JP2022520231A

JP2022520231A - 遺伝子疾患の治療用を含めアデノシンデアミナーゼ塩基エディターを用いた疾患関連遺伝子のスプライスアクセプター部位破壊

Info

Publication number: JP2022520231A
Application number: JP2021546889A
Authority: JP
Inventors: ニコルゴーデッリ、; マイケルパッカー、; イアンスレイメイカー、; イユ、; ベルンドゼッツェ、; ジェイソンマイケルゲールケ、; アンジェリカメッサーナ、; デイビッドエー．ボーン、; スン―ジュイ、
Original assignee: ビームセラピューティクスインク．
Priority date: 2019-02-13
Filing date: 2020-02-13
Publication date: 2022-03-29
Also published as: WO2020168075A9; WO2020168075A1; CA3128881A1; EP3924483A4; US20220098593A1; EP3924483A1; AU2020223297A1; CN114190093A; KR20210125560A

Abstract

本発明は、筋萎縮性側索硬化症 (ALS) および球脊髄性筋萎縮症 (SBMA) の衰弱作用を治療、低減または改善するための組成物および方法を特徴とする。塩基エディターシステムで遺伝性障害または状態に関連する標的遺伝子を改変することによって、遺伝性の疾患または状態例えばALSまたはSBMAに関連する遺伝子の通常の転写を破壊するための、ガイドポリヌクレオチドと共にポリヌクレオチドプログラム可能なヌクレオチド結合ドメインと核酸塩基編集ドメインとを含む改良された新規塩基エディター（例えばアデノシン塩基エディター）を使用する組成物および方法が提供される。

Description

関連出願への相互参照
この出願は、2019年2月13日に出願された米国仮出願第62/805,271号、2019年5月23日に出願された米国仮出願第62/852,228号、2019年5月23日に出願された米国仮出願第62/852,224号、2019年7月11日に出願された米国仮出願第62/873,140号、2019年7月11日に出願された米国仮出願第62/873,144号、2019年11月6日に出願された米国仮出願第62/931,722号、2019年11月27日に出願された米国仮出願第62/941,569号、2020年1月27日に出願された米国仮出願第62/966,526号の利益を主張し、それらの開示は参照によりその全体が本明細書に組み込まれる。

参照による組み込み
本明細書に記載されているすべての刊行物、特許、および特許出願は、個々の刊行物、特許、または特許出願が参照により組み込まれることが具体的かつ個別に示された場合と同程度に、参照により本明細書に組み込まれる。別段の表示がない限り、本明細書に記載されている刊行物、特許、および特許出願は、その全体が参照により本明細書に組み込まれる。

核酸配列の標的化された編集、例えば、ゲノムDNAの標的化された切断または標的化された改変は、遺伝子機能の研究にとって非常に有望なアプローチであり、ヒトの遺伝病に新しい治療法を提供する可能性も有する。現在利用可能な塩基エディターには、標的C・G塩基対をT・Aに変換するシチジン塩基エディター（BE4など）と、A・TをG・Cに変換するアデニン塩基エディター（ABE7.10など）が含まれる。より高い特異性および効率で標的配列内に改変を誘導することができる改良された塩基エディターが当技術分野で必要とされている。

本発明は、効率が増加された新規のアデニン塩基エディター（例えばABE8）を含む組成物、および、標的配列を編集するためにアデノシンデアミナーゼバリアントを含む塩基エディターを使用する方法を提供する。

ある態様において、本明細書では、必要とする対象において神経障害を治療する方法であって、(i) アデノシン塩基エディターまたはそれをコードする核酸配列と、(ii) ガイドポリヌクレオチドまたはそれをコードする核酸配列とを前記対象に投与することを含み、前記アデノシン塩基エディターはプログラム可能なDNA結合ドメインおよびアデノシンデアミナーゼドメインを含み、前記ガイドポリヌクレオチドが、前記アデノシン塩基エディターを誘導して前記対象の神経障害に関連する標的遺伝子のスプライス部位において単一核酸塩基の改変をもたらし、それによって対象の前記神経障害を治療する、方法が提供される。

ある実施形態では、前記アデノシンデアミナーゼが、配列番号2における番号付けでアミノ酸位置82もしくは166におけるアミノ酸置換またはそれに対応する置換を含む。ある実施形態では、前記単一核酸塩基の改変が、前記標的遺伝子によってコードされる転写物の代替的スプライシングをもたらす。ある実施形態では、前記代替的スプライシングが、前記標的遺伝子によってコードされる切り詰められたタンパク質または機能しないタンパク質を生成する。ある実施形態では、前記単一核酸塩基の改変が、前記対象における前記標的遺伝子の発現低下をもたらす。ある実施形態では、前記標的遺伝子がスーパーオキシドジスムターゼ1 (SOD1) 遺伝子であり、神経疾患が筋萎縮性側索硬化症 (ALS) である。ある実施形態では、前記標的遺伝子がアンドロゲン受容体 (AR) 遺伝子であり、神経疾患が球脊髄性筋萎縮症 (SBMA) である。

ある態様において、本明細書では、必要とする対象において筋萎縮性側索硬化症 (ALS) を治療する方法であって、前記対象に、 (i) 塩基エディターまたはそれをコードする核酸配列と、(ii)ガイドポリヌクレオチドまたはそれをコードする核酸配列とを投与することを含み、前記塩基エディターは、プログラム可能なDNA結合ドメインおよびデアミナーゼドメインを含み、前記ガイドポリヌクレオチドは、前記アデノシン塩基エディターを誘導して前記対象のスーパーオキシドジスムターゼ1 (SOD1) 遺伝子のスプライス部位における単一核酸塩基の改変をもたらし、それによって前記対象のALSを治療する、方法が提供される。

ある態様において、本明細書では、必要とする対象において筋萎縮性側索硬化症 (ALS) を治療する方法であって、前記対象に、(i)塩基エディターまたはそれをコードする核酸配列と、(ii) ガイドポリヌクレオチドまたはそれをコードする核酸配列とを投与することを含み、前記塩基エディターは、プログラム可能なDNA結合ドメインおよびデアミナーゼドメインを含み、前記ガイドポリヌクレオチドは、前記アデノシン塩基エディターを誘導して前記対象のスーパーオキシドジスムターゼ1 (SOD1) 遺伝子における単一核酸塩基の改変をもたらし、前記単一核酸塩基の改変は、SOD1遺伝子中に未熟な終止コドンをもたらし、それによって前記対象におけるALSを治療する、方法が提供される。

ある実施形態では、前記デアミナーゼが、配列番号2における番号付けでアミノ酸位置8もしくは166におけるアミノ酸置換またはそれに対応する置換を含むアデノシンデアミナーゼである。ある実施形態では、前記単一核酸塩基の改変がAからGへの改変である。ある実施形態では、前記単一核酸塩基の改変が、SOD1遺伝子のスプライスアクセプター部位におけるものである。ある実施形態では、前記スプライス部位が、SOD1遺伝子のエクソンの5’におけるスプライスアクセプター部位である。ある実施形態では、SOD1遺伝子の前記エクソンが、配列番号3に対応するエクソン3またはそのバリアントである。ある実施形態では、SOD1遺伝子の前記エクソン3が、配列番号3における番号付けでSOD1ポリヌクレオチド配列またはそのバリアントのヌクレオチド位置6828におけるスプライスアクセプターAGに隣接している。ある実施形態では、SOD1遺伝子の前記エクソンが、配列番号3に対応するエクソン4またはそのバリアントである。ある実施形態では、前記単一核酸塩基の改変が、配列番号3に対応するヒトSOD1遺伝子のエクソン3～5を欠失する転写産物またはそのバリアントを生成する。ある実施形態では、前記投与後に、前記対象においてSOD1遺伝子の発現が少なくとも40%低下する。

ある実施形態では、前記ガイドポリヌクレオチドが、SOD1遺伝子のスプライスアクセプター核酸配列またはスプライスドナー核酸配列に相補的な核酸配列を含む。ある実施形態では、前記ガイドポリヌクレオチドが、表19または表23から選択されるいずれかの核酸配列を含む。ある実施形態では、前記ガイドポリヌクレオチドが、5′-UUAAAGGAAAGUAAUGGACCAGU-3′、5′-UAAAUAGGCUGUACCAGUGCAGG-3′、5′-UUCAUUAUUAGGCAUGUUGGAGA-3′、5′-AAAUAGGCUGUACCAGUGCAGGU-3′、5′-UAUUAGGCAUGUUGGAGACUUGG-3′からなる群より選択される核酸配列を含む。

ある態様において、本明細書では、対象における球脊髄性筋萎縮症 (SBMA) を治療する方法であって、 (i) 塩基エディターまたはそれをコードする核酸配列と、(ii) ガイドポリヌクレオチドまたはそれをコードする核酸配列とを前記対象に投与することを含み、前記塩基エディターは、プログラム可能なDNA結合ドメインおよびデアミナーゼドメインを含み、前記ガイドポリヌクレオチドは、前記アデノシン塩基エディターを誘導して前記対象のアンドロゲン受容体 (AR) 遺伝子のスプライス部位において単一核酸塩基の改変をもたらし、それによって、前記対象中のSBMAを治療する、方法が提供される。

ある態様において、本明細書では、対象における球脊髄性筋萎縮症 (SBMA) を治療する方法であって、 (i) 塩基エディターまたはそれをコードする核酸配列と、(ii) ガイドポリヌクレオチドまたはそれをコードする核酸配列とを前記対象に投与することを含み、前記アデノシン塩基エディターは、プログラム可能なDNA結合ドメインおよびデアミナーゼドメインを含み、前記ガイドポリヌクレオチドが、前記アデノシン塩基エディターを誘導して前記対象のアンドロゲン受容体 (AR) 遺伝子において単一核酸塩基の改変をもたらし、前記単一核酸塩基の改変が、前記AR遺伝子における未熟な終止コドンをもたらし、それによって前記対象におけるSBMAを治療する、方法が提供される。

ある実施形態では、前記核酸塩基改変が、AR遺伝子におけるCAG-TAGコドン変化をもたらす。ある実施形態では、前記コドン変化がAR遺伝子のエクソン1またはエクソン2におけるものである。ある実施形態では、前記デアミナーゼが、配列番号2における番号付けでアミノ酸位置82または166におけるアミノ酸置換を含むアデノシンデアミナーゼである。ある実施形態では、前記単一核酸塩基の改変が、AからGへの改変である。ある実施形態では、前記AからGへの核酸塩基の改変がAR遺伝子のスプライスアクセプター部位におけるものである。ある実施形態では、前記スプライス部位が、AR遺伝子のエクソンの5’にあるスプライスアクセプター部位である。ある実施形態では、前記AR遺伝子のエクソンが、配列番号4に対応するエクソン2またはそのバリアントである。ある実施形態では、前記スプライス部位がAR遺伝子のエクソンの3’にあるスプライスドナー部位である。ある実施形態では、AR遺伝子の前記エクソンが、配列番号4に対応するエクソン1またはそのバリアントである。ある実施形態では、前記投与の後に対象においてAR遺伝子の発現が少なくとも40%低下する。

ある実施形態では、前記ガイドポリヌクレオチドが、AR遺伝子のスプライスアクセプター核酸配列またはスプライスドナー核酸配列に相補的な核酸配列を含む。ある実施形態では、前記ガイドポリヌクレオチドが、表41 Aまたは41 Bから選択される核酸配列を含む。ある実施形態では、前記ガイドポリヌクレオチドが、5′-ACUUACCGCAUGUCCCCGUAAGG-3′、5′- AGUGCAGUUAGGGCUGGGAAGGG-3′、5′- AAGUGCAGUUAGGGCUGGGAAGG-3′からなる群より選択される核酸配列を含む。

ある実施形態では、前記対象が哺乳動物またはヒトである。ある実施形態では、前記投与が、前記対象の中枢神経系 (CNS) の細胞への送達を通じて行われる。ある実施形態では、前記細胞が運動ニューロンである。

ある態様において、本明細書では、神経障害に関連する標的遺伝子またはその調節エレメントを改変する方法であって、前記標的遺伝子またはその調節エレメントを、 (i) アデノシン塩基エディターまたはそれをコードする核酸配列、および(ii) ガイドポリヌクレオチドまたはそれをコードする核酸配列と接触させることを含み、前記アデノシン塩基エディターが、プログラム可能なDNA結合ドメインおよびアデノシンデアミナーゼドメインを含み、前記ガイドポリヌクレオチドが、前記アデノシン塩基エディターを誘導して前記標的遺伝子のスプライス部位における単一核酸塩基の改変をもたらす、方法が提供される。

ある実施形態では、前記アデノシンデアミナーゼが、配列番号2における番号付けでアミノ酸位置82または166におけるアミノ酸置換を含む。ある実施形態では、前記単一核酸塩基の改変が、標的遺伝子によってコードされる転写物代替的スプライシング、標的遺伝子によってコードされる切り詰められたおよび/または非機能性のタンパク質、および/または細胞内で発現された場合の標的遺伝子の発現低下をもたらす。ある実施形態では、前記標的遺伝子がスーパーオキシドジスムターゼ1 (SOD1) 遺伝子であり、神経疾患が筋萎縮性側索硬化症 (ALS) である。ある実施形態では、前記標的遺伝子がアンドロゲン受容体 (AR) 遺伝子であり、神経疾患が球脊髄性筋萎縮症 (SBMA) である。

ある態様において、本明細書では、スーパーオキシドジスムターゼ (SOD1) 遺伝子の発現を調節する方法であって、SOD1遺伝子またはその調節エレメントを、 (i) 塩基エディターまたはそれをコードする核酸配列、および (ii) ガイドポリヌクレオチドまたはそれをコードする核酸配列と接触させることを含み、前記塩基エディターが、プログラム可能なDNA結合ドメインおよびデアミナーゼドメインを含み、前記ガイドポリヌクレオチドが前記アデノシン塩基エディターを誘導してスーパーオキシドジスムターゼ1 (SOD1) 遺伝子のスプライス部位における単一核酸塩基の改変をもたらす、方法が提供される。

ある態様において、本明細書では、スーパーオキシドジスムターゼ (SOD1) 遺伝子を改変する方法であって、SOD1遺伝子またはその調節エレメントを、 (i) 塩基エディターまたはそれをコードする核酸配列、および (ii) ガイドポリヌクレオチドまたはそれをコードする核酸配列と接触させることを含み、前記ガイドポリヌクレオチドは、前記アデノシン塩基エディターを誘導して前記対象のスーパーオキシドジスムターゼ1 (SOD1) 遺伝子における単一核酸塩基の改変をもたらし、前記単一核酸塩基の改変が、SOD1遺伝子において未熟な終止コドンをもたらす、方法が提供される。

ある実施形態では、前記単一核酸塩基の改変が、AからGへの改変である。ある実施形態では、前記核酸塩基の改変が、SOD1遺伝子のスプライスアクセプター部位におけるものである。ある実施形態では、前記スプライス部位が、SOD1遺伝子のエクソンの5'にあるスプライスアクセプター部位である。ある実施形態では、SOD1遺伝子の前記エクソンが、配列番号3に対応するエクソン3またはそのバリアントである。ある実施形態では、SOD1遺伝子の前記エクソン3が、配列番号3における番号付けでSOD1ポリヌクレオチド配列のヌクレオチド位置6828におけるスプライスアクセプターに隣接している。ある実施形態では、SOD1遺伝子の前記エクソンが、配列番号3に対応するエクソン4またはそのバリアントである。ある実施形態では、前記単一核酸塩基の改変が、配列番号3に対応するSOD1遺伝子のエクソン3～5を欠く転写産物またはそのバリアントを生成する。

ある実施形態では、前記ガイドポリヌクレオチドが、SOD1遺伝子のスプライスアクセプター核酸配列またはスプライスドナー核酸配列に相補的な核酸配列を含む。ある実施形態では、前記ガイドポリヌクレオチドが、表19または表23から選択される核酸配列を含む。ある実施形態では、前記ガイドポリヌクレオチドが、5′-UUAAAGGAAAGUAAUGGACCAGU-3′、5′-UAAAUAGGCUGUACCAGUGCAGG-3′、5′-UUCAUUAUUAGGCAUGUUGGAGA-3′、5′-AAAUAGGCUGUACCAGUGCAGGU-3′、5′-UAUUAGGCAUGUUGGAGACUUGG-3′からなる群から選択される核酸配列を含む。

ある態様において、本明細書では、アンドロゲン受容体 (AR) 遺伝子の発現を調節する方法であって、AR遺伝子またはその調節エレメントを、 (i) 塩基エディターまたはそれをコードする核酸配列、および (ii) ガイドポリヌクレオチドまたはそれをコードする核酸配列と接触させることを含み、前記塩基エディターは、プログラム可能なDNA結合ドメインおよびデアミナーゼドメインを含み、前記ガイドポリヌクレオチドが前記アデノシン塩基エディターを誘導してアンドロゲン受容体 (AR) 遺伝子のスプライス部位において単一核酸塩基の改変をもたらす、方法が提供される。

ある態様において、本明細書では、アンドロゲン受容体 (AR) 遺伝子を改変する方法であって、AR遺伝子またはその調節エレメントを、 (i) 塩基エディターまたはそれをコードする核酸配列、および (ii) ガイドポリヌクレオチドまたはそれをコードする核酸配列、と接触させることを含み、前記塩基エディターが、プログラム可能なDNA結合ドメインおよびデアミナーゼドメインを含み、前記ガイドポリヌクレオチドが前記アデノシン塩基エディターを誘導して前記対象におけるアンドロゲン受容体 (AR) 遺伝子における単一核酸塩基の改変をもたらし、前記単一核酸塩基の改変が、前記AR遺伝子において未熟な終止コドンを生じさせる、方法が提供される。

ある実施形態では、前記デアミナーゼが、配列番号2における番号付けでアミノ酸位置82または166におけるアミノ酸置換を含むアデノシンデアミナーゼである。ある実施形態では、前記デアミナーゼがシチジンデアミナーゼである。ある実施形態では、前記単一核酸塩基の改変が、CからTへの改変である。ある実施形態では、前記核酸塩基の改変が、AR遺伝子におけるCAG-TAGコドン変化をもたらす。ある実施形態では、前記コドン変化がAR遺伝子のエクソン1またはエクソン2にある。ある実施形態では、前記単一核酸塩基の改変が、AからGへの改変である。ある実施形態では、AからGへの核酸塩基改変がAR遺伝子のスプライスアクセプター部位におけるものである。

ある実施形態では、前記スプライス部位が、AR遺伝子のエクソンの5’にあるスプライスアクセプター部位である。ある実施形態では、AR遺伝子の前記エクソンが、配列番号4に対応するエクソン2またはそのバリアントである。ある実施形態では、前記スプライス部位がAR遺伝子のエクソンの3’にあるスプライスドナー部位である。ある実施形態では、AR遺伝子の前記エクソンが、配列番号4に対応するエクソン1またはそのバリアントである。

ある実施形態では、前記ガイドポリヌクレオチドが、表41 Aまたは41 Bから選択される核酸配列を含む。ある実施形態では、前記ガイドポリヌクレオチドが、AR遺伝子のスプライスアクセプター核酸配列またはスプライスドナー核酸配列に相補的な核酸配列を含む。ある実施形態では、前記ガイドポリヌクレオチドが、表41 Aまたは41 Bから選択される核酸配列を含む。ある実施形態では、前記ガイドポリヌクレオチドが、5′-ACUUACCGCAUGUCCCCGUAAGG-3′、5′- AGUGCAGUUAGGGCUGGGAAGGG-3′、5′- AAGUGCAGUUAGGGCUGGGAAGG-3′、およびその相補鎖からなる群より選択される核酸配列を含む。

ある実施形態では、前記接触が細胞内である。ある実施形態では、前記単一核酸塩基の改変が、細胞のゲノムにおいて15%未満のインデルをもたらす。ある実施形態では、前記単一核酸塩基の改変が、細胞のゲノムにおいて5%未満のインデルをもたらす。ある実施形態では、前記単一核酸塩基の改変が、細胞のゲノムにおいて2%未満のインデルをもたらす。ある実施形態では、前記細胞が哺乳動物細胞またはヒト細胞である。ある実施形態では、前記細胞が中枢神経系細胞である。ある実施形態では、前記細胞が運動ニューロンである。

ある実施形態では、前記接触が細胞の集団におけるものである。ある実施形態では、前記接触後に、細胞集団の少なくとも40%が単一核酸塩基の改変を含む。

ある実施形態では、前記接触後に、細胞集団の少なくとも50%が単一核酸塩基の改変を含む。ある実施形態では、前記接触後に、細胞集団の少なくとも60%が単一核酸塩基の改変を含む。ある実施形態では、前記接触後に、細胞集団の少なくとも85%が生存可能である。ある実施形態では、前記細胞の集団が哺乳動物細胞またはヒト細胞である。ある実施形態では、前記細胞の集団が中枢神経系細胞である。ある実施形態では、前記細胞の集団が運動ニューロンである。

ある実施形態では、前記アデノシンデアミナーゼがTadAデアミナーゼを含む。ある実施形態では、前記アデノシンデアミナーゼがTadA7.10である。

ある実施形態では、前記アデノシンデアミナーゼが、配列番号2における番号付けでV28S変異もしくはT166R変異またはそれに対応する変異を含むTadAである。ある実施形態では、前記アデノシンデアミナーゼが、配列番号2における番号付けでY147T、Y147R、Q154S、Y123H、およびQ154R、またはそれらに対応する変異のうちの1つ以上の変異を含む。ある実施形態では、前記アデノシンデアミナーゼが、配列番号2における番号付けでY147T + Q154R; Y147T + Q154S; Y147R + Q154S; V82S + Q154S; V82S + Y147R; V82S + Q154R; V82S + Y123H; I76Y + V82S; V82S + Y123H + Y147T; V82S + Y123H + Y147R; V82S + Y123H + Q154R; Y147R + Q154R +Y123H; Y147R + Q154R + I76Y; Y147R + Q154R + T166R; Y123H + Y147R + Q154R + I76Y; V82S + Y123H + Y147R + Q154R; およびI76Y + V82S + Y123H + Y147R + Q154Rからなる群より選択される変異の組合せまたはそれらの対応する変異を含む。

ある実施形態では、前記アデノシンデアミナーゼが、149、150、151、152、153、154、155、156、および157からなる群より選択される残基で始まるC末端の欠失を含む。ある実施形態では、前記アデノシンデアミナーゼがTadAダイマーを含む。ある実施形態では、前記アデノシンデアミナーゼがアデノシンデアミナーゼモノマーを含む。

上記様々な態様および実施形態において、前記ポリヌクレオチドによりプログラム可能なDNA結合ドメインがCas9ドメインである。ある実施形態では、前記Cas9ドメインがCas9ニッカーゼドメインである。ある実施形態では、前記Cas9ドメインがSpCas9ドメインを含む。ある実施形態では、前記SpCas9ドメインが、配列番号1における番号付けでD10Aおよび/またはH840Aアミノ酸置換またはそれに対応するアミノ酸置換を含む。ある実施形態では、前記Cas9ドメインがSaCas9ドメインを含む。ある実施形態では、前記Cas9ドメインが、改変されたPAMに対する特異性を有する。ある実施形態では、前記Cas9ドメインが、NGG、NGA、NGCG、NGN、NNGRRT、NNNRRT、NGCG、NGCN、NGTN、およびNGCからなる群から選択されるPAM配列に対する特異性を有し、ここでNはA、G、C、またはTであり、RはAまたはGである。

ある態様において、本明細書では、本明細書に記載される方法によって産生される細胞の集団が提供される。

ある態様において、本明細書では、(i) 塩基エディターまたはそれをコードする核酸配列と、 (ii) ガイドポリヌクレオチドまたはそれをコードする核酸配列とを含む、塩基エディターシステムであって、前記塩基エディターは、プログラム可能なDNA結合ドメインおよびデアミナーゼドメインを含み、前記ガイドポリヌクレオチドは、前記アデノシン塩基エディターを誘導してスーパーオキシドジスムターゼ1 (SOD1) のスプライス部位における単一核酸塩基の改変をもたらす、塩基エディターシステムが提供される。

ある態様において、本明細書では、(i) 塩基エディターまたはそれをコードする核酸配列と、 (ii) ガイドポリヌクレオチドまたはそれをコードする核酸配列とを含む、塩基エディターシステムであって、前記塩基エディターは、プログラム可能なDNA結合ドメインおよびデアミナーゼドメインを含み、前記ガイドポリヌクレオチドが前記アデノシン塩基エディターを誘導してスーパーオキシドジスムターゼ1 (SOD1) 遺伝子における単一核酸塩基の改変をもたらし、前記単一核酸塩基の改変がSOD1遺伝子において未熟な終止コドンをもたらす、塩基エディターシステムが提供される。

ある実施形態では、前記デアミナーゼが、配列番号2における番号付けでアミノ酸位置82または166におけるアミノ酸置換を含むアデノシンデアミナーゼである。ある実施形態では、前記デアミナーゼがシチジンデアミナーゼである。ある実施形態では、前記単一核酸塩基の改変が、AからGへの改変である。ある実施形態では、前記AからGへの核酸塩基の改変が、SOD1遺伝子のスプライスアクセプター部位におけるものである。ある実施形態では、前記スプライス部位が、SOD1遺伝子のエクソンの5’にあるスプライスアクセプター部位である。ある実施形態では、SOD1遺伝子の前記エクソンが、配列番号3に対応するエクソン3またはそのバリアントである。ある実施形態では、SOD1遺伝子の前記エクソン3が、配列番号3における番号付けでSOD1ポリヌクレオチド配列のヌクレオチド位置6828におけるスプライスアクセプターAGまたはそのバリアントに隣接している。ある実施形態では、SOD1転写物の代替的スプライシングが、配列番号3に対応するSOD1遺伝子のエクソン3～5を欠失する転写産物またはそのバリアントを生成する。ある実施形態では、SOD1遺伝子の前記エクソンが、配列番号3に対応するエクソン4またはそのバリアントである。

ある実施形態では、前記ガイドポリヌクレオチドが、SOD1遺伝子のスプライスアクセプター核酸配列またはスプライスドナー核酸配列に相補的な核酸配列を含む。ある実施形態では、前記ガイドポリヌクレオチドが、表19または表23から選択される核酸配列を含む。ある実施形態では、前記ガイドポリヌクレオチドが、5′-UUAAAGGAAAGUAAUGGACCAGU-3′、5′-UAAAUAGGCUGUACCAGUGCAGG-3′、5′-UUCAUUAUUAGGCAUGUUGGAGA-3′、5′-AAAUAGGCUGUACCAGUGCAGGU-3′、5′-UAUUAGGCAUGUUGGAGACUUGG-3′、およびその相補配列からなる群から選択される核酸配列を含む。

ある態様において、本明細書では、(i) 塩基エディターまたはそれをコードする核酸配列と、 (ii) ガイドポリヌクレオチドまたはそれをコードする核酸配列とを含む、塩基エディターシステムであって、前記塩基エディターは、プログラム可能なDNA結合ドメインおよびデアミナーゼドメインを含み、前記ガイドポリヌクレオチドが前記アデノシン塩基エディターを誘導してアンドロゲン受容体 (AR) 遺伝子のスプライス部位において単一核酸塩基の改変をもたらす、塩基エディターシステムが提供される。

ある態様において、本明細書では、(i) 塩基エディターまたはそれをコードする核酸配列と、(ii) ガイドポリヌクレオチドまたはそれをコードする核酸配列とを含む、塩基エディターシステムであって、前記アデノシン塩基エディターは、プログラム可能なDNA結合ドメインおよびデアミナーゼドメインを含み、前記ガイドポリヌクレオチドが前記アデノシン塩基エディターを誘導して対象中のアンドロゲン受容体 (AR) 遺伝子における単一核酸塩基の改変をもたらし、前記単一核酸塩基の改変が、AR遺伝子において未熟な終止コドンを生じさせる、塩基エディターシステムが提供される。

ある実施形態では、前記デアミナーゼが、配列番号2における番号付けでアミノ酸位置82または166におけるアミノ酸置換を含むアデノシンデアミナーゼである。ある実施形態では、前記デアミナーゼがシチジンデアミナーゼである。ある実施形態では、前記単一核酸塩基の改変が、CからTへの改変である。ある実施形態では、前記単一核酸塩基の改変が、AR遺伝子におけるCAG-TAGコドン変化をもたらす。ある実施形態では、前記コドン変化が、配列番号4に対応するAR遺伝子のエクソン1もしくはエクソン2またはそのバリアントである。ある実施形態では、前記単一核酸塩基の改変がAからGへの改変である。ある実施形態では、前記AからGへの核酸塩基の改変が、AR遺伝子のスプライスアクセプター部位におけるものである。ある実施形態では、前記スプライス部位が、AR遺伝子のエクソンの5’にあるスプライスアクセプター部位である。ある実施形態では、AR遺伝子の前記エクソンが、配列番号4に対応するエクソン2またはそのバリアントである。ある実施形態では、前記スプライス部位が、AR遺伝子のエクソンの3’にあるスプライスドナー部位である。ある実施形態では、AR遺伝子の前記エクソンが、配列番号4に対応するエクソン1またはそのバリアントである。

ある実施形態では、前記ガイドポリヌクレオチドが、AR遺伝子のスプライスアクセプター核酸配列またはスプライスドナー核酸配列に相補的な核酸配列を含む。ある実施形態では、前記ガイドポリヌクレオチドが、表41 Aまたは41 Bから選択される核酸配列を含む。ある実施形態では、前記ガイドポリヌクレオチドが、5′-ACUUACCGCAUGUCCCCGUAAGG-3′、5′- AGUGCAGUUAGGGCUGGGAAGGG-3′、5′- AAGUGCAGUUAGGGCUGGGAAGG-3′、およびその相補鎖からなる群から選択される核酸配列を含む。

ある実施形態では、前記アデノシンデアミナーゼがTadAデアミナーゼを含む。ある実施形態では、前記アデノシンデアミナーゼがTadA7.10である。ある実施形態では、前記アデノシンデアミナーゼが、配列番号2における番号付けでV28S変異もしくはT166R突然変異またはそれらに対応する変異を含むTadAである。ある実施形態では、前記アデノシンデアミナーゼが、配列番号2における番号付けでY147T、Y147R、Q154S、Y123H、およびQ154Rのうちの1つ以上またはそれらに対応する変異を含む。ある実施形態では、前記アデノシンデアミナーゼが、配列番号2における番号付けでY147T + Q154R; Y147T + Q154S; Y147R + Q154S; V82S + Q154S; V82S + Y147R; V82S + Q154R; V82S + Y123H; I76Y + V82S; V82S + Y123H + Y147T; V82S + Y123H + Y147R; V82S + Y123H + Q154R; Y147R + Q154R +Y123H; Y147R + Q154R + I76Y; Y147R + Q154R + T166R; Y123H + Y147R + Q154R + I76Y; V82S + Y123H + Y147R + Q154R; およびI76Y + V82S + Y123H + Y147R + Q154Rからなる群より選択される変異の組合せまたはそれらに対応する変異を含む。

ある実施形態では、前記アデノシンデアミナーゼが、149、150、151、152、153、154、155、156および157からなる群より選択される残基で始まるC末端の欠失を含む。ある実施形態では、前記アデノシンデアミナーゼがTadAダイマーを含む。ある実施形態では、前記アデノシンデアミナーゼがアデノシンデアミナーゼモノマーを含む。

ある実施形態では、前記ポリヌクレオチドによりプログラム可能なDNA結合ドメインがCas9ドメインである。ある実施形態では、前記Cas9ドメインがCas9ニッカーゼドメインである。ある実施形態では、前記Cas9ドメインがSpCas9ドメインを含む。ある実施形態では、前記SpCas9ドメインが、配列番号1における番号付けでD10Aおよび/またはH840Aアミノ酸置換またはそれらに対応するアミノ酸置換を含む。ある実施形態では、前記Cas9ドメインがSaCas9ドメインを含む。ある実施形態では、前記Cas9ドメインが、改変されたPAMに対する特異性を有する。ある実施形態では、前記Cas9ドメインが、NGG、NGA、NGCG、NGN、NNGRRT、NNNRRT、NGCG、NGCN、NGTN、およびNGCからなる群から選択されるPAM配列に対する特異性を有し、ここでNはA、G、C、またはTであり、RはAまたはGである。

ある態様において、本明細書では、本明細書に記載される塩基エディターシステムにおける前記ポリヌクレオチドによりプログラム可能なDNA結合ドメインをコードする核酸配列と、前記アデノシンデアミナーゼドメインをコードする核酸配列とを含む、ベクターが提供される。ある実施形態では、ベクターは前記ガイドポリヌクレオチドをコードする核酸配列をさらに含む。ある実施形態では、前記ベクターがウイルスベクターである。

ある態様において、本明細書では、本明細書に記載される塩基エディターシステムまたはベクターを含む、細胞が提供される。ある実施形態では、前記細胞が哺乳動物細胞、ヒト細胞、または運動ニューロンである。ある実施形態では、前記細胞がインビボ、エクスビボ、またはインビトロである。ある実施形態では、前記細胞が、対象から単離された自己細胞である。ある実施形態では、前記細胞が同種異系細胞である。

ある態様において、本明細書では、本明細書に記載される塩基エディターシステムまたはベクターを含む、細胞の集団が提供される。ある実施形態では、細胞の集団は哺乳動物細胞、ヒト細胞、または運動ニューロンである。ある実施形態では、細胞の集団はインビボ、エクスビボ、またはインビトロである。ある実施形態では、細胞が対象から単離された自己細胞である。

ある態様において、本明細書では、本明細書に記載の塩基エディター、ベクター、または細胞と、薬学的に許容される担体とを含む医薬組成物が提供される。一実施形態では、本明細書に記載の医薬組成物は、脂質をさらに含む。別の実施形態では、本明細書に記載の医薬組成物は、ウイルスをさらに含む。

ある態様において、本明細書では、本明細書に記載の塩基ディターシステムまたはベクターを含むキットが提供される。

本明細書に記載の方法の様々な実施形態において、ガイドポリヌクレオチドの少なくとも１つのヌクレオチドは、非天然の修飾を含む。本明細書に記載の方法の様々な実施形態において、核酸配列の少なくとも１つのヌクレオチドは、非天然の修飾を含む。本明細書に記載の方法の様々な実施形態において、塩基エディターシステムの核酸配列の少なくとも１つのヌクレオチドは、非天然の修飾を含む。いくつかの実施形態において、非天然の修飾は、化学的修飾である。いくつかの実施形態では、化学修飾は２’－Ｏ－メチル化である。いくつかの実施形態において、核酸配列は、ホスホロチオエートを含む。

本明細書における説明および例は、本開示の実施形態を詳細に例示する。本開示は、本明細書に記載される特定の実施形態に限定されず、したがって変化し得ることが理解されるべきである。当業者であれば、本開示には、その範囲内に包含される多数の変形および修正があることを認識するであろう。

本明細書に開示される実施形態の実施は、別段の指示がない限り、当業者の技量の範囲内にある、免疫学、生化学、化学、分子生物学、微生物学、細胞生物学、ゲノミクスおよび組換えDNAの従来の技術を使用する。例えば、Sambrook and Green, Molecular Cloning: A Laboratory Manual, 4th Edition (2012); the series Current Protocols in Molecular Biology (F. M. Ausubel, et al. eds.); the series Methods In Enzymology (Academic Press, Inc.), PCR 2: A Practical Approach (M.J. MacPherson, B.D. Hames and G.R. Taylor eds. (1995)), Harlow and Lane, eds. (1988) Antibodies, A Laboratory Manual, and Culture of Animal Cells: A Manual of Basic Technique and Specialized Applications, 6th Edition (R.I. Freshney, ed. (2010))参照。

本明細書で使用されているセクションの見出しは、まとめる目的のみのためのものであり、説明されている主題を限定するものとして解釈されるべきではない。

本開示の種々の特徴は、単一の実施形態に関連して説明され得るが、これらの特徴は、分離されて、または任意の適切な組み合わせで提供することもできる。逆に、本開示は、明確にするために別々の実施形態の文脈で説明され得るが、本開示はまた、単一の実施形態で実施することもできる。本明細書中で使用されるセクション見出しは、まとめる目的のみのためであり、記載される主題を限定するものと解釈されるべきではない。

本開示の特徴は、添付の特許請求の範囲に特に記載されている。下記の詳細な説明（これは本開示の原理が利用される例示的実施形態を提示する）を参照することによって、そして下記において説明する添付図面を考慮して、本開示の特徴および利点のよりよい理解が得られる。

定義
以下の定義は、当該技術分野の定義を補足するものであって本出願を対象としており、関連するまたは関連性のない案件、例えば共通の所有に係る特許または出願に帰するものではない。本明細書に記載されたものと同様または同等の任意の方法および材料を、本開示の試験の実施において使用することができるが、好ましい材料および方法を本明細書で説明する。従って、本明細書で使用される用語は、特定の実施形態を説明する目的のみのためのものであり、限定することを意図するものではない。

別段の定義がない限り、本明細書で使用されるすべての技術的および科学的用語は、本発明が属する分野の当業者によって一般的に理解される意味を有する。以下の参考文献は、当業者に、本発明において使用される多くの用語の一般的な定義を提供する: Singleton et al., Dictionary of Microbiology and Molecular Biology (2nd ed. 1994); The Cambridge Dictionary of Science and Technology (Walker ed., 1988); The Glossary of Genetics, 5th Ed., R. Rieger et al. (eds.), Springer Verlag (1991); and Hale & Marham, The Harper Collins Dictionary of Biology (1991)。

本出願において、単数形の使用は、特に断りのない限り、複数形を含む。本明細書で使用されるように、単数形「a」、「an」、および「the」は、文脈が明確にそうでないことを指示しない限り、複数の指示対象を含むことに留意しなければならない。本出願において、「又は」の使用は、別段の記載がない限り、「及び/又は」を意味し、含める意味に理解される。さらに、用語「含む(including)」、ならびに「含む(include)」、「含む(includes)」、および「含まれる(included)」などの他の形態の使用は、非限定的である。

本明細書及びクレームにおいて使用される場合、用語「含む(comprising)」(および「含む(comprise)」および「含む(comprises)」などのそのあらゆる形態)、「有する(having)」(「有する(have)」および「有する(has)」などのそのあらゆる形態)、「含む(including)」(「含む(include)」および「含む(includes)」などのそのあらゆる形態)又は「含む(containing)」(「含む(contains)」および「含む(contain)」などのそのあらゆる形態)は、包括的又は開放的であり、追加の、記載されていない要素又は方法工程を排除しない。本明細書で議論される任意の実施形態は、本開示の任意の方法または組成物に関して実施することができ、逆もまた同様であると考えられる。さらに、本開示の組成物を用いて、本開示の方法を達成することができる。

用語「約(about)」または「およそ(approximately)」は、当業者によって決定されるように、特定の値について許容可能な誤差範囲内であることを意味し、これは、値がどのように測定または決定されるか、すなわち、測定システムの制限に部分的に依存する。例えば、「約」は、当該技術分野における実務によれば、1以内または1を超える標準偏差内であることを意味し得る。あるいは、「約」は、所定の値の最大20%、最大10%、最大5%、または最大1%の範囲を意味し得る。別法として、特に生物学的システムまたはプロセスに関して、この用語は、同じ桁以内、例えば5倍以内、または2倍以内の値を意味することができる。特定の値が出願及び特許請求の範囲に記載されている場合、別段の記載がない限り、その特定の値について許容可能な誤差範囲内にあることを意味する「約」という用語が推定されるべきである。

本明細書で提供される範囲は、範囲内のすべての値についての省略形であると理解される。例えば、1～50の範囲は、1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, または 50からなる群からの任意の数、数の組み合わせ、またはサブ範囲を含むと理解される。

明細書における「いくつかの実施形態」、「ある実施形態」、「一実施形態」、または「他の実施形態」という言及は、その実施形態に関連して説明される特定の特徴、構造、または特性が、本開示の少なくともいくつかの実施形態に含まれるが、必ずしもすべての実施形態に含まれるとは限らないことを意味する。

「脱塩基（abasic）塩基エディター」とは、核酸塩基を切り出してDNA核酸塩基(A、T、C、またはG)を挿入することができる薬剤を意味する。脱塩基塩基エディターは、核酸グリコシラーゼポリペプチドまたはその断片を含む。一実施形態において、核酸グリコシラーゼは、下記の配列のアミノ酸204またはウラシルDNAグリコシラーゼの対応位置においてAspを含み（例えば、アミノ酸204におけるAsnを置換して）、かつシトシン-DNAグリコシラーゼ活性を有する、変異型ヒトウラシルDNAグリコシラーゼまたはその活性断片である。一実施形態において、核酸グリコシラーゼは、下記の配列のアミノ酸147またはウラシルDNAグリコシラーゼの対応位置においてAla、Gly、Cys、またはSerを含み（例えば、アミノ酸147におけるTyrを置換して）、かつチミン-DNAグリコシラーゼ活性を有する、変異型ヒトウラシルDNAグリコシラーゼまたはその活性断片である。例示的なヒトウラシル-DNAグリコシラーゼ、アイソフォーム1の配列は以下の通りである：
1 mgvfclgpwg lgrklrtpgk gplqllsrlc gdhlqaipak kapagqeepg tppssplsae
61 qldriqrnka aallrlaarn vpvgfgeswk khlsgefgkp yfiklmgfva eerkhytvyp
121 pphqvftwtq mcdikdvkvv ilgqdpyhgp nqahglcfsv qrpvppppsl eniykelstd
181 iedfvhpghg dlsgwakqgv lllnavltvr ahqanshker gweqftdavv swlnqnsngl
241 vfllwgsyaq kkgsaidrkr hhvlqtahps plsvyrgffg crhfsktnel lqksgkkpid
301 wkel

ヒトのウラシル-DNAグリコシラーゼ、アイソフォーム2の配列は以下の通りである。
1 migqktlysf fspsparkrh apspepavqg tgvagvpees gdaaaipakk apagqeepgt
61 ppssplsaeq ldriqrnkaa allrlaarnv pvgfgeswkk hlsgefgkpy fiklmgfvae
121 erkhytvypp phqvftwtqm cdikdvkvvi lgqdpyhgpn qahglcfsvq rpvppppsle
181 niykelstdi edfvhpghgd lsgwakqgvl llnavltvra hqanshkerg weqftdavvs
241 wlnqnsnglv fllwgsyaqk kgsaidrkrh hvlqtahpsp lsvyrgffgc rhfsktnell
301 qksgkkpidw kel

他の実施形態では、脱塩基エディターは、PCT/JP205/080958およびUS20170321210に記載されている脱塩基エディターのいずれかであり、これらは参照により本明細書に組み入れられる。特定の実施形態では、脱塩基エディターは、上記の配列に太字、下線で示された位置、または当該技術分野で知られる任意の他の脱塩基エディターまたはウラシルデグリコシラーゼにおける対応アミノ酸において突然変異を含む。一実施形態では、脱塩基エディターは、Y147、N204、L272、および/またはR276または対応位置に突然変異を含む。別の実施形態では、脱塩基エディターは、Y147AもしくはY147G突然変異または対応する突然変異を含む。別の実施形態では、脱塩基エディターは、N204D突然変異または対応する突然変異を含む。別の実施形態では、脱塩基エディターは、L272A突然変異または対応する突然変異を含む。別の実施形態では、脱塩基エディターは、R276EもしくはR276C突然変異または対応する突然変異を含む。

「アデノシンデアミナーゼ」とは、アデニンまたはアデノシンの加水分解的脱アミノ化を触媒することができるポリペプチドまたはその断片を意味する。ある態様において、デアミナーゼまたはデアミナーゼドメインは、アデノシンからイノシン、またはデオキシアデノシンからデオキシイノシンへの加水分解的脱アミノ化を触媒するアデノシンデアミナーゼである。ある態様において、アデノシンデアミナーゼは、デオキシリボ核酸 (DNA) 中のアデニンまたはアデノシンの加水分解的脱アミノ化を触媒する。本明細書中で提供されるアデノシンデアミナーゼ(例えば、遺伝子操作されたアデノシンデアミナーゼ、進化させたアデノシンデアミナーゼ)は、細菌などの任意の生物由来であり得る。

ある実施形態において、アデノシンデアミナーゼは、TadAデアミナーゼである。ある実施形態において、TadAデアミナーゼはTadAバリアントである。ある実施形態において、TadAバリアントはTadA*8である。ある実施形態において、デアミナーゼまたはデアミナーゼドメインは、例えばヒト、チンパンジー、ゴリラ、サル、ウシ、イヌ、ラット、またはマウスなどの生物由来の天然デアミナーゼのバリアントである。ある態様において、デアミナーゼまたはデアミナーゼドメインは、非天然のものである。例えば、いくつかの実施形態において、デアミナーゼまたはデアミナーゼドメインは、天然のデアミナーゼに対して少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、少なくとも99.1%、少なくとも99.2%、少なくとも99.3%、少なくとも99.4%、少なくとも99.5%、少なくとも99.6%、少なくとも99.7%、少なくとも99.8%、または少なくとも99.9%の同一性を有する。例えば、デアミナーゼドメインは、国際PCT出願番号PCT / 2007/045381(WO2018 / 027078)およびPCT / US2016 / 058344(WO 2017/070632)に記載されており、これらのそれぞれは、その全体が参照により本明細書に組み込まれる。また、Komor, A.C., et al., “Programmable editing of a target base in genomic DNA without double-stranded DNA cleavage” Nature 533, 420-424 (2016); Gaudelli, N.M., et al., “Programmable base editing of A・T to G・C in genomic DNA without DNA cleavage” Nature 551, 464-471 (2017); Komor, A.C., et al., “Improved base excision repair inhibition and bacteriophage Mu Gam protein yields C:G-to-T:A base editors with higher efficiency and product purity” Science Advances 3:eaao4774 (2017) ), およびRees, H.A., et al., “Base editing: precision chemistry on the genome and transcriptome of living cells.” Nat Rev Genet. 2018 Dec;19(12):770-788. doi: 10.1038/s41576-018-0059-1も参照（その全内容は参照により本明細書に組み込まれる）。

野生型TadA（wt）アデノシンデアミナーゼには、次の配列を有する（TadA参照配列とも呼ばれる）：
MSEVEFSHEYWMRHALTLAKRAWDEREVPVGAVLVHNNRVIGEGWNRPIGRHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTLEPCVMCAGAMIHSRIGRVVFGARDAKTGAAGSLMDVLHHPGMNHRVEITEGILADECAALLSDFFRMRRQEIKAQKKAQSSTD (配列番号2).

いくつかの実施形態において、アデノシンデアミナーゼは、以下の配列における改変を含む：
MSEVEFSHEY WMRHALTLAK RARDEREVPV GAVLVLNNRV IGEGWNRAIG LHDPTAHAEI MALRQGGLVM QNYRLIDATL YVTFEPCVMC AGAMIHSRIG RVVFGVRNAK TGAAGSLMDV LHYPGMNHRV EITEGILADE CAALLCYFFR MPRQVFNAQK KAQSSTD
（TadA*7.10とも呼ばれる）。

いくつかの実施形態では、TadA*7.10は、少なくとも１つの改変を含む。いくつかの実施形態において、TadA*7.10は、アミノ酸82および/または166での改変を含む。特定の実施形態において、上記参照配列のバリアントは、以下の改変のうちの１つ以上を含む：Y147T, Y147R, Q154S, Y123H, V82S, T166R, および／またはQ154R。改変Y123Hは、本明細書ではH123Hとも呼ばれる（TadA*7.10における改変H123YがY123H（wt）に戻ったもの）。他の実施形態では、TadA*7.10配列のバリアントは、以下のものからなる群から選択される変更の組み合わせを含む：Y147T + Q154R; Y147T + Q154S; Y147R + Q154S; V82S + Q154S; V82S + Y147R; V82S + Q154R; V82S + Y123H; I76Y + V82S; V82S + Y123H + Y147T; V82S + Y123H + Y147R; V82S + Y123H + Q154R; Y147R + Q154R +Y123H; Y147R + Q154R + I76Y; Y147R + Q154R + T166R; Y123H + Y147R + Q154R + I76Y; V82S + Y123H + Y147R + Q154R; およびI76Y + V82S + Y123H + Y147R + Q154R。

他の実施形態において、本発明は、残基149、150、151、152、153、154、155、156、または157で始まるＣ末端の欠失を含む、欠失を含有するアデノシンデアミナーゼバリアント、例えばTadA*8を提供する。他の実施形態において、アデノシンデアミナーゼバリアントは、以下の改変のうちの１つ以上を含むTadA（例えばTadA*8）モノマーである：Y147T、Y147R、Q154S、Y123H、V82S、T166R、および/またはQ154R。他の実施形態において、アデノシンデアミナーゼバリアントは、以下のものからなる群から選択される改変の組み合わせを含むTadA（例えばTadA*8）モノマーである：Y147T + Q154R; Y147T + Q154S; Y147R + Q154S; V82S + Q154S; V82S + Y147R; V82S + Q154R; V82S + Y123H; I76Y + V82S; V82S + Y123H + Y147T; V82S + Y123H + Y147R; V82S + Y123H + Q154R; Y147R + Q154R +Y123H; Y147R + Q154R + I76Y; Y147R + Q154R + T166R; Y123H + Y147R + Q154R + I76Y; V82S + Y123H + Y147R + Q154R; およびI76Y + V82S + Y123H + Y147R + Q154R。

さらに他の実施形態では、アデノシンデアミナーゼバリアントは、それぞれが以下の改変Y147T、Y147R、Q154S、Y123H、V82S、T166R、および/またはQ154Rのうちの１つ以上を有する２つのアデノシンデアミナーゼドメイン（例えばTadA*8）を含むホモ二量体である。他の実施形態では、アデノシンデアミナーゼバリアントは、それぞれが以下のものからなる群から選択される改変の組み合わせを有する２つのアデノシンデアミナーゼドメイン（例えばTadA*8）を含むホモ二量体である：Y147T + Q154R; Y147T + Q154S; Y147R + Q154S; V82S + Q154S; V82S + Y147R; V82S + Q154R; V82S + Y123H; I76Y + V82S; V82S + Y123H + Y147T; V82S + Y123H + Y147R; V82S + Y123H + Q154R; Y147R + Q154R +Y123H; Y147R + Q154R + I76Y; Y147R + Q154R + T166R; Y123H + Y147R + Q154R + I76Y; V82S + Y123H + Y147R + Q154R; およびI76Y + V82S + Y123H + Y147R + Q154R。

他の実施形態において、アデノシンデアミナーゼバリアントは、野生型TadAアデノシンデアミナーゼドメインと、以下の改変Y147T、Y147R、Q154S、Y123H、V82S、T166R、および/またはQ154Rのうちの１つ以上を含むアデノシンデアミナーゼバリアントドメイン（例えばTadA*8）と含むヘテロダイマーである。他の実施形態では、アデノシンデアミナーゼバリアントは、野生型TadAアデノシンデアミナーゼドメインと、以下からなる群から選択される改変の組み合わせを含むアデノシンデアミナーゼバリアントドメイン（例えばTadA*8）とを含むヘテロダイマーである：Y147T + Q154R; Y147T + Q154S; Y147R + Q154S; V82S + Q154S; V82S + Y147R; V82S + Q154R; V82S + Y123H; I76Y + V82S; V82S + Y123H + Y147T; V82S + Y123H + Y147R; V82S + Y123H + Q154R; Y147R + Q154R +Y123H; Y147R + Q154R + I76Y; Y147R + Q154R + T166R; Y123H + Y147R + Q154R + I76Y; V82S + Y123H + Y147R + Q154R; およびI76Y + V82S + Y123H + Y147R + Q154R。

他の実施形態では、アデノシンデアミナーゼバリアントは、TadA*7.10ドメインと、以下の改変Y147T、Y147R、Q154S、Y123H、V82S、T166R、および/またはQ154Rのうちの１つ以上を含むアデノシンデアミナーゼバリアントドメイン（例えばTadA*8）と含むヘテロダイマーである。他の実施形態において、アデノシンデアミナーゼバリアントは、TadA*7.10ドメインと、以下の改変の組み合わせを含むアデノシンデアミナーゼバリアントドメイン（例えばTadA*8）とを含むヘテロ二量体である：Y147T + Q154R; Y147T + Q154S; Y147R + Q154S; V82S + Q154S; V82S + Y147R; V82S + Q154R; V82S + Y123H; I76Y + V82S; V82S + Y123H + Y147T; V82S + Y123H + Y147R; V82S + Y123H + Q154R; Y147R + Q154R +Y123H; Y147R + Q154R + I76Y; Y147R + Q154R + T166R; Y123H + Y147R + Q154R + I76Y; V82S + Y123H + Y147R + Q154R; またはI76Y + V82S + Y123H + Y147R + Q154R。

一実施形態では、アデノシンデアミナーゼは、以下の配列またはアデノシンデアミナーゼ活性を有するそのフラグメントを含むかまたは本質的にそれらからなるTadA*8である：
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCTFFRMPRQVFNAQKKAQSSTD.

いくつかの実施形態では、TadA*8は切り詰められている。いくつかの実施形態において、短縮型TadA*8は、全長TadA*8に対して1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、6、17、18、19、または20個のN末端アミノ酸残基を欠いている。いくつかの実施形態において、短縮型TadA*8は、全長TadA*8と比較して1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、6、17、18、19、または20個のC末端アミノ酸残基を欠いている。いくつかの実施形態において、アデノシンデアミナーゼバリアントは、完全長のTadA*8である。

特定の実施形態において、アデノシンデアミナーゼヘテロダイマーは、TadA*8ドメインおよび以下のうちの１つから選択されるアデノシンデアミナーゼドメインを含む。

Escherichia coli TadA:
MRRAFITGVFFLSEVEFSHEYWMRHALTLAKRAWDEREVPVGAVLVHNNRVIGEGWNRPIGRHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTLEPCVMCAGAMIHSRIGRVVFGARDAKTGAAGSLMDVLHHPGMNHRVEITEGILADECAALLSDFFRMRRQEIKAQKKAQSSTD

E.coli TadA (N末端切詰め):
MSEVEFSHEYWMRHALTLAKRAWDEREVPVGAVLVHNNRVIGEGWNRPIGRHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTLEPCVMCAGAMIHSRIGRVVFGARDAKTGAAGSLMDVLHHPGMNHRVEITEGILADECAALLSDFFRMRRQEIKAQKKAQSSTD

Staphylococcus aureus (S. aureus) TadA:
MGSHMTNDIYFMTLAIEEAKKAAQLGEVPIGAIITKDDEVIARAHNLRETLQQPTAHAEHIAIERAAKVLGSWRLEGCTLYVTLEPCVMCAGTIVMSRIPRVVYGADDPKGGCSGSLMNLLQQSNFNHRAIVDKGVLKEACSTLLTTFFKNLRANKKSTN

Bacillus subtilis (B. subtilis) TadA:
MTQDELYMKEAIKEAKKAEEKGEVPIGAVLVINGEIIARAHNLRETEQRSIAHAEMLVIDEACKALGTWRLEGATLYVTLEPCPMCAGAVVLSRVEKVVFGAFDPKGGCSGTLMNLLQEERFNHQAEVVSGVLEEECGGMLSAFFRELRKKKKAARKNLSE

Salmonella typhimurium (S. typhimurium) TadA:
MPPAFITGVTSLSDVELDHEYWMRHALTLAKRAWDEREVPVGAVLVHNHRVIGEGWNRPIGRHDPTAHAEIMALRQGGLVLQNYRLLDTTLYVTLEPCVMCAGAMVHSRIGRVVFGARDAKTGAAGSLIDVLHHPGMNHRVEIIEGVLRDECATLLSDFFRMRRQEIKALKKADRAEGAGPAV

Shewanella putrefaciens (S. putrefaciens) TadA:
MDEYWMQVAMQMAEKAEAAGEVPVGAVLVKDGQQIATGYNLSISQHDPTAHAEILCLRSAGKKLENYRLLDATLYITLEPCAMCAGAMVHSRIARVVYGARDEKTGAAGTVVNLLQHPAFNHQVEVTSGVLAEACSAQLSRFFKRRRDEKKALKLAQRAQQGIE

Haemophilus influenzae F3031 (H. influenzae) TadA:
MDAAKVRSEFDEKMMRYALELADKAEALGEIPVGAVLVDDARNIIGEGWNLSIVQSDPTΑΗAEIIALRNGAKNIQNYRLLNSTLYVTLEPCTMCAGAILHSRIKRLVFGASDYKTGAIGSRFHFFDDYKMNHTLEITSGVLAEECSQKLSTFFQKRREEKKIEKALLKSLSDK

Caulobacter crescentus (C. crescentus) TadA:
MRTDESEDQDHRMMRLALDAARAAAEAGETPVGAVILDPSTGEVIATAGNGPIAAHDPTAHAEIAAMRAAAAKLGNYRLTDLTLVVTLEPCAMCAGAISHARIGRVVFGADDPKGGAVVHGPKFFAQPTCHWRPEVTGGVLADESADLLRGFFRARRKAKI

Geobacter sulfurreducens (G. sulfurreducens) TadA:
MSSLKKTPIRDDAYWMGKAIREAAKAAARDEVPIGAVIVRDGAVIGRGHNLREGSNDPSAHAEMIAIRQAARRSANWRLTGATLYVTLEPCLMCMGAIILARLERVVFGCYDPKGGAAGSLYDLSADPRLNHQVRLSPGVCQEECGTMLSDFFRDLRRRKKAKATPALFIDERKVPPEP

TadA*7.10
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPRQVFNAQKKAQSSTD

TadA*8を持つヘテロダイマーのコンポーネントとして企図される追加のTadA7.10またはTadA7.10バリアントとしては、次のものが挙げられる。

GSSGSETPGTSESATPESSGSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPRQVFNAQKKAQSSTD

TadA7.10 CP65
TAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPRQVFNAQKKAQSSTDGSSGSETPGTSESATPESSGSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDP

TadA7.10 CP83
YRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPRQVFNAQKKAQSSTDGSSGSETPGTSESATPESSGSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQN

TadA7.10 CP136
MNHRVEITEGILADECAALLCYFFRMPRQVFNAQKKAQSSTDGSSGSETPGTSESATPESSGSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPG

TadA7.10 C-切り詰め
GSSGSETPGTSESATPESSGSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPRQVFN

TadA7.10 C-切り詰め2
GSSGSETPGTSESATPESSGSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPRQ

TadA7.10 delta59-66+C-切り詰め
GSSGSETPGTSESATPESSGSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPRQVFN

TadA7.10 delta 59-66
GSSGSETPGTSESATPESSGSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPRQVFNAQKKAQSSTD.

いくつかの実施形態において、アデノシンデアミナーゼバリアントは、TadA7.10における改変を含む。いくつかの実施形態において、TadA7.10は、アミノ酸82または166での改変を含む。特定の実施形態において、上記参照配列のバリアントは、以下の改変のうちの１つ以上を含む：Y147T、Y147R、Q154S、Y123H、V82S、T166R、およびQ154R。他の実施形態では、アデノシンデアミナーゼバリアントは、Y147R + Q154R +Y123H; Y147R + Q154R + I76Y; Y147R + Q154R + T166R; Y147T + Q154R; Y147T + Q154S; およびY123H + Y147R + Q154R + I76Yからなる群から選択される改変の組み合わせを含む。

他の実施形態において、本発明は、欠失を含むアデノシンデアミナーゼバリアント、例えば、残基149、150、151、152、153、154、155、156、または157で始まるＣ末端の欠失を含むTadA7.10を提供する。他の実施形態において、アデノシンデアミナーゼバリアントは、以下の改変のうちの１つ以上を含むTadAモノマーである：Y147T、Y147R、Q154S、Y123H、V82S、T166R、Q154R。他の実施形態では、アデノシンデアミナーゼバリアントは、以下の改変を含むモノマーである：Y147R + Q154R + Y123H; Y147R + Q154R + I76Y; Y147R + Q154R + T166R; Y147T + Q154R; Y147T + Q154S;およびY123H + Y147 R + Q154R + I76Y。さらに他の実施形態では、アデノシンデアミナーゼバリアントは、それぞれが以下の改変Y147T、Y147R、Q154S、Y123H、V82S、T166R、Q154Rのうちの１つ以上を有する２つのアデノシンデアミナーゼドメインを含むホモ二量体である。他の実施形態では、アデノシンデアミナーゼバリアントは、野生型アデノシンデアミナーゼドメインまたはTadA7.10ドメインと、以下の改変の1つまたは複数を含むアデノシンデアミナーゼバリアントドメインとを含むヘテロダイマーである：Y147T、Y147R、Q154S、Y123H、V82S、T166R 、Q154R。他の実施形態では、アデノシンデアミナーゼバリアントは、TadA7.10ドメインと、以下の改変を含むTadA7.10のアデノシンデアミナーゼバリアントとを含むヘテロ二量体である。 Y147R + Q154R + I76Y; Y147R + Q154R + T166R; Y147T + Q154R; Y147T + Q154S;およびY123H + Y147R + Q154R + I76Y。

「投与すること」は、本明細書に記載される1以上の組成物を患者または対象に提供することとして本明細書で言及される。例として、限定するものではないが、組成物の投与、例えば注射は、静脈内 (i.v.) 注射、皮下(s.c.) 注射、皮内 (i.d.) 注射、腹腔内(i.p.) 注射又は筋肉内(i.m.) 注射によって行われ得る。1つ以上のそのような経路を用いることができる。非経口投与は、例えば、ボーラス注射によって、または経時的に徐々に灌流することによって行うことができる。いくつかの実施形態において、非経口投与は、血管内、静脈内、筋肉内、動脈内、髄腔内、腫瘍内、皮内、腹腔内、経気管、皮下、角質下、関節内、莢膜内、くも膜下および胸骨内への注入または注射を含む。あるいは、または同時に、投与は経口経路によることができる。

「薬剤（agent）」とは、任意の小分子化合物、抗体、核酸分子、またはポリペプチド、またはそれらの断片を意味する。

「改変」とは、本明細書に記載されるような標準技術の公知の方法によって検出されるような、遺伝子またはポリペプチドの構造、発現レベルまたは活性の変化（例えば増加または減少）を意味する。本明細書で使用される場合、改変は、ポリヌクレオチドもしくはポリペプチドの配列の変化、または発現レベルの変化、例えば10%のの変化、25%の変化、40%の変化、50%の変化、またはそれ以上の発現レベルの変化を含む。

「改善する(ameliorate)」とは、疾患の発生または進行を減少させる、抑制する、減衰させる、低減させる、停止させる、または安定させることを意味する。

「アナログ」とは、同一ではないが、類似の機能的または構造的特徴を有する分子を意味する。例えば、ポリヌクレオチドまたはポリペプチドアナログは、対応する天然ポリヌクレオチドまたはポリペプチドの生物学的活性を保持しながら、天然ポリヌクレオチドまたはポリペプチドと比較してそのアナログの機能を増強させる特定の修飾を有する。そのような修飾は、例えばリガンド結合を変化させることなく、アナログのDNA親和性、効率性、特異性、プロテアーゼもしくはヌクレアーゼ抵抗性、膜透過性、および／または半減期を増加させることができる。アナログは、非天然のポリヌクレオチドまたはアミノ酸を含み得る。

「塩基エディター（BE）」あるいは「核酸塩基エディター（NBE）」とは、ポリヌクレオチドに結合して核酸塩基修飾活性を有する薬剤を意味する。様々な実施形態において、塩基エディターは、核酸塩基修飾ポリペプチド（例えばデアミナーゼ）および核酸プログラミング可能なヌクレオチド結合ドメインを、ガイドポリヌクレオチド（例えばガイドRNA）と共に含む。様々な実施形態において、該薬剤は、塩基編集活性を有するタンパク質ドメイン、すなわち、核酸分子（例えばDNA）内の塩基（例えばA、T、C、G、U）を改変することができるドメインを含む生体分子複合体である。いくつかの実施形態において、ポリヌクレオチドプログラミング可能なDNA結合ドメインは、デアミナーゼドメインに融合または連結される。1つの実施形態において、該薬剤は、塩基編集活性を有するドメインを含む融合タンパク質である。別の態様において、塩基編集活性を有するタンパク質ドメインは、ガイドRNAに連結される（例えば、ガイドRNA上のRNA結合モチーフおよびデアミナーゼに融合されたRNA結合ドメインを介して）。ある態様において、塩基編集活性を有するドメインは、核酸分子内の塩基を脱アミノ化することができる。ある態様において、塩基エディターは、DNA分子内の1つ以上の塩基を脱アミノ化することができる。ある態様において、塩基エディターは、DNA内のアデノシン (A) を脱アミノ化することができる。ある態様において、塩基エディターは、アデノシン塩基エディター（ABE）である。

「シチジンデアミナーゼ」とは、アミノ基をカルボニル基に変換する脱アミノ化反応を触媒することができるポリペプチドまたはその断片を意味する。いくつかの実施形態において、シチジンデアミナーゼは、APOBECまたはAIDに対して少なくとも約85%の同一性を有する。1つの実施形態において、シチジンデアミナーゼは、シトシンをウラシルに、または5-メチルシトシンをチミンに変換する。Petromyzon marinus由来のPmCDA1（Petromyzon marinus cytosine deaminase 1, “PmCDA1”）、または哺乳動物（例えば、ヒト、ブタ、ウシ、ウマ、サル等）由来のAID（活性化誘導シチジンデアミナーゼ; AICDA）、およびAPOBECは、例示的シチジンデアミナーゼである。

いくつかの実施形態において、塩基エディターは、デアミナーゼ（例えば、アデノシンデアミナーゼまたはシチジンデアミナーゼ）に融合した再プログラム可能な塩基エディターである。いくつかの実施形態において、塩基エディターは、デアミナーゼ（例えば、アデノシンデアミナーゼまたはシチジンデアミナーゼ）に融合されたCas9である。いくつかの実施形態において、塩基エディターは、デアミナーゼ（例えばアデノシンデアミナーゼまたはシチジンデアミナーゼ）に融合されたヌクレアーゼ不活Cas9（dCas9）である。いくつかの実施形態において、Cas9は、循環置換体（circular permutant）のCas9（例えばspCas9またはsaCas9）である。循環置換体Cas9は当該分野で公知であり、例えば、Oakes et al., Cell 176, 254-267, 2019に記載されている。いくつかの実施形態において、塩基エディターは、塩基除去修復の阻害因子、例えばUGIドメインまたはdISNドメインに融合される。ある実施形態において、融合タンパク質は、デアミナーゼと、UGIドメインまたはdISNドメインのような塩基除去修復の阻害因子に融合されたCas9ニッカーゼを含む。他の実施形態では、塩基エディターは脱塩基型（abasic）塩基エディターである。

いくつかの実施形態では、塩基エディターは、アデノシン塩基エディター（ABE）である。いくつかの実施形態において、アデノシンデアミナーゼは、TadAから進化されたものである。いくつかの実施形態において、本発明の塩基エディターは、内部的に融合された触媒（例えば、デアミナーゼ）ドメインを有するnapDNAbpドメインを含む。いくつかの実施形態において、napDNAbpは、内部的に融合されたデアミナーゼドメインを有するCas12a（Cpf1）である。いくつかの実施形態において、napDNAbpは、内部的に融合されたデアミナーゼドメインを有するCas12b（c2c1）である。いくつかの実施形態において、napDNAbpは、内部的に融合されたデアミナーゼドメインを有するCas12c（c2c3）である。いくつかの実施形態において、napDNAbpは、内部的に融合されたデアミナーゼドメインを有するCas12d（CasX）である。いくつかの実施形態において、napDNAbpは、内部的に融合されたデアミナーゼドメインを有するCas12e（CasY）である。いくつかの実施形態において、napDNAbpは、内部的に融合されたデアミナーゼドメインを有するCas12gである。いくつかの実施形態において、napDNAbpは、内部的に融合されたデアミナーゼドメインを有するCas12hである。いくつかの実施形態において、napDNAbpは、内部的に融合されたデアミナーゼドメインを有するCas12iである。いくつかの実施形態において、塩基エディターは、デアミナーゼドメインに融合された触媒的に死んだCas12（dCas12)である。いくつかの実施形態において、塩基エディターは、デアミナーゼドメインに融合されたCas12ニッカーゼ（nCas12）である。

いくつかの実施形態において、塩基エディターは、アデノシンデアミナーゼバリアント（例えばTadA*8）を、循環置換体Cas9（例えばspCAS9またはsaCAS9）および二部分核局在化配列を含む足場にクローニングすることによって生成される（例えばABE8）。循環置換体Cas9は当技術分野で公知であり、例えばOakes et al., Cell 176, 254-267, 2019に記載されている。例示的な循環置換体を以下に記載するが、ここで太字の配列はCas9に由来する配列を示し、斜体の配列はリンカー配列を示し、下線が引かれた配列は二部分核局在化配列を示す。

CP5 (with MSP “NGC=Pam Variant with mutations Regular Cas9 likes NGG” PID=Protein Interacting Domain and “D10A” nickase):

いくつかの実施形態において、ABE8は、下記表6-9、13、または14からの塩基エディターから選択される。いくつかの実施形態において、ABE8は、TadAから進化されたアデノシンデアミナーゼバリアントを含む。いくつかの実施形態において、ABE8のアデノシンデアミナーゼバリアントは、下記表7、9、13または14に記載されるようなTadA*8バリアントである。いくつかの実施形態において、アデノシンデアミナーゼバリアントは、Y147T、Y147R、Q154S、Y123H、V82S、T166R、および/またはQ154Rの群から選択される１つ以上の改変を含むTadA*7.10バリアント（例えば、TadA*8）である。様々な実施形態において、ABE8は、Y147T + Q154R; Y147T + Q154S; Y147R + Q154S; V82S + Q154S; V82S + Y147R; V82S + Q154R; V82S + Y123H; I76Y + V82S; V82S + Y123H + Y147T; V82S + Y123H + Y147R; V82S + Y123H + Q154R; Y147R + Q154R +Y123H; Y147R + Q154R + I76Y; Y147R + Q154R + T166R; Y123H + Y147R + Q154R + I76Y; V82S + Y123H + Y147R + Q154R; およびI76Y + V82S + Y123H + Y147R + Q154Rからなる群から選択される改変の組み合わせを有するTadA*7.10（例えばTadA*8）を含む。いくつかの実施形態では、ABE8は単量体構築物である。いくつかの実施形態では、ABE8はヘテロ二量体構築物である。いくつかの実施形態では、ABE8塩基エディターは、以下の配列を含む：
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCTFFRMPRQVFNAQKKAQSSTD。

ある態様において、ポリヌクレオチドプログラミング可能なDNA結合ドメインは、CRISPR関連(例えばCasまたはCpf1)酵素である。ある態様において、塩基エディターは、デアミナーゼドメインに融合された、触媒的には死んだCas9 (dCas9) である。ある態様において、塩基エディターは、デアミナーゼドメインに融合されたCas9ニッカーゼ(nCas9) である。ある態様において、塩基エディターは、塩基除去修復 (BER) の阻害因子に融合される。ある態様において、塩基除去修復の阻害因子は、ウラシルDNAグリコシラーゼ阻害因子 (UGI) である。ある態様において、塩基除去修復の阻害因子は、イノシン塩基除去修復阻害因子である。

塩基エディターの詳細は、国際PCT出願番号PCT/2017/045381(国際公開第2018/027078号)およびPCT/US 2016/058344(国際公開第2017/070632号)に記載されており、それぞれその全体が参照により本明細書に組み込まれる。Komor, A.C., et al., “Programmable editing of a target base in genomic DNA without double-stranded DNA cleavage” Nature 533, 420-424 (2016); Gaudelli, N.M., et al., “Programmable base editing of A・T to G・C in genomic DNA without DNA cleavage” Nature 551, 464-471 (2017); Komor, A.C., et al., “Improved base excision repair inhibition and bacteriophage Mu Gam protein yields C:G-to-T:A base editors with higher efficiency and product purity” Science Advances 3:eaao4774 (2017), および Rees, H.A., et al., “Base editing: precision chemistry on the genome and transcriptome of living cells.” Nat Rev Genet. 2018 Dec;19(12):770-788. doi: 10.1038/s41576-018-0059-1も参照のこと (その内容全体を参照により本明細書に組み込む) 。

例として、本明細書に記載の塩基編集組成物、システム、および方法において使用されるシチジン塩基エディターは、下記の核酸配列（8877塩基対）（Addgene, Watertown, MA.; Komor AC, et al., 2017, Sci Adv., 30;3(8):eaao4774. doi: 10.1126/sciadv.aao4774）を有する。BE4核酸配列に対して少なくとも95%以上の同一性を有するポリヌクレオチド配列も包含される。

1 atatgccaag tacgccccct attgacgtca atgacggtaa atggcccgcc tggcattatg
61 cccagtacat gaccttatgg gactttccta cttggcagta catctacgta ttagtcatcg
121 ctattaccat ggtgatgcgg ttttggcagt acatcaatgg gcgtggatag cggtttgact
181 cacggggatt tccaagtctc caccccattg acgtcaatgg gagtttgttt tggcaccaaa
241 atcaacggga ctttccaaaa tgtcgtaaca actccgcccc attgacgcaa atgggcggta
301 ggcgtgtacg gtgggaggtc tatataagca gagctggttt agtgaaccgt cagatccgct
361 agagatccgc ggccgctaat acgactcact atagggagag ccgccaccat gagctcagag
421 actggcccag tggctgtgga ccccacattg agacggcgga tcgagcccca tgagtttgag
481 gtattcttcg atccgagaga gctccgcaag gagacctgcc tgctttacga aattaattgg
541 gggggccggc actccatttg gcgacataca tcacagaaca ctaacaagca cgtcgaagtc
601 aacttcatcg agaagttcac gacagaaaga tatttctgtc cgaacacaag gtgcagcatt
661 acctggtttc tcagctggag cccatgcggc gaatgtagta gggccatcac tgaattcctg
721 tcaaggtatc cccacgtcac tctgtttatt tacatcgcaa ggctgtacca ccacgctgac
781 ccccgcaatc gacaaggcct gcgggatttg atctcttcag gtgtgactat ccaaattatg
841 actgagcagg agtcaggata ctgctggaga aactttgtga attatagccc gagtaatgaa
901 gcccactggc ctaggtatcc ccatctgtgg gtacgactgt acgttcttga actgtactgc
961 atcatactgg gcctgcctcc ttgtctcaac attctgagaa ggaagcagcc acagctgaca
1021 ttctttacca tcgctcttca gtcttgtcat taccagcgac tgcccccaca cattctctgg
1081 gccaccgggt tgaaatctgg tggttcttct ggtggttcta gcggcagcga gactcccggg
1141 acctcagagt ccgccacacc cgaaagttct ggtggttctt ctggtggttc tgataaaaag
1201 tattctattg gtttagccat cggcactaat tccgttggat gggctgtcat aaccgatgaa
1261 tacaaagtac cttcaaagaa atttaaggtg ttggggaaca cagaccgtca ttcgattaaa
1321 aagaatctta tcggtgccct cctattcgat agtggcgaaa cggcagaggc gactcgcctg
1381 aaacgaaccg ctcggagaag gtatacacgt cgcaagaacc gaatatgtta cttacaagaa
1441 atttttagca atgagatggc caaagttgac gattctttct ttcaccgttt ggaagagtcc
1501 ttccttgtcg aagaggacaa gaaacatgaa cggcacccca tctttggaaa catagtagat
1561 gaggtggcat atcatgaaaa gtacccaacg atttatcacc tcagaaaaaa gctagttgac
1621 tcaactgata aagcggacct gaggttaatc tacttggctc ttgcccatat gataaagttc
1681 cgtgggcact ttctcattga gggtgatcta aatccggaca actcggatgt cgacaaactg
1741 ttcatccagt tagtacaaac ctataatcag ttgtttgaag agaaccctat aaatgcaagt
1801 ggcgtggatg cgaaggctat tcttagcgcc cgcctctcta aatcccgacg gctagaaaac
1861 ctgatcgcac aattacccgg agagaagaaa aatgggttgt tcggtaacct tatagcgctc
1921 tcactaggcc tgacaccaaa ttttaagtcg aacttcgact tagctgaaga tgccaaattg
1981 cagcttagta aggacacgta cgatgacgat ctcgacaatc tactggcaca aattggagat
2041 cagtatgcgg acttattttt ggctgccaaa aaccttagcg atgcaatcct cctatctgac
2101 atactgagag ttaatactga gattaccaag gcgccgttat ccgcttcaat gatcaaaagg
2161 tacgatgaac atcaccaaga cttgacactt ctcaaggccc tagtccgtca gcaactgcct
2221 gagaaatata aggaaatatt ctttgatcag tcgaaaaacg ggtacgcagg ttatattgac
2281 ggcggagcga gtcaagagga attctacaag tttatcaaac ccatattaga gaagatggat
2341 gggacggaag agttgcttgt aaaactcaat cgcgaagatc tactgcgaaa gcagcggact
2401 ttcgacaacg gtagcattcc acatcaaatc cacttaggcg aattgcatgc tatacttaga
2461 aggcaggagg atttttatcc gttcctcaaa gacaatcgtg aaaagattga gaaaatccta
2521 acctttcgca taccttacta tgtgggaccc ctggcccgag ggaactctcg gttcgcatgg
2581 atgacaagaa agtccgaaga aacgattact ccatggaatt ttgaggaagt tgtcgataaa
2641 ggtgcgtcag ctcaatcgtt catcgagagg atgaccaact ttgacaagaa tttaccgaac
2701 gaaaaagtat tgcctaagca cagtttactt tacgagtatt tcacagtgta caatgaactc
2761 acgaaagtta agtatgtcac tgagggcatg cgtaaacccg cctttctaag cggagaacag
2821 aagaaagcaa tagtagatct gttattcaag accaaccgca aagtgacagt taagcaattg
2881 aaagaggact actttaagaa aattgaatgc ttcgattctg tcgagatctc cggggtagaa
2941 gatcgattta atgcgtcact tggtacgtat catgacctcc taaagataat taaagataag
3001 gacttcctgg ataacgaaga gaatgaagat atcttagaag atatagtgtt gactcttacc
3061 ctctttgaag atcgggaaat gattgaggaa agactaaaaa catacgctca cctgttcgac
3121 gataaggtta tgaaacagtt aaagaggcgt cgctatacgg gctggggacg attgtcgcgg
3181 aaacttatca acgggataag agacaagcaa agtggtaaaa ctattctcga ttttctaaag
3241 agcgacggct tcgccaatag gaactttatg cagctgatcc atgatgactc tttaaccttc
3301 aaagaggata tacaaaaggc acaggtttcc ggacaagggg actcattgca cgaacatatt
3361 gcgaatcttg ctggttcgcc agccatcaaa aagggcatac tccagacagt caaagtagtg
3421 gatgagctag ttaaggtcat gggacgtcac aaaccggaaa acattgtaat cgagatggca
3481 cgcgaaaatc aaacgactca gaaggggcaa aaaaacagtc gagagcggat gaagagaata
3541 gaagagggta ttaaagaact gggcagccag atcttaaagg agcatcctgt ggaaaatacc
3601 caattgcaga acgagaaact ttacctctat tacctacaaa atggaaggga catgtatgtt
3661 gatcaggaac tggacataaa ccgtttatct gattacgacg tcgatcacat tgtaccccaa
3721 tcctttttga aggacgattc aatcgacaat aaagtgctta cacgctcgga taagaaccga
3781 gggaaaagtg acaatgttcc aagcgaggaa gtcgtaaaga aaatgaagaa ctattggcgg
3841 cagctcctaa atgcgaaact gataacgcaa agaaagttcg ataacttaac taaagctgag
3901 aggggtggct tgtctgaact tgacaaggcc ggatttatta aacgtcagct cgtggaaacc
3961 cgccaaatca caaagcatgt tgcacagata ctagattccc gaatgaatac gaaatacgac
4021 gagaacgata agctgattcg ggaagtcaaa gtaatcactt taaagtcaaa attggtgtcg
4081 gacttcagaa aggattttca attctataaa gttagggaga taaataacta ccaccatgcg
4141 cacgacgctt atcttaatgc cgtcgtaggg accgcactca ttaagaaata cccgaagcta
4201 gaaagtgagt ttgtgtatgg tgattacaaa gtttatgacg tccgtaagat gatcgcgaaa
4261 agcgaacagg agataggcaa ggctacagcc aaatacttct tttattctaa cattatgaat
4321 ttctttaaga cggaaatcac tctggcaaac ggagagatac gcaaacgacc tttaattgaa
4381 accaatgggg agacaggtga aatcgtatgg gataagggcc gggacttcgc gacggtgaga
4441 aaagttttgt ccatgcccca agtcaacata gtaaagaaaa ctgaggtgca gaccggaggg
4501 ttttcaaagg aatcgattct tccaaaaagg aatagtgata agctcatcgc tcgtaaaaag
4561 gactgggacc cgaaaaagta cggtggcttc gatagcccta cagttgccta ttctgtccta
4621 gtagtggcaa aagttgagaa gggaaaatcc aagaaactga agtcagtcaa agaattattg
4681 gggataacga ttatggagcg ctcgtctttt gaaaagaacc ccatcgactt ccttgaggcg
4741 aaaggttaca aggaagtaaa aaaggatctc ataattaaac taccaaagta tagtctgttt
4801 gagttagaaa atggccgaaa acggatgttg gctagcgccg gagagcttca aaaggggaac
4861 gaactcgcac taccgtctaa atacgtgaat ttcctgtatt tagcgtccca ttacgagaag
4921 ttgaaaggtt cacctgaaga taacgaacag aagcaacttt ttgttgagca gcacaaacat
4981 tatctcgacg aaatcataga gcaaatttcg gaattcagta agagagtcat cctagctgat
5041 gccaatctgg acaaagtatt aagcgcatac aacaagcaca gggataaacc catacgtgag
5101 caggcggaaa atattatcca tttgtttact cttaccaacc tcggcgctcc agccgcattc
5161 aagtattttg acacaacgat agatcgcaaa cgatacactt ctaccaagga ggtgctagac
5221 gcgacactga ttcaccaatc catcacggga ttatatgaaa ctcggataga tttgtcacag
5281 cttgggggtg actctggtgg ttctggagga tctggtggtt ctactaatct gtcagatatt
5341 attgaaaagg agaccggtaa gcaactggtt atccaggaat ccatcctcat gctcccagag
5401 gaggtggaag aagtcattgg gaacaagccg gaaagcgata tactcgtgca caccgcctac
5461 gacgagagca ccgacgagaa tgtcatgctt ctgactagcg acgcccctga atacaagcct
5521 tgggctctgg tcatacagga tagcaacggt gagaacaaga ttaagatgct ctctggtggt
5581 tctggaggat ctggtggttc tactaatctg tcagatatta ttgaaaagga gaccggtaag
5641 caactggtta tccaggaatc catcctcatg ctcccagagg aggtggaaga agtcattggg
5701 aacaagccgg aaagcgatat actcgtgcac accgcctacg acgagagcac cgacgagaat
5761 gtcatgcttc tgactagcga cgcccctgaa tacaagcctt gggctctggt catacaggat
5821 agcaacggtg agaacaagat taagatgctc tctggtggtt ctcccaagaa gaagaggaaa
5881 gtctaaccgg tcatcatcac catcaccatt gagtttaaac ccgctgatca gcctcgactg
5941 tgccttctag ttgccagcca tctgttgttt gcccctcccc cgtgccttcc ttgaccctgg
6001 aaggtgccac tcccactgtc ctttcctaat aaaatgagga aattgcatcg cattgtctga
6061 gtaggtgtca ttctattctg gggggtgggg tggggcagga cagcaagggg gaggattggg
6121 aagacaatag caggcatgct ggggatgcgg tgggctctat ggcttctgag gcggaaagaa
6181 ccagctgggg ctcgataccg tcgacctcta gctagagctt ggcgtaatca tggtcatagc
6241 tgtttcctgt gtgaaattgt tatccgctca caattccaca caacatacga gccggaagca
6301 taaagtgtaa agcctagggt gcctaatgag tgagctaact cacattaatt gcgttgcgct
6361 cactgcccgc tttccagtcg ggaaacctgt cgtgccagct gcattaatga atcggccaac
6421 gcgcggggag aggcggtttg cgtattgggc gctcttccgc ttcctcgctc actgactcgc
6481 tgcgctcggt cgttcggctg cggcgagcgg tatcagctca ctcaaaggcg gtaatacggt
6541 tatccacaga atcaggggat aacgcaggaa agaacatgtg agcaaaaggc cagcaaaagg
6601 ccaggaaccg taaaaaggcc gcgttgctgg cgtttttcca taggctccgc ccccctgacg
6661 agcatcacaa aaatcgacgc tcaagtcaga ggtggcgaaa cccgacagga ctataaagat
6721 accaggcgtt tccccctgga agctccctcg tgcgctctcc tgttccgacc ctgccgctta
6781 ccggatacct gtccgccttt ctcccttcgg gaagcgtggc gctttctcat agctcacgct
6841 gtaggtatct cagttcggtg taggtcgttc gctccaagct gggctgtgtg cacgaacccc
6901 ccgttcagcc cgaccgctgc gccttatccg gtaactatcg tcttgagtcc aacccggtaa
6961 gacacgactt atcgccactg gcagcagcca ctggtaacag gattagcaga gcgaggtatg
7021 taggcggtgc tacagagttc ttgaagtggt ggcctaacta cggctacact agaagaacag
7081 tatttggtat ctgcgctctg ctgaagccag ttaccttcgg aaaaagagtt ggtagctctt
7141 gatccggcaa acaaaccacc gctggtagcg gtggtttttt tgtttgcaag cagcagatta
7201 cgcgcagaaa aaaaggatct caagaagatc ctttgatctt ttctacgggg tctgacgctc
7261 agtggaacga aaactcacgt taagggattt tggtcatgag attatcaaaa aggatcttca
7321 cctagatcct tttaaattaa aaatgaagtt ttaaatcaat ctaaagtata tatgagtaaa
7381 cttggtctga cagttaccaa tgcttaatca gtgaggcacc tatctcagcg atctgtctat
7441 ttcgttcatc catagttgcc tgactccccg tcgtgtagat aactacgata cgggagggct
7501 taccatctgg ccccagtgct gcaatgatac cgcgagaccc acgctcaccg gctccagatt
7561 tatcagcaat aaaccagcca gccggaaggg ccgagcgcag aagtggtcct gcaactttat
7621 ccgcctccat ccagtctatt aattgttgcc gggaagctag agtaagtagt tcgccagtta
7681 atagtttgcg caacgttgtt gccattgcta caggcatcgt ggtgtcacgc tcgtcgtttg
7741 gtatggcttc attcagctcc ggttcccaac gatcaaggcg agttacatga tcccccatgt
7801 tgtgcaaaaa agcggttagc tccttcggtc ctccgatcgt tgtcagaagt aagttggccg
7861 cagtgttatc actcatggtt atggcagcac tgcataattc tcttactgtc atgccatccg
7921 taagatgctt ttctgtgact ggtgagtact caaccaagtc attctgagaa tagtgtatgc
7981 ggcgaccgag ttgctcttgc ccggcgtcaa tacgggataa taccgcgcca catagcagaa
8041 ctttaaaagt gctcatcatt ggaaaacgtt cttcggggcg aaaactctca aggatcttac
8101 cgctgttgag atccagttcg atgtaaccca ctcgtgcacc caactgatct tcagcatctt
8161 ttactttcac cagcgtttct gggtgagcaa aaacaggaag gcaaaatgcc gcaaaaaagg
8221 gaataagggc gacacggaaa tgttgaatac tcatactctt cctttttcaa tattattgaa
8281 gcatttatca gggttattgt ctcatgagcg gatacatatt tgaatgtatt tagaaaaata
8341 aacaaatagg ggttccgcgc acatttcccc gaaaagtgcc acctgacgtc gacggatcgg
8401 gagatcgatc tcccgatccc ctagggtcga ctctcagtac aatctgctct gatgccgcat
8461 agttaagcca gtatctgctc cctgcttgtg tgttggaggt cgctgagtag tgcgcgagca
8521 aaatttaagc tacaacaagg caaggcttga ccgacaattg catgaagaat ctgcttaggg
8581 ttaggcgttt tgcgctgctt cgcgatgtac gggccagata tacgcgttga cattgattat
8641 tgactagtta ttaatagtaa tcaattacgg ggtcattagt tcatagccca tatatggagt
8701 tccgcgttac ataacttacg gtaaatggcc cgcctggctg accgcccaac gacccccgcc
8761 cattgacgtc aataatgacg tatgttccca tagtaacgcc aatagggact ttccattgac
8821 gtcaatgggt ggagtattta cggtaaactg cccacttggc agtacatcaa gtgtatc

BE4アミノ酸配列：
MSSETGPVAVDPTLRRRIEPHEFEVFFDPRELRKETCLLYEINWGGRHSIWRHTSQNTNKHVEVNFIEKFTTERYFCPNTRCSITWFLSWSPCGECSRAITEFLSRYPHVTLFIYIARLYHHADPRNRQGLRDLISSGVTIQIMTEQESGYCWRNFVNYSPSNEAHWPRYPHLWVRLYVLELYCIILGLPPCLNILRRKQPQLTFFTIALQSCHYQRLPPHILWATGLKSGGSSGGSSGSETPGTSESATPESSGGSSGGSDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGDSGGSGGSGGSTNLSDIIEKETGKQLVIQESILMLPEEVEEVIGNKPESDILVHTAYDESTDENVMLLTSDAPEYKPWALVIQDSNGENKIKMLSGGSGGSGGSTNLSDIIEKETGKQLVIQESILMLPEEVEEVIGNKPESDILVHTAYDESTDENVMLLTSDAPEYKPWALVIQDSNGENKIKMLSGGSPKKKRK

例として、本明細書に記載の塩基編集組成物、システムおよび方法で使用されるアデニン塩基エディター（ABE）は、下記に提供される核酸配列（8877塩基対）を有する（Addgene, Watertown, MA.; Gaudelli NM, et al., Nature. 2017 Nov 23;551(7681):464-471. doi: 10.1038/nature24644; Koblan LW, et al., Nat Biotechnol. 2018 Oct;36(9):843-846. doi: 10.1038/nbt.4172.）。ABE核酸配列に対して少なくとも95％以上の同一性を有するポリヌクレオチド配列も包含される。

ATATGCCAAGTACGCCCCCTATTGACGTCAATGACGGTAAATGGCCCGCCTGGCATTATGCCCAGTACAT
GACCTTATGGGACTTTCCTACTTGGCAGTACATCTACGTATTAGTCATCGCTATTACCATGGTGATGCGG
TTTTGGCAGTACATCAATGGGCGTGGATAGCGGTTTGACTCACGGGGATTTCCAAGTCTCCACCCCATTG
ACGTCAATGGGAGTTTGTTTTGGCACCAAAATCAACGGGACTTTCCAAAATGTCGTAACAACTCCGCCCC
ATTGACGCAAATGGGCGGTAGGCGTGTACGGTGGGAGGTCTATATAAGCAGAGCTGGTTTAGTGAACCGT
CAGATCCGCTAGAGATCCGCGGCCGCTAATACGACTCACTATAGGGAGAGCCGCCACCATGAAACGGACA
GCCGACGGAAGCGAGTTCGAGTCACCAAAGAAGAAGCGGAAAGTCTCTGAAGTCGAGTTTAGCCACGAGT
ATTGGATGAGGCACGCACTGACCCTGGCAAAGCGAGCATGGGATGAAAGAGAAGTCCCCGTGGGCGCCGT
GCTGGTGCACAACAATAGAGTGATCGGAGAGGGATGGAACAGGCCAATCGGCCGCCACGACCCTACCGCA
CACGCAGAGATCATGGCACTGAGGCAGGGAGGCCTGGTCATGCAGAATTACCGCCTGATCGATGCCACCC
TGTATGTGACACTGGAGCCATGCGTGATGTGCGCAGGAGCAATGATCCACAGCAGGATCGGAAGAGTGGT
GTTCGGAGCACGGGACGCCAAGACCGGCGCAGCAGGCTCCCTGATGGATGTGCTGCACCACCCCGGCATG
AACCACCGGGTGGAGATCACAGAGGGAATCCTGGCAGACGAGTGCGCCGCCCTGCTGAGCGATTTCTTTA
GAATGCGGAGACAGGAGATCAAGGCCCAGAAGAAGGCACAGAGCTCCACCGACTCTGGAGGATCTAGCGG
AGGATCCTCTGGAAGCGAGACACCAGGCACAAGCGAGTCCGCCACACCAGAGAGCTCCGGCGGCTCCTCC
GGAGGATCCTCTGAGGTGGAGTTTTCCCACGAGTACTGGATGAGACATGCCCTGACCCTGGCCAAGAGGG
CACGCGATGAGAGGGAGGTGCCTGTGGGAGCCGTGCTGGTGCTGAACAATAGAGTGATCGGCGAGGGCTG
GAACAGAGCCATCGGCCTGCACGACCCAACAGCCCATGCCGAAATTATGGCCCTGAGACAGGGCGGCCTG
GTCATGCAGAACTACAGACTGATTGACGCCACCCTGTACGTGACATTCGAGCCTTGCGTGATGTGCGCCG
GCGCCATGATCCACTCTAGGATCGGCCGCGTGGTGTTTGGCGTGAGGAACGCAAAAACCGGCGCCGCAGG
CTCCCTGATGGACGTGCTGCACTACCCCGGCATGAATCACCGCGTCGAAATTACCGAGGGAATCCTGGCA
GATGAATGTGCCGCCCTGCTGTGCTATTTCTTTCGGATGCCTAGACAGGTGTTCAATGCTCAGAAGAAGG
CCCAGAGCTCCACCGACTCCGGAGGATCTAGCGGAGGCTCCTCTGGCTCTGAGACACCTGGCACAAGCGA
GAGCGCAACACCTGAAAGCAGCGGGGGCAGCAGCGGGGGGTCAGACAAGAAGTACAGCATCGGCCTGGCC
ATCGGCACCAACTCTGTGGGCTGGGCCGTGATCACCGACGAGTACAAGGTGCCCAGCAAGAAATTCAAGG
TGCTGGGCAACACCGACCGGCACAGCATCAAGAAGAACCTGATCGGAGCCCTGCTGTTCGACAGCGGCGA
AACAGCCGAGGCCACCCGGCTGAAGAGAACCGCCAGAAGAAGATACACCAGACGGAAGAACCGGATCTGC
TATCTGCAAGAGATCTTCAGCAACGAGATGGCCAAGGTGGACGACAGCTTCTTCCACAGACTGGAAGAGT
CCTTCCTGGTGGAAGAGGATAAGAAGCACGAGCGGCACCCCATCTTCGGCAACATCGTGGACGAGGTGGC
CTACCACGAGAAGTACCCCACCATCTACCACCTGAGAAAGAAACTGGTGGACAGCACCGACAAGGCCGAC
CTGCGGCTGATCTATCTGGCCCTGGCCCACATGATCAAGTTCCGGGGCCACTTCCTGATCGAGGGCGACC
TGAACCCCGACAACAGCGACGTGGACAAGCTGTTCATCCAGCTGGTGCAGACCTACAACCAGCTGTTCGA
GGAAAACCCCATCAACGCCAGCGGCGTGGACGCCAAGGCCATCCTGTCTGCCAGACTGAGCAAGAGCAGA
CGGCTGGAAAATCTGATCGCCCAGCTGCCCGGCGAGAAGAAGAATGGCCTGTTCGGAAACCTGATTGCCC
TGAGCCTGGGCCTGACCCCCAACTTCAAGAGCAACTTCGACCTGGCCGAGGATGCCAAACTGCAGCTGAG
CAAGGACACCTACGACGACGACCTGGACAACCTGCTGGCCCAGATCGGCGACCAGTACGCCGACCTGTTT
CTGGCCGCCAAGAACCTGTCCGACGCCATCCTGCTGAGCGACATCCTGAGAGTGAACACCGAGATCACCA
AGGCCCCCCTGAGCGCCTCTATGATCAAGAGATACGACGAGCACCACCAGGACCTGACCCTGCTGAAAGC
TCTCGTGCGGCAGCAGCTGCCTGAGAAGTACAAAGAGATTTTCTTCGACCAGAGCAAGAACGGCTACGCC
GGCTACATTGACGGCGGAGCCAGCCAGGAAGAGTTCTACAAGTTCATCAAGCCCATCCTGGAAAAGATGG
ACGGCACCGAGGAACTGCTCGTGAAGCTGAACAGAGAGGACCTGCTGCGGAAGCAGCGGACCTTCGACAA
CGGCAGCATCCCCCACCAGATCCACCTGGGAGAGCTGCACGCCATTCTGCGGCGGCAGGAAGATTTTTAC
CCATTCCTGAAGGACAACCGGGAAAAGATCGAGAAGATCCTGACCTTCCGCATCCCCTACTACGTGGGCC
CTCTGGCCAGGGGAAACAGCAGATTCGCCTGGATGACCAGAAAGAGCGAGGAAACCATCACCCCCTGGAA
CTTCGAGGAAGTGGTGGACAAGGGCGCTTCCGCCCAGAGCTTCATCGAGCGGATGACCAACTTCGATAAG
AACCTGCCCAACGAGAAGGTGCTGCCCAAGCACAGCCTGCTGTACGAGTACTTCACCGTGTATAACGAGC
TGACCAAAGTGAAATACGTGACCGAGGGAATGAGAAAGCCCGCCTTCCTGAGCGGCGAGCAGAAAAAGGC
CATCGTGGACCTGCTGTTCAAGACCAACCGGAAAGTGACCGTGAAGCAGCTGAAAGAGGACTACTTCAAG
AAAATCGAGTGCTTCGACTCCGTGGAAATCTCCGGCGTGGAAGATCGGTTCAACGCCTCCCTGGGCACAT
ACCACGATCTGCTGAAAATTATCAAGGACAAGGACTTCCTGGACAATGAGGAAAACGAGGACATTCTGGA
AGATATCGTGCTGACCCTGACACTGTTTGAGGACAGAGAGATGATCGAGGAACGGCTGAAAACCTATGCC
CACCTGTTCGACGACAAAGTGATGAAGCAGCTGAAGCGGCGGAGATACACCGGCTGGGGCAGGCTGAGCC
GGAAGCTGATCAACGGCATCCGGGACAAGCAGTCCGGCAAGACAATCCTGGATTTCCTGAAGTCCGACGG
CTTCGCCAACAGAAACTTCATGCAGCTGATCCACGACGACAGCCTGACCTTTAAAGAGGACATCCAGAAA
GCCCAGGTGTCCGGCCAGGGCGATAGCCTGCACGAGCACATTGCCAATCTGGCCGGCAGCCCCGCCATTA
AGAAGGGCATCCTGCAGACAGTGAAGGTGGTGGACGAGCTCGTGAAAGTGATGGGCCGGCACAAGCCCGA
GAACATCGTGATCGAAATGGCCAGAGAGAACCAGACCACCCAGAAGGGACAGAAGAACAGCCGCGAGAGA
ATGAAGCGGATCGAAGAGGGCATCAAAGAGCTGGGCAGCCAGATCCTGAAAGAACACCCCGTGGAAAACA
CCCAGCTGCAGAACGAGAAGCTGTACCTGTACTACCTGCAGAATGGGCGGGATATGTACGTGGACCAGGA
ACTGGACATCAACCGGCTGTCCGACTACGATGTGGACCATATCGTGCCTCAGAGCTTTCTGAAGGACGAC
TCCATCGACAACAAGGTGCTGACCAGAAGCGACAAGAACCGGGGCAAGAGCGACAACGTGCCCTCCGAAG
AGGTCGTGAAGAAGATGAAGAACTACTGGCGGCAGCTGCTGAACGCCAAGCTGATTACCCAGAGAAAGTT
CGACAATCTGACCAAGGCCGAGAGAGGCGGCCTGAGCGAACTGGATAAGGCCGGCTTCATCAAGAGACAG
CTGGTGGAAACCCGGCAGATCACAAAGCACGTGGCACAGATCCTGGACTCCCGGATGAACACTAAGTACG
ACGAGAATGACAAGCTGATCCGGGAAGTGAAAGTGATCACCCTGAAGTCCAAGCTGGTGTCCGATTTCCG
GAAGGATTTCCAGTTTTACAAAGTGCGCGAGATCAACAACTACCACCACGCCCACGACGCCTACCTGAAC
GCCGTCGTGGGAACCGCCCTGATCAAAAAGTACCCTAAGCTGGAAAGCGAGTTCGTGTACGGCGACTACA
AGGTGTACGACGTGCGGAAGATGATCGCCAAGAGCGAGCAGGAAATCGGCAAGGCTACCGCCAAGTACTT
CTTCTACAGCAACATCATGAACTTTTTCAAGACCGAGATTACCCTGGCCAACGGCGAGATCCGGAAGCGG
CCTCTGATCGAGACAAACGGCGAAACCGGGGAGATCGTGTGGGATAAGGGCCGGGATTTTGCCACCGTGC
GGAAAGTGCTGAGCATGCCCCAAGTGAATATCGTGAAAAAGACCGAGGTGCAGACAGGCGGCTTCAGCAA
AGAGTCTATCCTGCCCAAGAGGAACAGCGATAAGCTGATCGCCAGAAAGAAGGACTGGGACCCTAAGAAG
TACGGCGGCTTCGACAGCCCCACCGTGGCCTATTCTGTGCTGGTGGTGGCCAAAGTGGAAAAGGGCAAGT
CCAAGAAACTGAAGAGTGTGAAAGAGCTGCTGGGGATCACCATCATGGAAAGAAGCAGCTTCGAGAAGAA
TCCCATCGACTTTCTGGAAGCCAAGGGCTACAAAGAAGTGAAAAAGGACCTGATCATCAAGCTGCCTAAG
TACTCCCTGTTCGAGCTGGAAAACGGCCGGAAGAGAATGCTGGCCTCTGCCGGCGAACTGCAGAAGGGAA
ACGAACTGGCCCTGCCCTCCAAATATGTGAACTTCCTGTACCTGGCCAGCCACTATGAGAAGCTGAAGGG
CTCCCCCGAGGATAATGAGCAGAAACAGCTGTTTGTGGAACAGCACAAGCACTACCTGGACGAGATCATC
GAGCAGATCAGCGAGTTCTCCAAGAGAGTGATCCTGGCCGACGCTAATCTGGACAAAGTGCTGTCCGCCT
ACAACAAGCACCGGGATAAGCCCATCAGAGAGCAGGCCGAGAATATCATCCACCTGTTTACCCTGACCAA
TCTGGGAGCCCCTGCCGCCTTCAAGTACTTTGACACCACCATCGACCGGAAGAGGTACACCAGCACCAAA
GAGGTGCTGGACGCCACCCTGATCCACCAGAGCATCACCGGCCTGTACGAGACACGGATCGACCTGTCTC
AGCTGGGAGGTGACTCTGGCGGCTCAAAAAGAACCGCCGACGGCAGCGAATTCGAGCCCAAGAAGAAGAG
GAAAGTCTAACCGGTCATCATCACCATCACCATTGAGTTTAAACCCGCTGATCAGCCTCGACTGTGCCTT
CTAGTTGCCAGCCATCTGTTGTTTGCCCCTCCCCCGTGCCTTCCTTGACCCTGGAAGGTGCCACTCCCAC
TGTCCTTTCCTAATAAAATGAGGAAATTGCATCGCATTGTCTGAGTAGGTGTCATTCTATTCTGGGGGGT
GGGGTGGGGCAGGACAGCAAGGGGGAGGATTGGGAAGACAATAGCAGGCATGCTGGGGATGCGGTGGGCT
CTATGGCTTCTGAGGCGGAAAGAACCAGCTGGGGCTCGATACCGTCGACCTCTAGCTAGAGCTTGGCGTA
ATCATGGTCATAGCTGTTTCCTGTGTGAAATTGTTATCCGCTCACAATTCCACACAACATACGAGCCGGA
AGCATAAAGTGTAAAGCCTAGGGTGCCTAATGAGTGAGCTAACTCACATTAATTGCGTTGCGCTCACTGC
CCGCTTTCCAGTCGGGAAACCTGTCGTGCCAGCTGCATTAATGAATCGGCCAACGCGCGGGGAGAGGCGG
TTTGCGTATTGGGCGCTCTTCCGCTTCCTCGCTCACTGACTCGCTGCGCTCGGTCGTTCGGCTGCGGCGA
GCGGTATCAGCTCACTCAAAGGCGGTAATACGGTTATCCACAGAATCAGGGGATAACGCAGGAAAGAACA
TGTGAGCAAAAGGCCAGCAAAAGGCCAGGAACCGTAAAAAGGCCGCGTTGCTGGCGTTTTTCCATAGGCT
CCGCCCCCCTGACGAGCATCACAAAAATCGACGCTCAAGTCAGAGGTGGCGAAACCCGACAGGACTATAA
AGATACCAGGCGTTTCCCCCTGGAAGCTCCCTCGTGCGCTCTCCTGTTCCGACCCTGCCGCTTACCGGAT
ACCTGTCCGCCTTTCTCCCTTCGGGAAGCGTGGCGCTTTCTCATAGCTCACGCTGTAGGTATCTCAGTTC
GGTGTAGGTCGTTCGCTCCAAGCTGGGCTGTGTGCACGAACCCCCCGTTCAGCCCGACCGCTGCGCCTTA
TCCGGTAACTATCGTCTTGAGTCCAACCCGGTAAGACACGACTTATCGCCACTGGCAGCAGCCACTGGTA
ACAGGATTAGCAGAGCGAGGTATGTAGGCGGTGCTACAGAGTTCTTGAAGTGGTGGCCTAACTACGGCTA
CACTAGAAGAACAGTATTTGGTATCTGCGCTCTGCTGAAGCCAGTTACCTTCGGAAAAAGAGTTGGTAGC
TCTTGATCCGGCAAACAAACCACCGCTGGTAGCGGTGGTTTTTTTGTTTGCAAGCAGCAGATTACGCGCA
GAAAAAAAGGATCTCAAGAAGATCCTTTGATCTTTTCTACGGGGTCTGACACTCAGTGGAACGAAAACTC
ACGTTAAGGGATTTTGGTCATGAGATTATCAAAAAGGATCTTCACCTAGATCCTTTTAAATTAAAAATGA
AGTTTTAAATCAATCTAAAGTATATATGAGTAAACTTGGTCTGACAGTTACCAATGCTTAATCAGTGAGG
CACCTATCTCAGCGATCTGTCTATTTCGTTCATCCATAGTTGCCTGACTCCCCGTCGTGTAGATAACTAC
GATACGGGAGGGCTTACCATCTGGCCCCAGTGCTGCAATGATACCGCGAGACCCACGCTCACCGGCTCCA
GATTTATCAGCAATAAACCAGCCAGCCGGAAGGGCCGAGCGCAGAAGTGGTCCTGCAACTTTATCCGCCT
CCATCCAGTCTATTAATTGTTGCCGGGAAGCTAGAGTAAGTAGTTCGCCAGTTAATAGTTTGCGCAACGT
TGTTGCCATTGCTACAGGCATCGTGGTGTCACGCTCGTCGTTTGGTATGGCTTCATTCAGCTCCGGTTCC
CAACGATCAAGGCGAGTTACATGATCCCCCATGTTGTGCAAAAAAGCGGTTAGCTCCTTCGGTCCTCCGA
TCGTTGTCAGAAGTAAGTTGGCCGCAGTGTTATCACTCATGGTTATGGCAGCACTGCATAATTCTCTTAC
TGTCATGCCATCCGTAAGATGCTTTTCTGTGACTGGTGAGTACTCAACCAAGTCATTCTGAGAATAGTGT
ATGCGGCGACCGAGTTGCTCTTGCCCGGCGTCAATACGGGATAATACCGCGCCACATAGCAGAACTTTAA
AAGTGCTCATCATTGGAAAACGTTCTTCGGGGCGAAAACTCTCAAGGATCTTACCGCTGTTGAGATCCAG
TTCGATGTAACCCACTCGTGCACCCAACTGATCTTCAGCATCTTTTACTTTCACCAGCGTTTCTGGGTGA
GCAAAAACAGGAAGGCAAAATGCCGCAAAAAAGGGAATAAGGGCGACACGGAAATGTTGAATACTCATAC
TCTTCCTTTTTCAATATTATTGAAGCATTTATCAGGGTTATTGTCTCATGAGCGGATACATATTTGAATG
TATTTAGAAAAATAAACAAATAGGGGTTCCGCGCACATTTCCCCGAAAAGTGCCACCTGACGTCGACGGA
TCGGGAGATCGATCTCCCGATCCCCTAGGGTCGACTCTCAGTACAATCTGCTCTGATGCCGCATAGTTAA
GCCAGTATCTGCTCCCTGCTTGTGTGTTGGAGGTCGCTGAGTAGTGCGCGAGCAAAATTTAAGCTACAAC
AAGGCAAGGCTTGACCGACAATTGCATGAAGAATCTGCTTAGGGTTAGGCGTTTTGCGCTGCTTCGCGAT
GTACGGGCCAGATATACGCGTTGACATTGATTATTGACTAGTTATTAATAGTAATCAATTACGGGGTCAT
TAGTTCATAGCCCATATATGGAGTTCCGCGTTACATAACTTACGGTAAATGGCCCGCCTGGCTGACCGCC
CAACGACCCCCGCCCATTGACGTCAATAATGACGTATGTTCCCATAGTAACGCCAATAGGGACTTTCCAT
TGACGTCAATGGGTGGAGTATTTACGGTAAACTGCCCACTTGGCAGTACATCAAGTGTATC

「塩基編集活性」とは、ポリヌクレオチド内の塩基を化学的に改変させるように作用することを意味する。一実施形態では、第1の塩基が第2の塩基に変換される。一実施形態では、塩基編集活性は、シチジンデアミナーゼ活性、例えば標的C・GをT・Aに変換する活性である。別の実施形態では、塩基編集活性は、アデノシンまたはアデニンデアミナーゼ活性、例えばA・TをG・Cに変換する活性である。別の実施形態では、塩基編集活性は、シチジンデアミナーゼ活性、例えば標的C・GをT・Aに変換する活性であり、アデノシンまたはアデニンデアミナーゼ活性、例えばA・TをG・Cに変換する活性である。いくつかの実施形態では、塩基編集活性は、編集の効率によって評価される。塩基編集効率は、任意の適切な手段、例えば、サンガーシークエンシングまたは次世代シークエンシングによって測定することができる。いくつかの実施形態において、塩基編集効率は、塩基エディターによってもたらされる核酸塩基変換を伴う全配列決定リードのパーセンテージ、例えば、Ｇ．Ｃ塩基対に変換された標的Ａ．Ｔ塩基対を伴う全配列決定リードのパーセンテージによって測定される。いくつかの実施形態において、塩基編集効率は、細胞の集団において塩基編集が行われる場合に、塩基エディターによってもたらされる核酸塩基変換を伴う全細胞のパーセンテージによって測定される。

「塩基エディターシステム」という用語は、標的ヌクレオチド配列の核酸塩基を編集するためのシステムを指す。様々な実施形態において、塩基エディターシステムは、（1）ポリヌクレオチドプログラム可能なヌクレオチド結合ドメイン（例えばCas9）；（2）前記核酸塩基を脱アミノ化するためのデアミナーゼドメイン（例えば、アデノシンデアミナーゼまたはシチジンデアミナーゼ）；および（3）１つまたは複数のガイドポリヌクレオチド（例えば、ガイドRNA）を含む。いくつかの実施形態において、ポリヌクレオチドプログラム可能なヌクレオチド結合ドメインは、ポリヌクレオチドプログラム可能なＤＮＡ結合ドメインである。いくつかの実施形態において、塩基エディターは、アデニンまたはアデノシン塩基エディター（ABE）である。いくつかの実施形態では、塩基エディターシステムはABE8である。

いくつかの実施形態では、塩基エディターシステムは、２つ以上の塩基編集コンポーネントを含み得る。例えば、塩基エディターシステムは、複数のデアミナーゼを含み得る。いくつかの実施形態では、塩基エディターシステムは、１つまたは複数のアデノシンデアミナーゼを含み得る。いくつかの実施形態において、単一のガイドポリヌクレオチドを利用して、異なるデアミナーゼを標的核酸配列にターゲティングすることができる。いくつかの実施形態において、ガイドポリヌクレオチドの単一の対を利用して、異なるデアミナーゼを標的核酸配列にターゲティングすることができる。

塩基エディター系のデアミナーゼドメインおよびポリヌクレオチドプログラミング可能なヌクレオチド結合成分は、互いに共有結合的または非共有結合的により、またはその結合および相互作用の任意の組合せにより結合され得る。例えば、いくつかの実施形態において、デアミナーゼドメインが、ポリヌクレオチドプログラミング可能なヌクレオチド結合ドメインによって標的ヌクレオチド配列にターゲティングされ得る。ある実施形態において、ポリヌクレオチドプログラミング可能なヌクレオチド結合ドメインは、デアミナーゼドメインに融合または連結され得る。いくつかの実施形態において、ポリヌクレオチドプログラミング可能なヌクレオチド結合ドメインは、デアミナーゼドメインと非共有結合的に相互作用または結合することによって、デアミナーゼドメインを標的ヌクレオチド配列にターゲティングすることができる。例えば、いくつかの実施形態において、デアミナーゼドメインは、ポリヌクレオチドプログラミング可能なヌクレオチド結合ドメインの一部をなすさらなる異種部分またはドメインと相互作用し、会合し、または複合体を形成することができる、さらなる異種部分またはドメインを含むことができる。いくつかの実施形態において、追加の異種部分は、ポリペプチドと結合し、相互作用し、会合し、または複合体を形成することができる。いくつかの実施形態において、追加の異種部分は、ポリヌクレオチドと結合し、相互作用し、会合し、または複合体を形成することができる。いくつかの実施形態において、追加の異種部分は、ガイドポリヌクレオチドに結合することができる。いくつかの実施形態において、追加の異種部分は、ポリペプチドリンカーに結合することができる。いくつかの実施形態において、追加の異種部分は、ポリヌクレオチドリンカーに結合することができる。追加の異種部分は、タンパク質ドメインであってもよい。いくつかの実施形態において、追加の異種部分は、K相同(KH) ドメイン、MS2コートタンパク質ドメイン、PP7コートタンパク質ドメイン、SfMu Comコートタンパク質ドメイン、ステリルαモチーフ、テロメラーゼKu結合モチーフおよびKuタンパク質、テロメラーゼSm7結合モチーフおよびSm7タンパク質、またはRNA認識モチーフであり得る。

塩基エディターシステムは、ガイドポリヌクレオチド成分をさらに含むことができる。塩基エディターシステムの構成要素は、共有結合、非共有結合的相互作用、またはそれらの結合および相互作用の任意の組合せを介して互いに結合され得ることが理解されるべきである。ある態様において、デアミナーゼドメインは、ガイドポリヌクレオチドによって標的ヌクレオチド配列にターゲティングされ得る。例えば、いくつかの実施形態において、デアミナーゼドメインは、ガイドポリヌクレオチドの一部またはセグメント(例えばポリヌクレオチドモチーフ) と相互作用し、結合し、または複合体を形成し得るさらなる異種部分またはドメイン(例えばRNAまたはDNA結合タンパク質のようなポリヌクレオチド結合ドメイン)を含み得る。いくつかの実施形態において、追加の異種部分またはドメイン(例えばRNAまたはDNA結合タンパク質などのポリヌクレオチド結合ドメイン)は、デアミナーゼドメインに融合または連結され得る。いくつかの実施形態において、追加の異種部分は、ポリペプチドと結合し、相互作用し、会合し、またはポリペプチドと複合体を形成することができる。いくつかの実施形態において、追加の異種部分は、ポリヌクレオチドと結合し、相互作用し、会合し、またはポリヌクレオチドと複合体を形成することができる。いくつかの実施形態において、追加の異種部分は、ガイドポリヌクレオチドに結合することができる。いくつかの実施形態において、追加の異種部分は、ポリペプチドリンカーに結合することができる。いくつかの実施形態において、追加の異種部分は、ポリヌクレオチドリンカーに結合することができる。追加の異種部分は、タンパク質ドメインであってもよい。いくつかの実施形態において、追加の異種部分は、K相同（KH）ドメイン、MS2コートタンパク質ドメイン、PP7コートタンパク質ドメイン、SfMu Comコートタンパク質ドメイン、無菌アルファモチーフ、テロメラーゼKu結合モチーフおよびKuタンパク質、テロメラーゼSm7結合モチーフおよびSm7タンパク質、またはRNA認識モチーフであり得る。

ある実施形態において、塩基エディターシステムは、塩基除去修復（BER）の阻害因子コンポーネントをさらに含むことができる。塩基エディターシステムの構成要素は、共有結合、非共有結合的相互作用、またはそれらの結合および相互作用の任意の組み合わせを介して互いに結合され得ることが理解されるべきである。BER成分の阻害因子は、BER阻害因子を含み得る。ある実施形態において、BERの阻害因子は、ウラシルDNAグリコシラーゼ阻害因子 (UGI) であり得る。ある実施形態において、BERの阻害因子は、イノシンBER阻害因子であり得る。ある実施形態において、BERの阻害因子は、ポリヌクレオチドプログラミング可能なヌクレオチド結合ドメインにより標的ヌクレオチド配列にターゲティングされ得る。ある実施形態において、ポリヌクレオチドプログラミング可能なヌクレオチド結合ドメインは、BERの阻害因子に融合または連結され得る。ある実施形態において、ポリヌクレオチドプログラミング可能なヌクレオチド結合ドメインは、デアミナーゼドメインおよびBERの阻害因子に融合または連結され得る。いくつかの実施形態において、ポリヌクレオチドプログラミング可能なヌクレオチド結合ドメインは、BERの阻害因子と非共有結合的に相互作用するか、またはBERの阻害因子と会合することによって、BERの阻害因子を標的ヌクレオチド配列へとターゲティングすることができる。例えば、いくつかの実施形態において、BER成分の阻害因子は、ポリヌクレオチドプログラミング可能なヌクレオチド結合ドメインの一部であるさらなる異種部分またはドメインと相互作用、会合、または複合体形成し得るさらなる異種部分またはドメインを含み得る。

ある実施形態において、BERの阻害因子は、ガイドポリヌクレオチドにより標的ヌクレオチド配列にターゲティングされ得る。例えば、いくつかの実施形態において、BERの阻害因子は、ガイドポリヌクレオチドの一部またはセグメント(例えば、ポリヌクレオチドモチーフ)と相互作用、会合、または複合体形成し得るさらなる異種部分またはドメイン(例えば、RNAまたはDNA結合タンパク質のようなポリヌクレオチド結合ドメイン)を含み得る。いくつかの実施形態において、ガイドポリヌクレオチドのさらなる異種部分またはドメイン(例えば、RNAまたはDNA結合タンパク質のようなポリヌクレオチド結合ドメイン)は、BERの阻害因子に融合または連結され得る。いくつかの実施形態において、追加の異種部分は、ポリヌクレオチドと結合、相互作用、会合、または複合体形成することができる。いくつかの実施形態において、追加の異種部分は、ガイドポリヌクレオチドに結合することができる。いくつかの実施形態において、追加の異種部分は、ポリペプチドリンカーに結合することができる。いくつかの実施形態において、追加の異種部分は、ポリヌクレオチドリンカーに結合することができる。追加の異種部分は、タンパク質ドメインであってもよい。いくつかの実施形態において、追加の異種部分は、K相同(KH) ドメイン、MS2コートタンパク質ドメイン、PP7コートタンパク質ドメイン、SfMu Comコートタンパク質ドメイン、無菌アルファモチーフ、テロメラーゼKu結合モチーフおよびKuタンパク質、テロメラーゼSm7結合モチーフおよびSm7タンパク質、またはRNA認識モチーフであり得る。

用語「Cas9」または「Cas9ドメイン」は、Cas9タンパク質またはその断片（例えばCas9の活性、不活性、または部分的に活性なDNA切断ドメイン、および/またはCas9のgRNA結合ドメインを含むタンパク質）を含むRNA誘導ヌクレアーゼを指す。Cas9ヌクレアーゼは、casnlヌクレアーゼまたはCRISPR（clustered regularly interspaced short palindromic repeat）関連ヌクレアーゼと呼ばれることもある。CRISPRは、可動遺伝要素（ウイルス、転移因子、接合プラスミド）に対する防御を提供する適応免疫系である。CRISPRクラスターは、スペーサー、先行する可動要素に相補的な配列、および標的侵入核酸を含む。CRISPRクラスターは転写され、CRISPR RNA（crRNA）にプロセシングされる。II型CRISPRシステムでは、pre‐crRNAの正しいプロセシングはトランスコード小RNA（tracrRNA）、内因性リボヌクレアーゼ3（rnc）、およびCas9タンパク質を必要とする。tracrRNAはリボヌクレアーゼ3によるpre-crRNAのプロセシングのガイドとなる。続いて、Cas9/crRNA/tracrRNAが、スペーサーに相補的な線状または環状のdsDNA標的をエンドヌクレアーゼ的に切断する。crRNAに相補的でない標的鎖は、最初にエンドヌクレアーゼ的に切断され、次にエキソヌクレアーゼ的に3’-5’にトリムされる。自然界では、DNA結合および切断はタンパク質と両方のRNAとを典型的に要する。しかしながら、crRNAおよびtracrRNAの両方の側面を単一のRNA種に組み込むように、単一ガイドRNA（「sgRNA」、あるいは単に「gRNA」）を作製することができる。例えばJinek M.et al., Science 337:816-821(2012)を参照されたい（その内容全体が参照により本明細書に組み入れられる）。Cas9は、CRISPR反復配列中の短いモチーフ（PAMあるいはプロトスペーサー隣接モチーフ）を認識して、自己と非自己を区別することを助ける。Cas9ヌクレアーゼの配列および構造は、当業者によく知られている（例えば“Complete genome sequence of an Ml strain of Streptococcus pyogenes.” Ferretti et al., Proc. Natl. Acad. Sci. U.S.A. 98:4658-4663(2001); “CRISPR RNA maturation by trans-encoded small RNA and host factor RNase III.” Deltcheva E. et al., Nature 471:602-607(2011); および “A programmable dual-RNA-guided DNA endonuclease in adaptive bacterial immunity.” Jinek M. et al., Science 337:816-821(2012)参照。その内容全体が参照により本明細書に組み入れられる。）。Cas9オーソログは、限定されるものではないが、S. pyogenesおよびS. thermophilusを含む種々の種において記述されてきた。さらなる適切なCas9ヌクレアーゼおよび配列は、本開示に基づいて当業者に明らかとなり、そのようなCas9ヌクレアーゼおよび配列は、Chylinski, Rhun, and Charpentier, “The tracrRNA and Cas9 families of type II CRISPR-Cas immunity systems” (2013) RNA Biology 10:5, 726-737に開示されている生物および遺伝子座由来のCas9配列を含む。その全内容は参照により本明細書に組み込まれる。

例示的なCas9はStreptococcus pyogenes Cas9 (spCas9)であり、そのアミノ酸配列を下記に提供する。

（一重下線：HNHドメイン；二重下線：RuvCドメイン）

ヌクレアーゼ不活性化Cas9タンパク質は、互換的に「dCas9」タンパク質（nuclease-“dead” Cas9の意）または触媒的に不活なCas9とも称され得る。不活性なDNA切断ドメインを有するCas9タンパク質（又はその断片）を生成する方法は公知である（例えばJinek et al, Science. 337:816-821(2012); Qi et al, “Repurposing CRISPR as an RNA-Guided Platform for Sequence-Specific Control of Gene Expression”(2013) Cell. 28; 152(5): 1173-83参照（各内容は参照により本明細書に組み込まれる））。例えば、Cas9のDNA切断ドメインは、HNHヌクレアーゼサブドメインとRuvC1サブドメインという2つのサブドメインを含むことが知られている。HNHサブドメインはgRNAに相補的な鎖を切断し、RuvC1サブドメインは非相補的な鎖を切断する。これらのサブドメイン内の変異はCas9のヌクレアーゼ活性を抑制し得る。例えば、変異D10AおよびH840Aは、S. pyogenes Cas9 のヌクレアーゼ活性を完全に不活性化する（Jinek et al, Science. 337:816-821(2012); Qi et al, Cell. 28;152(5): 1173-83 (2013)）。ある態様において、Cas9ヌクレアーゼは、不活性な（例えば不活化された）DNA切断ドメインを有し、すなわち、Cas9は、「nCas9」タンパク質（「nickase」Cas9の意）と呼ばれるニッカーゼである。ある態様において、Cas9の断片を含むタンパク質が提供される。例えば、いくつかの実施形態において、タンパク質は、以下の2つのCas9ドメインのうちの1つを含む：(1) Cas9のgRNA結合ドメイン;(2) Cas9のDNA切断ドメイン。ある態様において、Cas9またはその断片を含むタンパク質は、「Cas9バリアント」と称される。Cas9バリアントは、Cas9またはその断片と相同性を共有する。例えば、Cas9バリアントは、野生型Cas9と少なくとも約70%の同一性、少なくとも約80%の同一性、少なくとも約90%の同一性、少なくとも約95%の同一性、少なくとも約96%の同一性、少なくとも約97%の同一性、少なくとも約98%の同一性、少なくとも約99%の同一性、少なくとも約99.5%の同一性、または少なくとも約99.9%の同一性を有する。いくつかの実施形態において、Cas9変異体は、野生型Cas9と比較して、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、21、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50またはそれ以上のアミノ酸変化を有し得る。いくつかの実施形態において、Cas9バリアントは、Cas9の断片 (例えばgRNA結合ドメインまたはDNA切断ドメイン)を含み、その断片は、野生型Cas9の対応する断片と少なくとも約70%の同一性を有し、少なくとも約80%の同一性を有し、少なくとも約90%の同一性を有し、少なくとも約95%の同一性を有し、少なくとも約96%の同一性を有し、少なくとも約97%の同一性を有し、少なくとも約98%の同一性を有し、少なくとも約99%の同一性を有し、少なくとも約99.5%の同一性を有し、または少なくとも約99.9%の同一性を有する。ある態様において、断片は、対応する野生型Cas9のアミノ酸長の少なくとも30%、少なくとも35%、少なくとも40%、少なくとも45%、少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%同一、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも99.5%である。

ある実施形態において、断片は、長さが少なくとも100アミノ酸である。ある実施形態において、断片は、少なくとも100、150、200、250、300、350、400、450、500、550、600、650、700、750、800、850、900、950、1000、1050、1100、1150、1200、1250、または少なくとも1300アミノ酸の長さである。

ある実施形態において、野生型Cas9は、Streptococcus pyogenes由来のCas9に対応する（NCBI参照配列：NC_017053.1、ヌクレオチド配列およびアミノ酸配列は以下の通り）。
ATGGATAAGAAATACTCAATAGGCTTAGATATCGGCACAAATAGCGTCGGATGGGCGGTGATCACTGATGATTATAAGGTTCCGTCTAAAAAGTTCAAGGTTCTGGGAAATACAGACCGCCACAGTATCAAAAAAAATCTTATAGGGGCTCTTTTATTTGGCAGTGGAGAGACAGCGGAAGCGACTCGTCTCAAACGGACAGCTCGTAGAAGGTATACACGTCGGAAGAATCGTATTTGTTATCTACAGGAGATTTTTTCAAATGAGATGGCGAAAGTAGATGATAGTTTCTTTCATCGACTTGAAGAGTCTTTTTTGGTGGAAGAAGACAAGAAGCATGAACGTCATCCTATTTTTGGAAATATAGTAGATGAAGTTGCTTATCATGAGAAATATCCAACTATCTATCATCTGCGAAAAAAATTGGCAGATTCTACTGATAAAGCGGATTTGCGCTTAATCTATTTGGCCTTAGCGCATATGATTAAGTTTCGTGGTCATTTTTTGATTGAGGGAGATTTAAATCCTGATAATAGTGATGTGGACAAACTATTTATCCAGTTGGTACAAATCTACAATCAATTATTTGAAGAAAACCCTATTAACGCAAGTAGAGTAGATGCTAAAGCGATTCTTTCTGCACGATTGAGTAAATCAAGACGATTAGAAAATCTCATTGCTCAGCTCCCCGGTGAGAAGAGAAATGGCTTGTTTGGGAATCTCATTGCTTTGTCATTGGGATTGACCCCTAATTTTAAATCAAATTTTGATTTGGCAGAAGATGCTAAATTACAGCTTTCAAAAGATACTTACGATGATGATTTAGATAATTTATTGGCGCAAATTGGAGATCAATATGCTGATTTGTTTTTGGCAGCTAAGAATTTATCAGATGCTATTTTACTTTCAGATATCCTAAGAGTAAATAGTGAAATAACTAAGGCTCCCCTATCAGCTTCAATGATTAAGCGCTACGATGAACATCATCAAGACTTGACTCTTTTAAAAGCTTTAGTTCGACAACAACTTCCAGAAAAGTATAAAGAAATCTTTTTTGATCAATCAAAAAACGGATATGCAGGTTATATTGATGGGGGAGCTAGCCAAGAAGAATTTTATAAATTTATCAAACCAATTTTAGAAAAAATGGATGGTACTGAGGAATTATTGGTGAAACTAAATCGTGAAGATTTGCTGCGCAAGCAACGGACCTTTGACAACGGCTCTATTCCCCATCAAATTCACTTGGGTGAGCTGCATGCTATTTTGAGAAGACAAGAAGACTTTTATCCATTTTTAAAAGACAATCGTGAGAAGATTGAAAAAATCTTGACTTTTCGAATTCCTTATTATGTTGGTCCATTGGCGCGTGGCAATAGTCGTTTTGCATGGATGACTCGGAAGTCTGAAGAAACAATTACCCCATGGAATTTTGAAGAAGTTGTCGATAAAGGTGCTTCAGCTCAATCATTTATTGAACGCATGACAAACTTTGATAAAAATCTTCCAAATGAAAAAGTACTACCAAAACATAGTTTGCTTTATGAGTATTTTACGGTTTATAACGAATTGACAAAGGTCAAATATGTTACTGAGGGAATGCGAAAACCAGCATTTCTTTCAGGTGAACAGAAGAAAGCCATTGTTGATTTACTCTTCAAAACAAATCGAAAAGTAACCGTTAAGCAATTAAAAGAAGATTATTTCAAAAAAATAGAATGTTTTGATAGTGTTGAAATTTCAGGAGTTGAAGATAGATTTAATGCTTCATTAGGCGCCTACCATGATTTGCTAAAAATTATTAAAGATAAAGATTTTTTGGATAATGAAGAAAATGAAGATATCTTAGAGGATATTGTTTTAACATTGACCTTATTTGAAGATAGGGGGATGATTGAGGAAAGACTTAAAACATATGCTCACCTCTTTGATGATAAGGTGATGAAACAGCTTAAACGTCGCCGTTATACTGGTTGGGGACGTTTGTCTCGAAAATTGATTAATGGTATTAGGGATAAGCAATCTGGCAAAACAATATTAGATTTTTTGAAATCAGATGGTTTTGCCAATCGCAATTTTATGCAGCTGATCCATGATGATAGTTTGACATTTAAAGAAGATATTCAAAAAGCACAGGTGTCTGGACAAGGCCATAGTTTACATGAACAGATTGCTAACTTAGCTGGCAGTCCTGCTATTAAAAAAGGTATTTTACAGACTGTAAAAATTGTTGATGAACTGGTCAAAGTAATGGGGCATAAGCCAGAAAATATCGTTATTGAAATGGCACGTGAAAATCAGACAACTCAAAAGGGCCAGAAAAATTCGCGAGAGCGTATGAAACGAATCGAAGAAGGTATCAAAGAATTAGGAAGTCAGATTCTTAAAGAGCATCCTGTTGAAAATACTCAATTGCAAAATGAAAAGCTCTATCTCTATTATCTACAAAATGGAAGAGACATGTATGTGGACCAAGAATTAGATATTAATCGTTTAAGTGATTATGATGTCGATCACATTGTTCCACAAAGTTTCATTAAAGACGATTCAATAGACAATAAGGTACTAACGCGTTCTGATAAAAATCGTGGTAAATCGGATAACGTTCCAAGTGAAGAAGTAGTCAAAAAGATGAAAAACTATTGGAGACAACTTCTAAACGCCAAGTTAATCACTCAACGTAAGTTTGATAATTTAACGAAAGCTGAACGTGGAGGTTTGAGTGAACTTGATAAAGCTGGTTTTATCAAACGCCAATTGGTTGAAACTCGCCAAATCACTAAGCATGTGGCACAAATTTTGGATAGTCGCATGAATACTAAATACGATGAAAATGATAAACTTATTCGAGAGGTTAAAGTGATTACCTTAAAATCTAAATTAGTTTCTGACTTCCGAAAAGATTTCCAATTCTATAAAGTACGTGAGATTAACAATTACCATCATGCCCATGATGCGTATCTAAATGCCGTCGTTGGAACTGCTTTGATTAAGAAATATCCAAAACTTGAATCGGAGTTTGTCTATGGTGATTATAAAGTTTATGATGTTCGTAAAATGATTGCTAAGTCTGAGCAAGAAATAGGCAAAGCAACCGCAAAATATTTCTTTTACTCTAATATCATGAACTTCTTCAAAACAGAAATTACACTTGCAAATGGAGAGATTCGCAAACGCCCTCTAATCGAAACTAATGGGGAAACTGGAGAAATTGTCTGGGATAAAGGGCGAGATTTTGCCACAGTGCGCAAAGTATTGTCCATGCCCCAAGTCAATATTGTCAAGAAAACAGAAGTACAGACAGGCGGATTCTCCAAGGAGTCAATTTTACCAAAAAGAAATTCGGACAAGCTTATTGCTCGTAAAAAAGACTGGGATCCAAAAAAATATGGTGGTTTTGATAGTCCAACGGTAGCTTATTCAGTCCTAGTGGTTGCTAAGGTGGAAAAAGGGAAATCGAAGAAGTTAAAATCCGTTAAAGAGTTACTAGGGATCACAATTATGGAAAGAAGTTCCTTTGAAAAAAATCCGATTGACTTTTTAGAAGCTAAAGGATATAAGGAAGTTAAAAAAGACTTAATCATTAAACTACCTAAATATAGTCTTTTTGAGTTAGAAAACGGTCGTAAACGGATGCTGGCTAGTGCCGGAGAATTACAAAAAGGAAATGAGCTGGCTCTGCCAAGCAAATATGTGAATTTTTTATATTTAGCTAGTCATTATGAAAAGTTGAAGGGTAGTCCAGAAGATAACGAACAAAAACAATTGTTTGTGGAGCAGCATAAGCATTATTTAGATGAGATTATTGAGCAAATCAGTGAATTTTCTAAGCGTGTTATTTTAGCAGATGCCAATTTAGATAAAGTTCTTAGTGCATATAACAAACATAGAGACAAACCAATACGTGAACAAGCAGAAAATATTATTCATTTATTTACGTTGACGAATCTTGGAGCTCCCGCTGCTTTTAAATATTTTGATACAACAATTGATCGTAAACGATATACGTCTACAAAAGAAGTTTTAGATGCCACTCTTATCCATCAATCCATCACTGGTCTTTATGAAACACGCATTGATTTGAGTCAGCTAGGAGGTGACTGA

（一重下線：HNHドメイン；二重下線:RuvCドメイン）

ある実施形態において、野生型Cas9は、以下のヌクレオチドおよび／またはアミノ酸配列に対応するか、またはこれらを含む：
ATGGATAAAAAGTATTCTATTGGTTTAGACATCGGCACTAATTCCGTTGGATGGGCTGTCATAACCGATGAATACAAAGTACCTTCAAAGAAATTTAAGGTGTTGGGGAACACAGACCGTCATTCGATTAAAAAGAATCTTATCGGTGCCCTCCTATTCGATAGTGGCGAAACGGCAGAGGCGACTCGCCTGAAACGAACCGCTCGGAGAAGGTATACACGTCGCAAGAACCGAATATGTTACTTACAAGAAATTTTTAGCAATGAGATGGCCAAAGTTGACGATTCTTTCTTTCACCGTTTGGAAGAGTCCTTCCTTGTCGAAGAGGACAAGAAACATGAACGGCACCCCATCTTTGGAAACATAGTAGATGAGGTGGCATATCATGAAAAGTACCCAACGATTTATCACCTCAGAAAAAAGCTAGTTGACTCAACTGATAAAGCGGACCTGAGGTTAATCTACTTGGCTCTTGCCCATATGATAAAGTTCCGTGGGCACTTTCTCATTGAGGGTGATCTAAATCCGGACAACTCGGATGTCGACAAACTGTTCATCCAGTTAGTACAAACCTATAATCAGTTGTTTGAAGAGAACCCTATAAATGCAAGTGGCGTGGATGCGAAGGCTATTCTTAGCGCCCGCCTCTCTAAATCCCGACGGCTAGAAAACCTGATCGCACAATTACCCGGAGAGAAGAAAAATGGGTTGTTCGGTAACCTTATAGCGCTCTCACTAGGCCTGACACCAAATTTTAAGTCGAACTTCGACTTAGCTGAAGATGCCAAATTGCAGCTTAGTAAGGACACGTACGATGACGATCTCGACAATCTACTGGCACAAATTGGAGATCAGTATGCGGACTTATTTTTGGCTGCCAAAAACCTTAGCGATGCAATCCTCCTATCTGACATACTGAGAGTTAATACTGAGATTACCAAGGCGCCGTTATCCGCTTCAATGATCAAAAGGTACGATGAACATCACCAAGACTTGACACTTCTCAAGGCCCTAGTCCGTCAGCAACTGCCTGAGAAATATAAGGAAATATTCTTTGATCAGTCGAAAAACGGGTACGCAGGTTATATTGACGGCGGAGCGAGTCAAGAGGAATTCTACAAGTTTATCAAACCCATATTAGAGAAGATGGATGGGACGGAAGAGTTGCTTGTAAAACTCAATCGCGAAGATCTACTGCGAAAGCAGCGGACTTTCGACAACGGTAGCATTCCACATCAAATCCACTTAGGCGAATTGCATGCTATACTTAGAAGGCAGGAGGATTTTTATCCGTTCCTCAAAGACAATCGTGAAAAGATTGAGAAAATCCTAACCTTTCGCATACCTTACTATGTGGGACCCCTGGCCCGAGGGAACTCTCGGTTCGCATGGATGACAAGAAAGTCCGAAGAAACGATTACTCCATGGAATTTTGAGGAAGTTGTCGATAAAGGTGCGTCAGCTCAATCGTTCATCGAGAGGATGACCAACTTTGACAAGAATTTACCGAACGAAAAAGTATTGCCTAAGCACAGTTTACTTTACGAGTATTTCACAGTGTACAATGAACTCACGAAAGTTAAGTATGTCACTGAGGGCATGCGTAAACCCGCCTTTCTAAGCGGAGAACAGAAGAAAGCAATAGTAGATCTGTTATTCAAGACCAACCGCAAAGTGACAGTTAAGCAATTGAAAGAGGACTACTTTAAGAAAATTGAATGCTTCGATTCTGTCGAGATCTCCGGGGTAGAAGATCGATTTAATGCGTCACTTGGTACGTATCATGACCTCCTAAAGATAATTAAAGATAAGGACTTCCTGGATAACGAAGAGAATGAAGATATCTTAGAAGATATAGTGTTGACTCTTACCCTCTTTGAAGATCGGGAAATGATTGAGGAAAGACTAAAAACATACGCTCACCTGTTCGACGATAAGGTTATGAAACAGTTAAAGAGGCGTCGCTATACGGGCTGGGGACGATTGTCGCGGAAACTTATCAACGGGATAAGAGACAAGCAAAGTGGTAAAACTATTCTCGATTTTCTAAAGAGCGACGGCTTCGCCAATAGGAACTTTATGCAGCTGATCCATGATGACTCTTTAACCTTCAAAGAGGATATACAAAAGGCACAGGTTTCCGGACAAGGGGACTCATTGCACGAACATATTGCGAATCTTGCTGGTTCGCCAGCCATCAAAAAGGGCATACTCCAGACAGTCAAAGTAGTGGATGAGCTAGTTAAGGTCATGGGACGTCACAAACCGGAAAACATTGTAATCGAGATGGCACGCGAAAATCAAACGACTCAGAAGGGGCAAAAAAACAGTCGAGAGCGGATGAAGAGAATAGAAGAGGGTATTAAAGAACTGGGCAGCCAGATCTTAAAGGAGCATCCTGTGGAAAATACCCAATTGCAGAACGAGAAACTTTACCTCTATTACCTACAAAATGGAAGGGACATGTATGTTGATCAGGAACTGGACATAAACCGTTTATCTGATTACGACGTCGATCACATTGTACCCCAATCCTTTTTGAAGGACGATTCAATCGACAATAAAGTGCTTACACGCTCGGATAAGAACCGAGGGAAAAGTGACAATGTTCCAAGCGAGGAAGTCGTAAAGAAAATGAAGAACTATTGGCGGCAGCTCCTAAATGCGAAACTGATAACGCAAAGAAAGTTCGATAACTTAACTAAAGCTGAGAGGGGTGGCTTGTCTGAACTTGACAAGGCCGGATTTATTAAACGTCAGCTCGTGGAAACCCGCCAAATCACAAAGCATGTTGCACAGATACTAGATTCCCGAATGAATACGAAATACGACGAGAACGATAAGCTGATTCGGGAAGTCAAAGTAATCACTTTAAAGTCAAAATTGGTGTCGGACTTCAGAAAGGATTTTCAATTCTATAAAGTTAGGGAGATAAATAACTACCACCATGCGCACGACGCTTATCTTAATGCCGTCGTAGGGACCGCACTCATTAAGAAATACCCGAAGCTAGAAAGTGAGTTTGTGTATGGTGATTACAAAGTTTATGACGTCCGTAAGATGATCGCGAAAAGCGAACAGGAGATAGGCAAGGCTACAGCCAAATACTTCTTTTATTCTAACATTATGAATTTCTTTAAGACGGAAATCACTCTGGCAAACGGAGAGATACGCAAACGACCTTTAATTGAAACCAATGGGGAGACAGGTGAAATCGTATGGGATAAGGGCCGGGACTTCGCGACGGTGAGAAAAGTTTTGTCCATGCCCCAAGTCAACATAGTAAAGAAAACTGAGGTGCAGACCGGAGGGTTTTCAAAGGAATCGATTCTTCCAAAAAGGAATAGTGATAAGCTCATCGCTCGTAAAAAGGACTGGGACCCGAAAAAGTACGGTGGCTTCGATAGCCCTACAGTTGCCTATTCTGTCCTAGTAGTGGCAAAAGTTGAGAAGGGAAAATCCAAGAAACTGAAGTCAGTCAAAGAATTATTGGGGATAACGATTATGGAGCGCTCGTCTTTTGAAAAGAACCCCATCGACTTCCTTGAGGCGAAAGGTTACAAGGAAGTAAAAAAGGATCTCATAATTAAACTACCAAAGTATAGTCTGTTTGAGTTAGAAAATGGCCGAAAACGGATGTTGGCTAGCGCCGGAGAGCTTCAAAAGGGGAACGAACTCGCACTACCGTCTAAATACGTGAATTTCCTGTATTTAGCGTCCCATTACGAGAAGTTGAAAGGTTCACCTGAAGATAACGAACAGAAGCAACTTTTTGTTGAGCAGCACAAACATTATCTCGACGAAATCATAGAGCAAATTTCGGAATTCAGTAAGAGAGTCATCCTAGCTGATGCCAATCTGGACAAAGTATTAAGCGCATACAACAAGCACAGGGATAAACCCATACGTGAGCAGGCGGAAAATATTATCCATTTGTTTACTCTTACCAACCTCGGCGCTCCAGCCGCATTCAAGTATTTTGACACAACGATAGATCGCAAACGATACACTTCTACCAAGGAGGTGCTAGACGCGACACTGATTCACCAATCCATCACGGGATTATATGAAACTCGGATAGATTTGTCACAGCTTGGGGGTGACGGATCCCCCAAGAAGAAGAGGAAAGTCTCGAGCGACTACAAAGACCATGACGGTGATTATAAAGATCATGACATCGATTACAAGGATGACGATGACAAGGCTGCAGGA

（一重下線：HNHドメイン；二重下線：RuvCドメイン）

いくつかの実施形態において、野生型Cas9は、Streptococcus pyogenesからのCas9（NCBI参照配列：NC_002737.2（下記のヌクレオチド配列）及びUniprot参照配列：Q99ZW2（下記のアミノ酸配列）に対応する。
ATGGATAAGAAATACTCAATAGGCTTAGATATCGGCACAAATAGCGTCGGATGGGCGGTGATCACTGATGAATATAAGGTTCCGTCTAAAAAGTTCAAGGTTCTGGGAAATACAGACCGCCACAGTATCAAAAAAAATCTTATAGGGGCTCTTTTATTTGACAGTGGAGAGACAGCGGAAGCGACTCGTCTCAAACGGACAGCTCGTAGAAGGTATACACGTCGGAAGAATCGTATTTGTTATCTACAGGAGATTTTTTCAAATGAGATGGCGAAAGTAGATGATAGTTTCTTTCATCGACTTGAAGAGTCTTTTTTGGTGGAAGAAGACAAGAAGCATGAACGTCATCCTATTTTTGGAAATATAGTAGATGAAGTTGCTTATCATGAGAAATATCCAACTATCTATCATCTGCGAAAAAAATTGGTAGATTCTACTGATAAAGCGGATTTGCGCTTAATCTATTTGGCCTTAGCGCATATGATTAAGTTTCGTGGTCATTTTTTGATTGAGGGAGATTTAAATCCTGATAATAGTGATGTGGACAAACTATTTATCCAGTTGGTACAAACCTACAATCAATTATTTGAAGAAAACCCTATTAACGCAAGTGGAGTAGATGCTAAAGCGATTCTTTCTGCACGATTGAGTAAATCAAGACGATTAGAAAATCTCATTGCTCAGCTCCCCGGTGAGAAGAAAAATGGCTTATTTGGGAATCTCATTGCTTTGTCATTGGGTTTGACCCCTAATTTTAAATCAAATTTTGATTTGGCAGAAGATGCTAAATTACAGCTTTCAAAAGATACTTACGATGATGATTTAGATAATTTATTGGCGCAAATTGGAGATCAATATGCTGATTTGTTTTTGGCAGCTAAGAATTTATCAGATGCTATTTTACTTTCAGATATCCTAAGAGTAAATACTGAAATAACTAAGGCTCCCCTATCAGCTTCAATGATTAAACGCTACGATGAACATCATCAAGACTTGACTCTTTTAAAAGCTTTAGTTCGACAACAACTTCCAGAAAAGTATAAAGAAATCTTTTTTGATCAATCAAAAAACGGATATGCAGGTTATATTGATGGGGGAGCTAGCCAAGAAGAATTTTATAAATTTATCAAACCAATTTTAGAAAAAATGGATGGTACTGAGGAATTATTGGTGAAACTAAATCGTGAAGATTTGCTGCGCAAGCAACGGACCTTTGACAACGGCTCTATTCCCCATCAAATTCACTTGGGTGAGCTGCATGCTATTTTGAGAAGACAAGAAGACTTTTATCCATTTTTAAAAGACAATCGTGAGAAGATTGAAAAAATCTTGACTTTTCGAATTCCTTATTATGTTGGTCCATTGGCGCGTGGCAATAGTCGTTTTGCATGGATGACTCGGAAGTCTGAAGAAACAATTACCCCATGGAATTTTGAAGAAGTTGTCGATAAAGGTGCTTCAGCTCAATCATTTATTGAACGCATGACAAACTTTGATAAAAATCTTCCAAATGAAAAAGTACTACCAAAACATAGTTTGCTTTATGAGTATTTTACGGTTTATAACGAATTGACAAAGGTCAAATATGTTACTGAAGGAATGCGAAAACCAGCATTTCTTTCAGGTGAACAGAAGAAAGCCATTGTTGATTTACTCTTCAAAACAAATCGAAAAGTAACCGTTAAGCAATTAAAAGAAGATTATTTCAAAAAAATAGAATGTTTTGATAGTGTTGAAATTTCAGGAGTTGAAGATAGATTTAATGCTTCATTAGGTACCTACCATGATTTGCTAAAAATTATTAAAGATAAAGATTTTTTGGATAATGAAGAAAATGAAGATATCTTAGAGGATATTGTTTTAACATTGACCTTATTTGAAGATAGGGAGATGATTGAGGAAAGACTTAAAACATATGCTCACCTCTTTGATGATAAGGTGATGAAACAGCTTAAACGTCGCCGTTATACTGGTTGGGGACGTTTGTCTCGAAAATTGATTAATGGTATTAGGGATAAGCAATCTGGCAAAACAATATTAGATTTTTTGAAATCAGATGGTTTTGCCAATCGCAATTTTATGCAGCTGATCCATGATGATAGTTTGACATTTAAAGAAGACATTCAAAAAGCACAAGTGTCTGGACAAGGCGATAGTTTACATGAACATATTGCAAATTTAGCTGGTAGCCCTGCTATTAAAAAAGGTATTTTACAGACTGTAAAAGTTGTTGATGAATTGGTCAAAGTAATGGGGCGGCATAAGCCAGAAAATATCGTTATTGAAATGGCACGTGAAAATCAGACAACTCAAAAGGGCCAGAAAAATTCGCGAGAGCGTATGAAACGAATCGAAGAAGGTATCAAAGAATTAGGAAGTCAGATTCTTAAAGAGCATCCTGTTGAAAATACTCAATTGCAAAATGAAAAGCTCTATCTCTATTATCTCCAAAATGGAAGAGACATGTATGTGGACCAAGAATTAGATATTAATCGTTTAAGTGATTATGATGTCGATCACATTGTTCCACAAAGTTTCCTTAAAGACGATTCAATAGACAATAAGGTCTTAACGCGTTCTGATAAAAATCGTGGTAAATCGGATAACGTTCCAAGTGAAGAAGTAGTCAAAAAGATGAAAAACTATTGGAGACAACTTCTAAACGCCAAGTTAATCACTCAACGTAAGTTTGATAATTTAACGAAAGCTGAACGTGGAGGTTTGAGTGAACTTGATAAAGCTGGTTTTATCAAACGCCAATTGGTTGAAACTCGCCAAATCACTAAGCATGTGGCACAAATTTTGGATAGTCGCATGAATACTAAATACGATGAAAATGATAAACTTATTCGAGAGGTTAAAGTGATTACCTTAAAATCTAAATTAGTTTCTGACTTCCGAAAAGATTTCCAATTCTATAAAGTACGTGAGATTAACAATTACCATCATGCCCATGATGCGTATCTAAATGCCGTCGTTGGAACTGCTTTGATTAAGAAATATCCAAAACTTGAATCGGAGTTTGTCTATGGTGATTATAAAGTTTATGATGTTCGTAAAATGATTGCTAAGTCTGAGCAAGAAATAGGCAAAGCAACCGCAAAATATTTCTTTTACTCTAATATCATGAACTTCTTCAAAACAGAAATTACACTTGCAAATGGAGAGATTCGCAAACGCCCTCTAATCGAAACTAATGGGGAAACTGGAGAAATTGTCTGGGATAAAGGGCGAGATTTTGCCACAGTGCGCAAAGTATTGTCCATGCCCCAAGTCAATATTGTCAAGAAAACAGAAGTACAGACAGGCGGATTCTCCAAGGAGTCAATTTTACCAAAAAGAAATTCGGACAAGCTTATTGCTCGTAAAAAAGACTGGGATCCAAAAAAATATGGTGGTTTTGATAGTCCAACGGTAGCTTATTCAGTCCTAGTGGTTGCTAAGGTGGAAAAAGGGAAATCGAAGAAGTTAAAATCCGTTAAAGAGTTACTAGGGATCACAATTATGGAAAGAAGTTCCTTTGAAAAAAATCCGATTGACTTTTTAGAAGCTAAAGGATATAAGGAAGTTAAAAAAGACTTAATCATTAAACTACCTAAATATAGTCTTTTTGAGTTAGAAAACGGTCGTAAACGGATGCTGGCTAGTGCCGGAGAATTACAAAAAGGAAATGAGCTGGCTCTGCCAAGCAAATATGTGAATTTTTTATATTTAGCTAGTCATTATGAAAAGTTGAAGGGTAGTCCAGAAGATAACGAACAAAAACAATTGTTTGTGGAGCAGCATAAGCATTATTTAGATGAGATTATTGAGCAAATCAGTGAATTTTCTAAGCGTGTTATTTTAGCAGATGCCAATTTAGATAAAGTTCTTAGTGCATATAACAAACATAGAGACAAACCAATACGTGAACAAGCAGAAAATATTATTCATTTATTTACGTTGACGAATCTTGGAGCTCCCGCTGCTTTTAAATATTTTGATACAACAATTGATCGTAAACGATATACGTCTACAAAAGAAGTTTTAGATGCCACTCTTATCCATCAATCCATCACTGGTCTTTATGAAACACGCATTGATTTGAGTCAGCTAGGAGGTGACTGA

（配列番号１）
（一重下線：HNHドメイン；二重下線：RuvCドメイン）

ある実施形態において、Cas9は、Corynebacterium ulcerans (NCBI Refs: NC_015683.1, NC_017317.1); Corynebacterium diphtheria (NCBI Refs: NC_016782.1, NC_016786.1); Spiroplasma syrphidicola (NCBI Ref: NC_021284.1); Prevotella intermedia (NCBI Ref: NC_017861.1); Spiroplasma taiwanense (NCBI Ref: NC_021846.1); Streptococcus iniae (NCBI Ref: NC_021314.1); Belliella baltica (NCBI Ref: NC_018010.1); Psychroflexus torquisI (NCBI Ref: NC_018721.1); Streptococcus thermophilus (NCBI Ref: YP_820832.1), Listeria innocua (NCBI Ref: NP_472073.1), Campylobacter jejuni (NCBI Ref: YP_002344900.1) もしくはNeisseria meningitidis (NCBI Ref: YP_002342100.1)からのCas9、または任意の他の生物からのCas9を指す。

いくつかの実施形態において、dCas9は、Cas9ヌクレアーゼ活性を不活性化する1以上の変異を有するCas9アミノ酸配列に対応するか、またはその一部もしくは全体を含む。例えば、いくつかの実施形態において、dCas9ドメインは、D10AおよびH840A変異または別のCas9における対応する変異を含む。いくつかの実施形態において、dCas9は、dCas9 (D10AおよびH840A) のアミノ酸配列を含む：

（一重下線：HNHドメイン；二重下線：RuvCドメイン）

いくつかの実施形態において、Cas9ドメインはD10A突然変異を含み、一方、上記で提供したアミノ酸配列における位置840における残基、または本明細書で提供されるアミノ酸配列のいずれかにおける対応する位置における残基は、ヒスチジンのままである。

他の実施形態において、例えばヌクレアーゼ不活性化Cas9 (dCas9) をもたらす、D10AおよびH840A以外の突然変異を有するdCas9バリアントが提供される。このような突然変異は、例えば、D10およびH840における他のアミノ酸置換、またはCas9のヌクレアーゼドメイン内の他の置換（例えば、HNHヌクレアーゼサブドメインおよび／またはRuvC1サブドメインにおける置換）を含む。ある態様において、dCas9のバリアントまたはホモログであって、少なくとも約70%の同一性、少なくとも約80%の同一性、少なくとも約90%の同一性、少なくとも約95%の同一性、少なくとも約98%の同一性、少なくとも約99%の同一性、少なくとも約99.5%の同一性、または少なくとも約99.9%の同一性を有するものが提供される。ある態様において、約5アミノ酸、約10アミノ酸、約15アミノ酸、約20アミノ酸、約25アミノ酸、約30アミノ酸、約40アミノ酸、約50アミノ酸、約75アミノ酸、約100アミノ酸またはそれ以上だけ短いまたは長いアミノ酸配列を有するdCas9のバリアントが提供される。

いくつかの実施形態において、本明細書に提供されるCas9融合タンパク質は、Cas9タンパク質の全長アミノ酸配列、例えば、本明細書に提供されるCas9配列の1つを含む。しかしながら、他の実施形態において、本明細書に提供される融合タンパク質は、全長Cas9配列を含まず、その1つ以上の断片のみを含む。好適なCas9ドメインおよびCas9断片の例示的アミノ酸配列が本明細書に提供され、Cas9ドメインおよび断片のさらなる好適な配列は、当業者には明らかであろう。

追加的なCas9タンパク質（例えば、ヌクレアーゼ不活（dead）Cas9（dCas9）、Cas9ニッカーゼ（nCas9）、またはヌクレアーゼ活性Cas9）は、そのバリアントおよびホモログを含めて、本開示の範囲内にあることが理解されるべきである。例示的なCas9タンパク質は、限定されるものではないが、下記に提供されるものを含む。ある態様において、Cas9タンパク質は、ヌクレアーゼ不活Cas9（dCas9）である。ある態様において、Cas9タンパク質は、Cas9ニッカーゼ（nCas9）である。いくつかの実施形態において、Cas9タンパク質はヌクレアーゼ活性Cas9である。

例示的な触媒不活Cas9 (dCas9):
DKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDAIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD

例示的な触媒的Cas9ニッカーゼ (nCas9):
DKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD

例示的な触媒的活性Cas9:
DKKYSIGLDIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD.

ある実施形態において、Cas9は、単細胞原核微生物のドメインおよび界を構成する古細菌（例えばナノアーキア）由来のCas9を指す。ある実施形態において、Cas9質は、例えば、Burstein et al., "New CRISPR-Cas systems from uncultivated microbes." Cell Res. 2017 Feb 21. doi: 10.1038/cr.2017.21に記載されているCasXまたはCasYを指し、その全体の内容は参照により本明細書に組み込まれる。ゲノム分解メタゲノミクスを用いて、生命の古細菌ドメインにおいて最初に報告されたCas9を含め、多くのCRISPR‐Cas系が同定された。この分岐Cas9タンパク質は、ほとんど研究されていないナノアーキアにおいて、活性CRISPR‐Cas系の一部として発見された。細菌では、それまで知られていなかった二つの系、CRISPR-CasXとCRISPR-CasYが発見され、それらは、これまでに発見された中でも最もコンパクトな系に入る。いくつかの実施形態において、Cas9は、CasXまたはCasXのバリアントを表す。いくつかの実施形態において、Cas9は、CasYまたはCasYのバリアントを表す。核酸プログラミング可能DNA結合タンパク質（napDNAbp：nucleic acid programmable DNA binding protein）として他のRNA誘導DNA結合タンパク質も使用され得、本開示の範囲内であることが理解されるべきである。

特定の実施形態において、本発明の方法において有用なnapDNAbpは、循環置換体を含み、これは公知であって例えばOakes et al., Cell 176, 254-267, 2019に記載されている。下記は例示的な循環置換体であり、ここで太字の配列はCas9由来の配列を示し、斜体の配列はリンカー配列を表し、下線の配列は二部分核局在化配列を表す。
CP5 (with MSP “NGC=Pam Variant with mutations Regular Cas9 likes NGG” PID=Protein Interacting Domain and “D10A” nickase):

塩基エディターに組み込むことができるポリヌクレオチドプログラム可能ヌクレオチド結合ドメインの非限定的な例としては、CRISPRタンパク質由来ドメイン、制限ヌクレアーゼ、メガヌクレアーゼ、TALヌクレアーゼ(TALEN) 、およびジンクフィンガーヌクレアーゼ (ZFN) が挙げられる。

いくつかの実施形態において、本明細書で提供される融合タンパク質のいずれかの核酸プログラム可能DNA結合タンパク質（napDNAbp）は、CasXまたはCasYタンパク質であり得る。いくつかの実施形態において、napDNAbpはCasXタンパク質である。いくつかの実施形態において、napDNAbpはCasYタンパク質である。いくつかの実施形態において、napDNAbpは、天然に存在するCasXまたはCasYタンパク質に対して少なくとも85%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも99.5%の同一性を有するアミノ酸配列を含む。いくつかの実施形態において、napDNAbpは、天然に存在するCasXまたはCasYタンパク質である。いくつかの実施形態において、napDNAbpは、本明細書に記載されるいずれかのCasXまたはCasYタンパク質に対して少なくとも85%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも99.5%の同一性を有するアミノ酸配列を含む。他の細菌種由来のCas12b/C2c1、CasXおよびCasYもまた、本開示に従って使用され得ることが理解されるべきである。

Cas12b/C2c1 (uniprot.org/uniprot/T0D7A2#2)
sp|T0D7A2|C2C1_ALIAG CRISPR-associated endo- nuclease C2c1 OS = Alicyclobacillus acido- terrestris (strain ATCC 49025 / DSM 3922/ CIP 106132 / NCIMB 13137/GD3B) GN=c2c1 PE=1 SV=1
MAVKSIKVKLRLDDMPEIRAGLWKLHKEVNAGVRYYTEWLSLLRQENLYRRSPNGDGEQECDKTAEECKAELLERLRARQVENGHRGPAGSDDELLQLARQLYELLVPQAIGAKGDAQQIARKFLSPLADKDAVGGLGIAKAGNKPRWVRMREAGEPGWEEEKEKAETRKSADRTADVLRALADFGLKPLMRVYTDSEMSSVEWKPLRKGQAVRTWDRDMFQQAIERMMSWESWNQRVGQEYAKLVEQKNRFEQKNFVGQEHLVHLVNQLQQDMKEASPGLESKEQTAHYVTGRALRGSDKVFEKWGKLAPDAPFDLYDAEIKNVQRRNTRRFGSHDLFAKLAEPEYQALWREDASFLTRYAVYNSILRKLNHAKMFATFTLPDATAHPIWTRFDKLGGNLHQYTFLFNEFGERRHAIRFHKLLKVENGVAREVDDVTVPISMSEQLDNLLPRDPNEPIALYFRDYGAEQHFTGEFGGAKIQCRRDQLAHMHRRRGARDVYLNVSVRVQSQSEARGERRPPYAAVFRLVGDNHRAFVHFDKLSDYLAEHPDDGKLGSEGLLSGLRVMSVDLGLRTSASISVFRVARKDELKPNSKGRVPFFFPIKGNDNLVAVHERSQLLKLPGETESKDLRAIREERQRTLRQLRTQLAYLRLLVRCGSEDVGRRERSWAKLIEQPVDAANHMTPDWREAFENELQKLKSLHGICSDKEWMDAVYESVRRVWRHMGKQVRDWRKDVRSGERPKIRGYAKDVVGGNSIEQIEYLERQYKFLKSWSFFGKVSGQVIRAEKGSRFAITLREHIDHAKEDRLKKLADRIIMEALGYVYALDERGKGKWVAKYPPCQLILLEELSEYQFNNDRPPSENNQLMQWSHRGVFQELINQAQVHDLLVGTMYAAFSSRFDARTGAPGIRCRRVPARCTQEHNPEPFPWWLNKFVVEHTLDACPLRADDLIPTGEGEIFVSPFSAEEGDFHQIHADLNAAQNLQQRLWSDFDISQIRLRCDWGEVDGELVLIPRLTGKRTADSYSNKVFYTNTGVTYYERERGKKRRKVFAQEKLSEEEAELLVEADEAREKSVVLMRDPSGIINRGNWTRQKEFWSMV NQRIEGYLVKQIRSRVPLQDSACENTGDI

CasX (uniprot.org/uniprot/F0NN87; uniprot.org/uniprot/F0NH53)
>tr|F0NN87|F0NN87_SULIH CRISPR-associated Casx protein OS = Sulfolobus islandicus (strain HVE10/4) GN = SiH_0402 PE=4 SV=1
MEVPLYNIFGDNYIIQVATEAENSTIYNNKVEIDDEELRNVLNLAYKIAKNNEDAAAERRGKAKKKKGEEGETTTSNIILPLSGNDKNPWTETLKCYNFPTTVALSEVFKNFSQVKECEEVSAPSFVKPEFYEFGRSPGMVERTRRVKLEVEPHYLIIAAAGWVLTRLGKAKVSEGDYVGVNVFTPTRGILYSLIQNVNGIVPGIKPETAFGLWIARKVVSSVTNPNVSVVRIYTISDAVGQNPTTINGGFSIDLTKLLEKRYLLSERLEAIARNALSISSNMRERYIVLANYIYEYLTG SKRLEDLLYFANRDLIMNLNSDDGKVRDLKLISAYVNGELIRGEG

>tr|F0NH53|F0NH53_SULIR CRISPR associated protein, Casx OS = Sulfolobus islandicus (strain REY15A) GN=SiRe_0771 PE=4 SV=1
MEVPLYNIFGDNYIIQVATEAENSTIYNNKVEIDDEELRNVLNLAYKIAKNNEDAAAERRGKAKKKKGEEGETTTSNIILPLSGNDKNPWTETLKCYNFPTTVALSEVFKNFSQVKECEEVSAPSFVKPEFYKFGRSPGMVERTRRVKLEVEPHYLIMAAAGWVLTRLGKAKVSEGDYVGVNVFTPTRGILYSLIQNVNGIVPGIKPETAFGLWIARKVVSSVTNPNVSVVSIYTISDAVGQNPTTINGGFSIDLTKLLEKRDLLSERLEAIARNALSISSNMRERYIVLANYIYEYLTGSKRLEDLLYFANRDLIMNLNSDDGKVRDLKLISAYVNGELIRGEG

Deltaproteobacteria CasX
MEKRINKIRKKLSADNATKPVSRSGPMKTLLVRVMTDDLKKRLEKRRKKPEVMPQVISNNAANNLRMLLDDYTKMKEAILQVYWQEFKDDHVGLMCKFAQPASKKIDQNKLKPEMDEKGNLTTAGFACSQCGQPLFVYKLEQVSEKGKAYTNYFGRCNVAEHEKLILLAQLKPVKDSDEAVTYSLGKFGQRALDFYSIHVTKESTHPVKPLAQIAGNRYASGPVGKALSDACMGTIASFLSKYQDIIIEHQKVVKGNQKRLESLRELAGKENLEYPSVTLPPQPHTKEGVDAYNEVIARVRMWVNLNLWQKLKLSRDDAKPLLRLKGFPSFPVVERRENEVDWWNTINEVKKLIDAKRDMGRVFWSGVTAEKRNTILEGYNYLPNENDHKKREGSLENPKKPAKRQFGDLLLYLEKKYAGDWGKVFDEAWERIDKKIAGLTSHIEREEARNAEDAQSKAVLTDWLRAKASFVLERLKEMDEKEFYACEIQLQKWYGDLRGNPFAVEAENRVVDISGFSIGSDGHSIQYRNLLAWKYLENGKREFYLLMNYGKKGRIRFTDGTDIKKSGKWQGLLYGGGKAKVIDLTFDPDDEQLIILPLAFGTRQGREFIWNDLLSLETGLIKLANGRVIEKTIYNKKIGRDEPALFVALTFERREVVDPSNIKPVNLIGVARGENIPAVIALTDPEGCPLPEFKDSSGGPTDILRIGEGYKEKQRAIQAAKEVEQRRAGGYSRKFASKSRNLADDMVRNSARDLFYHAVTHDAVLVFANLSRGFGRQGKRTFMTERQYTKMEDWLTAKLAYEGLTSKTYLSKTLAQYTSKTCSNCGFTITYADMDVMLVRLKKTSDGWATTLNNKELKAEYQITYYNRYKRQTVEKELSAELDRLSEESGNNDISKWTKGRRDEALFLLKKRFSHRPVQEQFVCLDCGHEVHAAEQAALNIARSWLFLNSNSTEFKSYKSGKQPFVGAWQAFYKRRLKEVWKPNA

CasY (ncbi.nlm.nih.gov/protein/APG80656.1)
>APG80656.1 CRISPR-associated protein CasY [uncultured Parcubacteria group bacterium]
MSKRHPRISGVKGYRLHAQRLEYTGKSGAMRTIKYPLYSSPSGGRTVPREIVSAINDDYVGLYGLSNFDDLYNAEKRNEEKVYSVLDFWYDCVQYGAVFSYTAPGLLKNVAEVRGGSYELTKTLKGSHLYDELQIDKVIKFLNKKEISRANGSLDKLKKDIIDCFKAEYRERHKDQCNKLADDIKNAKKDAGASLGERQKKLFRDFFGISEQSENDKPSFTNPLNLTCCLLPFDTVNNNRNRGEVLFNKLKEYAQKLDKNEGSLEMWEYIGIGNSGTAFSNFLGEGFLGRLRENKITELKKAMMDITDAWRGQEQEEELEKRLRILAALTIKLREPKFDNHWGGYRSDINGKLSSWLQNYINQTVKIKEDLKGHKKDLKKAKEMINRFGESDTKEEAVVSSLLESIEKIVPDDSADDEKPDIPAIAIYRRFLSDGRLTLNRFVQREDVQEALIKERLEAEKKKKPKKRKKKSDAEDEKETIDFKELFPHLAKPLKLVPNFYGDSKRELYKKYKNAAIYTDALWKAVEKIYKSAFSSSLKNSFFDTDFDKDFFIKRLQKIFSVYRRFNTDKWKPIVKNSFAPYCDIVSLAENEVLYKPKQSRSRKSAAIDKNRVRLPSTENIAKAGIALARELSVAGFDWKDLLKKEEHEEYIDLIELHKTALALLLAVTETQLDISALDFVENGTVKDFMKTRDGNLVLEGRFLEMFSQSIVFSELRGLAGLMSRKEFITRSAIQTMNGKQAELLYIPHEFQSAKITTPKEMSRAFLDLAPAEFATSLEPESLSEKSLLKLKQMRYYPHYFGYELTRTGQGIDGGVAENALRLEKSPVKKREIKCKQYKTLGRGQNKIVLYVRSSYYQTQFLEWFLHRPKNVQTDVAVSGSFLIDEKKVKTRWNYDALTVALEPVSGSERVFVSQPFTIFPEKSAEEEGQRYLGIDIGEYGIAYTALEITGDSAKILDQNFISDPQLKTLREEVKGLKLDQRRGTFAMPSTKIARIRESLVHSLRNRIHHLALKHKAKIVYELEVSRFEEGKQKIKKVYATLKKADVYSEIDADKNLQTTVWGKLAVASEISASYTSQFCGACKKLWRAEMQVDETITTQELIGTVRVIKGGTLIDAIKDFMRPPIFDENDTPFPKYRDFCDKHHISKKMRGNSCLFICPFCRANADADIQASQTIALLRYVKEEKKVEDYFERFRKLKNIKVLGQMKKI

「Cas12」または「Cas12ドメイン」という用語は、Cas12タンパク質またはその断片（例えば、Cas12の活性、不活性、または部分的に活性なDNA切断ドメインおよび/またはCas12のgRNA結合ドメインを含むタンパク質）を含むRNA誘導ヌクレアーゼを指す。Cas12はクラス2、タイプV CRISPR/Casシステムに属する。Cas12ヌクレアーゼは、CRISPR（clustered regularly interspaced short palindromic repeat）関連ヌクレアーゼと呼ばれることもある。例示的なBacillus hisashii Cas 12b (BhCas12b) Cas 12ドメインの配列を以下に提供する。
MAPKKKRKVGIHGVPAAATRSFILKIEPNEEVKKGLWKTHEVLNHGIAYYMNILKLIRQEAIYEHHEQDPKNPKKVSKAEIQAELWDFVLKMQKCNSFTHEVDKDEVFNILRELYEELVPSSVEKKGEANQLSNKFLYPLVDPNSQSGKGTASSGRKPRWYNLKIAGDPSWEEEKKKWEEDKKKDPLAKILGKLAEYGLIPLFIPYTDSNEPIVKEIKWMEKSRNQSVRRLDKDMFIQALERFLSWESWNLKVKEEYEKVEKEYKTLEERIKEDIQALKALEQYEKERQEQLLRDTLNTNEYRLSKRGLRGWREIIQKWLKMDENEPSEKYLEVFKDYQRKHPREAGDYSVYEFLSKKENHFIWRNHPEYPYLYATFCEIDKKKKDAKQQATFTLADPINHPLWVRFEERSGSNLNKYRILTEQLHTEKLKKKLTVQLDRLIYPTESGGWEEKGKVDIVLLPSRQFYNQIFLDIEEKGKHAFTYKDESIKFPLKGTLGGARVQFDRDHLRRYPHKVESGNVGRIYFNMTVNIEPTESPVSKSLKIHRDDFPKVVNFKPKELTEWIKDSKGKKLKSGIESLEIGLRVMSIDLGQRQAAAASIFEVVDQKPDIEGKLFFPIKGTELYAVHRASFNIKLPGETLVKSREVLRKAREDNLKLMNQKLNFLRNVLHFQQFEDITEREKRVTKWISRQENSDVPLVYQDELIQIRELMYKPYKDWVAFLKQLHKRLEVEIGKEVKHWRKSLSDGRKGLYGISLKNIDEIDRTRKFLLRWSLRPTEPGEVRRLEPGQRFAIDQLNHLNALKEDRLKKMANTIIMHALGYCYDVRKKKWQAKNPACQIILFEDLSNYNPYEERSRFENSKLMKWSRREIPRQVALQGEIYGLQVGEVGAQFSSRFHAKTGSPGIRCSVVTKEKLQDNRFFKNLQREGRLTLDKIAVLKEGDLYPDKGGEKFISLSKDRKCVTTHADINAAQNLQKRFWTRTHGFYKVYCKAYQVDGQTVYIPESKDQKQKIIEEFGEGYFILKDGVYEWVNAGKLKIKKGSSKQSSSELVDSDILKDSFDLASELKGEKLMLYRDPSGNVFPSDKWMAAGVFFGKLERILISKLTNQYSISTIEDDSSKQSMKRPAATKKAGQAKKKK.

BhCas12bアミノ酸配列に対して少なくとも85%以上の同一性を有するアミノ酸配列もまた、本発明の方法において有用である。

「シチジンデアミナーゼ」とは、アミノ基をカルボニル基に変換する脱アミノ化反応を触媒することができるポリペプチドまたはその断片を意味する。1つの実施形態において、シチジンデアミナーゼは、シトシンをウラシルに、または5-メチルシトシンをチミンに変換する。Petromyzon marinus由来のPmCDA1（Petromyzon marinus cytosine deaminase 1、”PmCDA1”）、または哺乳動物（例えば、ヒト、ブタ、ウシ、ウマ、サル等）由来のAID（活性化誘導シチジンデアミナーゼ; AICDA）、およびAPOBECは、例示的シチジンデアミナーゼである。

「保存的アミノ酸置換」または「保存的変異」という用語は、あるアミノ酸が共通の特性を有する別のアミノ酸に置き換わることを指す。個々のアミノ酸間の共通の性質を定義するための機能的な方法は、相同的な生物の対応するタンパク質間のアミノ酸変化の正規化された頻度を分析することである(Schulz, G. E. and Schirmer, R. H., Principles of Protein Structure, Springer-Verlag, New York (1979))。このような分析によれば、グループ内のアミノ酸が互いに優先的に交換され、それゆえに全体的なタンパク質構造に対するそれらの影響において互いに最も類似しているところアミノ酸のグループを定義することができる(上記Schulz, G. E. and Schirmer, R. H.)。保存変異の非限定的な例としては、例えば正電荷を維持することができるアミノ酸アルギニンからリジンおよびその逆；負電荷を維持することができるアスパラギン酸からグルタミン酸およびその逆；遊離の-OHが維持されるトレオニンからセリン；および遊離NH₂を維持できるアスパラギンからグルタミンのようなアミノ酸置換が挙げられる。

本明細書中で交換可能に使用される用語「コード配列」または「タンパク質コード配列」とは、タンパク質をコードするポリヌクレオチドのセグメントをいう。この領域または配列は、5’末端に近い方が開始コドンで境界され、3’末端に近い方が終止コドンで境界される。コード配列はオープンリーディングフレームとも呼ばれる。

本明細書中で使用する場合、用語「デアミナーゼ」または「デアミナーゼドメイン」とは、脱アミノ化反応を触媒するタンパク質または酵素を指す。ある態様において、デアミナーゼは、ヒポキサンチンへのアデニンの加水分解的脱アミノ化を触媒するアデノシンデアミナーゼである。ある態様において、デアミナーゼは、アデノシンまたはアデニン (A) からイノシン(I) への加水分解的脱アミノ化を触媒するアデノシンデアミナーゼである。ある態様において、デアミナーゼまたはデアミナーゼドメインは、アデノシンデアミナーゼであり、それぞれイノシンまたはデオキシイノシンへのアデノシンまたはデオキシアデノシンの加水分解的脱アミノ化を触媒する。ある態様において、アデノシンデアミナーゼは、デオキシリボ核酸 (DNA) 中のアデノシンの加水分解的脱アミノ化を触媒する。本明細書中で提供されるアデノシンデアミナーゼ(例えば、遺伝子操作されたアデノシンデアミナーゼ、進化されたアデノシンデアミナーゼ)は、細菌などの任意の生物由来であり得る。ある態様において、アデノシンデアミナーゼは、Escherichia coli、Staphylococcus aureus、Salmonella typhimurium、Shewanella putrefaciens、Haemophilus influenzae、またはCaulobacter crescentusなどの細菌に由来する。

ある実施形態において、アデノシンデアミナーゼは、TadAデアミナーゼである。ある実施形態において、TadAデアミナーゼはTadAバリアントである。ある実施形態において、TadAバリアントはTadA*8である。ある実施形態において、デアミナーゼまたはデアミナーゼドメインは、例えばヒト、チンパンジー、ゴリラ、サル、ウシ、イヌ、ラット、またはマウスなどの生物由来の天然デアミナーゼのバリアントである。ある態様において、デアミナーゼまたはデアミナーゼドメインは、非天然のものである。例えば、いくつかの実施形態において、デアミナーゼまたはデアミナーゼドメインは、天然のデアミナーゼに対して少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、少なくとも99.1%、少なくとも99.2%、少なくとも99.3%、少なくとも99.4%、少なくとも99.5%、少なくとも99.6%、少なくとも99.7%、少なくとも99.8%、または少なくとも99.9%の同一性を有する。例えば、デアミナーゼドメインは国際PCT出願番号PCT/2017/045381 (WO2018/027078) およびPCT/US2016/058344 (WO2017/070632) に記載されており、これらの各々は、その全体が参照により本明細書に組み込まれる。Komor, A.C., et al., “Programmable editing of a target base in genomic DNA without double-stranded DNA cleavage” Nature 533, 420-424 (2016); Gaudelli, N.M., et al., “Programmable base editing of A・T to G・C in genomic DNA without DNA cleavage”Nature 551, 464-471 (2017); Komor, A.C., et al., “Improved base excision repair inhibition and bacteriophage Mu Gam protein yields C:G-to-T:A base editors with higher efficiency and product purity”Science Advances 3:eaao4774 (2017) およびRees, H.A., et al., “Base editing: precision chemistry on the genome and transcriptome of living cells.” Nat Rev Genet. 2018 Dec;19(12):770-788. doi: 10.1038/s41576-018-0059-1も参照（その全内容が参照により本明細書に組み込まれる）。

「検出」は、検出されるべき分析物の存在、不在または量を同定することを指す。1つの実施形態において、ポリヌクレオチドまたはポリペプチドにおける配列変化が検出される。別の実施形態では、インデル（indel）の存在が検出される。

「検出可能な標識」とは、目的の分子に連結されたときに、分光学的、光化学的、生化学的、免疫化学的、または化学的手段を介して、後者を検出可能にする組成物を意味する。例えば、有用な標識には、放射性同位体、磁気ビーズ、金属ビーズ、コロイド粒子、蛍光色素、高電子密度試薬、酵素（例えば、酵素結合免疫吸着測定法 (ELISA) で一般的に用いられるもの）、ビオチン、ジゴキシゲニン、またはハプテンが含まれる。

「疾患」とは、細胞、組織または器官の正常な機能を損傷または妨害するあらゆる状態または障害を意味する。

本明細書で使用される用語「有効量」は、所望の生物学的応答を誘導するために十分な生物学的活性剤の量を意味する。疾患の治療的処置のために本発明を実施するために使用される活性剤（複数可）の有効量は、投与態様、対象の年齢、体重、および全般的健康状態に依存して変化する。最終的には、主治医または獣医が適切な量および用量を決定する。このような量は「有効」量と呼ばれる。一実施形態では、有効量は、細胞（例えば、インビトロまたはインビボの細胞）内の目的の遺伝子に改変を導入するのに十分な本発明の塩基エディター（例えば、プログラム可能DNA結合タンパク質、核酸塩基エディター、およびgRNA）の量である。いくつかの実施形態において、本明細書で提供される融合タンパク質の有効量、例えば、nCas9ドメインおよびデアミナーゼドメイン（例えば、アデノシンデアミナーゼまたはシチジンデアミナーゼ）を含む核酸塩基エディターの有効量は、その核酸塩基エディターによって特異的に結合および編集される標的部位の編集を誘導するために十分な融合タンパク質の量を指し得る。一実施形態では、有効量は、治療効果（例えば、疾患またはその症状もしくは状態を低減または制御する）を達成するために必要な塩基エディターの量である。このような治療効果は、対象、組織または器官の全ての細胞において目的遺伝子を変化させるのに十分である必要はなく、対象、組織または器官に存在する細胞の約1%、5%、10%、25%、50%、75%またはそれ以上において目的遺伝子を変化させるだけでよい。

いくつかの実施形態において、本明細書に提供される融合タンパク質（例えばnCas9ドメインおよびデアミナーゼドメイン（例えばアデノシンデアミナーゼ、シチジンデアミナーゼ）を含む核酸塩基エディターの有効量は、本明細書に記載される核酸塩基エディターによって特異的に結合され編集される標的部位の編集を誘導するのに十分な融合タンパク質の量を指す。当業者には理解されるように、作用物質（例えば融合タンパク質、ヌクレアーゼ、ハイブリッドタンパク質、タンパク質二量体、タンパク質（もしくはタンパク質二量体）とポリヌクレオチドとの複合体、またはポリヌクレオチド）の有効量は、例えば、望まれる生物学的応答、例えば編集されるべき特定のアリル、ゲノム、もしくは標的部位、標的化される細胞もしくは組織、および/または使用される作用物質などの種々の因子に応じて変化し得る。

「断片」とは、ポリペプチドまたは核酸分子の一部を意味する。この部分は、参照核酸分子またはポリペプチドの全長の少なくとも約10%、20%、30%、40%、50%、60%、70%、80%、または90%を含む。断片は、10、20、30、40、50、60、70、80、90、または100、200、300、400、500、600、700、800、900、または1000のヌクレオチドまたはアミノ酸を含み得る。

「ガイドRNA」あるいは「gRNA」は、標的配列に特異的となることができポリヌクレオチドプログラミング可能ヌクレオチド結合ドメインタンパク質（例えばCas9またはCpf1）と複合体を形成することができるポリヌクレオチドを意味する。一実施形態において、ガイドポリヌクレオチドはガイドRNA (gRNA) である。gRNAは2個以上のRNAの複合体として存在することもあれば、1個のRNA分子として存在することもある。単一のRNA分子として存在するgRNAは、単一ガイドRNA（sgRNA）と呼ばれることがあるが、「gRNA」は、単一の分子として、または2つ以上の分子の複合体として存在するガイドRNAを指すために互換的に使用される。典型的には、単一のRNA種として存在するgRNAは、(1) 標的核酸と相同性を共有するドメイン（例えば、標的へのCas9複合体の結合を指示する）；および(2) Cas9タンパク質に結合するドメインという二つのドメインを含む。ある態様において、ドメイン (2) は、tracrRNAとして知られる配列に対応し、ステム-ループ構造を含む。例えば、いくつかの態様において、ドメイン (2) は、Jinek et al., Science 337:816-821(2012)（その全内容が参照により本明細書に組み入れられる）に提供されるようなtracrRNAと同一または相同である。gRNA (例えばドメイン2を含むもの)の他の例は、2013年9月6日出願された「Switchable Cas9 Nucleases and Uses Thereof」と題される米国仮特許出願U.S.S.N. 61/874,682および2013年9月6日出願された「Delivery System For Functional Nucleases」と題される米国仮特許出願U.S.S.N. 61/874,746に見出され得、それら各々の全内容が参照により本明細書に組み入れられる。いくつかの実施形態において、gRNAは、ドメイン (1) および (2) の二つ以上を含み、「伸長されたgRNA。」と称され得る。伸長されたgRNAは、本明細書に記載されるように、二つ以上のCas9タンパク質と結合し、二つ以上の異なる領域における標的核酸と結合する。gRNAは、標的部位を相補するヌクレオチド配列を含み、これが標的部位へのヌクレアーゼ/RNA複合体の結合を媒介し、ヌクレアーゼ：RNA複合体の配列特異性を提供する。

「ハイブリダイゼーション」は、相補的な核酸塩基間の水素結合を意味し、ワトソン-クリック、フーグスティーンまたは逆フーグスティーン水素結合であり得る。たとえば、アデニンとチミンは相補的な核酸塩基で、水素結合を形成して対を形成する。

用語「塩基修復の阻害因子（inhibitor of base repair）」あるいは「IBR」は、核酸修復酵素、例えば塩基除去修復（BER：base excision repair）酵素の活性を阻害することができるタンパク質を指す。ある態様において、IBRは、イノシン塩基除去修復の阻害因子である。塩基修復の阻害因子の例としては、APE1、Endo III、Endo IV、Endo V、Endo VIII、Fpg、hOGGl、hNEILl、T7 Endol、T4 PDG、UDG、hSMUGLおよびhAAGの阻害因子が挙げられる。ある実施形態では、IBRは、Endo VまたはhAAGの阻害因子である。ある実施形態では、IBRは、触媒的に不活性なEndoVまたは触媒的に不活性なhAAGである。ある実施形態では、塩基修復阻害因子は、Endo VまたはhAAGの阻害因子である。ある実施形態では、塩基修復阻害因子は、触媒的に不活性なEndoVまたは触媒的に不活性なhAAGである。

ある実施形態では、塩基修復阻害因子は、ウラシルグリコシラーゼ阻害因子 (UGI) である。UGIとは、ウラシル-DNAグリコシラーゼの塩基除去修復酵素を阻害することができるタンパク質を指す。いくつかの実施形態において、UGIドメインは、野生型UGIまたはその断片を含む。いくつかの実施形態において、本明細書で提供されるUGIタンパク質は、UGIの断片、および、UGIまたはUGI断片に相同的なタンパク質を含む。ある態様において、塩基修復阻害因子は、イノシン塩基除去修復の阻害因子である。いくつかの態様において、塩基修復阻害因子は、「触媒的に不活性なイノシン特異的ヌクレアーゼ」または「死んだイノシン特異的ヌクレアーゼ」である。いかなる特定の理論にも拘束されることを望まないが、触媒的に不活性なイノシングリコシラーゼ（例えば、アルキルアデニングリコシラーゼ (AAG)）は、イノシンに結合することができるが、脱塩基部位を作ることもイノシンを除去することもできず、それによって、新たに形成されるイノシン部分をDNA損傷/修復機構から立体的にブロックする。いくつかの実施形態において、触媒的に不活性なイノシン特異的ヌクレアーゼは、核酸中のイノシンに結合することができるが、核酸を切断しない。代表的な、触媒的に不活性なイノシン特異的ヌクレアーゼの非限定的例としては、（例えばヒト由来の）触媒的に不活性なアルキルアデノシングリコシラーゼ(AAGヌクレアーゼ)、および（例えばE.coli由来の）触媒的に不活性なエンドヌクレアーゼV (EndoVヌクレアーゼ)が挙げられる。いくつかの実施形態において、触媒的に不活性なAAGヌクレアーゼは、E125Q突然変異または別のAAGヌクレアーゼにおける対応する突然変異を含む。

「増加」とは、少なくとも10%、25%、50%、75%、または100%の正の変化を意味する。

「インテイン（intein）」は、それ自身を切り出してそして残った断片（エクステイン（extein））をタンパク質スプライシングとして知られるプロセスにおいてペプチド結合で連結することができるタンパク質の断片である。インテインは「タンパク質イントロン」とも呼ばれる。インテインがそれ自身を切り出し、タンパク質の残りの部分を連結するプロセスは、本明細書において、「タンパク質スプライシング」または「インテイン媒介タンパク質スプライシング」と呼ばれる。ある態様において、前駆体タンパク質（インテイン媒介タンパク質スプライシングの前のインテイン含有タンパク質）のインテインは、二つの遺伝子に由来する。そのようなインテインは、本明細書では分割（split）インテインと呼ばれる（例えば、分割インテイン-Nおよび分割インテイン-C）。たとえば、シアノバクテリアでは、DNAポリメラーゼIIIの触媒サブユニットaであるDnaEは2つの別々の遺伝子dnaE-nおよびdnaE-cによってコードされている。dnaE-n遺伝子によってコードされるインテインは本明細書において「インテインN」と称され得る。dnaE-c遺伝子によってコードされるインテインは本明細書において「インテインC」と称され得る。

他のインテイン系も使用され得る。例として、dnaEインテイン、すなわちCfa-N（例えば分割インテイン-N）およびCfa-C（例えば分割インテイン-C）のインテイン対に基づく合成インテインが記述されている（例えば、参照により本明細書に組み入れられるStevens et al., J Am Chem Soc. 2016 Feb. 24; 138(7):2162-5）。本開示に従って使用することができるインテイン対の非限定的な例としては、Cfa DnaEインテイン、Ssp GyrBインテイン、Ssp DnaXインテイン、Ter DnaE3インテイン、Ter ThyXインテイン、Rma DnaBインテイン、およびCne Prp8インテイン（例えば、参照により本明細書に組み込まれる米国特許第8,394,604号に記載のようなもの）が挙げられる。

インテインの例示的なヌクレオチドおよびアミノ酸配列を提供する。
DnaE インテイン-N DNA: TGCCTGTCATACGAAACCGAGATACTGACAGTAGAATATGGCCTTCTGCCAATCGGGAAGATTGTGGAGAAACGGATAGAATGCACAGTTTACTCTGTCGATAACAATGGTAACATTTATACTCAGCCAGTTGCCCAGTGGCACGACCGGGGAGAGCAGGAAGTATTCGAATACTGTCTGGAGGATGGAAGTCTCATTAGGGCCACTAAGGACCACAAATTTATGACAGTCGATGGCCAGATGCTGCCTATAGACGAAATCTTTGAGCGAGAGTTGGACCTCATGCGAGTTGACAACCTTCCTAAT
DnaE インテイン-N タンパク質: CLSYETEILTVEYGLLPIGKIVEKRIECTVYSVDNNGNIYTQPVAQWHDR GEQEVFEYCLEDGSLIRATKDHKFMTVDGQMLPIDEIFERELDLMRVDNLPN
DnaE インテイン-C DNA: ATGATCAAGATAGCTACAAGGAAGTATCTTGGCAAACAAAACGTTTATGA TATTGGAGTCGAAAGAGATCACAACTTTGCTCTGAAGAACGGATTCATAGCTTCTAAT
Intein-C: MIKIATRKYLGKQNVYDIGVERDHNFALKNGFIASN
Cfa-N DNA: TGCCTGTCTTATGATACCGAGATACTTACCGTTGAATATGGCTTCTTGCCTATTGGAAAGATTGTCGAAGAGAGAATTGAATGCACAGTATATACTGTAGACAAGAATGGTTTCGTTTACACACAGCCCATTGCTCAATGGCACAATCGCGGCGAACAAGAAGTATTTGAGTACTGTCTCGAGGATGGAAGCATCATACGAGCAACTAAAGATCATAAATTCATGACCACTGACGGGCAGATGTTGCCAATAGATGAGATATTCGAGCGGGGCTTGGATCTCAAACAAGTGGATGGATTGCCA
Cfa-N タンパク質:
CLSYDTEILTVEYGFLPIGKIVEERIECTVYTVDKNGFVYTQPIAQWHNRGEQEVFEYCLEDGSIIRATKDHKFMTTDGQMLPIDEIFERGLDLKQVDGLP
Cfa-C DNA: ATGAAGAGGACTGCCGATGGATCAGAGTTTGAATCTCCCAAGAAGAAGAGGAAAGTAAAGATAATATCTCGAAAAAGTCTTGGTACCCAAAATGTCTATGATATTGGAGTGGAGAAAGATCACAACTTCCTTCTCAAGAACGGTCTCGTAGCCAGCAAC
Cfa-C タンパク質: MKRTADGSEFESPKKKRKVKIISRKSLGTQNVYDIGVEKDHNFLLKNGLVASN

分割Cas9のN末端部と分割Cas9のC末端部とを接合するために、インテインNおよびインテインCをそれぞれ分割Cas9のN末端部および分割Cas9のC末端部に融合させ得る。例えば、いくつかの実施形態において、インテイン-Nが、分割されたCas9のN-末端部分のC-末端に融合され、すなわち、N--[分割Cas9のN末端部分]-[インテイン-N]--Cの構造を形成する。いくつかの実施形態において、インテイン-Cが、分割されたCas9のC-末端部分のN-末端に融合され、すなわち、N-[インテイン-C]--[分割Cas9のC末端部分]-Cの構造を形成する。インテインが融合されたところのタンパク質（例えば分割Cas9）を連結するためのインテイン媒介性タンパク質スプライシングの機構は、例えば、参照により本明細書に組み入れられるShah et al., Chem Sci. 2014; 5(1):446-461に記載されているように、当該技術分野において公知である。インテインを設計および使用する方法は当該技術分野で公知であり、例えばWO2014004336、WO2017132580、US20150344549およびUS20180127780によって記載されており、これらの各々はその全体が参照により本明細書に組み込まれる

用語「単離された」、「精製された」、または「生物学的に純粋な」とは、その天然状態で見出される場合に通常それに付随する成分が、様々な程度まで除去されている物質を指す。「単離」は、元の入手源又は周囲環境からの分離の程度を示す。「精製」は、単離よりも高い分離度を示す。「精製された」又は「生物学的に純粋な」タンパク質は、不純物がタンパク質の生物学的特性に実質的に影響を与えたり他の有害な結果を引き起こさないように、他の物質が十分に除去されている。すなわち、本発明の核酸またはペプチドは、組換えDNA技術によって産生された場合には細胞物質、ウイルス物質または培地を実質的に含まない場合、あるいは化学的に合成された場合には化学的前駆体その他の化学物質を実質的に含まない場合には、精製されている。純度および均一性は、典型的には、分析化学技術、例えば、ポリアクリルアミドゲル電気泳動または高速液体クロマトグラフィーを用いて決定される。用語「精製された」は、核酸またはタンパク質が電気泳動ゲルにおいて本質的に1つのバンドを生じることを意味し得る。修飾、例えば、リン酸化またはグリコシル化を受けることができるタンパク質については、異なる修飾は、別々に精製することができる異なる単離されたタンパク質を生じ得る。

「単離ポリヌクレオチド」とは、本発明の核酸分子が由来する生物の天然ゲノムにおいて当該遺伝子に隣接する遺伝子を含まない核酸(例えばDNA)を意味する。したがって、この用語は、例えば、ベクターに組み込まれた；自律的に複製するプラスミドやウイルスに組み込まれた；原核生物や真核生物のゲノムDNAに組み込まれた；または他の配列とは独立した別の分子(例えば、PCRまたは制限エンドヌクレアーゼ消化によって生成されたcDNAまたはゲノムもしくはcDNA断片)として存在する組換えDNAを含む。さらに、この用語は、DNA分子から転写されるRNA分子、ならびに、さらなるポリペプチド配列をコードするハイブリッド遺伝子の一部である組換えDNAを含む。

「単離ポリペプチド」とは、天然状態で付随する成分から分離された本発明のポリペプチドを意味する。典型的には、ポリペプチドは、それが天然状態で会合しているタンパク質および天然有機分子から重量で少なくとも60%フリーである場合に、単離されている。好ましくは、調製物は、重量で少なくとも75%、より好ましくは少なくとも90%、最も好ましくは少なくとも99%が本発明のポリペプチドである。本発明の単離されたポリペプチドは、例えば、天然源からの抽出、そのようなポリペプチドをコードする組換え核酸の発現；または化学的にタンパク質を合成することにより得ることができる。純度は、任意の適切な方法、例えば、カラムクロマトグラフィー、ポリアクリルアミドゲル電気泳動、またはHPLC分析によって測定することができる。

本明細書において使用される用語「リンカー」は、二つの分子もしくは部分（例えばタンパク質複合体もしくはリボ核複合体の二つの成分、または融合タンパク質の二つのドメイン、例えば、ポリヌクレオチドプログラミング可能DNA結合ドメイン（例えばdCas9）とデアミナーゼドメイン（例えばアデノシンデアミナーゼ、シチジンデアミナーゼ、もしくはアデノシンデアミナーゼとシチジンデアミナーゼ）、またはnapDNAbpドメイン（例えばCas12b）とデアミナーゼドメイン（例えばアデノシンデアミナーゼもしくはシチジンデアミナーゼ））を連結する共有結合リンカー（例えば共有結合）、非共有結合リンカー、化学基、または分子を指すことができる。特定の実施形態では、リンカーは、Casタンパク質またはその断片内に挿入されたデアミナーゼドメインに隣接する。リンカーは、塩基エディターシステムの異なるコンポーネントまたはコンポーネントの異なる部分を繋げることができる。例えば、いくつかの実施形態において、リンカーは、ポリヌクレオチドプログラミング可能ヌクレオチド結合ドメインのガイドポリヌクレオチド結合ドメインおよびデアミナーゼの触媒ドメインを繋げることができる。ある態様において、リンカーは、CRISPRポリペプチドおよびデアミナーゼを結合することができる。ある態様において、リンカーは、Cas9およびデアミナーゼを繋げることができる。ある態様において、リンカーは、dCas9およびデアミナーゼを繋げることができる。ある態様において、リンカーは、nCas9およびデアミナーゼを繋げることができる。例えば、ある実施形態では、リンカーは、Cas12a/Cpfl、Cas12b/C2cl、Cas12c/C2c3、Cas12d/CasY、Cas12e/CasX、Cas12g、Cas12h、またはCas12iとデアミナーゼとを繋げ得る。ある態様において、リンカーは、ガイドポリヌクレオチドおよびデアミナーゼを繋げることができる。いくつかの実施形態において、リンカーは、塩基エディター系の脱アミノ化成分およびポリヌクレオチドプログラミング可能なヌクレオチド結合成分を繋げることができる。いくつかの実施形態において、リンカーは、塩基エディター系の脱アミノ化成分のRNA結合部分とnapDNAbp成分とを繋げることができる。いくつかの実施形態において、リンカーは、塩基エディターシステムの脱アミノ化成分のRNA結合部分と、ポリヌクレオチドプログラミング可能なヌクレオチド結合成分とを繋げることができる。いくつかの実施形態において、リンカーは、塩基エディタ系の脱アミノ化成分のRNA結合部分と、ポリヌクレオチドプログラミング可能なヌクレオチド結合成分のRNA結合部分とを結合することができる。リンカーは、2つの基、分子、または他の部分の間に配置され、またはそれらによって挟まれ、共有結合または非共有結合相互作用を介してそれぞれに連結され、かくして2つを連結することができる。ある態様において、リンカーは、有機分子、基、ポリマー、または化学的部分であり得る。ある態様において、リンカーはポリヌクレオチドであり得る。ある態様において、リンカーはDNAリンカーであり得る。ある態様において、リンカーはRNAリンカーであり得る。ある態様において、リンカーは、リガンドに結合することができるアプタマーを含むことができる。ある態様において、リガンドは、炭水化物、ペプチド、タンパク質、または核酸であり得る。いくつかの実施形態において、リンカーは、リボスイッチに由来するアプタマーを含むことができる。アプタマーが由来するリボスイッチは、テオフィリンリボスイッチ、チアミンピロリン酸 (TPP) リボスイッチ、アデノシンコバラミン (AdoCbl) リボスイッチ、S-アデノシルメチオニン (SAM) リボスイッチ、SAHリボスイッチ、フラビンモノヌクレオチド(FMN) リボスイッチ、テトラヒドロ葉酸リボスイッチ、リジンリボスイッチ、グリシンリボスイッチ、プリンリボスイッチ、GlmSリボスイッチ、またはプレクエオシン1 (PreQ1) リボスイッチから選択され得る。ある態様において、リンカーは、ポリペプチドまたはポリペプチドリガンドなどのタンパク質ドメインに結合したアプタマーを含み得る。ある態様において、ポリペプチドリガンドは、K相同(KH) ドメイン、MS2コートタンパク質ドメイン、PP7コートタンパク質ドメイン、SfMu Comコートタンパク質ドメイン、無菌のαモチーフ、テロメラーゼKu結合モチーフおよびKuタンパク質、テロメラーゼSm7結合モチーフおよびSm7タンパク質、またはRNA認識モチーフであり得る。ある態様において、ポリペプチドリガンドは、塩基エディター系成分の一部であり得る。例えば、核酸塩基編集成分は、デアミナーゼドメインおよびRNA認識モチーフを含み得る。

ある態様において、リンカーは、アミノ酸または複数のアミノ酸(例えばペプチドまたはタンパク質)であり得る。ある態様において、リンカーは、長さが約5～100アミノ酸、例えば、長さが約5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、20-30、30～40、40～50、50～60、60～70、70～80、80～90または90～100アミノ酸であり得る。ある態様において、リンカーは、長さが約100～150、150～200、200～250、250～300、300～350、350～400、400～450、または450～500アミノ酸であり得る。より長いまたはより短いリンカーも考えられる。

ある態様において、リンカーは、Cas9ヌクレアーゼドメインを含むRNAプログラム可能ヌクレアーゼのgRNA結合ドメインと、核酸編集タンパク質（例えば、シチジンまたはアデノシンデアミナーゼ）の触媒ドメインとを繋げる。ある態様において、リンカーは、dCas9および核酸編集タンパク質を繋げる。例えば、リンカーは、2つの基、分子、または他の部分の間に配置されるか、または2つの基、分子、または他の部分によって隣接され、共有結合を介してそれぞれに連結され、したがって2つを連結する。ある態様において、リンカーは、アミノ酸または複数のアミノ酸(例えば、ペプチドまたはタンパク質)である。ある態様において、リンカーは、有機分子、基、ポリマー、または化学的部分である。ある態様において、リンカーは、長さが5～200アミノ酸、例えば、長さが5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、25、35、45、50、55、60、60、65、70、70、75、80、85、90、90、95、100、101、102、103、104、105、110、120、130、140、150、160、175、180、190、または200アミノ酸である。より長い、またはより短いリンカーも企図される。

ある態様において、核酸塩基エディターのドメインは、SGGSSGSETPGTSESATPESSGGS, SGGSSGGSSGSETPGTSESATPESSGGSSGGS, またはGGSGGSPGSPAGSPTSTEEGTSESATPESGPGTSTEPSEGSAPGSPAGSPTSTEEGTSTE PSEGSAPGTSTEPSEGSAPGTSESATPESGPGSEPATSGGSGGSのアミノ酸配列を含むリンカーを介して融合される。ある態様において、核酸塩基エディターのドメインは、XTENリンカーとも呼ばれ得るアミノ酸配列SGSETPGTSESATPESを含むリンカーを介して融合される。ある態様において、リンカーは、アミノ酸配列SGGSを含む。ある態様において、リンカーは、(SGGS)_n、(GGGS)_n、(GGGGS)_n、(G)_n、(EAAAK)_n、(GGS)_n、SGSETPGTSESATPES、もしくは(XP)_nモチーフ、またはこれらのいずれかの組合せを含み、ここで、nは独立して1～30の整数であり、Xは任意のアミノ酸である。いくつかの実施形態において、nは1、2、3、4、5、6、7、8、9、10、11、12、13、14、または15である。

ある態様において、リンカーは、長さが24アミノ酸である。ある態様において、リンカーは、アミノ酸配列SGGSSGGSSGSETPGTSESATPESを含む。ある態様において、リンカーは、長さが40アミノ酸である。ある態様において、リンカーは、アミノ酸配列SGGSSGGSSGSETPGTSESATPESSGGSSGGSSGGSSGGSを含む。ある態様において、リンカーは、長さが64アミノ酸である。ある態様において、リンカーは、アミノ酸配列SGGSSGGSSGSETPGTSESATPESSGGSSGGSSGGSSGGSSGSETPGTSESATPESSGGS SGGSを含む。ある態様において、リンカーは、長さが92アミノ酸である。ある態様において、リンカーは、アミノ酸配列PGSPAGSPTSTEEGTSESATPESGPGTSTEPSEGSAPGSPAGSPTSTEEGTSTEPSEGSAPGTSTEPSEGSAPGTSESATPESGPGSEPATSを含む。

「マーカー」とは、疾患または障害に関連する発現レベルまたは活性の変化を有する任意のタンパク質またはポリヌクレオチドを意味する。

本明細書中で使用される場合、用語「変異」とは、配列内、例えば核酸もしくはアミノ酸配列内の残基が、別の残基により置換されること、または配列内の1以上の残基の欠失もしくは挿入をいう。変異は、本明細書中において典型的には、元の残基を同定し、次いで配列内の残基の位置を同定し、そして新たに置換された残基を同定することによって、記載される。本明細書中に提供されるアミノ酸置換 (変異) を作製するための種々の方法は、当該技術分野においてよく知られており、例えば、Green and Sambrook, Molecular Cloning: A Laboratory Manual (4th ed., Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y. (2012))によって提供されている。いくつかの態様において、本開示の塩基エディターは、有意な数の非意図的な変異、例えば非意図的な点突然変異を生成することなく、核酸(例えば対象のゲノム内の核酸)において「意図された変異」例えば点突然変異を効率的に生成することができる。いくつかの実施形態において、意図された変異は、その意図された変異を生じさせるように特に設計された、ガイドポリヌクレオチド（例えばgRNA）に結合した特定の塩基エディター（例えばシチジン塩基エディターまたはアデノシン塩基エディター）によって生じる変異である。

一般に、配列(例えば、本明細書に記載のアミノ酸配列)においてなされるか又は同定される変異は、参照(または野生型)配列、すなわち、その変異を含まない配列に関連して番号付けされる。当業者は、参照配列に対するアミノ酸および核酸配列における突然変異の位置を決定する方法を容易に理解するであろう。

「非保存的変異」という用語は、異なるグループの間のアミノ酸置換に関し、例えば、トリプトファンからリジン、またはセリンからフェニルアラニンなどである。この場合、非保存的アミノ酸置換は、機能性バリアントの生物学的活性を妨害または阻害しないことが好ましい。非保存的アミノ酸置換は、機能的バリアントの生物学的活性が野生型タンパク質と比較して増加するように、機能的バリアントの生物学的活性を増強することができる。

「核局在化配列」、「核局在化シグナル」または「NLS」という用語は、タンパク質の細胞核への移入を促進するアミノ酸配列を意味する。核局在化配列は当該技術分野において公知であり、例えば、2000年11月23日に出願され2001年5月31日にWO/2001/038547として公開された国際PCT出願PCT/EP 2000/011690のPlank et al.に記載されており、その内容は、例示的な核局在化配列の開示について参照により本明細書に組み入れられる。他の実施形態では、NLSは、例えばKoblan et al., Nature Biotech. 2018 doi:10.1038/nbt.4172によって記載された、最適化されたNLSである。ある態様において、NLSは、アミノ酸配列KRTADGSEFESPKKKRKV、KRPAATKKAGQAKKKK、KKTELQTTNAENKTKKL、KRGINDRNFWRGENGRKTR、RKSGKIAAIVVKRPRK、PKKKRKV、またはMDSLLMNRRKFLYQFKNVRWAKGRRETYLCを含む。

本明細書中で使用される場合、用語「核酸」および「核酸分子」とは、核酸塩基および酸性部分を含む化合物、例えばヌクレオシド、ヌクレオチド、またはヌクレオチドのポリマーをいう。典型的には、ポリマー核酸、例えば3つ以上のヌクレオチドを含む核酸分子は、隣接するヌクレオチドがホスホジエステル結合を介して互いに連結されている直鎖分子である。ある態様において、「核酸」は、個々の核酸残基(例えばヌクレオチドおよび/またはヌクレオシド)を指す。ある態様において、「核酸」は、三つ以上の個々のヌクレオチド残基を含むオリゴヌクレオチド鎖をいう。本明細書中で使用される、用語「オリゴヌクレオチド」、および「ポリヌクレオチド」は、ヌクレオチドのポリマー（例えば少なくとも3つのヌクレオチドの鎖）を指すために交換可能に使用され得る。ある態様において、「核酸」は、RNAならびに一本鎖および/または二本鎖DNAを包含する。核酸は、例えば、ゲノム、転写物、mRNA、tRNA、rRNA、siRNA、snRNA、プラスミド、コスミド、染色体、染色分体、または他の天然に存在する核酸分子との関連において、天然に存在し得る。他方、核酸分子は、例えば非天然に存在する分子、組換えDNAもしくはRNA、人工染色体、操作されたゲノム、もしくはその断片、または合成DNA、RNA、DNA/RNAハイブリッド、または非天然に存在するヌクレオチドもしくはヌクレオシドを含む、非天然に存在する分子であり得る。さらに、用語「核酸」、「DNA」、「RNA」、および/または類似の用語は、核酸アナログ、例えばホスホジエステル骨格以外を有するアナログを含む。核酸は、天然源から精製される、組換え発現系を用いて産生され必要に応じて精製される、化学的に合成される、等が可能である。化学的に合成された分子の場合、核酸は、適切な場合には、例えば、化学的に修飾された塩基または糖、および骨格修飾を有するアナログなどのヌクレオシドアナログを含み得る。核酸配列は、特に示されない限り、5’～3’方向に示される。ある態様において、核酸は、天然ヌクレオシド(例えばアデノシン、チミジン、グアノシン、シチジン、ウリジン、デオキシアデノシン、デオキシチミジン、デオキシグアノシン、およびデオキシシチジン)；ヌクレオシド類似体(例えば2-アミノアデノシン、2-チオチミジン、イノシン、ピロロピリミジン、3-メチルアデノシン、5-メチルシチジン、2-アミノアデノシン、C5-ブロモウリジン、C5-フルオロウリジン、C5-ヨードウリジン、C5-プロピニル-ウリジン、C5-プロピニル-シチジン、C5-メチルシチジン、2-アミノアデノシン、7-デアザアデノシン、7-デアザグアノシン、8-オキソアデノシン、8-オキソグアニン、O(6)-メチルグアニン、および2-チオシチジン)；化学修飾塩基；生物学的に修飾された塩基(例えばメチル化塩基)；挿入塩基；修飾糖(例えば2’-フルオロリボース、リボース、2’-デオキシリボース、アラビノース、およびヘキソース)；および/または修飾リン酸基(例えばホスホロチオエートおよび5’-N-ホスホロアミダイト結合)であるか、またはそれらを含む。

「核酸プログラミング可能DNA結合タンパク質」あるいは「napDNAbp」という用語は、「ポリヌクレオチドプログラミング可能ヌクレオチド結合ドメイン」と互換的に使用され得、特異的な核酸配列にnapDNAbpをガイドするガイド核酸またはガイドポリヌクレオチド（例えばgRNA）のような核酸（例えばDNAまたはRNA）と会合するタンパク質を指す。ある態様において、ポリヌクレオチドによりプログラミング可能なヌクレオチド結合ドメインは、ポリヌクレオチドによりプログラミング可能なDNA結合ドメインである。ある態様において、ポリヌクレオチドによりプログラミング可能なヌクレオチド結合ドメインは、ポリヌクレオチドによりプログラミング可能なRNA結合ドメインである。ある態様において、ポリヌクレオチドによりプログラミング可能なヌクレオチド結合ドメインは、Cas9タンパク質である。Cas9タンパク質は、ガイドRNAに相補的な特異的DNA配列にCas9タンパク質を誘導するガイドRNAと結合することができる。ある態様において、napDNAbpは、Cas9ドメイン、例えばヌクレアーゼ活性Cas9、Cas9ニッカーゼ (nCas9) 、またはヌクレアーゼ不活性Cas9 (dCas9) である。核酸プログラミング可能DNA結合タンパク質の非限定的な例としては、Cas9（例えばdCas9およびnCas9）、Cas12a/Cpfl、Cas12b/C2cl、Cas12c/C2c3、Cas12d/CasY、Cas12e/CasX、Cas12g、Cas12h、およびCas12iが挙げられる。Cas酵素の非限定的な例としては、Cas1、Cas1B、Cas2、Cas3、Cas4、Cas5、Cas5d、Cas5t、Cas5h、Cas5a、Cas6、Cas7、Cas8、Cas8a、Cas8b、Cas8c、Cas9（Csn1またはCsx12とも呼ばれる）、Cas10、Cas10d、Cas12a/Cpfl、Cas12b/C2cl、Cas12c/C2c3、Cas12d/CasY、Cas12e/CasX、Cas12g、Cas12h、Cas12i、Csy1、Csy2、Csy3、Csy4、Cse1、Cse2、Cse3、Cse4、Cse5e、Csc1、Csc2、Csa5、Csn1、Csn2、Csm1、Csm2、Csm3、Csm4、Csm5、Csm6、Cmr1、Cmr3、Cmr4、Cmr5、Cmr6、Csb1、Csb2、Csb3、Csx17、Csx14、Csx10、Csx16、CsaX、Csx3、Csx1、Csx1S、Csx11、Csf1、Csf2、CsO、Csf4、Csd1、Csd2、Cst1、Cst2、Csh1、Csh2、Csa1、Csa2、Csa3、Csa4、Csa5、タイプII Casエフェクタータンパク質、タイプV Casエフェクタータンパク質、タイプVI Casエフェクタータンパク質、CARF、DinG、それらのホモログ、またはそれらの改変または操作されたバージョンが挙げられる。他の核酸プログラミング可能なDNA結合タンパク質も、本開示に具体的に列記されていないかもしれないが、本開示の範囲内である。例えばMakarova et al. “Classification and Nomenclature of CRISPR-Cas Systems: Where from Here?” CRISPR J. 2018 Oct;1:325-336. doi: 10.1089/crispr.2018.0033; Yan et al., “Functionally diverse type V CRISPR-Cas systems” Science. 2019 Jan 4;363(6422):88-91. doi: 10.1126/science.aav7271を参照（それぞれの全内容が参照により本明細書に組み込まれる）。

用語「核酸塩基」、「窒素塩基」、または「塩基」は、本明細書中で互換的に使用され、ヌクレオシドを形成する窒素含有生物学的化合物を指し、ヌクレオシドはヌクレオチドの成分である。塩基対を形成し、互いに積み重なる核酸塩基の能力は、直接、リボ核酸 (RNA) およびデオキシリボ核酸 (DNA) のような長鎖らせん構造をもたらす。アデニン (A) 、シトシン (C) 、グアニン (G) 、チミン(T) 、ウラシル (U) の5種類の核酸塩基は、一次塩基または標準塩基と呼ばれる。アデニンとグアニンはプリンに由来し、シトシン、ウラシル、チミンはピリミジンに由来する。DNAとRNAは修飾された他の (非一次) 塩基を含むこともある。非限定的な例示的修飾核酸塩基としては、ヒポキサンチン、キサンチン、7-メチルグアニン、5,6-ジヒドロウラシル、5-メチルシトシン (m5C) 、および5-ヒドロメチルシトシンが挙げられる。ヒポキサンチンとキサンチンは変異原の存在によって生成され得、どちらも脱アミノ化(アミン基のカルボニル基への置換)によって生成される。ヒポキサンチンはアデニンから修飾され得る。キサンチンはグアニンから修飾され得る。ウラシルはシトシンの脱アミノ化によって生じ得る。「ヌクレオシド」は核酸塩基と五炭糖(リボースまたはデオキシリボース)からなる。ヌクレオシドの例としては、アデノシン、グアノシン、ウリジン、シチジン、5-メチルウリジン (m5U) 、デオキシアデノシン、デオキシグアノシン、チミジン、デオキシウリジン、およびデオキシシチジンが挙げられる。修飾核酸塩基を有するヌクレオシドとしては、イノシン (I) 、キサントシン (X) 、7-メチルグアノシン (m7G) 、ジヒドロウリジン (D) 、5-メチルシチジン (m5C) 、プソイドウリジン (Ψ) 等が挙げられる。ヌクレオチドは、核酸塩基、五炭糖(リボースまたはデオキシリボース)、および少なくとも一つのリン酸基からなる。

「核酸プログラム可能なDNA結合タンパク質」または「napDNAbp」という用語は、napDNAbpを特定の核酸配列に導くガイド核酸などの核酸（例えば、DNAまたはRNA）と会合するタンパク質を指す。例えば、Cas12タンパク質は、Cas12タンパク質をガイドRNAに相補的な特異的DNA配列に導くガイドRNAと結合することができる。いくつかの実施形態において、napDNAbpは、Cas12ドメイン、例えば、ヌクレアーゼ活性Cas12ドメインである。napDNAbpsの例には、Cas12a/Cpfl、Cas12b/C2cl、Cas12c/C2c3、Cas12d/CasY、Cas12e/CasX、Cas12g、Cas12h、およびCas12iが含まれる。他のnapDNAbpも、本開示に具体的に列記されていないかもしれないが、本開示の範囲内である。例えばMakarova et al. “Classification and Nomenclature of CRISPR-Cas Systems: Where from Here?” CRISPR J. 2018 Oct;1:325-336. doi: 10.1089/crispr.2018.0033; Yan et al., “Functionally diverse type V CRISPR-Cas systems” Science. 2019 Jan 4;363(6422):88-91. doi: 10.1126/science.aav7271を参照（それぞれの全内容が参照により本明細書に組み込まれる）。

「核酸塩基編集ドメイン」または「核酸塩基編集タンパク質」という用語は、本明細書において使用される場合、シトシン(もしくはシチジン)からウラシル(もしくはウリジン)またはチミン(もしくはチミジン)への、およびアデニン(もしくはアデノシン)からヒポキサンチン(もしくはイノシン)への脱アミノ化、ならびに非鋳型ヌクレオチド付加および挿入のような、RNAまたはDNAにおける核酸塩基修飾を触媒することができるタンパク質または酵素を指す。ある態様において、核酸塩基編集ドメインは、デアミナーゼドメイン(例えば、アデニンデアミナーゼもしくはアデノシンデアミナーゼ；またはシチジンデアミナーゼもしくはシトシンデアミナーゼ)である。ある態様において、核酸塩基編集ドメインは、複数のデアミナーゼドメイン(例えば、アデニンデアミナーゼもしくはアデノシンデアミナーゼと、シチジンもしくはシトシンデアミナーゼ)である。ある態様において、核酸塩基編集ドメインは、天然に存在する核酸塩基編集ドメインであり得る。いくつかの実施形態において、核酸塩基編集ドメインは、天然に存在する核酸塩基編集ドメインから操作または進化された核酸塩基編集ドメインであり得る。核酸塩基編集ドメインは、細菌、ヒト、チンパンジー、ゴリラ、サル、ウシ、イヌ、ラット、またはマウスなどの任意の生物由来であり得る。例えば、核酸塩基編集タンパク質は、国際PCT出願番号PCT/2017/045381(WO 2018/027078)およびPCT/US2016/058344(WO 2017/070632)に記載されており、これらのそれぞれは、その全体が参照により本明細書に組み込まれる。Komor, A.C., et al., “Programmable editing of a target base in genomic DNA without double-stranded DNA cleavage” Nature 533, 420-424 (2016); Gaudelli, N.M., et al., “Programmable base editing of A・T to G・C in genomic DNA without DNA cleavage”Nature 551, 464-471 (2017); およびKomor, A.C., et al., “Improved base excision repair inhibition and bacteriophage Mu Gam protein yields C:G-to-T:A base editors with higher efficiency and product purity” Science Advances 3:eaao4774 (2017)も参照（その全内容は、参照により本明細書に組み込まれる）。

本明細書で使用される場合、「薬剤を取得する」におけるような「取得する」は、その薬剤を合成すること、購入すること、または他の方法で獲得することを含む。

本明細書で使用される「患者」または「対象」は、疾患または障害と診断されている、それらを生じるリスクがある、またはそれらを有するかもしくは生ずる疑いがある哺乳動物対象または個体を指す。ある態様において、用語「患者」は、疾患または障害を生ずる可能性が平均より高い哺乳動物対象を指す。例示的な患者は、ヒト、ヒト以外の霊長類、ネコ、イヌ、ブタ、ウシ、ネコ、ウマ、ラクダ、ラマ、ヤギ、ヒツジ、齧歯類(例えば、マウス、ウサギ、ラット、モルモット)および本明細書に開示される治療から利益を得ることができる他の哺乳動物であり得る。例示的なヒト患者は、男性および/または女性であり得る。

「それを必要とする患者」または「それを必要とする対象」は、本明細書では、疾患または障害と診断された、またはそれを有するリスクがある、またはそれを有することがあらかじめ決定された、またはそれを有することが疑われる患者として言及される。

「病原性変異」、「病原性バリアント」、「疾患原因変異」、「疾患原因バリアント」、「有害変異」または「素因となる変異」という用語は、特定の疾患または障害に対する個体の感受性または素因を増大させる遺伝子変化または突然変異を指す。ある態様において、病原性変異は、遺伝子によってコードされるタンパク質中の少なくとも1つの野生型アミノ酸が少なくとも1つの病原性アミノ酸によって置換されたものを含む。

用語「薬学的に許容される担体」は、液体または固体の充填剤、希釈剤、賦形剤、製造助剤（例えば潤滑剤、タルクマグネシウム、ステアリン酸カルシウムまたはステアリン酸亜鉛、あるいはステアリン酸）、または溶媒カプセル化材料などの、身体のある部位（例えば送達部位）から別の部位（例えば器官、組織または身体の一部）への化合物の運搬または輸送に関与する薬学的に許容される材料、組成物またはビヒクルを意味する。薬学的に許容される担体は、製剤の他の成分と適合し、対象の組織に有害でないという意味で「許容される」（例えば生理的適合性、無菌性、生理的pH等）。「賦形剤」、「担体」、「薬学的に許容される担体」、「ビヒクル」等のような用語は本明細書で互換的に使用される。

「医薬組成物」という用語は、医薬的使用のために製剤化された組成物を表し得る。

用語「タンパク質」、「ペプチド」、「ポリペプチド」、およびそれらの文法的等価物は、本明細書において交換可能に使用され、ペプチド (アミド) 結合によって互いに連結されたアミノ酸残基のポリマーを指す。この用語は、任意のサイズ、構造または機能のタンパク質、ペプチドまたはポリペプチドを指す。典型的には、タンパク質、ペプチド、またはポリペプチドは、少なくとも3アミノ酸長である。タンパク質、ペプチド、またはポリペプチドは、個々のタンパク質または一群のタンパク質を指すことができる。タンパク質、ペプチド、またはポリペプチド中の1以上のアミノ酸は、例えば炭水化物基、ヒドロキシル基、リン酸基、ファルネシル基、イソファルネシル基、脂肪酸基、結合のためのリンカー、官能化、または他の修飾などの化学的実体の添加によって、修飾され得る。タンパク質、ペプチド、またはポリペプチドはまた、単一分子であってもよく、または多分子複合体であってもよい。タンパク質、ペプチド、またはポリペプチドは、天然に存在するタンパク質またはペプチドの単なる断片であり得る。タンパク質、ペプチド、またはポリペプチドは、天然に存在するもの、組換え体、もしくは合成のもの、またはそれらの任意の組み合わせであり得る。本明細書中で使用される場合、用語「融合タンパク質」とは、少なくとも二つの異なるタンパク質由来のタンパク質ドメインを含むハイブリッドポリペプチドをいう。1つのタンパク質は、融合タンパク質のアミノ末端 (N末端) 部分またはカルボキシ末端 (C末端) タンパク質に位置することができ、かくして、それぞれ、アミノ末端融合タンパク質またはカルボキシ末端融合タンパク質を形成する。タンパク質は、異なるドメイン、例えば、核酸結合ドメイン(例えば、標的部位へのタンパク質の結合を誘導するCas9のgRNA結合ドメイン)および核酸切断ドメイン、あるいは核酸編集タンパク質の触媒ドメインを含み得る。ある態様において、タンパク質は、タンパク質性部分、例えば、核酸結合ドメインを構成するアミノ酸配列、および有機化合物、例えば、核酸切断剤として作用し得る化合物を含む。ある態様において、タンパク質は、核酸 (例えば、RNAまたはDNA) と複合体化されているか、または核酸と会合している。本明細書で提供される任意のタンパク質は、当技術分野で公知の任意の方法によって生産することができる。例えば、本明細書で提供されるタンパク質は、組換えタンパク質発現および精製を介して生産することができ、これは、ペプチドリンカーを含む融合タンパク質に特に適している。組換えタンパク質の発現および精製のための方法はよく知られており、Green and Sambrook, Molecular Cloning: A Laboratory Manual (4th ed., Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y. (2012))によって記載されているものを含み、その全内容は参照により本明細書に組み入れられる。

本明細書に開示されるポリペプチドおよびタンパク質(機能的部分およびその機能的バリアントを含む)は、一つ以上の天然に存在するアミノ酸の代わりに合成アミノ酸を含むことができる。そのような合成アミノ酸は当該分野で公知であり、例えば、アミノシクロヘキサンカルボン酸、ノルロイシン、α-アミノn-デカン酸、ホモセリン、S-アセチルアミノメチル-システイン、trans-3-およびtrans-4-ヒドロキシプロリン、4-アミノフェニルアラニン、4-ニトロフェニルアラニン、4-クロロフェニルアラニン、4-カルボキシフェニルアラニン、β-フェニルセリンβ-ヒドロキシフェニルアラニン、フェニルグリシン、α-ナフチルアラニン、シクロヘキシルアラニン、シクロヘキシルグリシン、インドリン-2-カルボン酸、1,2,3,4-テトラヒドロイソキノリン-3-カルボン酸、アミノマロン酸、アミノマロン酸モノアミド、N'-ベンジル-N'-メチルリジン、N',N'-ジベンジル-リジン、6-ヒドロキシリジン、オルニチン、α-アミノシクロペンタンカルボン酸、アミノシクロヘキサンカルボン酸、アミノシクロヘキサンカルボン酸、α-アミノシクロヘプタンカルボン酸、α-(2-アミノ-2-ノルボルナン)-カルボン酸、α,γ-ジアミノ酪酸、α,β-ジアミノプロピオン酸、ホモフェニルアラニン、およびα-tert-ブチルグリシンが挙げられる。ポリペプチドおよびタンパク質は、ポリペプチド構築物の1つ以上のアミノ酸の翻訳後修飾と結合することができる。翻訳後修飾の非限定的な例としては、リン酸化、アセチル化およびホルミル化を含むアシル化、グリコシル化(N-リンクおよびO-リンクを含む)、アミド化、ヒドロキシル化、メチル化およびエチル化を含むアルキル化、ユビキチン化、ピロリドンカルボン酸の添加、ジスルフィド架橋の形成、硫酸化、ミリストイル化、パルミトイル化、イソプレニル化、ファルネシル化、ゲラニル化、グリピエーション、リポイル化およびヨード化が挙げられる。

「ポリヌクレオチドプログラム可能なヌクレオチド結合ドメイン」または「核酸プログラム可能なDNA結合タンパク質（napDNAbp）」という用語は、ポリヌクレオチドプログラム可能なヌクレオチド結合ドメインを特定の核酸配列に導くガイドポリヌクレオチド（例えば、ガイドRNA）などの核酸（例えば、DNAまたはRNA）と結合するタンパク質を指す。いくつかの実施形態において、ポリヌクレオチドプログラム可能なヌクレオチド結合ドメインは、ポリヌクレオチドプログラム可能なDNA結合ドメインである。いくつかの実施形態において、ポリヌクレオチドプログラム可能なヌクレオチド結合ドメインは、ポリヌクレオチドプログラム可能なRNA結合ドメインである。いくつかの実施形態において、ポリヌクレオチドプログラム可能なヌクレオチド結合ドメインは、Cas12タンパク質である。

タンパク質または核酸に関連して本明細書中で使用される用語「組み換え体」とは、自然界には存在しないが、人間の工学の産物であるタンパク質または核酸を指す。例えば、いくつかの実施形態において、組換えタンパク質または核酸分子は、任意の天然に存在する配列と比較して、少なくとも1つ、少なくとも2つ、少なくとも3つ、少なくとも4つ、少なくとも5つ、少なくとも6つ、または少なくとも7つの変異を含むアミノ酸またはヌクレオチド配列を含む。

「減少する」とは、少なくとも10%、25%、50%、75%、または100%の負の変化を意味する。

「参照（reference）」は、基準または対照の条件を意味する。1つの実施形態において、参照は野生型または健常な細胞である。他の実施形態において、限定されないが、参照は、試験条件に晒されていないか、またはプラセボもしくは通常の食塩水、培地、緩衝液、および/または、目的のポリヌクレオチドを保持しない対照ベクターに晒される、非処理細胞である。

「参照配列」は、配列比較の基礎として使用される定義済み配列である。参照配列は、特定の配列のサブセット又は全体であり得る；例えば、完全長のcDNAもしくは遺伝子配列のセグメント、または完全なcDNAまたは遺伝子配列。ポリペプチドについては、参照ポリペプチド配列の長さは、一般に、少なくとも約16アミノ酸、少なくとも約20アミノ酸、少なくとも約25アミノ酸、約35アミノ酸、約50アミノ酸、または約100アミノ酸である。核酸については、参照核酸配列の長さは、一般に、少なくとも約50ヌクレオチド、少なくとも約60ヌクレオチド、少なくとも約75ヌクレオチド、約100ヌクレオチドまたは約300ヌクレオチドまたはそれらの周辺もしくはそれらの間の任意の整数である。いくつかの実施形態において、参照配列は、目的タンパク質の野生型配列である。他の実施形態では、参照配列は、野生型タンパク質をコードするポリヌクレオチド配列である。

用語「RNAプログラム可能なヌクレアーゼ」および「RNA誘導ヌクレアーゼ」は、切断の標的ではない一つ以上のRNAをとともに使用される(例えば、それに結合または付随する)。ある態様において、RNAプログラム可能ヌクレアーゼは、RNAと複合体である場合、ヌクレアーゼ:RNA複合体と称され得る。典型的には、結合したRNAはガイドRNA (gRNA) と呼ばれる。gRNAは2個以上のRNAの複合体として存在することもあれば、1個のRNA分子として存在することもある。単一のRNA分子として存在するgRNAは、単一ガイドRNA（sgRNA）と呼ばれることがあるが、「gRNA」は、単一の分子として、または2つ以上の分子の複合体として存在するガイドRNAを指すために互換的に使用される。典型的には、単一のRNA種として存在するgRNAは、(1) 標的核酸と相同性を共有するドメイン（例えば、標的へのCas9複合体の結合を指示する）；および(2) Cas9タンパク質に結合するドメインという二つのドメインを含む。ある態様において、ドメイン (2) は、tracrRNAとして知られる配列に対応し、ステム-ループ構造を含む。例えば、いくつかの態様において、ドメイン (2) は、Jinek et al., Science 337:816-821(2012)（その全内容が参照により本明細書に組み入れられる）に提供されるようなtracrRNAと同一または相同である。gRNA (例えばドメイン2を含むもの)の他の例は、2013年9月6日出願された「Switchable Cas9 Nucleases and Uses Thereof」と題される米国仮特許出願U.S.S.N. 61/874,682および2013年9月6日出願された「Delivery System For Functional Nucleases」と題される米国仮特許出願U.S.S.N. 61/874,746に見出され得、それら各々の全内容が参照により本明細書に組み入れられる。いくつかの実施形態において、gRNAは、ドメイン (1) および (2) の二つ以上を含み、「伸長されたgRNA」と称され得る。例えば、伸長されたgRNAは、本明細書に記載されるように、例えば二つ以上のCas9タンパク質と結合し、二つ以上の異なる領域における標的核酸と結合する。gRNAは、標的部位を相補するヌクレオチド配列を含み、これが標的部位へのヌクレアーゼ/RNA複合体の結合を媒介し、ヌクレアーゼ：RNA複合体の配列特異性を提供する。

ある態様において、RNAプログラム可能ヌクレアーゼは、(CRISPR関連システム) Cas9エンドヌクレアーゼ、例えば、Streptococcus pyogenes由来のCas9 (Casnl) である（例えば、"Complete genome sequence of an Ml strain of Streptococcus pyogenes." Ferretti J.J. et al., Proc. Natl. Acad. Sci. U.S.A. 98:4658-4663(2001); "CRISPR RNA maturation by trans-encoded small RNA and host factor RNase III." Deltcheva E. et al., Nature 471:602-607(2011)参照）。

RNAプログラム可能なヌクレアーゼ(例:Cas9)は、DNA切断部位を標的とするためにRNA:DNAハイブリダイゼーションを使用するので、これらのタンパク質は、原理的に、ガイドRNAによって指定されるあらゆる配列を標的とすることができる。部位特異的切断のためにCas9のようなRNAプログラム可能なヌクレアーゼを使用する方法(例えばゲノムを改変するために)は、当該技術分野において公知である(例えば、Cong, L. et al., Multiplex genome engineering using CRISPR/Cas systems. Science 339, 819-823 (2013); Mali, P. et al., RNA-guided human genome engineering via Cas9. Science 339, 823-826 (2013); Hwang, W.Y. et al., Efficient genome editing in zebrafish using a CRISPR-Cas system. Nature biotechnology 31, 227-229 (2013); Jinek, M. et al., RNA-programmed genome editing in human cells. eLife 2, e00471 (2013); Dicarlo, J.E. et al., Genome engineering in Saccharomyces cerevisiae using CRISPR-Cas systems. Nucleic acids research (2013); Jiang, W. et al., RNA-guided editing of bacterial genomes using CRISPR-Cas systems. Nature biotechnology 31, 233-239 (2013)を参照。これらの各々の全内容は参照により本明細書に組み入れられる)。

用語「一塩基多型 (SNP)」は、ゲノム中の特定の位置で起こる単一ヌクレオチドの変異であり、ここで、各変異は集団内で認識できるある程度(例>1%)まで存在する。たとえば、ヒトゲノムの特定の塩基位置では、ほとんどの個体でCヌクレオチドが出現しうるが、少数の個体ではその位置がAで占められている。これは、この特定の位置にSNPがあり、CまたはAという2つのヌクレオチドのバリエーションがこの位置のアリルであることを意味する。SNPは疾患に対する感受性の差の根底にある。病気の重症度や治療に対する体の反応も、遺伝的バリエーションの表れである。SNPは、遺伝子のコード領域、遺伝子の非コード領域、または遺伝子間領域(遺伝子と遺伝子の間の領域)に存在しうる。ある態様において、コード配列内のSNPは、遺伝子コードの縮重のために、産生されるタンパク質のアミノ酸配列を必ずしも変化させない。コード領域のSNPには、同義SNPと非同義SNPの2種類がある。同義SNPはタンパク質配列に影響しないが、非同義SNPはタンパク質のアミノ酸配列を変化させる。非同義SNPにはミスセンスとナンセンスの2種類がある。タンパク質をコードする領域にないSNPは、遺伝子のスプライシング、転写因子の結合、メッセンジャーRNAの分解、または非コードRNAの配列に影響を与えることがある。この種のSNPによって影響を受ける遺伝子発現はeSNP (発現SNP)と呼ばれ、遺伝子の上流または下流にあり得る。一塩基バリアント (SNV) は、頻度に制限のない一塩基のバリエーションであり、体細胞で生じ得る。体細胞一塩基バリエーションは一塩基改変とも呼ばれ得る。

「特異的に結合する」とは、本発明のポリペプチドおよび/または核酸分子を認識および結合するが、試料（例えば生物学的試料）中の他の分子を実質的に認識および結合しない核酸分子、ポリペプチド、もしくはそれらの複合体（例えば、核酸プログラミング可能DNA結合ドメインおよびガイド核酸）、化合物、または分子を意味する。

本発明の方法において有用な核酸分子は、本発明のポリペプチドまたはその断片をコードする任意の核酸分子を含む。そのような核酸分子は、内因性核酸配列と100%同一である必要はないが、典型的には実質的同一性を示す。内因性配列に対して「実質的同一性」を有するポリヌクレオチドは、典型的には、二本鎖核酸分子の少なくとも一つの鎖とハイブリダイズすることができる。本発明の方法において有用な核酸分子は、本発明のポリペプチドまたはその断片をコードする任意の核酸分子を含む。そのような核酸分子は、内因性核酸配列と100%同一である必要はないが、典型的には実質的同一性を示す。内因性配列に対して「実質的同一性」を有するポリヌクレオチドは、典型的には、二本鎖核酸分子の少なくとも一つの鎖とハイブリダイズすることができる。「ハイブリダイズする」とは、種々のストリンジェンシー条件下で相補的ポリヌクレオチド配列(例えば、本明細書に記載の遺伝子)の間、またはその一部の間に二本鎖分子を形成する対をなすことを意味する。(例えばWahl, G. M. and S. L. Berger (1987) Methods Enzymol. 152:399; Kimmel, A. R. (1987) Methods Enzymol. 152:507参照)。

例えば、ストリンジェントな塩濃度は、通常、約750 mM未満 NaClおよび75 mMクエン酸三ナトリウム、好ましくは約500 mM未満 NaClおよび50 mMクエン酸三ナトリウム、より好ましくは約250 mM未満 NaClおよび25 mMクエン酸三ナトリウムである。低ストリンジェンシーハイブリダイゼーションは、有機溶媒、例えばホルムアミドの非存在下で得ることができ、一方、高ストリンジェンシーハイブリダイゼーションは、少なくとも約35%ホルムアミド、より好ましくは少なくとも約50%ホルムアミドの存在下で得ることができる。ストリンジェントな温度条件は、通常、少なくとも約30℃、より好ましくは少なくとも約37℃、最も好ましくは少なくとも約42℃の温度を含むであろう。ハイブリダイゼーション時間、界面活性剤 (例えば、ドデシル硫酸ナトリウム (SDS) ) の濃度、および担体DNAの含入または排除などの様々な追加のパラメーターは、当業者によく知られている。必要に応じてこれら様々な条件を組み合わせることによって、様々なレベルのストリンジェンシーが達成される。一実施形態では、ハイブリダイゼーションは、30℃で、750 mM NaCl、75 mMクエン酸三ナトリウムおよび1% SDS中で起こる。別の実施形態では、ハイブリダイゼーションは、37℃で、500 mM NaCl、50 mMクエン酸三ナトリウム、1% SDS、35%ホルムアミドおよび100μg/ml変性サケ精子DNA（ssDNA）中で起こる。別の実施形態において、ハイブリダイゼーションは、42℃において、250 mM NaCl、25 mMクエン酸三ナトリウム、1% SDS、50%ホルムアミドおよび200μg/ml ssDNA中で起こる。これらの条件の有用なバリエーションは、当業者には容易に明らかになるであろう。

ほとんどの用途では、ハイブリダイゼーションに続く洗浄工程もまた、ストリンジェンシーが異なる。洗浄ストリンジェンシー条件は、塩濃度および温度によって定義することができる。上記のように、洗浄ストリンジェンシーは、塩濃度を低下させるか、または温度を上昇させることによって増加させることができる。例えば、洗浄工程のためのストリンジェントな塩濃度は、好ましくは約30 mM未満NaClおよび3 mMクエン酸三ナトリウムであり、最も好ましくは約15 mM未満 NaClおよび1.5 mMクエン酸三ナトリウムである。洗浄工程のためのストリンジェントな温度条件は、通常、少なくとも約25℃、より好ましくは少なくとも約42℃、さらにより好ましくは少なくとも約68℃の温度を含む。一実施形態において、洗浄工程は、25℃で、30 mM NaCl、3 mMクエン酸三ナトリウム、および0.1% SDS中で行われる。より好ましい実施形態において、洗浄工程は、42℃で、15 mM NaCl、1.5 mMクエン酸三ナトリウム、および0.1% SDS中で行われる。より好ましい実施形態において、洗浄工程は、68℃で、15 mM NaCl、1.5 mMクエン酸三ナトリウム、および0.1% SDS中で行われる。これらの条件のさらなるバリエーションは、当業者には容易に明らかになるであろう。ハイブリダイゼーション技術は、当業者によくしられており、例えば、Benton and Davis (Science 196:180, 1977); Grunstein and Hogness (Proc. Natl. Acad. Sci., USA 72:3961, 1975); Ausubel et al. (Current Protocols in Molecular Biology, Wiley Interscience, New York, 2001); Berger and Kimmel (Guide to Molecular Cloning Techniques, 1987, Academic Press, New York); および Sambrook et al., Molecular Cloning: A Laboratory Manual, Cold Spring Harbor Laboratory Press, New Yorkに記述されている。

「分割（split）」とは、2つ以上の断片に分割されることを意味する。

「分割されたCas9タンパク質」あるいは「分割Cas9」とは、二つの別個のヌクレオチド配列によってコードされるN末端断片およびC末端断片として提供されるCas9タンパク質をいう。Cas9タンパク質のN末端部分およびC末端部分に対応するポリペプチドは、スプライスされて「再構成」Cas9タンパク質を形成することができる。特定の実施形態において、Cas9タンパク質は、例えば、Nishimasu et al., Cell, Volume 156, Issue 5, pp. 935-949, 2014に記載されるように、またはJiang et al. (2016) Science 351: 867-871. PDB file: 5F9Rに記載されるように（それぞれ参照により本明細書に組み込まれる）、タンパク質の非秩序的な領域内で2つの断片に分割される。いくつかの実施形態において、タンパク質は、SpCas9のおよそアミノ酸A292-G364、F445-K483、もしくはE565-T637の間の領域内の任意のC、T、A、もしくはSにおいて、または任意の他のCas9、Cas9バリアント（例えばnCas9、dCas9）、もしくは他のnapDNAbpにおける対応位置において、二つの断片に分割される。ある態様において、タンパク質は、SpCas9 T310、T313、A456、S469、またはC574において2つの断片に分割される。いくつかの実施形態において、タンパク質を2つの断片に分割するプロセスは、タンパク質を「分割（スプリッティング）する」と称される。

他の実施形態において、Cas9タンパク質のN末端部分は、S. pyogenes Cas9野生型（SpCas9）（NCBI参照配列：NC_002737.2、Uniprot参照配列：Q99ZW2）のアミノ酸1～573または1～637を含み、Cas9タンパク質のC末端部分は、SpCas9野生型のアミノ酸574～1368または638～1368の部分を含む。

分割されたCas9のC末端部分は、分割されたCas9のN末端部分と連結されて完全なCas9タンパク質を形成することができる。いくつかの実施形態において、Cas9タンパク質のC末端部分は、Cas9タンパク質のN末端部分が終わるところから始まる。このように、いくつかの実施態様において、分割Cas9のC末端部分は、spCas9のアミノ酸 (551-651) -1368の部分を含む。「(551-651) -1368」とは、アミノ酸551～651（両端を含む）のあいだのアミノ酸から始まり、アミノ酸1368で終わることを意味する。例えば、分割Cas9のC末端部分は、spCas9のアミノ酸551-1368、552-1368、553-1368、554-1368、555-1368、556-1368、557-1368、558-1368、559-1368、560-1368、561-1368、562-1368、563-1368、564-1368、565-1368、566-1368、567-1368、568-1368、569-1368、570-1368、571-1368、572-1368、573-1368、574-1368、575-1368、576-1368、577-1368、578-1368、579-1368、580-1368、581-1368、582-1368、583-1368、584-1368、585-1368、586-1368、587-1368、588-1368、589-1368、590-1368、591-1368、592-1368、593-1368、594-1368、595-1368、596-1368、597-1368、598-1368、599-1368、600-1368、601-1368、602-1368、603-1368、604-1368、605-1368、606-1368、607-1368、608-1368、609-1368、610-1368、611-1368、612-1368、613-1368、614-1368、615-1368、616-1368、617-1368、618-1368、619-1368、620-1368、621-1368、622-1368、623-1368、624-1368、625-1368、626-1368、627-1368、628-1368、629-1368、630-1368、631-1368、632-1368、633-1368、634-1368、635-1368、636-1368、637-1368、638-1368、639-1368、640-1368、641-1368、642-1368、643-1368、644-1368、645-1368、646-1368、647-1368、648-1368、649-1368、650-1368、または651-1368のいずれか１つの部分を含み得る。いくつかの実施形態において、分割されたCas9タンパク質のC末端部分は、SpCas9のアミノ酸574-1368または638-1368の部分を含む。

「対象」とは、哺乳動物を意味し、ヒト、または、ウシ、ウマ、イヌ、ヒツジ、もしくはネコのような非ヒト哺乳動物を含むが、これらに限定されない。対象には、家畜、労働力を生み食料のような商品を提供するために飼育される飼育動物（ウシ、ヤギ、ニワトリ、ウマ、ブタ、ウサギ、およびヒツジを含むがこれらに限定されない）が含まれる。

「実質的に同一である」とは、参照アミノ酸配列(例えば、本明細書に記載のアミノ酸配列のいずれか1つ)または核酸配列(例えば、本明細書に記載の核酸配列のいずれか1つ)に対して少なくとも50%の同一性を示すポリペプチドまたは核酸分子を意味する。一実施形態では、そのような配列は、比較のために使用される配列とアミノ酸レベルまたは核酸において少なくとも60%、80%もしくは85%、90%、95%または99%までもの同一性を有する。

配列同一性は、典型的には、配列解析ソフトウェア(例えば、Genetics Computer Group, University of Wisconsin Biotechnology Center, 1710 University Avenue, Madison, Wis. 53705のSequence Analysis Software Package、BLAST、BESTFIT、GAP、またはPILEUP/PRETTYBOXプログラム)を用いて測定される。そのようなソフトウェアは、種々の置換、欠失、および/または他の改変に相同性の程度を割り当てることによって、同一または類似の配列をマッチさせる。保存的置換は、典型的には、以下の群内の置換を含む:グリシン、アラニン；バリン、イソロイシン、ロイシン；アスパラギン酸、グルタミン酸、アスパラギン、グルタミン；セリン、トレオニン；リジン、アルギニン；フェニルアラニン、チロシン。同一性の程度を決定するための例示的なアプローチにおいて、BLASTプログラムを使用することができ、e ^-3とe ^-100の間の確率スコアが密接に関連した配列を示す。COBALTは、たとえば次のパラメータとともに使用される：
a) アラインメントパラメータ：Gap penalties-11,-1 and End-Gap penalties-5,-1,
b) CDDパラメータ：Use RPS BLAST on; Blast E-value 0.003; Find Conserved columns and Recompute on
c) クエリー・クラスタリング・パラメータ：Use query clusters on; Word Size 4; Max cluster distance 0.8; Alphabet Regular。
EMBOSS Needleは、たとえば次のパラメータで使用される。
a) Matrix: BLOSUM62;
b) GAP OPEN: 10;
c) GAP EXTEND: 0.5;
d) OUTPUT FORMAT: pair;
e) END GAP PENALTY: false;
f) END GAP OPEN: 10; and
g) END GAP EXTEND: 0.5.

用語「標的部位」とは、核酸分子内の配列であって、核酸塩基エディターによって改変される配列をいう。一実施形態において、標的部位は、デアミナーゼ（例えばシチジンまたはアデニンデアミナーゼ）またはそれを含む融合タンパク質によって脱アミノ化される。

本明細書中で使用される、用語「治療する(treat)」、「治療する(treating)」、「治療(treatment)」などは、障害および/またはそれに関連する症状を軽減もしくは改善すること、または所望の薬理学的および/または生理学的効果を得ることを指す。障害または状態を治療することは、関連する障害、状態または症状を完全に除去することを必要としないことが理解されるであろう（完全な除去が除外されるわけでもない）。いくつかの態様において、効果は、治療的であり、すなわち、限定されるものではないが、効果は、疾患および/またはそれに起因する有害症状を部分的または完全に低減、減少、除去、軽減、緩和、強度低下、または治癒する。ある態様において、効果は予防的であり、すなわち効果は、疾患または状態の発生または再発を保護または予防する。この目的のために、本開示の方法は、本明細書に記載されるような治療的に有効な量の組成物を投与することを含む。

「ウラシルグリコシラーゼ阻害因子」、あるいは「UGI」とは、ウラシル除去修復系を阻害する因子を意味する。1つの実施形態において、該因子は、宿主ウラシル-DNAグリコシラーゼに結合してDNAからのウラシル残基の除去を妨げるタンパク質またはその断片である。一実施形態において、UGIは、ウラシル-DNAグリコシラーゼ塩基除去修復酵素を阻害することができるタンパク質、その断片、またはドメインである。いくつかの態様において、UGIドメインは、野生型UGIまたはその改変バージョンを含む。いくつかの実施形態において、UGIドメインは、下記に提示される例示的アミノ酸配列の断片を含む。いくつかの実施形態において、UGI断片は、下記に提供される例示的UGI配列の少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または100%を含むアミノ酸配列を含む。いくつかの実施形態において、UGIは、以下に記載されるように、例示的UGIアミノ酸配列またはその断片に対して相同的なアミノ酸配列を含む。いくつかの実施態様において、UGIまたはその一部は、以下に記載されるように、野生型UGIもしくUGI配列またはその一部に対して少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、少なくとも99.5%、少なくとも99.9%または100%の同一性を有する。例示的なUGIは、以下のアミノ酸配列を含む：
>splP14739IUNGI_BPPB2 Uracil-DNA glycosylase inhibitor
MTNLSDIIEKETGKQLVIQESILMLPEEVEEVIGNKPESDILVHTAYDESTDENVMLLTSD APEYKPWALVIQDSNGENKIKML.

「ベクター」という用語は、核酸配列を細胞に導入して形質転換された細胞をもたらす手段を指す。ベクターには、プラスミド、トランスポゾン、ファージ、ウイルス、リポソーム、およびエピソームが含まれる。「発現ベクター」は、レシピエント細胞で発現されるヌクレオチド配列を含む核酸配列である。発現ベクターは、開始配列、停止配列、エンハンサー配列、プロモーター配列、および分泌配列などの、導入された配列の発現を増進および／または促進するための追加の核酸配列を含み得る。

本明細書で提供される組成物または方法は、本明細書で提供される他の組成物および方法のいずれか１つまたは複数と組み合わせることができる。

DNA編集は、病原性突然変異を遺伝子レベルで修正することによって病状を修正するための実行可能な手段として浮上してきた。最近まで、すべてのDNA編集プラットフォームは、特定のゲノム部位でDNA二本鎖切断（DSB）を誘導し内因性DNA修復経路に依存して半確率的態様で産物帰結を決定することにより機能し、遺伝的産物の複雑な集団をもたらしていた。相同性誘導型修復（HDR）経路を介して正確でユーザー定義された修復結果を達成することはできるが、多くの課題により、治療に関連する細胞型でのHDRを使用した高効率修復が妨げられている。実際にはこの経路は、競合する、エラーが発生しやすい非相同末端結合経路に比べて非効率的である。さらに、HDRは細胞周期のG1期とS期とに厳密に制限されており、有糸分裂後の細胞におけるDSBの正確な修復を妨げている。その結果、これらの集団においてユーザー定義されかつプログラム可能な方法で高効率でゲノム配列を改変することは困難または不可能であることが証明されている。

スーパーオキシドジスムターゼ1（SOD1）は、SOD1遺伝子によってコードされる酵素タンパク質である。SOD1酵素は体中の細胞に豊富に含まれています。SOD1酵素は銅（Cu）と亜鉛（Zn）に結合して、スーパーオキシドラジカルまたは活性酸素種（ROS）と呼ばれる有毒な荷電酸素分子を分解する。これらは通常の細胞プロセスの副産物であり、細胞の損傷、形質転換、あるいは死を避けるために定期的に分解する必要がある。SOD1遺伝子の少なくとも200の変異が、進行性の筋力低下、筋肉量の減少、および運動制御不能を特徴とする状態である筋萎縮性側索硬化症（ALS）を引き起こすことが見出されてきた。これらの変異のほとんどは、スーパーオキシドジスムターゼ酵素の1つのアミノ酸を変化させる。世界中で、SOD1遺伝子の突然変異が家族性ALSの15から20パーセントを引き起こす。SOD1遺伝子変異によって引き起こされるALSを有する全アメリカ人の約半数は、酵素の5位のアミノ酸残基アラニン（A）をアミノ酸残基バリン（V）に置き換える特定の変異、すなわちAla5ValあるいはA5Vを持っている。A5V突然変異によって引き起こされるALSは、一般に、他の遺伝子突然変異によって引き起こされるALSと比較して平均余命が短くなる。

ALSは、筋肉の動きを制御する神経細胞（運動ニューロン）の死によって引き起こされる。運動ニューロンがSOD1遺伝子変異に特に敏感である理由は現在不明であるが、これらのタイプのニューロンのサイズの大きさが、正常なSOD1酵素機能の破壊に対してより敏感であることに寄与する可能性がある。改変されたSOD1酵素が運動ニューロンの死を引き起こし得るいくつかの可能な態様としては、以下のことが挙げられる：（i）細胞、特にリソソームおよび/またはプロテオソームにおける有害なスーパーオキシドラジカルの増加；（ii）他の種類の有毒なラジカルの生成の増加と細胞死の増加；および/または（iii）細胞にとって毒性となり得る、ミスフォールドされたスーパーオキシドジスムターゼの凝集塊（凝集体）の蓄積。

「SOD1タンパク質」とは、NCBIアクセッション番号NP_000445に対して少なくとも約95％のアミノ酸配列同一性を有するポリペプチドまたはその断片を意味する。例示的なヒトSOD1アミノ酸配列を以下に提供する。
1 MATKAVCVLK GDGPVQGIIN FEQKESNGPV KVWGSIKGLT EGLHGFHVHE FGDNTAGCTS
61 AGPHFNPLSR KHGGPKDEER HVGDLGNVTA DKDGVADVSI EDSVISLSGD HCIIGRTLVV
121 HEKADDLGKG GNEESTKTGN AGSRLACGVI GIAQ

「SOD1ポリヌクレオチド」とは、SOD1タンパク質またはその断片をコードする核酸分子を意味する。NCBIアクセッション番号NC_000021.9:31659622-31668931（ホモサピエンス染色体21、GRCh38.p13一次アセンブリ）で入手可能な例示的なヒトSOD1ポリヌクレオチドのゲノム配列を以下に提供する（配列番号3）。

上記のSOD1ゲノム核酸配列では、SOD1遺伝子のエクソン3の5’末端にある「ag」スプライスアクセプター部位は太字で示されている。SOD1遺伝子のエクソン3の核酸配列は、上記のSOD1ゲノム配列においてイタリック体および二重下線で示されている。

NCBI参照配列：NM_000454.4で入手可能な例示的なヒトSOD1ポリヌクレオチドのmRNA/cDNA配列を以下に提供する：
gcgtcgtag tctcctgcag cgtctggggt ttccgttgca gtcctcggaa
ccaggacctc ggcgtggcct agcgagttat ggcgacgaag gccgtgtgcg tgctgaaggg
cgacggccca gtgcagggca tcatcaattt cgagcagaag gaaagtaatg gaccagtgaa
ggtgtgggga agcattaaag gactgactga aggcctgcat ggattccatg ttcatgagtt
tggagataat acagcaggct gtaccagtgc aggtcctcac tttaatcctc tatccagaaa
acacggtggg ccaaaggatg aagagaggca tgttggagac ttgggcaatg tgactgctga
caaagatggt gtggccgatg tgtctattga agattctgtg atctcactct caggagacca
ttgcatcatt ggccgcacac tggtggtcca tgaaaaagca gatgacttgg gcaaaggtgg
aaatgaagaa agtacaaaga caggaaacgc tggaagtcgt ttggcttgtg gtgtaattgg
gatcgcccaa taaacattcc cttggatgta gtctgaggcc ccttaactca tctgttatcc
tgctagctgt agaaatgtat cctgataaac attaaacact gtaatcttaa aagtgtaatt
gtgtgacttt ttcagagttg ctttaaagta cctgtagtga gaaactgatt tatgatcact
tggaagattt gtatagtttt ataaaactca gttaaaatgt ctgtttcaat gacctgtatt
ttgccagact taaatcacag atgggtatta aacttgtcag aatttctttg tcattcaagc
ctgtgaataa aaaccctgta tggcacttat tatgaggcta ttaaaagaat ccaaattcaa
actaaaaaaa aaaaaaaaaa a

「アンドロゲン受容体（AR）ポリヌクレオチド」とは、アンドロゲン受容体ポリペプチドをコードする任意のポリヌクレオチドを意味する。例示的なアンドロゲン受容体ポリヌクレオチドを以下に提供する（配列番号４）：
Homo sapiensアンドロゲン受容体（AR）、転写産物バリアント1、mRNA（NM_000044.6）
ATGGAAGTGCAGTTAGGGCTGGGAAGGGTCTACCCTCGGCCGCCGTCCAAGACCTACCGAGGAGCTTTCCAGAATCTGTTCCAGAGCGTGCGCGAAGTGATCCAGAACCCGGGCCCCAGGCACCCAGAGGCCGCGAGCGCAGCACCTCCCGGCGCCAGTTTGCTGCTGCTGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAAGAGACTAGCCCCAGGCAGCAGCAGCAGCAGCAGGGTGAGGATGGTTCTCCCCAAGCCCATCGTAGAGGCCCCACAGGCTACCTGGTCCTGGATGAGGAACAGCAACCTTCACAGCCGCAGTCGGCCCTGGAGTGCCACCCCGAGAGAGGTTGCGTCCCAGAGCCTGGAGCCGCCGTGGCCGCCAGCAAGGGGCTGCCGCAGCAGCTGCCAGCACCTCCGGACGAGGATGACTCAGCTGCCCCATCCACGTTGTCCCTGCTGGGCCCCACTTTCCCCGGCTTAAGCAGCTGCTCCGCTGACCTTAAAGACATCCTGAGCGAGGCCAGCACCATGCAACTCCTTCAGCAACAGCAGCAGGAAGCAGTATCCGAAGGCAGCAGCAGCGGGAGAGCGAGGGAGGCCTCGGGGGCTCCCACTTCCTCCAAGGACAATTACTTAGGGGGCACTTCGACCATTTCTGACAACGCCAAGGAGTTGTGTAAGGCAGTGTCGGTGTCCATGGGCCTGGGTGTGGAGGCGTTGGAGCATCTGAGTCCAGGGGAACAGCTTCGGGGGGATTGCATGTACGCCCCACTTTTGGGAGTTCCACCCGCTGTGCGTCCCACTCCTTGTGCCCCATTGGCCGAATGCAAAGGTTCTCTGCTAGACGACAGCGCAGGCAAGAGCACTGAAGATACTGCTGAGTATTCCCCTTTCAAGGGAGGTTACACCAAAGGGCTAGAAGGCGAGAGCCTAGGCTGCTCTGGCAGCGCTGCAGCAGGGAGCTCCGGGACACTTGAACTGCCGTCTACCCTGTCTCTCTACAAGTCCGGAGCACTGGACGAGGCAGCTGCGTACCAGAGTCGCGACTACTACAACTTTCCACTGGCTCTGGCCGGACCGCCGCCCCCTCCGCCGCCTCCCCATCCCCACGCTCGCATCAAGCTGGAGAACCCGCTGGACTACGGCAGCGCCTGGGCGGCTGCGGCGGCGCAGTGCCGCTATGGGGACCTGGCGAGCCTGCATGGCGCGGGTGCAGCGGGACCCGGTTCTGGGTCACCCTCAGCCGCCGCTTCCTCATCCTGGCACACTCTCTTCACAGCCGAAGAAGGCCAGTTGTATGGACCGTGTGGTGGTGGTGGGGGTGGTGGCGGCGGCGGCGGCGGCGGCGGCGGCGGCGGCGGCGGCGGCGGCGGCGGCGAGGCGGGAGCTGTAGCCCCCTACGGCTACACTCGGCCCCCTCAGGGGCTGGCGGGCCAGGAAAGCGACTTCACCGCACCTGATGTGTGGTACCCTGGCGGCATGGTGAGCAGAGTGCCCTATCCCAGTCCCACTTGTGTCAAAAGCGAAATGGGCCCCTGGATGGATAGCTACTCCGGACCTTACGGGGACATGCGTTTGGAGACTGCCAGGGACCATGTTTTGCCCATTGACTATTACTTTCCACCCCAGAAGACCTGCCTGATCTGTGGAGATGAAGCTTCTGGGTGTCACTATGGAGCTCTCACATGTGGAAGCTGCAAGGTCTTCTTCAAAAGAGCCGCTGAAGGGAAACAGAAGTACCTGTGCGCCAGCAGAAATGATTGCACTATTGATAAATTCCGAAGGAAAAATTGTCCATCTTGTCGTCTTCGGAAATGTTATGAAGCAGGGATGACTCTGGGAGCCCGGAAGCTGAAGAAACTTGGTAATCTGAAACTACAGGAGGAAGGAGAGGCTTCCAGCACCACCAGCCCCACTGAGGAGACAACCCAGAAGCTGACAGTGTCACACATTGAAGGCTATGAATGTCAGCCCATCTTTCTGAATGTCCTGGAAGCCATTGAGCCAGGTGTAGTGTGTGCTGGACACGACAACAACCAGCCCGACTCCTTTGCAGCCTTGCTCTCTAGCCTCAATGAACTGGGAGAGAGACAGCTTGTACACGTGGTCAAGTGGGCCAAGGCCTTGCCTGGCTTCCGCAACTTACACGTGGACGACCAGATGGCTGTCATTCAGTACTCCTGGATGGGGCTCATGGTGTTTGCCATGGGCTGGCGATCCTTCACCAATGTCAACTCCAGGATGCTCTACTTCGCCCCTGATCTGGTTTTCAATGAGTACCGCATGCACAAGTCCCGGATGTACAGCCAGTGTGTCCGAATGAGGCACCTCTCTCAAGAGTTTGGATGGCTCCAAATCACCCCCCAGGAATTCCTGTGCATGAAAGCACTGCTACTCTTCAGCATTATTCCAGTGGATGGGCTGAAAAATCAAAAATTCTTTGATGAACTTCGAATGAACTACATCAAGGAACTCGATCGTATCATTGCATGCAAAAGAAAAAATCCCACATCCTGCTCAAGACGCTTCTACCAGCTCACCAAGCTCCTGGACTCCGTGCAGCCTATTGCGAGAGAGCTGCATCAGTTCACTTTTGACCTGCTAATCAAGTCACACATGGTGAGCGTGGACTTTCCGGAAATGATGGCAGAGATCATCTCTGTGCAAGTGCCCAAGATCCTTTCTGGGAAAGTCAAGCCCATCTATTTCCACACCCAG

図1 A-1 Cはプラスミドを示す。図1 Aは、TadA7.10-dCas9塩基エディターをコードする発現ベクターである。図1 Bは、クロラムフェニコール耐性 (CamR) およびスペクチノマイシン耐性 (SpectR) を付与するタンパク質をコードする核酸分子を含むプラスミドである。このプラスミドはまた、2つの点突然変異によって不能にされたカナマイシン耐性遺伝子を含む。図1 Cは、クロラムフェニコール耐性 (CamR) およびスペクチノマイシン耐性 (SpectR) を付与するタンパク質をコードする核酸分子を含むプラスミドである。このプラスミドはまた、3つの点突然変異によって不能にされたカナマイシン耐性遺伝子を含む。図2は、図1に示された発現ベクターで形質導入された細菌コロニーのイメージであり、これは非機能的カナマイシン耐性遺伝子を含む。ベクターは、エラープローンPCRを用いて生成されたABE7.10バリアントを含んだ。これらの「進化された」ABE7.10バリアントを発現する細菌細胞を、増加するカナマイシンの濃度を用いてカナマイシン耐性について選択した。アデノシンデアミナーゼ活性を有するABE7.10バリアントを発現する細菌は、カナマイシン耐性遺伝子に導入された変異を修正し、カナマイシン耐性を回復させることができた。カナマイシン耐性細胞をさらなる分析のために選択した。図3 Aおよび3 Bは、胎児ヘモグロビンの上方調節について治療的に関連する部位である、ヘモグロビンサブユニットガンマ (HGB1) 遺伝子座の調節領域の編集を示す。図3 Aは、HGB1遺伝子の調節領域の一部の図である。図3 Bは、アデノシンデアミナーゼバリアントの効率および特異性を定量化する。編集はHEK293T細胞のヘモグロビンサブユニットガンマ1 (HGB1) 遺伝子座でアッセイされ、それは胎児ヘモグロビンのアップレギュレーションについて治療的に関連する部位である。上部パネルは、HGB1遺伝子の調節配列の標的領域におけるヌクレオチド残基を示す。A5、A8、A9、およびA11は、HGB1における編集されたアデノシン残基を示す。図4は、非カノニカル（非正準）PAM配列を認識するdCas9を含むアデノシン塩基エディターの相対的有効性を示す。上のパネルはヘモグロビンのサブユニットのコード配列を示している。下のパネルは、さまざまな長さのガイドRNAを有するアデノシンデアミナーゼバリアント塩基エディターの効率を示すグラフである。図5は、ABE8塩基エディターの効率および特異性を示すグラフである。意図された標的（target）ヌクレオチドおよび意図されていない標的ヌクレオチド（バイスタンダー(bystander)）における編集のパーセントが定量化されている。図6は、ABE8塩基エディターの効率および特異性を示すグラフである。意図された標的ヌクレオチドおよび意図されていない標的ヌクレオチド (バイスタンダー) における編集のパーセントが定量化されている。図7 A～7 Dは、第8世代アデニン塩基エディターがヒト細胞において、より優れたA・TからG・Cへの変換（conversion）を媒介することを示す。図7 Aは、アデニン塩基編集の概要を示す：i) ABE8は、ゲノム中のsgRNA標的化部位においてRループを創出する；ii) TadA*デアミナーゼは、Rループのss-DNA部分の加水分解脱アミノ化（Hydrolytic deamination）を介してアデニンをイノシンに化学的に変換する；iii) Cas9のD10Aニッカーゼはイノシン含有鎖の反対側の鎖にニックを入れる；iv) イノシン含有鎖は、DNA複製中に鋳型として使用され得る；v) DNAポリメラーゼ（DNA Polymerase）の場合、イノシンはシトシンと優先的に塩基対を形成する；vi) 複製後、イノシンはグアノシンに置き換えられる。図7 Bは、ABE8.x-mおよびABE8.x-dのアーキテクチャを示す。図7 Cは、tRNA Arg2 (PDB 2B3J) と複合体を形成したS. aureus TadA (図示せず) と整列したE. coli TadAデアミナーゼ (PDB 1Z3A) の3つの透視図を示す。8ラウンドの進化で同定された変異を強調している。図7 Dは、Hek293T細胞中の8つのゲノム部位にわたる、ABE7.10構築物に対するコアABE8構築物のA・TからG・C塩基編集効率を示すグラフである。値とエラーバーは、異なる日に行われた3つの独立した生物学的複製の平均とs.d.を反映している。

図8 A～図8 Cは、ヒト細胞においてCas9 PAMバリアントABE8と触媒的に不活なCas9 ABE8バリアントが、対応するABE7.10バリアントよりも高いA・T→G・C変換（conversion）を媒介することを示す。値とエラーバーは、異なる日に行われた3つの独立した生物学的複製の平均とs.d.を反映している。図8 Aは、NG-Cas9 ABE8s (-NG PAM) を有するHek293T細胞におけるA・TからG・Cへの変換を示すグラフである。図8 Bは、Sa-Cas9 ABE8s (-NNGRRT PAM) を有するHek293T細胞におけるA・TからG・Cへの変換を示すグラフである。図8 Cは、触媒的に不活性化されたdCas9-ABE8s (S. pyogenes Cas9のD10A, H840A)を有するHek293T細胞におけるA・TからG・Cへの変換を示すグラフである。図9 A-9 Eは、Hek293T細胞におけるABE7.10、ABEmaxおよび1つのBPNLSを有するABEmaxの間のオンターゲットおよびオフターゲット編集頻度の比較を示す。異なる日に実施したn=3の独立した生物学的反復試験について、個々のデータポイントが表示され、エラーバーはs.d.を表す。図9 Aおよび図9 Bは、標的上のDNA編集頻度を示すグラフである。図9 Bおよび図9 Cは、sgRNA誘導によるDNAオフターゲット編集の頻度を示すグラフである。図9 Eは、RNAオフターゲット編集頻度を示すグラフである。図10 A-10 Bは、HEK293T細胞における、TadA、C末端αヘリックス切詰型ABE構築物のA・TからG・Cへの変換中央値および対応するインデル（INDEL）形成を示す。図10 Aは、8つのゲノム部位（Site）にわたるA・TからG・Cへの編集変換中央値を示すヒートマップである。図10 Bは、インデル（Indel）形成を示すヒートマップである。デルタ（delta）残基値はTadAにおける欠失位置に対応する。n=3生物学的複製から生じた中央値。図11は、HEK293T細胞中の8つのゲノム部位にわたる、40個のABE8構築物のA・TからG・Cへの変換中央値を示すヒートマップである。中央値は2つ以上の生物学的反復から決定した。図12は、HEK293T細胞中の8つのゲノム部位にわたる40個のABE8構築物のインデル%中央値を示すヒートマップである。中央値は2つ以上の生物学的反復から決定した。図13は、編集における変化倍数（Fold change in editing）を示すグラフである（ABE8:ABE7）。Hek293T細胞における8つの異なるゲノム部位の標的内の全てのA位置にわたる平均のABE8:ABE7 A・T→G・C編集の表示。位置（position）2～12は、20 ntプロトスペーサー内の標的アデニンの位置を示し、位置20が-NGG PAMのすぐ5’にある。図14は、ABE8のデンドログラムを示す。さらなる研究のために選択されたコアABE8構築物を黒でハイライトした。図15は、HEK293T細胞における8つのゲノム部位（site）にわたる、コアとなる8つのABE8構築物のA・TからG・Cへの変換中央値を示すヒートマップである。中央値は3つ以上の生物学的反復試験から決定した。

図16は、HEK293T細胞中の8ゲノム部位（Site）において試験されたコアとなる8つのABE8のインデル（Indel）頻度中央値を示すヒートマップである。図17は、HEK293T細胞における六つのゲノム部位（Site）でのコアNG-ABE8構築物9 (-NG PAM) のA・TからG・Cへの変換中央値を示すヒートマップである。n=3生物学的複製から生じた中央値。図18は、HEK293T細胞中の6つのゲノム部位（Site）で試験されたコアNG-ABE8のインデル頻度中央値を示すヒートマップである。n=3生物学的複製から生じた中央値。図19は、HEK293T細胞における六つのゲノム部位（Site）でのコアSa-ABE8構築物 (-NNGRRT PAM) のA・TからG・Cへの変換中央値を示すヒートマップである。22 ntプロトスペーサ内のサイト位置には、-2から20まで (5’から3’)の番号が付けられている。位置20は、NNGRRT PAMの5’にある。n=3生物学的複製から生じた中央値。図20は、HEK293T細胞中の8ゲノム部位（Site）において試験されたコアsa-ABE8のインデル（Indel）頻度の中央値を示すヒートマップである。n=3生物学的複製から生じた中央値。図21は、HEK293T細胞における8つのゲノム部位（Site）でのコアdC 9-ABE8-m構築物の中央値A・TからG・Cへの変換を示すヒートマップである。Dead Cas9 (dC 9) はS.pyogenes Cas9内のD10AおよびH840A変異と定義される。生物学的反復回数が3回以上の場合の中央値。図22は、HEK293T細胞における8つのゲノム部位（Site）でのコアdC9-ABE8-d構築物のA・TからG・Cへの変換中央値を示すヒートマップである。Dead（不活）Cas9 (dC9) はS. pyogenes Cas9内のD10AおよびH840A変異と定義される。n≧3の生物学的反復から生じた中央値。図23 Aおよび23 Bは、HEK293T細胞中の8つのゲノム部位（Site）で試験したコアdC9-ABE8のインデル（Indel）頻度中央値を示す。n≧3の生物学的反復から生じた中央値。図23 Aは、ABE7.10と比較してdC9-ABE8-mバリアントについて示されたインデルを示すヒートマップである。図23 Bは、ABE7.10と比較してdC9-ABE8-dバリアントについて示されたインデルを示すヒートマップである。図24は、ABE8およびABE7.10で処理されたHek293T細胞によるC・GからT・Aへの編集を示すグラフである。標的内のすべてのC位置にわたり平均化された各部位（Site）の編集頻度。プロトスペーサー内のシトシンを影付きで示している。図25 A-25 Hは、ABE8構築物、およびDNAに対する特異性を改善するためのTadA変異を有するABE8構築物による、DNAオンターゲット編集およびsgRNA依存性DNAオフターゲット編集を示す。個々のデータポイントが表示され、エラーバーは異なる日に実施したn=3の独立した生物学的反復試験についてのs.d.を表す。図25 Aおよび25 Bは、ABE7と比較したコアABE8構築物についてのオンターゲットDNA編集頻度を示すグラフである。図25 Cおよび25 Dは、RNAオフターゲット編集を改善する突然変異を有するABE8についてのオンターゲットDNA編集頻度を示すグラフである。図25 Eおよび25 Fは、ABE7と比較したコアABE8構築物についての、sgRNA誘導によるDNAオフターゲット編集頻度をグラフである。図25 Gおよび25 Hは、RNAオフターゲット編集を改善する突然変異を有するABE8構築物についての、gRNA誘導によるDNAオフターゲット編集頻度を示すグラフである。

図26は、ヒト細胞において、以前に同定された12個のsgRNA依存性Cas9オフターゲット遺伝子座におけるインデル頻度を示すグラフであり、個々のデータ点が示され、エラーバーは、異なる日に実施したn=3の独立した生物学的反復試験についてのs.d.を表す。図27 Aおよび27 Bは、初代細胞におけるA・TからG・Cへの変換（conversion）および表現型の結果を示す。図27 Aは、二つの別々のドナー（donor）からのABE処理CD34+細胞における-198 HBG1/2部位でのA・TからG・Cへの変換を示すグラフである。処理後48および144時間で実施したNGS分析。-198 HBG1/2標的配列を、A7を強調表示して示す。A7についてプロットしたA・T→G・Cパーセント。図27 Bは、アルファ（alpha）グロビンに対する割合としての、形成されたガンマ（gamma）グロビンのパーセンテージを示すグラフである。ABE処理および赤血球分化の後の、異なる2ドナーから示された値。図28 Aおよび28 Bは、ABE8で処理したCD34+細胞の、HBG1/2の上流の-198プロモーター部位でのA・T→G・C変換を示す。図28 Aは、二人のドナー（donor）からのCD34+細胞における、エディター処理後48時間および144時間でのABE8のA→G編集頻度を示すヒートマップであり、ここで、ドナー2は、鎌状赤血球症についてヘテロ接合である。図28 Bは、A7のみの編集または(A 7+A 8)組み合わせ編集のいずれかを含む全配列決定リード（reads）の分布のグラフ表示である。図29は、ガンマグロビンプロモーターの-198部位における、ABE8処理CD34+細胞のインデル（Indel）頻度を示すヒートマップである。48時間および144時間時点における、二人のドナー（Donor）から示された頻度。図30は、未処理の分化CD34+細胞 (ドナー1) のUHPLC UV-Visトレース (220 nm) およびグロビン鎖レベルの積分を示す。図31は、ABE7.10-mで処理した分化CD34+細胞(ドナー1)のUHPLC UV-Visトレース (220 nm) およびグロビン鎖レベルの積分を示す図32は、ABE7.10-dで処理した分化CD34+細胞(ドナー1)のUHPLC UV-Visトレース (220 nm) およびグロビン鎖レベルの積分を示す。図33は、ABE8.8-mで処理した分化CD34+細胞(ドナー1)の UHPLC UV-Visトレース (220 nm) およびグロビン鎖レベルの積分を示す

図34は、ABE8.8-dで処理した分化CD34+細胞(ドナー1)のUHPLC UV-Visトレース (220 nm) およびグロビン鎖レベルの積分を示す。図35は、ABE8.13-mで処理した分化CD34+細胞(ドナー1)のUHPLC UV-Visトレース (220 nm) およびグロビン鎖レベルの積分を示す。図36は、ABE8.13-dで処理した分化CD34+細胞(ドナー1)のUHPLC UV-Visトレース (220 nm) およびグロビン鎖レベルの積分を示す。図37は、ABE8.17-mで処理した分化CD34+細胞(ドナー1)のUHPLC UV-Visトレース (220 nm) およびグロビン鎖レベルの積分を示す。図38は、ABE8.17-dで処理した分化CD34+細胞(ドナー1)のUHPLC UV-Visトレース (220 nm) およびグロビン鎖レベルの積分を示す。図39は、ABE8.20-m で処理した分化CD34+細胞(ドナー1)のUHPLC UV-Visトレース (220 nm) およびグロビン鎖レベルの積分を示す。図40は、ABE8.20-dで処理した分化CD34+細胞(ドナー1)のUHPLC UV-Visトレース (220 nm) およびグロビン鎖レベルの積分を示す。図41は、未処理の分化CD34+細胞 (ドナー2) のUHPLC UV-Visトレース (220 nm) およびグロビン鎖レベルの積分を示す。注：ドナー2は鎌状赤血球症についてヘテロ接合体である。図42は、ABE7.10-mで処理した分化CD34+細胞(ドナー2)のUHPLC UV-Visトレース (220 nm) およびグロビン鎖レベルの積分を示す。注：ドナー2は鎌状赤血球症についてヘテロ接合体である。図43は、ABE7.10-dで処理した分化CD34+細胞(ドナー2)のUHPLC UV-Visトレース (220 nm) およびグロビン鎖レベルの積分を示す。。注：ドナー2は鎌状赤血球症についてヘテロ接合体である。図44は、ABE8.8-mで処理した分化CD34+細胞(ドナー2)のUHPLC UV-Visトレース (220 nm) およびグロビン鎖レベルの積分を示す。注：ドナー2は鎌状赤血球症についてヘテロ接合体である。図45は、ABE8.8-dで処理した分化CD34+細胞(ドナー2)のUHPLC UV-Visトレース (220 nm) およびグロビン鎖レベルの積分を示す。注：ドナー2は鎌状赤血球症についてヘテロ接合体である。図46は、ABE8.13-mで処理した分化CD34+細胞(ドナー2)のUHPLC UV-Visトレース (220 nm) およびグロビン鎖レベルの積分を示す。注：ドナー2は鎌状赤血球症についてヘテロ接合体である。

図47は、ABE8.13-dで処理した分化CD34+細胞(ドナー2)のUHPLC UV-Visトレース (220 nm) およびグロビン鎖レベルの積分を示す。注：ドナー2は鎌状赤血球症についてヘテロ接合体である。図48は、ABE8.17-mで処理した分化CD34+細胞(ドナー2)のUHPLC UV-Visトレース (220 nm) およびグロビン鎖レベルの積分を示す。注：ドナー2は鎌状赤血球症についてヘテロ接合体である。図49は、ABE8.17-dで処理した分化CD34+細胞(ドナー2)のUHPLC UV-Visトレース (220 nm) およびグロビン鎖レベルの積分を示す。注：ドナー2は鎌状赤血球症についてヘテロ接合体である。図50は、ABE8.20-mで処理した分化CD34+細胞(ドナー2)のUHPLC UV-Visトレース (220 nm) およびグロビン鎖レベルの積分を示す。注：ドナー2は鎌状赤血球症についてヘテロ接合体である。図51 A～51 Eは、2つの独立した部位でのABE8.8による編集が、赤血球分化後11日目の除核前には90%を超える編集に達し、赤血球分化後18日目には、アルファグロビンまたは全ベータファミリーグロビンに対して約60%のガンマグロビンに達したことを示す。図51 Aは、2つの独立した実験において、2人の健康なドナーにおけるABE8.8編集の平均を示すグラフである。編集効率はHBG1とHBG2を区別するプライマーで測定した。図51 Bは、2つの独立した実験における1人の健康なドナーの平均を示すグラフである。編集効率はHBG1とHBG2の両方を認識するプライマーで測定した。図51 Cは、ヘテロ接合E6V突然変異を有するドナーにおけるABE8.8の編集を示すグラフである。図51 Dおよび51 Eは、ABE8.8編集済み細胞におけるガンマグロビンの増加を示すグラフである。図52 Aおよび52 Bは、鎌状赤血球突然変異を修正するためのABEバリアントを用いた編集のパーセント（%Editing）を示す。図52 Aは、SCD患者線維芽細胞において約70%の編集を有する異なるエディターバリアントのスクリーニングを示すグラフである。図52 Bは、リードABEバリアントで編集された、健常ドナー由来のCD34細胞を示すグラフであり、編集ウィンドウ内に存在しSCD突然変異の編集についてのプロキシとして機能する隣接プロリンにおける同義突然変異A13を標的としている。ABE8バリアントはプロキシA13において約40%の平均編集頻度を示した。図53 Aおよび53 Bは、ABE処理と関連するRNAにおける細胞内A→I編集を検出するためのRNAアンプリコン配列決定を示す。個々のデータポイントが表示され、エラーバーは、異なる日に実施したn=3の独立した生物学的反復試験についてのs.d.を表す。図53 Aは、ABE7およびCas9 (D10A) ニッカーゼコントロールと比較した、コアABE8構築物についての標的RNAアンプリコンにおけるA→I編集頻度を示すグラフである。図53 Bは、RNAオフターゲット編集を改善することが報告されている変異を有するABE8についての、標的RNAアンプリコンにおけるA→I編集頻度を示すグラフである。

図54は、対照と対比される、アッセイされたアデノシン塩基エディター (ABE8バリアント)によって達成されたスプライスアクセプター標的部位 (AG核酸部位) におけるAからGへの塩基編集の合計パーセントを示す棒グラフである。評価したABEのプロトスペーサーPAM配列はNGG ABEであった。図55は、SOD1エクソン3の転写のスプライス破壊を引き起こすA→Gヌクレオチド変化のための標的（Target）としての、SOD1ゲノム核酸配列のエクソン3スプライスアクセプター（Splice Acceptor）の概略図を示す。図に示されているのは、SOD1核酸配列のエクソン3の領域におけるゲノムDNA位置数値 (上部) ；エクソン3の領域におけるSOD1ゲノム核酸配列；エクソン3の5’にあるイントロン核酸配列；エクソン3の5’にある標的スプライスアクセプター核酸配列；および対応するガイド（Guide）RNA（gRNA）の核酸配列であり、SOD1エクソン3のすぐ5’にあるスプライスアクセプター (「AG」) 核酸を上向き矢印で示している。また、SOD1エクソン3の5’にあるAGスプライスアクセプターの近傍のイントロン配列におけるバイスタンダーのアデノシン (A) 核酸塩基 (ボックスで囲まれている) が示されている。図56は、本明細書に記載した塩基エディター系および方法を使用し、DNAのPCRおよびディープシークエンシング後に見られた、標的核酸配列における標的部位核酸塩基の改変の効率を示す表である。SOD1ゲノム核酸配列のエクソン3の5’に存在する標的スプライスアクセプター (AG) 核酸配列における正確なA→Gヌクレオチド変化 (改変) のパーセンテージ効率が示され、これは、塩基編集が生じた細胞中ゲノムDNAのPCRに続くディープシークエンシング(MySeq) によって検出されたものである。各核酸塩基A、C、G、Tを表の左端に沿って縦に並べ、標的部位核酸に沿ったDNA中の位置 (塩基対 (bp) 表示) を表の下部に沿って示す。この表は、ABE8塩基エディターバリアントならびに本明細書に記載のシステムおよび方法を用いて、スプライスアクセプター標的核酸部位 (標的部位に沿った位置6) におけるA→G変換の約81% (80.77%) の効率を示す。バイスタンダーA核酸塩基のG核酸塩基への改変（スプライスアクセプターの標的A核酸塩基の左側で囲んで示している2、3、4の位置）は、スプライスアクセプター核酸配列における標的Aの編集と比べて最小限であった。

図57 A～57 Lは、本明細書に記載された塩基エディターシステムおよび方法を使用し、DNAのPCRおよびディープシークエンシング後に見られた、標的核酸配列における標的部位核酸塩基の改変の効率を示す表である。各核酸塩基A、C、G、Tを表の左端に沿って縦に並べ、標的部位核酸に沿ったDNA中の位置 (塩基対 (bp) ) を表の下部に沿って示す。上記図56も参照。図58は、アッセイされたガイド20とともにアデノシン塩基エディター (ABE8バリアント) によって達成されたスプライスアクセプター標的部位 (AG核酸部位) の標的位置（Target Position）6におけるAからGへの塩基編集のパーセンテージを、対照と比べて示す棒グラフである。評価したABEのプロトスペーサーPAM配列はNGG ABEであった。図59は、対照と比較され、アッセイされたガイド42を用いてアデノシン塩基エディター (ABE8バリアント) によって達成された、標的位置（Target Position）5 (左) におけるAからGへの塩基編集のパーセンテージを示す棒グラフ、およびスプライスアクセプター標的部位 (AG核酸部位) における位置2、5、9 (右) におけるAからGへの塩基編集の合計パーセンテージを示す棒グラフである。評価したABEのプロトスペーサーPAM配列はNGG ABEであった。図60 Aは、アッセイされたガイド41とともにアデノシン塩基エディター (PVバリアント) によって達成された、スプライスアクセプター標的部位 (AG核酸部位) における標的位置（Target Position）5でのAからGへの塩基編集のパーセンテージを対照と比較して示す棒グラフである。評価されたABEのためのプロトスペーサーPAM配列は、NGT ABEであった。図60 Bは、本明細書に記載された塩基エディター系および方法を使用し、DNAのPCRおよびディープシークエンシング後に見られた、標的核酸配列における標的部位核酸塩基の改変の効率を示す表である。各核酸塩基A、C、G、Tを表の左端に沿って縦に並べ、標的部位核酸に沿ったDNA中の位置 (塩基対 (bp) ) を表の下部に沿って示す。上記図56も参照。図61は、アッセイされたガイド24と共にアデノシン塩基エディター (PVバリアント) によって達成された、スプライスアクセプター標的部位 (AG核酸部位) におけるAからGへの塩基編集の合計パーセントを対照と比較して示す棒グラフでる。評価したABEのプロトスペーサーPAM配列はNGA ABEであった。図62は、ガイド20を用いて、ABE8.8またはABE7.10で編集されたHEK297T細胞におけるSOD1タンパク（Protein）質レベル（左:ウェスタンブロット、右:定量化）を示す。対照としてβアクチン（Beta Actin）を用いた。図63は、アッセイされたガイド19と共にシチジン塩基エディター (PVバリアント) によって達成された、スプライスアクセプター標的部位 (AG核酸部位) における標的位置8でのC→T塩基編集のパーセンテージを対照と比較して示す棒グラフである。評価したABEのプロトスペーサーPAM配列はNGC CBEであった。

図64 Aは、アッセイされたガイド（Guide）41と共にアデノシン塩基エディター (PVバリアント) によって達成された、スプライスアクセプター標的部位 (AG核酸部位) における標的位置5でのAからGへの塩基編集のパーセンテージを対照と比較して示す棒グラフ (左) である。評価したABEのプロトスペーサーPAM配列はNGT ABEであった。右側は、ガイド41、20、40、および21が結合することが設計されているSOD1核酸配列のエクソン3の領域におけるゲノムDNA位置数値を示す図表である。上記図55も参照。図64 Bは、本明細書に記載された塩基エディター系および方法を使用し、DNAのPCRおよびディープシークエンシング後に見られた、標的核酸配列における標的部位核酸塩基の改変の効率を示す表である。各核酸塩基A、C、G、Tを表の左端に沿って縦に並べ、標的部位核酸に沿ったDNA中の位置 (塩基対 (bp) ) を表の下部に沿って示す。上記図56も参照。図65は、アッセイされたガイド（Guide）42と共にアデノシン塩基エディター (ABEバリアント) によって達成された、スプライスアクセプター標的部位 (AG核酸部位) におけるAからGへの塩基編集の合計パーセントを対照と比較して示す棒グラフ (左) である。評価したABEのプロトスペーサーPAM配列はNGG ABEであった。右側は、ガイド42、24、および25が結合するように設計されているSOD1核酸配列のエクソン3の領域におけるゲノムDNA位置数値を示す図表である。上記図55も参照。図66 Aは、アッセイされたガイド40と共にシチジン塩基エディター (BE4 VRQR)によって達成されたCからTへの塩基編集の合計パーセントを対照と比較して示す棒グラフである。評価されたCBEのためのプロトスペーサーPAM配列は、NGA CBEであった。図66 Bは、本明細書に記載された塩基エディター系および方法を使用し、DNAのPCRおよびディープシークエンシング後に見られた、標的核酸配列における標的部位核酸塩基の改変の効率を示す表である。各核酸塩基A、C、G、Tを表の左端に沿って縦に並べ、標的部位核酸に沿ったDNA中の位置 (塩基対 (bp) ) を表の下部に沿って示す。上記図56も参照。図67 Aは、アッセイされたガイド18とともにアデノシン塩基エディター (PVバリアント) によって達成された、スプライスアクセプター標的部位 (AG核酸部位) における標的位置5でのAからGへの塩基編集の割合を、対照と比べて示す棒グラフである。評価したABEのプロトスペーサーPAM配列はNGT ABEであった。図68は、本明細書に記載した塩基エディター系および方法を使用し、DNAのPCRおよびディープシークエンシング後に見られた、標的核酸配列における標的部位核酸塩基の改変の効率を示す表である。各核酸塩基A、C、G、Tを表の左端に沿って縦に並べ、標的部位核酸に沿ったDNA中の位置 (塩基対 (bp) ) を表の下部に沿って示す。上記図56も参照。

図69は、アッセイしたガイド16と共にシチジン塩基エディター (BE4 VRQR) によって達成されたCからTへの塩基編集の合計パーセントを対照と比較して示す棒グラフである。評価したCBEのプロトスペーサーPAM配列はNGA CBEであった。図70は、アッセイしたガイド17と共にシチジン塩基エディター (BE4 VRQR)によって達成された標的位置4におけるCからTへの塩基編集のパーセンテージを対照と比較して示す棒グラフである。評価したCBEのプロトスペーサーPAM配列はNGA CBEであった。図71は、アッセイしたガイド21と共にシチジン塩基エディター (BE4 VRQR) によって達成された、標的位置5におけるCからTへの塩基編集のパーセンテージを対照と比較して示す棒グラフである。評価したCBEのプロトスペーサーPAM配列はNGA CBEであった。図72 A～72 Lは、本明細書に記載された塩基エディター系および方法を使用して、DNAのPCRおよびディープシークエンシング後に見られた、標的核酸配列における標的部位核酸塩基の改変の効率を示す表である。各核酸塩基A、C、G、Tを表の左端に沿って縦に並べ、標的部位核酸に沿ったDNA中の位置 (塩基対 (bp) ) を表の下部に沿って示す。上記図56も参照。図73 A～73 Cは、本明細書に記載の塩基エディター系および方法を使用し、DNAのPCRおよびディープシークエンシング後に見られた、標的核酸配列における標的部位核酸塩基の改変の効率を示す表である。各核酸塩基A、C、G、Tを表の左端に沿って縦に並べ、標的部位核酸に沿ったDNA中の位置 (塩基対 (bp) ) を表の下部に沿って示す。上記図56も参照。図74 A～74 Cは、本明細書に記載された塩基エディター系および方法を使用し、DNAのPCRおよびディープシークエンシング後に見られた、標的核酸配列における標的部位核酸塩基の改変の効率を示す表である。各核酸塩基A、C、G、Tを表の左端に沿って縦に並べ、標的部位核酸に沿ったDNA中の位置 (塩基対 (bp) ) を表の下部に沿って示す。上記図56も参照。図75 A～75 Dは、本明細書に記載された塩基エディター系および方法を使用し、DNAのPCRおよびディープシークエンシング後に見られた、標的核酸配列における標的部位核酸塩基の改変の効率を示す表である。各核酸塩基A、C、G、Tを表の左端に沿って縦に並べ、標的部位核酸に沿ったDNA中の位置 (塩基対 (bp) ) を表の下部に沿って示す。上記図56も参照。

図76 A～76 Lは、本明細書に記載された塩基エディター系および方法を使用し、DNAのPCRおよびディープシークエンシング後に見られた、標的核酸配列における標的部位核酸塩基の改変の効率を示す表である。各核酸塩基A、C、G、Tを表の左端に沿って縦に並べ、標的部位核酸に沿ったDNA中の位置 (塩基対 (bp) ) を表の下部に沿って示す。上記図56も参照。図77 A～77 Lは、本明細書に記載された塩基エディター系および方法を使用し、DNAのPCRおよびディープシークエンシング後に見られた、標的核酸配列における標的部位核酸塩基の改変の効率を示す表である。各核酸塩基A、C、G、Tを表の左端に沿って縦に並べ、標的部位核酸に沿ったDNA中の位置 (塩基対 (bp) ) を表の下部に沿って示す。上記図56も参照。図78 A～78 Dは、本明細書に記載された塩基エディター系および方法を使用し、DNAのPCRおよびディープシークエンシング後に見られた、標的核酸配列における標的部位核酸塩基改変の効率を示す表である。各核酸塩基A、C、G、Tを表の左端に沿って縦に並べ、標的部位核酸に沿ったDNA中の位置 (塩基対 (bp) ) を表の下部に沿って示す。上記図56も参照。図79 A～79 Lは、本明細書に記載された塩基エディター系および方法を使用し、DNAのPCRおよびディープシークエンシング後に見られた、標的核酸配列における標的部位核酸塩基の改変の効率を示す表である。各核酸塩基A、C、G、Tを表の左端に沿って縦に並べ、標的部位核酸に沿ったDNA中の位置 (塩基対 (bp) ) を表の下部に沿って示す。上記図56も参照。図80は、シチジン塩基エディター (CBE) を用いて「CAG」を標的とした場合にアンドロゲン受容体のエクソン1に終止コドンが導入されたことを示す。図81は二つのグラフを提供する。左側のグラフは、指定したシチジン塩基エディターによるCからTへの編集のパーセントを示している。右側のグラフは、各シチジン塩基エディターについてのインデル率のパーセントを示している。図82 A-82 Iは、塩基編集が起こった細胞中のゲノムDNAのPCRに続くディープシークエンシング (MySeq) によって検出された、CBE塩基エディターバリアントを用いたAR核酸配列におけるC→T編集のパーセンテージの効率を示す表である。図82 A～82 Iは、AR核酸標的部位の6位におけるC→T塩基編集のパーセントを示す。CBEの代わりに水（water）を用いた対照反応を示す。

図83 Aは2つのグラフを提供する。左側のグラフは、エクソン1に未熟終止コドンが導入された結果、大多数の細胞でアンドロゲン受容体が機能的にノックアウトされたことを示している。中央のグラフは、各シチジン塩基エディターについてのインデル率パーセントを示している。右側は、ガイド8が結合するように設計されているAR核酸配列のエクソン1の領域におけるゲノムDNA位置数値を示す図表である。上記図80も参照。図83 Bは、塩基編集が起こった細胞中のゲノムDNAのPCRに続くディープシークエンシング (MySeq) によって検出された、CBE塩基エディターバリアントを用いたAR核酸配列におけるC→T編集のパーセンテージの効率を示す表である。図83 Bは、AR核酸標的部位における標的位置でのC→T塩基編集のパーセントを示す。CBEの代わりに水を用いた対照反応を示す。図84 Aは、対照と比較してアッセイされたガイド10を用いたシチジン塩基エディター（BGX5、BGX27、BGX29、およびBTX448）によって達成された標的位置6におけるCからTへの塩基編集のパーセンテージ（左）、およびパーセンテージ表示によるインデル率（中央）を示す棒グラフである。評価したCBEのプロトスペーサーPAM配列はNGG CBEであった。右側は、ガイド9および10が結合するように設計されているAR核酸配列のエクソン1の領域におけるゲノムDNA位置数値を示す図表である。上記図80も参照。図84 Bは、塩基編集が起こった細胞中のゲノムDNAのPCRに続くディープシークエンシング (MySeq) によって検出された、CBE塩基エディターバリアントを使用すたAR核酸配列中のC→T編集のパーセンテージの効率を示す表である。図83 Bは、AR核酸標的部位の位置6におけるC→T塩基編集のパーセントを示す。CBEの代わりに水を用いた場合の対照反応を示す。図85は、アッセイされたガイド8 (左) またはガイド14 (右)と共にアデノシン塩基エディター (ABE8バリアント) によって達成されたスプライスアクセプター標的部位 (AG核酸部位) におけるAからGへの塩基編集の合計パーセントを対照と比べて示す棒グラフである。評価したABEのプロトスペーサーPAM配列はNGG ABEであった。図86 Aは、アッセイされたガイド11と共にシチジン塩基エディター (BE4 VRQR) によって達成された、標的位置8でのCからTへの塩基編集のパーセンテージを対照と比べて示す棒グラフ (上) および要約表 (下) である。評価されたCBEのためのプロトスペーサーPAM配列は、NGA CBEであった。図86 Bは、CBE塩基エディターバリアントを用いたAR核酸配列におけるCからTへの編集のパーセンテージの効率を示す表であり、これは塩基編集が起こった細胞中のゲノムDNAのPCRに続くディープシークエンシング (MySeq) によって検出された。図86 Bは、AR核酸標的部位における位置8でのCからTへの塩基編集のパーセントを示す。CBEの代わりに水を用いた場合の対照（Control）反応を示す。

図87 Aは、アッセイされたガイド12と共にシチジン塩基エディター (BE4 VRQR) によって達成された、標的位置5におけるCからTへの塩基編集のパーセンテージを対照と比べて示す棒グラフ (上) および要約表 (下) である。評価されたCBEのためのプロトスペーサーPAM配列は、NGA CBEであった。図87 Bは、CBE塩基エディターバリアントを用いたAR核酸配列におけるCからTへの編集のパーセンテージの効率を示す表であり、これは塩基編集が起こった細胞中のゲノムDNAのPCRに続くディープシークエンシング(MySeq) によって検出された。図87 Bは、AR核酸標的部位の位置5におけるC→T塩基編集のパーセントを示す。CBEの代わりに水を用いた場合の対照（Control）反応を示す。図88は、アッセイされたガイド15と共にシチジン塩基エディター (BE4 VRQR) によって達成されたCからTへの塩基編集の合計パーセントを対照と比較して示す棒グラフである。評価したCBEのプロトスペーサーPAM配列はNGA CBEであった。各核酸塩基A、C、G、Tを表の左端に沿って縦に並べ、標的部位核酸に沿ったDNA中の位置 (塩基対 (bp) ) を表の下部に沿って示す。図89 A～89 Dは、本明細書に記載された塩基エディター系および方法を使用し、DNAのPCRおよびディープシークエンシング後に見られた、標的核酸配列における標的部位核酸塩基の改変の効率を示す表である。ARゲノム核酸配列のエクソン1の標的核酸配列における正確なC→TまたはA→Gヌクレオチド変化 (改変) のパーセンテージ効率が示され、これは、塩基編集が生じた細胞におけるゲノムDNAのPCRに続くディープシークエンシング (MySeq) によって検出された。各核酸塩基A、C、G、Tを表の左端に沿って縦に並べ、標的部位核酸に沿ったDNA中の位置 (塩基対 (bp) ) を表の下部に沿って示す。図90 A～90 Cは、本明細書に記載された塩基エディター系および方法を使用し、DNAのPCRおよびディープシークエンシング後に見られた、標的核酸配列における標的部位核酸塩基の改変の効率を示す表である。ARゲノム核酸配列のエクソン1の標的核酸配列における正確なC→TまたはA→Gヌクレオチド変化 (改変) のパーセンテージ効率が示され、これは、塩基編集が生じた細胞におけるゲノムDNAのPCRに続くディープシークエンシング (MySeq) によって検出された。各核酸塩基A、C、G、Tを表の左端に沿って縦に並べ、標的部位核酸に沿ったDNA中の位置 (塩基対 (bp) ) を表の下部に沿って示す。図91 A～91 Cは、本明細書に記載された塩基エディター系および方法を使用し、DNAのPCRおよびディープシークエンシング後に見られた、標的核酸配列における標的部位核酸塩基改変の効率を示す表である。ARゲノム核酸配列のエクソン1の標的核酸配列における正確なC→TまたはA→Gヌクレオチド変化 (改変) のパーセンテージ効率が示され、これは、塩基編集が生じた細胞におけるゲノムDNAのPCRに続くディープシークエンシング (MySeq) によって検出された。各核酸塩基A、C、G、Tを表の左端に沿って縦に並べ、標的部位核酸に沿ったDNA中の位置 (塩基対 (bp) ) を表の下部に沿って示す。図92 Aおよび92 Bは、本明細書に記載された塩基エディター系および方法を使用し、DNAのPCRおよびディープシークエンシング後に見られた、標的核酸配列における標的部位核酸塩基の改変の効率を示す表である。ARゲノム核酸配列のエクソン1の標的核酸配列における正確なC→TまたはA→Gヌクレオチド変化 (改変) のパーセンテージ効率が示され、これは、塩基編集が生じた細胞におけるゲノムDNAのPCRに続くディープシークエンシング (MySeq) によって検出された。各核酸塩基A、C、G、Tを表の左端に沿って縦に並べ、標的部位核酸に沿ったDNA中の位置 (塩基対 (bp) ) を表の下部に沿って示す。図93 A～93 Xは、本明細書に記載された塩基エディター系および方法を使用し、DNAのPCRおよびディープシークエンシング後に見られた、標的核酸配列における標的部位核酸塩基の改変の効率を示す表である。ARゲノム核酸配列のエクソン1の標的核酸配列における正確なC→TまたはA→Gヌクレオチド変化 (改変) のパーセンテージ効率が示され、これは、塩基編集が生じた細胞におけるゲノムDNAのPCRに続くディープシークエンシング (MySeq) によって検出された。各核酸塩基A、C、G、Tを表の左端に沿って縦に並べ、標的部位核酸に沿ったDNA中の位置 (塩基対 (bp) ) を表の下部に沿って示す。

本発明は、標的核酸塩基配列の改変を生成するための、効率が増加した新規のアデニン塩基エディター（例えばABE8）を含む組成物およびそれらを使用する方法を提供する。

［核酸塩基エディター］
ポリヌクレオチドの標的ヌクレオチド配列を編集、修飾または改変するための塩基エディターまたは核酸塩基エディターが本明細書に開示される。特定の実施形態では、本発明の塩基エディターは、SOD1ポリヌクレオチドを改変する。特定の実施形態では、本発明の塩基エディターは、ARポリヌクレオチドにおいて終止コドンを導入するか、またはスプライス部位を破壊する。本明細書に記載されるのは、ポリヌクレオチドプログラム可能なヌクレオチド結合ドメイン（例えばCas9）および核酸塩基編集ドメイン（例えばアデノシンデアミナーゼ）を含む核酸塩基エディターまたは塩基エディターである。ポリヌクレオチドプログラム可能なヌクレオチド結合ドメイン（例えばCas9）は、結合されたガイドポリヌクレオチド（例えばgRNA）と一緒である場合に、（結合されたガイド核酸の塩基と標的ポリヌクレオチド配列の塩基との間の相補的塩基対形成を介して）標的ポリヌクレオチド配列に特異的に結合することができ、それによって、編集されることが所望される標的核酸配列に塩基エディターを局在化させることができる。或る実施態様では、標的ポリヌクレオチド配列は一本鎖DNAまたは二本鎖DNAを含む。或る実施態様では、標的ポリヌクレオチド配列はRNAを含む。或る実施態様では、標的ポリヌクレオチド配列はDNA-RNAハイブリッドを含む。

［ポリヌクレオチドプログラミング可能なヌクレオチド結合ドメイン］
ポリヌクレオチドプログラム可能ヌクレオチド結合ドメインはまた、RNAに結合する核酸プログラム可能タンパク質を含むことができることを理解されたい。例えば、ポリヌクレオチドプログラム可能ヌクレオチド結合ドメインは、ポリヌクレオチドプログラム可能ヌクレオチド結合ドメインをRNAにガイドする核酸と結合され得る。他の核酸プログラム可能DNA結合タンパク質もまた、本開示の範囲内にあるが、それらは本開示には特に列記されていない。

塩基エディターのポリヌクレオチドプログラム可能ヌクレオチド結合ドメインは、それ自体が1つ以上のドメインを含むことができる。例えば、ポリヌクレオチドプログラム可能なヌクレオチド結合ドメインは、1つ以上のヌクレアーゼドメインを含むことができる。ある態様において、ポリヌクレオチドプログラム可能ヌクレオチド結合ドメインのヌクレアーゼドメインは、エンドヌクレアーゼまたはエキソヌクレアーゼを含むことができる。本明細書において、用語「エキソヌクレアーゼ」は、核酸(例えばRNAまたはDNA)を遊離末端から消化することができるタンパク質またはポリペプチドを指し、用語「エンドヌクレアーゼ」は、核酸(例えばDNAまたはRNA)の内部領域を触媒(例えば劈開)することができるタンパク質またはポリペプチドを指す。ある態様において、エンドヌクレアーゼは、二本鎖核酸の一本鎖を切断することができる。ある態様において、エンドヌクレアーゼは、二本鎖核酸分子の両方の鎖を切断することができる。ある態様において、ポリヌクレオチドプログラム可能ヌクレオチド結合ドメインは、デオキシリボヌクレアーゼであり得る。ある態様において、ポリヌクレオチドプログラム可能ヌクレオチド結合ドメインは、リボヌクレアーゼであり得る。

ある態様において、ポリヌクレオチドプログラム可能なヌクレオチド結合ドメインのヌクレアーゼドメインは、標的ポリヌクレオチドの0本、1本または2本の鎖を切断することができる。ある実施形態では、ポリヌクレオチドプログラム可能なヌクレオチド結合ドメインは、ニッカーゼドメインを含むことができる。本明細書において、用語「ニッカーゼ」は、二本鎖核酸分子(例えばDNA)中の二本鎖の一方の鎖のみを切断することができるヌクレアーゼドメインを含むポリヌクレオチドプログラム可能ヌクレオチド結合ドメインを指す。ある態様において、ニッカーゼは、活性なポリヌクレオチドプログラム可能ヌクレオチド結合ドメインに一つ以上の突然変異を導入することによって、ポリヌクレオチドプログラム可能ヌクレオチド結合ドメインの完全に触媒活性な(例えば天然の)形態から誘導することができる。例えば、ポリヌクレオチドプログラム可能なヌクレオチド結合ドメインがCas9に由来するニッカーゼドメインを含む場合、Cas9に由来するニッカーゼドメインは、D10A突然変異および位置840におけるヒスチジンを含むことができる。そのような実施形態では、残基H840は触媒活性を保持し、それによって核酸二本鎖の一本鎖を切断することができる。別の例において、Cas9由来ニッカーゼドメインは、H840A突然変異を含むことができ、一方、位置10におけるアミノ酸残基は、Dのままである。いくつかの実施形態において、ニッカーゼは、ニッカーゼ活性に必要ではないヌクレアーゼドメインの全部または一部を除去することによって、ポリヌクレオチドプログラム可能ヌクレオチド結合ドメインの完全に触媒活性な(例えば天然の)形態から誘導することができる。例えば、ポリヌクレオチドプログラム可能なヌクレオチド結合ドメインがCas9に由来するニッカーゼドメインを含む場合、Cas9に由来するニッカーゼドメインは、RuvCドメインまたはHNHドメインの全部または一部の欠失を含むことができる。

例示的な触媒活性Cas9のアミノ酸配列は以下の通りである：
MDKKYSIGLDIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD.

したがって、ニッカーゼドメインを含むポリヌクレオチドプログラム可能なヌクレオチド結合ドメインを含む塩基エディターは、特定のポリヌクレオチド標的配列(例えば結合したガイド核酸の相補的配列によって決定される)において一本鎖DNA切断 (ニック) を生成することができる。ある態様において、ニッカーゼドメイン(例えばCas9由来のニッカーゼドメイン)を含む塩基エディターによって切断される核酸二本鎖標的ポリヌクレオチド配列の鎖は、塩基エディターによって編集されない鎖である(すなわち、塩基エディタによって切断される鎖は、編集される塩基を含む鎖とは反対の鎖である)。他の態様において、ニッカーゼドメイン(例えばCas9由来のニッカーゼドメイン)を含む塩基エディターは、編集のために標的とされるDNA分子の鎖を切断することができる。そのような実施形態では、非標的鎖は切断されない。

触媒的に死んだ(すなわち標的ポリヌクレオチド配列を切断することができない)ポリヌクレオチドプログラム可能ヌクレオチド結合ドメインを含む塩基エディターも本明細書中に提供される。本明細書において、用語「触媒的に死んだ」および「ヌクレアーゼ不活」は、核酸の鎖を切断することができない結果となる一つ以上の突然変異および/または欠失を有するポリヌクレオチドプログラム可能ヌクレオチド結合ドメインを指すために交換可能に使用される。いくつかの実施形態において、触媒的に死んだポリヌクレオチドプログラム可能ヌクレオチド結合ドメイン塩基エディターは、1つ以上のヌクレアーゼドメインにおける特定の点突然変異の結果としてヌクレアーゼ活性を欠くことができる。例えば、Cas9ドメインを含む塩基エディターの場合、Cas9は、D10A突然変異およびH840A突然変異の両方を含むことができる。このような変異は両方のヌクレアーゼドメインを不活性化し、その結果ヌクレアーゼ活性を失う。他の実施形態において、触媒的に死んだポリヌクレオチドプログラム可能なヌクレオチド結合ドメインは、触媒ドメイン(例えばRuvC1および/またはHNHドメイン)の全部又は一部の一つ以上の欠失を含むことができる。さらなる態様において、触媒的に死んだポリヌクレオチドプログラム可能ヌクレオチド結合ドメインは、点突然変異(例えばD10AまたはH840A)ならびにヌクレアーゼドメインの全部または一部の欠失を含む。

また、本明細書では、ポリヌクレオチドプログラム可能ヌクレオチド結合ドメインの以前に機能していたバージョンから、触媒的に死んだポリヌクレオチドプログラム可能ヌクレオチド結合ドメインを生成することができる突然変異も企図される。例えば、触媒的に死んだCas9 (「dCas9」) の場合、D10AおよびH840A以外の突然変異を有してヌクレアーゼ不活性化Cas9をもたらすバリアントが提供される。このような突然変異は、例えば、D10およびH840における他のアミノ酸置換、またはCas9のヌクレアーゼドメイン内の他の置換(例えば、HNHヌクレアーゼサブドメインおよび/またはRuvC1サブドメインにおける置換)を含む。さらなる適切なヌクレアーゼ不活性dCas9ドメインは、本開示および当該分野における知識に基づいて当業者に明らかとなり得、本開示の範囲内である。このようなさらなる例示的な適切なヌクレアーゼ不活性Cas9ドメインには、限定されるものではないが、D10A/H840A、D10A/D839A/H840A、およびD10A/D839A/H840A/N863A突然変異体ドメインが含まれる(例えば、Prashant et al., CAS9 transcriptional activators for target specificity screening and paired nickases for cooperative genome engineering. Nature Biotechnology. 2013; 31(9): 833-838を参照されたい (その全内容は参照により本明細書に組み込まれる))。

塩基エディターに組み込むことができるポリヌクレオチドプログラム可能ヌクレオチド結合ドメインの非限定的な例としては、CRISPRタンパク質由来ドメイン、制限ヌクレアーゼ、メガヌクレアーゼ、TALヌクレアーゼ(TALEN) 、およびジンクフィンガーヌクレアーゼ (ZFN) が挙げられる。いくつかの実施形態において、塩基エディターは、核酸のCRISPR (すなわちClustered Regularly Interspaced Short Palindromic Repeats)媒介修飾の際に、結合ガイド核酸を介して核酸配列に結合することができる天然もしくは修飾されたタンパク質またはその一部を含むポリヌクレオチドプログラム可能ヌクレオチド結合ドメインを含む。そのようなタンパク質は、本明細書において「CRISPRタンパク質」と呼ばれる。従って、本明細書に開示されているのは、CRISPRタンパク質の全部または一部を含むポリヌクレオチドプログラム可能ヌクレオチド結合ドメインを含む塩基エディター（すなわち、CRISPRタンパク質の全部または一部をドメインとして含む塩基エディター（それは塩基エディターの「CRISPRタンパク質由来ドメイン」とも呼ばれる））である。塩基エディターに組み込まれたCRISPRタンパク質由来ドメインは、野生型または天然型のCRISPRタンパク質と比較して改変され得る。例えば、以下に記載するように、CRISPRタンパク質由来ドメインは、野生型または天然型のCRISPRタンパク質と比較して、1以上の突然変異、挿入、欠失、再配列および/または組換えを含み得る。

CRISPRは、可動遺伝要素(ウイルス、転移因子、接合プラスミド)に対する防御を提供する適応免疫系である。CRISPRクラスターは、スペーサー、先行する可動要素に相補的な配列、および標的侵入核酸を含む。CRISPRクラスターは転写され、CRISPR RNA (crRNA) にプロセシングされる。II型CRISPRシステムでは、pre‐crRNAの正しいプロセシングはトランスコード小RNA (tracrRNA)、内因性リボヌクレアーゼ3 (rnc) 、およびCas9タンパク質を必要とする。tracrRNAはリボヌクレアーゼ3によるpre-crRNAのプロセシングのガイドとなる。続いて、Cas9/crRNA/tracrRNAが、スペーサーに相補的な線状または環状のdsDNA標的をエンドヌクレアーゼで切断する。crRNAに相補的でない標的鎖は、最初にエンドヌクレアーゼ的に切断され、次にエキソヌクレアーゼ的に3’-5’にトリムされる。自然界では、DNA結合と切断にはタンパク質と両方のRNAが必要である。しかしながら、crRNAおよびtracrRNAの両方の側面を単一のRNA種に組み込むように、単一ガイドRNA (「sgRNA」、あるいは単に「gRNA」)を作製することができる。例えばJinek M. et al., Science 337:816-821(2012)を参照されたい（その内容全体が参照により本明細書に組み入れられる）。Cas9は、CRISPR反復配列中の短いモチーフ(PAMまたはプロトスペーサー隣接モチーフ)を認識して、「自己」と「非自己」を区別することを助ける。

いくつかの実施形態において、本明細書に記載される方法は、組み換え操作された（engineered）Casタンパク質を利用することができる。ガイドRNA (gRNA) は、Cas結合に必要な足場配列と、修飾されるゲノム標的を規定するユーザー定義の約20塩基スペーサーとからなる短い合成RNAである。したがって、当業者はCasタンパク質特異性のゲノム標的を変化させることができ、これは、ゲノムの他の部分と比較してgRNA標的化配列がゲノム標的に対していかに特異的であるかによって部分的に決定される。

いくつかの実施形態において、gRNA足場配列は以下の通りである：GUUUUAGAGC UAGAAAUAGC AAGUUAAAAU AAGGCUAGUC CGUUAUCAAC UUGAAAAAGU GGCACCGAGU CGGUGCUUUU。

いくつかの実施形態において、塩基エディターに組み込まれたCRISPRタンパク質由来ドメインは、結合ガイド核酸と組み合わせられた場合に標的ポリヌクレオチドに結合することができるエンドヌクレアーゼ(例えばデオキシリボヌクレアーゼまたはリボヌクレアーゼ)である。いくつかの実施形態において、塩基エディターに組み込まれたCRISPRタンパク質由来ドメインは、結合ガイド核酸と組み合わせられた場合に標的ポリヌクレオチドに結合することができるニッカーゼである。いくつかの実施形態において、塩基エディターに組み込まれたCRISPRタンパク質由来ドメインは、結合ガイド核酸と組み合わせられた場合に標的ポリヌクレオチドに結合することができる触媒的に死んだドメインである。或る実施態様では、塩基エディターのCRISPRタンパク質由来ドメインに結合する標的ポリヌクレオチドはDNAであり、或る実施態様では、塩基エディターのCRISPRタンパク質由来ドメインに結合する標的ポリヌクレオチドはRNAである。

本明細書中で用いることができるCAsタンパク質は、クラス1およびクラス2を含む。Casタンパク質の非限定的な例としては、Cas1、Cas1B、Cas2、Cas3、Cas4、Cas5d、Cas5t、Cas5h、Cas5a、Cas6、Cas7、Cas8、Cas9(Csn1またはCsx12とも呼ばれる)、Cas10、Csy1、Csy2、Csy3、Csy4、Cse1、Cse2、Cse3、Cse4、Cse5、Csn1、Csn2、Csm2、Csm3、Csm4、Csm5、Csm6、Cmr1、Cmr3、Cmr4、Cmr5、Csb1、Csb2、Csb3、Csx17、Csx14、Csx10、Cssx16、Cx16、Cx、Csx3、Csx1、Csx1S、Csf1、Csf2、CsO、Csf4、Csd1、Csd2、Cst1、Cst2、Csh1、Csh2、Csa1、Csa2、Csa3、Csa4、Csa5、Cas12a/Cpf1、Cas12b/C2c1、Cas12c/C2c3、Cas12d/CasY、Cas12e/CasX、Cas12g、Cas12h、およびCas12i、CARF、DinG、それらのホモログ、またはそれらの改変体が挙げられる。未改変のCRISPR酵素は、Cas9のように、2つの機能性エンドヌクレアーゼ領域、RuvCおよびHNHを有するDNA切断活性を有することができる。CRISPR酵素は、標的配列内および/または標的配列の相補鎖内などの標的配列において、一方または両方の鎖の切断を誘導することができる。例えば、CRISPR酵素は、標的配列の最初または最後のヌクレオチドから約1、2、3、4、5、6、7、8、9、10、15、20、25、50、100、200、500塩基対またはそれ以上にある一方または両方の鎖の切断を誘導することができる。

標的配列を含む標的ポリヌクレオチドの一方または両方の鎖を切断する能力を欠失するように、対応する野生型酵素に対して変異されたCRISPR酵素をコードするベクターを用いることができる。Cas9は、野生型の例示的なCas9ポリペプチド(例えばS. pyogenesからのCas9)と少なくとも、または少なくともおよそ、50%、60%、70%、80%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、または100%の配列同一性および/または配列相同性を有するポリペプチドを指すことができる。Cas9は、野生型の例示的なCas9ポリペプチド(例えばS.pyogenesからのもの)に対して、最大で、または最大でおよそ、約50%、60%、70%、80%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、または100%の配列同一性および/または配列相同性を有するポリペプチドを指すことができる。Cas9は、野生型、または欠失、挿入、置換、バリアント、突然変異、融合、キメラ、またはそれらの任意の組合せなどのアミノ酸変化を含み得るCas9タンパク質の改変型を指すことができる。

ある態様において、塩基エディターのCRISPRタンパク質由来ドメインは、Corynebacterium ulcerans (NCBI Refs: NC_015683.1, NC_017317.1); Corynebacterium diphtheria (NCBI Refs: NC_016782.1, NC_016786.1); Spiroplasma syrphidicola (NCBI Ref: NC_021284.1); Prevotella intermedia (NCBI Ref: NC_017861.1); Spiroplasma taiwanense (NCBI Ref: NC_021846.1); Streptococcus iniae (NCBI Ref: NC_021314.1); Belliella baltica (NCBI Ref: NC_018010.1); Psychroflexus torquis (NCBI Ref: NC_018721.1); Streptococcus thermophilus (NCBI Ref: YP_820832.1); Listeria innocua (NCBI Ref: NP_472073.1); Campylobacter jejuni (NCBI Ref: YP_002344900.1); Neisseria meningitidis (NCBI Ref: YP_002342100.1), Streptococcus pyogenes, または Staphylococcus aureus由来のCas9の全部または一部を含むことができる。

［核酸塩基エディターのCas9ドメイン］
Cas9ヌクレアーゼの配列および構造は、当業者によく知られている(例えば“Complete genome sequence of an Ml strain of Streptococcus pyogenes.” Ferretti et al., Proc. Natl. Acad. Sci. U.S.A. 98:4658-4663(2001); “CRISPR RNA maturation by trans-encoded small RNA and host factor RNase III.” Deltcheva E. et al., Nature 471:602-607(2011); および “A programmable dual-RNA-guided DNA endonuclease in adaptive bacterial immunity.” Jinek M. et al., Science 337:816-821(2012)参照。その内容全体が参照により本明細書に組み入れられる。)。Cas9オーソログは、限定されるものではないが、S.pyogenesおよびS.thermophilusを含む種々の種において記述されてきた。さらなる適切なCas9ヌクレアーゼおよび配列は、本開示に基づいて当業者に明らかとなり、そのようなCas9ヌクレアーゼおよび配列は、Chylinski, Rhun, and Charpentier, “The tracrRNA and Cas9 families of type II CRISPR-Cas immunity systems” (2013) RNA Biology 10:5, 726-737に開示されている生物および遺伝子座由来のCas9配列を含む。その全内容は参照により本明細書に組み込まれる。

いくつかの実施形態において、核酸プログラミング可能DNA結合タンパク質 (napDNAbp) は、Cas9ドメインである。非限定的な例示的Cas9ドメインが本明細書で提供される。Cas9ドメインは、ヌクレアーゼ活性Cas9ドメイン、ヌクレアーゼ不活性Cas9ドメイン（dCas9）、またはCas9ニッカーゼ（nCas9）であり得る。ある態様において、Cas9ドメインは、ヌクレアーゼ活性ドメインである。例えば、Cas9ドメインは、二本鎖核酸の両方の鎖（例えば二本鎖DNA分子の両方の鎖）を切断するCas9ドメインであり得る。いくつかの実施形態において、Cas9ドメインは、本明細書に記載のアミノ酸配列のいずれか1つを含む。いくつかの実施形態において、Cas9ドメインは、本明細書に記載されたアミノ酸配列のいずれか１つに対して少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも99.5%の同一性であるアミノ酸配列を含む。いくつかの実施形態において、Cas9ドメインは、本明細書に記載されるアミノ酸配列のいずれか１つと比較して1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、21、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、またはそれ以上の突然変異を有するアミノ酸配列を含む。いくつかの実施形態において、Cas9ドメインは、本明細書に記載されたアミノ酸配列のいずれか１つと比較して、少なくとも10、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90、少なくとも100、少なくとも150、少なくとも200、少なくとも250、少なくとも300、少なくとも350、少なくとも400、少なくとも500、少なくとも600、少なくとも700、少なくとも800、少なくとも900、少なくとも1000、少なくとも1100、または少なくとも1200個の同一の一続きのアミノ酸残基を有するアミノ酸配列を含む。

ある態様において、Cas9の断片を含むタンパク質が提供される。例えば、いくつかの実施形態において、タンパク質は、以下の2つのCas9ドメインのうちの1つを含む：(1) Cas9のgRNA結合ドメイン;(2) Cas9のDNA切断ドメイン。ある態様において、Cas9またはその断片を含むタンパク質は、「Cas9バリアント」と称される。Cas9バリアントは、Cas9またはその断片と相同性を共有する。例えば、Cas9バリアントは、野生型Cas9と少なくとも約70%同一、少なくとも約80%同一、少なくとも約90%同一、少なくとも約95%同一、少なくとも約96%同一、少なくとも約97%同一、少なくとも約98%同一、少なくとも約99%同一、少なくとも約99.5%同一、または少なくとも約99.9%同一である。いくつかの実施形態において、Cas9変異体は、野生型Cas9と比較して、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、21、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50またはそれ以上のアミノ酸変化を有し得る。いくつかの実施形態において、Cas9バリアントは、Cas9の断片 (例えばgRNA結合ドメインまたはDNA切断ドメイン)を含み、その断片は、野生型Cas9の対応する断片と少なくとも約70%同一であり、少なくとも約80%同一であり、少なくとも約90%同一であり、少なくとも約95%同一であり、少なくとも約96%同一であり、少なくとも約97%同一であり、少なくとも約98%同一であり、少なくとも約99%同一であり、少なくとも約99.5%同一であり、または少なくとも約99.9%同一である。ある態様において、断片は、対応する野生型Cas9のアミノ酸長の少なくとも30%、少なくとも35%、少なくとも40%、少なくとも45%、少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%同一、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも99.5%である。ある態様において、断片は、長さが少なくとも100アミノ酸である。ある態様において、断片は、少なくとも100、150、200、250、300、350、400、450、500、550、600、650、700、750、800、850、900、950、1000、1050、1100、1150、1200、1250、または少なくとも1300アミノ酸の長さである。

Cas9タンパク質は、そのガイドRNAに相補的な特定のDNA配列にCas9タンパク質をガイドする、ガイドRNAと結合することができる。ある態様において、ポリヌクレオチドプログラム可能なヌクレオチド結合ドメインは、Cas9ドメイン、例えばヌクレアーゼ活性Cas9、Cas9ニッカーゼ (nCas9) 、またはヌクレアーゼ不活性Cas9 (dCas9) である。核酸プログラム可能なDNA結合タンパク質の例としては、Cas9（例えばdCas9およびnCas9）、CasX、CasY、Cpf1、Cas12b/C2C1、およびCas12c/C2C3が挙げられるが、これらに限定されない。ある実施形態において、野生型Cas9は、Streptococcus pyogenes由来のCas9に対応する（NCBI参照配列：NC_017053.1、ヌクレオチドおよびアミノ酸の配列は以下の通り）。
ATGGATAAGAAATACTCAATAGGCTTAGATATCGGCACAAATAGCGTCGGATGGGCGGTGATCACTGATGATTATAAGGTTCCGTCTAAAAAGTTCAAGGTTCTGGGAAATACAGACCGCCACAGTATCAAAAAAAATCTTATAGGGGCTCTTTTATTTGGCAGTGGAGAGACAGCGGAAGCGACTCGTCTCAAACGGACAGCTCGTAGAAGGTATACACGTCGGAAGAATCGTATTTGTTATCTACAGGAGATTTTTTCAAATGAGATGGCGAAAGTAGATGATAGTTTCTTTCATCGACTTGAAGAGTCTTTTTTGGTGGAAGAAGACAAGAAGCATGAACGTCATCCTATTTTTGGAAATATAGTAGATGAAGTTGCTTATCATGAGAAATATCCAACTATCTATCATCTGCGAAAAAAATTGGCAGATTCTACTGATAAAGCGGATTTGCGCTTAATCTATTTGGCCTTAGCGCATATGATTAAGTTTCGTGGTCATTTTTTGATTGAGGGAGATTTAAATCCTGATAATAGTGATGTGGACAAACTATTTATCCAGTTGGTACAAATCTACAATCAATTATTTGAAGAAAACCCTATTAACGCAAGTAGAGTAGATGCTAAAGCGATTCTTTCTGCACGATTGAGTAAATCAAGACGATTAGAAAATCTCATTGCTCAGCTCCCCGGTGAGAAGAGAAATGGCTTGTTTGGGAATCTCATTGCTTTGTCATTGGGATTGACCCCTAATTTTAAATCAAATTTTGATTTGGCAGAAGATGCTAAATTACAGCTTTCAAAAGATACTTACGATGATGATTTAGATAATTTATTGGCGCAAATTGGAGATCAATATGCTGATTTGTTTTTGGCAGCTAAGAATTTATCAGATGCTATTTTACTTTCAGATATCCTAAGAGTAAATAGTGAAATAACTAAGGCTCCCCTATCAGCTTCAATGATTAAGCGCTACGATGAACATCATCAAGACTTGACTCTTTTAAAAGCTTTAGTTCGACAACAACTTCCAGAAAAGTATAAAGAAATCTTTTTTGATCAATCAAAAAACGGATATGCAGGTTATATTGATGGGGGAGCTAGCCAAGAAGAATTTTATAAATTTATCAAACCAATTTTAGAAAAAATGGATGGTACTGAGGAATTATTGGTGAAACTAAATCGTGAAGATTTGCTGCGCAAGCAACGGACCTTTGACAACGGCTCTATTCCCCATCAAATTCACTTGGGTGAGCTGCATGCTATTTTGAGAAGACAAGAAGACTTTTATCCATTTTTAAAAGACAATCGTGAGAAGATTGAAAAAATCTTGACTTTTCGAATTCCTTATTATGTTGGTCCATTGGCGCGTGGCAATAGTCGTTTTGCATGGATGACTCGGAAGTCTGAAGAAACAATTACCCCATGGAATTTTGAAGAAGTTGTCGATAAAGGTGCTTCAGCTCAATCATTTATTGAACGCATGACAAACTTTGATAAAAATCTTCCAAATGAAAAAGTACTACCAAAACATAGTTTGCTTTATGAGTATTTTACGGTTTATAACGAATTGACAAAGGTCAAATATGTTACTGAGGGAATGCGAAAACCAGCATTTCTTTCAGGTGAACAGAAGAAAGCCATTGTTGATTTACTCTTCAAAACAAATCGAAAAGTAACCGTTAAGCAATTAAAAGAAGATTATTTCAAAAAAATAGAATGTTTTGATAGTGTTGAAATTTCAGGAGTTGAAGATAGATTTAATGCTTCATTAGGCGCCTACCATGATTTGCTAAAAATTATTAAAGATAAAGATTTTTTGGATAATGAAGAAAATGAAGATATCTTAGAGGATATTGTTTTAACATTGACCTTATTTGAAGATAGGGGGATGATTGAGGAAAGACTTAAAACATATGCTCACCTCTTTGATGATAAGGTGATGAAACAGCTTAAACGTCGCCGTTATACTGGTTGGGGACGTTTGTCTCGAAAATTGATTAATGGTATTAGGGATAAGCAATCTGGCAAAACAATATTAGATTTTTTGAAATCAGATGGTTTTGCCAATCGCAATTTTATGCAGCTGATCCATGATGATAGTTTGACATTTAAAGAAGATATTCAAAAAGCACAGGTGTCTGGACAAGGCCATAGTTTACATGAACAGATTGCTAACTTAGCTGGCAGTCCTGCTATTAAAAAAGGTATTTTACAGACTGTAAAAATTGTTGATGAACTGGTCAAAGTAATGGGGCATAAGCCAGAAAATATCGTTATTGAAATGGCACGTGAAAATCAGACAACTCAAAAGGGCCAGAAAAATTCGCGAGAGCGTATGAAACGAATCGAAGAAGGTATCAAAGAATTAGGAAGTCAGATTCTTAAAGAGCATCCTGTTGAAAATACTCAATTGCAAAATGAAAAGCTCTATCTCTATTATCTACAAAATGGAAGAGACATGTATGTGGACCAAGAATTAGATATTAATCGTTTAAGTGATTATGATGTCGATCACATTGTTCCACAAAGTTTCATTAAAGACGATTCAATAGACAATAAGGTACTAACGCGTTCTGATAAAAATCGTGGTAAATCGGATAACGTTCCAAGTGAAGAAGTAGTCAAAAAGATGAAAAACTATTGGAGACAACTTCTAAACGCCAAGTTAATCACTCAACGTAAGTTTGATAATTTAACGAAAGCTGAACGTGGAGGTTTGAGTGAACTTGATAAAGCTGGTTTTATCAAACGCCAATTGGTTGAAACTCGCCAAATCACTAAGCATGTGGCACAAATTTTGGATAGTCGCATGAATACTAAATACGATGAAAATGATAAACTTATTCGAGAGGTTAAAGTGATTACCTTAAAATCTAAATTAGTTTCTGACTTCCGAAAAGATTTCCAATTCTATAAAGTACGTGAGATTAACAATTACCATCATGCCCATGATGCGTATCTAAATGCCGTCGTTGGAACTGCTTTGATTAAGAAATATCCAAAACTTGAATCGGAGTTTGTCTATGGTGATTATAAAGTTTATGATGTTCGTAAAATGATTGCTAAGTCTGAGCAAGAAATAGGCAAAGCAACCGCAAAATATTTCTTTTACTCTAATATCATGAACTTCTTCAAAACAGAAATTACACTTGCAAATGGAGAGATTCGCAAACGCCCTCTAATCGAAACTAATGGGGAAACTGGAGAAATTGTCTGGGATAAAGGGCGAGATTTTGCCACAGTGCGCAAAGTATTGTCCATGCCCCAAGTCAATATTGTCAAGAAAACAGAAGTACAGACAGGCGGATTCTCCAAGGAGTCAATTTTACCAAAAAGAAATTCGGACAAGCTTATTGCTCGTAAAAAAGACTGGGATCCAAAAAAATATGGTGGTTTTGATAGTCCAACGGTAGCTTATTCAGTCCTAGTGGTTGCTAAGGTGGAAAAAGGGAAATCGAAGAAGTTAAAATCCGTTAAAGAGTTACTAGGGATCACAATTATGGAAAGAAGTTCCTTTGAAAAAAATCCGATTGACTTTTTAGAAGCTAAAGGATATAAGGAAGTTAAAAAAGACTTAATCATTAAACTACCTAAATATAGTCTTTTTGAGTTAGAAAACGGTCGTAAACGGATGCTGGCTAGTGCCGGAGAATTACAAAAAGGAAATGAGCTGGCTCTGCCAAGCAAATATGTGAATTTTTTATATTTAGCTAGTCATTATGAAAAGTTGAAGGGTAGTCCAGAAGATAACGAACAAAAACAATTGTTTGTGGAGCAGCATAAGCATTATTTAGATGAGATTATTGAGCAAATCAGTGAATTTTCTAAGCGTGTTATTTTAGCAGATGCCAATTTAGATAAAGTTCTTAGTGCATATAACAAACATAGAGACAAACCAATACGTGAACAAGCAGAAAATATTATTCATTTATTTACGTTGACGAATCTTGGAGCTCCCGCTGCTTTTAAATATTTTGATACAACAATTGATCGTAAACGATATACGTCTACAAAAGAAGTTTTAGATGCCACTCTTATCCATCAATCCATCACTGGTCTTTATGAAACACGCATTGATTTGAGTCAGCTAGGAGGTGACTGA

（一重下線：HNHドメイン；二重下線：RuvCドメイン）

いくつかの実施形態において、野生型Cas9は、以下のヌクレオチドおよび/またはアミノ酸配列に対応するか、またはこれらを含む：
ATGGATAAAAAGTATTCTATTGGTTTAGACATCGGCACTAATTCCGTTGGATGGGCTGTCATAACCGATGAATACAAAGTACCTTCAAAGAAATTTAAGGTGTTGGGGAACACAGACCGTCATTCGATTAAAAAGAATCTTATCGGTGCCCTCCTATTCGATAGTGGCGAAACGGCAGAGGCGACTCGCCTGAAACGAACCGCTCGGAGAAGGTATACACGTCGCAAGAACCGAATATGTTACTTACAAGAAATTTTTAGCAATGAGATGGCCAAAGTTGACGATTCTTTCTTTCACCGTTTGGAAGAGTCCTTCCTTGTCGAAGAGGACAAGAAACATGAACGGCACCCCATCTTTGGAAACATAGTAGATGAGGTGGCATATCATGAAAAGTACCCAACGATTTATCACCTCAGAAAAAAGCTAGTTGACTCAACTGATAAAGCGGACCTGAGGTTAATCTACTTGGCTCTTGCCCATATGATAAAGTTCCGTGGGCACTTTCTCATTGAGGGTGATCTAAATCCGGACAACTCGGATGTCGACAAACTGTTCATCCAGTTAGTACAAACCTATAATCAGTTGTTTGAAGAGAACCCTATAAATGCAAGTGGCGTGGATGCGAAGGCTATTCTTAGCGCCCGCCTCTCTAAATCCCGACGGCTAGAAAACCTGATCGCACAATTACCCGGAGAGAAGAAAAATGGGTTGTTCGGTAACCTTATAGCGCTCTCACTAGGCCTGACACCAAATTTTAAGTCGAACTTCGACTTAGCTGAAGATGCCAAATTGCAGCTTAGTAAGGACACGTACGATGACGATCTCGACAATCTACTGGCACAAATTGGAGATCAGTATGCGGACTTATTTTTGGCTGCCAAAAACCTTAGCGATGCAATCCTCCTATCTGACATACTGAGAGTTAATACTGAGATTACCAAGGCGCCGTTATCCGCTTCAATGATCAAAAGGTACGATGAACATCACCAAGACTTGACACTTCTCAAGGCCCTAGTCCGTCAGCAACTGCCTGAGAAATATAAGGAAATATTCTTTGATCAGTCGAAAAACGGGTACGCAGGTTATATTGACGGCGGAGCGAGTCAAGAGGAATTCTACAAGTTTATCAAACCCATATTAGAGAAGATGGATGGGACGGAAGAGTTGCTTGTAAAACTCAATCGCGAAGATCTACTGCGAAAGCAGCGGACTTTCGACAACGGTAGCATTCCACATCAAATCCACTTAGGCGAATTGCATGCTATACTTAGAAGGCAGGAGGATTTTTATCCGTTCCTCAAAGACAATCGTGAAAAGATTGAGAAAATCCTAACCTTTCGCATACCTTACTATGTGGGACCCCTGGCCCGAGGGAACTCTCGGTTCGCATGGATGACAAGAAAGTCCGAAGAAACGATTACTCCATGGAATTTTGAGGAAGTTGTCGATAAAGGTGCGTCAGCTCAATCGTTCATCGAGAGGATGACCAACTTTGACAAGAATTTACCGAACGAAAAAGTATTGCCTAAGCACAGTTTACTTTACGAGTATTTCACAGTGTACAATGAACTCACGAAAGTTAAGTATGTCACTGAGGGCATGCGTAAACCCGCCTTTCTAAGCGGAGAACAGAAGAAAGCAATAGTAGATCTGTTATTCAAGACCAACCGCAAAGTGACAGTTAAGCAATTGAAAGAGGACTACTTTAAGAAAATTGAATGCTTCGATTCTGTCGAGATCTCCGGGGTAGAAGATCGATTTAATGCGTCACTTGGTACGTATCATGACCTCCTAAAGATAATTAAAGATAAGGACTTCCTGGATAACGAAGAGAATGAAGATATCTTAGAAGATATAGTGTTGACTCTTACCCTCTTTGAAGATCGGGAAATGATTGAGGAAAGACTAAAAACATACGCTCACCTGTTCGACGATAAGGTTATGAAACAGTTAAAGAGGCGTCGCTATACGGGCTGGGGACGATTGTCGCGGAAACTTATCAACGGGATAAGAGACAAGCAAAGTGGTAAAACTATTCTCGATTTTCTAAAGAGCGACGGCTTCGCCAATAGGAACTTTATGCAGCTGATCCATGATGACTCTTTAACCTTCAAAGAGGATATACAAAAGGCACAGGTTTCCGGACAAGGGGACTCATTGCACGAACATATTGCGAATCTTGCTGGTTCGCCAGCCATCAAAAAGGGCATACTCCAGACAGTCAAAGTAGTGGATGAGCTAGTTAAGGTCATGGGACGTCACAAACCGGAAAACATTGTAATCGAGATGGCACGCGAAAATCAAACGACTCAGAAGGGGCAAAAAAACAGTCGAGAGCGGATGAAGAGAATAGAAGAGGGTATTAAAGAACTGGGCAGCCAGATCTTAAAGGAGCATCCTGTGGAAAATACCCAATTGCAGAACGAGAAACTTTACCTCTATTACCTACAAAATGGAAGGGACATGTATGTTGATCAGGAACTGGACATAAACCGTTTATCTGATTACGACGTCGATCACATTGTACCCCAATCCTTTTTGAAGGACGATTCAATCGACAATAAAGTGCTTACACGCTCGGATAAGAACCGAGGGAAAAGTGACAATGTTCCAAGCGAGGAAGTCGTAAAGAAAATGAAGAACTATTGGCGGCAGCTCCTAAATGCGAAACTGATAACGCAAAGAAAGTTCGATAACTTAACTAAAGCTGAGAGGGGTGGCTTGTCTGAACTTGACAAGGCCGGATTTATTAAACGTCAGCTCGTGGAAACCCGCCAAATCACAAAGCATGTTGCACAGATACTAGATTCCCGAATGAATACGAAATACGACGAGAACGATAAGCTGATTCGGGAAGTCAAAGTAATCACTTTAAAGTCAAAATTGGTGTCGGACTTCAGAAAGGATTTTCAATTCTATAAAGTTAGGGAGATAAATAACTACCACCATGCGCACGACGCTTATCTTAATGCCGTCGTAGGGACCGCACTCATTAAGAAATACCCGAAGCTAGAAAGTGAGTTTGTGTATGGTGATTACAAAGTTTATGACGTCCGTAAGATGATCGCGAAAAGCGAACAGGAGATAGGCAAGGCTACAGCCAAATACTTCTTTTATTCTAACATTATGAATTTCTTTAAGACGGAAATCACTCTGGCAAACGGAGAGATACGCAAACGACCTTTAATTGAAACCAATGGGGAGACAGGTGAAATCGTATGGGATAAGGGCCGGGACTTCGCGACGGTGAGAAAAGTTTTGTCCATGCCCCAAGTCAACATAGTAAAGAAAACTGAGGTGCAGACCGGAGGGTTTTCAAAGGAATCGATTCTTCCAAAAAGGAATAGTGATAAGCTCATCGCTCGTAAAAAGGACTGGGACCCGAAAAAGTACGGTGGCTTCGATAGCCCTACAGTTGCCTATTCTGTCCTAGTAGTGGCAAAAGTTGAGAAGGGAAAATCCAAGAAACTGAAGTCAGTCAAAGAATTATTGGGGATAACGATTATGGAGCGCTCGTCTTTTGAAAAGAACCCCATCGACTTCCTTGAGGCGAAAGGTTACAAGGAAGTAAAAAAGGATCTCATAATTAAACTACCAAAGTATAGTCTGTTTGAGTTAGAAAATGGCCGAAAACGGATGTTGGCTAGCGCCGGAGAGCTTCAAAAGGGGAACGAACTCGCACTACCGTCTAAATACGTGAATTTCCTGTATTTAGCGTCCCATTACGAGAAGTTGAAAGGTTCACCTGAAGATAACGAACAGAAGCAACTTTTTGTTGAGCAGCACAAACATTATCTCGACGAAATCATAGAGCAAATTTCGGAATTCAGTAAGAGAGTCATCCTAGCTGATGCCAATCTGGACAAAGTATTAAGCGCATACAACAAGCACAGGGATAAACCCATACGTGAGCAGGCGGAAAATATTATCCATTTGTTTACTCTTACCAACCTCGGCGCTCCAGCCGCATTCAAGTATTTTGACACAACGATAGATCGCAAACGATACACTTCTACCAAGGAGGTGCTAGACGCGACACTGATTCACCAATCCATCACGGGATTATATGAAACTCGGATAGATTTGTCACAGCTTGGGGGTGACGGATCCCCCAAGAAGAAGAGGAAAGTCTCGAGCGACTACAAAGACCATGACGGTGATTATAAAGATCATGACATCGATTACAAGGATGACGATGACAAGGCTGCAGGA

（一重下線：HNHドメイン；二重下線：RuvCドメイン）

ある態様において、野生型Cas9は、Streptococcus pyogenesからのCas9（NCBI Reference Sequence: NC_002737.2（ヌクレオチド配列は以下の通り）およびUniprot Reference Sequence: Q99ZW2（アミノ酸配列は以下の通り）に対応する：
ATGGATAAGAAATACTCAATAGGCTTAGATATCGGCACAAATAGCGTCGGATGGGCGGTGATCACTGATGAATATAAGGTTCCGTCTAAAAAGTTCAAGGTTCTGGGAAATACAGACCGCCACAGTATCAAAAAAAATCTTATAGGGGCTCTTTTATTTGACAGTGGAGAGACAGCGGAAGCGACTCGTCTCAAACGGACAGCTCGTAGAAGGTATACACGTCGGAAGAATCGTATTTGTTATCTACAGGAGATTTTTTCAAATGAGATGGCGAAAGTAGATGATAGTTTCTTTCATCGACTTGAAGAGTCTTTTTTGGTGGAAGAAGACAAGAAGCATGAACGTCATCCTATTTTTGGAAATATAGTAGATGAAGTTGCTTATCATGAGAAATATCCAACTATCTATCATCTGCGAAAAAAATTGGTAGATTCTACTGATAAAGCGGATTTGCGCTTAATCTATTTGGCCTTAGCGCATATGATTAAGTTTCGTGGTCATTTTTTGATTGAGGGAGATTTAAATCCTGATAATAGTGATGTGGACAAACTATTTATCCAGTTGGTACAAACCTACAATCAATTATTTGAAGAAAACCCTATTAACGCAAGTGGAGTAGATGCTAAAGCGATTCTTTCTGCACGATTGAGTAAATCAAGACGATTAGAAAATCTCATTGCTCAGCTCCCCGGTGAGAAGAAAAATGGCTTATTTGGGAATCTCATTGCTTTGTCATTGGGTTTGACCCCTAATTTTAAATCAAATTTTGATTTGGCAGAAGATGCTAAATTACAGCTTTCAAAAGATACTTACGATGATGATTTAGATAATTTATTGGCGCAAATTGGAGATCAATATGCTGATTTGTTTTTGGCAGCTAAGAATTTATCAGATGCTATTTTACTTTCAGATATCCTAAGAGTAAATACTGAAATAACTAAGGCTCCCCTATCAGCTTCAATGATTAAACGCTACGATGAACATCATCAAGACTTGACTCTTTTAAAAGCTTTAGTTCGACAACAACTTCCAGAAAAGTATAAAGAAATCTTTTTTGATCAATCAAAAAACGGATATGCAGGTTATATTGATGGGGGAGCTAGCCAAGAAGAATTTTATAAATTTATCAAACCAATTTTAGAAAAAATGGATGGTACTGAGGAATTATTGGTGAAACTAAATCGTGAAGATTTGCTGCGCAAGCAACGGACCTTTGACAACGGCTCTATTCCCCATCAAATTCACTTGGGTGAGCTGCATGCTATTTTGAGAAGACAAGAAGACTTTTATCCATTTTTAAAAGACAATCGTGAGAAGATTGAAAAAATCTTGACTTTTCGAATTCCTTATTATGTTGGTCCATTGGCGCGTGGCAATAGTCGTTTTGCATGGATGACTCGGAAGTCTGAAGAAACAATTACCCCATGGAATTTTGAAGAAGTTGTCGATAAAGGTGCTTCAGCTCAATCATTTATTGAACGCATGACAAACTTTGATAAAAATCTTCCAAATGAAAAAGTACTACCAAAACATAGTTTGCTTTATGAGTATTTTACGGTTTATAACGAATTGACAAAGGTCAAATATGTTACTGAAGGAATGCGAAAACCAGCATTTCTTTCAGGTGAACAGAAGAAAGCCATTGTTGATTTACTCTTCAAAACAAATCGAAAAGTAACCGTTAAGCAATTAAAAGAAGATTATTTCAAAAAAATAGAATGTTTTGATAGTGTTGAAATTTCAGGAGTTGAAGATAGATTTAATGCTTCATTAGGTACCTACCATGATTTGCTAAAAATTATTAAAGATAAAGATTTTTTGGATAATGAAGAAAATGAAGATATCTTAGAGGATATTGTTTTAACATTGACCTTATTTGAAGATAGGGAGATGATTGAGGAAAGACTTAAAACATATGCTCACCTCTTTGATGATAAGGTGATGAAACAGCTTAAACGTCGCCGTTATACTGGTTGGGGACGTTTGTCTCGAAAATTGATTAATGGTATTAGGGATAAGCAATCTGGCAAAACAATATTAGATTTTTTGAAATCAGATGGTTTTGCCAATCGCAATTTTATGCAGCTGATCCATGATGATAGTTTGACATTTAAAGAAGACATTCAAAAAGCACAAGTGTCTGGACAAGGCGATAGTTTACATGAACATATTGCAAATTTAGCTGGTAGCCCTGCTATTAAAAAAGGTATTTTACAGACTGTAAAAGTTGTTGATGAATTGGTCAAAGTAATGGGGCGGCATAAGCCAGAAAATATCGTTATTGAAATGGCACGTGAAAATCAGACAACTCAAAAGGGCCAGAAAAATTCGCGAGAGCGTATGAAACGAATCGAAGAAGGTATCAAAGAATTAGGAAGTCAGATTCTTAAAGAGCATCCTGTTGAAAATACTCAATTGCAAAATGAAAAGCTCTATCTCTATTATCTCCAAAATGGAAGAGACATGTATGTGGACCAAGAATTAGATATTAATCGTTTAAGTGATTATGATGTCGATCACATTGTTCCACAAAGTTTCCTTAAAGACGATTCAATAGACAATAAGGTCTTAACGCGTTCTGATAAAAATCGTGGTAAATCGGATAACGTTCCAAGTGAAGAAGTAGTCAAAAAGATGAAAAACTATTGGAGACAACTTCTAAACGCCAAGTTAATCACTCAACGTAAGTTTGATAATTTAACGAAAGCTGAACGTGGAGGTTTGAGTGAACTTGATAAAGCTGGTTTTATCAAACGCCAATTGGTTGAAACTCGCCAAATCACTAAGCATGTGGCACAAATTTTGGATAGTCGCATGAATACTAAATACGATGAAAATGATAAACTTATTCGAGAGGTTAAAGTGATTACCTTAAAATCTAAATTAGTTTCTGACTTCCGAAAAGATTTCCAATTCTATAAAGTACGTGAGATTAACAATTACCATCATGCCCATGATGCGTATCTAAATGCCGTCGTTGGAACTGCTTTGATTAAGAAATATCCAAAACTTGAATCGGAGTTTGTCTATGGTGATTATAAAGTTTATGATGTTCGTAAAATGATTGCTAAGTCTGAGCAAGAAATAGGCAAAGCAACCGCAAAATATTTCTTTTACTCTAATATCATGAACTTCTTCAAAACAGAAATTACACTTGCAAATGGAGAGATTCGCAAACGCCCTCTAATCGAAACTAATGGGGAAACTGGAGAAATTGTCTGGGATAAAGGGCGAGATTTTGCCACAGTGCGCAAAGTATTGTCCATGCCCCAAGTCAATATTGTCAAGAAAACAGAAGTACAGACAGGCGGATTCTCCAAGGAGTCAATTTTACCAAAAAGAAATTCGGACAAGCTTATTGCTCGTAAAAAAGACTGGGATCCAAAAAAATATGGTGGTTTTGATAGTCCAACGGTAGCTTATTCAGTCCTAGTGGTTGCTAAGGTGGAAAAAGGGAAATCGAAGAAGTTAAAATCCGTTAAAGAGTTACTAGGGATCACAATTATGGAAAGAAGTTCCTTTGAAAAAAATCCGATTGACTTTTTAGAAGCTAAAGGATATAAGGAAGTTAAAAAAGACTTAATCATTAAACTACCTAAATATAGTCTTTTTGAGTTAGAAAACGGTCGTAAACGGATGCTGGCTAGTGCCGGAGAATTACAAAAAGGAAATGAGCTGGCTCTGCCAAGCAAATATGTGAATTTTTTATATTTAGCTAGTCATTATGAAAAGTTGAAGGGTAGTCCAGAAGATAACGAACAAAAACAATTGTTTGTGGAGCAGCATAAGCATTATTTAGATGAGATTATTGAGCAAATCAGTGAATTTTCTAAGCGTGTTATTTTAGCAGATGCCAATTTAGATAAAGTTCTTAGTGCATATAACAAACATAGAGACAAACCAATACGTGAACAAGCAGAAAATATTATTCATTTATTTACGTTGACGAATCTTGGAGCTCCCGCTGCTTTTAAATATTTTGATACAACAATTGATCGTAAACGATATACGTCTACAAAAGAAGTTTTAGATGCCACTCTTATCCATCAATCCATCACTGGTCTTTATGAAACACGCATTGATTTGAGTCAGCTAGGAGGTGACTGA

（一重下線：HNHドメイン；二重下線：RuvCドメイン）

いくつかの実施態様において、Cas9は、Corynebacterium ulcerans (NCBI Refs: NC_015683.1, NC_017317.1); Corynebacterium diphtheria (NCBI Refs: NC_016782.1, NC_016786.1); Spiroplasma syrphidicola (NCBI Ref: NC_021284.1); Prevotella intermedia (NCBI Ref: NC_017861.1); Spiroplasma taiwanense (NCBI Ref: NC_021846.1); Streptococcus iniae (NCBI Ref: NC_021314.1); Belliella baltica (NCBI Ref: NC_018010.1); Psychroflexus torquisI (NCBI Ref: NC_018721.1); Streptococcus thermophilus (NCBI Ref: YP_820832.1), Listeria innocua (NCBI Ref: NP_472073.1), Campylobacter jejuni (NCBI Ref: YP_002344900.1) もしくはNeisseria meningitidis (NCBI Ref: YP_002342100.1) からのCas9を表し、または任意の他の生物からのCas9を表す。

追加的なCas9タンパク質（例えば、ヌクレアーゼ不活（dead）Cas9（dCas9）、Cas9ニッカーゼ（nCas9）、またはヌクレアーゼ活性Cas9)は、そのバリアントおよびホモログを含めて、本開示の範囲内にあることを理解されたい。例示的なCas9タンパク質は、限定されるものではないが、以下に提供されるものを含む。ある態様において、Cas9タンパク質は、ヌクレアーゼ不活Cas9 (dCas9) である。ある態様において、Cas9タンパク質は、Cas9ニッカーゼ(nCas9) である。いくつかの実施形態において、Cas9タンパク質はヌクレアーゼ活性Cas9である。

ある態様において、Cas9ドメインは、ヌクレアーゼ不活性Cas9ドメイン(dCas9) である。例えば、dCas9ドメインは、二本鎖核酸分子のいずれの鎖も切断することなく、二本鎖核酸分子に結合し得る(例えば、gRNA分子を介して)。いくつかの実施形態において、ヌクレアーゼ不活性dCas9ドメインは、本明細書中に記載されたアミノ酸配列のD10X突然変異およびH840X突然変異、または本明細書中に提供されたアミノ酸配列のいずれかにおける対応する突然変異を含み、Xは任意のアミノ酸変化である。いくつかの実施形態において、ヌクレアーゼ不活性dCas9ドメインは、本明細書に記載のアミノ酸配列のD10A突然変異およびH840A突然変異、または本明細書に記載のアミノ酸配列のいずれかにおける対応する突然変異を含む。一例として、ヌクレアーゼ不活性Cas9ドメインは、クローニングベクターpPlatTET-gRNA 2 (アクセス番号BAV54124)中に提供される以下のアミノ酸配列を含む。

例示的な、触媒的に不活性なCas9 (dCas9) のアミノ酸配列は、以下の通りである：
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDAIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD
（例えばQi et al., “Repurposing CRISPR as an RNA-guided platform for sequence-specific control of gene expression.” Cell. 2013; 152(5):1173-83参照（その内容全体が参照により本明細書に組み入れられる））。

さらなる適切なヌクレアーゼ不活性dCas9ドメインは、本開示および当該分野における知識に基づいて当業者に明らかとなり、本開示の範囲内である。このようなさらなる例示的な適切なヌクレアーゼ不活性Cas9ドメインには、限定されるものではないが、D10A/H840A、D10A/D839A/H840A、およびD10A/D839A/H840A/N863A突然変異体ドメインが含まれる(例えば、Prashant et al., CAS9 transcriptional activators for target specificity screening and paired nickases for cooperative genome engineering. Nature Biotechnology. 2013; 31(9): 833-838を参照されたい (その全内容は参照により本明細書に組み込まれる))。

ある態様において、Cas9ヌクレアーゼは、不活性な（例えば不活化された）DNA切断ドメインを有し、すなわち、Cas9は、「nCas9」タンパク質（「nickase」Cas9の意）と呼ばれるニッカーゼである。ヌクレアーゼ不活性化Cas9タンパク質は、互換的に「dCas9」タンパク質（nuclease-“dead” Cas9の意）または触媒的に不活性なCas9とも称され得る。不活性なDNA切断ドメインを有するCas9タンパク質(又はその断片)を生成する方法は公知である（例えばJinek et al, Science. 337:816-821(2012); Qi et al, “Repurposing CRISPR as an RNA-Guided Platform for Sequence-Specific Control of Gene Expression”(2013) Cell. 28; 152(5): 1173-83参照（各内容は参照により本明細書に組み込まれる））。例えば、Cas9のDNA切断ドメインは、HNHヌクレアーゼサブドメインとRuvC1サブドメインという2つのサブドメインを含むことが知られている。HNHサブドメインはgRNAに相補的な鎖を切断し、RuvC1サブドメインは非相補的な鎖を切断する。これらのサブドメイン内の変異はCas9のヌクレアーゼ活性を抑制し得る。例えば、突然変異D10AおよびH840Aは、S. pyogenes Cas9 のヌクレアーゼ活性を完全に不活性化する（Jinek et al, Science. 337:816-821(2012); Qi et al, Cell. 28;152(5): 1173-83 (2013)）。

いくつかの実施形態において、dCas9ドメインは、本明細書に提供されるdCas9ドメインのいずれかに対して少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも99.5%の同一性を有するアミノ酸配列を含む。いくつかの実施形態において、Cas9ドメインは、本明細書に記載されるアミノ酸配列のいずれかと比較して1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、21、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50またはそれ以上の突然変異を有するアミノ酸配列を含む。いくつかの実施形態において、Cas9ドメインは、本明細書に記載されたアミノ酸配列のいずれかと比較して、少なくとも10、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90、少なくとも100、少なくとも150、少なくとも200、少なくとも250、少なくとも300、少なくとも350、少なくとも400、少なくとも500、少なくとも600、少なくとも700、少なくとも800、少なくとも900、少なくとも1000、少なくとも1100、または少なくとも1200の同一の連続したアミノ酸残基を有するアミノ酸配列を含む。

ある態様において、dCas9は、Cas9ヌクレアーゼ活性を不活性化する1以上の突然変異を有するCas9アミノ酸配列に対応するか、またはその一部もしくは全体を含む。例えば、いくつかの実施形態において、dCas9ドメインは、D10AおよびH840A突然変異または別のCas9における対応する突然変異を含む。

いくつかの実施形態において、dCas9は、dCas9 (D10AおよびH840A)のアミノ酸配列を含む：

（一重下線：HNHドメイン；二重下線：RuvCドメイン）

他の実施形態において、例えばヌクレアーゼ不活性化Cas9 (dCas9) をもたらす、D10AおよびH840A以外の突然変異を有するdCas9バリアントが提供される。このような突然変異は、例えば、D10およびH840における他のアミノ酸置換、またはCas9のヌクレアーゼドメイン内の他の置換(例えば、HNHヌクレアーゼサブドメインおよび/またはRuvC1サブドメインにおける置換)を含む。ある態様において、dCas9のバリアントまたはホモログであって、少なくとも約70%同一、少なくとも約80%同一、少なくとも約90%同一、少なくとも約95%同一、少なくとも約98%同一、少なくとも約99%同一、少なくとも約99.5%同一、または少なくとも約99.9%の同一性を有するものが提供される。ある態様において、約5アミノ酸、約10アミノ酸、約15アミノ酸、約20アミノ酸、約25アミノ酸、約30アミノ酸、約40アミノ酸、約50アミノ酸、約75アミノ酸、約100アミノ酸またはそれ以上だけ短いまたは長いアミノ酸配列を有するdCas9のバリアントが提供される。

ある態様において、Cas9ドメインは、Cas9ニッカーゼである。Cas9ニッカーゼは、二本鎖核酸分子(例えば二本鎖DNA分子)の一方の鎖のみを切断することができるCas9タンパク質であり得る。いくつかの実施形態において、Cas9ニッカーゼは、二本鎖核酸分子の標的鎖を切断し、これは、Cas9ニッカーゼが、Cas9に結合しているgRNA（例えばsgRNA）と塩基対を形成している（相補的である）鎖を切断することを意味する。ある態様において、Cas9ニッカーゼは、D10A突然変異を含み、位置840にヒスチジンを有する。いくつかの実施形態において、Cas9ニッカーゼは、二本鎖核酸分子の非標的、非塩基編集鎖を切断し、これは、Cas9ニッカーゼが、Cas9に結合しているgRNA（例えばsgRNA）と塩基対を形成していない鎖を切断することを意味する。ある態様において、Cas9ニッカーゼは、H840A突然変異を含み位置10にアスパラギン酸残基を有するか、または対応する突然変異。いくつかの実施形態において、Cas9ニッカーゼは、本明細書に提供されるCas9ニッカーゼのいずれかと少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも99.5%の同一性であるアミノ酸配列を含む。さらなる適切なCas9ニッカーゼは、本開示および当該分野における知識に基づいて当業者に明らかであり、本開示の範囲内である。

例示的な触媒的Cas9ニッカーゼ (nCas9) のアミノ酸配列は、以下の通りである：
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD

ある態様において、Cas9は、単細胞原核微生物のドメインおよび界を構成する古細菌（例えばナノアーキア）由来のCas9を指す。ある態様において、プログラミング可能なヌクレオチド結合タンパク質は、例えば、Burstein et al., "New CRISPR-Cas systems from uncultivated microbes." Cell Res. 2017 Feb 21. doi: 10.1038/cr.2017.21に記載されているCasXまたはCasYタンパク質であり得、その全体の内容は参照により本明細書に組み込まれる。ゲノム分解メタゲノミクスを用いて、生命の古細菌ドメインにおいて最初に報告されたCas9を含め、多くのCRISPR‐Cas系が同定された。この分岐Cas9タンパク質は、ほとんど研究されていないナノアーキアにおいて、活性CRISPR‐Cas系の一部として発見された。細菌では、それまで知られていなかった二つの系、CRISPR-CasXとCRISPR-CasYが発見され、それらは、これまでに発見された中でも最もコンパクトな系に入る。いくつかの実施形態において、本明細書に記載される塩基エディターシステムにおいて、Cas9は、CasXまたはCasXのバリアントによって置き換えられる。いくつかの実施形態において、本明細書に記載される塩基エディターシステムにおいて、Cas9は、CasYまたはCasYのバリアントによって置き換えられる。核酸プログラム可能DNA結合タンパク質 (napDNAbp) として他のRNA誘導DNA結合タンパク質も使用され得、本開示の範囲内であることが理解されるべきである。

いくつかの実施形態において、本明細書で提供される融合タンパク質のいずれかの核酸プログラム可能DNA結合タンパク質 (napDNAbp) は、CasXまたはCasYタンパク質であり得る。いくつかの実施形態において、napDNAbpはCasXタンパク質である。いくつかの実施形態において、napDNAbpはCasYタンパク質である。いくつかの実施形態において、napDNAbpは、天然に存在するCasXまたはCasYタンパク質に対して少なくとも85%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも99.5%の同一性を有するアミノ酸配列を含む。いくつかの実施形態において、プログラミング可能なヌクレオチド結合タンパク質は、天然に存在するCasXまたはCasYタンパク質である。いくつかの実施形態において、プログラミング可能なヌクレオチド結合タンパク質は、本明細書に記載されるいずれかのCasXまたはCasYタンパク質に対して少なくとも85%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも99.5%の同一性を有するアミノ酸配列を含む。他の細菌種由来のCasXおよびCasYもまた、本開示に従って使用され得ることが理解されるべきである。

例示的なCasX ((uniprot.org/uniprot/F0NN87; uniprot.org/uniprot/F0NH53) tr|F0NN87|F0NN87_SULIHCRISPR-associatedCasx protein OS = Sulfolobus islandicus (strain HVE10/4) GN = SiH_0402 PE=4 SV=1)アミノ酸配列は以下の通りである：
MEVPLYNIFGDNYIIQVATEAENSTIYNNKVEIDDEELRNVLNLAYKIAKNNEDAAAERRGKAKKKKGEEGETTTSNIILPLSGNDKNPWTETLKCYNFPTTVALSEVFKNFSQVKECEEVSAPSFVKPEFYEFGRSPGMVERTRRVKLEVEPHYLIIAAAGWVLTRLGKAKVSEGDYVGVNVFTPTRGILYSLIQNVNGIVPGIKPETAFGLWIARKVVSSVTNPNVSVVRIYTISDAVGQNPTTINGGFSIDLTKLLEKRYLLSERLEAIARNALSISSNMRERYIVLANYIYEYLTG SKRLEDLLYFANRDLIMNLNSDDGKVRDLKLISAYVNGELIRGEG.

例示的なCasX (>tr|F0NH53|F0NH53_SULIR CRISPR associated protein, Casx OS = Sulfolobus islandicus (strain REY15A) GN=SiRe_0771 PE=4 SV=1) アミノ酸配列は以下の通りである：
MEVPLYNIFGDNYIIQVATEAENSTIYNNKVEIDDEELRNVLNLAYKIAKNNEDAAAERRGKAKKKKGEEGETTTSNIILPLSGNDKNPWTETLKCYNFPTTVALSEVFKNFSQVKECEEVSAPSFVKPEFYKFGRSPGMVERTRRVKLEVEPHYLIMAAAGWVLTRLGKAKVSEGDYVGVNVFTPTRGILYSLIQNVNGIVPGIKPETAFGLWIARKVVSSVTNPNVSVVSIYTISDAVGQNPTTINGGFSIDLTKLLEKRDLLSERLEAIARNALSISSNMRERYIVLANYIYEYLTGSKRLEDLLYFANRDLIMNLNSDDGKVRDLKLISAYVNGELIRGEG.

Deltaproteobacteria CasX
MEKRINKIRKKLSADNATKPVSRSGPMKTLLVRVMTDDLKKRLEKRRKKPEVMPQVISNNAANNLRMLLDDYTKMKEAILQVYWQEFKDDHVGLMCKFAQPASKKIDQNKLKPEMDEKGNLTTAGFACSQCGQPLFVYKLEQVSEKGKAYTNYFGRCNVAEHEKLILLAQLKPVKDSDEAVTYSLGKFGQRALDFYSIHVTKESTHPVKPLAQIAGNRYASGPVGKALSDACMGTIASFLSKYQDIIIEHQKVVKGNQKRLESLRELAGKENLEYPSVTLPPQPHTKEGVDfAYNEVIARVRMWVNLNLWQKLKLSRDDAKPLLRLKGFPSFPVVERRENEVDWWNTINEVKKLIDAKRDMGRVFWSGVTAEKRNTILEGYNYLPNENDHKKREGSLENPKKPAKRQFGDLLLYLEKKYAGDWGKVFDEAWERIDKKIAGLTSHIEREEARNAEDAQSKAVLTDWLRAKASFVLERLKEMDEKEFYACEIQLQKWYGDLRGNPFAVEAENRVVDISGFSIGSDGHSIQYRNLLAWKYLENGKREFYLLMNYGKKGRIRFTDGTDIKKSGKWQGLLYGGGKAKVIDLTFDPDDEQLIILPLAFGTRQGREFIWNDLLSLETGLIKLANGRVIEKTIYNKKIGRDEPALFVALTFERREVVDPSNIKPVNLIGVARGENIPAVIALTDPEGCPLPEFKDSSGGPTDILRIGEGYKEKQRAIQAAKEVEQRRAGGYSRKFASKSRNLADDMVRNSARDLFYHAVTHDAVLVFANLSRGFGRQGKRTFMTERQYTKMEDWLTAKLAYEGLTSKTYLSKTLAQYTSKTCSNCGFTITYADMDVMLVRLKKTSDGWATTLNNKELKAEYQITYYNRYKRQTVEKELSAELDRLSEESGNNDISKWTKGRRDEALFLLKKRFSHRPVQEQFVCLDCGHEVHAAEQAALNIARSWLFLNSNSTEFKSYKSGKQPFVGAWQAFYKRRLKEVWKPNA

例示的なCasY ((ncbi.nlm.nih.gov/protein/APG80656.1) >APG80656.1 CRISPR-associated protein CasY [uncultured Parcubacteria group bacterium]) アミノ酸配列は以下の通りである：
MSKRHPRISGVKGYRLHAQRLEYTGKSGAMRTIKYPLYSSPSGGRTVPREIVSAINDDYVGLYGLSNFDDLYNAEKRNEEKVYSVLDFWYDCVQYGAVFSYTAPGLLKNVAEVRGGSYELTKTLKGSHLYDELQIDKVIKFLNKKEISRANGSLDKLKKDIIDCFKAEYRERHKDQCNKLADDIKNAKKDAGASLGERQKKLFRDFFGISEQSENDKPSFTNPLNLTCCLLPFDTVNNNRNRGEVLFNKLKEYAQKLDKNEGSLEMWEYIGIGNSGTAFSNFLGEGFLGRLRENKITELKKAMMDITDAWRGQEQEEELEKRLRILAALTIKLREPKFDNHWGGYRSDINGKLSSWLQNYINQTVKIKEDLKGHKKDLKKAKEMINRFGESDTKEEAVVSSLLESIEKIVPDDSADDEKPDIPAIAIYRRFLSDGRLTLNRFVQREDVQEALIKERLEAEKKKKPKKRKKKSDAEDEKETIDFKELFPHLAKPLKLVPNFYGDSKRELYKKYKNAAIYTDALWKAVEKIYKSAFSSSLKNSFFDTDFDKDFFIKRLQKIFSVYRRFNTDKWKPIVKNSFAPYCDIVSLAENEVLYKPKQSRSRKSAAIDKNRVRLPSTENIAKAGIALARELSVAGFDWKDLLKKEEHEEYIDLIELHKTALALLLAVTETQLDISALDFVENGTVKDFMKTRDGNLVLEGRFLEMFSQSIVFSELRGLAGLMSRKEFITRSAIQTMNGKQAELLYIPHEFQSAKITTPKEMSRAFLDLAPAEFATSLEPESLSEKSLLKLKQMRYYPHYFGYELTRTGQGIDGGVAENALRLEKSPVKKREIKCKQYKTLGRGQNKIVLYVRSSYYQTQFLEWFLHRPKNVQTDVAVSGSFLIDEKKVKTRWNYDALTVALEPVSGSERVFVSQPFTIFPEKSAEEEGQRYLGIDIGEYGIAYTALEITGDSAKILDQNFISDPQLKTLREEVKGLKLDQRRGTFAMPSTKIARIRESLVHSLRNRIHHLALKHKAKIVYELEVSRFEEGKQKIKKVYATLKKADVYSEIDADKNLQTTVWGKLAVASEISASYTSQFCGACKKLWRAEMQVDETITTQELIGTVRVIKGGTLIDAIKDFMRPPIFDENDTPFPKYRDFCDKHHISKKMRGNSCLFICPFCRANADADIQASQTIALLRYVKEEKKVEDYFERFRKLKNIKVLGQMKKI.

いくつかの実施形態では、Cas9は、Neisseria menigitidis Cas9（NmeCas9）またはそのバリアントである。Edraki et al. Mol. Cell. (2019) 73(4): 714-726に記載されているNmeCas9の特徴とPAM配列は、その全体が参照により本明細書に組み込まれる。

Nme1Cas9の例示的なアミノ酸配列を以下に提供する：
type II CRISPR RNA-guided endonuclease Cas9 [Neisseria meningitidis] WP_002235162.1
1 maafkpnpin yilgldigia svgwamveid edenpiclid lgvrvferae vpktgdslam
61 arrlarsvrr ltrrrahrll rarrllkreg vlqaadfden glikslpntp wqlraaaldr
121 kltplewsav llhlikhrgy lsqrkneget adkelgallk gvadnahalq tgdfrtpael
181 alnkfekesg hirnqrgdys htfsrkdlqa elillfekqk efgnphvsgg lkegietllm
241 tqrpalsgda vqkmlghctf epaepkaakn tytaerfiwl tklnnlrile qgserpltdt
301 eratlmdepy rkskltyaqa rkllgledta ffkglrygkd naeastlmem kayhaisral
361 ekeglkdkks plnlspelqd eigtafslfk tdeditgrlk driqpeilea llkhisfdkf
421 vqislkalrr ivplmeqgkr ydeacaeiyg dhygkkntee kiylppipad eirnpvvlra
481 lsqarkving vvrrygspar ihietarevg ksfkdrkeie krqeenrkdr ekaaakfrey
541 fpnfvgepks kdilklrlye qqhgkclysg keinlgrlne kgyveidhal pfsrtwddsf
601 nnkvlvlgse nqnkgnqtpy eyfngkdnsr ewqefkarve tsrfprskkq rillqkfded
661 gfkernlndt ryvnrflcqf vadrmrltgk gkkrvfasng qitnllrgfw glrkvraend
721 rhhaldavvv acstvamqqk itrfvrykem nafdgktidk etgevlhqkt hfpqpweffa
781 qevmirvfgk pdgkpefeea dtpeklrtll aeklssrpea vheyvtplfv srapnrkmsg
841 qghmetvksa krldegvsvl rvpltqlklk dlekmvnrer epklyealka rleahkddpa
901 kafaepfyky dkagnrtqqv kavrveqvqk tgvwvrnhng iadnatmvrv dvfekgdkyy
961 lvpiyswqva kgilpdravv qgkdeedwql iddsfnfkfs lhpndlvevi tkkarmfgyf
1021 aschrgtgni nirihdldhk igkngilegi gvktalsfqk yqidelgkei rpcrlkkrpp
1081 vr

Nme2Cas9の例示的なアミノ酸配列を以下に提供する：
type II CRISPR RNA-guided endonuclease Cas9 [Neisseria meningitidis] WP_002230835.1
1 maafkpnpin yilgldigia svgwamveid eeenpirlid lgvrvferae vpktgdslam
61 arrlarsvrr ltrrrahrll rarrllkreg vlqaadfden glikslpntp wqlraaaldr
121 kltplewsav llhlikhrgy lsqrkneget adkelgallk gvannahalq tgdfrtpael
181 alnkfekesg hirnqrgdys htfsrkdlqa elillfekqk efgnphvsgg lkegietllm
241 tqrpalsgda vqkmlghctf epaepkaakn tytaerfiwl tklnnlrile qgserpltdt
301 eratlmdepy rkskltyaqa rkllgledta ffkglrygkd naeastlmem kayhaisral
361 ekeglkdkks plnlsselqd eigtafslfk tdeditgrlk drvqpeilea llkhisfdkf
421 vqislkalrr ivplmeqgkr ydeacaeiyg dhygkkntee kiylppipad eirnpvvlra
481 lsqarkving vvrrygspar ihietarevg ksfkdrkeie krqeenrkdr ekaaakfrey
541 fpnfvgepks kdilklrlye qqhgkclysg keinlvrlne kgyveidhal pfsrtwddsf
601 nnkvlvlgse nqnkgnqtpy eyfngkdnsr ewqefkarve tsrfprskkq rillqkfded
661 gfkecnlndt ryvnrflcqf vadhilltgk gkrrvfasng qitnllrgfw glrkvraend
721 rhhaldavvv acstvamqqk itrfvrykem nafdgktidk etgkvlhqkt hfpqpweffa
781 qevmirvfgk pdgkpefeea dtpeklrtll aeklssrpea vheyvtplfv srapnrkmsg
841 ahkdtlrsak rfvkhnekis vkrvwlteik ladlenmvny kngreielye alkarleayg
901 gnakqafdpk dnpfykkggq lvkavrvekt qesgvllnkk naytiadngd mvrvdvfckv
961 dkkgknqyfi vpiyawqvae nilpdidckg yriddsytfc fslhkydlia fqkdekskve
1021 fayyincdss ngrfylawhd kgskeqqfri stqnlvliqk yqvnelgkei rpcrlkkrpp
1081 vr

Cas9ヌクレアーゼはRuvCとHNHという二つの機能性エンドヌクレアーゼ領域をもっている。Cas9は標的DNAに結合するとコンホメーション変化を起こし、これがヌクレアーゼドメインを位置付け、標的DNAの反対側の鎖を切断させる。Cas9を介したDNA切断の最終結果は、標的DNA内の二本鎖切断 (DSB) である(PAM配列の約3～4ヌクレオチド上流)。生じたDSBは、次の二つの一般的修復経路のうちの一つにより修復される: (1) 効率的だが誤りがちな非相同末端結合 (NHEJ) 経路；または (2) 効率は低いが忠実度の高い相同性誘導修復 (HDR) 経路。

非相同末端結合 (NHEJ) および/または相同性指向修復 (HDR) の「効率」は、任意の簡便な方法によって計算することができる。例えば、ある実施形態では、効率は、成功したHDRのパーセンテージで表すことができる。例えば、検査用ヌクレアーゼ分析を用いて切断産物を生成し、基質に対する産物の比を用いてパーセンテージを計算することができる。たとえば、HDRが成功した結果として新たに組み込まれた制限配列を含むDNAを直接切断する測量用ヌクレアーゼ酵素を使用することができる。切断される基質が多いほどHDRの割合が高かった(HDRの効率がより高かった)ことを示す。例示的な例として、HDRの割合 (パーセンテージ) は、以下の式を用いて計算することができる[(切断産物)/(基質+切断産物)] （例えば、 (b+c) / (a+b+c) ここで、「a」はDNA基質のバンド強度であり、「b」および「c」は切断生成物である。)。

ある実施形態では、効率はNHEJの成功率で表すことができる。例えば、T7エンドヌクレアーゼIアッセイを用いて切断産物を生成し、基質に対する産物の比を用いてNHEJのパーセンテージを計算することができる。T7エンドヌクレアーゼIは、野生型および突然変異体DNA鎖（NHEJは最初の切断部位に小さなランダムな挿入（insertion）や欠失（deletion）（インデル：indel）を生じる）のハイブリダイゼーションから生じるミスマッチのヘテロ二本鎖DNAを切断する。切断が多いほどNHEJの割合が高いこと(NHEJの効率が高いこと)を示す。例示的な例として、NHEJの割合 (パーセンテージ) は、式(1-(1-(b+c)/(a+b+c))^1/2) ×100を用いて計算することができ、ここで、「a」はDNA基質のバンド強度であり、「b」および「c」は切断生成物である（Ran et. al., Cell. 2013 Sep. 12; 154(6):1380-9; and Ran et al., Nat Protoc. 2013 Nov.; 8(11): 2281-2308）。

NHEJ修復経路は最も活性な修復機構であり、DSB部位での小ヌクレオチド挿入または欠失 (インデル) を頻繁に引き起こす。NHEJ媒介DSB修復のランダム性は、Cas9およびgRNAまたはガイドポリヌクレオチドを発現する細胞集団が多様な突然変異のアレイをもたらし得るので、重要な実際的意味を有する。ほとんどの実施形態で、NHEJは標的DNAに小さなインデルを生じさせ、その結果、標的遺伝子のオープンリーディングフレーム (ORF) 内に未熟な終止コドンをもたらすアミノ酸欠失、挿入、またはフレームシフト突然変異が生じる。理想的な最終結果は、標的遺伝子内の機能喪失型変異である。

NHEJ媒介DSB修復はしばしば遺伝子のオープンリーディングフレームを破壊するが、相同性指向修復 (HDR) は単一ヌクレオチド変化からフルオロフォアまたはタグの付加のような大きな挿入までの範囲の特異的ヌクレオチド変化を生成するために使用できる。HDRを遺伝子編集に利用するために、所望の配列を含むDNA修復テンプレートを、gRNAおよびCas9またはCas9ニッカーゼと共に目的の細胞型に送達することができる。修復テンプレートは、所望の編集ならびにその標的のすぐ上流および下流(左右相同アームと呼ばれる)にさらなる相同配列を含むことができる。各相同アームの長さは導入される変化の大きさに依存し得、より大きな挿入はより長い相同アームを必要とする。修復鋳型は、一本鎖オリゴヌクレオチド、二本鎖オリゴヌクレオチド、または二本鎖DNAプラスミドであり得る。HDRの効率は、Cas9、gRNAおよび外因性修復テンプレートを発現する細胞においても、一般的に低い(10%未満の修正アリル)。HDRは細胞周期のS期とG2期の間に起こるので、細胞を同調させることによってHDRの効率を高めることができる。NHEJに関与する遺伝子を化学的または遺伝的に阻害することもHDR頻度を増加させ得る。

いくつかの実施態様において、Cas9は、修飾（改変）Cas9である。所与のgRNA標的配列は、ゲノム全体にわたり、部分的な相同性が存在するさらなる部位を有し得る。これらの部位はオフターゲットと呼ばれ、gRNAを設計する際に考慮する必要があるが、gRNAの設計を最適化することに加えて、Cas9を修飾することによってCRISPRの特異性を高めることもできる。Cas9は2つのヌクレアーゼドメイン、RuvCおよびHNHの組合せ活性を介して二本鎖切断 (DSB) を生成する。SpCas9のD10A変異体であるCas9ニッカーゼは1つのヌクレアーゼドメインを保持し、DSBではなくDNAニックを生成する。特異的遺伝子編集のためのHDR媒介遺伝子編集にニッカーゼを組み合わせることもできる。

ある実施形態では、Cas9はバリアントCas9タンパク質である。バリアントCas9ポリペプチドは、野生型Cas9タンパク質のアミノ酸配列と比較して、一アミノ酸単位で異なる(例えば、欠失、挿入、置換、融合を有する)アミノ酸配列を有する。いくつかの例において、バリアントCas9ポリペプチドは、Cas9ポリペプチドのヌクレアーゼ活性を低下させるアミノ酸変化(例えば欠失、挿入、または置換)を有する。例えば、いくつかの例において、バリアントCas9ポリペプチドは、対応する野生型Cas9タンパク質のヌクレアーゼ活性の50%未満、40%未満、30%未満、20%未満、10%未満、5%未満、または1%未満を有する。ある実施形態では、バリアントCas9タンパク質は実質的なヌクレアーゼ活性をもたない。対象Cas9タンパク質が、実質的なヌクレアーゼ活性を有さないバリアントCas9タンパク質である場合、それは「dCas9」と称され得る。

ある実施形態では、バリアントCas9タンパク質は低減されたヌクレアーゼ活性を有する。例えば、バリアントCas9タンパク質は、野生型Cas9タンパク質（例えば野生型Cas9タンパク質）のエンドヌクレアーゼ活性の約20%未満、約15%未満、約10%未満、約5%未満、約1%未満、または約0.1%未満を示す。

ある実施形態では、バリアントCas9タンパク質は、ガイド標的配列の相補鎖を切断することができるが、二本鎖ガイド標的配列の非相補鎖を切断する能力が低下している。例えば、バリアントCas9タンパク質は、RuvCドメインの機能を低下させる突然変異(アミノ酸置換)を有することができる。非限定的な例として、いくつかの実施形態において、バリアントCas9タンパク質は、D10A (アミノ酸位置10におけるアスパラギン酸からアラニン)を有し、したがって、二本鎖ガイド標的配列の相補鎖を切断することができるが、二本鎖ガイド標的配列の非相補鎖を切断する能力が低下している(したがって、このバリアントCas9タンパク質が二本鎖標的核酸を切断するとき、二本鎖切断 (DSB) の代わりに一本鎖切断 (SSB) を生じる) (例えばJinek et al., Science. 2012 Aug. 17; 337(6096):816-21参照)。

ある実施形態では、バリアントCas9タンパク質は、二本鎖ガイド標的配列の非相補鎖を切断することができるが、ガイド標的配列の相補鎖を切断する能力が低下している。例えば、バリアントCas9タンパク質は、HNHドメインの機能を低下させる変異(アミノ酸置換)を有することができる(RuvC/HNH/RuvCドメインモチーフ)。非限定的な例として、いくつかの実施形態において、バリアントCas9タンパク質は、H840A (アミノ酸位置840におけるヒスチジンからアラニン)突然変異を有し、したがって、ガイド標的配列の非相補的ストランドを切断することができるが、ガイド標的配列の相補的ストランドを切断する能力が低下している(したがって、このバリアントCas9タンパク質が二本鎖ガイド標的配列を切断すると、DSBの代わりにSSBが生じる)。このようなCas9タンパク質は、ガイド標的配列(例えば一本鎖ガイド標的配列)を切断する能力が低下しているが、ガイド標的配列(例えば一本鎖ガイド標的配列)に結合する能力を保持している。

ある実施形態では、バリアントCas9タンパク質は、二本鎖標的DNAの相補鎖および非相補鎖の両方を切断する能力が低下している。非限定的な例として、ある実施形態では、バリアントCas9タンパク質は、D10AおよびH840A突然変異の両方を有し、その結果、ポリペプチドは、二本鎖標的DNAの相補鎖および非相補鎖の両方を切断する能力が低下している。このようなCas9タンパク質は、標的DNA (例えば一本鎖標的DNA)を切断する能力が低下しているが、標的DNA (例えば一本鎖標的DNA)に結合する能力は保持している。

別の非限定的な例として、いくつかの実施形態において、バリアントCas9タンパク質は、W476AおよびW1126A突然変異を有し、その結果、ポリペプチドは、標的DNA (例えば一本鎖標的DNA)を切断する能力が低下しているが、標的DNA (例えば一本鎖標的DNA)に結合する能力は保持している。

別の非限定的な例として、いくつかの実施形態において、バリアントCas9タンパク質は、P475A、W476A、N477A、D1125A、W1126A、およびD1127A突然変異を有し、その結果、ポリペプチドは、標的DNAを切断する能力が低下している。そのようなCas9タンパク質は、標的DNAを切断する能力を低下しているが(例えば一本鎖標的DNA)、標的DNA (例えば一本鎖標的DNA)に結合する能力を保持している。

別の非限定的な例として、いくつかの実施形態において、バリアントCas9タンパク質は、H840A、W476A、およびW1126A突然変異を有し、その結果、ポリペプチドは、標的DNA (例えば一本鎖標的DNA)を切断する能力が低下しているが、標的DNA (例えば一本鎖標的DNA)に結合する能力は保持している。別の非限定的な例として、いくつかの実施形態において、バリアントCas9タンパク質は、H840A、D10A、W476A、およびW1126A突然変異を有し、その結果、ポリペプチドは、標的DNAを切断する能力が低下している。このようなCas9タンパク質は、標的DNA (例えば一本鎖標的DNA)を切断する能力が低下しているが、標的DNA (例えば一本鎖標的DNA)に結合する能力は保持している。いくつかの実施形態において、バリアントCas9は、Cas9 HNHドメインの位置840における触媒的His残基が回復されている(A840H)。

別の非限定的な例として、いくつかの実施形態において、バリアントCas9タンパク質は、H840A、P475A、W476A、N477A、D1125A、W1126A、およびD1127A突然変異を有し、その結果、ポリペプチドは、標的DNA (例えば一本鎖標的DNA)を切断する能力を低下させるが、標的DNA (例えば一本鎖標的DNA)に結合する能力を保持する。別の非限定的な例として、いくつかの実施形態において、バリアントCas9タンパク質は、D10A、H840A、P475A、W476A、N477A、D1125A、W1126A、およびD1127A突然変異を有し、その結果、ポリペプチドは、標的DNAを切断する能力が低下している。そのようなCas9タンパク質は、標的DNA (例えば一本鎖標的DNA)を切断する能力を低下しているが、標的DNA (例えば一本鎖標的DNA)に結合する能力を保持している。ある実施形態において、バリアントCas9タンパク質がW476AおよびW1126A変異を有する場合、またはバリアントCas9タンパク質がP475A、W476A、N477A、D1125A、W1126A、およびD1127A変異を有する場合、バリアントCas9タンパク質はPAM配列に効率的に結合しない。したがって、このようないくつかの実施形態では、このようなバリアントCas9タンパク質を結合の方法に用いると、この方法はPAM配列を必要としない。換言すれば、ある実施形態では、このようなバリアントCas9タンパク質を結合の方法に用いる場合、この方法はガイドRNAを含み得るが、この方法は、PAM配列の非存在下で行うことができる(したがって、結合の特異性はガイドRNAの標的セグメントによってもたらされる)。上記の効果を達成するために、他の残基を変異させ得る(すなわち一方または他方のヌクレアーゼ部分を不活性化する)。非限定的な例として、残基D10、G12、G17、E762、H840、N854、N863、H982、H983、A984、D986、および/またはA987を変更(すなわち置換)することができる。また、アラニン置換以外の変異も好適である。

ある態様において、低下した触媒活性を有するバリアントCas9タンパク質（例えばCas9タンパク質がD10、G12、G17、E762、H840、N854、N863、H982、H983、A984、D986、および/またはA987突然変異、例えばD10A、G12A、G17A、E762A、H840A、N854A、N863A、H982A、H983A、A984A、および/またはD986Aを有する場合）は、それがガイドRNAと相互作用する能力を保持する限り、部位特異的様式で標的DNAに結合することができる（ガイドRNAによって標的DNA配列に誘導されるからである）。

いくつかの実施形態では、バリアントCasタンパク質はspCas9、spCas9-VRQR、spCas9-VRER、xCas9 (sp)、saCas9、saCas9-KKH、spCas9-MQKSER、spCas9-LRKIQK、またはspCas9-LRVSQLであり得る。

いくつかの実施形態において、アミノ酸置換D1135M、S1136Q、G1218K、E1219F、A1322R、D1332A、R1335E、およびT1337Rを含み（SpCas9-MQKFRAER）、改変されたPAM5’-NGC-3’に対する特異性を有する改変されたSpCas9が使用された。

S. pyogenes Cas9の代替としては、哺乳動物細胞において切断活性を示すCpf1ファミリー由来のRNA誘導エンドヌクレアーゼが挙げられ得る。PrevotellaおよびFrancisella 1由来のCRISPR (CRISPR/Cpf1) は、CRISPR/Cas9システムに類似したDNA編集技術である。Cpf1はクラスII CRISPR/Cas系のRNA誘導エンドヌクレアーゼである。この獲得免疫機構はPrevotellaやFrancisella細菌に見られる。Cpf1遺伝子はCRISPR遺伝子座に関連しており、ウイルスDNAを見出して切断するためにガイドRNAを用いるエンドヌクレアーゼをコードしている。Cpf1はCas9より小さく単純なエンドヌクレアーゼであり、CRISPR/Cas9系の制限のいくつかを克服する。Cas9ヌクレアーゼとは異なり、Cpf1を介したDNA切断の結果は、短い3'突出を伴う二本鎖切断である。Cpf1の互い違いの切断パターンは、伝統的な制限酵素クローニングに類似した、方向性のある遺伝子導入の可能性を開くことができ、これは遺伝子編集の効率を高め得る。上述したCas9のバリアントおよびオーソログと同様に、Cpf1は、CRISPRが標的とすることができる部位の数を、SpCas9が好むNGG PAM部位を欠くATに富む領域またはATに富むゲノムに拡大することもできる。Cpf1遺伝子座はα/β混合ドメイン、RuvC‐Iとそれに続くらせん領域、RuvC‐IIおよびジンクフィンガー様ドメインを含む。Cpf1タンパク質は、Cas9のRuvCドメインに類似したRuvC様エンドヌクレアーゼドメインを有する。さらに、Cpf1はHNHエンドヌクレアーゼ領域をもたず、Cpf1のN末端はCas9のαヘリックス認識ローブをもたない。Cpf1 CRISPR‐Casドメイン構成は、Cpf1が機能的にユニークであり、クラス2、タイプV CRISPRシステムとして分類されることを示した。Cpf1遺伝子座は、II型系よりもI型およびIII型に類似したCas1、Cas2およびCas4タンパク質をコードしていた。機能的Cpf1はトランス活性化CRISPR RNA (tracrRNA) を必要としない;したがって、CRISPR (crRNA) だけを要する。Cpf1はCas9より小さいだけでなく、より小さいsgRNA分子(Cas9の約半分の数のヌクレオチド)を有するので、これはゲノム編集に有益である。Cas9が標的とするGリッチPAMとは対照的に、Cpf1-crRNA複合体は、モチーフ5'-YTN-3'に隣接するプロトスペーサーの同定によって標的DNAまたはRNAを切断する。PAMの同定後、Cpf1は、4または5ヌクレオチドの突出を有するスティッキーエンド様のDNA二本鎖切断を導入する。

［核酸塩基エディターのCas12ドメイン］
通常、微生物CRISPR-Casシステムはクラス1システムとクラス2システムに分けられる。クラス1システムはマルチサブユニットエフェクター複合体を有する一方、クラス2システムは単一のタンパク質エフェクターを有する。たとえば、Cas9とCpf1は、タイプは異なるが（それぞれ、タイプIIとタイプV）クラス2エフェクターである。Cpf1に加えて、クラス2、タイプV CRISPR-Casシステムは、Cas12a/Cpfl、Cas12b/C2cl、Cas12c/C2c3、Cas12d/CasY、Cas12e/CasX、Cas12g、Cas12h、およびCas12iも含む。たとえば、Shmakov et al., “Discovery and Functional Characterization of Diverse Class 2 CRISPR Cas Systems,” Mol. Cell, 2015 Nov. 5; 60(3): 385-397; Makarova et al., “Classification and Nomenclature of CRISPR-Cas Systems: Where from Here?” CRISPR Journal, 2018, 1(5): 325-336; およびYan et al., “Functionally Diverse Type V CRISPR-Cas Systems,” Science, 2019 Jan. 4; 363: 88-91参照；それぞれの内容全体が参照により本明細書に組み込まれる。タイプV Casタンパク質は、RuvC（またはRuvC様）エンドヌクレアーゼドメインを含有する。成熟CRISPR RNA（crRNA）の生成は一般にtracrRNAに依存しないが、たとえばCas12b/C2c1は、crRNAの生成にtracrRNAを必要とする。Cas12b/C2c1は、DNA切断のためにcrRNAとtracrRNAの両方に依存する。

本発明で企図される核酸プログラム可能なDNA結合タンパク質には、クラス2、タイプVとして分類されるCasタンパク質（Cas12タンパク質）が含まれる。Casクラス2、タイプVタンパク質の非限定的な例には、Cas12a/Cpfl、Cas12b/C2cl、Cas12c/C2c3、Cas12d/CasY、Cas12e/CasX、Cas12g、Cas12h、およびCas12i、それらのホモログ、またはそれらの改変バージョンが含まれる。本明細書で使用される場合、Cas12タンパク質は、Cas12ヌクレアーゼ、Cas12ドメイン、またはCas12タンパク質ドメインと呼ばれることもある。いくつかの実施形態において、本発明のCas12タンパク質は、デアミナーゼドメインなどの内部的に融合されたタンパク質ドメインによって中断されたアミノ酸配列を含む。

いくつかの実施形態において、Cas12ドメインは、ヌクレアーゼ不活性なCas12ドメインまたはCas12ニッカーゼである。いくつかの実施形態において、Cas12ドメインは、ヌクレアーゼ活性ドメインである。例えば、Cas12ドメインは、二本鎖核酸（例えば、二本鎖DNA分子）の一本の鎖にニックを入れるCas12ドメインであり得る。いくつかの実施形態では、Cas12ドメインは、本明細書に記載のアミノ酸配列のいずれか１つを含む。いくつかの実施形態において、Cas12ドメインは、本明細書に記載のアミノ酸配列のいずれか１つに対して少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも99.5%の同一性であるであるアミノ酸配列を含む。いくつかの実施形態において、Cas12ドメインは、本明細書に記載のアミノ酸配列のいずれか1つと比較して1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、21、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50またはそれ以上の変異を有するアミノ酸配列を含む。いくつかの実施形態において、Cas12ドメインは、本明細書に記載のアミノ酸配列のいずれか１つと比較して、少なくとも10、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90、少なくとも100、少なくとも150、少なくとも200、少なくとも250、少なくとも300、少なくとも350、少なくとも400、少なくとも500、少なくとも600、少なくとも700、少なくとも800、少なくとも900、少なくとも1000、少なくとも1100、または少なくとも1200の同一の連続するアミノ酸残基を有するアミノ酸配列を含む。

いくつかの実施形態において、Cas12のフラグメント（断片）を含むタンパク質が提供される。例えば、いくつかの実施形態において、タンパク質は、以下の２つのCas12ドメインのうちの１つを含む：（１）Cas12のｇＲＮＡ結合ドメイン、または（2）Cas12のDNA切断ドメイン。いくつかの実施形態において、Cas12またはそのフラグメントを含むタンパク質は、「Cas12バリアント」と呼ばれる。Cas12バリアントは、Cas12またはそのフラグメントと相同性を共有する。例えば、Cas12バリアントは、野生型Cas12に対して少なくとも約70％の同一性、少なくとも約80％の同一性、少なくとも約90％の同一性、少なくとも約95％の同一性、少なくとも約96％の同一性、少なくとも約97％の同一性、少なくとも約98％の同一性、少なくとも約99％の同一性、少なくとも約99.5％の同一性、または少なくとも約99.9％の同一性である。いくつかの実施形態において、Cas12バリアントは、野生型Cas12と比較して1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、21、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46 、47、48、49、50またはそれ以上のアミノ酸変化を有し得る。いくつかの実施形態において、Cas12バリアントは、Cas12のフラグメント（例えば、gRNA結合ドメインまたはDNA切断ドメイン）を含み、その結果、そのフラグメントは、野生型Cas12の対応するフラグメントに対して少なくとも約70%の同一性、少なくとも約80%の同一性、少なくとも約90%の同一性、少なくとも約95%の同一性、少なくとも約96%の同一性、少なくとも約97%の同一性、少なくとも約98%の同一性、少なくとも約99％の同一性、少なくとも約99.5％の同一性、または少なくとも約99.9％の同一性を有する。いくつかの実施形態において、フラグメントは、対応する野生型Cas12のアミノ酸長の少なくとも30%、少なくとも35%、少なくとも40%、少なくとも45%、少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも99.5％の長さである。いくつかの実施形態において、フラグメントは、少なくとも100アミノ酸の長さである。いくつかの実施形態では、フラグメントは、少なくとも100、150、200、250、300、350、400、450、500、550、600、650、700、750、800、850、900、950、1000、1050、1100、1150、1200、1250、または少なくとも1300アミノ酸の長さである。

いくつかの実施形態において、Cas12は、Cas12ヌクレアーゼ活性を変化させる１つ以上の突然変異を有するCas12アミノ酸配列に対応するか、またはその一部もしくは全体を含む。そのような突然変異は、例として、Cas12のRuvCヌクレアーゼドメイン内のアミノ酸置換を含む。いくつかの実施形態において、野生型Cas12に対して少なくとも約70%の同一性、少なくとも約80%の同一性、少なくとも約90%の同一性、少なくとも約95%の同一性、少なくとも約98%の同一性、少なくとも約99％の同一性、少なくとも約99.5％の同一性、または少なくとも約99.9％の同一性であるCas12のバリアントまたはホモログが提供される。いくつかの実施形態において、約5アミノ酸、約10アミノ酸、約15アミノ酸、約20アミノ酸、約25アミノ酸、約30アミノ酸、約40アミノ酸、約50アミノ酸、約75アミノ酸、約100アミノ酸、またはそれ以上だけ短い、またはそれだけ長いアミノ酸配列を有するCas12のバリアントが提供される。

いくつかの実施形態では、本明細書で提供されるCas12融合タンパク質は、Cas12タンパク質の完全長アミノ酸配列、例えば、本明細書で提供されるCas12配列の１つを含む。しかしながら、他の実施形態では、本明細書で提供される融合タンパク質は、完全長のCas12配列を含まず、その１つまたは複数のフラグメントのみを含む。適切なCas12ドメインの例示的なアミノ酸配列が本明細書で提供され、Cas12ドメインおよびフラグメントの追加の適切な配列は、当業者には明らかであろう。

一般に、クラス2、タイプV Casタンパク質は、単一の機能的なRuvCエンドヌクレアーゼドメインを有する（たとえば、Chen et al., “CRISPR-Cas12a target binding unleashes indiscriminate single-stranded DNase activity,” Science 360:436-439 (2018)参照）。場合によっては、Cas12タンパク質はバリアントCas12bタンパク質である。（Strecker et al., Nature Communications, 2019, 10(1): Art. No.: 212を参照）。一実施形態では、バリアントCas12ポリペプチドは、野生型Cas12タンパク質のアミノ酸配列と比較した場合、1、2、3、4、5またはそれ以上のアミノ酸が異なる（例えば、欠失、挿入、置換、融合を有する）アミノ酸配列を有する。場合によっては、バリアントCas12ポリペプチドは、Cas12ポリペプチドの活性を低下させるアミノ酸変化（例えば、欠失、挿入、または置換）を有する。例えば、場合によっては、バリアントCas12は、対応する野生型Cas12bタンパク質のニッカーゼ活性の50％未満、40％未満、30％未満、20％未満、10％未満、5％未満、または1％未満を有するCas12bポリペプチドである。場合によっては、バリアントCas12bタンパク質には実質的なニッカーゼ活性がない。

場合によっては、バリアントCas12bタンパク質はニッカーゼ活性が低減されている。例えば、バリアントCas12bタンパク質は、野生型Cas12bタンパク質のニッカーゼ活性の約20％未満、約15％未満、約10％未満、約5％未満、約1％未満、または約0.1％未満を示す。

いくつかの実施形態において、Cas12タンパク質は、哺乳動物細胞において活性を示す、Cas12a/Cpf1ファミリーからのRNA誘導エンドヌクレアーゼを含む。PrevotellaおよびFrancisella 1由来のCRISPR（CRISPR/Cpf1）は、CRISPR/Cas9システムに類似したDNA編集技術である。Cpf1は、クラスII CRISPR/CasシステムのRNAガイドエンドヌクレアーゼである。この獲得免疫メカニズムは、PrevotellaおよびFrancisella細菌に見出される。Cpf1遺伝子はCRISPR遺伝子座に付随しており、ガイドRNAを使用してウイルスDNAを見つけて切断するエンドヌクレアーゼをコードしている。Cpf1はCas9よりも小さくて単純なエンドヌクレアーゼであり、CRISPR/Cas9システムの制約のいくつかを克服する。Cas9ヌクレアーゼとは異なり、Cpf1を介したDNA切断の結果は、短い3'オーバーハングを伴う二本鎖切断である。Cpf1のジグザグ状の切断パターンは、従来の制限酵素クローニングと同様に、遺伝子編集の効率を高めることができる、方向性のある遺伝子導入の可能性を開くことができる。上記のCas9バリアントおよびオーソログと同様に、Cpf1は、CRISPRによって標的にできるサイトの数を、SpCas9が好むNGGPAMサイトを欠くATリッチ領域またはATリッチゲノムに拡張することもできる。Cpf1遺伝子座には、混合アルファ/ベータドメイン、RuvC-Iとそれに続くヘリカル領域、RuvC-II、およびジンクフィンガー様ドメインが含まれている。Cpf1タンパク質には、Cas9のRuvCドメインに類似したRuvC様エンドヌクレアーゼドメインがある。さらに、Cpf1はCas9とは異なり、HNHエンドヌクレアーゼドメインを持たず、Cpf1のN末端にはCas9のアルファヘリックス認識ローブがない。Cpf1 CRISPR-Casドメインアーキテクチャは、Cpf1が機能的にユニークであり、クラス2、タイプV CRISPRシステムとして分類されることを示している。Cpf1遺伝子座はCas1、Cas2、およびCas4タンパク質をコードし、タイプIIシステムよりもタイプIおよびIIIに類似している。機能的Cpf1はトランス活性化CRISPR RNA（tracrRNA）を必要としないため、CRISPR（crRNA）のみが必要となる。Cpf1はCas9よりも小さいだけでなく、sgRNA分子もより小さい（Cas9の約半分のヌクレオチド数）ため、これはゲノム編集において有利となる。Cpf1-crRNA複合体は、Cas9が標的とするGリッチPAMとは対照的に、プロトスペーサー隣接モチーフ5'-YTN-3 'または5'-TTTN-3'を同定することにより標的DNAまたはRNAを切断する。PAMの同定後、Cpf1は、4または5ヌクレオチドのオーバーハングを持つスティッキーエンド様DNA二本鎖切断を導入する。

本発明のいくつかの局面において、ベクターは、対応する野生型酵素に関して変異したCRISPR酵素をコードし、その結果、変異したCRISPR酵素は標的配列を含む標的ポリヌクレオチドの一方または両方の鎖を切断する能力を欠く。Cas12は、野生型の例示的なCas12ポリペプチド（例えば、Bacillus hisashiiからのCas12）に対して少なくとも、または少なくともおよそ、50%、60%、70%、80%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99％、または100％の配列同一性および/または配列相同性を有するポリペプチドを指すことができる。Cas12は、野生型の例示的なCas12ポリペプチド（例えば、Bacillus hisashii (BhCas12b)、Bacillus sp. V3-13 (BvCas12b)、およびAlicyclobacillus acidiphilus (AaCas12b)由来のもの）に対して最大で、または最大でおよそ、50％、60％、70％、80％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％、または100％の配列同一性および/または配列相同性のポリペプチドを指すことができる。Cas12は、野生型、または欠失、挿入、置換、バリアント、突然変異、融合、キメラ、もしくはそれらの任意の組み合わせなどのアミノ酸変化を含み得るCas12タンパク質の改変形態を指すことができる。

［核酸によりプログラム可能なDNA結合タンパク質］
本開示のある側面は、核酸プログラミング可能なDNA結合タンパク質として作用するドメインを含む融合タンパク質を提供し、これは、塩基エディターのようなタンパク質を特異的な核酸（例えばDNAまたはRNA）配列に誘導するために使用され得る。特定の実施形態において、融合タンパク質は、核酸プログラミング可能なDNA結合タンパク質ドメインとデアミナーゼドメインとを含む。核酸によりプログラム可能なDNA結合タンパク質の非限定的な例としては、Cas9（例えばdCas9 および nCas9）、Cas12a/Cpfl、Cas12b/C2cl、Cas12c/C2c3、Cas12d/CasY、Cas12e/CasX、Cas12g、Cas12h、およびCas12iが挙げられる。Cas酵素の非限定的な例としては、Cas1、Cas1B、Cas2、Cas3、Cas4、Cas5、Cas5d、Cas5t、Cas5h、Cas5a、Cas6、Cas7、Cas8、Cas8a、Cas8b、Cas8c、Cas9（Csn1またはCsx12とも呼ばれる）、Cas10、Cas10d、Cas12a/Cpfl、Cas12b/C2cl、Cas12c/C2c3、Cas12d/CasY、Cas12e/CasX、Cas12g、Cas12h、Cas12i、Csy1、Csy2、Csy3、Csy4、Cse1、Cse2、Cse3、Cse4、Cse5e、Csc1、Csc2、Csa5、Csn1、Csn2、Csm1、Csm2、Csm3、Csm4、Csm5、Csm6、Cmr1、Cmr3、Cmr4、Cmr5、Cmr6、Csb1、Csb2、Csb3、Csx17、Csx14、Csx10、Csx16、CsaX、Csx3、Csx1、Csx1S、Csx11、Csf1、Csf2、CsO、Csf4、Csd1、Csd2、Cst1、Cst2、Csh1、Csh2、Csa1、Csa2、Csa3、Csa4、Csa5、タイプII Casエフェクタータンパク質、タイプV Casエフェクタータンパク質、タイプVI Casエフェクタータンパク質、CARF、DinG、それらのホモログ、またはそれらの改変または操作されたバージョンが挙げられる。他の核酸プログラミング可能なDNA結合タンパク質も、本開示に具体的に列記されていないかもしれないが、本開示の範囲内である。例えばMakarova et al. “Classification and Nomenclature of CRISPR-Cas Systems: Where from Here?” CRISPR J. 2018 Oct;1:325-336. doi: 10.1089/crispr.2018.0033; Yan et al., “Functionally diverse type V CRISPR-Cas systems” Science. 2019 Jan 4;363(6422):88-91. doi: 10.1126/science.aav7271を参照（それぞれの全内容が参照により本明細書に組み込まれる）。

Cas9とは異なるPAM特異性を有する核酸プログラミング可能DNA結合タンパク質の一例はPrevotella および Francisella1由来のClustered Regularly Interspaced Short Palindromic Repeats（Cpf1）である。Cas9と同様に、Cpf1もクラス2 CRISPRエフェクターである。Cpf1はCas9とは異なる特徴でロバストなDNA干渉を媒介することが示されている。Cpf1は、tracrRNAを欠く単一RNA誘導エンドヌクレアーゼであり、Tに富むプロトスペーサ隣接モチーフ(TTN、TTTN、またはYTN)を利用する。さらに、Cpf1はDNAを互い違いの二本鎖切断で切断する。16のCpf1ファミリータンパク質のうち、AcidaminococcusとLachnospiraceaeからの二つの酵素がヒト細胞において効率的なゲノム編集活性を有することが示されている。Cpf1タンパク質は当技術分野で知られており、例えば過去にYamano et al., “Crystal structure of Cpf1 in complex with guide RNA and target DNA.” Cell (165) 2016, p. 949-962に記載されており、その全体の内容は参照により本明細書に組み込まれる。

また、ガイドヌクレオチド配列プログラム可能DNA結合タンパク質ドメインとして使用され得るヌクレアーゼ不活性Cpf1 (dCpf1) バリアントは本発明の組成物および方法において有用である。Cpf1タンパク質は、Cas9のRuvCドメインに類似したRuvC様エンドヌクレアーゼドメインを有するが、HNHエンドヌクレアーゼドメインを有さず、Cpf1のN末端はCas9のアルファ-ヘリックス認識ローブを有さない。Zetsche et al., Cell, 163, 759-771, 2015 (参照により本明細書に組み込まれる)は、Cpf1のRuvC様ドメインが両方のDNA鎖の切断を担い、RuvC様ドメインの不活性化はCpf1ヌクレアーゼ活性を不活化することを示した。例えば、Francisella novicida Cpf1におけるD917A、E1006A、またはD1255Aに対応する突然変異は、Cpf1ヌクレアーゼ活性を不活化する。いくつかの実施形態において、本開示のdCpf1は、D917A、E1006A、D1255A、D917A/E1006A、D917A/D1255A、E1006A/D1255A、またはD917A/E1006A/D1255Aに対応する突然変異を含む。Cpf1のRuvCドメインを不活性化する任意の突然変異、例えば、置換変異、欠失、または挿入が、本開示に従って使用され得ることを理解されたい。

いくつかの実施形態において、本明細書で提供される融合タンパク質のいずれかの核酸プログラミング可能DNA結合タンパク質（napDNAbp）は、Cpf1タンパク質であり得る。いくつかの実施形態において、Cpf1タンパク質は、Cpf1ニッカーゼ (nCpf1) である。ある態様において、Cpf1タンパク質は、ヌクレアーゼ不活性Cpf1 (dCpf1) である。いくつかの実施形態において、Cpf1、nCpf1、またはdCpf1は、本明細書に開示されたCpf1配列に対して少なくとも85%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも99.5%の同一性を有するアミノ酸配列を含む。いくつかの実施形態において、dCpf1は、本明細書に開示されたCpf1配列に対して少なくとも85%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも99.5%の同一性を有するアミノ酸配列を含み、D917A、E1006A、D1255A、D917A/E1006A、D917A/D1255A、E1006A/D1255A、またはD917A/E1006A/D1255Aに対応する突然変異を含む。他の細菌種からのCpf1もまた本開示に従って使用され得ることが理解されるべきである。

野生型Francisella novicida Cpf1（D917, E1006, およびD1255は太字で下線を引いている。）
MSIYQEFVNKYSLSKTLRFELIPQGKTLENIKARGLILDDEKRAKDYKKAKQIIDKYHQFFIEEILSSVCISEDLLQNYSDVYFKLKKSDDDNLQKDFKSAKDTIKKQISEYIKDSEKFKNLFNQNLIDAKKGQESDLILWLKQSKDNGIELFKANSDITDIDEALEIIKSFKGWTTYFKGFHENRKNVYSSNDIPTSIIYRIVDDNLPKFLENKAKYESLKDKAPEAINYEQIKKDLAEELTFDIDYKTSEVNQRVFSLDEVFEIANFNNYLNQSGITKFNTIIGGKFVNGENTKRKGINEYINLYSQQINDKTLKKYKMSVLFKQILSDTESKSFVIDKLEDDSDVVTTMQSFYEQIAAFKTVEEKSIKETLSLLFDDLKAQKLDLSKIYFKNDKSLTDLSQQVFDDYSVIGTAVLEYITQQIAPKNLDNPSKKEQELIAKKTEKAKYLSLETIKLALEEFNKHRDIDKQCRFEEILANFAAIPMIFDEIAQNKDNLAQISIKYQNQGKKDLLQASAEDDVKAIKDLLDQTNNLLHKLKIFHISQSEDKANILDKDEHFYLVFEECYFELANIVPLYNKIRNYITQKPYSDEKFKLNFENSTLANGWDKNKEPDNTAILFIKDDKYYLGVMNKKNNKIFDDKAIKENKGEGYKKIVYKLLPGANKMLPKVFFSAKSIKFYNPSEDILRIRNHSTHTKNGSPQKGYEKFEFNIEDCRKFIDFYKQSISKHPEWKDFGFRFSDTQRYNSIDEFYREVENQGYKLTFENISESYIDSVVNQGKLYLFQIYNKDFSAYSKGRPNLHTLYWKALFDERNLQDVVYKLNGEAELFYRKQSIPKKITHPAKEAIANKNKDNPKKESVFEYDLIKDKRFTEDKFFFHCPITINFKSSGANKFNDEINLLLKEKANDVHILSIDRGERHLAYYTLVDGKGNIIKQDTFNIIGNDRMKTNYHDKLAAIEKDRDSARKDWKKINNIKEMKEGYLSQVVHEIAKLVIEYNAIVVFEDLNFGFKRGRFKVEKQVYQKLEKMLIEKLNYLVFKDNEFDKTGGVLRAYQLTAPFETFKKMGKQTGIIYYVPAGFTSKICPVTGFVNQLYPKYESVSKSQEFFSKFDKICYNLDKGYFEFSFDYKNFGDKAAKGKWTIASFGSRLINFRNSDKNHNWDTREVYPTKELEKLLKDYSIEYGHGECIKAAICGESDKKFFAKLTSVLNTILQMRNSKTGTELDYLISPVADVNGNFFDSRQAPKNMPQDADANGAYHIGLKGLMLLGRIKNNQEGKKLNLVIKNEEYFEFVQNRNN

Francisella novicida Cpf1 D917A（A917, E1006, およびD1255は太字で下線を引いている。）
MSIYQEFVNKYSLSKTLRFELIPQGKTLENIKARGLILDDEKRAKDYKKAKQIIDKYHQFFIEEILSSVCISEDLLQNYSDVYFKLKKSDDDNLQKDFKSAKDTIKKQISEYIKDSEKFKNLFNQNLIDAKKGQESDLILWLKQSKDNGIELFKANSDITDIDEALEIIKSFKGWTTYFKGFHENRKNVYSSNDIPTSIIYRIVDDNLPKFLENKAKYESLKDKAPEAINYEQIKKDLAEELTFDIDYKTSEVNQRVFSLDEVFEIANFNNYLNQSGITKFNTIIGGKFVNGENTKRKGINEYINLYSQQINDKTLKKYKMSVLFKQILSDTESKSFVIDKLEDDSDVVTTMQSFYEQIAAFKTVEEKSIKETLSLLFDDLKAQKLDLSKIYFKNDKSLTDLSQQVFDDYSVIGTAVLEYITQQIAPKNLDNPSKKEQELIAKKTEKAKYLSLETIKLALEEFNKHRDIDKQCRFEEILANFAAIPMIFDEIAQNKDNLAQISIKYQNQGKKDLLQASAEDDVKAIKDLLDQTNNLLHKLKIFHISQSEDKANILDKDEHFYLVFEECYFELANIVPLYNKIRNYITQKPYSDEKFKLNFENSTLANGWDKNKEPDNTAILFIKDDKYYLGVMNKKNNKIFDDKAIKENKGEGYKKIVYKLLPGANKMLPKVFFSAKSIKFYNPSEDILRIRNHSTHTKNGSPQKGYEKFEFNIEDCRKFIDFYKQSISKHPEWKDFGFRFSDTQRYNSIDEFYREVENQGYKLTFENISESYIDSVVNQGKLYLFQIYNKDFSAYSKGRPNLHTLYWKALFDERNLQDVVYKLNGEAELFYRKQSIPKKITHPAKEAIANKNKDNPKKESVFEYDLIKDKRFTEDKFFFHCPITINFKSSGANKFNDEINLLLKEKANDVHILSIARGERHLAYYTLVDGKGNIIKQDTFNIIGNDRMKTNYHDKLAAIEKDRDSARKDWKKINNIKEMKEGYLSQVVHEIAKLVIEYNAIVVFEDLNFGFKRGRFKVEKQVYQKLEKMLIEKLNYLVFKDNEFDKTGGVLRAYQLTAPFETFKKMGKQTGIIYYVPAGFTSKICPVTGFVNQLYPKYESVSKSQEFFSKFDKICYNLDKGYFEFSFDYKNFGDKAAKGKWTIASFGSRLINFRNSDKNHNWDTREVYPTKELEKLLKDYSIEYGHGECIKAAICGESDKKFFAKLTSVLNTILQMRNSKTGTELDYLISPVADVNGNFFDSRQAPKNMPQDADANGAYHIGLKGLMLLGRIKNNQEGKKLNLVIKNEEYFEFVQNRNN

Francisella novicidaCpf1 E1006A（D917, A1006,および D1255は太字で下線を引いている。）
MSIYQEFVNKYSLSKTLRFELIPQGKTLENIKARGLILDDEKRAKDYKKAKQIIDKYHQFFIEEILSSVCISEDLLQNYSDVYFKLKKSDDDNLQKDFKSAKDTIKKQISEYIKDSEKFKNLFNQNLIDAKKGQESDLILWLKQSKDNGIELFKANSDITDIDEALEIIKSFKGWTTYFKGFHENRKNVYSSNDIPTSIIYRIVDDNLPKFLENKAKYESLKDKAPEAINYEQIKKDLAEELTFDIDYKTSEVNQRVFSLDEVFEIANFNNYLNQSGITKFNTIIGGKFVNGENTKRKGINEYINLYSQQINDKTLKKYKMSVLFKQILSDTESKSFVIDKLEDDSDVVTTMQSFYEQIAAFKTVEEKSIKETLSLLFDDLKAQKLDLSKIYFKNDKSLTDLSQQVFDDYSVIGTAVLEYITQQIAPKNLDNPSKKEQELIAKKTEKAKYLSLETIKLALEEFNKHRDIDKQCRFEEILANFAAIPMIFDEIAQNKDNLAQISIKYQNQGKKDLLQASAEDDVKAIKDLLDQTNNLLHKLKIFHISQSEDKANILDKDEHFYLVFEECYFELANIVPLYNKIRNYITQKPYSDEKFKLNFENSTLANGWDKNKEPDNTAILFIKDDKYYLGVMNKKNNKIFDDKAIKENKGEGYKKIVYKLLPGANKMLPKVFFSAKSIKFYNPSEDILRIRNHSTHTKNGSPQKGYEKFEFNIEDCRKFIDFYKQSISKHPEWKDFGFRFSDTQRYNSIDEFYREVENQGYKLTFENISESYIDSVVNQGKLYLFQIYNKDFSAYSKGRPNLHTLYWKALFDERNLQDVVYKLNGEAELFYRKQSIPKKITHPAKEAIANKNKDNPKKESVFEYDLIKDKRFTEDKFFFHCPITINFKSSGANKFNDEINLLLKEKANDVHILSIDRGERHLAYYTLVDGKGNIIKQDTFNIIGNDRMKTNYHDKLAAIEKDRDSARKDWKKINNIKEMKEGYLSQVVHEIAKLVIEYNAIVVFADLNFGFKRGRFKVEKQVYQKLEKMLIEKLNYLVFKDNEFDKTGGVLRAYQLTAPFETFKKMGKQTGIIYYVPAGFTSKICPVTGFVNQLYPKYESVSKSQEFFSKFDKICYNLDKGYFEFSFDYKNFGDKAAKGKWTIASFGSRLINFRNSDKNHNWDTREVYPTKELEKLLKDYSIEYGHGECIKAAICGESDKKFFAKLTSVLNTILQMRNSKTGTELDYLISPVADVNGNFFDSRQAPKNMPQDADANGAYHIGLKGLMLLGRIKNNQEGKKLNLVIKNEEYFEFVQNRNN

Francisella novicida Cpf1 D1255A（D917, E1006, および A1255は太字で下線を引いている。）
MSIYQEFVNKYSLSKTLRFELIPQGKTLENIKARGLILDDEKRAKDYKKAKQIIDKYHQFFIEEILSSVCISEDLLQNYSDVYFKLKKSDDDNLQKDFKSAKDTIKKQISEYIKDSEKFKNLFNQNLIDAKKGQESDLILWLKQSKDNGIELFKANSDITDIDEALEIIKSFKGWTTYFKGFHENRKNVYSSNDIPTSIIYRIVDDNLPKFLENKAKYESLKDKAPEAINYEQIKKDLAEELTFDIDYKTSEVNQRVFSLDEVFEIANFNNYLNQSGITKFNTIIGGKFVNGENTKRKGINEYINLYSQQINDKTLKKYKMSVLFKQILSDTESKSFVIDKLEDDSDVVTTMQSFYEQIAAFKTVEEKSIKETLSLLFDDLKAQKLDLSKIYFKNDKSLTDLSQQVFDDYSVIGTAVLEYITQQIAPKNLDNPSKKEQELIAKKTEKAKYLSLETIKLALEEFNKHRDIDKQCRFEEILANFAAIPMIFDEIAQNKDNLAQISIKYQNQGKKDLLQASAEDDVKAIKDLLDQTNNLLHKLKIFHISQSEDKANILDKDEHFYLVFEECYFELANIVPLYNKIRNYITQKPYSDEKFKLNFENSTLANGWDKNKEPDNTAILFIKDDKYYLGVMNKKNNKIFDDKAIKENKGEGYKKIVYKLLPGANKMLPKVFFSAKSIKFYNPSEDILRIRNHSTHTKNGSPQKGYEKFEFNIEDCRKFIDFYKQSISKHPEWKDFGFRFSDTQRYNSIDEFYREVENQGYKLTFENISESYIDSVVNQGKLYLFQIYNKDFSAYSKGRPNLHTLYWKALFDERNLQDVVYKLNGEAELFYRKQSIPKKITHPAKEAIANKNKDNPKKESVFEYDLIKDKRFTEDKFFFHCPITINFKSSGANKFNDEINLLLKEKANDVHILSIDRGERHLAYYTLVDGKGNIIKQDTFNIIGNDRMKTNYHDKLAAIEKDRDSARKDWKKINNIKEMKEGYLSQVVHEIAKLVIEYNAIVVFEDLNFGFKRGRFKVEKQVYQKLEKMLIEKLNYLVFKDNEFDKTGGVLRAYQLTAPFETFKKMGKQTGIIYYVPAGFTSKICPVTGFVNQLYPKYESVSKSQEFFSKFDKICYNLDKGYFEFSFDYKNFGDKAAKGKWTIASFGSRLINFRNSDKNHNWDTREVYPTKELEKLLKDYSIEYGHGECIKAAICGESDKKFFAKLTSVLNTILQMRNSKTGTELDYLISPVADVNGNFFDSRQAPKNMPQDAAANGAYHIGLKGLMLLGRIKNNQEGKKLNLVIKNEEYFEFVQNRNN

Francisella novicidaCpf1 D917A/E1006A（A917, A1006, およびD1255は太字で下線を引いている。）
MSIYQEFVNKYSLSKTLRFELIPQGKTLENIKARGLILDDEKRAKDYKKAKQIIDKYHQFFIEEILSSVCISEDLLQNYSDVYFKLKKSDDDNLQKDFKSAKDTIKKQISEYIKDSEKFKNLFNQNLIDAKKGQESDLILWLKQSKDNGIELFKANSDITDIDEALEIIKSFKGWTTYFKGFHENRKNVYSSNDIPTSIIYRIVDDNLPKFLENKAKYESLKDKAPEAINYEQIKKDLAEELTFDIDYKTSEVNQRVFSLDEVFEIANFNNYLNQSGITKFNTIIGGKFVNGENTKRKGINEYINLYSQQINDKTLKKYKMSVLFKQILSDTESKSFVIDKLEDDSDVVTTMQSFYEQIAAFKTVEEKSIKETLSLLFDDLKAQKLDLSKIYFKNDKSLTDLSQQVFDDYSVIGTAVLEYITQQIAPKNLDNPSKKEQELIAKKTEKAKYLSLETIKLALEEFNKHRDIDKQCRFEEILANFAAIPMIFDEIAQNKDNLAQISIKYQNQGKKDLLQASAEDDVKAIKDLLDQTNNLLHKLKIFHISQSEDKANILDKDEHFYLVFEECYFELANIVPLYNKIRNYITQKPYSDEKFKLNFENSTLANGWDKNKEPDNTAILFIKDDKYYLGVMNKKNNKIFDDKAIKENKGEGYKKIVYKLLPGANKMLPKVFFSAKSIKFYNPSEDILRIRNHSTHTKNGSPQKGYEKFEFNIEDCRKFIDFYKQSISKHPEWKDFGFRFSDTQRYNSIDEFYREVENQGYKLTFENISESYIDSVVNQGKLYLFQIYNKDFSAYSKGRPNLHTLYWKALFDERNLQDVVYKLNGEAELFYRKQSIPKKITHPAKEAIANKNKDNPKKESVFEYDLIKDKRFTEDKFFFHCPITINFKSSGANKFNDEINLLLKEKANDVHILSIARGERHLAYYTLVDGKGNIIKQDTFNIIGNDRMKTNYHDKLAAIEKDRDSARKDWKKINNIKEMKEGYLSQVVHEIAKLVIEYNAIVVFADLNFGFKRGRFKVEKQVYQKLEKMLIEKLNYLVFKDNEFDKTGGVLRAYQLTAPFETFKKMGKQTGIIYYVPAGFTSKICPVTGFVNQLYPKYESVSKSQEFFSKFDKICYNLDKGYFEFSFDYKNFGDKAAKGKWTIASFGSRLINFRNSDKNHNWDTREVYPTKELEKLLKDYSIEYGHGECIKAAICGESDKKFFAKLTSVLNTILQMRNSKTGTELDYLISPVADVNGNFFDSRQAPKNMPQDADANGAYHIGLKGLMLLGRIKNNQEGKKLNLVIKNEEYFEFVQNRNN

Francisella novicidaCpf1 D917A/D1255A（A917, E1006, および A1255は太字で下線を引いている。）
MSIYQEFVNKYSLSKTLRFELIPQGKTLENIKARGLILDDEKRAKDYKKAKQIIDKYHQFFIEEILSSVCISEDLLQNYSDVYFKLKKSDDDNLQKDFKSAKDTIKKQISEYIKDSEKFKNLFNQNLIDAKKGQESDLILWLKQSKDNGIELFKANSDITDIDEALEIIKSFKGWTTYFKGFHENRKNVYSSNDIPTSIIYRIVDDNLPKFLENKAKYESLKDKAPEAINYEQIKKDLAEELTFDIDYKTSEVNQRVFSLDEVFEIANFNNYLNQSGITKFNTIIGGKFVNGENTKRKGINEYINLYSQQINDKTLKKYKMSVLFKQILSDTESKSFVIDKLEDDSDVVTTMQSFYEQIAAFKTVEEKSIKETLSLLFDDLKAQKLDLSKIYFKNDKSLTDLSQQVFDDYSVIGTAVLEYITQQIAPKNLDNPSKKEQELIAKKTEKAKYLSLETIKLALEEFNKHRDIDKQCRFEEILANFAAIPMIFDEIAQNKDNLAQISIKYQNQGKKDLLQASAEDDVKAIKDLLDQTNNLLHKLKIFHISQSEDKANILDKDEHFYLVFEECYFELANIVPLYNKIRNYITQKPYSDEKFKLNFENSTLANGWDKNKEPDNTAILFIKDDKYYLGVMNKKNNKIFDDKAIKENKGEGYKKIVYKLLPGANKMLPKVFFSAKSIKFYNPSEDILRIRNHSTHTKNGSPQKGYEKFEFNIEDCRKFIDFYKQSISKHPEWKDFGFRFSDTQRYNSIDEFYREVENQGYKLTFENISESYIDSVVNQGKLYLFQIYNKDFSAYSKGRPNLHTLYWKALFDERNLQDVVYKLNGEAELFYRKQSIPKKITHPAKEAIANKNKDNPKKESVFEYDLIKDKRFTEDKFFFHCPITINFKSSGANKFNDEINLLLKEKANDVHILSIARGERHLAYYTLVDGKGNIIKQDTFNIIGNDRMKTNYHDKLAAIEKDRDSARKDWKKINNIKEMKEGYLSQVVHEIAKLVIEYNAIVVFEDLNFGFKRGRFKVEKQVYQKLEKMLIEKLNYLVFKDNEFDKTGGVLRAYQLTAPFETFKKMGKQTGIIYYVPAGFTSKICPVTGFVNQLYPKYESVSKSQEFFSKFDKICYNLDKGYFEFSFDYKNFGDKAAKGKWTIASFGSRLINFRNSDKNHNWDTREVYPTKELEKLLKDYSIEYGHGECIKAAICGESDKKFFAKLTSVLNTILQMRNSKTGTELDYLISPVADVNGNFFDSRQAPKNMPQDAAANGAYHIGLKGLMLLGRIKNNQEGKKLNLVIKNEEYFEFVQNRNN

Francisella novicida Cpf1 E1006A/D1255A（D917, A1006, および A1255は太字で下線を引いている。）
MSIYQEFVNKYSLSKTLRFELIPQGKTLENIKARGLILDDEKRAKDYKKAKQIIDKYHQFFIEEILSSVCISEDLLQNYSDVYFKLKKSDDDNLQKDFKSAKDTIKKQISEYIKDSEKFKNLFNQNLIDAKKGQESDLILWLKQSKDNGIELFKANSDITDIDEALEIIKSFKGWTTYFKGFHENRKNVYSSNDIPTSIIYRIVDDNLPKFLENKAKYESLKDKAPEAINYEQIKKDLAEELTFDIDYKTSEVNQRVFSLDEVFEIANFNNYLNQSGITKFNTIIGGKFVNGENTKRKGINEYINLYSQQINDKTLKKYKMSVLFKQILSDTESKSFVIDKLEDDSDVVTTMQSFYEQIAAFKTVEEKSIKETLSLLFDDLKAQKLDLSKIYFKNDKSLTDLSQQVFDDYSVIGTAVLEYITQQIAPKNLDNPSKKEQELIAKKTEKAKYLSLETIKLALEEFNKHRDIDKQCRFEEILANFAAIPMIFDEIAQNKDNLAQISIKYQNQGKKDLLQASAEDDVKAIKDLLDQTNNLLHKLKIFHISQSEDKANILDKDEHFYLVFEECYFELANIVPLYNKIRNYITQKPYSDEKFKLNFENSTLANGWDKNKEPDNTAILFIKDDKYYLGVMNKKNNKIFDDKAIKENKGEGYKKIVYKLLPGANKMLPKVFFSAKSIKFYNPSEDILRIRNHSTHTKNGSPQKGYEKFEFNIEDCRKFIDFYKQSISKHPEWKDFGFRFSDTQRYNSIDEFYREVENQGYKLTFENISESYIDSVVNQGKLYLFQIYNKDFSAYSKGRPNLHTLYWKALFDERNLQDVVYKLNGEAELFYRKQSIPKKITHPAKEAIANKNKDNPKKESVFEYDLIKDKRFTEDKFFFHCPITINFKSSGANKFNDEINLLLKEKANDVHILSIDRGERHLAYYTLVDGKGNIIKQDTFNIIGNDRMKTNYHDKLAAIEKDRDSARKDWKKINNIKEMKEGYLSQVVHEIAKLVIEYNAIVVFADLNFGFKRGRFKVEKQVYQKLEKMLIEKLNYLVFKDNEFDKTGGVLRAYQLTAPFETFKKMGKQTGIIYYVPAGFTSKICPVTGFVNQLYPKYESVSKSQEFFSKFDKICYNLDKGYFEFSFDYKNFGDKAAKGKWTIASFGSRLINFRNSDKNHNWDTREVYPTKELEKLLKDYSIEYGHGECIKAAICGESDKKFFAKLTSVLNTILQMRNSKTGTELDYLISPVADVNGNFFDSRQAPKNMPQDAAANGAYHIGLKGLMLLGRIKNNQEGKKLNLVIKNEEYFEFVQNRNN

Francisella novicida Cpf1 D917A/E1006A/D1255A（A917, A1006, および A1255は太字で下線を引いている。）
MSIYQEFVNKYSLSKTLRFELIPQGKTLENIKARGLILDDEKRAKDYKKAKQIIDKYHQFFIEEILSSVCISEDLLQNYSDVYFKLKKSDDDNLQKDFKSAKDTIKKQISEYIKDSEKFKNLFNQNLIDAKKGQESDLILWLKQSKDNGIELFKANSDITDIDEALEIIKSFKGWTTYFKGFHENRKNVYSSNDIPTSIIYRIVDDNLPKFLENKAKYESLKDKAPEAINYEQIKKDLAEELTFDIDYKTSEVNQRVFSLDEVFEIANFNNYLNQSGITKFNTIIGGKFVNGENTKRKGINEYINLYSQQINDKTLKKYKMSVLFKQILSDTESKSFVIDKLEDDSDVVTTMQSFYEQIAAFKTVEEKSIKETLSLLFDDLKAQKLDLSKIYFKNDKSLTDLSQQVFDDYSVIGTAVLEYITQQIAPKNLDNPSKKEQELIAKKTEKAKYLSLETIKLALEEFNKHRDIDKQCRFEEILANFAAIPMIFDEIAQNKDNLAQISIKYQNQGKKDLLQASAEDDVKAIKDLLDQTNNLLHKLKIFHISQSEDKANILDKDEHFYLVFEECYFELANIVPLYNKIRNYITQKPYSDEKFKLNFENSTLANGWDKNKEPDNTAILFIKDDKYYLGVMNKKNNKIFDDKAIKENKGEGYKKIVYKLLPGANKMLPKVFFSAKSIKFYNPSEDILRIRNHSTHTKNGSPQKGYEKFEFNIEDCRKFIDFYKQSISKHPEWKDFGFRFSDTQRYNSIDEFYREVENQGYKLTFENISESYIDSVVNQGKLYLFQIYNKDFSAYSKGRPNLHTLYWKALFDERNLQDVVYKLNGEAELFYRKQSIPKKITHPAKEAIANKNKDNPKKESVFEYDLIKDKRFTEDKFFFHCPITINFKSSGANKFNDEINLLLKEKANDVHILSIARGERHLAYYTLVDGKGNIIKQDTFNIIGNDRMKTNYHDKLAAIEKDRDSARKDWKKINNIKEMKEGYLSQVVHEIAKLVIEYNAIVVFADLNFGFKRGRFKVEKQVYQKLEKMLIEKLNYLVFKDNEFDKTGGVLRAYQLTAPFETFKKMGKQTGIIYYVPAGFTSKICPVTGFVNQLYPKYESVSKSQEFFSKFDKICYNLDKGYFEFSFDYKNFGDKAAKGKWTIASFGSRLINFRNSDKNHNWDTREVYPTKELEKLLKDYSIEYGHGECIKAAICGESDKKFFAKLTSVLNTILQMRNSKTGTELDYLISPVADVNGNFFDSRQAPKNMPQDAAANGAYHIGLKGLMLLGRIKNNQEGKKLNLVIKNEEYFEFVQNRNN

いくつかの実施形態において、融合タンパク質中に存在するCas9ドメインの1つは、PAM配列を必要としないガイドヌクレオチド配列プログラミング可能DNA結合タンパク質ドメインで置換され得る。

ある実施形態において、Cas9ドメインは、Staphylococcus aureus由来のCas9ドメイン (SaCas9)である。ある態様において、SaCas9ドメインは、ヌクレアーゼ活性SaCas9、ヌクレアーゼ不活性SaCas9 (SaCas9d) 、またはSaCas9ニッカーゼ (SaCas9 n) である。いくつかの実施形態において、SaCas9、N579A突然変異、または本明細書に提供されるアミノ酸配列のいずれかにおける対応する突然変異を含む。

いくつかの実施形態において、SaCas9ドメイン、SaCas9dドメイン、またはSaCas9nドメインは、非標準PAMを有する核酸配列に結合することができ、いくつかの実施形態において、SaCas9ドメイン、SaCas9dドメイン、またはSaCas9nドメインは、NNGRRTまたはNNGRRT PAM配列を有する核酸配列に結合することができる。いくつかの実施形態において、SaCas9ドメインは、E781X、N967X、およびR1014X突然変異の1以上、または本明細書に提供されるアミノ酸配列のいずれかにおける対応する突然変異を含み、ここでXは任意のアミノ酸である。いくつかの実施形態において、SaCas9ドメインは、E781K、N967K、およびR1014H突然変異のうちの1つ以上、または本明細書に提供されるアミノ酸配列のいずれかにおける1つ以上の対応する突然変異を含む。いくつかの実施形態において、SaCas9ドメインは、E781K、N967K、またはR1014H突然変異、または本明細書に提供されるアミノ酸配列のいずれかにおける対応する突然変異を含む。

例示的なSaCas9のアミノ酸配列
KRNYILGLDIGITSVGYGIIDYETRDVIDAGVRLFKEANVENNEGRRSKRGARRLKRRRRHRIQRVKKLLFDYNLLTDHSELSGINPYEARVKGLSQKLSEEEFSAALLHLAKRRGVHNVNEVEEDTGNELSTKEQISRNSKALEEKYVAELQLERLKKDGEVRGSINRFKTSDYVKEAKQLLKVQKAYHQLDQSFIDTYIDLLETRRTYYEGPGEGSPFGWKDIKEWYEMLMGHCTYFPEELRSVKYAYNADLYNALNDLNNLVITRDENEKLEYYEKFQIIENVFKQKKKPTLKQIAKEILVNEEDIKGYRVTSTGKPEFTNLKVYHDIKDITARKEIIENAELLDQIAKILTIYQSSEDIQEELTNLNSELTQEEIEQISNLKGYTGTHNLSLKAINLILDELWHTNDNQIAIFNRLKLVPKKVDLSQQKEIPTTLVDDFILSPVVKRSFIQSIKVINAIIKKYGLPNDIIIELAREKNSKDAQKMINEMQKRNRQTNERIEEIIRTTGKENAKYLIEKIKLHDMQEGKCLYSLEAIPLEDLLNNPFNYEVDHIIPRSVSFDNSFNNKVLVKQEENSKKGNRTPFQYLSSSDSKISYETFKKHILNLAKGKGRISKTKKEYLLEERDINRFSVQKDFINRNLVDTRYATRGLMNLLRSYFRVNNLDVKVKSINGGFTSFLRRKWKFKKERNKGYKHHAEDALIIANADFIFKEWKKLDKAKKVMENQMFEEKQAESMPEIETEQEYKEIFITPHQIKHIKDFKDYKYSHRVDKKPNRELINDTLYSTRKDDKGNTLIVNNLNGLYDKDNDKLKKLINKSPEKLLMYHHDPQTYQKLKLIMEQYGDEKNPLYKYYEETGNYLTKYSKKDNGPVIKKIKYYGNKLNAHLDITDDYPNSRNKVVKLSLKPYRFDVYLDNGVYKFVTVKNLDVIKKENYYEVNSKCYEEAKKLKKISNQAEFIASFYNNDLIKINGELYRVIGVNNDLLNRIEVNMIDITYREYLENMNDKRPPRIIKTIASKTQSIKKYSTDILGNLYEVKSKKHPQIIKKG
太字で下線を付している上記残基N579は、（例えばA579に）変異されてSaCas9ニッカーゼを生じ得る。

例示的なSaCas9nのアミノ酸配列
KRNYILGLDIGITSVGYGIIDYETRDVIDAGVRLFKEANVENNEGRRSKRGARRLKRRRRHRIQRVKKLLFDYNLLTDHSELSGINPYEARVKGLSQKLSEEEFSAALLHLAKRRGVHNVNEVEEDTGNELSTKEQISRNSKALEEKYVAELQLERLKKDGEVRGSINRFKTSDYVKEAKQLLKVQKAYHQLDQSFIDTYIDLLETRRTYYEGPGEGSPFGWKDIKEWYEMLMGHCTYFPEELRSVKYAYNADLYNALNDLNNLVITRDENEKLEYYEKFQIIENVFKQKKKPTLKQIAKEILVNEEDIKGYRVTSTGKPEFTNLKVYHDIKDITARKEIIENAELLDQIAKILTIYQSSEDIQEELTNLNSELTQEEIEQISNLKGYTGTHNLSLKAINLILDELWHTNDNQIAIFNRLKLVPKKVDLSQQKEIPTTLVDDFILSPVVKRSFIQSIKVINAIIKKYGLPNDIIIELAREKNSKDAQKMINEMQKRNRQTNERIEEIIRTTGKENAKYLIEKIKLHDMQEGKCLYSLEAIPLEDLLNNPFNYEVDHIIPRSVSFDNSFNNKVLVKQEEASKKGNRTPFQYLSSSDSKISYETFKKHILNLAKGKGRISKTKKEYLLEERDINRFSVQKDFINRNLVDTRYATRGLMNLLRSYFRVNNLDVKVKSINGGFTSFLRRKWKFKKERNKGYKHHAEDALIIANADFIFKEWKKLDKAKKVMENQMFEEKQAESMPEIETEQEYKEIFITPHQIKHIKDFKDYKYSHRVDKKPNRELINDTLYSTRKDDKGNTLIVNNLNGLYDKDNDKLKKLINKSPEKLLMYHHDPQTYQKLKLIMEQYGDEKNPLYKYYEETGNYLTKYSKKDNGPVIKKIKYYGNKLNAHLDITDDYPNSRNKVVKLSLKPYRFDVYLDNGVYKFVTVKNLDVIKKENYYEVNSKCYEEAKKLKKISNQAEFIASFYNNDLIKINGELYRVIGVNNDLLNRIEVNMIDITYREYLENMNDKRPPRIIKTIASKTQSIKKYSTDILGNLYEVKSKKHPQIIKKG.
N579から変異されてSaCas9ニッカーゼを生じることができる上記残基A579には太字で下線を付している。

例示的なSaKKH Cas9のアミノ酸配列

上記の残基A579は、N579から変異されてSaCas9ニッカーゼを生じることができるものであり、太字で下線を付している。上記の残基K781、K967、およびH1014は、E781、N967、およびR1014から変異されてSaKKH Cas9を生じることができるものであり、斜体で下線を付している。

ある実施形態では、napDNAbpは循環置換体（circular permutant）である。下記配列において、プレーンテキストはアデノシンデアミナーゼ配列を表し、太字の配列はCas9由来の配列を示し、斜体の配列はリンカー配列を表し、下線の配列は二部分核局在化配列を表す。
CP5 (with MSP “NGC” PID and “D10A” nickase):

ある態様において、核酸プログラム可能DNA結合タンパク質 (napDNAbp) は、微生物CRISPR-Cas系の単一のエフェクターである。微生物CRISPR-Cas系の単一エフェクターは、Cas9、Cpf1、Cas12b/C2c1、およびCas12c/C2c3を含むが、これらに限定されない。典型的には、微生物CRISPR-Cas系はクラス1およびクラス2系に分けられる。クラス1の系は多サブユニットエフェクター複合体をもち、クラス2の系は単一のタンパク質エフェクターをもつ。たとえば、Cas9とCpf1はクラス2エフェクタである。Cas9およびCpf1に加えて、三つの異なるクラス2 CRISPR-Casシステム(Cas12b/C2c1およびCas12c/C2c3)がShmakov et al., “Discovery and Functional Characterization of Diverse Class 2 CRISPR Cas Systems”, Mol. Cell, 2015 Nov. 5; 60(3): 385-397によって記載されている(その全体の内容は参照により本明細書に組み込まれる) 。2つの系、Cas12b/C2c1とCas12c/C2c3のエフェクターはCpf1に関連するRuvC様エンドヌクレアーゼ領域を含む。第3の系は、2つの予測されるHEPN RNaseドメインをもつエフェクターを含む。Cas12b/C2c1によるCRISPR RNAの産生とは異なり、成熟CRISPR RNAの産生がtracrRNA非依存性である。Cas12b/C2c1はDNA切断にCRISPRRNAとtracrRNAの両方に依存する。

Alicyclobaccillus acidoterrastris Cas12b/C2c1 (AacC2c1) の結晶構造が、キメラ単一分子ガイドRNA (sgRNA) との複合体として報告されている。例えば、Liu et al., “C2c1-sgRNA Complex Structure Reveals RNA-Guided DNA Cleavage Mechanism”, Mol. Cell, 2017 Jan. 19; 65(2):310-322参照 (その内容全体を参照により本明細書に組み込む) 。また、三元複合体として標的DNAに結合したAlicyclobacillus acidoterrestris C2c1においても結晶構造が報告されている。例えば、Yang et al., “PAM-dependent Target DNA Recognition and Cleavage by C2C1 CRISPR-Cas endonuclease”, Cell, 2016 Dec. 15; 167(7):1814-1828参照（その内容全体が参照により本明細書に組み込まれる）。標的DNA鎖および非標的DNA鎖の両方と共に、AacC2c1の触媒的にコンピテントな立体配座は、1つのRuvC触媒ポケット内に独立して捕捉され、Cas12b/C2c1媒介切断は標的DNAのスタガード7ヌクレオチドの切断を生じる。Cas 12b/C2c1三元複合体と以前に同定されたCas9およびCpf1対応物の間の構造比較は、 CRISPR‐Cas9システムにより使用される機構の多様性を示す。

いくつかの実施形態において、本明細書で提供される融合タンパク質のいずれかの核酸プログラム可能DNA結合タンパク質 (napDNAbp) は、Cas12b/C2c1またはCas12c/C2c3タンパク質であり得る。いくつかの実施形態において、napDNAbpはCas12b/C2c1タンパク質である。いくつかの実施形態において、napDNAbpはCas12c/C2c3タンパク質である。いくつかの実施形態において、napDNAbpは、天然に存在するCas12b/C2c1またはCas12c/C2c3タンパク質に対して少なくとも85%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも99.5%の同一性を有するアミノ酸配列を含む。いくつかの実施形態において、napDNAbpは、天然に存在するCas12b/C2c1またはCas12c/C2c3タンパク質である。いくつかの実施形態において、napDNAbpは、本明細書に提供されるnapDNAbp配列のいずれかに対して少なくとも85%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも99.5%の同一性を有するアミノ酸配列を含む。他の細菌種由来のCas12b/C2c1またはCas12c/C2c3も本開示に従って使用することができることが理解されるべきである。

Cas12b/C2c1 ((uniprot.org/uniprot/T0D7A2#2) sp|T0D7A2|C2C1_ALIAG CRISPR-associated endonuclease C2c1 OS = Alicyclobacillus acido-terrestris (strain ATCC 49025 / DSM 3922/ CIP 106132 / NCIMB 13137/GD3B) GN=c2c1 PE=1 SV=1) のアミノ酸配列は以下の通りである：
MAVKSIKVKLRLDDMPEIRAGLWKLHKEVNAGVRYYTEWLSLLRQENLYRRSPNGDGEQECDKTAEECKAELLERLRARQVENGHRGPAGSDDELLQLARQLYELLVPQAIGAKGDAQQIARKFLSPLADKDAVGGLGIAKAGNKPRWVRMREAGEPGWEEEKEKAETRKSADRTADVLRALADFGLKPLMRVYTDSEMSSVEWKPLRKGQAVRTWDRDMFQQAIERMMSWESWNQRVGQEYAKLVEQKNRFEQKNFVGQEHLVHLVNQLQQDMKEASPGLESKEQTAHYVTGRALRGSDKVFEKWGKLAPDAPFDLYDAEIKNVQRRNTRRFGSHDLFAKLAEPEYQALWREDASFLTRYAVYNSILRKLNHAKMFATFTLPDATAHPIWTRFDKLGGNLHQYTFLFNEFGERRHAIRFHKLLKVENGVAREVDDVTVPISMSEQLDNLLPRDPNEPIALYFRDYGAEQHFTGEFGGAKIQCRRDQLAHMHRRRGARDVYLNVSVRVQSQSEARGERRPPYAAVFRLVGDNHRAFVHFDKLSDYLAEHPDDGKLGSEGLLSGLRVMSVDLGLRTSASISVFRVARKDELKPNSKGRVPFFFPIKGNDNLVAVHERSQLLKLPGETESKDLRAIREERQRTLRQLRTQLAYLRLLVRCGSEDVGRRERSWAKLIEQPVDAANHMTPDWREAFENELQKLKSLHGICSDKEWMDAVYESVRRVWRHMGKQVRDWRKDVRSGERPKIRGYAKDVVGGNSIEQIEYLERQYKFLKSWSFFGKVSGQVIRAEKGSRFAITLREHIDHAKEDRLKKLADRIIMEALGYVYALDERGKGKWVAKYPPCQLILLEELSEYQFNNDRPPSENNQLMQWSHRGVFQELINQAQVHDLLVGTMYAAFSSRFDARTGAPGIRCRRVPARCTQEHNPEPFPWWLNKFVVEHTLDACPLRADDLIPTGEGEIFVSPFSAEEGDFHQIHADLNAAQNLQQRLWSDFDISQIRLRCDWGEVDGELVLIPRLTGKRTADSYSNKVFYTNTGVTYYERERGKKRRKVFAQEKLSEEEAELLVEADEAREKSVVLMRDPSGIINRGNWTRQKEFWSMV NQRIEGYLVKQIRSRVPLQDSACENTGDI.

AacCas12b (Alicyclobacillus acidiphilus) - WP_067623834
MAVKSMKVKLRLDNMPEIRAGLWKLHTEVNAGVRYYTEWLSLLRQENLYRRSPNGDGEQECYKTAEECKAELLERLRARQVENGHCGPAGSDDELLQLARQLYELLVPQAIGAKGDAQQIARKFLSPLADKDAVGGLGIAKAGNKPRWVRMREAGEPGWEEEKAKAEARKSTDRTADVLRALADFGLKPLMRVYTDSDMSSVQWKPLRKGQAVRTWDRDMFQQAIERMMSWESWNQRVGEAYAKLVEQKSRFEQKNFVGQEHLVQLVNQLQQDMKEASHGLESKEQTAHYLTGRALRGSDKVFEKWEKLDPDAPFDLYDTEIKNVQRRNTRRFGSHDLFAKLAEPKYQALWREDASFLTRYAVYNSIVRKLNHAKMFATFTLPDATAHPIWTRFDKLGGNLHQYTFLFNEFGEGRHAIRFQKLLTVEDGVAKEVDDVTVPISMSAQLDDLLPRDPHELVALYFQDYGAEQHLAGEFGGAKIQYRRDQLNHLHARRGARDVYLNLSVRVQSQSEARGERRPPYAAVFRLVGDNHRAFVHFDKLSDYLAEHPDDGKLGSEGLLSGLRVMSVDLGLRTSASISVFRVARKDELKPNSEGRVPFCFPIEGNENLVAVHERSQLLKLPGETESKDLRAIREERQRTLRQLRTQLAYLRLLVRCGSEDVGRRERSWAKLIEQPMDANQMTPDWREAFEDELQKLKSLYGICGDREWTEAVYESVRRVWRHMGKQVRDWRKDVRSGERPKIRGYQKDVVGGNSIEQIEYLERQYKFLKSWSFFGKVSGQVIRAEKGSRFAITLREHIDHAKEDRLKKLADRIIMEALGYVYALDDERGKGKWVAKYPPCQLILLEELSEYQFNNDRPPSENNQLMQWSHRGVFQELLNQAQVHDLLVGTMYAAFSSRFDARTGAPGIRCRRVPARCAREQNPEPFPWWLNKFVAEHKLDGCPLRADDLIPTGEGEFFVSPFSAEEGDFHQIHADLNAAQNLQRRLWSDFDISQIRLRCDWGEVDGEPVLIPRTTGKRTADSYGNKVFYTKTGVTYYERERGKKRRKVFAQEELSEEEAELLVEADEAREKSVVLMRDPSGIINRGDWTRQKEFWSMVNQRIEGYLVKQIRSRVRLQESACENTGDI

BhCas12b (Bacillus hisashii) NCBI Reference Sequence: WP_095142515
MAPKKKRKVGIHGVPAAATRSFILKIEPNEEVKKGLWKTHEVLNHGIAYYMNILKLIRQEAIYEHHEQDPKNPKKVSKAEIQAELWDFVLKMQKCNSFTHEVDKDEVFNILRELYEELVPSSVEKKGEANQLSNKFLYPLVDPNSQSGKGTASSGRKPRWYNLKIAGDPSWEEEKKKWEEDKKKDPLAKILGKLAEYGLIPLFIPYTDSNEPIVKEIKWMEKSRNQSVRRLDKDMFIQALERFLSWESWNLKVKEEYEKVEKEYKTLEERIKEDIQALKALEQYEKERQEQLLRDTLNTNEYRLSKRGLRGWREIIQKWLKMDENEPSEKYLEVFKDYQRKHPREAGDYSVYEFLSKKENHFIWRNHPEYPYLYATFCEIDKKKKDAKQQATFTLADPINHPLWVRFEERSGSNLNKYRILTEQLHTEKLKKKLTVQLDRLIYPTESGGWEEKGKVDIVLLPSRQFYNQIFLDIEEKGKHAFTYKDESIKFPLKGTLGGARVQFDRDHLRRYPHKVESGNVGRIYFNMTVNIEPTESPVSKSLKIHRDDFPKVVNFKPKELTEWIKDSKGKKLKSGIESLEIGLRVMSIDLGQRQAAAASIFEVVDQKPDIEGKLFFPIKGTELYAVHRASFNIKLPGETLVKSREVLRKAREDNLKLMNQKLNFLRNVLHFQQFEDITEREKRVTKWISRQENSDVPLVYQDELIQIRELMYKPYKDWVAFLKQLHKRLEVEIGKEVKHWRKSLSDGRKGLYGISLKNIDEIDRTRKFLLRWSLRPTEPGEVRRLEPGQRFAIDQLNHLNALKEDRLKKMANTIIMHALGYCYDVRKKKWQAKNPACQIILFEDLSNYNPYEERSRFENSKLMKWSRREIPRQVALQGEIYGLQVGEVGAQFSSRFHAKTGSPGIRCSVVTKEKLQDNRFFKNLQREGRLTLDKIAVLKEGDLYPDKGGEKFISLSKDRKCVTTHADINAAQNLQKRFWTRTHGFYKVYCKAYQVDGQTVYIPESKDQKQKIIEEFGEGYFILKDGVYEWVNAGKLKIKKGSSKQSSSELVDSDILKDSFDLASELKGEKLMLYRDPSGNVFPSDKWMAAGVFFGKLERILISKLTNQYSISTIEDDSSKQSMKRPAATKKAGQAKKKK

BvCas12b V4と呼ばれるバリアント（野生型に対してS893R/K846R/E837G変化）は以下のように発現される：5’ mRNA Cap---5’UTR---bhCas12b---STOP配列--- 3’UTR --- 120polyAテール
5’UTR:
GGGAAATAAGAGAGAAAAGAAGAGTAAGAAGAAATATAAGAGCCACC
3’ UTR (TriLink 標準UTR)
GCTGGAGCCTCGGTGGCCATGCTTCTTGCCCCTTGGGCCTCCCCCCAGCCCCTCCTCCCCTTCCTGCACCCGTACCCCCGTGGTCTTTGAATAAAGTCTGA

bhCas12b (V4)の核酸配列
ATGGCCCCAAAGAAGAAGCGGAAGGTCGGTATCCACGGAGTCCCAGCAGCCGCCACCAGATCCTTCATCCTGAAGATCGAGCCCAACGAGGAAGTGAAGAAAGGCCTCTGGAAAACCCACGAGGTGCTGAACCACGGAATCGCCTACTACATGAATATCCTGAAGCTGATCCGGCAAGAGGCCATCTACGAGCACCACGAGCAGGACCCCAAGAATCCCAAGAAGGTGTCCAAGGCCGAGATCCAGGCCGAGCTGTGGGATTTCGTGCTGAAGATGCAGAAGTGCAACAGCTTCACACACGAGGTGGACAAGGACGAGGTGTTCAACATCCTGAGAGAGCTGTACGAGGAACTGGTGCCCAGCAGCGTGGAAAAGAAGGGCGAAGCCAACCAGCTGAGCAACAAGTTTCTGTACCCTCTGGTGGACCCCAACAGCCAGTCTGGAAAGGGAACAGCCAGCAGCGGCAGAAAGCCCAGATGGTACAACCTGAAGATTGCCGGCGATCCCTCCTGGGAAGAAGAGAAGAAGAAGTGGGAAGAAGATAAGAAAAAGGACCCGCTGGCCAAGATCCTGGGCAAGCTGGCTGAGTACGGACTGATCCCTCTGTTCATCCCCTACACCGACAGCAACGAGCCCATCGTGAAAGAAATCAAGTGGATGGAAAAGTCCCGGAACCAGAGCGTGCGGCGGCTGGATAAGGACATGTTCATTCAGGCCCTGGAACGGTTCCTGAGCTGGGAGAGCTGGAACCTGAAAGTGAAAGAGGAATACGAGAAGGTCGAGAAAGAGTACAAGACCCTGGAAGAGAGGATCAAAGAGGACATCCAGGCTCTGAAGGCTCTGGAACAGTATGAGAAAGAGCGGCAAGAACAGCTGCTGCGGGACACCCTGAACACCAACGAGTACCGGCTGAGCAAGAGAGGCCTTAGAGGCTGGCGGGAAATCATCCAGAAATGGCTGAAAATGGACGAGAACGAGCCCTCCGAGAAGTACCTGGAAGTGTTCAAGGACTACCAGCGGAAGCACCCTAGAGAGGCCGGCGATTACAGCGTGTACGAGTTCCTGTCCAAGAAAGAGAACCACTTCATCTGGCGGAATCACCCTGAGTACCCCTACCTGTACGCCACCTTCTGCGAGATCGACAAGAAAAAGAAGGACGCCAAGCAGCAGGCCACCTTCACACTGGCCGATCCTATCAATCACCCTCTGTGGGTCCGATTCGAGGAAAGAAGCGGCAGCAACCTGAACAAGTACAGAATCCTGACCGAGCAGCTGCACACCGAGAAGCTGAAGAAAAAGCTGACAGTGCAGCTGGACCGGCTGATCTACCCTACAGAATCTGGCGGCTGGGAAGAGAAGGGCAAAGTGGACATTGTGCTGCTGCCCAGCCGGCAGTTCTACAACCAGATCTTCCTGGACATCGAGGAAAAGGGCAAGCACGCCTTCACCTACAAGGATGAGAGCATCAAGTTCCCTCTGAAGGGCACACTCGGCGGAGCCAGAGTGCAGTTCGACAGAGATCACCTGAGAAGATACCCTCACAAGGTGGAAAGCGGCAACGTGGGCAGAATCTACTTCAACATGACCGTGAACATCGAGCCTACAGAGTCCCCAGTGTCCAAGTCTCTGAAGATCCACCGGGACGACTTCCCCAAGGTGGTCAACTTCAAGCCCAAAGAACTGACCGAGTGGATCAAGGACAGCAAGGGCAAGAAACTGAAGTCCGGCATCGAGTCCCTGGAAATCGGCCTGAGAGTGATGAGCATCGACCTGGGACAGAGACAGGCCGCTGCCGCCTCTATTTTCGAGGTGGTGGATCAGAAGCCCGACATCGAAGGCAAGCTGTTTTTCCCAATCAAGGGCACCGAGCTGTATGCCGTGCACAGAGCCAGCTTCAACATCAAGCTGCCCGGCGAGACACTGGTCAAGAGCAGAGAAGTGCTGCGGAAGGCCAGAGAGGACAATCTGAAACTGATGAACCAGAAGCTCAACTTCCTGCGGAACGTGCTGCACTTCCAGCAGTTCGAGGACATCACCGAGAGAGAGAAGCGGGTCACCAAGTGGATCAGCAGACAAGAGAACAGCGACGTGCCCCTGGTGTACCAGGATGAGCTGATCCAGATCCGCGAGCTGATGTACAAGCCTTACAAGGACTGGGTCGCCTTCCTGAAGCAGCTCCACAAGAGACTGGAAGTCGAGATCGGCAAAGAAGTGAAGCACTGGCGGAAGTCCCTGAGCGACGGAAGAAAGGGCCTGTACGGCATCTCCCTGAAGAACATCGACGAGATCGATCGGACCCGGAAGTTCCTGCTGAGATGGTCCCTGAGGCCTACCGAACCTGGCGAAGTGCGTAGACTGGAACCCGGCCAGAGATTCGCCATCGACCAGCTGAATCACCTGAACGCCCTGAAAGAAGATCGGCTGAAGAAGATGGCCAACACCATCATCATGCACGCCCTGGGCTACTGCTACGACGTGCGGAAGAAGAAATGGCAGGCTAAGAACCCCGCCTGCCAGATCATCCTGTTCGAGGATCTGAGCAACTACAACCCCTACGAGGAAAGGTCCCGCTTCGAGAACAGCAAGCTCATGAAGTGGTCCAGACGCGAGATCCCCAGACAGGTTGCACTGCAGGGCGAGATCTATGGCCTGCAAGTGGGAGAAGTGGGCGCTCAGTTCAGCAGCAGATTCCACGCCAAGACAGGCAGCCCTGGCATCAGATGTAGCGTCGTGACCAAAGAGAAGCTGCAGGACAATCGGTTCTTCAAGAATCTGCAGAGAGAGGGCAGACTGACCCTGGACAAAATCGCCGTGCTGAAAGAGGGCGATCTGTACCCAGACAAAGGCGGCGAGAAGTTCATCAGCCTGAGCAAGGATCGGAAGTGCGTGACCACACACGCCGACATCAACGCCGCTCAGAACCTGCAGAAGCGGTTCTGGACAAGAACCCACGGCTTCTACAAGGTGTACTGCAAGGCCTACCAGGTGGACGGCCAGACCGTGTACATCCCTGAGAGCAAGGACCAGAAGCAGAAGATCATCGAAGAGTTCGGCGAGGGCTACTTCATTCTGAAGGACGGGGTGTACGAATGGGTCAACGCCGGCAAGCTGAAAATCAAGAAGGGCAGCTCCAAGCAGAGCAGCAGCGAGCTGGTGGATAGCGACATCCTGAAAGACAGCTTCGACCTGGCCTCCGAGCTGAAAGGCGAAAAGCTGATGCTGTACAGGGACCCCAGCGGCAATGTGTTCCCCAGCGACAAATGGATGGCCGCTGGCGTGTTCTTCGGAAAGCTGGAACGCATCCTGATCAGCAAGCTGACCAACCAGTACTCCATCAGCACCATCGAGGACGACAGCAGCAAGCAGTCTATGAAAAGGCCGGCGGCCACGAAAAAGGCCGGCCAGGCAAAAAAGAAAAAG

いくつかの実施形態では、Cas12bはBvCas12Bである。いくつかの実施形態において、BvCas12Bは、野生型配列Bと比較して以下の変化を含む：以下に提供されるBvCas12B例示的配列における番号付けでS893R、K846R、およびE837G。

BvCas12b (Bacillus sp. V3-13) NCBI Reference Sequence: WP_101661451.1
MAIRSIKLKMKTNSGTDSIYLRKALWRTHQLINEGIAYYMNLLTLYRQEAIGDKTKEAYQAELINIIRNQQRNNGSSEEHGSDQEILALLRQLYELIIPSSIGESGDANQLGNKFLYPLVDPNSQSGKGTSNAGRKPRWKRLKEEGNPDWELEKKKDEERKAKDPTVKIFDNLNKYGLLPLFPLFTNIQKDIEWLPLGKRQSVRKWDKDMFIQAIERLLSWESWNRRVADEYKQLKEKTESYYKEHLTGGEEWIEKIRKFEKERNMELEKNAFAPNDGYFITSRQIRGWDRVYEKWSKLPESASPEELWKVVAEQQNKMSEGFGDPKVFSFLANRENRDIWRGHSERIYHIAAYNGLQKKLSRTKEQATFTLPDAIEHPLWIRYESPGGTNLNLFKLEEKQKKNYYVTLSKIIWPSEEKWIEKENIEIPLAPSIQFNRQIKLKQHVKGKQEISFSDYSSRISLDGVLGGSRIQFNRKYIKNHKELLGEGDIGPVFFNLVVDVAPLQETRNGRLQSPIGKALKVISSDFSKVIDYKPKELMDWMNTGSASNSFGVASLLEGMRVMSIDMGQRTSASVSIFEVVKELPKDQEQKLFYSINDTELFAIHKRSFLLNLPGEVVTKNNKQQRQERRKKRQFVRSQIRMLANVLRLETKKTPDERKKAIHKLMEIVQSYDSWTASQKEVWEKELNLLTNMAAFNDEIWKESLVELHHRIEPYVGQIVSKWRKGLSEGRKNLAGISMWNIDELEDTRRLLISWSKRSRTPGEANRIETDEPFGSSLLQHIQNVKDDRLKQMANLIIMTALGFKYDKEEKDRYKRWKETYPACQIILFENLNRYLFNLDRSRRENSRLMKWAHRSIPRTVSMQGEMFGLQVGDVRSEYSSRFHAKTGAPGIRCHALTEEDLKAGSNTLKRLIEDGFINESELAYLKKGDIIPSQGGELFVTLSKRYKKDSDNNELTVIHADINAAQNLQKRFWQQNSEVYRVPCQLARMGEDKLYIPKSQTETIKKYFGKGSFVKNNTEQEVYKWEKSEKMKIKTDTTFDLQDLDGFEDISKTIELAQEQQKKYLTMFRDPSGYFFNNETWRPQKEYWSIVNNIIKSCLKKKILSNKVEL

ある実施形態では、Cas12bはBTCas12bである。
BTCas12b (Bacillus thermoamylovorans) NCBI Reference Sequence: WP_041902512
MATRSFILKIEPNEEVKKGLWKTHEVLNHGIAYYMNILKLIRQEAIYEHHEQDPKNPKKV
SKAEIQAELWDFVLKMQKCNSFTHEVDKDVVFNILRELYEELVPSSVEKKGEANQLSNKF
LYPLVDPNSQSGKGTASSGRKPRWYNLKIAGDPSWEEEKKKWEEDKKKDPLAKILGKLAE
YGLIPLFIPFTDSNEPIVKEIKWMEKSRNQSVRRLDKDMFIQALERFLSWESWNLKVKEE
YEKVEKEHKTLEERIKEDIQAFKSLEQYEKERQEQLLRDTLNTNEYRLSKRGLRGWREII
QKWLKMDENEPSEKYLEVFKDYQRKHPREAGDYSVYEFLSKKENHFIWRNHPEYPYLYAT
FCEIDKKKKDAKQQATFTLADPINHPLWVRFEERSGSNLNKYRILTEQLHTEKLKKKLTV
QLDRLIYPTESGGWEEKGKVDIVLLPSRQFYNQIFLDIEEKGKHAFTYKDESIKFPLKGT
LGGARVQFDRDHLRRYPHKVESGNVGRIYFNMTVNIEPTESPVSKSLKIHRDDFPKFVNF
KPKELTEWIKDSKGKKLKSGIESLEIGLRVMSIDLGQRQAAAASIFEVVDQKPDIEGKLF
FPIKGTELYAVHRASFNIKLPGETLVKSREVLRKAREDNLKLMNQKLNFLRNVLHFQQFE
DITEREKRVTKWISRQENSDVPLVYQDELIQIRELMYKPYKDWVAFLKQLHKRLEVEIGK
EVKHWRKSLSDGRKGLYGISLKNIDEIDRTRKFLLRWSLRPTEPGEVRRLEPGQRFAIDQ
LNHLNALKEDRLKKMANTIIMHALGYCYDVRKKKWQAKNPACQIILFEDLSNYNPYEERS
RFENSKLMKWSRREIPRQVALQGEIYGLQVGEVGAQFSSRFHAKTGSPGIRCSVVTKEKL
QDNRFFKNLQREGRLTLDKIAVLKEGDLYPDKGGEKFISLSKDRKLVTTHADINAAQNLQ
KRFWTRTHGFYKVYCKAYQVDGQTVYIPESKDQKQKIIEEFGEGYFILKDGVYEWGNAGK
LKIKKGSSKQSSSELVDSDILKDSFDLASELKGEKLMLYRDPSGNVFPSDKWMAAGVFFG
KLERILISKLTNQYSISTIEDDSSKQSM

いくつかの実施形態では、napDNAbpはCas12cを指す。いくつかの実施形態において、Cas12cタンパク質は、Cas12c1またはCas12c1のバリアントである。いくつかの実施形態において、Cas12タンパク質は、Cas12c2またはCas12c2のバリアントである。いくつかの実施形態において、Cas12タンパク質は、Oleiphilus sp. HI0009由来のCas12c (すなわちOspCas12c) またはOspCas12cのバリアントである。これらのCas12c分子は、Yan et al., “Functionally Diverse Type V CRISPR-Cas Systems,” Science, 2019 Jan. 4; 363: 88-91に記載されており、その全内容は参照により本明細書に組み込まれる。いくつかの実施形態において、napDNAbpは、天然に存在するCas12c1、Cas12c2、またはOspCas12cタンパク質に対して少なくとも85%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96％、少なくとも97％、少なくとも98％、少なくとも99％、または少なくとも99.5％の同一性を有するアミノ酸配列を含む。いくつかの実施形態において、napDNAbpは、天然に存在するCas12c1、Cas12c2、またはOspCas12cタンパク質である。いくつかの実施形態において、napDNAbpは、本明細書に記載の任意のCas12c1、Cas12c2、またはOspCas12cタンパク質に対して少なくとも85%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96％、少なくとも97％、少なくとも98％、少なくとも99％、または少なくとも99.5％の同一性を有するアミノ酸配列を含む。他の細菌種由来のCas12c1、Cas12c2、またはOspCas12cもまた、本開示に従って使用され得ることが理解されるべきである。

Cas12c1 MQTKKTHLHLISAKASRKYRRTIACLSDTAKKDLERRKQSGAADPAQELSCLKTIKFKLEVPEGSKLPSFDRISQIYNALETIEKGSLSYLLFALILSGFRIFPNSSAAKTFASSSCYKNDQFASQIKEIFGEMVKNFIPSELESILKKGRRKNNKDWTEENIKRVLNSEFGRKNSEGSSALFDSFLSKFSQELFRKFDSWNEVNKKYLEAAELLDSMLASYGPFDSVCKMIGDSDSRNSLPDKSTIAFTNNAEITVDIESSVMPYMAIAALLREYRQSKSKAAPVAYVQSHLTTTNGNGLSWFFKFGLDLIRKAPVSSKQSTSDGSKSLQELFSVPDDKLDGLKFIKEACEALPEASLLCGEKGELLGYQDFRTSFAGHIDSWVANYVNRLFELIELVNQLPESIKLPSILTQKNHNLVASLGLQEAEVSHSLELFEGLVKNVRQTLKKLAGIDISSSPNEQDIKEFYAFSDVLNRLGSIRNQIENAVQTAKKDKIDLESAIEWKEWKKLKKLPKLNGLGGGVPKQQELLDKALESVKQIRHYQRIDFERVIQWAVNEHCLETVPKFLVDAEKKKINKESSTDFAAKENAVRFLLEGIGAAARGKTDSVSKAAYNWFVVNNFLAKKDLNRYFINCQGCIYKPPYSKRRSLAFALRSDNKDTIEVVWEKFETFYKEISKEIEKFNIFSQEFQTFLHLENLRMKLLLRRIQKPIPAEIAFFSLPQEYYDSLPPNVAFLALNQEITPSEYITQFNLYSSFLNGNLILLRRSRSYLRAKFSWVGNSKLIYAAKEARLWKIPNAYWKSDEWKMILDSNVLVFDKAGNVLPAPTLKKVCEREGDLRLFYPLLRQLPHDWCYRNPFVKSVGREKNVIEVNKEGEPKVASALPGSLFRLIGPAPFKSLLDDCFFNPLDKDLRECMLIVDQEISQKVEAQKVEASLESCTYSIAVPIRYHLEEPKVSNQFENVLAIDQGEAGLAYAVFSLKSIGEAETKPIAVGTIRIPSIRRLIHSVSTYRKKKQRLQNFKQNYDSTAFIMRENVTGDVCAKIVGLMKEFNAFPVLEYDVKNLESGSRQLSAVYKAVNSHFLYFKEPGRDALRKQLWYGGDSWTIDGIEIVTRERKEDGKEGVEKIVPLKVFPGRSVSARFTSKTCSCCGRNVFDWLFTEKKAKTNKKFNVNSKGELTTADGVIQLFEADRSKGPKFYARRKERTPLTKPIAKGSYSLEEIERRVRTNLRRAPKSKQSRDTSQSQYFCVYKDCALHFSGMQADENAAINIGRRFLTALRKNRRSDFPSNVKISDRLLDN

Cas12c2 MTKHSIPLHAFRNSGADARKWKGRIALLAKRGKETMRTLQFPLEMSEPEAAAINTTPFAVAYNAIEGTGKGTLFDYWAKLHLAGFRFFPSGGAATIFRQQAVFEDASWNAAFCQQSGKDWPWLVPSKLYERFTKAPREVAKKDGSKKSIEFTQENVANESHVSLVGASITDKTPEDQKEFFLKMAGALAEKFDSWKSANEDRIVAMKVIDEFLKSEGLHLPSLENIAVKCSVETKPDNATVAWHDAPMSGVQNLAIGVFATCASRIDNIYDLNGGKLSKLIQESATTPNVTALSWLFGKGLEYFRTTDIDTIMQDFNIPASAKESIKPLVESAQAIPTMTVLGKKNYAPFRPNFGGKIDSWIANYASRLMLLNDILEQIEPGFELPQALLDNETLMSGIDMTGDELKELIEAVYAWVDAAKQGLATLLGRGGNVDDAVQTFEQFSAMMDTLNGTLNTISARYVRAVEMAGKDEARLEKLIECKFDIPKWCKSVPKLVGISGGLPKVEEEIKVMNAAFKDVRARMFVRFEEIAAYVASKGAGMDVYDALEKRELEQIKKLKSAVPERAHIQAYRAVLHRIGRAVQNCSEKTKQLFSSKVIEMGVFKNPSHLNNFIFNQKGAIYRSPFDRSRHAPYQLHADKLLKNDWLELLAEISATLMASESTEQMEDALRLERTRLQLQLSGLPDWEYPASLAKPDIEVEIQTALKMQLAKDTVTSDVLQRAFNLYSSVLSGLTFKLLRRSFSLKMRFSVADTTQLIYVPKVCDWAIPKQYLQAEGEIGIAARVVTESSPAKMVTEVEMKEPKALGHFMQQAPHDWYFDASLGGTQVAGRIVEKGKEVGKERKLVGYRMRGNSAYKTVLDKSLVGNTELSQCSMIIEIPYTQTVDADFRAQVQAGLPKVSINLPVKETITASNKDEQMLFDRFVAIDLGERGLGYAVFDAKTLELQESGHRPIKAITNLLNRTHHYEQRPNQRQKFQAKFNVNLSELRENTVGDVCHQINRICAYYNAFPVLEYMVPDRLDKQLKSVYESVTNRYIWSSTDAHKSARVQFWLGGETWEHPYLKSAKDKKPLVLSPGRGASGKGTSQTCSCCGRNPFDLIKDMKPRAKIAVVDGKAKLENSELKLFERNLESKDDMLARRHRNERAGMEQPLTPGNYTVDEIKALLRANLRRAPKNRRTKDTTVSEYHCVFSDCGKTMHADENAAVNIGGKFIADIEK

OspCas12c
MTKLRHRQKKLTHDWAGSKKREVLGSNGKLQNPLLMPVKKGQVTEFRKAFSAYARATKGEMTDGRKNMFTHSFEPFKTKPSLHQCELADKAYQSLHSYLPGSLAHFLLSAHALGFRIFSKSGEATAFQASSKIEAYESKLASELACVDLSIQNLTISTLFNALTTSVRGKGEETSADPLIARFYTLLTGKPLSRDTQGPERDLAEVISRKIASSFGTWKEMTANPLQSLQFFEEELHALDANVSLSPAFDVLIKMNDLQGDLKNRTIVFDPDAPVFEYNAEDPADIIIKLTARYAKEAVIKNQNVGNYVKNAITTTNANGLGWLLNKGLSLLPVSTDDELLEFIGVERSHPSCHALIELIAQLEAPELFEKNVFSDTRSEVQGMIDSAVSNHIARLSSSRNSLSMDSEELERLIKSFQIHTPHCSLFIGAQSLSQQLESLPEALQSGVNSADILLGSTQYMLTNSLVEESIATYQRTLNRINYLSGVAGQINGAIKRKAIDGEKIHLPAAWSELISLPFIGQPVIDVESDLAHLKNQYQTLSNEFDTLISALQKNFDLNFNKALLNRTQHFEAMCRSTKKNALSKPEIVSYRDLLARLTSCLYRGSLVLRRAGIEVLKKHKIFESNSELREHVHERKHFVFVSPLDRKAKKLLRLTDSRPDLLHVIDEILQHDNLENKDRESLWLVRSGYLLAGLPDQLSSSFINLPIITQKGDRRLIDLIQYDQINRDAFVMLVTSAFKSNLSGLQYRANKQSFVVTRTLSPYLGSKLVYVPKDKDWLVPSQMFEGRFADILQSDYMVWKDAGRLCVIDTAKHLSNIKKSVFSSEEVLAFLRELPHRTFIQTEVRGLGVNVDGIAFNNGDIPSLKTFSNCVQVKVSRTNTSLVQTLNRWFEGGKVSPPSIQFERAYYKKDDQIHEDAAKRKIRFQMPATELVHASDDAGWTPSYLLGIDPGEYGMGLSLVSINNGEVLDSGFIHINSLINFASKKSNHQTKVVPRQQYKSPYANYLEQSKDSAAGDIAHILDRLIYKLNALPVFEALSGNSQSAADQVWTKVLSFYTWGDNDAQNSIRKQHWFGASHWDIKGMLRQPPTEKKPKPYIAFPGSQVSSYGNSQRCSCCGRNPIEQLREMAKDTSIKELKIRNSEIQLFDGTIKLFNPDPSTVIERRRHNLGPSRIPVADRTFKNISPSSLEFKELITIVSRSIRHSPEFIAKKRGIGSEYFCAYSDCNSSLNSEANAAANVAQKFQKQLFFEL

いくつかの実施形態において、napDNAbpは、Cas12g、Cas12h、またはCas12iを指し、これらは、例えばYan et al., “Functionally Diverse Type V CRISPR-Cas Systems,” Science, 2019 Jan. 4; 363: 88-91に記載されており、その内容全体は、参照により本明細書に組み込まれる。10テラバイトを超える配列データを集約することにより、Cas12g、Cas12h、Cas12iを含め以前に特徴付けられたクラスVタンパク質との弱い類似性を示すタイプV Casタンパク質の新しいクラスが同定された。いくつかの実施形態において、Cas12タンパク質は、Cas12gまたはそのバリアントである。いくつかの実施形態において、Cas12タンパク質は、Cas12hまたはそのバリアントである。いくつかの実施形態において、Cas12タンパク質は、Cas12iまたはそのバリアントである。他のRNA誘導DNA結合タンパク質がnapDNAbpとして使用され得、そして本開示の範囲内にあることを理解されたい。いくつかの実施形態において、napDNAbpは、天然に存在するCas12g、Cas12h、またはCas12iタンパク質に対して少なくとも85%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96％、少なくとも97％、少なくとも98％、少なくとも99％、または少なくとも99.5％の同一性を有するアミノ酸配列を含む。いくつかの実施形態において、napDNAbpは、天然に存在するCas12g、Cas12h、またはCas12iタンパク質である。いくつかの実施形態において、napDNAbpは、本明細書に記載の任意のCas12g、Cas12h、またはCas12iタンパク質に対して少なくとも85%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96％、少なくとも97％、少なくとも98％、少なくとも99％、または少なくとも99.5％の同一性であるアミノ酸配列を含む。他の細菌種由来のCas12g、Cas12h、またはCas12iもまた、本開示に従って使用され得ることが理解されるべきである。いくつかの実施形態では、Cas12iは、Cas12i1またはCas12i2である。

Cas12g1
MAQASSTPAVSPRPRPRYREERTLVRKLLPRPGQSKQEFRENVKKLRKAFLQFNADVSGVCQWAIQFRPRYGKPAEPTETFWKFFLEPETSLPPNDSRSPEFRRLQAFEAAAGINGAAALDDPAFTNELRDSILAVASRPKTKEAQRLFSRLKDYQPAHRMILAKVAAEWIESRYRRAHQNWERNYEEWKKEKQEWEQNHPELTPEIREAFNQIFQQLEVKEKRVRICPAARLLQNKDNCQYAGKNKHSVLCNQFNEFKKNHLQGKAIKFFYKDAEKYLRCGLQSLKPNVQGPFREDWNKYLRYMNLKEETLRGKNGGRLPHCKNLGQECEFNPHTALCKQYQQQLSSRPDLVQHDELYRKWRREYWREPRKPVFRYPSVKRHSIAKIFGENYFQADFKNSVVGLRLDSMPAGQYLEFAFAPWPRNYRPQPGETEISSVHLHFVGTRPRIGFRFRVPHKRSRFDCTQEELDELRSRTFPRKAQDQKFLEAARKRLLETFPGNAEQELRLLAVDLGTDSARAAFFIGKTFQQAFPLKIVKIEKLYEQWPNQKQAGDRRDASSKQPRPGLSRDHVGRHLQKMRAQASEIAQKRQELTGTPAPETTTDQAAKKATLQPFDLRGLTVHTARMIRDWARLNARQIIQLAEENQVDLIVLESLRGFRPPGYENLDQEKKRRVAFFAHGRIRRKVTEKAVERGMRVVTVPYLASSKVCAECRKKQKDNKQWEKNKKRGLFKCEGCGSQAQVDENAARVLGRVFWGEIELPTAIP

Cas12h1
MKVHEIPRSQLLKIKQYEGSFVEWYRDLQEDRKKFASLLFRWAAFGYAAREDDGATYISPSQALLERRLLLGDAEDVAIKFLDVLFKGGAPSSSCYSLFYEDFALRDKAKYSGAKREFIEGLATMPLDKIIERIRQDEQLSKIPAEEWLILGAEYSPEEIWEQVAPRIVNVDRSLGKQLRERLGIKCRRPHDAGYCKILMEVVARQLRSHNETYHEYLNQTHEMKTKVANNLTNEFDLVCEFAEVLEEKNYGLGWYVLWQGVKQALKEQKKPTKIQIAVDQLRQPKFAGLLTAKWRALKGAYDTWKLKKRLEKRKAFPYMPNWDNDYQIPVGLTGLGVFTLEVKRTEVVVDLKEHGKLFCSHSHYFGDLTAEKHPSRYHLKFRHKLKLRKRDSRVEPTIGPWIEAALREITIQKKPNGVFYLGLPYALSHGIDNFQIAKRFFSAAKPDKEVINGLPSEMVVGAADLNLSNIVAPVKARIGKGLEGPLHALDYGYGELIDGPKILTPDGPRCGELISLKRDIVEIKSAIKEFKACQREGLTMSEETTTWLSEVESPSDSPRCMIQSRIADTSRRLNSFKYQMNKEGYQDLAEALRLLDAMDSYNSLLESYQRMHLSPGEQSPKEAKFDTKRASFRDLLRRRVAHTIVEYFDDCDIVFFEDLDGPSDSDSRNNALVKLLSPRTLLLYIRQALEKRGIGMVEVAKDGTSQNNPISGHVGWRNKQNKSEIYFYEDKELLVMDADEVGAMNILCRGLNHSVCPYSFVTKAPEKKNDEKKEGDYGKRVKRFLKDRYGSSNVRFLVASMGFVTVTTKRPKDALVGKRLYYHGGELVTHDLHNRMKDEIKYLVEKEVLARRVSLSDSTIKSYKSFAHV

Cas12i1
MSNKEKNASETRKAYTTKMIPRSHDRMKLLGNFMDYLMDGTPIFFELWNQFGGGIDRDIISGTANKDKISDDLLLAVNWFKVMPINSKPQGVSPSNLANLFQQYSGSEPDIQAQEYFASNFDTEKHQWKDMRVEYERLLAELQLSRSDMHHDLKLMYKEKCIGLSLSTAHYITSVMFGTGAKNNRQTKHQFYSKVIQLLEESTQINSVEQLASIILKAGDCDSYRKLRIRCSRKGATPSILKIVQDYELGTNHDDEVNVPSLIANLKEKLGRFEYECEWKCMEKIKAFLASKVGPYYLGSYSAMLENALSPIKGMTTKNCKFVLKQIDAKNDIKYENEPFGKIVEGFFDSPYFESDTNVKWVLHPHHIGESNIKTLWEDLNAIHSKYEEDIASLSEDKKEKRIKVYQGDVCQTINTYCEEVGKEAKTPLVQLLRYLYSRKDDIAVDKIIDGITFLSKKHKVEKQKINPVIQKYPSFNFGNNSKLLGKIISPKDKLKHNLKCNRNQVDNYIWIEIKVLNTKTMRWEKHHYALSSTRFLEEVYYPATSENPPDALAARFRTKTNGYEGKPALSAEQIEQIRSAPVGLRKVKKRQMRLEAARQQNLLPRYTWGKDFNINICKRGNNFEVTLATKVKKKKEKNYKVVLGYDANIVRKNTYAAIEAHANGDGVIDYNDLPVKPIESGFVTVESQVRDKSYDQLSYNGVKLLYCKPHVESRRSFLEKYRNGTMKDNRGNNIQIDFMKDFEAIADDETSLYYFNMKYCKLLQSSIRNHSSQAKEYREEIFELLRDGKLSVLKLSSLSNLSFVMFKVAKSLIGTYFGHLLKKPKNSKSDVKAPPITDEDKQKADPEMFALRLALEEKRLNKVKSKKEVIANKIVAKALELRDKYGPVLIKGENISDTTKKGKKSSTNSFLMDWLARGVANKVKEMVMMHQGLEFVEVNPNFTSHQDPFVHKNPENTFRARYSRCTPSELTEKNRKEILSFLSDKPSKRPTNAYYNEGAMAFLATYGLKKNDVLGVSLEKFKQIMANILHQRSEDQLLFPSRGGMFYLATYKLDADATSVNWNGKQFWVCNADLVAAYNVGLVDIQKDFKKK

Cas12i2
MSSAIKSYKSVLRPNERKNQLLKSTIQCLEDGSAFFFKMLQGLFGGITPEIVRFSTEQEKQQQDIALWCAVNWFRPVSQDSLTHTIASDNLVEKFEEYYGGTASDAIKQYFSASIGESYYWNDCRQQYYDLCRELGVEVSDLTHDLEILCREKCLAVATESNQNNSIISVLFGTGEKEDRSVKLRITKKILEAISNLKEIPKNVAPIQEIILNVAKATKETFRQVYAGNLGAPSTLEKFIAKDGQKEFDLKKLQTDLKKVIRGKSKERDWCCQEELRSYVEQNTIQYDLWAWGEMFNKAHTALKIKSTRNYNFAKQRLEQFKEIQSLNNLLVVKKLNDFFDSEFFSGEETYTICVHHLGGKDLSKLYKAWEDDPADPENAIVVLCDDLKNNFKKEPIRNILRYIFTIRQECSAQDILAAAKYNQQLDRYKSQKANPSVLGNQGFTWTNAVILPEKAQRNDRPNSLDLRIWLYLKLRHPDGRWKKHHIPFYDTRFFQEIYAAGNSPVDTCQFRTPRFGYHLPKLTDQTAIRVNKKHVKAAKTEARIRLAIQQGTLPVSNLKITEISATINSKGQVRIPVKFDVGRQKGTLQIGDRFCGYDQNQTASHAYSLWEVVKEGQYHKELGCFVRFISSGDIVSITENRGNQFDQLSYEGLAYPQYADWRKKASKFVSLWQITKKNKKKEIVTVEAKEKFDAICKYQPRLYKFNKEYAYLLRDIVRGKSLVELQQIRQEIFRFIEQDCGVTRLGSLSLSTLETVKAVKGIIYSYFSTALNASKNNPISDEQRKEFDPELFALLEKLELIRTRKKKQKVERIANSLIQTCLENNIKFIRGEGDLSTTNNATKKKANSRSMDWLARGVFNKIRQLAPMHNITLFGCGSLYTSHQDPLVHRNPDKAMKCRWAAIPVKDIGDWVLRKLSQNLRAKNIGTGEYYHQGVKEFLSHYELQDLEEELLKWRSDRKSNIPCWVLQNRLAEKLGNKEAVVYIPVRGGRIYFATHKVATGAVSIVFDQKQVWVCNADHVAAANIALTVKGIGEQSSDEENPDGSRIKLQLTS

塩基エディターの代表的な核酸配列およびタンパク質配列は以下の通りである。
BhCas12b GGSGGS-ABE8-Xten20 at P153

MAPKKKRKVGIHGVPAAATRSFILKIEPNEEVKKGLWKTHEVLNHGIAYYMNILKLIRQEAIYEHHEQDPKNPKKVSKAEIQAELWDFVLKMQKCNSFTHEVDKDEVFNILRELYEELVPSSVEKKGEANQLSNKFLYPLVDPNSQSGKGTASSGRKPRWYNLKIAGDPGGSGGSSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLYDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHHPGMNHRVEITEGILADECAALLCRFFRMPRRVFNAQKKAQSSTDGSSGSETPGTSESATPESSGSWEEEKKKWEEDKKKDPLAKILGKLAEYGLIPLFIPYTDSNEPIVKEIKWMEKSRNQSVRRLDKDMFIQALERFLSWESWNLKVKEEYEKVEKEYKTLEERIKEDIQALKALEQYEKERQEQLLRDTLNTNEYRLSKRGLRGWREIIQKWLKMDENEPSEKYLEVFKDYQRKHPREAGDYSVYEFLSKKENHFIWRNHPEYPYLYATFCEIDKKKKDAKQQATFTLADPINHPLWVRFEERSGSNLNKYRILTEQLHTEKLKKKLTVQLDRLIYPTESGGWEEKGKVDIVLLPSRQFYNQIFLDIEEKGKHAFTYKDESIKFPLKGTLGGARVQFDRDHLRRYPHKVESGNVGRIYFNMTVNIEPTESPVSKSLKIHRDDFPKVVNFKPKELTEWIKDSKGKKLKSGIESLEIGLRVMSIDLGQRQAAAASIFEVVDQKPDIEGKLFFPIKGTELYAVHRASFNIKLPGETLVKSREVLRKAREDNLKLMNQKLNFLRNVLHFQQFEDITEREKRVTKWISRQENSDVPLVYQDELIQIRELMYKPYKDWVAFLKQLHKRLEVEIGKEVKHWRKSLSDGRKGLYGISLKNIDEIDRTRKFLLRWSLRPTEPGEVRRLEPGQRFAIDQLNHLNALKEDRLKKMANTIIMHALGYCYDVRKKKWQAKNPACQIILFEDLSNYNPYEERSRFENSKLMKWSRREIPRQVALQGEIYGLQVGEVGAQFSSRFHAKTGSPGIRCSVVTKEKLQDNRFFKNLQREGRLTLDKIAVLKEGDLYPDKGGEKFISLSKDRKCVTTHADINAAQNLQKRFWTRTHGFYKVYCKAYQVDGQTVYIPESKDQKQKIIEEFGEGYFILKDGVYEWVNAGKLKIKKGSSKQSSSELVDSDILKDSFDLASELKGEKLMLYRDPSGNVFPSDKWMAAGVFFGKLERILISKLTNQYSISTIEDDSSKQSMKRPAATKKAGQAKKKKGSYPYDVPDYAYPYDVPDYAYPYDVPDYA

BhCas12b GGSGGS-ABE8-Xten20 at K255

MAPKKKRKVGIHGVPAAATRSFILKIEPNEEVKKGLWKTHEVLNHGIAYYMNILKLIRQEAIYEHHEQDPKNPKKVSKAEIQAELWDFVLKMQKCNSFTHEVDKDEVFNILRELYEELVPSSVEKKGEANQLSNKFLYPLVDPNSQSGKGTASSGRKPRWYNLKIAGDPSWEEEKKKWEEDKKKDPLAKILGKLAEYGLIPLFIPYTDSNEPIVKEIKWMEKSRNQSVRRLDKDMFIQALERFLSWESWNLKVKEEYEKVEKEYKTLEERIKGGSGGSSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLYDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHHPGMNHRVEITEGILADECAALLCRFFRMPRRVFNAQKKAQSSTDGSSGSETPGTSESATPESSGEDIQALKALEQYEKERQEQLLRDTLNTNEYRLSKRGLRGWREIIQKWLKMDENEPSEKYLEVFKDYQRKHPREAGDYSVYEFLSKKENHFIWRNHPEYPYLYATFCEIDKKKKDAKQQATFTLADPINHPLWVRFEERSGSNLNKYRILTEQLHTEKLKKKLTVQLDRLIYPTESGGWEEKGKVDIVLLPSRQFYNQIFLDIEEKGKHAFTYKDESIKFPLKGTLGGARVQFDRDHLRRYPHKVESGNVGRIYFNMTVNIEPTESPVSKSLKIHRDDFPKVVNFKPKELTEWIKDSKGKKLKSGIESLEIGLRVMSIDLGQRQAAAASIFEVVDQKPDIEGKLFFPIKGTELYAVHRASFNIKLPGETLVKSREVLRKAREDNLKLMNQKLNFLRNVLHFQQFEDITEREKRVTKWISRQENSDVPLVYQDELIQIRELMYKPYKDWVAFLKQLHKRLEVEIGKEVKHWRKSLSDGRKGLYGISLKNIDEIDRTRKFLLRWSLRPTEPGEVRRLEPGQRFAIDQLNHLNALKEDRLKKMANTIIMHALGYCYDVRKKKWQAKNPACQIILFEDLSNYNPYEERSRFENSKLMKWSRREIPRQVALQGEIYGLQVGEVGAQFSSRFHAKTGSPGIRCSVVTKEKLQDNRFFKNLQREGRLTLDKIAVLKEGDLYPDKGGEKFISLSKDRKCVTTHADINAAQNLQKRFWTRTHGFYKVYCKAYQVDGQTVYIPESKDQKQKIIEEFGEGYFILKDGVYEWVNAGKLKIKKGSSKQSSSELVDSDILKDSFDLASELKGEKLMLYRDPSGNVFPSDKWMAAGVFFGKLERILISKLTNQYSISTIEDDSSKQSMKRPAATKKAGQAKKKKGSYPYDVPDYAYPYDVPDYAYPYDVPDYA

BhCas12b GGSGGS-ABE8-Xten20 at D306

MAPKKKRKVGIHGVPAAATRSFILKIEPNEEVKKGLWKTHEVLNHGIAYYMNILKLIRQEAIYEHHEQDPKNPKKVSKAEIQAELWDFVLKMQKCNSFTHEVDKDEVFNILRELYEELVPSSVEKKGEANQLSNKFLYPLVDPNSQSGKGTASSGRKPRWYNLKIAGDPSWEEEKKKWEEDKKKDPLAKILGKLAEYGLIPLFIPYTDSNEPIVKEIKWMEKSRNQSVRRLDKDMFIQALERFLSWESWNLKVKEEYEKVEKEYKTLEERIKEDIQALKALEQYEKERQEQLLRDTLNTNEYRLSKRGLRGWREIIQKWLKMDGGSGGSSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLYDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHHPGMNHRVEITEGILADECAALLCRFFRMPRRVFNAQKKAQSSTDGSSGSETPGTSESATPESSGENEPSEKYLEVFKDYQRKHPREAGDYSVYEFLSKKENHFIWRNHPEYPYLYATFCEIDKKKKDAKQQATFTLADPINHPLWVRFEERSGSNLNKYRILTEQLHTEKLKKKLTVQLDRLIYPTESGGWEEKGKVDIVLLPSRQFYNQIFLDIEEKGKHAFTYKDESIKFPLKGTLGGARVQFDRDHLRRYPHKVESGNVGRIYFNMTVNIEPTESPVSKSLKIHRDDFPKVVNFKPKELTEWIKDSKGKKLKSGIESLEIGLRVMSIDLGQRQAAAASIFEVVDQKPDIEGKLFFPIKGTELYAVHRASFNIKLPGETLVKSREVLRKAREDNLKLMNQKLNFLRNVLHFQQFEDITEREKRVTKWISRQENSDVPLVYQDELIQIRELMYKPYKDWVAFLKQLHKRLEVEIGKEVKHWRKSLSDGRKGLYGISLKNIDEIDRTRKFLLRWSLRPTEPGEVRRLEPGQRFAIDQLNHLNALKEDRLKKMANTIIMHALGYCYDVRKKKWQAKNPACQIILFEDLSNYNPYEERSRFENSKLMKWSRREIPRQVALQGEIYGLQVGEVGAQFSSRFHAKTGSPGIRCSVVTKEKLQDNRFFKNLQREGRLTLDKIAVLKEGDLYPDKGGEKFISLSKDRKCVTTHADINAAQNLQKRFWTRTHGFYKVYCKAYQVDGQTVYIPESKDQKQKIIEEFGEGYFILKDGVYEWVNAGKLKIKKGSSKQSSSELVDSDILKDSFDLASELKGEKLMLYRDPSGNVFPSDKWMAAGVFFGKLERILISKLTNQYSISTIEDDSSKQSMKRPAATKKAGQAKKKKGSYPYDVPDYAYPYDVPDYAYPYDVPDYA

BhCas12b GGSGGS-ABE8-Xten20 at D980

MAPKKKRKVGIHGVPAAATRSFILKIEPNEEVKKGLWKTHEVLNHGIAYYMNILKLIRQEAIYEHHEQDPKNPKKVSKAEIQAELWDFVLKMQKCNSFTHEVDKDEVFNILRELYEELVPSSVEKKGEANQLSNKFLYPLVDPNSQSGKGTASSGRKPRWYNLKIAGDPSWEEEKKKWEEDKKKDPLAKILGKLAEYGLIPLFIPYTDSNEPIVKEIKWMEKSRNQSVRRLDKDMFIQALERFLSWESWNLKVKEEYEKVEKEYKTLEERIKEDIQALKALEQYEKERQEQLLRDTLNTNEYRLSKRGLRGWREIIQKWLKMDENEPSEKYLEVFKDYQRKHPREAGDYSVYEFLSKKENHFIWRNHPEYPYLYATFCEIDKKKKDAKQQATFTLADPINHPLWVRFEERSGSNLNKYRILTEQLHTEKLKKKLTVQLDRLIYPTESGGWEEKGKVDIVLLPSRQFYNQIFLDIEEKGKHAFTYKDESIKFPLKGTLGGARVQFDRDHLRRYPHKVESGNVGRIYFNMTVNIEPTESPVSKSLKIHRDDFPKVVNFKPKELTEWIKDSKGKKLKSGIESLEIGLRVMSIDLGQRQAAAASIFEVVDQKPDIEGKLFFPIKGTELYAVHRASFNIKLPGETLVKSREVLRKAREDNLKLMNQKLNFLRNVLHFQQFEDITEREKRVTKWISRQENSDVPLVYQDELIQIRELMYKPYKDWVAFLKQLHKRLEVEIGKEVKHWRKSLSDGRKGLYGISLKNIDEIDRTRKFLLRWSLRPTEPGEVRRLEPGQRFAIDQLNHLNALKEDRLKKMANTIIMHALGYCYDVRKKKWQAKNPACQIILFEDLSNYNPYEERSRFENSKLMKWSRREIPRQVALQGEIYGLQVGEVGAQFSSRFHAKTGSPGIRCSVVTKEKLQDNRFFKNLQREGRLTLDKIAVLKEGDLYPDKGGEKFISLSKDRKCVTTHADINAAQNLQKRFWTRTHGFYKVYCKAYQVDGGSGGSSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLYDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHHPGMNHRVEITEGILADECAALLCRFFRMPRRVFNAQKKAQSSTDGSSGSETPGTSESATPESSGGQTVYIPESKDQKQKIIEEFGEGYFILKDGVYEWVNAGKLKIKKGSSKQSSSELVDSDILKDSFDLASELKGEKLMLYRDPSGNVFPSDKWMAAGVFFGKLERILISKLTNQYSISTIEDDSSKQSMKRPAATKKAGQAKKKKGSYPYDVPDYAYPYDVPDYAYPYDVPDYA

BhCas12b GGSGGS-ABE8-Xten20 at K1019

MAPKKKRKVGIHGVPAAATRSFILKIEPNEEVKKGLWKTHEVLNHGIAYYMNILKLIRQEAIYEHHEQDPKNPKKVSKAEIQAELWDFVLKMQKCNSFTHEVDKDEVFNILRELYEELVPSSVEKKGEANQLSNKFLYPLVDPNSQSGKGTASSGRKPRWYNLKIAGDPSWEEEKKKWEEDKKKDPLAKILGKLAEYGLIPLFIPYTDSNEPIVKEIKWMEKSRNQSVRRLDKDMFIQALERFLSWESWNLKVKEEYEKVEKEYKTLEERIKEDIQALKALEQYEKERQEQLLRDTLNTNEYRLSKRGLRGWREIIQKWLKMDENEPSEKYLEVFKDYQRKHPREAGDYSVYEFLSKKENHFIWRNHPEYPYLYATFCEIDKKKKDAKQQATFTLADPINHPLWVRFEERSGSNLNKYRILTEQLHTEKLKKKLTVQLDRLIYPTESGGWEEKGKVDIVLLPSRQFYNQIFLDIEEKGKHAFTYKDESIKFPLKGTLGGARVQFDRDHLRRYPHKVESGNVGRIYFNMTVNIEPTESPVSKSLKIHRDDFPKVVNFKPKELTEWIKDSKGKKLKSGIESLEIGLRVMSIDLGQRQAAAASIFEVVDQKPDIEGKLFFPIKGTELYAVHRASFNIKLPGETLVKSREVLRKAREDNLKLMNQKLNFLRNVLHFQQFEDITEREKRVTKWISRQENSDVPLVYQDELIQIRELMYKPYKDWVAFLKQLHKRLEVEIGKEVKHWRKSLSDGRKGLYGISLKNIDEIDRTRKFLLRWSLRPTEPGEVRRLEPGQRFAIDQLNHLNALKEDRLKKMANTIIMHALGYCYDVRKKKWQAKNPACQIILFEDLSNYNPYEERSRFENSKLMKWSRREIPRQVALQGEIYGLQVGEVGAQFSSRFHAKTGSPGIRCSVVTKEKLQDNRFFKNLQREGRLTLDKIAVLKEGDLYPDKGGEKFISLSKDRKCVTTHADINAAQNLQKRFWTRTHGFYKVYCKAYQVDGQTVYIPESKDQKQKIIEEFGEGYFILKDGVYEWVNAGKGGSGGSSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLYDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHHPGMNHRVEITEGILADECAALLCRFFRMPRRVFNAQKKAQSSTDGSSGSETPGTSESATPESSGLKIKKGSSKQSSSELVDSDILKDSFDLASELKGEKLMLYRDPSGNVFPSDKWMAAGVFFGKLERILISKLTNQYSISTIEDDSSKQSMKRPAATKKAGQAKKKKGSYPYDVPDYAYPYDVPDYAYPYDVPDYA

上記の配列では、コザック配列は太字で下線が引かれている。N末端核局在化シグナル（NLS）をマークしている。小文字はGGGSGGSリンカーを示す。破線による下線はABE8をコードする配列をマークし、修飾されていない配列はBhCas12bをコードする。二重下線はXten20リンカーを示す。単一下線はC末端NLSを示す。点線よる下線のGGATCCはGSリンカーを示す。イタリック体の文字は、3x血球凝集素（HA）タグのコード配列を表す。

［ガイドポリヌクレオチド］
一実施形態では、ガイドポリヌクレオチドはガイドRNAである。本明細書で使用される場合、「ガイドポリヌクレオチド」という用語は、標的配列に特異的であることができポリヌクレオチドプログラム可能なヌクレオチド結合ドメインタンパク質（例えばCas9またはCpf1）と複合体を形成することができるポリヌクレオチドを指す。一実施形態では、ガイドポリヌクレオチドはガイドRNAである。本明細書で使用される場合、「ガイドRNA（gRNA）」という用語およびその文法的同等物は、標的DNAに特異的であることができCasタンパク質と複合体を形成することができるRNAを指し得る。RNA/Cas複合体は、Casタンパク質を標的DNAへと「ガイド」するのを補助することができる。Cas9/crRNA/tracrRNAは、スペーサーに相補的な線状または環状dsDNA標的をエンドヌクレアーゼ的に切断する。crRNAに相補的でない標的鎖が最初にエンドヌクレアーゼで切断され、次いでエキソヌクレアーゼ的に3’-5’方向にトリムされる。自然界では、DNA結合と切断にはタンパク質と両方のRNAが通常必要とされる。しかしながら、crRNAおよびtracrRNAの両方の側面を単一のRNA種に組み込むように、単一ガイドRNA (「sgRNA」、または単に「gRNA」)を作製することができる。例えば、Jinek M. et al., Science 337:816-821(2012)を参照されたい（その内容全体が参照により本明細書に組み入れられる）。Cas9は、CRISPR反復配列中の短いモチーフ(PAMまたはプロトスペーサー隣接モチーフ)を認識して、自己と非自己を区別するのを助ける。Cas9ヌクレアーゼの配列および構造は、当業者によく知られている（例えば“Complete genome sequence of an M1 strain of Streptococcus pyogenes.” Ferretti, J.J. et al., Natl. Acad. Sci. U.S.A. 98:4658-4663(2001); “CRISPR RNA maturation by trans-encoded small RNA and host factor RNase III.” Deltcheva E. et al., Nature 471:602-607(2011); および “Programmable dual-RNA-guided DNA endonuclease in adaptive bacterial immunity.” Jinek M.et al, Science 337:816-821(2012)参照。その内容全体が参照により本明細書に組み入れられる）。Cas9オーソログは、限定されるものではないが、S. pyogenes および S. thermophilusを含む様々な種において記述されている。さらなる適切なCas9ヌクレアーゼおよび配列は、本開示に基づいて当業者に明らかとなり得、そのようなCas9ヌクレアーゼおよび配列には、Chylinski, Rhun, and Charpentier, “The tracrRNA and Cas9 families of type II CRISPR-Cas immunity systems” (2013) RNA Biology 10:5, 726-737に開示されている生物および遺伝子座からのCas9配列が含まれる（その全内容は参照により本明細書に組み込まれる）。ある態様において、Cas9ヌクレアーゼは、不活性(例えば不活化) DNA切断ドメインを有し、すなわち、Cas9はニッカーゼである。

ある態様において、ガイドポリヌクレオチドは、少なくとも一つの単一ガイドRNA (「sgRNA」または「gRNA」)である。ある態様において、ガイドポリヌクレオチドは、少なくとも一つのtracrRNAであり、ある態様において、ガイドポリヌクレオチドは、ポリヌクレオチドプログラム可能なDNA結合ドメイン(例:Cas9またはCpf1)を標的ヌクレオチド配列に導くためにPAM配列を必要としない。

本願明細書に開示される塩基エディターのポリヌクレオチドプログラム可能ヌクレオチド結合ドメイン(例えばCRISPR由来ドメイン)は、ガイドポリヌクレオチドと会合することによって標的ポリヌクレオチド配列を認識することができる。ガイドポリヌクレオチド(例えばgRNA)は、典型的には一本鎖であり、ポリヌクレオチドの標的配列に部位特異的に結合(すなわち相補的塩基対形成を介して)するようにプログラムすることができ、それによって、ガイド核酸を伴った塩基エディターを標的配列に導く。ガイドポリヌクレオチドはDNAであり得る。ガイドポリヌクレオチドはRNAであり得る。ある実施形態では、ガイドポリヌクレオチドは天然ヌクレオチド(例えばアデノシン)を含む。ある実施形態では、ガイドポリヌクレオチドは、非天然(または不自然)ヌクレオチド(例えばペプチド核酸またはヌクレオチドアナログ)を含む。ある実施形態では、ガイド核酸配列の標的化領域は、長さが少なくとも15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、または30ヌクレオチドであり得る。ガイド核酸の標的化領域は、長さが10～30ヌクレオチドの間、または長さが15～25ヌクレオチドの間、または長さが15～20ヌクレオチドの間であり得る。

いくつかの実施形態において、ガイドポリヌクレオチドは、例えば相補的塩基対形成を介して互いに相互作用できる、二つ以上の個別のポリヌクレオチドを含む(例えば二重ガイドポリヌクレオチド)。例えば、ガイドポリヌクレオチドは、CRISPR RNA (crRNA) およびトランス活性化CRISPR RNA (tracrRNA) を含むことができる。例えば、ガイドポリヌクレオチドは、1以上のトランス活性化CRISPR RNA (tracrRNA) を含むことができる。

II型CRISPRシステムにおいて、CRISPRタンパク質(例Cas9)による核酸の標的化は、典型的には、標的配列を認識する配列を含む第一のRNA分子(crRNA) と、ガイドRNA-CRISPRタンパク質複合体を安定化させる足場領域を形成する反復配列を含む第二のRNA分子(trRNA) との間の相補的塩基対形成を必要とする。このような二重ガイドRNAシステムは、本明細書に開示された塩基エディターを標的ポリヌクレオチド配列に導くためのガイドポリヌクレオチドとして利用され得る。

いくつかの実施形態において、本明細書で提供される塩基エディターは、単一ガイドポリヌクレオチド(例えばgRNA)を利用する。いくつかの実施形態において、本明細書で提供される塩基エディターは、デュアル（二重）ガイドポリヌクレオチド(例えばデュアルgRNA)を利用する。いくつかの実施形態において、本明細書で提供される塩基エディターは、一つ以上のガイドポリヌクレオチド(例えば複数のgRNA)を利用する。いくつかの実施形態において、単一ガイドポリヌクレオチドが、本明細書に記載される異なる塩基エディターのために利用される。例えば、単一ガイドポリヌクレオチドを、シチジン塩基エディターおよびアデノシン塩基エディターのために利用することができる。

他の実施形態では、ガイドポリヌクレオチドは、核酸のポリヌクレオチド標的化部分および核酸の足場部分の両方を単一分子(すなわち単一分子ガイド核酸)中に含むことができる。例えば、単一分子ガイドポリヌクレオチドは、単一ガイドRNA (sgRNAまたはgRNA)であり得る。本明細書において、「ガイドポリヌクレオチド配列」という用語は、塩基エディターと相互作用し標的ポリヌクレオチド配列に塩基エディターを導くことができる任意の単一、二重または複数分子核酸を企図する。

典型的には、ガイドポリヌクレオチド(例えばcrRNA/trRNA複合体またはgRNA)は、標的ポリヌクレオチド配列を認識しそれに結合することができる配列を含む「ポリヌクレオチド標的セグメント」と、塩基エディターのポリヌクレオチドプログラム可能ヌクレオチド結合ドメイン成分内でガイドポリヌクレオチドを安定化させる「タンパク質結合セグメント」とを含む。或る実施態様では、ガイドポリヌクレオチドのポリヌクレオチド標的セグメントは、DNAポリヌクレオチドを認識してそれに結合し、それによりDNA中の塩基の編集を促進する。他の実施態様では、ガイドポリヌクレオチドのポリヌクレオチド標的セグメントは、RNAポリヌクレオチドを認識しそれに結合し、それによりRNA中の塩基の編集を促進する。ここで、「セグメント」とは、分子の一部分または領域、例えばガイドポリヌクレオチド中の連続したヌクレオチドのストレッチをいう。また、セグメントは、複合体の領域/セクションも表し得、従ってセグメントは2つ以上の分子の領域を含むことができる。例えば、ガイドポリヌクレオチドが複数の核酸分子を含む場合、タンパク質結合セグメントは、例えば相補性の領域に沿ってハイブリダイズした複数の別個の分子の全てまたは一部を含むことができる。ある態様において、二つの別個の分子を含むDNA標的化RNAのタンパク質結合セグメントは、 (i) 長さが100塩基対である第一のRNA分子の塩基対40～75；および(ii) 長さが50塩基対である第二のRNA分子の10～25塩基対を含み得る。「セグメント」の定義は、特定の文脈において特に定義されない限り、全塩基対のうちの特定の数に限定されず、所与のRNA分子からの塩基対の特定の数に限定されず、複合体内の別個の分子の特定の数に限定されず、任意の全長のRNA分子の領域を含み得、他の分子に対する相補性を有する領域を含み得る。

ガイドRNAまたはガイドポリヌクレオチドは、2つ以上のRNA、例えばCRISPR RNA (crRNA) およびトランス活性化crRNA (tracrRNA) を含むことができる。ガイドRNAまたはガイドポリヌクレオチドは、時に、crRNAおよびtracrRNAの一部分(例えば機能的部分) の融合によって形成される単一鎖RNA、あるいは単一ガイドRNA (sgRNA) を含み得る。ガイドRNAまたはガイドポリヌクレオチドは、crRNAおよびtracrRNAを含む二重RNAであってもよい。さらに、crRNAは標的DNAとハイブリダイズし得る。

上述のように、ガイドRNAまたはガイドポリヌクレオチドは、発現産物であり得る。例えば、ガイドRNAをコードするDNAは、ガイドRNAをコードする配列を含むベクターであり得る。ガイドRNAまたはガイドポリヌクレオチドは、単離されたガイドRNA、またはガイドRNAをコードする配列およびプロモーターを含むプラスミドDNAを細胞にトランスフェクトすることによって、細胞に導入することができる。ガイドRNAまたはガイドポリヌクレオチドは、ウイルス媒介遺伝子送達の使用など、他の方法で細胞に導入することもできる。

ガイドRNAまたはガイドポリヌクレオチドを単離することができる。例えば、ガイドRNAは、単離されたRNAの形態で細胞または生物にトランスフェクトされ得る。ガイドRNAは、当技術分野で公知の任意のインビトロ転写系を用いたインビトロ転写によって調製することができる。ガイドRNAは、ガイドRNAをコードする配列を含むプラスミドの形態ではなく、単離されたRNAの形態で細胞に移入され得る。

ガイドRNAまたはガイドポリヌクレオチドは、以下の3つの領域を含み得る：染色体配列中の標的部位に相補的であり得る5’末端における第1の領域、ステムループ構造を形成し得る第2の内部領域、および一本鎖であり得る第3の3’領域。各ガイドRNAが融合タンパク質を特異的な標的部位にガイドするように、各ガイドRNAの第1の領域を異ならせることもできる。さらに、各ガイドRNAの第2および第3の領域は、すべてのガイドRNAにおいて同一であり得る。

ガイドRNAまたはガイドポリヌクレオチドの第1の領域は、そのガイドRNAの第1の領域が標的部位と塩基対を形成できるように、染色体配列の標的部位における配列に相補的であり得る。ある実施形態では、ガイドRNAの第一の領域は、約10ヌクレオチド～25ヌクレオチド(すなわち、10ヌクレオチドからヌクレオチドまで;または約10ヌクレオチドから約25ヌクレオチドまで;または10ヌクレオチドから約25ヌクレオチドまで;または約10ヌクレオチドから25ヌクレオチドまで)またはそれ以上を含むことができる。例えば、ガイドRNAの第一の領域と染色体配列中の標的部位との間の塩基対形成の領域は、長さが約10、11、12、13、14、15、16、17、18、19、20、22、23、24、25またはそれ以上のヌクレオチドであり得るか、またはおよそその長さであり得る。ときに、ガイドRNAの第一の領域は、長さが19、20、もしくは21ヌクレオチド、または約19、20、もしくは21ヌクレオチドであり得る。

ガイドRNAまたはガイドポリヌクレオチドは、二次構造を形成する第2の領域を含むこともできる。例えば、ガイドRNAによって形成される二次構造は、ステム（またはヘアピン）およびループを含むことができる。ループとステムの長さはさまざまであり得る。例えば、ループの長さは（約）3から10ヌクレオチドの範囲であり得、ステムの長さは（約）6から20塩基対の範囲であり得る。ステムは、1から10または約10ヌクレオチドの一つ以上のバルジを含むことができる。第二の領域の全長は、約16から60ヌクレオチド長の範囲であり得る。例えば、ループは長さが（約）4ヌクレオチドであり得、ステムは（約）12塩基対であり得る。

ガイドRNAまたはガイドポリヌクレオチドは、本質的に一本鎖状態であり得る3'末端の第3の領域も含むこともできる。たとえば、第3の領域は、対象とする細胞のいずれの染色体配列とも相補的でないこともあれば、ガイドRNAの残りの部分と相補的でないこともある。さらに第3の領域の長さはさまざまであり得る。第3の領域は、長さが約4ヌクレオチド以上であり得る。例えば、第3の領域の長さは、（約）5から60ヌクレオチド長の範囲であり得る。

ガイドRNAまたはガイドポリヌクレオチドは、遺伝子標的の任意のエクソンまたはイントロンを標的とすることができる。ある実施形態では、ガイドは遺伝子のエキソン1または2を標的にすることができる；他の実施形態では、ガイドは遺伝子のエキソン3または4を標的にすることができる。組成物は、全てが同じエクソンを標的とする複数のガイドRNA、あるいはいくつかの実施形態では、異なるエクソンを標的とする複数のガイドRNAを含むことができる。遺伝子のエキソンとイントロンが標的とされ得る。

ガイドRNAまたはガイドポリヌクレオチドは、約20ヌクレオチドの核酸配列を標的とし得る。標的核酸は、約20ヌクレオチド未満であり得る。標的核酸は、長さが少なくとも約5、10、15、16、17、18、19、20、21、22、23、24、25、30、または1～100ヌクレオチドの間の任意の長さであり得る。標的核酸は、長さが多くとも約5、10、15、16、17、18、19、20、21、22、23、24、25、30、40、50ヌクレオチド、または1～100ヌクレオチドの間の任意の長さであり得る。標的核酸配列は、PAMの最初のヌクレオチドの5’直近の約20塩基であり得る。ガイドRNAは、核酸配列を標的化し得る。標的核酸は、少なくとも約1～10、1～20、1～30、1～40、1～50、1～60、1～70、1～80、1～90、または1～100ヌクレオチドであり得る。

ガイドポリヌクレオチド、例えばガイドRNAは、別の核酸、例えば、細胞のゲノム中の標的核酸またはプロトスペーサーにハイブリダイズし得る核酸を指すことができる。ガイドポリヌクレオチドはRNAであり得る。ガイドポリヌクレオチドはDNAであり得る。ガイドポリヌクレオチドは、核酸の配列に部位特異的に結合するようにプログラムまたは設計することができる。ガイドポリヌクレオチドは、一ポリヌクレオチド鎖を含み得、単一ガイドポリヌクレオチドと呼ばれ得る。ガイドポリヌクレオチドは、2つのポリヌクレオチド鎖を含み得、二重ガイドポリヌクレオチドと呼ばれ得る。ガイドRNAはRNA分子として細胞や胚に導入され得る。例えば、RNA分子は、インビトロで転写され得、および/または化学的に合成され得る。RNAは、合成DNA分子、例えばgBlocks（登録商標）遺伝子断片から転写され得る。ガイドRNAはRNA分子として細胞や胚に導入され得る。ガイドRNAはまた、非RNA核酸分子、例えばDNA分子の形態で細胞または胚に導入され得る。例えば、ガイドRNAをコードするDNAが、対象の細胞または胚におけるガイドRNAの発現のためにプロモーター制御配列に作動可能に連結され得る。RNAコード配列は、RNAポリメラーゼIII (Pol III)によって認識されるプロモーター配列に作動可能に連結され得る。ガイドRNAを発現するために使用することができるプラスミドベクターは、px330ベクターおよびpx333ベクターを含むが、これらに限定されない。ある実施形態では、プラスミドベクター（例えばpx333ベクター）は、少なくとも二つのガイドRNAをコードするDNA配列を含むことができる。

ガイドポリヌクレオチド（例えばガイドRNA）およびターゲティング配列を選択、設計および検証するための方法は、本明細書中に記載され、当業者に知られている。例えば、核酸塩基エディター系におけるデアミナーゼドメイン(例えばAIDドメイン)の潜在的基質混合性（promiscuity）の影響を最小限にするために、意図せず脱アミノ化の標的となり得る残基(例えば、標的核酸遺伝子座内のssDNA上に潜在的に位置し得るオフターゲットC残基)の数を最小限にすることができる。さらに、ソフトウェアツールを使用して、標的核酸配列に対応するgRNAを最適化することができ、例えば、ゲノム全体の総オフターゲット活性を最小限化することができる。例えば、S. pyogenes Cas9を用いた標的化ドメイン選択肢の各可能性について、(例えばNAGまたはNGGなどの選択されたPAMに先行する)ある数(例えば1、2、3、4、5、6、7、8、9、または10)までのミスマッチ塩基対を含むすべてのオフターゲット配列をゲノムにわたって同定することができる。標的部位に相補的なgRNAの第一の領域を同定することができ、すべての第一の領域(例:crRNA)をその総予測オフターゲットスコアに従ってランク付けすることができ;上位にランクされた標的化ドメインは、最大のオンターゲット活性と最小のオフターゲット活性を持つ可能性が高いものを表す。候補gRNAは、当技術分野で公知の方法および/または本明細書に記載の方法を用いて機能的に評価することができる。

非限定的な例として、Cas9と共に使用するためのガイドRNAのcrRNAにおける標的DNAハイブリダイズ配列は、DNA配列探索アルゴリズムを用いて同定することができる。gRNA設計は、Bae S., Park J., & Kim J.-S. Cas-OFFinder: A fast and versatile algorithm that searches for potential off-target sites of Cas9 RNA-guided endonucleases. Bioinformatics 30, 1473-1475 (2014)に記載されているような公開ツールcas-offinderに基づくカスタムgRNA設計ソフトウェアを用いて実施することができる。このソフトウェアは、ガイドのゲノム全体的オフターゲット傾向を計算した後にガイドにスコアを付ける。通常、完全マッチから7個のミスマッチまでの範囲の一致が、17から24までの長さの範囲のガイドについて考慮される。いったんオフターゲットサイトが計算的に決定されると、各ガイドについて集約スコアが計算され、ウェブインターフェースを使用した表形式の出力に要約される。PAM配列に隣接する潜在的な標的部位を同定することに加えて、ソフトウェアは、選択された標的部位から1、2、3または3超のヌクレオチドだけ異なるすべてのPAM隣接配列も同定する。標的核酸配列、例えば標的遺伝子についてのゲノムDNA配列を得て、反復エレメントを、公に入手可能なツール、例えば、RepeatMaskerプログラムを用いてスクリーニングすることができる。RepeatMaskerは、入力されたDNA配列から、反復エレメントや低複雑性領域を探し出す。所与のクエリー配列に存在する反復の詳細な注釈が出力となる。

同定後、ガイドRNA（例えばcrRNA）の第１の領域が、標的部位へのそれらの距離、それらの直交性（orthogonality）、および関連するPAM配列との密接な一致のための5’ヌクレオチドの存在(例えば、関連するPAM (例えば、化膿レンサ球菌についてのNGG PAM、黄色ブドウ球菌についてのNNGRRTまたはNNGRRV PAM) を含むヒトゲノムにおける密接な一致の同定に基づく5’G)に基づいて、階層にランク付けされ得る。本明細書において使用される場合、直交性とは、標的配列に対して最小数のミスマッチを含む、ヒトゲノムにおける配列の数を表す。「高レベルの直交性」または「良好な直交性」は、例えば、意図された標的以外にヒトゲノムにおいて同一の配列を有さず、標的配列において一または二のミスマッチを含有する配列も有さない20マー標的化ドメインを指し得る。良好な直交性を有する標的化ドメインは、オフターゲットDNA切断を最小化するように選択され得る。

いくつかの実施形態において、塩基編集活性を検出すること、および候補ガイドポリヌクレオチドを試験することのためにレポーターシステムが使用され得る。いくつかの態様において、レポーターシステムは、塩基編集活性がレポーター遺伝子の発現をもたらす、レポーター遺伝子ベースのアッセイを含むことができる。例えば、レポーターシステムは、不活性化開始コドン、例えば、鋳型鎖上の3'-TAC-5'から3'-CAC-5'への突然変異を含むレポーター遺伝子を含み得る。標的Cの脱アミノ化に成功すると、対応するmRNAは5'-GUG-3'ではなく5'-AUG-3'として転写され、レポーター遺伝子の翻訳を可能にする。適切なレポーター遺伝子は、当業者には明らかであろう。レポーター遺伝子の非限定的な例としては、緑色蛍光タンパク質 (GFP) 、赤色蛍光タンパク質 (RFP) 、ルシフェラーゼ、分泌型アルカリホスファターゼ (SEAP) 、または、発現が検出可能であり当業者には明らかである他の任意の遺伝子をコードする遺伝子が挙げられる。レポーター系を用いて、多くの異なるgRNAを試験することができ、例えば、標的DNA配列に関してどの残基を、それぞれの対応デアミナーゼが標的とするかを決定することができる。非鋳型鎖を標的とするsgRNAも、特定の塩基編集タンパク質（例えばCas9デアミナーゼ融合タンパク質）のオフターゲット効果を評価するために試験することができる。いくつかの実施形態において、そのようなgRNAは、変異開始コドンがgRNAと塩基対を形成しないように設計することができる。ガイドポリヌクレオチドは、標準リボヌクレオチド、修飾リボヌクレオチド(例えば、プソイドウリジン)、リボヌクレオチド異性体、および/またはリボヌクレオチド類似体を含むことができる。いくつかの実施形態において、ガイドポリヌクレオチドは、少なくとも1つの検出可能な標識を含むことができる。検出可能な標識は、フルオロフォア(例えば、FAM、TMR、Cy3、Cy5、テキサスレッド、オレゴングリーン、Alexa Fluor、Haloタグ、または適切な蛍光色素)、検出タグ(例えば、ビオチン、ジゴキシゲニン等)、量子ドット、または金粒子であり得る。

ガイドポリヌクレオチドは、化学的に合成され得るか、酵素的に合成され得るか、またはそれらの組み合わせであり得る。例えば、ガイドRNAは、標準的なホスホロアミダイトベースの固相合成法を用いて合成することができる。あるいは、ガイドRNAをコードするDNAを、ファージRNAポリメラーゼにより認識されるプロモーター制御配列に作動可能に連結することによって、ガイドRNAをインビトロで合成することができる。適切なファージプロモーター配列の例は、T7、T3、SP6プロモーター配列、またはそれらのバリアントを含む。ガイドRNAが二つの別々の分子(例えば、crRNAとtracrRNA)を含む実施形態において、crRNAは化学的に合成することができ、tracrRNAは酵素的に合成することができる。

ある態様において、塩基エディター系は、複数のガイドポリヌクレオチド、例えばgRNAを含み得る。例えば、gRNAは、塩基エディター系に含まれる一つ以上の標的遺伝子座(例えば少なくとも1 gRNA、少なくとも2 gRNA、少なくとも5 gRNA、少なくとも10 gRNA、少なくとも20 gRNA、少なくとも30 gRNA、少なくとも50 gRNA)を標的とすることができる。前記複数のgRNA配列はタンデムに配置され得、好ましくは直接反復によって分離される。

ガイドRNAまたはガイドポリヌクレオチドをコードするDNA配列がベクターの一部であってもよい。さらに、ベクターは、追加の発現制御配列（例えばエンハンサー配列、Kozak配列、ポリアデニル化配列、転写終結配列など。）、選択可能なマーカー配列（例えばGFPまたはピューロマイシンなどの抗生物質耐性遺伝子）、複製起点などを含むことができる。ガイドRNAをコードするDNA分子は線状であってもよい。ガイドRNAまたはガイドポリヌクレオチドをコードするDNA分子が環状であってもよい。

いくつかの態様において、塩基エディター系の1つ以上の構成要素は、DNA配列によってコードされ得る。このようなDNA配列は、発現系（例えば細胞）に一緒に、または別々に導入することができる。例えば、ポリヌクレオチドプログラム可能なヌクレオチド結合ドメインおよびガイドRNAをコードするDNA配列を細胞に導入することができ、各DNA配列は別個の分子の一部であることができ(例えばポリヌクレオチドプログラム可能なヌクレオチド結合ドメインのコード配列を含む1つのベクターおよびガイドRNAコード配列を含む第2のベクター)、または両方が同じ分子の一部であることができる(例えばポリヌクレオチドプログラム可能なヌクレオチド結合ドメイン及びガイドRNAの両方のためのコード(および調節)配列を含む一つのベクター)。

ガイドポリヌクレオチドは、新しいまたは増強された特徴を有する核酸を提供するための1以上の改変を含むことができる。ガイドポリヌクレオチドは、核酸親和性タグを含むことができる。ガイドポリヌクレオチドは、合成ヌクレオチド、合成ヌクレオチドアナログ、ヌクレオチド誘導体、および/または修飾ヌクレオチドを含むことができる。

ある実施形態では、gRNAまたはガイドポリヌクレオチドは修飾（改変）を含むことができる。修飾は、gRNAまたはガイドポリヌクレオチドの任意の位置に施され得る。単一のgRNAまたはガイドポリヌクレオチドに対して複数の修飾を行うことができる。gRNAまたはガイドポリヌクレオチドは、修飾後に品質管理を受けることができる。ある実施形態では、品質管理は、PAGE、HPLC、MS、またはそれらの任意の組み合わせを含むことができる。

gRNAまたはガイドポリヌクレオチドの修飾は、置換、挿入、欠失、化学的修飾、物理的修飾、安定化、精製、またはそれらの任意の組合せであり得る。

gRNAまたはガイドポリヌクレオチドはまた、5’アデニル酸、5’グアノシン三リン酸キャップ、5’N 7-メチルグアノシン三リン酸キャップ、5’三リン酸キャップ、3’リン酸、3’チオリン酸、5’リン酸、5’チオリン酸、Cis-Synチミジン二量体、三量体、C12スペーサー、C3スペーサー、C6スペーサー、dスペーサー、PCスペーサー、rスペーサー、スペーサー18、スペーサー9、3’-3’修飾、5’-5’修飾、塩基脱落、アクリジン、アゾベンゼン、ビオチン、ビオチンBB、ビオチンTEG、コレステロールTEG、デスチオビオチンTEG、DNP TEG、DNP-X、DOTA、dT-ビオチン、二重ビオチン、ソラレン、ソラレンC2、ソラレンC6、TINA、3’DABCYL、ブラックホールクエンチャー1、ブラックホールクエンチャー2、DABCYL SE、dT-DABCYL、IRDye QC-1、QSY-21、QSY-35、QSY-7、QSY-9、カルボキシルリンカー、チオールリンカー、2’-デオキシリボヌクレオシド類似体プリン、2’-デオキシリボヌクレオシド類似体ピリミジン、リボヌクレオシド類似体、2’-O-メチルリボヌクレオシド類似体、糖修飾類似体、ウォブル/ユニバーサル塩基、蛍光色素標識、2’-フルオロRNA、2’-O-メチルRNA、メチルホスホネート、ホスホジエステルDNA、ホスホジエステルRNA、ホスホチオエステルDNA、ホスホロチオネートRNA、UNA、プソイドリジン-5’-トリホスフェート、5’-メチルシジン-5’-トリホスフェート、またはそれらの任意の組合せでも修飾され得る。

ある実施形態では、修飾は永続的である。その他の実施形態では、修飾は一時的である。ある実施形態では、gRNAまたはガイドポリヌクレオチドに対して複数の修飾が行われる。gRNAまたはガイドポリヌクレオチドの修飾は、それらのコンホメーション、極性、疎水性、化学反応性、塩基対形成相互作用、またはそれらの組み合わせなどの、ヌクレオチドの物理化学的特性を変化させることができる。

PAM配列は、当該技術分野で公知の任意のPAM配列であり得る。適切なPAM配列には、以下が含まれるが、これらに限定されない：NGG, NGA, NGC, NGN, NGT, NGCG, NGAG, NGAN, NGNG, NGCN, NGCG, NGTN, NNGRRT, NNNRRT, NNGRR(N), TTTV, TYCV, TYCV, TATV, NNNNGATT, NNAGAAW, または NAAAAC。Yはピリミジンであり、Nは任意のヌクレオチド塩基であり、WはAまたはTである。

修飾はホスホロチオエート置換でもあり得る。ある実施形態では、天然のホスホジエステル結合は細胞のヌクレアーゼによって急速に分解されやすく、ホスホロチオエート (PS) 結合置換体を用いたヌクレオチド間結合の修飾は、細胞分解による加水分解に対してより安定である。修飾は、gRNAまたはガイドポリヌクレオチドの安定性を増大させることができる。修飾は生物学的活性を増強させることもできる。ある実施形態では、ホスホロチオエート強化RNA gRNAは、RNアーゼA、RNアーゼT1、子牛血清ヌクレアーゼ、またはそれらの組み合わせを阻害することができる。これらの特性は、in vivoまたはin vitroでヌクレアーゼへの暴露がある可能性が高いアプリケーションにおいて、PS-RNA gRNAの使用を可能にする。例えば、ホスホロチオエート (PS) 結合をgRNAの5'末端または''末端における最後の3～5ヌクレオチドの間に導入することができ、それはエキソヌクレアーゼ分解を阻害し得る。ある実施形態では、ホスホロチオエート結合をgRNA全体に加えてエンドヌクレアーゼによる攻撃を減らすことができる。

異なるCas12bオルソログ（例えばBhCas12b、BvCas12b、AaCas12b）は、異なるスキャフォールド（足場）配列（tracrRNAとも呼ばれる）を使用する。いくつかの実施形態において、足場配列は、BhCas12bタンパク質と共に使用するために最適化されており、以下の配列を有する：（実際のgRNAにおいて、Tは、ウリジン（U）によって置き換えられる）。
BhCas12b sgRNAスキャフォールド (下線) + 20nt～23nt ガイド配列 (Nによって示される)。
5’GTTCTGTCTTTTGGTCAGGACAACCGTCTAGCTATAAGTGCTGCAGGGTGTGAGAAACTCCTATTGCTGGACGATGTCTCTTACGAGGCATTAGCACNNNNNNNNNNNNNNNNNNNN-3’

ある実施形態では、スキャフォールド配列はBvCas12bタンパク質との使用のために最適化され、以下の配列を有する：（実際のgRNAにおいて、Tは、ウリジン（U）によって置き換えられる）。
BvCas12b sgRNAスキャフォールド (下線) + 20nt～23ntガイド配列 (Nによって示される)。
5’GACCTATAGGGTCAATGAATCTGTGCGTGTGCCATAAGTAATTAAAAATTACCCACCACAGGAGCACCTGAAAACAGGTGCTTGGCACNNNNNNNNNNNNNNNNNNNN-3’

ある実施形態では、スキャフォールド配列はAaCas12bタンパク質との使用のために最適化され、以下の配列を有する：（実際のgRNAにおいて、Tは、ウリジン（U）によって置き換えられる）。
AaCas12b sgRNAスキャフォールド (下線) + 20nt～23ntガイド配列 (Nによって示される)。
5’GTCTAAAGGACAGAATTTTTCAACGGGTGTGCCAATGGCCACTTTCCAGGTGGCAAAGCCCGTTGAACTTCTCAAAAAGAACGATCTGAGAAGTGGCACNNNNNNNNNNNNNNNNNNNN-3’

したがって、当業者はCasタンパク質特異性のゲノム標的を変化させることができ、これは、ゲノムの他の部分と比較してgRNA標的化配列がゲノム標的に対していかに特異的であるかによって部分的に決定される。

［プロトスペーサ隣接モチーフ］
「プロトスペーサー隣接モチーフ(PAM)」またはPAM様モチーフは、CRISPR細菌適応免疫系においてCas9ヌクレアーゼによって標的化されるDNA配列の直後の2～6塩基対DNA配列を指す。いくつかの実施形態では、PAMは5’PAM (すなわちプロトスペーサの5’末端の上流に位置する)であり得る。他の実施形態では、PAMは3’PAM (すなわちプロトスペーサの5’末端の下流に位置する)であり得る。

PAM配列は標的結合に必須であるが、正確な配列はCasタンパク質の種類に依存する。

本明細書で提供される塩基エディターは、標準的または非標準的プロトスペーサー隣接モチーフ (PAM) 配列を含むヌクレオチド配列に結合することができるCRISPRタンパク質由来ドメインを含むことができる。PAM部位は、標的ポリヌクレオチド配列に近接するヌクレオチド配列である。本開示のいくつかの側面は、異なるPAM特異性を有するCRISPRタンパク質の全部または一部を含む塩基エディターを提供する。

例えば、S. pyogenes由来のCas9 (spCas9) などのCas9タンパク質は、典型的に、特定の核酸領域に結合するために標準的なNGG PAM配列を必要とし、ここで「NGG」中の「N」はアデニン (A) 、チミン(T) 、グアニン (G) 、またはシトシン (C) であり、Gはグアニンである。PAMはCRISPRタンパク質特異的であり得、異なるCRISPRタンパク質由来ドメインを含む異なる塩基エディター間で異なり得る。PAMは標的配列の5’または3’にあり得る。PAMは、標的配列の上流または下流にあり得る。PAMは、1、2、3、4、5、6、7、8、9、10またはそれ以上のヌクレオチドの長さであり得る。多くの場合、PAMは2～6ヌクレオチドの長さである。いくつかのPAMバリアントが下記表1に記載されている。

表１．Cas9タンパク質および対応するPAM配列

いくつかの実施形態では、PAMはNGCである。いくつかの実施形態では、NGC PAMは、Cas9バリアントによって認識される。いくつかの実施形態において、NGC PAMバリアントは、D1135M、S1136Q、G1218K、E1219F、A1322R、D1332A、R1335E、およびT1337R（総称して「MQKFRAER」と呼ばれる）から選択される1つ以上のアミノ酸置換を含む。

いくつかの実施形態において、PAMはNGTである。いくつかの実施形態において、NGT PAMはバリアントCas9によって認識される。いくつかの実施形態において、NGT PAMバリアントは、残基1335、1337、1135、1136、1218、および/または1219の一つまたは複数における標的化突然変異を通じて作成される。いくつかの実施形態において、NGT PAMバリアントは、残基1219、1335、1337、1218の一つまたは複数における標的化突然変異を通じて作成される。いくつかの実施形態において、NGT PAMバリアントは、残基1135、1136、1218、1219、および1335の一つまたは複数における標的化突然変異を通じて作成される。いくつかの実施形態において、NGT PAMバリアントは、下記表2および表3に提供される標的化突然変異のセットから選択される。

表２：残基1219、1335、1337、1218におけるNGT PAMバリアント変異

表３：残基1135、1136、1218、1219、および1335におけるNGT PAMバリアント変異

いくつかの実施形態において、NGT PAMバリアントは、表2および3のバリアント5、7、28、31、または36から選択される。いくつかの実施形態において、バリアントは、改善されたNGT PAM認識を有する。

いくつかの実施形態では、NGT PAMバリアントは、残基1219、1335、1337および/または1218において突然変異を有する。いくつかの実施形態では、NGT PAMバリアントは、下記表4に提供されるバリアントから、認識を改善するための変異を伴って選択される。

表４：残基1219、1335、1337、および1218におけるNGT PAMバリアント変異

いくつかの実施形態において、NGT PAMは、下記表5Aに提供されるバリアントから選択される。

表５Ａ．NGT PAMバリアント

いくつかの実施形態では、NGTNバリアントは、バリアント1である。いくつかの実施形態では、NGTNバリアントは、バリアント2である。いくつかの実施形態では、NGTNバリアントは、バリアント3である。いくつかの実施形態では、NGTNバリアントは、バリアント4である。いくつかの実施形態では、NGTNバリアントは、バリアント5である。いくつかの実施形態では、NGTNバリアントは、バリアント6である。

ある実施形態において、Cas9ドメインは、Streptococcus pyogenes由来のCas9ドメインである (SpCas9)。ある実施形態において、SpCas9ドメインは、ヌクレアーゼ活性SpCas9、ヌクレアーゼ不活性SpCas9 (SpCas9d) 、またはSpCas9ニッカーゼ (SpCas9n) である。いくつかの実施形態において、SpCas9は、D9X突然変異または本明細書に提供されるアミノ酸配列のいずれかにおける対応する突然変異を含み、ここでXはD以外のアミノ酸である。いくつかの実施形態において、SpCas9は、D9A突然変異または本明細書に提供されるアミノ酸配列のいずれかにおける対応する突然変異を含む。ある実施形態において、SpCas9ドメイン、SpCas9dドメインまたはSpCas9nドメインは、非正準PAMを有する核酸配列に結合することができる。ある実施形態において、SpCas9ドメイン、SpCas9dドメインまたはSpCas9nドメインは、NGG、NGAまたはNGCG PAM配列を有する核酸配列に結合することができる。いくつかの実施形態において、SpCas9ドメインは、D1135X、R1335X、およびT1337X変異のうちの1つ以上または本明細書に提供されるアミノ酸配列のいずれかにおける対応する変異を含み、ここでXは任意のアミノ酸である。いくつかの実施形態において、SpCas9ドメインは、D1135E、R1335Q、およびT1337R変異のうちの1つ以上または本明細書で提供されるアミノ酸配列のいずれかにおける対応する変異を含む。いくつかの実施形態において、SpCas9ドメインは、配列番号１における番号付けで、D1135E、R1335Q、およびT1337R変異または本明細書で提供されるアミノ酸配列のいずれかにおける対応する変異を含む。いくつかの実施形態において、SpCas9ドメインはD1135X、R1335X、およびT1337X変異のうちの1つ以上または本明細書に提供されるアミノ酸配列のいずれかにおける対応する変異を含み、ここでXは任意のアミノ酸である。いくつかの実施形態において、SpCas9ドメインは、D1135V、R1335Q、およびT1337R変異のうちの1つ以上または本明細書で提供されるアミノ酸配列のいずれかにおける対応する変異を含む。いくつかの実施形態において、SpCas9ドメインは、D1135V、R1335Q、およびT1337R変異、または本明細書で提供されるアミノ酸配列のいずれかにおける対応する変異を含む。いくつかの実施形態において、SpCas9ドメインは、D1135X、G1218X、R1335X、およびT1337X変異のうちの1つ以上または本明細書に提供されるアミノ酸配列のいずれかにおける対応する変異を含み、ここでXは任意のアミノ酸である。いくつかの実施形態において、SpCas9ドメインは、D1135V、G1218R、R1335Q、およびT1337R変異のうちの1つ以上または本明細書で提供されるアミノ酸配列のいずれかにおける対応する変異を含む。いくつかの実施形態において、SpCas9ドメインは、D1135V、G1218R、R1335Q、およびT1337R変異または本明細書で提供されるアミノ酸配列のいずれかにおける対応する変異を含む。

いくつかの実施形態において、本明細書に提供される融合タンパク質のいずれかのCas9ドメインは、本明細書に記載されるCas9ポリペプチドに対して少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも99.5%の同一性であるアミノ酸配列を含む。いくつかの実施形態において、本明細書に提供される融合タンパク質のいずれかのCas9ドメインは、本明細書に記載される任意のCas9ポリペプチドのアミノ酸配列を含む。いくつかの実施形態において、本明細書に提供される融合タンパク質のいずれかのCas9ドメインは、本明細書に記載される任意のCas9ポリペプチドのアミノ酸配列からなる。

いくつかの例において、本明細書に開示される塩基エディターのCRISPRタンパク質由来ドメインによって認識されるPAMは、塩基エディターをコードするインサート(例えばAAVインサート)とは別個のオリゴヌクレオチド上で細胞に提供され得る。そのような実施形態では、別個のオリゴヌクレオチド上にPAMを提供することは、さもなくば標的配列と同じポリヌクレオチド上に隣接するPAMが存在しないために切断することができない標的配列の切断を可能にする。

一実施形態において、S. pyogenes Cas9 (SpCas9) を、ゲノム工学のためのCRISPRエンドヌクレアーゼとして使用することができる。ただし、他のものも使用され得る。いくつかの実施形態では、異なるエンドヌクレアーゼを用いて特定のゲノム標的を標的化することができる。いくつかの実施形態では、非NGG PAM配列を有する合成SpCas9由来バリアントを使用することができる。さらに、様々な種からの他のCas9オルソログが同定されており、これらの「非SpCas9」は、本開示でも有用になり得る種々のPAM配列に結合し得る。例えば、比較的大きなサイズのSpCas9（約4 kbのコード配列）は、細胞内で効率的に発現することができないSpCas9 cDNAプラスミドをもたらすこともあり得る。逆に、Staphylococcus aureus Cas9 (SaCas9) のコード配列は、SpCas9よりも約1キロベース短いので、細胞内で効率的に発現させ得る。SpCas9と同様に、SaCas9エンドヌクレアーゼは、in vitroの哺乳類細胞およびin vivoのマウスにおいて標的遺伝子を修飾する能力がある。ある実施形態では、Casタンパク質は異なるPAM配列を標的とすることができる。いくつかの実施形態において、標的遺伝子は、Cas9 PAM、例えば、5’-NGGに隣接し得る。他の実施形態では、他のCas9オーソログは異なるPAM要件を有し得る。例えば、S. thermophilus のもののようなPAM（CRISPR1の場合は5’-NNAGAA、CRISPR3の場合は5’-NGGNG）およびNeisseria meningiditis のもの（5’-NNNNGATT）のような他のPAMも標的遺伝子に隣接して見出され得る。

いくつかの実施形態において、S. pyogenes系について、標的遺伝子配列は、5’-NGG PAMの前(すなわち、その5’側)にあり得、20 ntガイドRNA配列が、反対側の鎖と塩基対を形成して、PAMに隣接するCas9切断を媒介することができる。ある実施形態では、隣接切断は、PAMの（約）3塩基対上流であり得る。ある実施形態では、隣接切断は、PAMの（約）10塩基対上流であり得る。ある実施形態では、隣接切断は、PAMの（約）0～20塩基対上流であり得る。例えば、隣接切断は、PAM上流の1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、または30塩基対の隣であり得る。隣接切断はPAMの1～30塩基対下流でもあり得る。

ある実施形態では、Cas9は、改変されたPAM配列に対する特異性を有するCas9バリアントである。ある実施形態では、追加的なCas9バリアントおよびPAM配列はMiller et al., Continuous evolution of SpCas9 variants compatible with non-G PAMs. Nat Biotechnol (2020). https://doi.org/10.1038/s41587-020-0412-8に記述されており、その全体が参照により本明細書に組み入れられる。ある実施形態では、Cas9バリアントは特定のPAM要求性を持たない。ある実施形態では、Cas9バリアント、例えばSpCas9バリアントは、NRNH PAMに対する特異性を有し、ここでRはAまたはGでありHはA、C、またはTである。ある実施形態では、SpCas9バリアントは、PAM配列AAA, TAA, CAA, GAA, TAT, GAT, またはCACに対する特異性を有する。ある実施形態では、SpCas9バリアントは、配列番号１における番号付けで位置1114, 1134, 1135, 1137, 1139, 1151, 1180, 1188, 1211, 1218, 1219, 1221, 1249, 1256, 1264, 1290, 1318, 1317, 1320, 1321, 1323, 1332, 1333, 1335, 1337, もしくは1339またはそれに対応する位置におけるアミノ酸置換を含む。ある実施形態では、SpCas9バリアントは、配列番号１における番号付けで位置1114, 1135, 1218, 1219, 1221, 1249, 1320, 1321, 1323, 1332, 1333, 1335, もしくは1337またはそれに対応する位置におけるアミノ酸置換を含む。ある実施形態では、SpCas9バリアントは、配列番号１における番号付けで位置1114, 1134, 1135, 1137, 1139, 1151, 1180, 1188, 1211, 1219, 1221, 1256, 1264, 1290, 1318, 1317, 1320, 1323, 1333またはそれに対応する位置におけるアミノ酸置換を含む。ある実施形態では、SpCas9バリアントは、配列番号１における番号付けで位置1114, 1131, 1135, 1150, 1156, 1180, 1191, 1218, 1219, 1221, 1227, 1249, 1253, 1286, 1293, 1320, 1321, 1332, 1335, 1339またはそれに対応する位置におけるアミノ酸置換を含む。ある実施形態では、SpCas9バリアントは、配列番号１における番号付けで位置1114, 1127, 1135, 1180, 1207, 1219, 1234, 1286, 1301, 1332, 1335, 1337, 1338, 1349またはそれに対応する位置におけるアミノ酸置換を含む。SpCas9バリアントの例示的なアミノ酸置換およびPAM特異性は下記表5B, 5C, 5D, および5Eに示される。

表5B：SpCas9のアミノ酸置換とPAM

表5C： SpCas9 のアミノ酸置換とPAM

表5D： SpCas9 のアミノ酸置換とPAM

表5E： SpCas9 のアミノ酸置換とPAM

以下は、PAM配列に結合することができる例示的SpCas9タンパク質の配列である。

例示的なPAM結合SpCas9のアミノ酸配列は以下の通りである：
MDKKYSIGLDIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD

例示的なPAM結合SpCas9nのアミノ酸配列は以下の通りである：
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD

例示的なPAM結合SpEQR Cas9のアミノ酸配列は以下のとおりである：
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFESPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKQYRSTKEVLDATLIHQSITGLYETRIDLSQLGGD
上記配列において、D1134、R1334およびT1336から変異されてSpEQR Cas9を生じることができる残基E1134、Q1334およびR1336には太字で下線を付している。

例示的なPAM結合SpVQR Cas9のアミノ酸配列は以下の通りである：
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFVSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKQYRSTKEVLDATLIHQSITGLYETRIDLSQLGGD
上記配列において、D1134、R1334、およびT1336から変異されてSpVQR Cas9を生じることができる残基V1134、Q1334、およびR1336には太字で下線を付している。

例示的なPAM結合SpVRER Cas9のアミノ酸配列は以下の通りである：
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFVSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASARELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKEYRSTKEVLDATLIHQSITGLYETRIDLSQLGGD.
上記配列において、D1134、G1217、R1334、およびT1336から変異されてSpVRER Cas9を生じることができる残基V1134、R1217、Q1334、およびR1336には太字で下線を付している。

ある態様において、Cas9ドメインは、組換えCas9ドメインである。ある態様において、組換えCas9ドメインは、SpyMacCas9ドメインである。いくつかの実施形態において、SpyMacCas9ドメインは、ヌクレアーゼ活性SpyMacCas9、ヌクレアーゼ不活性SpyMacCas9 (SpyMacCas9d) 、またはSpyMacCas9ニッカーゼ(SpyMacCas9n) である。いくつかの実施形態において、SaCas9ドメイン、SaCas9dドメイン、またはSaCas9nドメインは、非標準PAMを有する核酸配列に結合することができる。いくつかの実施形態において、SpyMacCas9ドメイン、SpCas9dドメイン、またはSpCas9nドメインは、NAA PAM配列を有する核酸配列に結合することができる。

天然の5'-NAAN-3' PAM特異性を有するStreptococcus macacaeにおけるSpy Cas9の例示的なCas9 Aホモログの配列は当技術分野で知られており、例えば、Jakimoらによって記載されており（www.biorxiv.org/content/biorxiv/early/2018/09/27/429654.full.pdf）、下記に提供する。

SpyMacCas9
MDKKYSIGLDIGTNSVGWAVITDDYKVPSKKFKVLGNTDRHSIKKNLIGALLFGSGETAE
ATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFG
NIVDEVAYHEKYPTIYHLRKKLADSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSD
VDKLFIQLVQIYNQLFEENPINASRVDAKAILSARLSKSRRLENLIAQLPGEKRNGLFGN
LIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAI
LLSDILRVNSEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYA
GYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELH
AILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEE
VVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFL
SGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGAYHDLLKI
IKDKDFLDNEENEDILEDIVLTLTLFEDRGMIEERLKTYAHLFDDKVMKQLKRRRYTGWG
RLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGHSL
HEQIANLAGSPAIKKGILQTVKIVDELVKVMGHKPENIVIEMARENQTTQKGQKNSRERM
KRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHI
VPQSFIKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLT
KAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSK
LVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKM
IAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFA
TVRKVLSMPQVNIVKKTEIQTVGQNGGLFDDNPKSPLEVTPSKLVPLKKELNPKKYGGYQ
KPTTAYPVLLITDTKQLIPISVMNKKQFEQNPVKFLRDRGYQQVGKNDFIKLPKYTLVDI
GDGIKRLWASSKEIHKGNQLVVSKKSQILLYHAHHLDSDLSNDYLQNHNQQFDVLFNEII
SFSKKCKLGKEHIQKIENVYSNKKNSASIEELAESFIKLLGFTQLGATSPFNFLGVKLNQ
KQYKGKKDYILPCTEGTLIRQSITGLYETRVDLSKIGED.

ある実施形態では、バリアントCas9タンパク質はH840A、P475A、W476A、N477A、D1125A、W1126A、D1218Aの変異を有し、その結果、標的DNAまたはRNAを切断する能力が低下している。このようなCas9タンパク質は、標的DNA (例えば一本鎖標的DNA)を切断する能力は低下しているが、標的DNA (例えば一本鎖標的DNA)に結合する能力は保持している。別の非限定的な例として、いくつかの実施形態では、バリアントCas9タンパク質は、D10A、H840A、P475A、W476A、N477A、D1125A、W1126A、およびD1218A変異を有し、その結果、ポリペプチドは、標的DNA（例えば一本鎖標的DNA）を切断する能力が低下している。そのようなCas9タンパク質は、標的DNA(例えば一本鎖標的DNA)を切断する能力を低下しているが、標的DNA(例えば一本鎖標的DNA)に結合する能力を保持している。いくつかの実施形態では、バリアントCas9タンパク質がW476AおよびW1126A変異を有する場合、またはバリアントCas9タンパク質がP475A、W476A、N477A、D1125A、W1126A、およびD1218A 変異を有する場合、バリアントCas9タンパク質はPAM配列に効率的に結合しない。したがって、このような場合には、このようなバリアントCas9タンパク質を結合の方法に用いると、この方法はPAM配列を必要としない。換言すれば、ある実施形態では、このようなバリアントCas9タンパク質を結合の方法に用いる場合、この方法はガイドRNAを含み得るが、この方法は、PAM配列の非存在下で行うことができる(したがって、結合の特異性はガイドRNAの標的セグメントによってもたらされる)。上記の効果を達成するために、他の残基が変異され得る(すなわち一方または他方のヌクレアーゼ部分を不活性化する)。非限定的な例として、残基D10、G12、G17、E762、H840、N854、N863、H982、H983、A984、D986、および/またはA987を変更(すなわち置換)することができる。また、アラニン置換以外の変異も好適である。

ある態様において、塩基エディターのCRISPRタンパク質由来ドメインは、標準的PAM配列(NGG) を有するCas9タンパク質の全部または一部を含み得る。他の実施形態では、塩基エディターのCas9由来ドメインは、非標準的PAM配列を用いることができる。そのような配列は本技術分野で記述されており当業者には明らかであろう。例えば、非標準的PAM配列に結合するCas9ドメインは、Kleinstiver, B. P., et al., “Engineered CRISPR-Cas9 nucleases with altered PAM specificities” Nature, 523, 481-485 (2015); および Kleinstiver, B. P., et al., “Broadening the targeting range of Staphylococcus aureus CRISPR-Cas9 by modifying PAM recognition”Nature Biotechnology, 33, 1293-1298 (2015)に記述されており、それぞれの全内容を参照によりここに組み込む。

ある実施形態では、Cas9はNeisseria menigitidis Cas9 (NmeCas9)またはそのバリアントである。ある実施形態では、NmeCas9はNNNNGAYW PAMに対する特異性を有し、ここでYはCまたはTでありWはAまたはTである。ある実施形態では、NmeCas9はNNNNGYTT PAMに対する特異性を有し、ここでYはCまたはTである。ある実施形態では、NmeCas9はNNNNGTCT PAMに対する特異性を有する。ある実施形態では、NmeCas9はNme1 Cas9である。ある実施形態では、NmeCas9はNNNNGATT PAM、NNNNCCTA PAM、NNNNCCTC PAM、NNNNCCTT PAM、NNNNCCTG PAM、NNNNCCGT PAM、NNNNCCGGPAM、NNNNCCCA PAM、NNNNCCCT PAM、NNNNCCCC PAM、NNNNCCAT PAM、NNNNCCAG PAM、NNNNCCAT PAM、またはNNNGATT PAMに対する特異性を有する。ある実施形態では、Nme1Cas9はNNNNGATT PAM、NNNNCCTA PAM、NNNNCCTC PAM、NNNNCCTT PAM、またはNNNNCCTG PAMに対する特異性を有する。ある実施形態ではNmeCas9はCAA PAM、CAAA PAM、またはCCA PAMに対する特異性を有する。ある実施形態ではNmeCas9はNme2 Cas9である。ある実施形態ではNmeCas9はNmeCas9はNNNNCC (N4CC) PAMに対する特異性を有し、ここでNはA, G, C,またはTのいずれかである。ある実施形態ではNmeCas9はNNNNCCGT PAM、NNNNCCGGPAM、NNNNCCCA PAM、NNNNCCCT PAM、NNNNCCCC PAM、NNNNCCAT PAM、NNNNCCAG PAM、NNNNCCAT PAM、またはNNNGATT PAMに対する特異性を有する。ある実施形態では、NmeCas9はNme3Cas9である。ある実施形態では、NmeCas9はNNNNCAAA PAM、NNNNCC PAM、またはNNNNCNNN PAMに対する特異性を有する。Edraki et al. Mol. Cell. (2019) 73(4): 714-726に記述されたさらなるNmeCas9の特徴とPAM配列はその全体が参照により本明細書に組み入れられる。

Nme1Cas9の例示的なアミノ酸配列を以下に提供する：
type II CRISPR RNA誘導型エンドヌクレアーゼCas9 [Neisseria meningitidis] WP_002235162.1
1 maafkpnpin yilgldigia svgwamveid edenpiclid lgvrvferae vpktgdslam
61 arrlarsvrr ltrrrahrll rarrllkreg vlqaadfden glikslpntp wqlraaaldr
121 kltplewsav llhlikhrgy lsqrkneget adkelgallk gvadnahalq tgdfrtpael
181 alnkfekesg hirnqrgdys htfsrkdlqa elillfekqk efgnphvsgg lkegietllm
241 tqrpalsgda vqkmlghctf epaepkaakn tytaerfiwl tklnnlrile qgserpltdt
301 eratlmdepy rkskltyaqa rkllgledta ffkglrygkd naeastlmem kayhaisral
361 ekeglkdkks plnlspelqd eigtafslfk tdeditgrlk driqpeilea llkhisfdkf
421 vqislkalrr ivplmeqgkr ydeacaeiyg dhygkkntee kiylppipad eirnpvvlra
481 lsqarkving vvrrygspar ihietarevg ksfkdrkeie krqeenrkdr ekaaakfrey
541 fpnfvgepks kdilklrlye qqhgkclysg keinlgrlne kgyveidhal pfsrtwddsf
601 nnkvlvlgse nqnkgnqtpy eyfngkdnsr ewqefkarve tsrfprskkq rillqkfded
661 gfkernlndt ryvnrflcqf vadrmrltgk gkkrvfasng qitnllrgfw glrkvraend
721 rhhaldavvv acstvamqqk itrfvrykem nafdgktidk etgevlhqkt hfpqpweffa
781 qevmirvfgk pdgkpefeea dtpeklrtll aeklssrpea vheyvtplfv srapnrkmsg
841 qghmetvksa krldegvsvl rvpltqlklk dlekmvnrer epklyealka rleahkddpa
901 kafaepfyky dkagnrtqqv kavrveqvqk tgvwvrnhng iadnatmvrv dvfekgdkyy
961 lvpiyswqva kgilpdravv qgkdeedwql iddsfnfkfs lhpndlvevi tkkarmfgyf
1021 aschrgtgni nirihdldhk igkngilegi gvktalsfqk yqidelgkei rpcrlkkrpp
1081 vr

Nme2Cas9の例示的なアミノ酸配列を以下に提供する：
type II CRISPR RNA誘導型エンドヌクレアーゼCas9 [Neisseria meningitidis] WP_002230835.1
1 maafkpnpin yilgldigia svgwamveid eeenpirlid lgvrvferae vpktgdslam
61 arrlarsvrr ltrrrahrll rarrllkreg vlqaadfden glikslpntp wqlraaaldr
121 kltplewsav llhlikhrgy lsqrkneget adkelgallk gvannahalq tgdfrtpael
181 alnkfekesg hirnqrgdys htfsrkdlqa elillfekqk efgnphvsgg lkegietllm
241 tqrpalsgda vqkmlghctf epaepkaakn tytaerfiwl tklnnlrile qgserpltdt
301 eratlmdepy rkskltyaqa rkllgledta ffkglrygkd naeastlmem kayhaisral
361 ekeglkdkks plnlsselqd eigtafslfk tdeditgrlk drvqpeilea llkhisfdkf
421 vqislkalrr ivplmeqgkr ydeacaeiyg dhygkkntee kiylppipad eirnpvvlra
481 lsqarkving vvrrygspar ihietarevg ksfkdrkeie krqeenrkdr ekaaakfrey
541 fpnfvgepks kdilklrlye qqhgkclysg keinlvrlne kgyveidhal pfsrtwddsf
601 nnkvlvlgse nqnkgnqtpy eyfngkdnsr ewqefkarve tsrfprskkq rillqkfded
661 gfkecnlndt ryvnrflcqf vadhilltgk gkrrvfasng qitnllrgfw glrkvraend
721 rhhaldavvv acstvamqqk itrfvrykem nafdgktidk etgkvlhqkt hfpqpweffa
781 qevmirvfgk pdgkpefeea dtpeklrtll aeklssrpea vheyvtplfv srapnrkmsg
841 ahkdtlrsak rfvkhnekis vkrvwlteik ladlenmvny kngreielye alkarleayg
901 gnakqafdpk dnpfykkggq lvkavrvekt qesgvllnkk naytiadngd mvrvdvfckv
961 dkkgknqyfi vpiyawqvae nilpdidckg yriddsytfc fslhkydlia fqkdekskve
1021 fayyincdss ngrfylawhd kgskeqqfri stqnlvliqk yqvnelgkei rpcrlkkrpp
1081 vr

［PAM排他性が低減されたCas9ドメイン］
典型的には、S. pyogenes由来のCas9 (spCas9) などのCas9タンパク質は、特定の核酸領域に結合するために標準的なNGG PAM配列を必要とし、ここで「NGG」の「N」はアデノシン (A) 、チミジン (T) またはシトシン (C) であり、Gはグアノシンである。これは、ゲノム内の所望の塩基を編集する能力を制限し得る。いくつかの実施形態において、本明細書に提供される塩基編集融合タンパク質は、正確な位置、例えばPAMの上流にある標的塩基を含む領域に配置することが必要になり得る。例えばKomor, A.C., et al., “Programmable editing of a target base in genomic DNA without double-stranded DNA cleavage” Nature 533, 420-424 (2016)参照（これらの内容全体は、参照により本明細書に組み込まれる）。従って、いくつかの実施形態において、本明細書で提供される融合タンパク質のいずれかは、標準的（例えばNGG）PAM配列を含まないヌクレオチド配列に結合することができるCas9ドメインを含み得る。非標準的PAM配列に結合するCas9ドメインは本技術分野において記述されており当業者には明らかであろう。例えば、非標準PAM配列に結合するCas9ドメインは、Kleinstiver, B. P., et al., “Engineered CRISPR-Cas9 nucleases with altered PAM specificities” Nature 523, 481-485 (2015); およびKleinstiver, B. P., et al., “Broadening the targeting range of Staphylococcus aureus CRISPR-Cas9 by modifying PAM recognition” Nature Biotechnology 33, 1293-1298 (2015)に記述されており、それぞれの全内容を参照によりここに組み込む。

［高忠実度Cas9ドメイン］
本開示のいくつかの態様は、高忠実度Cas9ドメインを提供する。いくつかの実施形態において、高忠実度Cas9ドメインは、対応する野生型Cas9ドメインと比較して、Cas9ドメインとDNAの糖-リン酸骨格との間の静電相互作用を減少させる1つ以上の突然変異を含む人工Cas9ドメインである。特定の理論に拘束されることは望まないが、DNAの糖-リン酸骨格との静電相互作用を減少させた高忠実度Cas9ドメインは、より少ないオフターゲット効果を有し得る。ある態様において、Cas9ドメイン(例えば、野生型Cas9ドメイン)は、Cas9ドメインとDNAの糖-リン酸骨格との間の結合を低減させる一つ以上の突然変異を含む。ある態様において、Cas9ドメインは、Cas9ドメインとDNAの糖-リン酸骨格との間の結合を少なくとも1%、少なくとも2%、少なくとも3%、少なくとも4%、少なくとも5%、少なくとも10%、少なくとも15%、少なくとも20%、少なくとも25%、少なくとも30%、少なくとも35%、少なくとも40%、少なくとも45%、少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、または少なくとも70%だけ低減させる一つ以上の突然変異を含む。

いくつかの実施形態において、本明細書で提供されるCas9融合タンパク質のいずれかは、N497X、R661X、Q695X、および/またはQ926X突然変異の1以上、または本明細書で提供されるアミノ酸配列のいずれかにおける対応する突然変異を含み、ここでXは任意のアミノ酸である。いくつかの実施形態において、本明細書で提供されるCas9融合タンパク質のいずれかは、N497A、R661A、Q695A、および/またはQ926A突然変異の1以上、または本明細書で提供されるアミノ酸配列のいずれかにおける対応する突然変異を含む。いくつかの実施形態において、Cas9ドメインは、D10A突然変異、または本明細書に提供されるアミノ酸配列のいずれかにおける対応する突然変異を含む。高い忠実度を有するCas9ドメインは当技術分野で公知であり、当業者には明らかであろう。例えば、高い忠実度を有するCas9ドメインは、Kleinstiver, B.P., et al. “High-fidelity CRISPR-Cas9 nucleases with no detectable genome-wide off-target effects.” Nature 529, 490-495 (2016); およびSlaymaker, I.M., et al. “Rationally engineered Cas9 nucleases with improved specificity.” Science 351, 84-88 (2015)に記述されており、それぞれの全内容は参照により本明細書に組み入れられる。

ある態様において、改変されたCas9は、高忠実度Cas9酵素である。いくつかの実施形態において、高忠実度Cas9酵素は、SpCas9(K855A)、eSpCas9(1.1)、SpCas9-HF1、または高精度Cas9バリアント(HypaCas9)である。修飾Cas9eSpCas9(1.1)は、HNH/RuvCグルーブと非標的DNA鎖との間の相互作用を弱めるアラニン置換を含み、オフターゲット部位での鎖分離と切断を防止する。同様に、SpCas9-HF1は、DNAリン酸骨格とのCas9の相互作用を破壊するアラニン置換を介して、オフターゲット編集を低下させる。HypaCas9は、Cas9の校正と標的識別を増加させる突然変異をREC3ドメインに含む(SpCas9 N692A/M694A/Q695A/H698A)。3つの高忠実度酵素はすべて、野生型Cas9よりもオフターゲット編集が少ない。

例示的な高忠実度Cas9を以下に示す。

Cas9と対比される高忠実度Cas9ドメイン突然変異を太字および下線で示している
DKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTAFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGALSRKLINGIRDKQSGKTILDFLKSDGFANRNFMALIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRAITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD

［Cas9ドメインとシチジンデアミナーゼおよび／またはアデノシンデアミナーゼとを含む融合タンパク質］
本開示のいくつかの態様は、napDNAbp（例えばCas9ドメイン）と、1つ以上のアデノシンデアミナーゼドメイン、シチジンデアミナーゼドメイン、および/またはDNAグリコシラーゼドメインとを含む融合タンパク質を提供する。ある実施形態では、融合タンパク質はCas9ドメインとアデノシンデアミナーゼドメイン（例えばTadA*A）を含む。このCas9ドメインは、本明細書に提供されるCas9ドメインまたはCas9タンパク質（例えばdCas9またはnCas9）のいずれでもあり得ることが理解されるべきである。いくつかの実施形態において、本明細書に提供されるCas9ドメインまたはCas9タンパク質（例えばdCas9またはnCas9）のいずれかが、本明細書に提供されるシチジンデアミナーゼおよび／またはアデノシンデアミナーゼのいずれか（例えばTadA*A）と融合され得る。例えば、限定するものではないが、いくつかの実施形態において、融合タンパク質は、以下の構造を含む：
NH₂-[シチジンデアミナーゼ]-[Cas9ドメイン]-[アデノシンデアミナーゼ]-COOH；
NH₂-[アデノシンデアミナーゼ]-[Cas9ドメイン]-[シチジンデアミナーゼ]-COOH；
NH₂-[アデノシンデアミナーゼ]-[シチジンデアミナーゼ]-[Cas9ドメイン]-COOH；
NH₂-[シチジンデアミナーゼ]-[アデノシンデアミナーゼ]-[Cas9ドメイン]-COOH；
NH₂-[Cas9ドメイン]-[アデノシンデアミナーゼ]-[シチジンデアミナーゼ]-COOH；
NH₂-[Cas9ドメイン]-[シチジンデアミナーゼ]-[アデノシンデアミナーゼ]-COOH；
NH₂-[アデノシンデアミナーゼ]-[Cas9ドメイン]-COOH；
NH₂-[Cas9ドメイン]-[アデノシンデアミナーゼ]-COOH；
NH₂-[シチジンデアミナーゼ]-[Cas9ドメイン]-COOH；または
NH₂-[Cas9 domain]-[シチジンデアミナーゼ]-COOH。

ある実施形態において、シチジンデアミナーゼ、脱塩基エディター、およびアデノシンデアミナーゼ、ならびにnapDNAbp（例えばCas9ドメイン）を含む融合タンパク質は、リンカー配列を含まない。ある実施形態において、リンカーが、シチジンデアミナーゼおよび／またはアデノシンデアミナーゼドメインならびにnapDNAbpの間に存在する。いくつかの実施形態において、上記の一般的な構築で使用される「-」は、任意のリンカーの存在を示す。いくつかの実施形態において、シチジンデアミナーゼおよびアデノシンデアミナーゼおよびnapDNAbpは、本明細書に提供される任意のリンカーを介して融合される。例えば、いくつかの実施形態において、シチジンデアミナーゼおよび／またはアデノシンデアミナーゼおよびnapDNAbpは、本明細書に提供されるリンカーのいずれかを介して融合される。

［核局在化配列 (NLS) を含む融合タンパク質］
いくつかの態様において、本明細書で提供される融合タンパク質は、一つ以上 (例:2, 3, 4, 5) の核ターゲティング配列、例えば、核局在化配列 (NLS) をさらに含む。一実施形態では、二部分（bipartite）NLSが使用される。いくつかの態様において、NLSは、NLSを含むタンパク質の細胞核中への輸入(例えば核輸送によるもの)を促進するアミノ酸配列を含む。いくつかの実施形態において、本明細書において提供される融合タンパク質のいずれかは、核局在化配列 (NLS) をさらに含む。いくつかの実施形態において、NLSは融合タンパク質のN末端に融合される。いくつかの実施形態において、NLSは融合タンパク質のC末端に融合される。いくつかの実施形態において、NLSはCas9ドメインのN末端に融合される。いくつかの実施形態において、NLSはnCas9ドメインまたはdCas9ドメインのC末端に融合される。いくつかの実施形態において、NLSはデアミナーゼのN末端に融合される。いくつかの実施形態において、NLSはデアミナーゼのC末端に融合される。いくつかの実施形態において、NLSは、1つ以上のリンカーを介して融合タンパク質に融合される。ある態様において、NLSは、リンカーなしで融合タンパク質に融合される。いくつかの実施形態において、NLSは、本明細書において提供または参照されるNLS配列のいずれか1つのアミノ酸配列を含む。さらなる核局在化配列は当技術分野で公知であり、当業者には明らかであろう。例えば、NLS配列は、Plank et al., PCT/EP2000/011690に記載されており、その内容は、例示的な核局在化配列の開示について参照により本明細書に組み込まれる。ある態様において、NLSは、アミノ酸配列PKKKRKVEGADKRTADGSEFESPKKKRKV, KRTADGSEFESPKKKRKV, KRPAATKKAGQAKKKK, KKTELQTTNAENKTKKL, KRGINDRNFWRGENGRKTR, RKSGKIAAIVVKRPRKPKKKRKV, またはMDSLLMNRRKFLYQFKNVRWAKGRRETYLCを含む。

いくつかの実施形態において、NLSはリンカー中に存在するか、またはNLSはリンカー、例えば本明細書に記載されるリンカーによって隣接される。いくつかの実施形態において、N末端またはC末端NLSは、二部分NLSである。二部分NLSは、比較的短いスペーサー配列によって分離される二つの塩基性アミノ酸クラスターを含む（それゆえにbipartite、二部分と呼ばれ、一部分（monopartite）NLSは異なる）。ヌクレオプラスミンのNLSであるKR[PAATKKAGQA]KKKKは遍在的な二部シグナルのプロトタイプであり、塩基性アミノ酸の二つのクラスターが約10アミノ酸のスペーサーによって隔てられたものである。例示的な二部NLSの配列は、PKKKRKVEGADKRTADGSEFES PKKKRKVである。

いくつかの実施形態において、本発明の融合タンパク質は、リンカー配列を含まない。いくつかの実施形態において、１つ以上のドメインまたはタンパク質間にリンカー配列が存在する。いくつかの実施形態において、アデノシンデアミナーゼまたはシチジンデアミナーゼとCas9ドメインを有する例示的なCas9融合タンパク質の一般的な構造は、以下の構造のいずれか１つを含み、ここで、NLSは核局在化配列（例えば、本明細書で提供されるいずれかのNLS）であり、NH₂は、融合タンパク質のN末端であり、COOHは融合タンパク質のC末端である：
NH₂-NLS-[アデノシンデアミナーゼ]-[Cas9ドメイン]-COOH;
NH₂-NLS [Cas9ドメイン]-[アデノシンデアミナーゼ]-COOH;
NH₂-[アデノシンデアミナーゼ]-[Cas9ドメイン]-NLS-COOH;
NH₂-[Cas9ドメイン]-[アデノシンデアミナーゼ]-NLS-COOH;
NH₂-NLS-[シチジンデアミナーゼ]-[Cas9ドメイン]-COOH;
NH₂-NLS [Cas9ドメイン]-[シチジンデアミナーゼ]-COOH;
NH₂-[シチジンデアミナーゼ]-[Cas9ドメイン]-NLS-COOH; または
NH₂-[Cas9ドメイン]-[シチジンデアミナーゼ]-NLS-COOH。

本開示の融合タンパク質は、1つ以上のさらなる特徴を含み得ることが理解されるべきである。例えば、いくつかの態様において、融合タンパク質は、阻害因子、細胞質局在化配列、核外輸送配列などの輸送配列、または他の局在化配列、ならびに融合タンパク質の可溶化、精製、または検出に有用な配列タグを含むことができる。本明細書において提供される適切なタンパク質タグには、限定されるものではないが、ビオチンカルボキシラーゼキャリアータグ (BCCP) タグ、myc-タグ、カルモジュリンタグ、FLAG-タグ、ヘマグルチニン (HA) -タグ、ポリヒスチジンタグ（ヒスチジンタグまたはHis-タグとも呼ばれる）、マルトース結合タンパク質 (MBP) -タグ、nus-タグ、グルタチオン-S-トランスフェラーゼ (GST) -タグ、緑色蛍光タンパク質 (GFP) -タグ、チオレドキシンタグ、S-タグ、ソフタグ(例えばSoftag1、Softag3)、ストレプトタグ、ビオチンリガーゼタグ、FLAsHタグ、V5タグ、およびSBP-タグが含まれる。さらなる適切な配列は、当業者には明らかであろう。いくつかの実施形態において、融合タンパク質は、1つ以上のHisタグを含む。

1以上の核局在化配列 (NLS) を含むCRISPR酵素をコードするベクターを使用することができる。例えば、約1、2、3、4、5、6、7、8、9、10個のNLSを使用することができる。CRISPR酵素は、アミノ末端またはその近傍のNLS、カルボキシ末端またはその近傍の約1個、2個、3個、4個、5個、6個、7個、8個、9個、10個またはそれ以上のNLS、またはこれらの任意の組み合わせ(例えばアミノ末端における1以上のNLSおよびカルボキシ末端における1以上のNLS)を含むことができる。複数のNLSが存在する場合、各NLSは他から独立して選択することができ、したがって1つのNLSが1つ以上のコピーで存在することができ、および/または1つ以上のコピーで存在する1つ以上の他のNLSと組み合わせて存在することができる。

法において使用されるCRISPR酵素は、約6個のNLSを含むことができる。NLSに最も近いアミノ酸がN-またはC-末端からポリペプチド鎖に沿って約50アミノ酸内（例えば1、2、3、4、5、10、15、20、25、30、40、または50アミノ酸内）にあるとき、そのNLSはN-またはC-末端の近傍にあると考えられる。

［核酸塩基編集ドメイン］
ポリヌクレオチドプログラム可能なヌクレオチド結合ドメインおよび核酸塩基編集ドメイン（例えばデアミナーゼドメイン）を含む融合タンパク質を含む塩基エディターを本明細書に記載する。塩基エディターは、標的配列を認識することができるガイドポリヌクレオチドと相互作用することによって、標的ポリヌクレオチド配列中の1以上の塩基を編集するようにプログラムすることができる。標的配列がいったん認識されると、編集が行われるポリヌクレオチド上に塩基エディターが固定され、次いで、塩基エディターのデアミナーゼドメイン成分が標的塩基を編集することができる。

ある態様において、核酸塩基編集ドメインは、デアミナーゼドメインを含む。本明細書で特に説明されているように、デアミナーゼドメインは、シトシンデアミナーゼまたはアデノシンデアミナーゼとを含む。いくつかの実施形態では、「シトシンデアミナーゼ」および「シチジンデアミナーゼ」という用語は、交換可能に使用され得る。いくつかの実施形態では、「アデニンデアミナーゼ」および「アデノシンデアミナーゼ」という用語は、交換可能に使用され得る。核酸塩基編集タンパク質の詳細は、国際PCT出願番号PCT/2017/045381 (WO2018/027078) およびPCT/US2016/058344 (WO2017/070632) に記載されており、これらの各々は、その全体が参照により本明細書に組み込まれる。Komor, A.C., et al., “Programmable editing of a target base in genomic DNA without double-stranded DNA cleavage” Nature 533, 420-424 (2016); Gaudelli, N.M., et al., “Programmable base editing of A・T to G・C in genomic DNA without DNA cleavage”Nature 551, 464-471 (2017); および Komor, A.C., et al., “Improved base excision repair inhibition and bacteriophage Mu Gam protein yields C:G-to-T:A base editors with higher efficiency and product purity” Science Advances 3:eaao4774 (2017)も参照（その全内容が参照により本明細書に組み込まれる）。

［AからGへの編集］
いくつかの実施形態において、本明細書に記載される塩基エディターは、アデノシンデアミナーゼを含むデアミナーゼドメインを含み得る。塩基エディタのそのようなアデノシンデアミナーゼドメインは、Aを脱アミノ化して、Gの塩基対形成特性を示すイノシン（I）を形成することにより、アデニン（A）核酸塩基からグアニン（G）核酸塩基への編集を促進することができる。アデノシンデアミナーゼは、デオキシリボ核酸（DNA）中のデオキシアデノシン残基のアデニンを脱アミノ化（すなわち、アミン基を除去）することができる。

いくつかの実施形態において、本明細書において提供される核酸塩基エディターは、1つ以上のタンパク質ドメインを融合させ、それによって融合タンパク質を生成することによって作製することができる。ある態様において、本明細書において提供される融合タンパク質は、融合タンパク質の塩基編集活性(例えば効率、選択性、特異性)を改善する一つ以上の特徴を含む。例えば、本明細書中に提供される融合タンパク質は、ヌクレアーゼ活性が低下したCas9ドメインを含むことができる。いくつかの実施形態において、本明細書中で提供される融合タンパク質は、ヌクレアーゼ活性を有さないCas9ドメイン (dCas9) 、または、Cas9ニッカーゼ (nCas9) と呼ばれる、二本鎖DNA分子の一鎖を切断するCas9ドメインを有することができる。いかなる特定の理論にも拘束されることを望まないが、触媒残基(例えばH840)の存在が、標的Aと反対のTを含有する非編集（例えば非脱アミノ化）鎖を切断するCas9の活性を維持する。Cas9の触媒残基の突然変異(例えばD10からA10)は、標的A残基を含有する編集鎖の切断を妨げる。このようなCas9バリエーションは、gRNAによって規定される標的配列に基づく特定の位置で単一鎖DNA切断 (ニック) を生じさせることができ、非編集鎖の修復を導き、最終的には編集鎖においてTからCへの変化をもたらす。ある態様において、AからGへの塩基エディターは、イノシン塩基除去修復の阻害因子、例えば、ウラシルグリコシラーゼ阻害因子 (UGI) ドメインまたは触媒的に不活性なイノシン特異的ヌクレアーゼをさらに含む。いかなる特定の理論にも束縛されることを望まないが、UGIドメインまたは触媒的に不活性なイノシン特異的ヌクレアーゼは、脱アミノ化されたアデノシン残基(例えばイノシン)の塩基除去修復を阻害または防止することができ、これが、塩基エディターの活性または効率を改善させることができる。

アデノシンデアミナーゼを含む塩基エディターは、DNA、RNAおよびDNA-RNAハイブリッドを含む任意のポリヌクレオチドに作用することができる。特定の実施形態では、アデノシンデアミナーゼを含む塩基エディターは、RNAを含むポリヌクレオチドの標的Aを脱アミノ化することができる。例えば、塩基エディターは、RNAポリヌクレオチドおよび/またはDNA-RNAハイブリッドポリヌクレオチドの標的Aを脱アミノ化することができるアデノシンデアミナーゼドメインを含むことができる。一実施形態によると、塩基エディターに組み込まれたアデノシンデアミナーゼは、RNAに作用するアデノシンデアミナーゼ(ADAR、例えばADAR1またはADAR2)の全部または一部を含む。別の実施形態では、塩基エディターに組み込まれたアデノシンデアミナーゼは、tRNAに作用するアデノシンデアミナーゼ(ADAT)の全部または一部を含む。アデノシンデアミナーゼドメインを含む塩基エディターはまた、DNAポリヌクレオチドのA核酸塩基を脱アミノ化する能力も有し得る。一実施形態では、塩基エディターのアデノシンデアミナーゼドメインは、1以上の突然変異を含むADATの全部または一部を含み、これがDNA中の標的AをADATが脱アミノ化することを可能にする。例えば、塩基エディターは、D108N、A106V、D147Y、E155V、L84F、H123Y、I156F、または別のアデノシンデアミナーゼにおける対応する突然変異の1以上を含む大腸菌由来のADAT (EcTadA)の全部または一部を含むことができる。

アデノシンデアミナーゼは、任意の適切な生物（例えば大腸菌）に由来することができる。ある態様において、アデニンデアミナーゼは、天然に存在するアデノシンデアミナーゼが本明細書に提供される突然変異のいずれかに対応する一つ以上の突然変異を含むものである(例えば、ecTadAにおける突然変異)。任意の相同タンパク質中の対応する残基は、例えば、配列アラインメントおよび相同残基の決定によって同定することができる。本明細書中に記載された突然変異のいずれか(例えば、ecTadAで同定された突然変異のいずれか)に対応する、任意の天然アデノシンデアミナーゼ(例えば、ecTadAに対して相同性を有するもの)における突然変異を、それに応じて生成することができる。

［アデノシンデアミナーゼ］
いくつかの実施形態では、本明細書に記載される塩基エディターは、アデノシンデアミナーゼを含有するデアミナーゼドメインを含み得る。そのような塩基エディターのアデノシンデアミナーゼドメインは、Aを脱アミノ化してイノシン（I）（Gの塩基対形成特性を示す）を形成することにより、アデニン（A）核酸塩基からグアニン（G）核酸塩基への編集を促進させることができる。アデノシンデアミナーゼは、デオキシリボ核酸（DNA）のデオキシアデノシン残基のアデニンを脱アミノ化する（すなわちアミン基を除去する）ことができる。

いくつかの実施形態において、本明細書に提供されるアデノシンデアミナーゼは、アデニンを脱アミノ化することができる。いくつかの実施形態において、本明細書で提供されるアデノシンデアミナーゼは、DNAのデオキシアデノシン残基中のアデニンを脱アミノ化することができる。ある態様において、アデニンデアミナーゼは、本明細書に提供される突然変異のいずれか（例えばecTadAにおける突然変異）に対応する一つ以上の突然変異を含む、天然に存在するアデノシンデアミナーゼである。当業者は、例えば配列アラインメントおよび相同的残基の決定によって、任意の相同的タンパク質中の対応する残基を同定することができる。従って、当業者は、任意の天然に存在するアデノシンデアミナーゼ（例えばecTadA対する相同性を有するもの）において、本明細書に記載された突然変異のいずれか（例えば、ecTadAにおいて同定される突然変異のいずれか）に対応する突然変異を生成することができる。ある態様において、アデノシンデアミナーゼは原核生物由来である。ある態様において、アデノシンデアミナーゼは、細菌由来である。ある態様において、アデノシンデアミナーゼは、Escherichia coli、Staphylococcus aureus、Salmonella typhi、Shewanella putrefaciens、Haemophilus influenzae、Caulobacter crescentus、またはBacillus subtilisに由来する。ある態様において、アデノシンデアミナーゼは、大腸菌由来である。

本発明は、増加した効率（>50～60%）および特異性を有するアデノシンデアミナーゼバリアントを提供する。特に、本明細書に記載のアデノシンデアミナーゼバリアントは、ポリヌクレオチド内の所望の塩基を編集する可能性がより高く、塩基編集ウィンドウ中の改変が意図されていない塩基（すなわち「バイスタンダー」）を編集する可能性がより低い。

特定の実施形態では、TadAは、PCT/US2017/045381（WO2018/027078）に記載されているTadAのいずれか1つであり、これはその全体が参照により本明細書に組み込まれる。

いくつかの実施形態において、本発明の核酸塩基エディターは、以下の配列における改変を含むアデノシンデアミナーゼバリアントである：
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPRQVFNAQKKAQSSTD（TadA*7.10とも呼ばれる）。

特定の実施形態では、融合タンパク質は、単一の（例えば、単量体として提供される）TadA*8バリアントを含む。いくつかの実施形態において、TadA*8は、Cas9ニッカーゼに連結されている。いくつかの実施形態において、本発明の融合タンパク質は、野生型TadA（TadA(wt)）がTadA*8バリアントに連結されたものをヘテロ二量体として含む。他の実施形態では、本発明の融合タンパク質は、TadA*7.10がTadA*8バリアントに連結されたものをヘテロ二量体として含む。いくつかの実施形態において、塩基エディターは、TadA*8バリアントモノマーを含むABE8である。いくつかの実施形態において、塩基エディターは、TadA*8バリアントおよびTadA(wt)のヘテロダイマーを含むABE8である。いくつかの実施形態において、塩基エディターは、TadA*8バリアントおよびTadA*7.10のヘテロダイマーを含むABE8である。いくつかの実施形態において、塩基エディターは、TadA*8バリアントのヘテロダイマーを含むABE8である。いくつかの実施形態において、TadA*8バリアントは、表７から選択される。いくつかの実施形態において、ABE8は、表７から選択される。関連する配列は、以下の通りである。

いくつかの実施形態において、本発明の融合タンパク質は、野生型TadA（TadA(wt)）がTadAバリアント（例えばTadA *7.10バリアント）に連結されたヘテロ二量体を含む。関連する配列は次のとおりある。

野生型TadA（TadA(wt)）または「TadA参照配列」）
MSEVEFSHEYWMRHALTLAKRAWDEREVPVGAVLVHNNRVIGEGWNRPIGRHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTLEPCVMCAGAMIHSRIGRVVFGARDAKTGAAGSLMDVLHHPGMNHRVEITEGILADECAALLSDFFRMRRQEIKAQKKAQSSTD

TadA*7.10:
MSEVEFSHEYW MRHALTLAKR ARDEREVPVG AVLVLNNRVI GEGWNRAIGL HDPTAHAEIM ALRQGGLVMQ NYRLIDATLY VTFEPCVMCA GAMIHSRIGR VVFGVRNAKT GAAGSLMDVL HYPGMNHRVE ITEGILADEC AALLCYFFRM PRQVFNAQKK AQSSTD

ある態様において、アデノシンデアミナーゼは、本明細書に提供されるアデノシンデアミナーゼのいずれかに記載のアミノ酸配列のいずれかに対して少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも99.5%の同一性であるアミノ酸配列を含む。本明細書において提供されるアデノシンデアミナーゼは、一つ以上の突然変異(例えば、本明細書に提供される突然変異のいずれか)を含み得ることが理解されるべきである。本開示は、特定のパーセント同一性を有するデアミナーゼドメインが加えて本明細書に記載される突然変異のいずれかまたはその組合せを含むものを提供する。いくつかの実施形態において、アデノシンデアミナーゼは、参照配列または本明細書に提供されるアデノシンデアミナーゼのいずれかと比較して1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、21、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、またはそれ以上の変異を有するアミノ酸配列を含む。いくつかの実施形態において、アデノシンデアミナーゼは、当該技術分野において既知であるかまたは本明細書に記載されたアミノ酸配列のいずれかと比較して、少なくとも5個、少なくとも10個、少なくとも15個、少なくとも20個、少なくとも25個、少なくとも30個、少なくとも35個、少なくとも40個、少なくとも45個、少なくとも50個、少なくとも60個、少なくとも70個、少なくとも80個、少なくとも90個、少なくとも100個、少なくとも110個、少なくとも120個、少なくとも130個、少なくとも140個、少なくとも150個、少なくとも160個、または少なくとも170個の同一の連続するアミノ酸残基を有するアミノ酸配列を含む。

ある実施形態において、TadAデアミナーゼは、全長大腸菌TadAデアミナーゼである。例えば、特定の実施形態において、アデノシンデアミナーゼは、以下のアミノ酸配列を含む：
MRRAFITGVFFLSEVEFSHEYWMRHALTLAKRAWDEREVPVGAVLVHNNRVIGEGWNRPIGRHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTLEPCVMCAGAMIHSRIGRVVFGARDAKTGAAGSLMDVLHHPGMNHRVEITEGILADECAALLSDFFRMRRQEIKAQKKAQSSTD.

しかしながら、本出願において有用なさらなるアデノシンデアミナーゼが当業者には明らかであり、本開示の範囲内であることが理解されるべきである。例えば、アデノシンデアミナーゼは、tRNAに作用するアデノシンデアミナーゼ（ADAT）のホモログであり得る。限定されるものではないが、例示的なAD ATホモログのアミノ酸配列は以下のものを含む：

Staphylococcus aureus TadA:
MGSHMTNDIYFMTLAIEEAKKAAQLGEVPIGAIITKDDEVIARAHNLRETLQQPTAHAEHIAIERAAKVLGSWRLEGCTLYVTLEPCVMCAGTIVMSRIPRVVYGADDPKGGCSGS LMNLLQQSNFNHRAIVDKGVLKEACSTLLTTFFKNLRANKKSTN

Bacillus subtilis TadA:
MTQDELYMKEAIKEAKKAEEKGEVPIGAVLVINGEIIARAHNLRETEQRSIAHAEMLVIDEACKALGTWRLEGATLYVTLEPCPMCAGAVVLSRVEKVVFGAFDPKGGCSGTLMNLLQEERFNHQAEVVSGVLEEECGGMLSAFFRELRKKKKAARKNLSE

E. coli TadA (ecTadA) の実施形態は以下のものを含む：
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPRQVFNAQKKAQSSTD

ある態様において、アデノシンデアミナーゼは、原核生物由来である。ある態様において、アデノシンデアミナーゼは、細菌由来である。ある態様において、アデノシンデアミナーゼは、Escherichia coli、Staphylococcus aureus、Salmonella typhi、Shewanella putrefaciens、Haemophilus influenzae、Caulobacter crescentus、またはBacillus subtilisに由来する。ある態様において、アデノシンデアミナーゼは、大腸菌由来である。

1つの実施形態において、本発明の融合タンパク質は、TadA7.10に連結された野生型TadAがCas9ニッカーゼに連結されたものを含む。特定の実施形態では、融合タンパク質は、単一のTadA7.10ドメイン(例えば、モノマーとして提供される)を含む。他の実施形態では、ABE7.10エディターは、TadA7.10およびTadA(wt) を含み、これらはヘテロ二量体を形成することができる。

本明細書に提供される突然変異（例えばTadA参照配列に基づくもの）のいずれもが、E. coli TadA（ecTadA）、S. aureus TadA（saTadA）、または他のアデノシンデアミナーゼ（例えば細菌アデノシンデアミナーゼ）などの他のアデノシンデアミナーゼに導入され得ることが理解されるべきである。さらなるデアミナーゼを同様にアラインメントして、本明細書中に提供されるように変異させ得る相同的アミノ酸残基を同定できることは、当業者には明らかであろう。したがって、TadA参照配列において同定された突然変異のいずれも、相同的なアミノ酸残基を有する他のアデノシンデアミナーゼ（例えばecTada）において作製することができる。

ある態様において、アデノシンデアミナーゼは、TadA参照配列におけるD108X突然変異、または別のアデノシンデアミナーゼ(例えばecTadA)における対応する突然変異を含み、Xは野生型アデノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸を示す。ある態様において、アデノシンデアミナーゼは、D108G、D108N、D108V、D108A、またはD108Y突然変異、または別のアデノシンデアミナーゼにおける対応する突然変異を含む。

ある態様において、アデノシンデアミナーゼは、TadA参照配列におけるA106X突然変異、または別のアデノシンデアミナーゼ（例えばecTadA）における対応する突然変異を含み、Xは野生型アデノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸を示す。ある態様において、アデノシンデアミナーゼは、TadA参照配列におけるA106V突然変異、または別のアデノシンデアミナーゼ（例えば野生型TadAまたはecTadA）における対応する突然変異を含む。

ある態様において、アデノシンデアミナーゼは、TadA参照配列におけるE155X突然変異、または別のアデノシンデアミナーゼ（例えばecTadA）における対応する突然変異を含み、Xの存在は、野生型アデノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸を示す。ある態様において、アデノシンデアミナーゼは、TadA参照配列におけるE155D、E155G、またはE155V突然変異、または別のアデノシンデアミナーゼ（例えばecTadA）における対応する突然変異を含む。

ある態様において、アデノシンデアミナーゼは、TadA参照配列におけるD147X突然変異、または別のアデノシンデアミナーゼ（例えばecTadA）における対応する突然変異を含み、Xの存在は、野生型アデノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸を示す。ある態様において、アデノシンデアミナーゼは、TadA参照配列におけるD147Y突然変異、または別のアデノシンデアミナーゼ（例えばecTadA）における対応する突然変異を含む。

ある態様において、アデノシンデアミナーゼは、TadA参照配列におけるA106X、E155X、またはD147X、突然変異、または別のアデノシンデアミナーゼ（例えばecTadA）における対応する突然変異を含み、Xは野生型アデノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸を示す。ある態様において、アデノシンデアミナーゼは、E155D、E155G、またはE155V突然変異を含む。ある態様において、アデノシンデアミナーゼは、D147Yを含む。

例えば、アデノシンデアミナーゼは、TadA参照配列におけるD108N、A106V、E155V、および/またはD147Y突然変異、または別のアデノシンデアミナーゼ（例えばecTadA）における対応する突然変異を含み得る。ある態様において、アデノシンデアミナーゼは、TadA参照配列における以下の突然変異群（突然変異の群は「；」によって分離されている）、または別のアデノシンデアミナーゼ（例えばecTadA）における対応する突然変異を含む：D108NおよびA106V；D108NおよびE155V；D108NおよびD147Y；A106VおよびE155V；A106VおよびD147Y；E155VおよびD147Y；D108N, A106V,およびE155V；D108N, A106V,およびD147Y；D108N, E155V,およびD147Y；A106V, E155V,およびD 147Y；およびD108N, A106V, E155V,およびD147Y。ただし、ここで提供される対応する突然変異の任意の組合せを、アデノシンデアミナーゼ（例えばecTadA）において作製することができることを理解されたい。

いくつかの実施形態において、アデノシンデアミナーゼは、TadA参照配列におけるH8X、T17X、L18X、W23X、L34X、W45X、R51X、A56X、E59X、E85X、M94X、I95X、V102X、F104X、A106X、R107X、D108X、K110X、M118X、N127X、A138X、F149X、M151X、R153X、Q154X、I156X、および/またはK157X突然変異のうちの1以上、または他のアデノシンデアミナーゼ（例えばecTadA）における1以上の対応する突然変異を含み、ここで、Xの存在は、野生型アデノシンデアミナーゼにおける対応するアミノ酸以外のいずれかのアミノ酸を示す。いくつかの実施形態において、アデノシンデアミナーゼは、TadA参照配列に関連するH8Y、T17S、L18E、W23L、L34S、W45L、R51H、A56E、またはA56S、E59G、E85K、またはE85G、M94L、1951、V102A、F104L、A106V、R107C、またはR107H、またはR107P、D108G、またはD108N、またはD108A、D108Y、K110I、M118K、N127S、A138V、F149Y、M151V、R153C、Q154L、I156D、および/またはK157R突然変異のうちの1つ以上、または他のアデノシンデアミナーゼ（例えばecTadA）における1つ以上の対応する突然変異を含む。

ある態様において、アデノシンデアミナーゼは、TadA参照配列におけるH8X、D108X、および/またはN127X突然変異のうちの1つ以上、または別のアデノシンデアミナーゼ（例えばecTadA）における1つ以上の対応する突然変異を含み、Xは任意のアミノ酸の存在を示す。いくつかの実施形態において、アデノシンデアミナーゼは、TadA参照配列におけるH8Y、D108N、および/またはN127S突然変異の1以上、または別のアデノシンデアミナーゼ（例えばecTadA）における1以上の対応する突然変異を含む。

いくつかの実施形態において、アデノシンデアミナーゼは、TadA参照配列におけるH8X、R26X、M61X、L68X、M70X、A106X、D108X、A109X、N127X、D147X、R152X、Q154X、E155X、K161X、Q163X、および/またはT166X突然変異の1以上、または別のアデノシンデアミナーゼ（例えばecTadA）における1以上の対応する突然変異を含み、ここでXは、野生型アデノシンデアミナーゼにおける対応するアミノ酸以外のいずれかのアミノ酸の存在を示す。いくつかの実施形態において、アデノシンデアミナーゼは、TadA参照配列におけるH8Y、R26W、M61I、L68Q、M70V、A106T、D108N、A109T、N127S、D147Y、R152C、Q154HもしくはQ154R、E155GもしくはE155VもしくはE155D、K161Q、Q163H、および/もしくはT166P突然変異の1つ以上、または他のアデノシンデアミナーゼ（例えばecTadA）における1つ以上の対応する突然変異を含む。

いくつかの実施形態において、アデノシンデアミナーゼは、TadA参照配列におけるH8X、D108X、N127X、D147X、R152X、およびQ154Xからなる群より選択される1つ、2つ、3つ、4つ、5つ、または6つの突然変異、または別のアデノシンデアミナーゼ（例えばecTadA）における対応する突然変異（複数可）を含み、ここでXは野生型アデノシンデアミナーゼにおける対応するアミノ酸以外のいずれかのアミノ酸の存在を示す。いくつかの実施形態において、アデノシンデアミナーゼは、TadA参照配列におけるH8X、M61X、M70X、D108X、N127X、Q154X、E155X、およびQ163Xからなる群より選択される1つ、2つ、3つ、4つ、5つ、6つ、7つ、または8つの突然変異、または別のアデノシンデアミナーゼ（例えばecTadA）における対応する突然変異（複数可）を含み、ここでXは野生型アデノシンデアミナーゼにおける対応するアミノ酸以外のいずれかのアミノ酸の存在を示す。ある態様において、アデノシンデアミナーゼは、TadA参照配列におけるH8X、D108X、N127X、E155X、およびT166Xからなる群より選択される1つ、2つ、3つ、4つ、または5つの突然変異、または別のアデノシンデアミナーゼ（例えばecTadA）における対応する突然変異（複数可）を含み、ここでXは野生型アデノシンデアミナーゼにおける対応するアミノ酸以外のいずれかのアミノ酸の存在を示す。

ある態様において、アデノシンデアミナーゼは、H8X、A106X、D108X、別のアデノシンデアミナーゼにおける突然変異（複数可）からなる群から選択される1、2、3、4、5、または6個の突然変異を含み、ここでXは野生型アデノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸の存在を示す。ある態様において、アデノシンデアミナーゼは、H8X、R126X、L68X、D108X、N127X、D147X、およびE155Xからなる群より選択される1つ、2つ、3つ、4つ、5つ、6つ、7つ、または8つの突然変異、または別のアデノシンデアミナーゼにおける対応する突然変異（複数可）を含み、Xは野生型アデノシンデアミナーゼにおける対応するアミノ酸以外のいずれかのアミノ酸の存在を示す。ある態様において、アデノシンデアミナーゼは、TadA参照配列におけるH8X、D108X、A109X、N127X、およびE155Xからなる群より選択される1つ、2つ、3つ、4つ、または5つの突然変異、または別のアデノシンデアミナーゼ（例えばecTadA）における対応する突然変異（複数可）を含み、Xは野生型アデノシンデアミナーゼにおける対応するアミノ酸以外のいずれかのアミノ酸の存在を示す。

いくつかの実施形態において、アデノシンデアミナーゼは、TadA参照配列におけるH8Y、D108N、N127S、D147Y、R152C、およびQ154Hからなる群より選択される1つ、2つ、3つ、4つ、5つ、または6つの突然変異、または別のアデノシンデアミナーゼ（例えばecTadA）における対応する突然変異を含む。いくつかの実施形態において、アデノシンデアミナーゼは、TadA参照配列におけるH8Y、M61I、M70V、D108N、N127S、Q154R、E155GおよびQ163Hからなる群より選択される1つ、2つ、3つ、4つ、5つ、6つ、7つまたは8つの突然変異、または他のアデノシンデアミナーゼ（例えばecTadA）における対応する突然変異を含む。いくつかの実施形態において、アデノシンデアミナーゼは、TadA参照配列におけるH8Y、D108N、N127S、E155V、およびT166Pからなる群より選択される1つ、2つ、3つ、4つ、または5つの突然変異、または別のアデノシンデアミナーゼ（例えばecTadA）における対応する突然変異（複数可）を含む。いくつかの実施形態において、アデノシンデアミナーゼは、TadA参照配列におけるH8Y、A106T、D108N、N127S、E155D、およびK161Qからなる群から選択される1つ、2つ、3つ、4つ、5つ、または6つの突然変異、または他のアデノシンデアミナーゼ（例えばecTadA）における対応する突然変異を含む。いくつかの実施形態において、アデノシンデアミナーゼは、TadA参照配列におけるH8Y、R126W、L68Q、D108N、N127S、D147Y、およびE155Vからなる群より選択される1つ、2つ、3つ、4つ、5つ、6つ、7つ、または8つの突然変異、または他のアデノシンデアミナーゼ（例えばecTadA）における対応する突然変異を含む。いくつかの実施形態において、アデノシンデアミナーゼは、TadA参照配列におけるH8Y、D108N、A109T、N127S、およびE155Gからなる群より選択される1つ、2つ、3つ、4つ、または5つの突然変異、または別のアデノシンデアミナーゼ（例えばecTadA）における対応する突然変異（複数可）を含む。

本明細書に提供される変異のいずれか、および任意のさらなる変異（例えばecTadAアミノ酸配列に基づくもの）を、任意の他のアデノシンデアミナーゼに導入することができる。本明細書に提供される変異のいずれも、TadA参照配列または別のアデノシンデアミナーゼ（例えばecTadA）において、個々に、または任意の組合せで作製することができる。

AからGへの核酸塩基編集タンパク質の詳細は、国際PCT出願第PCT/2017/045381号(国際公開第2018/027078号)およびGaudelli, N.M., et al., “Programmable base editing of A・T to G・C in genomic DNA without DNA cleavage” Nature, 551, 464-471 (2017)に記載されており、その内容全体が参照により本明細書に組み込まれる。

ある態様において、アデノシンデアミナーゼは、別のアデノシンデアミナーゼ（例えばecTadA）において一つ以上の対応する突然変異を含む。ある態様において、アデノシンデアミナーゼは、TadA参照配列においてD108N、D108G、もしくはD108V突然変異、または別のアデノシンデアミナーゼ（例えばecTadA）において対応する突然変異を含む。ある態様において、アデノシンデアミナーゼは、TadA参照配列におけるA106VおよびD108N突然変異、または別のアデノシンデアミナーゼ（例えばecTadA）における対応する突然変異を含む。ある態様において、アデノシンデアミナーゼは、TadA参照配列におけるR107CおよびD108N突然変異、または別のアデノシンデアミナーゼ（例えばecTadA）における対応する突然変異を含む。ある態様において、アデノシンデアミナーゼは、TadA参照配列におけるH8Y、D108N、N127S、D147Y、およびQ154H突然変異、または別のアデノシンデアミナーゼ（例えばecTadA）における対応する突然変異を含む。ある態様において、アデノシンデアミナーゼは、TadA参照配列におけるH8Y、D108N、N127S、D147Y、およびE155V突然変異、または別のアデノシンデアミナーゼ（例えばecTadA）における対応する突然変異を含む。ある態様において、アデノシンデアミナーゼは、TadA参照配列におけるD108N、D147Y、およびE155V突然変異、または別のアデノシンデアミナーゼ（例えばecTadA）における対応する突然変異を含む。ある態様において、アデノシンデアミナーゼは、TadA参照配列におけるH8Y、D108N、およびN127S突然変異、または別のアデノシンデアミナーゼ（例えばecTadA）における対応する突然変異を含む。ある態様において、アデノシンデアミナーゼは、TadA参照配列におけるA106V、D108N、D147YおよびE155V突然変異、または別のアデノシンデアミナーゼ（例えばecTadA）における対応する突然変異を含む。

いくつかの実施形態において、アデノシンデアミナーゼは、tadA参照配列におけるS2X、H8X、I49X、L84X、H123X、N127X、I156Xおよび/またはK160X突然変異の1つ以上、または別のアデノシンデアミナーゼにおける1つ以上の対応する突然変異を含み、Xの存在は、野生型アデノシンデアミナーゼにおける対応するアミノ酸以外のいずれかのアミノ酸を示す。いくつかの実施形態において、アデノシンデアミナーゼは、TadA参照配列におけるS2A、H8Y、I49F、L84F、H123Y、N127S、I156Fおよび/またはK160S突然変異のうちの1つ以上、または別のアデノシンデアミナーゼ（例えばecTadA）における1つ以上の対応する突然変異を含む。

ある態様において、アデノシンデアミナーゼは、L84X突然変異アデノシンデアミナーゼを含み、Xは、野生型アデノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸を示す。ある態様において、アデノシンデアミナーゼは、TadA参照配列におけるL84F突然変異、または別のアデノシンデアミナーゼ（例えばecTadA）における対応する突然変異を含む。

ある態様において、アデノシンデアミナーゼは、TadA参照配列におけるH123X突然変異、または別のアデノシンデアミナーゼ（例えばecTadA）における対応する突然変異を含み、Xは、野生型アデノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸を示す。ある態様において、アデノシンデアミナーゼは、TadA参照配列におけるH123Y突然変異、または別のアデノシンデアミナーゼ（例えばecTadA）における対応する突然変異を含む。

ある態様において、アデノシンデアミナーゼは、TadA参照配列におけるI156X突然変異、または別のアデノシンデアミナーゼ（例えばecTadA）における対応する突然変異を含み、Xは、野生型アデノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸を示す。ある態様において、アデノシンデアミナーゼは、TadA参照配列におけるI156F突然変異、または別のアデノシンデアミナーゼ（例えばecTadA）における対応する突然変異を含む。

ある態様において、アデノシンデアミナーゼは、TadA参照配列において、L84X、A106X、D108X、H123X、D147X、E155X、およびI156Xからなる群より選択される1つ、2つ、3つ、4つ、5つ、6つ、または7つの突然変異、または別のアデノシンデアミナーゼ（例えばecTadA）における対応する突然変異（複数可）を含み、ここでXは、野生型アデノシンデアミナーゼにおける対応するアミノ酸以外のいずれかのアミノ酸の存在を示す。ある態様において、アデノシンデアミナーゼは、tadA参照配列においてS2X、I49X、A106X、D108X、D147X、およびE155Xからなる群より選択される1つ、2つ、3つ、4つ、5つ、または6つの突然変異、または別のアデノシンデアミナーゼ（例えばecTadA）における対応する突然変異（複数可）を含み、ここでXは野生型アデノシンデアミナーゼにおける対応するアミノ酸以外のいずれかのアミノ酸の存在を示す。ある態様において、アデノシンデアミナーゼは、TadA参照配列においてH8X、A106X、D108X、N127X、およびK160Xからなる群より選択される1、2、3、4、または5個の突然変異、または別のアデノシンデアミナーゼ（例えばecTadA）における対応する突然変異（複数可）を含み、ここでXは野生型アデノシンデアミナーゼにおける対応するアミノ酸以外のいずれかのアミノ酸の存在を示す。

ある態様において、アデノシンデアミナーゼは、TadA参照配列において、L84F、A106V、D108N、H123Y、D147Y、E155V、およびI156Fからなる群より選択される1つ、2つ、3つ、4つ、5つ、6つ、または7つの突然変異、または別のアデノシンデアミナーゼ（例えばecTadA）における対応する突然変異を含む。ある態様において、アデノシンデアミナーゼは、TadA参照配列において、S2A、I49F、A106V、D108N、D147Y、およびE155Vからなる群より選択される1つ、2つ、3つ、4つ、5つ、または6つの突然変異を含む。

いくつかの実施形態において、アデノシンデアミナーゼは、TadA参照配列においてH8Y、A106T、D108N、N127S、およびK160Sからなる群より選択される1つ、2つ、3つ、4つ、または5つの突然変異、または別のアデノシンデアミナーゼ（例えばecTadA）における対応する突然変異もしくは突然変異を含む。

いくつかの実施形態において、アデノシンデアミナーゼは、TadA参照配列においてE25X、R26X、R107X、A142X、および/またはA143X突然変異のうちの1以上、または別のアデノシンデアミナーゼ（例えばecTadA）における1以上の対応する突然変異を含み、Xの存在は、野生型アデノシンデアミナーゼにおける対応するアミノ酸以外のいずれかのアミノ酸を示す。ある態様において、アデノシンデアミナーゼは、TadA基準配列においてE25M、E25D、E25A、E25R、E25V、E25S、E25Y、R26G、R26N、R26Q、R26C、R26L、R26K、R107P、R107K、R107A、R107N、R107W、R107H、R107S、A142N、A142D、A142G、A143D、A143G、A143E、A143L、A143W、A143M、A143S、A143Qおよび/またはA143R突然変異のうちの1以上、または他のアデノシンデアミナーゼ（例えばecTadA）における1以上の対応する突然変異を含む。いくつかの実施形態において、アデノシンデアミナーゼは、TadA参照配列に対応する本明細書に記載の突然変異のうちの1つ以上、または別のアデノシンデアミナーゼ（例えばecTadA）における対応する突然変異のうちの1つ以上を含む。

ある態様において、アデノシンデアミナーゼは、TadA参照配列におけるE25X突然変異、または別のアデノシンデアミナーゼ（例えばecTadA）における対応する突然変異を含み、Xは、野生型アデノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸を示す。ある態様において、アデノシンデアミナーゼは、TadA参照配列におけるE25M、E25D、E25A、E25R、E25V、E25S、またはE25Y突然変異、または別のアデノシンデアミナーゼ（例えばecTadA）における対応する突然変異を含む。

ある態様において、アデノシンデアミナーゼは、TadA参照配列におけるR26X突然変異、または別のアデノシンデアミナーゼ（例えばecTadA）における対応する突然変異を含み、Xは、野生型アデノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸を示す。いくつかの実施形態において、アデノシンデアミナーゼは、TadA参照配列におけるR26G、R26N、R26Q、R26C、R26L、またはR26K突然変異、または別のアデノシンデアミナーゼ（例えばecTadA）における対応する突然変異を含む。

ある態様において、アデノシンデアミナーゼは、TadA参照配列におけるR107X突然変異、または別のアデノシンデアミナーゼ（例えばecTadA）における対応する突然変異を含み、Xは、野生型アデノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸を示す。ある態様において、アデノシンデアミナーゼは、TadA参照配列におけるR107P、R107K、R107A、R107N、R107W、R107H、またはR107S突然変異、または別のアデノシンデアミナーゼ（例えばecTadA）における対応する突然変異を含む。

ある態様において、アデノシンデアミナーゼは、TadA参照配列におけるA142X突然変異、または別のアデノシンデアミナーゼ（例えばecTadA）における対応する突然変異を含み、Xは、野生型アデノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸を示す。ある態様において、アデノシンデアミナーゼは、TadA参照配列におけるA142N、A142D、A142G突然変異、または別のアデノシンデアミナーゼ（例えばecTadA）における対応する突然変異を含む。

ある態様において、アデノシンデアミナーゼは、TadA参照配列におけるA143X突然変異、または別のアデノシンデアミナーゼ（例えばecTadA）における対応する突然変異を含み、Xは、野生型アデノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸を示す。ある態様において、アデノシンデアミナーゼは、TadA参照配列におけるA143D、A143G、A143E、A143L、A143W、A143M、A143S、A143Qおよび/またはA143Rの突然変異、または別のアデノシンデアミナーゼ（例えばecTadA）における対応する突然変異を含む。

いくつかの実施形態において、アデノシンデアミナーゼは、TadA参照配列におけるH36X、N37X、P48X、I49X、R51X、M70X、N72X、D77X、E134X、S146X、Q154X、K157X、および/またはK161X突然変異の1つ以上、または別のアデノシンデアミナーゼ（例えばecTadA）における1つ以上の対応する突然変異を含み、ここでXの存在は、野生型アデノシンデアミナーゼにおける対応するアミノ酸以外のいずれかのアミノ酸を示す。いくつかの実施形態において、アデノシンデアミナーゼは、TadA参照配列におけるH36L、N37T、N37S、P48T、P48L、I49V、R51H、R51L、M70L、N72S、D77G、E134G、S146R、S146C、Q154H、K157N、および/またはK161T突然変異の1以上、または別のアデノシンデアミナーゼ（例えばecTadA）における1以上の対応する突然変異を含む。

いくつかの実施形態において、アデノシンデアミナーゼは、TadA参照配列におけるH36X突然変異、または別のアデノシンデアミナーゼ（例えばecTadA）における対応する突然変異を含み、ここでXは、野生型アデノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸を示す。いくつかの実施形態において、アデノシンデアミナーゼは、TadA参照配列におけるH36L突然変異、または別のアデノシンデアミナーゼ（例えばecTadA）における対応する突然変異を含む。

ある態様において、アデノシンデアミナーゼは、TadA参照配列におけるN37X突然変異、または別のアデノシンデアミナーゼ（例えばecTadA）における対応する突然変異を含み、Xは野生型アデノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸を示す。ある態様において、アデノシンデアミナーゼは、TadA参照配列におけるN37TまたはN37S突然変異、または別のアデノシンデアミナーゼ（例えばecTadA）における対応する突然変異を含む。

ある態様において、アデノシンデアミナーゼは、TadA参照配列におけるP48X突然変異、または別のアデノシンデアミナーゼ（例えばecTadA）における対応する突然変異を含み、ここでXは、野生型アデノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸を示す。ある態様において、アデノシンデアミナーゼは、TadA参照配列におけるP48TまたはP48L突然変異、または別のアデノシンデアミナーゼ（例えばecTadA）における対応する突然変異を含む。

ある態様において、アデノシンデアミナーゼは、TadA参照配列におけるR51X突然変異、または別のアデノシンデアミナーゼにおける対応する突然変異を含み、Xは野生型アデノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸を示す。ある態様において、アデノシンデアミナーゼは、TadA参照配列におけるR51HまたはR51L突然変異、または別のアデノシンデアミナーゼ（例えばecTadA）における対応する突然変異を含む。

ある態様において、アデノシンデアミナーゼは、TadA参照配列におけるS146X突然変異、または別のアデノシンデアミナーゼにおける対応する突然変異を含み、Xは野生型アデノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸を示す。ある態様において、アデノシンデアミナーゼは、TadA参照配列におけるS146RまたはS146C突然変異、または別のアデノシンデアミナーゼ（例えばecTadA）における対応する突然変異を含む。

ある態様において、アデノシンデアミナーゼは、TadA参照配列におけるK157X突然変異、または別のアデノシンデアミナーゼにおける対応する突然変異を含み、Xは野生型アデノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸を示す。ある態様において、アデノシンデアミナーゼは、TadA参照配列におけるK157N突然変異、または別のアデノシンデアミナーゼ（例えばecTadA）における対応する突然変異を含む。

ある態様において、アデノシンデアミナーゼは、TadA参照配列におけるP48X突然変異、または別のアデノシンデアミナーゼ（例えばecTadA）における対応する突然変異を含み、ここでXは、野生型アデノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸を示す。ある態様において、アデノシンデアミナーゼは、TadA参照配列におけるP48S、P48T、またはP48A突然変異、または別のアデノシンデアミナーゼ（例えばecTadA）における対応する突然変異を含む。

ある態様において、アデノシンデアミナーゼは、TadA参照配列におけるA142X突然変異、または別のアデノシンデアミナーゼ（例えばecTadA）における対応する突然変異を含み、Xは野生型アデノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸を示す。ある態様において、アデノシンデアミナーゼは、TadA参照配列におけるA142N突然変異、または別のアデノシンデアミナーゼ（例えばecTadA）における対応する突然変異を含む。

ある態様において、アデノシンデアミナーゼは、TadA参照配列におけるW23X突然変異、または別のアデノシンデアミナーゼ（例えばecTadA）における対応する突然変異を含み、ここでXは、野生型アデノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸を示す。ある態様において、アデノシンデアミナーゼは、TadA参照配列におけるW23RまたはW23L突然変異、または別のアデノシンデアミナーゼ（例えばecTadA）における対応する突然変異を含む。

ある態様において、アデノシンデアミナーゼは、TadA参照配列におけるR152X突然変異、または別のアデノシンデアミナーゼ（例えばecTadA）における対応する突然変異を含み、ここでXは、野生型アデノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸を示す。ある態様において、アデノシンデアミナーゼは、TadA参照配列におけるR152PまたはR52H突然変異、または別のアデノシンデアミナーゼ（例えばecTadA）における対応する突然変異を含む。

一実施形態では、アデノシンデアミナーゼは、突然変異H36L、R51L、L84F、A106V、D108N、H123Y、S146C、D147Y、E155V、I156F、およびK157Nを含むことができる。一部の実施形態では、アデノシンデアミナーゼは、tadA基準配列に関連する突然変異の以下の組合せを含み、ここで、組合せの各突然変異は「_」によって分離され、突然変異の各組合せは括弧内にある：
(A106V_D108N),
(R107C_D108N),
(H8Y_D108N_N127S_D147Y_Q154H),
(H8Y_D108N_N127S_D147Y_E155V),
(D108N_D147Y_E155V),
(H8Y_D108N_N127S),
(H8Y_D108N_N127S_D147Y_Q154H),
(A106V_D108N_D147Y_E155V),
(D108Q_D147Y_E155V),
(D108M_D147Y_E155V),
(D108L_D147Y_E155V),
(D108K_D147Y_E155V),
(D108I_D147Y_E155V),
(D108F_D147Y_E155V),
(A106V_D108N_D147Y),
(A106V_D108M_D147Y_E155V),
(E59A_A106V_D108N_D147Y_E155V),
(E59A cat dead_A106V_D108N_D147Y_E155V),
(L84F_A106V_D108N_H123Y_D147Y_E155V_I156Y),
(L84F_A106V_D108N_H123Y_D147Y_E155V_I156F),
(R26G_L84F_A106V_R107H_D108N_H123Y_A142N_A143D_D147Y_E155V_I156F),
(E25G_R26G_L84F_A106V_R107H_D108N_H123Y_A142N_A143D_D147Y_E155V
_I156F), (E25D_R26G_L84F_A106V_R107K_D108N_H123Y_A142N_A143G_D147Y_E155V_
I156F),
(R26Q_L84F_A106V_D108N_H123Y_A142N_D147Y_E155V_I156F),
(E25M_R26G_L84F_A106V_R107P_D108N_H123Y_A142N_A143D_D147Y_E155V
_I156F),
(R26C_L84F_A106V_R107H_D108N_H123Y_A142N_D147Y_E155V_I156F), (L84F_A106V_D108N_H123Y_A142N_A143L_D147Y_E155V_I156F),
(R26G_L84F_A106V_D108N_H123Y_A142N_D147Y_E155V_I156F),
(E25A_R26G_L84F_A106V_R107N_D108N_H123Y_A142N_A143E_D147Y_E155V
_I156F),
(R26G_L84F_A106V_R107H_D108N_H123Y_A142N_A143D_D147Y_E155V_I156F),
(A106V_D108N_A142N_D147Y_E155V),
(R26G_A106V_D108N_A142N_D147Y_E155V),
(E25D_R26G_A106V_R107K_D108N_A142N_A143G_D147Y_E155V),
(R26G_A106V_D108N_R107H_A142N_A143D_D147Y_E155V),
(E25D_R26G_A106V_D108N_A142N_D147Y_E155V),
(A106V_R107K_D108N_A142N_D147Y_E155V),
(A106V_D108N_A142N_A143G_D147Y_E155V),
(A106V_D108N_A142N_A143L_D147Y_E155V),
(H36L_R51L_L84F_A106V_D108N_H123Y_S146C_D147Y_E155V_I156F _K157N),
(N37T_P48T_M70L_L84F_A106V_D108N_H123Y_D147Y_I49V_E155V_I156F),
(N37S_L84F_A106V_D108N_H123Y_D147Y_E155V_I156F_K161T),
(H36L_L84F_A106V_D108N_H123Y_D147Y_Q154H_E155V_I156F),
(N72S_L84F_A106V_D108N_H123Y_S146R_D147Y_E155V_I156F),
(H36L_P48L_L84F_A106V_D108N_H123Y_E134G_D147Y_E155V_I156F),
(H36L_L84F_A106V_D108N_H123Y_D147Y_E155V_I156F_K157N), (H36L_L84F_A106V_D108N_H123Y_S146C_D147Y_E155V_I156F),
(L84F_A106V_D108N_H123Y_S146R_D147Y_E155V_I156F_K161T),
(N37S_R51H_D77G_L84F_A106V_D108N_H123Y_D147Y_E155V_I156F),
(R51L_L84F_A106V_D108N_H123Y_D147Y_E155V_I156F_K157N),
(D24G_Q71R_L84F_H96L_A106V_D108N_H123Y_D147Y_E155V_I156F_K160E),
(H36L_G67V_L84F_A106V_D108N_H123Y_S146T_D147Y_E155V_I156F),
(Q71L_L84F_A106V_D108N_H123Y_L137M_A143E_D147Y_E155V_I156F),
(E25G_L84F_A106V_D108N_H123Y_D147Y_E155V_I156F_Q159L),
(L84F_A91T_F104I_A106V_D108N_H123Y_D147Y_E155V_I156F),
(N72D_L84F_A106V_D108N_H123Y_G125A_D147Y_E155V_I156F),
(P48S_L84F_S97C_A106V_D108N_H123Y_D147Y_E155V_I156F),
(W23G_L84F_A106V_D108N_H123Y_D147Y_E155V_I156F),
(D24G_P48L_Q71R_L84F_A106V_D108N_H123Y_D147Y_E155V_I156F_Q159L),
(L84F_A106V_D108N_H123Y_A142N_D147Y_E155V_I156F),
(H36L_R51L_L84F_A106V_D108N_H123Y_A142N_S146C_D147Y_E155V_I156F
_K157N), (N37S_L84F_A106V_D108N_H123Y_A142N_D147Y_E155V_I156F_K161T),
(L84F_A106V_D108N_D147Y_E155V_I156F),
(R51L_L84F_A106V_D108N_H123Y_S146C_D147Y_E155V_I156F_K157N_K161T),
(L84F_A106V_D108N_H123Y_S146C_D147Y_E155V_I156F_K161T),
(L84F_A106V_D108N_H123Y_S146C_D147Y_E155V_I156F_K157N_K160E_K161T),
(L84F_A106V_D108N_H123Y_S146C_D147Y_E155V_I156F_K157N_K160E),
(R74Q_L84F_A106V_D108N_H123Y_D147Y_E155V_I156F),
(R74A_L84F_A106V_D108N_H123Y_D147Y_E155V_I156F),
(L84F_A106V_D108N_H123Y_D147Y_E155V_I156F),
(R74Q_L84F_A106V_D108N_H123Y_D147Y_E155V_I156F),
(L84F_R98Q_A106V_D108N_H123Y_D147Y_E155V_I156F),
(L84F_A106V_D108N_H123Y_R129Q_D147Y_E155V_I156F),
(P48S_L84F_A106V_D108N_H123Y_A142N_D147Y_E155V_I156F),
(P48S_A142N),
(P48T_I49V_L84F_A106V_D108N_H123Y_A142N_D147Y_E155V_I156F_L157N),
(P48T_I49V_A142N),
(H36L_P48S_R51L_L84F_A106V_D108N_H123Y_S146C_D147Y_E155V_I156F_K157N),
(H36L_P48S_R51L_L84F_A106V_D108N_H123Y_S146C_A142N_D147Y_E155V_I156F (H36L_P48T_I49V_R51L_L84F_A106V_D108N_H123Y_S146C_D147Y_E155V_I156F _K157N),
(H36L_P48T_I49V_R51L_L84F_A106V_D108N_H123Y_A142N_S146C_D147Y_E155V_ I156F _K157N),
(H36L_P48A_R51L_L84F_A106V_D108N_H123Y_S146C_D147Y_E155V_I156F_K157N),
(H36L_P48A_R51L_L84F_A106V_D108N_H123Y_A142N_S146C_D147Y_E155V_I156F _K157N),
(H36L_P48A_R51L_L84F_A106V_D108N_H123Y_S146C_A142N_D147Y_E155V_I156F _K157N),
(W23L_H36L_P48A_R51L_L84F_A106V_D108N_H123Y_S146C_D147Y_E155V_I156F _K157N),
(W23R_H36L_P48A_R51L_L84F_A106V_D108N_H123Y_S146C_D147Y_E155V_I156F _K157N),
(W23L_H36L_P48A_R51L_L84F_A106V_D108N_H123Y_S146R_D147Y_E155V_I156F _K161T),
(H36L_P48A_R51L_L84F_A106V_D108N_H123Y_S146C_D147Y_R152H_E155V_I156F _K157N),
(H36L_P48A_R51L_L84F_A106V_D108N_H123Y_S146C_D147Y_R152P_E155V_I156F _K157N),
(W23L_H36L_P48A_R51L_L84F_A106V_D108N_H123Y_S146C_D147Y_R152P_E155V _I156F _K157N),
(W23L_H36L_P48A_R51L_L84F_A106V_D108N_H123Y_A142A_S146C_D147Y_E155V
_I156F _K157N),
(W23L_H36L_P48A_R51L_L84F_A106V_D108N_H123Y_A142A_S146C_D147Y_R152P _E155V_I156F_K157N),
(W23L_H36L_P48A_R51L_L84F_A106V_D108N_H123Y_S146R_D147Y_E155V_I156F _K161T),
(W23R_H36L_P48A_R51L_L84F_A106V_D108N_H123Y_S146C_D147Y_R152P_E155V _I156F _K157N),
(H36L_P48A_R51L_L84F_A106V_D108N_H123Y_A142N_S146C_D147Y_R152P_E155V
_I156F _K157N).

特定の実施形態では、本明細書で提供される融合タンパク質は、融合タンパク質の塩基編集活性を改善させる１つまたは複数の特徴を含む。例えば、本明細書で提供される融合タンパク質のいずれかは、ヌクレアーゼ活性が低減されたCas9ドメインを含み得る。いくつかの実施形態において、本明細書で提供される融合タンパク質のいずれかは、ヌクレアーゼ活性を有さないCas9ドメイン（dCas9）、または、Cas9ニッカーゼ（nCas9）と呼ばれる、二本鎖DNA分子の一つの鎖を切断するCas9ドメインを有し得る。

いくつかの実施形態において、アデノシンデアミナーゼは、TadA*7.10である。いくつかの実施形態では、TadA*7.10は、少なくとも1つの改変を含む。特定の実施形態では、TadA*7.10は、以下の改変のうちの1つまたは複数を含む：Y147T、Y147R、Q154S、Y123H、V82S、T166R、およびQ154R。改変Y123Hは、本明細書ではH123Hとも呼ばれる（TadA*7.10における改変H123YがY123H (wt)に戻されたもの）。他の実施形態では、TadA*7.10は、以下の群から選択される改変の組み合わせを含む：Y147T + Q154R; Y147T + Q154S; Y147R + Q154S; V82S + Q154S; V82S + Y147R; V82S + Q154R; V82S + Y123H; I76Y + V82S; V82S + Y123H + Y147T; V82S + Y123H + Y147R; V82S + Y123H + Q154R; Y147R + Q154R +Y123H; Y147R + Q154R + I76Y; Y147R + Q154R + T166R; Y123H + Y147R + Q154R + I76Y; V82S + Y123H + Y147R + Q154R; および I76Y + V82S + Y123H + Y147R + Q154R。特定の実施形態において、アデノシンデアミナーゼバリアントは、残基149、150、151、152、153、154、155、156、および157で始まるC末端の欠失を含む。

いくつかの実施形態では、TadAバリアントは、TadA7.10と比較して少なくとも１つの改変を含む。いくつかの実施形態において、TadAバリアントは、野生型TadAと比較して少なくとも１つの改変を含む。TadAバリアントにおけるアミノ酸改変は、TadA7.10または野生型TadAと比較して、本明細書に記載されるアミノ酸置換のいずれか１つであり得る。いくつかの実施形態では、TadAバリアント、例えば、TadA8は、アミノ酸位置23、26、36、37、48、49、51、72、84、87、105、108、123、125、142、145、147、152、155、16、157、161、またはそれらの任意の組み合わせにおいてアミノ酸改変を含む。いくつかの実施形態において、TadAバリアントは、TadA7.10に対するアミノ酸改変V82Xを含み、ここで、Xは、V以外の任意のアミノ酸である。いくつかの実施形態において、TadAバリアントは、TadA7.10に対するV82S改変を含む。いくつかの実施形態において、アミノ酸Xは、酸性アミノ酸、塩基性アミノ酸、または中性アミノ酸である。いくつかの実施形態において、TadAバリアントは、TadA7.10に対するアミノ酸改変T166Xを含み、ここで、Xは、T以外の任意のアミノ酸である。いくつかの実施形態において、アミノ酸Xは、酸性アミノ酸、塩基性アミノ酸、または中性アミノ酸である。いくつかの実施形態において、TadAバリアントは、TadA7.10に対するアミノ酸改変V82X、Y147X、Q154X、I76X、Y123X、R23X、L36X、A48X、L51X、F84X、V106X、N108X、Y123X、C146X、Y147X、P152X、Q154X、V155X、F156X、N157X、T166Xまたはそれらの任意の組み合わせを含み、ここで、Xは、TadA7.10におけるアミノ酸以外の任意のアミノ酸である。いくつかの実施形態において、Xは、酸性アミノ酸、塩基性アミノ酸、または中性アミノ酸である。いくつかの実施形態において、Xは、アミノ酸を、TadA参照配列における野生型アミノ酸に戻す。

他の実施形態では、本発明の塩基エディターは、以下の改変のうちの１つまたは複数を含むアデノシンデアミナーゼバリアント（例えばTadA*8）を含むモノマーである： Y147T、Y147R、Q154S、Y123H、V82S、T166R、および／またはQ154R。他の実施形態において、アデノシンデアミナーゼバリアント（TadA*8）は、以下の群から選択される改変の組み合わせを含む単量体である：Y147T + Q154R; Y147T + Q154S; Y147R + Q154S; V82S + Q154S; V82S + Y147R; V82S + Q154R; V82S + Y123H; I76Y + V82S; V82S + Y123H + Y147T; V82S + Y123H + Y147R; V82S + Y123H + Q154R; Y147R + Q154R +Y123H; Y147R + Q154R + I76Y; Y147R + Q154R + T166R; Y123H + Y147R + Q154R + I76Y; V82S + Y123H + Y147R + Q154R; およびI76Y + V82S + Y123H + Y147R + Q154R。他の実施形態では、塩基エディターは、野生型アデノシンデアミナーゼと、以下の改変のうちの１つまたは複数を含むアデノシンデアミナーゼバリアント（例えばTadA*8）とを含むヘテロダイマーである：Y147T, Y147R, Q154S, Y123H, V82S, T166R, および／またはQ154R。他の実施形態では、塩基エディターは、TadA*7.10ドメインと、以下の群から選択される改変の組み合わせを含むアデノシンデアミナーゼバリアントドメイン（例えばTadA*8）とを含むヘテロダイマーである：Y147T + Q154R; Y147T + Q154S; Y147R + Q154S; V82S + Q154S; V82S + Y147R; V82S + Q154R; V82S + Y123H; I76Y + V82S; V82S + Y123H + Y147T; V82S + Y123H + Y147R; V82S + Y123H + Q154R; Y147R + Q154R +Y123H; Y147R + Q154R + I76Y; Y147R + Q154R + T166R; Y123H + Y147R + Q154R + I76Y; V82S + Y123H + Y147R + Q154R; およびI76Y + V82S + Y123H + Y147R + Q154R。

一実施形態では、アデノシンデアミナーゼは、アデノシンデアミナーゼ活性を有する以下の配列またはその断片を含むか、または本質的にそれからなる、TadA*8である：
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCTFFRMPRQVFNAQKKAQSSTD

いくつかの実施形態では、TadA*8は切り詰められている。いくつかの実施形態において、切り詰め型TadA*8は、全長TadA*8と比較して1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、6、17、18、19、または20個のN末端アミノ酸残基を欠いている。いくつかの実施形態において、切り詰め型TadA*8は、全長TadA*8と比較して1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、6、17、18、19、または20個のC末端アミノ酸残基を欠いている。いくつかの実施形態において、アデノシンデアミナーゼバリアントは、完全長のTadA*8である。

いくつかの実施形態において、TadA*8は、TadA*8.1, TadA*8.2, TadA*8.3, TadA*8.4, TadA*8.5, TadA*8.6, TadA*8.7, TadA*8.8, TadA*8.9, TadA*8.10, TadA*8.11, TadA*8.12, TadA*8.13, TadA*8.14, TadA*8.15, TadA*8.16, TadA*8.17, TadA*8.18, TadA*8.19, TadA*8.20, TadA*8.21, TadA*8.22, TadA*8.23, TadA*8.24である。

一実施形態では、本発明の融合タンパク質は、野生型TadAが本明細書に記載のアデノシンデアミナーゼバリアント（例えばTadA*8）に連結されそしてそれがCas9ニッカーゼに連結されているものを含む。特定の実施形態において、融合タンパク質は単一のTadA*8ドメインを（すなわちモノマーとして提供されて）含む。別の実施形態では、塩基エディターはTadA*8とTadA(wt)とを含み、これらはヘテロダイマーを形成することができる。典型的な配列は以下の通りである。
TadA(wt):
MSEVEFSHEYWMRHALTLAKRAWDEREVPVGAVLVHNNRVIGEGWNRPIGRHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTLEPCVMCAGAMIHSRIGRVVFGARDAKTGAAGSLMDVLHHPGMNHRVEITEGILADECAALLSDFFRMRRQEIKAQKKAQSSTD
TadA*7.10:
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPRQVFNAQKKAQSSTD
TadA*8:
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCTFFRMPRQVFNAQKKAQSSTD.

特定の実施形態では、TadA*8は、太字で示されている以下の位置のいずれかに１つまたは複数の変異を含む。他の実施形態では、TadA*8は、下線を引いて示された位置のいずれかに１つまたは複数の変異を含む：

例えば、TadA*8は、アミノ酸位置82および/または166における改変（例えばV82S、T166R）を、単独で、または以下のうちのいずれか1つ以上と組み合わせて含む：Y147T, Y147R, Q154S, Y123H, および/またはQ154R。特定の実施形態では、改変の組み合わせが、以下のものからなる群から選択される：Y147T + Q154R; Y147T + Q154S; Y147R + Q154S; V82S + Q154S; V82S + Y147R; V82S + Q154R; V82S + Y123H; I76Y + V82S; V82S + Y123H + Y147T; V82S + Y123H + Y147R; V82S + Y123H + Q154R; Y147R + Q154R +Y123H; Y147R + Q154R + I76Y; Y147R + Q154R + T166R; Y123H + Y147R + Q154R + I76Y; V82S + Y123H + Y147R + Q154R; および I76Y + V82S + Y123H + Y147R + Q154R。

ある実施形態では、アデノシンデアミナーゼは、アデノシンデアミナーゼ活性を有する以下の配列またはその断片を含むか、または本質的にそれからなる、TadA*8である：
MSEVEFSHEY WMRHALTLAK RARDEREVPV GAVLVLNNRV IGEGWNRAIG LHDPTAHAEI MALRQGGLVM QNYRLIDATL YVTFEPCVMC AGAMIHSRIG
RVVFGVRNAK TGAAGSLMDV LHYPGMNHRV EITEGILADE CAALLCTFFR
MPRQVFNAQK KAQSSTD

いくつかの実施形態では、TadA*8は切り詰められている（truncated）。いくつかの実施形態において、切り詰め型TadA*8は、全長TadA*8と比較して1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、6、17、18、19、または20個のN末端アミノ酸残基を欠いている。いくつかの実施形態において、切り詰め型TadA*8は、全長TadA*8と比較して1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、6、17、18、19、または20個のC末端アミノ酸残基を欠いている。いくつかの実施形態において、アデノシンデアミナーゼバリアントは、完全長のTadA*8である。

一実施形態では、本発明の融合タンパク質は、野生型TadAが本明細書に記載のアデノシンデアミナーゼバリアント（例えばTadA*8）に連結されそしてそれがCas9ニッカーゼに連結されているものを含む。特定の実施形態において、融合タンパク質は単一のTadA*8ドメインを（すなわちモノマーとして提供されて）含む。別の実施形態では、塩基エディターはTadA*8とTadA(wt)とを含み、これらはヘテロダイマーを形成することができる。

いくつかの実施形態において、アデノシンデアミナーゼアリル（例えばTadAアリル）の合成ライブラリーを利用して、改変された塩基編集効率および／または特異性を有するアデノシン塩基エディターを生成することができる。いくつかの実施形態において、合成ライブラリーから生成されたアデノシン塩基エディターは、より高い塩基編集効率および／または特異性を含む。いくつかの実施形態において、合成ライブラリーから生成されたアデノシン塩基エディターは、野生型TadAを有するアデノシン塩基エディターと比較して、増加した塩基編集効率、増加した塩基編集特異性、低減されたオフターゲット編集、低減されたバイスタンダー編集、低減されたインデル形成、および／または低減された目的外編集を示す。いくつかの実施形態において、合成ライブラリーから生成されたアデノシン塩基エディターは、TadA*7.10を有するアデノシン塩基エディターと比較して、増加した塩基編集効率、増加した塩基編集特異性、低減されたオフターゲット編集、低減されたバイスタンダー編集、低減されたインデル形成、および／または低減された目的外編集を示す。いくつかの実施形態において、合成ライブラリーは、ABEのランダム化されたTadA部分を含む。いくつかの実施形態では、合成ライブラリーは、TadAの各位置に20個すべての正準的なアミノ酸の置換を含む。いくつかの実施形態において、合成ライブラリーは、ライブラリー構成員あたり１～２ヌクレオチド置換突然変異の平均頻度を含む。いくつかの実施形態において、合成ライブラリーは、TadA*7.10に見られるバックグラウンド突然変異を含む。

いくつかの実施形態では、本明細書に記載の塩基編集システムは、TadAがCas9に挿入された（inserted）ABEを含む。TadAがCas9に挿入された関連ABEの配列を提供する。

101 Cas9 TadAins 1015
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGA
LLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHR
LEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKAD
LRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENP
INASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTP
NFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAI
LLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEI
FFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLR
KQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPY
YVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDK
NLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVD
LLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKI
IKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQ
LKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDD
SLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKV
MGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHP
VENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDD
SIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNL
TKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLI
REVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKK
YPKLESEFVYGDYKVGSSGSETPGTSESATPESSGSEVEFSHEYWMRHAL
TLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQG
GLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGS
LMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPRQVFNAQKKAQSST
DYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIE
TNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKR
NSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELL
GITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRML
ASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKH
YLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFT
LTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQ
LGGD

102 Cas9 TadAins 1022
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGA
LLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHR
LEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKAD
LRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENP
INASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTP
NFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAI
LLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEI
FFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLR
KQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPY
YVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDK
NLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVD
LLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKI
IKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQ
LKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDD
SLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKV
MGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHP
VENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDD
SIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNL
TKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLI
REVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKK
YPKLESEFVYGDYKVYDVRKMIGSSGSETPGTSESATPESSGSEVEFSHE
YWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAE
IMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNA
KTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPRQVFNAQ
KKAQSSTDAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIE
TNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKR
NSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELL
GITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRML
ASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKH
YLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFT
LTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQ
LGGD

103 Cas9 TadAins 1029
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGA
LLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHR
LEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKAD
LRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENP
INASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTP
NFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAI
LLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEI
FFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLR
KQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPY
YVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDK
NLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVD
LLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKI
IKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQ
LKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDD
SLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKV
MGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHP
VENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDD
SIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNL
TKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLI
REVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKK
YPKLESEFVYGDYKVYDVRKMIAKSEQEIGSSGSETPGTSESATPESSGS
EVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLH
DPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRV
VFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMP
RQVFNAQKKAQSSTDGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIE
TNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKR
NSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELL
GITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRML
ASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKH
YLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFT
LTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQ
LGGD

103 Cas9 TadAins 1040
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGA
LLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHR
LEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKAD
LRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENP
INASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTP
NFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAI
LLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEI
FFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLR
KQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPY
YVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDK
NLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVD
LLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKI
IKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQ
LKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDD
SLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKV
MGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHP
VENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDD
SIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNL
TKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLI
REVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKK
YPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSGSSGSETPGT
SESATPESSGSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVI
GEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCA
GAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADEC
AALLCYFFRMPRQVFNAQKKAQSSTDNIMNFFKTEITLANGEIRKRPLIE
TNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKR
NSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELL
GITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRML
ASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKH
YLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFT
LTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQ
LGGD

105 Cas9 TadAins 1068
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGA
LLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHR
LEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKAD
LRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENP
INASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTP
NFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAI
LLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEI
FFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLR
KQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPY
YVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDK
NLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVD
LLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKI
IKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQ
LKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDD
SLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKV
MGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHP
VENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDD
SIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNL
TKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLI
REVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKK
YPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEI
TLANGEIRKRPLIETNGEGSSGSETPGTSESATPESSGSEVEFSHEYWMR
HALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMAL
RQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGA
AGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPRQVFNAQKKAQ
SSTDTGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKR
NSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELL
GITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRML
ASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKH
YLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFT
LTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQ
LGGD

106 Cas9 TadAins 1247
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGA
LLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHR
LEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKAD
LRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENP
INASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTP
NFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAI
LLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEI
FFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLR
KQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPY
YVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDK
NLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVD
LLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKI
IKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQ
LKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDD
SLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKV
MGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHP
VENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDD
SIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNL
TKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLI
REVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKK
YPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEI
TLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEV
QTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVE
KGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPK
YSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGGSS
GSETPGTSESATPESSGSEVEFSHEYWMRHALTLAKRARDEREVPVGAVL
VLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTF
EPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITE
GILADECAALLCYFFRMPRQVFNAQKKAQSSTDSPEDNEQKQLFVEQHKH
YLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFT
LTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQ
LGGD

107 Cas9 TadAins 1054
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGA
LLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHR
LEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKAD
LRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENP
INASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTP
NFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAI
LLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEI
FFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLR
KQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPY
YVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDK
NLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVD
LLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKI
IKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQ
LKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDD
SLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKV
MGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHP
VENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDD
SIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNL
TKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLI
REVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKK
YPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEI
TLANGSSGSETPGTSESATPESSGSEVEFSHEYWMRHALTLAKRARDERE
VPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLID
ATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMN
HRVEITEGILADECAALLCYFFRMPRQVFNAQKKAQSSTDGEIRKRPLIE
TNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKR
NSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELL
GITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRML
ASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKH
YLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFT
LTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQ
LGGD

108 Cas9 TadAins 1026
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGA
LLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHR
LEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKAD
LRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENP
INASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTP
NFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAI
LLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEI
FFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLR
KQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPY
YVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDK
NLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVD
LLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKI
IKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQ
LKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDD
SLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKV
MGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHP
VENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDD
SIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNL
TKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLI
REVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKK
YPKLESEFVYGDYKVYDVRKMIAKSEGSSGSETPGTSESATPESSGSEVE
FSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPT
AHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFG
VRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPRQV
FNAQKKAQSSTDQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIE
TNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKR
NSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELL
GITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRML
ASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKH
YLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFT
LTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQ
LGGD

109 Cas9 TadAins 768
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGA
LLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHR
LEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKAD
LRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENP
INASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTP
NFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAI
LLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEI
FFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLR
KQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPY
YVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDK
NLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVD
LLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKI
IKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQ
LKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDD
SLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKV
MGRHKPENIVIEMARENQGSSGSETPGTSESATPESSGSEVEFSHEYWMR
HALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMAL
RQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGA
AGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPRTTQKGQKNSR
ERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQEL
DINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKK
MKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQIT
KHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREI
NNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQE
IGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGR
DFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDP
KKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNP
IDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELAL
PSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSK
RVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFD
TTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD

110.1 Cas9 TadAins 1250
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGA
LLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHR
LEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKAD
LRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENP
INASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTP
NFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAI
LLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEI
FFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLR
KQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPY
YVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDK
NLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVD
LLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKI
IKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQ
LKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDD
SLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKV
MGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHP
VENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDD
SIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNL
TKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLI
REVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKK
YPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEI
TLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEV
QTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVE
KGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPK
YSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPG
SSGSETPGTSESATPESSGSEVEFSHEYWMRHALTLAKRARDEREVPVGA
VLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYV
TFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEI
TEGILADECAALLCYFFRMPREDNEQKQLFVEQHKHYLDEIIEQISEFSK
RVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFD
TTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD

110.2 Cas9 TadAins 1250
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGA
LLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHR
LEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKAD
LRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENP
INASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTP
NFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAI
LLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEI
FFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLR
KQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPY
YVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDK
NLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVD
LLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKI
IKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQ
LKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDD
SLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKV
MGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHP
VENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDD
SIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNL
TKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLI
REVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKK
YPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEI
TLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEV
QTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVE
KGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPK
YSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPG
SSGSSGSETPGTSESATPESSGSEVEFSHEYWMRHALTLAKRARDEREVP
VGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDAT
LYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHR
VEITEGILADECAALLCYFFRMPREDNEQKQLFVEQHKHYLDEIIEQISE
FSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFK
YFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD

110.3 Cas9 TadAins 1250
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGA
LLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHR
LEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKAD
LRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENP
INASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTP
NFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAI
LLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEI
FFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLR
KQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPY
YVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDK
NLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVD
LLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKI
IKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQ
LKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDD
SLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKV
MGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHP
VENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDD
SIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNL
TKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLI
REVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKK
YPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEI
TLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEV
QTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVE
KGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPK
YSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPG
SSGSSGSETPGTSESATPESGSSSGSEVEFSHEYWMRHALTLAKRARDER
EVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLI
DATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGM
NHRVEITEGILADECAALLCYFFRMPREDNEQKQLFVEQHKHYLDEIIEQ
ISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPA
AFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD

110.4 Cas9 TadAins 1250
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGA
LLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHR
LEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKAD
LRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENP
INASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTP
NFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAI
LLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEI
FFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLR
KQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPY
YVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDK
NLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVD
LLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKI
IKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQ
LKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDD
SLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKV
MGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHP
VENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDD
SIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNL
TKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLI
REVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKK
YPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEI
TLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEV
QTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVE
KGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPK
YSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPG
SSGSSGSETPGTSESATPESGSSSGSEVEFSHEYWMRHALTLAKRARDER
EVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLI
DATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGM
NHRVEITEGILADECAALLCYFFRMRREDNEQKQLFVEQHKHYLDEIIEQ
ISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPA
AFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD

110.5 Cas9 TadAins 1249
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGA
LLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHR
LEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKAD
LRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENP
INASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTP
NFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAI
LLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEI
FFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLR
KQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPY
YVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDK
NLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVD
LLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKI
IKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQ
LKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDD
SLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKV
MGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHP
VENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDD
SIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNL
TKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLI
REVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKK
YPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEI
TLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEV
QTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVE
KGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPK
YSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSGS
SGSSGSETPGTSESATPESGSSSGSEVEFSHEYWMRHALTLAKRARDERE
VPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLID
ATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMN
HRVEITEGILADECAALLCYFFRMRRPEDNEQKQLFVEQHKHYLDEIIEQ
ISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPA
AFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD

110.5 Cas9 TadAins delta 59-66 1250
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGA
LLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHR
LEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKAD
LRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENP
INASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTP
NFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAI
LLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEI
FFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLR
KQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPY
YVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDK
NLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVD
LLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKI
IKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQ
LKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDD
SLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKV
MGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHP
VENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDD
SIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNL
TKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLI
REVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKK
YPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEI
TLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEV
QTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVE
KGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPK
YSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPG
SSGSSGSETPGTSESATPESGSSGSEVEFSHEYWMRHALTLAKRARDERE
VPVGAVLVLNNRVIGEGWNRAHAEIMALRQGGLVMQNYRLIDATLYVTFE
PCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEG
ILADECAALLCYFFRMPRQVFNAQKKAQSSTDEDNEQKQLFVEQHKHYLD
EIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTN
LGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGG
D

110.6 Cas9 TadAins 1251
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGA
LLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHR
LEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKAD
LRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENP
INASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTP
NFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAI
LLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEI
FFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLR
KQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPY
YVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDK
NLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVD
LLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKI
IKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQ
LKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDD
SLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKV
MGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHP
VENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDD
SIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNL
TKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLI
REVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKK
YPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEI
TLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEV
QTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVE
KGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPK
YSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPE
GSSGSSGSETPGTSESATPESGSSSGSEVEFSHEYWMRHALTLAKRARDE
REVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRL
IDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPG
MNHRVEITEGILADECAALLCYFFRMRRDNEQKQLFVEQHKHYLDEIIEQ
ISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPA
AFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD

110.7 Cas9 TadAins 1252
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGA
LLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHR
LEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKAD
LRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENP
INASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTP
NFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAI
LLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEI
FFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLR
KQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPY
YVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDK
NLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVD
LLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKI
IKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQ
LKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDD
SLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKV
MGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHP
VENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDD
SIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNL
TKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLI
REVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKK
YPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEI
TLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEV
QTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVE
KGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPK
YSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPE
DGSSGSSGSETPGTSESATPESGSSSGSEVEFSHEYWMRHALTLAKRARD
EREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYR
LIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYP
GMNHRVEITEGILADECAALLCYFFRMRRNEQKQLFVEQHKHYLDEIIEQ
ISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPA
AFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD

110.8 Cas9 TadAins delta 59-66 C-truncate 1250
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGA
LLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHR
LEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKAD
LRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENP
INASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTP
NFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAI
LLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEI
FFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLR
KQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPY
YVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDK
NLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVD
LLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKI
IKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQ
LKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDD
SLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKV
MGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHP
VENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDD
SIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNL
TKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLI
REVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKK
YPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEI
TLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEV
QTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVE
KGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPK
YSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPG
SSGSETPGTSESATPESSGSEVEFSHEYWMRHALTLAKRARDEREVPVGA
VLVLNNRVIGEGWNRAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMC
AGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADE
CAALLCYFFRMPRQEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADA
NLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKR
YTSTKEVLDATLIHQSITGLYETRIDLSQLGGD

111.1 Cas9 TadAins 997
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGA
LLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHR
LEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKAD
LRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENP
INASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTP
NFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAI
LLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEI
FFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLR
KQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPY
YVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDK
NLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVD
LLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKI
IKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQ
LKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDD
SLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKV
MGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHP
VENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDD
SIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNL
TKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLI
REVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALSHE
YWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAE
IMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNA
KTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPRQVFNAQ
KKAQSSTDGSSGSETPGTSESATPESSGIKKYPKLESEFVYGDYKVYDVR
KMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGET
GEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKL
IARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIM
ERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGE
LQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEI
IEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLG
APAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD

111.2 Cas9 TadAins 997
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGA
LLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHR
LEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKAD
LRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENP
INASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTP
NFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAI
LLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEI
FFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLR
KQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPY
YVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDK
NLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVD
LLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKI
IKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQ
LKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDD
SLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKV
MGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHP
VENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDD
SIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNL
TKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLI
REVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALSHE
YWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAE
IMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNA
KTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPRQVFNAQ
KKAQSSTDGSSGSSGSETPGTSESATPESSGGSSIKKYPKLESEFVYGDY
KVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLI
ETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPK
RNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKEL
LGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRM
LASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHK
HYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLF
TLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLS
QLGGD

112 delta HNH TadA
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGA
LLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHR
LEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKAD
LRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENP
INASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTP
NFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAI
LLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEI
FFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLR
KQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPY
YVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDK
NLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVD
LLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKI
IKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQ
LKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDD
SLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKV
MGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSEVEFSHE
YWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAE
IMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNA
KTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPRQVFNAQ
KKAQSSTDGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDEND
KLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTAL
IKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFK
TEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKK
TEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVA
KVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIK
LPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKG
SPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKH
RDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATL
IHQSITGLYETRIDLSQLGGD

113 N-term single TadA helix trunc 165-end
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIG
LHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIG
RVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFR
MPRSGGSSGGSSGSETPGTSESATPESSGGSSGGSDKKYSIGLAIGTNSV
GWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKR
TARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERH
PIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRG
HFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARL
SKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQL
SKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAP
LSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGG
ASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHL
GELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMT
RKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYE
YFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKE
DYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDIL
EDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKL
INGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQ
GDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARE
NQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYL
QNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGK
SDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGF
IKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDF
RKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVY
DVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETN
GETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNS
DKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGI
TIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLAS
AGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYL
DEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLT
NLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLG
GD

114 N-term single TadA helix trunc 165-end delta 59-65
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRTAH
AEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVR
NAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPRSGGS
SGGSSGSETPGTSESATPESSGGSSGGSDKKYSIGLAIGTNSVGWAVITD
EYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYT
RRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIV
DEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGD
LNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLE
NLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDD
DLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIK
RYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFY
KFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAIL
RRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETI
TPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNE
LTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIE
CFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTL
TLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDK
QSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEH
IANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKG
QKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMY
VDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSE
EVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVE
TRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFY
KVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIA
KSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIV
WDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARK
KDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSS
FEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKG
NELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQI
SEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAA
FKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD

115.1 Cas9 TadAins1004
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGA
LLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHR
LEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKAD
LRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENP
INASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTP
NFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAI
LLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEI
FFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLR
KQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPY
YVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDK
NLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVD
LLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKI
IKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQ
LKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDD
SLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKV
MGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHP
VENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDD
SIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNL
TKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLI
REVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKK
YPKGSSGSETPGTSESATPESSGSEVEFSHEYWMRHALTLAKRARDEREV
PVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDA
TLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNH
RVEITEGILADECAALLCYFFRMPRQLESEFVYGDYKVYDVRKMIAKSEQ
EIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKG
RDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWD
PKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKN
PIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELA
LPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFS
KRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYF
DTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD

115.2 Cas9 TadAins1005
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGA
LLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHR
LEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKAD
LRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENP
INASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTP
NFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAI
LLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEI
FFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLR
KQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPY
YVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDK
NLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVD
LLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKI
IKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQ
LKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDD
SLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKV
MGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHP
VENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDD
SIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNL
TKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLI
REVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKK
YPKLGSSGSETPGTSESATPESSGSEVEFSHEYWMRHALTLAKRARDERE
VPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLID
ATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMN
HRVEITEGILADECAALLCYFFRMPRQESEFVYGDYKVYDVRKMIAKSEQ
EIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKG
RDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWD
PKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKN
PIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELA
LPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFS
KRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYF
DTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD

115.3 Cas9 TadAins1006
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGA
LLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHR
LEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKAD
LRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENP
INASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTP
NFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAI
LLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEI
FFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLR
KQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPY
YVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDK
NLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVD
LLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKI
IKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQ
LKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDD
SLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKV
MGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHP
VENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDD
SIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNL
TKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLI
REVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKK
YPKLEGSSGSETPGTSESATPESSGSEVEFSHEYWMRHALTLAKRARDER
EVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLI
DATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGM
NHRVEITEGILADECAALLCYFFRMPRQSEFVYGDYKVYDVRKMIAKSEQ
EIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKG
RDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWD
PKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKN
PIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELA
LPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFS
KRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYF
DTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD

115.4 Cas9 TadAins1007
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGA
LLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHR
LEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKAD
LRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENP
INASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTP
NFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAI
LLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEI
FFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLR
KQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPY
YVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDK
NLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVD
LLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKI
IKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQ
LKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDD
SLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKV
MGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHP
VENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDD
SIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNL
TKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLI
REVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKK
YPKLESGSSGSETPGTSESATPESSGSEVEFSHEYWMRHALTLAKRARDE
REVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRL
IDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPG
MNHRVEITEGILADECAALLCYFFRMPRQEFVYGDYKVYDVRKMIAKSEQ
EIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKG
RDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWD
PKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKN
PIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELA
LPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFS
KRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYF
DTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD

116.1 Cas9 TadAins C-term truncate2 792
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGA
LLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHR
LEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKAD
LRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENP
INASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTP
NFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAI
LLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEI
FFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLR
KQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPY
YVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDK
NLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVD
LLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKI
IKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQ
LKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDD
SLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKV
MGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGGSSGSETP
GTSESATPESSGSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNR
VIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVM
CAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILAD
ECAALLCYFFRMPRQSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQE
LDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVK
KMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQI
TKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVRE
INNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQ
EIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKG
RDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWD
PKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKN
PIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELA
LPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFS
KRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYF
DTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD

116.2 Cas9 TadAins C-term truncate2 791
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGA
LLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHR
LEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKAD
LRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENP
INASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTP
NFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAI
LLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEI
FFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLR
KQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPY
YVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDK
NLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVD
LLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKI
IKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQ
LKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDD
SLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKV
MGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSSGSETPG
TSESATPESSGSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRV
IGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMC
AGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADE
CAALLCYFFRMPRQGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQE
LDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVK
KMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQI
TKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVRE
INNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQ
EIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKG
RDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWD
PKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKN
PIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELA
LPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFS
KRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYF
DTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD

116.3 Cas9 TadAins C-term truncate2 790
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGA
LLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHR
LEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKAD
LRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENP
INASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTP
NFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAI
LLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEI
FFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLR
KQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPY
YVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDK
NLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVD
LLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKI
IKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQ
LKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDD
SLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKV
MGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKEGSSGSETPGT
SESATPESSGSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVI
GEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCA
GAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADEC
AALLCYFFRMPRQLGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQE
LDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVK
KMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQI
TKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVRE
INNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQ
EIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKG
RDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWD
PKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKN
PIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELA
LPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFS
KRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYF
DTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD

117 Cas9 delta 1017-1069
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGA
LLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHR
LEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKAD
LRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENP
INASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTP
NFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAI
LLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEI
FFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLR
KQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPY
YVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDK
NLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVD
LLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKI
IKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQ
LKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDD
SLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKV
MGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHP
VENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDD
SIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNL
TKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLI
REVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKK
YPKLESEFVYGDYKVYSSGSEVEFSHEYWMRHALTLAKRARDEREVPVGA
VLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYV
TFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEI
TEGILADECAALLCYFFRMPRQVFNAQKKAQSSTDGEIVWDKGRDFATVR
KVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGF
DSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEA
KGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVN
FLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILAD
ANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRK
RYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD

118 Cas9 TadA-CP116ins 1067
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGA
LLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHR
LEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKAD
LRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENP
INASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTP
NFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAI
LLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEI
FFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLR
KQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPY
YVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDK
NLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVD
LLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKI
IKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQ
LKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDD
SLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKV
MGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHP
VENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDD
SIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNL
TKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLI
REVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKK
YPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEI
TLANGEIRKRPLIETNMNHRVEITEGILADECAALLCYFFRMPRQVFNAQ
KKAQSSTDGSSGSETPGTSESATPESSGSEVEFSHEYWMRHALTLAKRAR
DEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNY
RLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHY
PGGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKR
NSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELL
GITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRML
ASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKH
YLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFT
LTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQ
LGGD

119 Cas9 TadAins 701
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGA
LLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHR
LEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKAD
LRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENP
INASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTP
NFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAI
LLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEI
FFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLR
KQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPY
YVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDK
NLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVD
LLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKI
IKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQ
LKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDD
SGSSGSETPGTSESATPESSGSEVEFSHEYWMRHALTLAKRARDEREVPV
GAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATL
YVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRV
EITEGILADECAALLCYFFRMPRQVFNAQKKAQSSTDLTFKEDIQKAQVS
GQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMA
RENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLY
YLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNR
GKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKA
GFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVS
DFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYK
VYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIE
TNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKR
NSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELL
GITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRML
ASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKH
YLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFT
LTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQ
LGGD

120 Cas9 TadACP136ins 1248
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGA
LLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHR
LEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKAD
LRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENP
INASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTP
NFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAI
LLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEI
FFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLR
KQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPY
YVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDK
NLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVD
LLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKI
IKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQ
LKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDD
SLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKV
MGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHP
VENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDD
SIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNL
TKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLI
REVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKK
YPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEI
TLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEV
QTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVE
KGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPK
YSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSMN
HRVEITEGILADECAALLCYFFRMPRQVFNAQKKAQSSTDGSSGSETPGT
SESATPESSGSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVI
GEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCA
GAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGPEDNEQKQLFVEQHKH
YLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFT
LTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQ
LGGD

121 Cas9 TadACP136ins 1052
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGA
LLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHR
LEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKAD
LRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENP
INASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTP
NFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAI
LLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEI
FFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLR
KQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPY
YVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDK
NLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVD
LLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKI
IKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQ
LKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDD
SLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKV
MGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHP
VENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDD
SIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNL
TKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLI
REVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKK
YPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEI
TLAMNHRVEITEGILADECAALLCYFFRMPRQVFNAQKKAQSSTDGSSGS
ETPGTSESATPESSGSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVL
NNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEP
CVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGNGEIRKRPLIE
TNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKR
NSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELL
GITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRML
ASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKH
YLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFT
LTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQ
LGGD

122 Cas9 TadACP136ins 1041
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGA
LLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHR
LEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKAD
LRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENP
INASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTP
NFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAI
LLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEI
FFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLR
KQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPY
YVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDK
NLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVD
LLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKI
IKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQ
LKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDD
SLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKV
MGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHP
VENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDD
SIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNL
TKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLI
REVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKK
YPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSMNHRVEITEG
ILADECAALLCYFFRMPRQVFNAQKKAQSSTDGSSGSETPGTSESATPES
SGSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAI
GLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRI
GRVVFGVRNAKTGAAGSLMDVLHYPGNIMNFFKTEITLANGEIRKRPLIE
TNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKR
NSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELL
GITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRML
ASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKH
YLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFT
LTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQ
LGGD

123 Cas9 TadACP139ins 1299
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGA
LLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHR
LEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKAD
LRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENP
INASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTP
NFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAI
LLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEI
FFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLR
KQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPY
YVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDK
NLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVD
LLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKI
IKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQ
LKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDD
SLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKV
MGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHP
VENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDD
SIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNL
TKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLI
REVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKK
YPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEI
TLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEV
QTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVE
KGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPK
YSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPE
DNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRMN
HRVEITEGILADECAALLCYFFRMPRQVFNAQKKAQSSTDGSSGSETPGT
SESATPESSGSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVI
GEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCA
GAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGDKPIREQAENIIHLFT
LTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQ
LGGD

124 Cas9 delta 792-872 TadAins
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGA
LLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHR
LEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKAD
LRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENP
INASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTP
NFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAI
LLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEI
FFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLR
KQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPY
YVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDK
NLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVD
LLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKI
IKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQ
LKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDD
SLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKV
MGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSEVEFSHE
YWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAE
IMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNA
KTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPRQVFNAQ
KKAQSSTDEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKA
GFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVS
DFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYK
VYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIE
TNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKR
NSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELL
GITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRML
ASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKH
YLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFT
LTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQ
LGGD

125 Cas9 delta 792-906 TadAins
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGA
LLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHR
LEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKAD
LRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENP
INASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTP
NFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAI
LLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEI
FFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLR
KQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPY
YVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDK
NLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVD
LLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKI
IKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQ
LKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDD
SLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKV
MGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSEVEFSHE
YWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAE
IMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNA
KTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPRQVFNAQ
KKAQSSTDGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDK
LIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALI
KKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKT
EITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKT
EVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAK
VEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKL
PKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGS
PEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHR
DKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLI
HQSITGLYETRIDLSQLGGD

126 TadA CP65ins 1003
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGA
LLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHR
LEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKAD
LRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENP
INASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTP
NFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAI
LLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEI
FFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLR
KQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPY
YVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDK
NLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVD
LLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKI
IKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQ
LKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDD
SLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKV
MGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHP
VENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDD
SIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNL
TKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLI
REVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKK
YPKTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGR
VVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRM
PRQVFNAQKKAQSSTDGSSGSETPGTSESATPESSGSEVEFSHEYWMRHA
LTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPLESEFVYGDYK
VYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIE
TNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKR
NSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELL
GITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRML
ASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKH
YLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFT
LTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQ
LGGD

127 TadA CP65ins 1016
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGA
LLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHR
LEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKAD
LRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENP
INASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTP
NFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAI
LLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEI
FFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLR
KQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPY
YVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDK
NLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVD
LLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKI
IKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQ
LKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDD
SLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKV
MGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHP
VENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDD
SIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNL
TKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLI
REVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKK
YPKLESEFVYGDYKVTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVM
CAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILAD
ECAALLCYFFRMPRQVFNAQKKAQSSTDGSSGSETPGTSESATPESSGSE
VEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHD
PYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIE
TNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKR
NSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELL
GITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRML
ASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKH
YLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFT
LTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQ
LGGD

128 TadA CP65ins 1022
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGA
LLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHR
LEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKAD
LRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENP
INASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTP
NFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAI
LLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEI
FFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLR
KQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPY
YVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDK
NLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVD
LLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKI
IKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQ
LKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDD
SLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKV
MGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHP
VENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDD
SIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNL
TKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLI
REVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKK
YPKLESEFVYGDYKVYDVRKMITAHAEIMALRQGGLVMQNYRLIDATLYV
TFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEI
TEGILADECAALLCYFFRMPRQVFNAQKKAQSSTDGSSGSETPGTSESAT
PESSGSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWN
RAIGLHDPAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIE
TNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKR
NSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELL
GITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRML
ASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKH
YLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFT
LTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQ
LGGD

129 TadA CP65ins 1029
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGA
LLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHR
LEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKAD
LRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENP
INASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTP
NFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAI
LLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEI
FFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLR
KQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPY
YVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDK
NLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVD
LLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKI
IKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQ
LKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDD
SLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKV
MGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHP
VENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDD
SIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNL
TKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLI
REVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKK
YPKLESEFVYGDYKVYDVRKMIAKSEQEITAHAEIMALRQGGLVMQNYRL
IDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPG
MNHRVEITEGILADECAALLCYFFRMPRQVFNAQKKAQSSTDGSSGSETP
GTSESATPESSGSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNR
VIGEGWNRAIGLHDPGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIE
TNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKR
NSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELL
GITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRML
ASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKH
YLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFT
LTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQ
LGGD

130 TadA CP65ins 1041
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGA
LLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHR
LEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKAD
LRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENP
INASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTP
NFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAI
LLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEI
FFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLR
KQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPY
YVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDK
NLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVD
LLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKI
IKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQ
LKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDD
SLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKV
MGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHP
VENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDD
SIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNL
TKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLI
REVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKK
YPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSTAHAEIMALR
QGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAA
GSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPRQVFNAQKKAQS
STDGSSGSETPGTSESATPESSGSEVEFSHEYWMRHALTLAKRARDEREV
PVGAVLVLNNRVIGEGWNRAIGLHDPNIMNFFKTEITLANGEIRKRPLIE
TNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKR
NSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELL
GITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRML
ASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKH
YLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFT
LTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQ
LGGD

131 TadA CP65ins 1054
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGA
LLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHR
LEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKAD
LRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENP
INASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTP
NFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAI
LLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEI
FFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLR
KQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPY
YVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDK
NLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVD
LLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKI
IKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQ
LKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDD
SLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKV
MGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHP
VENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDD
SIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNL
TKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLI
REVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKK
YPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEI
TLANTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIG
RVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFR
MPRQVFNAQKKAQSSTDGSSGSETPGTSESATPESSGSEVEFSHEYWMRH
ALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPGEIRKRPLIE
TNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKR
NSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELL
GITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRML
ASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKH
YLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFT
LTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQ
LGGD

132 TadA CP65ins 1246
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGA
LLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHR
LEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKAD
LRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENP
INASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTP
NFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAI
LLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEI
FFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLR
KQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPY
YVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDK
NLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVD
LLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKI
IKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQ
LKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDD
SLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKV
MGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHP
VENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDD
SIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNL
TKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLI
REVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKK
YPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEI
TLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEV
QTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVE
KGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPK
YSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGTAH
AEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVR
NAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPRQVFN
AQKKAQSSTDGSSGSETPGTSESATPESSGSEVEFSHEYWMRHALTLAKR
ARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPSPEDNEQKQLFVEQHKH
YLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFT
LTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQ
LGGD

したがって、いくつかの実施形態において、Cas9ポリペプチドの同定された位置においてTadAまたはそのバリアントを挿入するアデノシンデアミナーゼ塩基エディターが生成された。

［CからTへの編集］
いくつかの実施形態において、本明細書に開示される塩基エディターは、ポリヌクレオチドの標的シチジン（C）塩基を脱アミノ化して、チミンの塩基対形成特性を有するウリジン（U）を生成することができる、シチジンデアミナーゼを含む融合タンパク質を含む。いくつかの実施形態において、例えば、ポリヌクレオチドが二本鎖（例えば、DNA）である場合、ウリジン塩基は（例えば細胞修復機構によって）チミジン塩基で置換されて、C:GからT:Aへの遷移を生じさせる。他の実施形態では、塩基エディターによる核酸中のCからUへの脱アミノ化は、UからTへの置換を伴うことができない。

ポリヌクレオチド中の標的Cを脱アミノ化してUを生じさせることは、本明細書に記載の塩基エディターによって実行することができるタイプの塩基編集の非限定的な例である。別の例において、シチジンデアミナーゼドメインを含む塩基エディターは、シチジン (C) 塩基からグアニン (G) 塩基への変換を媒介することができる。例えば、塩基エディターのシチジンデアミナーゼドメインによるシチジンの脱アミノ化によって生成されたポリヌクレオチドのUは、塩基除去修復機構(例えばウラシルDNAグリコシラーゼ (UDG) ドメインによるもの)によってポリヌクレオチドから切り出され、脱塩基部位を生成することができる。次に、脱塩基部位の反対側の核酸塩基が、Cのような別の塩基で置換され得(例えば塩基修復機構により)、例えばこれは損傷乗り越えポリメラーゼによって行われる。脱塩基部位の反対側の核酸塩基がCで置換されるのが典型的であるが、他の置換(例えばA、G、T)も起こりうる。

従って、いくつかの実施形態において、本明細書に記載される塩基エディターは、ポリヌクレオチド中の標的Cを脱アミノ化してUにすることができる脱アミノ化ドメインあるいはデアミナーゼドメイン（例えばシチジンデアミナーゼドメイン）を含む。さらに、以下に記載するように、塩基エディターは、脱アミノ化から生じるUの、ある態様においてはTまたはGへの、変換を促進させるさらなるドメインを含むことができる。例えば、シチジンデアミナーゼドメインを含む塩基エディターは、さらにウラシルグリコシラーゼ阻害因子 (UGI) ドメインを含み、TによるUの置換を媒介し、CからTへの塩基編集事象を完了することができる。損傷乗り越えポリメラーゼは脱塩基部位の反対側でCの取り込みを促進することができるので（すなわち脱塩基部位でのGの取り込みをもたらし、CからGへの塩基編集事象を完了する）、別の例では塩基エディターは損傷乗り越えポリメラーゼを組み込んで、CからGへの塩基編集の効率を改善させることができる。いくつかの実施形態では、追加のドメインが、デアミナーゼドメインと共に内部的に融合されている。

ドメインとしてシチジンデアミナーゼを含む塩基エディターは、DNA、RNAおよびDNA-RNAハイブリッドを含む任意のポリヌクレオチドにおいて標的Cを脱アミノ化することができる。典型的には、シチジンデアミナーゼは、ポリヌクレオチドの一本鎖部分の文脈に配置されるC核酸塩基を触媒する。ある態様において、標的Cを含むポリヌクレオチド全体が一本鎖であり得る。例えば、塩基エディターに組み込まれたシチジンデアミナーゼは、一本鎖RNAポリヌクレオチド中の標的Cを脱アミノ化することができる。他の実施形態において、シチジンデアミナーゼドメインを含む塩基エディターは、二本鎖ポリヌクレオチドに作用することができるが、標的Cは、脱アミノ化反応の時点で一本鎖状態になるポリヌクレオチドの一部に位置し得る。例えば、napDNAbpドメインがCas12ドメインを含む実施形態において、いくつかのヌクレオチドは、Cas12-gRNA-標的DNA複合体の形成の際に対合しないままにしておくことができ、その結果、Cas12「Rループ複合体」が形成される。これらの不対ヌクレオチドは、一本鎖特異的ヌクレオチドデアミナーゼ酵素(例えばシチジンデアミナーゼ)の基質として作用し得る一本鎖DNAのバブルを形成することができる。

ある態様において、塩基エディターのシチジンデアミナーゼは、アポリポタンパク質B mRNA編集複合体 (APOBEC) ファミリーデアミナーゼの全部または一部を含むことができる。APOBECファミリーは進化的に保存されたシチジンデアミナーゼを含む。このファミリーのメンバーはCからUへの編集酵素である。APOBEC様タンパク質のN末端ドメインは触媒ドメインであり、C末端ドメインは偽触媒ドメインである。より具体的には、触媒ドメインは亜鉛依存性のシチジンデアミナーゼドメインであり、シチジンの脱アミノ化にとって重要である。APOBECファミリーメンバーには、APOBEC1、APOBEC2、APOBEC3A、APOBEC3B、APOBEC3C、APOBEC3D（今では「APOBEC3E」と呼ばれる）、APOBEC3F、APOBEC3G、APOBEC3H、APOBEC4、および活性化誘導 (シチジン) デアミナーゼ（AID）が含まれる。SaBE3、SaKKH-BE3、VQR-BE3、EQR-BE3、VRER-BE3、YE1-BE3、EE-BE3、YE2-BE3、およびYEE-BE3を含むがこれらに限定されない多くの改変シチジンデアミナーゼを含む塩基エディターが市販されており、これらはAddgeneから入手可能である（プラスミド85169、85170、85171、85172、85173、85174、85175、85176、85177）。一部の実施形態では、塩基エディターに組み込まれたデアミナーゼは、APOBEC1デアミナーゼの全部または一部を含む。一部の実施形態では、塩基エディターに組み込まれたデアミナーゼは、APOBEC2デアミナーゼの全部または一部を含む。一部の実施形態では、塩基エディターに組み込まれたデアミナーゼは、APOBEC3デアミナーゼの全部または一部を含む。一部の実施形態では、塩基エディターに組み込まれたデアミナーゼは、APOBEC3Aデアミナーゼの全部または一部を含む。一部の実施形態では、塩基エディターに組み込まれたデアミナーゼは、APOBEC3Bデアミナーゼの全部または一部を含む。一部の実施形態では、塩基エディターに組み込まれたデアミナーゼは、APOBEC3Cデアミナーゼの全部または一部を含む。一部の実施形態では、塩基エディターに組み込まれたデアミナーゼは、APOBEC3Dデアミナーゼの全部または一部を含む。一部の実施形態では、塩基エディターに組み込まれたデアミナーゼは、APOBEC3Eデアミナーゼの全部または一部を含む。一部の実施形態では、塩基エディターに組み込まれたデアミナーゼは、APOBEC3Fデアミナーゼの全部または一部を含む。一部の実施形態では、塩基エディターに組み込まれたデアミナーゼは、APOBEC3Gデアミナーゼの全部または一部を含む。一部の実施形態では、塩基エディターに組み込まれたデアミナーゼは、APOBEC3Hデアミナーゼの全部または一部を含む。一部の実施形態では、塩基エディターに組み込まれたデアミナーゼは、APOBEC4デアミナーゼの全部または一部を含む。ある態様において、塩基エディターに組み込まれたデアミナーゼは、活性化誘導デアミナーゼ (AID) の全部または一部を含む。

ある実施形態において、塩基エディターに組み込まれたデアミナーゼは、活性化誘導デアミナーゼ (AID) の全部または一部を含む。ある態様において、塩基エディターに組み込まれたデアミナーゼは、シチジンデアミナーゼ1 (CDA1) の全部または一部を含む。塩基エディターは、任意の適切な生物（例えば、ヒトまたはラット）からのデアミナーゼを含むことができることが理解されるであろう。いくつかの実施形態において、塩基エディターのデアミナーゼドメインは、ヒト、チンパンジー、ゴリラ、サル、ウシ、イヌ、ラット、またはマウスに由来する。いくつかの実施形態において、塩基エディターのデアミナーゼドメインは、ラットに由来する（例えば、ラットAPOBEC1）。いくつかの実施形態において、塩基エディターのデアミナーゼドメインは、ヒトAPOBEC1である。いくつかの実施形態において、塩基エディターのデアミナーゼドメインは、pmCDA1である。

PmCDA1の塩基配列とアミノ酸配列、およびヒトAIDのCDSの塩基配列とアミノ酸配列を以下に示す。

>tr|A5H718|A5H718_PETMA Cytosine deaminase OS=Petromyzon marinus OX=7757 PE=2 SV=1
MTDAEYVRIHEKLDIYTFKKQFFNNKKSVSHRCYVLFELKRRGERRACFWGYAVNKPQSGTERGIHAEIFSIRKVEEYLRDNPGQFTINWYSSWSPCADCAEKILEWYNQELRGNGHTLKIWACKLYYEKNARNQIGLWNLRDNGVGLNVMVSEHYQCCRKIFIQSSHNQLNENRWLEKTLKRAEKRRSELSIMIQVKILHTTKSPAV

>EF094822.1 Petromyzon marinus isolate PmCDA.21 cytosine deaminase mRNA, complete cds
TGACACGACACAGCCGTGTATATGAGGAAGGGTAGCTGGATGGGGGGGGGGGGAATACGTTCAGAGAGGACATTAGCGAGCGTCTTGTTGGTGGCCTTGAGTCTAGACACCTGCAGACATGACCGACGCTGAGTACGTGAGAATCCATGAGAAGTTGGACATCTACACGTTTAAGAAACAGTTTTTCAACAACAAAAAATCCGTGTCGCATAGATGCTACGTTCTCTTTGAATTAAAACGACGGGGTGAACGTAGAGCGTGTTTTTGGGGCTATGCTGTGAATAAACCACAGAGCGGGACAGAACGTGGAATTCACGCCGAAATCTTTAGCATTAGAAAAGTCGAAGAATACCTGCGCGACAACCCCGGACAATTCACGATAAATTGGTACTCATCCTGGAGTCCTTGTGCAGATTGCGCTGAAAAGATCTTAGAATGGTATAACCAGGAGCTGCGGGGGAACGGCCACACTTTGAAAATCTGGGCTTGCAAACTCTATTACGAGAAAAATGCGAGGAATCAAATTGGGCTGTGGAACCTCAGAGATAACGGGGTTGGGTTGAATGTAATGGTAAGTGAACACTACCAATGTTGCAGGAAAATATTCATCCAATCGTCGCACAATCAATTGAATGAGAATAGATGGCTTGAGAAGACTTTGAAGCGAGCTGAAAAACGACGGAGCGAGTTGTCCATTATGATTCAGGTAAAAATACTCCACACCACTAAGAGTCCTGCTGTTTAAGAGGCTATGCGGATGGTTTTC

>tr|Q6QJ80|Q6QJ80_HUMAN Activation-induced cytidine deaminase OS=Homo sapiens OX=9606 GN=AICDA PE=2 SV=1
MDSLLMNRRKFLYQFKNVRWAKGRRETYLCYVVKRRDSATSFSLDFGYLRNKNGCHVELLFLRYISDWDLDPGRCYRVTWFTSWSPCYDCARHVADFLRGNPNLSLRIFTARLYFCEDRKAEPEGLRRLHRAGVQIAIMTFKAPV

>NG_011588.1:5001-15681 Homo sapiens activation induced cytidine deaminase (AICDA), RefSeqGene (LRG_17) on chromosome 12
AGAGAACCATCATTAATTGAAGTGAGATTTTTCTGGCCTGAGACTTGCAGGGAGGCAAGAAGACACTCTGGACACCACTATGGACAGGTAAAGAGGCAGTCTTCTCGTGGGTGATTGCACTGGCCTTCCTCTCAGAGCAAATCTGAGTAATGAGACTGGTAGCTATCCCTTTCTCTCATGTAACTGTCTGACTGATAAGATCAGCTTGATCAATATGCATATATATTTTTTGATCTGTCTCCTTTTCTTCTATTCAGATCTTATACGCTGTCAGCCCAATTCTTTCTGTTTCAGACTTCTCTTGATTTCCCTCTTTTTCATGTGGCAAAAGAAGTAGTGCGTACAATGTACTGATTCGTCCTGAGATTTGTACCATGGTTGAAACTAATTTATGGTAATAATATTAACATAGCAAATCTTTAGAGACTCAAATCATGAAAAGGTAATAGCAGTACTGTACTAAAAACGGTAGTGCTAATTTTCGTAATAATTTTGTAAATATTCAACAGTAAAACAACTTGAAGACACACTTTCCTAGGGAGGCGTTACTGAAATAATTTAGCTATAGTAAGAAAATTTGTAATTTTAGAAATGCCAAGCATTCTAAATTAATTGCTTGAAAGTCACTATGATTGTGTCCATTATAAGGAGACAAATTCATTCAAGCAAGTTATTTAATGTTAAAGGCCCAATTGTTAGGCAGTTAATGGCACTTTTACTATTAACTAATCTTTCCATTTGTTCAGACGTAGCTTAACTTACCTCTTAGGTGTGAATTTGGTTAAGGTCCTCATAATGTCTTTATGTGCAGTTTTTGATAGGTTATTGTCATAGAACTTATTCTATTCCTACATTTATGATTACTATGGATGTATGAGAATAACACCTAATCCTTATACTTTACCTCAATTTAACTCCTTTATAAAGAACTTACATTACAGAATAAAGATTTTTTAAAAATATATTTTTTTGTAGAGACAGGGTCTTAGCCCAGCCGAGGCTGGTCTCTAAGTCCTGGCCCAAGCGATCCTCCTGCCTGGGCCTCCTAAAGTGCTGGAATTATAGACATGAGCCATCACATCCAATATACAGAATAAAGATTTTTAATGGAGGATTTAATGTTCTTCAGAAAATTTTCTTGAGGTCAGACAATGTCAAATGTCTCCTCAGTTTACACTGAGATTTTGAAAACAAGTCTGAGCTATAGGTCCTTGTGAAGGGTCCATTGGAAATACTTGTTCAAAGTAAAATGGAAAGCAAAGGTAAAATCAGCAGTTGAAATTCAGAGAAAGACAGAAAAGGAGAAAAGATGAAATTCAACAGGACAGAAGGGAAATATATTATCATTAAGGAGGACAGTATCTGTAGAGCTCATTAGTGATGGCAAAATGACTTGGTCAGGATTATTTTTAACCCGCTTGTTTCTGGTTTGCACGGCTGGGGATGCAGCTAGGGTTCTGCCTCAGGGAGCACAGCTGTCCAGAGCAGCTGTCAGCCTGCAAGCCTGAAACACTCCCTCGGTAAAGTCCTTCCTACTCAGGACAGAAATGACGAGAACAGGGAGCTGGAAACAGGCCCCTAACCAGAGAAGGGAAGTAATGGATCAACAAAGTTAACTAGCAGGTCAGGATCACGCAATTCATTTCACTCTGACTGGTAACATGTGACAGAAACAGTGTAGGCTTATTGTATTTTCATGTAGAGTAGGACCCAAAAATCCACCCAAAGTCCTTTATCTATGCCACATCCTTCTTATCTATACTTCCAGGACACTTTTTCTTCCTTATGATAAGGCTCTCTCTCTCTCCACACACACACACACACACACACACACACACACACACACACACACAAACACACACCCCGCCAACCAAGGTGCATGTAAAAAGATGTAGATTCCTCTGCCTTTCTCATCTACACAGCCCAGGAGGGTAAGTTAATATAAGAGGGATTTATTGGTAAGAGATGATGCTTAATCTGTTTAACACTGGGCCTCAAAGAGAGAATTTCTTTTCTTCTGTACTTATTAAGCACCTATTATGTGTTGAGCTTATATATACAAAGGGTTATTATATGCTAATATAGTAATAGTAATGGTGGTTGGTACTATGGTAATTACCATAAAAATTATTATCCTTTTAAAATAAAGCTAATTATTATTGGATCTTTTTTAGTATTCATTTTATGTTTTTTATGTTTTTGATTTTTTAAAAGACAATCTCACCCTGTTACCCAGGCTGGAGTGCAGTGGTGCAATCATAGCTTTCTGCAGTCTTGAACTCCTGGGCTCAAGCAATCCTCCTGCCTTGGCCTCCCAAAGTGTTGGGATACAGTCATGAGCCACTGCATCTGGCCTAGGATCCATTTAGATTAAAATATGCATTTTAAATTTTAAAATAATATGGCTAATTTTTACCTTATGTAATGTGTATACTGGCAATAAATCTAGTTTGCTGCCTAAAGTTTAAAGTGCTTTCCAGTAAGCTTCATGTACGTGAGGGGAGACATTTAAAGTGAAACAGACAGCCAGGTGTGGTGGCTCACGCCTGTAATCCCAGCACTCTGGGAGGCTGAGGTGGGTGGATCGCTTGAGCCCTGGAGTTCAAGACCAGCCTGAGCAACATGGCAAAACGCTGTTTCTATAACAAAAATTAGCCGGGCATGGTGGCATGTGCCTGTGGTCCCAGCTACTAGGGGGCTGAGGCAGGAGAATCGTTGGAGCCCAGGAGGTCAAGGCTGCACTGAGCAGTGCTTGCGCCACTGCACTCCAGCCTGGGTGACAGGACCAGACCTTGCCTCAAAAAAATAAGAAGAAAAATTAAAAATAAATGGAAACAACTACAAAGAGCTGTTGTCCTAGATGAGCTACTTAGTTAGGCTGATATTTTGGTATTTAACTTTTAAAGTCAGGGTCTGTCACCTGCACTACATTATTAAAATATCAATTCTCAATGTATATCCACACAAAGACTGGTACGTGAATGTTCATAGTACCTTTATTCACAAAACCCCAAAGTAGAGACTATCCAAATATCCATCAACAAGTGAACAAATAAACAAAATGTGCTATATCCATGCAATGGAATACCACCCTGCAGTACAAAGAAGCTACTTGGGGATGAATCCCAAAGTCATGACGCTAAATGAAAGAGTCAGACATGAAGGAGGAGATAATGTATGCCATACGAAATTCTAGAAAATGAAAGTAACTTATAGTTACAGAAAGCAAATCAGGGCAGGCATAGAGGCTCACACCTGTAATCCCAGCACTTTGAGAGGCCACGTGGGAAGATTGCTAGAACTCAGGAGTTCAAGACCAGCCTGGGCAACACAGTGAAACTCCATTCTCCACAAAAATGGGAAAAAAAGAAAGCAAATCAGTGGTTGTCCTGTGGGGAGGGGAAGGACTGCAAAGAGGGAAGAAGCTCTGGTGGGGTGAGGGTGGTGATTCAGGTTCTGTATCCTGACTGTGGTAGCAGTTTGGGGTGTTTACATCCAAAAATATTCGTAGAATTATGCATCTTAAATGGGTGGAGTTTACTGTATGTAAATTATACCTCAATGTAAGAAAAAATAATGTGTAAGAAAACTTTCAATTCTCTTGCCAGCAAACGTTATTCAAATTCCTGAGCCCTTTACTTCGCAAATTCTCTGCACTTCTGCCCCGTACCATTAGGTGACAGCACTAGCTCCACAAATTGGATAAATGCATTTCTGGAAAAGACTAGGGACAAAATCCAGGCATCACTTGTGCTTTCATATCAACCATGCTGTACAGCTTGTGTTGCTGTCTGCAGCTGCAATGGGGACTCTTGATTTCTTTAAGGAAACTTGGGTTACCAGAGTATTTCCACAAATGCTATTCAAATTAGTGCTTATGATATGCAAGACACTGTGCTAGGAGCCAGAAAACAAAGAGGAGGAGAAATCAGTCATTATGTGGGAACAACATAGCAAGATATTTAGATCATTTTGACTAGTTAAAAAAGCAGCAGAGTACAAAATCACACATGCAATCAGTATAATCCAAATCATGTAAATATGTGCCTGTAGAAAGACTAGAGGAATAAACACAAGAATCTTAACAGTCATTGTCATTAGACACTAAGTCTAATTATTATTATTAGACACTATGATATTTGAGATTTAAAAAATCTTTAATATTTTAAAATTTAGAGCTCTTCTATTTTTCCATAGTATTCAAGTTTGACAATGATCAAGTATTACTCTTTCTTTTTTTTTTTTTTTTTTTTTTTTTGAGATGGAGTTTTGGTCTTGTTGCCCATGCTGGAGTGGAATGGCATGACCATAGCTCACTGCAACCTCCACCTCCTGGGTTCAAGCAAAGCTGTCGCCTCAGCCTCCCGGGTAGATGGGATTACAGGCGCCCACCACCACACTCGGCTAATGTTTGTATTTTTAGTAGAGATGGGGTTTCACCATGTTGGCCAGGCTGGTCTCAAACTCCTGACCTCAGAGGATCCACCTGCCTCAGCCTCCCAAAGTGCTGGGATTACAGATGTAGGCCACTGCGCCCGGCCAAGTATTGCTCTTATACATTAAAAAACAGGTGTGAGCCACTGCGCCCAGCCAGGTATTGCTCTTATACATTAAAAAATAGGCCGGTGCAGTGGCTCACGCCTGTAATCCCAGCACTTTGGGAAGCCAAGGCGGGCAGAACACCCGAGGTCAGGAGTCCAAGGCCAGCCTGGCCAAGATGGTGAAACCCCGTCTCTATTAAAAATACAAACATTACCTGGGCATGATGGTGGGCGCCTGTAATCCCAGCTACTCAGGAGGCTGAGGCAGGAGGATCCGCGGAGCCTGGCAGATCTGCCTGAGCCTGGGAGGTTGAGGCTACAGTAAGCCAAGATCATGCCAGTATACTTCAGCCTGGGCGACAAAGTGAGACCGTAACAAAAAAAAAAAAATTTAAAAAAAGAAATTTAGATCAAGATCCAACTGTAAAAAGTGGCCTAAACACCACATTAAAGAGTTTGGAGTTTATTCTGCAGGCAGAAGAGAACCATCAGGGGGTCTTCAGCATGGGAATGGCATGGTGCACCTGGTTTTTGTGAGATCATGGTGGTGACAGTGTGGGGAATGTTATTTTGGAGGGACTGGAGGCAGACAGACCGGTTAAAAGGCCAGCACAACAGATAAGGAGGAAGAAGATGAGGGCTTGGACCGAAGCAGAGAAGAGCAAACAGGGAAGGTACAAATTCAAGAAATATTGGGGGGTTTGAATCAACACATTTAGATGATTAATTAAATATGAGGACTGAGGAATAAGAAATGAGTCAAGGATGGTTCCAGGCTGCTAGGCTGCTTACCTGAGGTGGCAAAGTCGGGAGGAGTGGCAGTTTAGGACAGGGGGCAGTTGAGGAATATTGTTTTGATCATTTTGAGTTTGAGGTACAAGTTGGACACTTAGGTAAAGACTGGAGGGGAAATCTGAATATACAATTATGGGACTGAGGAACAAGTTTATTTTATTTTTTGTTTCGTTTTCTTGTTGAAGAACAAATTTAATTGTAATCCCAAGTCATCAGCATCTAGAAGACAGTGGCAGGAGGTGACTGTCTTGTGGGTAAGGGTTTGGGGTCCTTGATGAGTATCTCTCAATTGGCCTTAAATATAAGCAGGAAAAGGAGTTTATGATGGATTCCAGGCTCAGCAGGGCTCAGGAGGGCTCAGGCAGCCAGCAGAGGAAGTCAGAGCATCTTCTTTGGTTTAGCCCAAGTAATGACTTCCTTAAAAAGCTGAAGGAAAATCCAGAGTGACCAGATTATAAACTGTACTCTTGCATTTTCTCTCCCTCCTCTCACCCACAGCCTCTTGATGAACCGGAGGAAGTTTCTTTACCAATTCAAAAATGTCCGCTGGGCTAAGGGTCGGCGTGAGACCTACCTGTGCTACGTAGTGAAGAGGCGTGACAGTGCTACATCCTTTTCACTGGACTTTGGTTATCTTCGCAATAAGGTATCAATTAAAGTCGGCTTTGCAAGCAGTTTAATGGTCAACTGTGAGTGCTTTTAGAGCCACCTGCTGATGGTATTACTTCCATCCTTTTTTGGCATTTGTGTCTCTATCACATTCCTCAAATCCTTTTTTTTATTTCTTTTTCCATGTCCATGCACCCATATTAGACATGGCCCAAAATATGTGATTTAATTCCTCCCCAGTAATGCTGGGCACCCTAATACCACTCCTTCCTTCAGTGCCAAGAACAACTGCTCCCAAACTGTTTACCAGCTTTCCTCAGCATCTGAATTGCCTTTGAGATTAATTAAGCTAAAAGCATTTTTATATGGGAGAATATTATCAGCTTGTCCAAGCAAAAATTTTAAATGTGAAAAACAAATTGTGTCTTAAGCATTTTTGAAAATTAAGGAAGAAGAATTTGGGAAAAAATTAACGGTGGCTCAATTCTGTCTTCCAAATGATTTCTTTTCCCTCCTACTCACATGGGTCGTAGGCCAGTGAATACATTCAACATGGTGATCCCCAGAAAACTCAGAGAAGCCTCGGCTGATGATTAATTAAATTGATCTTTCGGCTACCCGAGAGAATTACATTTCCAAGAGACTTCTTCACCAAAATCCAGATGGGTTTACATAAACTTCTGCCCACGGGTATCTCCTCTCTCCTAACACGCTGTGACGTCTGGGCTTGGTGGAATCTCAGGGAAGCATCCGTGGGGTGGAAGGTCATCGTCTGGCTCGTTGTTTGATGGTTATATTACCATGCAATTTTCTTTGCCTACATTTGTATTGAATACATCCCAATCTCCTTCCTATTCGGTGACATGACACATTCTATTTCAGAAGGCTTTGATTTTATCAAGCACTTTCATTTACTTCTCATGGCAGTGCCTATTACTTCTCTTACAATACCCATCTGTCTGCTTTACCAAAATCTATTTCCCCTTTTCAGATCCTCCCAAATGGTCCTCATAAACTGTCCTGCCTCCACCTAGTGGTCCAGGTATATTTCCACAATGTTACATCAACAGGCACTTCTAGCCATTTTCCTTCTCAAAAGGTGCAAAAAGCAACTTCATAAACACAAATTAAATCTTCGGTGAGGTAGTGTGATGCTGCTTCCTCCCAACTCAGCGCACTTCGTCTTCCTCATTCCACAAAAACCCATAGCCTTCCTTCACTCTGCAGGACTAGTGCTGCCAAGGGTTCAGCTCTACCTACTGGTGTGCTCTTTTGAGCAAGTTGCTTAGCCTCTCTGTAACACAAGGACAATAGCTGCAAGCATCCCCAAAGATCATTGCAGGAGACAATGACTAAGGCTACCAGAGCCGCAATAAAAGTCAGTGAATTTTAGCGTGGTCCTCTCTGTCTCTCCAGAACGGCTGCCACGTGGAATTGCTCTTCCTCCGCTACATCTCGGACTGGGACCTAGACCCTGGCCGCTGCTACCGCGTCACCTGGTTCACCTCCTGGAGCCCCTGCTACGACTGTGCCCGACATGTGGCCGACTTTCTGCGAGGGAACCCCAACCTCAGTCTGAGGATCTTCACCGCGCGCCTCTACTTCTGTGAGGACCGCAAGGCTGAGCCCGAGGGGCTGCGGCGGCTGCACCGCGCCGGGGTGCAAATAGCCATCATGACCTTCAAAGGTGCGAAAGGGCCTTCCGCGCAGGCGCAGTGCAGCAGCCCGCATTCGGGATTGCGATGCGGAATGAATGAGTTAGTGGGGAAGCTCGAGGGGAAGAAGTGGGCGGGGATTCTGGTTCACCTCTGGAGCCGAAATTAAAGATTAGAAGCAGAGAAAAGAGTGAATGGCTCAGAGACAAGGCCCCGAGGAAATGAGAAAATGGGGCCAGGGTTGCTTCTTTCCCCTCGATTTGGAACCTGAACTGTCTTCTACCCCCATATCCCCGCCTTTTTTTCCTTTTTTTTTTTTTGAAGATTATTTTTACTGCTGGAATACTTTTGTAGAAAACCACGAAAGAACTTTCAAAGCCTGGGAAGGGCTGCATGAAAATTCAGTTCGTCTCTCCAGACAGCTTCGGCGCATCCTTTTGGTAAGGGGCTTCCTCGCTTTTTAAATTTTCTTTCTTTCTCTACAGTCTTTTTTGGAGTTTCGTATATTTCTTATATTTTCTTATTGTTCAATCACTCTCAGTTTTCATCTGATGAAAACTTTATTTCTCCTCCACATCAGCTTTTTCTTCTGCTGTTTCACCATTCAGAGCCCTCTGCTAAGGTTCCTTTTCCCTCCCTTTTCTTTCTTTTGTTGTTTCACATCTTTAAATTTCTGTCTCTCCCCAGGGTTGCGTTTCCTTCCTGGTCAGAATTCTTTTCTCCTTTTTTTTTTTTTTTTTTTTTTTTTTTAAACAAACAAACAAAAAACCCAAAAAAACTCTTTCCCAATTTACTTTCTTCCAACATGTTACAAAGCCATCCACTCAGTTTAGAAGACTCTCCGGCCCCACCGACCCCCAACCTCGTTTTGAAGCCATTCACTCAATTTGCTTCTCTCTTTCTCTACAGCCCCTGTATGAGGTTGATGACTTACGAGACGCATTTCGTACTTTGGGACTTTGATAGCAACTTCCAGGAATGTCACACACGATGAAATATCTCTGCTGAAGACAGTGGATAAAAAACAGTCCTTCAAGTCTTCTCTGTTTTTATTCTTCAACTCTCACTTTCTTAGAGTTTACAGAAAAAATATTTATATACGACTCTTTAAAAAGATCTATGTCTTGAAAATAGAGAAGGAACACAGGTCTGGCCAGGGACGTGCTGCAATTGGTGCAGTTTTGAATGCAACATTGTCCCCTACTGGGAATAACAGAACTGCAGGACCTGGGAGCATCCTAAAGTGTCAACGTTTTTCTATGACTTTTAGGTAGGATGAGAGCAGAAGGTAGATCCTAAAAAGCATGGTGAGAGGATCAAATGTTTTTATATCAACATCCTTTATTATTTGATTCATTTGAGTTAACAGTGGTGTTAGTGATAGATTTTTCTATTCTTTTCCCTTGACGTTTACTTTCAAGTAACACAAACTCTTCCATCAGGCCATGATCTATAGGACCTCCTAATGAGAGTATCTGGGTGATTGTGACCCCAAACCATCTCTCCAAAGCATTAATATCCAATCATGCGCTGTATGTTTTAATCAGCAGAAGCATGTTTTTATGTTTGTACAAAAGAAGATTGTTATGGGTGGGGATGGAGGTATAGACCATGCATGGTCACCTTCAAGCTACTTTAATAAAGGATCTTAAAATGGGCAGGAGGACTGTGAACAAGACACCCTAATAATGGGTTGATGTCTGAAGTAGCAAATCTTCTGGAAACGCAAACTCTTTTAAGGAAGTCCCTAATTTAGAAACACCCACAAACTTCACATATCATAATTAGCAAACAATTGGAAGGAAGTTGCTTGAATGTTGGGGAGAGGAAAATCTATTGGCTCTCGTGGGTCTCTTCATCTCAGAAATGCCAATCAGGTCAAGGTTTGCTACATTTTGTATGTGTGTGATGCTTCTCCCAAAGGTATATTAACTATATAAGAGAGTTGTGACAAAACAGAATGATAAAGCTGCGAACCGTGGCACACGCTCATAGTTCTAGCTGCTTGGGAGGTTGAGGAGGGAGGATGGCTTGAACACAGGTGTTCAAGGCCAGCCTGGGCAACATAACAAGATCCTGTCTCTCAAAAAAAAAAAAAAAAAAAAGAAAGAGAGAGGGCCGGGCGTGGTGGCTCACGCCTGTAATCCCAGCACTTTGGGAGGCCGAGCCGGGCGGATCACCTGTGGTCAGGAGTTTGAGACCAGCCTGGCCAACATGGCAAAACCCCGTCTGTACTCAAAATGCAAAAATTAGCCAGGCGTGGTAGCAGGCACCTGTAATCCCAGCTACTTGGGAGGCTGAGGCAGGAGAATCGCTTGAACCCAGGAGGTGGAGGTTGCAGTAAGCTGAGATCGTGCCGTTGCACTCCAGCCTGGGCGACAAGAGCAAGACTCTGTCTCAGAAAAAAAAAAAAAAAAGAGAGAGAGAGAGAAAGAGAACAATATTTGGGAGAGAAGGATGGGGAAGCATTGCAAGGAAATTGTGCTTTATCCAACAAAATGTAAGGAGCCAATAAGGGATCCCTATTTGTCTCTTTTGGTGTCTATTTGTCCCTAACAACTGTCTTTGACAGTGAGAAAAATATTCAGAATAACCATATCCCTGTGCCGTTATTACCTAGCAACCCTTGCAATGAAGATGA
GCAGATCCACAGGAAAACTTGAATGCACAACTGTCTTATTTTAATCTTATTGTACATAAGTTTGTAAAAGAGTTAAAAATTGTTACTTCATGTATTCATTTATATTTTATATTATTTTGCGTCTAATGATTTTTTATTAACATGATTTCCTTTTCTGATATATTGAAATGGAGTCTCAAAGCTTCATAAATTTATAACTTTAGAAATGATTCTAATAACAACGTATGTAATTGTAACATTGCAGTAATGGTGCTACGAAGCCATTTCTCTTGATTTTTAGTAAACTTTTATGACAGCAAATTTGCTTCTGGCTCACTTTCAATCAGTTAAATAAATGATAAATAATTTTGGAAGCTGTGAAGATAAAATACCAAATAAAATAATATAAAAGTGATTTATATGAAGTTAAAATAAAAAATCAGTATGATGGAATAAACTTG

本発明の方法において有用な他のシチジンデアミナーゼを以下に提供する。

rAPOBEC-1 Rattus norvegicus
MSSETGPVAVDPTLRRRIEPHEFEVFFDPRELRKETCLLYEINWGGRHSIWRHTSQNTNKHVEVNFIEKFTTERYFCPNTRCSITWFLSWSPCGECSRAITEFLSRYPHVTLFIYIARLYHHADPRNRQGLRDLISSGVTIQIMTEQESGYCWRNFVNYSPSNEAHWPRYPHLWVRLYVLELYCIILGLPPCLNILRRKQPQLTFFTIALQSCHYQRLPPHILWATGLK

mAPOBEC-1 Mus musculus
MSSETGPVAVDPTLRRRIEPHEFEVFFDPRELRKETCLLYEINWGGRHSVWRHTSQNTSN
HVEVNFLEKFTTERYFRPNTRCSITWFLSWSPCGECSRAITEFLSRHPYVTLFIYIARLY
HHTDQRNRQGLRDLISSGVTIQIMTEQEYCYCWRNFVNYPPSNEAYWPRYPHLWVKLYVLELYCIILGLPPCLKILRRKQPQLTFFTITLQTCHYQRIPPHLLWATGLK

maAPOBEC-1 Mesocricetus auratus
MSSETGPVVVDPTLRRRIEPHEFDAFFDQGELRKETCLLYEIRWGGRHNIWRHTGQNTSRHVEINFIEKFTSERYFYPSTRCSIVWFLSWSPCGECSKAITEFLSGHPNVTLFIYAARLY
HHTDQRNRQGLRDLISRGVTIRIMTEQEYCYCWRNFVNYPPSNEVYWPRYPNLWMRLYALELYCIHLGLPPCLKIKRRHQYPLTFFRLNLQSCHYQRIPPHILWATGFI

hAPOBEC-1 Homo sapiens
MTSEKGPSTGDPTLRRRIEPWEFDVFYDPRELRKEACLLYEIKWGMSRKIWRSSGKNTTNHVEVNFIKKFTSERDFHPSMSCSITWFLSWSPCWECSQAIREFLSRHPGVTLVIYVARLF
WHMDQQNRQGLRDLVNSGVTIQIMRASEYYHCWRNFVNYPPGDEAHWPQYPPLWMMLYALELHCIILSLPPCLKISRRWQNHLTFFRLHLQNCHYQTIPPHILLATGLIHPSVAWR

ppAPOBEC-1 Pongo pygmaeus
MTSEKGPSTGDPTLRRRIESWEFDVFYDPRELRKETCLLYEIKWGMSRKIWRSSGKNTTNHVEVNFIKKFTSERRFHSSISCSITWFLSWSPCWECSQAIREFLSQHPGVTLVIYVARLF
WHMDQRNRQGLRDLVNSGVTIQIMRASEYYHCWRNFVNYPPGDEAHWPQYPPLWMMLYALELHCIILSLPPCLKISRRWQNHLAFFRLHLQNCHYQTIPPHILLATGLIHPSVTWR

ocAPOBEC1 Oryctolagus cuniculus
MASEKGPSNKDYTLRRRIEPWEFEVFFDPQELRKEACLLYEIKWGASSKTWRSSGKNTTNHVEVNFLEKLTSEGRLGPSTCCSITWFLSWSPCWECSMAIREFLSQHPGVTLIIFVARLF
QHMDRRNRQGLKDLVTSGVTVRVMSVSEYCYCWENFVNYPPGKAAQWPRYPPRWMLMYALELYCIILGLPPCLKISRRHQKQLTFFSLTPQYCHYKMIPPYILLATGLLQPSVPWR

mdAPOBEC-1 Monodelphis domestica
MNSKTGPSVGDATLRRRIKPWEFVAFFNPQELRKETCLLYEIKWGNQNIWRHSNQNTSQHAEINFMEKFTAERHFNSSVRCSITWFLSWSPCWECSKAIRKFLDHYPNVTLAIFISRLYWHMDQQHRQGLKELVHSGVTIQIMSYSEYHYCWRNFVDYPQGEEDYWPKYPYLWIMLYVLELHCIILGLPPCLKISGSHSNQLALFSLDLQDCHYQKIPYNVLVATGLVQPFVTWR

mAPOBEC-2 Mus musculus
MAQKEEAAEAAAPASQNGDDLENLEDPEKLKELIDLPPFEIVTGVRLPVNFFKFQFRNVEYSSGRNKTFLCYVVEVQSKGGQAQATQGYLEDEHAGAHAEEAFFNTILPAFDPALKYNVTWYVSSSPCAACADRILKTLSKTKNLRLLILVSRLFMWEEPEVQAALKKLKEAGCKLRIMKPQDFEYIWQNFVEQEEGESKAFEPWEDIQENFLYYEEKLADILK

hAPOBEC-2 Homo sapiens
MAQKEEAAVATEAASQNGEDLENLDDPEKLKELIELPPFEIVTGERLPANFFKFQFRNVE
YSSGRNKTFLCYVVEAQGKGGQVQASRGYLEDEHAAAHAEEAFFNTILPAFDPALRYNVTWYVSSSPCAACADRIIKTLSKTKNLRLLILVGRLFMWEEPEIQAALKKLKEAGCKLRIMKPQDFEYVWQNFVEQEEGESKAFQPWEDIQENFLYYEEKLADILK

ppAPOBEC-2 Pongo pygmaeus
MAQKEEAAAATEAASQNGEDLENLDDPEKLKELIELPPFEIVTGERLPANFFKFQFRNVE
YSSGRNKTFLCYVVEAQGKGGQVQASRGYLEDEHAAAHAEEAFFNTILPAFDPALRYNVTWYVSSSPCAACADRIIKTLSKTKNLRLLILVGRLFMWEELEIQDALKKLKEAGCKLRIMKPQDFEYVWQNFVEQEEGESKAFQPWEDIQENFLYYEEKLADILK

btAPOBEC-2 Bos Taurus
MAQKEEAAAAAEPASQNGEEVENLEDPEKLKELIELPPFEIVTGERLPAHYFKFQFRNVE
YSSGRNKTFLCYVVEAQSKGGQVQASRGYLEDEHATNHAEEAFFNSIMPTFDPALRYMVTWYVSSSPCAACADRIVKTLNKTKNLRLLILVGRLFMWEEPEIQAALRKLKEAGCRLRIMKPQDFEYIWQNFVEQEEGESKAFEPWEDIQENFLYYEEKLADILK

mAPOBEC-3 Mus musculus
MQPQRLGPRAGMGPFCLGCSHRKCYSPIRNLISQETFKFHFKNLGYAKGRKDTFLCYEVTRKDCDSPVSLHHGVFKNKDNIHAEICFLYWFHDKVLKVLSPREEFKITWYMSWSPCFECAEQIVRFLATHHNLSLDIFSSRLYNVQDPETQQNLCRLVQEGAQVAAMDLYEFKKCWKKFVDNGGRRFRPWKRLLTNFRYQDSKLQEILRPCYISVPSSSSSTLSNICLTKGLPETRFWVEGRRMDPLSEEEFYSQFYNQRVKHLCYYHRMKPYLCYQLEQFNGQAPLKGCLLSEKGKQHAEILFLDKIRSMELSQVTITCYLTWSPCPNCAWQLAAFKRDRPDLILHIYTSRLYFHWKRPFQKGLCSLWQSGILVDVMDLPQFTDCWTNFVNPKRPFWPWKGLEIISRRTQRRLRRIKESWGLQDLVNDFGNLQLGPPMS

hAPOBEC-3A Homo sapiens
MEASPASGPRHLMDPHIFTSNFNNGIGRHKTYLCYEVERLDNGTSVKMDQHRGFLHNQAKNLLCGFYGRHAELRFLDLVPSLQLDPAQIYRVTWFISWSPCFSWGCAGEVRAFLQENTHVRLRIFAARIYDYDPLYKEALQMLRDAGAQVSIMTYDEFKHCWDTFVDHQGCPFQPWDGLDEHSQALSGRLRAILQNQGN

hAPOBEC-3B Homo sapiens
MNPQIRNPMERMYRDTFYDNFENEPILYGRSYTWLCYEVKIKRGRSNLLWDTGVFRGQVYFKPQYHAEMCFLSWFCGNQLPAYKCFQITWFVSWTPCPDCVAKLAEFLSEHPNVTLTISAARLYYYWERDYRRALCRLSQAGARVTIMDYEEFAYCWENFVYNEGQQFMPWYKFDENYAFLHRTLKEILRYLMDPDTFTFNFNNDPLVLRRRQTYLCYEVERLDNGTWVLMDQHMGFLCNEAKNLLCGFYGRHAELRFLDLVPSLQLDPAQIYRVTWFISWSPCFSWGCAGEVRAFLQENTHVRLRIFAARIYDYDPLYKEALQMLRDAGAQVSIMTYDEFEYCWDTFVYRQGCPFQPWDGLEEHSQALSGRLRAILQNQGN

hAPOBEC-3C Homo sapiens
MNPQIRNPMKAMYPGTFYFQFKNLWEANDRNETWLCFTVEGIKRRSVVSWKTGVFRNQVDSETHCHAERCFLSWFCDDILSPNTKYQVTWYTSWSPCPDCAGEVAEFLARHSNVNLTIFTARLYYFQYPCYQEGLRSLSQEGVAVEIMDYEDFKYCWENFVYNDNEPFKPWKGLKTNFRLLKRRLRESLQ

hAPOBEC-3D Homo sapiens
MNPQIRNPMERMYRDTFYDNFENEPILYGRSYTWLCYEVKIKRGRSNLLWDTGVFRGPVLPKRQSNHRQEVYFRFENHAEMCFLSWFCGNRLPANRRFQITWFVSWNPCLPCVVKVTKFLAEHPNVTLTISAARLYYYRDRDWRWVLLRLHKAGARVKIMDYEDFAYCWENFVCNEGQPFMPWYKFDDNYASLHRTLKEILRNPMEAMYPHIFYFHFKNLLKACGRNESWLCFTMEVTKHHSAVFRKRGVFRNQVDPETHCHAERCFLSWFCDDILSPNTNYEVTWYTSWSPCPECAGEVAEFLARHSNVNLTIFTARLCYFWDTDYQEGLCSLSQEGASVKIMGYKDFVSCWKNFVYSDDEPFKPWKGLQTNFRLLKRRLREILQ

hAPOBEC-3F Homo sapiens
MKPHFRNTVERMYRDTFSYNFYNRPILSRRNTVWLCYEVKTKGPSRPRLDAKIFRGQVYSQPEHHAEMCFLSWFCGNQLPAYKCFQITWFVSWTPCPDCVAKLAEFLAEHPNVTLTISAARLYYYWERDYRRALCRLSQAGARVKIMDDEEFAYCWENFVYSEGQPFMPWYKFDDNYAFLHRTLKEILRNPMEAMYPHIFYFHFKNLRKAYGRNESWLCFTMEVVKHHSPVSWKRGVFRNQVDPETHCHAERCFLSWFCDDILSPNTNYEVTWYTSWSPCPECAGEVAEFLARHSNVNLTIFTARLYYFWDTDYQEGLRSLSQEGASVEIMGYKDFKYCWENFVYNDDEPFKPWKGLKYNFLFLDSKLQEILE

hAPOBEC-3G Homo sapiens
MKPHFRNTVERMYRDTFSYNFYNRPILSRRNTVWLCYEVKTKGPSRPPLDAKIFRGQVYSELKYHPEMRFFHWFSKWRKLHRDQEYEVTWYISWSPCTKCTRDMATFLAEDPKVTLTIFVARLYYFWDPDYQEALRSLCQKRDGPRATMKIMNYDEFQHCWSKFVYSQRELFEPWNNLPKYYILLHIMLGEILRHSMDPPTFTFNFNNEPWVRGRHETYLCYEVERMHNDTWVLLNQRRGFLCNQAPHKHGFLEGRHAELCFLDVIPFWKLDLDQDYRVTCFTSWSPCFSCAQEMAKFISKNKHVSLCIFTARIYDDQGRCQEGLRTLAEAGAKISIMTYSEFKHCWDTFVDHQGCPFQPWDGLDEHSQDLSGRLRAILQNQEN

hAPOBEC-4 Homo sapiens
MEPIYEEYLANHGTIVKPYYWLSFSLDCSNCPYHIRTGEEARVSLTEFCQIFGFPYGTTF
PQTKHLTFYELKTSSGSLVQKGHASSCTGNYIHPESMLFEMNGYLDSAIYNNDSIRHIIL
YSNNSPCNEANHCCISKMYNFLITYPGITLSIYFSQLYHTEMDFPASAWNREALRSLASL
WPRVVLSPISGGIWHSVLHSFISGVSGSHVFQPILTGRALADRHNAYEINAITGVKPYFT
DVLLQTKRNPNTKAQEALESYPLNNAFPGQFFQMPSGQLQPNLPPDLRAPVVFVLVPLRDLPPMHMGQNPNKPRNIVRHLNMPQMSFQETKDLGRLPTGRSVEIVEITEQFASSKEADEKKKKKGKK

mAPOBEC-4 Mus musculus
MDSLLMKQKKFLYHFKNVRWAKGRHETYLCYVVKRRDSATSCSLDFGHLRNKSGCHVELLFLRYISDWDLDPGRCYRVTWFTSWSPCYDCARHVAEFLRWNPNLSLRIFTARLYFCEDRKAEPEGLRRLHRAGVQIGIMTFKDYFYCWNTFVENRERTFKAWEGLHENSVRLTRQLRRILLPLYEVDDLRDAFRMLGF

rAPOBEC-4 Rattus norvegicus
MEPLYEEYLTHSGTIVKPYYWLSVSLNCTNCPYHIRTGEEARVPYTEFHQTFGFPWSTYP
QTKHLTFYELRSSSGNLIQKGLASNCTGSHTHPESMLFERDGYLDSLIFHDSNIRHIILY
SNNSPCDEANHCCISKMYNFLMNYPEVTLSVFFSQLYHTENQFPTSAWNREALRGLASLWPQVTLSAISGGIWQSILETFVSGISEGLTAVRPFTAGRTLTDRYNAYEINCITEVKPYFT
DALHSWQKENQDQKVWAASENQPLHNTTPAQWQPDMSQDCRTPAVFMLVPYRDLPPIHVNPSPQKPRTVVRHLNTLQLSASKVKALRKSPSGRPVKKEEARKGSTRSQEANETNKSKWKKQTLFIKSNICHLLEREQKKIGILSSWSV

mfAPOBEC-4 Macaca fascicularis
MEPTYEEYLANHGTIVKPYYWLSFSLDCSNCPYHIRTGEEARVSLTEFCQIFGFPYGTTY
PQTKHLTFYELKTSSGSLVQKGHASSCTGNYIHPESMLFEMNGYLDSAIYNNDSIRHIIL
YCNNSPCNEANHCCISKVYNFLITYPGITLSIYFSQLYHTEMDFPASAWNREALRSLASL
WPRVVLSPISGGIWHSVLHSFVSGVSGSHVFQPILTGRALTDRYNAYEINAITGVKPFFT
DVLLHTKRNPNTKAQMALESYPLNNAFPGQSFQMTSGIPPDLRAPVVFVLLPLRDLPPMHMGQDPNKPRNIIRHLNMPQMSFQETKDLERLPTRRSVETVEITERFASSKQAEEKTKKKKGKK

hAID Homo sapiens
MDSLLMNRRKFLYQFKNVRWAKGRRETYLCYVVKRRDSATSFSLDFGYLRNKNGCHVELLFLRYISDWDLDPGRCYRVTWFTSWSPCYDCARHVADFLRGNPNLSLRIFTARLYFCEDRKAEPEGLRRLHRAGVQIAIMTFKDYFYCWNTFVENHERTFKAWEGLHENSVRLSRQLRRILLPLYEVDDLRDAFRTLGL

clAID Canis lupus familiaris
MDSLLMKQRKFLYHFKNVRWAKGRHETYLCYVVKRRDSATSFSLDFGHLRNKSGCHVELLFLRYISDWDLDPGRCYRVTWFTSWSPCYDCARHVADFLRGYPNLSLRIFAARLYFCEDRKAEPEGLRRLHRAGVQIAIMTFKDYFYCWNTFVENREKTFKAWEGLHENSVRLSRQLRRILLPLYEVDDLRDAFRTLGL

btAID Bos Taurus
MDSLLKKQRQFLYQFKNVRWAKGRHETYLCYVVKRRDSPTSFSLDFGHLRNKAGCHVELLFLRYISDWDLDPGRCYRVTWFTSWSPCYDCARHVADFLRGYPNLSLRIFTARLYFCDKERKAEPEGLRRLHRAGVQIAIMTFKDYFYCWNTFVENHERTFKAWEGLHENSVRLSRQLRRILLPLYEVDDLRDAFRTLGL

mAID Mus musculus
MDSLLMNRRKFLYQFKNVRWAKGRRETYLCYVVKRRDSATSFSLDFGYLRNKNGCHVELLFLRYISDWDLDPGRCYRVTWFTSWSPCYDCARHVADFLRGNPNLSLRIFTARLYFCEDRKAEPEGLRRLHRAGVQIAIMTFKDYFYCWNTFVENHERTFKAWEGLHENSVRLSRQLRRILLPLYEVDDLRDAFRTLGL

pmCDA-1 Petromyzon marinus
MAGYECVRVSEKLDFDTFEFQFENLHYATERHRTYVIFDVKPQSAGGRSRRLWGYIINNPNVCHAELILMSMIDRHLESNPGVYAMTWYMSWSPCANCSSKLNPWLKNLLEEQGHTLTMHFSRIYDRDREGDHRGLRGLKHVSNSFRMGVVGRAEVKECLAEYVEASRRTLTWLDTTESMAAKMRRKLFCILVRCAGMRESGIPLHLFTLQTPLLSGRVVWWRV

pmCDA-2 Petromyzon marinus
MELREVVDCALASCVRHEPLSRVAFLRCFAAPSQKPRGTVILFYVEGAGRGVTGGHAVNYNKQGTSIHAEVLLLSAVRAALLRRRRCEDGEEATRGCTLHCYSTYSPCRDCVEYIQEFGASTGVRVVIHCCRLYELDVNRRRSEAEGVLRSLSRLGRDFRLMGPRDAIALLLGGRLANTADGESGASGNAWVTETNVVEPLVDMTGFGDEDLHAQVQRNKQIREAYANYASAVSLMLGELHVDPDKFPFLAEFLAQTSVEPSGTPRETRGRPRGASSRGPEIGRQRPADFERALGAYGLFLHPRIVSREADREEIKRDLIVVMRKHNYQGP

pmCDA-5 Petromyzon marinus
MAGDENVRVSEKLDFDTFEFQFENLHYATERHRTYVIFDVKPQSAGGRSRRLWGYIINNPNVCHAELILMSMIDRHLESNPGVYAMTWYMSWSPCANCSSKLNPWLKNLLEEQGHTLMMHFSRIYDRDREGDHRGLRGLKHVSNSFRMGVVGRAEVKECLAEYVEASRRTLTWLDTTESMAAKMRRKLFCILVRCAGMRESGMPLHLFT

yCD Saccharomyces cerevisiae
MVTGGMASKWDQKGMDIAYEEAALGYKEGGVPIGGCLINNKDGSVLGRGHNMRFQKGSATLHGEISTLENCGRLEGKVYKDTTLYTTLSPCDMCTGAIIMYGIPRCVVGENVNFKSKGEKYLQTRGHEVVVVDDERCKKIMKQFIDERPQDWFEDIGE

rAPOBEC-1 (delta 177-186)
MSSETGPVAVDPTLRRRIEPHEFEVFFDPRELRKETCLLYEINWGGRHSIWRHTSQNTNKHVEVNFIEKFTTERYFCPNTRCSITWFLSWSPCGECSRAITEFLSRYPHVTLFIYIARLYHHADPRNRQGLRDLISSGVTIQIMTEQESGYCWRNFVNYSPSNEAHWPRYPHLWVRGLPPCLNILRRKQPQLTFFTIALQSCHYQRLPPHILWATGLK

rAPOBEC-1 (delta 202-213)
MSSETGPVAVDPTLRRRIEPHEFEVFFDPRELRKETCLLYEINWGGRHSIWRHTSQNTNKHVEVNFIEKFTTERYFCPNTRCSITWFLSWSPCGECSRAITEFLSRYPHVTLFIYIARLYHHADPRNRQGLRDLISSGVTIQIMTEQESGYCWRNFVNYSPSNEAHWPRYPHLWVRLYVLELYCIILGLPPCLNILRRKQPQHYQRLPPHILWATGLK

Human AID:

（下線：核局在化配列；二重下線：核外搬出シグナル）

Mouse AID:

（下線：核局在化配列；二重下線：核外搬出シグナル）

Canine AID:

（下線：核局在化配列；二重下線：核外搬出シグナル）

Bovine AID:

（下線：核局在化配列；二重下線：核外搬出シグナル）

Rat AID:

（下線：核局在化配列；二重下線：核外搬出シグナル）

Mouse APOBEC-3

（斜体：核酸編集ドメイン）

Rat APOBEC-3:

（斜体：核酸編集ドメイン）

Rhesus macaque APOBEC-3G:

（斜体：核酸編集ドメイン；下線：細胞質局在化シグナル）

Chimpanzee APOBEC-3G:

Green monkey APOBEC-3G:

Human APOBEC-3G:

Human APOBEC-3F:

（斜体：核酸編集ドメイン）

Human APOBEC-3B:

（斜体：核酸編集ドメイン）

Rat APOBEC-3B:
MQPQGLGPNAGMGPVCLGCSHRRPYSPIRNPLKKLYQQTFYFHFKNVRYAWGRKNNFLCYEVNGMDCALPVPLRQGVFRKQGHIHAELCFIYWFHDKVLRVLSPMEEFKVTWYMSWSPCSKCAEQVARFLAAHRNLSLAIFSSRLYYYLRNPNYQQKLCRLIQEGVHVAAMDLPEFKKCWNKFVDNDGQPFRPWMRLRINFSFYDCKLQEIFSRMNLLREDVFYLQFNNSHRVKPVQNRYYRRKSYLCYQLERANGQEPLKGYLLYKKGEQHVEILFLEKMRSMELSQVRITCYLTWSPCPNCARQLAAFKKDHPDLILRIYTSRLYFWRKKFQKGLCTLWRSGIHVDVMDLPQFADCWTNFVNPQRPFRPWNELEKNSWRIQRRLRRIKESWGL

Bovine APOBEC-3B:
DGWEVAFRSGTVLKAGVLGVSMTEGWAGSGHPGQGACVWTPGTRNTMNLLREVLFKQQFGNQPRVPAPYYRRKTYLCYQLKQRNDLTLDRGCFRNKKQRHAERFIDKINSLDLNPSQSYKIICYITWSPCPNCANELVNFITRNNHLKLEIFASRLYFHWIKSFKMGLQDLQNAGISVAVMTHTEFEDCWEQFVDNQSRPFQPWDKLEQYSASIRRRLQRILTAPI

Chimpanzee APOBEC-3B:
MNPQIRNPMEWMYQRTFYYNFENEPILYGRSYTWLCYEVKIRRGHSNLLWDTGVFRGQMYSQPEHHAEMCFLSWFCGNQLSAYKCFQITWFVSWTPCPDCVAKLAKFLAEHPNVTLTISAARLYYYWERDYRRALCRLSQAGARVKIMDDEEFAYCWENFVYNEGQPFMPWYKFDDNYAFLHRTLKEIIRHLMDPDTFTFNFNNDPLVLRRHQTYLCYEVERLDNGTWVLMDQHMGFLCNEAKNLLCGFYGRHAELRFLDLVPSLQLDPAQIYRVTWFISWSPCFSWGCAGQVRAFLQENTHVRLRIFAARIYDYDPLYKEALQMLRDAGAQVSIMTYDEFEYCWDTFVYRQGCPFQPWDGLEEHSQALSGRLRAILQVRASSLCMVPHRPPPPPQSPGPCLPLCSEPPLGSLLPTGRPAPSLPFLLTASFSFPPPASLPPLPSLSLSPGHLPVPSFHSLTSCSIQPPCSSRIRETEGWASVSKEGRDLG

Human APOBEC-3C:

（斜体：核酸編集ドメイン）

Gorilla APOBEC-3C3C

Human APOBEC-3A:

（斜体：核酸編集ドメイン）

Rhesus macaque APOBEC-3A:

（斜体：核酸編集ドメイン）

Bovine APOBEC-3A3A:

（斜体：核酸編集ドメイン）

Human APOBEC-3H:

（斜体：核酸編集ドメイン）

Rhesus macaque APOBEC-3H:
MALLTAKTFSLQFNNKRRVNKPYYPRKALLCYQLTPQNGSTPTRGHLKNKKKDHAEIRFINKIKSMGLDETQCYQVTCYLTWSPCPSCAGELVDFIKAHRHLNLRIFASRLYYHWRPNYQEGLLLLCGSQVPVEVMGLPEFTDCWENFVDHKEPPSFNPSEKLEELDKNSQAIKRRLERIKSRSVDVLENGLRSLQLGPVTPSSSIRNSR

Human APOBEC-3D:

（斜体：核酸編集ドメイン）

Human APOBEC-1:
MTSEKGPSTGDPTLRRRIEPWEFDVFYDPRELRKEACLLYEIKWGMSRKIWRSSGKNTTNHVEVNFIKKFTSERDFHPSMSCSITWFLSWSPCWECSQAIREFLSRHPGVTLVIYVARLFWHMDQQNRQGLRDLVNSGVTIQIMRASEYYHCWRNFVNYPPGDEAHWPQYPPLWMMLYALELHCIILSLPPCLKISRRWQNHLTFFRLHLQNCHYQTIPPHILLATGLIHPSVAWR

Mouse APOBEC-1:
MSSETGPVAVDPTLRRRIEPHEFEVFFDPRELRKETCLLYEINWGGRHSVWRHTSQNTSNHVEVNFLEKFTTERYFRPNTRCSITWFLSWSPCGECSRAITEFLSRHPYVTLFIYIARLYHHTDQRNRQGLRDLISSGVTIQIMTEQEYCYCWRNFVNYPPSNEAYWPRYPHLWVKLYVLELYCIILGLPPCLKILRRKQPQLTFFTITLQTCHYQRIPPHLLWATGLK

Rat APOBEC-1:
MSSETGPVAVDPTLRRRIEPHEFEVFFDPRELRKETCLLYEINWGGRHSIWRHTSQNTNKHVEVNFIEKFTTERYFCPNTRCSITWFLSWSPCGECSRAITEFLSRYPHVTLFIYIARLYHHADPRNRQGLRDLISSGVTIQIMTEQESGYCWRNFVNYSPSNEAHWPRYPHLWVRLYVLELYCIILGLPPCLNILRRKQPQLTFFTIALQSCHYQRLPPHILWATGLK

Human APOBEC-2:
MAQKEEAAVATEAASQNGEDLENLDDPEKLKELIELPPFEIVTGERLPANFFKFQFRNVEYSSGRNKTFLCYVVEAQGKGGQVQASRGYLEDEHAAAHAEEAFFNTILPAFDPALRYNVTWYVSSSPCAACADRIIKTLSKTKNLRLLILVGRLFMWEEPEIQAALKKLKEAGCKLRIMKPQDFEYVWQNFVEQEEGESKAFQPWEDIQENFLYYEEKLADILK

Mouse APOBEC-2:
MAQKEEAAEAAAPASQNGDDLENLEDPEKLKELIDLPPFEIVTGVRLPVNFFKFQFRNVEYSSGRNKTFLCYVVEVQSKGGQAQATQGYLEDEHAGAHAEEAFFNTILPAFDPALKYNVTWYVSSSPCAACADRILKTLSKTKNLRLLILVSRLFMWEEPEVQAALKKLKEAGCKLRIMKPQDFEYIWQNFVEQEEGESKAFEPWEDIQENFLYYEEKLADILK

Rat APOBEC-2:
MAQKEEAAEAAAPASQNGDDLENLEDPEKLKELIDLPPFEIVTGVRLPVNFFKFQFRNVEYSSGRNKTFLCYVVEAQSKGGQVQATQGYLEDEHAGAHAEEAFFNTILPAFDPALKYNVTWYVSSSPCAACADRILKTLSKTKNLRLLILVSRLFMWEEPEVQAALKKLKEAGCKLRIMKPQDFEYLWQNFVEQEEGESKAFEPWEDIQENFLYYEEKLADILK

Bovine APOBEC-2:
MAQKEEAAAAAEPASQNGEEVENLEDPEKLKELIELPPFEIVTGERLPAHYFKFQFRNVEYSSGRNKTFLCYVVEAQSKGGQVQASRGYLEDEHATNHAEEAFFNSIMPTFDPALRYMVTWYVSSSPCAACADRIVKTLNKTKNLRLLILVGRLFMWEEPEIQAALRKLKEAGCRLRIMKPQDFEYIWQNFVEQEEGESKAFEPWEDIQENFLYYEEKLADILK

Petromyzon marinus CDA1 (pmCDAl):
MTDAEYVRIHEKLDIYTFKKQFFNNKKSVSHRCYVLFELKRRGERRACFWGYAVNKPQSGTERGIHAEIFSIRKVEEYLRDNPGQFTINWYSSWSPCADCAEKILEWYNQELRGNGHTLKIWACKLYYEKNARNQIGLWNLRDNGVGLNVMVSEHYQCCRKIFIQSSHNQLNENRWLEKTLKRAEKRRSELSFMIQVKILHTTKSPAV

Human APOBEC3G chain A:
MDPPTFTFNFNNEPWWGRHETYLCYEVERMHNDTWVLLNQRRGFLCNQAPHKHGFLEGRHAELCFLDVIPFWKLDLDQDYRVTCFTSWSPCFSCAQEMAKFISKNKHVSLCIFTARIYDDQGRCQEGLRTLAEAGAKISFTYSEFKHCWDTFVDHQGCPFQPWDGLDEHSQDLSGRLRAILQ

本開示の態様によるCas12のアミノ酸配列内で内部的に融合することができる他の例示的なデアミナーゼを以下に提供する。いくつかの実施形態では、それぞれの配列の活性ドメイン、例えば、局在化シグナル（例えば、核局在化配列、核外輸送シグナル、または細胞質局在化シグナル）を伴わないドメインを使用できることを理解されたい。

CからTへの核酸塩基編集タンパク質の詳細は、国際PCT出願番号PCT/US2016/058344 (WO2017/070632) およびKomor, A.C., et al., “Programmable editing of a target base in genomic DNA without double-stranded DNA cleavage” Nature 533, 420-424 (2016) に記載されており、これらの全内容は参照により本明細書に組み入れられる。

［シチジンデアミナーゼ］
一実施形態では、本発明の融合タンパク質は、シチジンデアミナーゼを含む。いくつかの実施形態では、本明細書で提供されるシチジンデアミナーゼは、シトシンまたは5-メチルシトシンをウラシルまたはチミンに脱アミノ化することができる。いくつかの実施形態では、本明細書で提供されるシトシンデアミナーゼは、DNA中のシトシンを脱アミノ化することができる。シチジンデアミナーゼは、任意の適切な生物に由来し得る。いくつかの実施形態において、シチジンデアミナーゼは、原核生物に由来する。いくつかの実施形態において、シチジンデアミナーゼは、細菌に由来する。いくつかの実施形態において、シチジンデアミナーゼは、哺乳動物（例えば、ヒト）に由来する。

いくつかの実施形態において、シチジンデアミナーゼは、本明細書に記載のシチジンデアミナーゼアミノ酸配列のいずれか１つに対して少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも99.5%の同一性であるアミノ酸配列を含む。

本発明の融合タンパク質は、核酸編集ドメインを含む。いくつかの実施形態において、核酸編集ドメインは、CからUへの塩基変化を触媒することができる。いくつかの実施形態において、核酸編集ドメインは、デアミナーゼドメインである。いくつかの実施形態において、デアミナーゼは、シチジンデアミナーゼまたはアデノシンデアミナーゼである。いくつかの実施形態において、デアミナーゼは、アポリポタンパク質B mRNA編集複合体（APOBEC）ファミリーデアミナーゼである。いくつかの実施形態において、デアミナーゼは、APOBEClデアミナーゼである。いくつかの実施形態において、デアミナーゼは、APOBEC2デアミナーゼである。いくつかの実施形態において、デアミナーゼは、APOBEC3デアミナーゼである。いくつかの実施形態において、デアミナーゼは、APOBEC3Aデアミナーゼである。いくつかの実施形態において、デアミナーゼは、APOBEC3Bデアミナーゼである。いくつかの実施形態において、デアミナーゼは、APOBEC3Cデアミナーゼである。いくつかの実施形態において、デアミナーゼは、APOBEC3Dデアミナーゼである。いくつかの実施形態において、デアミナーゼは、APOBEC3Eデアミナーゼである。いくつかの実施形態において、デアミナーゼは、APOBEC3Fデアミナーゼである。いくつかの実施形態において、デアミナーゼは、APOBEC3Gデアミナーゼである。いくつかの実施形態において、デアミナーゼは、APOBEC3Hデアミナーゼである。いくつかの実施形態において、デアミナーゼは、APOBEC4デアミナーゼである。いくつかの実施形態において、デアミナーゼは、活性化誘導デアミナーゼ（AID）である。いくつかの実施形態において、デアミナーゼは、脊椎動物のデアミナーゼである。いくつかの実施形態において、デアミナーゼは、無脊椎動物のデアミナーゼである。いくつかの実施形態において、デアミナーゼは、ヒト、チンパンジー、ゴリラ、サル、ウシ、イヌ、ラット、またはマウスのデアミナーゼである。いくつかの実施形態において、デアミナーゼは、ヒトデアミナーゼである。いくつかの実施形態において、デアミナーゼは、ラットデアミナーゼ、例えば、rAPOBEClである。いくつかの実施形態において、デアミナーゼは、Petromyzon marinusシチジンデアミナーゼ１（pmCDAl）である。いくつかの実施形態では、デミナーゼはヒトAPOBEC3Gである。いくつかの実施形態において、デアミナーゼは、ヒトAPOBEC3Gのフラグメントである。いくつかの実施形態において、核酸編集ドメインは、本明細書に記載の任意のデアミナーゼのデアミナーゼドメインに対して少なくとも80%、少なくとも85%、少なくとも90%、少なくとも92%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99％、または少なくとも99.5％の同一性である。

［追加的ドメイン］
本明細書に記載される塩基エディターは、ポリヌクレオチドの核酸塩基の編集、修飾、または改変を促進させるのを助ける任意のドメインを含むことができる。ある態様において、塩基エディターは、ポリヌクレオチドプログラム可能なヌクレオチド結合ドメイン(例えばCas9)、核酸塩基編集ドメイン(例えばデアミナーゼドメイン)、および一つ以上のさらなるドメインを含む。ある実施形態では、追加のドメインは、塩基エディターの酵素的または触媒的機能、塩基エディターの結合機能を促進することができ、または所望の塩基編集結果に干渉し得る細胞機構(例えば酵素)の阻害因子であり得る。ある態様において、塩基エディターは、ヌクレアーゼ、ニッカーゼ、リコンビナーゼ、デアミナーゼ、メチルトランスフェラーゼ、メチラーゼ、アセチラーゼ、アセチルトランスフェラーゼ、転写アクチベーター、または転写リプレッサードメインを含むことができる。

ある実施形態において、塩基エディターは、ウラシルグリコシラーゼ阻害因子 (UGI) ドメインを含むことができる。UGIドメインは、例えば、Cの脱アミノ化によって形成されるUがC核酸塩基に再変換されることを阻害することによって、シチジンデアミナーゼドメインを含む塩基エディターの効率を改善することができる。ある実施形態では、U:Gヘテロ二本鎖DNAの存在に対する細胞DNA修復応答が、細胞における核酸塩基編集効率の低下の原因となりうる。ある実施形態では、ウラシルDNAグリコシラーゼ (UDG)が、細胞内のDNAからのUの除去を触媒し得、それが塩基除去修復 (BER) を開始し得、大部分がU:G対からC:G対への復帰をもたらす。このような実施形態では、一本鎖に結合する、編集された塩基をブロックする、UGIを阻害する、BERを阻害する、編集された塩基を保護する、および/または編集されていない鎖の修復を促進する、1以上のドメインを含む塩基エディターにおいてBERは阻害され得る。したがって、本開示は、UGIドメインを含む塩基編集融合タンパク質を企図する。

ある態様において、塩基エディターは、二本鎖切断 (DSB) 結合タンパク質の全部または一部をドメインとして含む。例えば、DSB結合タンパク質は、バクテリオファージMuのGamタンパク質を含み得、これはDSBの末端に結合してそれらを分解から保護することができる。Komor, A.C., et al., “Improved base excision repair inhibition and bacteriophage Mu Gam protein yields C:G-to-T:A base editors with higher efficiency and product purity”Science Advances 3:eaao4774 (2017)を参照されたい（その全内容が参照により本明細書に組み入れられる）。

さらに、いくつかの実施形態では、Gamタンパク質が、塩基エディターのＮ末端に融合され得る。いくつかの実施形態において、Gamタンパク質は、塩基エディターのＣ末端に融合され得る。バクテリオファージMuのGamタンパク質は、二本鎖切断（DSB）の末端に結合し、それらを分解から保護することができる。いくつかの実施形態では、Gamを使用してDSBの自由端を結合することにより、塩基編集プロセスの際のインデル形成を減らすことができる。いくつかの実施形態において、174残基のGamタンパク質が、塩基エディターのＮ末端に融合される。Komor, A.C., et al., “Improved base excision repair inhibition and bacteriophage Mu Gam protein yields C:G-to-T:A base editors with higher efficiency and product purity” Science Advances 3:eaao4774 (2017)参照。いくつかの実施形態では、１つまたは複数の突然変異が、野生型ドメインと比較して塩基エディタードメインの長さを変え得る。たとえば、少なくとも1つのドメインの少なくとも1つのアミノ酸の削除が、塩基エディターの長さを短くし得る。別のケースでは、1つまたは複数の突然変異は、野生型ドメインと比較してドメインの長さを変更しない。たとえば、いずれかのドメインにおける置換（複数可）は、塩基エディターの長さを変えない。

ある態様において、塩基エディターは、核酸ポリメラーゼ (NAP) の全てまたは一部をドメインとして含むことができる。例えば、塩基エディターは、真核生物NAPの全部または一部を含むことができる。いくつかの実施形態において、塩基エディターに組み込まれるNAPまたはその一部は、DNAポリメラーゼである。ある態様において、塩基エディターに組み込まれるNAPまたはその一部は、損傷乗り越えポリメラーゼ活性を有する。ある実施形態では、塩基エディターに組み込まれるNAPまたはその一部は損傷乗り越えDNAポリメラーゼである。いくつかの実施形態において、塩基エディターに組み込まれるNAPまたはその一部は、Rev7、Rev1複合体、ポリメラーゼイオタ、ポリメラーゼカッパ、またはポリメラーゼイタである。いくつかの実施形態において、塩基エディターに組み込まれるNAPまたはその一部は、真核生物ポリメラーゼアルファ、ベータ、ガンマ、デルタ、イプシロン、ガンマ、イータ、イオタ、カッパ、ラムダ、ミュー、またはニュー成分である。ある態様において、塩基エディターに組み込まれるNAPまたはその一部は、核酸ポリメラーゼ（例えば損傷乗り越えDNAポリメラーゼ）に対して少なくとも75%、80%、85%、90%、95%、96%、97%、98%、99%、または99.5%の同一性であるアミノ酸配列を含む。

［その他の核酸塩基エディター］
本発明は、モジュラー式マルチエフェクター核酸塩基エディターを提供し、ここでは、実質的にあらゆる当技術分野で知られる核酸塩基エディターが、本明細書中に記載された融合タンパク質に挿入され得、または、シチジンデアミナーゼもしくはアデノシンデアミナーゼの代わりに交換され得る。1つの実施形態において、本発明は、脱塩基型核酸塩基エディタードメインを含むマルチエフェクター核酸塩基エディターを特徴とする。脱塩基型核酸塩基エディターは当技術分野で公知であり、例えば、Kavli et al., EMBO J. 15:3442-3447, 1996によって記述されており、この文献は参照により本明細書に組み込まれる。

一実施形態では、マルチエフェクター核酸塩基エディターは、以下のドメインＡ～Ｃ、Ａ～Ｄ、またはＡ～Ｅを含み：
NH₂-[A-B-C]-COOH、
NH₂-[A-B-C-D]-COOH、または
NH₂-[A-B-C-D-E]-COOH
ここで、AおよびC、またはA、C、およびEは、それぞれ、以下のうちの1つまたは複数を含む：アデノシンデアミナーゼドメインまたはその活性断片、シチジンデアミナーゼドメインまたはその活性断片、DNAグリコシラーゼドメインまたはその活性断片；ここで、BまたはBとDは、それぞれ、核酸配列特異的結合活性を有する１つまたは複数のドメインを含む。

一実施形態では、マルチエフェクター核酸塩基エディターは、NH₂-[A_n-B_o-C_n]-COOH、
NH₂-[A_n-B_o-C_n-D_o]-COOH、または
NH₂-[A_n-B_o-C_p-D_o-Eq]-COOH
を含み、ここで、AおよびC、またはA、C、およびEは、それぞれ、以下のうちの1つまたは複数を含む：アデノシンデアミナーゼドメインまたはその活性断片、シチジンデアミナーゼドメインまたはその活性断片、およびDNAグリコシラーゼドメインまたはその活性断片；ここで、nは整数1、2、3、4、または5であり、pは整数0、1、2、3、4、または5であり、BまたはBとDはそれぞれ、核酸配列特異的結合活性を有するドメインを含み、oは整数1、2、3、4、または5である。

本明細書に開示される塩基エディターのドメインは任意の順序で配置することができる。例えばポリヌクレオチドプログラム可能なヌクレオチド結合ドメインとデアミナーゼドメインを含む融合タンパク質を含む塩基エディターの非限定的な例は、以下のように配置され得る：
NH₂-[核酸塩基編集ドメイン]-リンカー1-[例えばCas9由来ドメイン]-COOH;
NH₂-[例えばシチジンデアミナーゼ]-リンカー1-[例えばCas9由来ドメイン]-COOH;
NH₂-[例えばシチジンデアミナーゼ]-リンカー1-[例えばCas9由来ドメイン]-リンカー2-[UGI]-COOH;
NH₂-[例えばAPOBEC]-リンカー1-[例えばCas9由来ドメイン]-COOH;
NH₂-[例えばシチジンデアミナーゼ]-リンカー1-[例えばCas9由来ドメイン]-COOH;
NH₂-[例えばAPOBEC]-リンカー1-[例えばCas9由来ドメイン]-COOH;
NH₂-[例えばAPOBEC]-リンカー1-[例えばCas9由来ドメイン]-リンカー2-[UGI]-COOH
NH₂-[例えばアデノシンデアミナーゼ]-[例えばCas9由来ドメイン]-COOH;
NH₂-[例えばCas9由来ドメイン]-[例えばアデノシンデアミナーゼ]-COOH;
NH₂-[例えばアデノシンデアミナーゼ]-[例えばCas9由来ドメイン]-[イノシンBER阻害因子]-COOH;
NH₂-[例えばアデノシンデアミナーゼ]-[イノシンBER阻害因子]-[例えばCas9由来ドメイン]-COOH;
NH₂-[イノシンBER阻害因子]-[例えばアデノシンデアミナーゼ]-[例えばCas9由来ドメイン]-COOH;
NH₂-[例えばCas9由来ドメイン]-[例えばアデノシンデアミナーゼ]-[イノシンBER阻害因子]-COOH;
NH₂-[例えばCas9由来ドメイン]-[イノシンBER阻害因子]-[例えばアデノシンデアミナーゼ]-COOH; または
NH₂-[イノシンBER阻害因子]-[例えばCas9由来ドメイン]-[例えばアデノシンデアミナーゼ]-COOH.

さらに、場合によっては、Gamタンパク質を塩基エディターのN末端に融合させることができる。場合によっては、Gamタンパク質を塩基エディタのC末端に融合させることができる。バクテリオファージMuのGamタンパク質は二本鎖切断 (DSB) の末端に結合し、それらを分解から保護することができる。いくつかの実施形態において、Gamを使用してDSBの遊離末端を結合することにより、塩基編集のプロセス中のインデル形成を低減することができる。いくつかの実施形態において、174残基のGamタンパク質は、塩基エディターのN末端に融合される。Komor, A.C., et al., “Improved base excision repair inhibition and bacteriophage Mu Gam protein yields C:G-to-T:A base editors with higher efficiency and product purity” Science Advances 3:eaao4774 (2017)を参照されたい。場合によっては、1つまたは複数の突然変異が、野生型ドメインと比較して、塩基編集ドメインの長さを変化させることができる。例えば、少なくとも1つのドメインにおける少なくとも1つのアミノ酸の欠失は、塩基エディターの長さを短くすることができる。別の例では、1つまたは複数の突然変異は、野生型ドメインに対するドメインの長さを変化させない。例えば、いずれかのドメインにおける置換（複数可）は塩基エディターの長さを変えない。すべてのドメインの長さが野生型ドメインと同じであるそのような塩基エディターの非限定的な例としては、以下のものが挙げられる：
NH₂-[APOBEC1]-リンカー1-[Cas9(D10A)]-リンカー2-[UGI]-COOH;
NH₂-[CDA1]-リンカー1-[Cas9(D10A)]-リンカー2-[UGI]-COOH;
NH₂-[AID]-リンカー1-[Cas9(D10A)]-リンカー2-[UGI]-COOH;
NH₂-[APOBEC1]-リンカー1-[Cas9(D10A)]-リンカー2-[SSB]-COOH;
NH₂-[UGI]-リンカー1-[ABOBEC1]-リンカー2-[Cas9(D10A)]-COOH;
NH₂-[APOBEC1]-リンカー1-[Cas9(D10A)]-リンカー2-[UGI]-リンカー3-[UGI]-COOH;
NH₂-[Cas9(D10A)]-リンカー1-[CDA1]-リンカー2-[UGI]-COOH;
NH₂-[Gam]-リンカー1-[APOBEC1]-リンカー2-[Cas9(D10A)]-リンカー3-[UGI]-COOH;
NH₂-[Gam]-リンカー1-[APOBEC1]-リンカー2-[Cas9(D10A)]-リンカー3-[UGI]-リンカー4-[UGI]-COOH;
NH2-[APOBEC1]-リンカー1-[dCas9(D10A, H840A)]-リンカー2-[UGI]-COOH; or
NH2-[APOBEC1]-リンカー1-[dCas9(D10A, H840A)]-COOH

［塩基エディターシステム］
本明細書で提供される塩基エディターシステムの使用は、 (a) 対象のポリヌクレオチド（例えば、二本鎖のDNAもしくはRNAまたは一本鎖のDNAもしくはRNA）の標的ヌクレオチド配列を、核酸塩基エディター（例えばアデノシン塩基エディター）とガイドポリ核酸（例えばgRNA）とを含む塩基エディターシステムと接触させ、ここで標的ヌクレオチド配列は標的核酸塩基対を含む、工程と；(b) 標的領域の鎖分離を誘導する工程と；(c) 標的領域の一本鎖における標的核酸塩基対の第1の核酸塩基を第2の核酸塩基に変換する工程と；(d) 標的領域の鎖を2本以上は切断することなく、第1の核酸塩基に相補的な第3の核酸塩基が、第2の核酸塩基に相補的な第4の核酸塩基に置換される工程とを含む。一部の実施形態では、ステップ (b) は省略されることを理解されたい。ある態様において、標的核酸塩基対は、1以上の遺伝子における複数の核酸塩基対である。いくつかの実施形態において、本明細書に提供される塩基エディターシステムは、1以上の遺伝子における複数の核酸塩基対の多重編集を可能にする。ある態様において、複数の核酸塩基対は、同一遺伝子内に位置する。いくつかの実施形態において、複数の核酸塩基対は、1またはそれより多い遺伝子に位置し、ここで、少なくとも1つの遺伝子は、異なる遺伝子座に位置する。

いくつかの実施形態において、切断された一本鎖(ニック鎖)は、ガイド核酸にハイブリダイズされる。いくつかの実施態様において、切断された一本鎖は、第一の核酸塩基を含む鎖と反対である。一部の実施形態では、塩基エディターはCas9ドメインを含む。いくつかの実施形態において、第1の塩基はアデニンであり、第2の塩基はG、C、AまたはTではない。いくつかの実施形態において、第2の塩基はイノシンである。

本明細書で提供されるのは、塩基エディターシステムを使用して核酸塩基を編集するためのシステム、組成物、および方法である。いくつかの実施形態において、塩基エディターシステムは、（１）核酸塩基を編集するための、ポリヌクレオチドプログラム可能なヌクレオチド結合ドメインおよび核酸塩基編集ドメイン（例えば、デアミナーゼドメイン）を含む塩基エディター（BE）と、（２）該ポリヌクレオチドプログラム可能なヌクレオチド結合ドメインと組み合わせられたガイドポリヌクレオチド（例えば、ガイドRNA）とを含む。いくつかの実施形態では、塩基エディターシステムは、アデノシン塩基エディター（ABE）を含む。いくつかの実施形態では、塩基エディターシステムは、シチジン塩基エディター（CBE）を含む。いくつかの実施形態において、ポリヌクレオチドプログラム可能なヌクレオチド結合ドメインは、ポリヌクレオチドプログラム可能なDNA結合ドメインである。いくつかの実施形態において、ポリヌクレオチドプログラム可能なヌクレオチド結合ドメインは、ポリヌクレオチドプログラム可能なRNA結合ドメインである。いくつかの実施形態において、核酸塩基編集ドメインは、デアミナーゼドメインである。いくつかの実施形態において、デアミナーゼドメインは、アデニンデアミナーゼまたはアデノシンデアミナーゼであり得る。いくつかの実施形態において、アデノシン塩基エディターはDNA中のアデニンを脱アミノ化し得る。いくつかの実施形態において、ABEは、進化されたTadAバリアントを含む。いくつかの実施形態において、デアミナーゼドメインは、シトシンデアミナーゼまたはシチジンデアミナーゼであり得る。いくつかの実施形態において、「シトシンデアミナーゼ」および「シチジンデアミナーゼ」という用語は、互換的に使用され得る。

核酸塩基編集タンパク質の詳細は、国際PCT出願番号PCT/2017/045381 (WO2018/027078) およびPCT/US2016/058344 (WO2017/070632) に記載されており、これらの各々は、その全体が参照により本明細書に組み込まれる。Komor, A.C., et al., “Programmable editing of a target base in genomic DNA without double-stranded DNA cleavage” Nature 533, 420-424 (2016); Gaudelli, N.M., et al., “Programmable base editing of A・T to G・C in genomic DNA without DNA cleavage” Nature 551, 464-471 (2017); および Komor, A.C., et al., “Improved base excision repair inhibition and bacteriophage Mu Gam protein yields C:G-to-T:A base editors with higher efficiency and product purity”Science Advances 3:eaao4774 (2017)も参照のこと（その内容全体が参照により本明細書に組み入れられる）。

いくつかの実施形態では、単一のガイドポリヌクレオチドを利用して、デアミナーゼを標的核酸配列にターゲティングすることができる。ある実施形態では、一対のガイドポリヌクレオチドが、異なるデアミナーゼを標的核酸配列にターゲティングするために利用され得る。

塩基エディター系の核酸塩基成分およびポリヌクレオチドプログラミング可能なヌクレオチド結合成分は、互いに共有結合的または非共有結合的により結合され得る。例えば、いくつかの実施形態において、デアミナーゼドメインが、ポリヌクレオチドプログラミング可能なヌクレオチド結合ドメインによって標的ヌクレオチド配列にターゲティングされ得る。ある態様において、ポリヌクレオチドプログラミング可能なヌクレオチド結合ドメインは、デアミナーゼドメインに融合または連結され得る。いくつかの実施形態において、ポリヌクレオチドプログラミング可能なヌクレオチド結合ドメインは、デアミナーゼドメインと非共有結合的に相互作用または結合することによって、デアミナーゼドメインを標的ヌクレオチド配列にターゲティングすることができる。例えば、いくつかの実施形態において、核酸塩基編集成分、例えばデアミナーゼ成分は、ポリヌクレオチドプログラミング可能なヌクレオチド結合ドメインの一部をなすさらなる異種部分またはドメインと相互作用し、会合し、または複合体を形成することができる、さらなる異種部分またはドメインを含むことができる。いくつかの実施形態において、追加の異種部分は、ポリペプチドと結合し、相互作用し、会合し、または複合体を形成することができる。いくつかの実施形態において、追加の異種部分は、ポリヌクレオチドと結合し、相互作用し、会合し、または複合体を形成することができる。いくつかの実施形態において、追加の異種部分は、ガイドポリヌクレオチドに結合することができる。いくつかの実施形態において、追加の異種部分は、ポリペプチドリンカーに結合することができる。いくつかの実施形態において、追加の異種部分は、ポリヌクレオチドリンカーに結合することができる。追加の異種部分は、タンパク質ドメインであってもよい。いくつかの実施形態において、追加の異種部分は、K相同(KH) ドメイン、MS2コートタンパク質ドメイン、PP7コートタンパク質ドメイン、SfMu Comコートタンパク質ドメイン、ステリルαモチーフ、テロメラーゼKu結合モチーフおよびKuタンパク質、テロメラーゼSm7結合モチーフおよびSm7タンパク質、またはRNA認識モチーフであり得る。

塩基編集システムは、ガイドポリヌクレオチド成分をさらに含むことができる。塩基編集システムの構成要素は、共有結合、非共有結合的相互作用、またはそれらの結合および相互作用の任意の組合せを介して互いに結合され得ることが理解されるべきである。ある態様において、デアミナーゼドメインは、ガイドポリヌクレオチドによって標的ヌクレオチド配列にターゲティングされ得る。例えば、いくつかの実施形態において、塩基エディター系の核酸塩基編集成分、例えばデアミナーゼ成分は、ガイドポリヌクレオチドの一部またはセグメント(例えばポリヌクレオチドモチーフ) と相互作用し、結合し、または複合体を形成し得るさらなる異種部分またはドメイン(例えばRNAまたはDNA結合タンパク質のようなポリヌクレオチド結合ドメイン)を含み得る。いくつかの実施形態において、追加の異種部分またはドメイン(例えばRNAまたはDNA結合タンパク質などのポリヌクレオチド結合ドメイン)は、デアミナーゼドメインに融合または連結され得る。いくつかの実施形態において、追加の異種部分は、ポリペプチドと結合し、相互作用し、会合し、またはポリペプチドと複合体を形成することができる。いくつかの実施形態において、追加の異種部分は、ポリヌクレオチドと結合し、相互作用し、会合し、またはポリヌクレオチドと複合体を形成することができる。いくつかの実施形態において、追加の異種部分は、ガイドポリヌクレオチドに結合することができる。いくつかの実施形態において、追加の異種部分は、ポリペプチドリンカーに結合することができる。いくつかの実施形態において、追加の異種部分は、ポリヌクレオチドリンカーに結合することができる。追加の異種部分は、タンパク質ドメインであってもよい。いくつかの実施形態において、追加の異種部分は、K相同(KH) ドメイン、MS2コートタンパク質ドメイン、PP7コートタンパク質ドメイン、SfMu Comコートタンパク質ドメイン、無菌アルファモチーフ、テロメラーゼKu結合モチーフおよびKuタンパク質、テロメラーゼSm7結合モチーフおよびSm7タンパク質、またはRNA認識モチーフであり得る。

ある態様において、塩基編集システムは、塩基除去修復 (BER) コンポーネントの阻害因子をさらに含むことができる。塩基編集システムの構成要素は、共有結合、非共有結合的相互作用、またはそれらの結合および相互作用の任意の組み合わせを介して互いに結合され得ることが理解されるべきである。BER成分の阻害因子は、塩基除去修復阻害因子を含み得る。ある態様において、塩基除去修復の阻害因子は、ウラシルDNAグリコシラーゼ阻害因子 (UGI) であり得る。ある態様において、塩基除去修復の阻害因子は、イノシン塩基除去修復阻害因子であり得る。ある態様において、塩基除去修復の阻害因子は、ポリヌクレオチドプログラミング可能なヌクレオチド結合ドメインにより標的ヌクレオチド配列にターゲティングされ得る。ある態様において、ポリヌクレオチドプログラミング可能なヌクレオチド結合ドメインは、塩基除去修復の阻害因子に融合または連結され得る。ある態様において、ポリヌクレオチドプログラミング可能なヌクレオチド結合ドメインは、デアミナーゼドメインおよび塩基除去修復の阻害因子に融合または連結され得る。いくつかの実施形態において、ポリヌクレオチドプログラム可能なヌクレオチド結合ドメインは、塩基除去修復の阻害因子と非共有結合的に相互作用するか、または塩基除去修復の阻害因子と会合することによって、塩基除去修復の阻害因子を標的ヌクレオチド配列へとターゲティングすることができる。例えば、いくつかの実施形態において、塩基除去修復成分の阻害因子は、ポリヌクレオチドプログラミング可能なヌクレオチド結合ドメインの一部であるさらなる異種部分またはドメインと相互作用、会合、または複合体形成し得るさらなる異種部分またはドメインを含み得る。ある態様において、塩基除去修復の阻害因子は、ガイドポリヌクレオチドにより標的ヌクレオチド配列にターゲティングされ得る。例えば、いくつかの実施形態において、塩基除去修復の阻害因子は、ガイドポリヌクレオチドの一部またはセグメント(例えば、ポリヌクレオチドモチーフ)と相互作用、会合、または複合体形成し得るさらなる異種部分またはドメイン(例えば、RNAまたはDNA結合タンパク質のようなポリヌクレオチド結合ドメイン)を含み得る。いくつかの実施形態において、ガイドポリヌクレオチドのさらなる異種部分またはドメイン(例えば、RNAまたはDNA結合タンパク質のようなポリヌクレオチド結合ドメイン)は、塩基除去修復の阻害因子に融合または連結され得る。いくつかの実施形態において、追加の異種部分は、ポリヌクレオチドと結合、相互作用、会合、または複合体形成することができる。いくつかの実施形態において、追加の異種部分は、ガイドポリヌクレオチドに結合することができる。いくつかの実施形態において、追加の異種部分は、ポリペプチドリンカーに結合することができる。いくつかの実施形態において、追加の異種部分は、ポリヌクレオチドリンカーに結合することができる。追加の異種部分は、タンパク質ドメインであってもよい。いくつかの実施形態において、追加の異種部分は、K相同(KH) ドメイン、MS2コートタンパク質ドメイン、PP7コートタンパク質ドメイン、SfMu Comコートタンパク質ドメイン、無菌アルファモチーフ、テロメラーゼKu結合モチーフおよびKuタンパク質、テロメラーゼSm7結合モチーフおよびSm7タンパク質、またはRNA認識モチーフであり得る。

ある態様において、塩基エディターは、編集された鎖の塩基除去修復（BER）を阻害する。いくつかの実施形態において、塩基エディターは、編集されていない鎖を保護または結合する。一部の実施形態では、塩基エディターはUGI活性を含む。ある態様において、塩基エディターは、触媒的に不活性なイノシン特異的ヌクレアーゼを含む。一部の実施形態では、塩基エディターはニッカーゼ活性を含む。ある態様において、塩基対の意図された編集は、PAM部位の上流にある。ある態様において、塩基対の意図された編集は、PAM部位の1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、または20ヌクレオチド上流にある。いくつかの実施形態において、塩基対の意図された編集は、PAM部位の下流にある。ある態様において、意図される編集された塩基対は、PAM部位の1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、または20ヌクレオチド下流にある。

いくつかの実施形態では、本方法は、正準的（例えばNGG）PAMサイトを必要としない。いくつかの実施態様において、核酸塩基エディターは、リンカー又はスペーサーを含む。ある態様において、リンカーまたはスペーサーは、長さが1～25アミノ酸である。ある態様において、リンカーまたはスペーサーは、長さが5～20アミノ酸である。ある態様において、リンカーまたはスペーサーは、長さが10、11、12、13、14、15、16、17、18、19、または20アミノ酸である。

いくつかの実施形態において、本明細書中で提供される塩基編集融合タンパク質は、正確な位置、例えば、標的塩基が規定された領域(例えば「脱アミノ化ウィンドウ」)内に配置されるような位置に配置される必要がある。ある実施形態では、標的は4塩基領域内にあり得る。ある実施形態では、そのような規定された標的領域は、PAMの約15塩基上流にあり得る。Komor, A.C., et al., “Programmable editing of a target base in genomic DNA without double-stranded DNA cleavage” Nature 533, 420-424 (2016); Gaudelli, N.M., et al., “Programmable base editing of A・T to G・C in genomic DNA without DNA cleavage”Nature 551, 464-471 (2017); and Komor, A.C., et al., “Improved base excision repair inhibition and bacteriophage Mu Gam protein yields C:G-to-T:A base editors with higher efficiency and product purity” Science Advances 3:eaao4774 (2017) 参照；その全内容が参照により本明細書に組み入れられる。

一部の実施形態では、標的領域は標的ウィンドウを含み、標的ウィンドウは標的核酸塩基対を含む。ある態様において、標的ウィンドウは、1～10ヌクレオチドを含む。ある態様において、標的ウィンドウは、長さが1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、または20ヌクレオチドである。いくつかの実施形態において、塩基対の意図された編集は、標的ウィンドウ内にある。いくつかの実施態様において、標的ウィンドウは、塩基対の意図された編集を含む。いくつかの実施形態において、本方法は、本明細書に提供される塩基エディターのいずれかを用いて実施される。いくつかの実施態様において、標的ウィンドウは、脱アミノ化ウィンドウである。脱アミノ化ウィンドウは、塩基エディターが標的ヌクレオチドに作用して脱アミノ化する定義された領域であり得る。いくつかの実施形態において、脱アミノ化ウィンドウは、２、３、４、５、６、７、８、９、または１０塩基の領域内にある。いくつかの実施形態において、脱アミノ化ウィンドウは、PAMの５、６、７、８、９、１０、１１、１２、１３、１４、１５、１６、１７、１８、１９、２０、２１、２２、２３、２４、または２５塩基上流である。

本開示の塩基エディターは、標的ポリヌクレオチド配列の編集を促進させる任意のドメイン、特徴またはアミノ酸配列を含むことができる。例えば、いくつかの実施形態において、塩基エディターは、核局在化配列 (NLS) を含む。いくつかの実施形態において、塩基エディターのNLSは、デアミナーゼドメインとポリヌクレオチドプログラム可能なヌクレオチド結合ドメインとの間に位置する。いくつかの実施形態において、塩基エディターのNLSは、ポリヌクレオチドプログラム可能ヌクレオチド結合ドメインに対してC末端に位置する。

本明細書に開示される塩基エディターに存在し得る他の例示的特徴は、細胞質局在化配列、核輸出配列などの輸出配列、または他の局在化配列などの局在化配列、ならびに融合タンパク質の可溶化、精製、または検出に有用な配列タグである。本明細書において提供される適切なタンパク質タグには、限定されるものではないが、ビオチンカルボキシラーゼキャリアータグ (BCCP) タグ、myc-タグ、カルモジュリンタグ、FLAG-タグ、ヘマグルチニン (HA) -タグ、ヒスチジンタグまたはHis-タグとも呼ばれるポリヒスチジンタグ、マルトース結合タンパク質 (MBP) -タグ、nus-タグ、グルタチオン-S-トランスフェラーゼ (GST) -タグ、緑色蛍光タンパク質 (GFP) -タグ、チオレドキシンタグ、S-タグ、ソフタグ(例ソフタグ1、ソフタグ3)、ストレプトタグ、ビオチンリガーゼタグ、FLASHタグ、V5タグ、およびSBP-タグが含まれる。さらなる適切な配列は、当業者には明らかであろう。いくつかの実施形態において、融合タンパク質は、1つ以上のHisタグを含む。

融合タンパク質に含まれ得るタンパク質ドメインの非限定的な例としては、デアミナーゼドメイン(例えばシチジンデアミナーゼ、アデノシンデアミナーゼ)、ウラシルグリコシラーゼ阻害因子 (UGI) ドメイン、エピトープタグ、およびレポーター遺伝子配列、および／または以下の活性のうちの１つ以上を有するタンパク質ドメインが挙げられる：メチラーゼ活性、デメチラーゼ活性、転写活性化活性、転写抑制活性、転写放出因子活性、ヒストン修飾活性、RNA切断活性、および核酸結合活性。追加のドメインは、異種（heterologous）機能ドメインであり得る。そのような異種機能ドメインは、DNAメチル化、DNA損傷、DNA修復、標的DNAに付随する標的ポリペプチド（例えばヒストン、DNA結合タンパク質等）の修飾などの機能活性を付与することができ、例えばヒストンのメチル化、ヒストンのアセチル化、ヒストンのユビキチン化などをもたらし得る。

付与される他の機能には、メチルトランスフェラーゼ活性、脱メチル化活性、脱アミノ化活性、ジスムターゼ活性、アルキル化活性、脱プリン化活性、酸化活性、ピリミジン二量体形成活性、インテグラーゼ活性、トランスポザーゼ活性、リコンビナーゼ活性、ポリメラーゼ活性、リガーゼ活性、ヘリカーゼ活性、フォトリアーゼ活性またはグリコシラーゼ活性、アセチルトランスフェラーゼ活性、デアセチラーゼ活性、キナーゼ活性、ホスファターゼ活性、ユビキチンリガーゼ活性、脱ユビキチン化活性、アデニル化活性、脱アデニル化活性、SUMO化活性、脱SUMO化活性、リボシル化活性、脱リボシル化活性、ミリストイル化活性、リモデリング活性、プロテアーゼ活性、酸化還元酵素活性、トランスフェラーゼ活性、ヒドロラーゼ活性、イソメラーゼ活性、シンターゼ活性、シンテターゼ活性、および脱ミリストイル化活性、またはこれらの任意の組合せが含まれる。

エピトープタグの非限定的な例は、ヒスチジン (His) タグ、V5タグ、FLAGタグ、インフルエンザヘマグルチニン (HA) タグ、Mycタグ、VSV-Gタグ、およびチオレドキシン (Trx) タグを含む。レポーター遺伝子の例としては、グルタチオン-5-トランスフェラーゼ (GST) 、西洋ワサビペルオキシダーゼ (HRP) 、クロラムフェニコールアセチルトランスフェラーゼ (CAT) 、β-ガラクトシダーゼ、β-グルクロニダーゼ、ルシフェラーゼ、緑色蛍光タンパク質 (GFP) 、HcRed、DsRed、シアン蛍光タンパク質 (CFP) 、黄色蛍光タンパク質 (YFP) 、および青色蛍光タンパク質 (BFP) を含む自己蛍光タンパク質が挙げられるが、これらに限定されない。さらなるタンパク質配列には、DNA分子に結合するかまたは他の細胞分子に結合するアミノ酸配列が含まれ得、これらには、マルトース結合タンパク質 (MBP) 、Sタグ、Lex A DNA結合ドメイン (DBD) 融合体、GAL4 DNA結合ドメイン融合体、および単純ヘルペスウイルス (HSV) BP16タンパク質融合体が挙げられるが、これらに限定されない。

一部の実施形態において、アデノシン塩基エディター（ABE）は、DNA中のアデニンを脱アミノ化することができる。ある態様において、ABEは、BE3のAPOBEC成分を、天然または操作された大腸菌TadA、ヒトADAR2、マウスADA、またはヒトADAT2で置換することによって生成される。いくつかの実施形態において、ABEは、進化されたTadAバリアントを含む。いくつかの実施態様では、ABEはABE 1.2 (TadA*-XTEN-nCas9-NLS) である。ある態様において、TadA*はA106VおよびD108N突然変異を含む。

ある態様において、ABEは第二世代ABEである。ある態様において、ABEはABE 2.1であり、これは、TadA* (TadA*2.1) において追加の突然変異D147YおよびE155Vを含むものである。いくつかの実施形態において、ABEはABE 2.2であり、これはABE 2.1が触媒的に不活性化されたバージョンのヒトアルキルアデニンDNAグリコシラーゼ(E125Q変異を伴うAAG)に融合されたものである。いくつかの実施形態において、ABEはABE 2.3であり、こではABE 2.1が触媒的に不活性化された大腸菌Endo V (D35A変異で不活化される)に融合されたものである。いくつかの態様において、ABEはABE 2.6であり、これはABE 2.1におけるリンカーの二倍の長さ(32アミノ酸、(SGGS)₂-XTEN-(SGGS)₂)のリンカーを有する。いくつかの実施態様において、ABEはABE 2.7であり、これはABE 2.1が追加の野生型TadAモノマーと連結されたものである。いくつかの実施態様では、ABEはABE 2.8であり、これはABE 2.1が追加のTadA*2.1モノマーでつながれたものである。いくつかの実施形態において、ABEはABE 2.9であり、これは進化されたTadA (TadA*2.1) とABE 2.1のN末端との直接融合体である。いくつかの実施形態において、ABEはABE 2.10であり、これは野生型TadAとABE 2.1のN末端との直接融合体である。いくつかの実施形態において、ABEはABE 2.11であり、これは、TadA*モノマーのN末端において不活性化E59A突然変異を有するABE 2.9である。いくつかの実施形態において、ABEはABE 2.12であり、これは、内部TadA*モノマーにおいて不活性化E59A突然変異を有するABE 2.9である。

ある態様において、ABEは、第三世代ABEである。ある態様において、ABEはABE 3.1であり、これは、三つのさらなるTadA突然変異(L84F、H123Y、およびI156F)を伴うABE 2.3である。

いくつかの実施形態において、ABEは第四世代ABEである。いくつかの実施形態において、ABEはABE4.3であり、これはさらなるTadA突然変異A142N (TadA*4.3) を伴うABE 3.1である。

いくつかの実施形態において、ABEは第五世代ABEである。いくつかの実施形態において、ABEはABE 5.1であり、これは生存クローンからの突然変異のコンセンサスセット(H36L、R51L、S146C、およびK157N) をABE 3.1に輸入することによって生成される。いくつかの実施形態において、ABEはABE 5.3であり、これは内部の進化されたTadA*に融合された野生型大腸菌TadAを含むヘテロ二量体構築物を有する。ある態様において、ABEは、以下の表6に示されるように、ABE 5.2、ABE 5.4、ABE 5.5、ABE 5.6、ABE 5.7、ABE 5.8、ABE 5.9、ABE 5.10、ABE 5.11、ABE 5.12、ABE 5.13、またはABE 5.14である。一部の実施形態では、ABEは第6世代ABEである。一部の実施形態では、ABEは、以下の表6に示されるように、ABE 6.1、ABE 6.2、ABE 6.3、ABE 6.4、ABE 6.5、またはABE 6.6である。いくつかの実施形態において、ABEは、第七世代ABEである。いくつかの実施形態において、ABEは、以下の表6に示されるように、ABE7.1、ABE7.2、ABE7.3、ABE7.4、ABE7.5、ABE7.6、ABE7.7、ABE7.8、ABE7.9、またはABE7.10である。

表６．ABEの遺伝子型

いくつかの実施形態において、塩基エディターは、アデノシン塩基エディターである。いくつかの実施形態において、アデノシン塩基エディターは、第８世代ABE（ABE8）である。いくつかの実施形態では、ABE8は、TadA*8バリアントを含む。いくつかの実施形態において、ABE8は、TadA*8バリアントを含有する単量体構築物（「ABE8.x-m」）を有する。いくつかの実施形態において、ABE8は、Y147T変異を有するTadA*7.10（TadA*8.1）を含有する単量体構築物を有するABE8.1-mである。いくつかの実施形態において、ABE8は、Y147R変異を有するTadA*7.10（TadA*8.2）を含有する単量体構築物を有するABE8.2-mである。いくつかの実施形態において、ABE8は、ABE8.3-mであり、これは、Q154S変異を有するTadA*7.10（TadA*8.3）を含有する単量体構築物を有する。いくつかの実施形態において、ABE8は、ABE8.4-mであり、これは、Y123H変異を有するTadA*7.10（TadA*8.4）を含有する単量体構築物を有する。いくつかの実施形態において、ABE8は、V82S変異を有するTadA*7.10（TadA*8.5）を含有する単量体構築物を有するABE8.5-mである。いくつかの実施形態において、ABE8は、ABE8.6-mであり、これは、T166R変異を有するTadA*7.10（TadA*8.6）を含む単量体構築物を有する。いくつかの実施形態において、ABE8は、ABE8.7-mであり、これは、Q154R突然変異を有するTadA*7.10（TadA*8.7）を含む単量体構築物を有する。いくつかの実施形態において、ABE8は、Y147R、Q154R、およびY123H突然変異を有するTadA*7.10（TadA*8.8）を含む単量体構築物を有するABE8.8-mである。いくつかの実施形態において、ABE8はABE8.9-mであり、これは、Y147R、Q154RおよびI76Y突然変異を有するTadA*7.10（TadA*8.9）を含む単量体構築物を有する。いくつかの実施形態において、ABE8は、ABE8.10-mであり、これは、Y147R、Q154R、およびT166R突然変異を有するTadA*7.10（TadA*8.10）を含む単量体構築物を有する。いくつかの実施形態において、ABE8は、ABE8.11-mであり、これは、Y147TおよびQ154R突然変異を有するTadA*7.10（TadA*8.11）を含む単量体構築物を有する。いくつかの実施形態において、ABE8は、ABE8.12-mであり、これは、Y147TおよびQ154S突然変異を有するTadA*7.10（TadA*8.12）を含む単量体構築物を有する。いくつかの実施形態において、ABE8は、ABE8.13-mであり、これは、Y123H（H123Yから戻されたY123H）、Y147R、Q154RおよびI76Y突然変異を有するTadA*7.10（TadA*8.13）を含む単量体構築物を有する。いくつかの実施形態において、ABE8は、I76YおよびV82S突然変異を有するTadA*7.10（TadA*8.14）を含む単量体構築物を有するABE8.14-mである。いくつかの実施形態において、ABE8は、V82SおよびY147R突然変異を有するTadA*7.10（TadA*8.15）を含む単量体構築物を有するABE8.15-mである。いくつかの実施形態において、ABE8は、ABE8.16-mであり、これは、V82S、Y123H（H123Yから戻されたY123H）およびY147R突然変異を有するTadA*7.10（TadA*8.16)を含む単量体構築物を有する。いくつかの実施形態では、ABE8はABE8.17-mであり、これは、V82SおよびQ154R突然変異を有するTadA*7.10（TadA*8.17）を含む単量体構築物を有する。いくつかの実施形態では、ABE8はABE8.18-mであり、これは、V82S、Y123H（H123Yから戻されたY123H）およびQ154R突然変異を有するTadA*7.10（TadA*8.18）を含む単量体構築物を有する。いくつかの実施形態では、ABE8はABE8.19-mであり、これは、V82S、Y123H（H123Yから戻されたY123H）、Y147RおよびQ154R突然変異を有するTadA*7.10（TadA*8.19）を含む単量体構築物を有する。いくつかの実施形態において、ABE8は、ABE8.20-mであり、これは、I76Y、V82S、Y123H（H123Yから戻されたY123H）、Y147RおよびQ154R突然変異を有するTadA*7.10（TadA*8.20）を含む単量体構築物を有する。いくつかの実施形態において、ABE8は、ABE8.21-mであり、これは、Y147RおよびQ154S突然変異を有するTadA*7.10（TadA*8.21）を含む単量体構築物を有する。いくつかの実施形態において、ABE8は、V82SおよびQ154S突然変異を有するTadA*7.10（TadA*8.22）を含む単量体構築物を有するABE8.22-mである。いくつかの実施形態において、ABE8は、ABE8.23-mであり、これは、V82SおよびY123H（H123Yから戻されたY123H）突然変異を伴うTadA*7.10（TadA*8.23）を含む単量体構築物を有する。いくつかの実施形態において、ABE8は、ABE8.24-mであり、これは、V82S、Y123H（H123Yから戻されたY123H）、およびY147T突然変異を有するTadA*7.10（TadA*8.24）を含む単量体構築物を有する。

いくつかの実施形態において、ABE8は、TadA*8バリアントに融合された野生型E.coli TadAを含むヘテロ二量体構築物（「ABE8.x-d」）を有する。いくつかの実施形態において、ABE8は、Y147T突然変異を有するTadA*7.10（TadA*8.1）に融合された野生型E.coli TadAを含むヘテロ二量体構築物を有するABE8.1-dである。いくつかの実施形態において、ABE8は、Y147R突然変異を有するTadA*7.10（TadA*8.2）に融合された野生型E.coli TadAを含むヘテロ二量体構築物を有するABE8.2-dである。いくつかの実施形態において、ABE8は、ABE8.3-dであり、これは、Q154S突然変異を有するTadA*7.10（TadA*8.3）に融合された野生型E.coli TadAを含むヘテロ二量体構築物を有する。いくつかの実施形態において、ABE8は、ABE8.4-dであり、これは、Y123H突然変異を有するTadA*7.10（TadA*8.4）に融合された野生型E.coli TadAを含むヘテロ二量体構築物を有する。いくつかの実施形態において、ABE8は、V82S突然変異を有するTadA*7.10（TadA*8.5）に融合された野生型E.coli TadAを含むヘテロ二量体構築物を有するABE8.5-dである。いくつかの実施形態において、ABE8は、T166R突然変異を有するTadA*7.10（TadA*8.6）に融合された野生型E.coli TadAを含むヘテロ二量体構築物を有するｄABE8.6-である。いくつかの実施形態において、ABE8は、ABE8.7-dであり、これは、Q154R突然変異を有するTadA*7.10（TadA*8.7）に融合された野生型E.coli TadAを含むヘテロ二量体構築物を有する。いくつかの実施形態において、ABE8は、Y147R、Q154R、およびY123H突然変異を有するTadA*7.10（TadA*8.8）に融合された野生型E.coli TadAを含むヘテロ二量体構築物を有するABE8.8-dである。いくつかの実施形態において、ABE8は、ABE8.9-dであり、これは、Y147R、Q154RおよびI76Y突然変異を有するTadA*7.1（TadA*8.9）0に融合された野生型E.coli TadAを含むヘテロ二量体構築物を有する。いくつかの実施形態において、ABE8は、ABE8.10-dであり、これは、Y147R、Q154R、およびT166R突然変異を有するTadA*7.10（TadA*8.10）に融合された野生型E.coli TadAを含むヘテロ二量体構築物を有する。いくつかの実施形態において、ABE8は、ABE8.11-dであり、これは、Y147TおよびQ154R突然変異を有するTadA*7.10（TadA*8.11）に融合された野生型E.coli TadAを含むヘテロ二量体構築物を有する。いくつかの実施形態において、ABE8は、Y147TおよびQ154S突然変異を有するTadA*7.10（TadA*8.12）に融合された野生型E.coli TadAを含むヘテロ二量体構築物を有するABE8.12-dである。いくつかの実施形態において、ABE8は、ABE8.13-dであり、Y123H（H123Yから戻されたY123H）、Y147R、Q154RおよびI76Y突然変異を有するTadA*7.10（TadA*8.13）に融合された野生型E.coli TadAを含むヘテロ二量体構築物を有する。いくつかの実施形態において、ABE8は、I76YおよびV82S突然変異を有するTadA*7.10（TadA*8.14）に融合された野生型E.coli TadAを含むヘテロ二量体構築物を有するABE8.14-dである。いくつかの実施形態において、ABE8は、V82SおよびY147R突然変異を有するTadA*7.10（TadA*8.15）に融合された野生型E.coli TadAを含むヘテロ二量体構築物を有するABE8.15-dである。いくつかの実施形態では、ABE8はABE8.16-dであり、これは、V82S、Y123H（H123Yから戻されたY123H）およびY147R突然変異を有するTadA*7.10（TadA*8.16）に融合された野生型E.coli TadAを含むヘテロ二量体構築物を有する。いくつかの実施形態において、ABE8は、V82SおよびQ154R突然変異を有するTadA*7.10（TadA*8.17）に融合された野生型E.coli TadAを含むヘテロ二量体構築物を有するABE8.17-dである。いくつかの実施形態では、ABE8はABE8.18-dであり、これは、V82S、Y123H（H123Yから戻されたY123H）およびQ154R突然変異を有するTadA*7.10（TadA*8.18）に融合された野生型大腸菌TadAを含むヘテロ二量体構築物を有する。いくつかの実施形態では、ABE8はABE8.19-dであり、これは、V82S、Y123H（ＹH123Yから戻されたY123H）、Y147RおよびQ154R突然変異有するTadA*7.10（TadA*8.19）に融合された野生型E.coli TadAを含むヘテロ二量体構築物を有する。いくつかの実施形態において、ABE8は、ABE8.20-dであり、これはI76Y、V82S、Y123H（H123Yから戻されたY123H）、Y147RおよびQ154R突然変異を有するTadA*7.10（TadA*8.20）に融合された野生型大腸菌TadAを含むヘテロ二量体構築物を有する。いくつかの実施形態において、ABE8は、ABE8.21-dであり、これは、Y147RおよびQ154S突然変異を有するTadA*7.10（TadA*8.21）に融合された野生型E.coli TadAを含むヘテロ二量体構築物を有する。いくつかの実施形態において、ABE8は、V82SおよびQ154S突然変異を有するTadA*7.10（TadA*8.22）に融合された野生型E.coli TadAを含むヘテロ二量体構築物を有するABE8.22-dである。いくつかの実施形態では、ABE8はABE8.23-dであり、これは、V82SおよびY123H（H123Yから戻されたY123H）突然変異を有するTadA*7.10（TadA*8.23）に融合された野生型E.coli TadAを含むヘテロ二量体構築物を有する。いくつかの実施形態では、ABE8はABE8.24-dであり、これは、V82S、Y123H（H123Yから戻されたY123H）、およびY147T突然変異を有するTadA*7.10（TadA*8.24）に融合された野生型E.coli TadAを含むヘテロ二量体構築物を有する。

いくつかの実施形態において、ABE8は、TadA*8バリアントに融合されたTadA*7.10（「ABE8.x-7」）を含むヘテロ二量体構築物を有する。いくつかの実施形態において、ABE8はY147T突然変異を有するTadA*7.10（TadA*8.1）に融合されたTadA*7.10を含むヘテロ二量体構築物を有するABE8.1-7である。いくつかの実施形態において、ABE8はY147R突然変異を有するTadA*7.10（TadA*8.2）に融合されたTadA*7.10を含むヘテロ二量体構築物を有するABE8.2-7である。いくつかの実施形態において、ABE8はQ154S突然変異を有するTadA*7.10に融合されたTadA*7.10（TadA*8.3）を含むヘテロ二量体構築物を有するABE8.3-7である。いくつかの実施形態において、ABE8はY123H突然変異を有するTadA*7.10（TadA*8.4）に融合されたTadA*7.10を含むヘテロ二量体構築物を有するABE8.4-7である。いくつかの実施形態において、ABE8はV82S突然変異を有するTadA*7.10（TadA*8.5）に融合されたTadA*7.10を含むヘテロ二量体構築物を有するABE8.5-7である。いくつかの実施形態において、ABE8はT166R突然変異を有するTadA*7.10（TadA*8.6）に融合されたTadA*7.10を含むヘテロ二量体構築物を有するABE8.6-7である。いくつかの実施形態において、ABE8はABE8.7-7であり、これは、Q154R突然変異を有するTadA*7.10（TadA*8.7）に融合されたTadA*7.10を含むヘテロ二量体構築物を有する。いくつかの実施形態において、ABE8はY147R、Q154R、およびY123H突然変異を有するTadA*7.10（TadA*8.8）に融合されたTadA*7.10を含むヘテロ二量体構築物を有するABE8.8-7である。いくつかの実施形態において、ABE8はY147R、Q154RおよびI76Y突然変異を有するTadA*7.10（TadA*8.9）に融合されたTadA*7.10を含むヘテロ二量体構築物を有するABE8.9-7である。いくつかの実施形態において、ABE8はY147R、Q154R、およびT166R突然変異を有するTadA*7.10（TadA*8.10）に融合されたTadA*7.10を含むヘテロ二量体構築物を有するABE8.10-7である。いくつかの実施形態において、ABE8はABE8.11-7であり、これは、Y147TおよびQ154R突然変異を有するTadA*7.10（TadA*8.11）に融合されたTadA*7.10を含むヘテロ二量体構築物を有する。いくつかの実施形態において、ABE8はABE8.12-7であり、これは、Y147TおよびQ154S突然変異を有するTadA*7.10（TadA*8.12）に融合されたTadA*7.10を含むヘテロ二量体構築物を有する。いくつかの実施形態において、ABE8はABE8.13-7であり、これは、Y123H（H123Yから戻されたY123H）、Y147R、Q154RおよびI76Y突然変異を有するTadA*7.10（TadA*8.13）に融合されたTadA*7.10を含むヘテロ二量体構築物を有する。いくつかの実施形態において、ABE8はI76YおよびV82S突然変異を有するTadA*7.10（TadA*8.14）に融合されたTadA*7.10を含むヘテロ二量体構築物を有するABE8.14-7である。いくつかの実施形態において、ABE8はV82SおよびY147R突然変異を有するTadA*7.10（TadA*8.15）に融合されたTadA*7.10を含むヘテロ二量体構築物を有するABE8.15-7である。いくつかの実施形態では、ABE8はABE8.16-7であり、これは、V82S、Y123H（H123Yから戻されたY123H）およびY147R突然変異を有するTadA*7.10（TadA*8.16）に融合されたTadA*7.10を含むヘテロ二量体構築物を有する。いくつかの実施形態において、ABE8はV82SおよびQ154R突然変異を有するTadA*7.10（TadA*8.17）に融合されたTadA*7.10を含むヘテロ二量体構築物を有するABE8.17-7である。いくつかの実施形態では、ABE8はABE8.18-7であり、これは、V82S、Y123H（H123Yから戻されたY123H）およびQ154R突然変異を有するTadA*7.10（TadA*8.18）に融合されたTadA*7.10を含むヘテロ二量体構築物を有する。いくつかの実施形態では、ABE8はABE8.19-7であり、これは、V82S、Y123H（H123Yから戻されたY123H）、Y147RおよびQ154R突然変異を有するTadA*7.10（TadA*8.19）に融合されたTadA*7.10を含むヘテロ二量体構築物を有する。いくつかの実施形態において、ABE8はABE8.20-7であり、I76Y、V82S、Y123H（H123Yから戻されたY123H）、Y147RおよびQ154R突然変異を有するTadA*7.10（TadA*8.20）に融合されたTadA*7.10を含むヘテロ二量体構築物を有する。いくつかの実施形態において、ABE8はABE8.21-7であり、これは、Y147RおよびQ154S突然変異を有するTadA*7.10（TadA*8.21）に融合されたTadA*7.10を含むヘテロ二量体構築物を有する。いくつかの実施形態において、ABE8はV82SおよびQ154S突然変異を有するTadA*7.10（TadA*8.22）に融合されたTadA*7.10を含むヘテロ二量体構築物を有するABE8.22-7である。いくつかの実施形態では、ABE8はABE8.23-7であり、これは、V82SおよびY123H突然変異（TadA*8.23）を有するTadA*7.10（H123Yから戻されたY123H）に融合されたTadA*7.10を含むヘテロ二量体構築物を有する。いくつかの実施形態では、ABE8はABE8.24-7であり、これは、V82S、Y123H（H123Yから戻されたY123H）、およびY147T突然変異を有するTadA*7.10（TadA*8.24）に融合されたTadA*7.10を含むヘテロ二量体構築物を有する。

いくつかの実施形態において、ABEは、下記表７に示されているようにABE8.1-m、ABE8.2-m、ABE8.3-m、ABE8.4-m、ABE8.5-m、ABE8.6-m、ABE8.7-m、ABE8.8-m、ABE8.9-m、ABE8.10-m、ABE8.11-m、ABE8.12-m、ABE8.13-m、ABE8.14-m、ABE8.15-m、ABE8.16-m、ABE8.17-m、ABE8.18-m、ABE8.19-m、ABE8.20-m、ABE8.21-m、ABE8.22-m、ABE8.23-m、ABE8.24-m、ABE8.1-d、ABE8.2-d、ABE8.3-d、ABE8.4-d、ABE8.5-d、ABE8.6-d、ABE8.7-d、ABE8.8-d、ABE8.9-d、ABE8.10-d、ABE8.11-d、ABE8.12-d、ABE8.13-d、ABE8.14-d、ABE8.15-d、ABE8.16-d、ABE8.17-d、ABE8.18-d、ABE8.19-d、ABE8.20-d、ABE8.21-d、ABE8.22-d、ABE8.23-d、またはABE8.24-dである。

表７：ABE8塩基エディター

いくつかの実施形態において、塩基エディター（例えば、ABE8）は、アデノシンデアミナーゼバリアント（例えば、TadA*8）を、循環置換体（circular permutant）Cas9（例えば、CP5またはCP6）および二部分核局在化配列を含む足場にクローニングすることによって生成される。いくつかの実施形態では、塩基エディター（例えば、ABE7.9、ABE7.10、またはABE8）は、NGC PAM CP5バリアント（S. pyrogenes Cas9またはspVRQR Cas9）である。いくつかの実施形態では、塩基エディター（例えば、ABE7.9、ABE7.10、またはABE8）は、AGA PAM CP5バリアント（S.pyrogenes Cas9またはspVRQR Cas9）である。いくつかの実施形態では、塩基エディター（例えば、ABE7.9、ABE7.10、またはABE8）は、NGC PAM CP6バリアント（S.pyrogenes Cas9またはspVRQR Cas9）である。いくつかの実施形態では、塩基エディター（例えば、ABE7.9、ABE7.10、またはABE8）は、AGA PAM CP6バリアント（S.pyrogenes Cas9またはspVRQR Cas9）である。

いくつかの実施形態において、ABEは、以下の表８に示されるような遺伝子型を有する。

表８．ABEの遺伝子型

以下の表9に示すように、40個のABE8の遺伝子型が記述されている。ABEの進化されたE.coli TadA部分の残基位置が示されている。ABE8における変異変化は、ABE7.10の変異とは異なる場合に示されている。いくつかの実施形態では、ABEは、以下の表９に示されるABEのうちの１つの遺伝子型を有する。

表９．進化されたTadAの残基アイデンティティ

いくつかの実施形態では、塩基エディターはABE8.1であり、これは、アデノシンデアミナーゼ活性を有する以下の配列またはそのフラグメントを含むか、または本質的にそれらからなる。

ABE8.1_Y147T_CP5_NGC PAM_monomer

上記の配列において、プレーンテキストはアデノシンデアミナーゼ配列を示し、太字の配列はCas9に由来する配列を示し、斜体の配列はリンカー配列を示し、下線が引かれた配列は二部分核局在化配列を示す。

pNMG-B335 ABE8.1_Y147T_CP5_NGC PAM_monomer

いくつかの実施形態では、塩基エディターはABE8.14であり、これは、アデノシンデアミナーゼ活性を有する以下の配列またはそのフラグメントを含むか、または本質的にそれらからなる。

pNMG-357_ABE8.14 with NGC PAM CP5

いくつかの実施形態では、塩基エディターはABE8.8-mであり、これは、アデノシンデアミナーゼ活性を有する以下の配列またはそのフラグメントを含むか、または本質的にそれらからなる。

ABE8.8-m

上記の配列において、プレーンテキストはアデノシンデアミナーゼ配列を示し、太字の配列はCas9に由来する配列を示し、斜体の配列はリンカー配列を示し、下線が引かれた配列は二部分核局在化配列を示し、二重下線が引かれた配列は変異を示す。

いくつかの実施形態では、塩基エディターはABE8.8-dであり、これは、アデノシンデアミナーゼ活性を有する以下の配列またはそのフラグメントを含むか、または本質的にそれらからなる。

ABE8.8-d

いくつかの実施形態では、塩基エディターはABE8.13-mであり、これは、アデノシンデアミナーゼ活性を有する以下の配列またはそのフラグメントを含むか、または本質的にそれらからなる。

ABE8.13-m

いくつかの実施形態では、塩基エディターはABE8.13-dであり、これは、アデノシンデアミナーゼ活性を有する以下の配列またはそのフラグメントを含むか、または本質的にそれらからなる。

ABE8.13-d

いくつかの実施形態では、塩基エディターはABE8.17-mであり、これは、アデノシンデアミナーゼ活性を有する以下の配列またはそのフラグメントを含むか、または本質的にそれらからなる。

ABE8.17-m

いくつかの実施形態では、塩基エディターはABE8.17-dであり、これは、アデノシンデアミナーゼ活性を有する以下の配列またはそのフラグメントを含むか、または本質的にそれらからなる。

ABE8.17-d

いくつかの実施形態では、塩基エディターはABE8.20-mであり、これは、アデノシンデアミナーゼ活性を有する以下の配列またはそのフラグメントを含むか、または本質的にそれらからなる。

ABE8.20-m

いくつかの実施形態では、塩基エディターはABE8.20-dであり、これは、アデノシンデアミナーゼ活性を有する以下の配列またはそのフラグメントを含むか、または本質的にそれらからなる。

ABE8.20-d

いくつかの実施形態では、本発明のABE8は以下の配列から選択される。

01. monoABE8.1_bpNLS + Y147T
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCTFFRMPRQVFNAQKKAQSSTDSGGSSGGSSGSETPGTSESATPESSGGSSGGSDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFVSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASARELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKQYRSTKEVLDATLIHQSITGLYETRIDLSQLGGDEGADKRTADGSEFESPKKKRKV

02. monoABE8.1_bpNLS + Y147R
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCRFFRMPRQVFNAQKKAQSSTDSGGSSGGSSGSETPGTSESATPESSGGSSGGSDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFVSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASARELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKQYRSTKEVLDATLIHQSITGLYETRIDLSQLGGDEGADKRTADGSEFESPKKKRKV

03. monoABE8.1_bpNLS + Q154S
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPRSVFNAQKKAQSSTDSGGSSGGSSGSETPGTSESATPESSGGSSGGSDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFVSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASARELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKQYRSTKEVLDATLIHQSITGLYETRIDLSQLGGDEGADKRTADGSEFESPKKKRKV

04. monoABE8.1_bpNLS + Y123H
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHHPGMNHRVEITEGILADECAALLCYFFRMPRQVFNAQKKAQSSTDSGGSSGGSSGSETPGTSESATPESSGGSSGGSDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFVSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASARELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKQYRSTKEVLDATLIHQSITGLYETRIDLSQLGGDEGADKRTADGSEFESPKKKRKV

05. monoABE8.1_bpNLS + V82S
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYSTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPRQVFNAQKKAQSSTDSGGSSGGSSGSETPGTSESATPESSGGSSGGSDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFVSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASARELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKQYRSTKEVLDATLIHQSITGLYETRIDLSQLGGDEGADKRTADGSEFESPKKKRKV

06. monoABE8.1_bpNLS + T166R
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPRQVFNAQKKAQSSRDSGGSSGGSSGSETPGTSESATPESSGGSSGGSDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFVSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASARELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKQYRSTKEVLDATLIHQSITGLYETRIDLSQLGGDEGADKRTADGSEFESPKKKRKV

07. monoABE8.1_bpNLS + Q154R
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPRRVFNAQKKAQSSTDSGGSSGGSSGSETPGTSESATPESSGGSSGGSDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFVSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASARELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKQYRSTKEVLDATLIHQSITGLYETRIDLSQLGGDEGADKRTADGSEFESPKKKRKV

08. monoABE8.1_bpNLS + Y147R_Q154R_Y123H
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHHPGMNHRVEITEGILADECAALLCRFFRMPRRVFNAQKKAQSSTDSGGSSGGSSGSETPGTSESATPESSGGSSGGSDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFVSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASARELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKQYRSTKEVLDATLIHQSITGLYETRIDLSQLGGDEGADKRTADGSEFESPKKKRKV

09. monoABE8.1_bpNLS + Y147R_Q154R_I76Y
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLYDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCRFFRMPRRVFNAQKKAQSSTDSGGSSGGSSGSETPGTSESATPESSGGSSGGSDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFVSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASARELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKQYRSTKEVLDATLIHQSITGLYETRIDLSQLGGDEGADKRTADGSEFESPKKKRKV

10. monoABE8.1_bpNLS + Y147R_Q154R_T166R
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCRFFRMPRRVFNAQKKAQSSRDSGGSSGGSSGSETPGTSESATPESSGGSSGGSDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFVSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASARELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKQYRSTKEVLDATLIHQSITGLYETRIDLSQLGGDEGADKRTADGSEFESPKKKRKV

11. monoABE8.1_bpNLS + Y147T_Q154R
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCTFFRMPRRVFNAQKKAQSSTDSGGSSGGSSGSETPGTSESATPESSGGSSGGSDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFVSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASARELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKQYRSTKEVLDATLIHQSITGLYETRIDLSQLGGDEGADKRTADGSEFESPKKKRKV

12. monoABE8.1_bpNLS + Y147T_Q154S
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCTFFRMPRSVFNAQKKAQSSTDSGGSSGGSSGSETPGTSESATPESSGGSSGGSDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFVSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASARELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKQYRSTKEVLDATLIHQSITGLYETRIDLSQLGGDEGADKRTADGSEFESPKKKRKV

13. monoABE8.1_bpNLS + H123Y123H_Y147R_Q154R_I76Y
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLYDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHHPGMNHRVEITEGILADECAALLCRFFRMPRRVFNAQKKAQSSTDSGGSSGGSSGSETPGTSESATPESSGGSSGGSDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFVSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASARELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKQYRSTKEVLDATLIHQSITGLYETRIDLSQLGGDEGADKRTADGSEFESPKKKRKV

14. monoABE8.1_bpNLS + V82S + Q154R
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYSTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPRRVFNAQKKAQSSTDSGGSSGGSSGSETPGTSESATPESSGGSSGGSDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFVSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASARELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKQYRSTKEVLDATLIHQSITGLYETRIDLSQLGGDEGADKRTADGSEFESPKKKRKV

いくつかの実施形態では、塩基エディターはシチジン塩基エディター (CBE)である。いくつかの実施形態では、非限定的な例示的CBEはBE1 (APOBEC1-XTEN-dCas9) 、BE2 (APOBEC1-XTEN-dCas9-UGI) 、BE3 (APOBEC1-XTEN-dCas9(A840H)-UGI) 、BE3-Gam、saBE3、saBE4-Gam、BE4、BE4-Gam、saBE4、またはsaB4E-Gamである。BE4はAPOBEC1‐Cas9n(D10A)リンカーを32アミノ酸まで、Cas9n‐UGIリンカーを9アミノ酸まで拡張し、単一塩基エディター構築物のC末端に別の9アミノ酸リンカーと共にUGIの第二コピーを付加する。塩基性エディタsaBE3およびsaBE4では、S. pyogenes Cas9n(D10A) をより小さいS. aureus Cas9n(D10A) で置き換えた。BE3-Gam、saBE3-Gam、BE4-Gam、およびsaBE4-Gamは、174残基のGamタンパク質が、16アミノ酸のXTENリンカーを介してBE3、saBE3、BE4、およびsaBE4のN末端に融合されたものを有する。

いくつかの実施形態において、塩基エディターは、ポリヌクレオチドによりプログラム可能なヌクレオチド結合ドメイン（例えばCas9由来ドメイン）が核酸塩基編集ドメイン（例えばデアミナーゼドメインの全部または一部）に融合されたものを含む融合タンパク質である。特定の実施形態では、本明細書で提供される融合タンパク質は、融合タンパク質の塩基編集活性を改善させる１つまたは複数の特徴を含む。例えば、本明細書で提供される融合タンパク質のいずれかは、ヌクレアーゼ活性が低減されたCas9ドメインを含み得る。いくつかの実施形態において、本明細書で提供される融合タンパク質のいずれかは、ヌクレアーゼ活性を有さないCas9ドメイン（dCas9）、または、Cas9ニッカーゼ（nCas9）と呼ばれる、二本鎖DNA分子の一つの鎖を切断するCas9ドメインを有し得る。

いくつかの実施形態において、塩基エディターは、ウラシルグリコシラーゼ阻害因子（UGI）の全部または一部を含むドメインをさらに含む。いくつかの実施形態において、塩基エディターは、ウラシルDNAグリコシラーゼ（UDG）などのウラシル結合タンパク質（UBP）の全部または一部を含むドメインを含む。いくつかの実施形態において、塩基エディターは、核酸ポリメラーゼの全部または一部を含むドメインを含む。いくつかの実施形態において、塩基エディターに組み込まれる核酸ポリメラーゼまたはその一部は、損傷乗り越え型（translesion）DNAポリメラーゼである。

いくつかの実施形態では、塩基エディターのドメインは、複数のドメインを含むことができる。例えば、Cas9に由来するポリヌクレオチドプログラム可能なヌクレオチド結合ドメインを含む塩基エディターは、野生型または天然のCas9のRECローブおよびNUCローブに対応するRECローブおよびNUCローブを含むことができる。別の例では、塩基エディターは、RuvCIドメイン、BHドメイン、REC1ドメイン、REC2ドメイン、RuvCIIドメイン、L1ドメイン、HNHドメイン、L2ドメイン、RuvCIIIドメイン、WEDドメイン、TOPOドメインまたはCTDドメインのうちの1つ以上を含むことができる。ある態様において、塩基エディターの一つ以上のドメインは、そのドメインを含むポリペプチドの野生型バージョンに対する突然変異(例えば置換、挿入、削除)を含む。例えば、ポリヌクレオチドプログラム可能DNA結合ドメインのHNHドメインは、H840A置換を含むことができる。別の例では、ポリヌクレオチドプログラム可能なDNA結合ドメインのRuvCIドメインは、D10A置換を含むことができる。

本明細書に開示される塩基エディターの異なるドメイン（例えば隣接ドメイン）は、一つ以上のリンカードメイン（例えばXTENリンカードメイン）を使用して、または使用せずに、互いに接続することができる。いくつかの実施形態では、リンカードメインは、二つの分子もしくは部分（例えば、第一のドメイン（例えばCas9由来ドメイン）および第二のドメイン（例えばアデノシンデアミナーゼドメイン）のような融合タンパク質の二つのドメイン）をつなげる結合（例えば共有結合）、化学基、または分子であり得る。ある態様において、リンカーは、共有結合（例えば炭素－炭素結合、ジスルフィド結合、炭素－ヘテロ原子結合など。）である。ある態様において、リンカーは、アミド結合における炭素窒素結合である。特定の実施形態では、リンカーは、環状もしくは非環状、置換もしくは非置換、分枝もしくは非分枝の脂肪族もしくはヘテロ脂肪族リンカーである。ある態様において、リンカーは、ポリマー（例えばポリエチレン、ポリエチレングリコール、ポリアミド、ポリエステルなど)である。特定の実施態様では、リンカーは、アミノアルカン酸のモノマー、ダイマー又はポリマーを含む。ある態様において、リンカーは、アミノアルカン酸（例えばグリシン、エタン酸、アラニン、β-アラニン、3-アミノプロパン酸、4-アミノブタン酸、5-ペンタン酸等）を含む。いくつかの実施態様において、リンカーは、アミノヘキサン酸(Ahx) のモノマー、ダイマー又はポリマーを含む。ある態様において、リンカーは炭素環部分（例えばシクロペンタン、シクロヘキサン）に基づく。他の態様において、リンカーはポリエチレングリコール部分 (PEG) を含む。ある態様において、リンカーは、アリールまたはヘテロアリール部分を含む。ある態様において、リンカーは、フェニル環に基づく。リンカーは、ペプチドからリンカーへの求核剤（例えばチオール、アミノ）の結合を促進させる官能化部分を含むことができる。リンカーの一部として任意の求電子剤を使用することができる。例示的な求電子剤としては、活性化エステル、活性化アミド、マイケル受容体、ハロゲン化アルキル、ハロゲン化アリール、ハロゲン化アシル、およびイソチオシアナートが挙げられるが、これらに限定されない。ある態様において、リンカーは、Cas9ヌクレアーゼドメインを含むRNAプログラム可能ヌクレアーゼのgRNA結合ドメインと、核酸編集タンパク質の触媒ドメインとを結合する。ある態様において、リンカーは、dCas9と第二のドメイン（例えばUGI等）とを連結する。

典型的には、リンカーは、2つの基、分子、または他の部分の間に配置されるか、または2つの基、分子、または他の部分によって隣接され、共有結合を介してそれぞれに連結され、したがって2つを連結する。ある態様において、リンカーは、アミノ酸または複数のアミノ酸(例えばペプチドまたはタンパク質)である。ある態様において、リンカーは、有機分子、基、ポリマー、または化学的部分である。ある態様において、リンカーは、長さが2～100アミノ酸であり、例えば、長さが2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、30～35、35～40、40～45、45～50、50～60、60～70、70～80、80～90、90～100、100～150～200アミノ酸である。ある態様において、リンカーは、長さが約3～約104 (例えば5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95, 100)アミノ酸である。より長いまたはより短いリンカーも考えられる。ある態様において、リンカードメインは、XTENリンカーとも呼ばれ得るアミノ酸配列SGSETPGTSESATPESを含む。融合タンパク質ドメインを連結するための任意の方法を用いて (例えば、(SGGS)n、(GGGS)n、(GGGGS)n、および(G)nの形態の非常に柔軟なリンカーから、(EAAAK)n、 (GGS)n、SGSETPGTSESATPESの形態のより剛性の高いリンカーまで(例えばGuilinger JP, Thompson DB, Liu DR. Fusion of catalytically inactive Cas9 to FokI nuclease improves the specificity of genome modification. Nat. Biotechnol. 2014; 32(6): 577-82参照。その全内容は参照によりここに組み込まれる)、または (XP)nモチーフ)、核酸塩基エディターの活性のための最適な長さを達成することができる。いくつかの実施態様において、nは、1、2、3、4、5、6、7、8、9、10、11、12、13、14又は15である。ある態様において、リンカーは、(GGS)nモチーフを含み、ここで、nは、1、3、または7である。いくつかの実施形態において、本明細書で提供される融合タンパク質のCas9ドメインは、アミノ酸配列SGSETPGTSESATPESを含むリンカーを介して融合される。いくつかの実施形態において、リンカーは、複数のプロリン残基を含み長さが5～21、5～14、5～9、5～7アミノ酸であり、例えば、PAPAP、PAPAPA、PAPAPAP、PAPAPAPA、P(AP)₄、P(AP)₇、P(AP)₁₀である(例えば、Tan J, Zhang F, Karcher D, Bock R. Engineering of high-precision base editors for site-specific single nucleotide replacement. Nat Commun. 2019 Jan 25;10(1):439を参照；その全内容は参照によりここに組み込まれる)。このようなプロリンに富むリンカーはまた、「硬質（rigid）」リンカーとも呼ばれる。

本発明の融合タンパク質は、核酸編集ドメインを含む。いくつかの実施形態において、デアミナーゼは、アデノシンデアミナーゼである。いくつかの実施形態において、デアミナーゼは、脊椎動物のデアミナーゼである。いくつかの実施形態において、デアミナーゼは、無脊椎動物のデアミナーゼである。いくつかの実施形態において、デアミナーゼは、ヒト、チンパンジー、ゴリラ、サル、ウシ、イヌ、ラット、またはマウスのデアミナーゼである。いくつかの実施形態において、デアミナーゼは、ヒトデアミナーゼである。いくつかの実施形態において、デアミナーゼは、ラットデアミナーゼである。

本明細書で使用される場合、「ヘテロ二量体（ヘテロダイマー）」は、野生型TadAドメインとTadA * 7.10ドメインのバリアント、または２つのバリアントTadAドメイン（例えば、TadA7.10と、Y147TおよびQ154S改変を伴うTadA7.10）を含む融合タンパク質を指すことができる。

異種ポリペプチド（例えば、デアミナーゼ）は、例えばnapDNAbpが標的ポリヌクレオチドおよびガイド核酸に結合するその能力を保持するように、適切な位置でnapDNAbp（例えば、Cas9）に挿入され得る。デアミナーゼは、デアミナーゼの機能（例えば、塩基編集活性）またはnapDNAbpの機能（例えば、標的核酸およびガイド核酸に結合する能力）を損なうことなく、napDNAbpに挿入することができる。デアミナーゼは、例えば、結晶学的研究によって示される無秩序な領域または高温因子もしくはB因子を含む領域でnapDNAbpに挿入することができる。秩序化されていない、無秩序である、または構造化されていないタンパク質の領域、例えば、溶媒に曝される領域およびループは、構造または機能を損なうことなく挿入に使用することができる。デアミナーゼは、可撓性ループ領域または溶媒に曝される領域においてnapDNAbpに挿入することができる。いくつかの実施形態において、デアミナーゼは、Cas9ポリペプチドの可撓性ループに挿入される。

いくつかの実施形態において、デアミナーゼの挿入位置は、Cas9ポリペプチドの結晶構造のB因子分析によって決定される。いくつかの実施形態において、デアミナーゼは、平均よりも高いB因子（例えば、総タンパク質または無秩序領域を含むタンパク質ドメインと比較してより高いB因子）を含むCas9ポリペプチドの領域に挿入される。Bファクター（因子）または温度ファクターは、平均位置からの原子の変動を示すことができる（たとえば、温度に依存する原子の振動または結晶格子の静的無秩序の結果として）。骨格原子の高いBファクター（たとえば、平均よりも高いBファクター）は、比較的高い局所移動度を持つ領域を示している可能性がある。このような領域は、構造または機能を損なうことなくデアミナーゼを挿入するために使用することができる。デアミナーゼは、総タンパク質の平均Bファクターより50％、60％、70％、80％、90％、100％、110％、120％、130％、140％、150％、160％、170％、180％、190％、200％、またはそれ以上高いBファクターのCα原子を有する残基の位置に挿入することができる。デアミナーゼは、その残基を含むCas9タンパク質ドメインの平均B因子よりも50％、60％、70％、80％、90％、100％、110％、120％、130％、140％、150％、160％、170％、180％、190％、200％、またはそれ以上高いBファクターのCα原子を有する残基の位置に挿入することができる。平均よりも高いB因子を含むCas9ポリペプチド位置は、例えば、配列番号１における番号付けで残基768、792、1052、1015、1022、1026、1029、1067、1040、1054、1068、1246、1247、および1248を含み得る。平均よりも高いB因子を含むCas9ポリペプチド領域は、例えば、配列番号１における番号付けで残基792-872、792-906、および2-791を含み得る。

異種ポリペプチド（例えばデアミナーゼ）は、配列番号1における番号付けで768、791、792、1015、1016、1022、1023、1026、1029、1040、1052、1054、1067、1068、1069、1246、1247、および1248からなる群より選択されるアミノ酸残基、または別のCas9ポリペプチドにおける対応するアミノ酸残基においてnapDNAbpに挿入され得る。いくつかの実施形態において、異種ポリペプチドは、配列番号1における番号付けでアミノ酸位置768-769、791-792、792-793、1015-1016、1022-1023、1026-1027、1029-1030、1040-1041、1052-1053、1054-1055、1067-1068、1068-1069、1247-1248、または1248-1249の間、またはそれに対応するアミノ酸位置の間に挿入される。いくつかの実施形態において、異種ポリペプチドは、配列番号1における番号付けでアミノ酸位置769-770、792-793、793-794、1016-1017、1023-1024、1027-1028、1030-1031、1041-1042、1053-1054、1055-1056、1068-1069、1069-1070、1248-1249、または1249-1250の間、またはそれに対応するアミノ酸位置の間に挿入される。いくつかの実施形態において、異種ポリペプチドは、配列番号1における番号付けで768、791、792、1015、1016、1022、1023、1026、1029、1040、1052、1054、1067、1068、1069、1246、1247、および1248からなる群より選択されるアミノ酸残基、または別のCas9ポリペプチドにおける対応するアミノ酸残基を置き換える。挿入位置に関して配列番号1を参照することは、例示目的であることを理解されたい。ここで論じられる挿入は、配列番号1のCas9ポリペプチド配列に限定されず、例えばCas9ニッカーゼ (nCas9) 、ヌクレアーゼ不活Cas9 (dCas9) 、ヌクレアーゼドメインを欠くCas9バリアント、切り詰め型Cas9、または部分的もしくは完全なHNHドメインを欠くCas9ドメインなどの、バリアントCas9ポリペプチドにおける対応する位置への挿入も含む。

異種ポリペプチド（例えばデアミナーゼ）は、配列番号1における番号付けで、768、792、1022、1026、1040、1068、および1247からなる群より選択されるアミノ酸残基、または別のCas9ポリペプチド中の対応するアミノ酸残基においてnapDNAbp中に挿入され得る。いくつかの実施形態において、異種ポリペプチドは、配列番号1における番号付けでアミノ酸位置768-769、792-793、1022-1023、1026-1027、1029-1030、1040-1041、1068-1069、または1247-1248の間、またはそれに対応するアミノ酸位置の間に挿入される。いくつかの実施形態において、異種ポリペプチドは、配列番号1における番号付けでアミノ酸位置769-770、793-794、1023-1024、1027-1028、1030-1031、1041-1042、1069-1070、または1248-1249の間、またはそれに対応するアミノ酸位置の間に挿入される。いくつかの実施形態において、異種ポリペプチドは、配列番号1における番号付けで768、792、1022、1026、1040、1068、および1247からなる群より選択されるアミノ酸残基、または別のCas9ポリペプチドにおける対応するアミノ酸残基を置き換える。

いくつかの実施形態において、ABE（例えばTadA）は、配列番号1における番号付けで1015、1022、1029、1040、1068、1247、1054、1026、768、1067、1248、1052、および1246からなる群から選択されるアミノ酸残基、または別のCas9ポリペプチドにおける対応するアミノ酸残基において挿入される。いくつかの実施形態において、ABE（例えばTadA）は、配列番号1における番号付けで残基792-872、792-906、または2-791に置き換わって、または別のCas9ポリペプチドにおける対応するアミノ酸残基に置き換わって挿入される。いくつかの実施形態において、ABEは、配列番号1における番号付けで1015、1022、1029、1040、1068、1247、1054、1026、768、1067、1248、1052、および1246からなる群から選択されるアミノ酸、または別のCas9ポリペプチドにおける対応するアミノ酸残基のN末端に挿入される。いくつかの実施形態において、ABEは、配列番号1における番号付けで1015、1022、1029、1040、1068、1247、1054、1026、768、1067、1248、1052、および1246からなる群から選択されるアミノ酸、または別のCas9ポリペプチドの対応するアミノ酸残基のC末端、に挿入される。いくつかの実施形態において、ABEは、配列番号1における番号付けで1015、1022、1029、1040、1068、1247、1054、1026、768、1067、1248、1052、および1246からなる群から選択されるアミノ酸、または別のCas9ポリペプチドにおける対応するアミノ酸残基を置き換えて挿入される。

いくつかの実施形態において、CBE（例えばAPOBEC1）は、配列番号1における番号付けで1016、1023、1029、1040、1069、および1247からなる群から選択されるアミノ酸残基、または別のCas9ポリペプチドにおける対応するアミノ酸残基において挿入される。いくつかの実施形態において、ABEは、配列番号1における番号付けで1016、1023、1029、1040、1069、および1247からなる群から選択されるアミノ酸のN末端、または別のCas9ポリペプチドの対応するアミノ酸残基に挿入される。いくつかの実施形態において、ABEは、配列番号1における番号付けで1016、1023、1029、1040、1069、および1247からなる群からなる群から選択されるアミノ酸、または別のCas9ポリペプチドにおける対応するアミノ酸残基のC末端に挿入される。いくつかの実施形態において、ABEは、配列番号1における番号付けで1016、1023、1029、1040、1069、および1247からなる群からなる群から選択されるアミノ酸、または別のCas9ポリペプチドにおける対応するアミノ酸残基を置き換えて挿入される。

いくつかの実施形態において、デアミナーゼは、配列番号1における番号付けでアミノ酸残基768、または別のCas9ポリペプチドの対応するアミノ酸残基において挿入される。いくつかの実施形態において、ABEは、配列番号1における番号付けでアミノ酸768、または別のCas9ポリペプチドにおける対応するアミノ酸残基のN末端に挿入される。いくつかの実施形態において、ABEは、配列番号1における番号付けでアミノ酸768、または別のCas9ポリペプチドにおける対応するアミノ酸残基のC末端に挿入される。いくつかの実施形態において、ABEは、配列番号1における番号付けでアミノ酸768、または別のCas9ポリペプチドの対応するアミノ酸残基を置き換えて挿入される。

いくつかの実施形態において、デアミナーゼは、配列番号1における番号付けでアミノ酸残基791、または別のCas9ポリペプチドの対応するアミノ酸残基において挿入される。いくつかの実施形態において、ABEは、配列番号1における番号付けでアミノ酸791、または別のCas9ポリペプチドにおける対応するアミノ酸残基のN末端に挿入される。いくつかの実施形態において、ABEは、配列番号1における番号付けでアミノ酸791、または別のCas9ポリペプチドにおける対応するアミノ酸残基のC末端に挿入される。いくつかの実施形態において、ABEは、配列番号1における番号付けでアミノ酸791、または別のCas9ポリペプチドの対応するアミノ酸残基を置き換えて挿入される。

いくつかの実施形態において、デアミナーゼは、配列番号1における番号付けでアミノ酸残基792、または別のCas9ポリペプチドの対応するアミノ酸残基において挿入される。いくつかの実施形態において、ABEは、配列番号1における番号付けでアミノ酸792、または別のCas9ポリペプチドにおける対応するアミノ酸残基のN末端に挿入される。いくつかの実施形態において、ABEは、配列番号1における番号付けでアミノ酸792、または別のCas9ポリペプチドにおける対応するアミノ酸残基のC末端に挿入される。いくつかの実施形態において、ABEは、配列番号1における番号付けでアミノ酸792、または別のCas9ポリペプチドの対応するアミノ酸残基を置き換えて挿入される。

いくつかの実施形態において、デアミナーゼは、配列番号1における番号付けでアミノ酸残基1016、または別のCas9ポリペプチドの対応するアミノ酸残基において挿入される。いくつかの実施形態において、ABEは、配列番号1における番号付けでアミノ酸1016、または別のCas9ポリペプチドにおける対応するアミノ酸残基のN末端に挿入される。いくつかの実施形態において、ABEは、配列番号1における番号付けでアミノ酸1016、または別のCas9ポリペプチドにおける対応するアミノ酸残基のC末端に挿入される。いくつかの実施形態において、ABEは、配列番号1における番号付けでアミノ酸1016、または別のCas9ポリペプチドの対応するアミノ酸残基を置き換えて挿入される。

いくつかの実施形態において、デアミナーゼは、配列番号1における番号付けでアミノ酸残基1022、または別のCas9ポリペプチドの対応するアミノ酸残基において挿入される。いくつかの実施形態において、ABEは、配列番号1における番号付けでアミノ酸1022、または別のCas9ポリペプチドにおける対応するアミノ酸残基のN末端に挿入される。いくつかの実施形態において、ABEは、配列番号1における番号付けでアミノ酸1022、または別のCas9ポリペプチドにおける対応するアミノ酸残基のC末端に挿入される。いくつかの実施形態において、ABEは、配列番号1における番号付けでアミノ酸1022、または別のCas9ポリペプチドの対応するアミノ酸残基を置き換えて挿入される。

いくつかの実施形態において、デアミナーゼは、配列番号1における番号付けでアミノ酸残基1023、または別のCas9ポリペプチドの対応するアミノ酸残基において挿入される。いくつかの実施形態において、ABEは、配列番号1における番号付けでアミノ酸1023、または別のCas9ポリペプチドにおける対応するアミノ酸残基のN末端に挿入される。いくつかの実施形態において、ABEは、配列番号1における番号付けでアミノ酸1023、または別のCas9ポリペプチドにおける対応するアミノ酸残基のC末端に挿入される。いくつかの実施形態において、ABEは、配列番号1における番号付けでアミノ酸1023、または別のCas9ポリペプチドの対応するアミノ酸残基を置き換えて挿入される。

いくつかの実施形態において、デアミナーゼは、配列番号1における番号付けでアミノ酸残基1026、または別のCas9ポリペプチドの対応するアミノ酸残基において挿入される。いくつかの実施形態において、ABEは、配列番号1における番号付けでアミノ酸1026、または別のCas9ポリペプチドにおける対応するアミノ酸残基のN末端に挿入される。いくつかの実施形態において、ABEは、配列番号1における番号付けでアミノ酸1026、または別のCas9ポリペプチドにおける対応するアミノ酸残基のC末端に挿入される。いくつかの実施形態において、ABEは、配列番号1における番号付けでアミノ酸1026、または別のCas9ポリペプチドの対応するアミノ酸残基を置き換えて挿入される。

いくつかの実施形態において、デアミナーゼは、配列番号1における番号付けでアミノ酸残基1029、または別のCas9ポリペプチドの対応するアミノ酸残基において挿入される。いくつかの実施形態において、ABEは、配列番号1における番号付けでアミノ酸1029、または別のCas9ポリペプチドにおける対応するアミノ酸残基のN末端に挿入される。いくつかの実施形態において、ABEは、配列番号1における番号付けでアミノ酸1029、または別のCas9ポリペプチドにおける対応するアミノ酸残基のC末端に挿入される。いくつかの実施形態において、ABEは、配列番号1における番号付けでアミノ酸1029、または別のCas9ポリペプチドの対応するアミノ酸残基を置き換えて挿入される。

いくつかの実施形態において、デアミナーゼは、配列番号1における番号付けでアミノ酸残基1040、または別のCas9ポリペプチドの対応するアミノ酸残基において挿入される。いくつかの実施形態において、ABEは、配列番号1における番号付けでアミノ酸1040、または別のCas9ポリペプチドにおける対応するアミノ酸残基のN末端に挿入される。いくつかの実施形態において、ABEは、配列番号1における番号付けでアミノ酸1040、または別のCas9ポリペプチドにおける対応するアミノ酸残基のC末端に挿入される。いくつかの実施形態において、ABEは、配列番号1における番号付けでアミノ酸1040、または別のCas9ポリペプチドの対応するアミノ酸残基を置き換えて挿入される。

いくつかの実施形態において、デアミナーゼは、配列番号1における番号付けでアミノ酸残基1052、または別のCas9ポリペプチドの対応するアミノ酸残基において挿入される。いくつかの実施形態において、ABEは、配列番号1における番号付けでアミノ酸1052、または別のCas9ポリペプチドにおける対応するアミノ酸残基のN末端に挿入される。いくつかの実施形態において、ABEは、配列番号1における番号付けでアミノ酸1052、または別のCas9ポリペプチドにおける対応するアミノ酸残基のC末端に挿入される。いくつかの実施形態において、ABEは、配列番号1における番号付けでアミノ酸1052、または別のCas9ポリペプチドの対応するアミノ酸残基を置き換えて挿入される。

いくつかの実施形態において、デアミナーゼは、配列番号1における番号付けでアミノ酸残基1054、または別のCas9ポリペプチドの対応するアミノ酸残基において挿入される。いくつかの実施形態において、ABEは、配列番号1における番号付けでアミノ酸1054、または別のCas9ポリペプチドにおける対応するアミノ酸残基のN末端に挿入される。いくつかの実施形態において、ABEは、配列番号1における番号付けでアミノ酸1054、または別のCas9ポリペプチドにおける対応するアミノ酸残基のC末端に挿入される。いくつかの実施形態において、ABEは、配列番号1における番号付けでアミノ酸1054、または別のCas9ポリペプチドの対応するアミノ酸残基を置き換えて挿入される。

いくつかの実施形態において、デアミナーゼは、配列番号1における番号付けでアミノ酸残基1067、または別のCas9ポリペプチドの対応するアミノ酸残基において挿入される。いくつかの実施形態において、ABEは、配列番号1における番号付けでアミノ酸1067、または別のCas9ポリペプチドにおける対応するアミノ酸残基のN末端に挿入される。いくつかの実施形態において、ABEは、配列番号1における番号付けでアミノ酸1067、または別のCas9ポリペプチドにおける対応するアミノ酸残基のC末端に挿入される。いくつかの実施形態において、ABEは、配列番号1における番号付けでアミノ酸1067、または別のCas9ポリペプチドの対応するアミノ酸残基を置き換えて挿入される。

いくつかの実施形態において、デアミナーゼは、配列番号1における番号付けでアミノ酸残基1068、または別のCas9ポリペプチドの対応するアミノ酸残基において挿入される。いくつかの実施形態において、ABEは、配列番号1における番号付けでアミノ酸1068、または別のCas9ポリペプチドにおける対応するアミノ酸残基のN末端に挿入される。いくつかの実施形態において、ABEは、配列番号1における番号付けでアミノ酸1068、または別のCas9ポリペプチドにおける対応するアミノ酸残基のC末端に挿入される。いくつかの実施形態において、ABEは、配列番号1における番号付けでアミノ酸1068、または別のCas9ポリペプチドの対応するアミノ酸残基を置き換えて挿入される。

いくつかの実施形態において、デアミナーゼは、配列番号1における番号付けでアミノ酸残基1069、または別のCas9ポリペプチドの対応するアミノ酸残基において挿入される。いくつかの実施形態において、ABEは、配列番号1における番号付けでアミノ酸1069、または別のCas9ポリペプチドにおける対応するアミノ酸残基のN末端に挿入される。いくつかの実施形態において、ABEは、配列番号1における番号付けでアミノ酸1069、または別のCas9ポリペプチドにおける対応するアミノ酸残基のC末端に挿入される。いくつかの実施形態において、ABEは、配列番号1における番号付けでアミノ酸1069、または別のCas9ポリペプチドの対応するアミノ酸残基を置き換えて挿入される。

いくつかの実施形態において、デアミナーゼは、配列番号1における番号付けでアミノ酸残基1246、または別のCas9ポリペプチドの対応するアミノ酸残基において挿入される。いくつかの実施形態において、ABEは、配列番号1における番号付けでアミノ酸1246、または別のCas9ポリペプチドにおける対応するアミノ酸残基のN末端に挿入される。いくつかの実施形態において、ABEは、配列番号1における番号付けでアミノ酸1246、または別のCas9ポリペプチドにおける対応するアミノ酸残基のC末端に挿入される。いくつかの実施形態において、ABEは、配列番号1における番号付けでアミノ酸1246、または別のCas9ポリペプチドの対応するアミノ酸残基を置き換えて挿入される。

いくつかの実施形態において、デアミナーゼは、配列番号1における番号付けでアミノ酸残基1247、または別のCas9ポリペプチドの対応するアミノ酸残基において挿入される。いくつかの実施形態において、ABEは、配列番号1における番号付けでアミノ酸1247、または別のCas9ポリペプチドにおける対応するアミノ酸残基のN末端に挿入される。いくつかの実施形態において、ABEは、配列番号1における番号付けでアミノ酸1247、または別のCas9ポリペプチドにおける対応するアミノ酸残基のC末端に挿入される。いくつかの実施形態において、ABEは、配列番号1における番号付けでアミノ酸1247、または別のCas9ポリペプチドの対応するアミノ酸残基を置き換えて挿入される。

いくつかの実施形態において、デアミナーゼは、配列番号1における番号付けでアミノ酸残基1248、または別のCas9ポリペプチドの対応するアミノ酸残基において挿入される。いくつかの実施形態において、ABEは、配列番号1における番号付けでアミノ酸1248、または別のCas9ポリペプチドにおける対応するアミノ酸残基のN末端に挿入される。いくつかの実施形態において、ABEは、配列番号1における番号付けでアミノ酸1248、または別のCas9ポリペプチドにおける対応するアミノ酸残基のC末端に挿入される。いくつかの実施形態において、ABEは、配列番号1における番号付けでアミノ酸1248、または別のCas9ポリペプチドの対応するアミノ酸残基を置き換えて挿入される。

ある実施形態において、異種ポリペプチド（例えばデアミナーゼ）は、Cas9ポリペプチドの可撓性ループに挿入される。可撓性ループ部分は、配列番号1における番号付けで530-537、569-570、686-691、943-947、1002-1025、1052-1077、1232-1247、もしくは1298-1300、または別のCas9ポリペプチド中の対応するアミノ酸残基からなる群から選択することができる。可撓性ループ部分は、配列番号1における番号付けで1-529、538-568、580-685、692-942、948-1001、1026-1051、1078-1231、もしくは1248-1297、または別のCas9ポリペプチド中の対応するアミノ酸残基からなる群から選択することができる。

異種ポリペプチド（例えばデアミナーゼ）は、配列番号1における番号付けでアミノ酸残基1017-1069、1242-1247、1052-1056、1060-1077、1002-1003、943-947、530-537、568-579、 686-691,1242-1247、1298-1300、1066-1077、1052-1056、もしくは1060-1077、または別のCas9ポリペプチドの対応するアミノ酸残基に対応する、Cas9ポリペプチド領域に挿入することができる。

異種ポリペプチド（例えばデアミナーゼ）はCas9ポリペプチドの欠失領域の代わりに挿入され得る。欠失領域は、Cas9ポリペプチドのN末端またはC末端部分に相当し得る。いくつかの実施形態において、欠失領域は、配列番号1における番号付けで残基792～872、または別のCas9ポリペプチドにおける対応するアミノ酸残基に相当する。いくつかの実施形態において、欠失領域は、配列番号1における番号付けで残基792～906、または別のCas9ポリペプチドにおける対応するアミノ酸残基に相当する。いくつかの実施形態において、欠失領域は、配列番号1における番号付けで残基2～791、または別のCas9ポリペプチドにおける対応するアミノ酸残基に相当する。

異種ポリペプチド（例えばデアミナーゼ）は、Cas9ポリペプチドの構造的または機能的ドメイン内に挿入され得る。異種ポリペプチド（例えばデアミナーゼ）は、Cas9ポリペプチドの2つの構造的または機能的ドメインの間に挿入することができる。異種ポリペプチド（例えばデアミナーゼ）は、Cas9ポリペプチドの構造的または機能的ドメインの代わりに、例えば、Cas9ポリペプチドからそのドメインを削除した後に、挿入され得る。Cas9ポリペプチドの構造的または機能的ドメインは、例えば、RuvC I、RuvC II、RuvC III、Rec1、Rec2、PI、またはHNHを含み得る。

いくつかの実施形態において、Cas9ポリペプチドは、RuvC I、RuvC II、RuvC III、Rec1、Rec2、PI、またはHNHドメインからなる群より選択される1以上のドメインを欠く。ある実施形態において、Cas9ポリペプチドは、ヌクレアーゼドメインを欠く。ある実施形態において、Cas9ポリペプチドは、HNHドメインを欠く。いくつかの実施形態において、Cas9ポリペプチドは、そのCas9ポリペプチドがHNH活性を低下させるかまたは消失させるように、HNHドメインの一部を欠く。

ある実施形態において、Cas9ポリペプチドは、ヌクレアーゼドメインの欠失を含み、デアミナーゼは、ヌクレアーゼドメインを置き換えて挿入される。いくつかの実施形態において、HNHドメインは削除され、デアミナーゼはその場所に挿入される。いくつかの実施形態において、RuvCドメインの1つ以上が欠失され、デアミナーゼがその場所に挿入される。

異種ポリペプチドを含む融合タンパク質は、napDNAbpのN末端およびC末端断片によって隣接され得る。ある実施形態において、融合タンパク質は、Cas9ポリペプチドのN末端断片およびC末端断片によって隣接されるデアミナーゼを含む。該N末端断片またはC末端断片は、標的ポリヌクレオチド配列に結合することができる。N末端断片のC末端またはC末端断片のN末端は、Cas9ポリペプチドの可撓性ループの一部を含み得る。N末端断片のC末端またはC末端断片のN末端は、Cas9ポリペプチドのαヘリックス構造の一部を含み得る。N末端断片またはC末端断片は、DNA結合ドメインを含み得る。N末端断片またはC末端断片は、RuvCドメインを含み得る。N末端断片またはC末端断片は、HNHドメインを含み得る。いくつかの実施形態において、N末端断片およびC末端断片のいずれもHNHドメインを含まない。

いくつかの実施形態において、N末端Cas9断片のC末端は、融合タンパク質が標的核酸塩基を脱アミノ化する際に標的核酸塩基に近接するアミノ酸を含む。いくつかの実施形態において、C末端Cas9断片のN末端は、融合タンパク質が標的核酸塩基を脱アミノ化する際に標的核酸塩基に近接するアミノ酸を含む。標的核酸塩基とN末端Cas9断片のC末端またはC末端Cas9断片のN末端におけるアミノ酸との間の近接性を有するためには、異なるデアミナーゼは挿入位置が異なり得る。例えば、ABEの挿入位置は、配列番号1における番号付けで1015、1022、1029、1040、1068、1247、1054、1026、768、1067、1248、1052、および1246からなる群から選択されるアミノ酸残基、または別のCas9ポリペプチドにおける対応するアミノ酸残基におけるものであり得る。CBEの適切な挿入位置は、配列番号1における番号付けで1016、1023、1029、1040、1069、および1247からなる群より選択されるアミノ酸残基、または別のCas9ポリペプチドの対応するアミノ酸残基であり得る。ある実施形態において、ABEの挿入は、上記のアミノ酸残基のいずれか1つのN末端またはC末端に挿入され得る。いくつかの実施形態において、ABEの挿入は、上記のアミノ酸残基のいずれか1つを置き換えて挿入され得る。

融合タンパク質のC末端Cas9断片（すなわち、融合タンパク質中のデアミナーゼに隣接するC末端Cas9断片）は、Cas9ポリペプチドのC末端を含み得る。融合タンパク質のC末端Cas9断片は、少なくとも約100、200、300、400、500、600、700、800、900、1000、1100、1200、または1300アミノ酸の長さを含むことができる。融合タンパク質のC末端Cas9断片は、配列番号1における番号付けでアミノ酸残基1-56、1-95、1-200、1-300、1-400、1-500、1-600、1-700、1-718、1-765、1-780、1-906、1-918、もしくは1-1100、または別のCas9ポリペプチドの対応するアミノ酸残基に相当する配列を含み得る。N末端Cas9断片は、配列番号1における番号付けでアミノ酸残基1-56、1-95、1-200、1-300、1-400、1-500、1-600、1-700、1-718、1-765、1-780、1-906、1-918、もしくは1-1100または別のCas9ポリペプチド中の対応するアミノ酸残基に対して少なくとも85%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも99.5%の配列同一性を含む配列を含み得る。

融合タンパク質のN末端Cas9断片（すなわち、融合タンパク質中のデアミナーゼに隣接するN末端Cas9断片）は、Cas9ポリペプチドのN末端を含み得る。融合タンパク質のN末端Cas9断片は、少なくとも約100、200、300、400、500、600、700、800、900、1000、1100、1200、または1300アミノ酸の長さを含むことができる。融合タンパク質のN末端Cas9断片は、配列番号1における番号付けでアミノ酸残基1099-1368、918-1368、906-1368、780-1368、765-1368、718-1368、94-1368、もしくは56-1368、または別のCas9ポリペプチドの対応するアミノ酸残基に相当する配列を含み得る。N末端Cas9断片は、配列番号1における番号付けでアミノ酸残基1099-1368、918-1368、906-1368、780-1368、765-1368、718-1368、94-1368、もしくは56-1368または別のCas9ポリペプチド中の対応するアミノ酸残基に対して少なくとも85%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも99.5%の配列同一性を含む配列を含み得る。

融合タンパク質のN末端Cas9断片およびC末端Cas9断片を合わせたものは、例えば、配列番号1に記載されているもののような、全長の天然Cas9ポリペプチド配列に相当していなくてもよい。

本明細書に記載された融合タンパク質は、非標的部位（例えばオフターゲット部位）での脱アミノ化が低減された、例えばゲノム全体に渡り目的外脱アミノ化が低減された、標的化脱アミノ化をもたらすことができる。本明細書に記載される融合タンパク質は、非標的部位におけるバイスタンダー脱アミノ化が低減された標的化脱アミノ化をもたらすことができる。望まれない脱アミノ化、またはオフターゲット脱アミノ化は、例えばCas9ポリペプチドのN末端またはC末端に融合されたデアミナーゼを含むエンド末端融合タンパク質と比較して、少なくとも30%、少なくとも40%、少なくとも50%、少なくとも60%、少なくとも70%、少なくとも80%、少なくとも90%、少なくとも95%、または少なくとも99%低減され得る。望まれない脱アミノ化、またはオフターゲット脱アミノ化は、例えばCas9ポリペプチドのN末端またはC末端に融合されたデアミナーゼを含むエンド末端融合タンパク質と比較して、少なくとも1倍（one-fold）、少なくとも2倍、少なくとも3倍、少なくとも4倍、少なくとも5倍、少なくとも10倍、少なくとも15倍、少なくとも20倍、少なくとも30倍、少なくとも40倍、少なくとも50倍、少なくとも60倍、少なくとも70倍、少なくとも80倍、少なくとも90倍、または少なくとも100倍低下させることができる。

いくつかの実施形態において、融合タンパク質のデアミナーゼは、Rループの範囲内で2つを超える核酸塩基を脱アミノ化しない。いくつかの実施形態において、融合タンパク質のデアミナーゼは、Rループの範囲内で3つを超える核酸塩基を脱アミノ化しない。いくつかの実施形態において、融合タンパク質のデアミナーゼは、Rループの範囲内で2、3、4、5、6、7、8、9、または10を超える核酸塩基を脱アミノ化しない。Rループは、DNA:RNAハイブリッド、DNA:DNAまたはRNA:RNA相補的構造を含み、一本鎖DNAと会合した三本鎖核酸構造である。本明細書中で用いられる場合、R-ループは、標的ポリヌクレオチドがCRISPR複合体または塩基編集複合体と接触された場合に形成され得、ここで、ガイドポリヌクレオチド（例えばガイドRNA）の一部が、標的ポリヌクレオチド（例えば標的DNA）の一部とハイブリダイズし、それと取って代わる。ある実施形態において、Rループは、スペーサー配列および標的DNA相補配列のハイブリダイズした領域を含む。Rループ領域の長さは約5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、または50核酸塩基対であり得る。いくつかの実施形態において、Rループ領域は長さが約20核酸塩基対である。本明細書で使用される場合、Rループ領域は、ガイドポリヌクレオチドとハイブリダイズする標的DNA鎖には限定されないことが理解されるべきである。例えば、Rループ領域内の標的核酸塩基の編集は、ガイドRNAと相補的な鎖を含むDNA鎖に対してであってもよく、またはガイドRNAと相補的な鎖の反対側の鎖であるDNA鎖に対してであってもよい。ある実施形態において、Rループの領域における編集は、標的DNA配列中のうち、ガイドRNAに対して非相補的な鎖（プロトスペーサー鎖）上の核酸塩基の編集を含む。

本明細書に記載される融合タンパク質は、正準的（canonical）な塩基編集とは異なる編集ウィンドウにおいて標的脱アミノ化をもたらし得る。ある実施形態において、標的核酸塩基は、標的ポリヌクレオチド配列におけるPAM配列の約1～約20塩基上流にある。ある実施形態において、標的核酸塩基は、標的ポリヌクレオチド配列におけるPAM配列の約2～約12塩基上流にある。いくつかの実施形態において、標的核酸塩基は、PAM配列から約1～9塩基対、約2～10塩基対、約3～11塩基対、約4～12塩基対、約5～13塩基対、約6～14塩基対、約7～15塩基対、約8～16塩基対、約9～17塩基対、約10～18塩基対、約11～19塩基対、約12～20塩基対、約1～7塩基対、約2～8塩基対、約3～9塩基対、約4～10塩基対、約5～11塩基対、約6～12塩基対、約7～13塩基対、約8～14塩基対、約9～15塩基対、約10～16塩基対、約11～17塩基対、約12～18塩基対、約13～19塩基対、約14～20塩基対、約1～5塩基対、約2～6塩基対、約3～7塩基対、約4～8塩基対、約5～9塩基対、約6～10塩基対、約7～11塩基対、約8～12塩基対、約9～13塩基対、約10～14塩基対、約11～15塩基対、約12～16塩基対、約13～17塩基対、約14～18塩基対、約15～19塩基対、約16～20塩基対、約1～3塩基対、約2～4塩基対、約3～5塩基対、約4～6塩基対、約5～7塩基対、約6～8塩基対、約7～9塩基対、約8～10塩基対、約9～11塩基対、約10～12塩基対、約11～13塩基対、約12～14塩基対、約13～15塩基対、約14～16塩基対、約15～17塩基対、約16～18塩基対、約17～19塩基対、約18～20塩基対だけ離れているか、またはそれだけ上流にある。いくつかの実施形態において、標的核酸塩基は、PAM配列から約1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20もしくはそれより多くの塩基対だけ離れているか、またはそれだけ上流にある。いくつかの実施形態では、標的核酸塩基は、PAM配列の約1、2、3、4、5、6、7、8、または9塩基対上流にある。いくつかの実施形態において、標的核酸塩基は、PAM配列の約2、3、4または6塩基対上流にある。

従って、例えばBE4のような正準的な塩基エディターと比較して別の塩基編集ウィンドウ嗜好性を可能にする、塩基編集を最適化するために融合タンパク質ライブラリーおよびその使用方法も本明細書で提供される。いくつかの実施形態において、本開示は、複数の融合タンパク質を含む、最適化された塩基編集のためのタンパク質ライブラリーを提供し、ここで、該複数の融合タンパク質の各々は、Cas9ポリペプチドのN末端断片およびC末端断片によって隣接されたデアミナーゼを含み、融合タンパク質の各々のN末端断片が、該複数の融合タンパク質の残りのもののN末端断片と異なるか、または、融合タンパク質の各々のC末端断片が、該複数の融合タンパク質の残りのもののC末端断片と異なり、該融合タンパク質の各々のデアミナーゼは、標的ポリヌクレオチド配列中のプロトスペーサー隣接モチーフ（Protospacer Adjacent Motif：PAM）配列に近接した標的核酸塩基を脱アミノ化し、該N末端断片またはC末端断片は標的ポリヌクレオチド配列に結合する。ある実施形態において、CRISPR Rループ内の各核酸塩基について、該複数の融合タンパク質のうちの少なくとも1つが、核酸塩基を脱アミノ化する。いくつかの実施形態において、標的ポリヌクレオチドのうちPAM配列から1～20塩基対離れた各核酸塩基について、該複数の融合タンパク質のうちの少なくとも一つが、核酸塩基を脱アミノ化する。いくつかの実施形態において、本明細書では、最適化された塩基編集を可能にする融合タンパク質ライブラリーを含むキットが提供される。

融合タンパク質は、2つ以上の異種ポリペプチドを含むことができる。例えば、融合タンパク質は、1つ以上のUGIドメインおよび/または1つ以上の核局在化シグナルをさらに含み得る。2つ以上の異種ドメインは、タンデムに挿入され得る。2つ以上の異種ドメインは、それらがNapDNAbp中でタンデムにならないような位置に挿入され得る。

いくつかの実施形態において、塩基エディターは、内部に融合された核酸塩基編集ドメイン（例えば、デアミナーゼドメインの全部または一部）を有するnapDNAbpドメイン（例えばCas12由来ドメイン）を含む融合タンパク質である。いくつかの実施形態では、napDNAbpはCas12bである。いくつかの実施形態において、塩基エディターは、表１８に提供される遺伝子座に挿入された内部融合TadA*8ドメインを有するBhCas12bドメインを含む。

表１８：Cas12bタンパク質における挿入遺伝子座

いくつかの実施形態では、塩基エディターは、複数のドメインを含むことができる。例えば、Cas12タンパク質に由来するnapDNAbpドメインを含む塩基エディターは、野生型あるいは天然のCas12のRECローブ（lobe）およびNUCローブに対応するRECローブおよびNUCローブを含むことができる。別の例では、塩基エディターは、1つまたは複数のRuvCドメインWEDドメインを含むことができる。いくつかの実施形態では、塩基エディターの１つまたは複数のドメインは、そのドメインを含むポリペプチドの野生型バージョンと比較して突然変異（例えば、置換、挿入、欠失）を含む。

本発明の融合タンパク質は、核酸編集ドメインを含む。ある態様において、核酸編集ドメインは、CからUへの塩基変化を触媒することができる。ある態様において、核酸編集ドメインは、デアミナーゼドメインである。ある態様において、デアミナーゼは、シチジンデアミナーゼまたはアデノシンデアミナーゼである。ある態様において、デアミナーゼは、アポリポタンパク質B mRNA編集複合体 (APOBEC) ファミリーデアミナーゼである。ある態様において、デアミナーゼは、APOBEClデアミナーゼである。ある態様において、デアミナーゼは、APOBEC 2デアミナーゼである。ある態様において、デアミナーゼは、APOBEC3デアミナーゼである。ある態様において、デアミナーゼは、APOBEC3Aデアミナーゼである。ある態様において、デアミナーゼは、APOBEC3Bデアミナーゼである。ある態様において、デアミナーゼは、APOBEC3Cデアミナーゼである。ある態様において、デアミナーゼは、APOBEC3Dデアミナーゼである。ある態様において、デアミナーゼは、APOBEC3Eデアミナーゼである。ある態様において、デアミナーゼは、APOBEC3Fデアミナーゼである。ある態様において、デアミナーゼは、APOBEC3Gデアミナーゼである。ある態様において、デアミナーゼは、APOBEC3Hデアミナーゼである。ある態様において、デアミナーゼは、APOBEC4デアミナーゼである。

ある態様において、デアミナーゼは、活性化誘導デアミナーゼ (AID) である。

ある態様において、デアミナーゼは、脊椎動物デアミナーゼである。ある態様において、デアミナーゼは、無脊椎動物デアミナーゼである。ある態様において、デアミナーゼは、ヒト、チンパンジー、ゴリラ、サル、ウシ、イヌ、ラット、またはマウスデアミナーゼである。ある態様において、デアミナーゼは、ヒトデアミナーゼである。ある態様において、デアミナーゼは、ラットデアミナーゼ、例えば、rAPOBEC1である。ある態様において、デアミナーゼは、Petromyzon marinusシチジンデアミナーゼ1 (pmCDAl) である。ある態様において、デアミナーゼは、ヒトAPOBEC3Gである。ある態様において、デアミナーゼは、ヒトAPOBEC3Gの断片である。ある態様において、核酸編集ドメインは、本明細書に記載される任意のデアミナーゼのデアミナーゼドメインに対して少なくとも80%、少なくとも85%、少なくとも90%、少なくとも92%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%) 、または少なくとも99.5%の同一性である。

［リンカー］
ある実施形態において、本発明のペプチドまたはペプチドドメインのいずれかを連結するためにリンカーが使用され得る。リンカーは、共有結合のように単純であり得、またはそれは、多原子の長さであるポリマーリンカーであり得る。ある実施形態において、リンカーは、ポリペプチドであるか、またはアミノ酸に基づくものである。他の実施形態において、リンカーはペプチド様ではない。ある実施形態において、リンカーは、共有結合（例えば、炭素-炭素結合、ジスルフィド結合、炭素-ヘテロ原子結合、等）である。ある実施形態において、リンカーは、アミド連結の炭素-窒素結合である。特定の実施形態では、リンカーは、環状又は非環状、置換又は非置換、分枝又は非分枝の脂肪族又はヘテロ脂肪族リンカーである。ある実施形態において、リンカーは、ポリマー（例えばポリエチレン、ポリエチレングリコール、ポリアミド、ポリエステル、その他）である。特定の実施形態では、リンカーは、アミノアルカン酸のモノマー、ダイマー又はポリマーを含む。ある実施形態において、リンカーは、アミノアルカン酸（例えば、グリシン、エタン酸、アラニン、ベータ-アラニン、3-アミノプロパン酸、4-アミノブタン酸、5-ペンタン酸、等）を含む。特定の実施形態では、リンカーは、アミノヘキサン酸 (Ahx) のモノマー、ダイマー又はポリマーを含む。ある態様において、リンカーは、炭素環部分（例えばシクロペンタン、シクロヘキサン）に基づく。他の実施形態において、リンカーは、ポリエチレングリコール部分 (PEG) を含む。他の実施形態において、リンカーはアミノ酸を含む。ある態様において、リンカーはペプチドを含む。ある実施形態において、リンカーは、アリールまたはヘテロアリール部分を含む。ある実施形態において、リンカーは、フェニル環に基づく。リンカーは、ペプチドからの求核剤（例えばチオール、アミノ）がリンカーに結合することを促進するための官能化部分を含み得る。リンカーの一部として任意の求電子剤を使用することができる。例示的な求電子剤としては、活性化エステル、活性化アミド、マイケル受容体、ハロゲン化アルキル、ハロゲン化アリール、ハロゲン化アシル、およびイソチオシアナートが挙げられるが、これらに限定されない。

ある実施形態において、リンカーは、一アミノ酸または複数のアミノ酸（例えばペプチドまたはタンパク質）である。いくつかの実施形態において、リンカーは、結合（例えば共有結合）、有機分子、基、ポリマー、または化学的部分である。ある実施形態において、リンカーは、長さが約3～約104（例えば5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、55、60、65、70、75、80、85、90、95、または100）アミノ酸である。

いくつかの実施形態において、アデノシンデアミナーゼおよびnapDNAbpは、長さが４、１６、３２、または１０４アミノ酸であるリンカーを介して融合される。いくつかの実施形態において、リンカーは、長さが約３から約１０４アミノ酸である。いくつかの実施形態において、本明細書で提供される融合タンパク質のいずれかは、リンカーを介して互いに融合されたアデノシンデアミナーゼおよびCas9ドメインを含む。核酸塩基エディターの活性のための最適な長さを達成するために、デアミナーゼドメイン（例えば、工学操作されたecTadA）およびCas9ドメインの間で種々のリンカーの長さおよび柔軟性を利用することができる（例えば、(GGGS)_n、(GGGGS)_n、および(G)_nの形態の非常に柔軟なリンカーから、(EAAAK)_n、 (SGGS)_n、SGSETPGTSESATPESの形態のより剛性の高いリンカーまで(例えばGuilinger JP, Thompson DB, Liu DR. Fusion of catalytically inactive Cas9 to FokI nuclease improves the specificity of genome modification. Nat. Biotechnol. 2014; 32(6): 577-82参照。その全内容は参照によりここに組み込まれる)、および (XP)_n）。いくつかの実施態様において、nは、1、2、3、4、5、6、7、8、9、10、11、12、13、14又は15である。ある実施形態において、リンカーは、(GGS)_nモチーフを含み、ここで、nは、1、3、または7である。いくつかの実施形態において、本明細書で提供される融合タンパク質のいずれかのアデノシンデアミナーゼおよびCas9ドメインは、アミノ酸配列SGSETPGTSESATPESを含むリンカー（例えばXTENリンカー）を介して融合される。

［ガイドRNAを伴うCas9複合体］
本開示のいくつかの側面は、本明細書で提供された融合タンパク質のいずれかと、融合タンパク質のCas9ドメイン（例えばdCas9、ヌクレアーゼ活性Cas9、またはCas9ニッカーゼ）に結合されたガイドRNA（例えば、A＼突然変異を標的とするガイド）とを含む複合体を提供する。これらの複合体はリボヌクレオタンパク質（RNP）とも呼ばれる。核酸塩基エディターの活性のための最適な長さを達成するために、融合タンパク質のドメインを連結する任意の方法が利用され得る（例えば、(GGGS)_n、(GGGGS)_n、および(G)_nの形態の非常に柔軟なリンカーから、(EAAAK)_n、(SGGS)_n、SGSETPGTSESATPESの形態のより剛性の高いリンカーまで（例えばGuilinger JP, Thompson DB, Liu DR. Fusion of catalytically inactive Cas9 to FokI nuclease improves the specificity of genome modification. Nat. Biotechnol. 2014; 32(6): 577-82参照。その全内容は参照によりここに組み込まれる）、および (XP)_n）。いくつかの実施態様において、nは、1、2、3、4、5、6、7、8、9、10、11、12、13、14又は15である。ある実施形態において、リンカーは、(GGS)_nモチーフを含み、ここで、nは、1、3、または7である。いくつかの実施形態において、本明細書で提供される融合タンパク質のCas9ドメインは、アミノ酸配列SGSETPGTSESATPESを含むリンカーを介して融合される。

ある態様において、ガイド核酸(例えばガイドRNA)は、15～100ヌクレオチド長であり、標的配列に相補的である少なくとも10個の連続するヌクレオチドの配列を含む。いくつかの実施形態において、ガイドRNAは、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、または50ヌクレオチドの長さである。いくつかの実施形態において、ガイドRNAは、標的配列に相補的な15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、または40個の連続したヌクレオチドの配列を含む。ある態様において、標的配列はDNA配列である。ある態様において、標的配列は、細菌、酵母、真菌、昆虫、植物または動物のゲノムにおける配列である。ある態様において、標的配列は、ヒトのゲノムにおける配列である。いくつかの実施形態において、標的配列の3’末端は、標準PAM配列 (NGG) にすぐ隣接している。いくつかの実施形態において、標的配列の3’末端は、非正準PAM配列（例えば表１に列挙されている配列または5’-NAA-3’）にすぐ隣接している。いくつかの実施形態において、ガイド核酸（例えばガイドRNA）は、目的の遺伝子（例えば、疾患または障害に関連する遺伝子）の配列に相補的である。

本開示のいくつかの態様は、本明細書に提供される融合タンパク質または複合体を使用する方法を提供する。例えば、本開示のいくつかの局面は、DNA分子を、本明細書中に提供される融合タンパク質のいずれか、および少なくとも一つのガイドRNAと接触させることを含む方法を提供し、ここで、ガイドRNAは、約15～100ヌクレオチド長であり、標的配列に相補的である少なくとも10個の連続したヌクレオチドの配列を含む。いくつかの実施形態において、標的配列の3’末端は、正準PAM配列（NGG）にすぐ隣接している。いくつかの実施形態において、標的配列の3’末端は、正準PAM配列（NGG）にすぐ隣接していない。いくつかの実施形態において、標的配列の3’末端は、AGC、GAG、TTT、GTG、またはCAA配列にすぐ隣接している。いくつかの実施形態において、標的配列の3’末端は、NGA、NGCG、NGN、NNGRRT、NNNRRT、NGCG、NGCN、NGTN、NGTN、NGTN、または5’ (TTTV) 配列にすぐ隣接している。

本開示のいくつかの態様は、本明細書で提供される融合タンパク質のいずれかと、疾患関連遺伝子または疾患原因遺伝子のエキソンの5’に位置するイントロン配列中のAGスプライスアクセプターを標的とするガイドRNAとを含む複合体を提供する。一実施形態では、標的化されるイントロンAGスプライスアクセプターは、ALSに関連するSOD1遺伝子のエキソン3の5’に位置する。

ある態様において、ガイド核酸(例えばガイドRNA)は、15～100ヌクレオチド長であり、標的配列に相補的である少なくとも10個の連続するヌクレオチドの配列を含む。いくつかの実施形態において、ガイドRNAは、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、または50ヌクレオチドの長さである。いくつかの実施形態において、ガイドRNAは、標的配列に相補的な15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、または40個の連続したヌクレオチドの配列を含む。ある態様において、標的配列はDNA配列である。ある態様において、標的配列は、細菌、酵母、真菌、昆虫、植物または動物のゲノムにおける配列である。ある態様において、標的配列は、ヒトのゲノムにおける配列である。いくつかの実施形態において、標的配列の3’末端は、標準PAM配列 (NGG) にすぐ隣接している。いくつかの実施形態において、標的配列の3’末端は、非正準PAM配列（例えば表１に列挙されている配列または5’-NAA-3’）にすぐ隣接している。いくつかの実施形態において、ガイド核酸（例えばガイドRNA）は、SOD1遺伝子のエキソン3の5’に位置するAGスプライスアクセプター配列に相補的である。

本開示のいくつかの態様は、本明細書に提供される融合タンパク質または複合体を使用する方法を提供する。例えば、本開示のいくつかの局面は、DNA分子を、本明細書中に提供される融合タンパク質のいずれか、および少なくとも一つのガイドRNAと接触させることを含む方法を提供し、ここで、ガイドRNAは、約15～100ヌクレオチド長であり、標的配列に相補的である少なくとも10個の連続したヌクレオチドの配列を含む。いくつかの実施形態において、標的配列の3’末端は、正準PAM配列（NGG）にすぐ隣接している。いくつかの実施形態において、標的配列の3’末端は、AGC、GAG、TTT、GTG、またはCAA配列にすぐ隣接している。いくつかの実施形態において、標的配列の3’末端は、NGA、NAA、NGCG、NGN、NNGRRT、NNNRRT、NGCG、NGCN、NGTN、NGTN、NGTN、または5’ (TTTV) 配列にすぐ隣接している。

それぞれの配列における特定の位置または残基の番号付けは、使用される特定のタンパク質および番号付けスキームに依存することが理解されるであろう。たとえば、成熟タンパク質の前駆体と成熟タンパク質そのものとでは番号付けが異なることがあり、種ごとの配列の違いが番号付けに影響することがある。当業者は、当業者に周知の方法、例えば、配列アラインメントおよび相同的残基の決定によって、任意の相同的タンパク質およびそれぞれのコード核酸中のそれぞれの残基を同定することができる。

本明細書に開示された融合タンパク質のいずれかを標的部位、例えば、編集される突然変異を含む部位にターゲティングするためには、融合タンパク質をガイドRNAと共に共発現させることが典型的に必要であることは当業者には明らかであろう。本明細書の他の箇所でより詳細に説明されるように、ガイドRNAは、典型的には、Cas9結合を可能にするtracrRNAフレームワークと、Cas9:核酸編集酵素/ドメイン融合タンパク質に配列特異性を付与するガイド配列とを含む。あるいは、ガイドRNAおよびtracrRNAは、2つの核酸分子として別々に提供され得る。いくつかの態様において、ガイドRNAは、ガイド配列が標的配列に相補的な配列を含むという構造を含む。ガイド配列は典型的には20ヌクレオチド長である。Cas9:核酸編集酵素/ドメイン融合タンパク質を特定のゲノム標的部位にターゲティングするための適切なガイドRNAの配列は、本開示に基づいて当業者に明らかであろう。そのような適切なガイドRNA配列は、典型的には、編集される標的ヌクレオチドの50ヌクレオチド以内の上流または下流内の核酸配列に相補的なガイド配列を含む。提供された融合タンパク質のいずれかを特定の標的配列に標的化するのに適したいくつかの例示的なガイドRNA配列が本明細書に提供される。

［ガイドRNAを伴うCas12複合体］
本開示のいくつかの側面は、本明細書で提供された融合タンパク質のいずれかと、ガイドRNA（例えば、標的ポリヌクレオチドを編集のための標的とするガイド）とを含む複合体を提供する。

ある態様において、ガイド核酸(例えばガイドRNA)は、15～100ヌクレオチド長であり、標的配列に相補的である少なくとも10個の連続するヌクレオチドの配列を含む。いくつかの実施形態において、ガイドRNAは、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、または50ヌクレオチドの長さである。いくつかの実施形態において、ガイドRNAは、標的配列に相補的な15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、または40個の連続したヌクレオチドの配列を含む。ある態様において、標的配列はDNA配列である。ある態様において、標的配列は、細菌、酵母、真菌、昆虫、植物または動物のゲノムにおける配列である。ある態様において、標的配列は、ヒトのゲノムにおける配列である。いくつかの実施形態において、標的配列の3’末端は、標準PAM配列にすぐ隣接している。いくつかの実施形態において、標的配列の3’末端は、非正準PAM配列にすぐ隣接している。

本開示のいくつかの態様は、本明細書に提供される融合タンパク質または複合体を使用する方法を提供する。例えば、本開示のいくつかの局面は、DNA分子を、本明細書中に提供される融合タンパク質のいずれか、および少なくとも一つのガイドRNAと接触させることを含む方法を提供し、ここで、ガイドRNAは、約15～100ヌクレオチド長であり、標的配列に相補的である少なくとも10個の連続したヌクレオチドの配列を含む。いくつかの実施形態において、標的配列の3’末端は、例えばTTN、DTTN、GTTN、ATTN、ATTC、DTTNT、WTTN、HATY、TTTN、TTTV、TTTC、TG、RTR、またはYTN PAMサイトにすぐ隣接している。

本明細書に開示された融合タンパク質のいずれかを標的部位、例えば、編集される突然変異を含む部位にターゲティングするためには、融合タンパク質をガイドRNAと共に共発現させることが典型的に必要であることは当業者には明らかであろう。本明細書の他の箇所でより詳細に説明されるように、ガイドRNAは、典型的には、Cas12結合を可能にするtracrRNAフレームワークと、Cas12:核酸編集酵素/ドメイン融合タンパク質に配列特異性を付与するガイド配列とを含む。あるいは、ガイドRNAおよびtracrRNAは、2つの核酸分子として別々に提供され得る。いくつかの態様において、ガイドRNAは、ガイド配列が標的配列に相補的な配列を含むという構造を含む。ガイド配列は典型的には20ヌクレオチド長である。Cas12:核酸編集酵素/ドメイン融合タンパク質を特定のゲノム標的部位にターゲティングするための適切なガイドRNAの配列は、本開示に基づいて当業者に明らかであろう。そのような適切なガイドRNA配列は、典型的には、編集される標的ヌクレオチドの50ヌクレオチド以内の上流または下流内の核酸配列に相補的なガイド配列を含む。提供された融合タンパク質のいずれかを特定の標的配列に標的化するのに適したいくつかの例示的なガイドRNA配列が本明細書に提供される。

本明細書に開示される塩基エディターのドメインは、デアミナーゼドメインがCas12タンパク質に内在化されている限り、任意の順序で配置することができる。例えばCas12ドメインとデアミナーゼドメインを含む融合タンパク質を含む塩基エディターの非限定的な例は、以下のように配置され得る：
NH2-[Cas12ドメイン]-リンカー1-[ABE8]-リンカー2-[Cas12ドメイン]-COOH;
NH2-[Cas12ドメイン]-リンカー1-[ABE8]-[Cas12ドメイン]-COOH;
NH2-[Cas12ドメイン]-[ABE8]-リンカー2-[Cas12ドメイン]-COOH;
NH2-[Cas12ドメイン]-[ABE8]-[Cas12ドメイン]-COOH;
NH2-[Cas12ドメイン]-リンカー1-[ABE8]-リンカー2-[Cas12ドメイン]-[イノシンBER阻害因子]-COOH;
NH2-[Cas12ドメイン]-リンカー1-[ABE8]-[Cas12ドメイン]-[イノシンBER阻害因子]-COOH;
NH2-[Cas12ドメイン]-[ABE8]-リンカー2-[Cas12ドメイン]-[イノシンBER阻害因子]-COOH;;
NH2-[Cas12ドメイン]-[ABE8]-[Cas12ドメイン]-[イノシンBER阻害因子]-COOH;
NH2-[イノシンBER阻害因子]-[Cas12ドメイン]-リンカー1-[ABE8]-リンカー2-[Cas12ドメイン]-COOH;
NH2-[イノシンBER阻害因子]-[Cas12ドメイン]-リンカー1-[ABE8]-[Cas12ドメイン]-COOH;
NH2-[イノシンBER阻害因子]-[Cas12ドメイン]-[ABE8]-リンカー2-[Cas12ドメイン]-COOH;
NH2-[イノシンBER阻害因子]NH2-[Cas12ドメイン]-[ABE8]-[Cas12ドメイン]-COOH;

さらに、場合によっては、Gamタンパク質を塩基エディターのN末端に融合させることができる。場合によっては、Gamタンパク質を塩基エディタのC末端に融合させることができる。バクテリオファージMuのGamタンパク質は二本鎖切断 (DSB) の末端に結合し、それらを分解から保護することができる。いくつかの実施形態において、Gamを使用してDSBの遊離末端を結合することにより、塩基編集のプロセス中のインデル形成を低減することができる。いくつかの実施形態において、174残基のGamタンパク質は、塩基エディターのN末端に融合される。Komor, A.C., et al., “Improved base excision repair inhibition and bacteriophage Mu Gam protein yields C:G-to-T:A base editors with higher efficiency and product purity” Science Advances 3:eaao4774 (2017)を参照されたい。場合によっては、1つまたは複数の突然変異が、野生型ドメインと比較して、塩基編集ドメインの長さを変化させることができる。例えば、少なくとも1つのドメインにおける少なくとも1つのアミノ酸の欠失は、塩基エディターの長さを短くすることができる。別の例では、1つまたは複数の突然変異は、野生型ドメインに対するドメインの長さを変化させない。例えば、いずれかのドメインにおける置換（複数可）は塩基エディターの長さを変えない。すべてのドメインの長さが野生型ドメインと同じであるそのような塩基エディターの非限定的な例としては、以下のものが挙げられる：
NH2-[Cas12ドメイン]-リンカー1-[APOBEC1]-リンカー2-[Cas12ドメイン]-COOH;
NH2-[Cas12ドメイン]-リンカー1-[APOBEC1]-[Cas12ドメイン]-COOH;
NH2-[Cas12ドメイン]-[APOBEC1]-リンカー2-[Cas12ドメイン]-COOH;
NH2-[Cas12ドメイン]-[APOBEC1]-[Cas12ドメイン]-COOH;
NH2-[Cas12ドメイン]-リンカー1-[APOBEC1]-リンカー2-[Cas12ドメイン]-[UGI]-COOH;
NH2-[Cas12ドメイン]-リンカー1-[APOBEC1]-[Cas12ドメイン]-[UGI]-COOH;
NH2-[Cas12ドメイン]-[APOBEC1]-リンカー2-[Cas12ドメイン]-[UGI]-COOH;
NH2-[Cas12ドメイン]-[APOBEC1]-[Cas12ドメイン]-[UGI]-COOH;
NH2-[UGI]-[Cas12ドメイン]-リンカー1-[APOBEC1]-リンカー2-[Cas12ドメイン]-COOH;
NH2-[UGI]-[Cas12ドメイン]-リンカー1-[APOBEC1]-[Cas12ドメイン]-COOH;
NH2-[UGI]-[Cas12ドメイン]-[APOBEC1]-リンカー2-[Cas12ドメイン]-COOH;
NH2-[UGI]-[Cas12ドメイン]-[APOBEC1]-[Cas12ドメイン]-COOH;

いくつかの実施形態において、本明細書中で提供される塩基編集融合タンパク質は、正確な位置、例えば、標的塩基が規定された領域(例えば「脱アミノ化ウィンドウ」)内に配置されるような位置に配置される必要がある。場合によっては、標的は4塩基領域内にあり得る。場合によっては、そのような規定された標的領域は、PAMの約15塩基上流にあり得る。Komor, A.C., et al., “Programmable editing of a target base in genomic DNA without double-stranded DNA cleavage” Nature 533, 420-424 (2016); Gaudelli, N.M., et al., “Programmable base editing of A・T to G・C in genomic DNA without DNA cleavage” Nature 551, 464-471 (2017); and Komor, A.C., et al., “Improved base excision repair inhibition and bacteriophage Mu Gam protein yields C:G-to-T:A base editors with higher efficiency and product purity”Science Advances 3:eaao4774 (2017) 参照；その全内容が参照により本明細書に組み入れられる。

定義された標的領域は、脱アミノ化ウィンドウであり得る。脱アミノ化ウィンドウは、塩基エディターが標的ヌクレオチドに作用して脱アミノ化する、規定された領域であり得る。いくつかの実施態様において、脱アミノ化ウィンドウは、2、3、4、5、6、7、8、9又は10塩基領域内にある。いくつかの実施態様において、脱アミノ化ウィンドウは、PAMの5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24又は25塩基上流にある。

本開示の塩基エディターは、標的ポリヌクレオチド配列の編集を促進させる任意のドメイン、特徴またはアミノ酸配列を含むことができる。例えば、いくつかの実施形態において、塩基エディターは、核局在化配列 (NLS) を含む。いくつかの実施形態において、塩基エディターのNLSは、デアミナーゼドメインとnapDNAbpドメインとの間に位置する。いくつかの実施形態において、塩基エディターのNLSは、napDNAbpドメインに対してC末端に位置する。

融合タンパク質に含まれるタンパク質ドメインは、異種機能ドメインであり得る。融合タンパク質に含めることができるタンパク質ドメインの非限定的な例には、デアミナーゼドメイン（例えば、シチジンデアミナーゼおよび／またはアデノシンデアミナーゼ）、ウラシルグリコシラーゼ阻害因子（UGI）ドメイン、エピトープタグ、およびレポーター遺伝子配列が含まれる。タンパク質ドメインは、例えば、以下の活性のうちの１つ以上を有する異種機能ドメインであり得る：転写活性化活性、転写抑制活性、転写放出因子活性、遺伝子サイレンシング活性、クロマチン修飾活性、エピジェネティック修飾活性、ヒストン修飾活性、RNA切断活性、および核酸結合活性。そのような異種機能ドメインは、標的DNAに付随する標的ポリペプチド（例えば、ヒストン、DNA結合タンパク質など）の修飾などの、機能活性を付与し得、例えば、ヒストンメチル化、ヒストンアセチル化、ヒストンユビキチン化をもたらすことができる。付与される他の機能および／または活性には、トランスポゼーズ活性、インテグラーゼ活性、リコンビナーゼ活性、リガーゼ活性、ユビキチンリガーゼ活性、脱ユビキチン化活性、アデニル化活性、脱デニル化活性、SUMO化活性、脱SUMO化活性、または上記の任意の組み合わせが含まれ得る。

ドメインは、エピトープタグ、レポータータンパク質、その他の結合ドメインで検出または標識され得る。エピトープタグの非限定的な例には、ヒスチジン（His）タグ、V5タグ、FLAGタグ、インフルエンザ血球凝集素（HA）タグ、Mycタグ、VSV-Gタグ、およびチオレドキシン（Trx）タグが含まれる。レポーター遺伝子の例には、グルタチオン-5-トランスフェラーゼ（GST）、ホースラディッシュペルオキシダーゼ（HRP）、クロラムフェニコールアセチルトランスフェラーゼ（CAT）、ベータガラクトシダーゼ、ベータグルクロニダーゼ、ルシフェラーゼ、緑色蛍光タンパク質（GFP）、HcRed、DsRed、シアン蛍光タンパク質（CFP）、黄色蛍光タンパク質（YFP）、および青色蛍光タンパク質（BFP）を含む自己蛍光タンパク質が含まれますが、これらに限定されない。追加のタンパク質配列としては、マルトース結合タンパク質（MBP）、Sタグ、Lex A DNA結合ドメイン（DBD）融合、GAL4 DNA結合ドメイン融合、および単純ヘルペスウイルス（HSV）BP16タンパク質融合などを含むがこれらに限定されない、DNA分子または他の細胞分子に結合するアミノ酸配列が挙げられる。

いくつかの実施形態において、BhCas12bガイドポリヌクレオチドは、以下の配列を有する：
BhCas12b sgRNAスキャフォールド（下線）+ 20nt～23ntガイド配列（N_nによって示される）
5’GTTCTGTCTTTTGGTCAGGACAACCGTCTAGCTATAAGTGCTGCAGGGTGTGAGAAACTCCTATTGCTGGACGATGTCTCTTACGAGGCATTAGCACNNNNNNNNNNNNNNNNNNNN-3’

いくつかの実施形態において、BvCas12bおよびAaCas12bガイドポリヌクレオチドは、以下の配列を有する：
BvCas12b sgRNAスキャフォールド（下線）+ 20nt～23ntガイド配列（N_nによって示される）
5’GACCTATAGGGTCAATGAATCTGTGCGTGTGCCATAAGTAATTAAAAATTACCCACCACAGGAGCACCTGAAAACAGGTGCTTGGCACNNNNNNNNNNNNNNNNNNNN-3’

AaCas12b sgRNAスキャフォールド（下線）+ 20nt～23ntガイド配列（N_nによって示される）
5’GTCTAAAGGACAGAATTTTTCAACGGGTGTGCCAATGGCCACTTTCCAGGTGGCAAAGCCCGTTGAACTTCTCAAAAAGAACGATCTGAGAAGTGGCACNNNNNNNNNNNNNNNNNNNN-3’

［アデノシンデアミナーゼバリアントおよびCas9ドメインを含む融合タンパク質を使用する方法］
本開示のいくつかの態様は、本明細書に提供される融合タンパク質または複合体を使用する方法を提供する。例えば、本開示のいくつかの局面は、タンパク質の突然変異形態をコードするDNA分子を、本明細書中に提供される融合タンパク質のいずれか、および少なくとも一つのガイドRNAと接触させることを含む方法を提供し、ここで、ガイドRNAは、約15～100ヌクレオチド長であり、標的配列に相補的である少なくとも10個の連続したヌクレオチドの配列を含む。いくつかの実施形態において、標的配列の3’末端は、正準PAM配列 (NGG) に直接隣接する。いくつかの実施形態において、標的配列の3'末端は、正準PAM配列 (NGG) に直接隣接していない。いくつかの実施形態において、標的配列の3’末端は、AGC、GAG、TTT、GTG、またはCAA配列にすぐ隣接している。いくつかの実施形態において、標的配列の3’末端は、NGA、NGCG、NGN、NNGRRT、NNNRRT、NGCG、NGCN、NGTN、NGTN、NGTN、または5’ (TTTV) 配列にすぐ隣接している。

本明細書に開示された、Cas9ドメインとアデノシンデアミナーゼバリアント（例えばABE8）を含む融合タンパク質のいずれかを標的部位、例えば、編集される突然変異を含む部位にターゲティングするためには、融合タンパク質をガイドRNA、例えばsgRNAと共に共発現させることが典型的に必要であることは当業者には明らかであろう。本明細書の他の箇所でより詳細に説明されるように、ガイドRNAは、典型的には、Cas9結合を可能にするtracrRNAフレームワークと、Cas9:核酸編集酵素/ドメイン融合タンパク質に配列特異性を付与するガイド配列とを含む。あるいは、ガイドRNAおよびtracrRNAは、2つの核酸分子として別々に提供され得る。いくつかの態様において、ガイドRNAは、ガイド配列が標的配列に相補的な配列を含むという構造を含む。ガイド配列は典型的には20ヌクレオチド長である。Cas9:核酸編集酵素/ドメイン融合タンパク質を特定のゲノム標的部位にターゲティングするための適切なガイドRNAの配列は、本開示に基づいて当業者に明らかであろう。そのような適切なガイドRNA配列は、典型的には、編集される標的ヌクレオチドの50ヌクレオチド以内の上流または下流内の核酸配列に相補的なガイド配列を含む。提供された融合タンパク質のいずれかを特定の標的配列に標的化するのに適したいくつかの例示的なガイドRNA配列が本明細書に提供される。

［塩基エディターの効率性］
CRISPR-Cas9ヌクレアーゼは、標的ゲノム編集を媒介するために広く使用されている。ほとんどのゲノム編集応用において、Cas9はガイドポリヌクレオチド(例えば単一ガイドRNA (sgRNA))と複合体を形成し、sgRNA配列により指定される標的部位で二本鎖DNA切断 (DSB) を誘導する。細胞は主に非相同末端結合 (NHEJ) 修復経路を介してこのDSBに応答し、遺伝子を破壊するフレームシフト変異を生じる確率的挿入または欠失 (インデル) を生じる。DSBに隣接する配列と高度の相同性を有するドナーDNA鋳型の存在下で、相同性指向性修復 (HDR) として知られる代替経路を介して遺伝子補正が達成され得る。残念ながら、ほとんどの非侵襲的条件下では、HDRは非効率であり、細胞状態および細胞型に依存し、より高いインデルの頻度によって支配される。ヒトの疾患に関連する既知の遺伝的変異の大部分は点突然変異であるため、より効率的かつクリーンに正確な点突然変異を作製できる方法が必要である。本明細書に提供される塩基編集システムは、二本鎖DNA切断を生じることなく、ドナーDNA鋳型を必要とせず、かつ過剰な確率的挿入および欠失を誘導することなく、ゲノム編集を提供するための新しい方法を提供する。

いくつかの態様において、疾患関連遺伝子のエキソンの5’の非コード領域におけるスプライスアクセプターの正確な塩基編集によって疾患関連遺伝子のmRNA転写物のスプライシングを破壊することができる方法が必要であり、本明細書に提供される。一実施形態では、疾患関連遺伝子は、ALSに関連するSOD1遺伝子である。一実施形態では、SOD1遺伝子のエキソン3の5'にあるスプライスアクセプターのＡからＧへの塩基編集が提供されて、SOD1 mRNA転写物のスプライシングを破壊し、したがって、切り詰め型SOD1タンパク質産物または非機能的（ヌル）タンパク質を生じる。

本発明の融合タンパク質は、著しい割合のインデルを生成することなく、変異を含むタンパク質をコードする特定のヌクレオチド塩基を有利に改変させる。本明細書において使用されるところの「インデル（indel）」は、核酸内のヌクレオチド塩基の挿入または欠失を指す。このような挿入または欠失は、遺伝子のコード領域内でフレームシフト突然変異を引き起こす可能性がある。いくつかの実施形態において、核酸において多数の挿入または欠失（すなわちインデル）を生じることなく、核酸内の特定のヌクレオチドを効率的に改変（例えば変異または脱アミノ化）する塩基エディターを生成することが望ましい。特定の実施形態では、本明細書に提供される塩基エディターのいずれかが、インデルと比べて意図された改変（例えば突然変異または脱アミノ化）のより大きな割合を生成することができる。

いくつかの実施形態において、本明細書で提供される塩基エディター系のいずれかは、標的ポリヌクレオチド配列において、50%未満、40%未満、30%未満、20%未満、19%未満、18%未満、17%未満、16%未満、15%未満、14%未満、13%未満、12%未満、11%未満、10%未満、9%未満、8%未満、7%未満、6%未満、5%未満、4%未満、3%未満、2%未満、1%未満、0.9%未満、0.8%未満、未満、0.7%未満、0.6%未満、0.5%未満、0.4%未満、0.3%未満、0.2%未満、0.1%未満、0.09%未満、0.08%未満、0.07%未満、未満、0.06%未満、0.05%未満、0.04%未満、0.03%未満、0.02%未満、または0.01%未満のインデル形成をもたらす。

いくつかの実施形態において、本明細書に記載されるABE8塩基エディターバリアントの１つを含む塩基エディター系のいずれかは、標的ポリヌクレオチド配列において、50%未満、40%未満、30%未満、20%未満、19%未満、18%未満、17%未満、16%未満、15%未満、14%未満、13%未満、12%未満、11%未満、10%未満、9%未満、8%未満、7%未満、6%未満、5%未満、4%未満、3%未満、2%未満、1%未満、0.9%未満、0.8%未満、未満、0.7%未満、0.6%未満、0.5%未満、0.4%未満、0.3%未満、0.2%未満、0.1%未満、0.09%未満、0.08%未満、0.07%未満、未満、0.06%未満、0.05%未満、0.04%未満、0.03%未満、0.02%未満、または0.01%未満のインデル形成をもたらす。いくつかの実施形態において、本明細書に記載のABE8塩基エディターバリアントの１つを含む塩基エディターシステムのいずれかは、標的ポリヌクレオチド配列において0.8%未満のインデル形成をもたらす。いくつかの実施形態において、本明細書に記載のABE8塩基エディターバリアントの１つを含む塩基エディターシステムのいずれかは、標的ポリヌクレオチド配列において最大で0.8%のインデル形成をもたらす。いくつかの実施形態において、本明細書に記載のABE8塩基エディターバリアントの１つを含む塩基エディターシステムのいずれかは、標的ポリヌクレオチド配列において0.3%未満のインデル形成をもたらす。いくつかの実施形態において、記載されたABE8塩基エディターバリアントの１つを含む塩基エディターシステムのいずれかは、ABE7塩基エディターの１つを含む塩基エディターシステムと比較して、標的ポリヌクレオチド配列におけるより低いインデル形成をもたらす。いくつかの実施形態において、本明細書に記載のABE8塩基エディターバリアントの１つを含むエディターシステムのいずれかは、ABE7.10を含む塩基エディターシステムと比較して、標的ポリヌクレオチド配列におけるより低いインデル形成をもたらす。

いくつかの実施形態では、本明細書に記載のABE8塩基エディターバリアントの１つを含む塩基エディターシステムのいずれかは、ABE7塩基エディターの１つを含む塩基エディターシステムと比較してインデル頻度が減少している。いくつかの実施形態では、本明細書に記載のABE8塩基エディターバリアントの１つを含む塩基エディターシステムのいずれかは、ABE7塩基エディターの１つを含む塩基エディターシステムと比較してインデル頻度が少なくとも0.01%、少なくとも1%、少なくとも2%、少なくとも3%、少なくとも4%、少なくとも5%、少なくとも10％、少なくとも15％、少なくとも20％、少なくとも25％、少なくとも30％、少なくとも35％、少なくとも40％、少なくとも45％、少なくとも50％、少なくとも55％、少なくとも60％、少なくとも65％、少なくとも70％、少なくとも75％、少なくとも80％、少なくとも85％、少なくとも90％、または少なくとも95％減少している。いくつかの実施形態では、本明細書に記載のABE8塩基エディターバリアントの１つを含む塩基エディターシステムは、ABE7.10を含む塩基エディターシステムと比較してインデル頻度が少なくとも0.01%、少なくとも1%、少なくとも2%、少なくとも3%、少なくとも4%、少なくとも5%、少なくとも10％、少なくとも15％、少なくとも20％、少なくとも25％、少なくとも30％、少なくとも35％、少なくとも40％、少なくとも45％、少なくとも50％、少なくとも55％、少なくとも60％、少なくとも65％、少なくとも70％、少なくとも75％、少なくとも80％、少なくとも85％、少なくとも90％、または少なくとも95％減少している。

本発明は、効率および特異性が増加したアデノシンデアミナーゼバリアント（例えば、ABE8バリアント）を提供する。特に、本明細書に記載のアデノシンデアミナーゼバリアントは、ポリヌクレオチド内の所望の塩基を編集する可能性がより高く、改変されることが意図されていない塩基（例えば「バイスタンダー」）を編集する可能性がより低い。

いくつかの実施形態では、本明細書に記載のABE8塩基エディターバリアントの１つを含む塩基編集システムのいずれかは、バイスタンダーの編集または変異が低減されている。いくつかの実施形態において、意図しない編集または変異は、バイスタンダー変異またはバイスタンダー編集、例えば、標的ヌクレオチド配列の標的ウィンドウ中の意図しない位置または非標的位置における標的塩基（例えばAまたはC）の塩基編集である。いくつかの実施形態では、本明細書に記載のABE8塩基エディターバリアントの１つを含む塩基編集システムのいずれかは、ABE7塩基エディター、例えば、ABE7.10を含む塩基エディターシステムと比較して、バイスタンダーの編集または変異が減少している。いくつかの実施形態において、本明細書に記載のABE8塩基エディターバリアントの１つを含む塩基編集システムのいずれかは、ABE7塩基エディター、例えばABE7.10を含む塩基エディターシステムと比べてバイスタンダーの編集または変異が少なくとも1%、少なくとも2%、少なくとも3%、少なくとも4%、少なくとも5%、少なくとも10％、少なくとも15％、少なくとも20％、少なくとも25％、少なくとも30％、少なくとも35％、少なくとも40％、少なくとも45％、少なくとも50％、少なくとも55 ％、少なくとも60％、少なくとも65％、少なくとも70％、少なくとも75％、少なくとも80％、少なくとも85％、少なくとも90％、少なくとも95％、または少なくとも99％低減されている。いくつかの実施形態において、本明細書に記載のABE8塩基エディターバリアントの１つを含む塩基編集システムのいずれかは、ABE7塩基エディター、例えばABE7.10を含む塩基エディターシステムと比べてバイスタンダーの編集または変異が少なくとも1.1倍、少なくとも1.2倍、少なくとも1.3倍、少なくとも1.4倍、少なくとも1.5倍、少なくとも1.6倍、少なくとも1.7倍、少なくとも1.8倍、少なくとも1.9倍、少なくとも2.0倍、少なくとも2.1倍、少なくとも2.2倍、少なくとも2.3倍、少なくとも2.4倍、少なくとも2.5倍、少なくとも2.6倍、少なくとも2.7倍、少なくとも2.8倍、少なくとも2.9倍、または少なくとも3.0倍低減されている。

いくつかの実施形態では、本明細書に記載のABE8塩基エディターバリアントの１つを含む塩基編集システムのいずれかは、目的外（spurious）の編集が低減されている。いくつかの実施形態において、意図しない編集または変異は、目的外の変異または目的外の編集、例えば、ゲノムの意図しない領域または非標的領域における標的塩基（例えばAまたはC）の非特異的編集またはガイド非依存性編集である。いくつかの実施形態では、本明細書に記載のABE8塩基エディターバリアントの１つを含む塩基編集システムのいずれかは、ABE7塩基エディター、例えば、ABE7.10を含む塩基エディターシステムと比較して、目的外編集が低減されている。いくつかの実施形態では、本明細書に記載のABE8塩基エディターバリアントの１つを含む塩基編集システムのいずれかは、ABE7塩基エディター、例えば、ABE7.10を含む塩基エディターシステムと比較して、目的外編集が少なくとも1%、少なくとも2%、少なくとも3%、少なくとも4%、少なくとも5%、少なくとも10％、少なくとも15％、少なくとも20％、少なくとも25％、少なくとも30％、少なくとも35％、少なくとも40％、少なくとも45％、少なくとも50％、少なくとも55％、少なくとも60％、少なくとも65％、少なくとも70％、少なくとも75％、少なくとも80％、少なくとも85％、少なくとも90％、少なくとも95％、または少なくとも99％低減されている。いくつかの実施形態では、本明細書に記載のABE8塩基エディターバリアントの１つを含む塩基編集システムのいずれかは、ABE7塩基エディター、例えば、ABE7.10を含む塩基エディターシステムと比較して、目的外編集が少なくとも1.1倍、少なくとも1.2倍、少なくとも1.3倍、少なくとも1.4倍、少なくとも1.5倍、少なくとも1.6倍、少なくとも1.7倍、少なくとも1.8倍、少なくとも1.9倍、少なくとも2.0倍、少なくとも2.1倍、少なくとも2.2倍、少なくとも2.3倍、少なくとも2.4倍、少なくとも2.5倍、少なくとも2.6倍、少なくとも2.7倍、少なくとも2.8倍、少なくとも2.9倍、または少なくとも3.0倍低減されている。

本開示のいくつかの態様は、本明細書に提供される塩基エディターが、例えば非意図的な点突然変異など、有意な数の非意図的な突然変異（すなわちバイスタンダーの変異）を生成することなく、核酸（例えば対象のゲノム内の核酸）において、意図する突然変異（例えば点突然変異など）を効率的に生成することができるという認識に基づく。いくつかの実施形態において、本明細書に提供される塩基エディターは、少なくとも0.01%の意図された突然変異（すなわち少なくとも0.01%の編集効率）を生じることができる。いくつかの実施形態において、本明細書に提供される塩基エディターは、少なくとも0.01%、1%、2%、3%、4%、5%、10%、15%、20%、25%、30%、40%、45%、50%、60%、70%、80%、90%、95%、または99%の意図された突然変異を生成することができる。

いくつかの実施形態において、本明細書に記載のABE8塩基エディターバリアントのいずれかは、少なくとも0.01%、少なくとも1%、少なくとも2%、少なくとも3%、少なくとも4%、少なくとも5%、少なくとも10%、少なくとも15％、少なくとも20％、少なくとも25％、少なくとも30％、少なくとも35％、少なくとも40％、少なくとも45％、少なくとも50％、少なくとも55％、少なくとも60％、少なくとも65％、少なくとも70％、少なくとも75％、少なくとも80％、少なくとも85％、少なくとも90％、少なくとも95％、または少なくとも99％の塩基編集効率を有する。いくつかの実施形態において、塩基編集効率は、細胞の集団における編集された核酸塩基のパーセンテージを計算することによって測定され得る。いくつかの実施形態では、本明細書に記載のABE8塩基エディターバリアントのいずれかは、細胞の集団における編集された核酸塩基により測定されるところで少なくとも0.01％、少なくとも1%、少なくとも2%、少なくとも3%、少なくとも4%、少なくとも5%、少なくとも10％、少なくとも15％、少なくとも20％、少なくとも25％、少なくとも30％、少なくとも35％、少なくとも40％、少なくとも45％、少なくとも50％、少なくとも55％、少なくとも60％、少なくとも65％、少なくとも70％、少なくとも75％、少なくとも80％、少なくとも85％、少なくとも90％、少なくとも95％、または少なくとも99％の塩基編集効率を有する。

いくつかの実施形態では、本明細書に記載のABE8塩基エディターバリアントのいずれも、ABE7塩基エディターと比較してより高い塩基編集効率を有する。いくつかの実施形態では、本明細書に記載のABE8塩基エディターバリアントのいずれかは、ABE7塩基エディター（例えばABE7.10）と比較して、少なくとも1%、少なくとも2%、少なくとも3%、少なくとも4%、少なくとも5%、少なくとも10%、少なくとも15%、少なくとも20％、少なくとも25％、少なくとも30％、少なくとも35％、少なくとも40％、少なくとも45％、少なくとも50％、少なくとも55％、少なくとも60％、少なくとも65％、少なくとも70％、少なくとも75％、少なくとも80％、少なくとも85％、少なくとも90％、少なくとも95％、少なくとも99％、少なくとも100％、少なくとも105％、少なくとも110％、少なくとも115％、少なくとも120％、少なくとも125％、少なくとも130％、少なくとも135％、少なくとも140％、少なくとも145％、少なくとも150％、少なくとも155％、少なくとも160％、少なくとも165％、少なくとも170％、少なくとも175％、少なくとも180％、少なくとも185％、少なくとも190％、少なくとも195％、少なくとも200％、少なくとも210％、少なくとも220％、少なくとも230％、少なくとも240％、少なくとも250％、少なくとも260％、少なくとも270％、少なくとも280％、少なくとも290％、少なくとも300％、少なくとも310％、少なくとも320％、少なくとも330％、少なくとも340％、少なくとも350％、少なくとも360％、少なくとも370％、少なくとも380％、少なくとも390％、少なくとも400％、少なくとも450％、または少なくとも500％高い塩基編集効率を有する。

いくつかの実施形態において、本明細書に記載のABE8塩基エディターバリアントのいずれかは、ABE7塩基エディター（例えばABE7.10）と比較して、少なくとも1.1倍、少なくとも1.2倍、少なくとも1.3倍、少なくとも1.4倍、少なくとも1.5倍、少なくとも1.6倍、少なくとも1.7倍を有する。少なくとも1.8倍、少なくとも1.9倍、少なくとも2.0倍、少なくとも2.1倍、少なくとも2.2倍、少なくとも2.3倍、少なくとも2.4倍、少なくとも2.5倍、少なくとも2.6倍、少なくとも2.7倍、少なくとも2.8倍、少なくとも2.9倍、少なくとも3.0倍、少なくとも3.1倍、少なくとも3.2倍、少なくとも3.3倍、少なくとも3.4倍、少なくとも3.5倍、少なくとも3.6倍、少なくとも3.7倍、少なくとも3.8倍、少なくとも3.9倍、少なくとも4.0倍、少なくとも4.1倍、少なくとも4.2倍、少なくとも4.3倍、少なくとも4.4倍、少なくとも4.5倍、少なくとも4.6倍、少なくとも4.7倍、少なくとも4.8倍、少なくとも4.9倍、または少なくとも5.0倍高い塩基編集効率を有する。

いくつかの実施形態において、本明細書に記載のABE8塩基エディターバリアントのいずれかは、少なくとも0.01%、少なくとも1%、少なくとも2%、少なくとも3%、少なくとも4%、少なくとも5%、少なくとも10%、少なくとも15％、少なくとも20％、少なくとも25％、少なくとも30％、少なくとも35％、少なくとも40％、少なくとも45％、少なくとも50％、少なくとも55％、少なくとも60％、少なくとも65％、少なくとも70％、少なくとも75％、少なくとも80％、少なくとも85％、少なくとも90％、少なくとも95％、または少なくとも99％のオンターゲット塩基編集効率を有する。いくつかの実施形態では、本明細書に記載のABE8塩基エディターバリアントのいずれかは、細胞の集団における編集された標的核酸塩基により測定されるところで少なくとも0.01%、少なくとも1%、少なくとも2%、少なくとも3%、少なくとも4%、少なくとも5%、少なくとも10％、少なくとも15％、少なくとも20％、少なくとも25％、少なくとも30％、少なくとも35％、少なくとも40％、少なくとも45％、少なくとも50％、少なくとも55％、少なくとも60％、少なくとも65％、少なくとも70％、少なくとも75％、少なくとも80％、少なくとも85％、少なくとも90％、少なくとも95％、または少なくとも99％のオンターゲット塩基編集効率を有する。

いくつかの実施形態では、本明細書に記載のABE8塩基エディターバリアントのいずれかは、ABE7塩基エディターと比較して、より高いオンターゲット塩基編集効率を有する。いくつかの実施形態では、本明細書に記載のABE8塩基エディターバリアントのいずれかは、ABE7塩基エディタ（例えばABE7.10）と比較して、少なくとも1%、少なくとも2%、少なくとも3%、少なくとも4%、少なくとも5%、少なくとも10%、少なくとも15%、少なくとも20%、少なくとも25%、少なくとも30%、少なくとも35%、少なくとも40%、少なくとも45%、少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも99%、少なくとも100%、少なくとも105%、少なくとも110%、少なくとも115%、少なくとも120%、少なくとも125%、少なくとも130%、少なくとも135%、少なくとも140%、少なくとも145%、少なくとも150%、少なくとも155%、少なくとも160%、少なくとも165%、少なくとも170%、少なくとも175%、少なくとも180%、少なくとも185%、少なくとも190%、少なくとも195%、少なくとも200%、少なくとも210%、少なくとも220%、少なくとも230%、少なくとも240%、少なくとも250%、少なくとも260%、少なくとも270%、少なくとも280%、少なくとも290%、少なくとも300%、少なくとも310%、少なくとも320%、少なくとも330%、少なくとも340%、少なくとも350%、少なくとも360%、少なくとも370%、少なくとも380%、少なくとも390%、少なくとも400%、少なくとも450%、または少なくとも500%高いオンターゲット塩基編集効率を有する。

いくつかの実施形態では、本明細書に記載のABE8塩基エディターバリアントのいずれかは、ABE7塩基エディタ（例えばABE7.10）と比較して、少なくとも1.1倍、少なくとも1.2倍、少なくとも1.3倍、少なくとも1.4倍、少なくとも1.5倍、少なくとも1.6倍、少なくとも1.7倍、少なくとも1.8倍、少なくとも1.9倍、少なくとも2.0倍、少なくとも2.1倍、少なくとも2.2倍、少なくとも2.3倍、少なくとも2.4倍、少なくとも2.5倍、少なくとも2.6倍、少なくとも2.7倍、少なくとも2.8倍、少なくとも2.9倍、少なくとも3.0倍、少なくとも3.1倍、少なくとも3.2倍、少なくとも3.3倍、少なくとも3.4倍、少なくとも3.5倍、少なくとも3.6倍、少なくとも3.7倍、少なくとも3.8倍、少なくとも3.9倍、少なくとも4.0倍、少なくとも4.1倍、少なくとも4.2倍、少なくとも4.3倍、少なくとも4.4倍、少なくとも4.5倍、少なくとも4.6倍、少なくとも4.7倍、少なくとも4.8倍、少なくとも4.9倍、または少なくとも5.0倍高いオンターゲット塩基編集効率を有する。

本明細書に記載のABE8塩基エディターバリアントは、プラスミド、ベクター、LNP複合体、またはmRNAを介して宿主細胞に送達され得る。いくつかの実施形態において、本明細書に記載されるABE8塩基エディターバリアントのいずれかは、mRNAとして宿主細胞に送達される。いくつかの実施形態では、核酸ベースの送達系（例えばmRNA）により送達されるABE8塩基エディターは、編集された核酸塩基により測定されるところで少なくとも1%、少なくとも2%、少なくとも3%、少なくとも4%、少なくとも5%、少なくとも10%、少なくとも15%、少なくとも20%、少なくとも25%、少なくとも30%、少なくとも35%、少なくとも40%、少なくとも45%、少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、または少なくとも99%のオンターゲット塩基編集効率を有する。いくつかの実施形態において、mRNAシステムによって送達されるABE8塩基エディターは、プラスミドまたはベクターシステムによって送達されるABE8塩基エディターと比較して、より高い塩基編集効率を有する。いくつかの実施形態において、本明細書に記載のABE8塩基エディターバリアントのいずれかは、プラスミドまたはベクター系によって送達される場合と比較して、mRNA系で送達された場合に少なくとも1%、少なくとも2%、少なくとも3%、少なくとも4%、少なくとも5%、少なくとも10%、少なくとも15%、少なくとも20%、少なくとも25%、少なくとも30%、少なくとも35%、少なくとも40%、少なくとも45%、少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも99%、少なくとも100%、少なくとも105%、少なくとも110%、少なくとも115%、少なくとも120%、少なくとも125%、少なくとも130%、少なくとも135%、少なくとも140%、少なくとも145%、少なくとも150%、少なくとも155%、少なくとも160%、少なくとも165%、少なくとも170%、少なくとも175%、少なくとも180%、少なくとも185%、少なくとも190%、少なくとも195%、少なくとも200%、少なくとも210%、少なくとも220%、少なくとも230%、少なくとも240%、少なくとも250%、少なくとも260%、少なくとも270%、少なくとも280%、少なくとも290%、少なくとも300%高い、少なくとも310%、少なくとも320%、少なくとも330%、少なくとも340%、少なくとも350%、少なくとも360%、少なくとも370%、少なくとも380%、少なくとも390%、少なくとも400%、少なくとも450%、または少なくとも500%のオンターゲット塩基編集効率を有する。ある実施形態において、本明細書に記載のABE8塩基エディターバリアントのいずれかは、プラスミドまたはベクター系によって送達される場合と比較して、mRNA系で送達された場合に少なくとも1.1倍、少なくとも1.2倍、少なくとも1.3倍、少なくとも1.4倍、少なくとも1.5倍、少なくとも1.6倍、少なくとも1.7倍、少なくとも1.8倍、少なくとも1.9倍、少なくとも2.0倍、少なくとも2.1倍、少なくとも2.2倍、少なくとも2.3倍、少なくとも2.4倍、少なくとも2.5倍、少なくとも2.6倍、少なくとも2.7倍、少なくとも2.8倍、少なくとも2.9倍、少なくとも3.0倍、少なくとも3.1倍、少なくとも3.2倍、少なくとも3.3倍、少なくとも3.4倍、少なくとも3.5倍、少なくとも3.6倍、少なくとも3.7倍、少なくとも3.8倍、少なくとも3.9倍、少なくとも4.0倍、少なくとも4.1倍、少なくとも4.2倍、少なくとも4.3倍、少なくとも4.4倍、少なくとも4.5倍、少なくとも4.6倍、少なくとも4.7倍、少なくとも4.8倍、少なくとも4.9倍、または少なくとも5.0倍高いオンターゲット塩基編集効率を有する。

ある実施形態において、本明細書に記載のABE8塩基エディターバリアントの１つを含む塩基エディターシステムのいずれかは、標的ポリヌクレオチド配列において、50%未満、40%未満、30%未満、20%未満、19%未満、18%未満、17%未満、16%未満、15%未満、14%未満、13%未満、12%未満、11%未満、10%未満、9%未満、8%未満、7%未満、6%未満、5%未満、4%未満、3%未満、2%未満、1%未満、0.9%未満、0.8%未満、0.7%未満、0.6%未満、0.5%未満、0.4%未満、0.3%未満、0.2%未満、0.1%未満、0.09%未満、0.08%未満、0.07%未満、0.06%未満、0.05%未満、0.04%未満、0.03%未満、0.02%未満、または0.01%未満のオフターゲット編集をもたらす。

ある実施形態において、本明細書に記載のABE8塩基エディターバリアントのいずれかは、プラスミドまたはベクター系によって送達される場合と比較して、mRNA系で送達された場合に、より低いガイド依存（guided）オフターゲット編集効率を有する。ある実施形態において、本明細書に記載のABE8塩基エディターバリアントのいずれかは、プラスミドまたはベクター系によって送達される場合と比較して、mRNA系で送達された場合に、少なくとも1%、少なくとも2%、少なくとも3%、少なくとも4%、少なくとも5%、少なくとも10%、少なくとも15%、少なくとも20%、少なくとも25%、少なくとも30%、少なくとも35%、少なくとも40%、少なくとも45%、少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、または少なくとも99%低いガイド依存オフターゲット編集効率を有する。ある実施形態において、本明細書に記載のABE8塩基エディターバリアントのいずれかは、プラスミドまたはベクター系によって送達される場合と比較して、mRNA系で送達された場合に、少なくとも1.1倍、少なくとも1.2倍、少なくとも1.3倍、少なくとも1.4倍、少なくとも1.5倍、少なくとも1.6倍、少なくとも1.7倍、少なくとも1.8倍、少なくとも1.9倍、少なくとも2.0倍、少なくとも2.1倍、少なくとも2.2倍、少なくとも2.3倍、少なくとも2.4倍、少なくとも2.5倍、少なくとも2.6倍、少なくとも2.7倍、少なくとも2.8倍、少なくとも2.9倍、または少なくとも3.0倍低いガイド依存オフターゲット編集効率を有する。ある実施形態において、本明細書に記載のABE8塩基エディターバリアントのいずれかは、プラスミドまたはベクター系によって送達される場合と比較して、mRNA系で送達された場合に、ガイド依存オフターゲット編集効率における少なくとも約2.2倍の減少を有する。

ある実施形態において、本明細書に記載のABE8塩基エディターバリアントのいずれかは、プラスミドまたはベクター系によって送達される場合と比較して、mRNA系で送達された場合に、より低いガイド非依存性オフターゲット編集効率を有する。ある実施形態において、本明細書に記載のABE8塩基エディターバリアントのいずれかは、プラスミドまたはベクター系によって送達される場合と比較して、mRNA系で送達された場合に、少なくとも1%、少なくとも2%、少なくとも3%、少なくとも4%、少なくとも5%、少なくとも10%、少なくとも15%、少なくとも20%、少なくとも25%、少なくとも30%、少なくとも35%、少なくとも40%、少なくとも45%、少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、または少なくとも99%低いガイド非依存性オフターゲット編集効率を有する。ある実施形態において、本明細書に記載のABE8塩基エディターバリアントのいずれかは、プラスミドまたはベクター系によって送達される場合と比較して、mRNA系で送達された場合に、少なくとも1.1倍、少なくとも1.2倍、少なくとも1.3倍、少なくとも1.4倍、少なくとも1.5倍、少なくとも1.6倍、少なくとも1.7倍、少なくとも1.8倍、少なくとも1.9倍、少なくとも2.0倍、少なくとも2.1倍、少なくとも2.2倍、少なくとも2.3倍、少なくとも2.4倍、少なくとも2.5倍、少なくとも2.6倍、少なくとも2.7倍、少なくとも2.8倍、少なくとも2.9倍、少なくとも3.0倍、少なくとも5.0倍、少なくとも10.0倍、少なくとも20.0倍、少なくとも50.0倍、少なくとも70.0倍、少なくとも100.0倍、少なくとも120.0倍、少なくとも130.0倍、または少なくとも150.0倍低いガイド非依存性オフターゲット編集効率を有する。ある実施形態において、本明細書に記載のABE8塩基エディターバリアントは、プラスミドまたはベクター系によって送達される場合と比較して、mRNA系で送達された場合に、ガイド非依存性オフターゲット編集効率（例えば目的外RNA脱アミノ化）における134.0倍の減少を有する。ある実施形態において、本明細書に記載のABE8塩基エディターバリアントは、ゲノムに渡るガイド非依存性突然変異率を上昇させない。

ある実施形態において、本明細書で提供される塩基エディターは、1:1超の意図される変異対インデルの比を生ずることができる。ある実施形態において、本明細書で提供される塩基エディターは、少なくとも1.5:1、少なくとも2:1、少なくとも2.5:1、少なくとも3:1、少なくとも3.5:1、少なくとも4:1、少なくとも4.5:1、少なくとも5:1、少なくとも5.5:1、少なくとも6:1、少なくとも6.5:1、少なくとも7:1、少なくとも7.5:1、少なくとも8:1、少なくとも10:1、少なくとも12:1、少なくとも15:1、少なくとも20:1、少なくとも25:1、少なくとも30:1、少なくとも40:1、少なくとも50:1、少なくとも100:1、少なくとも200:1、少なくとも300:1、少なくとも400:1、少なくとも500:1、少なくとも600:1、少なくとも700:1、少なくとも800:1、少なくとも900:1、もしくは少なくとも1000:1、またはそれ以上の、意図される変異対インデルの比を生ずることができる。

意図された突然変異およびインデルの数は、例えば、国際PCT出願番号PCT/2017/045381 (WO2030/027078) およびPCT/US2016/058344 (WO2017/070632)；Komor, A.C., et al., “Programmable editing of a target base in genomic DNA without double-stranded DNA cleavage” Nature 533, 420-424 (2016); Gaudelli, N.M., et al., “Programmable base editing of A・T to G・C in genomic DNA without DNA cleavage” Nature 551, 464-471 (2017); およびKomor, A.C., et al., “Improved base excision repair inhibition and bacteriophage Mu Gam protein yields C:G-to-T:A base editors with higher efficiency and product purity,”Science Advances 3:eaao4774 (2017)（その全内容は参照によりここに組み込まれる）に記載されているもののような、任意の適切な方法を用いて決定することができる。

いくつかの実施形態において、インデル頻度を計算するために、インデルが生じ得るウィンドウの両側に隣接する二つの10 bp配列に対する正確なマッチについて配列決定リードがスキャンされる。完全マッチが見つからない場合、そのリードは解析から除外される。このインデルウィンドウの長さが参照配列と完全にマッチする場合、リードはインデルを含まないものとして分類される。インデルウィンドウが参照配列よりも2塩基以上長いかまたは短い場合、配列決定リードは、それぞれ挿入または欠失として分類される。いくつかの態様において、本明細書において提供される塩基エディターは、核酸の領域におけるインデルの形成を制限することができる。ある態様において、その領域は、塩基エディターによって標的化されるヌクレオチドのところにあるか、または塩基エディターによって標的化されるヌクレオチドの2、3、4、5、6、7、8、9または10ヌクレオチド以内の領域である。

標的ヌクレオチド領域で形成されるインデルの数は、核酸(例えば細胞のゲノム内の核酸)が塩基エディターに曝される時間の量に依存し得る。いくつかの実施形態において、インデルの数または割合は、標的ヌクレオチド配列(例えば細胞のゲノム内の核酸)を塩基エディターに曝してから少なくとも1時間、少なくとも2時間、少なくとも6時間、少なくとも12時間、少なくとも24時間、少なくとも36時間、少なくとも48時間、少なくとも3日、少なくとも4日、少なくとも5日、少なくとも7日、少なくとも10日、または少なくとも14日後に決定される。本明細書に記載される塩基エディターの特徴は、本明細書に提供される融合タンパク質、または融合タンパク質を使用する方法のいずれにも適用され得ることが理解されるべきである。

いくつかの実施形態において、本明細書において提供される塩基エディターは、核酸の領域におけるインデルの形成を制限することができる。ある実施形態において、その領域は、塩基エディターによって標的化されるヌクレオチドのところにあるか、または塩基エディターによって標的化されるヌクレオチドの2、3、4、5、6、7、8、9または10ヌクレオチド以内の領域である。いくつかの実施形態では、本明細書で提供される塩基エディターのいずれかは、核酸の領域においてインデルの形成を1%未満、1.5%未満、2%未満、2.5%未満、3%未満、3.5%未満、4%未満、4.5%未満、5%未満、6%未満、7%未満、8%未満、9%未満、10%未満、12%未満、15%未満、または20%未満に制限することができる。核酸領域で形成されるインデルの数は、核酸（例えば細胞のゲノム内の核酸）が塩基エディターに曝される時間の量に依存し得る。いくつかの実施形態において、インデルの数または割合は、核酸（例えば細胞のゲノム内の核酸）を塩基エディターに曝してから少なくとも1時間、少なくとも2時間、少なくとも6時間、少なくとも12時間、少なくとも24時間、少なくとも36時間、少なくとも48時間、少なくとも3日、少なくとも4日、少なくとも5日、少なくとも7日、少なくとも10日、または少なくとも14日後に決定される。

本開示のいくつかの態様は、本明細書で提供されるいずれかの塩基エディターが、有意な数の非意図的突然変異（例えば目的外のオフターゲット編集またはバイスタンダー編集）を生成することなく、核酸（例えば対象のゲノム内の核酸）において意図された突然変異を効率的に生成することができるという認識に基づく。ある実施形態において、意図される突然変異は、標的遺伝子における突然変異を改変または補正するように特に設計されたgRNAに結合した特異的塩基エディターによって生成される突然変異である。ある実施形態において、意図される突然変異は、HBG変異を改変または補正するように特に設計されたgRNAに結合した特異的塩基エディターによって生成される突然変異である。

いくつかの実施形態において、本明細書で提供されるいずれかの塩基エディターは、意図された突然変異対意図されていない突然変異の比（例えば、意図した突然変異：意図しない突然変異）を1:1より大きくすることができるいくつかの実施形態において、本明細書で提供されるいずれかの塩基エディターは、意図された突然変異対意図されていない突然変異の比を、少なくとも1.5:1、少なくとも2:1、少なくとも2.5:1、少なくとも3:1、少なくとも3.5:1、少なくとも4:1、少なくとも4.5:1、少なくとも5:1、少なくとも5.5:1、少なくとも6:1、少なくとも6.5:1、少なくとも7:1、少なくとも7.5:1、少なくとも8:1、少なくとも10:1、少なくとも12:1、少なくとも15:1、少なくとも20:1、少なくとも25:1、少なくとも30:1、少なくとも40:1、少なくとも50:1、少なくとも100:1、少なくとも150:1、少なくとも200:1、少なくとも250:1、少なくとも500:1、または少なくとも1000:1にすることができる。本明細書に記載される塩基エディターの特徴は、本明細書に提供される融合タンパク質、または融合タンパク質を使用する方法のいずれにも適用され得ることが理解されるべきである。

［多重編集］
いくつかの実施形態において、本明細書に提供される塩基エディターシステムは、1以上の遺伝子における複数の核酸塩基対の多重（マルチプレックス）編集を可能にする。ある態様において、複数の核酸塩基対は、同一遺伝子内に位置する。いくつかの実施形態において、複数の核酸塩基対は、1つまたはそれより多い遺伝子に位置し、ここで、少なくとも1つの遺伝子は、異なる遺伝子座に位置する。ある態様において、多重編集は、1以上のガイドポリヌクレオチドを含むことができる。いくつかの実施形態では、多重編集は、1つ以上の塩基エディターシステムを含むことができる。いくつかの実施形態において、多重編集は、単一のガイドポリヌクレオチドを有する1つ以上の塩基エディターシステムを含むことができる。いくつかの実施形態において、多重編集は、複数のガイドポリヌクレオチドを有する1つ以上の塩基エディターシステムを含むことができる。いくつかの実施形態において、多重編集は、単一の塩基エディター系を有する1以上のガイドポリヌクレオチドを含むことができる。いくつかの実施形態において、多重編集は、標的ポリヌクレオチド配列への結合を標的化するためにPAM配列を必要としない少なくとも1つのガイドポリヌクレオチドを含むことができる。いくつかの実施形態において、多重編集は、標的ポリヌクレオチド配列への結合を標的化するためにPAM配列を必要とする少なくとも1つのガイドポリヌクレオチドを含むことができる。いくつかの実施形態において、多重編集は、標的ポリヌクレオチド配列への結合を標的化するためにPAM配列を必要としない少なくとも1つのガイドポリヌクレオチドと、標的ポリヌクレオチド配列への結合を標的化するためにPAM配列を必要とする少なくとも1つのガイドポリヌクレオチドとの混合物を含むことができる。本明細書に記載される塩基エディターのいずれかを使用する多重編集の特徴は、本明細書に提供される塩基エディターのいずれかを使用する方法の任意の組み合わせに適用され得ることを理解されたい。また、本明細書に記載される塩基エディターのいずれかを使用する多重編集は、複数の核酸塩基対の順次的編集を含むことができることを理解されたい。

本明細書で提供される方法は、以下の工程を含む：（ａ）対象のポリヌクレオチドの標的ヌクレオチド配列（例えば二本鎖DNA配列）を、核酸塩基エディター（例えばアデノシン塩基エディター、例えば、ABE8塩基エディター、またはシチジン塩基エディター）とガイドポリヌクレオチド（例えばgRNA）とを含む塩基エディターシステムに接触させる工程であって、ここで、標的ヌクレオチド配列は標的核酸塩基対を含む、工程；（ｂ）標的ヌクレオチド配列を含む標的領域の鎖分離を誘導する工程；（ｃ）標的領域の一本鎖中の標的核酸塩基対の第1の核酸塩基を第2の核酸塩基に編集する工程；および（ｄ）標的領域の１本を超えない鎖を切断する工程であって、ここで第１の核酸塩基に相補的な第３の核酸塩基が、第２の核酸塩基に相補的な第４の核酸塩基によって置き換えられる、工程。

いくつかの実施形態において、複数の核酸塩基対は、1つ以上の遺伝子内にある。ある実施形態において、複数の核酸塩基対は、同じ遺伝子内にある。いくつかの実施形態において、1つ以上の遺伝子における少なくとも1つの遺伝子は、異なる遺伝子座に位置する。

いくつかの実施形態において、編集は、少なくとも1つのタンパク質コード領域における複数の核酸塩基対の編集である。いくつかの実施形態において、編集は、少なくとも1つのタンパク質非コード領域における複数の核酸塩基対の編集である。いくつかの実施形態において、編集は、少なくとも1つのタンパク質コード領域および少なくとも1つのタンパク質非コード領域における複数の核酸塩基対の編集である。

いくつかの態様において、編集は、1以上のガイドポリヌクレオチドを伴う。いくつかの実施形態では、塩基エディターシステムは、1つ以上の塩基エディターシステムを含むことができる。いくつかの実施形態では、塩基エディターシステムは、単一のガイドポリヌクレオチドとともに1つ以上の塩基エディターシステムを含むことができる。いくつかの実施形態において、塩基エディターシステムは、複数のガイドポリヌクレオチドとともに1つ以上の塩基エディターシステムを含むことができる。いくつかの実施形態において、編集は、単一の塩基エディター系を有する1以上のガイドポリヌクレオチドを伴う。いくつかの実施形態において、編集は、標的ポリヌクレオチド配列への結合を標的化するためにPAM配列を必要としない少なくとも1つのガイドポリヌクレオチドを伴う。いくつかの実施形態において、編集は、標的ポリヌクレオチド配列への結合を標的化するためにPAM配列を必要とする少なくとも1つのガイドポリヌクレオチドを伴う。いくつかの実施形態において、編集は、標的ポリヌクレオチド配列への結合を標的化するためにPAM配列を必要としない少なくとも1つのガイドポリヌクレオチドと、標的ポリヌクレオチド配列への結合を標的化するためにPAM配列を必要とする少なくとも1つのガイドポリヌクレオチドとの混合物を伴う。本明細書に記載される塩基エディターのいずれかを使用する多重編集の特徴は、本明細書に提供される塩基エディターのいずれかを使用する方法の任意の組み合わせに適用され得ることを理解されたい。また、編集は、複数の核酸塩基対の順次的編集を含むことができることを理解されたい。

いくつかの実施形態において、１つ以上の遺伝子における複数の核酸塩基対の多重編集が可能な塩基エディターシステムは、本明細書に記載のABE8塩基エディターバリアントのうちの１つを含む。いくつかの実施形態において、１つ以上の遺伝子における複数の核酸塩基対の多重編集が可能な塩基エディターシステムは、ABE7塩基エディターのうちの１つを含む。いくつかの実施形態では、本明細書に記載のABE8塩基エディターバリアントの１つを含む、多重編集が可能な塩基エディターシステムは、ABE7塩基エディターの１つを含む多重編集が可能な塩基エディターシステムと比較して、より高い多重編集効率を有する。いくつかの実施形態では、本明細書に記載のABE8塩基エディターバリアントの１つを含む、多重編集が可能な塩基エディターシステムは、ABE7塩基エディターの１つを含む多重編集が可能な塩基エディターシステムと比較して、少なくとも1%、少なくとも2%、少なくとも3%、少なくとも4%、少なくとも5%、少なくとも10%、少なくとも15%、少なくとも20%、少なくとも25%、少なくとも30%、少なくとも35%、少なくとも40%、少なくとも45%、少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも99%、少なくとも100%、少なくとも105%、少なくとも110%、少なくとも115%、少なくとも120%、少なくとも125%、少なくとも130%、少なくとも135%、少なくとも140%、少なくとも145%、少なくとも150%、少なくとも155%、少なくとも160%、少なくとも165%、少なくとも170%、少なくとも175%、少なくとも180%、少なくとも185%、少なくとも190%、少なくとも195%、少なくとも200%、少なくとも210%、少なくとも220%、少なくとも230%、少なくとも240%、少なくとも250%、少なくとも260%、少なくとも270%、少なくとも280%、少なくとも290%、少なくとも300%高い、少なくとも310%、少なくとも320%、少なくとも330%、少なくとも340%、少なくとも350%、少なくとも360%、少なくとも370%、少なくとも380%、少なくとも390%、少なくとも400%、少なくとも450%、または少なくとも500%高い多重編集効率を有する。いくつかの実施形態では、本明細書に記載のABE8塩基エディターバリアントの１つを含む、多重編集が可能な塩基エディターシステムは、ABE7塩基エディターの１つを含む多重編集が可能な塩基エディターシステムと比較して、少なくとも1.1倍、少なくとも1.2倍、少なくとも1.3倍、少なくとも1.4倍、少なくとも1.5倍、少なくとも1.6倍、少なくとも1.7倍、少なくとも1.8倍、少なくとも1.9倍、少なくとも2.0倍、少なくとも2.1倍、少なくとも2.2倍、少なくとも2.3倍、少なくとも2.4倍、少なくとも2.5倍、少なくとも2.6倍、少なくとも2.7倍、少なくとも2.8倍、少なくとも2.9倍、少なくとも3.0倍、少なくとも3.1倍、少なくとも3.2倍、少なくとも3.3倍、少なくとも3.4倍、少なくとも3.5倍、少なくとも4.0倍、少なくとも4.5倍、少なくとも5.0倍、少なくとも5.5倍、または少なくとも6.0倍高い多重編集効率を有する。

［核酸を編集する方法］
本開示のいくつかの態様は、核酸を編集するための方法を提供する。いくつかの実施形態において、本方法は、タンパク質をコードする核酸分子の核酸塩基（例えば二本鎖DNA配列の塩基対）を編集するための方法である。いくつかの実施形態において、本方法は、a) 核酸（例えば二本鎖DNA配列）の標的領域を、塩基エディター（例えばアデノシンデアミナーゼに融合されたCas9ドメイン）およびガイド核酸（例えばgRNA）を含む複合体と接触させる、工程と、b) 前記標的領域の鎖分離を誘導する工程と、c) 標的領域の一本鎖における前記標的核酸塩基対の第一の核酸塩基を第二の核酸塩基に変換する工程と、d) nCas9を使用して、前記標的領域の、一本を超えない数の鎖を切断する工程とを含み、ここで、第一の核酸塩基に相補的な第三の核酸塩基が、第二の核酸塩基に相補的な第四の核酸塩基によって置き換えられる。ある実施形態において、本方法は、核酸において20%未満のインデル形成をもたらす。一部の実施形態では、工程bが省略されることが理解されるべきである。いくつかの実施形態において、本方法は、19%未満、18%未満、16%未満、14%未満、12%未満、10%未満、8%未満、6%未満、4%未満、2%未満、1%未満、0.5%未満、0.2%未満、または0.1%未満のインデル形成をもたらす。いくつかの実施態様において、本方法は、第二の核酸塩基を、第四の核酸塩基に相補的な第五の核酸塩基で置き換え、それによって意図された編集塩基対（例えばG・CからA・T）を生成することをさらに含む。いくつかの実施形態では、意図された塩基対の少なくとも5%が編集される。いくつかの実施形態では、意図された塩基対の少なくとも10%、15%、20%、25%、30%、35%、40%、45%、または50%が編集される。

ある実施形態において、標的ヌクレオチドにおける意図された生成物対意図されない生成物の比は、少なくとも2:1、少なくとも5:1、少なくとも10:1、少なくとも20:1、少なくとも30:1、少なくとも40:1、少なくとも50:1、少なくとも60:1、少なくとも70:1、少なくとも80:1、少なくとも90:1、少なくとも100:1、もしくは少なくとも200:1、またはそれ以上である。いくつかの実施形態において、意図された突然変異対インデル形成の比は、1:1超、10:1超、50:1超、100:1超、500:1超、もしくは1000:1超、またはそれ以上である。いくつかの実施形態において、切断された一本鎖（ニック鎖）が、ガイド核酸にハイブリダイズされる。いくつかの実施態様において、切断された一本鎖は、第一の核酸塩基を含む鎖とは反対の鎖である。一部の実施形態では、塩基エディターはdCas9ドメインを含む。いくつかの実施形態において、塩基エディターは、編集されていない鎖を保護または結合する。いくつかの実施形態において、意図される編集塩基対は、PAM部位の上流にある。ある実施形態において、意図される編集塩基対は、PAM部位の1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、または20ヌクレオチド上流である。いくつかの実施形態において、意図される編集塩基対は、PAM部位の下流にある。いくつかの実施形態において、意図される編集塩基対は、PAM部位の1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、または20ヌクレオチド下流にある。いくつかの実施形態において、本方法は、正準（例えばNGG）PAMサイトを必要としない。一部の実施形態では、核酸塩基エディターはリンカーを含む。ある態様において、リンカーは、長さが1～25アミノ酸である。ある態様において、リンカーは、長さが5～20アミノ酸である。ある実施形態において、リンカーは、長さが10、11、12、13、14、15、16、17、18、19、または20アミノ酸である。一実施形態において、リンカーは、長さが32アミノ酸である。別の実施形態では、「長いリンカー（long linker）」は、長さが少なくとも約60アミノ酸である。他の実施形態において、リンカーは、長さが約3～100アミノ酸である。一部の実施形態では、標的領域は標的ウィンドウを含み、標的ウィンドウは標的核酸塩基対を含む。ある実施形態において、標的ウィンドウは、1～10ヌクレオチドを含む。いくつかの実施形態において、標的ウィンドウは、長さが1～9、1～8、1～7、1～6、1～5、1～4、1～3、1～2、または1ヌクレオチドである。ある態様において、標的ウィンドウは、長さが1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、または20ヌクレオチドである。いくつかの実施形態において、意図される編集塩基対は、標的ウィンドウ内にある。いくつかの実施態様において、標的ウィンドウは、意図される編集塩基対を含む。いくつかの実施形態において、本方法は、本明細書に提供される塩基エディターのいずれかを用いて実施される。ある実施形態では、標的ウィンドウはメチル化ウィンドウである。

いくつかの実施形態において、本開示は、ヌクレオチド（例えばタンパク質をコードする遺伝子におけるSNP）を編集するための方法を提供する。いくつかの実施形態において、本開示は、二本鎖DNA配列の核酸塩基対を編集するための方法を提供する。いくつかの実施形態において、本方法は、a) 二本鎖DNA配列の標的領域を、塩基エディターおよびガイド核酸（例えばgRNA）を含む複合体と接触させ、ここで、標的領域が標的核酸塩基対を含む、工程と、b) 上記標的領域の鎖分離を誘導する工程と、c) 標的領域の一本鎖における前記標的核酸塩基対の第一の核酸塩基を第二の核酸塩基に変換する工程と、d) 前記標的領域の一本を超えない数の鎖を切断する工程と、を含み、ここで、第一の核酸塩基に相補的な第三の核酸塩基が、第二の核酸塩基に相補的な第四の核酸塩基によって置き換えられ、第二の核酸塩基が、第四の核酸塩基に相補的な第五の核酸塩基によって置き換えられ、それによって、意図された編集塩基対を生成し、ここで意図された塩基対を生成する効率は少なくとも5%である。一部の実施形態では、工程bは省略されることが理解されるべきである。いくつかの実施形態では、意図された塩基対の少なくとも5%が編集される。いくつかの実施形態では、意図された塩基対の少なくとも10%、15%、20%、25%、30%、35%、40%、45%、または50%が編集される。いくつかの態様において、本方法は、19%未満、18%未満、16%未満、14%未満、12%未満、10%未満、8%未満、6%未満、4%未満、2%未満、1%未満、0.5%未満、0.2%未満、または0.1%未満のインデル形成を引き起こす。ある実施形態において、標的ヌクレオチドにおける意図された生成物対意図されない生成物の比は、少なくとも2:1、少なくとも5:1、少なくとも10:1、少なくとも20:1、少なくとも30:1、少なくとも40:1、少なくとも50:1、少なくとも60:1、少なくとも70:1、少なくとも80:1、少なくとも90:1、少なくとも100:1、もしくは少なくとも200:1、またはそれ以上である。いくつかの実施形態において、意図された突然変異対インデル形成の比は、1:1超、10:1超、50:1超、100:1超、500:1超、もしくは1000:1超、またはそれ以上である。いくつかの実施形態において、切断された一本鎖が、ガイド核酸にハイブリダイズされる。いくつかの実施態様において、切断された一本鎖は、第一の核酸塩基を含む鎖とは反対の鎖である。いくつかの実施形態において、意図される編集塩基対は、PAM部位の上流にある。ある実施形態において、意図される編集塩基対は、PAM部位の1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、または20ヌクレオチド上流である。いくつかの実施形態において、意図される編集塩基対は、PAM部位の下流にある。いくつかの実施形態において、意図される編集塩基対は、PAM部位の1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、または20ヌクレオチド下流にある。いくつかの実施形態において、本方法は、正準（例えばNGG）PAMサイトを必要としない。ある態様において、リンカーは、長さが1～25アミノ酸である。ある態様において、リンカーは、長さが5～20アミノ酸である。ある実施形態において、リンカーは、長さが10、11、12、13、14、15、16、17、18、19、または20アミノ酸である。一部の実施形態では、標的領域は標的ウィンドウを含み、標的ウィンドウは標的核酸塩基対を含む。ある実施形態において、標的ウィンドウは、1～10ヌクレオチドを含む。いくつかの実施形態において、標的ウィンドウは、長さが1～9、1～8、1～7、1～6、1～5、1～4、1～3、1～2、または1ヌクレオチドである。ある態様において、標的ウィンドウは、長さが1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、または20ヌクレオチドである。いくつかの実施形態において、意図される編集塩基対は、標的ウィンドウ内で起こる。いくつかの実施態様において、標的ウィンドウは、意図される編集塩基対を含む。いくつかの実施形態において、核酸塩基エディターは、本明細書に提供される塩基エディターのいずれかである。

［宿主細胞における融合タンパク質の発現］
アデノシンデアミナーゼバリアントを含む本発明の融合タンパク質は、細菌、酵母、真菌、昆虫、植物、および動物細胞を含むがこれらに限定されない実質的にあらゆる関心対象の宿主細胞において、当業者に知られている通常の方法を用いて発現され得る。例えば、本発明のアデノシンデアミナーゼをコードするDNAは、cDNA配列に基づいてCDSの上流および下流のための適切なプライマーを設計することによってクローニングすることができる。クローン化されたDNAは、直接に、または必要に応じて制限酵素で消化した後に、または適切なリンカーおよび/または核局在化シグナルを追加した後で、塩基編集システムの1つ以上のさらなる成分をコードするDNAとライゲーションされ得る。塩基編集システムは宿主細胞内で翻訳されて複合体を形成する。

核酸塩基修飾活性を有する一つ以上のドメインをコードする一つ以上のポリヌクレオチド（例えばアデノシンデアミナーゼ）を、napDNAbpをコードするポリヌクレオチドに作動可能に連結して、本発明の融合タンパク質をコードするポリヌクレオチドを調製することにより、融合タンパク質が生成される。いくつかの実施形態において、napDNAbqをコードするポリヌクレオチド、および核酸塩基修飾活性を有するドメインをコードするDNAは、それぞれ、結合ドメインまたはその結合パートナーをコードするDNAと融合されてもよく、または、両方のDNAが、分離インテインをコードするDNAと融合されてもよく、それによって、核酸配列認識変換モジュールおよび核酸塩基変換酵素は、宿主細胞中で翻訳されて複合体を形成する。これらの場合、所望であれば、リンカーおよび/または核局在化シグナルがDNAの一方または両方の適切な位置に連結され得る。

本明細書に記載のタンパク質ドメインをコードするDNAは、DNAを化学的に合成することによって、または合成された部分的に重複するオリゴDNA短鎖をPCR法およびギブソンアセンブリ法を利用して連結し、その全長をコードするDNAを構築することによって、得ることができる。化学合成またはPCR法もしくはGibsonアセンブリ法の組み合わせによって完全長DNAを構築する利点は、使用されるコドンを、DNAが導入される宿主に応じてCDS完全長で設計できることである。異種DNAの発現では、そのDNA配列を宿主生物で高頻度で使用されるコドンに変換することにより、タンパク質発現レベルが増加することが期待される。使用する宿主におけるコドン使用頻度のデータとしては、例えば、上総DNA研究所ホームページに開示されている遺伝コード使用頻度データベース（http://www.kazusa.or.jp/codon/index.html）を使用することができ、または各宿主におけるコドン使用頻度を示す文献を参照してもよい。得られたデータおよび導入されるDNA配列を参照して、そのDNA配列に用いられるコドンのうち宿主での使用頻度の低いコドンを、同じアミノ酸をコードしかつ使用頻度の高いコドンに変換し得る。

核酸配列認識モジュールおよび/または核酸塩基変換酵素をコードするDNAを含む発現ベクターは、例えば、適切な発現ベクター中のプロモーターの下流にそのDNAを連結することによって作製することができる。

発現ベクターとしては、Escherichia coli由来プラスミド（例えばpBR322、pBR325、pUC12、pUC13）；Bacillus subtilis由来プラスミド（例えば、pUB110、pTP5、pC194）；酵母由来プラスミド（例えばpSH19、pSH15）；昆虫細胞発現プラスミド（例えばpFast-Bac）；動物細胞発現プラスミド（例えばpA1-11、pXT1、pRc/CMV、pRc/RSV、pcDNAI/Neo）；λファージ等のバクテリオファージ；バキュロウイルス等の昆虫ウイルスベクター（例えばBmNPV、AcNPV）；レトロウイルス、ワクシニアウイルス、アデノウイルス等の動物ウイルスベクター等が使用される。

プロモーターとしては、遺伝子発現に用いる宿主に適した任意のプロモーターを用いることができる。DSBを用いた従来の方法では、毒性のために宿主細胞の生存率が著しく低下することがあるため、誘導性プロモーターを用いることにより誘導開始までに細胞数を増やすことが望ましい。しかし、本発明の核酸修飾酵素複合体を発現させることにより十分な細胞増殖も得られるので、構成的プロモーターを用いることもできるが、これに限定されるものではない。

例えば、宿主が動物細胞である場合には、SRアルファプロモーター、SV40プロモーター、LTRプロモーター、CMV (サイトメガロウイルス) プロモーター、RSV (ラウス肉腫ウイルス)プロモーター、MoMuLV (モロニーマウス白血病ウイルス) LTR、HSV-TK (単純ヘルペスウイルスのチミジンキナーゼ)プロモーター等が用いられる。これらのうち、CMVプロモーター、SRアルファプロモーター等が好ましい。宿主が大腸菌である場合、trpプロモーター、lacプロモーター、recAプロモーター、ラムダP.sub.Lプロモーター、lppプロモーター、T7プロモーター等が好ましい。宿主がバチルス属である場合、SPO1プロモーター、SPO2プロモーター、penPプロモーター等が好ましい。宿主が酵母の場合には、Gal1/10プロモーター、PHO5プロモーター、PGKプロモーター、GAPプロモーター、ADHプロモーター等が好ましい。宿主が昆虫細胞である場合には、ポリヘドリンプロモーター、P10プロモーター等が好ましい。宿主が植物細胞である場合、CaMV35Sプロモーター、CaMV19Sプロモーター、NOSプロモーター等が好ましい。

ある実施形態において、発現ベクターは、必要に応じて、エンハンサー、スプライシングシグナル、ターミネーター、ポリA付加シグナル、選択マーカー（例えば薬物耐性遺伝子、栄養要求性相補遺伝子など）、複製起点などを含むことができる。

本明細書に記載されるタンパク質ドメインをコードするRNAは、例えば、上記核酸配列認識モジュールおよび/または核酸塩基変換酵素をコードするDNAをコードするベクターをテンプレートとして使用することにより、それ自体公知のインビトロ転写系においてmRNAに転写することにより調製することができる。

本発明の融合タンパク質は、核酸配列認識モジュールおよび／または核酸塩基変換酵素をコードするDNAを含む発現ベクターを宿主細胞に導入し、宿主細胞を培養することにより、細胞内で発現させることができる。

本発明において有用な宿主細胞としては、細菌細胞、酵母、昆虫細胞、動物細胞などが挙げられる。

Escherichia属には、Escherichia coli K12.cndot.DH1（Proc. Natl. Acad. Sci. USA, 60, 160 (1968)）、Escherichia coli JM103（Nucleic Acids Research, 9, 309 (1981)）、Escherichia coli JA221（Journal of Molecular Biology, 120, 517 (1978)）、Escherichia coli HB101（Journal of Molecular Biology, 41, 459 (1969)）、Escherichia coli C600（Genetics, 39, 440 (1954)）等が含まれる。

Bacillus属には、Bacillus subtilis M1114（Gene, 24, 255 (1983)）、Bacillus subtilis 207-21 （Journal of Biochemistry, 95, 87 (1984)）等が含まれる。

本発明の融合タンパク質の発現のために有用な酵母としては、Saccharomyces cerevisiae AH22、AH22R^-、NA87-11A、DKD-5D、20B-12、Schizosaccharomyces pombe NCYC1913、NCYC2036、Pichia pastoris KM71等が挙げられる。

融合タンパク質は、例えばAcNPVのようなウイルスベクターを用いて昆虫細胞で発現される。昆虫宿主細胞としては、ヨトウガ幼虫由来樹立株（Spodoptera frugiperda細胞；SF細胞）、Trichoplusianiの中腸由来MG1細胞、Trichoplusianiの卵由来のHigh Five（商標）細胞、Mamestra brassicae由来細胞、Estigmena acrea由来細胞等のいずれかの細胞株が用いられる。ウイルスがBmNPVの場合には、Bombyx mori由来樹立株の細胞（Bombyx mori N 細胞；BmN細胞）等を昆虫細胞として用いる。Sf細胞としては、例えば、Sf9細胞（ATCC CRL1711）、Sf21細胞（上記すべて、In Vivo, 13, 213-217 (1977)）等が挙げられる。

昆虫としては、例えば、Bombyx moriの幼虫、Drosophila、コオロギなどを用いて本発明の融合タンパク質が発現される（Nature, 315,592 (1985)）。

融合タンパク質を発現するために哺乳動物細胞株が使用され得る。このような細胞株としては、サルCOS-7細胞、サルVero細胞、チャイニーズハムスター卵巣 (CHO) 細胞、dhfr遺伝子欠損CHO細胞、マウスL細胞、マウスAtT-20細胞、マウスミエローマ細胞、ラットGH3細胞、ヒトFL細胞など、ヒトその他の哺乳動物のiPS細胞、ES細胞などの多能性幹細胞、および種々の組織から調製された初代培養細胞が挙げられる。また、ゼブラフィッシュ胚、Xenopus卵母細胞などを用いることもできる。

当業者によく知られる方法を用いて植物細胞が培養物中に維持され得る。植物細胞培養には、様々な植物（例えば、イネ、コムギ、トウモロコシ等の穀物、トマト、キュウリ、ナス等の農作物、カーネーション、Eustoma russellianum、タバコ、Arabidopsis thaliana）から調製される、懸濁培養細胞、カルス、プロトプラスト、葉断片、根断片等が関わる。

上記の宿主細胞は全て、ハプロイド（一倍体）または倍数体（例えば二倍体、三倍体、四倍体など）であり得る。従来の変異導入法では、変異は原則として1つの相同染色体にだけ導入されてヘテロ遺伝子型を作製する。したがって、優性変異が起こらない限り、望まれる表現型は発現せず、ホモ接合性は不都合にも労力と時間を必要とする。これに対して、本発明によれば、ゲノム中の相同染色体上のどの対立遺伝子にも変異を導入することができるので、劣性変異の場合でも一世代で所望の表現型を発現させることができ、従来の方法の問題点を解決することができるので極めて有用である。

本発明の融合タンパク質をコードする発現ベクターは、任意のトランスフェクション法を用いて宿主細胞に導入される（例えばリゾチーム法、コンピテント法、PEG法、CaCl₂共沈法、エレクトロポレーション法、マイクロインジェクション法、粒子銃法、リポフェクション法、アグロバクテリウム法）。トランスフェクション方法は、トランスフェクションされるべき宿主細胞に基づいて選択される。

Escherichia coliは、例えばProc. Natl. Acad. Sci. USA, 69, 2110 (1972)、Gene, 17, 107 (1982)等に記載された方法に従って形質転換され得る。

Bacillus属は、例えば、Molecular & General Genetics, 168, 111 (1979) 等に記載された方法によってベクター導入され得る。

酵母細胞は、例えばMethods in Enzymology, 194, 182-187 (1991)、Proc. Natl. Acad. Sci. USA, 75, 1929 (1978) 等に記載された方法によってベクター導入され得る。

昆虫細胞は、例えばBio/Technology, 6, 47-55 (1988)等に記載された方法によってベクター導入され得る。

哺乳動物細胞は、例えば、Cell Engineering additional volume 8, New Cell Engineering Experiment Protocol, 263-267 (1995)（Shujunsha刊行）、およびVirology, 52, 456 (1973) に記載されている方法によってベクター導入され得る。

本発明の発現ベクターを含む細胞は、宿主に応じて変わる公知の方法に従って培養される。

例えば、Escherichia coliまたはBacillus属を培養する場合、その培養のために使用される培地として液体培地が好ましい。培地は、好ましくは、形質転換体の成長に必要な炭素源、窒素源、無機物質等を含む。炭素源の例としては、グルコース、デキストリン、可溶性デンプン、スクロースなどが挙げられる。窒素源の例としては、アンモニウム塩、硝酸塩、コーンスティープリカー、ペプトン、カゼイン、肉エキス、大豆ケーキ、ジャガイモエキス等のような無機又は有機物質が挙げられ、無機物質としては、塩化カルシウム、リン酸二水素ナトリウム、塩化マグネシウム等が挙げられる。培地は、酵母エキス、ビタミン、成長促進因子などを含有してもよい。培地のpHは好ましくは約5～約8である。

Escherichia coliを培養するための培地としては、例えば、グルコース、カザミノ酸を含むM 9培地（Journal of Experiments in Molecular Genetics, 431-433, Cold Spring Harbor Laboratory, New York 1972）が好ましい。必要な場合には、例えば3.ベータ-インドリルアクリル酸のような薬剤が、プロモーターの効率的な機能を保証するために培地に添加され得る。Escherichia coliは、一般に約15～約43℃で培養される。必要ならば、曝気および撹拌を行ってもよい。

Bacillus属は一般に約30～約40℃で培養する。必要に応じて曝気及び攪拌が行われ得る。

酵母の培養のための培地の例としては、バークホルダー最少培地（Proc. Natl. Acad. Sci. USA, 77, 4505 (1980)）、0.5%カザミノ酸含有SD培地（Proc. Natl. Acad. Sci. USA, 81, 5330 (1984)）等が挙げられる。培地のpHは好ましくは約5～約8である。培養は、一般に約20℃～約35℃で行う。必要に応じて曝気及び攪拌を行ってもよい。

昆虫細胞や昆虫を培養するための培地としては、例えば、不活化10%ウシ血清等の添加剤を適宜含有するグレース昆虫培地（Nature, 195, 788 (1962)）等が用いられる。培地のpHは好ましくは約6.2～約6.4である。培養は一般に約27℃で行われる。必要に応じて曝気および撹拌を行ってもよい。

動物細胞を培養するための培地としては、例えば、約5～約20%のウシ胎児血清を含有する最小必須培地 (MEM)（Science, 122, 501 (1952)）、Dulbecco改変イーグル培地 (DMEM)（Virology, 8, 396 (1959)）、RPMI 1640培地（The Journal of the American Medical Association, 199, 519 (1967)）、199培地（Proceeding of the Society for the Biological Medicine, 73, 1 (1950)）等が使用される。培地のpHは好ましくは約6～約8である。培養は、一般に約30℃～約40℃で行われる。必要に応じて曝気および撹拌を行ってもよい。

植物細胞を培養するための培地としては、例えば、MS培地、LS培地、B5培地等が用いられる。培地のpHは好ましくは約5～約8である。培養は、一般に約20℃～約30℃で行われる。必要に応じて曝気及び撹拌を行ってもよい。

動物細胞、昆虫細胞、植物細胞等の高等真核細胞を宿主細胞として用いる場合には、本発明の塩基編集系（例えばアデノシンデアミナーゼバリアントを含むもの）をコードするDNAを、誘導性プロモーター（例えばメタロチオネインプロモーター（重金属イオンによって誘導される）、熱ショックタンパク質プロモーター（熱ショックによって誘導される）、Tet-ON/Tet-OFF系プロモーター（テトラサイクリンまたはその誘導体の追加または除去によって誘導される）、ステロイド応答性プロモーター（ステロイドホルモンまたはその誘導体によって誘導される）等）の制御下において宿主細胞に導入し、誘導物質が適切な段階で培地に添加されて（または培地から除去されて）核酸修飾酵素複合体の発現を誘導し、一定期間培養を行って塩基編集および標的遺伝子への変異の導入を実行し、塩基編集系の一過性の発現を実現することができる。

大腸菌などの原核細胞は誘導性プロモーターを利用することができる。誘導性プロモーターの例としては、lacプロモーター（IPTGによって誘導される）、cspAプロモーター（寒冷ショックによって誘導される）、araBADプロモーター（アラビノースによって誘導される）などが挙げられるが、これらに限定されない。

あるいは、動物細胞、昆虫細胞、植物細胞等の高等真核細胞を宿主細胞として用いる場合には、上述の誘導性プロモーターをベクター除去機序として利用することもできる。すなわち、宿主細胞で機能する複製起点をベクターに搭載し、複製に必要なタンパク質（例えば動物細胞についてはSV40 onおよびラージT抗原、oriP、およびEBNA-1等）をコードする核酸の発現を上記誘導性プロモーターにより制御する。その結果、誘導物質の存在下ではベクターは自律的に複製可能であるが、誘導物質を除去すると、自律的な複製はできず、ベクターは細胞分裂とともに自然に脱落する（Tet-OFF系ベクターではテトラサイクリンやドキシサイクリンの添加により自律的な複製ができない）。

［送達システム］
核酸塩基エディターおよびgRNAの、核酸に基づく送達
本開示による塩基編集システムをコードする核酸は、公知の方法によって、または本明細書に記載するように、対象に投与されるか、またはインビトロもしくはインビボで細胞に送達され得る。一実施形態において、核酸塩基エディターは、例えばベクター（例えばウイルスベクター又は非ウイルスベクター）、ベクターに基づかない方法（例えば裸のDNA、DNA複合体、mRNA、脂質ナノ粒子を用いて）、またはそれらの組み合わせによって送達され得る。

核酸塩基エディターをコードする核酸は、例えばトランスフェクションまたはエレクトロポレーションによって、裸のDNAまたはRNA、例えばmRNAとして細胞（例えば、造血細胞もしくはその前駆細胞、造血幹細胞、および/または人工多能性幹細胞）に直接送達されるか、または標的細胞による取り込みを促進させる分子（例えばN-アセチルガラクトサミン）にコンジュゲート化され得る。本明細書に記載されるベクターのような核酸ベクターも使用され得る。

核酸ベクターは、本明細書中に記載される融合タンパク質のドメインをコードする1以上の配列を含むことができる。ベクターはまた、タンパク質をコードする配列に付随する（例えば、挿入されているか、融合されている）シグナルペプチド（例えば、核局在化、核小体局在化、またはミトコンドリア局在化のためのもの）をコードする配列も含むことができる。一例として、核酸ベクターは、一つ以上の核局在化配列（例えばSV40からの核局在化配列）を含むCas9コード配列と、アデノシンデアミナーゼバリアント（ABE8）を含むことができる。

核酸ベクターはまた、任意の適切な数の調節/制御エレメント、例えばプロモーター、エンハンサー、イントロン、ポリアデニル化シグナル、Kozakコンセンサス配列、または内部リボソームエントリー部位 (IRES) を含むことができる。これらのエレメントは当技術分野でよく知られている。造血細胞については、適切なプロモーターは、IFNベータまたはCD45を含み得る。

本開示による核酸ベクターは、組換えウイルスベクターを含む。例示的なウイルスベクターは本明細書中に記載される。当技術分野で知られる他のウイルスベクターも使用することができる。さらに、ウイルス粒子を用いて、核酸および/またはペプチドの形態の塩基編集システム成分を送達することができる。例えば、「空の」ウイルス粒子は、任意の適切なカーゴを含有するようにアセンブルされ得る。ウイルスベクターおよびウイルス粒子はまた、標的化リガンドを組み込んで標的組織特異性を変化させるように操作することができる。

ウイルス性ベクターに加えて、本開示によるゲノム編集システムをコードする核酸を送達するために非ウイルス性ベクターを使用することもできる。非ウイルス性核酸ベクターの1つの重要なカテゴリーは、有機または無機であり得るナノ粒子のものである。ナノ粒子は当技術分野でよく知られており、任意の適切なナノ粒子設計を用いて、ゲノム編集システム構成要素またはそのような構成要素をコードする核酸を送達することができる。例えば、有機（例えば、脂質および/またはポリマー）ナノ粒子が、本開示の特定の実施形態において送達ビヒクルとしての使用のために適切となり得る。ナノ粒子製剤、および/または遺伝子導入において使用するための例示的な脂質を、表１０（下記）に示す。

表１１は、遺伝子移入および／またはナノ粒子製剤における使用のための例示的なポリマーを列記する。

表１２は、本明細書に記載される融合タンパク質をコードするポリヌクレオチドのための送達方法を要約する。

別の局面において、例えばCas9もしくはそのバリアントなどの核酸結合タンパク質および目的のゲノム核酸配列を標的とするgRNAのような、ゲノム編集システム構成要素またはそのような構成要素をコードする核酸の送達は、リボ核タンパク質 (RNP) を細胞に送達することによって達成され得る。RNPは、標的化gRNAと複合体を形成した核酸結合タンパク質、例えば、Cas9を含む。RNPは、エレクトロポレーション、ヌクレオフェクション、またはカチオン性脂質媒介方法、例えば、Zuris, J.A. et al., 2015, Nat. Biotechnology, 33(1):73-80によって報告されているもののような、公知の方法を用いて細胞に送達することができる。RNPは、CRISPR塩基編集システムにおける使用のために有利であり、特に一次細胞のようなトランスフェクトが困難な細胞のために有利である。さらに、RNPは、細胞におけるタンパク質発現で起こり得る困難を軽減することもでき、特に、CRISPRプラスミドにおいて使用され得るCMVまたはEF1Aなどの真核生物プロモーターがよく発現されない場合にはそうである。有利なことに、RNPの使用は、細胞への外来DNAの送達を必要としない。さらに、核酸結合タンパク質およびgRNA複合体を含むRNPは、経時的に分解されるので、RNPの使用は、オフターゲット効果を制限する可能性を有する。プラスミドベースの技術の場合と同様の方法で、RNPは、結合タンパク質(例えばCas9バリアント)を送達するために、そして相同性依存修復（HDR）を導くために使用され得る。

核酸分子発現をコードする塩基エディターを駆動するために使用されるプロモーターは、AAV ITRを含み得る。これは、ベクター中のスペースを占領してしまい得るさらなるプロモーター要素の必要性を排除するために有利であり得る。解放された追加のスペースは、ガイド核酸または選択マーカーなどの追加のエレメントの発現を駆動するために使用することができる。ITR活性は比較的弱いので、これは選択したヌクレアーゼの過剰発現による潜在的毒性を低減するために使用できる。

任意の適切なプロモーターを使用して、塩基エディターおよび、適当な場合には、ガイド核酸の発現を誘導することができる。遍在性発現のために使用することができるプロモーターとしては、CMV、CAG、CBh、PGK、SV40、フェリチン重鎖または軽鎖などが挙げられる。脳または他のCNS細胞での発現については、適切なプロモーターとしては、全てのニューロンについてのシナプシンI、興奮性ニューロンについてのCaMKIIα、GABA作動性ニューロンについてのGAD67もしくはGAD65またはVGATなどのプロモーターが挙げられ得る。肝細胞での発現については、適切なプロモーターとしては、アルブミンプロモーターが挙げられる。肺細胞の発現については、適切なプロモーターはSP-Bを含むことができ、内皮細胞については、適切なプロモーターはICAMを含むことができ、造血細胞については、適切なプロモーターはIFNβまたはCD45を含むことができる。骨芽細胞については、適当なプロモーターにはOG-2が含まれ得る。

いくつかの実施形態において、本開示の塩基エディターは、同じ核酸分子内で別々のプロモーターが塩基エディターおよび適合性ガイド核酸の発現を駆動することを可能にするのに十分な小ささである。例えば、ベクターまたはウイルスベクターは、塩基エディターをコードする核酸に作動可能に連結された第1のプロモーター、およびガイド核酸に作動可能に連結された第2のプロモーターを含むことができる。

ガイド核酸の発現を駆動するために使用されるプロモーターには、U6またはH1などのPol IIIプロモーター、ならびにgRNAアデノ随伴ウイルス (AAV) を発現するためのPol IIプロモーターとイントロンのカセットの使用が含まれ得る。

［ウイルスベクター］
従って、本明細書に記載される塩基エディターは、ウイルスベクターを用いて送達され得る。いくつかの実施形態において、本明細書に開示される塩基エディターは、ウイルスベクターに含まれる核酸上にコードされ得る。いくつかの実施形態において、塩基エディターシステムの1つ以上の構成要素は、1つ以上のウイルスベクター上にコードされ得る。例えば、塩基エディターおよびガイド核酸は、単一のウイルスベクター上にコードされ得る。他の実施形態において、塩基エディターおよびガイド核酸は、異なるウイルスベクター上にコードされる。いずれの場合も、塩基エディターおよびガイド核酸はそれぞれ、プロモーターおよびターミネーターに作動可能に連結され得る。ウイルスベクター上にコードされる成分の組合せは、選択されたウイルスベクターのカーゴサイズ制約により決定され得る。

塩基エディターの送達のためのRNAまたはDNAウイルスベースのシステムの使用は、培養中または宿主中の特定の細胞にウイルスをターゲティングし、ウイルスの積荷を核または宿主細胞ゲノムに輸送する、高度に進化したプロセスを利用する。ウイルスベクターは、培養中の細胞、患者に直接投与することができ(in vivo)、またはそれらを用いて細胞をin vitroで処理し得、改変された細胞を任意で患者に投与することができる(ex vivo)。従来のウイルスベースのシステムは、遺伝子導入のためのレトロウイルス、レンチウイルス、アデノウイルス、アデノ随伴及び単純ヘルペスウイルスベクターを含み得る。レトロウイルス、レンチウイルス、およびアデノ随伴ウイルスの遺伝子導入法では、宿主ゲノムへの組み込みが可能であり、しばしば挿入された導入遺伝子の長期発現をもたらす。さらに、多くの異なる細胞型および標的組織において高い形質導入効率が観察されている。

ウイルスベクターは、レンチウイルス（例えばHIVおよびHIVベースのベクター）、アデノウイルス（例えばAD100）、レトロウイルス（例えばマロニーマウス白血病ウイルス、MML-V）、ヘルペスウイルス（例えばHSV-2）、およびアデノ随伴ウイルス（例えばAAV）、またはその他のプラスミドもしくはウイルスベクタータイプを含み、特に、例えば米国特許第8,454,972号（製剤、アデノウイルスの用量）、米国特許第8,404,658号（製剤、AAVの用量）および米国特許第5,846,946号（製剤、DNAプラスミドの用量）、ならびにレンチウイルス、AAVおよびアデノウイルスを含む臨床試験に関する臨床試験および刊行物からの製剤および用量を用いるものが挙げられる。例えば、AAVについては、投与の経路、製剤および用量は、米国特許第8,454,972号におけるものおよびAAVを含む臨床試験におけるものとすることができる。アデノウイルスについては、投与の経路、製剤および用量は、米国特許第8,404,658号におけるものおよびアデノウイルスを含む臨床試験におけるものとすることができる。プラスミド送達については、投与の経路、製剤および用量は、米国特許第5,846,946号におけるものおよびプラスミドを含む臨床研究におけるものとすることができる。用量は平均的70 kgの個体（例えば成人男性）に基づくか外挿され得、体重および種の異なる患者、被験者、哺乳動物について調整することができる。投与の頻度は、医療従事者または獣医（例えば医師、獣医）の領域の範囲内であり、年齢、性別、全般的な健康状態、患者または対象の他の状態および対処される特定の状態または症状を含む通常の因子に依存する。ウイルスベクターを目的の組織に注入され得る。細胞型特異的塩基編集のためには、塩基エディターおよび任意のガイド核酸の発現は、細胞型特異的プロモーターによって駆動され得る。

レトロウイルスの指向性（tropism）は、外来のエンベロープタンパク質を組み込み、標的細胞の潜在的な標的集団を拡大することによって変化させることができる。レンチウイルスベクターは、非分裂細胞を形質導入または感染させることができ、典型的には高いウイルス力価を産生するレトロウイルスベクターである。したがって、レトロウイルス遺伝子導入系の選択は標的組織に依存する。レトロウイルスベクターは、6～10 kbまでの外来配列のパッケージング能力を有するシス作用性の長い末端反復から構成される。最小シス作用性LTRは、ベクターの複製およびパッケージングのために十分であり、次いでそれを用いて治療遺伝子が標的細胞に組み込まれ、永続的な導入遺伝子発現が提供される。広く使用されているレトロウイルスベクターには、マウス白血病ウイルス (MuLV) 、テナガザル白血病ウイルス (GaLV) 、サル免疫不全ウイルス (SIV) 、ヒト免疫不全ウイルス (HIV) 、およびそれらの組み合わせに基づくものが含まれる(例えばBuchscher et al., J. Virol. 66:2731-2739 (1992); Johann et al., J. Virol. 66:1635-1640 (1992); Sommnerfelt et al., Virol. 176:58-59 (1990); Wilson et al., J. Virol. 63:2374-2378 (1989); Miller et al., J. Virol. 65:2220-2224 (1991); PCT/US94/05700参照)。

レトロウイルスベクター、特にレンチウイルスベクターは、標的細胞への効率的な組み込みのために所定の長さより小さいポリヌクレオチド配列を必要とし得る。例えば、9 kbを超える長さのレトロウイルスベクターは、より小さいサイズのものと比較して低いウイルス力価をもたらし得る。ある態様において、本開示の塩基エディターは、レトロウイルスベクターを介して効率的なパッケージングおよび標的細胞への送達を可能にするのに十分なサイズである。いくつかの実施形態では、塩基エディターは、ガイド核酸および/またはターゲティング可能なヌクレアーゼ系の他の成分と共に発現された場合でも、効率的なパッキングおよび送達を可能にするサイズである。

一過性発現が好ましい用途では、アデノウイルスベースのシステムを使用することができる。アデノウイルスベクターは、多くの細胞型において非常に高い形質導入効率が可能であり、細胞分裂を必要としない。このようなベクターでは、高い力価および発現レベルが得られている。このベクターは比較的簡単な系で大量に生成できる。アデノ随伴ウイルス（「AAV」）ベクターもまた、例えば核酸およびペプチドのインビトロ生成において、ならびにインビボおよびエクスビボの遺伝子治療手順のために、標的核酸で細胞を形質導入することに使用され得る（例えば、West et al., Virology 160:38-47 (1987); 米国特許第4,797,368号; WO 93/24641; Kotin, Human Gene Therapy 5:793-801 (1994); Muzyczka, J. Clin. Invest. 94:1351 (1994)を参照）。組換えAAVベクターの構築は、
米国特許第5,173,414号; Tratschin et al., Mol. Cell. Biol. 5:3251-3260 (1985); Tratschin, et al., Mol. Cell. Biol. 4:2072-2081 (1984); Hermonat & Muzyczka, PNAS 81:6466-6470 (1984); およびSamulski et al., J. Virol. 63:03822-3828 (1989)を含む多くの刊行物に記載されている。

AAVはパルボウイルスファミリーに属する小さな一本鎖DNA依存性ウイルスである。4.7 kbの野生型 (wt) AAVゲノムは、それぞれ四つの複製タンパク質および三つのキャプシドタンパク質をコードする二つの遺伝子からなり、両側に145 bpの逆方向末端反復配列 (ITR) がある。ビリオンは三つのキャプシドタンパク質Vp1、Vp2およびVp3から成り、これらは同じオープンリーディングフレームから1:1:10比で産生されるが、異なるスプライシング (Vp1) および選択的翻訳開始部位(Vp2とVp3のそれぞれ)から産生される。Vp3はビリオン中に最も豊富に存在するサブユニットであり、ウイルスの指向性を規定する細胞表面での受容体認識に関与する。ウイルス感染性において機能するホスホリパーゼドメインがVp1のユニークなN末端に同定されている。

組換えAAV（rAAV）は、wt AAVと同様に、ベクター導入遺伝子カセットを挟むシス作用性145 bp ITRを利用し、外来DNAのパッケージングのために最大4.5 kbを提供する。感染後、rAAVは本発明の融合タンパク質を発現することができ、環状の頭・尾コンカテマーの状態のエピソームとして存在することにより、宿主ゲノムに組み込まれることなく存続することができる。このシステムを用いたrAAVの成功例は数多くあるが、in vitroおよびin vivoでは、パッケージング能力が限られているため、遺伝子のコード配列の長さがwt AAVゲノムの長さ以上である場合にAAV媒介遺伝子送達の使用が制限されている。

ウイルスベクターは、アプリケーションに基づいて選択することができる。例えば、インビボ遺伝子送達については、AAVが他のウイルスベクターよりも有利であり得る。ある実施形態において、AAVは低毒性を可能にするが、これは免疫応答を活性化させ得る細胞粒子の超遠心分離を必要としない精製方法に起因し得る。ある実施形態において、AAVは、宿主ゲノムに組み込まれないため、挿入変異誘発を引き起こす可能性の低さを可能にする。アデノウイルスは強い免疫応答を誘発するため、ワクチンとしてよく用いられる。ウイルスベクターのパッケージング能力が、ベクターにパッケージングすることができる塩基エディターのサイズを制限し得る。

AAVは約4.5 Kbまたは二つの145塩基逆末端反復配列 (ITR) を含め4.75 Kbのパッケージング能を有する。これは、開示された塩基エディター、ならびにプロモーターおよび転写ターミネーターが、単一のウイルスベクター中に収まり得ることを意味する。4.5 Kbまたは4.75 Kbより大きい構築物は、ウイルス産生の著しい低下をもたらし得る。例えば、SpCas9は非常に大きく、遺伝子自体が4.1 Kbを超えているため、AAVに詰め込むのは困難である。したがって、本開示の実施形態は、従来の塩基エディターよりも短い、開示された塩基エディターを利用することを含む。いくつかの例では、塩基エディターは4 kb未満である。開示された塩基エディターは4.5 kb、4.4 kb、4.3 kb、4.2 kb、4.1 kb、4 kb、3.9 kb、3.8 kb、3.7 kb、3.6 kb、3.5 kb、3.4 kb、3.3 kb、3.2 kb、3.1 kb、3 kb、2.9 kb、2.8 kb、2.7 kb、2.6 kb、2.5 kb、2 kb、または1.5 kb未満であり得る。いくつかの実施形態において、開示された塩基エディターの長さは4.5 kb以下である。

AAVは、AAV1、AAV2、AAV5、またはそれらの任意の組み合わせであり得る。標的とする細胞に関してAAVのタイプを選択することができる。例えば、AAV血清型1、2、5またはハイブリッドキャプシドAAV1、AAV2、AAV5またはそれらの任意の組合せを選択して、脳または神経細胞を標的化することができる；また、心臓組織を標的とするAAV4を選択することができる。AAV8は肝臓への送達に有用である。これらの細胞に関する特定のAAV血清型の表は、Grimm, D. et al, J. Virol. 82: 5887-5911 (2008)に見出され得る。

レンチウイルスは複雑なレトロウイルスであり、有糸分裂細胞と有糸分裂後細胞の両方に感染してその遺伝子を発現する能力をもつ。最も一般的に知られているレンチウイルスはヒト免疫不全ウイルス (HIV) であり、これは広範囲の細胞型を標的とするために他のウイルスのエンベロープ糖タンパク質を使用する。

レンチウイルスは以下のように調製できる。pCasES10（レンチウイルス伝達プラスミド骨格を含む）をクローニングした後、低継代（p=5）のHEK293FTを、T-75フラスコ中に播種し、抗生物質なしで、10%ウシ胎児血清を含むDMEM中でトランスフェクションの前日に50%コンフルエンスにした。20時間後、培地をOptiMEM（無血清）培地に変え、トランスフェクションを4時間後に行った。10μgのレンチウイルストランスファープラスミド（pCasES10）および以下のパッケージングプラスミド：5μgのpMD2.G（VSV-g偽型）および7.5μgのpsPAX2（gag/pol/rev/tat）で細胞をトランスフェクトする。トランスフェクションは4 mLのOptiMEM中でカチオン性脂質送達剤（50μlのリポフェクタミン2000および100μlのプラス試薬）を用いて行うことができる。6時間後、培地を10%ウシ胎児血清を含む抗生物質不含DMEMに変更する。これらの方法は細胞培養中に血清を用いるが、無血清法が好ましい。

レンチウイルスは以下のように精製できる。ウイルス上清を48時間後に回収する。上清をまずデブリから除去し、0.45μm低タンパク質結合（PVDF）フィルターを通して濾過する。次いで、これらを24,000 rpmで2時間超遠心機で遠心する。ウイルスペレットを50μlのDMEM中に4℃で一晩再懸濁する。次いでそれらを等分し、直ちに-80℃で凍結する。

別の実施形態では、ウマ伝染性貧血ウイルス (EIAV) に基づく最小の非霊長類レンチウイルスベクターも考えられる。別の実施形態では、血管静止タンパク質エンドスタチンおよびアンジオスタチンを発現するウマ感染性貧血ウイルスに基づくレンチウイルス遺伝子治療ベクター、RetinoStat（登録商標）を、網膜下注射を介して送達することが考えられる。別の実施形態では、自己不活化レンチウイルスベクターの使用が考えられる。

当該システムのあらゆるRNA、例えばガイドRNAまたは塩基エディターをコードするmRNAを、RNAの形態で細胞に送達することができる。塩基エディターをコードするmRNAは、インビトロ転写を使用して生成することができる。例えば、ヌクレアーゼmRNAは、以下の要素を含むPCRカセットを用いて合成することができる：T7プロモーター、任意でコザック配列（GCCACC）、ヌクレアーゼ配列、およびβグロビン-ポリAテールからの3’UTRのような3’UTR。このカセットは、T7ポリメラーゼによる転写のために使用され得る。ガイドポリヌクレオチド(例えばgRNA)もまた、インビトロ転写を用いて、T7プロモーター、次いで配列「GG」、およびガイドポリヌクレオチド配列を含有するカセットから転写され得る。

発現を増強し、毒性の可能性を低減するために、塩基エディターコード配列および/またはガイド核酸は、1以上の修飾ヌクレオシドを含むように修飾され得る（例えば擬似Uまたは5-メチル-Cを用いて）。

AAVベクターの小さいパッケージング能力は、このサイズを超える多数の遺伝子の送達および/または大きな生理学的調節エレメントの使用を困難にする。これらの課題は、例えば、送達されるタンパク質を2つ以上の断片に分割することによって対処することができ、ここで、N末端断片を分割インテイン-Nに融合し、C末端断片を分割インテイン-Cに融合する。そしてこれらの断片を2つ以上のAAVベクターにパッケージングする。本明細書中で使用される場合、「インテイン」とは、隣接するN末端エクステインおよびC末端エクステイン（例えば、連結されるべき断片）をライゲートする自己スプライシングタンパク質イントロン（例えばペプチド）を指す。異種タンパク質断片を連結するための特定のインテインの使用は、例えば、Wood et al., J. Biol. Chem. 289(21); 14512-9 (2014)に記載されている。例えば、インテインIntNおよびIntCは、別々のタンパク質断片に融合された場合、互いを認識して、自身をスプライスして排出し、それと同時に、融合している上記タンパク質断片の隣接するN-およびC-末端エクステインをライゲートして、それによってそれによって2つのタンパク質断片から完全長タンパク質を再構成する。他の適切なインテインは当業者に明らかであろう。

本発明の融合タンパク質の断片は、長さを変えることができる。ある態様において、タンパク質断片は、長さが2アミノ酸～約1000アミノ酸の範囲である。ある態様において、タンパク質断片は、長さが約5アミノ酸～約500アミノ酸の範囲である。ある態様において、タンパク質断片は、長さが約20アミノ酸～約200アミノ酸の範囲である。ある態様において、タンパク質断片は、長さが約10アミノ酸～約100アミノ酸の範囲である。他の長さの適切なタンパク質断片は、当業者には明らかであろう。

一実施形態では、大きな導入遺伝子発現カセットを二つの別々の半分(5’および3’末端、またはヘッドおよびテール)に分割することによって二重AAVベクターが生成され、カセットの各半分が単一のAAVベクター(5 kb未満)内にパッケージングされる。次いで、両方の二重AAVベクターによる同一細胞の同時感染に続いて、(1) 5’および3’ゲノム（二重AAV重複ベクター）間の相同組換え (HR)；(2) ITRを介した5′及び3′ゲノム(二重AAVトランススプライシングベクター)の尾・頭コンカテマー化；または (3) それら二つのメカニズムの組み合わせ(二重AAVハイブリッドベクター)により、完全長トランスジーン発現カセットの再構築が達成される。in vivoでの二重AAVベクターの使用は完全長タンパク質の発現をもたらす。二重AAVベクタープラットフォームの使用は、>4.7 kbの大きさの導入遺伝子のための効率的で実行可能な遺伝子導入戦略を表す。

［インテイン］
ある実施形態において、ヌクレアーゼ（例えばCas9）の一部または断片が、インテインに融合される。ヌクレアーゼは、インテインのN末端またはC末端に融合され得る。ある態様において、融合タンパク質の一部または断片は、インテインに融合され、AAVキャプシドタンパク質に融合される。インテイン、ヌクレアーゼおよびキャプシドタンパク質は、任意の配置(例えば、ヌクレアーゼ-インテイン-キャプシド、インテイン-ヌクレアーゼ-キャプシド、キャプシド-インテイン-ヌクレアーゼなど)で一緒に融合され得る。いくつかの実施形態において、インテインのN末端は融合タンパク質のC末端に融合され、インテインのC末端はAAVキャプシドタンパク質のN末端に融合される。

インテイン（intervening protein）は、多種多様な生物に見出される自己プロセシングドメインであり、タンパク質スプライシングとして知られるプロセスを行うものである。タンパク質スプライシングは、ペプチド結合の切断と形成の両方からなる多段階の生化学的反応である。タンパク質スプライシングの内因性基質は、インテインを含む生物に見出されるタンパク質であるが、インテインはまた、実質的にあらゆるポリペプチド骨格を化学的に操作するために使用することもできる。

タンパク質スプライシングでは、インテインは、二つのペプチド結合を切断することによって一前駆体ポリペプチドから自身を切り出し、それによって、隣接するエクステイン（外部タンパク質）配列を、新しいペプチド結合の形成を介して連結する。この転位は翻訳後に起こる（翻訳と同時に起こる可能性もある）。インテイン媒介性タンパク質スプライシングは自発的に起こり、インテインドメインの折りたたみだけを必要とする。

インテインの約5%が分割インテインであり、これらはN-インテインとC-インテインという二つの別々のポリペプチドとして転写され翻訳され、その各々が一つのエクステインに融合している。翻訳の際に、インテイン断片は、自発的にかつ非共有結合的に標準インテイン構造へとアセンブルし、トランスにタンパク質スプライシングを行う。タンパク質スプライシングの機序には一連のアシル転移反応が関わっており、これが、インテイン-エキステイン接合部における2つのペプチド結合の切断と、N-エキステインとC-エキステインの間の新しいペプチド結合の形成とをもたらす。このプロセスは、N‐エクステインとインテインのN‐末端とを繋げるペプチド結合の活性化によって開始される。事実上すべてのインテインは、N末端にシステインまたはセリンを有し、これがN-エクステインのC末端残基のカルボニル炭素を攻撃する。このNからO/Sへのアシル基の移動は、保存されたトレオニンとヒスチジン（TXXHモチーフと呼ばれる）、および一般的に見出されるアスパラギン酸によって促進され、直鎖状 (チオ)エステル中間体の形成をもたらす。次に、この中間体は、システイン、セリン、またはトレオニンであるC-エクステインの最初の残基 (+1) の求核攻撃によってトランス-(チオ)エステル化される。生成した分枝 (チオ)エステル中間体は、インテインの高度に保存されたC末端アスパラギンの環化というユニークな変換によって、解消される。この過程は、ヒスチジン（高度に保存されたHNFモチーフに見出されるもの）と最後から2番目のヒスチジンによって促進され、アスパラギン酸も関与し得る。このスクシンイミド生成反応は、反応複合体からインテインを切除し、非ペプチド結合を介して結合されたエクステインを残す。この構造は、インテイン非依存的態様で迅速に転位し、安定なペプチド結合になる。

いくつかの実施形態では、塩基エディター（例えばABE、CBE）のN末端断片が分割インテイン-Nに融合され、C末端断片が分割インテイン-Cに融合される。そしてこれらの断片を2つ以上のAAVベクターにパッケージングする。異種タンパク質断片を連結するための特定のインテインの使用は、例えば、Wood et al., J. Biol. Chem. 289(21); 14512-9 (2014)に記載されている。例えば、インテインIntNおよびIntCは、別々のタンパク質断片に融合された場合、互いを認識して、自身をスプライスして排出し、それと同時に、融合している上記タンパク質断片の隣接するN-およびC-末端エクステインをライゲートして、それによってそれによって2つのタンパク質断片から完全長タンパク質を再構成する。他の適切なインテインは当業者に明らかであろう。

いくつかの実施形態において、ABEは、SpCas9の選択された領域内のAla、Ser、Thr、またはCys残基においてN末端断片およびC末端断片に分割された。これらの領域は、Cas9結晶構造解析により同定されたループ領域に対応する。各断片のN-末端をインテイン-Nに融合させ、各断片のC-末端を、アミノ酸位置S303、T310、T313、S355、A456、S460、A463、T466、S469、T472、T474、C574、S577、A589、およびS590（下記配列で太字の大文字で示されている）においてインテインCに融合させる。
1 mdkkysigld igtnsvgwav itdeykvpsk kfkvlgntdr hsikknliga llfdsgetae
61 atrlkrtarr rytrrknric ylqeifsnem akvddsffhr leesflveed kkherhpifg
121 nivdevayhe kyptiyhlrk klvdstdkad lrliylalah mikfrghfli egdlnpdnsd
181 vdklfiqlvq tynqlfeenp inasgvdaka ilsarlsksr rlenliaqlp gekknglfgn
241 lialslgltp nfksnfdlae daklqlskdt ydddldnlla qigdqyadlf laaknlsdai
301 llSdilrvnT eiTkaplsas mikrydehhq dltllkalvr qqlpekykei ffdqSkngya
361 gyidggasqe efykfikpil ekmdgteell vklnredllr kqrtfdngsi phqihlgelh
421 ailrrqedfy pflkdnreki ekiltfripy yvgplArgnS rfAwmTrkSe eTiTpwnfee
481 vvdkgasaqs fiermtnfdk nlpnekvlpk hsllyeyftv yneltkvkyv tegmrkpafl
541 sgeqkkaivd llfktnrkvt vkqlkedyfk kieCfdSvei sgvedrfnAS lgtyhdllki
601 ikdkdfldne enedilediv ltltlfedre mieerlktya hlfddkvmkq lkrrrytgwg
661 rlsrklingi rdkqsgktil dflksdgfan rnfmqlihdd sltfkediqk aqvsgqgdsl
721 hehianlags paikkgilqt vkvvdelvkv mgrhkpeniv iemarenqtt qkgqknsrer
781 mkrieegike lgsqilkehp ventqlqnek lylyylqngr dmyvdqeldi nrlsdydvdh
841 ivpqsflkdd sidnkvltrs dknrgksdnv pseevvkkmk nywrqllnak litqrkfdnl
901 tkaergglse ldkagfikrq lvetrqitkh vaqildsrmn tkydendkli revkvitlks
961 klvsdfrkdf qfykvreinn yhhahdayln avvgtalikk ypklesefvy gdykvydvrk
1021 miakseqeig katakyffys nimnffktei tlangeirkr plietngetg eivwdkgrdf
1081 atvrkvlsmp qvnivkktev qtggfskesi lpkrnsdkli arkkdwdpkk yggfdsptva
1141 ysvlvvakve kgkskklksv kellgitime rssfeknpid fleakgykev kkdliiklpk
1201 yslfelengr krmlasagel qkgnelalps kyvnflylas hyeklkgspe dneqkqlfve
1261 qhkhyldeii eqisefskrv iladanldkv lsaynkhrdk pireqaenii hlftltnlga
1321 paafkyfdtt idrkrytstk evldatlihq sitglyetri dlsqlggd

［核酸塩基エディターを用いた変異の標的化］
変異を標的とする核酸塩基エディターの適合性は、本明細書に記載されるように評価される。一実施形態では、対象の単一の細胞が、レポーター（例えばGFP）をコードする少量のベクターと一緒に、塩基編集システムで形質導入される。これらの細胞は、293T、K562またはU20Sなどの不死化ヒト細胞株を含め、当技術分野で知られる任意の細胞株であり得る。あるいは、（例えばヒトの）一次細胞を使用してもよい。そのような細胞は、最終的な細胞標的に関連したものであり得る。

送達は、ウイルスベクターを用いて実施され得る。一実施形態において、トランスフェクションは、脂質トランスフェクション（LipofectamineやFugeneなど）を用いて、またはエレクトロポレーションによって実施することができる。トランスフェクション後、GFPの発現を蛍光顕微鏡またはフローサイトメトリーのいずれかによって測定して、一貫した高レベルのトランスフェクションを確認することができる。最も高い活性を与えるエディターの組み合わせを決定するために、これらの予備的なトランスフェクションは異なる複数の核酸塩基エディターを含むことができる。

核酸塩基エディターの活性は、本明細書に記載のように、すなわち細胞のゲノムの配列決定をして標的配列の変化を検出することによって評価される。サンガー配列決定のためには、精製されたPCRアンプリコンをプラスミド骨格中にクローン化し、形質転換し、ミニプレップし、単一のプライマーで配列決定する。配列決定はまた、次世代配列決定技術を用いて実施されてもよい。次世代配列決定を使用する場合、アンプリコンは、意図された切断部位が非対称に配置された300～500 bpであり得る。PCRに続いて、次世代配列決定のアダプターおよびバーコード（たとえば、Illumina multiplexアダプターとインデックス）をアンプリコンの末端に付加し得る（例えば高スループット配列決定（例えばIllumina MiSeq上でのもの）で使用するために）。

最初の試験で最大レベルの標的特異的改変を誘導する融合タンパク質を、さらなる評価のために選択し得る。

特定の実施形態では、核酸塩基エディターを用いて、目的のポリヌクレオチドを標的化する。一実施形態では、本発明の核酸塩基エディターは、細胞のゲノム内の目的の変異を標的化するために使用されるガイドRNAと共に、細胞（例えば造血細胞もしくはその前駆細胞、造血幹細胞、および/または人工多能性幹細胞）に送達され、それによって変異を変化させる。いくつかの実施形態において、塩基エディターは、ガイドRNAによって標的指向化され、対象遺伝子の配列に1つ以上の編集を導入する。

一実施形態では、核酸塩基エディターを用いて、スプライス部位、エンハンサー、および転写調節エレメントを含むがこれらに限定されない調節配列を標的化する。次いで、その調節エレメントにより制御される遺伝子の発現に対する該改変の影響を、当該技術分野で知られる任意の方法を用いてアッセイする。

他の実施形態では、本発明の核酸塩基エディターを使用して、相補性決定領域（CDR）をコードするポリヌクレオチドを標的化し、それにより、発現されるCDRに変化を生じさせる。続いて、CDR機能に対するこれらの変化の影響を、例えば抗原へのCDRの特異的結合を測定することによって、アッセイする。

さらに他の実施形態では、本発明の核酸塩基エディターを用いて、生物のゲノム内の目的のポリヌクレオチドを標的化する。一実施形態において、本発明の核酸塩基エディターは、細胞のゲノム内の様々な配列をタイル状にカバーするために使用されるガイドRNAのライブラリと共に細胞に送達され、それによってゲノム全体に渡って配列を系統的に改変する。

システムは、1つまたは複数の異なるベクターを含むことができる。一態様では、塩基エディターは、所望の細胞型における発現のためにコドン最適化され、それは好ましくは真核細胞、好ましくは哺乳動物細胞またはヒト細胞である。

一般に、コドン最適化とは、目的の宿主細胞における発現を増強するために、天然配列の少なくとも一つのコドン(例えば約1個、2個、3個、4個、5個、10個、15個、20個、25個、50個以上のコドン)を、天然アミノ酸配列を維持しながら、その宿主細胞の遺伝子においてより頻繁にまたは最も頻繁に使用されるコドンで置換することによって、核酸配列を改変するプロセスをいう。様々な種は特定のアミノ酸の特定のコドンについて特定の偏りを示す。コドンバイアス(生物間のコドン利用の違い)は、メッセンジャーRNA (mRNA) の翻訳効率としばしば相関し、それは特に、翻訳されるコドンの性質および特定のトランスファーRNA (tRNA) 分子の利用可能性に依存すると考えられている。細胞内の選択されたtRNAの優位性は、一般にペプチド合成で最も頻繁に使われるコドンを反映している。従って、遺伝子は、コドン最適化に基づいて、所与の生物における最適な遺伝子発現に合わせて調整することができる。コドン使用表は、例えば、「コドン使用データベース」www.kazusa.orjp/codon/ (2002年7月9日に訪問した)で容易に入手可能であり、これらの表は、多くの方法で適合させることができる。Nakamura, Y., et al. "Codon usage tabulated from the international DNA sequence databases: status for the year 2000" Nucl. Acids Res. 28:292 (2000)参照。例えばGene Forge (Aptagen; Jacobus, Pa.)のような、特定の宿主細胞における発現のために特定の配列をコドン最適化するためのコンピュータアルゴリズムも利用可能である。ある態様において、操作されたヌクレアーゼをコードする配列中の一つ以上のコドン(例えば1、2、3、4、5、10、15、20、25、50以上、または全てのコドン)は、特定のアミノ酸について最も頻繁に使用されるコドンに対応する。

パッケージング細胞は、典型的には、宿主細胞に感染し得るウイルス粒子を形成するために使用される。そのような細胞は、アデノウイルスをパッケージングする293細胞、およびレトロウイルスをパッケージングするpsi.2細胞またはPA317細胞を含む。遺伝子治療に使用されるウイルスベクターは、通常、核酸ベクターをウイルス粒子にパッケージする細胞株を作製することによって生成される。ベクターは、典型的には、パッケージングおよびその後の宿主への組み込みに必要な最小のウイルス配列を含み、他のウイルス配列は、発現されるべきポリヌクレオチドのための発現カセットによって置き換えられる。欠けているウイルス機能は、典型的にはパッケージング細胞株によってトランスに供給される。例えば、遺伝子治療に使用されるAAVベクターは、典型的には、パッケージングおよび宿主ゲノムへの組み込みに必要なAAVゲノムからのITR配列のみを有する。ウイルスDNAは、他のAAV遺伝子、すなわちrepおよびcapをコードするがITR配列を欠くヘルパープラスミドを含む細胞株においてパッケージングされ得る。細胞株は、ヘルパーとしてのアデノウイルスによっても感染され得る。ヘルパーウイルスは、AAVベクターの複製およびヘルパープラスミドからのAAV遺伝子の発現を促進することができる。場合によっては、ヘルパープラスミドは、ITR配列の欠如のために、有意な量ではパッケージングされない。アデノウイルスによる汚染は、例えばAAVよりもアデノウイルスの方が感受性である熱処理によって減少させることができる。

［塩基エディターを使用する方法］
疾患関連の遺伝子およびアリルの点突然変異の補正は、治療および基礎研究への応用を伴う遺伝子補正のための新しい戦略を提供する。

本開示は、本明細書で提供される塩基エディターシステムによって修正することができる点突然変異に関連するかまたはそれによって引き起こされる疾患と診断された対象の、治療のための方法を提供する。例えば、いくつかの実施形態において、そのような疾患（例えば、遺伝子突然変異によって引き起こされる疾患）を有する対象に、疾患関連遺伝子の点突然変異を修正する有効量の核酸塩基エディター（例えば、アデノシンデアミナーゼ塩基エディターまたはシチジンデアミナーゼ塩基エディター）を投与することを含む方法が提供される。本開示は、デアミナーゼ媒介遺伝子編集によって修正することができる点突然変異に関連するかまたはそれによって引き起こされる疾患の治療のための方法を提供する。本明細書で提供される戦略および融合タンパク質で治療することができる適切な疾患は、本開示に基づいて当業者には明らかであろう。本明細書で提供されるのは、疾患または障害に関連する標的ヌクレオチド配列中の核酸塩基を編集するために塩基エディターまたは塩基エディターシステムを使用する方法である。いくつかの実施形態において、塩基エディター（例えば、アデノシンデアミナーゼおよびCas12ドメインを含むもの）の活性が、点突然変異の修正をもたらす。いくつかの実施形態では、標的DNA配列は、疾患または障害に関連するG→A点突然変異を含み、変異A塩基の脱アミノ化が、疾患または障害に関連しない配列をもたらす。いくつかの実施形態において、標的DNA配列は、疾患または障害に関連するT→C点突然変異を含み、変異C塩基の脱アミノ化が、疾患または障害に関連しない配列をもたらす。

いくつかの実施形態では、標的DNA配列はタンパク質をコードし、点突然変異はコドン中にあり、野生型コドンと比較して突然変異コドンによってコードされるアミノ酸の変化をもたらす。いくつかの実施形態において、突然変異体Ａの脱アミノ化は、突然変異体コドンによってコードされるアミノ酸の変化をもたらす。いくつかの実施形態において、突然変異体Ａの脱アミノ化は、野生型アミノ酸をコードするコドンをもたらす。いくつかの実施形態において、突然変異体Ｃの脱アミノ化は、突然変異体コドンによってコードされるアミノ酸の変化をもたらす。いくつかの実施形態において、突然変異体Ｃの脱アミノ化は、野生型アミノ酸をコードするコドンをもたらす。いくつかの実施形態では、対象は、疾患もしくは障害を有するかまたは疾患もしくは障害と診断されている。

いくつかの実施形態では、本明細書で提供されるアデノシンデアミナーゼは、DNAのデオキシアデノシン残基を脱アミノ化することができる。本開示の他の態様は、アデノシンデアミナーゼ（例えば、本明細書に記載の、DNA中のデオキシアデノシンを脱アミノ化するアデノシンデアミナーゼ）と特定のヌクレオチド配列に結合することができるドメイン（例えばCas12）を含む融合タンパク質とを提供する。例えば、アデノシンはイノシン残基に変換されることができ、これは通常、シトシン残基と塩基対を形成する。そのような融合タンパク質は、とりわけ、核酸配列の標的化された編集に有用である。このような融合タンパク質は、インビトロでのDNAの標的化編集のために、例えば、変異細胞または変異動物の生成のために、標的突然変異の導入のために、例えば、エクスビボでの細胞における（例えば、対象から得られ、その後、同じまたは別の対象に再導入される細胞における）遺伝的欠陥の補正のために、および、インビボでの標的化変異の導入、例えば、遺伝的欠陥の補正のために使用され得、または、GからAもしくはTからCへの変異における疾患関連遺伝子への不活性化突然変異の導入が、本明細書で提供される核酸塩基エディターを使用して治療され得る。本開示は、デアミナーゼおよび核酸塩基エディターを利用する、デアミナーゼ、融合タンパク質、核酸、ベクター、細胞、組成物、方法、キット、システムなどを提供する。

［意図する変異の生成］
いくつかの実施形態では、本明細書で提供される方法の目的は、遺伝子編集を介して機能不全の遺伝子の機能を回復させることである。いくつかの実施形態において、機能不全の遺伝子の機能は、意図された突然変異を導入することによって回復される。いくつかの実施形態では、本明細書で提供される方法を使用して、遺伝子産物の正常な機能を破壊することができる。本明細書で提供される核酸塩基編集タンパク質は、例えば、ヒト細胞培養において疾患関連突然変異を修正することによって、インビトロでの遺伝子編集ベースのヒト治療について検証することができる。本明細書で提供される核酸塩基編集タンパク質、例えば、napDNAbpドメイン（例えば、Cas12）と核酸塩基編集ドメイン（例えば、アデノシンデアミナーゼドメインまたはシチジンデアミナーゼドメイン）とを含む融合タンパク質は、AからGまたはCからTへのあらゆる単一点変異を修正するために使用され得ることが当業者によって理解されるであろう。前者の場合は変異体AからIへの脱アミノ化、後者の場合は変異体Tと塩基対を形成するAの脱アミノ化、およびそれに続く１ラウンドの複製により、変異が修正される。

いくつかの実施形態では、本開示は、有意な数の意図しない突然変異（例えば意図しない点突然変異）を生成することなく、核酸（例えば、対象のゲノム内の核酸）において、点突然変異などの意図する突然変異を効率的に生成する塩基エディターを提供する。いくつかの実施形態において、意図される突然変異は、その意図される突然変異を生成するように特別に設計されたガイドポリヌクレオチド（例えばgRNA）に結合した特異的塩基エディター（例えば、シチジン塩基エディターまたはアデノシン塩基エディター）によって生成される突然変異である。いくつかの実施形態において、意図される突然変異は、疾患または障害に関連する突然変異である。いくつかの実施形態において、意図される突然変異は、疾患または障害に関連するアデニン（Ａ）からグアニン（Ｇ）への点突然変異である。いくつかの実施形態において、意図される突然変異は、疾患または障害に関連するシトシン（Ｃ）からチミン（Ｔ）点突然変異である。いくつかの実施形態において、意図される突然変異は、遺伝子のコード領域または非コード領域内のアデニン（Ａ）からグアニン（Ｇ）への点突然変異である。いくつかの実施形態において、意図される突然変異は、遺伝子のコード領域または非コード領域内のシトシン（Ｃ）からチミン（Ｔ）点突然変異である。いくつかの実施形態において、意図される突然変異は、遺伝子のコード領域内の終止コドン、例えば、中途（premature）終止コドンを生成する点突然変異である。いくつかの実施形態において、意図される突然変異は、終止コドンを除去する突然変異である。

いくつかの実施形態において、本明細書で提供されるいずれかの塩基エディターは、意図された突然変異対意図されていない突然変異の比（例えば、意図した点突然変異：意図しない点突然変異）を1:1より大きくすることができるいくつかの実施形態において、本明細書で提供されるいずれかの塩基エディターは、意図された突然変異対意図されていない突然変異（例えば、意図した点突然変異：意図しない点突然変異）の比を、少なくとも1.5:1、少なくとも2:1、少なくとも2.5:1、少なくとも3:1、少なくとも3.5:1、少なくとも4:1、少なくとも4.5:1、少なくとも5:1、少なくとも5.5:1、少なくとも6:1、少なくとも6.5:1、少なくとも7:1、少なくとも7.5:1、少なくとも8:1、少なくとも10:1、少なくとも12:1、少なくとも15:1、少なくとも20:1、少なくとも25:1、少なくとも30:1、少なくとも40:1、少なくとも50:1、少なくとも100:1、少なくとも150:1、少なくとも200:1、少なくとも250:1、少なくとも500:1、もしくは少なくとも1000:1またはそれ以上にすることができる。

塩基エディターの効率の詳細は、国際PCT出願番号PCT/2017/045381（WO 2018/027078）およびPCT/US2016/058344（WO 2017/070632）に記載されており、それぞれが参照によりその全体が本明細書に組み込まれる。Komor, A.C., et al., “Programmable editing of a target base in genomic DNA without double-stranded DNA cleavage” Nature 533, 420-424 (2016); Gaudelli, N.M., et al., “Programmable base editing of A・T to G・C in genomic DNA without DNA cleavage” Nature 551, 464-471 (2017);およびKomor, A.C., et al., “Improved base excision repair inhibition and bacteriophage Mu Gam protein yields C:G-to-T:A base editors with higher efficiency and product purity” Science Advances 3:eaao4774 (2017)も参照（その内容全体が参照により本明細書に組み込まれる）。

いくつかの実施形態において、本明細書に提供される方法を使用した１つ以上の遺伝子における複数の核酸塩基対の編集が、少なくとも１つの意図された突然変異の形成をもたらす。いくつかの実施形態において、前記少なくとも１つの意図された突然変異の形成が、疾患を引き起こす突然変異の正確な修正をもたらす。マルチプレックス編集は、本明細書で提供される任意の方法または方法の組み合わせを使用して達成できることが理解されるべきである。

［Ｉ．SOD遺伝子の改変］
疾患に関連する遺伝子（例えば、ALSに関連するSOD1遺伝子）またはアリルの1つまたは複数のエキソンの5'にあるイントロン核酸配列に位置するスプライスアクセプターを標的とすることによる通常のスプライシングの破壊は、疾患関連遺伝子の転写に影響を与えるための有用な戦略を提供し、治療法や基礎研究にアプリケーションを有する。理論に拘束されることを望まないが、通常のmRNAスプライシングを破壊する本明細書に記載の塩基編集システムおよび方法は、遺伝子転写物の代替的スプライシングをもたらし、それによって代替的スプライシングされたmRNAを生成することができ、これは、非機能的であるかまたは機能が限定された切り詰め型タンパク質および/または非正常もしくは異常なタンパク質産物をもたらし得る。場合によっては、正常なmRNAスプライシングを破壊する本明細書に記載の塩基編集システムおよび方法は、細胞内で分解され得るmRNA転写物をもたらす可能性がある。あるいは、正常なmRNAスプライシングの破壊は、最終的に、細胞内で分解される異常なタンパク質産物（例えば、切り詰められたタンパク質もしくは誤って折りたたまれたタンパク質）、または機能が低減されたか非機能的とされたタンパク質産物を生成し得る。

本開示は、SOD1遺伝子の転写の際にスプライシング破壊を引き起こすために本明細書で提供される塩基エディターシステムを使用して、ALSに関連するSOD1遺伝子のような、疾患遺伝子に関連する疾患と診断された対象の治療のための方法を提供する。例えば、いくつかの実施形態において、そのような疾患を有する対象に、有効量の核酸塩基エディター（例えば、アデノシンデアミナーゼ塩基エディターまたはシチジンデアミナーゼ塩基エディター）を投与することを含む方法が提供され、これは疾患関連遺伝子の転写の際にmRNAのスプライシングを破壊する。本開示は、ALSの治療のための方法を提供し、この方法では、ALS関連SOD1遺伝子配列のエキソン（例えば、SOD1遺伝子配列、特にヒトSOD1遺伝子配列のエキソン3）の5’に位置する非コーディング核酸配列におけるスプライスアクセプター（すなわちAG部位）のデアミナーゼ媒介性塩基編集により、SOD1 mRNA転写物のスプライシングが破壊される。

本明細書では、疾患または障害に関連する遺伝子のエキソンの5’に位置するスプライスアクセプター内の核酸塩基を編集するための、塩基エディターまたは塩基エディターシステムを使用する方法が提供される。いくつかの実施形態において、標的DNA配列は、疾患関連遺伝子のエキソンに隣接するゲノム配列のイントロンにおけるスプライスアクセプターであり、野生型スプライスアクセプターと比較してスプライスアクセプターの変化をもたらす。いくつかの実施形態において、スプライスアクセプターにおけるA核酸塩基の脱アミノ化が、転写の際のmRNA転写物のスプライシングの破壊をもたらす。いくつかの実施形態では、対象は、疾患または障害と診断されたかあるいは診断されている。

いくつかの実施形態において、塩基エディター（例えば、アデノシンデアミナーゼおよびCas9ドメインを含むもの）の活性は、疾患関連遺伝子のエキソンの5'側のスプライスアクセプター、例えば、SOD1遺伝子のエキソン3の5'側のスプライスアクセプターAGヌクレオチド配列を変化させ、遺伝子の転写の際の通常のスプライシングの破壊を引き起こす。いくつかの実施形態において、疾患または障害に関連する遺伝子のエキソンに隣接するカノニカルAGスプライスアクセプター核酸配列のアデノシンヌクレオチドが脱アミノ化されてグアノシンヌクレオチドをもたらし、それによってカノニカルAGスプライスアクセプターを改変し、従って遺伝子の転写の際の正常なスプライシングが影響を受け、例えば、代替的にスプライシングされた遺伝子転写物が生じ、疾患関連タンパク質の通常の産生（翻訳）が負の影響を受ける。

いくつかの実施形態では、本明細書で提供されるアデノシンデアミナーゼは、DNAのデオキシアデノシン残基を脱アミノ化することができる。本開示の他の態様は、アデノシンデアミナーゼ（例えば、本明細書に記載の、DNA中のデオキシアデノシンを脱アミノ化するアデノシンデアミナーゼ）と特定のヌクレオチド配列に結合することができるドメイン（例えばCas9またはCpf1タンパク質）を含む融合タンパク質とを提供する。例えば、アデノシンはイノシン残基に変換されることができ、これは通常、シトシン残基と塩基対を形成する。そのような融合タンパク質は、とりわけ、核酸配列の標的化された編集に有用である。このような融合タンパク質は、インビトロでのDNAの標的化編集のために、例えば、変異細胞または変異動物の生成のために、例えば、エクスビボでの細胞における（例えば、対象から得られ、その後、同じまたは別の対象に再導入される細胞における）疾患関連遺伝子のエキソンに隣接するスプライスアクセプターにおける、標的化突然変異の導入のために、および、インビボでの標的化突然変異の導入、例えば、本明細書に提供される核酸塩基エディターを使用して疾患（ALS）を治療するための、疾患関連遺伝子（例えばSOD1）の通常の転写に影響を与える、スプライスアクセプター（「AG」配列）におけるスプライシング破壊突然変異の導入のために、使用され得る。本開示は、デアミナーゼおよび核酸塩基エディターを利用する、デアミナーゼ、融合タンパク質、核酸、ベクター、細胞、組成物、方法、キット、システムなどを提供する。

［SOD1遺伝子を標的化するための核酸塩基エディターの使用］
SOD1遺伝子のエキソンの5'にあるスプライスアクセプター中のヌクレオチドを標的化する核酸塩基エディターの適合性は本明細書に記載されるように評価される。一実施形態では、目的の単一細胞は、レポーター（例えば、GFP）をコードする少量のベクターとともに、本明細書に記載の核酸塩基エディタをコードする１つまたは複数の核酸分子を用いてトランスフェクト、形質導入、または他の方法で改変される。これらの細胞は、293T、K562またはU20S細胞のような不死化ヒト細胞株であり得る。あるいは、初代ヒト細胞が使用され得る。細胞はまた、組織生検、外科手術、血液、血漿、血清、または他の生体液などからなどのように、対象または個人から取得され得る。そのような細胞は、最終的な細胞標的に関連するものであり得る。

送達は、下記においてさらに記述されるようにウイルスベクターを用いて実施され得る。一実施形態において、トランスフェクションは、脂質トランスフェクション（LipofectamineやFugeneなど）を用いて、またはエレクトロポレーションによって実施することができる。トランスフェクション後、GFPの発現を蛍光顕微鏡またはフローサイトメトリーのいずれかによって測定して、一貫した高レベルのトランスフェクションを確認することができる。最も高い活性を与えるエディターの組み合わせを決定するために、これらの予備的なトランスフェクションは異なる複数の核酸塩基エディターを含むことができる。

核酸塩基エディターの活性は、本明細書に記載のように、すなわち標的遺伝子の配列決定をして標的配列の変化を検出することによって評価される。サンガー配列決定のためには、精製されたPCRアンプリコンをプラスミド骨格中にクローン化し、形質転換し、ミニプレップし、単一のプライマーで配列決定する。配列決定はまた、次世代配列決定技術を用いて実施されてもよい。次世代配列決定を使用する場合、アンプリコンは、意図された切断部位が非対称に配置された300～500 bpであり得る。PCRに続いて、次世代配列決定のアダプターおよびバーコード（たとえば、Illumina multiplexアダプターとインデックス）をアンプリコンの末端に付加し得る（例えば高スループット配列決定（例えばIllumina MiSeq上でのもの）で使用するために）。

特定の実施形態において、核酸塩基エディターは、目的のポリヌクレオチドを標的化するために使用される。一実施形態では、本明細書に記載の核酸塩基エディターは、核酸配列を標的化するために使用されるガイドRNAと併せて細胞（例えば運動ニューロン）に送達され、標的化される核酸配列は例えばSOD1遺伝子エクソン（例えばエクソン3）のスプライスアクセプター中の核酸塩基であり、それによってスプライスアクセプターを破壊し、SOD1遺伝子の転写を変化させ、そして究極的には、例えば代替的転写物の産生を引き起こすことによって、SOD1タンパク質の産生に影響を与える。

いくつかの実施形態において、塩基エディターは、ガイドRNAによって標的指向化され、対象遺伝子の配列に1つ以上の編集を導入する。

［意図する変異の生成］
いくつかの実施形態において、本明細書で提供される方法の目的は、スプライスアクセプター（例えば、疾患関連遺伝子または疾患原因遺伝子のエキソンの5'にあるイントロンの3'に位置するAG配列モチーフ）の塩基編集を介して、疾患関連遺伝子または疾患原因遺伝子の転写の際のmRNAスプライシングを破壊することである。いくつかの実施形態において、意図された突然変異をスプライスアクセプターに導入することによって、遺伝子の転写が改変または調節される。いくつかの実施形態において、疾患関連遺伝子は、疾患関連遺伝子または疾患原因遺伝子のエキソンの5'にあるスプライスアクセプターの塩基編集のために、転写されないかまたは正常に転写されず、従ってmRNAスプライシングが破壊される。いくつかの実施形態では、本明細書に記載されるスプライシング破壊から遺伝子の代替的転写がもたらされる。いくつかの実施形態において、遺伝子の代替的転写は、その遺伝子によってコードされる切詰型および／または非機能性タンパク質産物をもたらす。いくつかの実施形態において、本明細書に記載される方法は、遺伝子産物の正常な機能を破壊するために使用され得る。本明細書で提供される核酸塩基編集タンパク質は、例えば、ヒト細胞培養において疾患関連遺伝子によってコードされる正常または機能的タンパク質の産生を低減または軽減することによって、遺伝子編集ベースのヒト治療についてインビトロで検証することができる。本明細書で提供される核酸塩基編集タンパク質、例えば、ポリヌクレオチドプログラム可能なヌクレオチド結合ドメイン（例えばCas9）と核酸塩基編集ドメイン（例えばアデノシンデアミナーゼドメインまたはシチジンデアミナーゼドメイン）とを含む融合タンパク質は、疾患関連遺伝子または疾患原因遺伝子のエキソンの5'にあるスプライスアクセプターにおいてAからG核酸塩基へと編集または正確に改変するために使用され得ることが当業者によって理解されるであろう。いくつかの実施形態において、本開示は、著しい数の意図しない突然変異（例えば意図しない点突然変異）を生成することなく、核酸（例えば、対象のゲノム内の核酸）において点突然変異などの意図された突然変異を効率的に生成する塩基エディターを提供する。いくつかの実施形態において、意図された突然変異は、その意図された突然変異を生成するように特異的に設計されたガイドポリヌクレオチド（例えばgRNA）に結合した特異的塩基エディター（例えば、アデノシン塩基エディターまたはシチジン塩基エディター）によって生成される突然変異である。いくつかの実施形態において、意図された突然変異は、遺伝子の非コード領域内のアデニン（Ａ）からグアニン（Ｇ）への点突然変異である。いくつかの実施形態において、意図された突然変異は、遺伝子の非コード領域内のシトシン（Ｃ）からチミン（Ｔ）への点突然変異である。いくつかの実施形態において、意図される突然変異は、疾患または障害に関連する遺伝子のエキソンの5'にある非コード領域におけるスプライスアクセプターの突然変異である。いくつかの実施形態において、意図された突然変異は、疾患または障害に関連する遺伝子のエキソンの5'にある非コード領域中のスプライスアクセプターにおけるアデニン（Ａ）からグアニン（Ｇ）への点突然変異である。いくつかの実施形態において、意図された突然変異は、遺伝子の完全な転写物の通常のスプライシングを破壊する突然変異であり、例えば、疾患原因遺伝子または疾患関連遺伝子のエキソンの5'に位置する非コード領域内のスプライスアクセプターにおけるAからGへの変化である。いくつかの実施形態において、意図された突然変異は、遺伝子転写物のスプライシングを破壊する、スプライスアクセプター中の突然変異であり切詰型および／または非機能的タンパク質産物をコードする代替的転写物をもたらす。

いくつかの実施形態において、本明細書に提供される方法を使用した、１つ以上の遺伝子における複数の核酸塩基対の編集が、少なくとも１つの意図された突然変異の形成をもたらす。いくつかの実施形態において、少なくとも１つの意図された突然変異の形成は、疾患関連遺伝子のエキソンの5’にあるスプライスアクセプターにおけるものであり、疾患関連遺伝子のmRNA転写物のスプライシングの破壊をもたらす。本明細書で提供されるいずれかの方法または方法の組み合わせを使用してマルチプレックス編集を達成し得ることが理解されるはずである。

［スプライスアクセプターの破壊］
いくつかの実施形態において、意図された突然変異は、アデノシン塩基エディター（例えばABE8）を用いてスプライスアクセプター（保存されたヌクレオチド配列モチーフ「AG」を有する）におけるＡ核酸塩基を標的化して転写の際の遺伝子のmRNAスプライシングの破壊（disruption）を引き起こすことである。一実施形態では、標的化されるスプライスアクセプターは、ALSに関連するSOD1遺伝子のエキソン3の5'にあるイントロンの3'末端に位置する「AG」配列モチーフである。意図された突然変異は、スプライスアクセプター中の保存された「AG」ヌクレオチド配列モチーフを改変して、スプライス破壊、および遺伝子の転写の際のmRNA転写物の正常なスプライシングの改変または喪失を引き起こす。一実施形態では、A→G塩基エディター（ABE）を用いたスプライスアクセプター保存モチーフ中のA核酸塩基の脱アミノ化が、正常なmRNAスプライシングを破壊し、あるmRNA転写物をもたらすスプライスアクセプター配列をもたらし、場合によっては、非正常な（例えば切詰型、断片化、および／または非機能性）の翻訳されたタンパク質をもたらし、疾患または障害を改善または治療する。いくつかの実施形態において、意図された突然変異は、スプライスアクセプターの保存されたヌクレオチド配列モチーフ「AG」におけるA→G点突然変異である。A→G点突然変異は、例えば、CBEを反対の鎖にターゲティングして病原性G核酸塩基の相補的Cを編集することによって実行することができる。塩基エディターは、変異もしくは変換されることが意図された核酸塩基、または変異もしくは変換されることが意図された核酸塩基の相補体にターゲティングされ得る。病原性または疾患原因突然変異および他の配列バリエーションの説明の命名法は、den Dunnen, J.T. and Antonarakis, S.E., “Mutation Nomenclature Extensions and Suggestions to Describe Complex Mutations: A Discussion.” Human Mutation 15:712 (2000)に記述されており、その全内容が参照により本明細書に組み込まれる。

［AR遺伝子の改変］
第１エキソンにおける終止コドンの導入またはスプライス部位の破壊は、ARポリペプチドの早期終結をもたらし、それにより、SBMAに罹患した対象の治療のための新しい戦略を提供する。

本開示は、SBMAと診断された対象の治療のための方法を提供する。例えば、いくつかの実施形態では、SBMAを有するまたは発症する傾向がある対象に、ARポリペプチドの早期終結をもたらす点突然変異を導入する核酸塩基エディター（例えば、アデノシンデアミナーゼ塩基エディターまたはシチジンデアミナーゼ塩基エディター）の有効量を投与することを含む方法が提供される。

それぞれの配列（例えば、それぞれ疾患関連遺伝子またはそのコード化タンパク質のポリヌクレオチドまたはアミノ酸配列）における特定の位置または残基の番号付けは、使用される特定のタンパク質および番号付けスキームに依存することが理解されるであろう。たとえば、成熟タンパク質の前駆体と成熟タンパク質そのものとでは番号付けが異なることがあり、種ごとの配列の違いが番号付けに影響することがある。当業者は、当業者によく知られた方法、例えば、配列アラインメントおよび相同的残基の決定によって、任意の相同的タンパク質およびそれぞれのコード核酸中の対応する残基を同定することができる。

SBMAに関連する標的ARヌクレオチド配列中の核酸塩基を編集するための塩基エディターまたは塩基エディターシステムを使用する方法が本明細書で提供される。いくつかの実施形態において、塩基エディター（例えば、シチジンデアミナーゼおよびCas9ドメインを含むもの）の活性が、点突然変異の導入をもたらす。

いくつかの実施形態において、Aの脱アミノ化が、ARポリペプチドのスプライス部位の破壊をもたらす。いくつかの実施形態において、Cの脱アミノ化が、ARポリペプチドにおける終止コドンの導入をもたらす。いくつかの実施形態では、対象はSBMAと診断されている。

［アンドロゲン受容体（AR）をコードする遺伝子中のヌクレオチドを標的化するための核酸塩基エディターの使用］
アンドロゲン受容体をコードする遺伝子中のヌクレオチドを標的化する核酸塩基エディターの適合性は本明細書に記載されるように評価される。一実施形態では、目的の単一細胞は、レポーター（例えば、GFP）をコードする少量のベクターとともに、本明細書に記載の核酸塩基エディタをコードする１つまたは複数の核酸分子を用いてトランスフェクト、形質導入、または他の方法で改変される。これらの細胞は、293T、K562またはU20Sのような不死化ヒト細胞株であり得る。あるいは、初代ヒト細胞が使用され得る。細胞はまた、組織生検、外科手術、血液、血漿、血清、または他の生体液などからなどのように、対象または個人から取得され得る。そのような細胞は、最終的な細胞標的に関連するものであり得る。

送達は、下記においてさらに説明するようにウイルスベクターを用いて実施され得る。一実施形態において、トランスフェクションは、脂質トランスフェクション（LipofectamineやFugeneなど）を用いて、またはエレクトロポレーションによって実施することができる。トランスフェクション後、GFPの発現を蛍光顕微鏡またはフローサイトメトリーのいずれかによって測定して、一貫した高レベルのトランスフェクションを確認することができる。最も高い活性を与えるエディターの組み合わせを決定するために、これらの予備的なトランスフェクションは異なる複数の核酸塩基エディターを含むことができる。

他の実施形態では、核酸塩基エディターの活性は、ARを天然でまたは組換えで発現する細胞における全長ARポリペプチドの存在または不在を検出することによって評価される。ARタンパク質を検出するための方法は当技術分野で知られており、例えば、イムノアッセイ、ELISA、およびウエスタンブロットが含まれる。

特定の実施形態において、核酸塩基エディターは、目的のポリヌクレオチドを標的化するために使用される。一実施形態では、本発明の核酸塩基エディターは、核酸配列（例えばアンドロゲン受容体をコードするポリヌクレオチド）を標的化するために使用されるガイドRNAと併せて細胞（例えばニューロン）に送達されて遺伝子において終止コドンを導入するかまたはスプライス部位を破壊し、それによりアンドロゲン受容体の発現を破壊する。

［意図する変異の生成］
本明細書で提供される核酸塩基編集タンパク質は、例えば、ヒト細胞培養中のAR標的遺伝子において終止コドンを導入するかまたはスプライス部位を破壊することにより、遺伝子編集ベースのヒト治療についてインビトロで検証することができる。本明細書で提供される核酸塩基編集タンパク質、例えば、ポリヌクレオチドプログラム可能なヌクレオチド結合ドメイン（例えばCas9）と核酸塩基編集ドメイン（例えば、アデノシンデアミナーゼドメインまたはシチジンデアミナーゼドメイン）とを含む融合タンパク質を使用してAからGまたはCからTへの任意の単一点変異を導入し得ることが当業者によって理解されるであろう。

いくつかの実施形態では、本開示は、有意な数の意図しない突然変異（例えば意図しない点突然変異）を生成することなく、核酸（例えば、対象のゲノム内の核酸）において、点突然変異などの意図する突然変異を効率的に生成できる塩基エディターを提供する。いくつかの実施形態において、意図される突然変異は、その意図される突然変異を生成するように特別に設計されたガイドポリヌクレオチド（例えばgRNA）に結合した特異的塩基エディター（例えば、シチジン塩基エディターまたはアデノシン塩基エディター）によって生成される突然変異である。いくつかの実施形態において、意図される突然変異は、スプライス部位を破壊するアデニン（Ａ）からグアニン（Ｇ）への点突然変異である。いくつかの実施形態において、意図される突然変異は、中途（premature）終止コドンの導入をもたらすシトシン（Ｃ）からチミン（Ｔ）点突然変異である。いくつかの実施形態において、意図される突然変異は、遺伝子のコード領域または非コード領域内のアデニン（Ａ）からグアニン（Ｇ）への点突然変異である。いくつかの実施形態において、意図される突然変異は、遺伝子のコード領域または非コード領域内のシトシン（Ｃ）からチミン（Ｔ）点突然変異である。いくつかの実施形態において、意図される突然変異は、遺伝子のコード領域内の終止コドン、例えば、中途終止コドンを生成する点突然変異である。いくつかの実施形態において、意図される突然変異は、遺伝子のコード領域内のスプライス部位を破壊する点突然変異である。

いくつかの実施形態において、１つ以上の遺伝子における複数の核酸塩基対の編集が、少なくとも１つの意図された突然変異の形成をもたらす。いくつかの実施形態において、少なくとも１つの意図された突然変異の形成は、中途の終止コドンの導入またはスプライス部位の破壊をもたらす。本明細書に記載の塩基エディターの多重編集の特徴は、本明細書に提供される塩基エディターを使用する方法の任意の組み合わせに適用できることが理解されるべきである。

［III. マルチエフェクター核酸塩基エディターのアプリケーション］
マルチエフェクター核酸塩基エディターを用いて、目的のポリヌクレオチドを標的とし、タンパク質発現を改変する変化を作り出すことができる。一実施形態では、マルチエフェクター核酸塩基エディターは、スプライス部位、エンハンサー、および転写調節エレメントを含むがこれらに限定されない非コード配列または調節配列を改変するために使用される。次いで、当該技術分野で公知の任意の方法を用いて、その調節エレメントによって制御される遺伝子の発現に対する当該改変の影響をアッセイする。特定の実施形態において、マルチエフェクター核酸塩基エディターは、調節配列を実質的に変化させて、それによって、遺伝子発現を調節するその能力を消失させることができる。有利なことに、これは、他のRNAプログラミング可能ヌクレアーゼとは対照的に、ゲノム標的配列に二本鎖切断を生じることなく行うことができる。

マルチエフェクター核酸塩基エディターを用いて、目的のポリヌクレオチドを標的とし、タンパク質活性を改変する変化を作り出すことができる。例えば、突然変異誘発の文脈において、マルチエフェクター核酸塩基エディターは、エラープローンPCRおよび他のポリメラーゼベースの方法と比べて多くの利点を有する。本発明のマルチエフェクター核酸塩基エディターは、標的領域内の複数の塩基に変化を生じるので、そのような変異は、エラープローンPCRによって導入される変異と比較して、タンパク質レベルで発現される可能性がより高い。エラープローンPCRによって導入される変異は、コドン中の単一ヌクレオチド変化が依然として同じアミノ酸をコードし得ること（コドンの縮重）を考慮すると、タンパク質レベルで発現される可能性がより低い。ポリヌクレオチド全体にわたってランダムな変化を誘導するエラープローンPCRとは異なり、本発明のマルチエフェクター核酸塩基エディターは、対象タンパク質の小さな領域または限定された領域内の特定のアミノ酸を標的化するために使用できる。

他の実施形態において、本発明のマルチエフェクター核酸塩基エディターは、生物のゲノム内の目的のポリヌクレオチドを標的化するために使用される。一実施形態において、生物は、微生物叢の細菌（例えばBacteriodetes、Verrucomicrobia、Firmicutes；ガンマプロテオバクテリア、アルファプロテオバクテリア、Bacteriodetes、Clostridia、Erysipelotrichia、Bacilli；Enterobacteriales、Bacteriodales、Verrucomicrobiales、Clostridiales、Erysiopelotrichales、Lactobacillales；Enterobacteriaceae、Bacteroidaceae、Erysiopelotrichaceae、Prevotellaceae、Coriobacteriaceae、およびAlcaligenaceae、Escherichia、Bacteroides、Alistipes、Akkermansia、Clostridium、Lactobacillus）である。別の実施形態では、生物は農業上重要な動物（例えば牛、羊、山羊、馬、鶏、七面鳥）または植物（例えば大豆、小麦、トウモロコシ、米、タバコ、リンゴ、ブドウ、モモ、プラム、チェリー）である。1つの実施形態において、本発明のマルチエフェクター核酸塩基エディターは、細胞のゲノム内の種々の配列を標的化するために使用されるガイドRNAのライブラリーと共に細胞に送達され、それによってゲノム全体の配列を系統的に変化させる。1つの実施形態において、本発明のマルチエフェクター核酸塩基エディターは、細胞のゲノム内の種々の配列をタイル状にカバーするために使用されるガイドRNAのライブラリーと共に細胞に送達され、それによってゲノム全体の配列を系統的に変化させる。

突然変異を、種々のタンパク質のいずれかにおいて作製して、構造-機能分析を促進ささせ、またはタンパク質の内因性活性を変化させ得る。突然変異は、例えば、酵素（例えばキナーゼ、ホスファターゼ、カルボキシラーゼ、ホスホジエステラーゼ）または酵素基質、受容体またはそのリガンド、ならびに抗体およびその抗原において作製され得る。一実施形態では、マルチエフェクター核酸塩基エディターは、酵素の活性部位、受容体のリガンド結合部位、または抗体の相補性決定領域 (CDR) をコードする核酸分子を標的とする。酵素の場合、活性部位に変異を導入すると、酵素活性が増加、減少、または消失し得る。酵素に対する突然変異の影響は、当技術分野で知られるおよび/または当業者には明らかである多くのアッセイのいずれかを含む、酵素活性アッセイにおいて特徴付けされる。受容体の場合、リガンド結合部位に生成された変異は、リガンドに対する受容体親和性を増加、減少、または消失させ得る。このような突然変異の効果は、当技術分野で知られるおよび/または当業者には明らかである多くのアッセイのいずれかを含む、受容体/リガンド結合アッセイにおいてアッセイされる。CDRの場合、CDR内に作られた変異は、抗原への結合を増加、減少、または無効にし得る。あるいは、CDR内に作られた変異は、抗原に対する抗体の特異性を改変し得る。次いで、これらの改変がCDR機能に及ぼす影響を、たとえば抗原へのCDRの特異的結合を測定することによって、または他のタイプのイムノアッセイにおいて、アッセイする。

［疾患および疾患関連遺伝子］
疾患関連または疾患原因遺伝子配列のエキソンの5'にある非コード核酸配列におけるスプライスアクセプターの保存された「AG」核酸モチーフ中の核酸塩基を標的化し編集するために、本明細書に記載のプログラム可能な塩基エディターまたはプログラム可能な塩基エディターシステムを使用することにより、疾患原因または疾患関連遺伝子の転写の際のスプライシングを破壊するための、システム、組成物および方法が本明細書に提供される。塩基エディター（例えば、アデノシンデアミナーゼおよびCas9ドメインを含むもの）の活性が、正準的スプライスアクセプターモチーフの改変および破壊を引き起こし、したがって、野生型スプライスアクセプターと比較してスプライスアクセプター配列の変化および疾患関連または疾患関連遺伝子の転写の際のmRNAの正常なスプライシングの破壊をもたらす。いくつかの実施形態において、スプライスアクセプターにおけるA核酸塩基の脱アミノ化が、mRNA転写物のスプライシング破壊をもたらす。

いくつかの実施形態において、疾患または障害の原因であることに関連する遺伝子配列のエクソンの5’にある正準的AGスプライスアクセプター核酸配列のアデノシンヌクレオチドが脱アミノ化されてグアノシンヌクレオチドを生じ、それによって、正準的AGスプライスアクセプターを改変して、遺伝子の転写の際のスプライシングが破壊されるか、または正常なスプライシングが起こる能力が失われる。一例として、代替的スプライシングがされた遺伝子転写物がもたらされ、正常または完全長の機能性タンパク質産物の翻訳および産生が負の影響を受け、その結果、切詰型および/または非機能性タンパク質産物が産生される。一実施形態によると、疾患関連遺伝子または疾患原因遺伝子は、筋萎縮性側索硬化症 (ALS) に関連するスーパーオキシドジスムターゼ1 (SOD1) 遺伝子である。実施形態において、アデノシンからグアノシン (AからG) への変化は、SOD1遺伝子のエクソン3核酸配列の5’にあるスプライスアクセプターヌクレオチド配列のカノニカルAGモチーフにおいて行われる。ある態様において、対象は、ALSを有する、またはALSと診断されたヒト患者である。

本発明はまた、アンドロゲン受容体をコードする遺伝子を改変することによって球脊髄性筋萎縮症 (SBMA) を治療するための組成物および方法を特徴とする。ある態様において、改変は、終止コドンを生成するか、またはエクソン1におけるスプライス部位を破壊する。他の実施形態では、改変はスプライス部位（例えば、スプライスドナー部位またはスプライスアクセプター部位）を破壊する。本発明は、アデノシン塩基エディター (ABE) を使用してアンドロゲン受容体 (AR) 遺伝子のエクソン1におけるアデノシンを脱アミノ化することができ、その変化により、スプライスドナーまたはスプライスアクセプター部位が破壊され、それによって、SBMAに関連するトリヌクレオチド反復伸長を有するARポリペプチドの発現が破壊されるという発見に少なくとも部分的に基づく。

［筋萎縮性側索硬化症およびスーパーオキシドジスムターゼ1 (SOD1)］
筋萎縮性側索硬化症 (ALS) は、脳および脊髄の神経細胞 (ニューロン) に影響を及ぼす進行性の神経変性疾患である。ALSは脳幹および脊髄の運動ニューロンの死を特徴とし、進行性の麻痺を引き起こし、最終的には患者を死に至らしめる。ニューヨーク・ヤンキースの著名な野球選手であるルー・ゲーリッグは1939年にALSにかかり、この病気に国内外の注目を集めさせた。この病気は今でも彼の名前と密接に結びつけられている。ALSは通常40歳から70歳の中年の人に発症する；しかし、他の人でもこの病気を発症し得る。その数は変動し得るが、米国では約3万人の患者が罹患していると推定され、毎年約5,000人がALSと診断されている。

運動ニューロンは、脳から脊髄へ、そして脊髄から全身の筋肉へと伸びている。ALSにおける運動ニューロンの進行性変性は最終的に細胞死と筋萎縮をもたらす。運動ニューロンが死滅すると、脳が筋肉の運動を開始して制御する能力が失われる。この病気の後期の患者は、随意筋活動の進行性麻痺の結果、完全に麻痺してしまうことがある。

一般に、ALSは2つの異なる型、すなわち孤発性（sporadic）と家族性（familial）に分類される。孤発性ALS（sALS；原因不明のALS事象）は、米国で最も一般的な病型であり、全症例の90～95%を占める。家族性ALS（fALS）は遺伝性であり、米国の全症例の5～10%を占める。fALSは、優性形態で、多くの遺伝子の変異によって引き起こされる。最も徹底的に研究された形態のfALSは、銅‐亜鉛 (Cu/Zn) スーパーオキシドジスムターゼ (SOD1) をコードする遺伝子の変異により引き起こされ、これはその蛋白質の一次構造に変化をもたらし、全fALS症例の10～15%を占める。

SOD1はスーパーオキシドから過酸化水素 (H₂O₂) と二酸素への不均化を触媒する豊富な抗酸化酵素である。ヒトでは、SOD1遺伝子は21番染色体長腕の22.11位に位置する。ヒトSOD1酵素は32 kDaのホモ二量体であり、サブユニット当たり一つの銅結合部位および一つの亜鉛結合部位ならびに一つの分子内ジスルフィド結合を有する。SOD1遺伝子における200以上のALS関連変異が同定されており、その大部分は遺伝的に優性である。すべてのfALS SOD1突然変異は、153残基SOD1ポリペプチド全体に広く散在する一次構造変化をもたらす。このような突然変異は、主に単一アミノ酸残基の置換であるが、挿入、欠失、およびC末端の切詰めも知られている。ヒト以外でALS様の症状と病理組織が自然に発現することが知られている哺乳類はイヌのみであり、イヌの疾患 (イヌ変性脊髄症) とSOD1遺伝子の変異との関連が発見されている（Y. Sheng et al., 2012, Current Topics in Medicinal Chemistry, 12:2560-2572）。多くのSOD1変異体は正常な酵素活性を示し、SOD1ノックアウトマウスは運動ニューロン死を示さないことから、SOD1関連fALSは機能喪失障害ではないことが示された。内因性野生型 (WT) マウスSOD1に加えて、ALSを引き起こすヒトSOD1変異体を発現するトランスジェニックマウスは、ALS様神経変性および麻痺を発症したことから、変異SOD1は毒性特性の獲得を介してALS疾患を引き起こすという結論に至った。SOD1について免疫反応性である蛋白質性封入体が、fALS‐SOD1患者とトランスジェニックマウスの脊髄に見出されている。従って、SOD1の凝集がSOD1関連fALSの病因の根底にあると考えられる。

変異型SOD1は、それ自体で、または他の細胞内成分とオリゴマー化し、高分子量凝集体 (可溶性オリゴマーまたは不溶性凝集体) を形成すると仮定されている。ALS関連変異SOD1バリアントはすべて、ヒトWT (hWT) 酵素と比較して、より高い凝集傾向を示す。しかし、SOD1ポリペプチドの不安定化は、すべてのSOD1変異タンパク質に共通する特徴ではない。Zn及びCu補因子の結合及びジスルフィド結合の形成を含む、SOD1の翻訳後修飾は、SOD1の安定性に大きく寄与する。SOD1凝集における金属化状態およびジスルフィド状態（未成熟なまたはミスフォールド形態のSOD1を含む可能性が高い）の役割がY. Sheng et al., (2012, Current Topics in Medicinal Chemistry, 12:2560-2572)によって論じられてきた。

ALSは、疾患が起こり得る多種多様な態様があるため、不均一な疾患である。ALSには多くの異なる型があり、それらの型は、それらの徴候および症状、ならびにそれらの遺伝的原因または明らかな遺伝学的連関の欠如によって区別される。孤発性ALSの患者のほとんどは、明らかな警告なしに、多くの場合50歳代後半または60歳代前半に本疾患の特徴を呈する。fALS患者のごく一部 (約5～10%) は、ALSの家族歴や、人格、行動、言語に影響を及ぼす進行性の脳疾患である前頭側頭型認知症 (FTD) と呼ばれる関連疾患を有している。fALSの徴候および症状は、典型的には、40代後半または50代前半の人々に最初に現れる。若年性ALSと呼ばれるまれな型のALSの症状は小児期または10代に発生する

ALSの最初の徴候および症状はしばしば軽微であり、見落とされることがある。最初期のALS症状には、筋肉のひきつり、けいれん、こわばり、筋力低下などがある。患者は不明瞭な発話 (構音障害) を起こし、後に咀嚼や嚥下が困難になり得る (嚥下困難) 。ALS患者の多くは、嚥下困難による摂食量の減少、および長期疾患による身体のエネルギー需要 (代謝) の増加のために、栄養失調を経験する。病気が進行すると筋肉は弱くなり、筋肉組織が萎縮すると腕や脚が細く見え始める。ALS患者は最終的に筋力と歩行能力を失う;このようにして、彼らは車椅子依存になる。時間の経過とともに、筋力低下によりALS患者は手および腕の使用を失う。呼吸器系の筋肉が弱くなるために、ALS患者は呼吸困難を起こし、ALSの徴候や症状が現れてから2～10年以内に呼吸不全の結果としてしばしばこの病気に打ち負かされる。しかしながら、疾患の進行は患者によって大きく異なる。ALS患者の約20%がFTDも発症する。人格や行動に変化により、患者は社会的に適切な方法で他者と交流することが難しくなり得る。病気が進行するにつれてコミュニケーション能力が悪化する。ALSとFTDがどのように関連しているかは不明であるが、両方の状態を発症した患者はALS-FTDと診断される。

ALS誘発性SOD1変異は共通して、SOD1蛋白質の折畳み平衡を、非折畳み及び部分的折畳み単量体の方にシフトさせ、初期折畳み事象から有害な副反応が生じることを示唆している。アポSOD単量体の立体配座レパートリーが、蛋白質の折畳み挙動の解析を通じてマッピングされた。解析の結果、生理的条件下で局所的に最も脱折り畳みを受けやすいSOD構造（通常は蛋白質内部に隠れている、構造的に無節操な界面の露出をもたらす）の領域をターゲティングすることが可能となり、未熟なアポSOD単量体が細胞毒性の前駆体であるという他の知見を確認した（A. Nordlund and M. Oliveberg, 2006; Proc. Natl. Acad. Sci. USA.; 103(27):10218-10223）。フォールディング平衡のシフトに伴って、ALS関連SOD変異は、蛋白質安定性の低下、正味電荷、および疾患進行の間の定量的関係を示す。まとめると、これらのデータは、少なくともALSの家族性形態において、例えば分子シャペロンの過負荷および膜脂質との有害な集塊のような、破壊された構造および減少した反発性電荷により誘発される蛋白質凝集または他の随伴性プロセスに関連する疾患機序を示唆する。(同上)。

現在のところ、ALSの治癒は存在しない。ALSの治療には、けいれん、痛み、嚥下機能のコントロールなど、疾患の症状に対処し進行を遅らせる薬剤が含まれる。ALS患者の脳内の高濃度のグルタメートを減少させ得るリルゾール (リルテック) や、ALSに伴う日常機能の衰えを減少させ得るエダラボン (ラディカバ) などの薬剤は、一部の患者では疾患の進行を遅らせたり減少させたりしているが、すべての患者において持続的ではない。

今日まで、ALSの治療のための既存の薬剤、治療法および戦略は、限られた成功しか得られていない。したがって、ALS患者を治療し、疾患に関連する症状および破壊的な衰弱を低減、改善および/または軽減するための新規な組成物および方法が強く必要とされている。

［球脊髄性筋萎縮症とアンドロゲン受容体 (AR)］
球脊髄性筋萎縮症（SBMA、ケネディ病としても知られる）は、球筋および四肢筋の進行性衰弱を特徴とする、X連鎖性の成人発症型運動ニューロン疾患である。SBMA患者は、顔面筋の筋力低下、嚥下困難を経験し、発症から20～30年後に車椅子生活を余儀なくされる。SBMAは、ハンチントン病および脊髄小脳失調症7型を含むCAG‐ポリグルタミン拡張疾患のファミリーのメンバーである。CAGの拡張の長さは疾患の発症年齢と逆相関しており、すなわち拡張が長ければ長いほど発症が早い。SBMAでは、CAG反復長は運動および感覚神経伝導異常とも相関する。

SBMAリピート伸長はアンドロゲン受容体 (AR) 遺伝子の第1エキソン中に起こる。アンドロゲン受容体は核内受容体であり、通常はリガンド結合後に遺伝子発現を調節する。ヒトでは、ヘテロ接合の女性保因者は一般に無症状であり、ホモ接合の女性でも症状は軽度である。SBMA疾患の症状は、変異アンドロゲン受容体におけるリガンド依存性の毒性機能獲得に起因する。現在まで、SBMAに対する有効な治療法はない。従って、神経機能の進行性喪失を予防または改善する、SBMA患者を治療する方法の必要性が存在する。

［スプライスアクセプター塩基の編集とエキソンのスプライシング］
本明細書では、疾患関連遺伝子または疾患原因遺伝子 (例えば、ALSに関連するSOD1遺伝子またはその変異型) のエクソンに関連するスプライスアクセプター内の1つ以上の標的ヌクレオチド (DNA塩基) を変異させるための、デアミナーゼ（例えば、ABE8にようなアデノシンデアミナーゼ、または本明細書に記載するシチジンデアミナーゼ）を含む、塩基エディターシステムおよびその使用方法を特徴とする。疾患関連遺伝子のスプライスアクセプター中の核酸塩基を編集することによって、本明細書に記載された塩基エディターシステムおよび方法は、プレメッセンジャーRNA (プレmRNA) がイントロン配列の除去を通じて成熟することによってエクソンの並置をもたらし成熟タンパク質への翻訳に先立って成熟転写物を形成する重要な生物学的プロセスである遺伝子スプライシングを調節する。スプライスアクセプター (またはスプライスアクセプター部位) は、遺伝子のイントロン核酸配列の3’末端かつエキソン (エキソン核酸配列) の5’側に位置する正準ヌクレオチド配列「AG」として当技術分野で公知である。一実施形態によると、遺伝子は、SOD1酵素タンパク質をコードするSOD1である。一実施形態によると、エキソンはSOD1遺伝子のエキソン3であり、スプライスアクセプターAGはSOD1遺伝子のエキソン3の5’末端に近接している。(図2)。

RNAスプライシングはRNAプロセシングの一形態であり、新しく作られた前駆体メッセンジャーRNA (プレmRNA) 転写産物が成熟メッセンジャーRNA (mRNA) に変換される。スプライシングの際には、イントロン (ゲノムDNAまたは遺伝子における非コード核酸配列) が除去され、エキソン (遺伝子コード領域核酸配列) が並置される。核にコードされた遺伝子の場合、スプライシングは核内で転写の際にまたは転写の直後に起こる。イントロンを含む真核生物の遺伝子では、タンパク質に翻訳され得る成熟mRNA分子をつくるためにスプライシングが通常必要になる。多くの真核生物イントロンでは、スプライシングは、スプライソソームすなわち低分子リボ核タンパク（snRNP）の複合体が触媒する一連の反応によって行われる。スプライソソームの会合と活性はプレmRNAの転写中に起こる。snRNPのRNA成分がイントロンと相互作用し、触媒作用に関与する。親RNA分子から自分自身の切り出しを触媒することができる自己スプライシング型イントロンあるいはリボザイムも存在する。

エキソンのスプライシングの際の一つの重要な段階は、エキソンとイントロンを規定する高度に保存された核酸配列がスプライソソーム機構によって認識されることである。より具体的には、遺伝子のエクソンに先行するほぼすべてのイントロンの5’末端は、正準またはコンセンサス「GT」核酸配列（「ドナー配列」と呼ばれる）で始まり、正準またはコンセンサス「AG」核酸配列（「アクセプター配列」と呼ばれる）で終わる。これらのドナーとアクセプターの核酸配列 (部位) は、遺伝子の転写と、イントロンをスプライシングで除去するタンパク質複合体 (スプライソソーム) による認識とに関与しており、遺伝子のエキソンが隣接して完全な遺伝子転写産物がつくられる。本明細書に記載のシステムおよび方法によれば、ゲノムDNA中のエクソンのスプライスアクセプター部位内の「AG」核酸配列を破壊する突然変異は、必須タンパク質による不適切なスプライシングをもたらし得、その結果、1つ以上のエクソンの正常な転写も破壊され、それによって、ある場合には遺伝子の成熟転写産物へのエクソンの取り込みが妨げられる。一実施形態によると、標的「AG」アクセプター配列のアデノシンが、本明細書に記載するような塩基エディターシステムおよび方法によってグアノシンに効果的に変換され、それが異常なアクセプター配列を生成し、mRNAスプライシングの破壊を引き起こす。コンセンサススプライスアクセプター配列が変化すると、アミノ酸の挿入や欠失、あるいはmRNAの読み枠の破壊が起こり得、それが最終的にタンパク質に翻訳される。

特定の実施形態では、本明細書に記載される塩基編集システムおよび方法は、ALSと関連するSOD1遺伝子のエクソン3の5’にあるAGスプライスアクセプターにおける核酸塩基を正確な様式で変異させ、それによって遺伝子の転写の際にスプライス破壊を引き起こす。これはひいては、改変されたまたは代替のSOD1転写産物 (遺伝子転写物) をもたらし、最終的には、例えば、完全長の破壊されていない遺伝子産物と比較して切り詰められたSOD1タンパク質をもたらす破壊されたSOD1遺伝子産物を生じる。プレmRNA転写物がプロセシングされる際に、破壊されたまたは代替的なスプライシングは、遺伝子の特定のエクソンの不適切な転写、および/または成熟転写物からの排除をもたらし得る。通常の状況下では、代替的スプライシングは、どのタンパク質アイソフォームが発現されるかについての時間的および組織特異的な制御を提供し、したがって生物学的複雑性および発生において重要な役割を果たす。本明細書に記載の塩基編集システムおよび方法によって提供されるような、代替的スプライシングをもたらすスプライスアクセプターの分子編集は、遺伝子転写を選択的に破壊することができ、遺伝子の特定のエクソン、場合によっては突然変異を含むエクソンが成熟転写産物から特異的に回避または排除される、有利な分子ツールを提供する。結果として生じる蛋白は、機能が低下しているか、または全く機能しないこともあり得る。いくつかの実施形態において、本明細書中に記載されるスプライス破壊によって生成された代替的転写物は、分解されるか、または断片または短縮タンパク質をもたらし得、それらタンパク質自体も細胞機構によって分解される。

本明細書に記載されるシステムおよび方法は、遺伝子スプライシングに影響を与え、所与の遺伝子によってコードされる1以上の遺伝子産物のバランスを調節するのに有用である。本願明細書に記載されるポリヌクレオチドプログラム可能なDNA塩基エディターシステムおよび方法は、スプライスアクセプター部位を特異的に標的化し、エクソンのゲノムDNA (gDNA) に変化を導入してgDNAを改変することにより、遺伝子の選択されたエクソンの5’にあるスプライスアクセプターの正確な突然変異による転写物スプライシング破壊を達成する。一実施形態によると、この遺伝子は、運動ニューロン細胞におけるその毒性過剰発現がALSに関連する酵素であるSOD1をコードする、SOD1遺伝子である。ヒトSOD1遺伝子のコード配列は、SOD1ゲノム配列において以下のように記載される5つのエクソンを含む：エクソン1はヌクレオチド149～220を包含する；エクソン2はヌクレオチド4169～4265を包含する；エクソン3はヌクレオチド6828～6897を包含する；エクソン4はヌクレオチド7637～7754を包含する；エクソン5は、SOD1ゲノムポリヌクレオチド配列のヌクレオチド8850～8957を包含する。

一実施形態によると、SOD1遺伝子のエクソン3の5’に位置する「AG」核酸スプライスアクセプター部位の「A」ヌクレオチドが標的とされ、システムのデアミナーゼによって「G」ヌクレオチドに正確に変換される。一実施形態によると、デアミナーゼはアデノシンデアミナーゼである。一実施形態によると、アデノシンデアミナーゼはABE8である。実施形態では、ABE8は、本明細書に記載のABE8.1～ABE8.14、またはABE7.10である。一実施形態によると、SOD1遺伝子のエクソン1の5’に位置する「AG」核酸スプライスアクセプターの「A」ヌクレオチドが、SOD1転写物のスプライシングを破壊するように標的化される。一実施形態によると、SOD1遺伝子のエクソン2の5’に位置する「AG」核酸スプライスアクセプターの「A」ヌクレオチドが、SOD1転写物のスプライシングを破壊するように標的化される。一実施形態によると、SOD1遺伝子のエクソン4の5’に位置する「AG」核酸スプライスアクセプターの「A」ヌクレオチドが、SOD1転写物のスプライシングを破壊するように標的化される。一実施形態によると、SOD1遺伝子のエクソン5の5’に位置する「AG」核酸スプライスアクセプターの「A」ヌクレオチドが、SOD1転写物のスプライシングを破壊するように標的化される。

［治療方法］
疾患もしくは状態、および／または疾患もしくは状態を引き起こす遺伝子変異を治療する方法も提供される。これらの方法は、対象（例えば、ヒトなどの哺乳動物）に、本明細書に記載の塩基エディターシステム（例えば、塩基エディターおよびｇＲＮＡ）をコードするポリヌクレオチドを含む治療有効量の医薬組成物を投与することを含む。いくつかの実施形態において、塩基エディターは、ｎａｐＤＮＡｂｐドメインとアデノシンデアミナーゼドメインまたはシチジンデアミナーゼドメインとを含む融合タンパク質である。対象の細胞が、塩基エディターと、その塩基エディターを標的指向化させる1つまたは複数のガイドポリヌクレオチドとで形質導入され、目的の遺伝子に変異を含む核酸配列のA・TからG・Cへの改変（細胞がアデノシンデアミナーゼドメインで形質導入されている場合）またはC・GからU・Aへの改変（細胞がシチジンデアミナーゼドメインで形質導入されている場合）がもたらされる。

本明細書に記載の方法は、本明細書に記載の組成物の有効量を対象(そのような治療を必要としていると特定された対象、又は疾患のリスクがありそのような治療を必要としていると疑われる対象を含む)に投与することを含む。このような治療を必要とする対象を同定することは、対象または医療専門家の判断にあり得、主観的(例えば所見)または客観的(例えば、検査または診断方法によって測定可能)であり得る。

治療方法は、一般的に、例えば、それを必要とする対象（例えば、ヒト患者）の目的遺伝子を標的とする、塩基エディターおよびgRNAをコードするベクターを含む薬学的組成物の治療有効量の投与を含む。このような治療は、その疾患または状態を患っている、それを有している、それに罹患しやすい、またはその罹患のリスクがある対象、特にヒト対象に適切に投与される。

一実施形態では、本発明は、治療の進行を監視する方法を提供する。本方法は、疾患、障害、またはその症状に罹患しているかまたは罹患しやすい対象において、診断マーカー（マーカー）（例えば疾患または状態に関連するSNP）または診断測定(例えば、スクリーニング、アッセイ) のレベルを決定する工程を含み、ここでその対象は、疾患またはその症状を治療するのに十分な本明細書中の組成物の治療量を投与された対象である。この方法で測定されたマーカーのレベルを、健康な正常対照または他の罹患患者のいずれかにおけるマーカーの既知のレベルと比較して、対象の疾患状態を確立することができる。好ましい態様において、第1のレベルの決定よりも後の時点で、対象におけるマーカーの第2のレベルが決定され、疾患の経過または治療の有効性をモニターするためにこの2つのレベルが比較される。特定の好ましい実施形態では、対象における治療前のマーカーのレベルが、本発明による治療を開始する前に決定される。このマーカーの治療前レベルを治療開始後の対象のマーカーレベルと比較して、治療の有効性を判定することができる。

ある実施形態において、細胞が対象から取得され、本明細書に提供される薬学的組成物と接触される。いくつかの態様において、対象から取り出されてex vivoで薬学的組成物と接触された細胞は、場合により、所望のゲノム改変が細胞において実行または検出された後に、対象に再導入される。ヌクレアーゼを含む薬学的組成物を送達する方法は、例えば、米国特許第6,453,242; 6,503,717; 6,534,261; 6,599,692; 6,607,882; 6,689,558; 6,824,978; 6,933,113; 6,979,539; 7,013,219; および7,163,824号に記載されており、その開示全体が参照により本明細書に組み込まれる。本明細書に提供される薬学的組成物の説明は、主に、ヒトへの投与に適した薬学的組成物に向けられているが、そのような組成物は、一般に、あらゆる種類の動物または生物への投与、例えば、獣医学的使用に適していることが、当業者によって理解されるであろう。

本明細書に提供されるのは、本明細書に記載の組成物またはシステム、例えば、塩基エディターシステムまたは塩基エディタータンパク質を用いて疾患または障害を治療する方法である。任意で、本明細書に記載の塩基エディターシステムは、１つまたは複数の他の処置と組み合わせることができる。一態様では、本明細書に提供されるのは、本明細書に記載の塩基エディターを投与することによって、必要とする対象において筋萎縮性側索硬化症（ALS）を治療する方法である。一態様では、本明細書で提供されるのは、本明細書で説明される塩基エディターを投与することによって、それを必要とする対象の球脊髄性筋萎縮症（SBMA）を治療する方法である。

個々の対象の応答は、完全な応答、部分的な応答、または安定した疾患として特徴付けられ得る。いくつかの実施形態では、応答は部分的応答（ＰＲ）である。いくつかの実施形態では、応答は完全応答（ＣＲ）である。いくつかの実施形態において、応答は、対象の無増悪生存期間（例えば、安定した疾患）をもたらす。

いくつかの実施形態において、治療は、そのヒト対象がその化合物で処置されなかった場合のヒト対象の予想される生存時間と比較して、ヒト対象の生存時間の増加をもたらす。

いくつかの実施形態では、記載された方法で治療されるヒト対象は、子供（例えば、０～１８歳）である。他の実施形態では、記載された方法で治療されるヒト対象は、成人（例えば、１８歳超）である。

［筋萎縮性側索硬化症（ALS）を治療する方法］
スーパーオキシドジスムターゼ1（SOD1）遺伝子などの、ALSに関連する遺伝子のイントロンの保存されたスプライスアクセプター部位を正確に塩基編集することにより、対象（例えば哺乳動物対象またはヒト対象）におけるSOD1遺伝子のエキソン間のイントロン配列の通常のスプライシング除去を破壊または不活性化し、それにより、SOD1遺伝子のエキソンの転写の際の通常のスプライシングを破壊または阻害し、ひいては、異常なおよび/または非機能的な（例えば切り詰められた）SOD1酵素を産生することによって、筋萎縮性側索硬化症（ALS）およびその症状を治療する方法が本明細書に提供される。スプライス破壊は、対象の運動ニューロンにおけるSOD1遺伝子によってコードされるSOD1酵素の正常なまたは機能的な発現を低減または排除し得る。一実施形態では、対象はヒト患者である。特定の実施形態では、対象は、ALSに罹患しているヒト患者である。この方法は、対象（例えば、ヒト、またはALSを有するヒトのような、哺乳動物）に、本明細書記載の塩基エディターシステム（例えば、塩基エディターとgRNA）をコードするポリヌクレオチドを含む治療有効量の医薬組成物を投与することを含む。いくつかの実施形態において、塩基エディターは、ポリヌクレオチドプログラム可能なDNA結合ドメインとアデノシンデアミナーゼドメインとを含む融合タンパク質である。いくつかの実施形態において、塩基エディターは、ポリヌクレオチドプログラム可能なDNA結合ドメインとシチジンデアミナーゼドメインとを含む融合タンパク質である。対象の細胞、例えば、モーターニューロンまたはCNS細胞が、塩基エディターと、塩基エディターを標的指向化する1つまたは複数のガイドポリヌクレオチドとで形質導入され、遺伝子のエキソン核酸配列の5'に位置するスプライスアクセプター配列（AG）（例えば本明細書の実施例１に記載されるような、SOD1遺伝子のエキソン3の5'に存在するスプライスアクセプター配列）を含むイントロニック核酸配列のA→G改変（細胞がアデノシンデアミナーゼドメインで形質導入された場合）またはC→U改変（細胞がシチジンデアミナーゼドメインで形質導入された場合）をもたらす。

治療方法は、一般的に、例えば、それを必要とする対象（例えばヒト患者）の疾患関連または疾患原因遺伝子のエキソン、例えばSOD1遺伝子のエキソン3（の5′側）に隣接するスプライスアクセプター部位を標的とする、塩基エディターおよびgRNAをコードするベクターを含む薬学的組成物の治療有効量の投与を含む。このような治療は、ALSを患っている、それを有している、それに罹患しやすい、またはその罹患のリスクがある対象、特にヒト対象に適切に投与される。本明細書の組成物はまた、ALSが関係している可能性がある他の任意の障害の治療にも使用され得る。

一実施形態では、治療の進行を監視する方法が提供される。本方法は、ALSに関連する障害またはその症状に罹患しているかまたは罹患しやすい対象において、診断マーカー（マーカー）（例えばALSに関連するSNP）または診断測定（例えば、スクリーニング、アッセイ）のレベルを決定する工程を含み、ここでその対象は、疾患またはその症状を治療するのに十分な本明細書中の組成物の治療量を投与された対象である。この方法で測定されたマーカーのレベルを、健康な正常対照または他の罹患患者のいずれかにおけるマーカーの既知のレベルと比較して、対象の疾患状態を確立することができる。好ましい態様において、第1のレベルの決定よりも後の時点で、対象におけるマーカーの第2のレベルが決定され、疾患の経過または治療の有効性をモニターするためにこの2つのレベルが比較される。特定の好ましい実施形態では、対象における治療前のマーカーのレベルが、本発明による治療を開始する前に決定される。このマーカーの治療前レベルを治療開始後の対象のマーカーレベルと比較して、治療の有効性を判定することができる。

ある実施形態では、運動ニューロン細胞またはCNS細胞のような細胞が対象から取得され、本明細書に提供される薬学的組成物と接触される。いくつかの態様において、対象から取り出されてex vivoで薬学的組成物と接触された細胞は、場合により、所望のゲノム改変が細胞において実行または検出された後に、対象に再導入される。ヌクレアーゼを含む薬学的組成物を送達する方法は、例えば、米国特許第6,453,242; 6,503,717; 6,534,261; 6,599,692; 6,607,882; 6,689,558; 6,824,978; 6,933,113; 6,979,539; 7,013,219; および7,163,824号に記載されており、その開示全体が参照により本明細書に組み込まれる。本明細書に提供される薬学的組成物の説明は、主に、ヒトへの投与に適した薬学的組成物に向けられているが、そのような組成物は、一般に、あらゆる種類の動物または生物への投与、例えば、獣医学的使用に適していることが、当業者によって理解されるであろう。

対象は、ALSの1つまたは複数の症状の改善を示すことができる。一実施形態では、症状の一つ以上における改善は少なくとも5%である。別の実施形態では、症状の一つ以上における改善は少なくとも10%である。別の実施形態では、症状の一つ以上における改善は少なくとも15%である。別の実施形態では、症状の一つ以上における改善は少なくとも20%である。別の実施形態では、症状の一つ以上における改善は少なくとも25%である。別の実施形態では、症状の一つ以上における改善は少なくとも30%である。別の実施形態では、症状の一つ以上における改善は少なくとも35%である。別の実施形態では、症状の一つ以上における改善は少なくとも40%である。別の実施形態では、症状の一つ以上における改善は少なくとも50%である。別の実施形態では、症状の一つ以上における改善は少なくとも60%である。別の実施形態では、症状の一つ以上における改善は少なくとも70%である。別の実施形態では、症状の一つ以上における改善は少なくとも75%である。別の実施形態では、症状の一つ以上における改善は少なくとも80%である。別の実施形態では、症状の一つ以上における改善は少なくとも85%である。別の実施形態では、症状の一つ以上における改善は少なくとも90%である。別の実施形態では、症状の一つ以上における改善は少なくとも95%である。

［球脊髄性筋萎縮症（SBMA）を治療する方法］
対象（例えば、ヒトなどの哺乳動物）に、本明細書に記載の塩基エディターシステム（例えば、塩基エディターおよびgRNA）をコードするポリヌクレオチドを含む治療有効量の医薬組成物を投与することを含む、SBMAを治療する方法も提供される。いくつかの実施形態において、塩基エディターは、ポリヌクレオチドプログラム可能なDNA結合ドメインとアデノシンデアミナーゼドメインまたはシチジンデアミナーゼドメインとを含む融合タンパク質である。対象の細胞が、塩基エディターと、その塩基エディターを標的指向化させる1つまたは複数のガイドポリヌクレオチドとで形質導入され、AR遺伝子における変異含有核酸配列のA・TからG・Cへの改変（細胞がアデノシンデアミナーゼドメインで形質導入されている場合）またはC・GからU・Aへの改変（細胞がシチジンデアミナーゼドメインで形質導入されている場合）がもたらされる。

治療方法は一般的に、例えば、必要とする対象（例えば、ヒト患者）のトリヌクレオチド反復拡張を含む変異型AR遺伝子を標的とする、塩基エディターおよびgRNAをコードするベクターを含む薬学的組成物の治療有効量の投与を含む。このような治療は、SBMAを患っている、それを有している、それに罹患しやすい、またはその罹患のリスクがある対象、特にヒト対象に適切に投与される。本明細書の組成物はまた、ARにおけるトリヌクレオチド反復拡張が関係している可能性がある他の任意の障害の治療にも使用され得る。

一実施形態では、本発明は、治療の進行を監視する方法を提供する。本方法は、SBMAの障害またはその症状に罹患しているかまたは罹患しやすい対象において、診断マーカー（マーカー）のレベル（例えばARポリペプチドのレベル）の決定または診断測定（例えば、スクリーニング、アッセイ）の工程を含み、ここでその対象は、疾患またはその症状を治療するのに十分な本明細書中の組成物の治療量を投与された対象である。この方法で測定されたマーカーのレベルを、健康な正常対照または他の罹患患者のいずれかにおけるマーカーの既知のレベルと比較して、対象の疾患状態を確立することができる。好ましい態様において、第1のレベルの決定よりも後の時点で、対象におけるマーカーの第2のレベルが決定され、疾患の経過または治療の有効性をモニターするためにこの2つのレベルが比較される。特定の好ましい実施形態では、対象における治療前のマーカーのレベルが、本発明による治療を開始する前に決定される。このマーカーの治療前レベルを治療開始後の対象のマーカーレベルと比較して、治療の有効性を判定することができる。

対象は、SBMAの1つまたは複数の症状の改善を示すことができる。一実施形態では、症状の一つ以上における改善は少なくとも5%である。別の実施形態では、症状の一つ以上における改善は少なくとも10%である。別の実施形態では、症状の一つ以上における改善は少なくとも15%である。別の実施形態では、症状の一つ以上における改善は少なくとも20%である。別の実施形態では、症状の一つ以上における改善は少なくとも25%である。別の実施形態では、症状の一つ以上における改善は少なくとも30%である。別の実施形態では、症状の一つ以上における改善は少なくとも35%である。別の実施形態では、症状の一つ以上における改善は少なくとも40%である。別の実施形態では、症状の一つ以上における改善は少なくとも50%である。別の実施形態では、症状の一つ以上における改善は少なくとも60%である。別の実施形態では、症状の一つ以上における改善は少なくとも70%である。別の実施形態では、症状の一つ以上における改善は少なくとも75%である。別の実施形態では、症状の一つ以上における改善は少なくとも80%である。別の実施形態では、症状の一つ以上における改善は少なくとも85%である。別の実施形態では、症状の一つ以上における改善は少なくとも90%である。別の実施形態では、症状の一つ以上における改善は少なくとも95%である。

［医薬組成物］
本開示の他の態様は、本明細書に記載される塩基エディター、融合タンパク質、または融合タンパク質-ガイドポリヌクレオチド複合体のいずれかを含む医薬組成物に関する。いくつかの態様において、医薬組成物は、薬学的に許容される担体をさらに含む。ある態様において、医薬組成物は、さらなる薬剤（例えば特異的送達、半減期の延長のためのもの、または他の治療化合物）を含む。

適切な薬学的に許容される担体は、一般に、対象に医薬組成物を投与することを助け、医薬組成物を送達可能な調製物に加工することを助け、または投与前に医薬組成物を保存することを助ける、不活性物質を含む。薬学的に許容される担体は、製剤の形態、質感、粘度、pH、薬物動態、溶解性を安定化、最適化、または他の態様で変化させることができる剤を含むことができる。

薬学的に許容される担体として役立つことができる物質のいくつかの非限定的な例は、以下を含む: (1) ラクトース、グルコースおよびスクロースのような糖;(2) コーンスターチ、ジャガイモでん粉等のでん粉;(3) セルロース及びその誘導体 (カルボキシメチルセルロースナトリウム、メチルセルロース、エチルセルロース、微結晶セルロース、酢酸セルロース等);(4) トラガント末;(5) モルト;(6)ゼラチン;(7) ステアリン酸マグネシウム、ラウリル硫酸ナトリウム、タルク等の潤滑剤;(8) ココアバター、坐剤用ワックス等の添加剤;(9) 落花生油、綿実油、ベニバナ油、ゴマ油、オリーブ油、コーン油、大豆油等の油;(10) プロピレングリコール等のグリコール;(11) ポリオール、例えばグリセリン、ソルビトール、マンニトール及びポリエチレングリコール (PEG); (12) エステル、例えばオレイン酸エチルおよびラウリン酸エチルなど;(13) 寒天;(14) 水酸化マグネシウム、水酸化アルミニウム等の緩衝剤;(15) アルギン酸;(16) パイロジェンフリー水;(17) 生理食塩液;(18) リンガー液;(19)エチルアルコール;(20) pH緩衝液;(21) ポリエステル、ポリカーボネート及び／又はポリ無水物;(22) ポリペプチドおよびアミノ酸のような増量剤 (23) エタノールのような血清アルコール;及び (23) 製剤に使用される他の非毒性適合性物質。緩衝剤、湿潤剤、乳化剤、希釈剤、封入剤、皮膚浸透増強剤、着色剤、離型剤、コーティング剤、甘味剤、風味料、香料、保存剤および抗酸化剤も製剤中に存在させることができる。例えば、担体は、限定されるものではないが、生理食塩水、緩衝生理食塩水、デキストロース、アルギニン、スクロース、水、グリセロール、エタノール、ソルビトール、デキストラン、カルボキシメチルセルロースナトリウム、およびそれらの組み合わせを含むことができる。

薬学的組成物は、約5.0～約8.0の範囲などの生理学的pHを反映する所定のレベルに製剤のpHを維持するために、一つ以上のpH緩衝化合物を含むことができる。水性液体製剤で使用されるpH緩衝化合物は、アミノ酸またはヒスチジンなどのアミノ酸の混合物、またはヒスチジンおよびグリシンなどのアミノ酸の混合物であり得る。あるいは、pH緩衝化合物は、製剤のpHを所定のレベル、例えば約5.0～約8.0の範囲に維持し、カルシウムイオンをキレートしない剤であることが好ましい。このようなpH緩衝化合物の典型的な例としては、イミダゾールおよび酢酸イオンが挙げられるが、これらに限定されない。pH緩衝化合物は、製剤のpHを所定のレベルに維持するのに適した任意の量で存在し得る。

薬学的組成物はまた、一つ以上の浸透圧調節剤、すなわち、処方物の浸透圧特性(例えば、等張性、オスモラリティ、および／または浸透圧)をレシピエント個体の血流および血液細胞にとって許容可能なレベルに調節する化合物を含有することができる。浸透圧調節剤は、カルシウムイオンをキレートしない薬剤であり得る。浸透圧調節剤は、製剤の浸透圧特性を調節する当業者に公知または入手可能な任意の化合物であり得る。当業者は、本発明の処方における使用のための所定の浸透圧調節剤の適合性を経験的に決定することができる。適切なタイプの浸透圧調節剤の例示的な例としては、塩化ナトリウムおよび酢酸ナトリウムのような塩；スクロース、デキストロース、マンニトールなどの糖;グリシンなどのアミノ酸;これらの薬剤および/または薬剤タイプの1つ以上の混合物が挙げられるが、これらに限定されない。浸透圧調節剤は、製剤の浸透圧特性を調節するのに十分な任意の濃度で存在し得る。

いくつかの実施形態において、薬学的組成物は、対象への送達のために、例えば遺伝子編集のために製剤化される。いくつかの実施形態において、本明細書で企図される薬学的組成物の投与は、限定されるものではないが、注入、輸血、または非経口的を含む従来の技術を用いて実施され得る。いくつかの実施形態において、非経口投与は、血管内、静脈内、筋肉内、動脈内、髄腔内、腫瘍内、皮内、腹腔内、経気管、皮下、角質下、関節内、莢膜内、くも膜下および胸骨内への注入または注射を含む。いくつかの実施形態において、本明細書に記載の医薬組成物を投与する適切な経路は、限定されるものではないが、局所、皮下、経皮、皮内、病巣内、関節内、腹腔内、膀胱内、経粘膜、歯肉、歯内、蝸牛内、経鼓膜、器官内、硬膜外、髄腔内、筋肉内、静脈内、血管内、骨内、眼周囲、腫瘍内、脳内、および脳室内投与を含む。

いくつかの態様において、本明細書に記載される薬学的組成物は、患部(例えば腫瘍部位)に局所的に投与される。いくつかの実施形態において、本明細書に記載される薬学的組成物は、注射、カテーテル、坐剤、またはインプラントによって、対象に投与され、インプラントは、多孔質、非多孔質、またはゼラチン質材料であり、例えば、シアラスティック膜、または繊維などの膜を含む。

他の態様において、本明細書に記載される薬学的組成物は、制御放出システムにおいて送達される。一実施形態では、ポンプを使用することができる（例えばLanger, 1990, Science 249: 1527-1533; Sefton, 1989, CRC Crit. Ref. Biomed. Eng. 14:201; Buchwald et al., 1980, Surgery 88:507; Saudek et al, 1989, N. Engl. J. Med. 321:574参照）。別の実施形態では、ポリマー材料を使用することができる。（例えばMedical Applications of Controlled Release (Langer and Wise eds., CRC Press, Boca Raton, Fla., 1974); Controlled Drug Bioavailability, Drug Product Design and Performance (Smolen and Ball eds., Wiley, New York, 1984); Ranger and Peppas, 1983, Macromol. Sci. Rev. Macromol. Chem. 23:61. See also Levy et al., 1985, Science 228: 190; During et al., 1989, Ann. Neurol. 25:351; Howard et ah, 1989, J. Neurosurg. 71: 105.）。他の制御放出システムは、例えば、上記Langerに記載されている。

いくつかの態様において、薬学的組成物は、対象、例えばヒトへの静脈内または皮下投与に適合された組成物として、ルーチンの手順に従って製剤化される。いくつかの態様において、注射による投与のための医薬組成物は、可溶化剤としての無菌等張使用の溶液および注射部位の痛みを緩和するためのリグノカインなどの局所麻酔薬である。一般に、成分は、単位投与形態、例えば、活性剤の量を示すアンプルまたはサシェットのような密閉容器内の乾燥凍結乾燥粉末または水を含まない濃縮物として、別々にまたは一緒に供給される。薬剤が注入によって投与される場合には、無菌の医薬グレードの水または生理食塩水を含む注入ボトルを用いてそれを分注することができる。医薬組成物が注射によって投与される場合、投与前に成分を混合することができるように、注射用滅菌水または生理食塩水のアンプルを提供することができる。

全身投与のための医薬組成物は、液体、例えば滅菌生理食塩水、乳酸化リンゲル液またはハンク液であり得る。さらに、医薬組成物は、固体形態であって、使用の直前に再溶解または懸濁され得る。凍結乾燥形態もまた考えられる。医薬組成物は、非経口投与にも適した、リポソームまたは微結晶などの脂質粒子または小胞内に含有することができる。粒子は、組成物がその中に含まれる限り、単ラメラまたは複数ラメラのような任意の適切な構造であり得る。化合物は、融合性脂質ジオレオイルホスファチジルエタノールアミン(DOPE)、低量(5-10モル%)のカチオン性脂質を含み、ポリエチレングリコール (PEG) コーティングにより安定化された、「安定化プラスミド脂質粒子」(SPLP)中に捕捉され得る (Zhang Y. P. et ah, Gene Ther. 1999, 6: 1438-47)。このような粒子および小胞には、N-[l-(2,3-ジオレオイルキシ)プロピル]-N,N,N-トリメチル-アモニウムメチル硫酸塩、あるいは「DOTAP」のような正電荷脂質が特に好ましい。このような脂質粒子の調製はよく知られている。例えば、米国特許第4,880,635；4,906,477；4,911,928；4,917,951；4,920,016;および4,921,757号参照（その各々は、参照により本明細書に組み込まれる）。

本明細書に記載の医薬組成物は、例えば、単位用量として投与または包装することができる。「単位用量」という用語は、本開示の薬学的組成物に関して使用される場合、対象のための単一用量として適した物理的に個別の単位を指し、各単位は、必要な希釈剤（例えば担体、またはビヒクル）と合わせて所望の治療効果を生じるように計算された所定量の活性物質を含有する。

さらに、この薬学的組成物は、 (a) 凍結乾燥形態の本発明の化合物を含有する容器、および (b) 本発明の凍結乾燥化合物の再構成または希釈のために使用される、薬学的に許容される希釈剤 (例えば無菌のもの) を含有する第2の容器を含む薬学的キットとして提供することができる。必要に応じて、そのような容器には、医薬品又は生物学的製剤の製造、使用又は販売を規制する政府機関によって規定された様式の通知であって、人に投与するための製造、使用又は販売の機関による承認を反映するものとすることができる。

別の態様では、上記疾患の治療に有用な材料を含む製品が含まれる。いくつかの実施態様において、製品は、容器及びラベルを含む。適切な容器は、例えばボトル、バイアル、シリンジ、および試験管を含む。容器は、ガラスまたはプラスチックなどの様々な材料から形成することができる。いくつかの実施形態において、容器は、本明細書に記載される疾患を治療するために有効である組成物を保持し、無菌アクセスポートを有し得る。例えば、容器は、静脈内溶液バッグ、または皮下注射針によって穿刺可能なストッパーを有するバイアルであり得る。組成物中の活性剤は、本発明の化合物である。いくつかの態様において、容器上のまたは容器に付随するラベルは、選択される疾患を治療するために組成物が使用されることを示す。製品は、リン酸緩衝生理食塩水、リンゲル液、またはデキストロース溶液などの薬学的に許容される緩衝液を含む第2の容器をさらに含むことができる。さらに、他の緩衝剤、希釈剤、フィルター、針、注射器、および使用説明書付き添付文書を含め、商業的観点および使用者の観点から望ましい他の物質を含むことができる。

いくつかの態様において、本明細書に記載される融合タンパク質、gRNA、および/または複合体のいずれかは、薬学的組成物の一部として提供される。いくつかの態様において、薬学的組成物は、本明細書に提供される融合タンパク質のいずれかを含む。いくつかの態様において、薬学的組成物は、本明細書に提供される複合体のいずれかを含む。いくつかの態様において、薬学的組成物は、gRNAおよびカチオン性脂質と複合体を形成するRNA-ガイドヌクレアーゼ（例えばCas9）を含むリボ核タンパク質複合体を含む。ある態様において、薬学的組成物は、gRNA、核酸プログラム可能DNA結合タンパク質、カチオン性脂質、および薬学的に許容される賦形剤を含む。薬学的組成物は、場合により、1つ以上の追加の治療活性物質を含むことができる。

いくつかの実施形態において、本明細書で提供される組成物は、対象内で標的化されたゲノム改変を行うために、対象、例えばヒト対象に投与される。いくつかの実施形態において、対象から細胞が取得され、本明細書中に提供される医薬組成物のいずれかと接触される。いくつかの実施形態において、対象から取り出されて医薬組成物とex vivoで接触された細胞は、任意で、所望のゲノム改変が細胞内で行われたかまたは検出された後に、対象に再導入される。ヌクレアーゼを含む医薬組成物を送達する方法は公知であり、例えば米国特許第6,453,242号、6,503,717号、6,534,261号、6,599,692号、6,607,882号、6,689,558号、6,824,978号、6,933,113号、6,979,539号、7,013,219号、および7,163,824号に記載されており、それらの全ての開示は、その全体が参照により本明細書に組み込まれる。本明細書で提供される医薬組成物の説明は、主として、ヒトへの投与に適した医薬組成物に向けられているが、当業者には、そのような組成物が、あらゆる種類の動物または生物への投与に一般的に適していることが理解される（例えば獣医学的用途）。

種々の動物への投与に適した組成物を与えるための、ヒトへの投与に適した医薬組成物の改変は十分に理解されており、通常の熟練した獣医薬理学者は、もし必要だとしても単に通常の実験で、そのような改変を設計および/または実施することができる。薬学的組成物の投与が意図される対象には、限定されるものではないが、ヒトおよび/または他の霊長類;哺乳動物、家畜、ペット、およびウシ、ブタ、ウマ、ヒツジ、ネコ、イヌ、マウス、および/またはラットなどの商業的に関連のある哺乳動物;ニワトリ、カモ、ガチョウ及び/又は七面鳥のような商業的に関連のある鳥類が含まれる。

本明細書に記載される薬学的組成物の製剤は、薬学の分野において公知の、または今後開発される任意の方法によって調製することができる。一般に、このような調製方法は、活性成分を賦形剤および/または1つ以上の他の補助成分と会合させ、次いで、必要および/または所望であれば、製品を所望の単回または複数回投与単位に成形および/または包装する工程を含む。薬学的製剤はさらに、薬学的に許容される賦形剤を含むことができ、それは、本明細書で使用される場合、所望の特定の剤形に適した、溶媒、分散媒体、希釈剤、または他の液体ビヒクル、分散または懸濁助剤、界面活性剤、等張剤、増粘剤または乳化剤、保存剤、固体結合剤、潤滑剤などのいずれかおよび全てを含む。Remington’s The Science and Practice of Pharmacy, 21st Edition, A. R. Gennaro (Lippincott, Williams & Wilkins, Baltimore, MD, 2006（参照によりその全体が本明細書に組み込まれる）は、薬学的組成物を製剤化する際に使用される種々の賦形剤およびその調製のための公知の技術を開示する。ヌクレアーゼを含む医薬組成物を製造するためのさらなる適切な方法、試薬、賦形剤および溶媒については、参照によりその全体が本明細書に組み込まれるPCT出願PCT/US2010/055131（2010年11月2日出願、公開番号WO2011/053982 A8）も参照のこと。

あらゆる従来の賦形剤媒体は、望ましくない生物学的効果を生じさせること、または他のかたちで医薬組成物の何らかの他の成分と有害な様式で相互作用することなどによって、物質またはその誘導体と不適合である場合を除き、その使用が本開示の範囲内にあると考えられる。

上記の組成物は、有効量で投与することができる。有効量は、投与方法、治療される特定の状態、および所望の結果に依存する。それはまた、状態のステージ、対象の年齢および身体的状態、もしあれば併用療法の性質、および医師によく知られた同様の因子に依存し得る。治療用途のためには、それは医学的に望ましい結果を達成するのに十分な量である。

いくつかの実施形態において、本開示による組成物は、様々な疾患、障害、および/または状態のいずれかの治療に使用することができる。いくつかの実施形態では、本開示による組成物は、ALSの治療に使用することができる。いくつかの実施形態では、本開示による組成物は、SBMAの治療に使用することができる。

［キット］
本開示の種々の態様は、塩基エディターシステムを含むキットを提供する。1つの実施形態において、キットは、核酸塩基エディター融合タンパク質をコードするヌクレオチド配列を含む核酸構築物を含む。融合タンパク質は、デアミナーゼドメイン（例えばシチジンデアミナーゼまたはアデニンデアミナーゼ）と核酸プログラミング可能なDNA結合タンパク質 (napDNAbp) とを含む。ある実施形態において、キットは、対象核酸分子を標的化することができる少なくとも1つのガイドRNAを含む。いくつかの実施形態において、目的の核酸分子は、SOD1遺伝子のエキソン核酸配列、例えばエキソン3に先行するイントロン核酸配列におけるスプライスアクセプター部位（例えばAG部位）である。いくつかの実施形態において、キットは、トリヌクレオチドリピート伸長を含むARポリヌクレオチドを標的化することができる少なくとも１つのガイドRNAを含む。いくつかの実施形態において、キットは、少なくとも1つのガイドRNAをコードするヌクレオチド配列を含む核酸構築物を含む。

キットは、いくつかの実施形態において、1つ以上の変異を編集するためにキットを使用するための指示書を提供する。いくつかの実施形態において、キットは、SOD1遺伝子のエキソン、例えばエキソン3の5'に位置するスプライスアクセプターを編集するためにキットを使用するための指示書を提供する。いくつかの実施形態において、キットは、そのキットを使用してARポリヌクレオチドに中途停止コドンを導入するための指示書を提供する。他の実施形態では、キットは、そのキットを使用してARポリヌクレオチドのスプライス部位を破壊するための指示書を提供する。指示書は、一般に、核酸分子を編集するためのキットの使用に関する情報を含む。他の実施形態では、指示書は、以下のうちの少なくとも1つを含む：注意書き；警告；臨床試験；および/または参考文献。指示書は、容器上に直接印刷してもよいし (それが存在する場合) 、容器に貼付するラベルとして印刷されてもよいし、容器内または容器と一緒に供給される独立したシート、パンフレット、カードまたはフォルダーとして印刷してもよい。さらなる実施形態では、キットは、適切な操作パラメータのためのラベルまたは別個の挿入物（パッケージインサート）の形態で指示書を含むことができる。さらに別の実施形態では、キットは、検出、較正、または正規化のための標準（複数可）として使用される、適切な陽性および陰性対照または対照サンプルを有する1つ以上の容器を含むことができる。キットはさらに、 (無菌の) リン酸緩衝生理食塩水、リンゲル液、またはデキストロース溶液などの薬学的に許容される緩衝液を含む第2の容器を含むことができる。それはさらに、他の緩衝液、希釈剤、フィルター、針、シリンジ、および使用指示書付きの添付文書を含む、商業的および使用者の観点から望ましい他の材料を含むことができる。

特定の実施形態では、キットは、ALSを有する対象の治療のために有用である。特定の実施形態では、キットは、SBMAを有する対象の治療のために有用である。

本発明の実施は、別段の表示がない限り、分子生物学（組換え技術を含む）、微生物学、細胞生物学、生化学および免疫学の従来の技術を利用し、これらは当業者の技量の範囲内である。そのような技術は、“Molecular Cloning: A Laboratory Manual”, second edition (Sambrook, 1989); “Oligonucleotide Synthesis” (Gait, 1984); “Animal Cell Culture” (Freshney, 1987); “Methods in Enzymology” “Handbook of Experimental Immunology” (Weir, 1996); “Gene Transfer Vectors for Mammalian Cells” (Miller and Calos, 1987); “Current Protocols in Molecular Biology” (Ausubel, 1987); “PCR: The Polymerase Chain Reaction”, (Mullis, 1994); “Current Protocols in Immunology” (Coligan, 1991)などの文献で詳しく説明されている。これらの技術は、本発明のポリヌクレオチドおよびポリペプチドの製造に適用可能であり、したがって、本発明の製造および実施において考慮され得る。特定の実施形態のために特に有用な技術は、以下のセクションで論じられる。

以下の実施例は、当業者に本発明のアッセイ、スクリーニング、および治療方法をいかに作って使用するかの完全な開示および説明を提供するために記載されており、本発明者らがその発明とみなすものの範囲を限定することを意図するものではない。

［実施例１：編集効率が向上したアデノシン塩基エディター］
Tad7.10-dCas9融合タンパク質を含む塩基編集システムは、約10～20%の効率で標的ポリヌクレオチドを編集することができるが、より高い効率を必要とする使用のためには、それらの使用は制限され得る。増大した効率および特異性を有するアデニン塩基エディターを同定するための取り組みにおいて、アデノシンデアミナーゼTadA 7.10を含む構築物をエラープローンPCRによって変異誘発させ、続いて、核酸プログラム可能なDNA結合タンパク質であるdCas9をコードする核酸配列に隣接させて発現ベクター中にクローン化した（図1 A）。アデノシンデアミナーゼ変異体を含む発現ベクターを、クロラムフェニコール耐性(CamR) およびスペクチノマイシン耐性 (SpectR) をコードしかつ2つの点突然変異によって機能しなくなったカナマイシン耐性遺伝子を有する選択プラスミドとともに、コンピテント細菌細胞に共形質転換した（進化ラウンド7戦略）（図1 B）。アデノシンデアミナーゼ活性の読み取りであるカナマイシン耐性の回復について細胞が選択された。その後の選択ラウンドでは、発現ベクターは、クロラムフェニコール耐性 (CamR) およびスペクチノマイシン耐性 (SpectR) をコードしかつ3つの点突然変異によって非機能性にされたカナマイシン耐性遺伝子を有するプラスミドとともにコンピテント細胞に共形質転換された（進化ラウンド8戦略）（図1 C）。不活性化されたカナマイシン耐性遺伝子の核酸配列を以下に提供する。

上記配列において、小文字はカナマイシン耐性プロモーター領域を示し、太字の配列は標的化された不活性化部分 (Q 4*及びW 15*) を示し、イタリック体の配列はカナマイシン耐性遺伝子の標的化された不活性部位 (D208N) を示し、下線の配列はPAM配列を示す。

再び、カナマイシン濃度が増加していく一連のアガロースプレート上に細胞を平板培養した。図2に示されるように、効率的な塩基編集活性を有するアデノシンデアミナーゼ変異体はカナマイシン耐性遺伝子に存在する突然変異を修正することができ、さらなる分析のために選択された。細菌細胞において効率的な塩基編集を示すアデノシンデアミナーゼバリアント塩基エディターを表13に記載している。選択されたアデノシンデアミナーゼバリアントを含む塩基エディターをコードする哺乳動物発現ベクターを作製した。

E6V (E7Vとも呼ばれる) 変異を含有する、鎌状赤血球症に関連するβグロビン蛋白質を発現するHek293T細胞を用いて、アデノシンデアミナーゼバリアントの編集効率を試験した（図。3 Aおよび3 B）。「Hek293T/HBBE6V細胞と称されるこれらの細胞は、表13に列挙されるABE8塩基エディターを含む融合タンパク質を含む塩基編集システムを発現するレンチウイルスベクターを用いて形質導入された。ABE8塩基エディターは、循環置換体（circular permutant）Cas9および二部分（bipartite）核局在配列を含む足場にアデノシンデアミナーゼバリアントをクローニングすることによって作製された。循環置換体のCas9は当技術分野で公知であり、例えばOakes et al., Cell 176, 254-267, 2019に記載されている。これらの配列は以下に提供される。

胎児ヘモグロビンの上方調節は鎌状赤血球症を克服するための治療アプローチである。図3 Aは、胎児ヘモグロビンの上方調節のための治療的に関連する部位を示す。残基5および8におけるアデノシンを編集することにより、BCL11A結合を有意に低下させることができ、それにより胎児ヘモグロビンの発現を増加させることができる。図3 Aを参照すると、ABE8塩基エディターは、ABE7.10塩基エディターよりも約2～3倍多い塩基編集活性を示した。

表１３：新規アデニン塩基エディターABE8

図4を参照して、ABE8塩基エディターを、HBB E6Vをコードするポリヌクレオチドを標的とする18、19、20、21、または22ヌクレオチドのガイドRNAと共に、Hek293T/HBBE 6V細胞に導入した。ABE8エディターは、循環置換体（Cp）Cas9に融合された場合、編集効率の増加を示した。合計で、40の異なるABE8構築物 (表14) および3つのABE7.10構築物を、Hek293T/HBBE 6V細胞における編集活性について試験した。例示的な構築物の配列は以下の通りである。編集の特異性を評価するために、標的変異、および意図しない変異またはバイスタンダー変異をモニターした（図5）。コドン5におけるアデノシンの意図しない編集はサイレントであった。しかし、コドン9の意図しない編集はセリンからプロリンへの変異をもたらした。再び図5を参照すると、複数のABE8塩基エディターは、ABE7.10エディターと比較して編集の効率および特異性の増加を示し、いずれのエディターも、セリンからプロリンへのミスセンス突然変異につながる有意なバイスタンダー編集を有さなかった。

鎌状赤血球変異を含む線維芽細胞において、選択されたABE8塩基エディターおよびABE7.10塩基エディター対照のさらなる分析を行った。図6に示されるように、ABE8エディターは、ABE7.10と比較して、塩基編集活動が増加していた。ABE8.18は約70%の効率を示した。選択されたABE8エディターは、前例のない特異性も示した。重要なことに、全てのABE8エディターについて平均INDEL（インデル）形成は0.1%未満であった。

［実施例２：ABE8設計のためのコドン最適化とNLS選択］
Cas9のコドン用法と核局在化配列が真核生物におけるゲノム編集効率を劇的に変化させ得ることが確立されている（例えば、Kim, S. el al ., Rescue of high-specificity Cas9 variants using sgRNAs with matched 5' nucleotides. Genome Biol 18, 218, doi: 10.1186/s 13059-017-1355-3 (2017); Mikami, M. et al., Comparison of CRISPR/Cas9 expression constructs for efficient targeted mutagenesis in rice. Plant Mol Biol 88, 561-572, doi: 10.1007/sl l l03-015-0342-x (2015); Jinek, M. et al. , RNA-programmed genome editing in human cells. Elife 2, e00471, doi: 10.7554/eLife.00471 (2013)参照）。塩基エディターの元のCas9n成分は、6つの潜在的なポリアデニル化部位を含み、真核生物での発現の乏しさにつながる（例えば、Kim, S. et al. , Rescue of high-specificity Cas9 variants using sgRNAs with matched 5' nucleotides. Genome Biol 18, 218, doi: 10.1186/sl3059-017-1355-3 (2017); Komor, A. C. et al., Programmable editing of a target base in genomic DNA without double-stranded DNA cleavage. Nature 533, 420-424, doi: 10.1038/naturel7946 (2016); Gaudelli, N. M. et al. Programmable base editing of A*T to G*C in genomic DNA without DNA cleavage. Nature 551, 464-471, doi: 10.1038/nature24644 (2017)参照）。これを高度に最適化されたコドン配列と置き換えると、塩基編集効率が向上する（例えば、Cong, L. et al. Multiplex genome engineering using CRISPR/Cas systems. Science 339, 819-823, doi: 10.1126/science.1231143 (2013); Koblan, L. W. et al. Improving cytidine and adenine base editors by expression optimization and ancestral reconstruction. Nat Biotechnol, doi: 10.1038/nbt.4172 (2018); Zafra, M. P. et al. Optimized base editors enable efficient editing in cells, organoids and mice. Nat Biotechnol, doi: 10.1038/nbt.4194 (2018)参照）。

4つのABE構築物に付随するDNAオンターゲット(図9 A、9 B)、DNAオフターゲット(図9 C、9 D)およびRNAオフターゲット(図9 E)塩基編集頻度を評価したが、これらは全てコドン最適化Cas9 (D10A)を含有した：i) 単一のC末端BP-SV40 NLSを有するABE7.10；ii) ABE7.10の5’TadA野生型部分を欠くmonoABE7.10；iii) コドン最適化TadA領域と2つのBPNLS配列を含有するABEmax；およびiv) ABEmaxと同じTadAコドン最適化を有するが単一のC末端BP-SV40 NLSを含むABEmax(-BPNLS) 。

4つの構築物は全て、著しく類似したオンターゲット編集効率を示し、NLSアーキテクチャおよびTadAコドン最適化はオンターゲット編集効率のためには決定的ではないことを示した(図9 A、9 B)。オフターゲットプロファイルもまた非常に類似していたが、ABEmaxは、ABE7.10と比較した場合、1部位で有意に大きなDNAオフターゲット編集を示した（p=0.00027、ステューデントの両側T検定）（図9 C、9 D）。ABEmax(-NBPNLS)は、ABE7.10より1.6倍大きいRNAオフターゲット編集の平均頻度を示した（図9 E）。

［実施例３：標的化範囲が拡大された優れたアデニン塩基エディター］
ABEは、進化された大腸菌tRNAARG修飾酵素であるTadAが、触媒的に減損されたCas9蛋白質（D10AニッカーゼCas9、nCas9）に共有結合的に融合されたものを含む分子機械である (図7 Aおよび7 B)。従来のアデニン塩基エディターの制限を克服するために、抗生物質セレクションを生き残るために3つ同時のA・T→G・Cへの復帰編集を行わなければならないABEを設計することによって、細菌セレクション系のストリンジェンシーを増加させた。以前のABE進化では、TadAライブラリーは、エラープローンPCRを介して作成された。対照的に、TadAの各位置で20個全ての正準的アミノ酸置換を含むTadAアリルの合成ライブラリーが利用され、これは、ライブラリー構成員当たり1～2ヌクレオチド置換変異の平均頻度を有するものであった。この化学ライブラリーは、エラープローンPCR技術で達成できるよりも大きな配列空間へのアクセスを可能にした。

約300クローンを単離し、続いて配列を決定した。得られた配列決定データから、高頻度で富化されたTadA*内の8つの変異を同定した (表7および9) 。同定された8つのアミノ酸変異のうち6つはコドン当たり少なくとも2つの核酸塩基変化を必要としたが、これらは以前のTadAエラープローンライブラリーでは観察されなかったものである。富化された突然変異のうちの2つはアデニン脱アミノ化の活性部位に対して近位にある残基を改変させる (I76およびV82) (図7 C)。以前に報告されたTadA*7.10のC末端αヘリックスにおける四つの変異に加えて、二つの新しい変異が同じαヘリックス内に観察された(Y147RとQ154R) (図7 C)。この高度に変異されたαヘリックスは、それが切り詰められると塩基編集効率が実質的に低下したため、ロバストな産物形成のために必要なものである (図10 Aおよび図10 B) 。

哺乳類細胞におけるTadA*バリアントの活性を試験するために、BEコドン最適化およびNLS配向を、最も有利なオンターゲットおよびオフターゲットプロファイルで利用した（実施例２；図9A～9E参照）。8つの濃縮されたTadA*変異を種々の組み合わせでABE7.10に組み込み、40の新しいABE8バリアントを得た (表7と9) 。ABEのTadA領域が不活性 (野生型) および活性 (進化型) TadA*プロトマーのヘテロダイマー融合体であるか、または工学操作されたTadA*の単一プロトマーであるABE8構築物を作製し、これは約500塩基対小さいエディターを生じた。これらの構築上バリアントは、それぞれABE8.x-dおよびABE8.x-mと呼ばれる (表7と9) 。

最初に、これら40の構築物について、正準的な20 nt S. pyogenesプロトスペーサー内の2～20の範囲の位置（NGG PAM=位置21、22、23）に標的A塩基を含む8つのゲノム部位に渡り、ABE7.10と比較したオンターゲットDNA編集効率を評価した (図11)。N末端野生型TadA構築物は、ABE8を用いたロバストなDNA編集にとって必要でなかった。実際、N末端野生型TadAを含む構築物(ABE8.x-d) は、その経済化された構造 (ABE8.x-m) と比較して、編集ウィンドウ選好性、全DNA編集結果、およびインデル頻度のいずれに関しても同様に機能する（図7 D、図11、図12）。構築物内TadA(wt):TadA*8ダイマー化はABE8活性に必要でないかもしれないが、それはトランス(in trans) TadA*8:TadA*8ダイマー化がABE8発現塩基エディター間で起こる可能性を排除しない。

試験されたすべてのサイトで、ABE8はABE7.10と比較して、プロトスペーサにおける正準位置 (A 5～A 7) で約1.5倍高く、非正準位置(A 3～A 4、A 8～A 10)で約3.2倍高い編集をもたらした(図13)。倍数の違いは、標的の配列、標的ウィンドウ内の「A」の位置、およびABE8構築物のアイデンティティに応じて異なる(図7 D、図11、図13)。全体として、試験した全てのサイトの全ての位置にわたる編集の中央値変化は、ABE7.10と比較して1.94倍であった (範囲1.34～4.49)。

次に、40の構築物の大きなABE8プールから、より詳細に評価するためにABE8構築物のサブセット（ABE8.8-m、ABE8.13-m、ABE8.17-m、ABE8.20-m、ABE8.8-d、ABE8.13-m、ABE8.17-dおよびABE8.20-d）を選択した。これらの構築物は、階層的クラスタリング分析を介して決定された、8ゲノム部位間の編集性能における明確な差異を有するABE8を表す(図14)。これらのABE8は全て、試験した全てのゲノム部位でABE7.10より有意に優れており(p値=0.0006871、両側Wilcoxon順位和検定)、ABE8誘導進化戦略から同定された変異の様々な組み合わせを含んでいる(図15および図16)。

非NGG PAMを認識するABEバリアントが報告されているが、これら構築物の編集効率は、NGG PAM配列を標的とするS.pyogenes Cas9で観察された結果と比較した場合、多くの例で低下している（例えば、Huang, T. P. et al. Circularly permuted and PAM-modified Cas9 variants broaden the targeting scope of base editors. Nat Biotechnol 37, 626-631, doi:10.1038/s41587-019-0134-y (2019); Hua, K. et al., Expanding the base editing scope in rice by using Cas9 variants. Plant Biotechnol J, doi:10.1111/pbi.12993 (2018); Yang, L. et al., Increasing targeting scope of adenosine base editors in mouse and rat embryos through fusion of TadA deaminase with Cas9 variants. Protein Cell 9, 814-819, doi:10.1007/s13238-018-0568-x (2018)参照）。進化されたデアミナーゼが、非NGG PAMを有する標的部位での編集効率も増加させるかどうかを決定するために、S. pyogenes Cas9を、遺伝子操作されたS. py.バリアントNG-Cas9（PAM :NG）（Nishimasu, H. et al. Engineered CRISPR-Cas9 nuclease with expanded targeting space. Science (2018)）またはStaphylococcus aureus Cas9（SaCas9、PAM: NNGRRT）（Ran, F. A. et al. In vivo genome editing using Staphylococcus aureus Cas9. Nature 520, 186-191, doi:10.1038/nature14299 (2015)）で置き換えたABE8エディターを作成した。ABE8バリアントをABE7.10と比較した場合、SpCas9-NG (NG-ABE8.x-m/d) および SaCas9 (Sa-ABE8.x-m/d) の両方について、A・T→G・C編集頻度においてそれぞれ1.6倍と2.0倍の中央値増加が観察された（図8A、8B、および17～20）。SpCas9-ABE8と同様に、非NGG PAMバリアントについてABE7.10とABE8構築物の間の編集効率における最大の違いは、編集ウィンドウにおける好まれる位置の周辺に位置する標的A位置で観察される（S. pyogenes：位置4～8；S. aureus：位置6～13；Rees, H. A. & Liu, D. R., Base editing: precision chemistry on the genome and transcriptome of living cells. Nat Rev Genet 19, 770-788, doi:10.1038/s41576-018-0059-1 (2018)も参照）。非NGG PAMを利用するABE8オーソログは、効率的なA塩基編集のための標的化範囲を拡大する。

インデル形成を最小にすることが必要となる用途のために、Cas9の触媒的に減損されたD10Aニッカーゼバリアントを触媒的に「死んだ」バージョンのCas9（D10A+H840A）（Jinek, M. et al. A programmable dual-RNA-guided DNA endonuclease in adaptive bacterial immunity. Science 337, 816-821, doi:10.1126/science.1225829 (2012)）で置き換えることの効果を、コアとなる8つのABE8構築物（「dC9-ABE8.x-m/d」）において調査した。ABEにおいてニッカーゼを死んだCas9で置き換えることにより、ABE7.10と比較してdC9-ABE8バリアントでは、有意に高い (2.1倍) オンターゲットDNA編集効率を維持しながらインデル頻度の>90%低下が観察された（図8 C、21、22、23 A、および23 B）。バックグラウンドを超えるインデルは観察されるが、試験した部位での頻度はわずか0.3～0.8%であった。幸いなことに、dC9-ABE8バリアントは、正準的ABE8と比較して、オンターゲットDNA編集効率の中央値14%の低下しか有さない。

オンターゲット遺伝子座における望ましくないABE媒介性ゲノム編集のもう１つの種類は、ABE依存性シトシン→ウラシル（C・G→T・A）変換である（Grunewald, J. et al., CRISPR DNA base editors with reduced RNA off-target and self-editing activities. Nat Biotechnol 37, 1041-1048, doi:10.1038/s41587-019-0236-6 (2019); Lee, C. et al. CRISPR-Pass: Gene Rescue of Nonsense Mutations Using Adenine Base Editors. Mol Ther 27, 1364-1371, doi:10.1016/j.ymthe.2019.05.013 (2019)参照）。試験された8つの標的部位において、C→Tへ編集の95パーセンタイルは、ABE8バリアントで0.45%、ABE7.10-dまたは-mで0.15%と測定され、ABEによるオンターゲットシトシン脱アミノ化は起こりうるがその頻度は一般的に非常に低いことが示された(図24)。まとめると、これらのデータは、ABE8が、他のしばしば望ましくない副産物と比較してA→G変換に対する高い特異性を保持していることを示す。

［実施例４：ABE8構築物によるDNAオンターゲット及びsgRNA依存性DNAオフターゲット編集はDNAに対する特異性を向上させる］
すべての塩基エディターと同様に、ABE8は、ゲノムやトランスクリプトームのオフターゲット遺伝子座に作用する可能性がある（例えば、Gaudelli, N. M. et al. Programmable base editing of A*T to G*C in genomic DNA without DNA cleavage. Nature 551, 464-471, doi:10.1038/nature24644 (2017); Komor, A. C., et al., Programmable editing of a target base in genomic DNA without double-stranded DNA cleavage. Nature 533, 420-424, doi:10.1038/nature17946 (2016); Grunewald, J. et al. CRISPR DNA base editors with reduced RNA off-target and self-editing activities. Nat Biotechnol 37, 1041-1048, doi:10.1038/s41587-019-0236-6 (2019); Rees, H. A., et al., Analysis and minimization of cellular RNA editing by DNA adenine base editors. Sci Adv 5, eaax5717, doi:10.1126/sciadv.aax5717 (2019); Rees, H. A. et al. Improving the DNA specificity and applicability of base editing through protein engineering and protein delivery. Nat Commun 8, 15790, doi:10.1038/ncomms15790 (2017); Jin, S. et al. Cytosine, but not adenine, base editors induce genome-wide off-target mutations in rice. Science 364, 292-295, doi:10.1126/science.aaw7166 (2019); Zuo, E. et al. Cytosine base editor generates substantial off-target single-nucleotide variants in mouse embryos. Science 364, 289-292, doi:10.1126/science.aav9973 (2019); Lee, H. K., et al., Cytosine but not adenine base editor generates mutations in mice. Biorxiv, doi:https://doi.org/10.1101/731927 (2019); Grunewald, J. et al. Transcriptome-wide off-target RNA editing induced by CRISPR-guided DNA base editors. Nature 569, 433-437, doi:10.1038/s41586-019-1161-z (2019); Zhou, C. et al. Off-target RNA mutation induced by DNA base editing and its elimination by mutagenesis. Nature 571, 275-278, doi:10.1038/s41586-019-1314-0 (2019)参照）。

4つのオンターゲット遺伝子座（図25 Aおよび25 B）、およびゲノムDNAにおける12の以前に同定されたsgRNA関連オフターゲット遺伝子座（Tsai, S. Q. et al. GUIDE-seq enables genome-wide profiling of off-target cleavage by CRISPR-Cas nucleases. Nat Biotechnol 33, 187-197, doi:10.1038/nbt.3117 (2015)）（図25 Eおよび25 F）における塩基編集を測定し、その全てがHEK293T細胞における真のCas9オフターゲット遺伝子座であることが確認された（図26）。オンターゲット遺伝子座での増加された活性から予想されるように、ABE8構築物は、ABE7.10よりも3～6倍大きいDNAオフターゲット編集頻度を示す。これは、ABE8構築物の使用についての注意事項であるが、sgRNAの慎重な選択および分析によりsgRNA依存性オフターゲット編集を実質的に減少させることができる（Tsai, S. Q. et al. GUIDE-seq enables genome-wide profiling of off-target cleavage by CRISPR-Cas nucleases. Nat Biotechnol 33, 187-197, doi:10.1038/nbt.3117 (2015); Yeh, W. H., et al., In vivo base editing of post-mitotic sensory cells. Nat Commun 9, 2184, doi:10.1038/s41467-018-04580-3 (2018)参照）。無差別的なsgRNAの使用を必要とするアプリケーションについては、ABE8.17mのTadAドメインへのDNAおよびRNA特異性増強V106W変異（Rees, H. A., Wilson, C., Doman, J. L. & Liu, D. R. Analysis and minimization of cellular RNA editing by DNA adenine base editors. Sci Adv 5, eaax5717, doi:10.1126/sciadv.aax5717 (2019)）の設置が、ABE7.10のものを超えるオンターゲット編集のレベルを維持しながらDNAオフターゲット編集を2.6倍減少させることができる（図25 C、25 D、25 Gおよび25 H）。

ABE8のsgRNA非依存性オフターゲット活性を測定するために、ABEで処理されたHEK293T細胞において細胞RNAの標的化増幅とハイスループットシークエンシングを行った（Gaudelli, N. M. et al. Programmable base editing of A*T to G*C in genomic DNA without DNA cleavage. Nature 551, 464-471, doi:10.1038/nature24644 (2017); Rees, H. A., et al., Analysis and minimization of cellular RNA editing by DNA adenine base editors. Sci Adv 5, eaax5717, doi:10.1126/sciadv.aax5717 (2019)参照）。このアッセイでは、ABE8は、ABE7.10と比較して、細胞RNAアデノシン脱アミノ化の平均頻度が2.3～5.3倍高かった（図25 A）。

目的外RNAオフターゲット編集を緩和するために、以前に発表された変異（Grunewald, J. et al. CRISPR DNA base editors with reduced RNA off-target and self-editing activities. Nat Biotechnol 37, 1041-1048, doi:10.1038/s41587-019-0236-6 (2019); Rees, H. A., et al., Analysis and minimization of cellular RNA editing by DNA adenine base editors. Sci Adv 5, eaax5717, doi:10.1126/sciadv.aax5717 (2019); Grunewald, J. et al. Transcriptome-wide off-target RNA editing induced by CRISPR-guided DNA base editors. Nature 569, 433-437, doi:10.1038/s41586-019-1161-z (2019); Zhou, C. et al. Off-target RNA mutation induced by DNA base editing and its elimination by mutagenesis. Nature 571, 275-278, doi:10.1038/s41586-019-1314-0 (2019)）をABE8.17-m中のデアミナーゼ酵素のTadA部分に導入し、オフターゲット編集頻度の減少を評価した。これらの変異は全て、異なる程度においてABE8.17-mのオンターゲット編集頻度を低減させ、V106WとF148AはABE8の減損が最も少なかった（図25 Cおよび25 D）。これらのうち、V106WのみがオフターゲットのRNAとDNA編集のレベルを実質的に低下させることができた(図25 B)。このように、ABE8へのV106W変異の組み込みが、細胞トランスクリプトームの一時的撹乱が回避されなければならない場合に、または無差別的sgRNAを用いた使用のために、適用可能である。

［実施例５：血液学的障害の治療のためのアデニン塩基エディター］
ABE8構築物をヒト造血幹細胞 (HSC) において評価した。細胞療法として患者に投与する前のHSCのex vivo操作および/または編集は、血液学的障害の治療のための有望なアプローチである。ABEはHBG1/2のプロモーター領域の-198位置にTからCへの置換を導入できることが以前に示された（Gaudelli, N. M. et al. Programmable base editing of A*T to G*C in genomic DNA without DNA cleavage. Nature 551, 464-471, doi:10.1038/nature24644 (2017)）。この天然に存在するアリルは、胎児ヘモグロビンの遺伝的持続性（HPFH：Hereditary Persistence of Fetal Hemoglobin）を生じ、成人期までγグロビンレベルの増加をもたらし、これは鎌状赤血球症およびβサラセミアで見られるβグロビンの欠損を緩和することができる（Wienert, B. et al. KLF1 drives the expression of fetal hemoglobin in British HPFH. Blood 130, 803-807, doi:10.1182/blood-2017-02-767400 (2017)）。HPFH表現型を再現しABE8の臨床的関連性を評価する目的で、CD34+造血幹細胞を2人のドナーから単離し、ABE8エディターをコードするmRNAと、標的Aをプロトスペーサー内の7位に配置する末端修飾sgRNAとでトランスフェクトした。

-198 HBG1/2プロモーター標的部位での平均ABE8編集効率は、初期時点 (48時間) ではいずれのABE7.10構築物よりも2～3倍高く、後期時点 (144時間) ではいずれのABE7.10よりも1.3～2倍高かった（図27 A、図28、図29）。これらの速度論的区別は、細胞療法の投与前の細胞培養を最小限に抑えなければならないex vivo療法にとって臨床的に重要である。

次に、ABE処理と赤血球分化後に産生されるγ（Gamma）グロビン蛋白質の量をUPLCにより定量した（図30～50）。模擬（Mock）処理細胞と比較した場合、ABE8処理群由来の赤血球における%γ（Gamma）グロビン/α（Alpha）グロビン発現の平均3.5倍の増加が観察され、ABE7.10 m/dで達成されたレベルとABE8.13-dを比較した場合には、約1.4倍の増加が観察された(図27 B)。鎌状赤血球症の症状を改善するには≧20%のHbFが必要であると予測されており、βサラセミア患者ではさらに高い最低濃度を要する可能性が高い（例えばCanver, M. C. & Orkin, S. H. Customizing the genome as therapy for the beta-hemoglobinopathies. Blood 127, 2536-2545, doi:10.1182/blood-2016-01-678128 (2016); Fitzhugh, C. D. et al. At least 20% donor myeloid chimerism is necessary to reverse the sickle phenotype after allogeneic HSCT. Blood 130, 1946-1948, doi:10.1182/blood-2017-03-772392 (2017)参照）。ABE8処理後に観察されたγグロビンレベルはこの閾値を超えていた。

全体として、ABE8はγグロビン遺伝子HBG 1とHBG 2のプロモーターにおける胎児ヘモグロビン (HPFH) アリルの自然発生遺伝的持続性を再現し、ヒトCD34+細胞培養における最大60%の編集効率と、分化赤血球におけるγグロビン発現の対応するアップレギュレーションを達成した。

［実施例６：鎌状赤血球症およびベータサラセミアの治療のための相補的塩基編集アプローチ］
鎌状赤血球症 (SCD) およびベータサラセミアは、βグロビンの産生および機能の障害であり、重度の貧血および多数の臓器系にわたる重大な疾患合併症を引き起こす。胎児ヘモグロビン (HbF) のアップレギュレーションまたはβグロビン遺伝子の補正により操作された造血幹細胞の自己移植は、β異常ヘモグロビン症患者の疾患負荷を減少させる可能性がある。塩基編集は最近開発された技術であり、二本鎖DNA切断を導入することなくゲノムの正確な改変を可能にする。

HbF抑制を解除する改変を同定するために、[[シトシン]]およびアデニン塩基エディター (ABE) を用いて、γグロビン遺伝子プロモーターを包括的にスクリーニングした。HbFを有意にアップレギュレートする3領域を同定したが、最も効果的なヌクレオチド残基変換は、胎児ヘモグロビンの遺伝的持続性(HPFH)患者で見られる天然のバリエーションにより支持された。HBG 1およびHBG 2プロモーター内の重要な調節モチーフにおけるヌクレオチド変換後にHbFレベルを有意に増加させるABEが開発された。CD34+造血幹細胞および前駆細胞 (HSPC) を臨床スケールで精製し、自己再生能を保持するように設計されたプロセスを用いて編集した。異なるABEを用いて、2つの独立した部位での編集は94%に達し、UPLCによれば63%までのガンマグロビンが得られた(図51 A～51 E)。この観察されたHbFレベルは、HPFHの臨床的観察と、より高いHbF用量をより軽度の疾患と結びつける非介入療法とに基づけば、SCDとベータサラセミア患者の大部分に保護を与えるはずである（Ngo et al., 2011 Brit J Hem; Musallam et al., 2012 Blood）。

SCDのGlu6Val変異を直接修正することが、SCD集団のためにデザインされた遺伝子治療の最近の目標となってきた。現在の塩基編集技術では、鎌状βグロビンにおけるA-T転換で生じるような変異はまだ変換できない；しかしながら、バリンの反対側の鎖のアデニン残基を認識し編集するようなABEバリアントは設計されている。この結果、バリンがアラニンに変換され、Hb G-Makassarとして知られる天然の変異体が産生される。この位置にアラニンを有するβグロビンはポリマー形成に寄与せず、Hb G-Makassarを有する患者は正常な血液学的パラメータおよび赤血球形態を呈する。これらのABEバリアントで編集されたSCD患者線維芽細胞は、標的アデニンの70%に至る変換を達成した(図52 A)。次いで、健康なドナーからのCD34細胞をリードABEバリアントで編集し、これは、編集ウィンドウ内に存在しSCD変異編集についてのプロキシとして働く隣接プロリンにおける同義突然変異を標的とした。平均編集頻度は40%であった(図52 B)。同種移植の場面でこれらのレベルで記録されたドナー骨髄キメラ現象は、鎌状赤血球表現型を逆転させるのに必要な20%を超えている（Fitzhugh et al, 2017 Blood）。

［実施例７：材料と方法］
一般的なメソッド：
全てのクローニングは、USER酵素 (New England Biolabs) クローニング法（Geu-Flores et al., USER fusion: a rapid and efficient method for simultaneous fusion and cloning of multiple PCR products. Nucleic Acids Res 35, e55, doi:10.1093/nar/gkm106 (2007)参照）を介して行い、PCR増幅のための鋳型は、細菌または哺乳動物のコドン最適化遺伝子断片として購入した (GeneArt)。作成したベクターをMach T1^Rコンピテント細胞 (Thermo Fisher Scientific) に形質転換し、長期保存のために-80℃で維持した。この研究で使用されたすべてのプライマーは、Integrated DNA Technologiesから購入され、PCRSは、Phusion U DNA Polymerase Green MultiPlex PCR Master Mix (ThermoFisher) またはQ5 Hot Start High-Fidelity 2x Master Mix (New England Biolabs) のいずれかを用いて実施された。本研究で用いたすべてのプラスミドは、エンドトキシン除去手順を含むZymoPURE Plasmid Midiprep (Zymo Research Corporation) を用いて、50 mLのMach 1培養物から新たに調製された。分子生物学グレードのHyclone水 (GE Healthcare Life Sciences) をすべてのアッセイ、トランスフェクション、およびPCR反応に用いて、DNAse活性の排除を確実にした。

Hek293T哺乳類細胞トランスフェクションに使用されるsgRNAのアミノ酸配列は、以下の表15に提供される。20 nt標的プロトスペーサーは太字で示してある。ヒトU6プロモーターは転写開始部位において「G」を好むことが確立されているので、標的DNA配列が「G」で始まっていない場合にはプライマーの5'末端に「G」を加えた（Cong, L. et al., Multiplex genome engineering using CRISPR/Cas systems. Science 339, 819-823, doi:10.1126/science.1231143 (2013)参照）。前に記述されたpFYF sgRNAプラスミドをPCR増幅のための鋳型として使用した。

表１５：Hek293T哺乳類細胞トランスフェクションに用いられたsgRNAの配列。

sgRNA足場配列は以下の通りである。
S. pyogenes:
GUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC
S. aureus: GUUUUAGUACUCUGUAAUGAAAAUUACAGAAUCUACUAAAACAAGGCAAAAUGCCGUGUUUAUCUCGUCAACUUGUUGGCGAGA

［誘導進化のためのインプット細菌TadA*ライブラリーの生成］
TadA*8.0ライブラリーは、TadA*7.10オープンリーディングフレームの各アミノ酸位置において20アミノ酸すべてをコードするように設計された（Gaudelli, N. M. et al., Programmable base editing of A*T to G*C in genomic DNA without DNA cleavage. Nature 551, 464-471, doi:10.1038/nature24644 (2017)）。各TadA*8.0ライブラリー構成員は、約1～2個の新しいコード変異を含み、化学的に合成されたものをRanomics Inc.（カナダ国トロント）から購入した。TadA*8.0ライブラリーをPhusion U Green MultiPlex PCR Master MixでPCR増幅し、ABE誘導進化のためにに最適化された細菌ベクターにUSER法によりアセンブルした（Gaudelli, N. M. et al., Programmable base editing of A*T to G*C in genomic DNA without DNA cleavage. Nature 551, 464-471, doi:10.1038/nature24644 (2017)）。

TadAバリアントの細菌進化
TadA*8ライブラリーを含むABEの誘導進化は、以下の変更を加えて、以前に記述されたように行った（Gaudelli, N. M. et al., Programmable base editing of A*T to G*C in genomic DNA without DNA cleavage. Nature 551, 464-471, doi:10.1038/nature24644 (2017)）：i) 大腸菌10ベータ (ニューイングランド・バイオラボ) を進化宿主として使用した；ii) カナマイシン上の生存を3つの遺伝子不活性化成分の補正に依存させた（例えば、生存には、カナマイシンにおける2つの停止変異と1つの活性部位変異の復帰変異を必要とした）。カナマイシン耐性遺伝子配列は、ABE8進化のための選択変異を含む。10ベータ宿主細胞中で選択プラスミドおよびエディターを一晩共培養した後、ライブラリー培養物を、プラスミド維持抗生物質および増加する濃度の選択抗生物質カナマイシン（64～512μg/mL）を添加した2xYT-寒天培地上に平板培養した。細菌を1日増殖させ、生存クローンのTadA*8部分を濃縮後にSanger配列決定した。次いで、目的の同定されたTadA*8突然変異を、USERアセンブリーを介して哺乳動物発現ベクターに組み込んだ。

［一般的なHEK293TおよびRPMI-8226哺乳類培養条件］
細胞を37℃で5% CO₂とともに培養した。HEK293T細胞［CLBTx 013, American Type Cell Culture Collection (ATCC)］は、10% (v/v) 胎児ウシ血清（A31606-02、Thermo Fisher Scientific社）を有するダルベッコ改変イーグル培地+グルタマックス（10566-016、Thermo Fisher Scientific社）中で培養した。RPMI-8226（CCL-155、ATCC）細胞は、10% (v/v) 胎児ウシ血清(Gibco) を含むRPMI-1640培地(Gibco) で培養した。供給者からの受領後、細胞はマイコプラズマについて陰性であった。

［Hek293TプラスミドトランスフェクションおよびgDNA抽出］
HEK293T細胞を、48ウェルのPoly-D-Lysine処理したBioCoatプレート (Corning) 上に35,000細胞/ウェルの密度で播種し、プレーティングの18～24時間後にトランスフェクトした。NucleoCounter NC-200 (ケモメテック) を使用して細胞を計数した。これらの細胞に、OptiMEM血清低減培地(ThermoFisher Scientific) において総容積12.5μLに希釈した750 ngの塩基エディターまたはヌクレアーゼ対照、250 ngのsgRNA、および10 ngのGFP-maxプラスミド (Lonza) を添加した。この溶液を11μLのOptiMEM血清低減培地中1.5μLのリポフェクタミン2000 (ThermoFisher) と混合し、15分間室温で放置した。次いで、全25μL混合物を予め播種しておいたHek293T細胞に移し、約120時間インキュベートした。インキュベーション後、培地を吸引し、細胞を250μLの1×PBS溶液 (ThermoFisher Scientific) で2回洗浄し、新しく調製された100μLの溶解緩衝液を添加した（100 mM Tris-HCl、pH 7.0、0.05% SDS、25 g/mL Proteinase K (Thermo Fisher Scientific)）。溶解緩衝液を含むトランスフェクションプレートを37℃で1時間インキュベートし、混合物を96ウェルPCRプレートに移し、80℃で30分間加熱した。

［ABE構造およびABE8構築物についてのDNAおよびRNAオフターゲット編集の分析］
HEK293T細胞を、48ウェルのポリ-D-リジンコーティングプレート (Corning) 上に16～20時間平板培養した後、抗生物質を含まないDMEM+Glutamax培地 (Thermo Fisher Scientific) 中で3万細胞/ウェルの密度でリポフェクションを行った。750 ngのニッカーゼまたは塩基エディター発現プラスミドDNAを、15μl OPTIMEM+Glutamax中で250 ngのsgRNA発現プラスミドDNAと組み合わせた。これを、ウェル当たり1.5μlのリポフェクタミン2000と8.5μlのOPTIMEM+Glutamaxを含む10μlの脂質混合物と混合した。トランスフェクションの3日後に細胞を回収し、DNAまたはRNAのいずれかを回収した。DNA分析のためには、細胞を1X PBS中で一回洗浄し、次いで製造業者の指示に従って100μlのQuickExtract（商標）緩衝液 (Lucigen) 中で溶解した。RNAの回収には、製造業者の指示に従ってMagMAX（商標）mirVana（商標）Total RNA Isolation Kit (Thermo Fisher Scientific) をKingFisher（商標）Flex Purification Systemと共に使用した。

標的化されたRNA配列決定は、ほぼ以前に記述された通りに行われた（Rees, H. A. et al., Analysis and minimization of cellular RNA editing by DNA adenine base editors. Sci Adv 5, eaax5717, doi:10.1126/sciadv.aax5717 (2019)参照）。cDNAは、製造業者の指示に従ってEZDnase (Thermo Fisher Scientific) と共にSuperScript IV One-Step RT-PCRシステムを用いて、単離されたRNAから調製した。以下のプログラムを使用した：58℃、12分間；98℃、2分間；その後、アンプリコンに応じて変化させたPCRサイクル：CTNNB 1およびIP90のためには32サイクルの[98℃、10秒；60℃、10秒；72℃、30秒]、およびRSL1D1のためには35サイクルの[98℃、10秒；58℃、10秒；72℃、30秒]。サンプルと同時にRT無し対照を実施した。複合RT-PCRに続いて、アンプリコンをバーコード化し、上述のようにIllumina Miseqを用いて配列決定した。各アンプリコン中のフォワードプライマーの末端後の最初の塩基から始まる、各アンプリコン中の最初の125 ntを、参照配列に整列させ、各アンプリコン中の平均および最大A→I頻度の分析のために使用した（図53 Aおよび53 B）。

オフターゲットDNA配列決定は、上記のようにIllumina Miseqシークエンサーを用いた配列決定のためのサンプルを調製するための二工程PCRおよびバーコード化法を用いて、下記表16に列挙される以前に公表されたプライマー（Komor, A. C. et al., Programmable editing of a target base in genomic DNA without double-stranded DNA cleavage. Nature 533, 420-424, doi:10.1038/nature17946 (2016); Rees, H. A. et al., Analysis and minimization of cellular RNA editing by DNA adenine base editors. Sci Adv 5, eaax5717, doi:10.1126/sciadv.aax5717 (2019)）を使用して行った。

表１６：ゲノム部位の増幅に用いたHTSプライマー：

［CD34+細胞において使用されるABEエディターのためのmRNA産生］
dT7プロモーターに続いて5’UTR、Kozak配列、ORF、および3’UTRをコードするプラスミド中に、エディターをクローニングした。dT7プロモーターは、環状プラスミドからの転写を妨げる、T7プロモーター内の不活性化点突然変異を有する。このプラスミドをPCR反応（Q5ホットスタート2Xマスターミックス）の鋳型にし、そこでは、フォワードプライマーがT7プロモーター内のSNPを修正し、リバースプライマーは3’UTRに120Aテールを付加した。得られたPCR産物をZymo Research 25μg DCCカラムで精製し、その後のin vitro転写においてmRNAテンプレートとして使用した。使用マニュアルに従ってNEB HiScribe High-Yield Kitを使用したが、ただしウリジンをN1-メチル-プソイドウリジンに完全置換し、CleanCap AG (Trilink) で転写同時キャッピングを行った。反応物クリーンアップは塩化リチウム沈殿により行った。増幅に使用されたプライマーは表17に見出すことができる。

表１７：ABE8 T7のin vitro転写反応に用いられたプライマー

［CD34+細胞調製］
動員化（mobilized）末梢血を得て、ヒトCD34+HSPCを濃縮した (HemaCare、M001F-GCSF/MOZ-2)。CD34+細胞を解凍し、エレクトロポレーションの48時間前に、1% Glutamax (Gibco) 、100 ng/mLのTPO (Peprotech) 、SCF (Peprotech) およびFlt-3 (Peprotech) を含有するX-VIVO 10 (Lonza) に入れた。

［CD34+細胞のエレクトロポレーション］
解凍48時間後、細胞をスピンダウンしてX-VIVO 10培地を除去し、0.1% HSA (Akron Biotechnologies) を有するMaxCyte緩衝液(HyClone) で洗浄した。次いで、細胞を冷MaxCyte緩衝液中で125万細胞/mLに再懸濁し、複数の20μLアリコートに分割した。次いで、ABE mRNA (0.15μM) および-198 HBG1/2 sgRNA (4.05μM) を、実験条件に従って分注し、MaxCyte緩衝液中で総量5μLまでに上昇させた。20μLの細胞を3つのグループに分けて5μLのRNA混合物に添加し、エレクトロポレーションのためにOC25x3 MaxCyteキュベットの各チャンバーに充填した。電荷を受けた後、チャンバーから25μLを回収し、24ウェル未処理培養プレート中のウェルの中央に置いた。インキュベーター（37℃、5% CO₂）内で20分間細胞を回復させた。20分の回復後、1% Glutamax、100 ng/mLのTPO、SCFおよびFlt-3を含有するX-VIVO 10を、100万細胞/mLの濃度で細胞に添加した。次いで細胞を、インキュベーター（37℃、5% CO₂）内で48時間さらに回復させた。

［ABEエレクトロポレーション後の赤血球分化］
48時間のエレクトロポレーション後休止に続いて (培養0日目)、細胞をスピンダウンし、5%ヒト血清、330μg/mLトランスフェリン (Sigma) 、10μg/mLヒトインスリン (Sigma) 、2 U/mLヘパリンナトリウム (Sigma) 、3 U/mL EPO (Peprotech) 、100 ng/mL SCF (Peprotech) 、5μg/mL IL 3および50μMヒドロコルチゾン (Sigma) を含有する「第1相」IMDM培地 (ATCC) に2万細胞/mLで移した。培養4日目に、細胞に4倍容量の同じ培地を与えた。7日目に、細胞をスピンダウンし、5%ヒト血清 (Sigma) 、330μg/mLトランスフェリン、10μg/mLヒトインスリン、2 U/mLヘパリンナトリウム、3 U/mL EPO、および100 ng/mL SCFを含有する「第2相」IMDM培地に20万細胞/mLで移した。11日目に、細胞をスピンダウンし、5%ヒト血清、330μg/mLトランスフェリン、10μg/mLヒトインスリン、2 U/mLヘパリンナトリウム、および3 U/mL EPOを含む「第3相」IMDM培地に100万細胞/mLで移した。14日目に、細胞をスピンダウンし、11日目と同じ培地中に再懸濁したが、ただし500万細胞/mLとした。18日目に、分化した赤血球を50万個の細胞アリコートで収集し、500μLのDPBS (Gibco) 中で一回洗浄し、UHPLC処理の前に-80℃で24時間凍結した。

［UHPLC分析用赤血球サンプルの調製］
凍結赤血球ペレットを室温で解凍した。ペレットをACK溶解緩衝液で最終濃度5×10⁴細胞/μLまで希釈した。試料をピペットで混合し、室温で5分間インキュベートした。次いで、試料を-80℃で5分間凍結し、解凍し、ピペットで混合した後に6,700 gで10分間遠心分離した。上清を注意深く除去し (細胞デブリペレットを乱すことなく) 、新しいプレートに移し、UHPLC分析のために超純水中で5×10³細胞/μLまで希釈した。

［超高速液体クロマトグラフィー (UHPLC) 分析］
二元ポンプとUV検出器と共に構成されたUHPLCシステム上で（サーモ・フィッシャー・サイエンティフィック、ヴァンキッシュ・ホライズン）、グロビン鎖の逆相分離を行った。固定相は、AQUITYペプチドBEH C18 VanGuardプレカラム（2.1 X 5 mm、1.7μmビーズ、300A細孔）の後のACQUITYペプチドBEH C18カラム（2.1 X 150 mm、1.7μmビーズ、300A細孔）（どちらもWaters社）からなり、カラム温度は60℃とした。溶離は、水中の0.1%トリフルオロ酢酸 (TFA) (A)とアセトニトリル中の0.08% TFA (B)を用い、流速0.25 mL/minで行った。グロビン鎖の分離は、0～10分で40～52%B；10～10.5分で52～40%B；12分まで40%Bという線形勾配を用いて達成された。試料注入体積を10μLとし、データレート5 Hzで波長220 nmのUVスペクトルを分析中に収集した。グロビン鎖のアイデンティティは、ヘモグロビン標準のLC/MS分析により確認した。

［CD34+細胞のゲノムDNA抽出］
ABEエレクトロポレーション後 (48時間後)、細胞のアリコートを1% Glutamax (Gibco)、 100 ng/mLのTPO (Peprotech)、 SCF (Peprotech) 及びFlt-3 (Peprotech) を含むX-VIVO 10培地 (Lonza) 中で培養した。48時間および144時間の後培養に続き、10万個の細胞を収集し、スピンダウンした。50μLのQuick Extract (Lucigen) を細胞ペレットに添加し、細胞混合物を96ウェルPCRプレート (Bio-Rad) に移した。溶解物を65℃で15分間加熱し、次いで98℃で10分間加熱した。細胞溶解物は-20℃で保存した。

［実施例８：細胞におけるSOD1遺伝子発現を破壊またはサイレンシングするためのアデノシンデアミナーゼ塩基エディターを用いたスプライスアクセプター破壊］
細胞内（例えば運動ニューロン）に豊富に存在する酵素であるSOD1タンパク質は、通常の状況下では、、無害化されない限り細胞を損傷する代謝老廃物の影響から保護する。動物モデルにおいてSOD1遺伝子の欠失は疾患を引き起こさないため、ALSはSOD1蛋白質の機能の欠如により引き起こされるとは見られない。その代わり、SOD1遺伝子の突然変異が、SOD1タンパク質の新たな毒性機能の獲得をもたらすと見られ、これは、運動ニューロンおよび星状細胞（すなわちALSで死滅する細胞）において突然変異SOD1タンパク質が凝集して沈着物を形成する傾向の増加と関連し得る。タンパク質凝集体が形成されると、通常は細胞の健康を維持している他のタンパク質を捕捉し得る。変異型SOD1蛋白はALSにおいて他の蛋白を捕捉し、毒性を引き起こし得る。あるいは、凝集体の毒性は、細胞のプロテオソームとリソソームを詰まらせて運動ニューロンを死に至らしめることによって生じ得る。

この実施例では、spCas9ニッカーゼ由来アデノシン塩基エディター (ABE) システムを用いて、SOD1遺伝子のエクソン3の5’末端における高度に保存されたスプライスアクセプター「AG」核酸配列に正確なA→G突然変異を導入した。正準スプライスアクセプター部位の「AG」核酸配列におけるA→G塩基変化は、SOD1遺伝子のメッセンジャーRNA (mRNA) ミススプライシングおよび遺伝子転写破壊および/またはエクソン3の代替的スプライシングを誘導する。

ABEを用いて、SOD1ゲノム核酸配列中のAGスプライスアクセプター中の「A」核酸塩基を効率的に標的化し、標的部位でA>G変換をすることによって、正準的「AG」スプライスアクセプターを破壊した。塩基編集をHEK293T細胞株で試験した。ガイドRNA (gRNA) をABE8塩基エディターバリアントすなわちABE8.1～ABE8.14およびABE7.10と共に用いて、「AG」スプライスアクセプター核酸のアデノシン（「A」）を標的とした（図54）。

gRNAは、本明細書に提供されるか、または当業者の知識に基づいて決定され、かつ当業者に理解されるように、ALSに関連するヒトSOD1遺伝子のスプライスアクセプター核酸配列（「AG」）（すなわち、SOD1のエクソン3のスプライスアクセプター5’）のための足場配列およびスペーサー配列（標的配列）を包含した（例えばKomor, A.C., et al., “Programmable editing of a target base in genomic DNA without double-stranded DNA cleavage” Nature 533, 420-424 (2016); Gaudelli, N.M., et al., “Programmable base editing of A・T to G・C in genomic DNA without DNA cleavage” Nature 551, 464-471 (2017); Komor, A.C., et al., “Improved base excision repair inhibition and bacteriophage Mu Gam protein yields C:G-to-T:A base editors with higher efficiency and product purity” Science Advances 3:eaao4774 (2017), およびRees, H.A., et al., “Base editing: precision chemistry on the genome and transcriptome of living cells.” Nat Rev Genet. 2018 Dec;19(12):770-788. doi: 10.1038/s41576-018-0059-1参照）。

図55では、SOD1ゲノムDNAのエクソン3の5’にあるイントロンスプライスアクセプター配列おける、グアノシン (G) に変換された標的アデノシン (A) 核酸塩基が示されている（すなわち5′-TTATAAATAGGCTGTACCAGTGCAG-3′）。さらに、塩基エディターシステムで使用されたガイドRNA核酸配列は、図55に示される配列：gRNA: 5′-AAUAUUUAUCCGACAUGGUCACGUC-3′を含む。使用されたPAM配列はNGG PAM（すなわちspCas9）であり、ここでNはG、A、C、またはTのいずれであってもよい(図55)。gRNAについて、スキャフォールト（足場）配列は以下の通りである：
GTTTTAGAGCTAGAAATAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGCACCGAGTCGGTGCTTTTTTT。

SOD1核酸配列のエクソン3によってコードされる最初の4アミノ酸が図55に示され、以下通りである：5′-Gly-Cys-Thr-Ser-Ala-3′。

使用されたABE塩基エディターはABE8バリアント：ABE8.1、ABE8.2、ABE8.2、ABE8.3、ABE8.4、ABE8.5、ABE8.6、ABE8.7、ABE8.8、ABE8.9、ABE8.10、ABE8.11、ABE8.12、ABE8.13およびABE8.14を含んだ（表7参照）。陽性対照塩基エディターABE7.10および陰性対照も参照比較のために使用した。

図56に示されるように、使用された全てのABE塩基エディターは、示されたgRNAを使用して、標的部位スプライスアクセプター部位において効率的なA→G塩基編集を提供した。分析されたABE8塩基エディターバリアントの全てが、対照と比較して塩基編集活性を示した。ABE8.5は約40%のA→G塩基編集活性を示したが、他のABE8バリアントは全て75%以上のA→G塩基編集活性を示した。

PCR産物のディープシークエンシングによって検出された、位置6における標的SOD1スプライスアクセプター (AG) (図55)のA→G塩基編集の効率が、図56に示される。図56に示すように、標的スプライス受容部位である位置6において、約81%のA→G塩基編集が達成された。試験されたABE8アデノシンデアミナーゼに付随するオフターゲット効果（すなわち、SOD1イントロン中のバイスタンダー「A」核酸塩基のA→G編集）が示されているが（図56の位置2～4におけるパーセント「G」核酸塩基）、これは標的位置6におけるA→G塩基編集のパーセントよりも著しく低い。

［SOD1遺伝子スプライスアクセプターの塩基編集のための単一ガイドRNA（sgRNA）］
本明細書に記載のシステムおよび方法での使用に適した、SOD1スプライスアクセプター破壊のための追加の単一ガイドRNA (sgRNA) 核酸配列の例を以下に示す。これらのsgRNAは、図55に示されるSOD1ゲノム核酸配列のスプライスアクセプター「AG」配列の標的アデノシン (A) 配列に相補的な「U6」で始まっている（示される核酸配列では、「U」核酸塩基の代わりに「T」核酸塩基が提示されている）。図55に示される配列の位置6におけるSOD1エクソン3スプライスアクセプター「AG」配列の標的「A」核酸塩基は、図中で上向き矢印によって示されている。以下に示すsgRNAは、sgRNA足場配列を含む。

ガイド16 (U6からsgRNAスキャフォールドまで)
TACGTGACGTAGAAAGTAATAATTTCTTGGGTAGTTTGCAGTTTTAAAATTATGTTTTAAAATGGACTATCATATGCTTACCGTAACTTGAAAGTATTTCGATTTCTTGGCTTTATATATCTTGTGGAAAGGACGAAACACCGCCTTGCCTTCTGCTCGAAATGTTTTAGAGCTAGAAATAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGCACCGAGTCGGTGCTTTTTTT

ガイド17 (U6からsgRNAスキャフォールドまで)
TACGTGACGTAGAAAGTAATAATTTCTTGGGTAGTTTGCAGTTTTAAAATTATGTTTTAAAATGGACTATCATATGCTTACCGTAACTTGAAAGTATTTCGATTTCTTGGCTTTATATATCTTGTGGAAAGGACGAAACACCGTGCAGGGCATCATCAATTTGTTTTAGAGCTAGAAATAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGCACCGAGTCGGTGCTTTTTTT

ガイド18 (U6からsgRNAスキャフォールドまで)
TACGTGACGTAGAAAGTAATAATTTCTTGGGTAGTTTGCAGTTTTAAAATTATGTTTTAAAATGGACTATCATATGCTTACCGTAACTTGAAAGTATTTCGATTTCTTGGCTTTATATATCTTGTGGAAAGGACGAAACACCGTTAAAGGAAAGTAATGGACCGTTTTAGAGCTAGAAATAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGCACCGAGTCGGTGCTTTTTTT

ガイド19 (U6からsgRNAスキャフォールドまで)
TACGTGACGTAGAAAGTAATAATTTCTTGGGTAGTTTGCAGTTTTAAAATTATGTTTTAAAATGGACTATCATATGCTTACCGTAACTTGAAAGTATTTCGATTTCTTGGCTTTATATATCTTGTGGAAAGGACGAAACACCGTTACTTTCCTTTAAGAAAAGGTTTTAGAGCTAGAAATAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGCACCGAGTCGGTGCTTTTTTT

ガイド20 (U6からsgRNAスキャフォールドまで)
TACGTGACGTAGAAAGTAATAATTTCTTGGGTAGTTTGCAGTTTTAAAATTATGTTTTAAAATGGACTATCATATGCTTACCGTAACTTGAAAGTATTTCGATTTCTTGGCTTTATATATCTTGTGGAAAGGACGAAACACCGTAAATAGGCTGTACCAGTGCGTTTTAGAGCTAGAAATAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGCACCGAGTCGGTGCTTTTTTT

ガイド21(U6からsgRNAスキャフォールドまで)
TACGTGACGTAGAAAGTAATAATTTCTTGGGTAGTTTGCAGTTTTAAAATTATGTTTTAAAATGGACTATCATATGCTTACCGTAACTTGAAAGTATTTCGATTTCTTGGCTTTATATATCTTGTGGAAAGGACGAAACACCGGTACAGCCTATTTATAAGAGTTTTAGAGCTAGAAATAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGCACCGAGTCGGTGCTTTTTTT

ガイド22 (U6からsgRNAスキャフォールドまで)
TACGTGACGTAGAAAGTAATAATTTCTTGGGTAGTTTGCAGTTTTAAAATTATGTTTTAAAATGGACTATCATATGCTTACCGTAACTTGAAAGTATTTCGATTTCTTGGCTTTATATATCTTGTGGAAAGGACGAAACACCGATGCTTCCCCACACCTTCACGTTTTAGAGCTAGAAATAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGCACCGAGTCGGTGCTTTTTTT

ガイド24 (U6からsgRNAスキャフォールドまで)
TACGTGACGTAGAAAGTAATAATTTCTTGGGTAGTTTGCAGTTTTAAAATTATGTTTTAAAATGGACTATCATATGCTTACCGTAACTTGAAAGTATTTCGATTTCTTGGCTTTATATATCTTGTGGAAAGGACGAAACACCGTTCATTATTAGGCATGTTGGGTTTTAGAGCTAGAAATAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGCACCGAGTCGGTGCTTTTTTT

ガイド25 (U6からsgRNAスキャフォールドまで)
TACGTGACGTAGAAAGTAATAATTTCTTGGGTAGTTTGCAGTTTTAAAATTATGTTTTAAAATGGACTATCATATGCTTACCGTAACTTGAAAGTATTTCGATTTCTTGGCTTTATATATCTTGTGGAAAGGACGAAACACCGAACATGCCTAATAATGAAAAGTTTTAGAGCTAGAAATAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGCACCGAGTCGGTGCTTTTTTT

ガイド39 (U6からsgRNAスキャフォールドまで)
TACGTGACGTAGAAAGTAATAATTTCTTGGGTAGTTTGCAGTTTTAAAATTATGTTTTAAAATGGACTATCATATGCTTACCGTAACTTGAAAGTATTTCGATTTCTTGGCTTTATATATCTTGTGGAAAGGACGAAACACCGTTCCTTTAAGAAAAGTGCAAGTTTTAGAGCTAGAAATAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGCACCGAGTCGGTGCTTTTTTT

ガイド40 (U6からsgRNAスキャフォールドまで)
TACGTGACGTAGAAAGTAATAATTTCTTGGGTAGTTTGCAGTTTTAAAATTATGTTTTAAAATGGACTATCATATGCTTACCGTAACTTGAAAGTATTTCGATTTCTTGGCTTTATATATCTTGTGGAAAGGACGAAACACCGACAGCCTATTTATAAGAAGAGTTTTAGAGCTAGAAATAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGCACCGAGTCGGTGCTTTTTTT

ガイド41 (U6からsgRNAスキャフォールドまで)
TACGTGACGTAGAAAGTAATAATTTCTTGGGTAGTTTGCAGTTTTAAAATTATGTTTTAAAATGGACTATCATATGCTTACCGTAACTTGAAAGTATTTCGATTTCTTGGCTTTATATATCTTGTGGAAAGGACGAAACACCGAAATAGGCTGTACCAGTGCAGTTTTAGAGCTAGAAATAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGCACCGAGTCGGTGCTTTTTTT

ガイド42 (U6からsgRNAスキャフォールドまで)
TACGTGACGTAGAAAGTAATAATTTCTTGGGTAGTTTGCAGTTTTAAAATTATGTTTTAAAATGGACTATCATATGCTTACCGTAACTTGAAAGTATTTCGATTTCTTGGCTTTATATATCTTGTGGAAAGGACGAAACACCGTATTAGGCATGTTGGAGACTGTTTTAGAGCTAGAAATAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGCACCGAGTCGGTGCTTTTTTT

以下の表は、上記sgRNAのいくつかを用いたSOD1スプライスアクセプター塩基編集の結果を示す。表19では、いくつかのgRNAとABEについて標的部位での塩基編集のパーセントを示している。

対照と比較した、本明細書に記載のいくつかの異なるABE8 (またはABE7.10) アデノシン塩基エディターおよびsgRNA「ガイド20」によって標的部位で達成されたAからGへの塩基編集のパーセントを、下記表20に示す。

対照と比較した、本明細書に記載のいくつかの異なるABE8 (またはABE7.10) アデノシン塩基エディターおよびsgRNA「ガイド42」によって達成された、標的部位におけるAからGへの塩基編集のパーセントを、下記表21に示す。

対照と比較した、本明細書に記載のいくつかの異なるABE8 (またはABE7.10) アデノシン塩基エディターおよびsgRNA「ガイド41」によって達成された、標的部位におけるAからGへの塩基編集のパーセントを、下記表22に示す。

［細胞培養とトランスフェクション］
HEK293T (293T) 細胞株は、American Tissue Culture Collection (ATCC) から入手した。293T細胞は、10%ウシ胎児血清および1%ペニシリン/ストレプトマイシンを添加したDMEM中、37℃、5% CO₂で維持した。全ての細胞株は、製造業者の指示に従ってリポフェクタミン2000 (Invitrogen) を用いて24ウェルプレート中でトランスフェクトした。リポフェクションに用いたDNA量は1μg/ウェルであった。対照GFP発現プラスミドの送達後に蛍光顕微鏡によって測定したところ、トランスフェクション効率は293T細胞について常に80%より高かった。

プラスミドトランスフェクションのために、HEK293T細胞を平板培養し、OptiMEM培地およびリポフェクタミン2000を用いて、U6プロモーターを含みgRNAをコードする250 ngの発現プラスミドと、Cas9/ABE8バリアント塩基エディターをコードする750 ngの発現プラスミドとでトランスフェクトした。使用したABE8塩基エディターバリアントにはNGG PAM配列が含まれていた。細胞を37℃、5% CO₂で5日間維持し、トランスフェクション後3日目には培地を交換した。その後、細胞を溶解し、ゲノムDNAを単離し、典型的には20～100 ngの鋳型DNAを用いて標準的な手順を用いてPCRを行った。アダプター (Illumina) を加えた後、DNAをディープシークエンシングした。所望の部位における塩基編集をMiSeq分析により分析した。

293T細胞の複製トランスフェクションから採取したゲノムDNAまたはRNAからのPCRアンプリコンについて、ディープシークエンシングを行った。ゲル電気泳動によってPCR産物の質を検証した後、PCR産物を、例えばZymo Research社のZymo clean Gel DNA Recovery Kitを用いたゲル抽出によって単離した。剪断せずにショットガンライブラリーを調製した。ライブラリーをqPCRによって定量し、MiSeq 500サイクル配列決定キットバージョン2を用いて、断片の各末端から、251サイクルに渡り一つのMiSeq Nanoフローセル上で配列決定した。Fastqファイルが生成され、bcl2fastq v2.17.1.14変換ソフトウェア (Illumina) によって脱多重化された。

［実施例９：細胞におけるSOD1遺伝子発現を破壊またはサイレンシングするためのアデノシンおよびシチジン塩基エディターを用いたスプライスアクセプター破壊］
この実施例では、spCas9ニッカーゼ由来アデノシン塩基エディター (ABE) システムを用いて、SOD1遺伝子のエクソン3の5’末端における高度に保存されたスプライスアクセプター「AG」核酸配列に正確なA→G突然変異を導入した。さらに、シチジン塩基エディタ (CBE) システムを用いて、SOD1遺伝子のエクソン3の5’末端におけるスプライスアクセプター核酸配列付近に正確なC→T突然変異を導入した。正準的スプライスアクセプター部位の「AG」核酸配列におけるAからGへの塩基変化および/またはスプライスアクセプター部位近傍のCからTへの塩基変化は、メッセンジャーRNA (mRNA) のミススプライシングおよびSOD1遺伝子のエクソン3の遺伝子転写破壊および/または代替的スプライシングを誘導し得る。

ABEを用いて、SOD1ゲノム核酸配列中のAGスプライスアクセプターにおける「A」核酸塩基を効率的に標的化し、標的部位でA>G変換をすることによって、正準的な「AG」スプライスアクセプターを破壊した。ABE8塩基エディターバリアントすなわちABE8.1～ABE8.14、およびABE7.10、ならびにPVバリアントすなわちPV1～PV14、PV PV34、PV36、PV57、PV60、PV65、PV188～PV198およびPV216とともにガイドRNA (gRNA) を用いて、「AG」スプライスアクセプター核酸のアデノシン（「A」）を標的化した（図58, 59, 60A, 61, 64A, 65,および67）。さらに、CBEを用いて、SOD1ゲノム核酸配列のエクソン3の5’における「AG」スプライスアクセプター部位の下流に位置する「C」核酸塩基を効率的に標的化し標的部位でC>T変換をすることによって、エクソン3のスプライシングを破壊した。CBE塩基エディターバリアント（例えばBE4；図63、66A、69、70、および71）と共にガイドRNA (gRNA) を用いて、「AG」スプライスアクセプター核酸の下流のシチジン（「C」）を標的化した。塩基編集はHEK293T細胞株で試験した。

gRNAは、本明細書に提供されるか、または当業者の知識に基づいて決定されかつ当業者に理解されるように、ALSに関連するヒトSOD1遺伝子のスプライスアクセプター核酸配列（「AG」；すなわち、SOD1のエクソン3の5’にあるスプライスアクセプター）のための足場配列およびスペーサー配列（標的配列）を包含した。（例えば、Komor, A.C., et al., “Programmable editing of a target base in genomic DNA without double-stranded DNA cleavage” Nature 533, 420-424 (2016); Gaudelli, N.M., et al., “Programmable base editing of A・T to G・C in genomic DNA without DNA cleavage”Nature 551, 464-471 (2017); Komor, A.C., et al., “Improved base excision repair inhibition and bacteriophage Mu Gam protein yields C:G-to-T:A base editors with higher efficiency and product purity” Science Advances 3:eaao4774 (2017), およびRees, H.A., et al., “Base editing: precision chemistry on the genome and transcriptome of living cells.” Nat Rev Genet. 2018 Dec;19(12):770-788. doi: 10.1038/s41576-018-0059-1参照。）

使用されたABE塩基エディターは以下のABE8バリアントを含んだ：ABE8.1, ABE8.2, ABE8.2, ABE8.3, ABE8.4, ABE8.5, ABE8.6, ABE8.7, ABE8.8, ABE8.9, ABE8.10, ABE8.11, ABE8.12, ABE8.13およびABE8.14（表7参照）。陽性対照塩基エディターABE7.10および陰性対照も参照比較のために使用した。使用されたABE塩基エディターは、以下のPVバリアントも含んだ：PV1、PV2、PV3、PV4、PV5、PV6、PV7、PV8、PV9、PV10、PV11、PV12、PV13、PV14、PV34、PV36、PV57、PV60、PV65、PV188、PV189、PV190、PV191、PV192、PV193、PV194、PV195、PV196、PV197、PV198、およびPV216。使用されたCBE塩基エディターには、PV217～233、PV266～268、PV271、およびPV284-BE4 VRQRが含まれた。参照比較のために陰性対照を用いた。

図60 B、64 B、66 B、68、および72～79は、異なるgRNAで試験されたABEおよびCBE塩基エディターのA→GまたはC→T塩基編集効率を示し、これは、ディープシークエンシングPCR産物によって検出されたものである。

SOD1蛋白質レベルを測定して、塩基編集がSOD1のmRNAスプライシングと蛋白質レベルの崩壊をもたらしたことを確認した(図62)。リポフェクタミン2000システムを用い、ABE8.8またはABE7.10塩基エディターおよびガイド20 (gRNA 20) でHEK293T細胞株において塩基編集を試験した。蛋白質レベルはJess Protein Simple (ウェスタンブロット) を用いて測定した。サンプルはローディングコントロールであるβアクチンに対して正規化した。

［SOD1遺伝子スプライスアクセプターの塩基編集のための単一ガイドRNA (sgRNA)］
本願明細書に記載されるシステムおよび方法での使用に適した、SOD1スプライスアクセプター破壊のための単一ガイドRNA (sgRNA) 核酸配列の例は、実施例8に記載される。これらのsgRNAは、図55に示されるSOD1ゲノム核酸配列のスプライスアクセプター「AG」配列の標的アデノシン (A) 配列に相補的な「U6」で始まっている（示される核酸配列では、「U」核酸塩基の代わりに「T」核酸塩基が提示されている）。図55に示される配列の位置6におけるSOD1エクソン3スプライスアクセプター「AG」配列の標的「A」核酸塩基は、図中で上向き矢印によって示されている。以下の表は、実施例8に記載されたsgRNAのいくつかを用いたSOD1スプライスアクセプター塩基編集の結果を示す。表23には、gRNA核酸配列およびPAM配列を記載する。

表24では、いくつかのgRNAおよびABE/CBEについて、標的部位における最高オンターゲット塩基編集が示されている。

表25～34において、本明細書中に記載されるいくつかの異なるABE8 (またはABE7.10) アデノシン塩基エディター、PVアデノシン塩基エディターまたはBE4のようなCBEと異なるsgRNAとによって達成された、標的部位および標的部位付近（例えばバイスタンダー）におけるA→GまたはC→T塩基編集のパーセントが対照と比較して示される。

表25：ALSガイド15

表26：ALSガイド16

表27：ALSガイド17

表28A：ALSガイド18

表28B：ALSガイド18

表29：ALSガイド19

表30：ALSガイド21

表31：ALSガイド22

表32：ALSガイド24

表33：ALSガイド40

表34A：ALSガイド41

表34B：ALSガイド41

細胞培養とトランスフェクション
HEK293T (293T) 細胞株はAmerican Tissue Culture Collection (ATCC) から入手した。293T細胞は、10%ウシ胎児血清および1%ペニシリン/ストレプトマイシンを添加したDMEM中、37℃、5% CO₂で維持した。全ての細胞株を、製造業者の指示に従ってリポフェクタミン2000 (Invitrogen) を用いて24ウェルプレート中でトランスフェクトした。リポフェクションに用いたDNA量は1μg/ウェルであった。トランスフェクション効率は、対照GFP発現プラスミドの送達後に蛍光顕微鏡によって測定したところ、293T細胞について80%よりも常に高かった。

［実施例１０：シチジン塩基エディターを用いて、AR遺伝子のエクソン1またはエクソン2に終止コドンを導入した］
SBMAの分子機序は、アンドロゲン受容体（AR）ポリペプチドのポリグルタミン（polyQ）区域をコードする、AR遺伝子の第1エクソンにおけるトリヌクレオチドCAG反復の拡張である。変異ARタンパク質を含有する核内封入体が、脳幹および脊髄の運動ニューロン中に存在する。このような封入体の存在がSBMAの病態生理と関連している。

この実施例では、C→T塩基エディター系を用いて、拡張型トリヌクレオチド反復を含む変異AR遺伝子のエクソン1においてグルタミン(Gln) をコードするCAGコドンに正確なC→T突然変異を導入した。CからTへの塩基変化は、標的「CAG」核酸配列をTAGに変換し、これは、タンパク質の早期終結をもたらす。他の実施形態では、本発明のCBEは、CAAをTAAに、CGAをTGAに、またはTGGをTGA、TAGもしくはTAAに変更する。

［実施例11:アデニン塩基エディター（ABE）を用いて、ARポリヌクレオチド内のスプライスアクセプター及びスプライスドナー部位を破壊した］
この実施例では、A→G塩基エディター系を用いて、拡張トリヌクレオチド反復を含む変異型AR遺伝子のエクソン1のスプライスドナー部位に正確なA→G突然変異を導入した。C→T塩基エディターを用いて、拡張型トリヌクレオチド反復を含む変異型AR遺伝子のエクソン1のスプライスドナー部位に正確なC→T突然変異を導入した。A→G塩基エディター系は、エクソン2の直前のスプライスアクセプター部位に正確なA→G突然変異を生じさせるためにも使用された。

上記の各実施例において、塩基編集はHEK293T細胞株で試験された。使用されたガイドRNA (gRNA) は、以下に示す配列を有するシチジン塩基エディターを伴ってARの「CAG」を標的化した。

BGX5-D10A (CMV to SV40 NLS)
GATTATTGACTAGTTATTAATAGTAATCAATTACGGGGTCATTAGTTCATAGCCCATATATGGAGTTCCGCGTTACATAACTTACGGTAAATGGCCCGCCTGGCTGACCGCCCAACGACCCCCGCCCATTGACGTCAATAATGACGTATGTTCCCATAGTAACGCCAATAGGGACTTTCCATTGACGTCAATGGGTGGAGTATTTACGGTAAACTGCCCACTTGGCAGTACATCAAGTGTATCATATGCCAAGTACGCCCCCTATTGACGTCAATGACGGTAAATGGCCCGCCTGGCATTATGCCCAGTACATGACCTTATGGGACTTTCCTACTTGGCAGTACATCTACGTATTAGTCATCGCTATTACCATGGTGATGCGGTTTTGGCAGTACATCAATGGGCGTGGATAGCGGTTTGACTCACGGGGATTTCCAAGTCTCCACCCCATTGACGTCAATGGGAGTTTGTTTTGGCACCAAAATCAACGGGACTTTCCAAAATGTCGTAACAACTCCGCCCCATTGACGCAAATGGGCGGTAGGCGTGTACGGTGGGAGGTCTATATAAGCAGAGCTGGTTTAGTGAACCGTCAGATCCGCTAGAGATCCGCGGCCGCTAATACGACTCACTATAGGGAGAGCCGCCACCATGACCTCTGAGAAGGGCCCTAGCACAGGCGACCCCACCCTGCGGCGGAGAATCGAGAGCTGGGAGTTCGACGTGTTCTACGACCCTAGAGAACTGAGAAAGGAAACCTGCCTGCTGTACGAGATCAAGTGGGGCATGAGCAGAAAGATCTGGCGGAGCTCTGGCAAGAACACCACCAACCACGTGGAAGTGAATTTCATCAAGAAGTTCACCAGCGAGAGAAGGTTCCACAGCAGCATCAGCTGCAGCATCACCTGGTTCCTGAGCTGGTCCCCTTGCTGGGAATGCAGCCAGGCCATCAGAGAGTTCCTGAGCCAACACCCCGGAGTGACACTGGTGATCTACGTGGCCAGACTGTTCTGGCACATGGACCAGAGAAACAGACAGGGCCTGAGAGATCTGGTCAACAGCGGCGTGACTATCCAGATCATGCGGGCCAGCGAGTACTACCACTGTTGGCGGAACTTCGTGAACTACCCCCCCGGCGATGAGGCCCACTGGCCTCAGTACCCTCCTCTGTGGATGATGCTGTACGCCCTGGAACTGCACTGCATCATCCTGTCTCTGCCTCCATGTCTGAAGATCTCTAGAAGATGGCAGAACCACCTGGCCTTCTTCAGACTGCACCTGCAGAATTGCCACTACCAGACCATCCCCCCCCACATCCTGCTGGCTACAGGCCTGATCCACCCTTCTGTGACCTGGAGACTTAAGAGCGGAGGATCTAGCGGCGGCTCTAGCGGATCTGAGACACCTGGCACAAGCGAGTCTGCCACACCTGAGAGTAGCGGCGGATCTTCTGGTGGCTCTGACAAGAAGTACAGCATCGGCCTGGCCATCGGCACCAACTCTGTGGGCTGGGCCGTGATCACCGACGAGTACAAGGTGCCCAGCAAGAAATTCAAGGTGCTGGGCAACACCGACCGGCACAGCATCAAGAAGAACCTGATCGGAGCCCTGCTGTTCGACAGCGGCGAAACAGCCGAGGCCACCCGGCTGAAGAGAACCGCCAGAAGAAGATACACCAGACGGAAGAACCGGATCTGCTATCTGCAAGAGATCTTCAGCAACGAGATGGCCAAGGTGGACGACAGCTTCTTCCACAGACTGGAAGAGTCCTTCCTGGTGGAAGAGGATAAGAAGCACGAGCGGCACCCCATCTTCGGCAACATCGTGGACGAGGTGGCCTACCACGAGAAGTACCCCACCATCTACCACCTGAGAAAGAAACTGGTGGACAGCACCGACAAGGCCGACCTGCGGCTGATCTATCTGGCCCTGGCCCACATGATCAAGTTCCGGGGCCACTTCCTGATCGAGGGCGACCTGAACCCCGACAACAGCGACGTGGACAAGCTGTTCATCCAGCTGGTGCAGACCTACAACCAGCTGTTCGAGGAAAACCCCATCAACGCCAGCGGCGTGGACGCCAAGGCCATCCTGTCTGCCAGACTGAGCAAGAGCAGACGGCTGGAAAATCTGATCGCCCAGCTGCCCGGCGAGAAGAAGAATGGCCTGTTCGGAAACCTGATTGCCCTGAGCCTGGGCCTGACCCCCAACTTCAAGAGCAACTTCGACCTGGCCGAGGATGCCAAACTGCAGCTGAGCAAGGACACCTACGACGACGACCTGGACAACCTGCTGGCCCAGATCGGCGACCAGTACGCCGACCTGTTTCTGGCCGCCAAGAACCTGTCCGACGCCATCCTGCTGAGCGACATCCTGAGAGTGAACACCGAGATCACCAAGGCCCCCCTGAGCGCCTCTATGATCAAGAGATACGACGAGCACCACCAGGACCTGACCCTGCTGAAAGCTCTCGTGCGGCAGCAGCTGCCTGAGAAGTACAAAGAGATTTTCTTCGACCAGAGCAAGAACGGCTACGCCGGCTACATTGACGGCGGAGCCAGCCAGGAAGAGTTCTACAAGTTCATCAAGCCCATCCTGGAAAAGATGGACGGCACCGAGGAACTGCTCGTGAAGCTGAACAGAGAGGACCTGCTGCGGAAGCAGCGGACCTTCGACAACGGCAGCATCCCCCACCAGATCCACCTGGGAGAGCTGCACGCCATTCTGCGGCGGCAGGAAGATTTTTACCCATTCCTGAAGGACAACCGGGAAAAGATCGAGAAGATCCTGACCTTCCGCATCCCCTACTACGTGGGCCCTCTGGCCAGGGGAAACAGCAGATTCGCCTGGATGACCAGAAAGAGCGAGGAAACCATCACCCCCTGGAACTTCGAGGAAGTGGTGGACAAGGGCGCTTCCGCCCAGAGCTTCATCGAGCGGATGACCAACTTCGATAAGAACCTGCCCAACGAGAAGGTGCTGCCCAAGCACAGCCTGCTGTACGAGTACTTCACCGTGTATAACGAGCTGACCAAAGTGAAATACGTGACCGAGGGAATGAGAAAGCCCGCCTTCCTGAGCGGCGAGCAGAAAAAGGCCATCGTGGACCTGCTGTTCAAGACCAACCGGAAAGTGACCGTGAAGCAGCTGAAAGAGGACTACTTCAAGAAAATCGAGTGCTTCGACTCCGTGGAAATCTCCGGCGTGGAAGATCGGTTCAACGCCTCCCTGGGCACATACCACGATCTGCTGAAAATTATCAAGGACAAGGACTTCCTGGACAATGAGGAAAACGAGGACATTCTGGAAGATATCGTGCTGACCCTGACACTGTTTGAGGACAGAGAGATGATCGAGGAACGGCTGAAAACCTATGCCCACCTGTTCGACGACAAAGTGATGAAGCAGCTGAAGCGGCGGAGATACACCGGCTGGGGCAGGCTGAGCCGGAAGCTGATCAACGGCATCCGGGACAAGCAGTCCGGCAAGACAATCCTGGATTTCCTGAAGTCCGACGGCTTCGCCAACAGAAACTTCATGCAGCTGATCCACGACGACAGCCTGACCTTTAAAGAGGACATCCAGAAAGCCCAGGTGTCCGGCCAGGGCGATAGCCTGCACGAGCACATTGCCAATCTGGCCGGCAGCCCCGCCATTAAGAAGGGCATCCTGCAGACAGTGAAGGTGGTGGACGAGCTCGTGAAAGTGATGGGCCGGCACAAGCCCGAGAACATCGTGATCGAAATGGCCAGAGAGAACCAGACCACCCAGAAGGGACAGAAGAACAGCCGCGAGAGAATGAAGCGGATCGAAGAGGGCATCAAAGAGCTGGGCAGCCAGATCCTGAAAGAACACCCCGTGGAAAACACCCAGCTGCAGAACGAGAAGCTGTACCTGTACTACCTGCAGAATGGGCGGGATATGTACGTGGACCAGGAACTGGACATCAACCGGCTGTCCGACTACGATGTGGACCATATCGTGCCTCAGAGCTTTCTGAAGGACGACTCCATCGACAACAAGGTGCTGACCAGAAGCGACAAGAACCGGGGCAAGAGCGACAACGTGCCCTCCGAAGAGGTCGTGAAGAAGATGAAGAACTACTGGCGGCAGCTGCTGAACGCCAAGCTGATTACCCAGAGAAAGTTCGACAATCTGACCAAGGCCGAGAGAGGCGGCCTGAGCGAACTGGATAAGGCCGGCTTCATCAAGAGACAGCTGGTGGAAACCCGGCAGATCACAAAGCACGTGGCACAGATCCTGGACTCCCGGATGAACACTAAGTACGACGAGAATGACAAGCTGATCCGGGAAGTGAAAGTGATCACCCTGAAGTCCAAGCTGGTGTCCGATTTCCGGAAGGATTTCCAGTTTTACAAAGTGCGCGAGATCAACAACTACCACCACGCCCACGACGCCTACCTGAACGCCGTCGTGGGAACCGCCCTGATCAAAAAGTACCCTAAGCTGGAAAGCGAGTTCGTGTACGGCGACTACAAGGTGTACGACGTGCGGAAGATGATCGCCAAGAGCGAGCAGGAAATCGGCAAGGCTACCGCCAAGTACTTCTTCTACAGCAACATCATGAACTTTTTCAAGACCGAGATTACCCTGGCCAACGGCGAGATCCGGAAGCGGCCTCTGATCGAGACAAACGGCGAAACCGGGGAGATCGTGTGGGATAAGGGCCGGGATTTTGCCACCGTGCGGAAAGTGCTGAGCATGCCCCAAGTGAATATCGTGAAAAAGACCGAGGTGCAGACAGGCGGCTTCAGCAAAGAGTCTATCCTGCCCAAGAGGAACAGCGATAAGCTGATCGCCAGAAAGAAGGACTGGGACCCTAAGAAGTACGGCGGCTTCGACAGCCCCACCGTGGCCTATTCTGTGCTGGTGGTGGCCAAAGTGGAAAAGGGCAAGTCCAAGAAACTGAAGAGTGTGAAAGAGCTGCTGGGGATCACCATCATGGAAAGAAGCAGCTTCGAGAAGAATCCCATCGACTTTCTGGAAGCCAAGGGCTACAAAGAAGTGAAAAAGGACCTGATCATCAAGCTGCCTAAGTACTCCCTGTTCGAGCTGGAAAACGGCCGGAAGAGAATGCTGGCCTCTGCCGGCGAACTGCAGAAGGGAAACGAACTGGCCCTGCCCTCCAAATATGTGAACTTCCTGTACCTGGCCAGCCACTATGAGAAGCTGAAGGGCTCCCCCGAGGATAATGAGCAGAAACAGCTGTTTGTGGAACAGCACAAGCACTACCTGGACGAGATCATCGAGCAGATCAGCGAGTTCTCCAAGAGAGTGATCCTGGCCGACGCTAATCTGGACAAAGTGCTGTCCGCCTACAACAAGCACCGGGATAAGCCCATCAGAGAGCAGGCCGAGAATATCATCCACCTGTTTACCCTGACCAATCTGGGAGCCCCTGCCGCCTTCAAGTACTTTGACACCACCATCGACCGGAAGAGGTACACCAGCACCAAAGAGGTGCTGGACGCCACCCTGATCCACCAGAGCATCACCGGCCTGTACGAGACACGGATCGACCTGTCTCAGCTGGGAGGTGACTCTGGTGGAAGCGGAGGATCTGGCGGCAGCACCAATCTGAGCGACATCATCGAGAAAGAGACAGGCAAGCAGCTGGTCATCCAAGAGTCCATCCTGATGCTGCCTGAAGAGGTGGAAGAAGTGATCGGCAACAAGCCCGAGTCCGACATCCTGGTGCACACCGCCTACGATGAGAGCACCGACGAGAACGTGATGCTGCTGACCTCTGACGCCCCTGAGTACAAGCCTTGGGCTCTCGTGATCCAGGACAGCAACGGCGAGAACAAGATCAAGATGCTGAGCGGCGGCTCTGGTGGCTCTGGCGGATCTACAAACCTGTCCGATATTATTGAGAAAGAAACCGGGAAACAGCTCGTGATTCAAGAGTCTATTCTCATGCTCCCGGAAGAAGTCGAGGAAGTCATTGGAAACAAGCCTGAGAGCGATATTCTGGTCCATACAGCCTACGACGAGTCTACCGATGAGAATGTCATGCTCCTCACCAGCGACGCTCCCGAGTATAAGCCATGGGCACTTGTCATTCAGGACTCCAATGGGGAAAACAAAATCAAAATGCTCCCAAAGAAAAAACGCAAGGTGGAGGGAGCTGATAAGCGCACCGCCGATGGTTCCGAGTTCGAAAGCCCCAAGAAGAAGAGGAAAGTCT

APOBEC1 Pongo pygmaeus (orangutan) replacing rAPOBEC1
MTSEKGPSTGDPTLRRRIESWEFDVFYDPRELRKETCLLYEIKWGMSRKIWRSSGKNTTNHVEVNFIKKFTSERRFHSSISCSITWFLSWSPCWECSQAIREFLSQHPGVTLVIYVARLFWHMDQRNRQGLRDLVNSGVTIQIMRASEYYHCWRNFVNYPPGDEAHWPQYPPLWMMLYALELHCIILSLPPCLKISRRWQNHLAFFRLHLQNCHYQTIPPHILLATGLIHPSVTWRLKSGGSSGGSSGSETPGTSESATPESSGGSSGGSDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGDSGGSGGSGGSTNLSDIIEKETGKQLVIQESILMLPEEVEEVIGNKPESDILVHTAYDESTDENVMLLTSDAPEYKPWALVIQDSNGENKIKMLSGGSGGSGGSTNLSDIIEKETGKQLVIQESILMLPEEVEEVIGNKPESDILVHTAYDESTDENVMLLTSDAPEYKPWALVIQDSNGENKIKMLPKKKRKVEGADKRTADGSEFESPKKKRKV

BGX27-D10A (CMV to SV40 NLS)
CATTGATTATTGACTAGTTATTAATAGTAATCAATTACGGGGTCATTAGTTCATAGCCCATATATGGAGTTCCGCGTTACATAACTTACGGTAAATGGCCCGCCTGGCTGACCGCCCAACGACCCCCGCCCATTGACGTCAATAATGACGTATGTTCCCATAGTAACGCCAATAGGGACTTTCCATTGACGTCAATGGGTGGAGTATTTACGGTAAACTGCCCACTTGGCAGTACATCAAGTGTATCATATGCCAAGTACGCCCCCTATTGACGTCAATGACGGTAAATGGCCCGCCTGGCATTATGCCCAGTACATGACCTTATGGGACTTTCCTACTTGGCAGTACATCTACGTATTAGTCATCGCTATTACCATGGTGATGCGGTTTTGGCAGTACATCAATGGGCGTGGATAGCGGTTTGACTCACGGGGATTTCCAAGTCTCCACCCCATTGACGTCAATGGGAGTTTGTTTTGGCACCAAAATCAACGGGACTTTCCAAAATGTCGTAACAACTCCGCCCCATTGACGCAAATGGGCGGTAGGCGTGTACGGTGGGAGGTCTATATAAGCAGAGCTGGTTTAGTGAACCGTCAGATCCGCTAGAGATCCGCGGCCGCTAATACGACTCACTATAGGGAGAGCCGCCACCATGGCCGGCTACGAGTGCGTGCGGGTGTCCGAGAAGCTGGATTTCGATACCTTCGAGTTCCAGTTCGAGAACCTGCACTACGCCACAGAGAGACACAGAACCTACGTGATCTTCGACGTGAAACCTCAGAGCGCCGGAGGCAGAAGCCGGCGGCTGTGGGGCTACATCATCAACAACCCCAACGTGTGCCACGCCGAGCTGATCCTGATGAGCATGATCGACCGGCACCTGGAATCTAATCCTGGCGTGTACGCCATGACCTGGTACATGAGCTGGTCCCCATGTGCTAATTGCAGCAGCAAGCTGAACCCTTGGCTGAAAAACCTGCTCGAGGAACAGGGCCACACCCTGACCATGCACTTCAGCAGAATCTACGACAGAGATAGAGAAGGCGACCACCGAGGACTGAGAGGCCTGAAGCACGTGTCCAACAGCTTCAGAATGGGCGTGGTCGGAAGAGCCGAGGTGAAGGAATGTCTGGCCGAATACGTGGAAGCCAGCAGAAGAACACTGACATGGCTGGACACCACAGAGAGCATGGCCGCCAAGATGCGGAGAAAGCTGTTCTGCATCCTGGTGCGGTGCGCCGGCATGAGAGAGAGCGGCATCCCCCTGCACCTGTTTACCCTGCAGACCCCTCTGCTGAGCGGCAGAGTGGTGTGGTGGCGGGTGCTTAAGAGCGGAGGATCTAGCGGCGGCTCTAGCGGATCTGAGACACCTGGCACAAGCGAGTCTGCCACACCTGAGAGTAGCGGCGGATCTTCTGGTGGCTCTGACAAGAAGTACAGCATCGGCCTGGCCATCGGCACCAACTCTGTGGGCTGGGCCGTGATCACCGACGAGTACAAGGTGCCCAGCAAGAAATTCAAGGTGCTGGGCAACACCGACCGGCACAGCATCAAGAAGAACCTGATCGGAGCCCTGCTGTTCGACAGCGGCGAAACAGCCGAGGCCACCCGGCTGAAGAGAACCGCCAGAAGAAGATACACCAGACGGAAGAACCGGATCTGCTATCTGCAAGAGATCTTCAGCAACGAGATGGCCAAGGTGGACGACAGCTTCTTCCACAGACTGGAAGAGTCCTTCCTGGTGGAAGAGGATAAGAAGCACGAGCGGCACCCCATCTTCGGCAACATCGTGGACGAGGTGGCCTACCACGAGAAGTACCCCACCATCTACCACCTGAGAAAGAAACTGGTGGACAGCACCGACAAGGCCGACCTGCGGCTGATCTATCTGGCCCTGGCCCACATGATCAAGTTCCGGGGCCACTTCCTGATCGAGGGCGACCTGAACCCCGACAACAGCGACGTGGACAAGCTGTTCATCCAGCTGGTGCAGACCTACAACCAGCTGTTCGAGGAAAACCCCATCAACGCCAGCGGCGTGGACGCCAAGGCCATCCTGTCTGCCAGACTGAGCAAGAGCAGACGGCTGGAAAATCTGATCGCCCAGCTGCCCGGCGAGAAGAAGAATGGCCTGTTCGGAAACCTGATTGCCCTGAGCCTGGGCCTGACCCCCAACTTCAAGAGCAACTTCGACCTGGCCGAGGATGCCAAACTGCAGCTGAGCAAGGACACCTACGACGACGACCTGGACAACCTGCTGGCCCAGATCGGCGACCAGTACGCCGACCTGTTTCTGGCCGCCAAGAACCTGTCCGACGCCATCCTGCTGAGCGACATCCTGAGAGTGAACACCGAGATCACCAAGGCCCCCCTGAGCGCCTCTATGATCAAGAGATACGACGAGCACCACCAGGACCTGACCCTGCTGAAAGCTCTCGTGCGGCAGCAGCTGCCTGAGAAGTACAAAGAGATTTTCTTCGACCAGAGCAAGAACGGCTACGCCGGCTACATTGACGGCGGAGCCAGCCAGGAAGAGTTCTACAAGTTCATCAAGCCCATCCTGGAAAAGATGGACGGCACCGAGGAACTGCTCGTGAAGCTGAACAGAGAGGACCTGCTGCGGAAGCAGCGGACCTTCGACAACGGCAGCATCCCCCACCAGATCCACCTGGGAGAGCTGCACGCCATTCTGCGGCGGCAGGAAGATTTTTACCCATTCCTGAAGGACAACCGGGAAAAGATCGAGAAGATCCTGACCTTCCGCATCCCCTACTACGTGGGCCCTCTGGCCAGGGGAAACAGCAGATTCGCCTGGATGACCAGAAAGAGCGAGGAAACCATCACCCCCTGGAACTTCGAGGAAGTGGTGGACAAGGGCGCTTCCGCCCAGAGCTTCATCGAGCGGATGACCAACTTCGATAAGAACCTGCCCAACGAGAAGGTGCTGCCCAAGCACAGCCTGCTGTACGAGTACTTCACCGTGTATAACGAGCTGACCAAAGTGAAATACGTGACCGAGGGAATGAGAAAGCCCGCCTTCCTGAGCGGCGAGCAGAAAAAGGCCATCGTGGACCTGCTGTTCAAGACCAACCGGAAAGTGACCGTGAAGCAGCTGAAAGAGGACTACTTCAAGAAAATCGAGTGCTTCGACTCCGTGGAAATCTCCGGCGTGGAAGATCGGTTCAACGCCTCCCTGGGCACATACCACGATCTGCTGAAAATTATCAAGGACAAGGACTTCCTGGACAATGAGGAAAACGAGGACATTCTGGAAGATATCGTGCTGACCCTGACACTGTTTGAGGACAGAGAGATGATCGAGGAACGGCTGAAAACCTATGCCCACCTGTTCGACGACAAAGTGATGAAGCAGCTGAAGCGGCGGAGATACACCGGCTGGGGCAGGCTGAGCCGGAAGCTGATCAACGGCATCCGGGACAAGCAGTCCGGCAAGACAATCCTGGATTTCCTGAAGTCCGACGGCTTCGCCAACAGAAACTTCATGCAGCTGATCCACGACGACAGCCTGACCTTTAAAGAGGACATCCAGAAAGCCCAGGTGTCCGGCCAGGGCGATAGCCTGCACGAGCACATTGCCAATCTGGCCGGCAGCCCCGCCATTAAGAAGGGCATCCTGCAGACAGTGAAGGTGGTGGACGAGCTCGTGAAAGTGATGGGCCGGCACAAGCCCGAGAACATCGTGATCGAAATGGCCAGAGAGAACCAGACCACCCAGAAGGGACAGAAGAACAGCCGCGAGAGAATGAAGCGGATCGAAGAGGGCATCAAAGAGCTGGGCAGCCAGATCCTGAAAGAACACCCCGTGGAAAACACCCAGCTGCAGAACGAGAAGCTGTACCTGTACTACCTGCAGAATGGGCGGGATATGTACGTGGACCAGGAACTGGACATCAACCGGCTGTCCGACTACGATGTGGACCATATCGTGCCTCAGAGCTTTCTGAAGGACGACTCCATCGACAACAAGGTGCTGACCAGAAGCGACAAGAACCGGGGCAAGAGCGACAACGTGCCCTCCGAAGAGGTCGTGAAGAAGATGAAGAACTACTGGCGGCAGCTGCTGAACGCCAAGCTGATTACCCAGAGAAAGTTCGACAATCTGACCAAGGCCGAGAGAGGCGGCCTGAGCGAACTGGATAAGGCCGGCTTCATCAAGAGACAGCTGGTGGAAACCCGGCAGATCACAAAGCACGTGGCACAGATCCTGGACTCCCGGATGAACACTAAGTACGACGAGAATGACAAGCTGATCCGGGAAGTGAAAGTGATCACCCTGAAGTCCAAGCTGGTGTCCGATTTCCGGAAGGATTTCCAGTTTTACAAAGTGCGCGAGATCAACAACTACCACCACGCCCACGACGCCTACCTGAACGCCGTCGTGGGAACCGCCCTGATCAAAAAGTACCCTAAGCTGGAAAGCGAGTTCGTGTACGGCGACTACAAGGTGTACGACGTGCGGAAGATGATCGCCAAGAGCGAGCAGGAAATCGGCAAGGCTACCGCCAAGTACTTCTTCTACAGCAACATCATGAACTTTTTCAAGACCGAGATTACCCTGGCCAACGGCGAGATCCGGAAGCGGCCTCTGATCGAGACAAACGGCGAAACCGGGGAGATCGTGTGGGATAAGGGCCGGGATTTTGCCACCGTGCGGAAAGTGCTGAGCATGCCCCAAGTGAATATCGTGAAAAAGACCGAGGTGCAGACAGGCGGCTTCAGCAAAGAGTCTATCCTGCCCAAGAGGAACAGCGATAAGCTGATCGCCAGAAAGAAGGACTGGGACCCTAAGAAGTACGGCGGCTTCGACAGCCCCACCGTGGCCTATTCTGTGCTGGTGGTGGCCAAAGTGGAAAAGGGCAAGTCCAAGAAACTGAAGAGTGTGAAAGAGCTGCTGGGGATCACCATCATGGAAAGAAGCAGCTTCGAGAAGAATCCCATCGACTTTCTGGAAGCCAAGGGCTACAAAGAAGTGAAAAAGGACCTGATCATCAAGCTGCCTAAGTACTCCCTGTTCGAGCTGGAAAACGGCCGGAAGAGAATGCTGGCCTCTGCCGGCGAACTGCAGAAGGGAAACGAACTGGCCCTGCCCTCCAAATATGTGAACTTCCTGTACCTGGCCAGCCACTATGAGAAGCTGAAGGGCTCCCCCGAGGATAATGAGCAGAAACAGCTGTTTGTGGAACAGCACAAGCACTACCTGGACGAGATCATCGAGCAGATCAGCGAGTTCTCCAAGAGAGTGATCCTGGCCGACGCTAATCTGGACAAAGTGCTGTCCGCCTACAACAAGCACCGGGATAAGCCCATCAGAGAGCAGGCCGAGAATATCATCCACCTGTTTACCCTGACCAATCTGGGAGCCCCTGCCGCCTTCAAGTACTTTGACACCACCATCGACCGGAAGAGGTACACCAGCACCAAAGAGGTGCTGGACGCCACCCTGATCCACCAGAGCATCACCGGCCTGTACGAGACACGGATCGACCTGTCTCAGCTGGGAGGTGACTCTGGTGGAAGCGGAGGATCTGGCGGCAGCACCAATCTGAGCGACATCATCGAGAAAGAGACAGGCAAGCAGCTGGTCATCCAAGAGTCCATCCTGATGCTGCCTGAAGAGGTGGAAGAAGTGATCGGCAACAAGCCCGAGTCCGACATCCTGGTGCACACCGCCTACGATGAGAGCACCGACGAGAACGTGATGCTGCTGACCTCTGACGCCCCTGAGTACAAGCCTTGGGCTCTCGTGATCCAGGACAGCAACGGCGAGAACAAGATCAAGATGCTGAGCGGCGGCTCTGGTGGCTCTGGCGGATCTACAAACCTGTCCGATATTATTGAGAAAGAAACCGGGAAACAGCTCGTGATTCAAGAGTCTATTCTCATGCTCCCGGAAGAAGTCGAGGAAGTCATTGGAAACAAGCCTGAGAGCGATATTCTGGTCCATACAGCCTACGACGAGTCTACCGATGAGAATGTCATGCTCCTCACCAGCGACGCTCCCGAGTATAAGCCATGGGCACTTGTCATTCAGGACTCCAATGGGGAAAACAAAATCAAAATGCTCCCAAAGAAAAAACGCAAGGTGGAGGGAGCTGATAAGCGCACCGCCGATGGTTCCGAGTTCGAAAGCCCCAAGAAGAAGAGGAAAGT

Cytidine deaminase 1 Petromyzon marinus (lamprey) replacing rAPOBEC1
MAGYECVRVSEKLDFDTFEFQFENLHYATERHRTYVIFDVKPQSAGGRSRRLWGYIINNPNVCHAELILMSMIDRHLESNPGVYAMTWYMSWSPCANCSSKLNPWLKNLLEEQGHTLTMHFSRIYDRDREGDHRGLRGLKHVSNSFRMGVVGRAEVKECLAEYVEASRRTLTWLDTTESMAAKMRRKLFCILVRCAGMRESGIPLHLFTLQTPLLSGRVVWWRVLKSGGSSGGSSGSETPGTSESATPESSGGSSGGSDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGDSGGSGGSGGSTNLSDIIEKETGKQLVIQESILMLPEEVEEVIGNKPESDILVHTAYDESTDENVMLLTSDAPEYKPWALVIQDSNGENKIKMLSGGSGGSGGSTNLSDIIEKETGKQLVIQESILMLPEEVEEVIGNKPESDILVHTAYDESTDENVMLLTSDAPEYKPWALVIQDSNGENKIKMLPKKKRKVEGADKRTADGSEFESPKKKRK

BGX29-D10A
CATTGATTATTGACTAGTTATTAATAGTAATCAATTACGGGGTCATTAGTTCATAGCCCATATATGGAGTTCCGCGTTACATAACTTACGGTAAATGGCCCGCCTGGCTGACCGCCCAACGACCCCCGCCCATTGACGTCAATAATGACGTATGTTCCCATAGTAACGCCAATAGGGACTTTCCATTGACGTCAATGGGTGGAGTATTTACGGTAAACTGCCCACTTGGCAGTACATCAAGTGTATCATATGCCAAGTACGCCCCCTATTGACGTCAATGACGGTAAATGGCCCGCCTGGCATTATGCCCAGTACATGACCTTATGGGACTTTCCTACTTGGCAGTACATCTACGTATTAGTCATCGCTATTACCATGGTGATGCGGTTTTGGCAGTACATCAATGGGCGTGGATAGCGGTTTGACTCACGGGGATTTCCAAGTCTCCACCCCATTGACGTCAATGGGAGTTTGTTTTGGCACCAAAATCAACGGGACTTTCCAAAATGTCGTAACAACTCCGCCCCATTGACGCAAATGGGCGGTAGGCGTGTACGGTGGGAGGTCTATATAAGCAGAGCTGGTTTAGTGAACCGTCAGATCCGCTAGAGATCCGCGGCCGCTAATACGACTCACTATAGGGAGAGCCGCCACCATGGCTGGCGATGAGAACGTGCGGGTGAGTGAAAAGCTGGACTTCGACACCTTCGAGTTCCAGTTCGAGAATCTGCACTACGCCACCGAGAGACACCGGACCTACGTGATCTTCGACGTGAAACCTCAGTCTGCCGGCGGCAGAAGCCGGCGGCTGTGGGGCTACATCATCAACAACCCTAACGTGTGCCACGCCGAGCTGATCCTGATGAGCATGATCGACAGACACCTGGAAAGCAACCCCGGCGTGTACGCCATGACCTGGTACATGTCTTGGTCCCCATGTGCCAACTGCAGCAGCAAGCTGAACCCCTGGCTGAAAAACCTGCTGGAGGAACAGGGCCACACCCTGATGATGCACTTCAGCAGAATCTACGACCGGGACCGCGAGGGCGACCACAGAGGCCTGAGAGGACTGAAGCACGTGTCCAACAGCTTCAGAATGGGCGTGGTGGGCAGAGCCGAAGTGAAGGAATGCCTGGCCGAGTACGTGGAAGCCAGCAGAAGAACACTGACCTGGCTGGATACAACCGAGAGCATGGCCGCCAAGATGAGAAGGAAGCTGTTCTGCATCCTGGTGCGGTGCGCCGGCATGCGGGAATCTGGCATGCCTCTGCACCTGTTTACCCTTAAGAGCGGAGGATCTAGCGGCGGCTCTAGCGGATCTGAGACACCTGGCACAAGCGAGTCTGCCACACCTGAGAGTAGCGGCGGATCTTCTGGTGGCTCTGACAAGAAGTACAGCATCGGCCTGGCCATCGGCACCAACTCTGTGGGCTGGGCCGTGATCACCGACGAGTACAAGGTGCCCAGCAAGAAATTCAAGGTGCTGGGCAACACCGACCGGCACAGCATCAAGAAGAACCTGATCGGAGCCCTGCTGTTCGACAGCGGCGAAACAGCCGAGGCCACCCGGCTGAAGAGAACCGCCAGAAGAAGATACACCAGACGGAAGAACCGGATCTGCTATCTGCAAGAGATCTTCAGCAACGAGATGGCCAAGGTGGACGACAGCTTCTTCCACAGACTGGAAGAGTCCTTCCTGGTGGAAGAGGATAAGAAGCACGAGCGGCACCCCATCTTCGGCAACATCGTGGACGAGGTGGCCTACCACGAGAAGTACCCCACCATCTACCACCTGAGAAAGAAACTGGTGGACAGCACCGACAAGGCCGACCTGCGGCTGATCTATCTGGCCCTGGCCCACATGATCAAGTTCCGGGGCCACTTCCTGATCGAGGGCGACCTGAACCCCGACAACAGCGACGTGGACAAGCTGTTCATCCAGCTGGTGCAGACCTACAACCAGCTGTTCGAGGAAAACCCCATCAACGCCAGCGGCGTGGACGCCAAGGCCATCCTGTCTGCCAGACTGAGCAAGAGCAGACGGCTGGAAAATCTGATCGCCCAGCTGCCCGGCGAGAAGAAGAATGGCCTGTTCGGAAACCTGATTGCCCTGAGCCTGGGCCTGACCCCCAACTTCAAGAGCAACTTCGACCTGGCCGAGGATGCCAAACTGCAGCTGAGCAAGGACACCTACGACGACGACCTGGACAACCTGCTGGCCCAGATCGGCGACCAGTACGCCGACCTGTTTCTGGCCGCCAAGAACCTGTCCGACGCCATCCTGCTGAGCGACATCCTGAGAGTGAACACCGAGATCACCAAGGCCCCCCTGAGCGCCTCTATGATCAAGAGATACGACGAGCACCACCAGGACCTGACCCTGCTGAAAGCTCTCGTGCGGCAGCAGCTGCCTGAGAAGTACAAAGAGATTTTCTTCGACCAGAGCAAGAACGGCTACGCCGGCTACATTGACGGCGGAGCCAGCCAGGAAGAGTTCTACAAGTTCATCAAGCCCATCCTGGAAAAGATGGACGGCACCGAGGAACTGCTCGTGAAGCTGAACAGAGAGGACCTGCTGCGGAAGCAGCGGACCTTCGACAACGGCAGCATCCCCCACCAGATCCACCTGGGAGAGCTGCACGCCATTCTGCGGCGGCAGGAAGATTTTTACCCATTCCTGAAGGACAACCGGGAAAAGATCGAGAAGATCCTGACCTTCCGCATCCCCTACTACGTGGGCCCTCTGGCCAGGGGAAACAGCAGATTCGCCTGGATGACCAGAAAGAGCGAGGAAACCATCACCCCCTGGAACTTCGAGGAAGTGGTGGACAAGGGCGCTTCCGCCCAGAGCTTCATCGAGCGGATGACCAACTTCGATAAGAACCTGCCCAACGAGAAGGTGCTGCCCAAGCACAGCCTGCTGTACGAGTACTTCACCGTGTATAACGAGCTGACCAAAGTGAAATACGTGACCGAGGGAATGAGAAAGCCCGCCTTCCTGAGCGGCGAGCAGAAAAAGGCCATCGTGGACCTGCTGTTCAAGACCAACCGGAAAGTGACCGTGAAGCAGCTGAAAGAGGACTACTTCAAGAAAATCGAGTGCTTCGACTCCGTGGAAATCTCCGGCGTGGAAGATCGGTTCAACGCCTCCCTGGGCACATACCACGATCTGCTGAAAATTATCAAGGACAAGGACTTCCTGGACAATGAGGAAAACGAGGACATTCTGGAAGATATCGTGCTGACCCTGACACTGTTTGAGGACAGAGAGATGATCGAGGAACGGCTGAAAACCTATGCCCACCTGTTCGACGACAAAGTGATGAAGCAGCTGAAGCGGCGGAGATACACCGGCTGGGGCAGGCTGAGCCGGAAGCTGATCAACGGCATCCGGGACAAGCAGTCCGGCAAGACAATCCTGGATTTCCTGAAGTCCGACGGCTTCGCCAACAGAAACTTCATGCAGCTGATCCACGACGACAGCCTGACCTTTAAAGAGGACATCCAGAAAGCCCAGGTGTCCGGCCAGGGCGATAGCCTGCACGAGCACATTGCCAATCTGGCCGGCAGCCCCGCCATTAAGAAGGGCATCCTGCAGACAGTGAAGGTGGTGGACGAGCTCGTGAAAGTGATGGGCCGGCACAAGCCCGAGAACATCGTGATCGAAATGGCCAGAGAGAACCAGACCACCCAGAAGGGACAGAAGAACAGCCGCGAGAGAATGAAGCGGATCGAAGAGGGCATCAAAGAGCTGGGCAGCCAGATCCTGAAAGAACACCCCGTGGAAAACACCCAGCTGCAGAACGAGAAGCTGTACCTGTACTACCTGCAGAATGGGCGGGATATGTACGTGGACCAGGAACTGGACATCAACCGGCTGTCCGACTACGATGTGGACCATATCGTGCCTCAGAGCTTTCTGAAGGACGACTCCATCGACAACAAGGTGCTGACCAGAAGCGACAAGAACCGGGGCAAGAGCGACAACGTGCCCTCCGAAGAGGTCGTGAAGAAGATGAAGAACTACTGGCGGCAGCTGCTGAACGCCAAGCTGATTACCCAGAGAAAGTTCGACAATCTGACCAAGGCCGAGAGAGGCGGCCTGAGCGAACTGGATAAGGCCGGCTTCATCAAGAGACAGCTGGTGGAAACCCGGCAGATCACAAAGCACGTGGCACAGATCCTGGACTCCCGGATGAACACTAAGTACGACGAGAATGACAAGCTGATCCGGGAAGTGAAAGTGATCACCCTGAAGTCCAAGCTGGTGTCCGATTTCCGGAAGGATTTCCAGTTTTACAAAGTGCGCGAGATCAACAACTACCACCACGCCCACGACGCCTACCTGAACGCCGTCGTGGGAACCGCCCTGATCAAAAAGTACCCTAAGCTGGAAAGCGAGTTCGTGTACGGCGACTACAAGGTGTACGACGTGCGGAAGATGATCGCCAAGAGCGAGCAGGAAATCGGCAAGGCTACCGCCAAGTACTTCTTCTACAGCAACATCATGAACTTTTTCAAGACCGAGATTACCCTGGCCAACGGCGAGATCCGGAAGCGGCCTCTGATCGAGACAAACGGCGAAACCGGGGAGATCGTGTGGGATAAGGGCCGGGATTTTGCCACCGTGCGGAAAGTGCTGAGCATGCCCCAAGTGAATATCGTGAAAAAGACCGAGGTGCAGACAGGCGGCTTCAGCAAAGAGTCTATCCTGCCCAAGAGGAACAGCGATAAGCTGATCGCCAGAAAGAAGGACTGGGACCCTAAGAAGTACGGCGGCTTCGACAGCCCCACCGTGGCCTATTCTGTGCTGGTGGTGGCCAAAGTGGAAAAGGGCAAGTCCAAGAAACTGAAGAGTGTGAAAGAGCTGCTGGGGATCACCATCATGGAAAGAAGCAGCTTCGAGAAGAATCCCATCGACTTTCTGGAAGCCAAGGGCTACAAAGAAGTGAAAAAGGACCTGATCATCAAGCTGCCTAAGTACTCCCTGTTCGAGCTGGAAAACGGCCGGAAGAGAATGCTGGCCTCTGCCGGCGAACTGCAGAAGGGAAACGAACTGGCCCTGCCCTCCAAATATGTGAACTTCCTGTACCTGGCCAGCCACTATGAGAAGCTGAAGGGCTCCCCCGAGGATAATGAGCAGAAACAGCTGTTTGTGGAACAGCACAAGCACTACCTGGACGAGATCATCGAGCAGATCAGCGAGTTCTCCAAGAGAGTGATCCTGGCCGACGCTAATCTGGACAAAGTGCTGTCCGCCTACAACAAGCACCGGGATAAGCCCATCAGAGAGCAGGCCGAGAATATCATCCACCTGTTTACCCTGACCAATCTGGGAGCCCCTGCCGCCTTCAAGTACTTTGACACCACCATCGACCGGAAGAGGTACACCAGCACCAAAGAGGTGCTGGACGCCACCCTGATCCACCAGAGCATCACCGGCCTGTACGAGACACGGATCGACCTGTCTCAGCTGGGAGGTGACACCAATCTGAGCGACATCATCGAGAAAGAGACAGGCAAGCAGCTGGTCATCCAAGAGTCCATCCTGATGCTGCCTGAAGAGGTGGAAGAAGTGATCGGCAACAAGCCCGAGTCCGACATCCTGGTGCACACCGCCTACGATGAGAGCACCGACGAGAACGTGATGCTGCTGACCTCTGACGCCCCTGAGTACAAGCCTTGGGCTCTCGTGATCCAGGACAGCAACGGCGAGAACAAGATCAAGATGCTGAGCGGCGGCTCTGGTGGCTCTGGCGGATCTACAAACCTGTCCGATATTATTGAGAAAGAAACCGGGAAACAGCTCGTGATTCAAGAGTCTATTCTCATGCTCCCGGAAGAAGTCGAGGAAGTCATTGGAAACAAGCCTGAGAGCGATATTCTGGTCCATACAGCCTACGACGAGTCTACCGATGAGAATGTCATGCTCCTCACCAGCGACGCTCCCGAGTATAAGCCATGGGCACTTGTCATTCAGGACTCCAATGGGGAAAACAAAATCAAAATGCTCCCAAAGAAAAAACGCAAGGTGGAGGGAGCTGATAAGCGCACCGCCGATGGTTCCGAGTTCGAAAGCCCCAAGAAGAAGAGGAAAGTCTAACC

Cytidine deaminase 5 Petromyzon marinus (lamprey) replacing rAPOBEC1
MAGDENVRVSEKLDFDTFEFQFENLHYATERHRTYVIFDVKPQSAGGRSRRLWGYIINNPNVCHAELILMSMIDRHLESNPGVYAMTWYMSWSPCANCSSKLNPWLKNLLEEQGHTLMMHFSRIYDRDREGDHRGLRGLKHVSNSFRMGVVGRAEVKECLAEYVEASRRTLTWLDTTESMAAKMRRKLFCILVRCAGMRESGMPLHLFTLKSGGSSGGSSGSETPGTSESATPESSGGSSGGSDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGDTNLSDIIEKETGKQLVIQESILMLPEEVEEVIGNKPESDILVHTAYDESTDENVMLLTSDAPEYKPWALVIQDSNGENKIKMLSGGSGGSGGSTNLSDIIEKETGKQLVIQESILMLPEEVEEVIGNKPESDILVHTAYDESTDENVMLLTSDAPEYKPWALVIQDSNGENKIKMLPKKKRKVEGADKRTADGSEFESPKKKRK

BTX 448 (CMV-NLS)
TTGATTATTGACTAGTTATTAATAGTAATCAATTACGGGGTCATTAGTTCATAGCCCATATATGGAGTTCCGCGTTACATAACTTACGGTAAATGGCCCGCCTGGCTGACCGCCCAACGACCCCCGCCCATTGACGTCAATAATGACGTATGTTCCCATAGTAACGCCAATAGGGACTTTCCATTGACGTCAATGGGTGGAGTATTTACGGTAAACTGCCCACTTGGCAGTACATCAAGTGTATCATATGCCAAGTACGCCCCCTATTGACGTCAATGACGGTAAATGGCCCGCCTGGCATTATGCCCAGTACATGACCTTATGGGACTTTCCTACTTGGCAGTACATCTACGTATTAGTCATCGCTATTACCATGGTGATGCGGTTTTGGCAGTACATCAATGGGCGTGGATAGCGGTTTGACTCACGGGGATTTCCAAGTCTCCACCCCATTGACGTCAATGGGAGTTTGTTTTGGCACCAAAATCAACGGGACTTTCCAAAATGTCGTAACAACTCCGCCCCATTGACGCAAATGGGCGGTAGGCGTGTACGGTGGGAGGTCTATATAAGCAGAGCTGGTTTAGTGAACCGTCAGATCCGCTAGAGATCCGCGGCCGCTAATACGACTCACTATAGGGAGAGCCGCCACCATGAGCAGCGAGACAGGCCCTGTGGCTGTGGATCCTACACTGCGGAGAAGAATCGAGCCCCACGAGTTCGAGGTGTTCTTCGACCCCAGAGAGCTGCGGAAAGAGACATGCCTGCTGTACGAGATCAACTGGGGCGGCAGACACTCTATCTGGCGGCACACAAGCCAGAACACCAACAAGCACGTGGAAGTGAACTTTATCGAGAAGTTTACGACCGAGCGGTACTTCTGCCCCAACACCAGATGCAGCATCACCTGGTTTCTGAGCTGGTCCCCTTGCGGCGAGTGCAGCAGAGCCATCACCGAGTTTCTGTCCAGATATCCCCACGTGACCCTGTTCATCTATATCGCCCGGCTGTACCACCACGCCGATCCTAGAAATAGACAGGGACTGCGCGACCTGATCAGCAGCGGAGTGACCATCCAGATCATGACCGAGCAAGAGAGCGGCTACTGCTGGCGGAACTTCGTGAACTACAGCCCCAGCAACGAAGCCCACTGGCCTAGATATCCTCACCTGTGGGTCCGACTGTACGTGCTGGAACTGTACTGCATCATCCTGGGCCTGCCTCCATGCCTGAACATCCTGAGAAGAAAGCAGCCTCAGCTGACCTTCTTCACAATCGCCCTGCAGAGCTGCCACTACCAGAGACTGCCTCCACACATCCTGTGGGCCACCGGACTTAAGAGCGGAGGATCTAGCGGCGGCTCTAGCGGATCTGAGACACCTGGCACAAGCGAGTCTGCCACACCTGAGAGTAGCGGCGGATCTTCTGGCGGCTCCGACAAGAAGTACTCTATCGGACTGGCCATCGGCACCAACTCTGTTGGATGGGCCGTGATCACCGACGAGTACAAGGTGCCCAGCAAGAAATTCAAGGTGCTGGGCAACACCGACCGGCACAGCATCAAGAAGAATCTGATCGGCGCCCTGCTGTTCGACTCTGGCGAAACAGCCGAAGCCACCAGACTGAAGAGAACCGCCAGGCGGAGATACACCCGGCGGAAGAACCGGATCTGCTACCTGCAAGAGATCTTCAGCAACGAGATGGCCAAGGTGGACGACAGCTTCTTCCACAGACTGGAAGAGTCCTTCCTGGTGGAAGAGGACAAGAAGCACGAGCGGCACCCCATCTTCGGCAACATCGTGGATGAGGTGGCCTACCACGAGAAGTACCCCACCATCTACCACCTGAGAAAGAAACTGGTGGACAGCACCGACAAGGCCGACCTGAGACTGATCTACCTGGCTCTGGCCCACATGATCAAGTTCCGGGGCCACTTTCTGATCGAGGGCGATCTGAACCCCGACAACAGCGACGTGGACAAGCTGTTCATCCAGCTGGTGCAGACCTACAACCAGCTGTTCGAGGAAAACCCCATCAACGCCTCTGGCGTGGACGCCAAGGCTATCCTGTCTGCCAGACTGAGCAAGAGCAGAAGGCTGGAAAACCTGATCGCCCAGCTGCCTGGCGAGAAGAAGAATGGCCTGTTCGGCAACCTGATTGCCCTGAGCCTGGGACTGACCCCTAACTTCAAGAGCAACTTCGACCTGGCCGAGGATGCCAAACTGCAGCTGAGCAAGGACACCTACGACGACGACCTGGACAATCTGCTGGCCCAGATCGGCGATCAGTACGCCGACTTGTTTCTGGCCGCCAAGAACCTGTCCGACGCCATCCTGCTGAGCGATATCCTGAGAGTGAACACCGAGATCACAAAGGCCCCTCTGAGCGCCTCTATGATCAAGAGATACGACGAGCACCACCAGGATCTGACCCTGCTGAAGGCCCTCGTTAGACAGCAGCTGCCAGAGAAGTACAAAGAGATTTTCTTCGATCAGTCCAAGAACGGCTACGCCGGCTACATTGATGGCGGAGCCAGCCAAGAGGAATTCTACAAGTTCATCAAGCCCATCCTGGAAAAGATGGACGGCACCGAGGAACTGCTGGTCAAGCTGAACAGAGAGGACCTGCTGCGGAAGCAGCGGACCTTCGACAATGGCTCTATCCCTCACCAGATCCACCTGGGAGAGCTGCACGCCATTCTGCGGAGACAAGAGGACTTTTACCCATTCCTGAAGGACAACCGGGAAAAGATCGAGAAGATCCTGACCTTCAGGATCCCCTACTACGTGGGACCACTGGCCAGAGGCAATAGCAGATTCGCCTGGATGACCAGAAAGAGCGAGGAAACCATCACACCCTGGAACTTCGAGGAAGTGGTGGACAAGGGCGCCAGCGCTCAGTCCTTCATCGAGCGGATGACCAACTTCGATAAGAACCTGCCTAACGAGAAGGTGCTGCCCAAGCACTCCCTGCTGTATGAGTACTTCACCGTGTACAACGAGCTGACCAAAGTGAAATACGTGACCGAGGGAATGAGAAAGCCCGCCTTTCTGAGCGGCGAGCAGAAAAAGGCCATTGTGGATCTGCTGTTCAAGACCAACCGGAAAGTGACCGTGAAGCAGCTGAAAGAGGACTACTTCAAGAAAATCGAGTGCTTCGACAGCGTGGAAATCAGCGGCGTGGAAGATCGGTTCAATGCCAGCCTGGGCACATACCACGACCTGCTGAAAATTATCAAGGACAAGGACTTCCTGGACAACGAAGAGAACGAGGACATTCTCGAGGACATCGTGCTGACCCTGACACTGTTTGAGGACAGAGAGATGATCGAGGAACGGCTGAAAACATACGCCCACCTGTTCGACGACAAAGTGATGAAGCAACTGAAGCGGAGGCGGTACACAGGCTGGGGCAGACTGTCTCGGAAGCTGATCAACGGCATCCGGGATAAGCAGTCCGGCAAGACAATCCTGGATTTCCTGAAGTCCGACGGCTTCGCCAACAGAAACTTCATGCAGCTGATCCACGACGACAGCCTGACCTTTAAAGAGGACATCCAGAAAGCCCAGGTGTCCGGCCAAGGCGATTCTCTGCACGAGCACATTGCCAACCTGGCCGGATCTCCCGCCATTAAGAAGGGCATCCTGCAGACAGTGAAGGTGGTGGACGAGCTTGTGAAAGTGATGGGCAGACACAAGCCCGAGAACATCGTGATCGAAATGGCCAGAGAGAACCAGACCACACAGAAGGGCCAGAAGAACAGCCGCGAGAGAATGAAGCGGATCGAAGAGGGCATCAAAGAGCTGGGCAGCCAGATCCTGAAAGAACACCCCGTGGAAAACACCCAGCTGCAGAACGAGAAGCTGTACCTGTACTACCTGCAGAATGGACGGGATATGTACGTGGACCAAGAGCTGGACATCAACCGGCTGAGCGACTACGATGTGGACCATATCGTGCCCCAGAGCTTTCTGAAGGACGACTCCATCGATAACAAGGTCCTGACCAGAAGCGACAAGAACCGGGGCAAGAGCGATAACGTGCCCTCCGAAGAGGTGGTCAAGAAGATGAAGAACTACTGGCGACAGCTGCTGAACGCCAAGCTGATTACCCAGCGGAAGTTCGATAACCTGACCAAGGCCGAGAGAGGCGGCCTGAGCGAACTTGATAAGGCCGGCTTCATTAAGCGGCAGCTGGTGGAAACCCGGCAGATCACCAAACACGTGGCACAGATTCTGGACTCCCGGATGAACACTAAGTACGACGAGAATGACAAGCTGATCCGGGAAGTGAAAGTCATCACCCTGAAGTCTAAGCTGGTGTCCGATTTCCGGAAGGATTTCCAGTTCTACAAAGTGCGGGAAATCAACAACTACCATCACGCCCACGACGCCTACCTGAATGCCGTTGTTGGAACAGCCCTGATCAAGAAGTATCCCAAGCTGGAAAGCGAGTTCGTGTACGGCGACTACAAGGTGTACGACGTGCGGAAGATGATCGCCAAGAGCGAACAAGAGATCGGCAAGGCTACCGCCAAGTACTTTTTCTACAGCAACATCATGAACTTTTTCAAGACAGAGATCACCCTGGCCAACGGCGAGATCCGGAAAAGACCCCTGATCGAGACAAACGGCGAAACCGGGGAGATCGTGTGGGATAAGGGCAGAGATTTTGCCACAGTGCGGAAAGTGCTGAGCATGCCCCAAGTGAATATCGTGAAGAAAACCGAGGTGCAGACAGGCGGCTTCAGCAAAGAGTCTATCCTGCCTAAGCGGAACAGCGATAAGCTGATCGCCAGAAAGAAGGACTGGGACCCTAAGAAGTACGGCGGCTTCGATAGCCCTACCGTGGCCTATTCTGTGCTGGTGGTGGCCAAAGTGGAAAAGGGCAAGTCCAAAAAGCTCAAGAGCGTGAAAGAGCTGCTGGGGATCACCATCATGGAAAGAAGCAGCTTTGAGAAGAACCCGATCGACTTTCTGGAAGCCAAGGGCTACAAAGAAGTCAAGAAGGACCTCATCATCAAGCTCCCCAAGTACAGCCTGTTCGAGCTGGAAAATGGCCGGAAGCGGATGCTGGCCTCAGCAGGCGAACTGCAGAAAGGCAATGAACTGGCCCTGCCTAGCAAATACGTCAACTTCCTGTACCTGGCCAGCCACTATGAGAAGCTGAAGGGCAGCCCCGAGGACAATGAGCAAAAGCAGCTGTTTGTGGAACAGCACAAGCACTACCTGGACGAGATCATCGAGCAGATCAGCGAGTTCTCCAAGAGAGTGATCCTGGCCGACGCTAACCTGGATAAGGTGCTGTCTGCCTATAACAAGCACCGGGACAAGCCTATCAGAGAGCAGGCCGAGAATATCATCCACCTGTTTACCCTGACCAACCTGGGAGCCCCTGCCGCCTTCAAGTACTTCGACACCACCATCGACCGGAAGAGGTACACCAGCACCAAAGAGGTGCTGGACGCCACACTGATCCACCAGTCTATCACCGGCCTGTACGAAACCCGGATCGACCTGTCTCAGCTCGGCGGCGATTCTGGTGGTTCTGGCGGAAGTGGCGGATCCACCAATCTGAGCGACATCATCGAAAAAGAGACAGGCAAGCAGCTCGTGATCCAAGAATCCATCCTGATGCTGCCTGAAGAGGTTGAGGAAGTGATCGGCAACAAGCCTGAGTCCGACATCCTGGTGCACACCGCCTACGATGAGAGCACCGATGAGAACGTCATGCTGCTGACAAGCGACGCCCCTGAGTACAAGCCTTGGGCTCTCGTGATTCAGGACAGCAATGGGGAGAACAAGATCAAGATGCTGAGCGGAGGTAGCGGAGGCAGTGGCGGAAGCACAAACCTGTCTGATATCATTGAAAAAGAAACCGGGAAGCAACTGGTCATTCAAGAGTCCATTCTCATGCTCCCGGAAGAAGTCGAGGAAGTCATTGGAAACAAACCCGAGAGCGATATTCTGGTCCACACAGCCTATGACGAGTCTACAGACGAAAACGTGATGCTCCTGACCTCTGACGCTCCCGAGTATAAGCCCTGGGCACTTGTTATCCAGGACTCTAACGGGGAAAACAAAATCAAAATGTTGTCCGGCGGCAGCAAGCGGACAGCCGATGGATCTGAGTTCGAGAGCCCCAAGAAGAAACGGAAGGTGGAGTGACCGGTCATC

APOBEC1 (Rat)
MSSETGPVAVDPTLRRRIEPHEFEVFFDPRELRKETCLLYEINWGGRHSIWRHTSQNTNKHVEVNFIEKFTTERYFCPNTRCSITWFLSWSPCGECSRAITEFLSRYPHVTLFIYIARLYHHADPRNRQGLRDLISSGVTIQIMTEQESGYCWRNFVNYSPSNEAHWPRYPHLWVRLYVLELYCIILGLPPCLNILRRKQPQLTFFTIALQSCHYQRLPPHILWATGLKSGGSSGGSSGSETPGTSESATPESSGGSSGGSDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGDSGGSGGSGGSTNLSDIIEKETGKQLVIQESILMLPEEVEEVIGNKPESDILVHTAYDESTDENVMLLTSDAPEYKPWALVIQDSNGENKIKMLSGGSGGSGGSTNLSDIIEKETGKQLVIQESILMLPEEVEEVIGNKPESDILVHTAYDESTDENVMLLTSDAPEYKPWALVIQDSNGENKIKMLSGGSKRTADGSEFESPKKKRK

塩基エディターBGX5-D10Aには、オランウータンAPOBEC1、spCas9D10A、CMVプロモーター、およびSV40 NLSが含まれる。BGX27-D10Aは、pmCDA1シチジンデアミナーゼ、spCas9D10A、CMVプロモーター、およびSV40 NLSを含む。BGX29-D10Aは、pmCDA5、spCas9D10A、CMVプロモーターおよびSV40 NLSを含む。BTX448は、rApobec1、spCas9D10A、CMVプロモーターおよびSV40 NLSを含む。

所望により、rAPOBEC1がAPOBEC1 Pongo pygmaeus、シチジンデアミナーゼ1 Petromyzon marinus（ヤツメウナギ）、またはシチジンデアミナーゼ5 Petromyzon marinus（ヤツメウナギ）で置き換えられる。

C→T塩基エディターで使用され得るシチジンデアミナーゼは、例えば、以下のいずれかを含む：

mAPOBEC-1 Mus musculus
MSSETGPVAVDPTLRRRIEPHEFEVFFDPRELRKETCLLYEINWGGRHSVWRHTSQNTSNHVEVNFLEKFTTERYFRPNTRCSITWFLSWSPCGECSRAITEFLSRHPYVTLFIYIARLYHHTDQRNRQGLRDLISSGVTIQIMTEQEYCYCWRNFVNYPPSNEAYWPRYPHLWVKLYVLELYCIILGLPPCLKILRRKQPQLTFFTITLQTCHYQRIPPHLLWATGLK

maAPOBEC-1 Mesocricetus auratus
MSSETGPVVVDPTLRRRIEPHEFDAFFDQGELRKETCLLYEIRWGGRHNIWRHTGQNTSRHVEINFIEKFTSERYFYPSTRCSIVWFLSWSPCGECSKAITEFLSGHPNVTLFIYAARLYHHTDQRNRQGLRDLISRGVTIRIMTEQEYCYCWRNFVNYPPSNEVYWPRYPNLWMRLYALELYCIHLGLPPCLKIKRRHQYPLTFFRLNLQSCHYQRIPPHILWATGFI

hAPOBEC-1 Homo sapiens
MTSEKGPSTGDPTLRRRIEPWEFDVFYDPRELRKEACLLYEIKWGMSRKIWRSSGKNTTNHVEVNFIKKFTSERDFHPSMSCSITWFLSWSPCWECSQAIREFLSRHPGVTLVIYVARLFWHMDQQNRQGLRDLVNSGVTIQIMRASEYYHCWRNFVNYPPGDEAHWPQYPPLWMMLYALELHCIILSLPPCLKISRRWQNHLTFFRLHLQNCHYQTIPPHILLATGLIHPSVAWR

ppAPOBEC-1 Pongo pygmaeus
MTSEKGPSTGDPTLRRRIESWEFDVFYDPRELRKETCLLYEIKWGMSRKIWRSSGKNTTNHVEVNFIKKFTSERRFHSSISCSITWFLSWSPCWECSQAIREFLSQHPGVTLVIYVARLFWHMDQRNRQGLRDLVNSGVTIQIMRASEYYHCWRNFVNYPPGDEAHWPQYPPLWMMLYALELHCIILSLPPCLKISRRWQNHLAFFRLHLQNCHYQTIPPHILLATGLIHPSVTWR

ocAPOBEC1 Oryctolagus cuniculus
MASEKGPSNKDYTLRRRIEPWEFEVFFDPQELRKEACLLYEIKWGASSKTWRSSGKNTTNHVEVNFLEKLTSEGRLGPSTCCSITWFLSWSPCWECSMAIREFLSQHPGVTLIIFVARLFQHMDRRNRQGLKDLVTSGVTVRVMSVSEYCYCWENFVNYPPGKAAQWPRYPPRWMLMYALELYCIILGLPPCLKISRRHQKQLTFFSLTPQYCHYKMIPPYILLATGLLQPSVPWR

hAPOBEC-2 Homo sapiens
MAQKEEAAVATEAASQNGEDLENLDDPEKLKELIELPPFEIVTGERLPANFFKFQFRNVEYSSGRNKTFLCYVVEAQGKGGQVQASRGYLEDEHAAAHAEEAFFNTILPAFDPALRYNVTWYVSSSPCAACADRIIKTLSKTKNLRLLILVGRLFMWEEPEIQAALKKLKEAGCKLRIMKPQDFEYVWQNFVEQEEGESKAFQPWEDIQENFLYYEEKLADILK

ppAPOBEC-2 Pongo pygmaeus
MAQKEEAAAATEAASQNGEDLENLDDPEKLKELIELPPFEIVTGERLPANFFKFQFRNVEYSSGRNKTFLCYVVEAQGKGGQVQASRGYLEDEHAAAHAEEAFFNTILPAFDPALRYNVTWYVSSSPCAACADRIIKTLSKTKNLRLLILVGRLFMWEELEIQDALKKLKEAGCKLRIMKPQDFEYVWQNFVEQEEGESKAFQPWEDIQENFLYYEEKLADILK

btAPOBEC-2 Bos Taurus
MAQKEEAAAAAEPASQNGEEVENLEDPEKLKELIELPPFEIVTGERLPAHYFKFQFRNVEYSSGRNKTFLCYVVEAQSKGGQVQASRGYLEDEHATNHAEEAFFNSIMPTFDPALRYMVTWYVSSSPCAACADRIVKTLNKTKNLRLLILVGRLFMWEEPEIQAALRKLKEAGCRLRIMKPQDFEYIWQNFVEQEEGESKAFEPWEDIQENFLYYEEKLADILK

hAPOBEC-4 Homo sapiens
MEPIYEEYLANHGTIVKPYYWLSFSLDCSNCPYHIRTGEEARVSLTEFCQIFGFPYGTTFPQTKHLTFYELKTSSGSLVQKGHASSCTGNYIHPESMLFEMNGYLDSAIYNNDSIRHIILYSNNSPCNEANHCCISKMYNFLITYPGITLSIYFSQLYHTEMDFPASAWNREALRSLASLWPRVVLSPISGGIWHSVLHSFISGVSGSHVFQPILTGRALADRHNAYEINAITGVKPYFTDVLLQTKRNPNTKAQEALESYPLNNAFPGQFFQMPSGQLQPNLPPDLRAPVVFVLVPLRDLPPMHMGQNPNKPRNIVRHLNMPQMSFQETKDLGRLPTGRSVEIVEITEQFASSKEADEKKKKKGKK

rAPOBEC-4 Rattus norvegicus
MEPLYEEYLTHSGTIVKPYYWLSVSLNCTNCPYHIRTGEEARVPYTEFHQTFGFPWSTYPQTKHLTFYELRSSSGNLIQKGLASNCTGSHTHPESMLFERDGYLDSLIFHDSNIRHIILYSNNSPCDEANHCCISKMYNFLMNYPEVTLSVFFSQLYHTENQFPTSAWNREALRGLASLWPQVTLSAISGGIWQSILETFVSGISEGLTAVRPFTAGRTLTDRYNAYEINCITEVKPYFTDALHSWQKENQDQKVWAASENQPLHNTTPAQWQPDMSQDCRTPAVFMLVPYRDLPPIHVNPSPQKPRTVVRHLNTLQLSASKVKALRKSPSGRPVKKEEARKGSTRSQEANETNKSKWKKQTLFIKSNICHLLEREQKKIGILSSWSV

mfAPOBEC-4 Macaca fascicularis
MEPTYEEYLANHGTIVKPYYWLSFSLDCSNCPYHIRTGEEARVSLTEFCQIFGFPYGTTYPQTKHLTFYELKTSSGSLVQKGHASSCTGNYIHPESMLFEMNGYLDSAIYNNDSIRHIILYCNNSPCNEANHCCISKVYNFLITYPGITLSIYFSQLYHTEMDFPASAWNREALRSLASLWPRVVLSPISGGIWHSVLHSFVSGVSGSHVFQPILTGRALTDRYNAYEINAITGVKPFFTDVLLHTKRNPNTKAQMALESYPLNNAFPGQSFQMTSGIPPDLRAPVVFVLLPLRDLPPMHMGQDPNKPRNIIRHLNMPQMSFQETKDLERLPTRRSVETVEITERFASSKQAEEKTKKKKGKK

使用されたgRNAは、足場配列とトリヌクレオチド反復拡張を有するAR遺伝子のためのスペーサー配列 (標的配列) とを包含する。ゲノムのAR核酸配列のエクソン1の5’末端における塩基編集のための標的配列は、以下の通りであった:
5′-AGTGCAGTTAGGGCTGGGAA -3′ (図80)。

図81および82 A～82 Iに見られるように、使用されたCBEの全てが、図に参照されるgRNAを使用して効率的なC→T塩基編集を提供した。アッセイしたCBEバリアントの全てが、対照と比較して塩基編集活性を有した。

図82 A～82 Iで観察されるように、ガイド9を用いて、標的Cにおいて63%を超える塩基編集が達成された。図83 Aおよび83 Bに示すように、エクソン1に終止コドンを導入するとARの機能的ノックアウトが生じ、そこでは60%を超える編集が観察された。図81および82 A～82 Iに示される結果を生じるために使用されたガイド（Guide）の具体的な配列は以下の通りである。

Guide 8 (U6 through sgRNA scaffold)
TACGTGACGTAGAAAGTAATAATTTCTTGGGTAGTTTGCAGTTTTAAAATTATGTTTTAAAATGGACTATCATATGCTTACCGTAACTTGAAAGTATTTCGATTTCTTGGCTTTATATATCTTGTGGAAAGGACGAAACACCGACTTACCGCATGTCCCCGTAGTTTTAGAGCTAGAAATAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGCACCGAGTCGGTGCTTTTTTT

Guide 9 (U6 through sgRNA scaffold)
TACGTGACGTAGAAAGTAATAATTTCTTGGGTAGTTTGCAGTTTTAAAATTATGTTTTAAAATGGACTATCATATGCTTACCGTAACTTGAAAGTATTTCGATTTCTTGGCTTTATATATCTTGTGGAAAGGACGAAACACCGAGTGCAGTTAGGGCTGGGAAGTTTTAGAGCTAGAAATAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGCACCGAGTCGGTGCTTTTTTT

Guide 10 (U6 through sgRNA scaffold)
TACGTGACGTAGAAAGTAATAATTTCTTGGGTAGTTTGCAGTTTTAAAATTATGTTTTAAAATGGACTATCATATGCTTACCGTAACTTGAAAGTATTTCGATTTCTTGGCTTTATATATCTTGTGGAAAGGACGAAACACCGAAGTGCAGTTAGGGCTGGGAGTTTTAGAGCTAGAAATAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGCACCGAGTCGGTGCTTTTTTT

Guide 11 (U6 through sgRNA scaffold)
TACGTGACGTAGAAAGTAATAATTTCTTGGGTAGTTTGCAGTTTTAAAATTATGTTTTAAAATGGACTATCATATGCTTACCGTAACTTGAAAGTATTTCGATTTCTTGGCTTTATATATCTTGTGGAAAGGACGAAACACCGACCTACCGAGGAGCTTTCCGTTTTAGAGCTAGAAATAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGCACCGAGTCGGTGCTTTTTTT

Guide 12 (U6 through sgRNA scaffold)
TACGTGACGTAGAAAGTAATAATTTCTTGGGTAGTTTGCAGTTTTAAAATTATGTTTTAAAATGGACTATCATATGCTTACCGTAACTTGAAAGTATTTCGATTTCTTGGCTTTATATATCTTGTGGAAAGGACGAAACACCGTTCCAGAGCGTGCGCGAAGGTTTTAGAGCTAGAAATAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGCACCGAGTCGGTGCTTTTTTT

Guide 13 (U6 through sgRNA scaffold)
TACGTGACGTAGAAAGTAATAATTTCTTGGGTAGTTTGCAGTTTTAAAATTATGTTTTAAAATGGACTATCATATGCTTACCGTAACTTGAAAGTATTTCGATTTCTTGGCTTTATATATCTTGTGGAAAGGACGAAACACCGTTTCCAGTTTGGAGACTGCCGTTTTAGAGCTAGAAATAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGCACCGAGTCGGTGCTTTTTTT

Guide 14 (U6 through sgRNA scaffold)
TACGTGACGTAGAAAGTAATAATTTCTTGGGTAGTTTGCAGTTTTAAAATTATGTTTTAAAATGGACTATCATATGCTTACCGTAACTTGAAAGTATTTCGATTTCTTGGCTTTATATATCTTGTGGAAAGGACGAAACACCGTTCCAGTTTGGAGACTGCCAGTTTTAGAGCTAGAAATAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGCACCGAGTCGGTGCTTTTTTT

Guide 15 (U6 through sgRNA scaffold)
TACGTGACGTAGAAAGTAATAATTTCTTGGGTAGTTTGCAGTTTTAAAATTATGTTTTAAAATGGACTATCATATGCTTACCGTAACTTGAAAGTATTTCGATTTCTTGGCTTTATATATCTTGTGGAAAGGACGAAACACCGTCCACCCCAGAAGACCTGCCGTTTTAGAGCTAGAAATAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGCACCGAGTCGGTGCTTTTTTT

使用されたPAM配列はNGG PAM (すなわちspCas9)であり、ここでNはG、A、C、またはTのいずれかであり得る。PAMを太字で示したガイドは以下の通りである：表35において斜体で示したヌクレオチドが編集のために標的化された。

表35 A

表35 B

［ガイド編集データ］
表36～40に参照されるエディターを、指定されたガイドと組み合わせて使用して、上記表35に示されるAR標的ヌクレオチドの編集を行った。

AR遺伝子を編集するために使用された方法は、本明細書に提供される通り、または当業者の知識に基づいて決定され当業者に理解される通りである（例えば、Komor, A.C., et al., “Programmable editing of a target base in genomic DNA without double-stranded DNA cleavage” Nature 533, 420-424 (2016); Gaudelli, N.M., et al., “Programmable base editing of A・T to G・C in genomic DNA without DNA cleavage” Nature 551, 464-471 (2017); Komor, A.C., et al., “Improved base excision repair inhibition and bacteriophage Mu Gam protein yields C:G-to-T:A base editors with higher efficiency and product purity” Science Advances 3:eaao4774 (2017), および Rees, H.A., et al., “Base editing: precision chemistry on the genome and transcriptome of living cells.” Nat Rev Genet. 2018 Dec;19(12):770-788. doi: 10.1038/s41576-018-0059-1参照）。

本明細書に記載される実施例で提供された結果は、以下の材料および方法を用いて得られた。

［クローニング］
標的ポリヌクレオチドならびに使用されるgRNAおよびプライマーのDNA配列は、本明細書中に記載される。gRNAについては、以下のスカフォールド（足場）配列が提示される：GUUUUAGAGC UAGAAAUAGC AAGUUAAAAU AAGGCUAGUC CGUUAUCAAC UUGAAAAAGU GGCACCGAGU CGGUGCUUUU。この足場はNGG PAMのために使用された；上記gRNAは足場配列およびARのためのスペーサー配列（標的配列）を包含する。

PCRはVeraSeq ULtra DNAポリメラーゼ (Enzymatics) またはQ 5ホットスタート高忠実度DNAポリメラーゼ (New England Biolabs) を用いて行った。塩基エディター (BE) プラスミドはUSERクローニング (New England Biolabs) を用いて構築した。デアミナーゼ遺伝子は、gBlocks遺伝子断片 (Integrated DNA Technologies) として合成した。使用したCas9遺伝子は以前に報告されたプラスミドから得られた。デアミナーゼおよび融合遺伝子をpCMV（哺乳類コドン最適化）またはpET28b（E. coliコドン最適化）バックボーン中にクローン化した。部位特異的変異誘発を用いてsgRNA発現プラスミドを構築した。

簡単に説明すると、上述したプライマーを、製造業者の説明書に従ってT4ポリヌクレオチドキナーゼ (New England Biolabs) を用いて5’リン酸化された。次に、製造業者の指示に従って、リン酸化プライマーおよびテンプレートとして目的遺伝子をコードするプラスミド共にQ5ホットスタート高忠実度ポリメラーゼ (New England Biolabs) を用いてPCRを行った。PCR産物をDpnI (20 U、New England Biolabs)とともに37℃で1時間インキュベートし、QIAprepスピンカラム (Qiagen) で精製し、製造業者の指示に従ってQuickLigase (New England Biolabs) を用いてライゲーションした。DNAベクター増幅は、Mach1コンピテント細胞 (ThermoFisher Scientific) を用いて行った。

［塩基エディターの発現と精製］
E. coli BL21 STAR (DE3) コンピテント細胞(ThermoFisher Scientific) をプラスミド（例えば塩基エディターBGX5-D10A、BGX27-D10A、BGX29- D10A、およびBTX 448をコードするプラスミド）で形質転換した。得られた発現株を、100μg ml-1のカナマイシンを含むLuria-Bertani (LB) ブロス中で37℃にて一晩増殖させた。細胞を同じ培地に1:100に希釈し、OD600=～0.6になるまで37℃で増殖させた。培養物を2時間かけて4℃まで冷却し、イソプロピル-β-d-1-チオガラクトピラノシド (IPTG) を0.5 mMで添加して蛋白質発現を誘導した。約16時間後、4,000 gで遠心分離して細胞を集め、溶解緩衝液（50 mMのトリス(ヒドロキシメチル)-アミノメタン（Tris）-HCl (pH 7.5)、1 M NaCl、20% グリセロール、10 mM トリス(2-カルボキシエチル)ホスフィン（TCEP、Soltec Ventures社））に再懸濁した。細胞を超音波処理（20秒パルスオン、20秒パルスオフ、合計8分間、6 W出力）によって溶解し、25,000 gで15分間遠心分離した後、溶解物上清を単離した。溶解物をHis-Purニッケル-ニトロ酢酸 (ニッケル-NTA) 樹脂 (ThermoFisher Scientific) と4℃で1時間インキュベートして、Hisタグ付き融合タンパク質を捕捉した。樹脂をカラムに移し、40 mlの溶解緩衝液で洗浄した。Hisタグ融合タンパク質を、285 mMイミダゾールを補充した溶解緩衝液中で溶出させ、限外濾過(Amicon-Millipore、100 kDaの分子量カットオフ)によって全容量1 mlまで濃縮した。タンパク質を、50 mMトリス(ヒドロキシメチル)-アミノメタン（Tris）-HCl (pH 7.0)、0.1 M NaCl、20%グリセロール、10 mM TCEPを含有する低塩精製緩衝液中で20 mlに希釈し、SPセファロース高速流動樹脂 (GEライフサイエンス) 上にロードした。樹脂をこの低塩緩衝液40 mlで洗浄し、タンパク質を、50 mMトリス(ヒドロキシメチル)-アミノメタン（Tris）-HCl (pH 7.0)、0.5 M NaCl、20%グリセロール、10 mM TCEPを含有する活性緩衝液5 mlで溶出した。溶出したタンパク質をSDS-PAGEで定量した。

［sgRNAのインビトロ転写］
CMVプロモーターに続いてsgRNA標的配列を含む線状DNA断片を、製造業者の指示に従ってトランスクリプトエイドT7高収率転写キット (ThermoFisher Scientific) を用いてインビトロで転写した。sgRNA産物を、製造業者の指示に従ってMEGAclear Kit (ThermoFisher Scientific) を用いて精製し、UV吸光度によって定量した。

［Cy3コンジュゲート化dsDNA基質の調製］
典型的には、非標識配列鎖（例えば80 ntの非標識鎖の配列）は、PAGE精製オリゴヌクレオチドとしてIDTに注文した。各80 nt基質の3’末端に相補的な25 nt Cy3標識プライマーは、HPLC精製オリゴヌクレオチドとしてIDTに注文した。Cy3標識dsDNA基質を生成するために、80 nt鎖 (5μlの100μM溶液) を、dNTP (0.75μlの100 mM溶液) を伴うNEBuffer2 (38.25μlの50 mM NaCl、10 mM Tris-HCl、10 mM MgCl₂、1 mM DTT、pH 7.9溶液、New England Biolabs)中でCy3標識プライマー (5μlの100μM溶液) と組み合わせ、95℃に5分間加熱し、続いて45℃まで0.1℃/秒の率で徐々に冷却した。このアニーリング期間の後、Klenow exo-（5 U, New England Biolabs）を添加し、反応物を37℃で1時間インキュベートした。この溶液を緩衝液PB (250μl、Qiagen)およびイソプロパノール (50μl) で希釈し、QIAprepスピンカラム (Qiagen) で精製し、50μlのTris緩衝液で溶出した。
dsDNAのデアミナーゼアッセイ。精製された融合タンパク質（活性緩衝液中1.9μMを20μl）を1当量の適切なsgRNAと組み合わせ、周囲温度で5分間インキュベートした。Cy3標識dsDNA基質を125 nMの最終濃度まで添加し、得られた溶液を37℃で2時間インキュベートした。dsDNAを緩衝液PB (100μl、Qiagen)およびイソプロパノール (25μl) の添加によって融合体から分離し、EconoSpinマイクロスピンカラム (エポックライフサイエンス) で精製し、20μlのCutSmart緩衝液 (ニューイングランド・バイオラブス) で溶出した。USER酵素(1 U、ニューイングランド・バイオラブス)を、精製され編集されたdsDNAに加え、37℃で1時間インキュベートした。Cy3標識鎖は、5μlの反応溶液と15μlのDMSOベースのローディング緩衝液(5 mM Tris、0.5 mM EDTA、12.5%グリセロール、0.02%ブロモフェノールブルー、0.02%キシレンシアン、80% DMSO)とを組み合わせることによって、その相補鎖から完全に変性分離された。完全長C含有基質を、10% TBE-尿素ゲル (Bio-Rad) 上で、切断されたU含有編集化基質から分離し、GE Amersham Typhoonイメージャ上で画像化した。

［ハイスループット配列決定のためのin vitro編集dsDNAの調製］
オリゴヌクレオチドはIDTから得た。相補配列をトリス緩衝液中で組み合わせ (100μM溶液5μl) 、95℃に5分間加熱することによりアニールし、続いて45℃まで0.1℃/秒の速度で徐冷して60 bpのdsDNA基質を生成した。精製された融合タンパク質 (活性緩衝液中1.9μMを20μl) を1当量の適切なsgRNAと組み合わせ、周囲温度で5分間インキュベートした。60量体dsDNA基質を125 nMの最終濃度で添加し、得られた溶液を37℃で2時間インキュベートした。dsDNAを緩衝液PB (100μl、Qiagen)およびイソプロパノール (25μl) の添加によって融合物から分離し、EconoSpinマイクロスピンカラム (エポックライフサイエンス) 上で20μlのトリス緩衝液で溶出して精製した。得られた編集されたDNA (1μlを鋳型として使用した) を、高スループット配列決定プライマー対およびVeraSeq Ultra (Enzymatics) を用いて、製造業者の説明書に従って、13サイクルの増幅でPCRにより増幅した。PCR反応生成物は、RapidTips (Diffinity Genomics) を用いて精製され、精製されたDNAは、配列決定アダプターを含有するプライマーを用いたPCRによって増幅され、精製され、先に記載されたようにMiSeqハイスループットDNAシーケンサー (Illumina) 上で配列決定された。

［細胞培養］
HEK293T (ATCC CRL-3216)は、10% (v/v) ウシ胎児血清 (FBS) を補充したダルベッコ改変イーグル培地+GlutaMax (ThermoFisher) 中で、37℃、5% CO2で維持した。目的遺伝子（例えばトリヌクレオチド反復拡張を含む変異型AR遺伝子）を含む不死化細胞（Taconic Biosciences）は、10% (v/v) ウシ胎児血清 (FBS) および200μg ml-1ジェネティシン(ThermoFisher Scientific社) を添加したダルベッコ改変イーグル培地+GlutaMax (ThermoFisher Scientific社) 中で培養した。

［トランスフェクション］
HEK293T細胞を48ウェルのコラーゲンコートBioCoatプレート (Corning) 上に播種し、約85%の集密度においてトランスフェクトした。簡単に述べれば、製造業者のプロトコールに従って、ウェル当たり1.5μlのリポフェクタミン2000 (ThermoFisher Scientific) を用いて、750 ngのBEおよび250 ngのsgRNA発現プラスミドをトランスフェクトした。HEK293T細胞は、製造業者の説明書に従って、適切なAmaxa Nucleofector IIプログラムを用いてトランスフェクトした (HEK293T細胞用のプログラムQ-001を用いたVキット)。

［ゲノムDNA試料のハイスループットDNA配列決定］
トランスフェクトされた細胞を3日後に収穫し、Agencourt DNAdvance Genomic DNA Isolation Kit (Beckman Coulter) を製造業者の指示に従って用いて、ゲノムDNAを単離した。関心対象のオンターゲットおよびオフターゲットゲノム領域を、隣接する高スループット配列決定プライマー対を用いたPCRによって増幅した。PCR増幅は、5 ngのゲノムDNAをテンプレートとして用いて、製造業者の指示に従ってPhusion high-fidelity DNAポリメラーゼ(ThermoFisher) を用いて行った。反応が増幅のリニアレンジで止まることを確実にするために、各プライマー対についてサイクル数を別々に決定した。PCR産物はRapidTips (Diffinity Genomics) を用いて精製した。精製されたDNAを、配列決定アダプターを含むプライマーを用いたPCRにより増幅した。生成物をゲル精製し、Quant-iT PicoGreen dsDNAアッセイキット (ThermoFisher) およびKAPA Library Quantification Kit-Illumina (KAPA Biosystems) を用いて定量した。サンプルは、前述のようにイルミナMiSeq上で配列決定した（Pattanayak, Nature Biotechnol. 31, 839-843 (2013)）。

［データ分析］
配列決定リード(reads)をMiSeq Reporter (Illumina) を用いて自動的に脱多重化し、個々のFASTQファイルをカスタムMatlabで解析した。各リードは、Smith-Watermanアルゴリズムを用いて適切な参照配列にペアワイズに整列させた。Qスコアが31未満の塩基コールはNに置き換えられ、従ってヌクレオチド頻度の計算から除外された。この処理により、MiSeq塩基呼び出しエラー率の予測値はおよそ1,000個に1個になりる。リードおよび参照配列がギャップを含まないアラインメント配列をアラインメント表に保存し、そこから各遺伝子座について塩基頻度を一覧にすることができた。インデル頻度は、以前に記載された基準（Zuris, et al., Nature Biotechnol. 33, 73-80 (2015)）を使用してカスタムMatlabスクリプトにより定量した。配列決定リードを走査して、インデルが生じる可能性のあるウィンドウの両側に隣接する二つの10 bp配列との完全一致を探索した。完全一致が見つからなかった場合、そのリードは分析から除外された。このインデル・ウィンドウの長さが参照配列と正確に一致する場合、そのリードはインデルを含まないものとして分類された。インデル・ウィンドウが参照配列よりも2塩基以上長いか短い場合、その配列決定リードは、それぞれ挿入または欠失として分類された。

［実施例１２：アデニン塩基エディター (ABE) またはシチジン塩基エディター (CBE) を用いて、それぞれ、ARポリヌクレオチド内のスプライスアクセプター部位およびスプライスドナー部位を破壊するか、またはAR遺伝子のエクソン1もしくはエクソン2に終止コドンを導入した］
この実施例では、C→T塩基エディター系を用いて、拡張型トリヌクレオチド反復を含む変異AR遺伝子のエクソン1におけるグルタミン (Gln) をコードするCAGコドンに正確なC→T突然変異を導入した。CからTへの塩基変化は、標的「CAG」核酸配列をTAGに変換し、これは、タンパク質の早期終結をもたらす。他の実施形態において、本発明のCBEは、CAAコドンをTAAに、CGAコドンをTGAに、またはTGGコドンをTGA、TAG、もしくはTAAに変化させる。さらに、A→G塩基エディター系を用いて、拡張型トリヌクレオチド反復を含む変異AR遺伝子のエクソン1のスプライスドナー部位に正確なA→G突然変異を導入した。A→G塩基エディター系は、エクソン2の直前のスプライスアクセプター部位に正確なA→G変異を生じさせるためにも用いられた。各例において、塩基編集はHEK293T細胞株において試験された。アデニン塩基エディターおよびシチジン塩基エディターの配列は、実施例11および本出願の種々の段落に記載されている。

ABEを用いて、ARゲノム核酸配列におけるスプライスアクセプター中の「A」核酸塩基を効率的に標的化し、標的部位でA>G変換をすることによって、エクソン2の直前のスプライスアクセプター部位に正確なA→G突然変異を生じさせた。ABE8塩基エディターバリアントすなわちABE8.1～ABE8.14、およびABE7.10と共に、ガイドRNA (gRNA) を用いて、「AG」スプライスアクセプター核酸のアデノシン（「A」）を標的化した（図85）。加えて、CBEを使用して、ARゲノム核酸配列のエクソン1に位置する「C」核酸塩基を効率的に標的化し、標的部位でC>T変換をすることによって、変異体AR遺伝子のエクソン1におけるグルタミン (Gln) をコードするCAGコドンに正確なC→T突然変異を導入した。CBE塩基エディターバリアント（例えばBE4またはBGX5、BGX27、BGX29、BTX448；図84 A、86 A、87 A、および88）と共に、ガイドRNA (gRNA) を用いて、シチジン（「C」）を標的化した。塩基編集をHEK293T細胞株で試験した。

図84 B、86 B、87 B、および89～93は、異なるgRNAを用いて試験されたABEおよびCBE塩基エディターのA→GまたはC→T塩基編集効率を示し、これはPCR産物のディープシークエンシングによって検出されたものである。

表41 AにはgRNA核酸配列およびPAM配列が記載されている。
表41 A

表41 Bでは、いくつかのgRNAおよびABE/CBEについて、標的部位における最高オンターゲット塩基編集が示されている。
表41 B

表42～46では、本明細書に記載されるいくつかの異なるABE8 (またはABE7.10) アデノシン塩基エディター、PVアデノシン塩基エディターまたはCBE (BE 4およびBGXバリアントなど) および異なるsgRNAによって達成された、標的部位および標的部位付近（例えばバイスタンダー）におけるA→GまたはC→T塩基編集のパーセントを対照と比較して示す。

表42：SBMAガイド8

表43：SBMAガイド9

表44：SBMAガイド10

表45：SBMAガイド11

表46：SBMAガイド12

［配列］
以下の配列において、小文字はカナマイシン耐性プロモーター領域を示し、太字の配列は標的化された不活性化部分 (Q4*及びW15*) を示し、斜体の配列はカナマイシン耐性遺伝子の標的化された不活性部位 (D208N) を示し、下線の配列はPAM配列を示す。

不活化カナマイシン耐性遺伝子:

以下の配列において、プレーンテキストはアデノシンデアミナーゼ配列を示し、太字の配列はCas9由来の配列を示し、斜体の配列はリンカー配列を示し、下線付きの配列は二部分核局在化配列を示し、二重下線付きの配列は突然変異を示す。

CP5 (with MSP “NGC” PID and “D10A” nickase):

ABE8.1_Y147T_CP5_NGC PAM_monomer

pNMG-B335 ABE8.1_Y147T_CP5_NGC PAM_monomer

pNMG-357_ABE8.14 with NGC PAM CP5

ABE8.8-m

ABE8.8-d

ABE8.13-m

ABE8.13-d

ABE8.17-m

ABE8.17-d

ABE8.20-m

ABE8.20-d

［他の実施形態］
以上の説明から、本明細書に記載された発明を様々な用途および条件に適合させるために、それに変形および修正を加えることができることは明らかである。そのような実施形態も、下記の特許請求の範囲の範囲内である。

本明細書における可変要素の定義における要素のリストの記載は、リストされた要素のいずれかの単一の要素または組み合わせ（またはサブ組み合わせ）としてのその可変要素の定義を含む。本明細書における一実施形態の記載は、その実施形態を単一実施形態として、または任意の他の実施形態もしくはその一部との組み合わせとして含む。

本明細書に記載されるすべての刊行物、特許、および特許出願は、それぞれの個々の刊行物、特許、または特許出願が参照により組み込まれるように具体的かつ個別に指示された場合と同じ範囲で、参照により本明細書に組み込まれる。別段の表示がない場合、本明細書に記載されている刊行物、特許、および特許出願は、それらの全体が参照により本明細書に組み込まれる。

Claims

必要とする対象において神経障害を治療する方法であって、(i) アデノシン塩基エディターまたはそれをコードする核酸配列と、(ii) ガイドポリヌクレオチドまたはそれをコードする核酸配列とを前記対象に投与することを含み、前記アデノシン塩基エディターはプログラム可能なDNA結合ドメインおよびアデノシンデアミナーゼドメインを含み、
前記ガイドポリヌクレオチドが、前記アデノシン塩基エディターを誘導して前記対象の神経障害に関連する標的遺伝子のスプライス部位において単一核酸塩基の改変をもたらし、それによって対象の前記神経障害を治療する、方法。
前記アデノシンデアミナーゼが、配列番号2における番号付けでアミノ酸位置82もしくは166におけるアミノ酸置換またはそれに対応する置換を含む、請求項1記載の方法。
前記単一核酸塩基の改変が、前記標的遺伝子によってコードされる転写物の代替的スプライシングをもたらす、請求項1または2に記載の方法。
前記代替的スプライシングが、前記標的遺伝子によってコードされる切り詰められたタンパク質または機能しないタンパク質を生成する、請求項1～3のいずれか一項記載の方法。
前記単一核酸塩基の改変が、前記対象における前記標的遺伝子の発現低下をもたらす、請求項1～4のいずれか一項記載の方法。
前記標的遺伝子がスーパーオキシドジスムターゼ1 (SOD1) 遺伝子であり、神経疾患が筋萎縮性側索硬化症 (ALS) である、請求項1～5のいずれか一項記載の方法。
必要とする対象において筋萎縮性側索硬化症 (ALS) を治療する方法であって、前記対象に、 (i) 塩基エディターまたはそれをコードする核酸配列と、(ii)ガイドポリヌクレオチドまたはそれをコードする核酸配列とを投与することを含み、
前記塩基エディターは、プログラム可能なDNA結合ドメインおよびデアミナーゼドメインを含み、
前記ガイドポリヌクレオチドは、前記アデノシン塩基エディターを誘導して前記対象のスーパーオキシドジスムターゼ1 (SOD1) 遺伝子のスプライス部位における単一核酸塩基の改変をもたらし、それによって前記対象のALSを治療する、方法。
必要とする対象において筋萎縮性側索硬化症 (ALS) を治療する方法であって、前記対象に、(i)塩基エディターまたはそれをコードする核酸配列と、(ii) ガイドポリヌクレオチドまたはそれをコードする核酸配列とを投与することを含み、
前記塩基エディターは、プログラム可能なDNA結合ドメインおよびデアミナーゼドメインを含み、
前記ガイドポリヌクレオチドは、前記アデノシン塩基エディターを誘導して前記対象のスーパーオキシドジスムターゼ1 (SOD1) 遺伝子における単一核酸塩基の改変をもたらし、前記単一核酸塩基の改変は、SOD1遺伝子中に未熟な終止コドンをもたらし、それによって前記対象におけるALSを治療する、方法。
前記デアミナーゼが、配列番号2における番号付けでアミノ酸位置8もしくは166におけるアミノ酸置換またはそれに対応する置換を含むアデノシンデアミナーゼである、請求項7または8記載の方法。
前記単一核酸塩基の改変がAからGへの改変である、請求項7～9のいずれか一項記載の方法。
前記単一核酸塩基の改変が、SOD1遺伝子のスプライスアクセプター部位におけるものである、請求項7～10のいずれか一項記載の方法。
前記スプライス部位が、SOD1遺伝子のエクソンの5’におけるスプライスアクセプター部位である、請求項7～11のいずれか一項記載の方法。
SOD1遺伝子の前記エクソンが、配列番号3に対応するエクソン3またはそのバリアントである、請求項7～12のいずれか一項記載の方法。
SOD1遺伝子の前記エクソン3が、配列番号3における番号付けでSOD1ポリヌクレオチド配列またはそのバリアントのヌクレオチド位置6828におけるスプライスアクセプターAGに隣接している、請求項7～13のいずれか一項記載の方法。
SOD1遺伝子の前記エクソンが、配列番号3に対応するエクソン4またはそのバリアントである、請求項7～12のいずれか一項記載の方法。
前記単一核酸塩基の改変が、配列番号3に対応するヒトSOD1遺伝子のエクソン3～5を欠失する転写産物またはそのバリアントを生成する、請求項7～15のいずれか一項に記載の方法。
前記投与後に、前記対象においてSOD1遺伝子の発現が少なくとも40%低下する、請求項7～16のいずれか一項記載の方法。
前記ガイドポリヌクレオチドが、SOD1遺伝子のスプライスアクセプター核酸配列またはスプライスドナー核酸配列に相補的な核酸配列を含む、請求項7～17のいずれか一項記載の方法。
前記ガイドポリヌクレオチドが、表19または表23から選択されるいずれかの核酸配列を含む、請求項7～18のいずれか一項記載の方法。
前記ガイドポリヌクレオチドが、5′-UUAAAGGAAAGUAAUGGACCAGU-3′、5′-UAAAUAGGCUGUACCAGUGCAGG-3′、5′-UUCAUUAUUAGGCAUGUUGGAGA-3′、5′-AAAUAGGCUGUACCAGUGCAGGU-3′、5′-UAUUAGGCAUGUUGGAGACUUGG-3′からなる群より選択される核酸配列を含む、請求項7～19のいずれか一項記載の方法。
前記標的遺伝子がアンドロゲン受容体 (AR) 遺伝子であり、神経疾患が球脊髄性筋萎縮症 (SBMA) である、請求項1～5のいずれか一項記載の方法。
対象における球脊髄性筋萎縮症 (SBMA) を治療する方法であって、 (i) 塩基エディターまたはそれをコードする核酸配列と、(ii) ガイドポリヌクレオチドまたはそれをコードする核酸配列とを前記対象に投与することを含み、
前記塩基エディターは、プログラム可能なDNA結合ドメインおよびデアミナーゼドメインを含み、
前記ガイドポリヌクレオチドは、前記アデノシン塩基エディターを誘導して前記対象のアンドロゲン受容体 (AR) 遺伝子のスプライス部位において単一核酸塩基の改変をもたらし、それによって、前記対象中のSBMAを治療する、方法。
対象における球脊髄性筋萎縮症 (SBMA) を治療する方法であって、 (i) 塩基エディターまたはそれをコードする核酸配列と、(ii) ガイドポリヌクレオチドまたはそれをコードする核酸配列とを前記対象に投与することを含み、
前記アデノシン塩基エディターは、プログラム可能なDNA結合ドメインおよびデアミナーゼドメインを含み、
前記ガイドポリヌクレオチドが、前記アデノシン塩基エディターを誘導して前記対象のアンドロゲン受容体 (AR) 遺伝子において単一核酸塩基の改変をもたらし、前記単一核酸塩基の改変が、前記AR遺伝子における未熟な終止コドンをもたらし、それによって前記対象におけるSBMAを治療する、方法。
前記核酸塩基改変が、AR遺伝子におけるCAG-TAGコドン変化をもたらす、請求項22または23に記載の方法。
前記コドン変化がAR遺伝子のエクソン1またはエクソン2におけるものである、請求項22～24のいずれか一項記載の方法。
前記デアミナーゼが、配列番号2における番号付けでアミノ酸位置82または166におけるアミノ酸置換を含むアデノシンデアミナーゼである、請求項22～25のいずれか一項記載の方法。
前記単一核酸塩基の改変が、AからGへの改変である、請求項22～26のいずれか一項記載の方法。
前記AからGへの核酸塩基の改変がAR遺伝子のスプライスアクセプター部位におけるものである、請求項22～27のいずれか一項記載の方法。
前記スプライス部位が、AR遺伝子のエクソンの5’にあるスプライスアクセプター部位である、請求項22～28のいずれか一項記載の方法。
前記AR遺伝子のエクソンが、配列番号4に対応するエクソン2またはそのバリアントである、請求項22～29のいずれか一項記載の方法。
前記スプライス部位がAR遺伝子のエクソンの3’にあるスプライスドナー部位である、請求項22～28のいずれか一項記載の方法。
AR遺伝子の前記エクソンが、配列番号4に対応するエクソン1またはそのバリアントである、請求項22～28および31のいずれか一項記載の方法。
前記投与の後に対象においてAR遺伝子の発現が少なくとも40%低下する、請求項22～32のいずれか一項記載の方法。
前記ガイドポリヌクレオチドが、AR遺伝子のスプライスアクセプター核酸配列またはスプライスドナー核酸配列に相補的な核酸配列を含む、請求項22～33のいずれか一項に記載の方法。
前記ガイドポリヌクレオチドが、表41 Aまたは41 Bから選択される核酸配列を含む、請求項22～34のいずれか一項記載の方法。
前記ガイドポリヌクレオチドが、5′-ACUUACCGCAUGUCCCCGUAAGG-3′、5′- AGUGCAGUUAGGGCUGGGAAGGG-3′、5′- AAGUGCAGUUAGGGCUGGGAAGG-3′からなる群より選択される核酸配列を含む、請求項22～35のいずれか一項に記載の方法。
前記対象が哺乳動物またはヒトである、請求項1～36のいずれか一項記載の方法。
前記投与が、前記対象の中枢神経系 (CNS) の細胞への送達を通じて行われる、請求項1～37のいずれか一項記載の方法。
前記細胞が運動ニューロンである、請求項1～38のいずれか一項記載の方法。
神経障害に関連する標的遺伝子またはその調節エレメントを改変する方法であって、前記標的遺伝子またはその調節エレメントを、 (i) アデノシン塩基エディターまたはそれをコードする核酸配列、および(ii) ガイドポリヌクレオチドまたはそれをコードする核酸配列と接触させることを含み、前記アデノシン塩基エディターが、プログラム可能なDNA結合ドメインおよびアデノシンデアミナーゼドメインを含み、前記ガイドポリヌクレオチドが、前記アデノシン塩基エディターを誘導して前記標的遺伝子のスプライス部位における単一核酸塩基の改変をもたらす、方法。
前記アデノシンデアミナーゼが、配列番号2における番号付けでアミノ酸位置82または166におけるアミノ酸置換を含む、請求項40記載の方法。
前記単一核酸塩基の改変が、標的遺伝子によってコードされる転写物代替的スプライシング、標的遺伝子によってコードされる切り詰められたおよび/または非機能性のタンパク質、および/または細胞内で発現された場合の標的遺伝子の発現低下をもたらす、請求項40または41に記載の方法。
前記標的遺伝子がスーパーオキシドジスムターゼ1 (SOD1) 遺伝子であり、神経疾患が筋萎縮性側索硬化症 (ALS) である、請求項40～42のいずれか一項記載の方法。
スーパーオキシドジスムターゼ (SOD1) 遺伝子の発現を調節する方法であって、SOD1遺伝子またはその調節エレメントを、 (i) 塩基エディターまたはそれをコードする核酸配列、および (ii) ガイドポリヌクレオチドまたはそれをコードする核酸配列と接触させることを含み、
前記塩基エディターが、プログラム可能なDNA結合ドメインおよびデアミナーゼドメインを含み、前記ガイドポリヌクレオチドが前記アデノシン塩基エディターを誘導してスーパーオキシドジスムターゼ1 (SOD1) 遺伝子のスプライス部位における単一核酸塩基の改変をもたらす、方法。
スーパーオキシドジスムターゼ (SOD1) 遺伝子を改変する方法であって、SOD1遺伝子またはその調節エレメントを、 (i) 塩基エディターまたはそれをコードする核酸配列、および (ii) ガイドポリヌクレオチドまたはそれをコードする核酸配列と接触させることを含み、
前記ガイドポリヌクレオチドは、前記アデノシン塩基エディターを誘導して前記対象のスーパーオキシドジスムターゼ1 (SOD1) 遺伝子における単一核酸塩基の改変をもたらし、前記単一核酸塩基の改変が、SOD1遺伝子において未熟な終止コドンをもたらす、方法。
前記単一核酸塩基の改変が、AからGへの改変である、請求項44または45に記載の方法。
前記核酸塩基の改変が、SOD1遺伝子のスプライスアクセプター部位におけるものである、請求項44～46のいずれか一項に記載の方法。
前記スプライス部位が、SOD1遺伝子のエクソンの5'にあるスプライスアクセプター部位である、請求項44～47のいずれか一項記載の方法。
SOD1遺伝子の前記エクソンが、配列番号3に対応するエクソン3またはそのバリアントである、請求項44～48のいずれか一項記載の方法。
SOD1遺伝子の前記エクソン3が、配列番号3における番号付けでSOD1ポリヌクレオチド配列のヌクレオチド位置6828におけるスプライスアクセプターに隣接している、請求項44～49のいずれか一項記載の方法、またはそのバリアント。
SOD1遺伝子の前記エクソンが、配列番号3に対応するエクソン4またはそのバリアントである、請求項44～48のいずれか一項記載の方法。
前記単一核酸塩基の改変が、配列番号3に対応するSOD1遺伝子のエクソン3～5を欠く転写産物またはそのバリアントを生成する、請求項44～51のいずれか一項に記載の方法。
前記ガイドポリヌクレオチドが、SOD1遺伝子のスプライスアクセプター核酸配列またはスプライスドナー核酸配列に相補的な核酸配列を含む、請求項44～52のいずれか一項記載の方法。
前記ガイドポリヌクレオチドが、表19または表23から選択される核酸配列を含む、請求項44～53のいずれか一項に記載の方法。
前記ガイドポリヌクレオチドが、5′-UUAAAGGAAAGUAAUGGACCAGU-3′、5′-UAAAUAGGCUGUACCAGUGCAGG-3′、5′-UUCAUUAUUAGGCAUGUUGGAGA-3′、5′-AAAUAGGCUGUACCAGUGCAGGU-3′、5′-UAUUAGGCAUGUUGGAGACUUGG-3′からなる群から選択される核酸配列を含む、請求項44～54のいずれか一項記載の方法。
前記標的遺伝子がアンドロゲン受容体 (AR) 遺伝子であり、神経疾患が球脊髄性筋萎縮症 (SBMA) である、請求項40～42のいずれか一項記載の方法。
アンドロゲン受容体 (AR) 遺伝子の発現を調節する方法であって、AR遺伝子またはその調節エレメントを、 (i) 塩基エディターまたはそれをコードする核酸配列、および (ii) ガイドポリヌクレオチドまたはそれをコードする核酸配列と接触させることを含み、
前記塩基エディターは、プログラム可能なDNA結合ドメインおよびデアミナーゼドメインを含み、前記ガイドポリヌクレオチドが前記アデノシン塩基エディターを誘導してアンドロゲン受容体 (AR) 遺伝子のスプライス部位において単一核酸塩基の改変をもたらす、方法。
アンドロゲン受容体 (AR) 遺伝子を改変する方法であって、AR遺伝子またはその調節エレメントを、 (i) 塩基エディターまたはそれをコードする核酸配列、および (ii) ガイドポリヌクレオチドまたはそれをコードする核酸配列、と接触させることを含み、
前記塩基エディターが、プログラム可能なDNA結合ドメインおよびデアミナーゼドメインを含み、前記ガイドポリヌクレオチドが前記アデノシン塩基エディターを誘導して前記対象におけるアンドロゲン受容体 (AR) 遺伝子における単一核酸塩基の改変をもたらし、前記単一核酸塩基の改変が、前記AR遺伝子において未熟な終止コドンを生じさせる、方法。
前記デアミナーゼが、配列番号2における番号付けでアミノ酸位置82または166におけるアミノ酸置換を含むアデノシンデアミナーゼである、請求項57または58記載の方法。
前記デアミナーゼがシチジンデアミナーゼである、請求項57～59のいずれか一項記載の方法。
前記単一核酸塩基の改変が、CからTへの改変である、請求項57～60のいずれか一項記載の方法。
前記核酸塩基の改変が、AR遺伝子におけるCAG-TAGコドン変化をもたらす、請求項57～61のいずれか一項に記載の方法。
前記コドン変化がAR遺伝子のエクソン1またはエクソン2にある、請求項57～62のいずれか一項記載の方法。
前記単一核酸塩基の改変が、AからGへの改変である、請求項57～63のいずれか一項に記載の方法。
AからGへの核酸塩基改変がAR遺伝子のスプライスアクセプター部位におけるものである、請求項57～64のいずれか一項記載の方法。
前記スプライス部位が、AR遺伝子のエクソンの5’にあるスプライスアクセプター部位である、請求項57～65のいずれか一項に記載の方法。
AR遺伝子の前記エクソンが、配列番号4に対応するエクソン2またはそのバリアントである、請求項57～66のいずれか一項記載の方法。
前記スプライス部位がAR遺伝子のエクソンの3’にあるスプライスドナー部位である、請求項57～65のいずれか一項記載の方法。
AR遺伝子の前記エクソンが、配列番号4に対応するエクソン1またはそのバリアントである、請求項57～65および68のいずれか一項記載の方法。
前記ガイドポリヌクレオチドが、表41 Aまたは41 Bから選択される核酸配列を含む、請求項57～69のいずれか一項記載の方法。
前記ガイドポリヌクレオチドが、AR遺伝子のスプライスアクセプター核酸配列またはスプライスドナー核酸配列に相補的な核酸配列を含む、請求項57～70のいずれか一項に記載の方法。
前記ガイドポリヌクレオチドが、表41 Aまたは41 Bから選択される核酸配列を含む、請求項57～71のいずれか一項記載の方法。
前記ガイドポリヌクレオチドが、5′-ACUUACCGCAUGUCCCCGUAAGG-3′、5′- AGUGCAGUUAGGGCUGGGAAGGG-3′、5′- AAGUGCAGUUAGGGCUGGGAAGG-3′、およびその相補鎖からなる群より選択される核酸配列を含む、請求項57～72のいずれか一項に記載の方法。
前記接触が細胞内である、請求項57～73のいずれか一項記載の方法。
前記単一核酸塩基の改変が、細胞のゲノムにおいて15%未満のインデルをもたらす、請求項57～74のいずれか一項記載の方法。
前記単一核酸塩基の改変が、細胞のゲノムにおいて5%未満のインデルをもたらす、請求項57～75のいずれか一項記載の方法。
前記単一核酸塩基の改変が、細胞のゲノムにおいて2%未満のインデルをもたらす、請求項57～76のいずれか一項記載の方法。
前記細胞が哺乳動物細胞またはヒト細胞である、請求項57～77のいずれか一項記載の方法。
前記細胞が中枢神経系細胞である、請求項57～78のいずれか一項記載の方法。
前記細胞が運動ニューロンである、請求項57～79のいずれか一項記載の方法。
前記接触が細胞の集団におけるものである、請求項57～80のいずれか一項記載の方法。
前記接触後に、細胞集団の少なくとも40%が単一核酸塩基の改変を含む、請求項57～81のいずれか一項記載の方法。
前記接触後に、細胞集団の少なくとも50%が単一核酸塩基の改変を含む、請求項57～82のいずれか一項記載の方法。
前記接触後に、細胞集団の少なくとも60%が単一核酸塩基の改変を含む、請求項57～83のいずれか一項記載の方法。
前記接触後に、細胞集団の少なくとも85%が生存可能である、請求項57～84のいずれか一項記載の方法。
前記細胞の集団が哺乳動物細胞またはヒト細胞である、請求項57～85のいずれか一項記載の方法。
前記細胞の集団が中枢神経系細胞である、請求項57～86のいずれか一項記載の方法。
前記細胞の集団が運動ニューロンである、請求項57～87のいずれか一項記載の方法。
前記アデノシンデアミナーゼがTadAデアミナーゼを含む、請求項1～88のいずれか一項記載の方法。
前記アデノシンデアミナーゼがTadA7.10である、請求項89記載の方法。
前記アデノシンデアミナーゼが、配列番号2における番号付けでV28S変異もしくはT166R変異またはそれに対応する変異を含むTadAである、請求項89または90記載の方法。
前記アデノシンデアミナーゼが、配列番号2における番号付けでY147T、Y147R、Q154S、Y123H、およびQ154R、またはそれらに対応する変異のうちの1つ以上の変異を含む、請求項89～91のいずれか一項記載の方法。
前記アデノシンデアミナーゼが、配列番号2における番号付けでY147T + Q154R; Y147T + Q154S; Y147R + Q154S; V82S + Q154S; V82S + Y147R; V82S + Q154R; V82S + Y123H; I76Y + V82S; V82S + Y123H + Y147T; V82S + Y123H + Y147R; V82S + Y123H + Q154R; Y147R + Q154R +Y123H; Y147R + Q154R + I76Y; Y147R + Q154R + T166R; Y123H + Y147R + Q154R + I76Y; V82S + Y123H + Y147R + Q154R; およびI76Y + V82S + Y123H + Y147R + Q154Rからなる群より選択される変異の組合せまたはそれらの対応する変異を含む、請求項89～92のいずれか一項記載の方法。
前記アデノシンデアミナーゼが、149、150、151、152、153、154、155、156、および157からなる群より選択される残基で始まるC末端の欠失を含む、請求項89～93のいずれか一項記載の方法。
前記アデノシンデアミナーゼがTadAダイマーを含む、請求項89～94のいずれか一項記載の方法。
前記アデノシンデアミナーゼがアデノシンデアミナーゼモノマーを含む、請求項89～95のいずれか一項記載の方法。
前記ポリヌクレオチドによりプログラム可能なDNA結合ドメインがCas9ドメインである、請求項1～96のいずれか一項に記載の方法。
前記Cas9ドメインがCas9ニッカーゼドメインである、請求項97記載の方法。
前記Cas9ドメインがSpCas9ドメインを含む、請求項97または98に記載の方法。
前記SpCas9ドメインが、配列番号1における番号付けでD10Aおよび/またはH840Aアミノ酸置換またはそれに対応するアミノ酸置換を含む、請求項97～99のいずれか一項記載の方法。
前記Cas9ドメインがSaCas9ドメインを含む、請求項97～100のいずれか一項記載の方法。
前記Cas9ドメインが、改変されたPAMに対する特異性を有する、請求項97～101のいずれか一項記載の方法。
前記Cas9ドメインが、NGG、NGA、NGCG、NGN、NNGRRT、NNNRRT、NGCG、NGCN、NGTN、およびNGCからなる群から選択されるPAM配列に対する特異性を有し、ここでNはA、G、C、またはTであり、RはAまたはGである、請求項97～102のいずれか一項に記載の方法。
請求項1～103のいずれか一項によって産生される細胞の集団。
(i) 塩基エディターまたはそれをコードする核酸配列と、 (ii) ガイドポリヌクレオチドまたはそれをコードする核酸配列とを含む、塩基エディターシステムであって、
前記塩基エディターは、プログラム可能なDNA結合ドメインおよびデアミナーゼドメインを含み、
前記ガイドポリヌクレオチドは、前記アデノシン塩基エディターを誘導してスーパーオキシドジスムターゼ1 (SOD1) のスプライス部位における単一核酸塩基の改変をもたらす、
塩基エディターシステム。
(i) 塩基エディターまたはそれをコードする核酸配列と、 (ii) ガイドポリヌクレオチドまたはそれをコードする核酸配列とを含む、塩基エディターシステムであって、
前記塩基エディターは、プログラム可能なDNA結合ドメインおよびデアミナーゼドメインを含み、
前記ガイドポリヌクレオチドが前記アデノシン塩基エディターを誘導してスーパーオキシドジスムターゼ1 (SOD1) 遺伝子における単一核酸塩基の改変をもたらし、前記単一核酸塩基の改変がSOD1遺伝子において未熟な終止コドンをもたらす、
塩基エディターシステム。
前記デアミナーゼが、配列番号2における番号付けでアミノ酸位置82または166におけるアミノ酸置換を含むアデノシンデアミナーゼである、請求項105または106に記載の塩基エディターシステム。
前記デアミナーゼがシチジンデアミナーゼである、請求項105～107のいずれか一項記載の塩基エディターシステム。
前記単一核酸塩基の改変が、AからGへの改変である、請求項105～108のいずれか一項に記載の塩基エディターシステム。
前記AからGへの核酸塩基の改変が、SOD1遺伝子のスプライスアクセプター部位におけるものである、請求項105～109のいずれか一項に記載の塩基エディターシステム。
前記スプライス部位が、SOD1遺伝子のエクソンの5’にあるスプライスアクセプター部位である、請求項105～110のいずれか一項に記載の塩基エディターシステム。
SOD1遺伝子の前記エクソンが、配列番号3に対応するエクソン3またはそのバリアントである、請求項105～111のいずれか一項に記載の塩基エディターシステム。
SOD1遺伝子の前記エクソン3が、配列番号3における番号付けでSOD1ポリヌクレオチド配列のヌクレオチド位置6828におけるスプライスアクセプターAGまたはそのバリアントに隣接している、請求項105～112のいずれか一項に記載の塩基エディターシステム。
SOD1転写物の代替的スプライシングが、配列番号3に対応するSOD1遺伝子のエクソン3～5を欠失する転写産物またはそのバリアントを生成する、請求項105～113のいずれか一項に記載の塩基エディターシステム。
SOD1遺伝子の前記エクソンが、配列番号3に対応するエクソン4またはそのバリアントである、請求項105～111のいずれか一項に記載の塩基エディターシステム。
前記ガイドポリヌクレオチドが、SOD1遺伝子のスプライスアクセプター核酸配列またはスプライスドナー核酸配列に相補的な核酸配列を含む、請求項105～115のいずれか一項記載の塩基エディターシステム。
前記ガイドポリヌクレオチドが、表19または表23から選択される核酸配列を含む、請求項105～116のいずれか一項に記載の塩基エディターシステム。
前記ガイドポリヌクレオチドが、5′-UUAAAGGAAAGUAAUGGACCAGU-3′、5′-UAAAUAGGCUGUACCAGUGCAGG-3′、5′-UUCAUUAUUAGGCAUGUUGGAGA-3′、5′-AAAUAGGCUGUACCAGUGCAGGU-3′、5′-UAUUAGGCAUGUUGGAGACUUGG-3′、およびその相補配列からなる群から選択される核酸配列を含む、請求項105～117のいずれか一項に記載の塩基エディターシステム。
(i) 塩基エディターまたはそれをコードする核酸配列と、 (ii) ガイドポリヌクレオチドまたはそれをコードする核酸配列とを含む、塩基エディターシステムであって、
前記塩基エディターは、プログラム可能なDNA結合ドメインおよびデアミナーゼドメインを含み、
前記ガイドポリヌクレオチドが前記アデノシン塩基エディターを誘導してアンドロゲン受容体 (AR) 遺伝子のスプライス部位において単一核酸塩基の改変をもたらす、塩基エディターシステム。
(i) 塩基エディターまたはそれをコードする核酸配列と、(ii) ガイドポリヌクレオチドまたはそれをコードする核酸配列とを含む、塩基エディターシステムであって、
前記アデノシン塩基エディターは、プログラム可能なDNA結合ドメインおよびデアミナーゼドメインを含み、
前記ガイドポリヌクレオチドが前記アデノシン塩基エディターを誘導して対象中のアンドロゲン受容体 (AR) 遺伝子における単一核酸塩基の改変をもたらし、前記単一核酸塩基の改変が、AR遺伝子において未熟な終止コドンを生じさせる、塩基エディターシステム。
前記デアミナーゼが、配列番号2における番号付けでアミノ酸位置82または166におけるアミノ酸置換を含むアデノシンデアミナーゼである、請求項119または120に記載の塩基エディターシステム。
前記デアミナーゼがシチジンデアミナーゼである、請求項119～121のいずれか一項記載の塩基エディターシステム。
前記単一核酸塩基の改変が、CからTへの改変である、請求項119～122のいずれか一項記載の塩基エディターシステム。
前記単一核酸塩基の改変が、AR遺伝子におけるCAG-TAGコドン変化をもたらす、請求項119～123のいずれか一項に記載の塩基エディターシステム。
前記コドン変化が、配列番号4に対応するAR遺伝子のエクソン1もしくはエクソン2またはそのバリアントである、請求項119～124のいずれか一項に記載の塩基エディターシステム。
前記単一核酸塩基の改変がAからGへの改変である、請求項119～125のいずれか一項記載の塩基エディターシステム。
前記AからGへの核酸塩基の改変が、AR遺伝子のスプライスアクセプター部位におけるものである、請求項119～126のいずれか一項に記載の塩基エディターシステム。
前記スプライス部位が、AR遺伝子のエクソンの5’にあるスプライスアクセプター部位である、請求項119～127のいずれか一項に記載の塩基エディターシステム。
AR遺伝子の前記エクソンが、配列番号4に対応するエクソン2またはそのバリアントである、請求項119～128のいずれか一項に記載の塩基エディターシステム。
前記スプライス部位が、AR遺伝子のエクソンの3’にあるスプライスドナー部位である、請求項119～127のいずれか一項に記載の塩基エディターシステム。
AR遺伝子の前記エクソンが、配列番号4に対応するエクソン1またはそのバリアントである、請求項119～127および130のいずれか一項に記載の塩基エディターシステム。
前記ガイドポリヌクレオチドが、AR遺伝子のスプライスアクセプター核酸配列またはスプライスドナー核酸配列に相補的な核酸配列を含む、請求項119～131のいずれか一項記載の塩基エディターシステム。
前記ガイドポリヌクレオチドが、表41 Aまたは41 Bから選択される核酸配列を含む、請求項119～132のいずれか一項に記載の塩基エディターシステム。
前記ガイドポリヌクレオチドが、5′-ACUUACCGCAUGUCCCCGUAAGG-3′、5′- AGUGCAGUUAGGGCUGGGAAGGG-3′、5′- AAGUGCAGUUAGGGCUGGGAAGG-3′、およびその相補鎖からなる群から選択される核酸配列を含む、請求項119～133のいずれか一項に記載の塩基エディターシステム。
前記アデノシンデアミナーゼがTadAデアミナーゼを含む、請求項105～134のいずれか一項記載の塩基エディターシステム。
前記アデノシンデアミナーゼがTadA7.10である、請求項135記載の塩基エディターシステム。
前記アデノシンデアミナーゼが、配列番号2における番号付けでV28S変異もしくはT166R突然変異またはそれらに対応する変異を含むTadAである、請求項135または136に記載の塩基エディターシステム。
前記アデノシンデアミナーゼが、配列番号2における番号付けでY147T、Y147R、Q154S、Y123H、およびQ154Rのうちの1つ以上またはそれらに対応する変異を含む、請求項135～137のいずれか一項に記載の塩基エディターシステム。
前記アデノシンデアミナーゼが、配列番号2における番号付けでY147T + Q154R; Y147T + Q154S; Y147R + Q154S; V82S + Q154S; V82S + Y147R; V82S + Q154R; V82S + Y123H; I76Y + V82S; V82S + Y123H + Y147T; V82S + Y123H + Y147R; V82S + Y123H + Q154R; Y147R + Q154R +Y123H; Y147R + Q154R + I76Y; Y147R + Q154R + T166R; Y123H + Y147R + Q154R + I76Y; V82S + Y123H + Y147R + Q154R; およびI76Y + V82S + Y123H + Y147R + Q154Rからなる群より選択される変異の組合せまたはそれらに対応する変異を含む、請求項135～138のいずれか一項記載の塩基エディターシステム
前記アデノシンデアミナーゼが、149、150、151、152、153、154、155、156および157からなる群より選択される残基で始まるC末端の欠失を含む、請求項135～139のいずれか一項記載の塩基エディターシステム。
前記アデノシンデアミナーゼがTadAダイマーを含む、請求項135～140のいずれか一項記載の塩基エディターシステム。
前記アデノシンデアミナーゼがアデノシンデアミナーゼモノマーを含む、請求項135～141のいずれか一項記載の塩基エディターシステム。
前記ポリヌクレオチドによりプログラム可能なDNA結合ドメインがCas9ドメインである、請求項105～142のいずれか一項に記載の塩基エディターシステム。
前記Cas9ドメインがCas9ニッカーゼドメインである、請求項143に記載の塩基エディターシステム。
前記Cas9ドメインがSpCas9ドメインを含む、請求項143または144に記載の塩基エディターシステム。
前記SpCas9ドメインが、配列番号1における番号付けでD10Aおよび/またはH840Aアミノ酸置換またはそれらに対応するアミノ酸置換を含む、請求項143～145のいずれか一項記載の塩基エディターシステム。
前記Cas9ドメインがSaCas9ドメインを含む、請求項143～146のいずれか一項記載の塩基エディターシステム。
前記Cas9ドメインが、改変されたPAMに対する特異性を有する、請求項105～147のいずれか一項に記載の塩基エディターシステム。
前記Cas9ドメインが、NGG、NGA、NGCG、NGN、NNGRRT、NNNRRT、NGCG、NGCN、NGTN、およびNGCからなる群から選択されるPAM配列に対する特異性を有し、ここでNはA、G、C、またはTであり、RはAまたはGである、請求項143～148のいずれか一項に記載の塩基エディターシステム。
請求項105～149のいずれか一項に記載の塩基エディターシステムにおける前記ポリヌクレオチドによりプログラム可能なDNA結合ドメインをコードする核酸配列と、前記アデノシンデアミナーゼドメインをコードする核酸配列とを含む、ベクター。
前記ガイドポリヌクレオチドをコードする核酸配列をさらに含む、請求項150に記載のベクター。
前記ベクターがウイルスベクターである、請求項150または151に記載のベクター。
請求項105～149のいずれか一項に記載の塩基エディターシステムまたは請求項150～152のいずれか一項に記載のベクターを含む、細胞。
前記細胞が哺乳動物細胞、ヒト細胞、または運動ニューロンである、請求項153に記載の細胞。
前記細胞がインビボ、エクスビボ、またはインビトロである、請求項153または154記載の細胞。
前記細胞が、対象から単離された自己細胞である、請求項153～155のいずれか一項記載の細胞。
前記細胞が同種異系細胞である、請求項153～156のいずれか一項記載の細胞。
請求項105～149のいずれか一項に記載の塩基エディターシステムまたは請求項150～152のいずれか一項に記載のベクターを含む、細胞の集団。
哺乳動物細胞、ヒト細胞、または運動ニューロンである、請求項158記載の細胞の集団。
インビボ、エクスビボ、またはインビトロである、請求項158または159記載の細胞の集団。
細胞が対象から単離された自己細胞である、請求項158～160のいずれか一項記載の細胞の集団。
請求項105～149のいずれか一項記載の塩基エディターシステム、請求項150～152のいずれか一項記載のベクター、請求項153～157のいずれか一項記載の細胞、または請求項158～161のいずれか一項記載の細胞の集団と、薬学的に許容される担体とを含む、医薬組成物。
脂質をさらに含む、請求項162記載の医薬組成物。
ウイルスをさらに含む、請求項162記載の医薬組成物。
請求項105～149のいずれか一項記載の塩基エディターシステムまたは請求項150～152のいずれか一項記載のベクターを含む、キット。
前記ガイドポリヌクレオチドの少なくとも1つのヌクレオチドが非天然修飾を含む、前記請求項のいずれか一項に記載の方法。
前記核酸配列の少なくとも一つのヌクレオチドが非天然修飾を含む、請求項20、36、55または73のいずれか一項に記載の方法。
前記核酸配列の少なくとも一つのヌクレオチドが非天然修飾を含む、請求項118または134のいずれか一項に記載の塩基エディターシステム。