JP2022519761A

JP2022519761A - アルファ－１アンチトリプシン不全を治療するための組成物および方法

Info

Publication number: JP2022519761A
Application number: JP2021546890A
Authority: JP
Inventors: ニコルゴーデッリ、; マイケルパッカー、; ベルンドゼッツェ、; イアンスレイメイカー、; イユ、; デイビッドエー．ボーン、; スン―ジュイ、
Original assignee: ビームセラピューティクスインク．
Priority date: 2019-02-13
Filing date: 2020-02-13
Publication date: 2022-03-24
Also published as: CN114072180A; EP3923994A1; WO2020168135A1; AU2020223314A1; US20230101597A1; CA3128878A1; KR20210126680A; EP3923994A4

Abstract

本発明は、アルファ-1アンチトリプシン（A1AT）不全と関連する有害な突然変異を編集するための組成物および方法を特徴とする。特定の実施形態では、本発明は、異例なレベルの効率性を有する、アデノシンデアミナーゼ塩基エディター、ABE8を用いて、A1ATポリヌクレオチド中の突然変異を修正するための方法を提供する。

Description

関連出願の相互参照
本出願は、2019年2月13日に出願された米国仮特許出願第62/805,238号；2019年2月13日に出願された第62/805,271号；2019年5月23日に出願された第62/852,224号；2019年5月23日に出願された第62/852,228号；2019年11月6日に出願された第62/931,722号；2019年11月27日に出願された第62/941,569号；および2020年1月27日に出願された第62/966,526号の利益を主張する国際PCT出願であり、これらの文献の内容全体が参照により本明細書に組み込まれる。

参照による組み込み
本明細書において言及するすべての刊行物、特許および特許出願は、各個々の刊行物、特許または特許出願が、具体的にかつ個々に、参照により本明細書に組み込まれると示されるのと同じ度合いまで、参照により本明細書に組み込まれる。別に指示のない限り、本明細書で言及する刊行物、特許および特許出願は、その全体が参照により本明細書に組み込まれる。

健康な個体において、アルファ-1アンチトリプシン（A1AT）は、肝臓内の肝細胞によって産生され、全身循環内に分泌されて、そこでプロテアーゼ阻害剤として機能する。A1ATは、好中球エラスターゼの特に優れた阻害剤であり、従って、組織および肺などの臓器をエラスチン分解から保護する。アルファ-1アンチトリプシン不全（A1AD）の患者では、A1ATをコードする遺伝子中に突然変異があり、これにより、タンパク質産生が減少している。

その結果、肺中のエラスチンは、好中球エラスターゼによってより容易に分解され、長期に渡ると、肺の弾力性が損なわれて、慢性閉塞性肺疾患（COPD）に発展する。

最も一般的な病原性A1ATバリアントは、アミノ酸342でグルタミン酸からリジンへの置換を生じる、グアニンからアデニンへの突然変異である。この置換は、肝細胞内で、タンパク質をミスフォールディングさせて重合させ、最終的には毒性凝集物が肝損傷および肝硬変を引き起こし得る。肝毒性は、遺伝子ノックアウト（CRISPR/ZFN/TALEN）または遺伝子ノックダウン（siRNA）によって対処可能であるが、いずれのアプローチも肺病理には対処しない。肺病理は、タンパク質置換療法で対処可能であるが、この療法はまた、肝毒性に対処できない。遺伝子療法はまた、A1AT遺伝子欠損に対処するには不適当であろう。A1AD患者の肝臓は、すでに、内因性A1ATによって引き起こされる重度の疾患の負荷下にあるため、肝臓においてA1ATを増加させる遺伝子療法は、逆効果であろう。

従って、肺病理および肝毒性の両方に対処する、A1AD患者の治療法に関する必要性がある。

以下に記載するように、本発明は、アルファ-1アンチトリプシン不全（A1AD）と関連する有害な突然変異を編集するための組成物および方法を特徴とする。特定の実施形態では、本発明は、A1ADと関連する突然変異を修正するため、異例なレベル（例えば＞60～70%）の効率性および特異性を有する、「ABE8」と称される改変アデノシンデアミナーゼを用いる、A1AD治療法を提供する。

一態様において、本発明は、アルファ-1アンチトリプシン不全と関連する一塩基多型（SNP）を含有するアルファ-1アンチトリプシンポリヌクレオチドを編集する方法であって、このポリヌクレオチドと、1つ以上のガイドRNA、ならびにポリヌクレオチドプログラム可能DNA結合ドメインおよび
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPRQVFNAQKKAQSSTD
のアミノ酸82位または166位で改変を含有するアデノシンデアミナーゼバリアントである少なくとも1つの塩基エディタードメインを含有する塩基エディターを接触させる工程を含み、前記ガイドRNAが前記塩基エディターをターゲティング（標的指向化）してアルファ-1アンチトリプシン不全と関連するSNPの改変をもたらす、前記方法を提供する。

別の態様では、本発明は、アルファ-1アンチトリプシン不全と関連する一塩基多型（SNP）を含有するアルファ-1アンチトリプシンポリヌクレオチドを編集する方法であって、1つ以上のガイドRNA、ならびに以下の配列：

（太字配列はCas9由来の配列を示し、斜字配列はリンカー配列を示し、下線配列は二部分（bipartite）核局在化配列を示す）を含有するポリヌクレオチドプログラム可能DNA結合ドメインおよび
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPRQVFNAQKKAQSSTD
のアミノ酸82位または166位で改変を含有するアデノシンデアミナーゼバリアントを含有する少なくとも1つの塩基エディタードメインを含有する融合タンパク質を接触させる工程を含む、前記方法を提供する。

別の態様では、本発明は、先の態様いずれかの融合タンパク質および
5’-ACCAUCGACAAGAAAGGGACUGA GUUUUAGAGC UAGAAAUAGC AAGUUAAAAU AAGGCUAGUC CGUUAUCAAC UUGAAAAAGU GGCACCGAGU CGGUGCUUUU-3’
5’-CCAUCGACAAGAAAGGGACUGA GUUUUAGAGC UAGAAAUAGC AAGUUAAAAU AAGGCUAGUC CGUUAUCAAC UUGAAAAAGU GGCACCGAGU CGGUGCUUUU-3’
5’-CAUCGACAAGAAAGGGACUGA GUUUUAGAGC UAGAAAUAGC AAGUUAAAAU AAGGCUAGUC CGUUAUCAAC UUGAAAAAGU GGCACCGAGU CGGUGCUUUU-3’
5’-AUCGACAAGAAAGGGACUGA GUUUUAGAGC UAGAAAUAGC AAGUUAAAAU AAGGCUAGUC CGUUAUCAAC UUGAAAAAGU GGCACCGAGU CGGUGCUUUU-3’
5’-UCGACAAGAAAGGGACUGA GUUUUAGAGC UAGAAAUAGC AAGUUAAAAU AAGGCUAGUC CGUUAUCAAC UUGAAAAAGU GGCACCGAGU CGGUGCUUUU-3’
5’-CGACAAGAAAGGGACUGA GUUUUAGAGC UAGAAAUAGC AAGUUAAAAU AAGGCUAGUC CGUUAUCAAC UUGAAAAAGU GGCACCGAGU CGGUGCUUUU-3’
より選択される核酸配列を含有するガイドRNAを含有する塩基編集システムを提供する。

別の態様では、細胞内に以下：
前記細胞に対する、塩基エディターまたは前記塩基エディターをコードするポリヌクレオチドであって、塩基エディターがポリヌクレオチドプログラム可能DNA結合ドメインおよび先の態様いずれかに記載するアデノシンデアミナーゼを含有する、前記塩基エディターまたはポリヌクレオチド；および塩基エディターをターゲティングしてアルファ-1アンチトリプシン不全と関連するSNPのA・TからG・Cへの改変をもたらす1つ以上のガイドポリヌクレオチド
を導入することによって産生された細胞またはその前駆細胞を提供する。一実施形態では、産生される細胞は、肝細胞またはその前駆細胞である。別の実施形態では、細胞は、アルファ-1アンチトリプシン不全を有する対象由来である。別の実施形態では、細胞は哺乳動物細胞またはヒト細胞である。

上記態様の多様な実施形態では、gRNAは、核酸配列5’- GUUUUAGAGC UAGAAAUAGC AAGUUAAAAU AAGGCUAGUC CGUUAUCAAC UUGAAAAAGU GGCACCGAGU CGGUGCUUUU-3をさらに含有する。

さらに別の態様では、本発明は、対象において、アルファ-1アンチトリプシン不全を治療する方法であって、前記対象に、前記態様いずれかの細胞を投与する工程を含む、前記方法を提供する。一実施形態では、細胞は、前記対象に対して自己または同種である。

さらに別の態様では、本発明は、上に列挙する態様および実施形態の細胞から増殖したかまたは拡張された、単離細胞または細胞集団を提供する。

さらに別の態様では、本発明は、肝細胞を産生する方法であって：（a）アルファ-1アンチトリプシン不全と関連するSNPを含有する肝細胞内に、塩基エディター、または前記塩基エディターをコードするポリヌクレオチドであって、前記塩基エディターが、ポリヌクレオチドプログラム可能ヌクレオチド結合ドメイン、ならびに上記態様および実施形態のいずれか1つに記載するアデノシンデアミナーゼバリアントドメインを含む、前記塩基エディターまたはポリヌクレオチド；ならびに1つ以上のガイドポリヌクレオチドを導入する工程を含み、前記の1つ以上のガイドポリヌクレオチドが、前記塩基エディターをターゲティングしてアルファ-1アンチトリプシン不全と関連するSNPのA・TからG・Cへの改変をもたらす、前記方法を提供する。

多様な実施形態では、肝細胞は哺乳動物細胞またはヒト細胞である。

上記態様の他の実施形態では、アデノシンデアミナーゼバリアントは、アミノ酸82位および166位に改変を含む。上記態様の他の実施形態では、アデノシンデアミナーゼバリアントは、V82S改変を含む。上記態様の他の実施形態では、アデノシンデアミナーゼバリアントは、T166R改変を含む。上記態様の他の実施形態では、アデノシンデアミナーゼバリアントは、V82SおよびT166R改変を含む。上記態様の他の実施形態では、アデノシンデアミナーゼバリアントは、以下の改変：Y147T、Y147R、Q154S、Y123H、およびQ154Rの1つ以上をさらに含む。上記態様の他の実施形態では、アデノシンデアミナーゼバリアントは、以下の改変：Y147T + Q154R; Y147T + Q154S; Y147R + Q154S; V82S + Q154S; V82S + Y147R; V82S + Q154R; V82S + Y123H; I76Y + V82S; V82S + Y123H + Y147T; V82S + Y123H + Y147R; V82S + Y123H + Q154R; Y147R + Q154R +Y123H; Y147R + Q154R + I76Y; Y147R + Q154R + T166R; Y123H + Y147R + Q154R + I76Y; V82S + Y123H + Y147R + Q154R; およびI76Y + V82S + Y123H + Y147R + Q154Rを含む。上記態様の他の実施形態では、アデノシンデアミナーゼバリアントは、Y147R + Q154R +Y123Hを含む。上記態様の他の実施形態では、アデノシンデアミナーゼバリアントは、Y147R + Q154R + I76Yを含む。上記態様の他の実施形態では、アデノシンデアミナーゼバリアントは、Y147R + Q154R + T166Rを含む。上記態様の他の実施形態では、アデノシンデアミナーゼバリアントは、Y147T + Q154Rを含む。上記態様の他の実施形態では、アデノシンデアミナーゼバリアントは、Y147T + Q154Sを含む。上記態様の他の実施形態では、アデノシンデアミナーゼバリアントは、Y147R + Q154Sを含む。上記態様の他の実施形態では、アデノシンデアミナーゼバリアントは、V82S + Q154Sを含む。上記態様の他の実施形態では、アデノシンデアミナーゼバリアントは、V82S + Y147Rを含む。上記態様の他の実施形態では、アデノシンデアミナーゼバリアントは、V82S + Q154Rを含む。上記態様の他の実施形態では、アデノシンデアミナーゼバリアントは、V82S + Y123Hを含む。上記態様の他の実施形態では、アデノシンデアミナーゼバリアントは、I76Y + V82Sを含む。上記態様の他の実施形態では、アデノシンデアミナーゼバリアントは、V82S + Y123H + Y147Tを含む。上記態様の他の実施形態では、アデノシンデアミナーゼバリアントは、V82S + Y123H + Y147Rを含む。上記態様の他の実施形態では、アデノシンデアミナーゼバリアントは、V82S + Y123H + Q154Rを含む。上記態様の他の実施形態では、アデノシンデアミナーゼバリアントは、Y123H + Y147R + Q154R + I76Yを含む。上記態様の他の実施形態では、アデノシンデアミナーゼバリアントは、V82S + Y123H + Y147R + Q154Rを含む。上記態様の他の実施形態では、アデノシンデアミナーゼバリアントは、I76Y + V82S + Y123H + Y147R + Q154Rを含む。上記態様の他の実施形態では、アデノシンデアミナーゼバリアントは、149、150、151、152、153、154、155、156、および157からなる群より選択される残基で始まる、C末端の欠失を含む。上記態様の他の実施形態では、塩基エディタードメインは、V82SおよびT166Rを含有する単一アデノシンデアミナーゼバリアントを含む。上記態様の他の実施形態では、塩基エディタードメインは、野生型アデノシンデアミナーゼドメインおよびアデノシンデアミナーゼバリアントを含む。上記態様の他の実施形態では、アデノシンデアミナーゼバリアントは、Y147T、Y147R、Q154S、Y123H、V82S、T166R、Q154Rからなる群より選択される改変をさらに含む。上記態様の他の実施形態では、塩基エディタードメインは、TadA7.10ドメインおよびアデノシンデアミナーゼバリアントを含む。上記態様の他の実施形態では、アデノシンデアミナーゼバリアントは、Y147T、Y147R、Q154S、Y123H、V82S、T166R、Q154Rからなる群より選択される改変をさらに含む。上記態様の他の実施形態では、塩基エディターは、TadA7.10ドメイン、ならびにY147T + Q154R; Y147T + Q154S; Y147R + Q154S; V82S + Q154S; V82S + Y147R; V82S + Q154R; V82S + Y123H; I76Y + V82S; V82S + Y123H + Y147T; V82S + Y123H + Y147R; V82S + Y123H + Q154R; Y147R + Q154R +Y123H; Y147R + Q154R + I76Y; Y147R + Q154R + T166R; Y123H + Y147R + Q154R + I76Y; V82S + Y123H + Y147R + Q154R;およびI76Y + V82S + Y123H + Y147R + Q154Rからなる群より選択される改変を含有するアデノシンデアミナーゼバリアントを含む。上記態様の他の実施形態では、塩基エディターは、以下の配列またはアデノシンデアミナーゼ活性を有するその断片を含むか、またはこうした配列または断片から本質的になる、ABE8である：MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCTFFRMPRQVFNAQKKAQSSTD。上記態様の他の実施形態では、アデノシンデアミナーゼバリアントは、全長ABE8に比較して、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、6、17、18、19、または20のN末端アミノ酸残基が失われている、一部切除（truncated）ABE8を含む。上記態様の他の実施形態では、アデノシンデアミナーゼバリアントは、全長ABE8に比較して、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、6、17、18、19、または20のC末端アミノ酸残基が失われている、一部切除ABE8を含む。

上記態様の他の実施形態では、アルファ-1アンチトリプシン不全と関連するSNPでのA・TからG・Cへの改変は、アルファ-1アンチトリプシンポリペプチド中でグルタミン酸をリジンに変化させる。上記態様の他の実施形態では、アルファ-1アンチトリプシン不全と関連するSNPは、アミノ酸342位でリジンを有するアルファ-1アンチトリプシンポリペプチドの発現を生じる。上記態様の他の実施形態では、アルファ-1アンチトリプシン不全と関連するSNPは、グルタミン酸をリジンで置換する。上記態様の他の実施形態では、アルファ-1アンチトリプシン不全と関連するSNPのA・TからG・Cへの改変に関して、細胞を選択する。上記態様の他の実施形態では、ポリヌクレオチドプログラム可能DNA結合ドメインは、改変Staphylococcus aureus Cas9（SaCas9）、Streptococcus thermophilus 1 Cas9（St1Cas9）、改変Streptococcus pyogenes Cas9（SpCas9）、またはそのバリアントである。上記態様の他の実施形態では、ポリヌクレオチドプログラム可能DNA結合ドメインは、改変プロトスペーサー隣接モチーフ（PAM）特異性または非G PAMに対する特異性を有する、SpCas9のバリアントを含む。上記態様の他の実施形態では、改変PAMは、核酸配列5’-NGC-3’に対する特異性を有する。上記態様の他の実施形態では、改変SpCas9は、アミノ酸置換、D1135M、S1136Q、G1218K、E1219F、A1322R、D1332A、R1335E、およびT1337R、またはその対応するアミノ酸置換を含む。上記態様の他の実施形態では、ポリヌクレオチドプログラム可能DNA結合ドメインは、ヌクレアーゼ不活性またはニッカーゼバリアントである。上記態様の他の実施形態では、ニッカーゼバリアントは、アミノ酸置換D10Aまたはその対応するアミノ酸置換を含む。上記態様の他の実施形態では、塩基エディターは、ジンクフィンガードメインをさらに含む。上記態様の他の実施形態では、アデノシンデアミナーゼドメインは、デオキシリボ核酸（DNA）中のアデニンを脱アミノ化することが可能である。上記態様の他の実施形態では、1つ以上のガイドRNAは、CRISPR RNA（crRNA）およびトランスエンコードされる小分子RNA(tracrRNA)を含み、crRNAは、アルファ-1アンチトリプシン不全と関連するSNPを含有するアルファ-1アンチトリプシン核酸配列に相補的な核酸配列を含む。上記態様の他の実施形態では、塩基エディターおよび1つ以上のガイドポリヌクレオチドは、細胞中で複合体を形成する。上記態様の他の実施形態では、塩基エディターは、アルファ-1アンチトリプシン不全と関連するSNPを含有するアルファ-1アンチトリプシン核酸配列に相補的な核酸配列を含有するシングルガイドRNA（sgRNA）と複合体を形成する。

別の態様では、対象においてアルファ-1アンチトリプシン不全（A1AD）を治療するための方法であって、対象に、Cas9またはCas12ポリペプチド内に挿入されたアデノシンデアミナーゼバリアントを含む融合タンパク質、あるいはその融合タンパク質をコードするポリヌクレオチド；およびこの融合タンパク質をターゲティングしてA1ADと関連する一塩基多型（SNP）のA・TからG・Cへの改変をもたらす、1つ以上のガイドポリヌクレオチドを投与し、それによって対象においてA1ADを治療する工程を含む、前記方法を提供する。

別の態様では、対象においてアルファ-1アンチトリプシン不全（A1AD）を治療する方法であって、アデノシン塩基エディター、ABE8、または前記塩基エディターをコードするポリヌクレオチドであって、ABE8がCas9またはCas12ポリペプチド内に挿入されたアデノシンデアミナーゼバリアントを含む、前記塩基エディターまたはポリヌクレオチド；およびABE8をターゲティングしてA1ADと関連するSNPのA・TからG・Cへの改変をもたらす、1つ以上のガイドポリヌクレオチドを投与し、それによって対象においてA1ADを治療する工程を含む、前記方法を提供する。

上述の方法の実施形態では、ABE8は、ABE8.1-m、ABE8.2-m、ABE8.3-m、ABE8.4-m、ABE8.5-m、ABE8.6-m、ABE8.7-m、ABE8.8-m、ABE8.9-m、ABE8.10-m、ABE8.11-m、ABE8.12-m、ABE8.13-m、ABE8.14-m、ABE8.15-m、ABE8.16-m、ABE8.17-m、ABE8.18-m、ABE8.19-m、ABE8.20-m、ABE8.21-m、ABE8.22-m、ABE8.23-m、ABE8.24-m、ABE8.1-d、ABE8.2-d、ABE8.3-d、ABE8.4-d、ABE8.5-d、ABE8.6-d、ABE8.7-d、ABE8.8-d、ABE8.9-d、ABE8.10-d、ABE8.11-d、ABE8.12-d、ABE8.13-d、ABE8.14-d、ABE8.15-d、ABE8.16-d、ABE8.17-d、ABE8.18-d、ABE8.19-d、ABE8.20-d、ABE8.21-d、ABE8.22-d、ABE8.23-d、またはABE8.24-dより選択される。上記方法の実施形態では、アデノシンデアミナーゼバリアントは：
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPRQVFNAQKKAQSSTD
のアミノ酸配列を含み；このアミノ酸配列は少なくとも1つの改変を含む。一実施形態では、アデノシンデアミナーゼバリアントは、アミノ酸82位および/または166位で改変を含む。一実施形態では、少なくとも1つの改変は：V82S、T166R、Y147T、Y147R、Q154S、Y123H、および/またはQ154Rを含む。

上記方法の一実施形態では、アデノシンデアミナーゼバリアントは改変の以下の組み合わせ：Y147T + Q154R; Y147T + Q154S; Y147R + Q154S; V82S + Q154S; V82S + Y147R; V82S + Q154R; V82S + Y123H; I76Y + V82S; V82S + Y123H + Y147T; V82S + Y123H + Y147R; V82S + Y123H + Q154R; Y147R + Q154R +Y123H; Y147R + Q154R + I76Y; Y147R + Q154R + T166R; Y123H + Y147R + Q154R + I76Y; V82S + Y123H + Y147R + Q154R;およびI76Y + V82S + Y123H + Y147R + Q154Rの1つを含む。上記方法の一実施形態では、アデノシンデアミナーゼバリアントは、TadA*8.1、TadA*8.2、TadA*8.3、TadA*8.4、TadA*8.5、TadA*8.6、TadA*8.7、TadA*8.8、TadA*8.9、TadA*8.10、TadA*8.11、TadA*8.12、TadA*8.13、TadA*8.14、TadA*8.15、TadA*8.16、TadA*8.17、TadA*8.18、TadA*8.19、TadA*8.20、TadA*8.21、TadA*8.22、TadA*8.23、またはTadA*8.24である。一実施形態では、アデノシンデアミナーゼバリアントは、149、150、151、152、153、154、155、156、および157からなる群より選択される残基で始まるC末端の欠失を含む。一実施形態では、アデノシンデアミナーゼバリアントは、TadA*8アデノシンデアミナーゼバリアントドメインを含むアデノシンデアミナーゼのモノマー（monomer）である。一実施形態では、アデノシンデアミナーゼバリアントは、野生型アデノシンデアミナーゼドメインおよびTadA*8アデノシンデアミナーゼバリアントドメインを含むアデノシンデアミナーゼのヘテロダイマー（heterodimer）である。一実施形態では、アデノシンデアミナーゼバリアントは、TadAドメインおよびTadA*8アデノシンデアミナーゼバリアントドメインを含むアデノシンデアミナーゼヘテロダイマーである。上記方法の一実施形態では、A1ADと関連するSNPでのA・TからG・Cへの改変は、アミノ酸342位でのグルタミン酸をリジンに変化させる。上記方法の一実施形態では、A1ADと関連するSNPはアミノ酸342位でリジンを有するアルファ-1アンチトリプシンポリペプチドの発現を生じる。上記方法の一実施形態では、アルファ-1アンチトリプシン不全と関連するSNPは、グルタミン酸をリジンで置換する。

上記方法の一実施形態では、アデノシンデアミナーゼバリアントは、Cas9またはCas12ポリペプチドの柔軟なループ、アルファらせん領域、非構造化部分、または溶媒アクセス可能部分内に挿入される。上記方法の一実施形態では、アデノシンデアミナーゼバリアントは、Cas9またはCas12ポリペプチドのN末端断片およびC末端断片に隣接する。

上記方法の一実施形態では、融合タンパク質またはABE8は、構造NH₂-[Cas9またはCas12ポリペプチドのN末端断片]-[アデノシンデアミナーゼバリアント]-[Cas9またはCas12ポリペプチドのC末端断片]-COOHを含み、式中、「]-[」の各例は任意のリンカーである。一実施形態では、N末端断片のC末端またはC末端断片のN末端は、Cas9またはCas12ポリペプチドの柔軟なループの一部を含む。一実施形態では、柔軟なループは、アデノシンデアミナーゼバリアントが標的核酸塩基を脱アミノ化する際、標的核酸塩基の近傍にあるアミノ酸を含む。

上記方法の一実施形態では、方法は、A1ADと関連するSNP標的核酸塩基の脱アミノ化を達成するためのガイド核酸配列を対象に投与する工程をさらに含む。上記方法の一実施形態では、SNP標的核酸塩基の脱アミノ化は、標的核酸塩基を野生型核酸塩基で、または非野生型核酸塩基で置換し、標的核酸塩基の脱アミノ化は、A1ADの症状を軽減する。上記方法の一実施形態では、A1ADと関連するSNPの脱アミノ化は、グルタミン酸をリジンで置換する。

上記方法の一実施形態では、標的核酸塩基は、標的ポリヌクレオチド配列において、PAM配列から1～20核酸塩基離れている。一実施形態では、標的核酸塩基は、PAM配列の2～12核酸塩基上流である。上記方法の一実施形態では、Cas9またはCas12ポリペプチドのN末端断片またはC末端断片は、標的ポリヌクレオチド配列に結合する。特定の実施形態では、N末端断片またはC末端断片は、RuvCドメインを含むか；N末端断片またはC末端断片は、HNHドメインを含むか；N末端断片およびC末端断片のいずれも、HNHドメインを含まないか；あるいはN末端断片およびC末端断片のいずれも、RuvCドメインを含まない。一実施形態では、Cas9またはCas12ポリペプチドは、1つ以上の構造ドメイン中に部分的または完全欠失を含み、デアミナーゼがCas9またはCas12ポリペプチドの部分的または完全欠失の位置に挿入される。特定の実施形態では、欠失はRuvCドメイン内であるか；欠失はHNHドメイン内であるか；または欠失は、RuvCドメインおよびC末端ドメインを架橋する。

上記方法の一実施形態では、融合タンパク質またはABE8はCas9ポリペプチドを含む。一実施形態では、Cas9ポリペプチドは、Streptococcus pyogenes Cas9(SpCas9)、Staphylococcus aureus Cas9（SaCas9）、Streptococcus thermophilus 1 Cas9（St1Cas9）、またはそのバリアントである。一実施形態では、Cas9ポリペプチドは、以下のアミノ酸配列（Cas9参照配列）を含む：

（一重下線：HNHドメイン；二重下線：RuvCドメイン；（Cas9参照配列）、またはその対応する領域）。特定の実施形態では、Cas9ポリペプチドは、Cas9ポリペプチド参照配列における番号付けでアミノ酸1017～1069、またはその対応するアミノ酸の欠失を含み；Cas9ポリペプチドは、Cas9ポリペプチド参照配列における番号付けでアミノ酸792～872、またはその対応するアミノ酸の欠失を含むか；あるいはCas9ポリペプチドは、Cas9ポリペプチド参照配列における番号付けでアミノ酸792～906、またはその対応するアミノ酸の欠失を含む。上記方法の一実施形態では、アデノシンデアミナーゼバリアントは、Cas9ポリペプチドの柔軟なループ内に挿入される。一実施形態では、柔軟なループは、Cas9参照配列中で番号付けられるような530～537、569～579、686～691、768～793、943～947、1002～1040、1052～1077、1232～1248、および1298～1300位、またはその対応するアミノ酸位のアミノ酸残基からなる群より選択される領域を含む。

上記方法の一実施形態では、デアミナーゼバリアントは、Cas9参照配列中で番号付けられるような、アミノ酸位768～769、791～792、792～793、1015～1016、1022～1023、1026～1027、1029～1030、1040～1041、1052～1053、1054～1055、1067～1068、1068～1069、1247～1248、または1248～1249、あるいはその対応するアミノ酸位の間に挿入される。上記方法の一実施形態では、デアミナーゼバリアントは、Cas9参照配列中で番号付けられるような、アミノ酸位768～769、792～793、1022～1023、1026～1027、1040～1041、1068～1069、または1247～1248、あるいはその対応するアミノ酸位の間に挿入される。上記方法の一実施形態では、デアミナーゼバリアントは、Cas9参照配列中で番号付けられるような、アミノ酸位1016～1017、1023～1024、1029～1030、1040～1041、1069～1070、または1247～1248、あるいはその対応するアミノ酸位の間に挿入される。上記方法の一実施形態では、アデノシンデアミナーゼバリアントは、表13Aに同定する遺伝子座で、Cas9ポリペプチド内に挿入（ins）される。一実施形態では、N末端断片は、Cas9参照配列のアミノ酸残基1～529、538～568、580～685、692～942、948～1001、1026～1051、1078～1231、および/または1248～1297、あるいはその対応する残基を含む。一実施形態では、C末端断片は、Cas9参照配列のアミノ酸残基1301～1368、1248～1297、1078～1231、1026～1051、948～1001、692～942、580～685、および/または538～568、あるいはその対応する残基を含む。

上記方法の一実施形態では、Cas9ポリペプチドは改変Cas9であり、改変PAMまたは非G PAMに対する特異性を有する。上記方法の一実施形態では、Cas9ポリペプチドはニッカーゼであるかまたはCas9ポリペプチドはヌクレアーゼ不活性である。上記方法の一実施形態では、Cas9ポリペプチドは改変SpCas9ポリペプチドである。一実施形態では、改変SpCas9は、アミノ酸置換D1135M、S1136Q、G1218K、E1219F、A1322R、D1332A、R1335E、およびT1337Rを含み(SpCas9-MQKFRAER)、改変PAM 5’-NGC-3’に対する特異性を有する。

上記方法の一実施形態では、融合タンパク質またはABE8はCas12ポリペプチドを含む。一実施形態では、アデノシンデアミナーゼバリアントは、Cas12ポリペプチド内に導入される。一実施形態では、Cas12ポリペプチドは、Cas12a、Cas12b、Cas12c、Cas12d、Cas12e、Cas12g、Cas12h、またはCas12iである。一実施形態では、アデノシンデアミナーゼバリアントは、アミノ酸位: a) BhCas12bの153～154、255～256、306～307、980～981、1019～1020、534～535、604～605、もしくは344～345、またはCas12a、Cas12c、Cas12d、Cas12e、Cas12g、Cas12h、もしくはCas12iの対応するアミノ酸残基; b) BvCas12bの147～148、248～249、299～300、991～992、もしくは1031～1032、またはCas12a、Cas12c、Cas12d、Cas12e、Cas12g、Cas12h、もしくはCas12iの対応するアミノ酸残基; あるいはc) AaCas12bの157～158、258～259、310～311、1008～1009、もしくは1044～1045、またはCas12a、Cas12c、Cas12d、Cas12e、Cas12g、Cas12h、もしくはCas12iの対応するアミノ酸残基の間に挿入される。一実施形態では、アデノシンデアミナーゼバリアントは、表13Bに同定する遺伝子座で、Cas12ポリペプチド内に挿入される。一実施形態では、Cas12ポリペプチドはCas12bである。一実施形態では、Cas12ポリペプチドは、BhCas12bドメイン、BvCas12bドメイン、またはAACas12bドメインを含む。

上記方法の一実施形態では、ガイドRNAはCRISPR RNA（crRNA）およびトランス活性化crRNA（tracrRNA）を含む。上記方法の一実施形態では、対象は哺乳動物またはヒトである。

別の態様では、上記方法、態様および実施形態の任意の1つの塩基編集システム、ならびに薬学的に許容され得るキャリアー、ビヒクル、または賦形剤を含む薬学的組成物を提供する。

一態様では、上記態様および実施形態の細胞、ならびに薬学的に許容され得るキャリアー、ビヒクル、または賦形剤を含む薬学的組成物を提供する。

別の態様では、上記方法、態様および実施形態のいずれか1つの塩基編集システムを含むキットを提供する。

別の態様では、上記態様および実施形態のいずれか1つの細胞を含むキットを提供する。キットの一実施形態では、キットはさらに、使用のための使用説明書を含むパッケージ挿入物を含む。

一態様では、本明細書で提供するのは、ポリヌクレオチドプログラム可能DNA結合ドメイン、および
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPRQVFNAQKKAQSSTD
のアミノ酸82位または166位で改変を含むアデノシンデアミナーゼバリアントを含む、少なくとも1つの塩基エディタードメインを含む、塩基エディターである。

一態様では、塩基エディターシステムは上記塩基エディターおよびガイドRNAを含み、前記ガイドRNAは、前記塩基エディターをターゲティングしてアルファ-1アンチトリプシン不全と関連するSNPの改変をもたらす。いくつかの実施形態では、アデノシンデアミナーゼバリアントは、V82S改変および/またはT166R改変を含む。いくつかの実施形態では、アデノシンデアミナーゼバリアントは、以下の改変: Y147T、Y147R、Q154S、Y123H、およびQ154Rの1つ以上をさらに含む。いくつかの実施形態では、塩基エディタードメインは、野生型アデノシンデアミナーゼドメインおよびアデノシンデアミナーゼバリアントを含むアデノシンデアミナーゼヘテロダイマーを含む。いくつかの実施形態では、アデノシンデアミナーゼバリアントは、全長TadA8に比較して、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、6、17、18、19、または20のN末端アミノ酸残基が欠けている一部切除TadA8である。いくつかの実施形態では、アデノシンデアミナーゼバリアントは、全長TadA8に比較して、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、6、17、18、19、または20のC末端アミノ酸残基が欠けている一部切除TadA8である。いくつかの実施形態では、ポリヌクレオチドプログラム可能DNA結合ドメインは、改変Staphylococcus aureus Cas9（SaCas9）、Streptococcus thermophilus 1 Cas9（St1Cas9）、改変Streptococcus pyogenes（SpCas9）、またはそのバリアントである。いくつかの実施形態では、ポリヌクレオチドプログラム可能DNA結合ドメインは、改変プロトスペーサー隣接モチーフ（PAM）特異性または非G PAMに対する特異性を有するSpCas9のバリアントである。いくつかの実施形態では、ポリヌクレオチドプログラム可能DNA結合ドメインは、ヌクレアーゼ不活性Cas9である。いくつかの実施形態では、ポリヌクレオチドプログラム可能DNA結合ドメインは、Cas9ニッカーゼである。

一態様では、1つ以上のガイドRNA、ならびに以下の配列：

（太字配列はCas9由来の配列を示し、斜字配列はリンカー配列を示し、下線配列は二部分核局在化配列を示す）を含むポリヌクレオチドプログラム可能DNA結合ドメイン、および
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPRQVFNAQKKAQSSTD
のアミノ酸82位および/または166位で改変を含むアデノシンデアミナーゼバリアントを含む少なくとも１つの塩基エディタードメインを含む融合タンパク質を含む、塩基エディターシステムを提供する。

一態様では、上記塩基エディターシステムの任意の1つを含む細胞を提供する。いくつかの実施形態では、細胞はヒト細胞または哺乳動物細胞である。いくつかの実施形態では、細胞はex vivo、in vivo、またはin vitroである。

本発明は、アルファ-1アンチトリプシン不全（A1AD）と関連する突然変異を編集するための組成物および方法を提供する。本発明によって定義される組成物および物品は、以下に提供する実施例と関連して単離されるかまたはそうでなければ製造された。本発明の他の特徴および利点は、詳細な説明および特許請求の範囲から明らかであろう。

定義
以下の定義は、当技術分野の定義を補足するものであって本出願を対象としており、任意の関連するまたは関連性のない案件、例えば共通の所有に係る特許または出願に帰するものではない。本明細書に記載されたものと同様または同等の任意の方法および材料を、本開示の試験の実施において使用することができるが、好ましい材料および方法を本明細書で説明する。従って、本明細書で使用される用語は、特定の実施形態を説明する目的のみのためのものであり、限定することを意図するものではない。

別段の定義がない限り、本明細書で使用されるすべての技術的および科学的用語は、本発明が属する分野の当業者によって一般的に理解される意味を有する。以下の参考文献は、当業者に、本発明において使用される多くの用語の一般的な定義を提供する: Singleton et al., Dictionary of Microbiology and Molecular Biology (2nd ed. 1994); The Cambridge Dictionary of Science and Technology (Walker ed., 1988); The Glossary of Genetics, 5th Ed., R. Rieger et al. (eds.), Springer Verlag (1991); and Hale & Marham, The Harper Collins Dictionary of Biology (1991)。

本出願において、単数形の使用は、特に断りのない限り、複数形を含む。本明細書で使用されるように、単数形「a」、「an」、および「the」は、文脈が明確にそうでないことを指示しない限り、複数の指示対象を含むことに留意しなければならない。本出願において、「または」の使用は、別段の記載がない限り、「および/または」を意味し、かつ包括的であると理解される。さらに、用語「含む(including)」、ならびに「含む(include)」、「含む(includes)」、および「含まれる(included)」などの他の型の使用は、非限定的である。

本明細書およびクレームにおいて使用される場合、用語「含む(comprising)」(および「含む(comprise)」および「含む(comprises)」などのそのあらゆる形態)、「有する(having)」(「有する(have)」および「有する(has)」などのそのあらゆる形態)、「含む(including)」(「含む(include)」および「含む(includes)」などのそのあらゆる形態)または「含有する(containing)」(「含有する(contains)」および「含有する(contain)」などのそのあらゆる形態)は、包括的または開放的であり、追加の、記載されていない要素または方法工程を排除しない。本明細書で議論される任意の実施形態は、本開示の任意の方法または組成物に関して実施することができ、逆もまた同様であると考えられる。さらに、本開示の組成物を用いて、本開示の方法を達成することができる。

用語「約(about)」または「およそ(approximately)」は、当業者によって決定されるように、特定の値について許容可能な誤差範囲内であることを意味し、これは、値がどのように測定または決定されるか、すなわち、測定システムの制限に部分的に依存する。例えば、「約」は、当技術分野における実務によれば、1以内または1を超える標準偏差内であることを意味し得る。あるいは、「約」は、所定の値の最大20%、最大10%、最大5%、または最大1%の範囲を意味し得る。あるいは、特に生物学的システムまたはプロセスに関して、この用語は、同じ桁以内、例えば5倍以内または2倍以内の値を意味することができる。特定の値が出願および特許請求の範囲に記載されている場合、別段の記載がない限り、その特定の値について許容可能な誤差範囲内にあることを意味する「約」という用語が推定されるべきである。

本明細書に提供する範囲は、第一の値および最後の値を含めて、範囲内の値すべてに関する省略表現であると理解される。例えば、1～50の範囲は、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、または50からなる群からの任意の数字、数字の組み合わせ、または下位範囲を含むと理解される。

明細書における「いくつかの実施形態」、「ある実施形態」、「一実施形態」、または「他の実施形態」という言及は、その実施形態に関連して説明される特定の特徴、構造、または特性が、本開示の少なくともいくつかの実施形態に含まれるが、必ずしもすべての実施形態に含まれるとは限らないことを意味する。

「アデノシンデアミナーゼ」とは、アデニンまたはアデノシンの加水分解的脱アミノ化を触媒することができるポリペプチドまたはその断片を意味する。いくつかの実施形態では、デアミナーゼまたはデアミナーゼドメインは、アデノシンからイノシン、またはデオキシアデノシンからデオキシイノシンへの加水分解的脱アミノ化を触媒するアデノシンデアミナーゼである。いくつかの実施形態では、アデノシンデアミナーゼは、デオキシリボ核酸 (DNA) 中のアデニンまたはアデノシンの加水分解的脱アミノ化を触媒する。本明細書で提供されるアデノシンデアミナーゼ(例えば、遺伝子操作されたアデノシンデアミナーゼ、進化させたアデノシンデアミナーゼ)は、細菌などの任意の生物由来であり得る。

いくつかの実施形態では、アデノシンデアミナーゼは、以下の配列における改変を含む：
MSEVEFSHEY WMRHALTLAK RARDEREVPV GAVLVLNNRV IGEGWNRAIG LHDPTAHAEI MALRQGGLVM QNYRLIDATL YVTFEPCVMC AGAMIHSRIG RVVFGVRNAK TGAAGSLMDV LHYPGMNHRV EITEGILADE CAALLCYFFR MPRQVFNAQK KAQSSTD
（TadA*7.10とも呼ばれる）。

いくつかの実施形態では、TadA*7.10は少なくとも1つの改変を含む。いくつかの実施形態では、TadA*7.10はアミノ酸82位および/または166位における改変を含む。特定の実施形態では、上記参照配列のバリアントは、以下の改変のうちの1つ以上を含む：Y147T、Y147R、Q154S、Y123H、V82S、T166R、および/またはQ154R。改変Y123Hはまた、本明細書において、H123H（TadA*7.10における改変H123YがY123H (wt)に復帰された改変）とも称される。他の実施形態では、TadA*7.10配列のバリアントは、Y147T + Q154R; Y147T + Q154S; Y147R + Q154S; V82S + Q154S; V82S + Y147R; V82S + Q154R; V82S + Y123H; I76Y + V82S; V82S + Y123H + Y147T; V82S + Y123H + Y147R; V82S + Y123H + Q154R; Y147R + Q154R +Y123H; Y147R + Q154R + I76Y; Y147R + Q154R + T166R; Y123H + Y147R + Q154R + I76Y; V82S + Y123H + Y147R + Q154R; およびI76Y + V82S + Y123H + Y147R + Q154Rからなる群より選択される改変の組み合わせを含む。

他の実施形態では、本発明は、欠失を含むアデノシンデアミナーゼバリアント、例えば、残基149、150、151、152、153、154、155、156、または157で始まるC末端の欠失を含むTadA*8を提供する。他の実施形態では、アデノシンデアミナーゼバリアントは、1つ以上の以下の改変: Y147T、Y147R、Q154S、Y123H、V82S、T166R、および/またはQ154Rを含むTadA（例えばTadA*8）モノマーである。他の実施形態では、アデノシンデアミナーゼバリアントは: Y147T + Q154R; Y147T + Q154S; Y147R + Q154S; V82S + Q154S; V82S + Y147R; V82S + Q154R; V82S + Y123H; I76Y + V82S; V82S + Y123H + Y147T; V82S + Y123H + Y147R; V82S + Y123H + Q154R; Y147R + Q154R +Y123H; Y147R + Q154R + I76Y; Y147R + Q154R + T166R; Y123H + Y147R + Q154R + I76Y; V82S + Y123H + Y147R + Q154R;およびI76Y + V82S + Y123H + Y147R + Q154Rの群より選択される改変の組み合わせを含むモノマーである。

さらに他の実施形態では、アデノシンデアミナーゼバリアントは、各々、1つ以上の以下の改変：Y147T、Y147R、Q154S、Y123H、V82S、T166R、および/またはQ154Rを有する2つのアデノシンデアミナーゼドメイン（例えばTadA*8）を含むホモダイマーである。他の実施形態では、アデノシンデアミナーゼバリアントは、各々: Y147T + Q154R; Y147T + Q154S; Y147R + Q154S; V82S + Q154S; V82S + Y147R; V82S + Q154R; V82S + Y123H; I76Y + V82S; V82S + Y123H + Y147T; V82S + Y123H + Y147R; V82S + Y123H + Q154R; Y147R + Q154R +Y123H; Y147R + Q154R + I76Y; Y147R + Q154R + T166R; Y123H + Y147R + Q154R + I76Y; V82S + Y123H + Y147R + Q154R; およびI76Y + V82S + Y123H + Y147R + Q154Rの群より選択される改変の組み合わせを有する、2つのアデノシンデアミナーゼドメイン（例えばTadA*8）を含むホモダイマーである。

他の実施形態では、アデノシンデアミナーゼバリアントは、野生型TadAアデノシンデアミナーゼドメイン、ならびに以下の改変Y147T、Y147R、Q154S、Y123H、V82S、T166R、および/またはQ154Rの1つ以上を含むアデノシンデアミナーゼバリアントドメイン（例えばTadA*8）を含む、ヘテロダイマーである。他の実施形態では、アデノシンデアミナーゼバリアントは、野生型TadAアデノシンデアミナーゼドメイン、ならびに：Y147T + Q154R; Y147T + Q154S; Y147R + Q154S; V82S + Q154S; V82S + Y147R; V82S + Q154R; V82S + Y123H; I76Y + V82S; V82S + Y123H + Y147T; V82S + Y123H + Y147R; V82S + Y123H + Q154R; Y147R + Q154R +Y123H; Y147R + Q154R + I76Y; Y147R + Q154R + T166R; Y123H + Y147R + Q154R + I76Y; V82S + Y123H + Y147R + Q154R;およびI76Y + V82S + Y123H + Y147R + Q154Rの群より選択される改変の組み合わせを含むアデノシンデアミナーゼバリアントドメイン（例えばTadA*8）を含む、ヘテロダイマーである。

他の実施形態では、アデノシンデアミナーゼバリアントは、TadA*7.10ドメイン、ならびに以下の改変Y147T、Y147R、Q154S、Y123H、V82S、T166R、および/またはQ154Rの1つ以上を含むアデノシンデアミナーゼバリアントドメイン（例えばTadA*8）を含むヘテロダイマーである。他の実施形態では、アデノシンデアミナーゼバリアントは、TadA*7.10ドメイン、および以下の改変：Y147T + Q154R; Y147T + Q154S; Y147R + Q154S; V82S + Q154S; V82S + Y147R; V82S + Q154R; V82S + Y123H; I76Y + V82S; V82S + Y123H + Y147T; V82S + Y123H + Y147R; V82S + Y123H + Q154R; Y147R + Q154R +Y123H; Y147R + Q154R + I76Y; Y147R + Q154R + T166R; Y123H + Y147R + Q154R + I76Y; V82S + Y123H + Y147R + Q154R; またはI76Y + V82S + Y123H + Y147R + Q154Rの組み合わせを含むアデノシンデアミナーゼバリアントドメイン（例えばTadA*8）を含む、ヘテロダイマーである。

一実施形態では、アデノシンデアミナーゼは、以下の配列またはアデノシンデアミナーゼ活性を有するその断片を含むかまたはこれらから本質的になる、TadA*8である：
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCTFFRMPRQVFNAQKKAQSSTD。

いくつかの実施形態では、TadA*8は一部切除されている。いくつかの実施形態では、一部切除TadA*8には、全長TadA*8に比較して、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、6、17、18、19、または20のN末端アミノ酸残基が失われている。いくつかの実施形態では、一部切除TadA*8では、全長TadA*8に比較して、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、6、17、18、19、または20のC末端アミノ酸残基が失われている。いくつかの実施形態では、アデノシンデアミナーゼバリアントは全長TadA*8である。

特定の実施形態では、アデノシンデアミナーゼヘテロダイマーは、TadA*8ドメイン、および以下の1つより選択されるアデノシンデアミナーゼドメインを含む：

Staphylococcus aureus（S. aureus）TadA：
MGSHMTNDIYFMTLAIEEAKKAAQLGEVPIGAIITKDDEVIARAHNLRETLQQPTAHAEHIAIERAAKVLGSWRLEGCTLYVTLEPCVMCAGTIVMSRIPRVVYGADDPKGGCSGSLMNLLQQSNFNHRAIVDKGVLKEACSTLLTTFFKNLRANKKSTN

Bacillus subtilis（B. subtillis）TadA：
MTQDELYMKEAIKEAKKAEEKGEVPIGAVLVINGEIIARAHNLRETEQRSIAHAEMLVIDEACKALGTWRLEGATLYVTLEPCPMCAGAVVLSRVEKVVFGAFDPKGGCSGTLMNLLQEERFNHQAEVVSGVLEEECGGMLSAFFRELRKKKKAARKNLSE

Salmonella typhimurium（S. typhimurium）TadA：
MPPAFITGVTSLSDVELDHEYWMRHALTLAKRAWDEREVPVGAVLVHNHRVIGEGWNRPIGRHDPTAHAEIMALRQGGLVLQNYRLLDTTLYVTLEPCVMCAGAMVHSRIGRVVFGARDAKTGAAGSLIDVLHHPGMNHRVEIIEGVLRDECATLLSDFFRMRRQEIKALKKADRAEGAGPAV

Shewanella putrefaciens（S. putrefaciens）TadA：
MDEYWMQVAMQMAEKAEAAGEVPVGAVLVKDGQQIATGYNLSISQHDPTAHAEILCLRSAGKKLENYRLLDATLYITLEPCAMCAGAMVHSRIARVVYGARDEKTGAAGTVVNLLQHPAFNHQVEVTSGVLAEACSAQLSRFFKRRRDEKKALKLAQRAQQGIE

Haemophilus influenzae F3031（H. influenzae）TadA：
MDAAKVRSEFDEKMMRYALELADKAEALGEIPVGAVLVDDARNIIGEGWNLSIVQSDPTΑΗAEIIALRNGAKNIQNYRLLNSTLYVTLEPCTMCAGAILHSRIKRLVFGASDYKTGAIGSRFHFFDDYKMNHTLEITSGVLAEECSQKLSTFFQKRREEKKIEKALLKSLSDK

Caulobacter crescentus（C. crescentus）TadA：
MRTDESEDQDHRMMRLALDAARAAAEAGETPVGAVILDPSTGEVIATAGNGPIAAHDPTAHAEIAAMRAAAAKLGNYRLTDLTLVVTLEPCAMCAGAISHARIGRVVFGADDPKGGAVVHGPKFFAQPTCHWRPEVTGGVLADESADLLRGFFRARRKAKI

Geobacter sulfurreducens（G. sulfrreducens）TadA：
MSSLKKTPIRDDAYWMGKAIREAAKAAARDEVPIGAVIVRDGAVIGRGHNLREGSNDPSAHAEMIAIRQAARRSANWRLTGATLYVTLEPCLMCMGAIILARLERVVFGCYDPKGGAAGSLYDLSADPRLNHQVRLSPGVCQEECGTMLSDFFRDLRRRKKAKATPALFIDERKVPPEP

TadA*7.10
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPRQVFNAQKKAQSSTD

「アデノシンデアミナーゼ塩基エディター（ABE8）ポリペプチド」は、以下の参照配列：
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPRQVFNAQKKAQSSTD
のアミノ酸82位および/または166位で改変を含むアデノシンデアミナーゼバリアントを含む、本明細書に定義しかつ/または記載するような塩基エディター（BE）を意味する。

いくつかの実施形態では、ABE8は、参照配列に比較してさらなる改変を含む。

「アデノシンデアミナーゼ塩基エディター8（ABE8）ポリヌクレオチド」は、ABE8ポリペプチドをコードするポリヌクレオチド（ポリヌクレオチド配列）を意味する。

「投与する」は、本明細書において、患者または対象に、1つ以上の本明細書記載の組成物を提供することを指す。例として、かつ限定なしに、組成物投与、例えば注射は、静脈内（i.v.）注射、皮下（s.c.）注射、皮内（i.d.）注射、腹腔内（i.p.）注射、または筋内（i.m.）注射によって行われてもよい。1つ以上のこうした経路を使用してもよい。非経口投与は、例えば、ボーラス注射、または長期に渡る漸次灌流によってもよい。あるいは、または同時に、投与は経口経路によってもよい。

「剤」によって、任意の小分子化学化合物、抗体、核酸分子、またはポリペプチド、あるいはその断片を意味する。

「アルファ-1アンチトリプシン（A1AT）タンパク質」は、UniProt寄託番号P01009に少なくとも約95%のアミノ酸配列同一性を有するポリペプチドまたはその断片を意味する。特定の実施形態では、A1ATタンパク質は、以下の参照配列に比較して、1つ以上の改変を含む。1つの特定の実施形態では、A1ADと関連するA1ATタンパク質はE342K突然変異を含む。例示的なA1ATアミノ酸配列を以下に提供する。
>sp|P01009|A1AT_HUMAN アルファ-1-アンチトリプシンOS=Homo sapiens OX=9606 GN=SERPINA1 PE=1 SV=3
MPSSVSWGILLLAGLCCLVPVSLAEDPQGDAAQKTDTSHHDQDHPTFNKITPNLAEFAFSLYRQLAHQSNSTNIFFSPVSIATAFAMLSLGTKADTHDEILEGLNFNLTEIPEAQIHEGFQELLRTLNQPDSQLQLTTGNGLFLSEGLKLVDKFLEDVKKLYHSEAFTVNFGDTEEAKKQINDYVEKGTQGKIVDLVKELDRDTVFALVNYIFFKGKWERPFEVKDTEEEDFHVDQVTTVKVPMMKRLGMFNIQHCKKLSSWVLLMKYLGNATAIFFLPDEGKLQHLENELTHDIITKFLENEDRRSASLHLPKLSITGTYDLKSVLGQLGITKVFSNGADLSGVTEEAPLKLSKAVHKAVLTIDEKGTEAAGAMFLEAIPMSIPPEVKFNKPFVFLMIEQNTKSPLFMGKVVNPTQK
上記A1ATタンパク質配列において、最初の24アミノ酸はシグナルペプチドを構成する（下線）。A1ADで突然変異されている配列の342位（すなわちE342K）は、シグナル配列に続いてアミノ酸「1」として設定されたアミノ酸残基「E」に基づいて決定される。

「改変」とは、本明細書に記載されるような標準技術の公知の方法によって検出されるような、遺伝子またはポリペプチドの構造、発現レベルまたは活性の変化（例えば増加または減少）を意味する。本明細書で使用される場合、改変は、ポリヌクレオチドまたはポリペプチド配列の変化、あるいは発現レベルの変化、例えば25%の変化、40%の変化、50%以上の発現レベルの変化を含む。

「改善する(ameliorate)」とは、疾患の発生または進行を減少させる、抑制する、減衰させる、低減させる、停止させる、または安定させることを意味する。

「アナログ」とは、同一ではないが、類似の機能的または構造的特徴を有する分子を意味する。例えば、ポリヌクレオチドまたはポリペプチドアナログは、対応する天然存在ポリヌクレオチドまたはポリペプチドの生物学的活性を保持しながら、天然存在ポリヌクレオチドまたはポリペプチドと比較して、そのアナログの機能を増強させる特定の生化学的修飾を有する。そのような修飾は、例えばリガンド結合を改変することなく、アナログのDNAに対するアフィニティ、有効性、特異性、プロテアーゼまたはヌクレアーゼ耐性、膜透過性、および/または半減期を増加させることができる。アナログは、非天然アミノ酸を含み得る。

「塩基エディター（BE）」あるいは「核酸塩基エディター（NBE）」とは、ポリヌクレオチドに結合して核酸塩基改変活性を有する剤を意味する。多様な実施形態では、塩基エディターは、核酸塩基改変ポリペプチド（例えば、デアミナーゼ）および核酸プログラム可能ヌクレオチド結合ドメインを、ガイドポリヌクレオチド（例えばガイドRNA）とともに含む。多様な実施形態では、該剤は、塩基編集活性を有するタンパク質ドメイン、すなわち、核酸分子（例えばDNA）内の塩基（例えばA、T、C、G、U）を改変することができるドメインを含む生体分子複合体である。いくつかの実施形態では、ポリヌクレオチドプログラム可能DNA結合ドメインは、デアミナーゼドメインに融合または連結される。一実施形態では、該剤は、塩基編集活性を有するドメインを含む融合タンパク質である。別の実施形態では、塩基編集活性を有するタンパク質ドメインは、ガイドRNAに連結される（例えば、ガイドRNA上のRNA結合モチーフおよびデアミナーゼに融合されたRNA結合ドメインを介して）。いくつかの実施形態では、塩基編集活性を有するドメインは、核酸分子内の塩基を脱アミノ化することができる。いくつかの実施形態では、塩基エディターは、DNA分子内の1つ以上の塩基を脱アミノ化することができる。いくつかの実施形態では、塩基エディターは、DNA内のアデノシン(A) を脱アミノ化することができる。いくつかの実施形態では、塩基エディターはアデノシン塩基エディター(ABE) である。

いくつかの実施形態では、塩基エディターは、循環置換体（circular permutant）Cas9（例えばspCas9またはsaCas9）および二部分核局在化配列を含む足場内にアデノシンデアミナーゼバリアント（例えばTadA*8）をクローニングすることによって生成される（例えばABE8）。循環置換体Cas9は当技術分野に公知であり、例えば、Oakes et al., Cell 176, 254-267, 2019に記載されている。例示的な循環置換体は、以下の通りであり、太字配列はCas9由来の配列を示し、斜字配列はリンカー配列を示し、下線配列は二部分核局在化配列を示す。

CP5（MSP「NGC=突然変異を含むPamバリアント、通常のCas9はNGGを好む」、PID=タンパク質相互作用ドメインおよび「D10A」ニッカーゼを含む）：

いくつかの実施形態では、ABE8は、以下の表6～9、13、または14由来の塩基エディターより選択される。いくつかの実施形態では、ABE8は、TadAから進化されたアデノシンデアミナーゼバリアントを含有する。いくつかの実施形態では、ABE8のアデノシンデアミナーゼバリアントは、以下の表7、9、13、または14に記載するようなTadA*8バリアントである。いくつかの実施形態では、アデノシンデアミナーゼバリアントは、Y147T、Y147R、Q154S、Y123H、V82S、T166R、および/またはQ154Rの群より選択される改変の1つ以上を含むTadA*7.10バリアント（例えばTadA*8）である。多様な実施形態では、ABE8は、Y147T + Q154R; Y147T + Q154S; Y147R + Q154S; V82S + Q154S; V82S + Y147R; V82S + Q154R; V82S + Y123H; I76Y + V82S; V82S + Y123H + Y147T; V82S + Y123H + Y147R; V82S + Y123H + Q154R; Y147R + Q154R +Y123H; Y147R + Q154R + I76Y; Y147R + Q154R + T166R; Y123H + Y147R + Q154R + I76Y; V82S + Y123H + Y147R + Q154R; およびI76Y + V82S + Y123H + Y147R + Q154Rの群より選択される改変の組み合わせを含む、TadA*7.10バリアント（例えばTadA*8)を含む。いくつかの実施形態では、ABE8はモノマー構築物である。いくつかの実施形態では、ABE8はヘテロダイマー構築物である。いくつかの実施形態では、ABE8は、配列：
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCTFFRMPRQVFNAQKKAQSSTD
を含む。

いくつかの実施形態では、ポリヌクレオチドプログラム可能DNA結合ドメインは、CRISPR会合(例えばCasまたはCpf1)酵素である。いくつかの実施形態では、塩基エディターは、デアミナーゼドメインに融合された、触媒的に不活性である（dead）Cas9 (dCas9) である。いくつかの実施形態では、塩基エディターは、デアミナーゼドメインに融合されたCas9ニッカーゼ(nCas9) である。塩基エディターの詳細は、国際PCT出願番号PCT/2017/045381(WO 2018/027078)およびPCT/US 2016/058344(WO 2017/070632)に記載されており、それぞれその全体が参照により本明細書に組み込まれる。Komor, A.C., et al., “Programmable editing of a target base in genomic DNA without double-stranded DNA cleavage”Nature 533, 420-424 (2016); Gaudelli, N.M., et al., “Programmable base editing of A・T to G・C in genomic DNA without DNA cleavage” Nature 551, 464-471 (2017); Komor, A.C., et al., “Improved base excision repair inhibition and bacteriophage Mu Gam protein yields C:G-to-T:A base editors with higher efficiency and product purity”Science Advances 3:eaao4774 (2017), および Rees, H.A., et al., “Base editing: precision chemistry on the genome and transcriptome of living cells.” Nat Rev Genet. 2018 Dec;19(12):770-788. doi: 10.1038/s41576-018-0059-1も参照のこと (その内容全体を参照により本明細書に組み込む) 。

例として、本明細書に記載する塩基編集組成物、システムおよび方法中で用いられるようなアデニン塩基エディター（ABE）は、以下に提供するような核酸配列（8877塩基対）、（Addgene, Watertown, MA.; Gaudelli NM, et al., Nature. 2017 Nov 23;551(7681):464-471. doi: 10.1038/nature24644; Koblan LW, et al., Nat Biotechnol. 2018 Oct;36(9):843-846. doi: 10.1038/nbt.4172.）を有する。ABE核酸配列に少なくとも95%以上の同一性を有するポリヌクレオチド配列もまた含まれる。
ATATGCCAAGTACGCCCCCTATTGACGTCAATGACGGTAAATGGCCCGCCTGGCATTATGCCCAGTACATGACCTTATGGGACTTTCCTACTTGGCAGTACATCTACGTATTAGTCATCGCTATTACCATGGTGATGCGGTTTTGGCAGTACATCAATGGGCGTGGATAGCGGTTTGACTCACGGGGATTTCCAAGTCTCCACCCCATTGACGTCAATGGGAGTTTGTTTTGGCACCAAAATCAACGGGACTTTCCAAAATGTCGTAACAACTCCGCCCCATTGACGCAAATGGGCGGTAGGCGTGTACGGTGGGAGGTCTATATAAGCAGAGCTGGTTTAGTGAACCGTCAGATCCGCTAGAGATCCGCGGCCGCTAATACGACTCACTATAGGGAGAGCCGCCACCATGAAACGGACAGCCGACGGAAGCGAGTTCGAGTCACCAAAGAAGAAGCGGAAAGTCTCTGAAGTCGAGTTTAGCCACGAGTATTGGATGAGGCACGCACTGACCCTGGCAAAGCGAGCATGGGATGAAAGAGAAGTCCCCGTGGGCGCCGTGCTGGTGCACAACAATAGAGTGATCGGAGAGGGATGGAACAGGCCAATCGGCCGCCACGACCCTACCGCACACGCAGAGATCATGGCACTGAGGCAGGGAGGCCTGGTCATGCAGAATTACCGCCTGATCGATGCCACCCTGTATGTGACACTGGAGCCATGCGTGATGTGCGCAGGAGCAATGATCCACAGCAGGATCGGAAGAGTGGTGTTCGGAGCACGGGACGCCAAGACCGGCGCAGCAGGCTCCCTGATGGATGTGCTGCACCACCCCGGCATGAACCACCGGGTGGAGATCACAGAGGGAATCCTGGCAGACGAGTGCGCCGCCCTGCTGAGCGATTTCTTTAGAATGCGGAGACAGGAGATCAAGGCCCAGAAGAAGGCACAGAGCTCCACCGACTCTGGAGGATCTAGCGGAGGATCCTCTGGAAGCGAGACACCAGGCACAAGCGAGTCCGCCACACCAGAGAGCTCCGGCGGCTCCTCCGGAGGATCCTCTGAGGTGGAGTTTTCCCACGAGTACTGGATGAGACATGCCCTGACCCTGGCCAAGAGGGCACGCGATGAGAGGGAGGTGCCTGTGGGAGCCGTGCTGGTGCTGAACAATAGAGTGATCGGCGAGGGCTGGAACAGAGCCATCGGCCTGCACGACCCAACAGCCCATGCCGAAATTATGGCCCTGAGACAGGGCGGCCTGGTCATGCAGAACTACAGACTGATTGACGCCACCCTGTACGTGACATTCGAGCCTTGCGTGATGTGCGCCGGCGCCATGATCCACTCTAGGATCGGCCGCGTGGTGTTTGGCGTGAGGAACGCAAAAACCGGCGCCGCAGGCTCCCTGATGGACGTGCTGCACTACCCCGGCATGAATCACCGCGTCGAAATTACCGAGGGAATCCTGGCAGATGAATGTGCCGCCCTGCTGTGCTATTTCTTTCGGATGCCTAGACAGGTGTTCAATGCTCAGAAGAAGGCCCAGAGCTCCACCGACTCCGGAGGATCTAGCGGAGGCTCCTCTGGCTCTGAGACACCTGGCACAAGCGAGAGCGCAACACCTGAAAGCAGCGGGGGCAGCAGCGGGGGGTCAGACAAGAAGTACAGCATCGGCCTGGCCATCGGCACCAACTCTGTGGGCTGGGCCGTGATCACCGACGAGTACAAGGTGCCCAGCAAGAAATTCAAGGTGCTGGGCAACACCGACCGGCACAGCATCAAGAAGAACCTGATCGGAGCCCTGCTGTTCGACAGCGGCGAAACAGCCGAGGCCACCCGGCTGAAGAGAACCGCCAGAAGAAGATACACCAGACGGAAGAACCGGATCTGCTATCTGCAAGAGATCTTCAGCAACGAGATGGCCAAGGTGGACGACAGCTTCTTCCACAGACTGGAAGAGTCCTTCCTGGTGGAAGAGGATAAGAAGCACGAGCGGCACCCCATCTTCGGCAACATCGTGGACGAGGTGGCCTACCACGAGAAGTACCCCACCATCTACCACCTGAGAAAGAAACTGGTGGACAGCACCGACAAGGCCGACCTGCGGCTGATCTATCTGGCCCTGGCCCACATGATCAAGTTCCGGGGCCACTTCCTGATCGAGGGCGACCTGAACCCCGACAACAGCGACGTGGACAAGCTGTTCATCCAGCTGGTGCAGACCTACAACCAGCTGTTCGAGGAAAACCCCATCAACGCCAGCGGCGTGGACGCCAAGGCCATCCTGTCTGCCAGACTGAGCAAGAGCAGACGGCTGGAAAATCTGATCGCCCAGCTGCCCGGCGAGAAGAAGAATGGCCTGTTCGGAAACCTGATTGCCCTGAGCCTGGGCCTGACCCCCAACTTCAAGAGCAACTTCGACCTGGCCGAGGATGCCAAACTGCAGCTGAGCAAGGACACCTACGACGACGACCTGGACAACCTGCTGGCCCAGATCGGCGACCAGTACGCCGACCTGTTTCTGGCCGCCAAGAACCTGTCCGACGCCATCCTGCTGAGCGACATCCTGAGAGTGAACACCGAGATCACCAAGGCCCCCCTGAGCGCCTCTATGATCAAGAGATACGACGAGCACCACCAGGACCTGACCCTGCTGAAAGCTCTCGTGCGGCAGCAGCTGCCTGAGAAGTACAAAGAGATTTTCTTCGACCAGAGCAAGAACGGCTACGCCGGCTACATTGACGGCGGAGCCAGCCAGGAAGAGTTCTACAAGTTCATCAAGCCCATCCTGGAAAAGATGGACGGCACCGAGGAACTGCTCGTGAAGCTGAACAGAGAGGACCTGCTGCGGAAGCAGCGGACCTTCGACAACGGCAGCATCCCCCACCAGATCCACCTGGGAGAGCTGCACGCCATTCTGCGGCGGCAGGAAGATTTTTACCCATTCCTGAAGGACAACCGGGAAAAGATCGAGAAGATCCTGACCTTCCGCATCCCCTACTACGTGGGCCCTCTGGCCAGGGGAAACAGCAGATTCGCCTGGATGACCAGAAAGAGCGAGGAAACCATCACCCCCTGGAACTTCGAGGAAGTGGTGGACAAGGGCGCTTCCGCCCAGAGCTTCATCGAGCGGATGACCAACTTCGATAAGAACCTGCCCAACGAGAAGGTGCTGCCCAAGCACAGCCTGCTGTACGAGTACTTCACCGTGTATAACGAGCTGACCAAAGTGAAATACGTGACCGAGGGAATGAGAAAGCCCGCCTTCCTGAGCGGCGAGCAGAAAAAGGCCATCGTGGACCTGCTGTTCAAGACCAACCGGAAAGTGACCGTGAAGCAGCTGAAAGAGGACTACTTCAAGAAAATCGAGTGCTTCGACTCCGTGGAAATCTCCGGCGTGGAAGATCGGTTCAACGCCTCCCTGGGCACATACCACGATCTGCTGAAAATTATCAAGGACAAGGACTTCCTGGACAATGAGGAAAACGAGGACATTCTGGAAGATATCGTGCTGACCCTGACACTGTTTGAGGACAGAGAGATGATCGAGGAACGGCTGAAAACCTATGCCCACCTGTTCGACGACAAAGTGATGAAGCAGCTGAAGCGGCGGAGATACACCGGCTGGGGCAGGCTGAGCCGGAAGCTGATCAACGGCATCCGGGACAAGCAGTCCGGCAAGACAATCCTGGATTTCCTGAAGTCCGACGGCTTCGCCAACAGAAACTTCATGCAGCTGATCCACGACGACAGCCTGACCTTTAAAGAGGACATCCAGAAAGCCCAGGTGTCCGGCCAGGGCGATAGCCTGCACGAGCACATTGCCAATCTGGCCGGCAGCCCCGCCATTAAGAAGGGCATCCTGCAGACAGTGAAGGTGGTGGACGAGCTCGTGAAAGTGATGGGCCGGCACAAGCCCGAGAACATCGTGATCGAAATGGCCAGAGAGAACCAGACCACCCAGAAGGGACAGAAGAACAGCCGCGAGAGAATGAAGCGGATCGAAGAGGGCATCAAAGAGCTGGGCAGCCAGATCCTGAAAGAACACCCCGTGGAAAACACCCAGCTGCAGAACGAGAAGCTGTACCTGTACTACCTGCAGAATGGGCGGGATATGTACGTGGACCAGGAACTGGACATCAACCGGCTGTCCGACTACGATGTGGACCATATCGTGCCTCAGAGCTTTCTGAAGGACGACTCCATCGACAACAAGGTGCTGACCAGAAGCGACAAGAACCGGGGCAAGAGCGACAACGTGCCCTCCGAAGAGGTCGTGAAGAAGATGAAGAACTACTGGCGGCAGCTGCTGAACGCCAAGCTGATTACCCAGAGAAAGTTCGACAATCTGACCAAGGCCGAGAGAGGCGGCCTGAGCGAACTGGATAAGGCCGGCTTCATCAAGAGACAGCTGGTGGAAACCCGGCAGATCACAAAGCACGTGGCACAGATCCTGGACTCCCGGATGAACACTAAGTACGACGAGAATGACAAGCTGATCCGGGAAGTGAAAGTGATCACCCTGAAGTCCAAGCTGGTGTCCGATTTCCGGAAGGATTTCCAGTTTTACAAAGTGCGCGAGATCAACAACTACCACCACGCCCACGACGCCTACCTGAACGCCGTCGTGGGAACCGCCCTGATCAAAAAGTACCCTAAGCTGGAAAGCGAGTTCGTGTACGGCGACTACAAGGTGTACGACGTGCGGAAGATGATCGCCAAGAGCGAGCAGGAAATCGGCAAGGCTACCGCCAAGTACTTCTTCTACAGCAACATCATGAACTTTTTCAAGACCGAGATTACCCTGGCCAACGGCGAGATCCGGAAGCGGCCTCTGATCGAGACAAACGGCGAAACCGGGGAGATCGTGTGGGATAAGGGCCGGGATTTTGCCACCGTGCGGAAAGTGCTGAGCATGCCCCAAGTGAATATCGTGAAAAAGACCGAGGTGCAGACAGGCGGCTTCAGCAAAGAGTCTATCCTGCCCAAGAGGAACAGCGATAAGCTGATCGCCAGAAAGAAGGACTGGGACCCTAAGAAGTACGGCGGCTTCGACAGCCCCACCGTGGCCTATTCTGTGCTGGTGGTGGCCAAAGTGGAAAAGGGCAAGTCCAAGAAACTGAAGAGTGTGAAAGAGCTGCTGGGGATCACCATCATGGAAAGAAGCAGCTTCGAGAAGAATCCCATCGACTTTCTGGAAGCCAAGGGCTACAAAGAAGTGAAAAAGGACCTGATCATCAAGCTGCCTAAGTACTCCCTGTTCGAGCTGGAAAACGGCCGGAAGAGAATGCTGGCCTCTGCCGGCGAACTGCAGAAGGGAAACGAACTGGCCCTGCCCTCCAAATATGTGAACTTCCTGTACCTGGCCAGCCACTATGAGAAGCTGAAGGGCTCCCCCGAGGATAATGAGCAGAAACAGCTGTTTGTGGAACAGCACAAGCACTACCTGGACGAGATCATCGAGCAGATCAGCGAGTTCTCCAAGAGAGTGATCCTGGCCGACGCTAATCTGGACAAAGTGCTGTCCGCCTACAACAAGCACCGGGATAAGCCCATCAGAGAGCAGGCCGAGAATATCATCCACCTGTTTACCCTGACCAATCTGGGAGCCCCTGCCGCCTTCAAGTACTTTGACACCACCATCGACCGGAAGAGGTACACCAGCACCAAAGAGGTGCTGGACGCCACCCTGATCCACCAGAGCATCACCGGCCTGTACGAGACACGGATCGACCTGTCTCAGCTGGGAGGTGACTCTGGCGGCTCAAAAAGAACCGCCGACGGCAGCGAATTCGAGCCCAAGAAGAAGAGGAAAGTCTAACCGGTCATCATCACCATCACCATTGAGTTTAAACCCGCTGATCAGCCTCGACTGTGCCTTCTAGTTGCCAGCCATCTGTTGTTTGCCCCTCCCCCGTGCCTTCCTTGACCCTGGAAGGTGCCACTCCCACTGTCCTTTCCTAATAAAATGAGGAAATTGCATCGCATTGTCTGAGTAGGTGTCATTCTATTCTGGGGGGTGGGGTGGGGCAGGACAGCAAGGGGGAGGATTGGGAAGACAATAGCAGGCATGCTGGGGATGCGGTGGGCTCTATGGCTTCTGAGGCGGAAAGAACCAGCTGGGGCTCGATACCGTCGACCTCTAGCTAGAGCTTGGCGTAATCATGGTCATAGCTGTTTCCTGTGTGAAATTGTTATCCGCTCACAATTCCACACAACATACGAGCCGGAAGCATAAAGTGTAAAGCCTAGGGTGCCTAATGAGTGAGCTAACTCACATTAATTGCGTTGCGCTCACTGCCCGCTTTCCAGTCGGGAAACCTGTCGTGCCAGCTGCATTAATGAATCGGCCAACGCGCGGGGAGAGGCGGTTTGCGTATTGGGCGCTCTTCCGCTTCCTCGCTCACTGACTCGCTGCGCTCGGTCGTTCGGCTGCGGCGAGCGGTATCAGCTCACTCAAAGGCGGTAATACGGTTATCCACAGAATCAGGGGATAACGCAGGAAAGAACATGTGAGCAAAAGGCCAGCAAAAGGCCAGGAACCGTAAAAAGGCCGCGTTGCTGGCGTTTTTCCATAGGCTCCGCCCCCCTGACGAGCATCACAAAAATCGACGCTCAAGTCAGAGGTGGCGAAACCCGACAGGACTATAAAGATACCAGGCGTTTCCCCCTGGAAGCTCCCTCGTGCGCTCTCCTGTTCCGACCCTGCCGCTTACCGGATACCTGTCCGCCTTTCTCCCTTCGGGAAGCGTGGCGCTTTCTCATAGCTCACGCTGTAGGTATCTCAGTTCGGTGTAGGTCGTTCGCTCCAAGCTGGGCTGTGTGCACGAACCCCCCGTTCAGCCCGACCGCTGCGCCTTATCCGGTAACTATCGTCTTGAGTCCAACCCGGTAAGACACGACTTATCGCCACTGGCAGCAGCCACTGGTAACAGGATTAGCAGAGCGAGGTATGTAGGCGGTGCTACAGAGTTCTTGAAGTGGTGGCCTAACTACGGCTACACTAGAAGAACAGTATTTGGTATCTGCGCTCTGCTGAAGCCAGTTACCTTCGGAAAAAGAGTTGGTAGCTCTTGATCCGGCAAACAAACCACCGCTGGTAGCGGTGGTTTTTTTGTTTGCAAGCAGCAGATTACGCGCAGAAAAAAAGGATCTCAAGAAGATCCTTTGATCTTTTCTACGGGGTCTGACACTCAGTGGAACGAAAACTCACGTTAAGGGATTTTGGTCATGAGATTATCAAAAAGGATCTTCACCTAGATCCTTTTAAATTAAAAATGAAGTTTTAAATCAATCTAAAGTATATATGAGTAAACTTGGTCTGACAGTTACCAATGCTTAATCAGTGAGGCACCTATCTCAGCGATCTGTCTATTTCGTTCATCCATAGTTGCCTGACTCCCCGTCGTGTAGATAACTACGATACGGGAGGGCTTACCATCTGGCCCCAGTGCTGCAATGATACCGCGAGACCCACGCTCACCGGCTCCAGATTTATCAGCAATAAACCAGCCAGCCGGAAGGGCCGAGCGCAGAAGTGGTCCTGCAACTTTATCCGCCTCCATCCAGTCTATTAATTGTTGCCGGGAAGCTAGAGTAAGTAGTTCGCCAGTTAATAGTTTGCGCAACGTTGTTGCCATTGCTACAGGCATCGTGGTGTCACGCTCGTCGTTTGGTATGGCTTCATTCAGCTCCGGTTCCCAACGATCAAGGCGAGTTACATGATCCCCCATGTTGTGCAAAAAAGCGGTTAGCTCCTTCGGTCCTCCGATCGTTGTCAGAAGTAAGTTGGCCGCAGTGTTATCACTCATGGTTATGGCAGCACTGCATAATTCTCTTACTGTCATGCCATCCGTAAGATGCTTTTCTGTGACTGGTGAGTACTCAACCAAGTCATTCTGAGAATAGTGTATGCGGCGACCGAGTTGCTCTTGCCCGGCGTCAATACGGGATAATACCGCGCCACATAGCAGAACTTTAAAAGTGCTCATCATTGGAAAACGTTCTTCGGGGCGAAAACTCTCAAGGATCTTACCGCTGTTGAGATCCAGTTCGATGTAACCCACTCGTGCACCCAACTGATCTTCAGCATCTTTTACTTTCACCAGCGTTTCTGGGTGAGCAAAAACAGGAAGGCAAAATGCCGCAAAAAAGGGAATAAGGGCGACACGGAAATGTTGAATACTCATACTCTTCCTTTTTCAATATTATTGAAGCATTTATCAGGGTTATTGTCTCATGAGCGGATACATATTTGAATGTATTTAGAAAAATAAACAAATAGGGGTTCCGCGCACATTTCCCCGAAAAGTGCCACCTGACGTCGACGGATCGGGAGATCGATCTCCCGATCCCCTAGGGTCGACTCTCAGTACAATCTGCTCTGATGCCGCATAGTTAAGCCAGTATCTGCTCCCTGCTTGTGTGTTGGAGGTCGCTGAGTAGTGCGCGAGCAAAATTTAAGCTACAACAAGGCAAGGCTTGACCGACAATTGCATGAAGAATCTGCTTAGGGTTAGGCGTTTTGCGCTGCTTCGCGATGTACGGGCCAGATATACGCGTTGACATTGATTATTGACTAGTTATTAATAGTAATCAATTACGGGGTCATTAGTTCATAGCCCATATATGGAGTTCCGCGTTACATAACTTACGGTAAATGGCCCGCCTGGCTGACCGCCCAACGACCCCCGCCCATTGACGTCAATAATGACGTATGTTCCCATAGTAACGCCAATAGGGACTTTCCATTGACGTCAATGGGTGGAGTATTTACGGTAAACTGCCCACTTGGCAGTACATCAAGTGTATC

「塩基編集活性」とは、ポリヌクレオチド内の塩基を化学的に改変させるように作用することを意味する。一実施形態では、第一の塩基が第二の塩基に変換される。一実施形態では、塩基編集活性は、アデノシンまたはアデニンデアミナーゼ活性、例えばA・TをG・Cに変換する活性である。塩基編集活性はまた、アデノシンまたはアデニンデアミナーゼ活性、例えばA・TをG・Cに変換する活性、およびシチジンデアミナーゼ活性、例えば標的C・GをT・Aに変換する活性を伴ってもよい。いくつかの実施形態では、塩基編集活性は、編集効率によって評価される。塩基編集効率は、任意の適切な手段によって、例えばサンガー配列決定または次世代配列決定によって測定され得る。いくつかの実施形態では、塩基編集効率は、塩基エディターによって達成された核酸塩基変換を含む総配列決定リードの割合、例えばG.C塩基対に変換された標的A.T塩基対を含む総配列決定リードの割合によって測定される。いくつかの実施形態では、塩基編集効率は、細胞集団において塩基編集を行った際、塩基エディターによって達成された核酸塩基変換を含む総細胞の割合によって測定される。

用語「塩基エディターシステム」とは、標的ヌクレオチド配列の核酸塩基を編集するためのシステムを指す。多様な実施形態では、塩基エディターシステムは、(1) ポリヌクレオチドプログラム可能ヌクレオチド結合ドメイン（例えばCas9）と；（2）前記核酸塩基を脱アミノ化するためのデアミナーゼドメイン（例えばアデノシンデアミナーゼ）と；（3）1つ以上のガイドポリヌクレオチド（例えばガイドRNA）とを含む。いくつかの実施形態では、ポリヌクレオチドプログラム可能ヌクレオチド結合ドメインは、ポリヌクレオチドプログラム可能DNA結合ドメインである。いくつかの実施形態では、塩基エディターは、アデニンまたはアデノシン塩基エディター（ABE）である。いくつかの実施形態では、塩基エディターシステムはABE8である。

いくつかの実施形態では、塩基エディターシステムは、1つより多い塩基編集構成要素を含んでもよい。例えば、塩基エディターシステムは、1つより多いデアミナーゼを含んでもよい。いくつかの実施形態では、塩基エディターシステムは1つ以上のアデノシンデアミナーゼを含んでもよい。いくつかの実施形態では、シングルガイドポリヌクレオチドを利用して、標的核酸配列に、異なるデアミナーゼをターゲティングしてもよい。いくつかの実施形態では、ガイドポリヌクレオチドの単一対を利用して、標的核酸配列に、異なるデアミナーゼをターゲティングしてもよい。

塩基エディターシステムのデアミナーゼドメインおよびポリヌクレオチドプログラム可能ヌクレオチド結合構成要素は、互いに共有的にまたは非共有的に関連付けられてもよいし、あるいはその会合および相互作用の任意の組み合わせによって関連付けられてもよい。例えば、いくつかの実施形態では、デアミナーゼドメインは、ポリヌクレオチドプログラム可能ヌクレオチド結合ドメインによって、標的ヌクレオチド配列に標的指向化されてもよい。いくつかの実施形態では、ポリヌクレオチドプログラム可能ヌクレオチド結合ドメインを、デアミナーゼドメインに融合させるかまたは連結してもよい。いくつかの実施形態では、ポリヌクレオチドプログラム可能ヌクレオチド結合ドメインは、デアミナーゼドメインと非共有的に相互作用するかまたは会合することによって、標的ヌクレオチド配列にデアミナーゼドメインを標的指向化し得る。例えば、いくつかの実施形態では、デアミナーゼドメインは、ポリヌクレオチドプログラム可能ヌクレオチド結合ドメインの一部である、追加の異種部分またはドメインと、相互作用するか、会合するか、または複合体を形成可能である、追加の異種部分またはドメインを含んでもよい。いくつかの実施形態では、追加の異種部分は、ポリペプチドと結合し、相互作用し、会合し、または複合体を形成することが可能であり得る。いくつかの実施形態では、追加の異種部分は、ポリヌクレオチドと結合し、相互作用し、会合し、または複合体を形成可能であり得る。いくつかの実施形態では、追加の異種部分は、ガイドポリヌクレオチドに結合可能であり得る。いくつかの実施形態では、追加の異種部分は、ポリペプチドリンカーに結合可能であり得る。いくつかの実施形態では、追加の異種部分は、ポリヌクレオチドリンカーに結合可能であり得る。追加の異種部分は、タンパク質ドメインであってもよい。いくつかの実施形態では、追加の異種部分は、K相同(KH) ドメイン、MS2コートタンパク質ドメイン、PP7コートタンパク質ドメイン、SfMu Comコートタンパク質ドメイン、ステライルアルファモチーフ、テロメラーゼKu結合モチーフおよびKuタンパク質、テロメラーゼSm7結合モチーフおよびSm7タンパク質、またはRNA認識モチーフであり得る。

塩基エディターシステムは、ガイドポリヌクレオチド構成要素をさらに含むことができる。塩基エディターシステムの構成要素は、共有結合、非共有相互作用、またはそれらの会合および相互作用の任意の組み合わせを介して互いに関連付けされ得ることが理解されるべきである。いくつかの実施形態では、デアミナーゼドメインは、ガイドポリヌクレオチドによって、標的ヌクレオチド配列にターゲティングされ得る。例えば、いくつかの実施形態では、デアミナーゼドメインは、ガイドポリヌクレオチドの一部またはセグメント(例えばポリヌクレオチドモチーフ) と相互作用し、会合し、または複合体を形成可能である追加の異種部分またはドメイン(例えばRNAまたはDNA結合タンパク質のようなポリヌクレオチド結合ドメイン)を含み得る。いくつかの実施形態では、追加の異種部分またはドメイン(例えばRNAまたはDNA結合タンパク質などのポリヌクレオチド結合ドメイン)は、デアミナーゼドメインに融合または連結され得る。いくつかの実施形態では、追加の異種部分は、ポリペプチドと結合するか、相互作用するか、会合するか、または複合体を形成することが可能であり得る。いくつかの実施形態では、追加の異種部分は、ポリヌクレオチドと結合するか、相互作用するか、会合するか、または複合体を形成することが可能であり得る。いくつかの実施形態では、追加の異種部分は、ガイドポリヌクレオチドに結合可能であり得る。いくつかの実施形態では、追加の異種部分は、ポリペプチドリンカーに結合可能であり得る。いくつかの実施形態では、追加の異種部分は、ポリヌクレオチドリンカーに結合可能であり得る。追加の異種部分は、タンパク質ドメインであってもよい。いくつかの実施形態では、追加の異種部分は、K相同(KH) ドメイン、MS2コートタンパク質ドメイン、PP7コートタンパク質ドメイン、SfMu Comコートタンパク質ドメイン、ステライルアルファモチーフ、テロメラーゼKu結合モチーフおよびKuタンパク質、テロメラーゼSm7結合モチーフおよびSm7タンパク質、またはRNA認識モチーフであり得る。

いくつかの実施形態では、塩基エディターシステムは、塩基切除修復（BER）構成要素の阻害因子をさらに含んでもよい。塩基エディターシステムの構成要素は、共有結合、非共有相互作用、またはその会合および相互作用の任意の組み合わせを通じて、互いに関連付けられてもよいことが理解されるべきである。BER構成要素の阻害因子は、BER阻害因子を含んでもよい。いくつかの実施形態では、BERの阻害因子は、ウラシルDNAグリコシラーゼ阻害因子（UGI）であってもよい。いくつかの実施形態では、BERの阻害因子は、イノシンBER阻害因子であってもよい。いくつかの実施形態では、BERの阻害因子は、ポリヌクレオチドプログラム可能ヌクレオチド結合ドメインによって、標的ヌクレオチド配列にターゲティングされていてもよい。いくつかの実施形態では、ポリヌクレオチドプログラム可能ヌクレオチド結合ドメインは、BER阻害因子に融合または連結されていてもよい。いくつかの実施形態では、ポリヌクレオチドプログラム可能ヌクレオチド結合ドメインは、デアミナーゼドメインおよびBERの阻害因子に融合または連結されていてもよい。いくつかの実施形態では、ポリヌクレオチドプログラム可能ヌクレオチド結合ドメインは、BER阻害因子との非共有相互作用または会合によって、BERの阻害因子を標的ヌクレオチド配列にターゲティングしてもよい。例えば、いくつかの実施形態では、BER構成要素の阻害因子は、ポリヌクレオチドプログラム可能ヌクレオチド結合ドメインの一部である追加の異種部分またはドメインと、相互作用するか、会合するか、または複合体を形成することが可能な、追加の異種部分またはドメインを含んでもよい。

いくつかの実施形態では、BERの阻害因子は、ガイドポリヌクレオチドによって、標的ヌクレオチド配列にターゲティングされ得る。例えば、いくつかの実施形態では、BERの阻害因子は、ガイドポリヌクレオチドの一部またはセグメント(例えばポリヌクレオチドモチーフ) と相互作用可能であるか、会合可能であるか、または複合体を形成可能である追加の異種部分またはドメイン(例えばRNAまたはDNA結合タンパク質のようなポリヌクレオチド結合ドメイン)を含み得る。いくつかの実施形態では、ガイドポリヌクレオチドの追加の異種部分またはドメイン(例えばRNAまたはDNA結合タンパク質などのポリヌクレオチド結合ドメイン)は、BERの阻害因子に融合または連結され得る。いくつかの実施形態では、追加の異種部分は、ポリヌクレオチドと結合するか、相互作用するか、会合するか、または複合体を形成することが可能であり得る。いくつかの実施形態では、追加の異種部分は、ガイドポリヌクレオチドに結合可能であり得る。いくつかの実施形態では、追加の異種部分は、ポリペプチドリンカーに結合可能であり得る。いくつかの実施形態では、追加の異種部分は、ポリヌクレオチドリンカーに結合可能であり得る。追加の異種部分は、タンパク質ドメインであってもよい。いくつかの実施形態では、追加の異種部分は、K相同(KH) ドメイン、MS2コートタンパク質ドメイン、PP7コートタンパク質ドメイン、SfMu Comコートタンパク質ドメイン、ステライルアルファモチーフ、テロメラーゼKu結合モチーフおよびKuタンパク質、テロメラーゼSm7結合モチーフおよびSm7タンパク質、またはRNA認識モチーフであり得る。

用語「Cas9」または「Cas9ドメイン」は、Cas9タンパク質またはその断片（例えばCas9の活性、不活性、または部分的に活性なDNA切断ドメイン、および/またはCas9のgRNA結合ドメインを含むタンパク質）を含むRNA誘導型ヌクレアーゼを指す。Cas9ヌクレアーゼは、CasnlヌクレアーゼまたはCRISPR（clustered regularly interspaced short palindromic repeat）会合ヌクレアーゼと呼ばれることもある。CRISPRは、可動性の遺伝要素（ウイルス、転位因子および接合性プラスミド）に対する保護を提供する、適応免疫システムである。CRISPRクラスターは、スペーサー、先行する可動要素に相補的な配列、および標的侵入核酸を含有する。CRISPRクラスターは転写され、CRISPR RNA (crRNA) にプロセシングされる。II型CRISPRシステムでは、pre‐crRNAの正しいプロセシングはトランスエンコード小分子RNA (tracrRNA)、内因性リボヌクレアーゼ3 (rnc) 、およびCas9タンパク質を必要とする。tracrRNAはリボヌクレアーゼ3が補助するpre-crRNAのプロセシングのガイドとなる。続いて、Cas9/crRNA/tracrRNAが、スペーサーに相補的な直鎖または環状のdsDNA標的をエンドヌクレアーゼで切断する。crRNAに相補的でない標的鎖は、最初にエンドヌクレアーゼ的に切断され、次にエキソヌクレアーゼ的に3’-5’にトリムされる。自然界では、DNA結合と切断にはタンパク質と両方のRNAが必要である。しかし、crRNAおよびtracrRNAの両方の態様を単一のRNA種に組み込むように、シングルガイドRNA (「sgRNA」、あるいは単に「gRNA」)を操作することができる。例えばJinek M., Chylinski K., Fonfara I., Hauer M., Doudna J. A., Charpentier E. Science 337:816-821(2012)を参照のこと（その内容全体が参照により本明細書に組み入れられる）。Cas9は、CRISPR反復配列中の短いモチーフ(PAMまたはプロトスペーサー隣接モチーフ)を認識して、「自己」と「非自己」を区別することを助ける。Cas9ヌクレアーゼの配列および構造は、当業者によく知られている(例えば“Complete genome sequence of an Ml strain of Streptococcus pyogenes.”Ferretti et al., J.J., McShan W.M., Ajdic D.J., Savic D.J., Savic G., Lyon K., Primeaux C, Sezate S., Suvorov A.N., Kenton S., Lai H.S., Lin S.P., Qian Y., Jia H.G., Najar F.Z., Ren Q., Zhu H., Song L., White J., Yuan X., Clifton S.W., Roe B.A., McLaughlin R.E., Proc. Natl. Acad. Sci. U.S.A. 98:4658-4663(2001); “CRISPR RNA maturation by trans-encoded small RNA and host factor RNase III.” Deltcheva E., Chylinski K., Sharma CM., Gonzales K., Chao Y., Pirzada Z.A., Eckert M.R., Vogel J., Charpentier E., Nature 471:602-607(2011); および “A programmable dual-RNA-guided DNA endonuclease in adaptive bacterial immunity.” Jinek M., Chylinski K., Fonfara I., Hauer M., Doudna J.A., Charpentier E. Science 337:816-821(2012)を参照のこと。その内容全体が参照により本明細書に組み入れられる)。Cas9オルソログは、限定されるものではないが、S.pyogenesおよびS.thermophilusを含む多様な種において記述されてきた。追加の適切なCas9ヌクレアーゼおよび配列は、本開示に基づいて当業者に明らかとなり、そのようなCas9ヌクレアーゼおよび配列は、Chylinski, Rhun, and Charpentier, “The tracrRNA and Cas9 families of type II CRISPR-Cas immunity systems” (2013) RNA Biology 10:5, 726-737に開示されている生物および遺伝子座由来のCas9配列を含む。その全内容は参照により本明細書に組み込まれる。

例示的なCas9は、Streptococcus pyogenes Cas9（spCas9）であり、そのアミノ酸配列は以下に提供される。

（一重下線：HNHドメイン；二重下線：RuvCドメイン）

ヌクレアーゼ不活性化Cas9タンパク質は、交換可能に「dCas9」タンパク質（nuclease-“dead”Cas9の意）または触媒的に不活性なCas9とも称され得る。不活性なDNA切断ドメインを有するCas9タンパク質(またはその断片)を生成する方法は公知である(例えばJinek et al, Science. 337:816-821(2012); Qi et al, “Repurposing CRISPR as an RNA-Guided Platform for Sequence-Specific Control of Gene Expression” (2013) Cell. 28; 152(5): 1173-83を参照のこと (各々の全内容は参照により本明細書に組み込まれる))。例えば、Cas9のDNA切断ドメインは、HNHヌクレアーゼサブドメインとRuvC1サブドメインという2つのサブドメインを含むことが知られている。HNHサブドメインはgRNAに相補的な鎖を切断し、RuvC1サブドメインは非相補的な鎖を切断する。これらのサブドメイン内の変異はCas9のヌクレアーゼ活性を抑制し得る。例えば、突然変異D10AおよびH840Aは、S. pyogenes Cas9 のヌクレアーゼ活性を完全に不活性化する（Jinek et al, Science. 337:816-821(2012); Qi et al, Cell. 28;152(5): 1173-83 (2013)）。いくつかの実施形態では、Cas9ヌクレアーゼは、不活性な(例えば不活化された) DNA切断ドメインを有し、すなわち、Cas9は、「nCas9」タンパク質（「nickase」Cas9の意）と呼ばれるニッカーゼである。いくつかの実施形態では、Cas9の断片を含むタンパク質を提供する。例えば、いくつかの実施形態では、タンパク質は、2つのCas9ドメイン：（1）Cas9のgRNA結合ドメイン；または（２）Cas9のDNA切断ドメインの1つを含む。いくつかの実施形態では、Cas9またはその断片を含むタンパク質は、「Cas9バリアント」と称される。Cas9バリアントは、Cas9またはその断片に対する相同性を共有する。例えば、Cas9バリアントは、野生型Cas9に、少なくとも約70%同一、少なくとも約80%同一、少なくとも約90%同一、少なくとも約95%同一、少なくとも約96%同一、少なくとも約97%同一、少なくとも約98%同一、少なくとも約99%同一、少なくとも約99.5%同一、または少なくとも約99.9%同一である。いくつかの実施形態では、Cas9バリアントは、野生型Cas9に比較して、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、21、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50またはそれより多いアミノ酸変化を有してもよい。
いくつかの実施形態では、Cas9バリアントはCas9の断片（例えばgRNA結合ドメインまたはDNA切断ドメイン）を含み、断片は、野生型Cas9の対応する断片に、少なくとも約70%同一、少なくとも約80%同一、少なくとも約90%同一、少なくとも約95%同一、少なくとも約96%同一、少なくとも約97%同一、少なくとも約98%同一、少なくとも約99%同一、少なくとも約99.5%同一、または少なくとも約99.9%同一である。いくつかの実施形態では、断片は、対応する野生型Cas9のアミノ酸の長さの少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%、または少なくとも約99.5%である。

いくつかの実施形態では、断片は、長さ少なくとも100アミノ酸である。いくつかの実施形態では、断片は、長さ少なくとも100、150、200、250、300、350、400、450、500、550、600、650、700、750、800、850、900、950、1000、1050、1100、1150、1200、1250、または少なくとも1300アミノ酸である。

いくつかの実施形態では、野生型Cas9は、Streptococcus pyogenes由来のCas9に対応する（NCBI参照配列：NC_017053.1、ヌクレオチドおよびアミノ酸の配列は以下の通り）。
ATGGATAAGAAATACTCAATAGGCTTAGATATCGGCACAAATAGCGTCGGATGGGCGGTGATCACTGATGATTATAAGGTTCCGTCTAAAAAGTTCAAGGTTCTGGGAAATACAGACCGCCACAGTATCAAAAAAAATCTTATAGGGGCTCTTTTATTTGGCAGTGGAGAGACAGCGGAAGCGACTCGTCTCAAACGGACAGCTCGTAGAAGGTATACACGTCGGAAGAATCGTATTTGTTATCTACAGGAGATTTTTTCAAATGAGATGGCGAAAGTAGATGATAGTTTCTTTCATCGACTTGAAGAGTCTTTTTTGGTGGAAGAAGACAAGAAGCATGAACGTCATCCTATTTTTGGAAATATAGTAGATGAAGTTGCTTATCATGAGAAATATCCAACTATCTATCATCTGCGAAAAAAATTGGCAGATTCTACTGATAAAGCGGATTTGCGCTTAATCTATTTGGCCTTAGCGCATATGATTAAGTTTCGTGGTCATTTTTTGATTGAGGGAGATTTAAATCCTGATAATAGTGATGTGGACAAACTATTTATCCAGTTGGTACAAATCTACAATCAATTATTTGAAGAAAACCCTATTAACGCAAGTAGAGTAGATGCTAAAGCGATTCTTTCTGCACGATTGAGTAAATCAAGACGATTAGAAAATCTCATTGCTCAGCTCCCCGGTGAGAAGAGAAATGGCTTGTTTGGGAATCTCATTGCTTTGTCATTGGGATTGACCCCTAATTTTAAATCAAATTTTGATTTGGCAGAAGATGCTAAATTACAGCTTTCAAAAGATACTTACGATGATGATTTAGATAATTTATTGGCGCAAATTGGAGATCAATATGCTGATTTGTTTTTGGCAGCTAAGAATTTATCAGATGCTATTTTACTTTCAGATATCCTAAGAGTAAATAGTGAAATAACTAAGGCTCCCCTATCAGCTTCAATGATTAAGCGCTACGATGAACATCATCAAGACTTGACTCTTTTAAAAGCTTTAGTTCGACAACAACTTCCAGAAAAGTATAAAGAAATCTTTTTTGATCAATCAAAAAACGGATATGCAGGTTATATTGATGGGGGAGCTAGCCAAGAAGAATTTTATAAATTTATCAAACCAATTTTAGAAAAAATGGATGGTACTGAGGAATTATTGGTGAAACTAAATCGTGAAGATTTGCTGCGCAAGCAACGGACCTTTGACAACGGCTCTATTCCCCATCAAATTCACTTGGGTGAGCTGCATGCTATTTTGAGAAGACAAGAAGACTTTTATCCATTTTTAAAAGACAATCGTGAGAAGATTGAAAAAATCTTGACTTTTCGAATTCCTTATTATGTTGGTCCATTGGCGCGTGGCAATAGTCGTTTTGCATGGATGACTCGGAAGTCTGAAGAAACAATTACCCCATGGAATTTTGAAGAAGTTGTCGATAAAGGTGCTTCAGCTCAATCATTTATTGAACGCATGACAAACTTTGATAAAAATCTTCCAAATGAAAAAGTACTACCAAAACATAGTTTGCTTTATGAGTATTTTACGGTTTATAACGAATTGACAAAGGTCAAATATGTTACTGAGGGAATGCGAAAACCAGCATTTCTTTCAGGTGAACAGAAGAAAGCCATTGTTGATTTACTCTTCAAAACAAATCGAAAAGTAACCGTTAAGCAATTAAAAGAAGATTATTTCAAAAAAATAGAATGTTTTGATAGTGTTGAAATTTCAGGAGTTGAAGATAGATTTAATGCTTCATTAGGCGCCTACCATGATTTGCTAAAAATTATTAAAGATAAAGATTTTTTGGATAATGAAGAAAATGAAGATATCTTAGAGGATATTGTTTTAACATTGACCTTATTTGAAGATAGGGGGATGATTGAGGAAAGACTTAAAACATATGCTCACCTCTTTGATGATAAGGTGATGAAACAGCTTAAACGTCGCCGTTATACTGGTTGGGGACGTTTGTCTCGAAAATTGATTAATGGTATTAGGGATAAGCAATCTGGCAAAACAATATTAGATTTTTTGAAATCAGATGGTTTTGCCAATCGCAATTTTATGCAGCTGATCCATGATGATAGTTTGACATTTAAAGAAGATATTCAAAAAGCACAGGTGTCTGGACAAGGCCATAGTTTACATGAACAGATTGCTAACTTAGCTGGCAGTCCTGCTATTAAAAAAGGTATTTTACAGACTGTAAAAATTGTTGATGAACTGGTCAAAGTAATGGGGCATAAGCCAGAAAATATCGTTATTGAAATGGCACGTGAAAATCAGACAACTCAAAAGGGCCAGAAAAATTCGCGAGAGCGTATGAAACGAATCGAAGAAGGTATCAAAGAATTAGGAAGTCAGATTCTTAAAGAGCATCCTGTTGAAAATACTCAATTGCAAAATGAAAAGCTCTATCTCTATTATCTACAAAATGGAAGAGACATGTATGTGGACCAAGAATTAGATATTAATCGTTTAAGTGATTATGATGTCGATCACATTGTTCCACAAAGTTTCATTAAAGACGATTCAATAGACAATAAGGTACTAACGCGTTCTGATAAAAATCGTGGTAAATCGGATAACGTTCCAAGTGAAGAAGTAGTCAAAAAGATGAAAAACTATTGGAGACAACTTCTAAACGCCAAGTTAATCACTCAACGTAAGTTTGATAATTTAACGAAAGCTGAACGTGGAGGTTTGAGTGAACTTGATAAAGCTGGTTTTATCAAACGCCAATTGGTTGAAACTCGCCAAATCACTAAGCATGTGGCACAAATTTTGGATAGTCGCATGAATACTAAATACGATGAAAATGATAAACTTATTCGAGAGGTTAAAGTGATTACCTTAAAATCTAAATTAGTTTCTGACTTCCGAAAAGATTTCCAATTCTATAAAGTACGTGAGATTAACAATTACCATCATGCCCATGATGCGTATCTAAATGCCGTCGTTGGAACTGCTTTGATTAAGAAATATCCAAAACTTGAATCGGAGTTTGTCTATGGTGATTATAAAGTTTATGATGTTCGTAAAATGATTGCTAAGTCTGAGCAAGAAATAGGCAAAGCAACCGCAAAATATTTCTTTTACTCTAATATCATGAACTTCTTCAAAACAGAAATTACACTTGCAAATGGAGAGATTCGCAAACGCCCTCTAATCGAAACTAATGGGGAAACTGGAGAAATTGTCTGGGATAAAGGGCGAGATTTTGCCACAGTGCGCAAAGTATTGTCCATGCCCCAAGTCAATATTGTCAAGAAAACAGAAGTACAGACAGGCGGATTCTCCAAGGAGTCAATTTTACCAAAAAGAAATTCGGACAAGCTTATTGCTCGTAAAAAAGACTGGGATCCAAAAAAATATGGTGGTTTTGATAGTCCAACGGTAGCTTATTCAGTCCTAGTGGTTGCTAAGGTGGAAAAAGGGAAATCGAAGAAGTTAAAATCCGTTAAAGAGTTACTAGGGATCACAATTATGGAAAGAAGTTCCTTTGAAAAAAATCCGATTGACTTTTTAGAAGCTAAAGGATATAAGGAAGTTAAAAAAGACTTAATCATTAAACTACCTAAATATAGTCTTTTTGAGTTAGAAAACGGTCGTAAACGGATGCTGGCTAGTGCCGGAGAATTACAAAAAGGAAATGAGCTGGCTCTGCCAAGCAAATATGTGAATTTTTTATATTTAGCTAGTCATTATGAAAAGTTGAAGGGTAGTCCAGAAGATAACGAACAAAAACAATTGTTTGTGGAGCAGCATAAGCATTATTTAGATGAGATTATTGAGCAAATCAGTGAATTTTCTAAGCGTGTTATTTTAGCAGATGCCAATTTAGATAAAGTTCTTAGTGCATATAACAAACATAGAGACAAACCAATACGTGAACAAGCAGAAAATATTATTCATTTATTTACGTTGACGAATCTTGGAGCTCCCGCTGCTTTTAAATATTTTGATACAACAATTGATCGTAAACGATATACGTCTACAAAAGAAGTTTTAGATGCCACTCTTATCCATCAATCCATCACTGGTCTTTATGAAACACGCATTGATTTGAGTCAGCTAGGAGGTGACTGA

（一重下線：HNHドメイン；二重下線：RuvCドメイン）

いくつかの実施形態では、野生型Cas9は、以下のヌクレオチドおよび/またはアミノ酸配列に対応するか、またはこれらを含む：
ATGGATAAAAAGTATTCTATTGGTTTAGACATCGGCACTAATTCCGTTGGATGGGCTGTCATAACCGATGAATACAAAGTACCTTCAAAGAAATTTAAGGTGTTGGGGAACACAGACCGTCATTCGATTAAAAAGAATCTTATCGGTGCCCTCCTATTCGATAGTGGCGAAACGGCAGAGGCGACTCGCCTGAAACGAACCGCTCGGAGAAGGTATACACGTCGCAAGAACCGAATATGTTACTTACAAGAAATTTTTAGCAATGAGATGGCCAAAGTTGACGATTCTTTCTTTCACCGTTTGGAAGAGTCCTTCCTTGTCGAAGAGGACAAGAAACATGAACGGCACCCCATCTTTGGAAACATAGTAGATGAGGTGGCATATCATGAAAAGTACCCAACGATTTATCACCTCAGAAAAAAGCTAGTTGACTCAACTGATAAAGCGGACCTGAGGTTAATCTACTTGGCTCTTGCCCATATGATAAAGTTCCGTGGGCACTTTCTCATTGAGGGTGATCTAAATCCGGACAACTCGGATGTCGACAAACTGTTCATCCAGTTAGTACAAACCTATAATCAGTTGTTTGAAGAGAACCCTATAAATGCAAGTGGCGTGGATGCGAAGGCTATTCTTAGCGCCCGCCTCTCTAAATCCCGACGGCTAGAAAACCTGATCGCACAATTACCCGGAGAGAAGAAAAATGGGTTGTTCGGTAACCTTATAGCGCTCTCACTAGGCCTGACACCAAATTTTAAGTCGAACTTCGACTTAGCTGAAGATGCCAAATTGCAGCTTAGTAAGGACACGTACGATGACGATCTCGACAATCTACTGGCACAAATTGGAGATCAGTATGCGGACTTATTTTTGGCTGCCAAAAACCTTAGCGATGCAATCCTCCTATCTGACATACTGAGAGTTAATACTGAGATTACCAAGGCGCCGTTATCCGCTTCAATGATCAAAAGGTACGATGAACATCACCAAGACTTGACACTTCTCAAGGCCCTAGTCCGTCAGCAACTGCCTGAGAAATATAAGGAAATATTCTTTGATCAGTCGAAAAACGGGTACGCAGGTTATATTGACGGCGGAGCGAGTCAAGAGGAATTCTACAAGTTTATCAAACCCATATTAGAGAAGATGGATGGGACGGAAGAGTTGCTTGTAAAACTCAATCGCGAAGATCTACTGCGAAAGCAGCGGACTTTCGACAACGGTAGCATTCCACATCAAATCCACTTAGGCGAATTGCATGCTATACTTAGAAGGCAGGAGGATTTTTATCCGTTCCTCAAAGACAATCGTGAAAAGATTGAGAAAATCCTAACCTTTCGCATACCTTACTATGTGGGACCCCTGGCCCGAGGGAACTCTCGGTTCGCATGGATGACAAGAAAGTCCGAAGAAACGATTACTCCATGGAATTTTGAGGAAGTTGTCGATAAAGGTGCGTCAGCTCAATCGTTCATCGAGAGGATGACCAACTTTGACAAGAATTTACCGAACGAAAAAGTATTGCCTAAGCACAGTTTACTTTACGAGTATTTCACAGTGTACAATGAACTCACGAAAGTTAAGTATGTCACTGAGGGCATGCGTAAACCCGCCTTTCTAAGCGGAGAACAGAAGAAAGCAATAGTAGATCTGTTATTCAAGACCAACCGCAAAGTGACAGTTAAGCAATTGAAAGAGGACTACTTTAAGAAAATTGAATGCTTCGATTCTGTCGAGATCTCCGGGGTAGAAGATCGATTTAATGCGTCACTTGGTACGTATCATGACCTCCTAAAGATAATTAAAGATAAGGACTTCCTGGATAACGAAGAGAATGAAGATATCTTAGAAGATATAGTGTTGACTCTTACCCTCTTTGAAGATCGGGAAATGATTGAGGAAAGACTAAAAACATACGCTCACCTGTTCGACGATAAGGTTATGAAACAGTTAAAGAGGCGTCGCTATACGGGCTGGGGACGATTGTCGCGGAAACTTATCAACGGGATAAGAGACAAGCAAAGTGGTAAAACTATTCTCGATTTTCTAAAGAGCGACGGCTTCGCCAATAGGAACTTTATGCAGCTGATCCATGATGACTCTTTAACCTTCAAAGAGGATATACAAAAGGCACAGGTTTCCGGACAAGGGGACTCATTGCACGAACATATTGCGAATCTTGCTGGTTCGCCAGCCATCAAAAAGGGCATACTCCAGACAGTCAAAGTAGTGGATGAGCTAGTTAAGGTCATGGGACGTCACAAACCGGAAAACATTGTAATCGAGATGGCACGCGAAAATCAAACGACTCAGAAGGGGCAAAAAAACAGTCGAGAGCGGATGAAGAGAATAGAAGAGGGTATTAAAGAACTGGGCAGCCAGATCTTAAAGGAGCATCCTGTGGAAAATACCCAATTGCAGAACGAGAAACTTTACCTCTATTACCTACAAAATGGAAGGGACATGTATGTTGATCAGGAACTGGACATAAACCGTTTATCTGATTACGACGTCGATCACATTGTACCCCAATCCTTTTTGAAGGACGATTCAATCGACAATAAAGTGCTTACACGCTCGGATAAGAACCGAGGGAAAAGTGACAATGTTCCAAGCGAGGAAGTCGTAAAGAAAATGAAGAACTATTGGCGGCAGCTCCTAAATGCGAAACTGATAACGCAAAGAAAGTTCGATAACTTAACTAAAGCTGAGAGGGGTGGCTTGTCTGAACTTGACAAGGCCGGATTTATTAAACGTCAGCTCGTGGAAACCCGCCAAATCACAAAGCATGTTGCACAGATACTAGATTCCCGAATGAATACGAAATACGACGAGAACGATAAGCTGATTCGGGAAGTCAAAGTAATCACTTTAAAGTCAAAATTGGTGTCGGACTTCAGAAAGGATTTTCAATTCTATAAAGTTAGGGAGATAAATAACTACCACCATGCGCACGACGCTTATCTTAATGCCGTCGTAGGGACCGCACTCATTAAGAAATACCCGAAGCTAGAAAGTGAGTTTGTGTATGGTGATTACAAAGTTTATGACGTCCGTAAGATGATCGCGAAAAGCGAACAGGAGATAGGCAAGGCTACAGCCAAATACTTCTTTTATTCTAACATTATGAATTTCTTTAAGACGGAAATCACTCTGGCAAACGGAGAGATACGCAAACGACCTTTAATTGAAACCAATGGGGAGACAGGTGAAATCGTATGGGATAAGGGCCGGGACTTCGCGACGGTGAGAAAAGTTTTGTCCATGCCCCAAGTCAACATAGTAAAGAAAACTGAGGTGCAGACCGGAGGGTTTTCAAAGGAATCGATTCTTCCAAAAAGGAATAGTGATAAGCTCATCGCTCGTAAAAAGGACTGGGACCCGAAAAAGTACGGTGGCTTCGATAGCCCTACAGTTGCCTATTCTGTCCTAGTAGTGGCAAAAGTTGAGAAGGGAAAATCCAAGAAACTGAAGTCAGTCAAAGAATTATTGGGGATAACGATTATGGAGCGCTCGTCTTTTGAAAAGAACCCCATCGACTTCCTTGAGGCGAAAGGTTACAAGGAAGTAAAAAAGGATCTCATAATTAAACTACCAAAGTATAGTCTGTTTGAGTTAGAAAATGGCCGAAAACGGATGTTGGCTAGCGCCGGAGAGCTTCAAAAGGGGAACGAACTCGCACTACCGTCTAAATACGTGAATTTCCTGTATTTAGCGTCCCATTACGAGAAGTTGAAAGGTTCACCTGAAGATAACGAACAGAAGCAACTTTTTGTTGAGCAGCACAAACATTATCTCGACGAAATCATAGAGCAAATTTCGGAATTCAGTAAGAGAGTCATCCTAGCTGATGCCAATCTGGACAAAGTATTAAGCGCATACAACAAGCACAGGGATAAACCCATACGTGAGCAGGCGGAAAATATTATCCATTTGTTTACTCTTACCAACCTCGGCGCTCCAGCCGCATTCAAGTATTTTGACACAACGATAGATCGCAAACGATACACTTCTACCAAGGAGGTGCTAGACGCGACACTGATTCACCAATCCATCACGGGATTATATGAAACTCGGATAGATTTGTCACAGCTTGGGGGTGACGGATCCCCCAAGAAGAAGAGGAAAGTCTCGAGCGACTACAAAGACCATGACGGTGATTATAAAGATCATGACATCGATTACAAGGATGACGATGACAAGGCTGCAGGA

（一重下線：HNHドメイン；二重下線：RuvCドメイン）

いくつかの実施形態では、野生型Cas9は、Streptococcus pyogenes由来のCas9に対応する（NCBI参照配列: NC_002737.2（ヌクレオチド配列は以下の通り）およびUniprot参照配列: Q99ZW2（アミノ酸配列は以下の通り）：
ATGGATAAGAAATACTCAATAGGCTTAGATATCGGCACAAATAGCGTCGGATGGGCGGTGATCACTGATGAATATAAGGTTCCGTCTAAAAAGTTCAAGGTTCTGGGAAATACAGACCGCCACAGTATCAAAAAAAATCTTATAGGGGCTCTTTTATTTGACAGTGGAGAGACAGCGGAAGCGACTCGTCTCAAACGGACAGCTCGTAGAAGGTATACACGTCGGAAGAATCGTATTTGTTATCTACAGGAGATTTTTTCAAATGAGATGGCGAAAGTAGATGATAGTTTCTTTCATCGACTTGAAGAGTCTTTTTTGGTGGAAGAAGACAAGAAGCATGAACGTCATCCTATTTTTGGAAATATAGTAGATGAAGTTGCTTATCATGAGAAATATCCAACTATCTATCATCTGCGAAAAAAATTGGTAGATTCTACTGATAAAGCGGATTTGCGCTTAATCTATTTGGCCTTAGCGCATATGATTAAGTTTCGTGGTCATTTTTTGATTGAGGGAGATTTAAATCCTGATAATAGTGATGTGGACAAACTATTTATCCAGTTGGTACAAACCTACAATCAATTATTTGAAGAAAACCCTATTAACGCAAGTGGAGTAGATGCTAAAGCGATTCTTTCTGCACGATTGAGTAAATCAAGACGATTAGAAAATCTCATTGCTCAGCTCCCCGGTGAGAAGAAAAATGGCTTATTTGGGAATCTCATTGCTTTGTCATTGGGTTTGACCCCTAATTTTAAATCAAATTTTGATTTGGCAGAAGATGCTAAATTACAGCTTTCAAAAGATACTTACGATGATGATTTAGATAATTTATTGGCGCAAATTGGAGATCAATATGCTGATTTGTTTTTGGCAGCTAAGAATTTATCAGATGCTATTTTACTTTCAGATATCCTAAGAGTAAATACTGAAATAACTAAGGCTCCCCTATCAGCTTCAATGATTAAACGCTACGATGAACATCATCAAGACTTGACTCTTTTAAAAGCTTTAGTTCGACAACAACTTCCAGAAAAGTATAAAGAAATCTTTTTTGATCAATCAAAAAACGGATATGCAGGTTATATTGATGGGGGAGCTAGCCAAGAAGAATTTTATAAATTTATCAAACCAATTTTAGAAAAAATGGATGGTACTGAGGAATTATTGGTGAAACTAAATCGTGAAGATTTGCTGCGCAAGCAACGGACCTTTGACAACGGCTCTATTCCCCATCAAATTCACTTGGGTGAGCTGCATGCTATTTTGAGAAGACAAGAAGACTTTTATCCATTTTTAAAAGACAATCGTGAGAAGATTGAAAAAATCTTGACTTTTCGAATTCCTTATTATGTTGGTCCATTGGCGCGTGGCAATAGTCGTTTTGCATGGATGACTCGGAAGTCTGAAGAAACAATTACCCCATGGAATTTTGAAGAAGTTGTCGATAAAGGTGCTTCAGCTCAATCATTTATTGAACGCATGACAAACTTTGATAAAAATCTTCCAAATGAAAAAGTACTACCAAAACATAGTTTGCTTTATGAGTATTTTACGGTTTATAACGAATTGACAAAGGTCAAATATGTTACTGAAGGAATGCGAAAACCAGCATTTCTTTCAGGTGAACAGAAGAAAGCCATTGTTGATTTACTCTTCAAAACAAATCGAAAAGTAACCGTTAAGCAATTAAAAGAAGATTATTTCAAAAAAATAGAATGTTTTGATAGTGTTGAAATTTCAGGAGTTGAAGATAGATTTAATGCTTCATTAGGTACCTACCATGATTTGCTAAAAATTATTAAAGATAAAGATTTTTTGGATAATGAAGAAAATGAAGATATCTTAGAGGATATTGTTTTAACATTGACCTTATTTGAAGATAGGGAGATGATTGAGGAAAGACTTAAAACATATGCTCACCTCTTTGATGATAAGGTGATGAAACAGCTTAAACGTCGCCGTTATACTGGTTGGGGACGTTTGTCTCGAAAATTGATTAATGGTATTAGGGATAAGCAATCTGGCAAAACAATATTAGATTTTTTGAAATCAGATGGTTTTGCCAATCGCAATTTTATGCAGCTGATCCATGATGATAGTTTGACATTTAAAGAAGACATTCAAAAAGCACAAGTGTCTGGACAAGGCGATAGTTTACATGAACATATTGCAAATTTAGCTGGTAGCCCTGCTATTAAAAAAGGTATTTTACAGACTGTAAAAGTTGTTGATGAATTGGTCAAAGTAATGGGGCGGCATAAGCCAGAAAATATCGTTATTGAAATGGCACGTGAAAATCAGACAACTCAAAAGGGCCAGAAAAATTCGCGAGAGCGTATGAAACGAATCGAAGAAGGTATCAAAGAATTAGGAAGTCAGATTCTTAAAGAGCATCCTGTTGAAAATACTCAATTGCAAAATGAAAAGCTCTATCTCTATTATCTCCAAAATGGAAGAGACATGTATGTGGACCAAGAATTAGATATTAATCGTTTAAGTGATTATGATGTCGATCACATTGTTCCACAAAGTTTCCTTAAAGACGATTCAATAGACAATAAGGTCTTAACGCGTTCTGATAAAAATCGTGGTAAATCGGATAACGTTCCAAGTGAAGAAGTAGTCAAAAAGATGAAAAACTATTGGAGACAACTTCTAAACGCCAAGTTAATCACTCAACGTAAGTTTGATAATTTAACGAAAGCTGAACGTGGAGGTTTGAGTGAACTTGATAAAGCTGGTTTTATCAAACGCCAATTGGTTGAAACTCGCCAAATCACTAAGCATGTGGCACAAATTTTGGATAGTCGCATGAATACTAAATACGATGAAAATGATAAACTTATTCGAGAGGTTAAAGTGATTACCTTAAAATCTAAATTAGTTTCTGACTTCCGAAAAGATTTCCAATTCTATAAAGTACGTGAGATTAACAATTACCATCATGCCCATGATGCGTATCTAAATGCCGTCGTTGGAACTGCTTTGATTAAGAAATATCCAAAACTTGAATCGGAGTTTGTCTATGGTGATTATAAAGTTTATGATGTTCGTAAAATGATTGCTAAGTCTGAGCAAGAAATAGGCAAAGCAACCGCAAAATATTTCTTTTACTCTAATATCATGAACTTCTTCAAAACAGAAATTACACTTGCAAATGGAGAGATTCGCAAACGCCCTCTAATCGAAACTAATGGGGAAACTGGAGAAATTGTCTGGGATAAAGGGCGAGATTTTGCCACAGTGCGCAAAGTATTGTCCATGCCCCAAGTCAATATTGTCAAGAAAACAGAAGTACAGACAGGCGGATTCTCCAAGGAGTCAATTTTACCAAAAAGAAATTCGGACAAGCTTATTGCTCGTAAAAAAGACTGGGATCCAAAAAAATATGGTGGTTTTGATAGTCCAACGGTAGCTTATTCAGTCCTAGTGGTTGCTAAGGTGGAAAAAGGGAAATCGAAGAAGTTAAAATCCGTTAAAGAGTTACTAGGGATCACAATTATGGAAAGAAGTTCCTTTGAAAAAAATCCGATTGACTTTTTAGAAGCTAAAGGATATAAGGAAGTTAAAAAAGACTTAATCATTAAACTACCTAAATATAGTCTTTTTGAGTTAGAAAACGGTCGTAAACGGATGCTGGCTAGTGCCGGAGAATTACAAAAAGGAAATGAGCTGGCTCTGCCAAGCAAATATGTGAATTTTTTATATTTAGCTAGTCATTATGAAAAGTTGAAGGGTAGTCCAGAAGATAACGAACAAAAACAATTGTTTGTGGAGCAGCATAAGCATTATTTAGATGAGATTATTGAGCAAATCAGTGAATTTTCTAAGCGTGTTATTTTAGCAGATGCCAATTTAGATAAAGTTCTTAGTGCATATAACAAACATAGAGACAAACCAATACGTGAACAAGCAGAAAATATTATTCATTTATTTACGTTGACGAATCTTGGAGCTCCCGCTGCTTTTAAATATTTTGATACAACAATTGATCGTAAACGATATACGTCTACAAAAGAAGTTTTAGATGCCACTCTTATCCATCAATCCATCACTGGTCTTTATGAAACACGCATTGATTTGAGTCAGCTAGGAGGTGACTGA

（配列番号1。一重下線：HNHドメイン；二重下線：RuvCドメイン）

いくつかの実施形態では、Cas9は、Corynebacterium ulcerans (NCBI参照: NC_015683.1, NC_017317.1); Corynebacterium diphtheria (NCBI参照: NC_016782.1, NC_016786.1); Spiroplasma syrphidicola (NCBI参照: NC_021284.1); Prevotella intermedia (NCBI参照: NC_017861.1); Spiroplasma taiwanense (NCBI参照: NC_021846.1); Streptococcus iniae (NCBI参照: NC_021314.1); Belliella baltica (NCBI参照: NC_018010.1); Psychroflexus torquisI (NCBI参照: NC_018721.1); Streptococcus thermophilus (NCBI参照: YP_820832.1), Listeria innocua (NCBI参照: NP_472073.1), Campylobacter jejuni (NCBI参照: YP_002344900.1) もしくは Neisseria meningitidis (NCBI参照: YP_002342100.1) 由来のCas9を表し、または任意の他の生物由来のCas9を表す。

いくつかの実施形態では、Cas9はNeisseria meningitidis Cas9（NmeCas9）またはそのバリアントである。いくつかの実施形態では、NmeCas9は、NNNNGAYW PAMに対する特異性を有し、YはCまたはTであり、WはAまたはTである。いくつかの実施形態では、NmeCas9はNNNNGYTT PAMに対する特異性を有し、YはCまたはTである。いくつかの実施形態では、NmeCas9はNNNNGTCT PAMに対する特異性を有する。いくつかの実施形態では、NmeCas9はNme1 Cas9である。いくつかの実施形態では、NmeCas9は、NNNNGATT PAM、NNNNCCTA PAM、NNNNCCTC PAM、NNNNCCTT PAM、NNNNCCTG PAM、NNNNCCGT PAM、NNNNCCGGPAM、NNNNCCCA PAM、NNNNCCCT PAM、NNNNCCCC PAM、NNNNCCAT PAM、NNNNCCAG PAM、NNNNCCAT PAM、またはNNNGATT PAMに対する特異性を有する。いくつかの実施形態では、Nme1Cas9は、NNNNGATT PAM、NNNNCCTA PAM、NNNNCCTC PAM、NNNNCCTT PAM、またはNNNNCCTG PAMに対する特異性を有する。いくつかの実施形態では、NmeCas9はCAA PAM、CAAA PAM、またはCCA PAMに対する特異性を有する。いくつかの実施形態では、NmeCas9はNme2 Cas9である。いくつかの実施形態では、NmeCas9は、NNNNCC (N4CC) PAMに対する特異性を有し、NはA、G、C、またはTのいずれか1つである。いくつかの実施形態では、NmeCas9は、NNNNCCGT PAM、NNNNCCGGPAM、NNNNCCCA PAM、NNNNCCCT PAM、NNNNCCCC PAM、NNNNCCAT PAM、NNNNCCAG PAM、NNNNCCAT PAM、またはNNNGATT PAMに対する特異性を有する。いくつかの実施形態では、NmeCas9はNme3Cas9である。いくつかの実施形態では、NmeCas9は、NNNNCAAA PAM、NNNNCC PAM、またはNNNNCNNN PAMに対する特異性を有する。いくつかの実施形態では、Nme1、Nme2またはNme3のPAM相互作用ドメインは、それぞれ、N₄GAT、N₄CC、およびN₄CAAAである。さらなるNmeCas9の特徴およびPAM配列は、Edraki et al., A Compact, High-Accuracy Cas9 with a Dinucleotide PAM for In Vivo Genome Editing, Mol. Cell. (2019) 73(4): 714-726に記載され、該文献はその全体が参照により本明細書に組み込まれる。

例示的なNeisseria meningitidis Cas9タンパク質、Nme1Cas9, (NCBI参照: WP_002235162.1; II型CRISPR RNA誘導型エンドヌクレアーゼCas9)は、以下のアミノ酸配列を有する：
1 maafkpnpin yilgldigia svgwamveid edenpiclid lgvrvferae vpktgdslam
61 arrlarsvrr ltrrrahrll rarrllkreg vlqaadfden glikslpntp wqlraaaldr
121 kltplewsav llhlikhrgy lsqrkneget adkelgallk gvadnahalq tgdfrtpael
181 alnkfekesg hirnqrgdys htfsrkdlqa elillfekqk efgnphvsgg lkegietllm
241 tqrpalsgda vqkmlghctf epaepkaakn tytaerfiwl tklnnlrile qgserpltdt
301 eratlmdepy rkskltyaqa rkllgledta ffkglrygkd naeastlmem kayhaisral
361 ekeglkdkks plnlspelqd eigtafslfk tdeditgrlk driqpeilea llkhisfdkf
421 vqislkalrr ivplmeqgkr ydeacaeiyg dhygkkntee kiylppipad eirnpvvlra
481 lsqarkving vvrrygspar ihietarevg ksfkdrkeie krqeenrkdr ekaaakfrey
541 fpnfvgepks kdilklrlye qqhgkclysg keinlgrlne kgyveidhal pfsrtwddsf
601 nnkvlvlgse nqnkgnqtpy eyfngkdnsr ewqefkarve tsrfprskkq rillqkfded
661 gfkernlndt ryvnrflcqf vadrmrltgk gkkrvfasng qitnllrgfw glrkvraend
721 rhhaldavvv acstvamqqk itrfvrykem nafdgktidk etgevlhqkt hfpqpweffa
781 qevmirvfgk pdgkpefeea dtpeklrtll aeklssrpea vheyvtplfv srapnrkmsg
841 qghmetvksa krldegvsvl rvpltqlklk dlekmvnrer epklyealka rleahkddpa
901 kafaepfyky dkagnrtqqv kavrveqvqk tgvwvrnhng iadnatmvrv dvfekgdkyy
961 lvpiyswqva kgilpdravv qgkdeedwql iddsfnfkfs lhpndlvevi tkkarmfgyf
1021 aschrgtgni nirihdldhk igkngilegi gvktalsfqk yqidelgkei rpcrlkkrpp
1081 vr

別の例示的なNeisseria meningitidis Cas9タンパク質、Nme2Cas9, (NCBI参照: WP_002230835; II型CRISPR RNA誘導型エンドヌクレアーゼCas9) は、以下のアミノ酸配列を有する：
1 maafkpnpin yilgldigia svgwamveid eeenpirlid lgvrvferae vpktgdslam
61 arrlarsvrr ltrrrahrll rarrllkreg vlqaadfden glikslpntp wqlraaaldr
121 kltplewsav llhlikhrgy lsqrkneget adkelgallk gvannahalq tgdfrtpael
181 alnkfekesg hirnqrgdys htfsrkdlqa elillfekqk efgnphvsgg lkegietllm
241 tqrpalsgda vqkmlghctf epaepkaakn tytaerfiwl tklnnlrile qgserpltdt
301 eratlmdepy rkskltyaqa rkllgledta ffkglrygkd naeastlmem kayhaisral
361 ekeglkdkks plnlsselqd eigtafslfk tdeditgrlk drvqpeilea llkhisfdkf
421 vqislkalrr ivplmeqgkr ydeacaeiyg dhygkkntee kiylppipad eirnpvvlra
481 lsqarkving vvrrygspar ihietarevg ksfkdrkeie krqeenrkdr ekaaakfrey
541 fpnfvgepks kdilklrlye qqhgkclysg keinlvrlne kgyveidhal pfsrtwddsf
601 nnkvlvlgse nqnkgnqtpy eyfngkdnsr ewqefkarve tsrfprskkq rillqkfded
661 gfkecnlndt ryvnrflcqf vadhilltgk gkrrvfasng qitnllrgfw glrkvraend
721 rhhaldavvv acstvamqqk itrfvrykem nafdgktidk etgkvlhqkt hfpqpweffa
781 qevmirvfgk pdgkpefeea dtpeklrtll aeklssrpea vheyvtplfv srapnrkmsg
841 ahkdtlrsak rfvkhnekis vkrvwlteik ladlenmvny kngreielye alkarleayg
901 gnakqafdpk dnpfykkggq lvkavrvekt qesgvllnkk naytiadngd mvrvdvfckv
961 dkkgknqyfi vpiyawqvae nilpdidckg yriddsytfc fslhkydlia fqkdekskve
1021 fayyincdss ngrfylawhd kgskeqqfri stqnlvliqk yqvnelgkei rpcrlkkrpp
1081 vr

いくつかの実施形態では、dCas9は、Cas9ヌクレアーゼ活性を不活化する1つ以上の突然変異を有するCas9アミノ酸配列に部分的にまたは全体として対応するか、あるいはこうした配列を部分的にまたは全体として含む。例えば、いくつかの実施形態では、dCas9ドメインは、D10AおよびH840A突然変異、または別のCas9中の対応する突然変異を含む。いくつかの実施形態では、dCas9は、dCas9のアミノ酸配列（D10AおよびH840A）を含む：

（一重下線：HNHドメイン；二重下線：RuvCドメイン）

いくつかの実施形態では、Cas9ドメインはD10A突然変異を含み、840位、または本明細書で提供するアミノ酸配列いずれかの対応する位の残基は、上に提供するアミノ酸配列中のヒスチジンのままである。

他の実施形態では、D10AおよびH840A以外の突然変異を有するdCas9バリアントを提供し、これは例えばヌクレアーゼ不活化されたCas9（dCas9）を生じる。こうした突然変異には、例えば、D10およびH840での他のアミノ酸置換、あるいはCas9のヌクレアーゼドメイン内の他の置換（例えばHNHヌクレアーゼサブドメインおよび/またはRuvC1サブドメイン中の置換）が含まれる。いくつかの実施形態では、少なくとも約70％同一、少なくとも約80％同一、少なくとも約90％同一、少なくとも約95％同一、少なくとも約98％同一、少なくとも約99％同一、少なくとも約99.5％同一、または少なくとも約99.9％同一である、dCas9のバリアントまたはホモログを提供する。いくつかの実施形態では、約5アミノ酸、約10アミノ酸、約15アミノ酸、約20アミノ酸、約25アミノ酸、約30アミノ酸、約40アミノ酸、約50アミノ酸、約75アミノ酸、約100アミノ酸またはそれ以上、短いかまたは長いアミノ酸配列を有するdCas9のバリアントを提供する。

いくつかの実施形態では、本明細書に提供するようなCas9融合タンパク質は、Cas9タンパク質の全長アミノ酸配列、例えば本明細書に提供するCas9配列の1つを含む。しかし、他の実施形態では、本明細書に提供するような融合タンパク質は、全長Cas9配列を含まず、その1つ以上の断片のみを含む。適切なCas9ドメインおよびCas9断片の例示的なアミノ酸配列を本明細書に提供し、Cas9ドメインおよび断片の追加の適切な配列は、当業者には明らかであろう。

追加のCas9タンパク質（例えばヌクレアーゼ不活性Cas9（dCas9）、Cas9ニッカーゼ（nCas9）、またはヌクレアーゼ活性Cas9）は、そのバリアントおよびホモログを含めて、本開示の範囲内であることを認識しなければならない。例示的なCas9タンパク質には、限定なしに、以下に提供するものが含まれる。いくつかの実施形態では、Cas9タンパク質は、ヌクレアーゼ不活性Cas9（dCas9）である。いくつかの実施形態では、Cas9タンパク質はCas9ニッカーゼ（nCas9）である。いくつかの実施形態では、Cas9タンパク質はヌクレアーゼ活性Cas9である。

例示的な触媒的に不活性であるCas9(dCas9)のアミノ酸配列は以下の通りである：
DKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDAIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD

例示的な触媒的Cas9ニッカーゼ(nCas9)のアミノ酸配列は以下の通りである：
DKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD

例示的な触媒的に活性であるCas9のアミノ酸配列は以下の通りである：
DKKYSIGLDIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD.

いくつかの実施形態では、Cas9は、単細胞原核微生物のドメインおよび界を構成する古細菌(例えばナノアーキア)由来のCas9を指す。いくつかの実施形態では、Cas9は、例えば、Burstein et al., "New CRISPR-Cas systems from uncultivated microbes." Cell Res. 2017 Feb 21. doi: 10.1038/cr.2017.21に記載されているCasXまたはCasYを指し、該文献の全体の内容は参照により本明細書に組み込まれる。ゲノム分解メタゲノミクスを用いて、生命の古細菌ドメインにおいて最初に報告されたCas9を含め、多くのCRISPR‐Casシステムが同定された。この多様なCas9タンパク質は、ほとんど研究されていないナノアーキアにおいて、活性CRISPR‐Casシステムの一部として発見された。細菌では、それまで知られていなかった2つのシステム、CRISPR-CasXとCRISPR-CasYが発見され、それらは、これまでに発見された中でも最もコンパクトなシステムに入る。いくつかの実施形態では、Cas9は、CasXまたはCasXのバリアントを指す。いくつかの実施形態では、Cas9は、CasYまたはCasYのバリアントを指す。核酸プログラム可能DNA結合タンパク質 (napDNAbp) として他のRNA誘導型DNA結合タンパク質も使用されてもよく、本開示の範囲内であることが理解されるべきである。

いくつかの実施形態では、Cas9は、改変PAM配列に対する特異性を有するCas9バリアントである。いくつかの実施形態では、追加のCas9バリアントおよびPAM配列は、Miller et al., Continuous evolution of SpCas9 variants compatible with non-G PAMs. Nat Biotechnol (2020). doi.org/10.1038/s41587-020-0412-8に記載され、その全内容は参照により本明細書に組み込まれる。いくつかの実施形態では、Cas9バリアントは特定のPAM要件を持たない。いくつかの実施形態では、Cas9バリアント、例えばSpCas9バリアントは、NRNH PAMに対する特異性を有し、RはAまたはGであり、HはA、C、またはTである。いくつかの実施形態では、SpCas9バリアントは、PAM配列AAA、TAA、CAA、GAA、TAT、GAT、またはCACに対する特異性を有する。いくつかの実施形態では、SpCas9バリアントは、以下の参照配列に対して番号付けされるような、1114、1134、1135、1137、1139、1151、1180、1188、1211、1218、1219、1221、1249、1256、1264、1290、1318、1317、1320、1321、1323、1332、1333、1335、1337、または1339位、あるいはその対応する位でアミノ酸置換を含む。

（一重下線：HNHドメイン；二重下線：RuvCドメイン）

いくつかの実施形態では、SpCas9バリアントは、上記参照配列に対して番号付けされるような、1114、1135、1218、1219、1221、1249、1320、1321、1323、1332、1333、1335、または1337位、あるいはその対応する位のアミノ酸置換を含む。いくつかの実施形態では、SpCas9バリアントは、上記参照配列に対して番号付けされるような、1114、1134、1135、1137、1139、1151、1180、1188、1211、1219、1221、1256、1264、1290、1318、1317、1320、1323、1333位、あるいはその対応する位のアミノ酸置換を含む。いくつかの実施形態では、SpCas9バリアントは、上記参照配列に対して番号付けされるような、1114、1131、1135、1150、1156、1180、1191、1218、1219、1221、1227、1249、1253、1286、1293、1320、1321、1332、1335、1339位、あるいはその対応する位のアミノ酸置換を含む。いくつかの実施形態では、SpCas9バリアントは、上記参照配列に対して番号付けされるような、1114、1127、1135、1180、1207、1219、1234、1286、1301、1332、1335、1337、1338、1349位のアミノ酸置換を含む。SpCas9バリアントの例示的なアミノ酸置換およびPAM特異性を、表A～Dおよび図8に示す。

表A

表B

表C

表D

特定の実施形態では、本発明の方法で有用なnapDNAbpsには、当技術分野に公知であり、例えばOakes et al., Cell 176, 254-267, 2019によって記載される循環置換体が含まれる。例示的な循環置換体は以下の通りであり、太字はCas9由来の配列を示し、斜字配列はリンカー配列を示し、下線配列は二部分核局在化配列を示す。
CP5（MSP「NGC=突然変異を含むPamバリアント、通常のCas9はNGGを好む」、PID=タンパク質相互作用ドメインおよび「D10A」ニッカーゼを含む）：

塩基エディターに取り込まれ得るポリヌクレオチドプログラム可能ヌクレオチド結合ドメインの限定されない例には、CRISPRタンパク質由来ドメイン、制限ヌクレアーゼ、メガヌクレアーゼ、TALヌクレアーゼ（TALEN）、およびジンクフィンガーヌクレアーゼ（ZFN）が含まれる。

いくつかの実施形態では、本明細書に提供する融合タンパク質いずれかの核酸プログラム可能DNA結合タンパク質（napDNAbp）は、CasXまたはCasYタンパク質であってもよい。いくつかの実施形態では、napDNAbpはCasXタンパク質である。いくつかの実施形態では、napDNAbpはCasYタンパク質である。いくつかの実施形態では、napDNAbpは、天然存在CasXまたはCasYタンパク質に、少なくとも85％、少なくとも90％、少なくとも91％、少なくとも92％、少なくとも93％、少なくとも94％、少なくとも95％、少なくとも96％、少なくとも97％、少なくとも98％、少なくとも99％、または少なくとも99.5％同一であるアミノ酸配列を含む。いくつかの実施形態では、napDNAbpは天然存在CasXまたはCasYタンパク質である。いくつかの実施形態では、napDNAbpは、本明細書記載のCasXまたはCasYタンパク質のいずれかに、少なくとも85％、少なくとも90％、少なくとも91％、少なくとも92％、少なくとも93％、少なくとも94％、少なくとも95％、少なくとも96％、少なくとも97％、少なくとも98％、少なくとも99％、または少なくとも99.5％同一であるアミノ酸配列を含む。他の細菌種由来のCas12b/C2c1、CasXおよびCasYもまた、本開示に従って使用され得ることを認識すべきである。

Cas12b/C2c1 (uniprot.org/uniprot/T0D7A2#2)
sp|T0D7A2|C2C1_ALIAG CRISPR会合エンドヌクレアーゼC2c1 OS= Alicyclobacillus acido- terrestris (ATCC 49025 / DSM 3922/ CIP 106132 / NCIMB 13137/GD3B株) GN=c2c1 PE=1 SV=1
MAVKSIKVKLRLDDMPEIRAGLWKLHKEVNAGVRYYTEWLSLLRQENLYRRSPNGDGEQECDKTAEECKAELLERLRARQVENGHRGPAGSDDELLQLARQLYELLVPQAIGAKGDAQQIARKFLSPLADKDAVGGLGIAKAGNKPRWVRMREAGEPGWEEEKEKAETRKSADRTADVLRALADFGLKPLMRVYTDSEMSSVEWKPLRKGQAVRTWDRDMFQQAIERMMSWESWNQRVGQEYAKLVEQKNRFEQKNFVGQEHLVHLVNQLQQDMKEASPGLESKEQTAHYVTGRALRGSDKVFEKWGKLAPDAPFDLYDAEIKNVQRRNTRRFGSHDLFAKLAEPEYQALWREDASFLTRYAVYNSILRKLNHAKMFATFTLPDATAHPIWTRFDKLGGNLHQYTFLFNEFGERRHAIRFHKLLKVENGVAREVDDVTVPISMSEQLDNLLPRDPNEPIALYFRDYGAEQHFTGEFGGAKIQCRRDQLAHMHRRRGARDVYLNVSVRVQSQSEARGERRPPYAAVFRLVGDNHRAFVHFDKLSDYLAEHPDDGKLGSEGLLSGLRVMSVDLGLRTSASISVFRVARKDELKPNSKGRVPFFFPIKGNDNLVAVHERSQLLKLPGETESKDLRAIREERQRTLRQLRTQLAYLRLLVRCGSEDVGRRERSWAKLIEQPVDAANHMTPDWREAFENELQKLKSLHGICSDKEWMDAVYESVRRVWRHMGKQVRDWRKDVRSGERPKIRGYAKDVVGGNSIEQIEYLERQYKFLKSWSFFGKVSGQVIRAEKGSRFAITLREHIDHAKEDRLKKLADRIIMEALGYVYALDERGKGKWVAKYPPCQLILLEELSEYQFNNDRPPSENNQLMQWSHRGVFQELINQAQVHDLLVGTMYAAFSSRFDARTGAPGIRCRRVPARCTQEHNPEPFPWWLNKFVVEHTLDACPLRADDLIPTGEGEIFVSPFSAEEGDFHQIHADLNAAQNLQQRLWSDFDISQIRLRCDWGEVDGELVLIPRLTGKRTADSYSNKVFYTNTGVTYYERERGKKRRKVFAQEKLSEEEAELLVEADEAREKSVVLMRDPSGIINRGNWTRQKEFWSMV NQRIEGYLVKQIRSRVPLQDSACENTGDI

CasX (uniprot.org/uniprot/F0NN87; uniprot.org/uniprot/F0NH53)
>tr|F0NN87|F0NN87_SULIH CRISPR会合Casxタンパク質OS = Sulfolobus islandicus (HVE10/4株) GN = SiH_0402 PE=4 SV=1
MEVPLYNIFGDNYIIQVATEAENSTIYNNKVEIDDEELRNVLNLAYKIAKNNEDAAAERRGKAKKKKGEEGETTTSNIILPLSGNDKNPWTETLKCYNFPTTVALSEVFKNFSQVKECEEVSAPSFVKPEFYEFGRSPGMVERTRRVKLEVEPHYLIIAAAGWVLTRLGKAKVSEGDYVGVNVFTPTRGILYSLIQNVNGIVPGIKPETAFGLWIARKVVSSVTNPNVSVVRIYTISDAVGQNPTTINGGFSIDLTKLLEKRYLLSERLEAIARNALSISSNMRERYIVLANYIYEYLTG SKRLEDLLYFANRDLIMNLNSDDGKVRDLKLISAYVNGELIRGEG

>tr|F0NH53|F0NH53_SULIR CRISPR会合タンパク質, Casx OS = Sulfolobus islandicus (REY15A株) GN=SiRe_0771 PE=4 SV=1
MEVPLYNIFGDNYIIQVATEAENSTIYNNKVEIDDEELRNVLNLAYKIAKNNEDAAAERRGKAKKKKGEEGETTTSNIILPLSGNDKNPWTETLKCYNFPTTVALSEVFKNFSQVKECEEVSAPSFVKPEFYKFGRSPGMVERTRRVKLEVEPHYLIMAAAGWVLTRLGKAKVSEGDYVGVNVFTPTRGILYSLIQNVNGIVPGIKPETAFGLWIARKVVSSVTNPNVSVVSIYTISDAVGQNPTTINGGFSIDLTKLLEKRDLLSERLEAIARNALSISSNMRERYIVLANYIYEYLTGSKRLEDLLYFANRDLIMNLNSDDGKVRDLKLISAYVNGELIRGEG

Deltaproteobacteria CasX
MEKRINKIRKKLSADNATKPVSRSGPMKTLLVRVMTDDLKKRLEKRRKKPEVMPQVISNNAANNLRMLLDDYTKMKEAILQVYWQEFKDDHVGLMCKFAQPASKKIDQNKLKPEMDEKGNLTTAGFACSQCGQPLFVYKLEQVSEKGKAYTNYFGRCNVAEHEKLILLAQLKPVKDSDEAVTYSLGKFGQRALDFYSIHVTKESTHPVKPLAQIAGNRYASGPVGKALSDACMGTIASFLSKYQDIIIEHQKVVKGNQKRLESLRELAGKENLEYPSVTLPPQPHTKEGVDAYNEVIARVRMWVNLNLWQKLKLSRDDAKPLLRLKGFPSFPVVERRENEVDWWNTINEVKKLIDAKRDMGRVFWSGVTAEKRNTILEGYNYLPNENDHKKREGSLENPKKPAKRQFGDLLLYLEKKYAGDWGKVFDEAWERIDKKIAGLTSHIEREEARNAEDAQSKAVLTDWLRAKASFVLERLKEMDEKEFYACEIQLQKWYGDLRGNPFAVEAENRVVDISGFSIGSDGHSIQYRNLLAWKYLENGKREFYLLMNYGKKGRIRFTDGTDIKKSGKWQGLLYGGGKAKVIDLTFDPDDEQLIILPLAFGTRQGREFIWNDLLSLETGLIKLANGRVIEKTIYNKKIGRDEPALFVALTFERREVVDPSNIKPVNLIGVARGENIPAVIALTDPEGCPLPEFKDSSGGPTDILRIGEGYKEKQRAIQAAKEVEQRRAGGYSRKFASKSRNLADDMVRNSARDLFYHAVTHDAVLVFANLSRGFGRQGKRTFMTERQYTKMEDWLTAKLAYEGLTSKTYLSKTLAQYTSKTCSNCGFTITYADMDVMLVRLKKTSDGWATTLNNKELKAEYQITYYNRYKRQTVEKELSAELDRLSEESGNNDISKWTKGRRDEALFLLKKRFSHRPVQEQFVCLDCGHEVHAAEQAALNIARSWLFLNSNSTEFKSYKSGKQPFVGAWQAFYKRRLKEVWKPNA

CasY (ncbi.nlm.nih.gov/protein/APG80656.1)
>APG80656.1 CRISPR会合タンパク質CasY [非培養Parcubacteria群細菌]
MSKRHPRISGVKGYRLHAQRLEYTGKSGAMRTIKYPLYSSPSGGRTVPREIVSAINDDYVGLYGLSNFDDLYNAEKRNEEKVYSVLDFWYDCVQYGAVFSYTAPGLLKNVAEVRGGSYELTKTLKGSHLYDELQIDKVIKFLNKKEISRANGSLDKLKKDIIDCFKAEYRERHKDQCNKLADDIKNAKKDAGASLGERQKKLFRDFFGISEQSENDKPSFTNPLNLTCCLLPFDTVNNNRNRGEVLFNKLKEYAQKLDKNEGSLEMWEYIGIGNSGTAFSNFLGEGFLGRLRENKITELKKAMMDITDAWRGQEQEEELEKRLRILAALTIKLREPKFDNHWGGYRSDINGKLSSWLQNYINQTVKIKEDLKGHKKDLKKAKEMINRFGESDTKEEAVVSSLLESIEKIVPDDSADDEKPDIPAIAIYRRFLSDGRLTLNRFVQREDVQEALIKERLEAEKKKKPKKRKKKSDAEDEKETIDFKELFPHLAKPLKLVPNFYGDSKRELYKKYKNAAIYTDALWKAVEKIYKSAFSSSLKNSFFDTDFDKDFFIKRLQKIFSVYRRFNTDKWKPIVKNSFAPYCDIVSLAENEVLYKPKQSRSRKSAAIDKNRVRLPSTENIAKAGIALARELSVAGFDWKDLLKKEEHEEYIDLIELHKTALALLLAVTETQLDISALDFVENGTVKDFMKTRDGNLVLEGRFLEMFSQSIVFSELRGLAGLMSRKEFITRSAIQTMNGKQAELLYIPHEFQSAKITTPKEMSRAFLDLAPAEFATSLEPESLSEKSLLKLKQMRYYPHYFGYELTRTGQGIDGGVAENALRLEKSPVKKREIKCKQYKTLGRGQNKIVLYVRSSYYQTQFLEWFLHRPKNVQTDVAVSGSFLIDEKKVKTRWNYDALTVALEPVSGSERVFVSQPFTIFPEKSAEEEGQRYLGIDIGEYGIAYTALEITGDSAKILDQNFISDPQLKTLREEVKGLKLDQRRGTFAMPSTKIARIRESLVHSLRNRIHHLALKHKAKIVYELEVSRFEEGKQKIKKVYATLKKADVYSEIDADKNLQTTVWGKLAVASEISASYTSQFCGACKKLWRAEMQVDETITTQELIGTVRVIKGGTLIDAIKDFMRPPIFDENDTPFPKYRDFCDKHHISKKMRGNSCLFICPFCRANADADIQASQTIALLRYVKEEKKVEDYFERFRKLKN IKVLGQMKKI

「保存的アミノ酸置換」または「保存的突然変異」という用語は、あるアミノ酸が共通の特性を有する別のアミノ酸に置き換わることを指す。個々のアミノ酸間の共通の特性を定義するための機能的な方法は、相同的な生物の対応するタンパク質間のアミノ酸変化の正規化された頻度を分析することである(Schulz, G. E. and Schirmer, R. H., Principles of Protein Structure, Springer-Verlag, New York (1979))。このような分析によれば、グループ内のアミノ酸が互いに優先的に交換され、それゆえに全体的なタンパク質構造に対するそれらの影響において互いに最も類似しているアミノ酸のグループを定義することができる(上記Schulz, G. E. and Schirmer, R. H.)。保存的突然変異の非限定的な例には、例えば正電荷を維持することができるアミノ酸アルギニンに対するリジンおよびその逆；負電荷を維持することができるアスパラギン酸に対するグルタミン酸およびその逆；遊離OHを維持することができるトレオニンに対するセリン；ならびに遊離NH₂を維持できるアスパラギンに対するグルタミンのようなアミノ酸置換が挙げられる。

本明細書中で交換可能に使用される用語「コード配列」または「タンパク質コード配列」とは、タンパク質をコードするポリヌクレオチドのセグメントを指す。この領域または配列は、5’末端に近い方が開始コドンで境界付けられ、3’末端に近い方が停止コドンで境界付けられる。コード配列はオープンリーディングフレームとも呼ばれ得る。

本明細書中で使用する場合、用語「デアミナーゼ」または「デアミナーゼドメイン」とは、脱アミノ化反応を触媒するタンパク質または酵素を指す。いくつかの実施形態では、デアミナーゼは、ヒポキサンチンへのアデニンの加水分解的脱アミノ化を触媒するアデノシンデアミナーゼである。いくつかの実施形態では、デアミナーゼは、アデノシンまたはアデニン (A) からイノシン (I) への加水分解的脱アミノ化を触媒するアデノシンデアミナーゼである。いくつかの実施形態では、デアミナーゼまたはデアミナーゼドメインは、アデノシンデアミナーゼであり、それぞれイノシンまたはデオキシイノシンへのアデノシンまたはデオキシアデノシンの加水分解的脱アミノ化を触媒する。いくつかの実施形態では、アデノシンデアミナーゼは、デオキシリボ核酸 (DNA) 中のアデノシンの加水分解的脱アミノ化を触媒する。本明細書で提供されるアデノシンデアミナーゼ(例えば、遺伝子操作されたアデノシンデアミナーゼ、進化されたアデノシンデアミナーゼ)は、細菌などの任意の生物由来であり得る。いくつかの実施形態では、アデノシンデアミナーゼは、Escherichia coli、Staphylococcus aureus、Salmonella typhi、Shewanella putrefaciens、Haemophilus influenzae、またはCaulobacter crescentusなどの細菌に由来する。

いくつかの実施形態では、アデノシンデアミナーゼは、TadAデアミナーゼである。いくつかの実施形態では、TadAデアミナーゼはTadAバリアントである。いくつかの実施形態では、TadAバリアントはTadA*8である。いくつかの実施形態では、デアミナーゼまたはデアミナーゼドメインは、例えばヒト、チンパンジー、ゴリラ、サル、ウシ、イヌ、ラット、またはマウスなどの生物由来の天然存在デアミナーゼのバリアントである。いくつかの実施形態では、デアミナーゼまたはデアミナーゼドメインは、天然に存在しない。例えば、いくつかの実施形態では、デアミナーゼまたはデアミナーゼドメインは、天然存在デアミナーゼに対して少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、少なくとも99.1%、少なくとも99.2%、少なくとも99.3%、少なくとも99.4%、少なくとも99.5%、少なくとも99.6%、少なくとも99.7%、少なくとも99.8%、または少なくとも99.9%同一である。例えば、デアミナーゼドメインは、国際PCT出願第PCT//2017/045381号 (WO 2018/027078) および第PCT/US2016/058344号 (WO 2017/070632)に記載され、これら文献は各々、その全内容が参照により本明細書に組み込まれる。Komor, A.C., et al., “Programmable editing of a target base in genomic DNA without double-stranded DNA cleavage” Nature 533, 420-424 (2016); Gaudelli, N.M., et al., “Programmable base editing of A・T to G・C in genomic DNA without DNA cleavage” Nature 551, 464-471 (2017); Komor, A.C., et al., “Improved base excision repair inhibition and bacteriophage Mu Gam protein yields C:G-to-T:A base editors with higher efficiency and product purity” Science Advances 3:eaao4774 (2017) ), およびRees, H.A., et al., “Base editing: precision chemistry on the genome and transcriptome of living cells.” Nat Rev Genet. 2018 Dec;19(12):770-788. doi: 10.1038/s41576-018-0059-1もまた参照のこと、これらの全内容は、参照により本明細書に組み込まれる。

「検出」は、検出されるべき分析物の存在、不在または量を同定することを指す。1つの実施形態では、ポリヌクレオチドまたはポリペプチドにおける配列改変が検出される。別の実施形態では、インデル（indel）の存在が検出される。

「検出可能な標識」とは、関心対象の分子に連結されたときに、分光学的、光化学的、生化学的、免疫化学的、または化学的手段を介して、後者を検出可能にする組成物を意味する。例えば、有用な標識には、放射性同位体、磁気ビーズ、金属ビーズ、コロイド粒子、蛍光色素、高電子密度試薬、酵素（例えば、ELISAで一般的に用いられるもの）、ビオチン、ジゴキシゲニン、またはハプテンが含まれる。

「疾患」とは、細胞、組織または臓器の正常な機能を損傷または妨害するあらゆる状態または障害を意味する。一実施形態では、疾患はA1ADである。

用語「有効量」は、本明細書において、所望の生物学的反応を誘発するために十分である生物学的活性剤の量を指す。特定の実施形態では、有効量は、療法効果を達成するために、細胞においてA1AT突然変異を改変するため十分な、塩基エディターシステム（例えばプログラム可能DNA結合タンパク質を含む融合タンパク質、核酸塩基エディターおよびgRNA）の量である。こうした療法効果は、組織または臓器のすべての細胞においてA1ADを改変するために十分である必要はなく、対象、組織または臓器に存在する細胞の約1％、5％、10％、25％、50％、75％またはそれより多くのみが改変されてもよい。一実施形態では、有効量は、A1ADの1つ以上の症状を軽減させるために十分である。本発明を実施するために用いられる活性剤（複数可）の有効量は、投与方式、対象の年齢、体重、および全般的健康状態に依存して変化する。最終的には、主治医または獣医が適切な量および投薬措置を決定する。このような量は「有効」量と呼ばれる。一実施形態では、有効量は、細胞(例えば、in vitroまたはin vivoの細胞)内の関心対象の遺伝子に改変を導入するのに十分な本発明の塩基エディター（例えばプログラム可能DNA結合タンパク質を含む融合タンパク質、核酸塩基エディターおよびgRNA）の量である。一実施形態では、有効量は、療法効果を達成する（例えば疾患またはその症状もしくは状態を減少させるかまたは制御する）ために必要な塩基エディターの量である。

「断片」とは、ポリペプチドまたは核酸分子の部分を意味する。この部分は、参照核酸分子またはポリペプチドの全長の少なくとも約10%、20%、30%、40%、50%、60%、70%、80%、または90%を含有する。断片は、10、20、30、40、50、60、70、80、90、または100、200、300、400、500、600、700、800、900、または1000のヌクレオチドまたはアミノ酸を含有し得る。

「ガイドRNA」または「gRNA」は、標的配列に特異的であってポリヌクレオチドプログラム可能ヌクレオチド結合ドメインタンパク質（例えばCas9またはCpf1）と複合体を形成することができるポリヌクレオチドを意味する。一実施形態では、ガイドポリヌクレオチドはガイドRNA (gRNA) である。gRNAは2つ以上のRNAの複合体として存在することもあれば、単一のRNA分子として存在することもある。単一のRNA分子として存在するgRNAは、シングルガイドRNA（sgRNA）と呼ばれることがあるが、「gRNA」は、単一の分子として、または2つ以上の分子の複合体として存在するガイドRNAを指すために交換可能に使用される。典型的には、単一のRNA種として存在するgRNAは、(1) 標的核酸と相同性を共有する（例えば、標的へのCas9複合体の結合を指示する）ドメイン；および(2) Cas9タンパク質に結合するドメインという2つのドメインを含む。いくつかの実施形態では、ドメイン (2) は、tracrRNAとして知られる配列に対応し、ステム-ループ構造を含む。例えば、いくつかの実施形態では、ドメイン (2) は、Jinek et al., Science 337:816-821(2012)（その全内容が参照により本明細書に組み入れられる）に提供されるようなtracrRNAと同一または相同である。gRNA (例えばドメイン2を含むもの)の他の例は、「Switchable Cas9 Nucleases and Uses Thereof」と題される2013年9月6日出願の米国仮特許出願U.S.S.N. 61/874,682、および「Delivery System For Functional Nucleases」と題される2013年9月6日出願の米国仮特許出願U.S.S.N. 61/874,746に見出され得、それら各々の全内容が参照により本明細書に組み入れられる。いくつかの実施形態では、gRNAは、ドメイン (1) および(2) の2つ以上を含み、「伸長されたgRNA」と称され得る。伸長されたgRNAは、本明細書に記載されるように、2つ以上のCas9タンパク質と結合し、2つ以上の異なる領域で標的核酸と結合する。gRNAは、標的部位を相補するヌクレオチド配列を含み、これが標的部位へのヌクレアーゼ/RNA複合体の結合を仲介し、ヌクレアーゼ：RNA複合体の配列特異性を提供する。当業者に認識されるであろうように、RNAポリヌクレオチド配列、例えばgRNA配列には、DNAポリヌクレオチド配列中に含まれる核酸塩基チミン（T）よりも、ピリミジン誘導体である核酸塩基ウラシル（U）が含まれる。RNAにおいては、ウラシルがアデニンと塩基対形成し、DNA転写中のチミンを置換する。

「ハイブリダイゼーション」は、相補的な核酸塩基間の水素結合を意味し、ワトソン-クリック、フーグスティーンまたは逆フーグスティーン水素結合であり得る。例えば、アデニンとチミンは相補的な核酸塩基で、水素結合を形成して対を形成する。

用語「塩基修復の阻害因子」、または「IBR」は、核酸修復酵素、例えば塩基除去修復（BER）酵素の活性を阻害することができるタンパク質を指す。いくつかの実施形態では、IBRは、イノシン塩基除去修復の阻害因子である。塩基修復の阻害因子の例としては、APE1、Endo III、Endo IV、Endo V、Endo VIII、Fpg、hOGGl、hNEILl、T7 Endol、T4 PDG、UDG、hSMUGlおよびhAAGの阻害因子が挙げられる。いくつかの実施形態では、IBRは、Endo VまたはhAAGの阻害因子である。いくつかの実施形態では、IBRは、触媒的に不活性なEndoVまたは触媒的に不活性なhAAGである。いくつかの実施形態では、塩基修復阻害因子は、Endo VまたはｈAAGの阻害因子である。いくつかの実施形態では、塩基修復阻害因子は、触媒的に不活性なEndoVまたは触媒的に不活性なhAAGである。

いくつかの実施形態では、塩基修復阻害因子は、ウラシルグリコシラーゼ阻害因子 (UGI) である。UGIとは、ウラシル-DNAグリコシラーゼの塩基除去修復酵素を阻害することができるタンパク質を指す。いくつかの実施形態では、UGIドメインは、野生型UGIまたは野生型UGIの断片を含む。いくつかの実施形態では、本明細書で提供されるUGIタンパク質は、UGIの断片、およびUGIまたはUGI断片に相同的なタンパク質を含む。いくつかの実施形態では、塩基修復阻害因子は、イノシン塩基除去修復の阻害因子である。いくつかの実施形態において、塩基修復阻害因子は、「触媒的に不活性のイノシン特異的ヌクレアーゼ」または「不活性のイノシン特異的ヌクレアーゼ」である。いかなる特定の理論にも拘束されることを望まないが、触媒的に不活性なイノシングリコシラーゼ（例えば、アルキルアデニングリコシラーゼ(AAG)）は、イノシンに結合することができるが、脱塩基部位を作ることもイノシンを除去することもできず、それによって、新たに形成されるイノシン部分をDNA損傷/修復機構から立体的にブロックする。いくつかの実施形態では、触媒的に不活性なイノシン特異的ヌクレアーゼは、核酸中のイノシンに結合することができるが、核酸を切断しない。非限定的で例示的な、触媒的に不活性なイノシン特異的ヌクレアーゼには、例えばヒト由来の触媒的に不活性なアルキルアデノシングリコシラーゼ(AAGヌクレアーゼ)、および例えばE.coli由来の触媒的に不活性なエンドヌクレアーゼV (EndoVヌクレアーゼ)が含まれる。いくつかの実施形態では、触媒的に不活性なAAGヌクレアーゼは、E125Q突然変異または別のAAGヌクレアーゼにおける対応する突然変異を含む。

「増加」とは、少なくとも10%、25%、50%、75%、または100%の正の変化を意味する。

「インテイン（intein）」は、それ自身を切り出して、残った断片（エクステイン（extein））をタンパク質スプライシングとして知られるプロセスにおいてペプチド結合で連結することができるタンパク質の断片である。インテインは「タンパク質イントロン」とも呼ばれる。インテインがそれ自身を切り出し、タンパク質の残りの部分を連結するプロセスは、本明細書において、「タンパク質スプライシング」または「インテイン仲介タンパク質スプライシング」と呼ばれる。いくつかの実施形態では、前駆体タンパク質（インテイン仲介タンパク質スプライシングの前のインテイン含有タンパク質）のインテインは、2つの遺伝子に由来する。そのようなインテインは、本明細書では分割（split）インテインと呼ばれる（例えば、分割インテイン-Nおよび分割インテイン-C）。例えば、シアノバクテリアでは、DNAポリメラーゼIIIの触媒サブユニットaであるDnaEは2つの別々の遺伝子dnaE-nおよびdnaE-cによってコードされている。dnaE-n遺伝子によってコードされるインテインは本明細書において「インテインN」と称され得る。dnaE-c遺伝子によってコードされるインテインは本明細書において「インテインC」と称され得る。

他のインテインシステムも使用され得る。例として、dnaEインテイン、すなわちCfa-N（例えば分割インテイン-N）およびCfa-C（例えば分割インテイン-C）のインテイン対に基づく合成インテインが記述されている（例えば、参照により本明細書に組み入れられるStevens et al., J Am Chem Soc. 2016 Feb. 24; 138(7):2162-5）。本開示に従って使用することができるインテイン対の非限定的な例としては：Cfa DnaEインテイン、Ssp GyrBインテイン、Ssp DnaXインテイン、Ter DnaE3インテイン、Ter ThyXインテイン、Rma DnaBインテイン、およびCne Prp8インテイン（例えば、参照により本明細書に組み込まれる米国特許第8,394,604号に記載のようなもの）が挙げられる。

インテインの例示的なヌクレオチドおよびアミノ酸配列を提供する。

DnaE インテイン-N DNA:
TGCCTGTCATACGAAACCGAGATACTGACAGTAGAATATGGCCTTCTGCCAATCGGGAAGATTGTGGAGAAACGGATAGAATGCACAGTTTACTCTGTCGATAACAATGGTAACATTTATACTCAGCCAGTTGCCCAGTGGCACGACCGGGGAGAGCAGGAAGTATTCGAATACTGTCTGGAGGATGGAAGTCTCATTAGGGCCACTAAGGACCACAAATTTATGACAGTCGATGGCCAGATGCTGCCTATAGACGAAATCTTTGAGCGAGAGTTGGACCTCATGCGAGTTGACAACCTTCCTAAT

DnaE インテイン-N タンパク質:
CLSYETEILTVEYGLLPIGKIVEKRIECTVYSVDNNGNIYTQPVAQWHDR GEQEVFEYCLEDGSLIRATKDHKFMTVDGQMLPIDEIFERELDLMRVDNLPN

DnaE インテイン-C DNA:
ATGATCAAGATAGCTACAAGGAAGTATCTTGGCAAACAAAACGTTTATGA TATTGGAGTCGAAAGAGATCACAACTTTGCTCTGAAGAACGGATTCATAGCTTCTAAT

インテイン-C:
MIKIATRKYLGKQNVYDIGVERDHNFALKNGFIASN

Cfa-N DNA:
TGCCTGTCTTATGATACCGAGATACTTACCGTTGAATATGGCTTCTTGCCTATTGGAAAGATTGTCGAAGAGAGAATTGAATGCACAGTATATACTGTAGACAAGAATGGTTTCGTTTACACACAGCCCATTGCTCAATGGCACAATCGCGGCGAACAAGAAGTATTTGAGTACTGTCTCGAGGATGGAAGCATCATACGAGCAACTAAAGATCATAAATTCATGACCACTGACGGGCAGATGTTGCCAATAGATGAGATATTCGAGCGGGGCTTGGATCTCAAACAAGTGGATGGATTGCCA

Cfa-N タンパク質:
CLSYDTEILTVEYGFLPIGKIVEERIECTVYTVDKNGFVYTQPIAQWHNRGEQEVFEYCLEDGSIIRATKDHKFMTTDGQMLPIDEIFERGLDLKQVDGLP

Cfa-C DNA:
ATGAAGAGGACTGCCGATGGATCAGAGTTTGAATCTCCCAAGAAGAAGAGGAAAGTAAAGATAATATCTCGAAAAAGTCTTGGTACCCAAAATGTCTATGATATTGGAGTGGAGAAAGATCACAACTTCCTTCTCAAGAACGGTCTCGTAGCCAGCAAC

Cfa-C タンパク質:
MKRTADGSEFESPKKKRKVKIISRKSLGTQNVYDIGVEKDHNFLLKNGLVASN

分割Cas9のN末端部と分割Cas9のC末端部とを連結するために、インテインNおよびインテインCをそれぞれ分割Cas9のN末端部および分割Cas9のC末端部に融合させ得る。例えば、いくつかの実施形態では、インテイン-Nが、分割Cas9のN末端部分のC末端に融合され、すなわち、N--[分割Cas9のN末端部分]-[インテイン-N]--Cの構造を形成する。いくつかの実施形態では、インテイン-Cが、分割Cas9のC末端部分のN末端に融合され、すなわち、N-[インテイン-C]--[分割Cas9のC末端部分]-Cの構造を形成する。インテインが融合されたタンパク質（例えば分割Cas9）を連結するためのインテイン仲介性タンパク質スプライシングの機構は、例えば、参照により本明細書に組み入れられるShah et al., Chem Sci. 2014; 5(1):446-461に記載されているように、当技術分野において公知である。インテインを設計および使用する方法は当技術分野で公知であり、例えばWO2014004336、WO2017132580、US20150344549およびUS20180127780によって記載されており、これらの各々はその全体が参照により本明細書に組み込まれる。

用語「単離された」、「精製された」、または「生物学的に純粋な」とは、その天然状態で見出される場合に通常それに付随する構成要素が、多様な程度まで除去されている物質を指す。「単離」は、元の供給源または周囲環境からの分離の程度を示す。「精製」は、単離よりも高い分離度を示す。「精製された」または「生物学的に純粋な」タンパク質は、不純物がタンパク質の生物学的特性に実質的に影響を与えたり他の有害な結果を引き起こしたりしないように、他の物質が十分に除去されている。すなわち、本発明の核酸またはペプチドは、組換えDNA技術によって産生された場合には細胞物質、ウイルス物質または培地を実質的に含まない場合、あるいは化学的に合成された場合には化学的前駆体その他の化学物質を実質的に含まない場合には、精製されている。純度および均一性は、典型的には、分析化学技術、例えば、ポリアクリルアミドゲル電気泳動または高速液体クロマトグラフィーを用いて決定される。用語「精製された」は、核酸またはタンパク質が電気泳動ゲルにおいて本質的に1つのバンドを生じることを意味し得る。修飾、例えば、リン酸化またはグリコシル化を受けることができるタンパク質については、異なる修飾は、別々に精製することができる異なる単離されたタンパク質を生じ得る。

「単離ポリヌクレオチド」とは、本発明の核酸分子が由来する生物の天然存在ゲノムにおいて該遺伝子に隣接する遺伝子を含まない核酸(例えばDNA)を意味する。従って、この用語は、例えば、ベクターに組み込まれた；自律的に複製するプラスミドやウイルスに組み込まれた；原核生物や真核生物のゲノムDNAに組み込まれた；または他の配列とは独立した別個の分子(例えば、PCRまたは制限エンドヌクレアーゼ消化によって生成されたcDNAまたはゲノムもしくはcDNA断片)として存在する組換えDNAを含む。さらに、この用語は、DNA分子から転写されるRNA分子、ならびに、さらなるポリペプチド配列をコードするハイブリッド遺伝子の一部である組換えDNAを含む。

「単離ポリペプチド」とは、天然状態で付随する構成要素から分離されている本発明のポリペプチドを意味する。典型的には、ポリペプチドは、該ポリペプチドが天然状態で会合しているタンパク質および天然存在有機分子を重量で少なくとも60%含まない場合に、単離されている。好ましくは、調製物は、重量で少なくとも75%、より好ましくは90%、最も好ましくは99%が本発明のポリペプチドである。本発明の単離されたポリペプチドは、例えば、天然供給源からの抽出、そのようなポリペプチドをコードする組換え核酸の発現；または化学的にタンパク質を合成することにより得ることができる。純度は、任意の適切な方法、例えば、カラムクロマトグラフィー、ポリアクリルアミドゲル電気泳動、またはHPLC分析によって測定することができる。

本明細書において使用される用語「リンカー」は、2つの分子もしくは部分、例えばタンパク質複合体もしくはリボ核複合体の2つの構成要素、または融合タンパク質の2つのドメイン、例えば、ポリヌクレオチドプログラム可能DNA結合ドメイン(例えばdCas9)とデアミナーゼドメイン(例えばPCT/US19/44935に記載されるような、アデノシンデアミナーゼ、またはアデノシンデアミナーゼとシチジンデアミナーゼ)を連結する共有結合リンカー(例えば共有結合)、非共有結合リンカー、化学基、または分子を指すことができる。リンカーは、塩基エディターシステムの異なる構成要素または構成要素の異なる部分を連結することができる。例えば、いくつかの実施形態では、リンカーは、ポリヌクレオチドプログラム可能ヌクレオチド結合ドメインのガイドポリヌクレオチド結合ドメインおよびデアミナーゼの触媒ドメインを連結することができる。いくつかの実施形態では、リンカーは、CRISPRポリペプチドおよびデアミナーゼを連結することができる。いくつかの実施形態では、リンカーは、Cas9およびデアミナーゼを連結することができる。いくつかの実施形態では、リンカーは、dCas9およびデアミナーゼを連結することができる。いくつかの実施形態では、リンカーは、nCas9およびデアミナーゼを連結することができる。いくつかの実施形態では、リンカーは、ガイドポリヌクレオチドおよびデアミナーゼを連結することができる。いくつかの実施形態では、リンカーは、塩基エディターシステムの脱アミノ化構成要素およびポリヌクレオチドプログラム可能ヌクレオチド結合構成要素を連結することができる。いくつかの実施形態では、リンカーは、塩基エディターシステムの脱アミノ化構成要素のRNA結合部分およびポリヌクレオチドプログラム可能ヌクレオチド結合構成要素を連結することができる。いくつかの実施形態では、リンカーは、塩基エディターシステムの脱アミノ化構成要素のRNA結合部分およびポリヌクレオチドプログラム可能ヌクレオチド結合構成要素のRNA結合部分を連結することができる。リンカーは、2つの基、分子、または他の部分の間に配置されるか、またはそれらに隣接し、共有結合または非共有結合相互作用を介してそれぞれにつながれ、したがって2つをつなぐことができる。いくつかの実施形態では、リンカーは、有機分子、基、ポリマー、または化学的部分であり得る。いくつかの実施形態では、リンカーはポリヌクレオチドであり得る。いくつかの実施形態では、リンカーはDNAリンカーであり得る。いくつかの実施形態では、リンカーはRNAリンカーであり得る。いくつかの実施形態では、リンカーは、リガンドに結合することができるアプタマーを含むことができる。いくつかの実施形態では、リガンドは、炭水化物、ペプチド、タンパク質、または核酸であり得る。いくつかの実施形態では、リンカーは、リボスイッチに由来してもよいアプタマーを含むことができる。アプタマーが由来するリボスイッチは、テオフィリンリボスイッチ、チアミンピロリン酸 (TPP) リボスイッチ、アデノシンコバラミン (AdoCbl) リボスイッチ、S-アデノシルメチオニン(SAM) リボスイッチ、SAHリボスイッチ、フラビンモノヌクレオチド (FMN) リボスイッチ、テトラヒドロ葉酸リボスイッチ、リジンリボスイッチ、グリシンリボスイッチ、プリンリボスイッチ、GlmSリボスイッチ、またはプレクエオシン1 (PreQ1) リボスイッチから選択され得る。いくつかの実施形態では、リンカーは、ポリペプチドまたはポリペプチドリガンドなどのタンパク質ドメインに結合したアプタマーを含み得る。いくつかの実施形態では、ポリペプチドリガンドは、K相同 (KH) ドメイン、MS2コートタンパク質ドメイン、PP7コートタンパク質ドメイン、SfMu Comコートタンパク質ドメイン、ステライルアルファモチーフ、テロメラーゼKu結合モチーフおよびKuタンパク質、テロメラーゼSm7結合モチーフおよびSm7タンパク質、またはRNA認識モチーフであり得る。いくつかの実施形態では、ポリペプチドリガンドは、塩基エディターシステム構成要素の一部であり得る。例えば、核酸塩基編集構成要素は、デアミナーゼドメインおよびRNA認識モチーフを含み得る。

いくつかの実施形態では、リンカーは、アミノ酸または複数のアミノ酸(例えばペプチドまたはタンパク質)であり得る。いくつかの実施形態では、リンカーは、長さ約5～100アミノ酸、例えば、長さが約5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、20～30、30～40、40～50、50～60、60～70、70～80、80～90または90～100アミノ酸であり得る。いくつかの実施形態では、リンカーは、長さ約100～150、150～200、200～250、250～300、300～350、350～400、400～450、または450～500アミノ酸であり得る。より長いまたはより短いリンカーも考えられる。

いくつかの実施形態では、リンカーは、Cas9ヌクレアーゼドメインを含むRNAプログラム可能ヌクレアーゼのgRNA結合ドメインおよび核酸編集タンパク質(例えば、アデノシンデアミナーゼ)の触媒ドメインを連結する。いくつかの実施形態では、リンカーは、dCas9および核酸編集タンパク質を連結する。例えば、リンカーは、2つの基、分子、または他の部分の間に配置されるか、またはそれらに隣接し、共有結合を介してそれぞれにつながれ、従って2つを連結する。いくつかの実施形態では、リンカーは、アミノ酸または複数のアミノ酸(例えば、ペプチドまたはタンパク質)である。いくつかの実施形態では、リンカーは、有機分子、基、ポリマー、または化学的部分である。いくつかの実施形態では、リンカーは、長さ5～200アミノ酸、例えば、長さ5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、25、35、45、50、55、60、60、65、70、70、75、80、85、90、90、95、100、101、102、103、104、105、110、120、130、140、150、160、175、180、190、または200アミノ酸である。より長いまたはより短いリンカーもまた意図される。

いくつかの実施形態では、核酸塩基エディターのドメインは、SGGSSGSETPGTSESATPESSGGS, SGGSSGGSSGSETPGTSESATPESSGGSSGGS、またはGGSGGSPGSPAGSPTSTEEGTSESATPESGPGTSTEPSEGSAPGSPAGSPTSTEEGTSTE PSEGSAPGTSTEPSEGSAPGTSESATPESGPGSEPATSGGSGGSのアミノ酸配列を含むリンカーを介して融合される。いくつかの実施形態では、核酸塩基エディターのドメインは、XTENリンカーとも呼ばれ得るアミノ酸配列SGSETPGTSESATPESを含むリンカーを介して融合される。いくつかの実施形態では、リンカーはアミノ酸配列SGGSを含む。いくつかの実施形態では、リンカーは、(SGGS)_n、(GGGS)_n、(GGGGS)_n、(G)_n、(EAAAK)_n、(GGS)_n、SGSETPGTSESATPES、または(XP)_n モチーフ、あるいはこれらのいずれかの組み合わせを含み、nは独立に、1～30の間の整数であり、Xは任意のアミノ酸である。いくつかの実施形態では、nは1、2、3、4、5、6、7、8、9、10、11、12、13、14、または15である。

いくつかの実施形態では、リンカーは、長さ24アミノ酸である。いくつかの実施形態では、リンカーは、アミノ酸配列SGGSSGGSSGSETPGTSESATPESを含む。いくつかの実施形態では、リンカーは、長さ40アミノ酸である。いくつかの実施形態では、リンカーは、アミノ酸配列SGGSSGGSSGSETPGTESATPESSGGSSGGSSGSSGGSを含む。いくつかの実施形態では、リンカーは、長さ64アミノ酸である。いくつかの実施形態では、リンカーは、アミノ酸配列SGGSSGGSSGSETPGTSESATPESSGGSSGGSSGGSSGGSSGSETPGTSESATPESSGGSSGGSを含む。いくつかの実施形態では、リンカーは、長さ92アミノ酸である。いくつかの実施形態では、リンカーは、アミノ酸配列PGSPAGSPTSTEEGTSESATPESGPGTSTEPSEGSAPGSPAGSPTSTEEGTSTEPSEGSAP GTSTEPSEGSAPGTSESATPESGPGSEPATSを含む。

「マーカー」とは、疾患または障害に関連する発現レベルまたは活性の改変を有する任意のタンパク質またはポリヌクレオチドを意味する。

本明細書中で使用される場合、用語「突然変異」とは、配列内、例えば核酸もしくはアミノ酸配列内の残基が、別の残基により置換されること、または配列内の1つ以上の残基の欠失もしくは挿入をいう。突然変異は、本明細書において典型的には、元の残基を同定し、次いで配列内の残基の位を同定し、新たに置換された残基の同一性を同定することによって、記載される。本明細書に提供されるアミノ酸置換 (突然変異) を作製するための多様な方法は、当技術分野においてよく知られており、例えば、Green and Sambrook, Molecular Cloning: A Laboratory Manual (4th ed., Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y. (2012) )によって提供されている。いくつかの実施形態では、本開示の塩基エディターは、有意な数の非意図的な突然変異、例えば非意図的な点突然変異を生成することなく、核酸(例えば対象のゲノム内の核酸)において「意図される突然変異」例えば点突然変異を効率的に生成することができる。いくつかの実施形態では、意図される突然変異は、その意図される突然変異を生じさせるように特に設計された、ガイドポリヌクレオチド(例えばgRNA)に結合した特定の塩基エディター(例えばアデノシン塩基エディター)によって生じる突然変異である。

一般に、配列(例えば、本明細書に記載のアミノ酸配列)においてなされるかまたは同定される突然変異は、参照(または野生型)配列、すなわち、その突然変異を含有しない配列に関連して番号付けされる。当業者は、参照配列に対するアミノ酸および核酸配列における突然変異の位置を決定する方法を容易に理解するであろう。

「非保存的突然変異」という用語は、異なるグループの間のアミノ酸置換に関し、例えば、トリプトファンに対するリジン、またはセリンに対するフェニルアラニンなどである。この場合、非保存的アミノ酸置換は、機能性バリアントの生物学的活性を妨害または阻害しないことが好ましい。非保存的アミノ酸置換は、機能的バリアントの生物学的活性が野生型タンパク質と比較して増加するように、機能的バリアントの生物学的活性を増進させることができる。

「核局在化配列」、「核局在化シグナル」または「NLS」という用語は、タンパク質の細胞核への移入を促進するアミノ酸配列を意味する。核局在化配列は当技術分野において公知であり、例えば、2000年11月23日に出願され2001年5月31日にWO/2001/038547として公開された国際PCT出願PCT/EP 2000/011690のPlank et al.に記載されており、その内容は、例示的な核局在化配列の開示について参照により本明細書に組み入れられる。他の実施形態では、NLSは、例えばKoblan et al., Nature Biotech. 2018 doi:10.1038/nbt.4172によって記載された、最適化されたNLSである。いくつかの実施形態では、NLSは、アミノ酸配列KRTADGSEFESPKKKRKV, KRPAATKKAGQAKKKK, KKTELQTTNAENKTKKL, KRGINDRNFWRGENGRKTR, RKSGKIAAIVVKRPRK, PKKKRKV,または MDSLLMNRRKFLYQFKNVRWAKGRRETYLCを含む。

本明細書中で使用される際、用語「核酸」および「核酸分子」とは、核酸塩基および酸性部分を含む化合物、例えばヌクレオシド、ヌクレオチド、またはヌクレオチドのポリマーをいう。典型的には、ポリマー核酸、例えば3つ以上のヌクレオチドを含む核酸分子は、隣接するヌクレオチドがホスホジエステル連結を介して互いに連結されている直鎖分子である。いくつかの実施形態では、「核酸」は、個々の核酸残基(例えばヌクレオチドおよび/またはヌクレオシド)を指す。いくつかの実施形態では、「核酸」は、3つ以上の個々のヌクレオチド残基を含むオリゴヌクレオチド鎖をいう。本明細書で使用される際、用語「オリゴヌクレオチド」および「ポリヌクレオチド」は、ヌクレオチドのポリマー(例えば少なくとも3つの一連のヌクレオチド)を指すために交換可能に使用され得る。いくつかの実施形態では、「核酸」は、RNAならびに一本鎖および/または二本鎖DNAを包含する。核酸は、例えば、ゲノム、転写物、mRNA、tRNA、rRNA、siRNA、snRNA、プラスミド、コスミド、染色体、染色分体、または他の天然に存在する核酸分子との関連において、天然に存在し得る。他方、核酸分子は、例えば組換えDNAもしくはRNA、人工染色体、操作されたゲノム、もしくはその断片、または合成DNA、RNA、DNA/RNAハイブリッド、または非天然に存在するヌクレオチドもしくはヌクレオシドを含む、非天然に存在する分子であり得る。さらに、用語「核酸」、「DNA」、「RNA」、および/または類似の用語は、核酸アナログ、例えばホスホジエステル主鎖以外を有するアナログを含む。核酸は、天然供給源から精製される、組換え発現系を用いて産生され必要に応じて精製される、化学的に合成される、等が可能である。化学的に合成された分子の場合、核酸は、適切な場合には、例えば、化学的に修飾された塩基または糖、および主鎖修飾を有するアナログなどのヌクレオシドアナログを含み得る。核酸配列は、特に示されない限り、5’から3’方向に示される。いくつかの実施形態では、核酸は、天然ヌクレオシド(例えばアデノシン、チミジン、グアノシン、シチジン、ウリジン、デオキシアデノシン、デオキシチミジン、デオキシグアノシン、およびデオキシシチジン)；ヌクレオシドアナログ(例えば2-アミノアデノシン、2-チオチミジン、イノシン、ピロロピリミジン、3-メチルアデノシン、5-メチルシチジン、2-アミノアデノシン、C5-ブロモウリジン、C5-フルオロウリジン、C5-ヨードウリジン、C5-プロピニル-ウリジン、C5-プロピニル-シチジン、C5-メチルシチジン、2-アミノアデノシン、7-デアザアデノシン、7-デアザグアノシン、8-オキソアデノシン、8-オキソグアノシン、O(6)-メチルグアニン、および2-チオシチジン)；化学修飾塩基；生物学的に修飾された塩基(例えばメチル化塩基)；挿入塩基；修飾糖(例えば2’-フルオロリボース、リボース、2’-デオキシリボース、アラビノース、およびヘキソース)；および/または修飾リン酸基(例えばホスホロチオエートおよび5’-N-ホスホロアミダイト連結)であるか、またはそれらを含む。

「核酸プログラム可能DNA結合タンパク質」あるいは「napDNAbp」という用語は、「ポリヌクレオチドプログラム可能ヌクレオチド結合ドメイン」と交換可能に使用可能であり、特定の核酸配列にnapDNAbpをガイドするガイド核酸またはガイドポリヌクレオチド（例えばgRNA）のような核酸（例えばDNAまたはRNA）と会合するタンパク質を指す。いくつかの実施形態では、ポリヌクレオチドプログラム可能ヌクレオチド結合ドメインは、ポリヌクレオチドプログラム可能DNA結合ドメインである。いくつかの実施形態では、ポリヌクレオチドプログラム可能ヌクレオチド結合ドメインは、ポリヌクレオチドプログラム可能なRNA結合ドメインである。いくつかの実施形態では、ポリヌクレオチドプログラム可能ヌクレオチド結合ドメインは、Cas9タンパク質である。Cas9タンパク質は、ガイドRNAに相補的な特定のDNA配列にCas9タンパク質をガイドするガイドRNAと会合することができる。いくつかの実施形態では、napDNAbpは、Cas9ドメイン、例えばヌクレアーゼ活性Cas9、Cas9ニッカーゼ (nCas9) 、またはヌクレアーゼ不活性Cas9 (dCas9) である。核酸プログラム可能DNA結合タンパク質の非限定的な例には、Cas9（例えばdCas9およびnCas9）、Cas12a/Cpfl、Cas12b/C2cl、Cas12c/C2c3、Cas12d/CasY、Cas12e/CasX、Cas12g、Cas12h、およびCas12iが挙げられる。Cas酵素の非限定的な例としては、Cas1、Cas1B、Cas2、Cas3、Cas4、Cas5、Cas5d、Cas5t、Cas5h、Cas5a、Cas6、Cas7、Cas8、Cas8a、Cas8b、Cas8c、Cas9（Csn1またはCsx12としても知られる）、Cas10、Cas10d、Cas12a/Cpfl、Cas12b/C2cl、Cas12c/C2c3、Cas12d/CasY、Cas12e/CasX、Cas12g、Cas12h、Cas12i、Csy1、Csy2、Csy3、Csy4、Cse1、Cse2、Cse3、Cse4、Cse5e、Csc1、Csc2、Csa5、Csn1、Csn2、Csm1、Csm2、Csm3、Csm4、Csm5、Csm6、Cmr1、Cmr3、Cmr4、Cmr5、Cmr6、Csb1、Csb2、Csb3、Csx17、Csx14、Csx10、Csx16、CsaX、Csx3、Csx1、Csx1S、Csx11、Csf1、Csf2、CsO、Csf4、Csd1、Csd2、Cst1、Cst2、Csh1、Csh2、Csa1、Csa2、Csa3、Csa4、Csa5、II型Casエフェクタータンパク質、V型Casエフェクタータンパク質、VI型Casエフェクタータンパク質、CARF、DinG、それらのホモログ、あるいはそれらの修飾または操作されたバージョンが含まれる。他の核酸プログラム可能DNA結合タンパク質も、本開示に具体的に列記されていない可能性があるが、本開示の範囲内である。例えばMakarova et al. “Classification and Nomenclature of CRISPR-Cas Systems: Where from Here?” CRISPR J. 2018 Oct;1:325-336. doi: 10.1089/crispr.2018.0033; Yan et al., “Functionally diverse type V CRISPR-Cas systems” Science. 2019 Jan 4;363(6422):88-91. doi: 10.1126/science.aav7271を参照のこと（それぞれの全内容が参照により本明細書に組み込まれる）。

用語「核酸塩基」、「窒素塩基」、または「塩基」は、本明細書中で交換可能に使用され、ヌクレオシドを形成する窒素含有生物学的化合物を指し、ヌクレオシドはヌクレオチドの構成要素である。塩基対を形成し、互いに積み重なる核酸塩基の能力は、直接、リボ核酸(RNA) およびデオキシリボ核酸(DNA) のような長鎖らせん構造をもたらす。アデニン(A) 、シトシン(C) 、グアニン(G) 、チミン(T) 、ウラシル(U) の5つの核酸塩基は、主要な（primary）塩基またはカノニカルな（canonical）核酸塩基と呼ばれる。アデニンとグアニンはプリンに由来し、シトシン、ウラシル、チミンはピリミジンに由来する。DNAとRNAは修飾された他の(非主要) 塩基も含有してもよい。非限定的な例示的修飾核酸塩基には、ヒポキサンチン、キサンチン、7-メチルグアニン、5,6-ジヒドロウラシル、5-メチルシトシン(m5C) 、および5-ヒドロメチルシトシンが含まれる。ヒポキサンチンとキサンチンは突然変異原の存在によって生成可能であり、どちらも脱アミノ化(アミン基のカルボニル基への置換)によって生成される。ヒポキサンチンはアデニンから修飾され得る。キサンチンはグアニンから修飾され得る。ウラシルはシトシンの脱アミノ化によって生じ得る。「ヌクレオシド」は核酸塩基と五炭糖(リボースまたはデオキシリボースのいずれか)からなる。ヌクレオシドの例には、アデノシン、グアノシン、ウリジン、シチジン、5-メチルウリジン(m5U) 、デオキシアデノシン、デオキシグアノシン、チミジン、デオキシウリジン、およびデオキシシチジンが含まれる。修飾核酸塩基を有するヌクレオシドの例には、イノシン(I) 、キサントシン(X) 、7-メチルグアノシン(m7G) 、ジヒドロウリジン(D) 、5-メチルシチジン(m5C) 、プソイドウリジン(Ψ) が含まれる。「ヌクレオチド」は、核酸塩基、五炭糖(リボースまたはデオキシリボースのいずれか)、および少なくとも1つのリン酸基からなる。

「核酸塩基編集ドメイン」または「核酸塩基編集タンパク質」という用語は、本明細書において使用される際、アデニン(もしくはアデノシン)からヒポキサンチン(もしくはイノシン)への脱アミノ化、ならびに非テンプレート化ヌクレオチド付加および挿入のような、RNAまたはDNAにおける核酸塩基改変を触媒することができるタンパク質または酵素を指す。いくつかの実施形態では、核酸塩基編集ドメインは、デアミナーゼドメイン(例えば、アデニンデアミナーゼもしくはアデノシンデアミナーゼ)である。いくつかの実施形態では、核酸塩基編集ドメインは、1つより多いデアミナーゼドメイン(例えば、アデニンデアミナーゼ、またはアデノシンデアミナーゼとシチジンもしくはシトシンデアミナーゼ、例えばPCT/US19/44935に記載される通り)である。いくつかの実施形態では、核酸塩基編集ドメインは、天然に存在する核酸塩基編集ドメインであり得る。いくつかの実施形態では、核酸塩基編集ドメインは、天然に存在する核酸塩基編集ドメインから操作または進化された核酸塩基編集ドメインであり得る。核酸塩基編集ドメインは、細菌、ヒト、チンパンジー、ゴリラ、サル、ウシ、イヌ、ラット、またはマウスなどの任意の生物由来であり得る。

本明細書で使用される際、「剤を取得する」におけるような「取得する」は、その剤を合成すること、購入すること、生成すること、調製すること、または他の方法で獲得することを含む。

本明細書で使用される際、「患者」または「対象」は、疾患または障害と診断されている、それらを有するかもしくは発展させるリスクがある、またはそれらを有するかもしくは発展させる疑いがある哺乳動物対象または個体を指す。いくつかの実施形態では、用語「患者」は、疾患または障害を生ずる可能性が平均より高い哺乳動物対象を指す。例示的な患者は、ヒト、非ヒト霊長類、ネコ、イヌ、ブタ、ウシ、ネコ、ウマ、ラクダ、ラマ、ヤギ、ヒツジ、齧歯類(例えば、マウス、ウサギ、ラット、またはモルモット)および本明細書に開示される療法から利益を得ることができる他の哺乳動物であり得る。例示的なヒト患者は、男性および/または女性であり得る。

「それを必要とする患者」または「それを必要とする対象」は、本明細書では、疾患または障害と診断された、それを有する、それを有するリスクがある、それに感受性がある、それを有することがあらかじめ決定された、またはそれを有することが疑われる患者または個体として言及される。

「病原性突然変異」、「病原性バリアント」、「疾患原因突然変異」、「疾患原因バリアント」、「有害突然変異」または「素因となる突然変異」という用語は、特定の疾患または障害に対する個体の感受性または素因を増大させる遺伝子改変または突然変異を指す。いくつかの実施形態では、病原性突然変異は、遺伝子によってコードされるタンパク質中の少なくとも1つの野生型アミノ酸が少なくとも1つの病原性アミノ酸によって置換されたものを含む。

用語「タンパク質」、「ペプチド」、「ポリペプチド」、およびそれらの文法的等価物は、本明細書において交換可能に使用され、ペプチド(アミド) 結合によってともに連結されたアミノ酸残基のポリマーを指す。この用語は、任意のサイズ、構造または機能のタンパク質、ペプチドまたはポリペプチドを指す。典型的には、タンパク質、ペプチド、またはポリペプチドは、少なくとも長さ3アミノ酸である。タンパク質、ペプチド、またはポリペプチドは、個々のタンパク質または一群のタンパク質を指すことができる。タンパク質、ペプチド、またはポリペプチド中の1つ以上のアミノ酸は、コンジュゲート化、官能化、または他の修飾等のため、例えば炭水化物基、ヒドロキシル基、リン酸基、ファルネシル基、イソファルネシル基、脂肪酸基、リンカーなどの化学的実体の添加によって、修飾され得る。タンパク質、ペプチド、またはポリペプチドはまた、単一分子であってもよく、または多分子複合体であってもよい。タンパク質、ペプチド、またはポリペプチドは、天然に存在するタンパク質またはペプチドの単なる断片であり得る。タンパク質、ペプチド、またはポリペプチドは、天然に存在するもの、組換え体、もしくは合成のもの、またはそれらの任意の組み合わせであり得る。本明細書中で使用される際、用語「融合タンパク質」とは、少なくとも2つの異なるタンパク質由来のタンパク質ドメインを含むハイブリッドポリペプチドをいう。1つのタンパク質は、融合タンパク質のアミノ末端(N末端) 部分またはカルボキシ末端(C末端) タンパク質に位置することができ、従って、それぞれ、アミノ末端融合タンパク質またはカルボキシ末端融合タンパク質を形成する。タンパク質は、異なるドメイン、例えば、核酸結合ドメイン(例えば、標的部位へのタンパク質の結合を導くCas9のgRNA結合ドメイン)および核酸切断ドメイン、あるいは核酸編集タンパク質の触媒ドメインを含み得る。いくつかの実施形態では、タンパク質は、タンパク質性部分、例えば、核酸結合ドメインを構成するアミノ酸配列、および有機化合物、例えば、核酸切断剤として作用し得る化合物を含む。いくつかの実施形態では、タンパク質は、核酸、例えばRNAまたはDNAと複合体化されているか、または核酸と会合している。本明細書で提供される任意のタンパク質は、当技術分野で公知の任意の方法によって生産することができる。例えば、本明細書で提供されるタンパク質は、組換えタンパク質発現および精製を介して生産することができ、これは、ペプチドリンカーを含む融合タンパク質に特に適している。組換えタンパク質の発現および精製のための方法はよく知られており、Green and Sambrook, Molecular Cloning: A Laboratory Manual (4th ed., Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y. (2012))によって記載されているものを含み、その全内容は参照により本明細書に組み入れられる。

本明細書に開示されるポリペプチドおよびタンパク質(機能的部分およびその機能的バリアントを含む)は、1つ以上の天然に存在するアミノ酸の代わりに合成アミノ酸を含むことができる。そのような合成アミノ酸は当技術分野で公知であり、例えば、アミノシクロヘキサンカルボン酸、ノルロイシン、α-アミノn-デカン酸、ホモセリン、S-アセチルアミノメチル-システイン、trans-3-およびtrans-4-ヒドロキシプロリン、4-アミノフェニルアラニン、4-ニトロフェニルアラニン、4-クロロフェニルアラニン、4-カルボキシフェニルアラニン、β-フェニルセリンβ-ヒドロキシフェニルアラニン、フェニルグリシン、α-ナフチルアラニン、シクロヘキシルアラニン、シクロヘキシルグリシン、インドリン-2-カルボン酸、1,2,3,4-テトラヒドロイソキノリン-3-カルボン酸、アミノマロン酸、アミノマロン酸モノアミド、N'-ベンジル-N'-メチル-リジン、N',N'-ジベンジル-リジン、6-ヒドロキシリジン、オルニチン、α-アミノシクロペンタンカルボン酸、α-アミノシクロヘキサンカルボン酸、α-アミノシクロヘプタンカルボン酸、α-(2-アミノ-2-ノルボルナン)-カルボン酸、α,γ-ジアミノ酪酸、α,β-ジアミノプロピオン酸、ホモフェニルアラニン、およびα-tert-ブチルグリシンが挙げられる。ポリペプチドおよびタンパク質は、ポリペプチド構築物の1つ以上のアミノ酸の翻訳後修飾と関連することができる。翻訳後修飾の非限定的な例としては、リン酸化、アセチル化およびホルミル化を含むアシル化、グリコシル化(N-連結およびO-連結を含む)、アミド化、ヒドロキシル化、メチル化およびエチル化を含むアルキル化、ユビキチン化、ピロリドンカルボン酸の添加、ジスルフィド架橋の形成、硫酸化、ミリストイル化、パルミトイル化、イソプレニル化、ファルネシル化、ゲラニル化、グリピエーション（glypiation）、リポイル化およびヨード化が挙げられる。

タンパク質または核酸に関連して本明細書中で使用される用語「組換え体」とは、天然には存在せず、人為操作の産物であるタンパク質または核酸を指す。例えば、いくつかの実施形態では、組換えタンパク質または核酸分子は、任意の天然に存在する配列と比較して、少なくとも1つ、少なくとも2つ、少なくとも3つ、少なくとも4つ、少なくとも5つ、少なくとも6つ、または少なくとも7つの突然変異を含むアミノ酸またはヌクレオチド配列を含む。

「減少する」とは、少なくとも10%、25%、50%、75%、または100%の負の改変を意味する。

「参照（reference）」は、標準または対照の条件を意味する。一実施形態では、参照は野生型または健康な細胞である。他の実施形態では、限定なしに、参照は、試験条件に晒されていないか、またはプラセボもしくは生理食塩水、培地、緩衝液、および/または、関心対象のポリヌクレオチドを保持しない対照ベクターに晒される、非処理細胞である。

「参照配列」は、配列比較の基礎として使用される定義済み配列である。参照配列は、特定の配列のサブセットまたは全体であり得る；例えば、完全長のcDNAもしくは遺伝子配列のセグメント、または完全なcDNAまたは遺伝子配列。ポリペプチドについては、参照ポリペプチド配列の長さは、一般に、少なくとも約16アミノ酸、少なくとも約20アミノ酸、少なくとも約25アミノ酸、約35アミノ酸、約50アミノ酸、または約100アミノ酸である。核酸については、参照核酸配列の長さは、一般に、少なくとも約50ヌクレオチド、少なくとも約60ヌクレオチド、少なくとも約75ヌクレオチド、約100ヌクレオチドまたは約300ヌクレオチドまたはおよそそれらの値もしくはそれらの間の任意の整数である。いくつかの実施形態では、参照配列は、関心対象のタンパク質の野生型配列である。他の実施形態では、参照配列は、野生型タンパク質をコードするポリヌクレオチド配列である。

用語「RNAプログラム可能ヌクレアーゼ」および「RNA誘導型ヌクレアーゼ」は、切断の標的ではない1つ以上のRNAとともに使用される(例えば、それに結合または会合する)。いくつかの実施形態では、RNAプログラム可能ヌクレアーゼは、RNAと複合体である場合、ヌクレアーゼ:RNA複合体と称され得る。典型的には、結合したRNA（複数可）はガイドRNA (gRNA) と呼ばれる。gRNAは2つ以上のRNAの複合体として存在することもあれば、単一のRNA分子として存在することもある。単一のRNA分子として存在するgRNAは、シングルガイドRNA（sgRNA）と呼ばれることがあるが、「gRNA」は、単一の分子として、または2つ以上の分子の複合体のいずれかとして存在するガイドRNAを指すために交換可能に使用される。典型的には、単一のRNA種として存在するgRNAは、(1) 標的核酸と相同性を共有するドメイン（例えば、標的へのCas9複合体の結合を指示する）；および(2) Cas9タンパク質に結合するドメインという2つのドメインを含む。いくつかの実施形態では、ドメイン (2) は、tracrRNAとして知られる配列に対応し、ステム-ループ構造を含む。例えば、いくつかの態様において、ドメイン (2) は、Jinek et al., Science 337:816-821(2012)（その全内容が参照により本明細書に組み入れられる）に提供されるようなtracrRNAと同一または相同である。gRNA (例えばドメイン2を含むもの)の他の例は、「Switchable Cas9 Nucleases and Uses Thereof」と題され2013年9月6日に出願された米国仮特許出願U.S.S.N.61/874,682および「Delivery System For Functional Nucleases」と題され2013年9月6日に出願された米国仮特許出願U.S.S.N.61/874,746に見出されることが可能であり、それら各々の全内容が参照により本明細書に組み入れられる。いくつかの実施形態では、gRNAは、ドメイン (1) および (2) の2つ以上を含み、「伸長されたgRNA」と称され得る。例えば、伸長されたgRNAは、本明細書に記載されるように、例えば2つ以上のCas9タンパク質と結合し、2つ以上の異なる領域で標的核酸と結合する。gRNAは、標的部位を相補するヌクレオチド配列を含み、これが前記標的部位へのヌクレアーゼ/RNA複合体の結合を仲介し、ヌクレアーゼ：RNA複合体の配列特異性を提供する。

いくつかの実施形態では、RNAプログラム可能ヌクレアーゼは、(CRISPR関連システム) Cas9エンドヌクレアーゼ、例えば、Streptococcus pyogenes由来のCas9 (Casnl) である（例えば、"Complete genome sequence of an Ml strain of Streptococcus pyogenes." Ferretti J.J., McShan W.M., Ajdic D.J., Savic D.J., Savic G., Lyon K., Primeaux C, Sezate S., Suvorov A.N., Kenton S., Lai H.S., Lin S.P., Qian Y., Jia H.G., Najar F.Z., Ren Q., Zhu H., Song L., White J., Yuan X., Clifton S.W., Roe B.A., McLaughlin R.E., Proc. Natl. Acad. Sci. U.S.A. 98:4658-4663(2001); "CRISPR RNA maturation by trans-encoded small RNA and host factor RNase III." Deltcheva E., Chylinski K., Sharma CM., Gonzales K., Chao Y., Pirzada Z.A., Eckert M.R., Vogel J., Charpentier E., Nature 471:602-607(2011)を参照のこと）。

RNAプログラム可能ヌクレアーゼ(例えばCas9)は、DNA切断部位を標的とするためにRNA:DNAハイブリダイゼーションを使用するため、これらのタンパク質は、原則として、ガイドRNAによって特定される任意の配列を標的とすることができる。部位特異的切断のためにCas9のようなRNAプログラム可能ヌクレアーゼを使用する方法(例えばゲノムを改変するために)は、当技術分野において公知である(例えば、Cong, L. et al., Multiplex genome engineering using CRISPR/Cas systems. Science 339, 819-823 (2013); Mali, P. et al., RNA-guided human genome engineering via Cas9. Science 339, 823-826 (2013); Hwang, W.Y. et al., Efficient genome editing in zebrafish using a CRISPR-Cas system. Nature biotechnology 31, 227-229 (2013); Jinek, M. et al., RNA-programmed genome editing in human cells. eLife 2, e00471 (2013); Dicarlo, J.E. et al., Genome engineering in Saccharomyces cerevisiae using CRISPR-Cas systems. Nucleic acids research (2013); Jiang, W. et al., RNA-guided editing of bacterial genomes using CRISPR-Cas systems. Nature biotechnology 31, 233-239 (2013)を参照のこと。これらの各々の全内容は参照により本明細書に組み入れられる)。

用語「一塩基多型(SNP)」は、ゲノム中の特定の位で起こる単一ヌクレオチドの変異であり、各変異は集団内で認識できるある程度(例えば>1%)まで存在する。例えば、ヒトゲノム中の特定の塩基位では、ほとんどの個体でCヌクレオチドが出現し得るが、少数の個体ではその位がAで占められている。これは、この特定の位にSNPがあり、CまたはAという2つのあり得るヌクレオチドの変異がこの位のアレルであることを意味する。SNPは疾患に対する感受性の相違の根底にある。病気の重症度や治療に対する体の反応も、遺伝的変異の表れである。SNPは、遺伝子のコード領域、遺伝子の非コード領域、または遺伝子間領域(遺伝子と遺伝子の間の領域)に存在し得る。いくつかの実施形態では、コード配列内のSNPは、遺伝暗号の縮重のために、産生されるタンパク質のアミノ酸配列を必ずしも変化させない。コード領域のSNPには、同義SNPと非同義SNPの2種類がある。同義SNPはタンパク質配列に影響しないが、非同義SNPはタンパク質のアミノ酸配列を変化させる。非同義SNPにはミスセンスとナンセンスの2種類がある。タンパク質をコードする領域にないSNPは、遺伝子スプライシング、転写因子の結合、メッセンジャーRNAの分解、または非コードRNAの配列に影響を与えることがある。この種のSNPによって影響を受ける遺伝子発現はeSNP (発現SNP)と呼ばれ、遺伝子の上流または下流にあり得る。一塩基バリアント(SNV) は、頻度に制限のない一塩基の変異であり、体細胞で生じ得る。体細胞一塩基変異は一塩基改変とも呼ばれ得る。

「特異的に結合する」とは、本発明のポリペプチドおよび/または核酸分子を認識し、これに結合するが、試料、例えば生物学的試料中の他の分子を実質的に認識せず、これに結合しない核酸分子、ポリペプチド、もしくはそれらの複合体（例えば、核酸プログラム可能DNA結合ドメインおよびガイド核酸）、化合物、または分子を意味する。

本発明の方法において有用な核酸分子は、本発明のポリペプチドまたはその断片をコードする任意の核酸分子を含む。そのような核酸分子は、内因性核酸配列と100%同一である必要はないが、典型的には実質的同一性を示す。内因性配列に対して「実質的同一性」を有するポリヌクレオチドは、典型的には、二本鎖核酸分子の少なくとも1つの鎖とハイブリダイズすることができる。本発明の方法において有用な核酸分子は、本発明のポリペプチドまたはその断片をコードする任意の核酸分子を含む。そのような核酸分子は、内因性核酸配列と100%同一である必要はないが、典型的には実質的同一性を示す。内因性配列に対して「実質的同一性」を有するポリヌクレオチドは、典型的には、二本鎖核酸分子の少なくとも1つの鎖とハイブリダイズすることができる。「ハイブリダイズする」とは、多様なストリンジェンシー条件下で相補的ポリヌクレオチド配列(例えば、本明細書に記載の遺伝子)の間、またはその一部の間に二本鎖分子を形成する対をなすことを意味する。(例えばWahl, G. M. and S. L. Berger (1987) Methods Enzymol. 152:399; Kimmel, A. R. (1987) Methods Enzymol. 152:507を参照のこと)。

例えば、ストリンジェントな塩濃度は、通常、約750 mM未満のNaClおよび75 mMクエン酸三ナトリウム、好ましくは約500 mM未満のNaClおよび50 mMクエン酸三ナトリウム、より好ましくは約250 mM未満のNaClおよび25 mMクエン酸三ナトリウムである。低ストリンジェンシーハイブリダイゼーションは、有機溶媒、例えばホルムアミドの非存在下で得ることができ、一方、高ストリンジェンシーハイブリダイゼーションは、少なくとも約35%ホルムアミド、より好ましくは少なくとも約50%ホルムアミドの存在下で得ることができる。ストリンジェントな温度条件は、通常、少なくとも約30℃、より好ましくは少なくとも約37℃、最も好ましくは少なくとも約42℃の温度を含むであろう。ハイブリダイゼーション時間、界面活性剤、例えば、ドデシル硫酸ナトリウム(SDS) の濃度、およびキャリアーDNAの包含または排除などの多様な追加のパラメータは、当業者によく知られている。必要に応じてこれら多様な条件を組み合わせることによって、多様なレベルのストリンジェンシーが達成される。一実施形態では、ハイブリダイゼーションは、30℃で、750 mM NaCl、75 mMクエン酸三ナトリウムおよび1% SDS中で起こる。別の実施形態では、ハイブリダイゼーションは、37℃で、500 mM NaCl、50 mMクエン酸三ナトリウム、1% SDS、35%ホルムアミドおよび100μg/ml変性サケ精子DNA (ssDNA) 中で起こる。別の実施形態では、ハイブリダイゼーションは、42℃で、250 mM NaCl、25 mMクエン酸三ナトリウム、1% SDS、50%ホルムアミドおよび200μg/ml ssDNA中で起こる。これらの条件の有用なバリエーションは、当業者には容易に明らかになるであろう。

ほとんどの用途では、ハイブリダイゼーションに続く洗浄工程もまた、ストリンジェンシーが異なる。洗浄ストリンジェンシー条件は、塩濃度および温度によって定義することができる。上記のように、洗浄ストリンジェンシーは、塩濃度を低下させるか、または温度を上昇させることによって増加させることができる。例えば、洗浄工程のためのストリンジェントな塩濃度は、好ましくは約30 mM未満のNaClおよび3 mMクエン酸三ナトリウムであり、最も好ましくは約15 mM未満のNaClおよび1.5 mMクエン酸三ナトリウムであり得る。洗浄工程のためのストリンジェントな温度条件は、通常、少なくとも約25℃、より好ましくは少なくとも約42℃、さらにより好ましくは少なくとも約68℃の温度を含む。一実施形態では、洗浄工程は、25℃で、30 mM NaCl、3 mMクエン酸三ナトリウム、および0.1% SDS中で行われる。より好ましい実施形態では、洗浄工程は、42℃で、15 mM NaCl、1.5 mMクエン酸三ナトリウム、および0.1% SDS中で行われる。より好ましい実施形態では、洗浄工程は、68℃で、15 mM NaCl、1.5 mMクエン酸三ナトリウム、および0.1% SDS中で行われる。これらの条件の追加のバリエーションは、当業者には容易に明らかになるであろう。ハイブリダイゼーション技術は、当業者によく知られており、例えば、Benton and Davis (Science 196:180, 1977); Grunstein and Hogness (Proc. Natl. Acad. Sci., USA 72:3961, 1975); Ausubel et al. (Current Protocols in Molecular Biology, Wiley Interscience, New York, 2001); Berger and Kimmel (Guide to Molecular Cloning Techniques, 1987, Academic Press, New York); およびSambrook et al., Molecular Cloning: A Laboratory Manual, Cold Spring Harbor Laboratory Press, New Yorkに記述されている。

「分割（split）」とは、2つ以上の断片に分割されることを意味する。

「分割されたCas9タンパク質」あるいは「分割Cas9」とは、2つの別個のヌクレオチド配列によってコードされるN末端断片およびC末端断片として提供されるCas9タンパク質をいう。Cas9タンパク質のN末端部分およびC末端部分に対応するポリペプチドは、スプライスされて「再構成」Cas9タンパク質を形成することができる。特定の実施形態では、Cas9タンパク質は、例えば、Nishimasu et al., Cell, Volume 156, Issue 5, pp. 935-949, 2014に記載されるように、またはJiang et al. (2016) Science 351: 867-871. PDB file: 5F9Rに記載されるように（それぞれ参照により本明細書に組み込まれる）、タンパク質の非秩序的な領域内で2つの断片に分割される。いくつかの実施形態では、タンパク質は、SpCas9のおよそアミノ酸A292～G364、F445～K483、もしくはE565～T637の間の領域内の任意のC、T、A、もしくはSにおいて、または任意の他のCas9、Cas9バリアント（例えばnCas9、dCas9）、もしくは他のnapDNAbpにおける対応する位で、2つの断片に分割される。いくつかの実施形態では、タンパク質は、SpCas9 T310、T313、A456、S469、またはC574で2つの断片に分けられる。いくつかの実施形態では、タンパク質を2つの断片に分けるプロセスは、タンパク質を「分割（スプリッティング）する」と称される。

他の実施形態では、Cas9タンパク質のN末端部分は、S. pyogenes Cas9野生型（SpCas9）（NCBI参照配列：NC_002737.2、Uniprot参照配列：Q99ZW2）のアミノ酸1～573または1～637、あるいは対応する位／突然変異を含み、Cas9タンパク質のC末端部分は、SpCas9野生型のアミノ酸574～1368または638～1368の部分を含む。

分割されたCas9のC末端部分は、分割Cas9のN末端部分と連結されて完全なCas9タンパク質を形成することができる。いくつかの実施形態では、Cas9タンパク質のC末端部分は、Cas9タンパク質のN末端部分が終わるところから始まる。こうしたものとして、いくつかの実施形態では、分割Cas9のC末端部分は、spCas9のアミノ酸 (551～651) ～1368の部分を含む。「(551～651)～1368」とは、アミノ酸551～651（両端を含む）の間のアミノ酸から始まり、アミノ酸1368で終わることを意味する。例えば、分割Cas9のC末端部分は、spCas9のアミノ酸551～1368、552～1368、553～1368、554～1368、555～1368、556～1368、557～1368、558～1368、559～1368、560～1368、561～1368、562～1368、563～1368、564～1368、565～1368、566～1368、567～1368、568～1368、569～1368、570～1368、571～1368、572～1368、573～1368、574～1368、575～1368、576～1368、577～1368、578～1368、579～1368、580～1368、581～1368、582～1368、583～1368、584～1368、585～1368、586～1368、587～1368、588～1368、589～1368、590～1368、591～1368、592～1368、593～1368、594～1368、595～1368、596～1368、597～1368、598～1368、599～1368、600～1368、601～1368、602～1368、603～1368、604～1368、605～1368、606～1368、607～1368、608～1368、609～1368、610～1368、611～1368、612～1368、613～1368、614～1368、615～1368、616～1368、617～1368、618～1368、619～1368、620～1368、621～1368、622～1368、623～1368、624～1368、625～1368、626～1368、627～1368、628～1368、629～1368、630～1368、631～1368、632～1368、633～1368、634～1368、635～1368、636～1368、637～1368、638～1368、639～1368、640～1368、641～1368、642～1368、643～1368、644～1368、645～1368、646～1368、647～1368、648～1368、649～1368、650～1368、または651～1368のいずれか１つの部分を含み得る。いくつかの実施形態では、分割Cas9タンパク質のC末端部分は、SpCas9のアミノ酸574～1368または638～1368の部分を含む。

「Serpin1Aポリヌクレオチド」は、A1ATタンパク質またはその断片をコードする核酸分子を意味する。NCBI寄託番号NM_000295で入手可能である例示的なSerpin1Aポリヌクレオチドの配列を以下に提供する：
1 acaatgactc ctttcggtaa gtgcagtgga agctgtacac tgcccaggca aagcgtccgg
61 gcagcgtagg cgggcgactc agatcccagc cagtggactt agcccctgtt tgctcctccg
121 ataactgggg tgaccttggt taatattcac cagcagcctc ccccgttgcc cctctggatc
181 cactgcttaa atacggacga ggacagggcc ctgtctcctc agcttcaggc accaccactg
241 acctgggaca gtgaatcgac aatgccgtct tctgtctcgt ggggcatcct cctgctggca
301 ggcctgtgct gcctggtccc tgtctccctg gctgaggatc cccagggaga tgctgcccag
361 aagacagata catcccacca tgatcaggat cacccaacct tcaacaagat cacccccaac
421 ctggctgagt tcgccttcag cctataccgc cagctggcac accagtccaa cagcaccaat
481 atcttcttct ccccagtgag catcgctaca gcctttgcaa tgctctccct ggggaccaag
541 gctgacactc acgatgaaat cctggagggc ctgaatttca acctcacgga gattccggag
601 gctcagatcc atgaaggctt ccaggaactc ctccgtaccc tcaaccagcc agacagccag
661 ctccagctga ccaccggcaa tggcctgttc ctcagcgagg gcctgaagct agtggataag
721 tttttggagg atgttaaaaa gttgtaccac tcagaagcct tcactgtcaa cttcggggac
781 accgaagagg ccaagaaaca gatcaacgat tacgtggaga agggtactca agggaaaatt
841 gtggatttgg tcaaggagct tgacagagac acagtttttg ctctggtgaa ttacatcttc
901 tttaaaggca aatgggagag accctttgaa gtcaaggaca ccgaggaaga ggacttccac
961 gtggaccagg tgaccaccgt gaaggtgcct atgatgaagc gtttaggcat gtttaacatc
1021 cagcactgta agaagctgtc cagctgggtg ctgctgatga aatacctggg aatgccacc
1081 gccatcttct tcctgcctga tgaggggaaa ctacagcacc tggaaaatga ctcacccac
1141 gatatcatca ccaagttcct ggaaaatgaa gacagaaggt ctgccagctt catttaccc
1201 aaactgtcca ttactggaac ctatgatctg aagagcgtcc tgggtcaact ggcatcact
1261 aaggtcttca gcaatggggc tgacctctcc ggggtcacag aggaggcacc ctgaagctc
1321 tccaaggccg tgcataaggc tgtgctgacc atcgacgaga aagggactga gctgctggg
1381 gccatgtttt tagaggccat acccatgtct atcccccccg aggtcaagtt aacaaaccc
1441 tttgtcttct taatgattga acaaaatacc aagtctcccc tcttcatggg aaagtggtg
1501 aatcccaccc aaaaataact gcctctcgct cctcaacccc tcccctccat cctggcccc
1561 ctccctggat gacattaaag aagggttgag ctggtccctg cctgcatgtg ctgtaaatc
1621 cctcccatgt tttctctgag tctccctttg cctgctgagg ctgtatgtgg ctccaggta
1681 acagtgctgt cttcgggccc cctgaactgt gttcatggag catctggctg gtaggcaca
1741 tgctgggctt gaatccaggg gggactgaat cctcagctta cggacctggg ccatctgtt
1801 tctggagggc tccagtcttc cttgtcctgt cttggagtcc ccaagaagga tcacagggg
1861 aggaaccaga taccagccat gaccccaggc tccaccaagc atcttcatgt cccctgctc
1921 atcccccact cccccccacc cagagttgct catcctgcca gggctggctg gcccacccc
1981 aaggctgccc tcctgggggc cccagaactg cctgatcgtg ccgtggccca ttttgtggc
2041 atctgcagca acacaagaga gaggacaatg tcctcctctt gacccgctgt acctaacca
2101 gactcgggcc ctgcacctct caggcacttc tggaaaatga ctgaggcaga tcttcctga
2161 agcccattct ccatggggca acaaggacac ctattctgtc cttgtccttc atcgctgcc
2221 ccagaaagcc tcacatatct ccgtttagaa tcaggtccct tctccccaga gaagaggag
2281 ggtctctgct ttgttttctc tatctcctcc tcagacttga ccaggcccag aggccccag
2341 aagaccatta ccctatatcc cttctcctcc ctagtcacat ggccataggc tgctgatgg
2401 ctcaggaagg ccattgcaag gactcctcag ctatgggaga ggaagcacat acccattga
2461 cccccgcaac ccctcccttt cctcctctga gtcccgactg gggccacatg agcctgact
2521 tctttgtgcc tgttgctgtc cctgcagtct tcagagggcc accgcagctc agtgccacg
2581 gcaggaggct gttcctgaat agcccctgtg gtaagggcca ggagagtcct ccatcctcc
2641 aaggccctgc taaaggacac agcagccagg aagtcccctg ggcccctagc gaaggacag
2701 cctgctccct ccgtctctac caggaatggc cttgtcctat ggaaggcact ccccatccc
2761 aaactaatct aggaatcact gtctaaccac tcactgtcat gaatgtgtac taaaggatg
2821 aggttgagtc ataccaaata gtgatttcga tagttcaaaa tggtgaaatt gcaattcta
2881 catgattcag tctaatcaat ggataccgac tgtttcccac acaagtctcc gttctctta
2941 agcttactca ctgacagcct ttcactctcc acaaatacat taaagatatg ccatcacca
3001 agccccctag gatgacacca gacctgagag tctgaagacc tggatccaag tctgacttt
3061 tccccctgac agctgtgtga ccttcgtgaa gtcgccaaac ctctctgagc ccagtcatt
3121 gctagtaaga cctgcctttg agttggtatg atgttcaagt tagataacaa atgtttata
3181 cccattagaa cagagaataa atagaactac atttcttgca
PAM配列を強調し、アデニン塩基編集後の正しい配列を示している。

「対象」とは、哺乳動物を意味し、ヒトまたは非ヒト哺乳動物、例えばウシ亜科、ウマ科、イヌ科、ヒツジ科、もしくはネコ科が含まれるが、これらに限定されない。対象には、家畜（livestock）、労働を生じ、商品、例えば食品を提供するように育てられた飼育動物（domesticated animal）が含まれるがこれらに限定されず、ウシ、ヤギ、ニワトリ、ウマ、ブタ、ウサギ、およびヒツジが含まれるがこれらに限定されない。

「実質的に同一である」とは、参照アミノ酸配列(例えば、本明細書に記載のアミノ酸配列のいずれか1つ)または核酸配列(例えば、本明細書に記載の核酸配列のいずれか1つ)に対して少なくとも50%の同一性を示すポリペプチドまたは核酸分子を意味する。一実施形態では、そのような配列は、比較のために使用される配列とアミノ酸レベルまたは核酸レベルで少なくとも60%、80%、85%、90%、95%またはさらに99%の同一性を有する。
配列同一性は、典型的には、配列解析ソフトウェア(例えば、Genetics Computer Group, University of Wisconsin Biotechnology Center, 1710 University Avenue, Madison, Wis. 53705のSequence Analysis Software Package、BLAST、BESTFIT、GAP、またはPILEUP/PRETTYBOXプログラム)を用いて測定される。そのようなソフトウェアは、多様な置換、欠失、および/または他の改変に相同性の程度を割り当てることによって、同一または類似の配列をマッチさせる。保存的置換は、典型的には、以下の群内の置換を含む:グリシン、アラニン；バリン、イソロイシン、ロイシン；アスパラギン酸、グルタミン酸、アスパラギン、グルタミン；セリン、トレオニン；リジン、アルギニン；フェニルアラニン、チロシン。同一性の程度を決定するための例示的なアプローチにおいて、密接に関連した配列を示すe ^-3とe ^-100の間の確率スコアを含むBLASTプログラムを使用することができる。

COBALTは、例えば次のパラメータとともに使用される：
a) アラインメントパラメータ：ギャップペナルティ -11、-1および末端ギャップペナルティ-5、-1
b) CDDパラメータ： RPS BLASTをオンで用いる; Blast E値0.003; 保存カラムを見つけ再計算を続ける
c) クエリー・クラスタリング・パラメータ：クエリークラスターをオンで用いる; ワードサイズ4; 最大クラスター距離0.8;アルファベットは通常通り。
EMBOSS Needleは、例えば次のパラメータで使用される。
a) マトリックス: BLOSUM62;
b) ギャップオープン: 10;
c) ギャップ伸長: 0.5;
d) 出力形式: 対;
e) 末端ギャップペナルティ: 偽;
f) 末端ギャップオープン: 10; および
g) 末端ギャップ伸長: 0.5。

用語「標的部位」とは、核酸分子内の配列であって、核酸塩基エディターによって改変される配列をいう。一実施形態では、標的部位は、デアミナーゼまたはデアミナーゼ（例えばアデニンデアミナーゼ）を含む融合タンパク質によって脱アミノ化される。

本明細書で使用される際、用語「治療する(treat)」、「治療している(treating)」、「治療(treatment)」などは、障害および/またはそれに関連する症状を軽減もしくは改善すること、または所望の薬理学的および/または生理学的効果を得ることを指す。障害または状態を治療することは、関連する障害、状態または症状を完全に除去することを必要としないことが理解されるであろう。いくつかの実施形態では、効果は、療法的であり、すなわち、限定されるものではないが、効果は、疾患および/または疾患に起因する有害症状を部分的または完全に低減、減少、除去、軽減、緩和、強度低下、または治癒させる。いくつかの実施形態では、効果は予防的であり、すなわち効果は、疾患または状態の発生または再発を保護または予防する。この目的のために、本開示の方法は、本明細書に記載されるような療法的に有効な量の組成物を投与することを含む。一実施形態では、疾患はアルファ-1アンチトリプシン不全（A1AD）である。

「ウラシルグリコシラーゼ阻害因子」、または「UGI」とは、ウラシル除去修復システムを阻害する剤を意味する。一実施形態では、該剤は、宿主ウラシル-DNAグリコシラーゼに結合してDNAからのウラシル残基の除去を妨げるタンパク質またはその断片である。一実施形態では、UGIは、ウラシル-DNAグリコシラーゼ塩基除去修復酵素を阻害することができるタンパク質、その断片、またはドメインである。いくつかの実施形態では、UGIドメインは、野生型UGIまたはその改変バージョンを含む。いくつかの実施形態では、UGIドメインは、以下に提示される例示的アミノ酸配列の断片を含む。いくつかの実施形態では、UGI断片は、以下に提供される例示的UGI配列の少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または100%を含むアミノ酸配列を含む。いくつかの実施形態では、UGIは、以下に記載されるように、例示的UGIアミノ酸配列またはその断片に対して相同なアミノ酸配列を含む。いくつかの実施形態では、UGIまたはその一部は、以下に記載されるように、野生型UGIもしくUGI配列またはその一部に対して少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、少なくとも99.5%、少なくとも99.9%または100%の同一性を有する。例示的なUGIは、以下のアミノ酸配列を含む：
>splP14739IUNGI_BPPB2 ウラシル-DNAグリコシラーゼ阻害因子
MTNLSDIIEKETGKQLVIQESILMLPEEVEEVIGNKPESDILVHTAYDESTDENVMLLTSD APEYKPWALVIQDSNGENKIKML.

用語「ベクター」は、細胞内に核酸配列を導入し、形質転換された細胞を生じる手段を指す。ベクターには、プラスミド、トランスポゾン、ファージ、ウイルス、リポソーム、およびエピソームが含まれる。「発現ベクター」は、レシピエント細胞において発現されるべきヌクレオチド配列を含む核酸配列である。発現ベクターには、導入された配列の発現を促進し、かつ/または容易にする、追加の核酸配列、例えば開始、停止、エンハンサー、プロモーター、および分泌配列が含まれてもよい。

本明細書で提供される任意の組成物または方法を、本明細書で提供される任意の他の1つ以上の組成物および方法と組み合わせてもよい。

本明細書における「いくつかの実施形態」、「ある実施形態」、「一実施形態」、または「他の実施形態」という言及は、その実施形態に関連して説明される特定の特徴、構造、または特性が、本開示の少なくともいくつかの実施形態に含まれるが、必ずしもすべての実施形態に含まれるとは限らないことを意味する。

本明細書における可変物の任意の定義における化学基のリストの記載は、列挙された基の任意の単一の基または組み合わせとしてのその可変物の定義を含む。本明細書における可変物または態様に関する実施形態の記述は、任意の単一の実施形態としての、または任意の他の実施形態もしくはその一部と組み合わせられた、その実施形態を含む。

DNA編集は、遺伝子レベルで病原性突然変異を修正することによって、疾患状態を改変する実行可能な手段として出現してきた。最近まで、すべてのDNA編集プラットフォームは、特定のゲノム部位でDNA二本鎖切断（DSB）を誘導し、内因性DNA修復経路に頼り、半確率的方式で産物結果を決定する結果、複雑な遺伝子産物集団を生じることによって機能してきた。相同性指向性修復（HDR）経路を通じて、正確で、ユーザーが定義する修復結果が達成可能であるが、療法的に適切な細胞タイプにおいて、HDRを用いた高効率修復は、いくつかの困難によって妨げられてきている。実際には、この経路は、競合する、誤りがちな非相同端連結経路に比較して非効率的である。さらに、HDRは、細胞周期のG1およびS期に厳密に制限され、有糸分裂後の細胞におけるDSBの正確な修復を妨げる。その結果、これらの集団において、高効率に、ユーザーが定義するプログラム可能な方式でゲノム配列を改変することは、困難であるかまたは不可能であることが示されてきている。

図１A～１Cはプラスミドを示す。図１Aは、TadA7.10-dCas9塩基エディターをコードする発現ベクターである。図１Bは、クロラムフェニコール耐性（CamR）およびスペクチノマイシン耐性（SpectR）を与えるタンパク質をコードする核酸分子を含むプラスミドである。このプラスミドはまた、２つの点突然変異によって不能にされたカナマイシン耐性遺伝子も含む。図１Cは、クロラムフェニコール耐性（CamR）およびスペクチノマイシン耐性（SpectR）を与えるタンパク質をコードする核酸分子を含むプラスミドである。このプラスミドはまた、3つの点突然変異によって不能にされたカナマイシン耐性遺伝子も含む。図2は、カナマイシン耐性遺伝子欠損を含む、図１A～Cに示す発現ベクターで形質導入された細菌コロニーの画像である。ベクターは、誤りがちなPCRを用いて生成されたABE7.10バリアントを含有した。増加する濃度のカナマイシンを用いて、カナマイシン耐性に関して、これらの「進化された」ABE7.10バリアントを発現する細菌細胞を選択した。アデノシンデアミナーゼ活性を有するABE7.10バリアントを発現する細菌は、カナマイシン耐性遺伝子内に導入された突然変異を修正し、それによってカナマイシン耐性を回復することが可能であった。カナマイシン耐性細胞をさらなる分析のために選択した。図3は、表6に列挙する選択したABE8の有効性および特異性を定量化するグラフである。HEK293T細胞におけるアルファ-1アンチトリプシン遺伝子座で、編集をアッセイした。図4Aおよび4Bは、ABE8の編集効率および特異性を例示する。図4Aおよび4Bは、表６に記載する選択したABE8の塩基編集および特異性を定量化するグラフである。単一のバリアントTadAデアミナーゼドメインまたは野生型TadAデアミナーゼを評価した。図5は、オンターゲットアデニン（A）塩基対バイスタンダーAを編集するABE8の有効性を示すグラフを提示する。特に、ABE8は、有効なTadAデアミナーゼ、ABE7.10と比較した、A1AD部位での編集（すなわちA・TからG・Cの変換）の5倍増加を生じる。図6A～6Dは、塩基エディター操作を通じた、初代PiZ線維芽細胞における核酸塩基修正の改善された率の生成に関する核酸配列、表および棒グラフを示す。図6Aは、A1ADに関連するPiZ突然変異をコードする標的部位DNA配列を示す。この配列には、20ヌクレオチドのプロトスペーサーおよび非カノニカルspCas9 NGC PAMが含まれる。図6Bは、PiZ突然変異を修正するために用いた、多様なエディターのTadAデアミナーゼおよびCas9 PAMバリアント構成要素の両方を記載する表を提示する。図6Cおよび6Dは、Neonエレクトロポレーションシステムを用いて塩基編集試薬でトランスフェクションされた、患者由来PiZZ線維芽細胞（GM11423 Corriel Biorepository）で観察される編集率を示す棒グラフを提示する。各処理は、70,000の線維芽細胞、塩基エディターをコードする100ng mRNAおよび50ngアルファ-1修正gRNAを含有する10μlエレクトロポレーション緩衝液からなった。48時間の回復後、細胞を溶解し、標的とされるアンプリコンの配列決定によって、関心対象の遺伝子座を調べた。2回の独立の実験から、データを得た。これらのデータおよび結果は、NGC PAM認識の最適化（バリアント（Variant）1～3、図6Bおよび6C）およびABE8/9突然変異の取り込みを通じたTadAデアミナーゼの最適化（バリアント4～9、図6B～6D）の両方に関する編集効率の改善を立証する。図7A～7Dは、NSG-PiZトランスジェニックマウスにおける脂質ナノ粒子（LNP）仲介送達および塩基編集によって産生される血清A1ATの増加に関連する核酸配列、表およびグラフを提示する。図7Aは、20ヌクレオチドのプロトスペーサーおよび非カノニカルspCas9 NGC PAMを含む、標的部位DNA配列を示す。図7Bは、PiZ突然変異を修正するために用いた多様なエディターのTadAデアミナーゼおよびCas9 PAMバリアント構成要素の両方を記載する表を提示する。図7Cは、1:1重量比のgRNAおよび塩基エディターをコードするmRNAを含有する、1.5mg/kgのLNPで処置した7日後のNSG-PiZトランスジェニックマウスモデル由来の全肝臓gDNAにおいて観察される編集率を示すグラフを提示する。市販のNSG-PiZマウスは、免疫不全NOD-SCIDガンマ（NSG）バックグラウンド上に突然変異体ヒトSERPINA1(Glu342Lys突然変異)を発現し、これは、部分的肝切除後、ヒト肝細胞に関する安定なバックグラウンドを提供する（The Jackson Laboratory, Mount Desert Island, ME）。結果は、ngcABEvar9が、より早いバージョンのバリアント8よりも、より高い編集率を生じることを立証した。図7Dは、MSDサンドイッチイムノアッセイによって測定した際、処置前の試料に比較して、編集率が、血清アルファ-1アンチトリプシンの増加と相関することを示すグラフを提示する。これらの結果に基づいて、ABE8試薬を用いた塩基編集は、アルファ-1アンチトリプシン不全およびその潜在的な肺続発症に対処することが可能である。図8は、NRNN PAMスペース内で、すべてのあり得るPAMにアクセスするためのCas9バリアントを示す表である。PAM中に3つ以下の定義されたヌクレオチドの認識を必要とするCas9変異体のみを列挙する。非G PAMバリアントには、SpCas9-NRRH、SpCas9-NRTH、およびSpCas9-NRCH (Miller, S.M., et al. Continuous evolution of SpCas9 variants compatible with non-G PAMs, Nat. Biotechnol. (2020), (//doi.org/10.1038/s41587-020-0412-8)が含まれ、該文献の内容は、その全体が参照により本明細書に組み込まれる。

以下に記載するように、本発明は、アルファ-1アンチトリプシン不全（A1AD）と関連する突然変異を改変するための組成物および方法を特徴とする。いくつかの実施形態では、編集は、有害な突然変異を修正し、編集されたポリヌクレオチドが、野生型参照ポリヌクレオチド配列と区別できないようにする。別の実施形態では、編集は有害な突然変異を改変し、編集されたポリヌクレオチドが良性の突然変異を含むようにする。

本発明は、少なくとも部分的に、アデノシンデアミナーゼバリアントを含む塩基エディターが、有効にかつ正確に、A1ADと関連する有害な突然変異を編集し得るという発見に基づく。

［アルファ-1アンチトリプシン不全（A1AD）］
アルファ-1アンチトリプシン（A1A）は、染色体第14番上のSERPINA1遺伝子にコードされるプロテアーゼ阻害因子である。この糖タンパク質は主に肝臓中で合成されて血流に分泌され、健康な成人における血清濃度は1.5～3.0g/L（20～52μmol/L）である。該糖タンパク質は、肺間質および肺胞裏打ち液内に拡散し、ここで好中球エラスターゼを不活化して、それによって肺組織をプロテアーゼが仲介する損傷から保護する。アルファ-1アンチトリプシン不全（A1AD）は、常染色体共優性方式で遺伝する。SERPINA1遺伝子の100を超える遺伝子バリアントが記載されてきているが、すべてが疾患に関連するわけではない。これらのバリアントのアルファベット命名は、ゲル電気泳動上の泳動速度に基づく。最も一般的なバリアントはM（中程度の移動度）アレル（PiM）であり、2つの最も頻繁な不全アレルはPiSおよびPiZである（後者は泳動速度が最も遅い）。測定可能な血清タンパク質を産生しない、いくつかの突然変異が記載されてきており；これらは「ヌル」アレルと称される。最も一般的な遺伝子型はMMであり、アルファ-1アンチトリプシンの正常な血清レベルを生じる。重度の不全を有する大部分のヒトは、Zアレルがホモ接合性である（ZZ）。米国の60,000人を超えるA1AD患者は重度のZZ表現型を有する。Zタンパク質は、肝細胞小胞体での産生中、ミスフォールディングして重合し；これらの異常なポリマーは肝臓中に捕捉され、アルファ-1アンチトリプシンの血清レベルが非常に減少する。不全なまたは不安定なA1AT産生のため、A1ADに罹患した患者では肝臓および/または肺病変が引き起こされる。アルファ-1アンチトリプシン不全患者で見られる肝疾患は、肝細胞中に異常なアルファ-1アンチトリプシンタンパク質が集積し、その結果、オートファジー、小胞体ストレス反応およびアポトーシスを含む細胞反応が起こることによって引き起こされる。アルファ-1アンチトリプシンの循環レベルが減少することで、肺中の好中球エラスターゼ活性が増加し；プロテアーゼおよびアンチプロテアーゼのこの不均衡の結果、この状態に関連する肺疾患が生じる。

アルファ-1アンチトリプシン不全（「A1AD」）は、白人において最も一般的であり、最も頻繁には肺および肝臓に影響を及ぼす。肺では、最も一般的な徴候は、肺底部で最も顕著な早発性（30代および40代の患者）汎細葉性肺気腫である。しかし、びまん性または上葉肺気腫が起こる可能性があり、気管支拡張症も同様である。最も頻繁に記載される症状には、呼吸困難、喘鳴および咳が含まれる。罹患個体の肺機能試験は、COPDと一致する知見を示す；が、気管支拡張剤反応が見られる可能性があり、喘息と診断される可能性がある。ZZ遺伝子型によって引きこされる肝疾患が多様な形式で顕在化する。罹患幼児では新生児期に症状が現れる可能性があり、胆汁鬱滞性黄疸、時に無胆汁性糞便（薄い色または粘土色）および肝腫脹を伴う。血中の抱合型ビリルビン、トランスアミナーゼおよびガンマ－グルタミルトランスフェラーゼレベルは上昇する。より年齢が高い小児および成人における肝疾患は、トランスアミナーゼの上昇が偶然発見されるか、または静脈瘤出血もしくは腹水を含む確立された肝硬変の徴候によって症状が見つかる可能性がある。アルファ-1アンチトリプシン不全はまた、患者に肝細胞癌を起こしやすくする。ホモ接合性ZZ遺伝子型は肝疾患が発展するために必要であるが、ヘテロ接合性Z突然変異は、C型肝炎感染および嚢胞性線維症肝疾患におけるように、より重度の肝疾患のリスクをより大きくすることによって、他の疾患の遺伝子修飾因子として作用し得る。

A1ADの2つの最も一般的な臨床バリアントは、E264V（PiS）およびE342K（PiZ）アレルである。臨床的一塩基バリアントE342K（PiZ）は、不安定および/または不活性A1ATタンパク質を生じ、その結果、肝臓および肺毒性を引き起こす。遺伝は常染色体共優性である。半数を超えるA1AD患者が突然変異E342Kの少なくとも1つのコピーを宿する。

いくつかの実施形態では、疾患または障害はアルファ-1アンチトリプシン不全（A1AD）である。いくつかの実施形態では、病原性突然変異は遺伝子SERPINA1中である。いくつかの実施形態では、SERPINA1の突然変異はE342K（PiZアレル）である。いくつかの実施形態では、7位のAはGに編集されて、PiZアレルを野生型アレルに回復させる。

［核酸塩基エディター］
ポリヌクレオチドの標的ヌクレオチド配列を編集、修飾または改変するための塩基エディターまたは核酸塩基エディターが本明細書に開示される。本明細書に記載されるのは、ポリヌクレオチドプログラム可能ヌクレオチド結合ドメインおよび核酸塩基編集ドメイン（例えばアデノシンデアミナーゼ）を含む核酸塩基エディターまたは塩基エディターである。ポリヌクレオチドプログラム可能ヌクレオチド結合ドメインは、結合したガイドポリヌクレオチド（例えばgRNA）と一緒である場合に、標的ポリヌクレオチド配列に（すなわち結合したガイド核酸の塩基と標的ポリヌクレオチド配列の塩基との間の相補的塩基対形成を介して）特異的に結合することができ、それによって、編集が望ましい標的核酸配列に塩基エディターを局在化させることができる。いくつかの実施形態では、標的ポリヌクレオチド配列は一本鎖DNAまたは二本鎖DNAを含む。いくつかの実施形態では、標的ポリヌクレオチド配列はRNAを含む。いくつかの実施形態では、標的ポリヌクレオチド配列はDNA-RNAハイブリッドを含む。

［ポリヌクレオチドプログラム可能ヌクレオチド結合ドメイン］
ポリヌクレオチドプログラム可能ヌクレオチド結合ドメインはまた、RNAに結合する核酸プログラム可能タンパク質を含むことができることを理解されたい。例えば、ポリヌクレオチドプログラム可能ヌクレオチド結合ドメインは、ポリヌクレオチドプログラム可能ヌクレオチド結合ドメインをRNAにガイドする核酸と会合し得る。他の核酸プログラム可能DNA結合タンパク質もまた、本開示の範囲内にあるが、それらは本開示には特に列記されていない。

塩基エディターのポリヌクレオチドプログラム可能ヌクレオチド結合ドメインは、それ自体が1つ以上のドメインを含むことができる。例えば、ポリヌクレオチドプログラム可能ヌクレオチド結合ドメインは、1つ以上のヌクレアーゼドメインを含むことができる。いくつかの実施形態では、ポリヌクレオチドプログラム可能ヌクレオチド結合ドメインのヌクレアーゼドメインは、エンドヌクレアーゼまたはエキソヌクレアーゼを含むことができる。本明細書において、用語「エキソヌクレアーゼ」は、核酸(例えばRNAまたはDNA)を遊離末端から消化することができるタンパク質またはポリペプチドを指し、用語「エンドヌクレアーゼ」は、核酸(例えばDNAまたはRNA)の内部領域を触媒(例えば切断)することができるタンパク質またはポリペプチドを指す。いくつかの実施形態では、エンドヌクレアーゼは、二本鎖核酸の一本鎖を切断することができる。いくつかの実施形態では、エンドヌクレアーゼは、二本鎖核酸分子の両方の鎖を切断することができる。いくつかの実施形態では、ポリヌクレオチドプログラム可能ヌクレオチド結合ドメインは、デオキシリボヌクレアーゼであり得る。いくつかの実施形態では、ポリヌクレオチドプログラム可能ヌクレオチド結合ドメインは、リボヌクレアーゼであり得る。

いくつかの実施形態では、ポリヌクレオチドプログラム可能ヌクレオチド結合ドメインのヌクレアーゼドメインは、標的ポリヌクレオチドの0本、1本または2本の鎖を切断することができる。いくつかの実施形態では、ポリヌクレオチドプログラム可能ヌクレオチド結合ドメインは、ニッカーゼドメインを含むことができる。本明細書において、用語「ニッカーゼ」は、二本鎖核酸分子(例えばDNA)中の二本鎖の一方の鎖のみを切断することができるヌクレアーゼドメインを含むポリヌクレオチドプログラム可能ヌクレオチド結合ドメインを指す。いくつかの実施形態では、ニッカーゼは、活性ポリヌクレオチドプログラム可能ヌクレオチド結合ドメインに1つ以上の突然変異を導入することによって、ポリヌクレオチドプログラム可能ヌクレオチド結合ドメインの完全に触媒活性な(例えば天然の)形態から得られ得る。例えば、ポリヌクレオチドプログラム可能ヌクレオチド結合ドメインがCas9に由来するニッカーゼドメインを含む場合、Cas9に由来するニッカーゼドメインは、D10A突然変異および840位のヒスチジンを含むことができる。そのような実施形態では、残基H 840は触媒活性を保持し、それによって核酸二本鎖の一本鎖を切断することができる。別の例において、Cas9由来ニッカーゼドメインは、H840A突然変異を含むことができ、一方、10位のアミノ酸残基は、Dのままである。いくつかの実施形態では、ニッカーゼは、ニッカーゼ活性に必要ではないヌクレアーゼドメインのすべてまたは一部を除去することによって、ポリヌクレオチドプログラム可能ヌクレオチド結合ドメインの完全に触媒活性な(例えば天然の)形態から得られ得る。例えば、ポリヌクレオチドプログラム可能ヌクレオチド結合ドメインがCas9に由来するニッカーゼドメインを含む場合、Cas9に由来するニッカーゼドメインは、RuvCドメインまたはHNHドメインのすべてまたは一部の欠失を含むことができる。

例示的な触媒活性Cas9のアミノ酸配列は以下の通りである：
MDKKYSIGLDIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD.

従って、ニッカーゼドメインを含むポリヌクレオチドプログラム可能ヌクレオチド結合ドメインを含む塩基エディターは、特定のポリヌクレオチド標的配列(例えば結合したガイド核酸の相補的配列によって決定される)で、一本鎖DNA切断(ニック) を生成することができる。いくつかの実施形態では、ニッカーゼドメイン(例えばCas9由来のニッカーゼドメイン)を含む塩基エディターによって切断される核酸二本鎖標的ポリヌクレオチド配列の鎖は、塩基エディターによって編集されない鎖である(すなわち、塩基エディターによって切断される鎖は、編集される塩基を含む鎖とは反対の鎖である)。他の実施形態では、ニッカーゼドメイン(例えばCas9由来のニッカーゼドメイン)を含む塩基エディターは、編集のために標的とされるDNA分子の鎖を切断することができる。このような実施形態では、非標的鎖は切断されない。

触媒的に不活性である(すなわち標的ポリヌクレオチド配列を切断することができない)ポリヌクレオチドプログラム可能ヌクレオチド結合ドメインを含む塩基エディターも本明細書中に提供される。本明細書において、用語「触媒的に不活性である」および「ヌクレアーゼ不活性」は、核酸の鎖を切断することができない結果となる1つ以上の突然変異および/または欠失を有するポリヌクレオチドプログラム可能ヌクレオチド結合ドメインを指すために交換可能に使用される。いくつかの実施形態では、触媒的に不活性であるポリヌクレオチドプログラム可能ヌクレオチド結合ドメイン塩基エディターは、1つ以上のヌクレアーゼドメインにおける特定の点突然変異の結果としてヌクレアーゼ活性を欠くことができる。例えば、Cas9ドメインを含む塩基エディターの場合、Cas9は、D10A突然変異およびH840A突然変異の両方を含むことができる。このような突然変異は両方のヌクレアーゼドメインを不活化し、その結果ヌクレアーゼ活性を失う。他の実施形態では、触媒的に不活性であるポリヌクレオチドプログラム可能ヌクレオチド結合ドメインは、触媒ドメイン(例えばRuvC1および/またはHNHドメイン)のすべてまたは一部の1つ以上の欠失を含むことができる。さらなる実施形態では、触媒的に不活性であるポリヌクレオチドプログラム可能ヌクレオチド結合ドメインは、点突然変異(例えばD10AまたはH840A)ならびにヌクレアーゼドメインのすべてまたは一部の欠失を含む。

また、本明細書では、ポリヌクレオチドプログラム可能ヌクレオチド結合ドメインの以前に機能していたバージョンから、触媒的に不活性であるポリヌクレオチドプログラム可能ヌクレオチド結合ドメインを生成することができる突然変異も企図される。例えば、触媒的に不活性であるCas9 (「dCas9」) の場合、D10AおよびH840A以外の突然変異を有してヌクレアーゼ不活性化Cas9をもたらすバリアントが提供される。このような突然変異は、例えば、D10およびH840における他のアミノ酸置換、またはCas9のヌクレアーゼドメイン内の他の置換(例えば、HNHヌクレアーゼサブドメインおよび/またはRuvC1サブドメインにおける置換)を含む。追加の適切なヌクレアーゼ不活性dCas9ドメインは、本開示および当技術分野における知識に基づいて当業者に明らかとなることが可能であり、本開示の範囲内である。このような追加の例示的な適切なヌクレアーゼ不活性Cas9ドメインには、限定されるものではないが、D10A/H840A、D10A/D839A/H840A、およびD10A/D839A/H840A/N863A突然変異体ドメインが含まれる(例えば、Prashant et al., CAS9 transcriptional activators for target specificity screening and paired nickases for cooperative genome engineering. Nature Biotechnology. 2013; 31(9): 833-838を参照のこと (その全内容は参照により本明細書に組み込まれる))。

塩基エディターに組み込むことができるポリヌクレオチドプログラム可能ヌクレオチド結合ドメインの非限定的な例には、CRISPRタンパク質由来ドメイン、制限ヌクレアーゼ、メガヌクレアーゼ、TALヌクレアーゼ(TALEN) 、およびジンクフィンガーヌクレアーゼ (ZFN) が含まれる。いくつかの実施形態では、塩基エディターは、核酸のCRISPR (すなわちClustered Regularly Interspaced Short Palindromic Repeats)仲介改変の際に、結合したガイド核酸を介して核酸配列に結合することができる天然もしくは改変されたタンパク質またはその一部を含むポリヌクレオチドプログラム可能ヌクレオチド結合ドメインを含む。そのようなタンパク質は、本明細書において「CRISPRタンパク質」と呼ばれる。従って、本明細書に開示されているのは、CRISPRタンパク質のすべてまたは一部を含むポリヌクレオチドプログラム可能ヌクレオチド結合ドメインを含む塩基エディター（すなわち、CRISPRタンパク質のすべてまたは一部をドメインとして含む塩基エディター、塩基エディターの「CRISPRタンパク質由来ドメイン」とも呼ばれる）である。塩基エディターに組み込まれたCRISPRタンパク質由来ドメインは、野生型または天然型のCRISPRタンパク質と比較して改変され得る。例えば、以下に記載するように、CRISPRタンパク質由来ドメインは、野生型または天然型のCRISPRタンパク質と比較して、1つ以上の突然変異、挿入、欠失、再配置および/または組換えを含み得る。

CRISPRは、可動遺伝要素(ウイルス、転移因子、接合性プラスミド)に対する防御を提供する適応免疫システムである。CRISPRクラスターは、スペーサー、先行する可動要素に相補的な配列、および標的侵入核酸を含む。CRISPRクラスターは転写され、CRISPR RNA (crRNA) にプロセシングされる。II型CRISPRシステムでは、pre‐crRNAの正しいプロセシングはトランスコード小分子RNA (tracrRNA)、内因性リボヌクレアーゼ3 (rnc) 、およびCas9タンパク質を必要とする。tracrRNAはリボヌクレアーゼ3が補助するpre-crRNAのプロセシングのガイドとなる。続いて、Cas9/crRNA/tracrRNAが、スペーサーに相補的な直鎖または環状のdsDNA標的をエンドヌクレアーゼで切断する。crRNAに相補的でない標的鎖は、最初にエンドヌクレアーゼ的に切断され、次にエキソヌクレアーゼ的に3’-5’にトリムされる。自然界では、DNA結合と切断にはタンパク質と両方のRNAが必要である。しかし、crRNAおよびtracrRNAの両方の側面を単一のRNA種に組み込むように、シングルガイドRNA (「sgRNA」、あるいは単に「gRNA」)を作製することができる。例えばJinek M., Chylinski K., Fonfara I., Hauer M., Doudna J. A., Charpentier E. Science 337:816-821(2012)を参照のこと（その内容全体が参照により本明細書に組み入れられる）。Cas9は、CRISPR反復配列中の短いモチーフ(PAMまたはプロトスペーサー隣接モチーフ)を認識して、「自己」と「非自己」を区別することを助ける。

いくつかの実施形態では、本明細書に記載される方法は、操作されたCasタンパク質を利用することができる。ガイドRNA (gRNA) は、Cas結合に必要な足場配列と、改変されるゲノム標的を規定するユーザー定義の約20塩基スペーサーとからなる短い合成RNAである。従って、当業者はCasタンパク質特異性のゲノム標的を変化させることができ、これは、ゲノムの残りの部分と比較してgRNA標的指向化配列がゲノム標的に対していかに特異的であるかによって部分的に決定される。

いくつかの実施形態では、gRNA足場配列は以下の通りである：GUUUUAGAGC UAGAAAUAGC AAGUUAAAAU AAGGCUAGUC CGUUAUCAAC UUGAAAAAGU GGCACCGAGU CGGUGCUUUU。

いくつかの実施形態では、塩基エディター内に組み込まれたCRISPRタンパク質由来ドメインは、結合ガイド核酸と組み合わせられた場合に標的ポリヌクレオチドに結合することができるエンドヌクレアーゼ(例えばデオキシリボヌクレアーゼまたはリボヌクレアーゼ)である。いくつかの実施形態では、塩基エディター内に組み込まれたCRISPRタンパク質由来ドメインは、結合したガイド核酸と組み合わせられた場合に標的ポリヌクレオチドに結合することができるニッカーゼである。いくつかの実施形態では、塩基エディター内に組み込まれたCRISPRタンパク質由来ドメインは、結合したガイド核酸と組み合わせられた場合に標的ポリヌクレオチドに結合することができる触媒的に不活性のドメインである。いくつかの実施形態では、塩基エディターのCRISPRタンパク質由来ドメインに結合する標的ポリヌクレオチドはDNAである。いくつかの実施形態では、塩基エディターのCRISPRタンパク質由来ドメインに結合する標的ポリヌクレオチドはRNAである。

本明細書で用いることができるCasタンパク質には、クラス1およびクラス2が含まれる。Casタンパク質の非限定的な例には、Cas1、Cas1B、Cas2、Cas3、Cas4、Cas5、Cas5d、Cas5t、Cas5h、Cas5a、Cas6、Cas7、Cas8、Cas9 (also known as Csn1 or Csx12)、Cas10、Csy1 、Csy2、Csy3、Csy4、Cse1、Cse2、Cse3、Cse4、Cse5e、Csc1、Csc2、Csa5、Csn1、Csn2、Csm1、Csm2、Csm3、Csm4、Csm5、Csm6、Cmr1、Cmr3、Cmr4、Cmr5、Cmr6、Csb1、Csb2、Csb3、Csx17、Csx14、Csx10、Csx16、CsaX、Csx3、Csx1、Csx1S、Csf1、Csf2、CsO、Csf4、Csd1、Csd2、Cst1、Cst2、Csh1、Csh2、Csa1、Csa2、Csa3、Csa4、Csa5、Cas12a/Cpf1、Cas12b/C2c1、Cas12c/C2c3、Cas12d/CasY、Cas12e/CasX、Cas12g、Cas12h、およびCas12i、CARF、DinG、それらのホモログ、またはそれらの改変型が含まれる。未改変のCRISPR酵素は、Cas9のように、2つの機能性エンドヌクレアーゼ領域、RuvCおよびHNHを有するDNA切断活性を有することができる。CRISPR酵素は、標的配列内および/または標的配列の相補鎖内などの標的配列で、一方または両方の鎖の切断を誘導することができる。例えば、CRISPR酵素は、標的配列の最初または最後のヌクレオチドから約1、2、3、4、5、6、7、8、9、10、15、20、25、50、100、200、500塩基対またはそれ以上離れた、一方または両方の鎖の切断を誘導することができる。

標的配列を含有する標的ポリヌクレオチドの一方または両方の鎖を切断する能力を欠くように、対応する野生型酵素に対して突然変異されたCRISPR酵素をコードするベクターを用いることができる。Cas9は、野生型の例示的なCas9ポリペプチド(例えばS. pyogenes由来のCas9)と少なくとも、または少なくともおよそ、50%、60%、70%、80%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、または100%の配列同一性および/または配列相同性を有するポリペプチドを指すことができる。Cas9は、野生型の例示的なCas9ポリペプチド(例えばS.pyogenes由来のもの)に対して、最大で、または最大でおよそ、50%、60%、70%、80%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、または100%の配列同一性および/または配列相同性を有するポリペプチドを指すことができる。Cas9は、野生型、または欠失、挿入、置換、バリアント、突然変異、融合、キメラ、またはそれらの任意の組み合わせなどのアミノ酸変化を含み得るCas9タンパク質の改変型を指すことができる。

いくつかの実施形態では、塩基エディターのCRISPRタンパク質由来ドメインには、Corynebacterium ulcerans (NCBI参照: NC_015683.1, NC_017317.1); Corynebacterium diphtheria (NCBI参照: NC_016782.1, NC_016786.1); Spiroplasma syrphidicola (NCBI参照: NC_021284.1); Prevotella intermedia (NCBI参照: NC_017861.1); Spiroplasma taiwanense (NCBI参照: NC_021846.1); Streptococcus iniae (NCBI参照: NC_021314.1); Belliella baltica (NCBI参照: NC_018010.1); Psychroflexus torquis (NCBI参照: NC_018721.1); Streptococcus thermophilus (NCBI参照: YP_820832.1); Listeria innocua (NCBI参照: NP_472073.1); Campylobacter jejuni (NCBI参照: YP_002344900.1); Neisseria meningitidis (NCBI参照: YP_002342100.1), Streptococcus pyogenes, または Staphylococcus aureus由来のCas9のすべてまたは一部が含まれてもよい。

［核酸塩基エディターのCas9ドメイン］
Cas9ヌクレアーゼの配列および構造は、当業者によく知られている(例えば“Complete genome sequence of an Ml strain of Streptococcus pyogenes.” Ferretti et al., J.J., McShan W.M., Ajdic D.J., Savic D.J., Savic G., Lyon K., Primeaux C, Sezate S., Suvorov A.N., Kenton S., Lai H.S., Lin S.P., Qian Y., Jia H.G., Najar F.Z., Ren Q., Zhu H., Song L., White J., Yuan X., Clifton S.W., Roe B.A., McLaughlin R.E., Proc. Natl. Acad. Sci. U.S.A. 98:4658-4663(2001); “CRISPR RNA maturation by trans-encoded small RNA and host factor RNase III.” Deltcheva E., Chylinski K., Sharma CM., Gonzales K., Chao Y., Pirzada Z.A., Eckert M.R., Vogel J., Charpentier E., Nature 471:602-607(2011); および “A programmable dual-RNA-guided DNA endonuclease in adaptive bacterial immunity.” Jinek M., Chylinski K., Fonfara I., Hauer M., Doudna J.A., Charpentier E. Science 337:816-821(2012)を参照のこと。各々、その内容全体が参照により本明細書に組み入れられる)。Cas9オルソログは、限定されるものではないが、S.pyogenesおよびS.thermophilusを含む多様な種において記述されてきた。追加の適切なCas9ヌクレアーゼおよび配列は、本開示に基づいて当業者に明らかとなり、そのようなCas9ヌクレアーゼおよび配列は、Chylinski, Rhun, and Charpentier, “The tracrRNA and Cas9 families of type II CRISPR-Cas immunity systems” (2013) RNA Biology 10:5, 726-737に開示されている生物および遺伝子座由来のCas9配列を含む。その全内容は参照により本明細書に組み込まれる。

いくつかの実施形態では、核酸プログラム可能DNA結合タンパク質 (napDNAbp) は、Cas9ドメインである。非限定的な例示的Cas9ドメインが本明細書で提供される。Cas9ドメインは、ヌクレアーゼ活性Cas9ドメイン、ヌクレアーゼ不活性Cas9ドメイン（dCas9）、またはCas9ニッカーゼ（nCas9）であり得る。いくつかの実施形態では、Cas9ドメインは、ヌクレアーゼ活性ドメインである。例えば、Cas9ドメインは、二本鎖核酸の両方の鎖（例えば二本鎖DNA分子の両方の鎖）を切断するCas9ドメインであり得る。いくつかの実施形態では、Cas9ドメインは、本明細書に記載のアミノ酸配列のいずれか1つを含む。いくつかの実施形態では、Cas9ドメインは、本明細書に記載のアミノ酸配列のいずれか１つに対して少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも99.5%同一であるアミノ酸配列を含む。いくつかの実施形態では、Cas9ドメインは、本明細書に記載のアミノ酸配列のいずれか１つと比較して1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、21、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50以上、またはそれより多い突然変異を有するアミノ酸配列を含む。いくつかの実施形態では、Cas9ドメインは、本明細書に記載のアミノ酸配列のいずれか１つと比較して、少なくとも10、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90、少なくとも100、少なくとも150、少なくとも200、少なくとも250、少なくとも300、少なくとも350、少なくとも400、少なくとも500、少なくとも600、少なくとも700、少なくとも800、少なくとも900、少なくとも1000、少なくとも1100、または少なくとも1200の同一の連続したアミノ酸残基を有するアミノ酸配列を含む。

いくつかの実施形態では、Cas9の断片を含むタンパク質が提供される。例えば、いくつかの実施形態では、タンパク質は、以下の2つのCas9ドメインのうちの1つを含む：(1) Cas9のgRNA結合ドメイン;(2) Cas9のDNA切断ドメイン。いくつかの実施形態では、Cas9またはその断片を含むタンパク質は、「Cas9バリアント」と称される。Cas9バリアントは、Cas9またはその断片と相同性を共有する。例えば、Cas9バリアントは、野生型Cas9と少なくとも約70%同一、少なくとも約80%同一、少なくとも約90%同一、少なくとも約95%同一、少なくとも約96%同一、少なくとも約97%同一、少なくとも約98%同一、少なくとも約99%同一、少なくとも約99.5%同一、または少なくとも約99.9%同一である。いくつかの実施形態では、Cas9バリアントは、野生型Cas9と比較して、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、21、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、またはそれより多くのアミノ酸変化を有し得る。いくつかの実施形態では、Cas9バリアントは、Cas9の断片(例えばgRNA結合ドメインまたはDNA切断ドメイン)を含み、その断片は、野生型Cas9の対応する断片と少なくとも約70%同一、少なくとも約80%同一、少なくとも約90%同一、少なくとも約95%同一、少なくとも約96%同一、少なくとも約97%同一、少なくとも約98%同一、少なくとも約99%同一、少なくとも約99.5%同一、または少なくとも約99.9%同一である。いくつかの実施形態では、断片は、対応する野生型Cas9のアミノ酸長の少なくとも30%、少なくとも35%、少なくとも40%、少なくとも45%、少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%同一、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも99.5%である。いくつかの実施形態では、断片は、長さが少なくとも100アミノ酸である。いくつかの実施形態では、断片は、少なくとも100、150、200、250、300、350、400、450、500、550、600、650、700、750、800、850、900、950、1000、1050、1100、1150、1200、1250、または少なくとも1300アミノ酸の長さである。

いくつかの実施形態では、本明細書に提供されるCas9融合タンパク質は、Cas9タンパク質の全長アミノ酸配列、例えば、本明細書に提供されるCas9配列の1つを含む。しかし、他の実施形態では、本明細書に提供される融合タンパク質は、全長Cas9配列を含まず、その1つ以上の断片のみを含む。適切なCas9ドメインおよびCas9断片の例示的アミノ酸配列が本明細書に提供され、Cas9ドメインおよび断片の追加の適切な配列は、当業者には明らかであろう。

Cas9タンパク質は、そのガイドRNAに相補的な特定のDNA配列にCas9タンパク質をガイドする、ガイドRNAと会合することができる。いくつかの実施形態では、ポリヌクレオチドプログラム可能ヌクレオチド結合ドメインは、Cas9ドメイン、例えばヌクレアーゼ活性Cas9、Cas9ニッカーゼ(nCas9) 、またはヌクレアーゼ不活性Cas9 (dCas9) である。核酸プログラム可能DNA結合タンパク質の例には、Cas9 (例えばdCas9およびnCas9)、CasX、CasY、Cpf1、Cas12b/C2Cl、およびCas12c/C2C3が含まれるが、これらに限定されない。

（一重下線：HNHドメイン；二重下線：RuvCドメイン）

（一重下線：HNHドメイン；二重下線：RuvCドメイン）

いくつかの実施形態では、野生型Cas9は、Streptococcus pyogenes由来のCas9（NCBI参照配列: NC_002737.2（ヌクレオチド配列は以下の通り）およびUniprot参照配列: Q99ZW2（アミノ酸配列は以下の通り）に対応する：
ATGGATAAGAAATACTCAATAGGCTTAGATATCGGCACAAATAGCGTCGGATGGGCGGTGATCACTGATGAATATAAGGTTCCGTCTAAAAAGTTCAAGGTTCTGGGAAATACAGACCGCCACAGTATCAAAAAAAATCTTATAGGGGCTCTTTTATTTGACAGTGGAGAGACAGCGGAAGCGACTCGTCTCAAACGGACAGCTCGTAGAAGGTATACACGTCGGAAGAATCGTATTTGTTATCTACAGGAGATTTTTTCAAATGAGATGGCGAAAGTAGATGATAGTTTCTTTCATCGACTTGAAGAGTCTTTTTTGGTGGAAGAAGACAAGAAGCATGAACGTCATCCTATTTTTGGAAATATAGTAGATGAAGTTGCTTATCATGAGAAATATCCAACTATCTATCATCTGCGAAAAAAATTGGTAGATTCTACTGATAAAGCGGATTTGCGCTTAATCTATTTGGCCTTAGCGCATATGATTAAGTTTCGTGGTCATTTTTTGATTGAGGGAGATTTAAATCCTGATAATAGTGATGTGGACAAACTATTTATCCAGTTGGTACAAACCTACAATCAATTATTTGAAGAAAACCCTATTAACGCAAGTGGAGTAGATGCTAAAGCGATTCTTTCTGCACGATTGAGTAAATCAAGACGATTAGAAAATCTCATTGCTCAGCTCCCCGGTGAGAAGAAAAATGGCTTATTTGGGAATCTCATTGCTTTGTCATTGGGTTTGACCCCTAATTTTAAATCAAATTTTGATTTGGCAGAAGATGCTAAATTACAGCTTTCAAAAGATACTTACGATGATGATTTAGATAATTTATTGGCGCAAATTGGAGATCAATATGCTGATTTGTTTTTGGCAGCTAAGAATTTATCAGATGCTATTTTACTTTCAGATATCCTAAGAGTAAATACTGAAATAACTAAGGCTCCCCTATCAGCTTCAATGATTAAACGCTACGATGAACATCATCAAGACTTGACTCTTTTAAAAGCTTTAGTTCGACAACAACTTCCAGAAAAGTATAAAGAAATCTTTTTTGATCAATCAAAAAACGGATATGCAGGTTATATTGATGGGGGAGCTAGCCAAGAAGAATTTTATAAATTTATCAAACCAATTTTAGAAAAAATGGATGGTACTGAGGAATTATTGGTGAAACTAAATCGTGAAGATTTGCTGCGCAAGCAACGGACCTTTGACAACGGCTCTATTCCCCATCAAATTCACTTGGGTGAGCTGCATGCTATTTTGAGAAGACAAGAAGACTTTTATCCATTTTTAAAAGACAATCGTGAGAAGATTGAAAAAATCTTGACTTTTCGAATTCCTTATTATGTTGGTCCATTGGCGCGTGGCAATAGTCGTTTTGCATGGATGACTCGGAAGTCTGAAGAAACAATTACCCCATGGAATTTTGAAGAAGTTGTCGATAAAGGTGCTTCAGCTCAATCATTTATTGAACGCATGACAAACTTTGATAAAAATCTTCCAAATGAAAAAGTACTACCAAAACATAGTTTGCTTTATGAGTATTTTACGGTTTATAACGAATTGACAAAGGTCAAATATGTTACTGAAGGAATGCGAAAACCAGCATTTCTTTCAGGTGAACAGAAGAAAGCCATTGTTGATTTACTCTTCAAAACAAATCGAAAAGTAACCGTTAAGCAATTAAAAGAAGATTATTTCAAAAAAATAGAATGTTTTGATAGTGTTGAAATTTCAGGAGTTGAAGATAGATTTAATGCTTCATTAGGTACCTACCATGATTTGCTAAAAATTATTAAAGATAAAGATTTTTTGGATAATGAAGAAAATGAAGATATCTTAGAGGATATTGTTTTAACATTGACCTTATTTGAAGATAGGGAGATGATTGAGGAAAGACTTAAAACATATGCTCACCTCTTTGATGATAAGGTGATGAAACAGCTTAAACGTCGCCGTTATACTGGTTGGGGACGTTTGTCTCGAAAATTGATTAATGGTATTAGGGATAAGCAATCTGGCAAAACAATATTAGATTTTTTGAAATCAGATGGTTTTGCCAATCGCAATTTTATGCAGCTGATCCATGATGATAGTTTGACATTTAAAGAAGACATTCAAAAAGCACAAGTGTCTGGACAAGGCGATAGTTTACATGAACATATTGCAAATTTAGCTGGTAGCCCTGCTATTAAAAAAGGTATTTTACAGACTGTAAAAGTTGTTGATGAATTGGTCAAAGTAATGGGGCGGCATAAGCCAGAAAATATCGTTATTGAAATGGCACGTGAAAATCAGACAACTCAAAAGGGCCAGAAAAATTCGCGAGAGCGTATGAAACGAATCGAAGAAGGTATCAAAGAATTAGGAAGTCAGATTCTTAAAGAGCATCCTGTTGAAAATACTCAATTGCAAAATGAAAAGCTCTATCTCTATTATCTCCAAAATGGAAGAGACATGTATGTGGACCAAGAATTAGATATTAATCGTTTAAGTGATTATGATGTCGATCACATTGTTCCACAAAGTTTCCTTAAAGACGATTCAATAGACAATAAGGTCTTAACGCGTTCTGATAAAAATCGTGGTAAATCGGATAACGTTCCAAGTGAAGAAGTAGTCAAAAAGATGAAAAACTATTGGAGACAACTTCTAAACGCCAAGTTAATCACTCAACGTAAGTTTGATAATTTAACGAAAGCTGAACGTGGAGGTTTGAGTGAACTTGATAAAGCTGGTTTTATCAAACGCCAATTGGTTGAAACTCGCCAAATCACTAAGCATGTGGCACAAATTTTGGATAGTCGCATGAATACTAAATACGATGAAAATGATAAACTTATTCGAGAGGTTAAAGTGATTACCTTAAAATCTAAATTAGTTTCTGACTTCCGAAAAGATTTCCAATTCTATAAAGTACGTGAGATTAACAATTACCATCATGCCCATGATGCGTATCTAAATGCCGTCGTTGGAACTGCTTTGATTAAGAAATATCCAAAACTTGAATCGGAGTTTGTCTATGGTGATTATAAAGTTTATGATGTTCGTAAAATGATTGCTAAGTCTGAGCAAGAAATAGGCAAAGCAACCGCAAAATATTTCTTTTACTCTAATATCATGAACTTCTTCAAAACAGAAATTACACTTGCAAATGGAGAGATTCGCAAACGCCCTCTAATCGAAACTAATGGGGAAACTGGAGAAATTGTCTGGGATAAAGGGCGAGATTTTGCCACAGTGCGCAAAGTATTGTCCATGCCCCAAGTCAATATTGTCAAGAAAACAGAAGTACAGACAGGCGGATTCTCCAAGGAGTCAATTTTACCAAAAAGAAATTCGGACAAGCTTATTGCTCGTAAAAAAGACTGGGATCCAAAAAAATATGGTGGTTTTGATAGTCCAACGGTAGCTTATTCAGTCCTAGTGGTTGCTAAGGTGGAAAAAGGGAAATCGAAGAAGTTAAAATCCGTTAAAGAGTTACTAGGGATCACAATTATGGAAAGAAGTTCCTTTGAAAAAAATCCGATTGACTTTTTAGAAGCTAAAGGATATAAGGAAGTTAAAAAAGACTTAATCATTAAACTACCTAAATATAGTCTTTTTGAGTTAGAAAACGGTCGTAAACGGATGCTGGCTAGTGCCGGAGAATTACAAAAAGGAAATGAGCTGGCTCTGCCAAGCAAATATGTGAATTTTTTATATTTAGCTAGTCATTATGAAAAGTTGAAGGGTAGTCCAGAAGATAACGAACAAAAACAATTGTTTGTGGAGCAGCATAAGCATTATTTAGATGAGATTATTGAGCAAATCAGTGAATTTTCTAAGCGTGTTATTTTAGCAGATGCCAATTTAGATAAAGTTCTTAGTGCATATAACAAACATAGAGACAAACCAATACGTGAACAAGCAGAAAATATTATTCATTTATTTACGTTGACGAATCTTGGAGCTCCCGCTGCTTTTAAATATTTTGATACAACAATTGATCGTAAACGATATACGTCTACAAAAGAAGTTTTAGATGCCACTCTTATCCATCAATCCATCACTGGTCTTTATGAAACACGCATTGATTTGAGTCAGCTAGGAGGTGACTGA

（一重下線：HNHドメイン；二重下線：RuvCドメイン）

追加的なCas9タンパク質（例えば、ヌクレアーゼ不活性（dead）Cas9（dCas9）、Cas9ニッカーゼ（nCas9）、またはヌクレアーゼ活性Cas9)は、そのバリアントおよびホモログを含めて、本開示の範囲内にあることを理解されたい。例示的なCas9タンパク質は、限定されるものではないが、以下に提供されるものを含む。いくつかの実施形態では、Cas9タンパク質は、ヌクレアーゼ不活性Cas9 (dCas9) である。いくつかの実施形態では、Cas9タンパク質は、Cas9ニッカーゼ(nCas9) である。いくつかの実施形態では、Cas9タンパク質はヌクレアーゼ活性Cas9である。

いくつかの実施形態では、Cas9ドメインは、ヌクレアーゼ不活性Cas9ドメイン (dCas9) である。例えば、dCas9ドメインは、二本鎖核酸分子のいずれの鎖も切断することなく、二本鎖核酸分子に結合し得る(例えば、gRNA分子を介して)。いくつかの実施形態では、ヌクレアーゼ不活性dCas9ドメインは、本明細書に記載のアミノ酸配列のD10X突然変異およびH840X突然変異、または本明細書に提供されたアミノ酸配列のいずれかにおける対応する突然変異を含み、Xは任意のアミノ酸変化である。いくつかの実施形態では、ヌクレアーゼ不活性dCas9ドメインは、本明細書に提供されたアミノ酸配列のD10A突然変異およびH840A突然変異、または本明細書に記載のアミノ酸配列のいずれかにおける対応する突然変異を含む。一例として、ヌクレアーゼ不活性Cas9ドメインは、クローニングベクターpPlatTET-gRNA 2 (寄託番号BAV54124)中に示されるアミノ酸配列を含む：

例示的な、触媒的に不活性なCas9 (dCas9) のアミノ酸配列は、以下の通りである：
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDAIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD
（例えばQi et al., “Repurposing CRISPR as an RNA-guided platform for sequence-specific control of gene expression.” Cell. 2013; 152(5):1173-83を参照のこと（その内容全体が参照により本明細書に組み入れられる））。

追加の適切なヌクレアーゼ不活性dCas9ドメインは、本開示および当技術分野における知識に基づいて当業者には明らかであろうし、本開示の範囲内である。こうした追加の例示的で適切なヌクレアーゼ不活性Cas9ドメインには、限定なしに、D10A/H840A、D10A/D839A/H840A、およびD10A/D839A/H840A/N863A 突然変異体ドメインが含まれる（例えば、Prashant et al., CAS9 transcriptional activators for target specificity screening and paired nickases for cooperative genome engineering. Nature Biotechnology. 2013; 31(9): 833-838を参照のこと（該文献の全内容は参照により本明細書に組み込まれる)）。

いくつかの実施形態では、Cas9ヌクレアーゼは、不活性な(例えば不活化された) DNA切断ドメインを有し、すなわち、Cas9は、「nCas9」タンパク質（「nickase」Cas9の意）と呼ばれるニッカーゼである。ヌクレアーゼ不活性化Cas9タンパク質は、交換可能に「dCas9」タンパク質（nuclease-“dead” Cas9の意）または触媒的に不活性なCas9とも称され得る。不活性なDNA切断ドメインを有するCas9タンパク質(またはその断片)を生成する方法は公知である(例えばJinek et al, Science. 337:816-821(2012); Qi et al, “Repurposing CRISPR as an RNA-Guided Platform for Sequence-Specific Control of Gene Expression” (2013) Cell. 28; 152(5): 1173-83を参照のこと (各内容は参照により本明細書に組み込まれる))。例えば、Cas9のDNA切断ドメインは、HNHヌクレアーゼサブドメインとRuvC1サブドメインという2つのサブドメインを含むことが知られている。HNHサブドメインはgRNAの相補鎖を切断し、RuvC1サブドメインは非相補鎖を切断する。これらのサブドメイン内の突然変異はCas9のヌクレアーゼ活性を抑制し得る。例えば、突然変異D10AおよびH840Aは、S. pyogenes Cas9 のヌクレアーゼ活性を完全に不活性化する（Jinek et al, Science. 337:816-821(2012); Qi et al, Cell. 28;152(5): 1173-83 (2013)）。
いくつかの実施形態では、dCas9ドメインは、本明細書に提供されるdCas9ドメインのいずれか1つに対して少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも99.5%の同一性を有するアミノ酸配列を含む。いくつかの実施形態では、Cas9ドメインは、本明細書に示されるアミノ酸配列のいずれか1つと比較して1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、21、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50以上、またはそれより多くの突然変異を有するアミノ酸配列を含む。いくつかの実施形態では、Cas9ドメインは、本明細書に示されたアミノ酸配列のいずれか1つと比較して、少なくとも10、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90、少なくとも100、少なくとも150、少なくとも200、少なくとも250、少なくとも300、少なくとも350、少なくとも400、少なくとも500、少なくとも600、少なくとも700、少なくとも800、少なくとも900、少なくとも1000、少なくとも1100、または少なくとも1200の同一の連続したアミノ酸残基を有するアミノ酸配列を含む。

いくつかの実施形態では、dCas9は、Cas9ヌクレアーゼ活性を不活化する1つ以上の突然変異を有するCas9アミノ酸配列に対応するか、またはその一部もしくは全体を含む。例えば、いくつかの実施形態では、dCas9ドメインは、D10AおよびH840A突然変異または別のCas9における対応する突然変異を含む。

いくつかの実施形態では、dCas9は、dCas9 (D10AおよびH840A)のアミノ酸配列を含む：

（一重下線：HNHドメイン；二重下線：RuvCドメイン）

いくつかの実施形態では、Cas9ドメインはD10A突然変異を含み、一方、上記で提供したアミノ酸配列における840位の残基、または本明細書で提供されるアミノ酸配列のいずれかにおける対応する位の残基は、ヒスチジンのままである。

他の実施形態では、例えばヌクレアーゼ不活化Cas9 (dCas9) を生じる、D10AおよびH840A以外の突然変異を有するdCas9バリアントが提供される。このような突然変異は、例えば、D10およびH840での他のアミノ酸置換、またはCas9のヌクレアーゼドメイン内の他の置換(例えば、HNHヌクレアーゼサブドメインおよび/またはRuvC1サブドメインにおける置換)を含む。いくつかの実施形態では、dCas9のバリアントまたはホモログであって、少なくとも約70%同一、少なくとも約80%同一、少なくとも約90%同一、少なくとも約95%同一、少なくとも約98%同一、少なくとも約99%同一、少なくとも約99.5%同一、または少なくとも約99.9%同一であるものが提供される。いくつかの実施形態では、約5アミノ酸、約10アミノ酸、約15アミノ酸、約20アミノ酸、約25アミノ酸、約30アミノ酸、約40アミノ酸、約50アミノ酸、約75アミノ酸、約100アミノ酸またはそれ以上短いまたは長いアミノ酸配列を有するdCas9のバリアントが提供される。
いくつかの実施形態では、Cas9ドメインは、Cas9ニッカーゼである。Cas9ニッカーゼは、二本鎖核酸分子(例えば二本鎖DNA分子)の一方の鎖のみを切断することができるCas9タンパク質であり得る。いくつかの実施形態では、Cas9ニッカーゼは、二本鎖核酸分子の標的鎖を切断し、これは、Cas9ニッカーゼが、Cas9に結合しているgRNA（例えばsgRNA）と塩基対を形成している（相補的である）鎖を切断することを意味する。いくつかの実施形態では、Cas9ニッカーゼは、D10A突然変異を含み、840位にヒスチジンを有する。いくつかの実施形態では、Cas9ニッカーゼは、二本鎖核酸分子の非標的、非塩基編集鎖を切断し、これは、Cas9ニッカーゼが、Cas9に結合しているgRNA（例えばsgRNA）と塩基対を形成していない鎖を切断することを意味する。いくつかの実施形態では、Cas9ニッカーゼは、H840A突然変異を含み、10位にアスパラギン酸残基を有するか、または対応する突然変異を有する。いくつかの実施形態では、Cas9ニッカーゼは、本明細書に提供されるCas9ニッカーゼのいずれか1つと少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも99.5%同一であるアミノ酸配列を含む。追加の適切なCas9ニッカーゼは、本開示および当分野における知識に基づいて当業者に明らかであり、本開示の範囲内である。

例示的な触媒的Cas9ニッカーゼ (nCas9) のアミノ酸配列は、以下の通りである：
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD

いくつかの実施形態では、Cas9は、単細胞原核微生物のドメインおよび界を構成する古細菌(例えばナノアーキア)由来のCas9を指す。いくつかの実施形態では、プログラム可能ヌクレオチド結合タンパク質は、例えば、Burstein et al., "New CRISPR-Cas systems from uncultivated microbes." Cell Res. 2017 Feb 21. doi: 10.1038/cr.2017.21に記載されているCasXまたはCasYタンパク質であってもよく、その全体の内容は参照により本明細書に組み込まれる。ゲノム分解メタゲノミクスを用いて、生命の古細菌ドメインにおいて最初に報告されたCas9を含め、多くのCRISPR‐Casシステムが同定された。この多様なCas9タンパク質は、ほとんど研究されていないナノアーキアにおいて、活性CRISPR‐Casシステムの一部として発見された。細菌では、それまで知られていなかった2つのシステム、CRISPR-CasXとCRISPR-CasYが発見され、それらは、これまでに発見された中でも最もコンパクトなシステムに入る。いくつかの実施形態では、本明細書に記載される塩基エディターシステムにおいて、Cas9は、CasXまたはCasXのバリアントによって置き換えられる。いくつかの実施形態では、本明細書に記載される塩基エディターシステムにおいて、Cas9は、CasYまたはCasYのバリアントによって置き換えられる。核酸プログラム可能DNA結合タンパク質(napDNAbp) として他のRNA誘導型DNA結合タンパク質を用いてもよく、これらが本開示の範囲内であることが理解されるべきである。

いくつかの実施形態では、本明細書で提供される融合タンパク質のいずれかの核酸プログラム可能DNA結合タンパク質(napDNAbp) は、CasXまたはCasYタンパク質であり得る。いくつかの実施形態では、napDNAbpはCasXタンパク質である。いくつかの実施形態では、napDNAbpはCasYタンパク質である。いくつかの実施形態では、napDNAbpは、天然に存在するCasXまたはCasYタンパク質に対して少なくとも85%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも99.5%同一であるアミノ酸配列を含む。いくつかの実施形態では、プログラム可能ヌクレオチド結合タンパク質は、天然に存在するCasXまたはCasYタンパク質である。いくつかの実施形態では、プログラム可能ヌクレオチド結合タンパク質は、本明細書に記載されるいずれかのCasXまたはCasYタンパク質に対して少なくとも85%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも99.5%同一であるアミノ酸配列を含む。他の細菌種由来のCasXおよびCasYもまた、本開示に従って使用され得ることが理解されるべきである。

例示的なCasX ((uniprot.org/uniprot/F0NN87; uniprot.org/uniprot/F0NH53) tr|F0NN87|F0NN87_SULIHCRISPR会合Casxタンパク質 OS = Sulfolobus islandicus (HVE10/4株) GN = SiH_0402 PE=4 SV=1) のアミノ酸配列は以下の通りである：
MEVPLYNIFGDNYIIQVATEAENSTIYNNKVEIDDEELRNVLNLAYKIAKNNEDAAAERRGKAKKKKGEEGETTTSNIILPLSGNDKNPWTETLKCYNFPTTVALSEVFKNFSQVKECEEVSAPSFVKPEFYEFGRSPGMVERTRRVKLEVEPHYLIIAAAGWVLTRLGKAKVSEGDYVGVNVFTPTRGILYSLIQNVNGIVPGIKPETAFGLWIARKVVSSVTNPNVSVVRIYTISDAVGQNPTTINGGFSIDLTKLLEKRYLLSERLEAIARNALSISSNMRERYIVLANYIYEYLTG SKRLEDLLYFANRDLIMNLNSDDGKVRDLKLISAYVNGELIRGEG.

例示的なCasX (>tr|F0NH53|F0NH53_SULIR CRISPR会合タンパク質, Casx OS = Sulfolobus islandicus (REY15A株) GN=SiRe_0771 PE=4 SV=1) のアミノ酸配列は以下の通りである：
MEVPLYNIFGDNYIIQVATEAENSTIYNNKVEIDDEELRNVLNLAYKIAKNNEDAAAERRGKAKKKKGEEGETTTSNIILPLSGNDKNPWTETLKCYNFPTTVALSEVFKNFSQVKECEEVSAPSFVKPEFYKFGRSPGMVERTRRVKLEVEPHYLIMAAAGWVLTRLGKAKVSEGDYVGVNVFTPTRGILYSLIQNVNGIVPGIKPETAFGLWIARKVVSSVTNPNVSVVSIYTISDAVGQNPTTINGGFSIDLTKLLEKRDLLSERLEAIARNALSISSNMRERYIVLANYIYEYLTGSKRLEDLLYFANRDLIMNLNSDDGKVRDLKLISAYVNGELIRGEG.

Deltaproteobacteria CasX
MEKRINKIRKKLSADNATKPVSRSGPMKTLLVRVMTDDLKKRLEKRRKKPEVMPQVISNNAANNLRMLLDDYTKMKEAILQVYWQEFKDDHVGLMCKFAQPASKKIDQNKLKPEMDEKGNLTTAGFACSQCGQPLFVYKLEQVSEKGKAYTNYFGRCNVAEHEKLILLAQLKPVKDSDEAVTYSLGKFGQRALDFYSIHVTKESTHPVKPLAQIAGNRYASGPVGKALSDACMGTIASFLSKYQDIIIEHQKVVKGNQKRLESLRELAGKENLEYPSVTLPPQPHTKEGVDfAYNEVIARVRMWVNLNLWQKLKLSRDDAKPLLRLKGFPSFPVVERRENEVDWWNTINEVKKLIDAKRDMGRVFWSGVTAEKRNTILEGYNYLPNENDHKKREGSLENPKKPAKRQFGDLLLYLEKKYAGDWGKVFDEAWERIDKKIAGLTSHIEREEARNAEDAQSKAVLTDWLRAKASFVLERLKEMDEKEFYACEIQLQKWYGDLRGNPFAVEAENRVVDISGFSIGSDGHSIQYRNLLAWKYLENGKREFYLLMNYGKKGRIRFTDGTDIKKSGKWQGLLYGGGKAKVIDLTFDPDDEQLIILPLAFGTRQGREFIWNDLLSLETGLIKLANGRVIEKTIYNKKIGRDEPALFVALTFERREVVDPSNIKPVNLIGVARGENIPAVIALTDPEGCPLPEFKDSSGGPTDILRIGEGYKEKQRAIQAAKEVEQRRAGGYSRKFASKSRNLADDMVRNSARDLFYHAVTHDAVLVFANLSRGFGRQGKRTFMTERQYTKMEDWLTAKLAYEGLTSKTYLSKTLAQYTSKTCSNCGFTITYADMDVMLVRLKKTSDGWATTLNNKELKAEYQITYYNRYKRQTVEKELSAELDRLSEESGNNDISKWTKGRRDEALFLLKKRFSHRPVQEQFVCLDCGHEVHAAEQAALNIARSWLFLNSNSTEFKSYKSGKQPFVGAWQAFYKRRLKEVWKPNA

例示的なCasY ((ncbi.nlm.nih.gov/protein/APG80656.1) >APG80656.1 CRISPR会合タンパク質 CasY [未培養Parcubacteria 群細菌]) のアミノ酸配列は以下の通りである：
MSKRHPRISGVKGYRLHAQRLEYTGKSGAMRTIKYPLYSSPSGGRTVPREIVSAINDDYVGLYGLSNFDDLYNAEKRNEEKVYSVLDFWYDCVQYGAVFSYTAPGLLKNVAEVRGGSYELTKTLKGSHLYDELQIDKVIKFLNKKEISRANGSLDKLKKDIIDCFKAEYRERHKDQCNKLADDIKNAKKDAGASLGERQKKLFRDFFGISEQSENDKPSFTNPLNLTCCLLPFDTVNNNRNRGEVLFNKLKEYAQKLDKNEGSLEMWEYIGIGNSGTAFSNFLGEGFLGRLRENKITELKKAMMDITDAWRGQEQEEELEKRLRILAALTIKLREPKFDNHWGGYRSDINGKLSSWLQNYINQTVKIKEDLKGHKKDLKKAKEMINRFGESDTKEEAVVSSLLESIEKIVPDDSADDEKPDIPAIAIYRRFLSDGRLTLNRFVQREDVQEALIKERLEAEKKKKPKKRKKKSDAEDEKETIDFKELFPHLAKPLKLVPNFYGDSKRELYKKYKNAAIYTDALWKAVEKIYKSAFSSSLKNSFFDTDFDKDFFIKRLQKIFSVYRRFNTDKWKPIVKNSFAPYCDIVSLAENEVLYKPKQSRSRKSAAIDKNRVRLPSTENIAKAGIALARELSVAGFDWKDLLKKEEHEEYIDLIELHKTALALLLAVTETQLDISALDFVENGTVKDFMKTRDGNLVLEGRFLEMFSQSIVFSELRGLAGLMSRKEFITRSAIQTMNGKQAELLYIPHEFQSAKITTPKEMSRAFLDLAPAEFATSLEPESLSEKSLLKLKQMRYYPHYFGYELTRTGQGIDGGVAENALRLEKSPVKKREIKCKQYKTLGRGQNKIVLYVRSSYYQTQFLEWFLHRPKNVQTDVAVSGSFLIDEKKVKTRWNYDALTVALEPVSGSERVFVSQPFTIFPEKSAEEEGQRYLGIDIGEYGIAYTALEITGDSAKILDQNFISDPQLKTLREEVKGLKLDQRRGTFAMPSTKIARIRESLVHSLRNRIHHLALKHKAKIVYELEVSRFEEGKQKIKKVYATLKKADVYSEIDADKNLQTTVWGKLAVASEISASYTSQFCGACKKLWRAEMQVDETITTQELIGTVRVIKGGTLIDAIKDFMRPPIFDENDTPFPKYRDFCDKHHISKKMRGNSCLFICPFCRANADADIQASQTIALLRYVKEEKKVEDYFERFRKLKNIKVLGQMKKI.

Cas9ヌクレアーゼはRuvCとHNHという2つの機能性エンドヌクレアーゼドメインを有する。Cas9は標的に結合するとコンホメーション変化を起こし、これがヌクレアーゼドメインを位置付け、標的DNAの反対側の鎖を切断させる。Cas9を介したDNA切断の最終結果は、標的DNA内の二本鎖切断(DSB) である(PAM配列の約3～4ヌクレオチド上流)。次いで、生じたDSBは、次の2つの一般的修復経路のうちの1つにより修復される: (1) 効率的だが誤りがちな非相同末端結合(NHEJ) 経路；または (2) 効率は低いが忠実度の高い相同性指向性修復 (HDR) 経路。

非相同末端結合(NHEJ) および/または相同性指向性修復 (HDR) の「効率」は、任意の簡便な方法によって計算することができる。例えば、いくつかの実施形態では、効率は、成功したHDRのパーセンテージで表すことができる。例えば、検査用（suveyor）ヌクレアーゼアッセイを用いて切断産物を生成し、基質に対する産物の比を用いてパーセンテージを計算することができる。例えば、HDRが成功した結果として新たに組み込まれた制限配列を含有するDNAを直接切断する検査用ヌクレアーゼ酵素を使用することができる。切断される基質が多いほどHDRの割合が高かった(HDRの効率がより高かった)ことを示す。例示的な例として、HDRの割合(パーセンテージ) は、以下の式を用いて計算することができる[(切断産物)/(基質+切断産物)] （例えば、(b+c) / (a+b+c) ここで、「a」はDNA基質のバンド強度であり、「b」および「c」は切断産物である)。

いくつかの実施形態では、効率はNHEJの成功率で表すことができる。例えば、T7エンドヌクレアーゼIアッセイを用いて切断産物を生成し、基質に対する産物の比を用いてNHEJのパーセンテージを計算することができる。T7エンドヌクレアーゼIは、野生型および突然変異体DNA鎖（NHEJは最初の切断部位に小さなランダムな挿入（insertion）や欠失（deletion）（インデル：indel）を生じる）のハイブリダイゼーションから生じるミスマッチのヘテロ二本鎖DNAを切断する。切断が多いほどNHEJの割合が高いこと(NHEJの効率が高いこと)を示す。例示的な例として、NHEJの割合(パーセンテージ) は、式(1-(1-(b+c)/(a+b+c))^1/2) ×100を用いて計算することができ、ここで、「a」はDNA基質のバンド強度であり、「b」および「c」は切断産物である（Ran et. al., Cell. 2013 Sep. 12; 154(6):1380-9; およびRan et al., Nat Protoc. 2013 Nov.; 8(11): 2281-2308）。

NHEJ修復経路は最も活性な修復機構であり、DSB部位での小分子ヌクレオチド挿入または欠失(インデル) を頻繁に引き起こす。NHEJ仲介DSB修復のランダム性は、Cas9およびgRNAまたはガイドポリヌクレオチドを発現する細胞集団が多様な突然変異のアレイをもたらし得るため、重要な実際的意味を有する。大部分の実施形態では、NHEJは標的DNAに小さなインデルを生じさせ、その結果、標的遺伝子のオープンリーディングフレーム(ORF) 内に未熟な終止コドンをもたらすアミノ酸欠失、挿入、またはフレームシフト突然変異が生じる。理想的な最終結果は、標的遺伝子内の機能喪失型突然変異である。

NHEJ仲介DSB修復はしばしば遺伝子のオープンリーディングフレームを破壊するが、相同性指向性修復(HDR) は単一ヌクレオチド変化からフルオロフォアまたはタグの付加のような大きな挿入までの範囲の特異的ヌクレオチド変化を生成するために使用できる。HDRを遺伝子編集に利用するために、所望の配列を含有するDNA修復テンプレートを、gRNA（複数可）およびCas9またはCas9ニッカーゼとともに関心対象の細胞タイプに送達することができる。修復テンプレートは、所望の編集ならびにその標的のすぐ上流および下流(左右相同アームと呼ばれる)に追加の相同配列を含有することができる。各相同アームの長さは導入される変化の大きさに依存する可能性があり、より大きな挿入はより長い相同アームを必要とする。修復テンプレートは、一本鎖オリゴヌクレオチド、二本鎖オリゴヌクレオチド、または二本鎖DNAプラスミドであり得る。HDRの効率は、Cas9、gRNAおよび外因性修復テンプレートを発現する細胞においても、一般的に低い(10%未満の修正アレル)。HDRは細胞周期のS期とG2期の間に起こるため、細胞を同調させることによってHDRの効率を高めることができる。NHEJに関与する遺伝子を化学的または遺伝的に阻害することもHDR頻度を増加させ得る。

いくつかの実施形態では、Cas9は改変Cas9である。所定のgRNA標的指向化配列は、ゲノム全体にわたり、部分的な相同性が存在する追加の部位を有し得る。これらの部位はオフターゲットと呼ばれ、gRNAを設計する際に考慮する必要がある。gRNAの設計を最適化することに加えて、Cas9を改変することによってCRISPRの特異性を高めることもできる。Cas9は2つのヌクレアーゼドメイン、RuvCおよびHNHの組み合わせ活性を介して二本鎖切断(DSB) を生成する。SpCas9のD10A突然変異体であるCas9ニッカーゼは1つのヌクレアーゼドメインを保持し、DSBではなくDNAニックを生成する。特異的遺伝子編集のためのHDR仲介遺伝子編集にニッカーゼシステムを組み合わせることもできる。

いくつかの実施形態では、Cas9はバリアントCas9タンパク質である。バリアントCas9ポリペプチドは、野生型Cas9タンパク質のアミノ酸配列と比較して、一アミノ酸単位で異なる(例えば、欠失、挿入、置換、融合を有する)アミノ酸配列を有する。いくつかの例において、バリアントCas9ポリペプチドは、Cas9ポリペプチドのヌクレアーゼ活性を低下させるアミノ酸変化(例えば欠失、挿入、または置換)を有する。例えば、いくつかの例において、バリアントCas9ポリペプチドは、対応する野生型Cas9タンパク質のヌクレアーゼ活性の50%未満、40%未満、30%未満、20%未満、10%未満、5%未満、または1%未満を有する。いくつかの実施形態では、バリアントCas9タンパク質は実質的なヌクレアーゼ活性を持たない。対象Cas9タンパク質が、実質的なヌクレアーゼ活性を持たないバリアントCas9タンパク質である場合、それは「dCas9」と称され得る。

いくつかの実施形態では、バリアントCas9タンパク質は減少したヌクレアーゼ活性を有する。例えば、バリアントCas9タンパク質は、野生型Cas9タンパク質、例えば野生型Cas9タンパク質のエンドヌクレアーゼ活性の約20%未満、約15%未満、約10%未満、約5%未満、約1%未満、または約0.1%未満を示す。

いくつかの実施形態では、バリアントCas9タンパク質は、ガイド標的配列の相補鎖を切断することができるが、二本鎖ガイド標的配列の非相補鎖を切断する能力が低下している。例えば、バリアントCas9タンパク質は、RuvCドメインの機能を低下させる突然変異(アミノ酸置換)を有することができる。非限定的な例として、いくつかの実施形態では、バリアントCas9タンパク質は、D10A (アミノ酸10位におけるアスパラギン酸からアラニン)を有し、従って、二本鎖ガイド標的配列の相補鎖を切断することができるが、二本鎖ガイド標的配列の非相補鎖を切断する能力が低下している(従って、このバリアントCas9タンパク質が二本鎖標的核酸を切断する際、二本鎖切断(DSB) の代わりに一本鎖切断(SSB) を生じる) (例えばJinek et al., Science. 2012 Aug. 17; 337(6096):816-21を参照のこと)。

いくつかの実施形態では、バリアントCas9タンパク質は、二本鎖ガイド標的配列の非相補鎖を切断することができるが、ガイド標的配列の相補鎖を切断する能力が低下している。例えば、バリアントCas9タンパク質は、HNHドメインの機能を低下させる突然変異(アミノ酸置換)を有することができる(RuvC/HNH/RuvCドメインモチーフ)。非限定的な例として、いくつかの実施形態では、バリアントCas9タンパク質は、H840A (アミノ酸840位におけるヒスチジンからアラニン)突然変異を有し、従って、ガイド標的配列の非相補鎖を切断することができるが、ガイド標的配列の相補鎖を切断する能力が低下している(従って、このバリアントCas9タンパク質が二本鎖ガイド標的配列を切断すると、DSBの代わりにSSBが生じる)。このようなCas9タンパク質は、ガイド標的配列(例えば一本鎖ガイド標的配列)を切断する能力が低下しているが、ガイド標的配列(例えば一本鎖ガイド標的配列)に結合する能力を保持している。

いくつかの実施形態では、バリアントCas9タンパク質は、二本鎖標的DNAの相補鎖および非相補鎖の両方を切断する能力が低下している。非限定的な例として、いくつかの実施形態では、バリアントCas9タンパク質は、D10AおよびH840A突然変異の両方を宿し、その結果、ポリペプチドは、二本鎖標的DNAの相補鎖および非相補鎖の両方を切断する能力が低下している。このようなCas9タンパク質は、標的DNA (例えば一本鎖標的DNA)を切断する能力が低下しているが、標的DNA (例えば一本鎖標的DNA)に結合する能力は保持している。

別の非限定的な例として、いくつかの実施形態では、バリアントCas9タンパク質は、W476AおよびW1126A突然変異を宿し、その結果、ポリペプチドは、標的DNAを切断する能力が低下している。こうしたCas9タンパク質は、標的DNA (例えば一本鎖標的DNA)を切断する能力が低下しているが、標的DNA (例えば一本鎖標的DNA)に結合する能力を保持している。

別の非限定的な例として、いくつかの実施形態では、バリアントCas9タンパク質は、P475A、W476A、N477A、D1125A、W1126A、およびD1127A突然変異を宿し、その結果、ポリペプチドは、標的DNAを切断する能力が低下している。そのようなCas9タンパク質は、標的DNA(例えば一本鎖標的DNA)を切断する能力が低下しているが、標的DNA (例えば一本鎖標的DNA)に結合する能力を保持している。

別の非限定的な例として、いくつかの実施形態では、バリアントCas9タンパク質は、H840A、W476A、およびW1126A突然変異を宿し、その結果、ポリペプチドは、標的DNAを切断する能力が低下している。こうしたCas9タンパク質は、標的DNA (例えば一本鎖標的DNA)を切断する能力が低下しているが、標的DNA (例えば一本鎖標的DNA)に結合する能力を保持している。別の非限定的な例として、いくつかの実施形態では、バリアントCas9タンパク質は、H840A、D10A、W476A、およびW1126A突然変異を宿し、その結果、ポリペプチドは、標的DNAを切断する能力が低下している。このようなCas9タンパク質は、標的DNA (例えば一本鎖標的DNA)を切断する能力が低下しているが、標的DNA (例えば一本鎖標的DNA)に結合する能力を保持している。いくつかの実施形態では、バリアントCas9は、Cas9 HNHドメインの840位で触媒的His残基が回復されている(A840H)。

別の非限定的な例として、いくつかの実施形態では、バリアントCas9タンパク質は、H840A、P475A、W476A、N477A、D1125A、W1126A、およびD1127A突然変異を宿し、その結果、ポリペプチドは、標的DNAを切断する能力が低下している。こうしたCas9タンパク質は、標的DNA (例えば一本鎖標的DNA)を切断する能力が低下しているが、標的DNA (例えば一本鎖標的DNA)に結合する能力を保持する。別の非限定的な例として、いくつかの実施形態では、バリアントCas9タンパク質は、D10A、H840A、P475A、W476A、N477A、D1125A、W1126A、およびD1127A突然変異を宿し、その結果、ポリペプチドは、標的DNAを切断する能力が低下している。そのようなCas9タンパク質は、標的DNA (例えば一本鎖標的DNA)を切断する能力が低下しているが、標的DNA (例えば一本鎖標的DNA)に結合する能力を保持している。いくつかの実施形態では、バリアントCas9タンパク質がW476AおよびW1126A突然変異を宿する場合、またはバリアントCas9タンパク質がP475A、W476A、N477A、D1125A、W1126A、およびD1127A突然変異を宿する場合、バリアントCas9タンパク質はPAM配列に効率的に結合しない。従って、このような場合には、このようなバリアントCas9タンパク質を結合法に用いる際、この方法はPAM配列を必要としない。換言すれば、いくつかの実施形態では、このようなバリアントCas9タンパク質を結合法に用いる際、この方法はガイドRNAを含み得るが、この方法は、PAM配列の非存在下で行うことができる(従って、結合の特異性はガイドRNAの標的セグメントによってもたらされる)。上記の効果を達成するために、他の残基を突然変異させ得る(すなわち一方または他方のヌクレアーゼ部分を不活性化する)。非限定的な例として、残基D10、G12、G17、E762、H840、N854、N863、H982、H983、A984、D986、および/またはA987を改変(すなわち置換)することができる。また、アラニン置換以外の突然変異も好適である。

いくつかの実施形態では、低下した触媒活性を有するバリアントCas9タンパク質（例えばCas9タンパク質がD10、G12、G17、E762、H840、N854、N863、H982、H983、A984、D986、および/またはA987突然変異、例えばD10A、G12A、G17A、E762A、H840A、N854A、N863A、H982A、H983A、A984A、および/またはD986Aを有する場合）は、それがガイドRNAと相互作用する能力を保持する限り、部位特異的様式で標的DNAになお結合することができる（ガイドRNAによって標的DNA配列になお誘導されるため）。

いくつかの実施形態では、バリアントCasタンパク質はspCas9、spCas9-VRQR、spCas9-VRER、xCas9 (sp)、saCas9、saCas9-KKH、spCas9-MQKSER、spCas9-LRKIQK、またはspCas9-LRVSQLであり得る。

いくつかの実施形態では、アミノ酸置換D1135M、S1136Q、G1218K、E1219F、A1322R、D1332A、R1335E、およびT1337Rを含み、改変PAM 5'-NGC-3'に対する特異性を有する改変SpCas9 (SpCas9-MQKFRAER)を用いた。

S. pyogenes Cas9の代替には、哺乳動物細胞において切断活性を示すCpf1ファミリー由来のRNA誘導型エンドヌクレアーゼが含まれてもよい。PrevotellaおよびFrancisella 1由来のCRISPR (CRISPR/Cpf1) は、CRISPR/Cas9システムに類似したDNA編集技術である。Cpf1はクラスII CRISPR/CasシステムのRNA誘導型エンドヌクレアーゼである。この適応免疫機構はPrevotellaやFrancisella細菌に見られる。Cpf1遺伝子はCRISPR遺伝子座に関連しており、ウイルスDNAを見出して切断するためにガイドRNAを用いるエンドヌクレアーゼをコードしている。Cpf1はCas9より小さく単純なエンドヌクレアーゼであり、CRISPR/Cas9システムの制限のいくつかを克服する。Cas9ヌクレアーゼとは異なり、Cpf1を介したDNA切断の結果は、短い3'オーバーハングを伴う二本鎖切断である。Cpf1のねじれ型（staggered）の切断パターンは、伝統的な制限酵素クローニングに類似した、方向性のある遺伝子導入の可能性を開くことができ、これは遺伝子編集の効率を高め得る。上述したCas9のバリアントおよびオルソログと同様に、Cpf1は、CRISPRが標的とすることができる部位の数を、SpCas9が好むNGG PAM部位を欠くATリッチ領域またはATリッチゲノムに拡大することもできる。Cpf1遺伝子座はアルファ/ベータ混合ドメイン、RuvC‐Iとそれに続くらせん領域、RuvC‐IIおよびジンクフィンガー様ドメインを含む。Cpf1タンパク質は、Cas9のRuvCドメインに類似したRuvC様エンドヌクレアーゼドメインを有する。さらに、Cpf1はHNHエンドヌクレアーゼドメインを持たず、Cpf1のN末端はCas9のアルファらせん認識ローブを持たない。Cpf1 CRISPR‐Casドメイン構成は、Cpf1が機能的にユニークであり、クラス2、V型CRISPRシステムとして分類されることを示した。Cpf1遺伝子座は、II型システムシステムよりもI型およびIII型により類似したCas1、Cas2およびCas4タンパク質をコードしていた。機能的Cpf1はトランス活性化CRISPR RNA (tracrRNA) を必要とせず、従って、CRISPR (crRNA) だけを要する。Cpf1はCas9より小さいだけでなく、より小さいsgRNA分子(Cas9の約半分の数のヌクレオチド)を有するため、これはゲノム編集に有益である。Cas9が標的とするGリッチPAMとは対照的に、Cpf1-crRNA複合体は、プロトスペーサー隣接モチーフ5'-YTN-3'の同定によって標的DNAまたはRNAを切断する。PAMの同定後、Cpf1は、4または5ヌクレオチドのオーバーハングを有する付着（sticky）末端様のDNA二本鎖切断を導入する。

［核酸塩基エディターのCas12ドメイン］
典型的には、微生物CRISPR-Casシステムは、クラス1およびクラス2システムに分けられる。クラス1システムは、マルチサブユニットエフェクター複合体を有する一方、クラス2システムは単一のタンパク質エフェクターを有する。例えば、Cas9およびCpf1は、異なるタイプである（それぞれII型およびV型）にもかかわらず、クラス2エフェクターである。Cpf1に加えて、クラス2、V型CRISPR-Casシステムはまた、Cas12a/Cpfl、Cas12b/C2cl、Cas12c/C2c3、Cas12d/CasY、Cas12e/CasX、Cas12g、Cas12h、およびCas12iもまた含む。例えば、Shmakov et al., “Discovery and Functional Characterization of Diverse Class 2 CRISPR Cas Systems,” Mol. Cell, 2015 Nov. 5; 60(3): 385-397; Makarova et al., “Classification and Nomenclature of CRISPR-Cas Systems: Where from Here?” CRISPR Journal, 2018, 1(5): 325-336;およびYan et al., “Functionally Diverse Type V CRISPR-Cas Systems,” Science, 2019 Jan. 4; 363: 88-91を参照のこと（これらの文献は、その全体が参照により本明細書に組み込まれる）。V型Casタンパク質は、RuvC (またはRuvC様) エンドヌクレアーゼドメインを含有する。成熟CRISPR RNA (crRNA)の産生は、一般的に、tracrRNA独立であるが、例えば、Cas12b/C2c1は、crRNA の産生にtracrRNAを必要とする。Cas12b/C2c1は、DNA切断のため、crRNAおよびtracrRNAの両方に依存する。

本発明で意図される核酸プログラム可能DNA結合タンパク質には、クラス2、V型と分類されるCasタンパク質(Cas12タンパク質)が含まれる。Casクラス2、V型タンパク質の限定されない例には、Cas12a/Cpfl、Cas12b/C2cl、Cas12c/C2c3、Cas12d/CasY、Cas12e/CasX、Cas12g、Cas12h、およびCas12i、そのホモログまたは改変型が含まれる。本明細書で用いる際、Cas12 タンパク質はまた、Cas12ヌクレアーゼ、Cas12ドメイン、またはCas12タンパク質ドメインとも称され得る。いくつかの実施形態では、本発明のCas12タンパク質は、内部に融合したタンパク質ドメイン、例えばデアミナーゼドメインによって中断されるアミノ酸配列を含む。

いくつかの実施形態では、Cas12ドメインは、ヌクレアーゼ不活性Cas12ドメインまたはCas12ニッカーゼである。いくつかの実施形態では、Cas12ドメインは、ヌクレアーゼ活性ドメインである。例えば、Cas12ドメインは、二本鎖核酸（例えば二本鎖DNA分子）の一方の鎖にニックを入れるCas12ドメインであり得る。いくつかの実施形態では、Cas12ドメインは、本明細書に記載のアミノ酸配列のいずれか1つを含む。いくつかの実施形態では、Cas12ドメインは、本明細書に記載されたアミノ酸配列のいずれか１つに対して少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも99.5%同一であるアミノ酸配列を含む。いくつかの実施形態では、Cas12ドメインは、本明細書に記載されるアミノ酸配列のいずれか１つと比較して1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、21、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、またはそれより多い突然変異を有するアミノ酸配列を含む。いくつかの実施形態では、Cas12ドメインは、本明細書に記載されたアミノ酸配列のいずれか１つと比較して、少なくとも10、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90、少なくとも100、少なくとも150、少なくとも200、少なくとも250、少なくとも300、少なくとも350、少なくとも400、少なくとも500、少なくとも600、少なくとも700、少なくとも800、少なくとも900、少なくとも1000、少なくとも1100、または少なくとも1200の同一の連続したアミノ酸残基を有するアミノ酸配列を含む。

いくつかの実施形態では、Cas12の断片を含むタンパク質が提供される。例えば、いくつかの実施形態では、タンパク質は、以下の2つのCas12ドメインのうちの1つを含む：(1) Cas12のgRNA結合ドメイン;(2) Cas12のDNA切断ドメイン。いくつかの実施形態では、Cas12またはその断片を含むタンパク質は、「Cas12バリアント」と称される。Cas12バリアントは、Cas12またはその断片と相同性を共有する。例えば、Cas12バリアントは、野生型Cas12と少なくとも約70%同一、少なくとも約80%同一、少なくとも約90%同一、少なくとも約95%同一、少なくとも約96%同一、少なくとも約97%同一、少なくとも約98%同一、少なくとも約99%同一、少なくとも約99.5%同一、または少なくとも約99.9%同一である。いくつかの実施形態では、Cas12バリアントは、野生型Cas12と比較して、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、21、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50またはそれより多くのアミノ酸変化を有し得る。いくつかの実施形態では、Cas12バリアントは、Cas12の断片(例えばgRNA結合ドメインまたはDNA切断ドメイン)を含み、その断片は、野生型Cas12の対応する断片と少なくとも約70%同一、少なくとも約80%同一、少なくとも約90%同一、少なくとも約95%同一、少なくとも約96%同一、少なくとも約97%同一、少なくとも約98%同一、少なくとも約99%同一、少なくとも約99.5%同一、または少なくとも約99.9%同一である。いくつかの実施形態では、断片は、対応する野生型Cas12のアミノ酸長の少なくとも30%、少なくとも35%、少なくとも40%、少なくとも45%、少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%同一、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも99.5%である。いくつかの実施形態では、断片は、長さが少なくとも100アミノ酸である。いくつかの実施形態では、断片は、少なくとも100、150、200、250、300、350、400、450、500、550、600、650、700、750、800、850、900、950、1000、1050、1100、1150、1200、1250、または少なくとも1300アミノ酸の長さである。

いくつかの実施形態では、Cas12は、Cas12ヌクレアーゼ活性を改変する1つ以上の突然変異を有するCas12アミノ酸配列に部分的にまたは全体として対応するか、あるいはこうした配列を部分的にまたは全体として含む。こうした突然変異には、例えば、Cas12のRuvCヌクレアーゼドメイン内のアミノ酸置換が含まれる。いくつかの実施形態では、野生型Cas12に少なくとも約70%同一、少なくとも約80%同一、少なくとも約90%同一、少なくとも約95%同一、少なくとも約98%同一、少なくとも約99%同一、少なくとも約99.5%同一、または少なくとも約99.9%同一であるCas12のバリアントまたはホモログを提供する。いくつかの実施形態では、約5アミノ酸、約10アミノ酸、約15アミノ酸、約20アミノ酸、約25アミノ酸、約30アミノ酸、約40アミノ酸、約50アミノ酸、約75アミノ酸、約100アミノ酸以上、短いまたは長い、Cas12のバリアントを提供する。

いくつかの実施形態では、本明細書に提供されるようなCas12融合タンパク質は、Cas12タンパク質の全長アミノ酸配列、例えば本明細書に提供するCas12配列の1つを含む。しかし、他の実施形態では、本明細書で提供するような融合タンパク質は、全長Cas12配列を含まず、その1つ以上の断片のみを含む。適切なCas12ドメインの例示的なアミノ酸配列を本明細書に提供し、Cas12ドメインおよび断片の追加の適切な配列は、当業者には明らかであろう。

一般的に、クラス2、V型Casタンパク質は、単一の機能性RuvCエンドヌクレアーゼドメインを有する（例えば、Chen et al., “CRISPR-Cas12a target binding unleashes indiscriminate single-stranded DNase activity,” Science 360:436-439 (2018)を参照のこと）。いくつかの場合、Cas12タンパク質はバリアントCas12bタンパク質である（Strecker et al., Nature Communications, 2019, 10(1): Art. No.: 212を参照のこと）。一実施形態では、バリアントCas12ポリペプチドは、野生型Cas12タンパク質のアミノ酸配列と比較した際、1、2、3、4、5以上のアミノ酸で異なる（例えば欠失、挿入、置換、融合を有する）アミノ酸配列を有する。いくつかの例では、バリアントCas12ポリペプチドは、Cas12ポリペプチドの活性を減少させるアミノ酸変化（例えば欠失、挿入、または置換）を有する。例えば、いくつかの例では、バリアントCas12は、対応する野生型Cas12bタンパク質の50%未満、40%未満、30%未満、20%未満、10%未満、5%未満、または1%未満のニッカーゼ活性を有するCas12bポリペプチドである。

いくつかの場合、バリアントCas12bタンパク質は減少したニッカーゼ活性を有する。例えば、バリアントCas12bタンパク質は、野生型Cas12bタンパク質の約20%未満、約15%未満、約10%未満、約5%未満、約1%未満、または約0.1%未満のニッカーゼ活性を示す。

いくつかの実施形態では、Cas12タンパク質には、哺乳動物細胞において活性を示すCas12a/Cpf1ファミリー由来のRNA誘導型エンドヌクレアーゼが含まれる。PrevotellaおよびFrancisella 1由来のCRISPR（CRISPR/Cpf1）は、CRISPR/Cas9システムに類似のDNA編集技術である。Cpf1はクラスII CRISPR/CasシステムのRNA誘導型エンドヌクレアーゼである。この適応免疫機構は、PrevotellaおよびFrancisella細菌で見られる。Cpf1遺伝子は、CRISPR遺伝子座に関連し、ウイルスDNAを発見して切断するためにガイドRNAを用いるエンドヌクレアーゼをコードする。Cpf1は、Cas9よりも小さくより単純なエンドヌクレアーゼであり、CRISPR/Cas9システムの限界のいくつかを克服する。Cas9ヌクレアーゼとは異なり、Cpf1仲介DNA切断の結果は、短い3'オーバーハングを持つ二本鎖切断である。Cpf1のねじれ型切断パターンは、伝統的な制限酵素クローニングに似た、方向性遺伝子トランスファーの可能性を開くことが可能であり、これは遺伝子編集の効率を増加させ得る。上述のCas9バリアントおよびオルソログ同様、Cpf1はまた、CRISPRによって標的とされ得る部位の数を、SpCas9に好まれるNGG PAM部位を欠くATリッチ領域またはATリッチゲノムにまで拡張し得る。Cpf1遺伝子座は、混合アルファ／ベータドメイン、RuvC-I、その後、らせん領域、RuvC-IIおよびジンクフィンガー様ドメインを含有する。Cpf1タンパク質は、Cas9のRuvCドメインに類似のRuvC様エンドヌクレアーゼドメインを有する。さらに、Cpf1は、Cas9とは異なり、HNHエンドヌクレアーゼドメインを持たず、Cpf1のN末端はCas9のアルファらせん認識ローブを持たない。Cpf1 CRISPR-Casドメイン構築は、Cpf1が機能的にユニークであり、クラス2、V型CRISPRシステムと分類されることを示す。Cpf1遺伝子座は、II型システムよりもI型およびIII型と類似のCas1、Cas2、およびCas4タンパク質をコードする。機能的Cpf1は、トランス活性化CRISPR RNA（tracrRNA）を必要とせず、従って、CRISPR（crRNA）のみが必要である。Cpf1はCas9より小さいだけでなく、また、より小さいsgRNA分子（Cas9のおよそ半数のヌクレオチド）も有するため、これはゲノム編集に有益である。Cpf1-crRNA複合体は、Cas9によって標的とされるGリッチPAMとは対照的に、プロトスペーサー隣接モチーフ5'-YTN-3'または5'-TTTN-3'の同定によって、標的DNAまたはRNAを切断する。PAMの同定後、Cpf1は、4または5ヌクレオチドのオーバーハングを有する付着端様DNA二本鎖切断を導入する。

本発明のいくつかの態様において、ベクターは、対応する野生型酵素に関して突然変異されているCRISPR酵素をコードし、突然変異されたCRISPR酵素は、標的配列を含有する標的ポリヌクレオチドの一方または両方の鎖を切断する能力を欠く。Cas12は、野生型例示的Cas12ポリペプチド（例えばBacillus hisashii由来のCas12）に少なくとも約50%、60%、70%、80%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、または100%の配列同一性および/または配列相同性を持つポリペプチドを指してもよい。Cas12は、野生型例示的Cas12ポリペプチド(例えば、Bacillus hisashii由来 (BhCas12b)、Bacillus種 V3-13由来 (BvCas12b)、およびAlicyclobacillus acidiphilus由来(AaCas12b))に、最大または最大約、50%、60%、70%、80%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、または100% 配列同一性および/または配列相同性を持つポリペプチドを指してもよい。Cas12は、欠失、挿入、置換、バリアント、突然変異、融合、キメラ、またはその任意の組み合わせなどのアミノ酸変化を含み得る、Cas12タンパク質の野生型または改変型を指してもよい。

［核酸プログラム可能DNA結合タンパク質］
本開示のいくつかの態様は、核酸プログラム可能DNA結合タンパク質として作用するドメインを含む融合タンパク質を提供し、これは、塩基エディターのようなタンパク質を特定の核酸（例えばDNAまたはRNA）配列にガイドするために使用され得る。特定の実施形態では、融合タンパク質は、核酸プログラム可能DNA結合タンパク質ドメインとデアミナーゼドメインとを含む。核酸プログラム可能DNA結合タンパク質の非限定的な例には、Cas9（例えばdCas9およびnCas9）、Cas12a/Cpfl、Cas12b/C2cl、Cas12c/C2c3、Cas12d/CasY、Cas12e/CasX、Cas12g、Cas12h、およびCas12iが含まれる。Cas酵素の非限定的な例には、Cas1、Cas1B、Cas2、Cas3、Cas4、Cas5、Cas5d、Cas5t、Cas5h、Cas5a、Cas6、Cas7、Cas8、Cas8a、Cas8b、Cas8c、Cas9（Csn1またはCsx12とも呼ばれる）、Cas10、Cas10d、Cas12a/Cpfl、Cas12b/C2cl、Cas12c/C2c3、Cas12d/CasY、Cas12e/CasX、Cas12g、Cas12h、Cas12i、Csy1、Csy2、Csy3、Csy4、Cse1、Cse2、Cse3、Cse4、Cse5e、Csc1、Csc2、Csa5、Csn1、Csn2、Csm1、Csm2、Csm3、Csm4、Csm5、Csm6、Cmr1、Cmr3、Cmr4、Cmr5、Cmr6、Csb1、Csb2、Csb3、Csx17、Csx14、Csx10、Csx16、CsaX、Csx3、Csx1、Csx1S、Csx11、Csf1、Csf2、CsO、Csf4、Csd1、Csd2、Cst1、Cst2、Csh1、Csh2、Csa1、Csa2、Csa3、Csa4、Csa5、II型Casエフェクタータンパク質、V型Casエフェクタータンパク質、VI型Casエフェクタータンパク質、CARF、DinG、それらのホモログ、またはそれらの改変または操作された型が含まれる。他の核酸プログラム可能DNA結合タンパク質も、本開示に具体的に列記されていない可能性があるが、本開示の範囲内である。例えばMakarova et al. “Classification and Nomenclature of CRISPR-Cas Systems: Where from Here?” CRISPR J. 2018 Oct;1:325-336. doi: 10.1089/crispr.2018.0033; Yan et al., “Functionally diverse type V CRISPR-Cas systems” Science. 2019 Jan 4;363(6422):88-91. doi: 10.1126/science.aav7271を参照のこと（それぞれの全内容が参照により本明細書に組み込まれる）。

Cas9とは異なるPAM特異性を有する核酸プログラム可能DNA結合タンパク質の一例は、Prevotella およびFrancisella1由来のClustered Regularly Interspaced Short Palindromic Repeats（Cpf1）である。Cas9と同様に、Cpf1もクラス2 CRISPRエフェクターである。Cpf1はCas9とは異なる特徴でロバストなDNA干渉を仲介することが示されている。Cpf1は、tracrRNAを欠く単一RNA誘導型エンドヌクレアーゼであり、Tリッチプロトスペーサー隣接モチーフ(TTN、TTTN、またはYTN)を利用する。さらに、Cpf1はDNAをねじれ型DNA二本鎖切断で切断する。16のCpf1ファミリータンパク質のうち、AcidaminococcusとLachnospiraceae由来の2つの酵素がヒト細胞において効率的なゲノム編集活性を有することが示されている。Cpf1タンパク質は当技術分野で知られており、例えば過去にYamano et al., “Crystal structure of Cpf1 in complex with guide RNA and target DNA.” Cell (165) 2016, p. 949-962に記載されており、その全体の内容は参照により本明細書に組み込まれる。

ガイドヌクレオチド配列プログラム可能DNA結合タンパク質ドメインとして使用され得るヌクレアーゼ不活性Cpf1 (dCpf1) バリアントが、本発明の組成物および方法において有用である。Cpf1タンパク質は、Cas9のRuvCドメインに類似したRuvC様エンドヌクレアーゼドメインを有するが、HNHエンドヌクレアーゼドメインを持たず、Cpf1のN末端はCas9のアルファらせん認識ローブを持たない。Zetsche et al., Cell, 163, 759-771, 2015 (参照により本明細書に組み込まれる)は、Cpf1のRuvC様ドメインが両方のDNA鎖の切断を担い、RuvC様ドメインの不活化はCpf1ヌクレアーゼ活性を不活化することを示した。例えば、Francisella novicida Cpf1におけるD917A、E1006A、またはD1255Aに対応する突然変異は、Cpf1ヌクレアーゼ活性を不活化する。いくつかの実施形態では、本開示のdCpf1は、D917A、E1006A、D1255A、D917A/E1006A、D917A/D1255A、E1006A/D1255A、またはD917A/E1006A/D1255Aに対応する突然変異を含む。Cpf1のRuvCドメインを不活化する任意の突然変異、例えば、置換突然変異、欠失、または挿入が、本開示に従って使用され得ることを理解されたい。

いくつかの実施形態では、本明細書で提供される融合タンパク質のいずれかの核酸プログラム可能DNA結合タンパク質（napDNAbp）は、Cpf1タンパク質であり得る。いくつかの実施形態では、Cpf1タンパク質は、Cpf1ニッカーゼ(nCpf1) である。いくつかの実施形態では、Cpf1タンパク質は、ヌクレアーゼ不活性Cpf1 (dCpf1) である。いくつかの実施形態では、Cpf1、nCpf1、またはdCpf1は、本明細書に開示されたCpf1配列に対して少なくとも85%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも99.5%同一であるアミノ酸配列を含む。いくつかの実施形態では、dCpf1は、本明細書に開示されたCpf1配列に対して少なくとも85%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも99.5%同一であるアミノ酸配列を含み、D917A、E1006A、D1255A、D917A/E1006A、D917A/D1255A、E1006A/D1255A、またはD917A/E1006A/D1255Aに対応する突然変異を含む。他の細菌種由来のCpf1もまた本開示に従って使用され得ることが理解されるべきである。

野生型Francisella novicida Cpf1（D917、E1006、およびD1255は太字に下線で示される）。
MSIYQEFVNKYSLSKTLRFELIPQGKTLENIKARGLILDDEKRAKDYKKAKQIIDKYHQFFIEEILSSVCISEDLLQNYSDVYFKLKKSDDDNLQKDFKSAKDTIKKQISEYIKDSEKFKNLFNQNLIDAKKGQESDLILWLKQSKDNGIELFKANSDITDIDEALEIIKSFKGWTTYFKGFHENRKNVYSSNDIPTSIIYRIVDDNLPKFLENKAKYESLKDKAPEAINYEQIKKDLAEELTFDIDYKTSEVNQRVFSLDEVFEIANFNNYLNQSGITKFNTIIGGKFVNGENTKRKGINEYINLYSQQINDKTLKKYKMSVLFKQILSDTESKSFVIDKLEDDSDVVTTMQSFYEQIAAFKTVEEKSIKETLSLLFDDLKAQKLDLSKIYFKNDKSLTDLSQQVFDDYSVIGTAVLEYITQQIAPKNLDNPSKKEQELIAKKTEKAKYLSLETIKLALEEFNKHRDIDKQCRFEEILANFAAIPMIFDEIAQNKDNLAQISIKYQNQGKKDLLQASAEDDVKAIKDLLDQTNNLLHKLKIFHISQSEDKANILDKDEHFYLVFEECYFELANIVPLYNKIRNYITQKPYSDEKFKLNFENSTLANGWDKNKEPDNTAILFIKDDKYYLGVMNKKNNKIFDDKAIKENKGEGYKKIVYKLLPGANKMLPKVFFSAKSIKFYNPSEDILRIRNHSTHTKNGSPQKGYEKFEFNIEDCRKFIDFYKQSISKHPEWKDFGFRFSDTQRYNSIDEFYREVENQGYKLTFENISESYIDSVVNQGKLYLFQIYNKDFSAYSKGRPNLHTLYWKALFDERNLQDVVYKLNGEAELFYRKQSIPKKITHPAKEAIANKNKDNPKKESVFEYDLIKDKRFTEDKFFFHCPITINFKSSGANKFNDEINLLLKEKANDVHILSIDRGERHLAYYTLVDGKGNIIKQDTFNIIGNDRMKTNYHDKLAAIEKDRDSARKDWKKINNIKEMKEGYLSQVVHEIAKLVIEYNAIVVFEDLNFGFKRGRFKVEKQVYQKLEKMLIEKLNYLVFKDNEFDKTGGVLRAYQLTAPFETFKKMGKQTGIIYYVPAGFTSKICPVTGFVNQLYPKYESVSKSQEFFSKFDKICYNLDKGYFEFSFDYKNFGDKAAKGKWTIASFGSRLINFRNSDKNHNWDTREVYPTKELEKLLKDYSIEYGHGECIKAAICGESDKKFFAKLTSVLNTILQMRNSKTGTELDYLISPVADVNGNFFDSRQAPKNMPQDADANGAYHIGLKGLMLLGRIKNNQEGKKLNLVIKNEEYFEFVQNRNN

Francisella novicida Cpf1 D917A（A917、E1006、およびD1255は太字に下線で示される）。
MSIYQEFVNKYSLSKTLRFELIPQGKTLENIKARGLILDDEKRAKDYKKAKQIIDKYHQFFIEEILSSVCISEDLLQNYSDVYFKLKKSDDDNLQKDFKSAKDTIKKQISEYIKDSEKFKNLFNQNLIDAKKGQESDLILWLKQSKDNGIELFKANSDITDIDEALEIIKSFKGWTTYFKGFHENRKNVYSSNDIPTSIIYRIVDDNLPKFLENKAKYESLKDKAPEAINYEQIKKDLAEELTFDIDYKTSEVNQRVFSLDEVFEIANFNNYLNQSGITKFNTIIGGKFVNGENTKRKGINEYINLYSQQINDKTLKKYKMSVLFKQILSDTESKSFVIDKLEDDSDVVTTMQSFYEQIAAFKTVEEKSIKETLSLLFDDLKAQKLDLSKIYFKNDKSLTDLSQQVFDDYSVIGTAVLEYITQQIAPKNLDNPSKKEQELIAKKTEKAKYLSLETIKLALEEFNKHRDIDKQCRFEEILANFAAIPMIFDEIAQNKDNLAQISIKYQNQGKKDLLQASAEDDVKAIKDLLDQTNNLLHKLKIFHISQSEDKANILDKDEHFYLVFEECYFELANIVPLYNKIRNYITQKPYSDEKFKLNFENSTLANGWDKNKEPDNTAILFIKDDKYYLGVMNKKNNKIFDDKAIKENKGEGYKKIVYKLLPGANKMLPKVFFSAKSIKFYNPSEDILRIRNHSTHTKNGSPQKGYEKFEFNIEDCRKFIDFYKQSISKHPEWKDFGFRFSDTQRYNSIDEFYREVENQGYKLTFENISESYIDSVVNQGKLYLFQIYNKDFSAYSKGRPNLHTLYWKALFDERNLQDVVYKLNGEAELFYRKQSIPKKITHPAKEAIANKNKDNPKKESVFEYDLIKDKRFTEDKFFFHCPITINFKSSGANKFNDEINLLLKEKANDVHILSIARGERHLAYYTLVDGKGNIIKQDTFNIIGNDRMKTNYHDKLAAIEKDRDSARKDWKKINNIKEMKEGYLSQVVHEIAKLVIEYNAIVVFEDLNFGFKRGRFKVEKQVYQKLEKMLIEKLNYLVFKDNEFDKTGGVLRAYQLTAPFETFKKMGKQTGIIYYVPAGFTSKICPVTGFVNQLYPKYESVSKSQEFFSKFDKICYNLDKGYFEFSFDYKNFGDKAAKGKWTIASFGSRLINFRNSDKNHNWDTREVYPTKELEKLLKDYSIEYGHGECIKAAICGESDKKFFAKLTSVLNTILQMRNSKTGTELDYLISPVADVNGNFFDSRQAPKNMPQDADANGAYHIGLKGLMLLGRIKNNQEGKKLNLVIKNEEYFEFVQNRNN

Francisella novicida Cpf1 E1006A（D917、A1006、および D1255は太字に下線で示される）。
MSIYQEFVNKYSLSKTLRFELIPQGKTLENIKARGLILDDEKRAKDYKKAKQIIDKYHQFFIEEILSSVCISEDLLQNYSDVYFKLKKSDDDNLQKDFKSAKDTIKKQISEYIKDSEKFKNLFNQNLIDAKKGQESDLILWLKQSKDNGIELFKANSDITDIDEALEIIKSFKGWTTYFKGFHENRKNVYSSNDIPTSIIYRIVDDNLPKFLENKAKYESLKDKAPEAINYEQIKKDLAEELTFDIDYKTSEVNQRVFSLDEVFEIANFNNYLNQSGITKFNTIIGGKFVNGENTKRKGINEYINLYSQQINDKTLKKYKMSVLFKQILSDTESKSFVIDKLEDDSDVVTTMQSFYEQIAAFKTVEEKSIKETLSLLFDDLKAQKLDLSKIYFKNDKSLTDLSQQVFDDYSVIGTAVLEYITQQIAPKNLDNPSKKEQELIAKKTEKAKYLSLETIKLALEEFNKHRDIDKQCRFEEILANFAAIPMIFDEIAQNKDNLAQISIKYQNQGKKDLLQASAEDDVKAIKDLLDQTNNLLHKLKIFHISQSEDKANILDKDEHFYLVFEECYFELANIVPLYNKIRNYITQKPYSDEKFKLNFENSTLANGWDKNKEPDNTAILFIKDDKYYLGVMNKKNNKIFDDKAIKENKGEGYKKIVYKLLPGANKMLPKVFFSAKSIKFYNPSEDILRIRNHSTHTKNGSPQKGYEKFEFNIEDCRKFIDFYKQSISKHPEWKDFGFRFSDTQRYNSIDEFYREVENQGYKLTFENISESYIDSVVNQGKLYLFQIYNKDFSAYSKGRPNLHTLYWKALFDERNLQDVVYKLNGEAELFYRKQSIPKKITHPAKEAIANKNKDNPKKESVFEYDLIKDKRFTEDKFFFHCPITINFKSSGANKFNDEINLLLKEKANDVHILSIDRGERHLAYYTLVDGKGNIIKQDTFNIIGNDRMKTNYHDKLAAIEKDRDSARKDWKKINNIKEMKEGYLSQVVHEIAKLVIEYNAIVVFADLNFGFKRGRFKVEKQVYQKLEKMLIEKLNYLVFKDNEFDKTGGVLRAYQLTAPFETFKKMGKQTGIIYYVPAGFTSKICPVTGFVNQLYPKYESVSKSQEFFSKFDKICYNLDKGYFEFSFDYKNFGDKAAKGKWTIASFGSRLINFRNSDKNHNWDTREVYPTKELEKLLKDYSIEYGHGECIKAAICGESDKKFFAKLTSVLNTILQMRNSKTGTELDYLISPVADVNGNFFDSRQAPKNMPQDADANGAYHIGLKGLMLLGRIKNNQEGKKLNLVIKNEEYFEFVQNRNN

Francisella novicida Cpf1 D1255A（D917、E1006、および A1255は太字に下線で示される）。
MSIYQEFVNKYSLSKTLRFELIPQGKTLENIKARGLILDDEKRAKDYKKAKQIIDKYHQFFIEEILSSVCISEDLLQNYSDVYFKLKKSDDDNLQKDFKSAKDTIKKQISEYIKDSEKFKNLFNQNLIDAKKGQESDLILWLKQSKDNGIELFKANSDITDIDEALEIIKSFKGWTTYFKGFHENRKNVYSSNDIPTSIIYRIVDDNLPKFLENKAKYESLKDKAPEAINYEQIKKDLAEELTFDIDYKTSEVNQRVFSLDEVFEIANFNNYLNQSGITKFNTIIGGKFVNGENTKRKGINEYINLYSQQINDKTLKKYKMSVLFKQILSDTESKSFVIDKLEDDSDVVTTMQSFYEQIAAFKTVEEKSIKETLSLLFDDLKAQKLDLSKIYFKNDKSLTDLSQQVFDDYSVIGTAVLEYITQQIAPKNLDNPSKKEQELIAKKTEKAKYLSLETIKLALEEFNKHRDIDKQCRFEEILANFAAIPMIFDEIAQNKDNLAQISIKYQNQGKKDLLQASAEDDVKAIKDLLDQTNNLLHKLKIFHISQSEDKANILDKDEHFYLVFEECYFELANIVPLYNKIRNYITQKPYSDEKFKLNFENSTLANGWDKNKEPDNTAILFIKDDKYYLGVMNKKNNKIFDDKAIKENKGEGYKKIVYKLLPGANKMLPKVFFSAKSIKFYNPSEDILRIRNHSTHTKNGSPQKGYEKFEFNIEDCRKFIDFYKQSISKHPEWKDFGFRFSDTQRYNSIDEFYREVENQGYKLTFENISESYIDSVVNQGKLYLFQIYNKDFSAYSKGRPNLHTLYWKALFDERNLQDVVYKLNGEAELFYRKQSIPKKITHPAKEAIANKNKDNPKKESVFEYDLIKDKRFTEDKFFFHCPITINFKSSGANKFNDEINLLLKEKANDVHILSIDRGERHLAYYTLVDGKGNIIKQDTFNIIGNDRMKTNYHDKLAAIEKDRDSARKDWKKINNIKEMKEGYLSQVVHEIAKLVIEYNAIVVFEDLNFGFKRGRFKVEKQVYQKLEKMLIEKLNYLVFKDNEFDKTGGVLRAYQLTAPFETFKKMGKQTGIIYYVPAGFTSKICPVTGFVNQLYPKYESVSKSQEFFSKFDKICYNLDKGYFEFSFDYKNFGDKAAKGKWTIASFGSRLINFRNSDKNHNWDTREVYPTKELEKLLKDYSIEYGHGECIKAAICGESDKKFFAKLTSVLNTILQMRNSKTGTELDYLISPVADVNGNFFDSRQAPKNMPQDAAANGAYHIGLKGLMLLGRIKNNQEGKKLNLVIKNEEYFEFVQNRNN

Francisella novicida Cpf1 D917A/E1006A（A917、A1006、およびD1255は太字に下線で示される）。
MSIYQEFVNKYSLSKTLRFELIPQGKTLENIKARGLILDDEKRAKDYKKAKQIIDKYHQFFIEEILSSVCISEDLLQNYSDVYFKLKKSDDDNLQKDFKSAKDTIKKQISEYIKDSEKFKNLFNQNLIDAKKGQESDLILWLKQSKDNGIELFKANSDITDIDEALEIIKSFKGWTTYFKGFHENRKNVYSSNDIPTSIIYRIVDDNLPKFLENKAKYESLKDKAPEAINYEQIKKDLAEELTFDIDYKTSEVNQRVFSLDEVFEIANFNNYLNQSGITKFNTIIGGKFVNGENTKRKGINEYINLYSQQINDKTLKKYKMSVLFKQILSDTESKSFVIDKLEDDSDVVTTMQSFYEQIAAFKTVEEKSIKETLSLLFDDLKAQKLDLSKIYFKNDKSLTDLSQQVFDDYSVIGTAVLEYITQQIAPKNLDNPSKKEQELIAKKTEKAKYLSLETIKLALEEFNKHRDIDKQCRFEEILANFAAIPMIFDEIAQNKDNLAQISIKYQNQGKKDLLQASAEDDVKAIKDLLDQTNNLLHKLKIFHISQSEDKANILDKDEHFYLVFEECYFELANIVPLYNKIRNYITQKPYSDEKFKLNFENSTLANGWDKNKEPDNTAILFIKDDKYYLGVMNKKNNKIFDDKAIKENKGEGYKKIVYKLLPGANKMLPKVFFSAKSIKFYNPSEDILRIRNHSTHTKNGSPQKGYEKFEFNIEDCRKFIDFYKQSISKHPEWKDFGFRFSDTQRYNSIDEFYREVENQGYKLTFENISESYIDSVVNQGKLYLFQIYNKDFSAYSKGRPNLHTLYWKALFDERNLQDVVYKLNGEAELFYRKQSIPKKITHPAKEAIANKNKDNPKKESVFEYDLIKDKRFTEDKFFFHCPITINFKSSGANKFNDEINLLLKEKANDVHILSIARGERHLAYYTLVDGKGNIIKQDTFNIIGNDRMKTNYHDKLAAIEKDRDSARKDWKKINNIKEMKEGYLSQVVHEIAKLVIEYNAIVVFADLNFGFKRGRFKVEKQVYQKLEKMLIEKLNYLVFKDNEFDKTGGVLRAYQLTAPFETFKKMGKQTGIIYYVPAGFTSKICPVTGFVNQLYPKYESVSKSQEFFSKFDKICYNLDKGYFEFSFDYKNFGDKAAKGKWTIASFGSRLINFRNSDKNHNWDTREVYPTKELEKLLKDYSIEYGHGECIKAAICGESDKKFFAKLTSVLNTILQMRNSKTGTELDYLISPVADVNGNFFDSRQAPKNMPQDADANGAYHIGLKGLMLLGRIKNNQEGKKLNLVIKNEEYFEFVQNRNN

Francisella novicida Cpf1 D917A/D1255A（A917、E1006、および A1255は太字に下線で示される）。
MSIYQEFVNKYSLSKTLRFELIPQGKTLENIKARGLILDDEKRAKDYKKAKQIIDKYHQFFIEEILSSVCISEDLLQNYSDVYFKLKKSDDDNLQKDFKSAKDTIKKQISEYIKDSEKFKNLFNQNLIDAKKGQESDLILWLKQSKDNGIELFKANSDITDIDEALEIIKSFKGWTTYFKGFHENRKNVYSSNDIPTSIIYRIVDDNLPKFLENKAKYESLKDKAPEAINYEQIKKDLAEELTFDIDYKTSEVNQRVFSLDEVFEIANFNNYLNQSGITKFNTIIGGKFVNGENTKRKGINEYINLYSQQINDKTLKKYKMSVLFKQILSDTESKSFVIDKLEDDSDVVTTMQSFYEQIAAFKTVEEKSIKETLSLLFDDLKAQKLDLSKIYFKNDKSLTDLSQQVFDDYSVIGTAVLEYITQQIAPKNLDNPSKKEQELIAKKTEKAKYLSLETIKLALEEFNKHRDIDKQCRFEEILANFAAIPMIFDEIAQNKDNLAQISIKYQNQGKKDLLQASAEDDVKAIKDLLDQTNNLLHKLKIFHISQSEDKANILDKDEHFYLVFEECYFELANIVPLYNKIRNYITQKPYSDEKFKLNFENSTLANGWDKNKEPDNTAILFIKDDKYYLGVMNKKNNKIFDDKAIKENKGEGYKKIVYKLLPGANKMLPKVFFSAKSIKFYNPSEDILRIRNHSTHTKNGSPQKGYEKFEFNIEDCRKFIDFYKQSISKHPEWKDFGFRFSDTQRYNSIDEFYREVENQGYKLTFENISESYIDSVVNQGKLYLFQIYNKDFSAYSKGRPNLHTLYWKALFDERNLQDVVYKLNGEAELFYRKQSIPKKITHPAKEAIANKNKDNPKKESVFEYDLIKDKRFTEDKFFFHCPITINFKSSGANKFNDEINLLLKEKANDVHILSIARGERHLAYYTLVDGKGNIIKQDTFNIIGNDRMKTNYHDKLAAIEKDRDSARKDWKKINNIKEMKEGYLSQVVHEIAKLVIEYNAIVVFEDLNFGFKRGRFKVEKQVYQKLEKMLIEKLNYLVFKDNEFDKTGGVLRAYQLTAPFETFKKMGKQTGIIYYVPAGFTSKICPVTGFVNQLYPKYESVSKSQEFFSKFDKICYNLDKGYFEFSFDYKNFGDKAAKGKWTIASFGSRLINFRNSDKNHNWDTREVYPTKELEKLLKDYSIEYGHGECIKAAICGESDKKFFAKLTSVLNTILQMRNSKTGTELDYLISPVADVNGNFFDSRQAPKNMPQDAAANGAYHIGLKGLMLLGRIKNNQEGKKLNLVIKNEEYFEFVQNRNN

Francisella novicida Cpf1 E1006A/D1255A（D917、A1006、およびA1255は太字に下線で示される）。
MSIYQEFVNKYSLSKTLRFELIPQGKTLENIKARGLILDDEKRAKDYKKAKQIIDKYHQFFIEEILSSVCISEDLLQNYSDVYFKLKKSDDDNLQKDFKSAKDTIKKQISEYIKDSEKFKNLFNQNLIDAKKGQESDLILWLKQSKDNGIELFKANSDITDIDEALEIIKSFKGWTTYFKGFHENRKNVYSSNDIPTSIIYRIVDDNLPKFLENKAKYESLKDKAPEAINYEQIKKDLAEELTFDIDYKTSEVNQRVFSLDEVFEIANFNNYLNQSGITKFNTIIGGKFVNGENTKRKGINEYINLYSQQINDKTLKKYKMSVLFKQILSDTESKSFVIDKLEDDSDVVTTMQSFYEQIAAFKTVEEKSIKETLSLLFDDLKAQKLDLSKIYFKNDKSLTDLSQQVFDDYSVIGTAVLEYITQQIAPKNLDNPSKKEQELIAKKTEKAKYLSLETIKLALEEFNKHRDIDKQCRFEEILANFAAIPMIFDEIAQNKDNLAQISIKYQNQGKKDLLQASAEDDVKAIKDLLDQTNNLLHKLKIFHISQSEDKANILDKDEHFYLVFEECYFELANIVPLYNKIRNYITQKPYSDEKFKLNFENSTLANGWDKNKEPDNTAILFIKDDKYYLGVMNKKNNKIFDDKAIKENKGEGYKKIVYKLLPGANKMLPKVFFSAKSIKFYNPSEDILRIRNHSTHTKNGSPQKGYEKFEFNIEDCRKFIDFYKQSISKHPEWKDFGFRFSDTQRYNSIDEFYREVENQGYKLTFENISESYIDSVVNQGKLYLFQIYNKDFSAYSKGRPNLHTLYWKALFDERNLQDVVYKLNGEAELFYRKQSIPKKITHPAKEAIANKNKDNPKKESVFEYDLIKDKRFTEDKFFFHCPITINFKSSGANKFNDEINLLLKEKANDVHILSIDRGERHLAYYTLVDGKGNIIKQDTFNIIGNDRMKTNYHDKLAAIEKDRDSARKDWKKINNIKEMKEGYLSQVVHEIAKLVIEYNAIVVFADLNFGFKRGRFKVEKQVYQKLEKMLIEKLNYLVFKDNEFDKTGGVLRAYQLTAPFETFKKMGKQTGIIYYVPAGFTSKICPVTGFVNQLYPKYESVSKSQEFFSKFDKICYNLDKGYFEFSFDYKNFGDKAAKGKWTIASFGSRLINFRNSDKNHNWDTREVYPTKELEKLLKDYSIEYGHGECIKAAICGESDKKFFAKLTSVLNTILQMRNSKTGTELDYLISPVADVNGNFFDSRQAPKNMPQDAAANGAYHIGLKGLMLLGRIKNNQEGKKLNLVIKNEEYFEFVQNRNN

Francisella novicida Cpf1 D917A/E1006A/D1255A（A917、A1006、および A1255は太字に下線で示される）。
MSIYQEFVNKYSLSKTLRFELIPQGKTLENIKARGLILDDEKRAKDYKKAKQIIDKYHQFFIEEILSSVCISEDLLQNYSDVYFKLKKSDDDNLQKDFKSAKDTIKKQISEYIKDSEKFKNLFNQNLIDAKKGQESDLILWLKQSKDNGIELFKANSDITDIDEALEIIKSFKGWTTYFKGFHENRKNVYSSNDIPTSIIYRIVDDNLPKFLENKAKYESLKDKAPEAINYEQIKKDLAEELTFDIDYKTSEVNQRVFSLDEVFEIANFNNYLNQSGITKFNTIIGGKFVNGENTKRKGINEYINLYSQQINDKTLKKYKMSVLFKQILSDTESKSFVIDKLEDDSDVVTTMQSFYEQIAAFKTVEEKSIKETLSLLFDDLKAQKLDLSKIYFKNDKSLTDLSQQVFDDYSVIGTAVLEYITQQIAPKNLDNPSKKEQELIAKKTEKAKYLSLETIKLALEEFNKHRDIDKQCRFEEILANFAAIPMIFDEIAQNKDNLAQISIKYQNQGKKDLLQASAEDDVKAIKDLLDQTNNLLHKLKIFHISQSEDKANILDKDEHFYLVFEECYFELANIVPLYNKIRNYITQKPYSDEKFKLNFENSTLANGWDKNKEPDNTAILFIKDDKYYLGVMNKKNNKIFDDKAIKENKGEGYKKIVYKLLPGANKMLPKVFFSAKSIKFYNPSEDILRIRNHSTHTKNGSPQKGYEKFEFNIEDCRKFIDFYKQSISKHPEWKDFGFRFSDTQRYNSIDEFYREVENQGYKLTFENISESYIDSVVNQGKLYLFQIYNKDFSAYSKGRPNLHTLYWKALFDERNLQDVVYKLNGEAELFYRKQSIPKKITHPAKEAIANKNKDNPKKESVFEYDLIKDKRFTEDKFFFHCPITINFKSSGANKFNDEINLLLKEKANDVHILSIARGERHLAYYTLVDGKGNIIKQDTFNIIGNDRMKTNYHDKLAAIEKDRDSARKDWKKINNIKEMKEGYLSQVVHEIAKLVIEYNAIVVFADLNFGFKRGRFKVEKQVYQKLEKMLIEKLNYLVFKDNEFDKTGGVLRAYQLTAPFETFKKMGKQTGIIYYVPAGFTSKICPVTGFVNQLYPKYESVSKSQEFFSKFDKICYNLDKGYFEFSFDYKNFGDKAAKGKWTIASFGSRLINFRNSDKNHNWDTREVYPTKELEKLLKDYSIEYGHGECIKAAICGESDKKFFAKLTSVLNTILQMRNSKTGTELDYLISPVADVNGNFFDSRQAPKNMPQDAAANGAYHIGLKGLMLLGRIKNNQEGKKLNLVIKNEEYFEFVQNRNN

いくつかの実施形態では、融合タンパク質中に存在するCas9ドメインの1つは、PAM配列を必要としないガイドヌクレオチド配列プログラム可能DNA結合タンパク質ドメインで置換され得る。

いくつかの実施形態では、Cas9ドメインは、Staphylococcus aureus由来のCas9ドメイン(SaCas9)である。いくつかの実施形態では、SaCas9ドメインは、ヌクレアーゼ活性SaCas9、ヌクレアーゼ不活性SaCas9 (SaCas9d) 、またはSaCas9ニッカーゼ (SaCas9 n) である。いくつかの実施形態では、SaCas9は、N579A突然変異、または本明細書に提供されるアミノ酸配列のいずれかにおける対応する突然変異を含む。

いくつかの実施形態では、SaCas9ドメイン、SaCas9dドメイン、またはSaCas9nドメインは、非カノニカルPAMを有する核酸配列に結合することができる。いくつかの実施形態では、SaCas9ドメイン、SaCas9dドメイン、またはSaCas9nドメインは、NNGRRTまたはNNGRRT PAM配列を有する核酸配列に結合することができる。いくつかの実施形態では、SaCas9ドメインは、E781X、N967X、およびR1014X突然変異の1つ以上、または本明細書に提供されるアミノ酸配列のいずれかにおける対応する突然変異を含み、ここでXは任意のアミノ酸である。いくつかの実施形態では、SaCas9ドメインは、E781K、N967K、およびR1014H突然変異のうちの1つ以上、または本明細書に提供されるアミノ酸配列のいずれかにおける1つ以上の対応する突然変異を含む。いくつかの実施形態では、SaCas9ドメインは、E781K、N967K、またはR1014H突然変異、または本明細書に提供されるアミノ酸配列のいずれかにおける対応する突然変異を含む。

例示的なSaCas9配列
KRNYILGLDIGITSVGYGIIDYETRDVIDAGVRLFKEANVENNEGRRSKRGARRLKRRRRHRIQRVKKLLFDYNLLTDHSELSGINPYEARVKGLSQKLSEEEFSAALLHLAKRRGVHNVNEVEEDTGNELSTKEQISRNSKALEEKYVAELQLERLKKDGEVRGSINRFKTSDYVKEAKQLLKVQKAYHQLDQSFIDTYIDLLETRRTYYEGPGEGSPFGWKDIKEWYEMLMGHCTYFPEELRSVKYAYNADLYNALNDLNNLVITRDENEKLEYYEKFQIIENVFKQKKKPTLKQIAKEILVNEEDIKGYRVTSTGKPEFTNLKVYHDIKDITARKEIIENAELLDQIAKILTIYQSSEDIQEELTNLNSELTQEEIEQISNLKGYTGTHNLSLKAINLILDELWHTNDNQIAIFNRLKLVPKKVDLSQQKEIPTTLVDDFILSPVVKRSFIQSIKVINAIIKKYGLPNDIIIELAREKNSKDAQKMINEMQKRNRQTNERIEEIIRTTGKENAKYLIEKIKLHDMQEGKCLYSLEAIPLEDLLNNPFNYEVDHIIPRSVSFDNSFNNKVLVKQEENSKKGNRTPFQYLSSSDSKISYETFKKHILNLAKGKGRISKTKKEYLLEERDINRFSVQKDFINRNLVDTRYATRGLMNLLRSYFRVNNLDVKVKSINGGFTSFLRRKWKFKKERNKGYKHHAEDALIIANADFIFKEWKKLDKAKKVMENQMFEEKQAESMPEIETEQEYKEIFITPHQIKHIKDFKDYKYSHRVDKKPNRELINDTLYSTRKDDKGNTLIVNNLNGLYDKDNDKLKKLINKSPEKLLMYHHDPQTYQKLKLIMEQYGDEKNPLYKYYEETGNYLTKYSKKDNGPVIKKIKYYGNKLNAHLDITDDYPNSRNKVVKLSLKPYRFDVYLDNGVYKFVTVKNLDVIKKENYYEVNSKCYEEAKKLKKISNQAEFIASFYNNDLIKINGELYRVIGVNNDLLNRIEVNMIDITYREYLENMNDKRPPRIIKTIASKTQSIKKYSTDILGNLYEVKSKKHPQIIKKG
下線で示され太字である上記残基N579は、（例えばA579に）突然変異されてSaCas9ニッカーゼを生じ得る。

例示的なSaCas9n配列
KRNYILGLDIGITSVGYGIIDYETRDVIDAGVRLFKEANVENNEGRRSKRGARRLKRRRRHRIQRVKKLLFDYNLLTDHSELSGINPYEARVKGLSQKLSEEEFSAALLHLAKRRGVHNVNEVEEDTGNELSTKEQISRNSKALEEKYVAELQLERLKKDGEVRGSINRFKTSDYVKEAKQLLKVQKAYHQLDQSFIDTYIDLLETRRTYYEGPGEGSPFGWKDIKEWYEMLMGHCTYFPEELRSVKYAYNADLYNALNDLNNLVITRDENEKLEYYEKFQIIENVFKQKKKPTLKQIAKEILVNEEDIKGYRVTSTGKPEFTNLKVYHDIKDITARKEIIENAELLDQIAKILTIYQSSEDIQEELTNLNSELTQEEIEQISNLKGYTGTHNLSLKAINLILDELWHTNDNQIAIFNRLKLVPKKVDLSQQKEIPTTLVDDFILSPVVKRSFIQSIKVINAIIKKYGLPNDIIIELAREKNSKDAQKMINEMQKRNRQTNERIEEIIRTTGKENAKYLIEKIKLHDMQEGKCLYSLEAIPLEDLLNNPFNYEVDHIIPRSVSFDNSFNNKVLVKQEEASKKGNRTPFQYLSSSDSKISYETFKKHILNLAKGKGRISKTKKEYLLEERDINRFSVQKDFINRNLVDTRYATRGLMNLLRSYFRVNNLDVKVKSINGGFTSFLRRKWKFKKERNKGYKHHAEDALIIANADFIFKEWKKLDKAKKVMENQMFEEKQAESMPEIETEQEYKEIFITPHQIKHIKDFKDYKYSHRVDKKPNRELINDTLYSTRKDDKGNTLIVNNLNGLYDKDNDKLKKLINKSPEKLLMYHHDPQTYQKLKLIMEQYGDEKNPLYKYYEETGNYLTKYSKKDNGPVIKKIKYYGNKLNAHLDITDDYPNSRNKVVKLSLKPYRFDVYLDNGVYKFVTVKNLDVIKKENYYEVNSKCYEEAKKLKKISNQAEFIASFYNNDLIKINGELYRVIGVNNDLLNRIEVNMIDITYREYLENMNDKRPPRIIKTIASKTQSIKKYSTDILGNLYEVKSKKHPQIIKKG
N579から突然変異されてSaCas9ニッカーゼを生じ得る上記残基A579は下線で示され太字である。

例示的なSaKKH Cas9配列
KRNYILGLDIGITSVGYGIIDYETRDVIDAGVRLFKEANVENNEGRRSKRGARRLKRRRRHRIQRVKKLLFDYNLLTDHSELSGINPYEARVKGLSQKLSEEEFSAALLHLAKRRGVHNVNEVEEDTGNELSTKEQISRNSKALEEKYVAELQLERLKKDGEVRGSINRFKTSDYVKEAKQLLKVQKAYHQLDQSFIDTYIDLLETRRTYYEGPGEGSPFGWKDIKEWYEMLMGHCTYFPEELRSVKYAYNADLYNALNDLNNLVITRDENEKLEYYEKFQIIENVFKQKKKPTLKQIAKEILVNEEDIKGYRVTSTGKPEFTNLKVYHDIKDITARKEIIENAELLDQIAKILTIYQSSEDIQEELTNLNSELTQEEIEQISNLKGYTGTHNLSLKAINLILDELWHTNDNQIAIFNRLKLVPKKVDLSQQKEIPTTLVDDFILSPVVKRSFIQSIKVINAIIKKYGLPNDIIIELAREKNSKDAQKMINEMQKRNRQTNERIEEIIRTTGKENAKYLIEKIKLHDMQEGKCLYSLEAIPLEDLLNNPFNYEVDHIIPRSVSFDNSFNNKVLVKQEEASKKGNRTPFQYLSSSDSKISYETFKKHILNLAKGKGRISKTKKEYLLEERDINRFSVQKDFINRNLVDTRYATRGLMNLLRSYFRVNNLDVKVKSINGGFTSFLRRKWKFKKERNKGYKHHAEDALIIANADFIFKEWKKLDKAKKVMENQMFEEKQAESMPEIETEQEYKEIFITPHQIKHIKDFKDYKYSHRVDKKPNRKLINDTLYSTRKDDKGNTLIVNNLNGLYDKDNDKLKKLINKSPEKLLMYHHDPQTYQKLKLIMEQYGDEKNPLYKYYEETGNYLTKYSKKDNGPVIKKIKYYGNKLNAHLDITDDYPNSRNKVVKLSLKPYRFDVYLDNGVYKFVTVKNLDVIKKENYYEVNSKCYEEAKKLKKISNQAEFIASFYKNDLIKINGELYRVIGVNNDLLNRIEVNMIDITYREYLENMNDKRPPHIIKTIASKTQSIKKYSTDILGNLYEVKSKKHPQIIKKG.

N579から突然変異されてSaCas9ニッカーゼを生じ得る上記残基A579は、下線で示され太字である。E781、N967、およびR1014から突然変異されてSaKKH Cas9を生じ得る上記残基K781、K967、およびH1014は、下線で示され斜字である。

いくつかの実施形態では、napDNAbpは循環置換体である。以下の配列において、プレーンテキストはアデノシンデアミナーゼ配列を示し、太字配列はCas9由来の配列を示し、斜字配列はリンカー配列を示し、下線配列は二部分核局在化配列を示す。
CP5（MSP「NGC」PIDおよび「D10A」ニッカーゼを含む）：

いくつかの実施形態では、核酸プログラム可能DNA結合タンパク質 (napDNAbp) は、微生物CRISPR-Casシステムの単一のエフェクターである。微生物CRISPR-Casシステムの単一エフェクターは、Cas9、Cpf1、Cas12b/C2c1、およびCas12c/C2c3を含むが、これらに限定されない。典型的には、微生物CRISPR-Casシステムはクラス1およびクラス2システムに分けられる。クラス1のシステムはマルチサブユニットエフェクター複合体を持ち、クラス2のシステムは単一のタンパク質エフェクターを持つ。例えば、Cas9とCpf1はクラス2エフェクターである。Cas9およびCpf1に加えて、3つの異なるクラス2 CRISPR-Casシステム(Cas12b/C2c1およびCas12c/C2c3)がShmakov et al., “Discovery and Functional Characterization of Diverse Class 2 CRISPR Cas Systems”, Mol. Cell, 2015 Nov. 5; 60(3): 385-397によって記載されている(その全体の内容は参照により本明細書に組み込まれる) 。2つのシステム、Cas12b/C2c1とCas12c/C2c3のエフェクターはCpf1に関連するRuvC様エンドヌクレアーゼドメインを含む。第三のシステムは、2つの予測されるHEPN RNアーゼドメインを持つエフェクターを含有する。Cas12b/C2c1によるCRISPR RNAの産生とは異なり、成熟CRISPR RNAの産生はtracrRNA非依存性である。Cas12b/C2c1はDNA切断のため、CRISPR RNAとtracrRNAの両方に依存する。

Alicyclobaccillus acidoterrastris Cas12b/C2c1 (AacC2c1) の結晶構造が、キメラ単一分子ガイドRNA (sgRNA) との複合体として報告されている。例えば、Liu et al., “C2c1-sgRNA Complex Structure Reveals RNA-Guided DNA Cleavage Mechanism”, Mol. Cell, 2017 Jan. 19; 65(2):310-322を参照のこと (その内容全体を参照により本明細書に組み込む) 。また、三元複合体として標的DNAに結合したAlicyclobacillus acidoterrestris C2c1においても結晶構造が報告されている。例えば、Yang et al., “PAM-dependent Target DNA Recognition and Cleavage by C2C1 CRISPR-Cas endonuclease”, Cell, 2016 Dec. 15; 167(7):1814-1828を参照のこと（その内容全体が参照により本明細書に組み込まれる）。標的DNA鎖および非標的DNA鎖の両方とともに、AacC2c1の触媒的に適格な（competent）コンホメーションは、単一のRuvC触媒ポケット内に位置するよう独立して捕捉され、Cas12b/C2c1仲介切断は標的DNAのねじれ型の7ヌクレオチドの切断を生じる。Cas 12b/C2c1三元複合体と以前に同定されたCas9およびCpf1対応物の間の構造比較は、 CRISPR‐Cas9システムにより使用される機構の多様性を示す。

いくつかの実施形態では、本明細書で提供される融合タンパク質のいずれかの核酸プログラム可能DNA結合タンパク質 (napDNAbp) は、Cas12b/C2c1またはCas12c/C2c3タンパク質であり得る。いくつかの実施形態では、napDNAbpはCas12b/C2c1タンパク質である。いくつかの実施形態では、napDNAbpはCas12c/C2c3タンパク質である。いくつかの実施形態では、napDNAbpは、天然に存在するCas12b/C2c1またはCas12c/C2c3タンパク質に対して少なくとも85%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも99.5%同一であるアミノ酸配列を含む。いくつかの実施形態では、napDNAbpは、天然に存在するCas12b/C2c1またはCas12c/C2c3タンパク質である。いくつかの実施形態では、napDNAbpは、本明細書に提供されるnapDNAbp配列のいずれか1つに対して少なくとも85%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも99.5%同一であるアミノ酸配列を含む。他の細菌種由来のCas12b/C2c1またはCas12c/C2c3も本開示に従って使用することができることが理解されるべきである。

Cas12b/C2c1 ((uniprot.org/uniprot/T0D7A2#2) sp|T0D7A2|C2C1_ALIAG CRISPR会合エンドヌクレアーゼ C2c1 OS = Alicyclobacillus acido-terrestris (ATCC 49025 / DSM 3922/ CIP 106132 / NCIMB 13137/GD3B株) GN=c2c1 PE=1 SV=1) のアミノ酸配列は以下の通りである：
MAVKSIKVKLRLDDMPEIRAGLWKLHKEVNAGVRYYTEWLSLLRQENLYRRSPNGDGEQECDKTAEECKAELLERLRARQVENGHRGPAGSDDELLQLARQLYELLVPQAIGAKGDAQQIARKFLSPLADKDAVGGLGIAKAGNKPRWVRMREAGEPGWEEEKEKAETRKSADRTADVLRALADFGLKPLMRVYTDSEMSSVEWKPLRKGQAVRTWDRDMFQQAIERMMSWESWNQRVGQEYAKLVEQKNRFEQKNFVGQEHLVHLVNQLQQDMKEASPGLESKEQTAHYVTGRALRGSDKVFEKWGKLAPDAPFDLYDAEIKNVQRRNTRRFGSHDLFAKLAEPEYQALWREDASFLTRYAVYNSILRKLNHAKMFATFTLPDATAHPIWTRFDKLGGNLHQYTFLFNEFGERRHAIRFHKLLKVENGVAREVDDVTVPISMSEQLDNLLPRDPNEPIALYFRDYGAEQHFTGEFGGAKIQCRRDQLAHMHRRRGARDVYLNVSVRVQSQSEARGERRPPYAAVFRLVGDNHRAFVHFDKLSDYLAEHPDDGKLGSEGLLSGLRVMSVDLGLRTSASISVFRVARKDELKPNSKGRVPFFFPIKGNDNLVAVHERSQLLKLPGETESKDLRAIREERQRTLRQLRTQLAYLRLLVRCGSEDVGRRERSWAKLIEQPVDAANHMTPDWREAFENELQKLKSLHGICSDKEWMDAVYESVRRVWRHMGKQVRDWRKDVRSGERPKIRGYAKDVVGGNSIEQIEYLERQYKFLKSWSFFGKVSGQVIRAEKGSRFAITLREHIDHAKEDRLKKLADRIIMEALGYVYALDERGKGKWVAKYPPCQLILLEELSEYQFNNDRPPSENNQLMQWSHRGVFQELINQAQVHDLLVGTMYAAFSSRFDARTGAPGIRCRRVPARCTQEHNPEPFPWWLNKFVVEHTLDACPLRADDLIPTGEGEIFVSPFSAEEGDFHQIHADLNAAQNLQQRLWSDFDISQIRLRCDWGEVDGELVLIPRLTGKRTADSYSNKVFYTNTGVTYYERERGKKRRKVFAQEKLSEEEAELLVEADEAREKSVVLMRDPSGIINRGNWTRQKEFWSMV NQRIEGYLVKQIRSRVPLQDSACENTGDI.

BhCas12b (Bacillus hisashii) NCBI参照配列: WP_095142515
MAPKKKRKVGIHGVPAAATRSFILKIEPNEEVKKGLWKTHEVLNHGIAYYMNILKLIRQEAIYEHHEQDPKNPKKVSKAEIQAELWDFVLKMQKCNSFTHEVDKDEVFNILRELYEELVPSSVEKKGEANQLSNKFLYPLVDPNSQSGKGTASSGRKPRWYNLKIAGDPSWEEEKKKWEEDKKKDPLAKILGKLAEYGLIPLFIPYTDSNEPIVKEIKWMEKSRNQSVRRLDKDMFIQALERFLSWESWNLKVKEEYEKVEKEYKTLEERIKEDIQALKALEQYEKERQEQLLRDTLNTNEYRLSKRGLRGWREIIQKWLKMDENEPSEKYLEVFKDYQRKHPREAGDYSVYEFLSKKENHFIWRNHPEYPYLYATFCEIDKKKKDAKQQATFTLADPINHPLWVRFEERSGSNLNKYRILTEQLHTEKLKKKLTVQLDRLIYPTESGGWEEKGKVDIVLLPSRQFYNQIFLDIEEKGKHAFTYKDESIKFPLKGTLGGARVQFDRDHLRRYPHKVESGNVGRIYFNMTVNIEPTESPVSKSLKIHRDDFPKVVNFKPKELTEWIKDSKGKKLKSGIESLEIGLRVMSIDLGQRQAAAASIFEVVDQKPDIEGKLFFPIKGTELYAVHRASFNIKLPGETLVKSREVLRKAREDNLKLMNQKLNFLRNVLHFQQFEDITEREKRVTKWISRQENSDVPLVYQDELIQIRELMYKPYKDWVAFLKQLHKRLEVEIGKEVKHWRKSLSDGRKGLYGISLKNIDEIDRTRKFLLRWSLRPTEPGEVRRLEPGQRFAIDQLNHLNALKEDRLKKMANTIIMHALGYCYDVRKKKWQAKNPACQIILFEDLSNYNPYEERSRFENSKLMKWSRREIPRQVALQGEIYGLQVGEVGAQFSSRFHAKTGSPGIRCSVVTKEKLQDNRFFKNLQREGRLTLDKIAVLKEGDLYPDKGGEKFISLSKDRKCVTTHADINAAQNLQKRFWTRTHGFYKVYCKAYQVDGQTVYIPESKDQKQKIIEEFGEGYFILKDGVYEWVNAGKLKIKKGSSKQSSSELVDSDILKDSFDLASELKGEKLMLYRDPSGNVFPSDKWMAAGVFFGKLERILISKLTNQYSISTIEDDSSKQSMKRPAATKKAGQAKKKK

いくつかの実施形態では、Cas12bはBvCas12Bである。いくつかの実施形態では、Cas12bは、以下に提供する例示的なBvCas12bアミノ酸配列において番号付けられるようなアミノ酸置換S893R、K846R、およびE837Gを含む。
BvCas12b (Bacillus種 V3-13) NCBI参照配列: WP_101661451.1
MAIRSIKLKMKTNSGTDSIYLRKALWRTHQLINEGIAYYMNLLTLYRQEAIGDKTKEAYQAELINIIRNQQRNNGSSEEHGSDQEILALLRQLYELIIPSSIGESGDANQLGNKFLYPLVDPNSQSGKGTSNAGRKPRWKRLKEEGNPDWELEKKKDEERKAKDPTVKIFDNLNKYGLLPLFPLFTNIQKDIEWLPLGKRQSVRKWDKDMFIQAIERLLSWESWNRRVADEYKQLKEKTESYYKEHLTGGEEWIEKIRKFEKERNMELEKNAFAPNDGYFITSRQIRGWDRVYEKWSKLPESASPEELWKVVAEQQNKMSEGFGDPKVFSFLANRENRDIWRGHSERIYHIAAYNGLQKKLSRTKEQATFTLPDAIEHPLWIRYESPGGTNLNLFKLEEKQKKNYYVTLSKIIWPSEEKWIEKENIEIPLAPSIQFNRQIKLKQHVKGKQEISFSDYSSRISLDGVLGGSRIQFNRKYIKNHKELLGEGDIGPVFFNLVVDVAPLQETRNGRLQSPIGKALKVISSDFSKVIDYKPKELMDWMNTGSASNSFGVASLLEGMRVMSIDMGQRTSASVSIFEVVKELPKDQEQKLFYSINDTELFAIHKRSFLLNLPGEVVTKNNKQQRQERRKKRQFVRSQIRMLANVLRLETKKTPDERKKAIHKLMEIVQSYDSWTASQKEVWEKELNLLTNMAAFNDEIWKESLVELHHRIEPYVGQIVSKWRKGLSEGRKNLAGISMWNIDELEDTRRLLISWSKRSRTPGEANRIETDEPFGSSLLQHIQNVKDDRLKQMANLIIMTALGFKYDKEEKDRYKRWKETYPACQIILFENLNRYLFNLDRSRRENSRLMKWAHRSIPRTVSMQGEMFGLQVGDVRSEYSSRFHAKTGAPGIRCHALTEEDLKAGSNTLKRLIEDGFINESELAYLKKGDIIPSQGGELFVTLSKRYKKDSDNNELTVIHADINAAQNLQKRFWQQNSEVYRVPCQLARMGEDKLYIPKSQTETIKKYFGKGSFVKNNTEQEVYKWEKSEKMKIKTDTTFDLQDLDGFEDISKTIELAQEQQKKYLTMFRDPSGYFFNNETWRPQKEYWSIVNNIIKSCLKKKILSNKVEL

［ガイドポリヌクレオチド］
一実施形態では、ガイドポリヌクレオチドはガイドRNAである。RNA/Cas複合体は、Casタンパク質を標的DNAに「ガイド」するのを補助することができる。Cas9/crRNA/tracrRNAは、スペーサーに相補的な直鎖または環状dsDNA標的をエンドヌクレアーゼ的に切断する。crRNAに相補的でない標的鎖が最初にエンドヌクレアーゼ的に切断され、次いでエキソヌクレアーゼ的に3’-5’方向にトリムされる。自然界では、典型的には、DNA結合と切断にはタンパク質と両方のRNAが必要とされる。しかし、crRNAおよびtracrRNAの両方の態様を単一のRNA種に組み込むように、シングルガイドRNA (「sgRNA」、または単に「gRNA」)を操作することができる。例えば、Jinek M. et al., Science 337:816-821(2012)を参照のこと（その内容全体が参照により本明細書に組み入れられる）。Cas9は、CRISPR反復配列中の短いモチーフ(PAMまたはプロトスペーサー隣接モチーフ)を認識して、自己と非自己を区別するのを助ける。Cas9ヌクレアーゼの配列および構造は、当業者によく知られている（例えば“Complete genome sequence of an M1 strain of Streptococcus pyogenes.” Ferretti, J.J. et al., Natl. Acad. Sci. U.S.A. 98:4658-4663(2001); “CRISPR RNA maturation by trans-encoded small RNA and host factor RNase III.” Deltcheva E. et al., Nature 471:602-607(2011); および “Programmable dual-RNA-guided DNA endonuclease in adaptive bacterial immunity.” Jinek M.et al, Science 337:816-821(2012)参照。その内容全体が参照により本明細書に組み入れられる）。Cas9オルソログは、限定されるものではないが、S. pyogenes および S. thermophilusを含む多様な種において記述されている。追加の適切なCas9ヌクレアーゼおよび配列は、本開示に基づいて当業者に明らかとなることも可能であり、そのようなCas9ヌクレアーゼおよび配列には、Chylinski, Rhun, and Charpentier, “The tracrRNA and Cas9 families of type II CRISPR-Cas immunity systems” (2013) RNA Biology 10:5, 726-737に開示されている生物および遺伝子座由来のCas9配列が含まれる（その全内容は参照により本明細書に組み込まれる）。いくつかの実施形態では、Cas9ヌクレアーゼは、不活性(例えば不活化) DNA切断ドメインを有し、すなわち、Cas9はニッカーゼである。

いくつかの実施形態では、ガイドポリヌクレオチドは、少なくとも1つのシングルガイドRNA (「sgRNA」または「gRNA」)である。いくつかの実施形態では、ガイドポリヌクレオチドは、少なくとも1つのtracrRNAである。いくつかの実施形態では、ガイドポリヌクレオチドは、ポリヌクレオチドプログラム可能DNA結合ドメイン(例えばCas9またはCpf1)を標的ヌクレオチド配列にガイドするためにPAM配列を必要としない。

本明細書に開示される塩基エディターのポリヌクレオチドプログラム可能ヌクレオチド結合ドメイン(例えばCRISPR由来ドメイン)は、ガイドポリヌクレオチドと会合することによって標的ポリヌクレオチド配列を認識することができる。ガイドポリヌクレオチド(例えばgRNA)は、典型的には一本鎖であり、ポリヌクレオチドの標的配列に部位特異的に(すなわち相補的塩基対形成を介して)結合するようにプログラムすることができ、それによって、ガイド核酸を伴った塩基エディターを標的配列に導く。ガイドポリヌクレオチドはDNAであり得る。ガイドポリヌクレオチドはRNAであり得る。いくつかの実施形態では、ガイドポリヌクレオチドは天然ヌクレオチド(例えばアデノシン)を含む。いくつかの実施形態では、ガイドポリヌクレオチドは、非天然(または不自然)ヌクレオチド(例えばペプチド核酸またはヌクレオチドアナログ)を含む。いくつかの実施形態では、ガイド核酸配列の標的指向化領域は、長さ少なくとも15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、または30ヌクレオチドであり得る。ガイド核酸の標的指向化領域は、長さ10～30ヌクレオチドの間、または長さ15～25ヌクレオチドの間、または長さ15～20ヌクレオチドの間であり得る。

いくつかの実施形態では、ガイドポリヌクレオチドは、例えば相補的塩基対形成を介して互いに相互作用できる、2つ以上の個別のポリヌクレオチドを含む(例えば二重ガイドポリヌクレオチド)。例えば、ガイドポリヌクレオチドは、CRISPR RNA (crRNA) およびトランス活性化CRISPR RNA (tracrRNA) を含むことができる。例えば、ガイドポリヌクレオチドは、1つ以上のトランス活性化CRISPR RNA (tracrRNA) を含むことができる。

II型CRISPRシステムにおいて、CRISPRタンパク質(例えばCas9)による核酸の標的化は、典型的には、標的配列を認識する配列を含む第一のRNA分子 (crRNA) と、ガイドRNA-CRISPRタンパク質複合体を安定化させる足場領域を形成する反復配列を含む第二のRNA分子 (trRNA) との間の相補的塩基対形成を必要とする。このような二重ガイドRNAシステムは、本明細書に開示された塩基エディターを標的ポリヌクレオチド配列に導くためのガイドポリヌクレオチドとして使用され得る。

いくつかの実施形態では、本明細書で提供される塩基エディターは、シングルガイドポリヌクレオチド(例えばgRNA)を利用する。いくつかの実施形態では、本明細書で提供される塩基エディターは、デュアル（二重）ガイドポリヌクレオチド(例えばデュアルgRNA)を利用する。いくつかの実施形態では、本明細書で提供される塩基エディターは、1つ以上のガイドポリヌクレオチド(例えば複数のgRNA)を利用する。いくつかの実施形態では、シングルガイドポリヌクレオチドが、本明細書に記載される異なる塩基エディターのために利用される。例えば、PCT/US19/44935に記載されるように、シングルガイドポリヌクレオチドを、アデノシン塩基エディター、またはアデノシン塩基エディターおよびシチジン塩基エディターのために利用することができる。

他の実施形態では、ガイドポリヌクレオチドは、核酸のポリヌクレオチド標的化部分および核酸の足場部分の両方を単一分子(すなわち単一分子ガイド核酸)中に含むことができる。例えば、単一分子ガイドポリヌクレオチドは、シングルガイドRNA (sgRNAまたはgRNA)であり得る。本明細書において、「ガイドポリヌクレオチド配列」という用語は、塩基エディターと相互作用し標的ポリヌクレオチド配列に塩基エディターを導くことができる任意の単一、二重または複数分子核酸を企図する。

典型的には、ガイドポリヌクレオチド(例えばcrRNA/trRNA複合体またはgRNA)は、標的ポリヌクレオチド配列を認識しそれに結合することができる配列を含む「ポリヌクレオチド標的化セグメント」と、塩基エディターのポリヌクレオチドプログラム可能ヌクレオチド結合ドメイン構成要素内でガイドポリヌクレオチドを安定化させる「タンパク質結合セグメント」とを含む。いくつかの実施形態では、ガイドポリヌクレオチドのポリヌクレオチド標的化セグメントは、DNAポリヌクレオチドを認識してそれに結合し、それによりDNA中の塩基の編集を促進する。他の実施形態では、ガイドポリヌクレオチドのポリヌクレオチド標的化セグメントは、RNAポリヌクレオチドを認識しそれに結合し、それによりRNA中の塩基の編集を促進する。ここで、「セグメント」とは、分子の一部分または領域、例えばガイドポリヌクレオチド中の連続したヌクレオチドのストレッチをいう。また、セグメントは、複合体の領域/セクションも指すことも可能であり、従ってセグメントは1つより多い分子の領域を含むことも可能である。例えば、ガイドポリヌクレオチドが複数の核酸分子を含む場合、タンパク質結合セグメントは、例えば相補性の領域に沿ってハイブリダイズした複数の別個の分子のすべてまたは一部を含むことができる。いくつかの実施形態では、2つの別個の分子を含むDNA標的化RNAのタンパク質結合セグメントは、 (i) 長さ100塩基対である第一のRNA分子の塩基対40～75；および(ii) 長さ50塩基対である第二のRNA分子の10～25塩基対を含み得る。「セグメント」の定義は、特定の文脈において特に定義されない限り、全塩基対のうちの特定の数に限定されず、所定のRNA分子由来の塩基対のいかなる特定の数にも限定されず、複合体内の別個の分子の特定の数に限定されず、任意の全長のRNA分子の領域を含んでもよく、他の分子に対する相補性を有する領域を含んでもよい。

ガイドRNAまたはガイドポリヌクレオチドは、2つ以上のRNA、例えばCRISPR RNA (crRNA) およびトランス活性化crRNA (tracrRNA) を含むことができる。ガイドRNAまたはガイドポリヌクレオチドは、時に、crRNAおよびtracrRNAの一部分(例えば機能的部分) の融合によって形成される単一鎖RNA、またはシングルガイドRNA (sgRNA) を含み得る。ガイドRNAまたはガイドポリヌクレオチドはまた、crRNAおよびtracrRNAを含むデュアルRNAであってもよい。さらに、crRNAは標的DNAとハイブリダイズし得る。

上に論じるように、ガイドRNAまたはガイドポリヌクレオチドは、発現産物であり得る。例えば、ガイドRNAをコードするDNAは、ガイドRNAをコードする配列を含むベクターであり得る。ガイドRNAまたはガイドポリヌクレオチドは、単離されたガイドRNA、またはガイドRNAをコードする配列およびプロモーターを含むプラスミドDNAを細胞にトランスフェクションすることによって、細胞内にトランスファーすることができる。ガイドRNAまたはガイドポリヌクレオチドは、ウイルス仲介遺伝子送達の使用など、他の方法で細胞にトランスファーすることもできる。

ガイドRNAまたはガイドポリヌクレオチドを単離することができる。例えば、ガイドRNAは、単離されたRNAの形態で細胞または生物にトランスフェクションされ得る。ガイドRNAは、当技術分野で公知の任意のin vitro転写システムを用いたin vitro転写によって調製することができる。ガイドRNAは、ガイドRNAをコードする配列を含むプラスミドの形態ではなく、単離されたRNAの形態で細胞にトランスファーされ得る。

ガイドRNAまたはガイドポリヌクレオチドは、以下の3つの領域を含み得る：染色体配列中の標的部位に相補的であり得る5’端での第一の領域、ステムループ構造を形成し得る第二の内部領域、および一本鎖であり得る第三の3’領域。また、各ガイドRNAが融合タンパク質を特異的な標的部位にガイドするように、各ガイドRNAの第一の領域は異なっていてもよい。さらに、各ガイドRNAの第二および第三の領域は、すべてのガイドRNAにおいて同一であり得る。

ガイドRNAまたはガイドポリヌクレオチドの第一の領域は、そのガイドRNAの第一の領域が標的部位と塩基対を形成できるように、染色体配列中の標的部位で配列に相補的であり得る。いくつかの実施形態では、ガイドRNAの第一の領域は、約10ヌクレオチド～25ヌクレオチド(すなわち、10ヌクレオチド～ヌクレオチド;または約10ヌクレオチド～約25ヌクレオチド;または10ヌクレオチド～約25ヌクレオチド;または約10ヌクレオチド～25ヌクレオチド)またはそれより多くを含むことができる。例えば、ガイドRNAの第一の領域と染色体配列中の標的部位との間の塩基対形成の領域は、長さ10、11、12、13、14、15、16、17、18、19、20、22、23、24、25またはそれより多くのヌクレオチドであり得るか、またはおよそその長さであり得る。ときに、ガイドRNAの第一の領域は、長さ19、20、もしくは21ヌクレオチド、または約19、20、もしくは21ヌクレオチドであり得る。

ガイドRNAまたはガイドポリヌクレオチドはまた、二次構造を形成する第二の領域を含むこともできる。例えば、ガイドRNAによって形成される二次構造は、ステム（またはヘアピン）およびループを含むことができる。ループとステムの長さは多様であり得る。例えば、ループの長さは（約）3～10ヌクレオチドの範囲であってもよく、ステムの長さは（約）6～20塩基対の範囲であってもよい。ステムは、1～10または約10ヌクレオチドの1つ以上のバルジを含んでもよい。第二の領域の全長は、長さ（約）16～60ヌクレオチドの範囲であってもよい。例えば、ループは長さ（約）4ヌクレオチドであってもよく、ステムは（約）12塩基対であってもよい。

ガイドRNAまたはガイドポリヌクレオチドは、本質的に一本鎖状態であり得る3'端の第三の領域も含むこともできる。例えば、第三の領域は、関心対象の細胞のいずれの染色体配列とも相補的でないこともあれば、ガイドRNAの残りの部分と相補的でないこともある。さらに第三の領域の長さは多様であり得る。第三の領域は、長さ（約）4ヌクレオチド以上であり得る。例えば、第三の領域の長さは、長さ（約）5～60ヌクレオチドの範囲であり得る。

ガイドRNAまたはガイドポリヌクレオチドは、遺伝子標的の任意のエクソンまたはイントロンを標的とすることができる。いくつかの実施形態では、ガイドは遺伝子のエクソン1または2を標的にすることができ;他の実施形態では、ガイドは遺伝子のエクソン3または4を標的にすることができる。組成物は、すべてが同じエクソンを標的とする複数のガイドRNA、またはいくつかの実施形態では、異なるエクソンを標的とし得る複数のガイドRNAを含むことができる。遺伝子のエクソンとイントロンが標的とされ得る。

ガイドRNAまたはガイドポリヌクレオチドは、（約）20ヌクレオチドの核酸配列を標的とし得る。標的核酸は、（約）20ヌクレオチド未満であり得る。標的核酸は、長さ少なくとも（約）5、10、15、16、17、18、19、20、21、22、23、24、25、30、または1～100ヌクレオチドの間の任意の長さであり得る。標的核酸は、長さ多くとも（約）5、10、15、16、17、18、19、20、21、22、23、24、25、30、40、50ヌクレオチド、または1～100ヌクレオチドの間の任意の長さであり得る。標的核酸配列は、PAMの最初のヌクレオチドのすぐ5’側の（約）20塩基であり得る。ガイドRNAは、核酸配列を標的化し得る。標的核酸は、少なくとも（約）1～10、1～20、1～30、1～40、1～50、1～60、1～70、1～80、1～90、または1～100ヌクレオチドであり得る。

ガイドポリヌクレオチド、例えば、ガイドRNAは、別の核酸、例えば、細胞のゲノム中の標的核酸またはプロトスペーサーにハイブリダイズし得る核酸を指すことができる。ガイドポリヌクレオチドはRNAであり得る。ガイドポリヌクレオチドはDNAであり得る。ガイドポリヌクレオチドは、核酸の配列に部位特異的に結合するようにプログラムまたは設計され得る。ガイドポリヌクレオチドは、１つのポリヌクレオチド鎖を含んでもよく、シングルガイドポリヌクレオチドと呼ばれてもよい。ガイドポリヌクレオチドは、2つのポリヌクレオチド鎖を含んでもよく、ダブルガイドポリヌクレオチドと呼ばれてもよい。ガイドRNAはRNA分子として細胞や胚に導入されてもよい。例えば、RNA分子は、in vitroで転写されてもよく、および/または化学的に合成されてもよい。RNAは、合成DNA分子、例えばgBlocks（登録商標）遺伝子断片から転写されてもよい。次いで、ガイドRNAはRNA分子として細胞や胚に導入され得る。ガイドRNAはまた、非RNA核酸分子、例えばDNA分子の形態で細胞または胚に導入され得る。例えば、ガイドRNAをコードするDNAが、関心対象の細胞または胚におけるガイドRNAの発現のためにプロモーター制御配列に機能可能に連結され得る。RNAコード配列は、RNAポリメラーゼIII (Pol III)によって認識されるプロモーター配列に機能可能に連結され得る。ガイドRNAを発現するために使用することができるプラスミドベクターは、px330ベクターおよびpx333ベクターを含むが、これらに限定されない。いくつかの実施形態では、プラスミドベクター(例えばpx333ベクター)は、少なくとも2つのガイドRNAをコードするDNA配列を含むことができる。

ガイドポリヌクレオチド、例えばガイドRNAおよび標的化配列を選択、設計および検証するための方法は、本明細書中に記載され、当業者に知られている。例えば、核酸塩基エディターシステムにおけるデアミナーゼドメイン(例えばAIDドメイン)の潜在的基質混合性（promiscuity）の影響を最小限にするために、意図せず脱アミノ化の標的となり得る残基(例えば、標的核酸遺伝子座内のssDNA上に潜在的に位置し得るオフターゲットC残基)の数を最小限にすることができる。さらに、ソフトウェアツールを使用して、標的核酸配列に対応するgRNAを最適化することができ、例えば、ゲノム全体の総オフターゲット活性を最小限にすることができる。例えば、S. pyogenes Cas9を用いた標的化ドメイン選択肢の各可能性について、(例えばNAGまたはNGGなどの選択されたPAMに先行する)ある数(例えば1、2、3、4、5、6、7、8、9、または10)までのミスマッチ塩基対を含むすべてのオフターゲット配列をゲノムにわたって同定することができる。標的部位に相補的なgRNAの第一の領域を同定することができ、すべての第一の領域(例えばcrRNA)をその総予測オフターゲットスコアに従ってランク付けすることができ;上位にランクされた標的化ドメインは、最大のオンターゲット活性と最小のオフターゲット活性を持つ可能性が高いものを表す。候補標的化gRNAは、当技術分野で公知の方法および/または本明細書に記載の方法を用いて機能的に評価することができる。

非限定的な例として、Cas9とともに使用するためのガイドRNAのcrRNAにおける標的DNAハイブリダイズ配列は、DNA配列探索アルゴリズムを用いて同定することができる。gRNA設計は、Bae S., Park J., & Kim J.-S. Cas-OFFinder: A fast and versatile algorithm that searches for potential off-target sites of Cas9 RNA-guided endonucleases. Bioinformatics 30, 1473-1475 (2014)に記載されているような公開ツールcas-offinderに基づくカスタムgRNA設計ソフトウェアを用いて実施することができる。このソフトウェアは、ガイドのゲノム全体のオフターゲット傾向を計算した後にガイドにスコアを付ける。典型的には、完全マッチから7個のミスマッチまでの範囲の一致が、17～24の長さの範囲のガイドについて考慮される。いったんオフターゲット部位が計算的に決定されると、各ガイドについて集約スコアが計算され、ウェブインターフェースを使用した表形式の出力に要約される。PAM配列に隣接する潜在的な標的部位を同定することに加えて、ソフトウェアはまた、選択された標的部位から1、2、3ヌクレオチドまたは3ヌクレオチドより多く異なるすべてのPAM隣接配列も同定する。標的核酸配列、例えば標的遺伝子についてのゲノムDNA配列を得て、反復要素を、公的に入手可能なツール、例えば、RepeatMaskerプログラムを用いてスクリーニングすることができる。RepeatMaskerは、入力されたDNA配列から、反復要素や低複雑性領域を探し出す。所定のクエリー配列に存在する反復の詳細な注釈が出力となる。

同定後、ガイドRNA、例えばcrRNAの第一の領域が、標的部位へのそれらの距離、それらの直交性（orthogonality）、および関連するPAM配列との密接な一致のための5’ヌクレオチドの存在(例えば、関連するPAM、例えば、S. pyogenesについてのNGG PAM、S. aureusについてのNNGRRTまたはNNGRRV PAM) を含むヒトゲノムにおける密接な一致の同定に基づく5’G)に基づいて、階層にランク付けされ得る。本明細書において使用される際、直交性とは、標的配列に対して最小数のミスマッチを含む、ヒトゲノムにおける配列の数を表す。「高レベルの直交性」または「優れた直交性」は、例えば、意図される標的以外にヒトゲノムにおいて同一の配列を持たず、標的配列において1つまたは2つのミスマッチを含有する配列も持たない20量体標的化ドメインを指し得る。優れた直交性（orthogonality）を有する標的化ドメインは、オフターゲットDNA切断を最小化するように選択され得る。

いくつかの実施形態では、塩基編集活性を検出すること、および候補ガイドポリヌクレオチドを試験することのためにレポーターシステムが使用され得る。いくつかの実施形態では、レポーターシステムは、塩基編集活性がレポーター遺伝子の発現をもたらす、レポーター遺伝子に基づくアッセイを含むことができる。例えば、レポーターシステムは、不活化開始コドン、例えば、テンプレート鎖上の3'-TAC-5'から3'-CAC-5'への突然変異を含むレポーター遺伝子を含み得る。標的Cの脱アミノ化に成功すると、対応するmRNAは5'-GUG-3'ではなく5'-AUG-3'として転写され、レポーター遺伝子の翻訳を可能にする。適切なレポーター遺伝子は、当業者には明らかであろう。レポーター遺伝子の非限定的な例には、緑色蛍光タンパク質(GFP) 、赤色蛍光タンパク質(RFP) 、ルシフェラーゼ、分泌型アルカリホスファターゼ(SEAP) をコードする遺伝子、または発現が検出可能であり当業者には明らかである任意の他の遺伝子が含まれる。レポーターシステムを用いて、多くの異なるgRNAを試験することができ、例えば、標的DNA配列に関してどの残基（複数可）をそれぞれのデアミナーゼが標的とするかを決定することができる。非テンプレート鎖を標的とするsgRNAもまた、特定の塩基編集タンパク質、例えばCas9デアミナーゼ融合タンパク質のオフターゲット効果を評価するために試験することができる。いくつかの実施形態では、そのようなgRNAは、変異開始コドンがgRNAと塩基対を形成しないように設計することができる。ガイドポリヌクレオチドは、標準リボヌクレオチド、修飾リボヌクレオチド(例えば、プソイドウリジン)、リボヌクレオチド異性体、および/またはリボヌクレオチドアナログを含むことができる。いくつかの実施形態では、ガイドポリヌクレオチドは、少なくとも1つの検出可能な標識を含むことができる。検出可能な標識は、フルオロフォア(例えば、FAM、TMR、Cy3、Cy5、テキサスレッド、オレゴングリーン、Alexa Fluor、Haloタグ、または適切な蛍光色素)、検出タグ(例えば、ビオチン、ジゴキシゲニン等)、量子ドット、または金粒子であり得る。

ガイドポリヌクレオチドは、化学的に合成され得るか、酵素的に合成され得るか、またはそれらの組み合わせであり得る。例えば、ガイドRNAは、ホスホロアミダイトに基づく標準的な固相合成法を用いて合成することができる。あるいは、ガイドRNAをコードするDNAを、ファージRNAポリメラーゼにより認識されるプロモーター制御配列に機能可能に連結することによって、ガイドRNAをin vitroで合成することができる。適切なファージプロモーター配列の例には、T7、T3、SP6プロモーター配列、またはそれらの変型が含まれる。ガイドRNAが2つの別々の分子(例えば、crRNAとtracrRNA)を含む実施形態では、crRNAは化学的に合成することができ、tracrRNAは酵素的に合成することができる。

いくつかの実施形態では、塩基エディターシステムは、複数のガイドポリヌクレオチド、例えばgRNAを含み得る。例えば、gRNAは、塩基エディターシステムに含まれる1つ以上の標的遺伝子座(例えば少なくとも1つのgRNA、少なくとも2つのgRNA、少なくとも5つのgRNA、少なくとも10のgRNA、少なくとも20のgRNA、少なくとも30のgRNA、少なくとも50のgRNA)を標的とすることができる。複数のgRNA配列はタンデムに配置されてもよく、好ましくは直接反復配列によって分離される。

ガイドRNAまたはガイドポリヌクレオチドをコードするDNA配列はまた、ベクターの一部であってもよい。さらに、ベクターは、追加の発現制御配列(例えばエンハンサー配列、Kozak配列、ポリアデニル化配列、転写終結配列など)、選択可能なマーカー配列(例えばGFPまたはピューロマイシンなどの抗生物質耐性遺伝子)、複製起点などを含むことができる。ガイドRNAをコードするDNA分子は直鎖であってもよい。ガイドRNAまたはガイドポリヌクレオチドをコードするDNA分子はまた、環状であってもよい。

いくつかの実施形態では、塩基エディターシステムの1つ以上の構成要素は、DNA配列によってコードされ得る。このようなDNA配列は、発現系、例えば細胞に一緒に、または別々に導入されてもよい。例えば、ポリヌクレオチドプログラム可能ヌクレオチド結合ドメインおよびガイドRNAをコードするDNA配列を細胞に導入することができ、各DNA配列は別個の分子の一部であってもよく(例えばポリヌクレオチドプログラム可能ヌクレオチド結合ドメインのコード配列を含む1つのベクターおよびガイドRNAコード配列を含む第二のベクター)、または両方が同じ分子の一部であることができる(例えばポリヌクレオチドプログラム可能ヌクレオチド結合ドメインおよびガイドRNAの両方のためのコード(および調節)配列を含む1つのベクター)。

ガイドポリヌクレオチドは、新しいまたは増強された特徴を有する核酸を提供するための1つ以上の修飾を含むことができる。ガイドポリヌクレオチドは、核酸アフィニティタグを含むことができる。ガイドポリヌクレオチドは、合成ヌクレオチド、合成ヌクレオチドアナログ、ヌクレオチド誘導体、および/または修飾ヌクレオチドを含むことができる。

いくつかの実施形態では、gRNAまたはガイドポリヌクレオチドは修飾を含むことができる。修飾は、gRNAまたはガイドポリヌクレオチドの任意の位置に施され得る。シングルgRNAまたはガイドポリヌクレオチドに対して複数の修飾を行うことができる。gRNAまたはガイドポリヌクレオチドは、修飾後に品質管理を受けることができる。いくつかの実施形態では、品質管理は、PAGE、HPLC、MS、またはそれらの任意の組み合わせを含むことができる。

gRNAまたはガイドポリヌクレオチドの改変は、置換、挿入、欠失、化学的修飾、物理的修飾、安定化、精製、またはそれらの任意の組み合わせであり得る。

gRNAまたはガイドポリヌクレオチドはまた、5’アデニル酸、5’グアノシン三リン酸キャップ、5’N 7-メチルグアノシン三リン酸キャップ、5’三リン酸キャップ、3’リン酸、3’チオリン酸、5’リン酸、5’チオリン酸、Cis-Synチミジンダイマー、トリマー、C12スペーサー、C3スペーサー、C6スペーサー、dスペーサー、PCスペーサー、rスペーサー、スペーサー18、スペーサー9、3’-3’修飾、5’-5’修飾、塩基脱落、アクリジン、アゾベンゼン、ビオチン、ビオチンBB、ビオチンTEG、コレステリルTEG、デスチオビオチンTEG、DNP TEG、DNP-X、DOTA、dT-ビオチン、二重ビオチン、ソラレンC2、ソラレンC6、TINA、3’DABCYL、ブラックホールクエンチャー1、ブラックホールクエンチャー2、DABCYL SE、dT-DABCYL、IRDye QC-1、QSY-21、QSY-35、QSY-7、QSY-9、カルボキシルリンカー、チオールリンカー、2’-デオキシリボヌクレオシドアナログプリン、2’-デオキシリボヌクレオシドアナログピリミジン、リボヌクレオシドアナログ、2’-O-メチルリボヌクレオシドアナログ、糖修飾アナログ、ウォブル/ユニバーサル塩基、蛍光色素標識、2’-フルオロRNA、2’-O-メチルRNA、メチルホスホネート、ホスホジエステルDNA、ホスホジエステルRNA、ホスホチオエートDNA、ホスホロチオエートRNA、UNA、プソイドウリジン-5’-三リン酸、5’-メチルシジン-5’-三リン酸、またはそれらの任意の組み合わせでも修飾され得る。

いくつかの実施形態では、修飾は永続的である。他の実施形態では、修飾は一過性である。いくつかの実施形態では、gRNAまたはガイドポリヌクレオチドに対して複数の修飾が行われる。gRNAまたはガイドポリヌクレオチドの修飾は、それらのコンホメーション、極性、疎水性、化学反応性、塩基対形成相互作用、またはそれらの組み合わせなどの、ヌクレオチドの物理化学的特性を改変することができる。

PAM配列は、当技術分野で公知の任意のPAM配列であり得る。適切なPAM配列には、以下が含まれるが、これらに限定されない：NGG、NGA、NGC、NGN、NGT、NGCG、NGAG、NGAN、NGNG、NGCN、NGCG、NGTN、NNGRRT、NNNRRT、NNGRR(N)、TTTV、TYCV、TYCV、TATV、NNNNGATT、NNAGAAW、またはNAAAAC。Yはピリミジンであり、Nは任意のヌクレオチド塩基であり、WはAまたはTである。
修飾はホスホロチオエート置換でもあり得る。いくつかの実施形態では、天然のホスホジエステル結合は細胞のヌクレアーゼによって急速に分解されやすく、ホスホロチオエート(PS) 結合置換体を用いたヌクレオチド間連結の修飾は、細胞分解による加水分解に対してより安定であってもよい。修飾は、gRNAまたはガイドポリヌクレオチドの安定性を増大させることができる。修飾はまた、生物学的活性を増強させることもできる。いくつかの実施形態では、ホスホロチオエート強化RNA gRNAは、RNアーゼA、RNアーゼT1、子ウシ血清ヌクレアーゼ、またはそれらの組み合わせを阻害することができる。これらの特性は、in vivoまたはin vitroでヌクレアーゼへの曝露がある可能性が高い適用において、PS-RNA gRNAの使用を可能にし得る。例えば、ホスホロチオエート(PS) 結合をgRNAの5'末端または''末端の最後の3～5ヌクレオチドの間に導入することができ、それはエキソヌクレアーゼ分解を阻害し得る。いくつかの実施形態では、ホスホロチオエート結合をgRNA全体に加えてエンドヌクレアーゼによる攻撃を減らすことができる。

［プロトスペーサー隣接モチーフ］
用語「プロトスペーサー隣接モチーフ (PAM)」またはPAM様モチーフは、CRISPR細菌適応免疫系においてCas9ヌクレアーゼによって標的化されるDNA配列の直後の2～6塩基対DNA配列を指す。いくつかの実施形態では、PAMは5’PAM (すなわちプロトスペーサーの5’端の上流に位置する)であり得る。他の実施形態では、PAMは3’PAM (すなわちプロトスペーサーの5’端の下流に位置する)であり得る。

PAM配列は標的結合に必須であるが、正確な配列はCasタンパク質のタイプに依存する。

本明細書で提供される塩基エディターは、カノニカルまたは非カノニカル・プロトスペーサー隣接モチーフ (PAM) 配列を含むヌクレオチド配列に結合することができるCRISPRタンパク質由来ドメインを含むことができる。PAM部位は、標的ポリヌクレオチド配列に近接するヌクレオチド配列である。本開示のいくつかの態様は、異なるPAM特異性を有するCRISPRタンパク質のすべてまたは一部を含む塩基エディターを提供する。例えば、S. pyogenes由来のCas9 (spCas9) などのCas9タンパク質は、典型的には、特定の核酸領域に結合するためにカノニカルなNGG PAM配列を必要とし、ここで「NGG」中の「N」はアデニン (A) 、チミン(T) 、グアニン (G) 、またはシトシン(C) であり、Gはグアニンである。PAMはCRISPRタンパク質特異的であってもよく、異なるCRISPRタンパク質由来ドメインを含む異なる塩基エディター間で異なってもよい。PAMは標的配列の5’または3’にあり得る。PAMは、標的配列の上流または下流にあり得る。PAMは、長さ1、2、3、4、5、6、7、8、9、10ヌクレオチドまたはそれより長くてもよい。しばしば、PAMは長さ2～6ヌクレオチドである。いくつかのPAMバリアントが下記表1に記載されている。

表1. Cas9タンパク質および対応するPAM配列

いくつかの実施形態では、PAMはNGCである。いくつかの実施形態では、NGC PAMはCas9バリアントによって認識される。いくつかの実施形態では、NGC PAMバリアントには、D1135M、S1136Q、G1218K、E1219F、A1322R、D1332A、R1335E、およびT1337R（集合的に「MQKFRAER」と称される）より選択される1つ以上のアミノ酸置換が含まれる。

いくつかの実施形態では、PAMはNGTである。いくつかの実施形態では、NGT PAMはCas9バリアントによって認識される。いくつかの実施形態では、NGT PAMバリアントは、1335、1337、1135、1136、1218、および/または1219の1つ以上の残基での標的化突然変異を通じて生成される。いくつかの実施形態では、NGT PAMバリアントは、1219、1335、1337、1218の1つ以上の残基での標的化突然変異を通じて生成される。いくつかの実施形態では、NGT PAMバリアントは、1135、1136、1218、1219、および1335の1つ以上の残基での標的化突然変異を通じて生成される。いくつかの実施形態では、NGT PAMバリアントは、下記表2および表3に提供される標的化突然変異のセットから選択される。

表2：残基1219、1335、1337、1218でのNGT PAMバリアント突然変異

表3：残基1135、1136、1218、1219、および1335でのNGT PAMバリアント突然変異

いくつかの実施形態では、NGT PAMバリアントは、表2および3のバリアント5、7、28、31、または36から選択される。いくつかの実施形態では、バリアントは、改善されたNGT PAM認識を有する。

いくつかの実施形態では、NGT PAMバリアントは、残基1219、1335、1337および/または1218で突然変異を有する。いくつかの実施形態では、NGT PAMバリアントは、下記表4に提供されるバリアントから、認識を改善するための突然変異を伴って選択される。

表4：残基1219、1335、1337、および1218でのNGT PAMバリアント突然変異

いくつかの実施形態では、NGT PAMに対する特異性を持つ塩基エディターを、下記表5Aに提供するように生成してもよい。

表5A NGT PAMバリアント

いくつかの実施形態では、NGTNバリアントはバリアント1である。いくつかの実施形態では、NGTNバリアントはバリアント2である。いくつかの実施形態では、NGTNバリアントはバリアント3である。いくつかの実施形態では、NGTNバリアントはバリアント4である。いくつかの実施形態では、NGTNバリアントはバリアント5である。いくつかの実施形態では、NGTNバリアントはバリアント6である。

いくつかの実施形態では、Cas9ドメインは、Streptococcus pyogenes由来のCas9ドメインである(SpCas9)。いくつかの実施形態では、SpCas9ドメインは、ヌクレアーゼ活性SpCas9、ヌクレアーゼ不活性SpCas9 (SpCas9d) 、またはSpCas9ニッカーゼ (SpCas9n) である。いくつかの実施形態では、SpCas9は、D10X突然変異、または本明細書に提供されるアミノ酸配列のいずれかにおける対応する突然変異を含み、ここでXはD以外の任意のアミノ酸である。いくつかの実施形態では、SpCas9は、D10A突然変異、または本明細書に提供されるアミノ酸配列のいずれかにおける対応する突然変異を含む。いくつかの実施形態では、SpCas9ドメイン、SpCas9dドメインまたはSpCas9nドメインは、非カノニカルPAMを有する核酸配列に結合することができる。いくつかの実施形態では、SpCas9ドメイン、SpCas9dドメインまたはSpCas9nドメインは、NGG、NGAまたはNGCG PAM配列を有する核酸配列に結合することができる。いくつかの実施形態では、SpCas9ドメインは、D1135X、R1335X、およびT1337X突然変異の1つ以上、または本明細書に提供されるアミノ酸配列のいずれかにおける対応する突然変異を含み、ここでXは任意のアミノ酸である。いくつかの実施形態では、SpCas9ドメインは、D1135E、R1335Q、およびT1337R突然変異の1つ以上、または本明細書に提供されるアミノ酸配列のいずれかにおける対応する突然変異を含む。いくつかの実施形態では、SpCas9ドメインは、D1135E、R1335Q、およびT1337R突然変異、または本明細書に提供されるアミノ配列のいずれかにおける対応する突然変異を含む。いくつかの実施形態では、SpCas9ドメインは、D1135X、R1335X、およびT1337X突然変異の1つ以上、または本明細書において提供されるアミノ酸配列のいずれかにおける対応する突然変異を含み、ここでXは任意のアミノ酸である。いくつかの実施形態では、SpCas9ドメインは、D1135V、R1335Q、およびT1337R突然変異の1つ以上、または本明細書に提供されるアミノ酸配列のいずれかにおける対応する突然変異を含む。いくつかの実施形態では、SpCas9ドメインは、D1135V、R1335Q、およびT1337R突然変異、または本明細書に提供されるアミノ酸配列のいずれかにおける対応する突然変異を含む。いくつかの実施形態では、SpCas9ドメインは、D1135X、G1218X、R1335X、およびT1337X突然変異の1つ以上、または本明細書に提供されるアミノ酸配列のいずれかにおける対応する突然変異を含み、ここでXは任意のアミノ酸である。いくつかの実施形態では、SpCas9ドメインは、D1135V、G1218R、R1335Q、およびT1337R突然変異の1つ以上、または本明細書に提供されるアミノ配列のいずれかにおける対応する突然変異を含む。いくつかの実施形態では、SpCas9ドメインは、D1135V、G1218R、R1335Q、およびT1337R突然変異、または本明細書において提供されるアミノ酸配列のいずれかにおける対応する突然変異を含む。

いくつかの実施形態では、Cas9は改変PAM配列に対する特異性を有するCas9バリアントである。いくつかの実施形態では、追加のCas9バリアントおよびPAM配列は、Miller et al., Continuous evolution of SpCas9 variants compatible with non-G PAMs. Nat Biotechnol (2020). https://doi.org/10.1038/s41587-020-0412-8に記載され、その全内容は参照により本明細書に組み込まれる。いくつかの実施形態では、Cas9バリアントは特定のPAM要件を持たない。いくつかの実施形態では、Cas9バリアント、例えばSpCas9バリアントは、NRNH PAMに対する特異性を有し、RはAまたはGであり、HはA、C、またはTである。いくつかの実施形態では、SpCas9バリアントは、PAM配列AAA、TAA、CAA、GAA、TAT、GAT、またはCACに対する特異性を有する。いくつかの実施形態では、SpCas9バリアントは、配列番号1において番号付けられるように、1114、1134、1135、1137、1139、1151、1180、1188、1211、1218、1219、1221、1249、1256、1264、1290、1318、1317、1320、1321、1323、1332、1333、1335、1337、または1339位、あるいはその対応する位でアミノ酸置換を含む。いくつかの実施形態では、SpCas9バリアントは、配列番号1において番号付けられるように、1114、1135、1218、1219、1221、1249、1320、1321、1323、1332、1333、1335、または1337位、あるいはその対応する位でアミノ酸置換を含む。いくつかの実施形態では、SpCas9バリアントは、配列番号1において番号付けられるように、1114、1134、1135、1137、1139、1151、1180、1188、1211、1219、1221、1256、1264、1290、1318、1317、1320、1323、1332、1333位、あるいはその対応する位でアミノ酸置換を含む。いくつかの実施形態では、SpCas9バリアントは、配列番号1において番号付けられるように、1114、1131、1135、1150、1156、1180、1191、1218、1219、1221、1227、1249、1253、1286、1293、1320、1321、1332、1335、1339位、あるいはその対応する位でアミノ酸置換を含む。いくつかの実施形態では、SpCas9バリアントは、配列番号1において番号付けられるように、1114、1127、1135、1180、1207、1219、1234、1286、1301、1332、1335、1337、1338、1349位、あるいはその対応する位でアミノ酸置換を含む。SpCas9バリアントの例示的なアミノ酸置換およびPAM特異性を、以下の表5B、5C、5D、および5Eに示す。

表5B

表5C

表5D

表5E

いくつかの実施形態では、本明細書に提供される融合タンパク質のいずれかのCas9ドメインは、本明細書に記載されるCas9ポリペプチドに対して少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも99.5%同一であるアミノ酸配列を含む。いくつかの実施形態では、本明細書に提供される融合タンパク質のいずれかのCas9ドメインは、本明細書に記載される任意のCas9ポリペプチドのアミノ酸配列を含む。いくつかの実施形態では、本明細書に提供される融合タンパク質のいずれかのCas9ドメインは、本明細書に記載される任意のCas9ポリペプチドのアミノ酸配列からなる。

いくつかの例では、本明細書に開示される塩基エディターのCRISPRタンパク質由来ドメインによって認識されるPAMは、塩基エディターをコードする挿入物 (例えばAAV挿入物)とは別個のオリゴヌクレオチド上で細胞に提供され得る。そのような実施形態では、別個のオリゴヌクレオチド上にPAMを提供することは、そうでなければ標的配列と同じポリヌクレオチド上に隣接するPAMが存在しないために切断することができない標的配列の切断を可能にする。

一実施形態では、S. pyogenes Cas9 (SpCas9) を、ゲノム工学のためのCRISPRエンドヌクレアーゼとして使用することができる。しかし、他のものも使用され得る。いくつかの実施形態では、異なるエンドヌクレアーゼを用いて特定のゲノム標的を標的化することができる。いくつかの実施形態では、非NGG PAM配列を有する合成SpCas9由来バリアントを使用することができる。さらに、多様な種由来の他のCas9オルソログが同定されており、これらの「非SpCas9」は、本開示でも有用になり得る多様なPAM配列に結合し得る。例えば、比較的大きなサイズのSpCas9（約4kbのコード配列）は、細胞内で効率的に発現することができないSpCas9 cDNA所持プラスミドを導くこともあり得る。逆に、Staphylococcus aureus Cas9 (SaCas9) のコード配列は、SpCas9よりも約1キロ塩基短いため、細胞内で効率的に発現させ得る。SpCas9と同様に、SaCas9エンドヌクレアーゼは、in vitroの哺乳動物細胞およびin vivoのマウスにおいて標的遺伝子を改変する能力がある。いくつかの実施形態では、Casタンパク質は異なるPAM配列を標的とすることができる。いくつかの実施形態では、標的遺伝子は、例えば、Cas9 PAM、5’-NGGに隣接し得る。他の実施形態では、他のCas9オルソログは異なるPAM要件を有し得る。例えば、S. thermophilus（CRISPR1の場合は5’-NNAGAA、CRISPR3の場合は5’-NGGNG）およびNeisseria meningiditis（5’-NNNNGATT）のもののような他のPAMも標的遺伝子に隣接して見出され得る。

いくつかの実施形態では、S. pyogenesシステムについて、標的遺伝子配列は、5’-NGG PAMの前(すなわち、その5’側)にあることも可能であり、20 ntガイドRNA配列が、反対側の鎖と塩基対を形成して、PAMに隣接するCas9切断を仲介することができる。いくつかの実施形態では、隣接切断は、PAMの（約）3塩基対上流であり得る。いくつかの実施形態では、隣接切断は、PAMの（約）10塩基対上流であり得る。いくつかの実施形態では、隣接切断は、PAMの（約）0～20塩基対上流であり得る。例えば、隣接切断は、PAM上流の1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、または30塩基対の隣であり得る。隣接切断はPAMの1～30塩基対下流でもあり得る。PAM配列に結合することができる例示的なSpCas9タンパク質の配列は、以下の通りである:

例示的なPAM結合SpCas9のアミノ酸配列は以下の通りである：
MDKKYSIGLDIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD

例示的なPAM結合SpCas9nのアミノ酸配列は以下の通りである：
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD

例示的なPAM結合SpEQR Cas9のアミノ酸配列は以下の通りである：
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESVLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFESPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKQYRSTKEVLDATLIHQSITGLYETRIDLSQLGGD
上記配列において、D1134、R1335およびT1336から突然変異されてSpEQR Cas9を生じることができる残基E1134、Q1334およびR1336を下線と太字で示す。

例示的なPAM結合SpVQR Cas9のアミノ酸配列は以下の通りである：
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFVSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKQYRSTKEVLDATLIHQSITGLYETRIDLSQLGGD
上記配列において、D1134、R1335、およびT1336から突然変異されてSpVQR Cas9を生じることができる残基V1134、Q1334、およびR1336を下線と太字で示す。

例示的なPAM結合SpVRER Cas9のアミノ酸配列は以下の通りである：
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFVSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASARELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKEYRSTKEVLDATLIHQSITGLYETRIDLSQLGGD.
上記配列において、D1134、G1217、R1335、およびT1336から突然変異されてSpVRER Cas9を生じることができる残基V1134、R1217、Q1334およびR1336を下線と太字で示す。

いくつかの実施形態では、操作SpCas9バリアントは、3' H（非G PAM）が隣接するプロトスペーサー隣接モチーフ（PAM）配列を認識可能である（図8A～8Eを参照のこと）。いくつかの実施形態では、SpCas9バリアントはNRNH PAMを認識する（RはAまたはGであり、HはA、CまたはTである）。いくつかの実施形態では、非G PAMはNRRH、NRTH、またはNRCHである。これらのバリアントは、例えば、その全体が参照により本明細書に組み込まれる、Miller S.M., et al. Continuous evolution of SpCas9 variants compatible with non-G PAMs. Nat Biotechnol. (2020)（//doi.org/10.1038/s41587-020-0412-8）に記載されるように、ファージ補助非連続進化（PANCE）を通じて進化させた。

いくつかの実施形態では、Cas9ドメインは、組換えCas9ドメインである。いくつかの実施形態では、組換えCas9ドメインは、SpyMacCas9ドメインである。いくつかの実施形態では、SpyMacCas9ドメインは、ヌクレアーゼ活性SpyMacCas9、ヌクレアーゼ不活性SpyMacCas9 (SpyMacCas9d) 、またはSpyMacCas9ニッカーゼ (SpyMacCas9n) である。いくつかの実施形態では、SaCas9ドメイン、SaCas9dドメイン、またはSaCas9nドメインは、非カノニカルPAMを有する核酸配列に結合することができる。いくつかの実施形態では、SpyMacCas9ドメイン、SpCas9dドメイン、またはSpCas9nドメインは、NAA PAM配列を有する核酸配列に結合することができる。

天然5'-NAAN-3' PAM特異性を有するStreptococcus macacae中のSpy Cas9の例示的なCas9Aホモログの配列は、当技術分野に知られ、例えばJakimo et al., (www.biorxiv.org/content/biorxiv/early/2018/09/27/429654.full.pdf)に記載され、以下に提供される。

SpyMacCas9
MDKKYSIGLDIGTNSVGWAVITDDYKVPSKKFKVLGNTDRHSIKKNLIGALLFGSGETAE
ATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFG
NIVDEVAYHEKYPTIYHLRKKLADSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSD
VDKLFIQLVQIYNQLFEENPINASRVDAKAILSARLSKSRRLENLIAQLPGEKRNGLFGN
LIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAI
LLSDILRVNSEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYA
GYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELH
AILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEE
VVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFL
SGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGAYHDLLKI
IKDKDFLDNEENEDILEDIVLTLTLFEDRGMIEERLKTYAHLFDDKVMKQLKRRRYTGWG
RLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGHSL
HEQIANLAGSPAIKKGILQTVKIVDELVKVMGHKPENIVIEMARENQTTQKGQKNSRERM
KRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHI
VPQSFIKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLT
KAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSK
LVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKM
IAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFA
TVRKVLSMPQVNIVKKTEIQTVGQNGGLFDDNPKSPLEVTPSKLVPLKKELNPKKYGGYQ
KPTTAYPVLLITDTKQLIPISVMNKKQFEQNPVKFLRDRGYQQVGKNDFIKLPKYTLVDI
GDGIKRLWASSKEIHKGNQLVVSKKSQILLYHAHHLDSDLSNDYLQNHNQQFDVLFNEII
SFSKKCKLGKEHIQKIENVYSNKKNSASIEELAESFIKLLGFTQLGATSPFNFLGVKLNQ
KQYKGKKDYILPCTEGTLIRQSITGLYETRVDLSKIGED.

いくつかの実施形態には、バリアントCas9タンパク質はH840A、P475A、W476A、N477A、D1125A、W1126A、およびD1218A 突然変異を宿し、その結果、標的DNAまたはRNAを切断する能力が低下している。このようなCas9タンパク質は、標的DNA (例えば一本鎖標的DNA)を切断する能力は低下しているが、標的DNA (例えば一本鎖標的DNA)に結合する能力は保持している。別の非限定的な例として、いくつかの実施形態では、バリアントCas9タンパク質は、D10A、H840A、P475A、W476A、N477A、D1125A、W1126A、およびD1218A 突然変異を宿し、その結果、ポリペプチドは、標的DNAを切断する能力が低下している。そのようなCas9タンパク質は、標的DNA(例えば一本鎖標的DNA)を切断する能力は低下しているが、標的DNA(例えば一本鎖標的DNA)に結合する能力を保持している。いくつかの実施形態では、バリアントCas9タンパク質がW476AおよびW1126A突然変異を有する場合、またはバリアントCas9タンパク質がP475A、W476A、N477A、D1125A、W1126A、およびD1218A 突然変異を有する場合、バリアントCas9タンパク質はPAM配列に効率的に結合しない。従って、このような場合には、このようなバリアントCas9タンパク質を結合の方法に用いると、この方法はPAM配列を必要としない。換言すれば、いくつかの実施形態では、このようなバリアントCas9タンパク質を結合の方法に用いる場合、この方法はガイドRNAを含んでもよいが、この方法は、PAM配列の非存在下で行うことができる(従って、結合の特異性はガイドRNAの標的化セグメントによってもたらされる)。上記の効果を達成するために、他の残基が突然変異され得る(すなわち一方または他方のヌクレアーゼ部分を不活化する)。非限定的な例として、残基D10、G12、G17、E762、H840、N854、N863、H982、H983、A984、D986、および/またはA987を改変(すなわち置換)することができる。また、アラニン置換以外の突然変異も適切である。

いくつかの実施形態では、塩基エディターのCRISPRタンパク質由来ドメインは、カノニカルPAM配列 (NGG) を有するCas9タンパク質のすべてまたは一部を含み得る。他の実施形態では、塩基エディターのCas9由来ドメインは、非カノニカルPAM配列を用いることができる。そのような配列は当技術分野で記述されており当業者には明らかであろう。例えば、非カノニカルPAM配列に結合するCas9ドメインは、Kleinstiver, B. P., et al., “Engineered CRISPR-Cas9 nucleases with altered PAM specificities” Nature, 523, 481-485 (2015); および Kleinstiver, B. P., et al., “Broadening the targeting range of Staphylococcus aureus CRISPR-Cas9 by modifying PAM recognition” Nature Biotechnology, 33, 1293-1298 (2015)に記述されており、それぞれの全内容は参照により本明細書に組み込まれる。

［PAM排他性が低減されたCas9ドメイン］
典型的には、S. pyogenes由来のCas9 (spCas9) などのCas9タンパク質は、特定の核酸領域に結合するためにカノニカルなNGG PAM配列を必要とし、ここで「NGG」中の「N」はアデノシン(A) 、チミジン(T) またはシトシン(C) であり、Gはグアノシンである。これは、ゲノム内の所望の塩基を編集する能力を制限し得る。いくつかの実施形態では、本明細書に提供される塩基編集融合タンパク質は、正確な位置、例えばPAMの上流にある標的塩基を含む領域に配置することが必要になり得る。例えばKomor, A.C., et al., “Programmable editing of a target base in genomic DNA without double-stranded DNA cleavage” Nature 533, 420-424 (2016)を参照のこと（これらの内容全体は、参照により本明細書に組み込まれる）。従って、いくつかの実施形態では、本明細書で提供される融合タンパク質のいずれかは、カノニカルな（例えばNGG）PAM配列を含まないヌクレオチド配列に結合することができるCas9ドメインを含み得る。非カノニカルPAM配列に結合するCas9ドメインは本技術分野において記述されており当業者には明らかであろう。例えば、非カノニカルPAM配列に結合するCas9ドメインは、Kleinstiver, B. P., et al., “Engineered CRISPR-Cas9 nucleases with altered PAM specificities” Nature 523, 481-485 (2015); およびKleinstiver, B. P., et al., “Broadening the targeting range of Staphylococcus aureus CRISPR-Cas9 by modifying PAM recognition” Nature Biotechnology 33, 1293-1298 (2015)に記述されており、それぞれの全内容を参照により本明細書に組み込む。

［高忠実度Cas9ドメイン］
本開示のいくつかの態様は、高忠実度Cas9ドメインを提供する。いくつかの実施形態では、高忠実度Cas9ドメインは、対応する野生型Cas9ドメインと比較して、Cas9ドメインとDNAの糖-リン酸主鎖との間の静電相互作用を減少させる1つ以上の突然変異を含む操作されたCas9ドメインである。特定の理論によって束縛されることは望ましくないが、DNAの糖-リン酸主鎖との静電相互作用を減少させた高忠実度Cas9ドメインは、より少ないオフターゲット効果を有し得る。いくつかの実施形態では、Cas9ドメイン(例えば、野生型Cas9ドメイン)は、Cas9ドメインとDNAの糖-リン酸主鎖との間の会合を減少させる1つ以上の突然変異を含む。いくつかの実施形態では、Cas9ドメインは、Cas9ドメインとDNAの糖-リン酸主鎖との間の会合を少なくとも1%、少なくとも2%、少なくとも3%、少なくとも4%、少なくとも5%、少なくとも10%、少なくとも15%、少なくとも20%、少なくとも25%、少なくとも30%、少なくとも35%、少なくとも40%、少なくとも45%、少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、または少なくとも70%減少させる１つ以上の突然変異を含む。

いくつかの実施形態では、本明細書で提供されるCas9融合タンパク質のいずれかは、N497X、R661X、Q695X、および/またはQ926X突然変異の1つ以上、または本明細書で提供されるアミノ酸配列のいずれかにおける対応する突然変異を含み、ここでXは任意のアミノ酸である。いくつかの実施形態では、本明細書で提供されるCas9融合タンパク質のいずれかは、N497A、R661A、Q695A、および/またはQ926A突然変異の1つ以上、または本明細書で提供されるアミノ酸配列のいずれかにおける対応する突然変異を含む。いくつかの実施形態では、Cas9ドメインは、D10A突然変異、または本明細書に提供されるアミノ酸配列のいずれかにおける対応する突然変異を含む。高い忠実度を有するCas9ドメインは当技術分野で公知であり、当業者には明らかであろう。例えば、高い忠実度を有するCas9ドメインは、Kleinstiver, B.P., et al. “High-fidelity CRISPR-Cas9 nucleases with no detectable genome-wide off-target effects.” Nature 529, 490-495 (2016); およびSlaymaker, I.M., et al. “Rationally engineered Cas9 nucleases with improved specificity.” Science 351, 84-88 (2015)に記述されており、それぞれの全内容は参照により本明細書に組み入れられる。

いくつかの実施形態では、改変Cas9は、高忠実度Cas9酵素である。いくつかの実施形態では、高忠実度Cas9酵素は、SpCas9(K855A)、eSpCas9(1.1)、SpCas9-HF1、または高精度Cas9バリアント(HypaCas9)である。改変Cas9 eSpCas9(1.1)は、HNH/RuvCグルーブと非標的DNA鎖との間の相互作用を弱めるアラニン置換を含み、オフターゲット部位での鎖分離と切断を防止する。同様に、SpCas9-HF1は、DNAリン酸主鎖とのCas9の相互作用を破壊するアラニン置換を介して、オフターゲット編集を低下させる。HypaCas9は、Cas9の校正と標的識別を増加させる突然変異をREC3ドメインに含む(SpCas9 N692A/M694A/Q695A/H698A)。3つの高忠実度酵素はすべて、野生型Cas9よりもオフターゲット編集が少ない。

例示的な高忠実度Cas9を以下に示す。Cas9に対する高忠実度Cas9ドメイン突然変異を太字および下線で示している。
DKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTAFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGALSRKLINGIRDKQSGKTILDFLKSDGFANRNFMALIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRAITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD

［核局在化配列 (NLS) を含む融合タンパク質］
いくつかの実施形態では、本明細書で提供される融合タンパク質は、１つ以上 (例えば2つ、3つ、4つ、5つ) の核標的化配列、例えば、核局在化配列(NLS) をさらに含む。一実施形態では、二部分NLSが使用される。いくつかの実施形態では、NLSは、NLSを含むタンパク質の細胞核内への移入(例えば核輸送によるもの)を促進するアミノ酸配列を含む。いくつかの実施形態では、本明細書に提供される融合タンパク質のいずれかは、核局在化配列(NLS) をさらに含む。いくつかの実施形態では、NLSは融合タンパク質のN末端に融合される。いくつかの実施形態では、NLSは融合タンパク質のC末端に融合される。いくつかの実施形態では、NLSはCas9ドメインのN末端に融合される。いくつかの実施形態では、NLSはnCas9ドメインまたはdCas9ドメインのC末端に融合される。いくつかの実施形態では、NLSはデアミナーゼのN末端に融合される。いくつかの実施形態では、NLSはデアミナーゼのC末端に融合される。いくつかの実施形態では、NLSは、1つ以上のリンカーを介して融合タンパク質に融合される。いくつかの実施形態では、NLSは、リンカーなしで融合タンパク質に融合される。いくつかの実施形態では、NLSは、本明細書において提供または参照されるNLS配列のいずれか1つのアミノ酸配列を含む。追加の核局在化配列は当技術分野で公知であり、当業者には明らかであろう。例えば、NLS配列は、Plank et al., PCT/EP2000/011690に記載されており、その内容は、例示的な核局在化配列の開示について参照により本明細書に組み込まれる。いくつかの実施形態では、NLSは、アミノ酸配列PKKKRKVEGADKRTADGSEFESPKKKRKV、KRTADGSEFESPKKKRKV、KRPAATKKAGQAKKKK、KKTELQTTNAENKTKKL、KRGINDRNFWRGENGRKTR、RKSGKIAAIVVKRPRKPKKKRKV、またはMDSLLMNRRKFLYQFKNVRWAKGRRETYLCを含む。

いくつかの実施形態では、NLSはリンカー中に存在するか、またはNLSにはリンカー、例えば本明細書に記載されるリンカーが隣接する。いくつかの実施形態では、N末端またはC末端NLSは、二部分NLSである。二部分NLSは、比較的短いスペーサー配列によって分離される2つの塩基性アミノ酸クラスターを含む（それゆえにbipartite、二部分と呼ばれ、一部分（monopartite）NLSとは異なる）。ヌクレオプラスミンのNLSであるKR[PAATKKAGQA]KKKKは遍在性の二部分シグナルのプロトタイプであり、塩基性アミノ酸の2つのクラスターが約10アミノ酸のスペーサーによって隔てられたものである。例示的な二部分NLSの配列は、PKKKRKVEGADKRTADGSEFESPKKKRKVである。

いくつかの実施形態では、本発明の融合タンパク質は、リンカー配列を含まない。いくつかの実施形態では、1つ以上のドメインまたはタンパク質の間にリンカー配列が存在する。

本開示の融合タンパク質は、1つ以上の追加の特徴を含み得ることが理解されるべきである。例えば、いくつかの実施形態では、融合タンパク質は、阻害因子、細胞質局在化配列、核外輸送配列などの輸送配列、または他の局在化配列、ならびに融合タンパク質の可溶化、精製、または検出に有用な配列タグを含むことができる。本明細書において提供される適切なタンパク質タグには、限定されるものではないが、ビオチンカルボキシラーゼキャリアータンパク質(BCCP) タグ、myc-タグ、カルモジュリンタグ、FLAG-タグ、赤血球凝集素(HA) -タグ、ポリヒスチジンタグ（ヒスチジンタグまたはHis-タグとも呼ばれる）、マルトース結合タンパク質(MBP) -タグ、nus-タグ、グルタチオン-S-トランスフェラーゼ(GST) -タグ、緑色蛍光タンパク質 (GFP) -タグ、チオレドキシンタグ、S-タグ、Softag(例えばSoftag1、Softag3)、Strep-タグ、ビオチンリガーゼタグ、FLAsHタグ、V5タグ、およびSBP-タグが含まれる。追加の適切な配列は、当業者には明らかであろう。いくつかの実施形態では、融合タンパク質は、1つ以上のHisタグを含む。

1つ以上の核局在化配列 (NLS) を含むCRISPR酵素をコードするベクターを使用することができる。例えば、約1、2、3、4、5、6、7、8、9、10のNLSを使用することができる。CRISPR酵素は、アミノ末端またはその近傍のNLS、カルボキシ末端またはその近傍の約1、2、3、4、5、6、7、8、9、10またはそれ以上のNLS、あるいはこれらの任意の組み合わせ(例えばアミノ末端での1つ以上のNLSおよびカルボキシ末端での1つ以上のNLS)を含むことができる。複数のNLSが存在する場合、各NLSは他から独立して選択することができ、従って1つのNLSが複数のコピーで存在することができ、および/または1つ以上のコピーで存在する1つ以上の他のNLSと組み合わせて存在することができる。

方法において使用されるCRISPR酵素は、約6個のNLSを含むことができる。NLSに最も近いアミノ酸がN-またはC末端からポリペプチド鎖に沿って約50アミノ酸内（例えば1、2、3、4、5、10、15、20、25、30、40、または50アミノ酸内）にあるとき、そのNLSはN-またはC末端の近傍にあると考えられる。

［核酸塩基編集ドメイン］
ポリヌクレオチドプログラム可能ヌクレオチド結合ドメインおよび核酸塩基編集ドメイン(例えばデアミナーゼドメイン)を含む融合タンパク質を含む塩基エディターを本明細書に記載する。塩基エディターは、標的配列を認識することができるガイドポリヌクレオチドと相互作用することによって、標的ポリヌクレオチド配列中の1つ以上の塩基を編集するようにプログラムすることができる。標的配列がいったん認識されると、編集が行われるポリヌクレオチド上に塩基エディターが固定され、次いで、塩基エディターのデアミナーゼドメイン構成要素が標的塩基を編集することができる。
いくつかの実施形態では、核酸塩基編集ドメインは、デアミナーゼドメインを含む。本明細書で特に説明されているように、デアミナーゼドメインは、アデノシンデアミナーゼを含む。いくつかの実施形態では、「アデニンデアミナーゼ」および「アデノシンデアミナーゼ」という用語は、交換可能に使用され得る。核酸塩基編集タンパク質の詳細は、国際PCT出願番号PCT/2017/045381 (WO2018/027078) およびPCT/US2016/058344 (WO2017/070632) に記載されており、これらの各々は、その全体が参照により本明細書に組み込まれる。Komor, A.C., et al., “Programmable editing of a target base in genomic DNA without double-stranded DNA cleavage” Nature 533, 420-424 (2016); Gaudelli, N.M., et al., “Programmable base editing of A・T to G・C in genomic DNA without DNA cleavage” Nature 551, 464-471 (2017); およびKomor, A.C., et al., “Improved base excision repair inhibition and bacteriophage Mu Gam protein yields C:G-to-T:A base editors with higher efficiency and product purity” Science Advances 3:eaao4774 (2017)も参照のこと（その全内容が参照により本明細書に組み込まれる）。

［AからGへの編集］
いくつかの実施形態では、本明細書に記載される塩基エディターは、アデノシンデアミナーゼを含むデアミナーゼドメインを含むことができる。塩基エディターのこのようなアデノシンデアミナーゼドメインは、Aを脱アミノ化して、Gの塩基対形成特性を示すイノシン (I) を形成することによって、アデニン (A) 核酸塩基からグアニン (G) 核酸塩基への編集を促進することができる。アデノシンデアミナーゼは、デオキシリボ核酸 (DNA) 中のデオキシアデノシン残基のアデニンを脱アミノ化すること(すなわちアミン基を除去すること)ができる。

いくつかの実施形態では、本明細書において提供される核酸塩基エディターは、1つ以上のタンパク質ドメインを融合させ、それによって融合タンパク質を生成することによって作製することができる。特定の実施形態では、本明細書において提供される融合タンパク質は、融合タンパク質の塩基編集活性(例えば効率、選択性、特異性)を改善する1つ以上の特徴を含む。例えば、本明細書中に提供される融合タンパク質は、ヌクレアーゼ活性が低下したCas9ドメインを含むことができる。いくつかの実施形態では、本明細書で提供される融合タンパク質は、ヌクレアーゼ活性を持たないCas9ドメイン (dCas9) 、または、Cas9ニッカーゼ (nCas9) と呼ばれる、二本鎖DNA分子の一鎖を切断するCas9ドメインを有することができる。いかなる特定の理論にも拘束されることも望まないが、触媒残基(例えばH840)の存在が、標的Aと反対のTを含有する非編集（例えば非脱アミノ化）鎖を切断するCas9の活性を維持する。Cas9の触媒残基の突然変異(例えばD10からA10)は、標的A残基を含有する編集鎖の切断を妨げる。このようなCas9バリアントは、gRNAによって定義される標的配列に基づく特定の位置で一本鎖DNA切断 (ニック) を生じさせることができ、非編集鎖の修復を導き、最終的には非編集鎖上でTからCへの変化をもたらす。いくつかの実施形態では、AからGへの塩基エディターは、イノシン塩基除去修復の阻害因子、例えば、ウラシルグリコシラーゼ阻害因子 (UGI) ドメインまたは触媒的に不活性なイノシン特異的ヌクレアーゼをさらに含む。いかなる特定の理論にも束縛されることを望まないが、UGIドメインまたは触媒的に不活性なイノシン特異的ヌクレアーゼは、脱アミノ化されたアデノシン残基(例えばイノシン)の塩基除去修復を阻害または防止することができ、これが、塩基エディターの活性または効率を改善させることができる。

アデノシンデアミナーゼを含む塩基エディターは、DNA、RNAおよびDNA-RNAハイブリッドを含む任意のポリヌクレオチドに作用することができる。特定の実施形態では、アデノシンデアミナーゼを含む塩基エディターは、RNAを含むポリヌクレオチドの標的Aを脱アミノ化することができる。例えば、塩基エディターは、RNAポリヌクレオチドおよび/またはDNA-RNAハイブリッドポリヌクレオチドの標的Aを脱アミノ化することができるアデノシンデアミナーゼドメインを含むことができる。一実施形態では、塩基エディターに組み込まれたアデノシンデアミナーゼは、RNAに作用するアデノシンデアミナーゼ(ADAR、例えばADAR1またはADAR2)のすべてまたは一部を含む。別の実施形態では、塩基エディターに組み込まれたアデノシンデアミナーゼは、tRNAに作用するアデノシンデアミナーゼ(ADAT)のすべてまたは一部を含む。アデノシンデアミナーゼドメインを含む塩基エディターはまた、DNAポリヌクレオチドのA核酸塩基を脱アミノ化する能力も有し得る。一実施形態では、塩基エディターのアデノシンデアミナーゼドメインは、1つ以上の突然変異を含むADATのすべてまたは一部を含み、これがDNA中の標的AをADATが脱アミノ化することを可能にする。例えば、塩基エディターは、突然変異D108N、A106V、D147Y、E155V、L84F、H123Y、I157F、または別のアデノシンデアミナーゼにおける対応する突然変異の1つ以上を含むEscherichia coli由来のADAT (EcTadA)のすべてまたは一部を含むことができる。

アデノシンデアミナーゼは、任意の適切な生物（例えば大腸菌）に由来することができる。いくつかの実施形態では、アデニンデアミナーゼは、天然に存在するアデノシンデアミナーゼであって、本明細書に提供される突然変異(例えば、ecTadAにおける突然変異)のいずれかに対応する1つ以上の突然変異を含むものである。任意の相同タンパク質中の対応する残基は、例えば、配列アラインメントおよび相同残基の決定によって同定することができる。本明細書中に記載された突然変異のいずれか(例えば、ecTadAで同定された突然変異のいずれか)に対応する、任意の天然存在アデノシンデアミナーゼ(例えば、ecTadAに対して相同性を有するもの)における突然変異を、それに応じて生成することができる。

［アデノシンデアミナーゼ］
いくつかの実施形態では、本明細書記載の塩基エディターは、アデノシンデアミナーゼを含むデアミナーゼドメインを含んでもよい。塩基エディターのこうしたアデノシンデアミナーゼドメインは、Aを脱アミノ化して、Gの塩基対形成特性を示すイノシン（I）を形成することによって、アデニン（A）核酸塩基のグアニン（G）核酸塩基への編集を容易にし得る。アデノシンデアミナーゼは、デオキシリボ核酸（DNA）中のデオキシアデノシン残基のアデニンを脱アミノ化する（すなわちアミン基を除去する）ことが可能である。

いくつかの実施形態では、本明細書に提供されるアデノシンデアミナーゼは、アデニンを脱アミノ化することができる。いくつかの実施形態では、本明細書で提供されるアデノシンデアミナーゼは、DNAのデオキシアデノシン残基中のアデニンを脱アミノ化することができる。いくつかの実施形態では、アデニンデアミナーゼは、本明細書に提供される突然変異のいずれか（例えばecTadAにおける突然変異）に対応する1つ以上の突然変異を含む、天然存在アデノシンデアミナーゼである。当業者は、例えば配列アラインメントおよび相同残基の決定によって、任意の相同タンパク質中の対応する残基を同定することができる。従って、当業者は、任意の天然存在アデノシンデアミナーゼ（例えばecTadAに対する相同性を有するもの）において、本明細書に記載された突然変異のいずれか（例えば、ecTadAにおいて同定される突然変異のいずれか）に対応する突然変異を生成することができる。いくつかの実施形態では、アデノシンデアミナーゼは原核生物由来である。いくつかの実施形態では、アデノシンデアミナーゼは、細菌由来である。いくつかの実施形態では、アデノシンデアミナーゼは、Escherichia coli、Staphylococcus aureus、Salmonella typhi、Shewanella putrefaciens、Haemophilus influenzae、Caulobacter crescentus、またはBacillus subtilisに由来する。いくつかの実施形態では、アデノシンデアミナーゼは、大腸菌由来である。

本発明は、効率（>50～60%）および特異性が増加したアデノシンデアミナーゼバリアントを提供する。特に、本明細書記載のアデノシンデアミナーゼバリアントは、ポリヌクレオチド内の所望の塩基を編集する可能性がより高く、改変されることが意図されない塩基（すなわち「バイスタンダー」）を編集する可能性がより低い。

特定の実施形態では、TadAは、その全体が参照により本明細書に組み込まれる、PCT/US2017/045381(WO 2018/027078)に記載されるTadAのいずれか1つである。

いくつかの実施形態では、本発明の核酸塩基エディターは、以下の配列中に改変を含むアデノシンデアミナーゼバリアントである：
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPRQVFNAQKKAQSSTD
（TadA*7.10とも称される）。

特定の実施形態では、融合タンパク質は、単一の（例えばモノマーとして提供される）TadA*8バリアントを含む。いくつかの実施形態では、TadA*8は、Cas9ニッカーゼに連結される。いくつかの実施形態では、本発明の融合タンパク質は、TadA*8バリアントに連結された野生型TadA(TadA(wt))のヘテロダイマーとして構成される。他の実施形態では、本発明の融合タンパク質は、TadA*8バリアントに連結されたTadA*7.10のヘテロダイマーとして構成される。いくつかの実施形態では、塩基エディターは、TadA*8バリアントモノマーを含むABE8である。いくつかの実施形態では、塩基エディターは、TadA*8バリアントおよびTadA(wt)のヘテロダイマーを含むABE8である。いくつかの実施形態では、塩基エディターは、TadA*8バリアントおよびTadA*7.10のヘテロダイマーを含むABE8である。いくつかの実施形態では、塩基エディターは、TadA*8バリアントのヘテロダイマーを含むABE8である。いくつかの実施形態では、TadA*8バリアントは表7より選択される。いくつかの実施形態では、ABEは表7より選択される。適切な配列は以下の通りである：

野生型TadA（TadA(wt)）または「TadA参照配列」
MSEVEFSHEYWMRHALTLAKRAWDEREVPVGAVLVHNNRVIGEGWNRPIGRHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTLEPCVMCAGAMIHSRIGRVVFGARDAKTGAAGSLMDVLHHPGMNHRVEITEGILADECAALLSDFFRMRRQEIKAQKKAQSSTD （配列番号２）

TadA*7.10:
MSEVEFSHEYW MRHALTLAKR ARDEREVPVG AVLVLNNRVI GEGWNRAIGL HDPTAHAEIM ALRQGGLVMQ NYRLIDATLY VTFEPCVMCA GAMIHSRIGR VVFGVRNAKT GAAGSLMDVL HYPGMNHRVE ITEGILADEC AALLCYFFRM PRQVFNAQKK AQSSTD

いくつかの実施形態では、アデノシンデアミナーゼは、本明細書に提供されるアデノシンデアミナーゼのいずれかに記載のアミノ酸配列のいずれか1つに対して少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも99.5%同一であるアミノ酸配列を含む。本明細書において提供されるアデノシンデアミナーゼは、1つ以上の突然変異(例えば、本明細書に提供される突然変異のいずれか)を含み得ることが理解されるべきである。本開示は、特定のパーセント同一性を有する任意のデアミナーゼドメインに、本明細書に記載される突然変異のいずれかまたはその組み合わせが加わったものを提供する。いくつかの実施形態では、アデノシンデアミナーゼは、参照配列または本明細書に提供されるアデノシンデアミナーゼのいずれかと比較して1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、21、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、またはそれより多くの突然変異を有するアミノ酸配列を含む。いくつかの実施形態では、アデノシンデアミナーゼは、当技術分野において公知であるかまたは本明細書に記載されたアミノ酸配列のいずれか1つと比較して、少なくとも5、少なくとも10、少なくとも15、少なくとも20、少なくとも25、少なくとも30、少なくとも35、少なくとも40、少なくとも45、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90、少なくとも100、少なくとも110、少なくとも120、少なくとも130、少なくとも140、少なくとも150、少なくとも160、または少なくとも170の同一の連続するアミノ酸残基を有するアミノ酸配列を含む。

いくつかの実施形態では、TadAデアミナーゼは全長E. coli TadAデアミナーゼである。例えば、特定の実施形態では、アデノシンデアミナーゼはアミノ酸配列：
MRRAFITGVFFLSEVEFSHEYWMRHALTLAKRAWDEREVPVGAVLVHNNRVIGEGWNRPIGRHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTLEPCVMCAGAMIHSRIGRVVFGARDAKTGAAGSLMDVLHHPGMNHRVEITEGILADECAALLSDFFRMRRQEIKAQKKAQSSTD
を含む。

しかし、本出願において有用な追加のアデノシンデアミナーゼが当業者に明らかであり、これらが本開示の範囲内にあることを認識しなければならない。例えば、アデノシンデアミナーゼは、tRNAに対して作用するアデノシンデアミナーゼホモログ（ADAT）であってもよい。限定なしに、例示的なAD ATホモログのアミノ酸配列には以下が含まれる：

Staphylococcus aureus TadA:
MGSHMTNDIYFMTLAIEEAKKAAQLGEVPIGAIITKDDEVIARAHNLRETLQQPTAHAEHIAIERAAKVLGSWRLEGCTLYVTLEPCVMCAGTIVMSRIPRVVYGADDPKGGCSGS LMNLLQQSNFNHRAIVDKGVLKEACSTLLTTFFKNLRANKKSTN

Bacillus subtilis TadA:
MTQDELYMKEAIKEAKKAEEKGEVPIGAVLVINGEIIARAHNLRETEQRSIAHAEMLVIDEACKALGTWRLEGATLYVTLEPCPMCAGAVVLSRVEKVVFGAFDPKGGCSGTLMNLLQEERFNHQAEVVSGVLEEECGGMLSAFFRELRKKKKAARKNLSE

Salmonella typhimurium (S. typhimurium) TadA:
MPPAFITGVTSLSDVELDHEYWMRHALTLAKRAWDEREVPVGAVLVHNHRVIGEGWNRPIGRHDPTAHAEIMALRQGGLVLQNYRLLDTTLYVTLEPCVMCAGAMVHSRIGRVVFGARDAKTGAAGSLIDVLHHPGMNHRVEIIEGVLRDECATLLSDFFRMRRQEIKALKKADRAEGAGPAV

Shewanella putrefaciens (S. putrefaciens) TadA:
MDEYWMQVAMQMAEKAEAAGEVPVGAVLVKDGQQIATGYNLSISQHDPTAHAEILCLRSAGKKLENYRLLDATLYITLEPCAMCAGAMVHSRIARVVYGARDEKTGAAGTVVNLLQHPAFNHQVEVTSGVLAEACSAQLSRFFKRRRDEKKALKLAQRAQQGIE

Haemophilus influenzae F3031 (H. influenzae) TadA:
MDAAKVRSEFDEKMMRYALELADKAEALGEIPVGAVLVDDARNIIGEGWNLSIVQSDPTΑΗAEIIALRNGAKNIQNYRLLNSTLYVTLEPCTMCAGAILHSRIKRLVFGASDYKTGAIGSRFHFFDDYKMNHTLEITSGVLAEECSQKLSTFFQKRREEKKIEKALLKSLSDK

Caulobacter crescentus (C. crescentus) TadA:
MRTDESEDQDHRMMRLALDAARAAAEAGETPVGAVILDPSTGEVIATAGNGPIAAHDPTAHAEIAAMRAAAAKLGNYRLTDLTLVVTLEPCAMCAGAISHARIGRVVFGADDPKGGAVVHGPKFFAQPTCHWRPEVTGGVLADESADLLRGFFRARRKAKI

Geobacter sulfurreducens (G. sulfrreducens) TadA:
MSSLKKTPIRDDAYWMGKAIREAAKAAARDEVPIGAVIVRDGAVIGRGHNLREGSNDPSAHAEMIAIRQAARRSANWRLTGATLYVTLEPCLMCMGAIILARLERVVFGCYDPKGGAAGSLYDLSADPRLNHQVRLSPGVCQEECGTMLSDFFRDLRRRKKAKATPALF IDERKVPPEP

E. coli TadA (ec TadA）の実施形態には、以下が含まれる：
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPRQVFNAQKKAQSSTD

いくつかの実施形態では、アデノシンデアミナーゼは、原核生物由来である。いくつかの実施形態では、アデノシンデアミナーゼは、細菌由来である。いくつかの実施形態では、アデノシンデアミナーゼは、Escherichia coli、Staphylococcus aureus、Salmonella typhi、Shewanella putrefaciens、Haemophilus influenzae、Caulobacter crescentus、またはBacillus subtilisに由来する。いくつかの実施形態では、アデノシンデアミナーゼは、大腸菌由来である。

一実施形態では、本発明の融合タンパク質は、TadA7.10に連結された野生型TadAがCas9ニッカーゼに連結されたものを含む。特定の実施形態では、融合タンパク質は、単一のTadA7.10ドメイン(例えば、モノマーとして提供される)を含む。他の実施形態では、ABE7.10エディターは、TadA7.10およびTadA(wt) を含み、これらはヘテロダイマーを形成することができる。

いくつかの実施形態では、アデノシンデアミナーゼは、本明細書に提供されるアデノシンデアミナーゼのいずれかに記載のアミノ酸配列のいずれかに対して少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも99.5%同一であるアミノ酸配列を含む。本明細書において提供されるアデノシンデアミナーゼは、1つ以上の突然変異(例えば、本明細書に提供される突然変異のいずれか)を含み得ることが理解されるべきである。本開示は、特定のパーセント同一性を有する任意のデアミナーゼドメインに、本明細書に記載される突然変異のいずれかまたはその組み合わせが加わったものを提供する。いくつかの実施形態では、アデノシンデアミナーゼは、参照配列または本明細書に提供されるアデノシンデアミナーゼのいずれかと比較して1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、21、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、またはそれより多くの突然変異を有するアミノ酸配列を含む。いくつかの実施形態では、アデノシンデアミナーゼは、当技術分野において公知であるかまたは本明細書に記載されたアミノ酸配列のいずれか1つと比較して、少なくとも5、少なくとも10、少なくとも15、少なくとも20、少なくとも25、少なくとも30、少なくとも35、少なくとも40、少なくとも45、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90、少なくとも100、少なくとも110、少なくとも120、少なくとも130、少なくとも140、少なくとも150、少なくとも160、または少なくとも170の同一の連続するアミノ酸残基を有するアミノ酸配列を含む。

本明細書に提供される突然変異（例えばTadA参照配列に基づくもの）のいずれもが、E. coli TadA（ecTadA）、S. aureus TadA（saTadA）、または他のアデノシンデアミナーゼ（例えば細菌アデノシンデアミナーゼ）などの他のアデノシンデアミナーゼに導入され得ることが理解されるべきである。追加のデアミナーゼを同様にアラインメントして、本明細書中に提供されるように突然変異させ得る相同的アミノ酸残基を同定できることは、当業者には明らかであろう。従って、TadA参照配列において同定された突然変異のいずれも、相同なアミノ酸残基を有する他のアデノシンデアミナーゼ（例えばecTada）において作製することができる。また、本明細書中に提供される突然変異のいずれも、TadA参照配列または別のアデノシンデアミナーゼにおいて、個々にまたは任意の組み合わせで作製できることが理解されるべきである。

いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるD108X突然変異、または別のアデノシンデアミナーゼ(例えばecTadA)における対応する突然変異を含み、Xは、野生型アデノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸を示す。いくつかの実施形態では、アデノシンデアミナーゼは、D108G、D108N、D108V、D108A、またはD108Y突然変異、あるいは別のアデノシンデアミナーゼにおける対応する突然変異を含む。

いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるA106X突然変異、または別のアデノシンデアミナーゼ（例えばecTadA）における対応する突然変異を含み、Xは、野生型アデノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸を示す。いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるA106V突然変異、または別のアデノシンデアミナーゼ（例えば野生型TadAまたはecTadA）における対応する突然変異を含む。

いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるE155X突然変異、または別のアデノシンデアミナーゼ（例えばecTadA）における対応する突然変異を含み、Xの存在は、野生型アデノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸を示す。いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるE155D、E155G、またはE155V突然変異、あるいは別のアデノシンデアミナーゼ（例えばecTadA）における対応する突然変異を含む。

いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるD147X突然変異、または別のアデノシンデアミナーゼ（例えばecTadA）における対応する突然変異を含み、Xの存在は、野生型アデノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸を示す。いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるD147Y突然変異、または別のアデノシンデアミナーゼ（例えばecTadA）における対応する突然変異を含む。

いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるA106X、E155X、またはD147X突然変異、あるいは別のアデノシンデアミナーゼ（例えばecTadA）における対応する突然変異を含み、Xは、野生型アデノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸を示す。いくつかの実施形態では、アデノシンデアミナーゼは、E155D、E155G、またはE155V突然変異を含む。いくつかの実施形態では、アデノシンデアミナーゼは、D147Yを含む。

例えば、アデノシンデアミナーゼは、TadA参照配列におけるD108N、A106V、E155V、および/またはD147Y突然変異、あるいは別のアデノシンデアミナーゼ（例えばecTadA）における対応する突然変異を含有してもよい。いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列における以下の突然変異群（突然変異の群は「；」によって分離されている）、または別のアデノシンデアミナーゼ（例えばecTadA）における対応する突然変異を含む：D108NおよびA106V；D108NおよびE155V；D108NおよびD147Y；A106VおよびE155V；A106VおよびD147Y；E155VおよびD147Y；D108N、A106V、およびE155V；D108N、A106V、およびD147Y；D108N、E155V、およびD147Y；A106V、E155V、およびD 147Y；ならびにD108N、A106V、E155V、およびD147Y。しかし、ここで提供される対応する突然変異の任意の組み合わせを、アデノシンデアミナーゼ（例えばecTadA）において作製することができることを理解されたい。

いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるH8X、T17X、L18X、W23X、L34X、W45X、R51X、A56X、E59X、E85X、M94X、I95X、V102X、F104X、A106X、R107X、D108X、K110X、M118X、N127X、A138X、F149X、M151X、R153X、Q154X、I156X、および/またはK157X突然変異のうちの1つ以上、あるいは別のアデノシンデアミナーゼ（例えばecTadA）における1つ以上の対応する突然変異を含み、Xの存在は、野生型アデノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸を示す。いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるH8Y、T17S、L18E、W23L、L34S、W45L、R51H、A56E、もしくはA56S、E59G、E85K、もしくはE85G、M94L、1951、V102A、F104L、A106V、R107C、もしくはR107H、もしくはR107P、D108G、もしくはD108N、もしくはD108V、もしくはD108A、もしくはD108Y、K110I、M118K、N127S、A138V、F149Y、M151V、R153C、Q154L、I156D、および/またはK157R突然変異のうちの1つ以上、あるいは別のアデノシンデアミナーゼ（例えばecTadA）における1つ以上の対応する突然変異を含む。

いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるH8X、D108X、および/またはN127X突然変異のうちの1つ以上、あるいは別のアデノシンデアミナーゼ（例えばecTadA）における1つ以上の対応する突然変異を含み、Xは任意のアミノ酸の存在を示す。いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるH8Y、D108N、および/またはN127S突然変異の1つ以上、あるいは別のアデノシンデアミナーゼ（例えばecTadA）における1つ以上の対応する突然変異を含む。

いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるH8X、R26X、M61X、L68X、M70X、A106X、D108X、A109X、N127X、D147X、R152X、Q154X、E155X、K161X、Q163X、および/またはT166X突然変異の1つ以上、あるいは別のアデノシンデアミナーゼ（例えばecTadA）における1つ以上の対応する突然変異を含み、Xは、野生型アデノシンデアミナーゼにおける対応するアミノ酸以外のいずれかのアミノ酸の存在を示す。いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるH8Y、R26W、M61I、L68Q、M70V、A106T、D108N、A109T、N127S、D147Y、R152C、Q154HもしくはQ154R、E155GもしくはE155VもしくはE155D、K161Q、Q163H、および/またはT166P突然変異の1つ以上、あるいは別のアデノシンデアミナーゼ（例えばecTadA）における1つ以上の対応する突然変異を含む。

いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるH8X、D108X、N127X、D147X、R152X、およびQ154Xからなる群より選択される1つ、2つ、3つ、4つ、5つ、または6つの突然変異、あるいは別のアデノシンデアミナーゼ（例えばecTadA）における対応する突然変異（複数可）を含み、Xは、野生型アデノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸の存在を示す。いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるH8X、M61X、M70X、D108X、N127X、Q154X、E155X、およびQ163Xからなる群より選択される1つ、2つ、3つ、4つ、5つ、6つ、7つ、または8つの突然変異、あるいは別のアデノシンデアミナーゼ（例えばecTadA）における対応する突然変異（複数可）を含み、Xは、野生型アデノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸の存在を示す。いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるH8X、D108X、N127X、E155X、およびT166Xからなる群より選択される1つ、2つ、3つ、4つ、または5つの突然変異、あるいは別のアデノシンデアミナーゼ（例えばecTadA）における対応する突然変異（複数可）を含み、Xは、野生型アデノシンデアミナーゼにおける対応するアミノ酸以外のいずれかのアミノ酸の存在を示す。

いくつかの実施形態では、アデノシンデアミナーゼは、H8X、A106X、D108Xからなる群から選択される1つ、2つ、3つ、4つ、5つ、または6つの突然変異、あるいは別のアデノシンデアミナーゼにおける突然変異（複数可）を含み、Xは、野生型アデノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸の存在を示す。いくつかの実施形態では、アデノシンデアミナーゼは、H8X、R26X、L68X、D108X、N127X、D147X、およびE155Xからなる群より選択される1つ、2つ、3つ、4つ、5つ、6つ、7つ、または8つの突然変異、あるいは別のアデノシンデアミナーゼにおける対応する突然変異（複数可）を含み、Xは、野生型アデノシンデアミナーゼにおける対応するアミノ酸以外のいずれかのアミノ酸の存在を示す。いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるH8X、D108X、A109X、N127X、およびE155Xからなる群より選択される1つ、2つ、3つ、4つ、または5つの突然変異、あるいは別のアデノシンデアミナーゼ（例えばecTadA）における対応する突然変異（複数可）を含み、Xは、野生型アデノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸の存在を示す。

いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるH8Y、D108N、N127S、D147Y、R152C、およびQ154Hからなる群より選択される1つ、2つ、3つ、4つ、5つ、または6つの突然変異、あるいは別のアデノシンデアミナーゼ（例えばecTadA）における対応する突然変異（複数可）を含む。いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるH8Y、M61I、M70V、D108N、N127S、Q154R、E155GおよびQ163Hからなる群より選択される1つ、2つ、3つ、4つ、5つ、6つ、7つまたは8つの突然変異、あるいは別のアデノシンデアミナーゼ（例えばecTadA）における対応する突然変異（複数可）を含む。いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるH8Y、D108N、N127S、E155V、およびT166Pからなる群より選択される1つ、2つ、3つ、4つ、または5つの突然変異、あるいは別のアデノシンデアミナーゼ（例えばecTadA）における対応する突然変異（複数可）を含む。いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるH8Y、A106T、D108N、N127S、E155D、およびK161Qからなる群から選択される1つ、2つ、3つ、4つ、5つ、または6つの突然変異、あるいは別のアデノシンデアミナーゼ（例えばecTadA）における対応する突然変異（複数可）を含む。いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるH8Y、R26W、L68Q、D108N、N127S、D147Y、およびE155Vからなる群より選択される1つ、2つ、3つ、4つ、5つ、6つ、7つ、または8つの突然変異、あるいは別のアデノシンデアミナーゼ（例えばecTadA）における対応する突然変異（複数可）を含む。いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるH8Y、D108N、A109T、N127S、およびE155Gからなる群より選択される1つ、2つ、3つ、4つ、または5つの突然変異、あるいは別のアデノシンデアミナーゼ（例えばecTadA）における対応する突然変異（複数可）を含む。

本明細書に提供される突然変異のいずれか、および任意の追加の突然変異(例えばecTadAアミノ酸配列に基づくもの)を、任意の他のアデノシンデアミナーゼに導入することができる。本明細書に提供される突然変異のいずれも、TadA参照配列または別のアデノシンデアミナーゼ（例えばecTadA）において、個々に、または任意の組み合わせで作製することができる。

AからGへの核酸塩基編集タンパク質の詳細は、国際PCT出願第PCT/2017/045381号(WO 2018/027078）およびGaudelli, N.M., et al., “Programmable base editing of A・T to G・C in genomic DNA without DNA cleavage” Nature, 551, 464-471 (2017)に記載されており、その内容全体が参照により本明細書に組み込まれる。

いくつかの実施形態では、アデノシンデアミナーゼは、別のアデノシンデアミナーゼ（例えばecTadA）において1つ以上の対応する突然変異を含む。いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるD108N、D108G、またはD108V突然変異、あるいは別のアデノシンデアミナーゼ（例えばecTadA）において対応する突然変異を含む。いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるA106VおよびD108N突然変異、または別のアデノシンデアミナーゼ（例えばecTadA）における対応する突然変異を含む。いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるR107CおよびD108N突然変異、または別のアデノシンデアミナーゼ（例えばecTadA）における対応する突然変異を含む。いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるH8Y、D108N、N127S、D147Y、およびQ154H突然変異、または別のアデノシンデアミナーゼ（例えばecTadA）における対応する突然変異を含む。いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるH8Y、D108N、N127S、D147Y、およびE155V突然変異、または別のアデノシンデアミナーゼ（例えばecTadA）における対応する突然変異を含む。いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるD108N、D147Y、およびE155V突然変異、または別のアデノシンデアミナーゼ（例えばecTadA）における対応する突然変異を含む。いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるH8Y、D108N、およびN127S突然変異、または別のアデノシンデアミナーゼ（例えばecTadA）における対応する突然変異を含む。いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるA106V、D108N、D147YおよびE155V突然変異、または別のアデノシンデアミナーゼ（例えばecTadA）における対応する突然変異を含む。

いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるS2X、H8X、I49X、L84X、H123X、N127X、I156Xおよび/またはK160X突然変異の1つ以上、または別のアデノシンデアミナーゼにおける1つ以上の対応する突然変異を含み、Xの存在は、野生型アデノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸を示す。いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるS2A、H8Y、I49F、L84F、H123Y、N127S、I156Fおよび/またはK160S突然変異の1つ以上、または別のアデノシンデアミナーゼ（例えばecTadA）における1つ以上の対応する突然変異を含む。

いくつかの実施形態では、アデノシンデアミナーゼは、L84X突然変異アデノシンデアミナーゼを含み、Xは、野生型アデノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸を示す。いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるL84F突然変異、または別のアデノシンデアミナーゼ（例えばecTadA）における対応する突然変異を含む。

いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるH123X突然変異、または別のアデノシンデアミナーゼ（例えばecTadA）における対応する突然変異を含み、Xは、野生型アデノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸を示す。いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるH123Y突然変異、または別のアデノシンデアミナーゼ（例えばecTadA）における対応する突然変異を含む。

いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるI156X突然変異、または別のアデノシンデアミナーゼ（例えばecTadA）における対応する突然変異を含み、Xは、野生型アデノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸を示す。いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるI156F突然変異、または別のアデノシンデアミナーゼ（例えばecTadA）における対応する突然変異を含む。

いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるL84X、A106X、D108X、H123X、D147X、E155X、およびI156Xからなる群より選択される1つ、2つ、3つ、4つ、5つ、6つ、または7つの突然変異、あるいは別のアデノシンデアミナーゼ（例えばecTadA）における対応する突然変異（複数可）を含み、Xは、野生型アデノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸の存在を示す。いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるS2X、I49X、A106X、D108X、D147X、およびE155Xからなる群より選択される1つ、2つ、3つ、4つ、5つ、または6つの突然変異、あるいは別のアデノシンデアミナーゼ（例えばecTadA）における対応する突然変異（複数可）を含み、Xは、野生型アデノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸の存在を示す。いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるH8X、A106X、D108X、N127X、およびK160Xからなる群より選択される1つ、2つ、3つ、4つ、または5つの突然変異、あるいは別のアデノシンデアミナーゼ（例えばecTadA）における対応する突然変異（複数可）を含み、Xは、野生型アデノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸の存在を示す。

いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるL84F、A106V、D108N、H123Y、D147Y、E155V、およびI156Fからなる群より選択される1つ、2つ、3つ、4つ、5つ、6つ、または7つの突然変異、あるいは別のアデノシンデアミナーゼ（例えばecTadA）における対応する突然変異（複数可）を含む。いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるS2A、I49F、A106V、D108N、D147Y、およびE155Vからなる群より選択される1つ、2つ、3つ、4つ、5つ、または6つの突然変異を含む。

いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるH8Y、A106T、D108N、N127S、およびK160Sからなる群より選択される1つ、2つ、3つ、4つ、または5つの突然変異、あるいは別のアデノシンデアミナーゼ（例えばecTadA）における対応する突然変異（複数可）を含む。

いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるE25X、R26X、R107X、A142X、および/またはA143X突然変異の1つ以上、あるいは別のアデノシンデアミナーゼ（例えばecTadA）における1つ以上の対応する突然変異を含み、Xの存在は、野生型アデノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸を示す。いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるE25M、E25D、E25A、E25R、E25V、E25S、E25Y、R26G、R26N、R26Q、R26C、R26L、R26K、R107P、R107K、R107A、R107N、R107W、R107H、R107S、A142N、A142D、A142G、A143D、A143G、A143E、A143L、A143W、A143M、A143S、A143Q および/または A143R突然変異の1つ以上、または別のアデノシンデアミナーゼ（例えばecTadA）における1つ以上の対応する突然変異を含む。いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列に対応する本明細書に記載の突然変異の1つ以上、あるいは別のアデノシンデアミナーゼ（例えばecTadA）における対応する1つ以上の突然変異を含む。

いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるE25X突然変異、または別のアデノシンデアミナーゼ（例えばecTadA）における対応する突然変異を含み、Xは、野生型アデノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸を示す。いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるE25M、E25D、E25A、E25R、E25V、E25S、またはE25Y突然変異、あるいは別のアデノシンデアミナーゼ（例えばecTadA）における対応する突然変異を含む。

いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるR26X突然変異、または別のアデノシンデアミナーゼ（例えばecTadA）における対応する突然変異を含み、Xは、野生型アデノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸を示す。いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるR26G、R26N、R26Q、R26C、R26L、またはR26K突然変異、あるいは別のアデノシンデアミナーゼ（例えばecTadA）における対応する突然変異を含む。

いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるR107X突然変異、または別のアデノシンデアミナーゼ（例えばecTadA）における対応する突然変異を含み、Xは、野生型アデノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸を示す。いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるR107P、R107K、R107A、R107N、R107W、R107H、またはR107S突然変異、あるいは別のアデノシンデアミナーゼ（例えばecTadA）における対応する突然変異を含む。

いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるA142X突然変異、または別のアデノシンデアミナーゼ（例えばecTadA）における対応する突然変異を含み、Xは、野生型アデノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸を示す。いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるA142N、A142D、A142G突然変異、または別のアデノシンデアミナーゼ（例えばecTadA）における対応する突然変異を含む。

いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるA143X突然変異、または別のアデノシンデアミナーゼ（例えばecTadA）における対応する突然変異を含み、Xは、野生型アデノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸を示す。いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるA143D、A143G、A143E、A143L、A143W、A143M、A143S、A143Qおよび/またはA143Rの突然変異、あるいは別のアデノシンデアミナーゼ（例えばecTadA）における対応する突然変異を含む。

いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるH36X、N37X、P48X、I49X、R51X、M70X、N72X、D77X、E134X、S146X、Q154X、K157X、および/またはK161X突然変異の1つ以上、または別のアデノシンデアミナーゼ（例えばecTadA）における1つ以上の対応する突然変異を含み、Xの存在は、野生型アデノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸を示す。いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるH36L、N37T、N37S、P48T、P48L、I49V、R51H、R51L、M70L、N72S、D77G、E134G、S146R、S146C、Q154H、K157N、および/またはK161T突然変異の1つ以上、あるいは別のアデノシンデアミナーゼ（例えばecTadA）における1つ以上の対応する突然変異を含む。

いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるH36X突然変異、または別のアデノシンデアミナーゼ（例えばecTadA）における対応する突然変異を含み、Xは、野生型アデノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸を示す。いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるH36L突然変異、または別のアデノシンデアミナーゼ（例えばecTadA）における対応する突然変異を含む。

いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるN37X突然変異、または別のアデノシンデアミナーゼ（例えばecTadA）における対応する突然変異を含み、Xは、野生型アデノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸を示す。いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるN37TまたはN37S突然変異、あるいは別のアデノシンデアミナーゼ（例えばecTadA）における対応する突然変異を含む。

いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるP48X突然変異、または別のアデノシンデアミナーゼ（例えばecTadA）における対応する突然変異を含み、Xは、野生型アデノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸を示す。いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるP48TまたはP48L突然変異、あるいは別のアデノシンデアミナーゼ（例えばecTadA）における対応する突然変異を含む。

いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるR51X突然変異、または別のアデノシンデアミナーゼにおける対応する突然変異を含み、Xは、野生型アデノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸を示す。いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるR51HまたはR51L突然変異、あるいは別のアデノシンデアミナーゼ（例えばecTadA）における対応する突然変異を含む。

いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるS146X突然変異、または別のアデノシンデアミナーゼ（例えばecTadA）における対応する突然変異を含み、Xは、野生型アデノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸を示す。いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるS146RまたはS146C突然変異、あるいは別のアデノシンデアミナーゼ（例えばecTadA）における対応する突然変異を含む。

いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるK157X突然変異、あるいは別のアデノシンデアミナーゼ（例えばecTadA）における対応する突然変異を含み、Xは、野生型アデノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸を示す。いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるK157N突然変異、または別のアデノシンデアミナーゼ（例えばecTadA）における対応する突然変異を含む。

いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるP48X突然変異、または別のアデノシンデアミナーゼ（例えばecTadA）における対応する突然変異を含み、Xは、野生型アデノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸を示す。いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるP48S、P48T、またはP48A突然変異、あるいは別のアデノシンデアミナーゼ（例えばecTadA）における対応する突然変異を含む。

いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるA142X突然変異、または別のアデノシンデアミナーゼ（例えばecTadA）における対応する突然変異を含み、Xは、野生型アデノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸を示す。いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるA142N突然変異、または別のアデノシンデアミナーゼ（例えばecTadA）における対応する突然変異を含む。

いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるW23X突然変異、または別のアデノシンデアミナーゼ（例えばecTadA）における対応する突然変異を含み、Xは、野生型アデノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸を示す。いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるW23RまたはW23L突然変異、あるいは別のアデノシンデアミナーゼ（例えばecTadA）における対応する突然変異を含む。

いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるR152X突然変異、または別のアデノシンデアミナーゼ（例えばecTadA）における対応する突然変異を含み、Xは、野生型アデノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸を示す。いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるR152PまたはR52H突然変異、あるいは別のアデノシンデアミナーゼ（例えばecTadA）における対応する突然変異を含む。

一実施形態では、アデノシンデアミナーゼは、突然変異H36L、R51L、L84F、A106V、D108N、H123Y、S146C、D147Y、E155V、I156F、およびK157Nを含むことができる。いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列に対する突然変異の以下の組み合わせを含み、ここで、組み合わせの各突然変異は「_」によって分離され、突然変異の各組み合わせは括弧内にある：
(A106V_D108N),
(R107C_D108N),
(H8Y_D108N_N127S_D147Y_Q154H),
(H8Y_ D108N_N127S_D147Y_E155V),
(D108N_D147Y_E155V),
(H8Y_D108N_N127S),
(H8Y_D108N_N127S_D147Y_Q154H),
(A106V_D108N_D147Y_E155V),
(D108Q_D147Y_E155V),
(D108M_D147Y_E155V),
(D108L_D147Y_E155V),
(D108K_D147Y_E155V),
(D108I_D147Y_E155V),
(D108F_D147Y_E155V),
(A106V_D108N_D147Y),
(A106V_D108M_D147Y_E155V),
(E59A_A106V_D108N_D147Y_E155V),
(E59A cat dead_A106V_D108N_D147Y_E155V),
(L84F_A106V_D108N_H123Y_D147Y_E155V_I156Y),
(L84F_A106V_D108N_H123Y_D147Y_E155V_I156F),
(R26G_L84F_A106V_R107H_D108N_H123Y_A142N_A143D_D147Y_E155V_I156F),
(E25G_R26G_L84F_A106V_R107H_D108N_H123Y_A142N_A143D_D147Y_E155V
_I156F), (E25D_R26G_L84F_A106V_R107K_D108N_H123Y_A142N_A143G_D147Y_E155V_
I156F),
(R26Q_L84F_A106V_D108N_H123Y_A142N_D147Y_E155V_I156F),
(E25M_R26G_L84F_A106V_R107P_D108N_H123Y_A142N_A143D_D147Y_E155V
_I156F),
(R26C_L84F_A106V_R107H_D108N_H123Y_A142N_D147Y_E155V_I156F), (L84F_A106V_D108N_H123Y_A142N_A143L_D147Y_E155V_I156F),
(R26G_L84F_A106V_D108N_H123Y_A142N_D147Y_E155V_I156F),
(E25A_R26G_L84F_A106V_R107N_D108N_H123Y_A142N_A143E_D147Y_E155V
_I156F),
(R26G_L84F_A106V_R107H_D108N_H123Y_A142N_A143D_D147Y_E155V_I156F),
(A106V_D108N_A142N_D147Y_E155V),
(R26G_A106V_D108N_A142N_D147Y_E155V),
(E25D_R26G_A106V_R107K_D108N_A142N_A143G_D147Y_E155V),
(R26G_A106V_D108N_R107H_A142N_A143D_D147Y_E155V),
(E25D_R26G_A106V_D108N_A142N_D147Y_E155V),
(A106V_R107K_D108N_A142N_D147Y_E155V),
(A106V_D108N_A142N_A143G_D147Y_E155V),
(A106V_D108N_A142N_A143L_D147Y_E155V),
(H36L_R51L_L84F_A106V_D108N_H123Y_S146C_D147Y_E155V_I156F _K157N),
(N37T_P48T_M70L_L84F_A106V_D108N_H123Y_D147Y_I49V_E155V_I156F),
(N37S_L84F_A106V_D108N_H123Y_D147Y_E155V_I156F_K161T),
(H36L_L84F_A106V_D108N_H123Y_D147Y_Q154H_E155V_I156F),
(N72S_L84F_A106V_D108N_H123Y_S146R_D147Y_E155V_I156F),
(H36L_P48L_L84F_A106V_D108N_H123Y_E134G_D147Y_E155V_I156F),
(H36L_L84F_A106V_D108N_H123Y_D147Y_E155V_I156F_K157N), (H36L_L84F_A106V_D108N_H123Y_S146C_D147Y_E155V_I156F),
(L84F_A106V_D108N_H123Y_S146R_D147Y_E155V_I156F_K161T),
(N37S_R51H_D77G_L84F_A106V_D108N_H123Y_D147Y_E155V_I156F),
(R51L_L84F_A106V_D108N_H123Y_D147Y_E155V_I156F_K157N),
(D24G_Q71R_L84F_H96L_A106V_D108N_H123Y_D147Y_E155V_I156F_K160E),
(H36L_G67V_L84F_A106V_D108N_H123Y_S146T_D147Y_E155V_I156F),
(Q71L_L84F_A106V_D108N_H123Y_L137M_A143E_D147Y_E155V_I156F),
(E25G_L84F_A106V_D108N_H123Y_D147Y_E155V_I156F_Q159L),
(L84F_A91T_F104I_A106V_D108N_H123Y_D147Y_E155V_I156F),
(N72D_L84F_A106V_D108N_H123Y_G125A_D147Y_E155V_I156F),
(P48S_L84F_S97C_A106V_D108N_H123Y_D147Y_E155V_I156F),
(W23G_L84F_A106V_D108N_H123Y_D147Y_E155V_I156F),
(D24G_P48L_Q71R_L84F_A106V_D108N_H123Y_D147Y_E155V_I156F_Q159L),
(L84F_A106V_D108N_H123Y_A142N_D147Y_E155V_I156F),
(H36L_R51L_L84F_A106V_D108N_H123Y_A142N_S146C_D147Y_E155V_I156F
_K157N), (N37S_L84F_A106V_D108N_H123Y_A142N_D147Y_E155V_I156F_K161T),
(L84F_A106V_D108N_D147Y_E155V_I156F),
(R51L_L84F_A106V_D108N_H123Y_S146C_D147Y_E155V_I156F_K157N_K161T),
(L84F_A106V_D108N_H123Y_S146C_D147Y_E155V_I156F_K161T),
(L84F_A106V_D108N_H123Y_S146C_D147Y_E155V_I156F_K157N_K160E_K161T),
(L84F_A106V_D108N_H123Y_S146C_D147Y_E155V_I156F_K157N_K160E),
(R74Q_L84F_A106V_D108N_H123Y_D147Y_E155V_I156F),
(R74A_L84F_A106V_D108N_H123Y_D147Y_E155V_I156F),
(L84F_A106V_D108N_H123Y_D147Y_E155V_I156F),
(R74Q_L84F_A106V_D108N_H123Y_D147Y_E155V_I156F),
(L84F_R98Q_A106V_D108N_H123Y_D147Y_E155V_I156F),
(L84F_A106V_D108N_H123Y_R129Q_D147Y_E155V_I156F),
(P48S_L84F_A106V_D108N_H123Y_A142N_D147Y_E155V_I156F),
(P48S_A142N),
(P48T_I49V_L84F_A106V_D108N_H123Y_A142N_D147Y_E155V_I156F_L157N),
(P48T_I49V_A142N),
(H36L_P48S_R51L_L84F_A106V_D108N_H123Y_S146C_D147Y_E155V_I156F_K157N),
(H36L_P48S_R51L_L84F_A106V_D108N_H123Y_S146C_A142N_D147Y_E155V_I156F (H36L_P48T_I49V_R51L_L84F_A106V_D108N_H123Y_S146C_D147Y_E155V_I156F _K157N),
(H36L_P48T_I49V_R51L_L84F_A106V_D108N_H123Y_A142N_S146C_D147Y_E155V_ I156F _K157N),
(H36L_P48A_R51L_L84F_A106V_D108N_H123Y_S146C_D147Y_E155V_I156F_K157N),
(H36L_P48A_R51L_L84F_A106V_D108N_H123Y_A142N_S146C_D147Y_E155V_I156F _K157N),
(H36L_P48A_R51L_L84F_A106V_D108N_H123Y_S146C_A142N_D147Y_E155V_I156F _K157N),
(W23L_H36L_P48A_R51L_L84F_A106V_D108N_H123Y_S146C_D147Y_E155V_I156F _K157N),
(W23R_H36L_P48A_R51L_L84F_A106V_D108N_H123Y_S146C_D147Y_E155V_I156F _K157N),
(W23L_H36L_P48A_R51L_L84F_A106V_D108N_H123Y_S146R_D147Y_E155V_I156F _K161T),
(H36L_P48A_R51L_L84F_A106V_D108N_H123Y_S146C_D147Y_R152H_E155V_I156F _K157N),
(H36L_P48A_R51L_L84F_A106V_D108N_H123Y_S146C_D147Y_R152P_E155V_I156F _K157N),
(W23L_H36L_P48A_R51L_L84F_A106V_D108N_H123Y_S146C_D147Y_R152P_E155V _I156F _K157N),
(W23L_H36L_P48A_R51L_L84F_A106V_D108N_H123Y_A142A_S146C_D147Y_E155V
_I156F _K157N),
(W23L_H36L_P48A_R51L_L84F_A106V_D108N_H123Y_A142A_S146C_D147Y_R152P _E155V_I156F_K157N),
(W23L_H36L_P48A_R51L_L84F_A106V_D108N_H123Y_S146R_D147Y_E155V_I156F _K161T),
(W23R_H36L_P48A_R51L_L84F_A106V_D108N_H123Y_S146C_D147Y_R152P_E155V _I156F _K157N),
(H36L_P48A_R51L_L84F_A106V_D108N_H123Y_A142N_S146C_D147Y_R152P_E155V
_I156F _K157N).

特定の実施形態では、本明細書で提供される融合タンパク質は、融合タンパク質の塩基編集活性を改善する1つ以上の特徴を含む。例えば、本明細書に提供される任意の融合タンパク質は、ヌクレアーゼ活性が低下したCas9ドメインを含み得る。いくつかの実施形態では、本明細書で提供される任意の融合タンパク質は、ヌクレアーゼ活性を持たないCas9ドメイン (dCas9) 、またはCas9ニッカーゼ (nCas9) と呼ばれる、二本鎖DNA分子の1つの鎖を切断するCas9ドメインを有し得る。

いくつかの実施形態では、アデノシンデアミナーゼはTadA*7.10である。いくつかの実施形態では、TadA*7.10は少なくとも1つの改変を含む。特定の実施形態では、TadA*7.10は、TadA*7.10に対する以下の改変または追加の改変の1つ以上を含む：Y147T、Y147R、Q154S、Y123H、V82S、T166R、およびQ154R。改変Y123Hはまた、本明細書において、H123H（TadA*7.10における改変H123YがY123H TadA(wt)に復帰された改変）とも称される。他の実施形態では、TadA*7.10は：Y147T + Q154R; Y147T + Q154S; Y147R + Q154S; V82S + Q154S; V82S + Y147R; V82S + Q154R; V82S + Y123H; I76Y + V82S; V82S + Y123H + Y147T; V82S + Y123H + Y147R; V82S + Y123H + Q154R; Y147R + Q154R +Y123H; Y147R + Q154R + I76Y; Y147R + Q154R + T166R; Y123H + Y147R + Q154R + I76Y; V82S + Y123H + Y147R + Q154R; およびI76Y + V82S + Y123H + Y147R + Q154Rの群より選択される改変の組み合わせを含む。特定の実施形態では、アデノシンデアミナーゼバリアントは、残基149、150、151、152、153、154、155、156、および157から始まるC末端の欠失を含む。

他の実施形態では、本発明の塩基エディターは、TadA*7.10またはTadA参照配列に比較して、1つ以上の以下の改変: Y147T、Y147R、Q154S、Y123H、V82S、T166R、および/またはQ154Rを含むアデノシンデアミナーゼバリアント（例えばTadA*8）を含むモノマーである。他の実施形態では、アデノシンデアミナーゼバリアント（TadA*8）は: Y147T + Q154R; Y147T + Q154S; Y147R + Q154S; V82S + Q154S; V82S + Y147R; V82S + Q154R; V82S + Y123H; I76Y + V82S; V82S + Y123H + Y147T; V82S + Y123H + Y147R; V82S + Y123H + Q154R; Y147R + Q154R +Y123H; Y147R + Q154R + I76Y; Y147R + Q154R + T166R; Y123H + Y147R + Q154R + I76Y; V82S + Y123H + Y147R + Q154R;およびI76Y + V82S + Y123H + Y147R + Q154Rの群より選択される改変の組み合わせを含むモノマーである。他の実施形態では、塩基エディターは、野生型アデノシンデアミナーゼ、ならびに以下の改変Y147T、Y147R、Q154S、Y123H、V82S、T166R、および/またはQ154Rの1つ以上を含むアデノシンデアミナーゼバリアント（例えばTadA*8）を含む、ヘテロダイマーである。他の実施形態では、塩基エディターは、TadA*7.10ドメイン、ならびに：Y147T + Q154R; Y147T + Q154S; Y147R + Q154S; V82S + Q154S; V82S + Y147R; V82S + Q154R; V82S + Y123H; I76Y + V82S; V82S + Y123H + Y147T; V82S + Y123H + Y147R; V82S + Y123H + Q154R; Y147R + Q154R +Y123H; Y147R + Q154R + I76Y; Y147R + Q154R + T166R; Y123H + Y147R + Q154R + I76Y; V82S + Y123H + Y147R + Q154R;およびI76Y + V82S + Y123H + Y147R + Q154Rの群より選択される改変の組み合わせを含むアデノシンデアミナーゼバリアントドメイン（例えばTadA*8）を含む、ヘテロダイマーである。他の実施形態では、塩基エディターは、野生型アデノシンデアミナーゼ、ならびに以下の改変Y147T、Y147R、Q154S、Y123H、V82S、T166R、および/またはQ154Rの1つ以上を含むアデノシンデアミナーゼバリアントドメイン（例えばTadA*8）を含むヘテロダイマーである。

一実施形態では、アデノシンデアミナーゼは、以下の配列またはアデノシンデアミナーゼ活性を有するその断片を含むかまたはこれらから本質的になる、TadA*8である：
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCTFFRMPRQVFNAQKKAQSSTD

いくつかの実施形態では、TadA*8は一部切除されている。いくつかの実施形態では、一部切除TadA*8では、全長TadA*8に比較して、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、6、17、18、19、または20のN末端アミノ酸残基が失われている。いくつかの実施形態では、一部切除TadA*8では、全長TadA*8に比較して、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、6、17、18、19、または20のC末端アミノ酸残基が失われている。いくつかの実施形態では、アデノシンデアミナーゼバリアントは全長TadA*8である。

いくつかの実施形態では、TadA*8は、TadA*8.1、TadA*8.2、TadA*8.3、TadA*8.4、TadA*8.5、TadA*8.6、TadA*8.7、TadA*8.8、TadA*8.9、TadA*8.10、TadA*8.11、TadA*8.12、TadA*8.13、TadA*8.14、TadA*8.15、TadA*8.16、TadA*8.17、TadA*8.18、TadA*8.19、TadA*8.20、TadA*8.21、TadA*8.22、TadA*8.23、TadA*8.24である。

一実施形態では、本発明の融合タンパク質は、本明細書記載のアデノシンデアミナーゼバリアント（例えばTadA*8）に連結された野生型TadAがCas9ニッカーゼに連結されたものを含む。特定の実施形態では、融合タンパク質は、単一のTadA*8ドメイン(例えば、モノマーとして提供されるもの)を含む。他の実施形態では、塩基エディターは、TadA*8およびTadA(wt) を含み、これらはヘテロ二量体を形成することができる。例示的な配列は以下の通りである：

TadA（wt）、「TadA参照配列」；
MSEVEFSHEYWMRHALTLAKRAWDEREVPVGAVLVHNNRVIGEGWNRPIGRHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTLEPCVMCAGAMIHSRIGRVVFGARDAKTGAAGSLMDVLHHPGMNHRVEITEGILADECAALLSDFFRMRRQEIKAQKKAQSSTD

TadA*8
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCTFFRMPRQVFNAQKKAQSSTD.

いくつかの実施形態では、アデノシンデアミナーゼは、本明細書に提供されるアデノシンデアミナーゼのいずれかに記載のアミノ酸配列のいずれか1つに対して少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも99.5%同一であるアミノ酸配列を含む。本明細書において提供されるアデノシンデアミナーゼは、1つ以上の突然変異(例えば、本明細書に提供される突然変異のいずれか)を含み得ることが理解されるべきである。本開示は、特定のパーセント同一性を有する任意のデアミナーゼドメインに加えて本明細書に記載される突然変異のいずれかまたはその組み合わせを含むものを提供する。いくつかの実施形態では、アデノシンデアミナーゼは、参照配列または本明細書に提供されるアデノシンデアミナーゼのいずれかと比較して1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、21、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、またはそれより多い突然変異を有するアミノ酸配列を含む。いくつかの実施形態では、アデノシンデアミナーゼは、当技術分野において公知であるかまたは本明細書に記載されたアミノ酸配列のいずれか1つと比較して、少なくとも5、少なくとも10、少なくとも15、少なくとも20、少なくとも25、少なくとも30、少なくとも35、少なくとも40、少なくとも45、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90、少なくとも100、少なくとも110、少なくとも120、少なくとも130、少なくとも140、少なくとも150、少なくとも160、または少なくとも170の同一の連続するアミノ酸残基を有するアミノ酸配列を含む。

特定の実施形態では、TadA*8は、太字で示す以下の位のいずれかで1つ以上の突然変異を含む。他の実施形態では、TadA*8は、下線で示す位のいずれかで1つ以上の突然変異を含む：
MSEVEFSHEY WMRHALTLAK RARDEREVPV GAVLVLNNRV IGEGWNRAIG ⁵⁰LHDPTAHAEI MALRQGGLVM QNYRLIDATL YVTFEPCVMC AGAMIHSRIG ¹⁰⁰RVVFGVRNAK TGAAGSLMDV LHYPGMNHRV EITEGILADE CAALLCYFFR ¹⁵⁰MPRQVFNAQK KAQSSTD

例えば、TadA*8は、82位および/または166位のアミノ酸位での改変（例えばV82S、T166R）を単独で、あるいは以下のY147T、Y147R、Q154S、Y123H、および/またはQ154Rのいずれか1つ以上と組み合わせて含む。特定の実施形態では、改変の組み合わせは：Y147T + Q154R; Y147T + Q154S; Y147R + Q154S; V82S + Q154S; V82S + Y147R; V82S + Q154R; V82S + Y123H; I76Y + V82S; V82S + Y123H + Y147T; V82S + Y123H + Y147R; V82S + Y123H + Q154R; Y147R + Q154R +Y123H; Y147R + Q154R + I76Y; Y147R + Q154R + T166R; Y123H + Y147R + Q154R + I76Y; V82S + Y123H + Y147R + Q154R; およびI76Y + V82S + Y123H + Y147R + Q154Rの群より選択される。

いくつかの実施形態では、アデノシンデアミナーゼは、以下の配列またはアデノシンデアミナーゼ活性を有するその断片を含むかまたはこうした配列から本質的になる、TadA*8である：
MSEVEFSHEY WMRHALTLAK RARDEREVPV GAVLVLNNRV IGEGWNRAIG LHDPTAHAEI MALRQGGLVM QNYRLIDATL YVTFEPCVMC AGAMIHSRIG
RVVFGVRNAK TGAAGSLMDV LHYPGMNHRV EITEGILADE CAALLCTFFR
MPRQVFNAQK KAQSSTD

一実施形態では、本発明の融合タンパク質は、本明細書記載のアデノシンデアミナーゼバリアント（例えばTadA*8）に連結された野生型TadAがCas9ニッカーゼに連結されたものを含む。特定の実施形態では、融合タンパク質は、単一のTadA*8ドメイン(例えば、モノマーとして提供されるもの)を含む。他の実施形態では、塩基エディターは、TadA*8およびTadA(wt) を含み、これらはヘテロダイマーを形成することができる。

［追加のドメイン］
本明細書に記載される塩基エディターは、ポリヌクレオチドの核酸塩基の編集、修飾、または改変の促進を補助する任意のドメインを含むことができる。いくつかの実施形態では、塩基エディターは、ポリヌクレオチドプログラム可能ヌクレオチド結合ドメイン(例えばCas9)、核酸塩基編集ドメイン(例えばデアミナーゼドメイン)、および1つ以上の追加のドメインを含む。いくつかの実施形態では、追加のドメインは、塩基エディターの酵素的または触媒的機能、塩基エディターの結合機能を促進することができ、または所望の塩基編集結果に干渉し得る細胞機構(例えば酵素)の阻害因子であり得る。いくつかの実施形態では、塩基エディターは、ヌクレアーゼ、ニッカーゼ、レコンビナーゼ、デアミナーゼ、メチルトランスフェラーゼ、メチラーゼ、アセチラーゼ、アセチルトランスフェラーゼ、転写アクチベーター、または転写リプレッサードメインを含むことができる。

いくつかの実施形態では、塩基エディターは、ウラシルグリコシラーゼ阻害因子 (UGI) ドメインを含むことができる。いくつかの実施形態では、U:Gヘテロ二本鎖DNAの存在に対する細胞DNA修復応答が、細胞における核酸塩基編集効率の低下の原因となり得る。こうした実施形態では、ウラシルDNAグリコシラーゼ (UDG)が、細胞中のDNAからのUの除去を触媒可能であり、それが塩基除去修復 (BER) を開始可能であり、大部分がU:G対からC:G対への復帰をもたらす。こうした実施形態では、一本鎖に結合する、編集された塩基をブロックする、UGIを阻害する、BERを阻害する、編集された塩基を保護する、および/または編集されていない鎖の修復を促進する、1つ以上のドメインを含む塩基エディターにおいてBERは阻害され得る。従って、本開示は、UGIドメインを含む塩基編集融合タンパク質を企図する。

いくつかの実施形態では、塩基エディターは、二本鎖切断 (DSB) 結合タンパク質のすべてまたは一部をドメインとして含む。例えば、DSB結合タンパク質は、バクテリオファージMuのGamタンパク質を含んでもよく、これはDSBの末端に結合してそれらを分解から保護することができる。Komor, A.C., et al., “Improved base excision repair inhibition and bacteriophage Mu Gam protein yields C:G-to-T:A base editors with higher efficiency and product purity” Science Advances 3:eaao4774 (2017)を参照のこと（その全内容が参照により本明細書に組み入れられる）。

さらに、いくつかの実施形態では、Gamタンパク質を塩基エディターのN末端に融合させてもよい。いくつかの実施形態では、Gamタンパク質を塩基エディターのC末端に融合させることができる。バクテリオファージMuのGamタンパク質は二本鎖切断 (DSB) の末端に結合し、それらを分解から保護することができる。いくつかの実施形態では、Gamを使用してDSBの遊離末端を結合することにより、塩基編集のプロセス中のインデル形成を低減することができる。いくつかの実施形態では、174残基のGamタンパク質は、塩基エディターのN末端に融合される。Komor, A.C., et al., “Improved base excision repair inhibition and bacteriophage Mu Gam protein yields C:G-to-T:A base editors with higher efficiency and product purity” Science Advances 3:eaao4774 (2017)を参照のこと。いくつかの実施形態では、突然変異（複数可）が、野生型ドメインと比較して、塩基編集ドメインの長さを変化させることができる。例えば、少なくとも1つのドメインにおける少なくとも1つのアミノ酸の欠失は、塩基エディターの長さを短くすることができる。別の場合、突然変異（複数可）は、野生型ドメインに対するドメインの長さを変化させない。例えば、いずれかのドメインにおける置換（複数可）は塩基エディターの長さを変える/変えない。

いくつかの実施形態では、塩基エディターは、核酸ポリメラーゼ (NAP) のすべてまたは一部をドメインとして含むことができる。例えば、塩基エディターは、真核生物NAPのすべてまたは一部を含むことができる。いくつかの実施形態では、塩基エディターに組み込まれるNAPまたはその一部は、DNAポリメラーゼである。いくつかの実施形態では、塩基エディター内に組み込まれるNAPまたはその一部は、損傷乗り越えポリメラーゼ活性を有する。いくつかの実施形態では、塩基エディターに組み込まれるNAPまたはその一部は、損傷乗り越えDNAポリメラーゼである。いくつかの実施形態では、塩基エディターに組み込まれるNAPまたはその一部は、Rev7、Rev1複合体、ポリメラーゼ・イオタ、ポリメラーゼ・カッパ、またはポリメラーゼ・エータである。いくつかの実施形態では、塩基エディターに組み込まれるNAPまたはその一部は、真核生物ポリメラーゼ・アルファ、ベータ、ガンマ、デルタ、イプシロン、ガンマ、エータ、イオタ、カッパ、ラムダ、ミュー、またはニュー構成要素である。いくつかの実施形態では、塩基エディターに組み込まれるNAPまたはその一部は、核酸ポリメラーゼ（例えば損傷乗り越えDNAポリメラーゼ）に対して少なくとも75%、80%、85%、90%、95%、96%、97%、98%、99%、または99.5%の同一性であるアミノ酸配列を含む。

［塩基エディターシステム］
本明細書で提供される塩基エディターシステムの使用は、 (a) 対象のポリヌクレオチド（例えば、二本鎖または一本鎖DNAまたはRNA）の標的ヌクレオチド配列を、核酸塩基エディター（例えばアデノシン塩基エディター）およびガイドポリ核酸（例えばgRNA）を含む塩基エディターシステムと接触させる工程と；(b) 前記標的領域の鎖分離を誘導する工程と；(c)標的領域の一本鎖における前記標的核酸塩基対の第一の核酸塩基を第二の核酸塩基に変換する工程と；(d) 前記標的領域の1つより多くない鎖を切断し、第一の核酸塩基に相補的な第三の核酸塩基が、第二の核酸塩基に相補的な第四の核酸塩基に置換される工程を含む。いくつかの実施形態では、工程 (b) は省略されることを理解されたい。いくつかの実施形態では、前記の標的とされる核酸塩基対は、1つ以上の遺伝子における複数の核酸塩基対である。いくつかの実施形態では、本明細書に提供される塩基エディターシステムは、1つ以上の遺伝子における複数の核酸塩基対の多重編集を可能にする。いくつかの実施形態では、複数の核酸塩基対は、同一遺伝子中に位置する。いくつかの実施形態では、複数の核酸塩基対は、1つ以上の遺伝子に位置し、ここで、少なくとも1つの遺伝子は、異なる遺伝子座に位置する。

いくつかの実施形態では、切断された一本鎖(ニック鎖)は、ガイド核酸にハイブリダイズされる。いくつかの実施形態では、切断された一本鎖は、第一の核酸塩基を含む鎖と反対である。いくつかの実施形態では、塩基エディターはCas9ドメインを含む。いくつかの実施形態では、第一の塩基はアデニンであり、第二の塩基はG、C、AまたはTではない。いくつかの実施形態では、第二の塩基はイノシンである。

本明細書に提供される塩基編集システムは、触媒的に欠陥のあるStreptococcus pyogenes Cas9、アデニンデアミナーゼ、および塩基除去修復の阻害因子を含む融合タンパク質を用いて、二本鎖DNA切断を生じることなく、ドナーDNAテンプレートを必要とせず、かつ過剰な確率的挿入および欠失を誘導することなく、DNAにおけるプログラム可能な一塩基(C→TまたはA→G)変化を誘導する、ゲノム編集の新規なアプローチを提供する。

本明細書では、塩基エディターシステムを用いて核酸塩基を編集するためのシステム、組成物、および方法を提供する。いくつかの実施形態では、塩基エディターシステムは、（1）核酸塩基を編集するための、ポリヌクレオチドプログラム可能ヌクレオチド結合ドメインおよび核酸塩基編集ドメイン（例えばデアミナーゼドメイン）を含む塩基エディター（BE）；ならびに（2）ポリヌクレオチドプログラム可能ヌクレオチド結合ドメインと組み合わされたガイドポリヌクレオチド（例えばガイドRNA）を含む。いくつかの実施形態では、塩基エディターシステムはアデノシン塩基エディター（ABE）を含む。いくつかの実施形態では、ポリヌクレオチドプログラム可能ヌクレオチド結合ドメインはポリヌクレオチドプログラム可能DNA結合ドメインである。いくつかの実施形態では、ポリヌクレオチドプログラム可能ヌクレオチド結合ドメインはポリヌクレオチドプログラム可能RNA結合ドメインである。いくつかの実施形態では、核酸塩基編集ドメインはデアミナーゼドメインである。いくつかの実施形態では、デアミナーゼドメインはアデニンデアミナーゼまたはアデノシンデアミナーゼである。いくつかの実施形態では、アデノシン塩基エディターはDNA中のアデニンを脱アミノ化可能である。いくつかの実施形態では、ABEは進化されたTadAバリアントを含む。

核酸塩基編集タンパク質の詳細は、国際PCT出願番号PCT/2017/045381 (WO2018/027078) およびPCT/US2016/058344 (WO2017/070632) に記載されており、これらの各々は、その全体が参照により本明細書に組み込まれる。Komor, A.C., et al., “Programmable editing of a target base in genomic DNA without double-stranded DNA cleavage” Nature 533, 420-424 (2016); Gaudelli, N.M., et al., “Programmable base editing of A・T to G・C in genomic DNA without DNA cleavage” Nature 551, 464-471 (2017); および Komor, A.C., et al., “Improved base excision repair inhibition and bacteriophage Mu Gam protein yields C:G-to-T:A base editors with higher efficiency and product purity” Science Advances 3:eaao4774 (2017)も参照のこと（その内容全体が参照により本明細書に組み入れられる）。

いくつかの実施形態では、単一のガイドポリヌクレオチドを利用して、デアミナーゼを標的核酸配列にターゲティングしてもよい。いくつかの実施形態では、単一対のガイドポリヌクレオチドを利用して、異なるデアミナーゼを標的核酸配列にターゲティングしてもよい。

塩基エディターシステムの核酸塩基構成要素およびポリヌクレオチドプログラム可能ヌクレオチド結合構成要素は、互いに共有的または非共有的に会合され得る。例えば、いくつかの実施形態では、デアミナーゼドメインが、ポリヌクレオチドプログラム可能ヌクレオチド結合ドメインによって標的ヌクレオチド配列にターゲティングされ得る。いくつかの実施形態では、ポリヌクレオチドプログラム可能ヌクレオチド結合ドメインは、デアミナーゼドメインに融合または連結され得る。いくつかの実施形態では、ポリヌクレオチドプログラム可能ヌクレオチド結合ドメインは、デアミナーゼドメインと非共有的に相互作用するかまたは会合することによって、デアミナーゼドメインを標的ヌクレオチド配列にターゲティングすることができる。例えば、いくつかの実施形態では、核酸塩基編集構成要素、例えばデアミナーゼ構成要素は、ポリヌクレオチドプログラム可能ヌクレオチド結合ドメインの一部をなす追加の異種部分またはドメインと相互作用するか、会合するか、または複合体を形成することができる、追加の異種部分またはドメインを含むことができる。いくつかの実施形態では、追加の異種部分は、ポリペプチドと結合するか、相互作用するか、会合するか、または複合体を形成することが可能であり得る。いくつかの実施形態では、追加の異種部分は、ポリヌクレオチドと結合するか、相互作用するか、会合するか、または複合体を形成することが可能であり得る。いくつかの実施形態では、追加の異種部分は、ガイドポリヌクレオチドに結合することが可能であり得る。いくつかの実施形態では、追加の異種部分は、ポリペプチドリンカーに結合することが可能であり得る。いくつかの実施形態では、追加の異種部分は、ポリヌクレオチドリンカーに結合することが可能であり得る。追加の異種部分は、タンパク質ドメインであってもよい。いくつかの実施形態では、追加の異種部分は、K相同(KH) ドメイン、MS2コートタンパク質ドメイン、PP7コートタンパク質ドメイン、SfMu Comコートタンパク質ドメイン、ステライルアルファモチーフ、テロメラーゼKu結合モチーフおよびKuタンパク質、テロメラーゼSm7結合モチーフおよびSm7タンパク質、またはRNA認識モチーフであり得る。
塩基エディターシステムは、ガイドポリヌクレオチド構成要素をさらに含むことができる。塩基エディターシステムの構成要素は、共有結合、非共有相互作用、またはそれらの会合および相互作用の任意の組み合わせを介して互いに会合され得ることが理解されるべきである。いくつかの実施形態では、デアミナーゼドメインは、ガイドポリヌクレオチドによって標的ヌクレオチド配列にターゲティングされ得る。例えば、いくつかの実施形態では、塩基エディターシステムの核酸塩基編集構成要素、例えばデアミナーゼ構成要素は、ガイドポリヌクレオチドの一部またはセグメント(例えばポリヌクレオチドモチーフ) と相互作用するか、会合するか、または複合体を形成することが可能である追加の異種部分またはドメイン(例えばRNAまたはDNA結合タンパク質のようなポリヌクレオチド結合ドメイン)を含み得る。いくつかの実施形態では、追加の異種部分またはドメイン(例えばRNAまたはDNA結合タンパク質などのポリヌクレオチド結合ドメイン)は、デアミナーゼドメインに融合または連結され得る。いくつかの実施形態では、追加の異種部分は、ポリペプチドと結合するか、相互作用するか、会合するか、または複合体を形成することが可能であり得る。いくつかの実施形態では、追加の異種部分は、ポリヌクレオチドと結合するか、相互作用するか、会合するか、または複合体を形成することが可能であり得る。いくつかの実施形態では、追加の異種部分は、ガイドポリヌクレオチドに結合することが可能であり得る。いくつかの実施形態では、追加の異種部分は、ポリペプチドリンカーに結合することが可能であり得る。いくつかの実施形態では、追加の異種部分は、ポリヌクレオチドリンカーに結合することが可能であり得る。追加の異種部分は、タンパク質ドメインであってもよい。いくつかの実施形態では、追加の異種部分は、K相同(KH) ドメイン、MS2コートタンパク質ドメイン、PP7コートタンパク質ドメイン、SfMu Comコートタンパク質ドメイン、ステライルアルファモチーフ、テロメラーゼKu結合モチーフおよびKuタンパク質、テロメラーゼSm7結合モチーフおよびSm7タンパク質、またはRNA認識モチーフであり得る。

いくつかの実施形態では、塩基エディターシステムは、塩基除去修復(BER) 構成要素の阻害因子をさらに含むことができる。塩基エディターシステムの構成要素は、共有結合、非共有相互作用、またはそれらの会合および相互作用の任意の組み合わせを介して互いに会合され得ることが理解されるべきである。BER構成要素の阻害因子は、塩基除去修復阻害因子を含み得る。いくつかの実施形態では、塩基除去修復の阻害因子は、ウラシルDNAグリコシラーゼ阻害因子(UGI) であり得る。いくつかの実施形態では、塩基除去修復の阻害因子は、イノシン塩基除去修復阻害因子であり得る。いくつかの実施形態では、塩基除去修復の阻害因子は、ポリヌクレオチドプログラム可能ヌクレオチド結合ドメインにより標的ヌクレオチド配列にターゲティングされ得る。いくつかの実施形態では、ポリヌクレオチドプログラム可能ヌクレオチド結合ドメインは、塩基除去修復の阻害因子に融合または連結され得る。いくつかの実施形態では、ポリヌクレオチドプログラム可能ヌクレオチド結合ドメインは、デアミナーゼドメインおよび塩基除去修復の阻害因子に融合または連結され得る。いくつかの実施形態では、ポリヌクレオチドプログラム可能ヌクレオチド結合ドメインは、塩基除去修復の阻害因子と非共有的に相互作用するか、または会合することによって、塩基除去修復の阻害因子を標的ヌクレオチド配列へとターゲティングすることができる。例えば、いくつかの実施形態では、塩基除去修復構成要素の阻害因子は、ポリヌクレオチドプログラム可能ヌクレオチド結合ドメインの一部である追加の異種部分またはドメインと相互作用するか、会合するか、または複合体を形成することが可能である追加の異種部分またはドメインを含み得る。

いくつかの実施形態では、塩基除去修復の阻害因子は、ガイドポリヌクレオチドにより標的ヌクレオチド配列にターゲティングされ得る。例えば、いくつかの実施形態では、塩基除去修復の阻害因子は、ガイドポリヌクレオチドの一部またはセグメント(例えば、ポリヌクレオチドモチーフ)と相互作用するか、会合するか、または複合体を形成することが可能である追加の異種部分またはドメイン(例えば、RNAまたはDNA結合タンパク質のようなポリヌクレオチド結合ドメイン)を含み得る。いくつかの実施形態では、ガイドポリヌクレオチドの追加の異種部分またはドメイン(例えば、RNAまたはDNA結合タンパク質のようなポリヌクレオチド結合ドメイン)は、塩基除去修復の阻害因子に融合または連結され得る。いくつかの実施形態では、追加の異種部分は、ポリヌクレオチドと結合するか、相互作用するか、会合するか、または複合体を形成することが可能であり得る。いくつかの実施形態では、追加の異種部分は、ガイドポリヌクレオチドに結合可能であり得る。いくつかの実施形態では、追加の異種部分は、ポリペプチドリンカーに結合可能であり得る。いくつかの実施形態では、追加の異種部分は、ポリヌクレオチドリンカーに結合可能であり得る。追加の異種部分は、タンパク質ドメインであってもよい。いくつかの実施形態では、追加の異種部分は、K相同(KH) ドメイン、MS2コートタンパク質ドメイン、PP7コートタンパク質ドメイン、SfMu Comコートタンパク質ドメイン、ステライルアルファモチーフ、テロメラーゼKu結合モチーフおよびKuタンパク質、テロメラーゼSm7結合モチーフおよびSm7タンパク質、またはRNA認識モチーフであり得る。

いくつかの実施形態では、塩基エディターは、編集された鎖の塩基除去修復（BER）を阻害する。いくつかの実施形態では、塩基エディターは、編集されていない鎖を保護するかまたはこうした鎖に結合する。いくつかの実施形態では、塩基エディターはUGI活性を含む。いくつかの実施形態では、塩基エディターは、触媒的に不活性なイノシン特異的ヌクレアーゼを含む。いくつかの実施形態では、塩基エディターはニッカーゼ活性を含む。いくつかの実施形態では、塩基対の意図される編集は、PAM部位の上流にある。いくつかの実施形態では、塩基対の意図される編集は、PAM部位の1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、または20ヌクレオチド上流にある。いくつかの実施形態では、塩基対の意図される編集は、PAM部位の下流にある。いくつかの実施形態では、意図される編集された塩基対は、PAM部位の1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、または20ヌクレオチド下流にある。

いくつかの実施形態では、本方法は、カノニカル(例えばNGG) PAM部位を必要としない。いくつかの実施形態では、核酸塩基エディターは、リンカーまたはスペーサーを含む。いくつかの実施形態では、リンカーまたはスペーサーは、長さ1～25アミノ酸である。いくつかの実施形態では、リンカーまたはスペーサーは、長さ5～20アミノ酸である。いくつかの実施形態では、リンカーまたはスペーサーは、長さ10、11、12、13、14、15、16、17、18、19、または20アミノ酸である。

いくつかの実施形態では、本明細書で提供される塩基編集融合タンパク質は、正確な位置、例えば、標的塩基が定義された領域(例えば「脱アミノ化ウィンドウ」)内に配置されるような位置に配置される必要がある。いくつかの実施形態では、標的は4塩基領域内にあり得る。いくつかの実施形態では、そのような定義された標的領域は、PAMの約15塩基上流にあり得る。Komor, A.C., et al., “Programmable editing of a target base in genomic DNA without double-stranded DNA cleavage” Nature 533, 420-424 (2016); Gaudelli, N.M., et al., “Programmable base editing of A・T to G・C in genomic DNA without DNA cleavage” Nature 551, 464-471 (2017);およびKomor, A.C., et al., “Improved base excision repair inhibition and bacteriophage Mu Gam protein yields C:G-to-T:A base editors with higher efficiency and product purity” Science Advances 3:eaao4774 (2017) を参照のこと；その全内容が参照により本明細書に組み入れられる。

いくつかの実施形態では、標的領域は標的ウィンドウを含み、標的ウィンドウは標的核酸塩基対を含む。いくつかの実施形態では、標的ウィンドウは、1～10ヌクレオチドを含む。いくつかの実施形態では、標的ウィンドウは、長さ1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、または20ヌクレオチドである。いくつかの実施形態では、塩基対の意図される編集は、標的ウィンドウ内にある。いくつかの実施形態では、標的ウィンドウは、塩基対の意図される編集を含む。いくつかの実施形態では、本方法は、本明細書に提供される塩基エディターのいずれかを用いて実施される。いくつかの実施形態では、標的ウィンドウは、脱アミノ化ウィンドウである。脱アミノ化ウィンドウは、塩基エディターが標的ヌクレオチドに作用して脱アミノ化する、定義された領域であり得る。いくつかの実施形態では、脱アミノ化ウィンドウは、2、3、4、5、6、7、8、9または10塩基領域内にある。いくつかの実施形態では、脱アミノ化ウィンドウは、PAMの5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24または25塩基上流にある。

本開示の塩基エディターは、標的ポリヌクレオチド配列の編集を促進させる任意のドメイン、特徴またはアミノ酸配列を含むことができる。例えば、いくつかの実施形態では、塩基エディターは、核局在化配列 (NLS) を含む。いくつかの実施形態では、塩基エディターのNLSは、デアミナーゼドメインとポリヌクレオチドプログラム可能ヌクレオチド結合ドメインとの間に位置する。いくつかの実施形態では、塩基エディターのNLSは、ポリヌクレオチドプログラム可能ヌクレオチド結合ドメインに対してC末端に位置する。

本明細書に開示されるような塩基エディターに存在し得る他の例示的特徴は、細胞質局在化配列、核輸出配列などの輸出配列、または他の局在化配列などの局在化配列、ならびに融合タンパク質の可溶化、精製、または検出に有用な配列タグである。本明細書において提供される適切なタンパク質タグには、限定されるものではないが、ビオチンカルボキシラーゼキャリアータンパク質 (BCCP) タグ、myc-タグ、カルモジュリンタグ、FLAG-タグ、赤血球凝集素 (HA) -タグ、ヒスチジンタグまたはHis-タグとも呼ばれるポリヒスチジンタグ、マルトース結合タンパク質 (MBP) -タグ、nus-タグ、グルタチオン-S-トランスフェラーゼ (GST) -タグ、緑色蛍光タンパク質 (GFP) -タグ、チオレドキシンタグ、S-タグ、Softag(例えばSoftag1、Softag3)、ストレプトタグ、ビオチンリガーゼタグ、FLAsHタグ、V5タグ、およびSBP-タグが含まれる。追加の適切な配列は、当業者には明らかであろう。いくつかの実施形態では、融合タンパク質は、1つ以上のHisタグを含む。

融合タンパク質に含まれてもよいタンパク質ドメインの非限定的な例には、デアミナーゼドメイン（例えばアデノシンデアミナーゼ）、ウラシルグリコシラーゼ阻害因子（UGI）ドメイン、エピトープタグ、およびレポーター遺伝子配列が含まれる。

エピトープタグの非限定的な例は、ヒスチジン (His) タグ、V5タグ、FLAGタグ、インフルエンザ赤血球凝集素 (HA) タグ、Mycタグ、VSV-Gタグ、およびチオレドキシン (Trx) タグを含む。レポーター遺伝子の例には、グルタチオン-5-トランスフェラーゼ (GST) 、西洋ワサビペルオキシダーゼ (HRP) 、クロラムフェニコールアセチルトランスフェラーゼ (CAT) 、ベータ-ガラクトシダーゼ、ベータ-グルクロニダーゼ、ルシフェラーゼ、緑色蛍光タンパク質 (GFP) 、HcRed、DsRed、シアン蛍光タンパク質 (CFP) 、黄色蛍光タンパク質 (YFP) 、および青色蛍光タンパク質 (BFP) を含む自己蛍光タンパク質が含まれるが、これらに限定されない。さらなるタンパク質配列には、DNA分子に結合するかまたは他の細胞分子に結合するアミノ酸配列が含まれてもよく、これらには、マルトース結合タンパク質 (MBP) 、Sタグ、Lex A DNA結合ドメイン (DBD) 融合体、GAL4 DNA結合ドメイン融合体、および単純ヘルペスウイルス (HSV) BP16タンパク質融合体が含まれるが、これらに限定されない。

いくつかの実施形態では、アデノシン塩基エディター（ABE）は、DNA中のアデニンを脱アミノ化することができる。いくつかの実施形態では、ABEは、BE3のAPOBEC1構成要素を、天然または操作されたE. coli TadA、ヒトADAR2、マウスADA、またはヒトADAT2で置換することによって生成される。いくつかの実施形態では、ABEは、進化されたTadAバリアントを含む。いくつかの実施形態では、ABEはABE 1.2 (TadA*-XTEN-nCas9-NLS) である。いくつかの実施形態では、TadA*はA106VおよびD108N突然変異を含む。

いくつかの実施形態では、ABEは第二世代ABEである。いくつかの実施形態では、ABEはABE 2.1であり、これは、TadA*において追加の突然変異D147YおよびE155Vを含む(TadA*2.1)。いくつかの実施形態では、ABEはABE 2.2であり、これはABE 2.1が触媒的に不活化された型のヒトアルキルアデニンDNAグリコシラーゼ(E125Q突然変異を伴うAAG)に融合されたものである。いくつかの実施形態では、ABEはABE 2.3であり、これはABE 2.1が触媒的に不活化された型のE. coli Endo V (D35A突然変異で不活化される)に融合されたものである。いくつかの実施形態において、ABEはABE 2.6であり、これはABE 2.1におけるリンカーの2倍の長さ(32アミノ酸、(SGGS)₂-XTEN-(SGGS)₂)のリンカーを有する。いくつかの実施形態では、ABEはABE 2.7であり、これはABE 2.1が追加の野生型TadAモノマーに係留されたものである。いくつかの実施形態では、ABEはABE 2.8であり、これはABE 2.1が追加のTadA*2.1モノマーとともに係留されたものである。いくつかの実施形態では、ABEはABE 2.9であり、これは進化されたTadA (TadA*2.1) とABE 2.1のN末端との直接融合体である。いくつかの実施形態では、ABEはABE 2.10であり、これは野生型TadAとABE 2.1のN末端との直接融合体である。いくつかの実施形態では、ABEはABE 2.11であり、これは、TadA*モノマーのN末端で不活化E59A突然変異を有するABE 2.9である。いくつかの実施形態では、ABEはABE 2.12であり、これは、内部TadA*モノマーにおいて不活化E59A突然変異を有するABE 2.9である。

いくつかの実施形態では、ABEは、第三世代ABEである。いくつかの実施形態では、ABEはABE 3.1であり、これは、3つの追加のTadA突然変異(L84F、H123Y、およびI157F)を伴うABE 2.3である。

いくつかの実施形態では、ABEは第四世代ABEである。いくつかの実施形態では、ABEはABE4.3であり、これは追加のTadA突然変異A142N (TadA*4.3) を伴うABE 3.1である。

いくつかの実施形態では、ABEは第五世代ABEである。いくつかの実施形態では、ABEはABE 5.1であり、これは生存クローンからの突然変異のコンセンサスセット(H36L、R51L、S146C、およびK157N) をABE 3.1に移入することによって生成される。いくつかの実施形態では、ABEはABE 5.3であり、これは内部の進化されたTadA*に融合された野生型E. coli TadAを含有するヘテロダイマー構築物を有する。いくつかの実施形態では、ABEは、以下の表6に示されるような、ABE 5.2、ABE 5.4、ABE 5.5、ABE 5.6、ABE 5.7、ABE 5.8、ABE 5.9、ABE 5.10、ABE 5.11、ABE 5.12、ABE 5.13、またはABE 5.14である。いくつかの実施形態では、ABEは第六世代ABEである。いくつかの実施形態では、ABEは、以下の表6に示されるような、ABE 6.1、ABE 6.2、ABE 6.3、ABE 6.4、ABE 6.5、またはABE 6.6である。いくつかの実施形態では、ABEは、第七世代ABEである。いくつかの実施形態では、ABEは、以下の表6に示されるような、ABE7.1、ABE7.2、ABE7.3、ABE7.4、ABE7.5、ABE7.6、ABE7.7、ABE7.8、ABE7.9、またはABE7.10である。

表6 ABEの遺伝子型

いくつかの実施形態では、塩基エディターは第八世代ABE（ABE8）である。いくつかの実施形態では、ABE8はTadA*8バリアントを含有する。いくつかの実施形態では、ABE8はTadA*8バリアントを含有するモノマー構築物（「ABE8.x-m」）である。いくつかの実施形態では、ABE8はABE8.1-mであり、これはY147T突然変異を含むTadA*7.10（TadA*8.1）を含有するモノマー構築物を有する。いくつかの実施形態では、ABE8はABE8.2-mであり、これはY147R突然変異を含むTadA*7.10（TadA*8.2）を含有するモノマー構築物を有する。いくつかの実施形態では、ABE8はABE8.3-mであり、これはQ154S突然変異を含むTadA*7.10（TadA*8.3）を含有するモノマー構築物を有する。いくつかの実施形態では、ABE8はABE8.4-mであり、これはY123H突然変異を含むTadA*7.10（TadA*8.4）を含有するモノマー構築物を有する。いくつかの実施形態では、ABE8はABE8.5-mであり、これはV82S突然変異を含むTadA*7.10（TadA*8.5）を含有するモノマー構築物を有する。いくつかの実施形態では、ABE8はABE8.6-mであり、これはT166R突然変異を含むTadA*7.10（TadA*8.6）を含有するモノマー構築物を有する。いくつかの実施形態では、ABE8はABE8.7-mであり、これはQ154R突然変異を含むTadA*7.10（TadA*8.7）を含有するモノマー構築物を有する。いくつかの実施形態では、ABE8はABE8.8-mであり、これはY147R、Q154R、およびY123H突然変異を含むTadA*7.10（TadA*8.8）を含有するモノマー構築物を有する。いくつかの実施形態では、ABE8はABE8.9-mであり、これはY147R、Q154RおよびI76Y突然変異を含むTadA*7.10（TadA*8.9）を含有するモノマー構築物を有する。いくつかの実施形態では、ABE8はABE8.10-mであり、これはY147R、Q154R、およびT166R突然変異を含むTadA*7.10（TadA*8.10）を含有するモノマー構築物を有する。いくつかの実施形態では、ABE8はABE8.11-mであり、これはY147TおよびQ154R突然変異を含むTadA*7.10（TadA*8.11）を含有するモノマー構築物を有する。いくつかの実施形態では、ABE8はABE8.12-mであり、これはY147TおよびQ154S突然変異を含むTadA*7.10（TadA*8.12）を含有するモノマー構築物を有する。いくつかの実施形態では、ABE8はABE8.13-mであり、これはY123H（H123Yから復帰されたY123H）、Y147R、Q154RおよびI76Y突然変異を含むTadA*7.10（TadA*8.13）を含有するモノマー構築物を有する。いくつかの実施形態では、ABE8はABE8.14-mであり、これはI76YおよびV82S突然変異を含むTadA*7.10（TadA*8.14）を含有するモノマー構築物を有する。いくつかの実施形態では、ABE8はABE8.15-mであり、これはV82SおよびY147R突然変異を含むTadA*7.10（TadA*8.15）を含有するモノマー構築物を有する。いくつかの実施形態では、ABE8はABE8.16-mであり、これはV82S、Y123H（H123Yから復帰されたY123H）およびY147R突然変異を含むTadA*7.10（TadA*8.16）を含有するモノマー構築物を有する。いくつかの実施形態では、ABE8はABE8.17-mであり、これはV82SおよびQ154R突然変異を含むTadA*7.10（TadA*8.17）を含有するモノマー構築物を有する。いくつかの実施形態では、ABE8はABE8.18-mであり、これはV82S、Y123H(H123Yから復帰されたY123H)およびQ154R突然変異を含むTadA*7.10（TadA*8.18）を含有するモノマー構築物を有する。いくつかの実施形態では、ABE8はABE8.19-mであり、これはV82S、Y123H(H123Yから復帰されたY123H)、Y147RおよびQ154R突然変異を含むTadA*7.10（TadA*8.19）を含有するモノマー構築物を有する。いくつかの実施形態では、ABE8はABE8.20-mであり、これはI76Y、V82S、Y123H(H123Yから復帰されたY123H)、Y147RおよびQ154R突然変異を含むTadA*7.10（TadA*8.20）を含有するモノマー構築物を有する。いくつかの実施形態では、ABE8はABE8.21-mであり、これはY147RおよびQ154S突然変異を含むTadA*7.10（TadA*8.21）を含有するモノマー構築物を有する。いくつかの実施形態では、ABE8はABE8.22-mであり、これはV82SおよびQ154S突然変異を含むTadA*7.10（TadA*8.22）を含有するモノマー構築物を有する。いくつかの実施形態では、ABE8はABE8.23-mであり、これはV82SおよびY123H(H123Yから復帰されたY123H)突然変異を含むTadA*7.10（TadA*8.23）を含有するモノマー構築物を有する。いくつかの実施形態では、ABE8はABE8.24-mであり、これはV82S、Y123H(H123Yから復帰されたY123H)、およびY147T突然変異を含むTadA*7.10（TadA*8.24）を含有するモノマー構築物を有する。

いくつかの実施形態では、ABE8は、TadA*8バリアントに融合された野生型E. coli TadAを含有するヘテロダイマー構築物（「ABE8.x-d」）を有する。いくつかの実施形態では、ABE8はABE8.1-dであり、これはY147T突然変異を含むTadA*7.10（TadA*8.1）に融合した野生型E. coli TadAを含有するヘテロダイマー構築物を有する。いくつかの実施形態では、ABE8はABE8.2-dであり、これはY147R突然変異を含むTadA*7.10（TadA*8.2）に融合した野生型E. coli TadAを含有するヘテロダイマー構築物を有する。いくつかの実施形態では、ABE8はABE8.3-dであり、これはQ154S突然変異を含むTadA*7.10（TadA*8.3）に融合した野生型E. coli TadAを含有するヘテロダイマー構築物を有する。いくつかの実施形態では、ABE8はABE8.4-dであり、これはY123H突然変異を含むTadA*7.10（TadA*8.4）に融合した野生型E. coli TadAを含有するヘテロダイマー構築物を有する。いくつかの実施形態では、ABE8はABE8.5-dであり、これはV82S突然変異を含むTadA*7.10（TadA*8.5）に融合した野生型E. coli TadAを含有するヘテロダイマー構築物を有する。いくつかの実施形態では、ABE8はABE8.6-dであり、これはT166R突然変異を含むTadA*7.10（TadA*8.6）に融合した野生型E. coli TadAを含有するヘテロダイマー構築物を有する。いくつかの実施形態では、ABE8はABE8.7-dであり、これはQ154R突然変異を含むTadA*7.10（TadA*8.7）に融合した野生型E. coli TadAを含有するヘテロダイマー構築物を有する。いくつかの実施形態では、ABE8はABE8.8-dであり、これはY147R、Q154R、およびY123H突然変異を含むTadA*7.10（TadA*8.8）に融合した野生型E. coli TadAを含有するヘテロダイマー構築物を有する。いくつかの実施形態では、ABE8はABE8.9-dであり、これはY147R、Q154RおよびI76Y突然変異を含むTadA*7.10（TadA*8.9）に融合した野生型E. coli TadAを含有するヘテロダイマー構築物を有する。いくつかの実施形態では、ABE8はABE8.10-dであり、これはY147R、Q154R、およびT166R突然変異を含むTadA*7.10（TadA*8.10）に融合した野生型E. coli TadAを含有するヘテロダイマー構築物を有する。いくつかの実施形態では、ABE8はABE8.11-dであり、これはY147TおよびQ154R突然変異を含むTadA*7.10（TadA*8.11）に融合した野生型E. coli TadAを含有するヘテロダイマー構築物を有する。いくつかの実施形態では、ABE8はABE8.12-dであり、これはY147TおよびQ154S突然変異を含むTadA*7.10（TadA*8.12）に融合した野生型E. coli TadAを含有するヘテロダイマー構築物を有する。いくつかの実施形態では、ABE8はABE8.13-dであり、これはY123H（H123Yから復帰されたY123H）、Y147R、Q154RおよびI76Y突然変異を含むTadA*7.10（TadA*8.13）に融合した野生型E. coli TadAを含有するヘテロダイマー構築物を有する。いくつかの実施形態では、ABE8はABE8.14-dであり、これはI76YおよびV82S突然変異を含むTadA*7.10（TadA*8.14）に融合した野生型E. coli TadAを含有するヘテロダイマー構築物を有する。いくつかの実施形態では、ABE8はABE8.15-dであり、これはV82SおよびY147R突然変異を含むTadA*7.10（TadA*8.15）に融合した野生型E. coli TadAを含有するヘテロダイマー構築物を有する。いくつかの実施形態では、ABE8はABE8.16-dであり、これはV82S、Y123H（H123Yから復帰されたY123H）およびY147R突然変異を含むTadA*7.10（TadA*8.16）に融合した野生型E. coli TadAを含有するヘテロダイマー構築物を有する。いくつかの実施形態では、ABE8はABE8.17-dであり、これはV82SおよびQ154R突然変異を含むTadA*7.10（TadA*8.17）に融合した野生型E. coli TadAを含有するヘテロダイマー構築物を有する。いくつかの実施形態では、ABE8はABE8.18-dであり、これはV82S、Y123H(H123Yから復帰されたY123H)およびQ154R突然変異を含むTadA*7.10（TadA*8.18）に融合した野生型E. coli TadAを含有するヘテロダイマー構築物を有する。いくつかの実施形態では、ABE8はABE8.19-dであり、これはV82S、Y123H(H123Yから復帰されたY123H)、Y147RおよびQ154R突然変異を含むTadA*7.10（TadA*8.19）に融合した野生型E. coli TadAを含有するヘテロダイマー構築物を有する。いくつかの実施形態では、ABE8はABE8.20-dであり、これはI76Y、V82S、Y123H(H123Yから復帰されたY123H)、Y147RおよびQ154R突然変異を含むTadA*7.10（TadA*8.20）に融合した野生型E. coli TadAを含有するヘテロダイマー構築物を有する。いくつかの実施形態では、ABE8はABE8.21-dであり、これはY147RおよびQ154S突然変異を含むTadA*7.10（TadA*8.21）に融合した野生型E. coli TadAを含有するヘテロダイマー構築物を有する。いくつかの実施形態では、ABE8はABE8.22-dであり、これはV82SおよびQ154S突然変異を含むTadA*7.10（TadA*8.22）に融合した野生型E. coli TadAを含有するヘテロダイマー構築物を有する。いくつかの実施形態では、ABE8はABE8.23-dであり、これはV82SおよびY123H(H123Yから復帰されたY123H)突然変異を含むTadA*7.10（TadA*8.23）に融合した野生型E. coli TadAを含有するヘテロダイマー構築物を有する。いくつかの実施形態では、ABE8はABE8.24-dであり、これはV82S、Y123H(H123Yから復帰されたY123H)、およびY147T突然変異を含むTadA*7.10（TadA*8.24）に融合した野生型E. coli TadAを含有するヘテロダイマー構築物を有する。

いくつかの実施形態では、ABE8は、TadA*8バリアントに融合されたTadA*7.10を含有するヘテロダイマー構築物（「ABE8.x-7」）を有する。いくつかの実施形態では、ABE8はABE8.1-7であり、これはY147T突然変異を含むTadA*7.10（TadA*8.1）に融合したTadA*7.10を含有するヘテロダイマー構築物を有する。いくつかの実施形態では、ABE8はABE8.2-7であり、これはY147R突然変異を含むTadA*7.10（TadA*8.2）に融合したTadA*7.10を含有するヘテロダイマー構築物を有する。いくつかの実施形態では、ABE8はABE8.3-7であり、これはQ154S突然変異を含むTadA*7.10（TadA*8.3）に融合したTadA*7.10を含有するヘテロダイマー構築物を有する。いくつかの実施形態では、ABE8はABE8.4-7であり、これはY123H突然変異を含むTadA*7.10（TadA*8.4）に融合したTadA*7.10を含有するヘテロダイマー構築物を有する。いくつかの実施形態では、ABE8はABE8.5-7であり、これはV82S突然変異を含むTadA*7.10（TadA*8.5）に融合したTadA*7.10を含有するヘテロダイマー構築物を有する。いくつかの実施形態では、ABE8はABE8.6-7であり、これはT166R突然変異を含むTadA*7.10（TadA*8.6）に融合したTadA*7.10を含有するヘテロダイマー構築物を有する。いくつかの実施形態では、ABE8はABE8.7-7であり、これはQ154R突然変異を含むTadA*7.10（TadA*8.7）に融合したTadA*7.10を含有するヘテロダイマー構築物を有する。いくつかの実施形態では、ABE8はABE8.8-7であり、これはY147R、Q154R、およびY123H突然変異を含むTadA*7.10（TadA*8.8）に融合したTadA*7.10を含有するヘテロダイマー構築物を有する。いくつかの実施形態では、ABE8はABE8.9-7であり、これはY147R、Q154RおよびI76Y突然変異を含むTadA*7.10（TadA*8.9）に融合したTadA*7.10を含有するヘテロダイマー構築物を有する。いくつかの実施形態では、ABE8はABE8.10-7であり、これはY147R、Q154R、およびT166R突然変異を含むTadA*7.10（TadA*8.10）に融合したTadA*7.10を含有するヘテロダイマー構築物を有する。いくつかの実施形態では、ABE8はABE8.11-7であり、これはY147TおよびQ154R突然変異を含むTadA*7.10（TadA*8.11）に融合したTadA*7.10を含有するヘテロダイマー構築物を有する。いくつかの実施形態では、ABE8はABE8.12-7であり、これはY147TおよびQ154S突然変異を含むTadA*7.10（TadA*8.12）に融合したTadA*7.10を含有するヘテロダイマー構築物を有する。いくつかの実施形態では、ABE8はABE8.13-7であり、これはY123H（H123Yから復帰されたY123H）、Y147R、Q154RおよびI76Y突然変異を含むTadA*7.10（TadA*8.13）に融合したTadA*7.10を含有するヘテロダイマー構築物を有する。いくつかの実施形態では、ABE8はABE8.14-7であり、これはI76YおよびV82S突然変異を含むTadA*7.10（TadA*8.14）に融合したTadA*7.10を含有するヘテロダイマー構築物を有する。いくつかの実施形態では、ABE8はABE8.15-7であり、これはV82SおよびY147R突然変異を含むTadA*7.10（TadA*8.15）に融合したTadA*7.10を含有するヘテロダイマー構築物を有する。いくつかの実施形態では、ABE8はABE8.16-7であり、これはV82S、Y123H（H123Yから復帰されたY123H）およびY147R突然変異を含むTadA*7.10（TadA*8.16）に融合したTadA*7.10を含有するヘテロダイマー構築物を有する。いくつかの実施形態では、ABE8はABE8.17-7であり、これはV82SおよびQ154R突然変異を含むTadA*7.10（TadA*8.17）に融合したTadA*7.10を含有するヘテロダイマー構築物を有する。いくつかの実施形態では、ABE8はABE8.18-7であり、これはV82S、Y123H(H123Yから復帰されたY123H)およびQ154R突然変異を含むTadA*7.10（TadA*8.18）に融合したTadA*7.10を含有するヘテロダイマー構築物を有する。いくつかの実施形態では、ABE8はABE8.19-7であり、これはV82S、Y123H(H123Yから復帰されたY123H)、Y147RおよびQ154R突然変異を含むTadA*7.10（TadA*8.19）に融合したTadA*7.10を含有するヘテロダイマー構築物を有する。いくつかの実施形態では、ABE8はABE8.20-7であり、これはI76Y、V82S、Y123H(H123Yから復帰されたY123H)、Y147RおよびQ154R突然変異を含むTadA*7.10（TadA*8.20）に融合したTadA*7.10を含有するヘテロダイマー構築物を有する。いくつかの実施形態では、ABE8はABE8.21-7であり、これはY147RおよびQ154S突然変異を含むTadA*7.10（TadA*8.21）に融合したTadA*7.10を含有するヘテロダイマー構築物を有する。いくつかの実施形態では、ABE8はABE8.22-7であり、これはV82SおよびQ154S突然変異を含むTadA*7.10（TadA*8.22）に融合したTadA*7.10を含有するヘテロダイマー構築物を有する。いくつかの実施形態では、ABE8はABE8.23-7であり、これはV82SおよびY123H(H123Yから復帰されたY123H)突然変異を含むTadA*7.10（TadA*8.23）に融合したTadA*7.10を含有するヘテロダイマー構築物を有する。いくつかの実施形態では、ABE8はABE8.24-7であり、これはV82S、Y123H(H123Yから復帰されたY123H)、およびY147T突然変異を含むTadA*7.10（TadA*8.24）に融合したTadA*7.10を含有するヘテロダイマー構築物を有する。

いくつかの実施形態では、ABEは、以下の表7に示すような、ABE8.1-m、ABE8.2-m、ABE8.3-m、ABE8.4-m、ABE8.5-m、ABE8.6-m、ABE8.7-m、ABE8.8-m、ABE8.9-m、ABE8.10-m、ABE8.11-m、ABE8.12-m、ABE8.13-m、ABE8.14-m、ABE8.15-m、ABE8.16-m、ABE8.17-m、ABE8.18-m、ABE8.19-m、ABE8.20-m、ABE8.21-m、ABE8.22-m、ABE8.23-m、ABE8.24-m、ABE8.1-d、ABE8.2-d、ABE8.3-d、ABE8.4-d、ABE8.5-d、ABE8.6-d、ABE8.7-d、ABE8.8-d、ABE8.9-d、ABE8.10-d、ABE8.11-d、ABE8.12-d、ABE8.13-d、ABE8.14-d、ABE8.15-d、ABE8.16-d、ABE8.17-d、ABE8.18-d、ABE8.19-d、ABE8.20-d、ABE8.21-d、ABE8.22-d、ABE8.23-d、またはABE8.24-dである。

表7：塩基エディター-ABE8

いくつかの実施形態では、塩基エディター（例えばABE8）は、アデノシンデアミナーゼバリアント（例えばTadA*8）を、循環置換体Cas9（例えばCP5またはCP6）および二部分核局在化配列を含む足場内にクローニングすることによって生成される。いくつかの実施形態では、塩基エディター（例えばABE7.9、ABE7.10、またはABE8）は、NGC PAM CP5バリアント（S. pyogenes Cas9またはspVRQR Cas9）である。いくつかの実施形態では、塩基エディター（例えばABE7.9、ABE7.10、またはABE8）は、AGA PAM CP5バリアント（S. pyogenes Cas9またはspVRQR Cas9）である。いくつかの実施形態では、塩基エディター（例えばABE7.9、ABE7.10、またはABE8）は、NGC PAM CP6バリアント（S. pyogenes Cas9またはspVRQR Cas9）である。いくつかの実施形態では、塩基エディター（例えばABE7.9、ABE7.10、またはABE8）は、AGA PAM CP6バリアント（S. pyogenes Cas9またはspVRQR Cas9）である。

いくつかの実施形態では、ABEは以下の表8に示すような遺伝子型を有する。

表8 ABEの遺伝子型

以下の表9に示すように、40個のABE8の遺伝子型が記載される。ABE7.10突然変異と異なる場合のABE8中の突然変異変化を示す。いくつかの実施形態では、ABEは表9に示すようなABEの1つの遺伝子型を有する。

表9 進化されたTadAにおける残基同一性

いくつかの実施形態では、塩基エディターはABE8.1であり、これは、以下の配列またはアデノシンデアミナーゼ活性を有するその断片を含むかまたはこうした配列から本質的になる：
ABE8.1_Y147T_CP5_NGC PAM_モノマー

上記配列中、プレーンテキストはアデノシンデアミナーゼ配列を示し、太字配列はCas9由来の配列を示し、斜字配列はリンカー配列を示し、下線配列は二部分核局在化配列を示す。

いくつかの実施形態では、塩基エディターはABE8.1であり、これは、以下の配列またはアデノシンデアミナーゼ活性を有するその断片を含むかまたはこうした配列から本質的になる：
pNMG-B335 ABE8.1_Y147T_CP5_NGC PAM_モノマー

いくつかの実施形態では、塩基エディターはABE8.14であり、これは、以下の配列またはアデノシンデアミナーゼ活性を有するその断片を含むかまたはこうした配列から本質的になる：
NGCPAM CP5を含むpNMG-357-ABE8.14

いくつかの実施形態では、塩基エディターはABE8.8-mであり、これは、以下の配列またはアデノシンデアミナーゼ活性を有するその断片を含むかまたはこうした配列から本質的になる：
ABE8.8-m

上記配列中、プレーンテキストはアデノシンデアミナーゼ配列を示し、太字配列はCas9由来の配列を示し、斜字配列はリンカー配列を示し、下線配列は二部分核局在化配列を示し、二重下線配列は突然変異を示す。

いくつかの実施形態では、塩基エディターはABE8.8-dであり、これは、以下の配列またはアデノシンデアミナーゼ活性を有するその断片を含むかまたはこうした配列から本質的になる：
ABE8.8-d

いくつかの実施形態では、塩基エディターはABE8.13-mであり、これは、以下の配列またはアデノシンデアミナーゼ活性を有するその断片を含むかまたはこうした配列から本質的になる：
ABE8.13-m

いくつかの実施形態では、塩基エディターはABE8.13-dであり、これは、以下の配列またはアデノシンデアミナーゼ活性を有するその断片を含むかまたはこうした配列から本質的になる：
ABE8.13-d

いくつかの実施形態では、塩基エディターはABE8.17-mであり、これは、以下の配列またはアデノシンデアミナーゼ活性を有するその断片を含むかまたはこうした配列から本質的になる：
ABE8.17-m

いくつかの実施形態では、塩基エディターはABE8.17-dであり、これは、以下の配列またはアデノシンデアミナーゼ活性を有するその断片を含むかまたはこうした配列から本質的になる：
ABE8.17-d

いくつかの実施形態では、塩基エディターはABE8.20-mであり、これは、以下の配列またはアデノシンデアミナーゼ活性を有するその断片を含むかまたはこうした配列から本質的になる：
ABE8.20-m

いくつかの実施形態では、塩基エディターはABE8.20-dであり、これは、以下の配列またはアデノシンデアミナーゼ活性を有するその断片を含むかまたはこうした配列から本質的になる：
ABE8.20-d

いくつかの実施形態では、本発明のABE8は以下の配列より選択される：

01. monoABE8.1_bpNLS + Y147T
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCTFFRMPRQVFNAQKKAQSSTDSGGSSGGSSGSETPGTSESATPESSGGSSGGSDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFVSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASARELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKQYRSTKEVLDATLIHQSITGLYETRIDLSQLGGDEGADKRTADGSEFESPKKKRKV

02. monoABE8.1_bpNLS + Y147R
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCRFFRMPRQVFNAQKKAQSSTDSGGSSGGSSGSETPGTSESATPESSGGSSGGSDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFVSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASARELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKQYRSTKEVLDATLIHQSITGLYETRIDLSQLGGDEGADKRTADGSEFESPKKKRKV

03. monoABE8.1_bpNLS + Q154S
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPRSVFNAQKKAQSSTDSGGSSGGSSGSETPGTSESATPESSGGSSGGSDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFVSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASARELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKQYRSTKEVLDATLIHQSITGLYETRIDLSQLGGDEGADKRTADGSEFESPKKKRKV

04. monoABE8.1_bpNLS + Y123H
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHHPGMNHRVEITEGILADECAALLCYFFRMPRQVFNAQKKAQSSTDSGGSSGGSSGSETPGTSESATPESSGGSSGGSDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFVSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASARELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKQYRSTKEVLDATLIHQSITGLYETRIDLSQLGGDEGADKRTADGSEFESPKKKRKV

05. monoABE8.1_bpNLS + V82S
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYSTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPRQVFNAQKKAQSSTDSGGSSGGSSGSETPGTSESATPESSGGSSGGSDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFVSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASARELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKQYRSTKEVLDATLIHQSITGLYETRIDLSQLGGDEGADKRTADGSEFESPKKKRKV

06. monoABE8.1_bpNLS + T166R
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPRQVFNAQKKAQSSRDSGGSSGGSSGSETPGTSESATPESSGGSSGGSDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFVSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASARELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKQYRSTKEVLDATLIHQSITGLYETRIDLSQLGGDEGADKRTADGSEFESPKKKRKV

07. monoABE8.1_bpNLS + Q154R
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPRRVFNAQKKAQSSTDSGGSSGGSSGSETPGTSESATPESSGGSSGGSDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFVSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASARELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKQYRSTKEVLDATLIHQSITGLYETRIDLSQLGGDEGADKRTADGSEFESPKKKRKV

08. monoABE8.1_bpNLS + Y147R_Q154R_Y123H
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHHPGMNHRVEITEGILADECAALLCRFFRMPRRVFNAQKKAQSSTDSGGSSGGSSGSETPGTSESATPESSGGSSGGSDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFVSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASARELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKQYRSTKEVLDATLIHQSITGLYETRIDLSQLGGDEGADKRTADGSEFESPKKKRKV

09. monoABE8.1_bpNLS + Y147R_Q154R_I76Y
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLYDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCRFFRMPRRVFNAQKKAQSSTDSGGSSGGSSGSETPGTSESATPESSGGSSGGSDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFVSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASARELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKQYRSTKEVLDATLIHQSITGLYETRIDLSQLGGDEGADKRTADGSEFESPKKKRKV

10. monoABE8.1_bpNLS + Y147R_Q154R_T166R
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCRFFRMPRRVFNAQKKAQSSRDSGGSSGGSSGSETPGTSESATPESSGGSSGGSDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFVSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASARELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKQYRSTKEVLDATLIHQSITGLYETRIDLSQLGGDEGADKRTADGSEFESPKKKRKV

11. monoABE8.1_bpNLS + Y147T_Q154R
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCTFFRMPRRVFNAQKKAQSSTDSGGSSGGSSGSETPGTSESATPESSGGSSGGSDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFVSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASARELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKQYRSTKEVLDATLIHQSITGLYETRIDLSQLGGDEGADKRTADGSEFESPKKKRKV

12. monoABE8.1_bpNLS + Y147T_Q154S
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCTFFRMPRSVFNAQKKAQSSTDSGGSSGGSSGSETPGTSESATPESSGGSSGGSDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFVSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASARELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKQYRSTKEVLDATLIHQSITGLYETRIDLSQLGGDEGADKRTADGSEFESPKKKRKV

13. monoABE8.1_bpNLS + H123Y123H_Y147R_Q154R_I76Y
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLYDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHHPGMNHRVEITEGILADECAALLCRFFRMPRRVFNAQKKAQSSTDSGGSSGGSSGSETPGTSESATPESSGGSSGGSDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFVSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASARELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKQYRSTKEVLDATLIHQSITGLYETRIDLSQLGGDEGADKRTADGSEFESPKKKRKV

14. monoABE8.1_bpNLS + V82S + Q154R
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYSTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPRRVFNAQKKAQSSTDSGGSSGGSSGSETPGTSESATPESSGGSSGGSDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFVSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASARELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKQYRSTKEVLDATLIHQSITGLYETRIDLSQLGGDEGADKRTADGSEFESPKKKRKV

いくつかの実施形態では、塩基エディターは、核酸塩基編集ドメイン（例えばデアミナーゼドメインのすべてまたは部分）に融合されたポリヌクレオチドプログラム可能ヌクレオチド結合ドメイン（例えばCas9由来ドメイン)を含む融合タンパク質である。特定の実施形態では、本明細書に提供する融合タンパク質は、融合タンパク質の塩基編集活性を改善する1つ以上の特徴を含む。例えば、本明細書に提供するいかなる融合タンパク質も、減少したヌクレアーゼ活性を有するCas9ドメインを含んでもよい。いくつかの実施形態では、本明細書に提供する融合タンパク質のいずれも、ヌクレアーゼ活性を持たないCas9ドメイン（dCas9）、またはCas9ニッカーゼと称される、二本鎖DNA分子の一方の鎖をカットするCas9ドメイン（nCas9）を有してもよい。

いくつかの実施形態では、塩基エディターは、ウラシルグリコシラーゼ阻害因子 (UGI) のすべてまたは一部を含むドメインをさらに含む。いくつかの実施形態では、塩基エディターは、ウラシルDNAグリコシラーゼ(UDG)などの、ウラシル結合タンパク質(UBP)のすべてまたは一部を含むドメインを含む。いくつかの実施形態では、塩基エディターは、核酸ポリメラーゼのすべてまたは一部を含むドメインを含む。いくつかの実施形態では、塩基エディターに組み込まれる核酸ポリメラーゼまたはその一部は、損傷乗り越えDNAポリメラーゼである。

いくつかの実施形態では、塩基エディターのドメインは、複数のドメインを含むことができる。例えば、Cas9に由来するポリヌクレオチドプログラム可能ヌクレオチド結合ドメインを含む塩基エディターは、野生型または天然のCas9のRECローブおよびNUCローブに対応するRECローブおよびNUCローブを含むことができる。別の例では、塩基エディターは、RuvCIドメイン、BHドメイン、REC1ドメイン、REC2ドメイン、RuvCIIドメイン、L1ドメイン、HNHドメイン、L2ドメイン、RuvCIIIドメイン、WEDドメイン、TOPOドメインまたはCTDドメインの1つ以上を含むことができる。いくつかの実施形態では、塩基エディターの1つ以上のドメインは、そのドメインを含むポリペプチドの野生型バージョンに対する突然変異(例えば置換、挿入、欠失)を含む。例えば、ポリヌクレオチドプログラム可能DNA結合ドメインのHNHドメインは、H840A置換を含むことができる。別の例では、ポリヌクレオチドプログラム可能DNA結合ドメインのRuvCIドメインは、D10A置換を含むことができる。

本明細書に開示される塩基エディターの異なるドメイン（例えば隣接ドメイン）は、1つ以上のリンカードメイン（例えばXTENリンカードメイン）を使用して、または使用せずに、互いに連結することができる。いくつかの実施形態では、リンカードメインは、2つの分子もしくは部分、例えば、第一のドメイン（例えばCas9由来ドメイン）および第二のドメイン（例えばアデノシンデアミナーゼドメイン）のような融合タンパク質の2つのドメインを連結する結合（例えば共有結合）、化学基、または分子であり得る。いくつかの実施形態では、リンカーは、共有結合（例えば炭素－炭素結合、ジスルフィド結合、炭素－ヘテロ原子結合など）である。特定の実施形態では、リンカーは、アミド連結の炭素窒素結合である。特定の実施形態では、リンカーは、環状もしくは非環状、置換もしくは非置換、分枝もしくは非分枝の脂肪族もしくはヘテロ脂肪族リンカーである。特定の実施形態では、リンカーは、ポリマー（例えばポリエチレン、ポリエチレングリコール、ポリアミド、ポリエステルなど)である。特定の実施形態では、リンカーは、アミノアルカン酸のモノマー、ダイマーまたはポリマーを含む。いくつかの実施形態では、リンカーは、アミノアルカン酸（例えばグリシン、エタン酸、アラニン、ベータ-アラニン、3-アミノプロパン酸、4-アミノブタン酸、5-ペンタン酸等）を含む。いくつかの実施形態では、リンカーは、アミノヘキサン酸 (Ahx) のモノマー、ダイマーまたはポリマーを含む。特定の実施形態では、リンカーは炭素環部分（例えばシクロペンタン、シクロヘキサン）に基づく。他の実施形態では、リンカーはポリエチレングリコール部分 (PEG) を含む。特定の実施形態では、リンカーは、アリールまたはヘテロアリール部分を含む。特定の実施形態では、リンカーは、フェニル環に基づく。リンカーは、ペプチドからリンカーへの求核剤（例えばチオール、アミノ）の付着を促進させる官能化部分を含むことができる。リンカーの一部として任意の求電子剤を使用することができる。例示的な求電子剤には、活性化エステル、活性化アミド、マイケルアクセプター、ハロゲン化アルキル、ハロゲン化アリール、ハロゲン化アシル、およびイソチオシアナートが含まれるが、これらに限定されない。いくつかの実施形態では、リンカーは、Cas9ヌクレアーゼドメインを含むRNAプログラム可能ヌクレアーゼのgRNA結合ドメインと、核酸編集タンパク質の触媒ドメインとを結合する。いくつかの実施形態では、リンカーは、dCas9と第二のドメイン（例えばUGI等）とを連結する。

典型的には、リンカーは、2つの基、分子、または他の部分の間に配置されるか、または2つの基、分子、または他の部分によって隣接され、共有結合を介してそれぞれに連結され、従って2つを連結する。いくつかの実施形態では、リンカーは、アミノ酸または複数のアミノ酸(例えばペプチドまたはタンパク質)である。いくつかの実施形態では、リンカーは、有機分子、基、ポリマー、または化学的部分である。いくつかの実施形態では、リンカーは、長さ2～100アミノ酸であり、例えば、長さ2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、30～35、35～40、40～45、45～50、50～60、60～70、70～80、80～90、90～100、100～150または150～200アミノ酸である。いくつかの実施形態では、リンカーは、長さ約3～約104 (例えば5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、55、60、65、70、75、80、85、90、95、または100)アミノ酸である。より長いまたはより短いリンカーも考えられる。いくつかの実施形態では、リンカードメインは、XTENリンカーとも呼ばれ得るアミノ酸配列SGSETPGTSESATPESを含む。融合タンパク質ドメインを連結するための任意の方法を用いて (例えば、(SGGS)_n、(GGGS)_n、(GGGGS)_n、および(G)_nの型の非常に柔軟なリンカーから、(EAAAK)_n、 (GGS)_n、SGSETPGTSESATPESの型のより剛性の高いリンカーまで(例えばGuilinger JP, Thompson DB, Liu DR. Fusion of catalytically inactive Cas9 to FokI nuclease improves the specificity of genome modification. Nat. Biotechnol. 2014; 32(6): 577-82を参照のこと。その全内容は参照により本明細書に組み込まれる)、または (XP)_nモチーフ)、核酸塩基エディターの活性のための最適な長さを達成することができる。いくつかの実施形態では、nは、1、2、3、4、5、6、7、8、9、10、11、12、13、14または15である。いくつかの実施形態では、リンカーは、(GGS)_nモチーフを含み、ここで、nは、1、3、または7である。いくつかの実施形態では、本明細書で提供される融合タンパク質のCas9ドメインは、アミノ酸配列SGSETPGTSESATPESを含むリンカーを介して融合される。いくつかの実施形態では、リンカーは、複数のプロリン残基を含み、長さ5～21、5～14、5～9、5～7アミノ酸であり、例えば、PAPAP、PAPAPA、PAPAPAP、PAPAPAPA、P(AP)₄、P(AP)₇、P(AP)₁₀である(例えば、Tan J, Zhang F, Karcher D, Bock R. Engineering of high-precision base editors for site-specific single nucleotide replacement. Nat Commun. 2019 Jan 25;10(1):439を参照のこと；その全内容は参照により本明細書に組み込まれる)。このようなプロリンリッチリンカーはまた、「剛性」リンカーとも呼ばれる。

本発明の融合タンパク質は核酸編集ドメインを含む。いくつかの実施形態では、デアミナーゼはアデノシンデアミナーゼである。いくつかの実施形態では、デアミナーゼは脊椎動物デアミナーゼである。いくつかの実施形態では、デアミナーゼは無脊椎動物デアミナーゼである。いくつかの実施形態では、デアミナーゼは、ヒト、チンパンジー、ゴリラ、サル、ウシ、イヌ、ラット、またはマウスデアミナーゼである。いくつかの実施形態では、デアミナーゼはヒトデアミナーゼである。いくつかの実施形態では、デアミナーゼはラットデアミナーゼである。

［リンカー］
特定の実施形態では、リンカーを用いて、本発明の任意のペプチドまたはペプチドドメインを連結してもよい。リンカーは、共有結合程度に単純であってもよいし、または多くの原子に渡る長さのポリマーリンカーであってもよい。特定の実施形態では、リンカーはポリペプチドであるかまたはアミノ酸に基づく。他の実施形態では、リンカーはペプチド様ではない。特定の実施形態では、リンカーは、共有結合（例えば炭素－炭素結合、ジスルフィド結合、炭素－ヘテロ原子結合など）である。特定の実施形態では、リンカーは、アミド連結の炭素窒素結合である。特定の実施形態では、リンカーは、環状もしくは非環状、置換もしくは非置換、分枝もしくは非分枝の脂肪族もしくはヘテロ脂肪族リンカーである。特定の実施形態では、リンカーは、ポリマー（例えばポリエチレン、ポリエチレングリコール、ポリアミド、ポリエステルなど)である。特定の実施形態では、リンカーは、アミノアルカン酸のモノマー、ダイマーまたはポリマーを含む。特定の実施形態では、リンカーは、アミノアルカン酸（例えばグリシン、エタン酸、アラニン、ベータ-アラニン、3-アミノプロパン酸、4-アミノブタン酸、5-ペンタン酸等）を含む。特定の実施形態では、リンカーは、アミノヘキサン酸 (Ahx) のモノマー、ダイマーまたはポリマーを含む。特定の実施形態では、リンカーは炭素環部分（例えばシクロペンタン、シクロヘキサン）に基づく。他の実施形態では、リンカーはポリエチレングリコール部分 (PEG) を含む。他の実施形態では、リンカーはアミノ酸を含む。特定の実施形態では、リンカーはペプチドを含む。特定の実施形態では、リンカーは、アリールまたはヘテロアリール部分を含む。特定の実施形態では、リンカーは、フェニル環に基づく。リンカーは、ペプチドからリンカーへの求核剤（例えばチオール、アミノ）の付着を促進させる官能化部分を含むことができる。リンカーの一部として任意の求電子剤を使用することができる。例示的な求電子剤には、活性化エステル、活性化アミド、マイケルアクセプター、ハロゲン化アルキル、ハロゲン化アリール、ハロゲン化アシル、およびイソチオシアナートが含まれるが、これらに限定されない。

いくつかの実施形態では、リンカーは、アミノ酸または複数のアミノ酸(例えばペプチドまたはタンパク質)である。いくつかの実施形態では、リンカーは、結合（例えば共有結合）、有機分子、基、ポリマー、または化学的部分である。いくつかの実施形態では、リンカーは、長さ約3～約104 (例えば5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、55、60、65、70、75、80、85、90、95、または100)アミノ酸である。

いくつかの実施形態では、アデノシンデアミナーゼおよびnapDNAbpは、長さ4、16、32、または104アミノ酸であるリンカーを通じて融合される。いくつかの実施形態では、リンカーは、長さ約3～約104アミノ酸である。いくつかの実施形態では、本明細書に提供する融合タンパク質はいずれも、互いにリンカーを通じて融合されているアデノシンデアミナーゼおよびCas9ドメインを含む。核酸塩基エディターの活性に最適な長さを達成するため、デアミナーゼドメイン（例えば操作されたecTadA）およびCas9ドメインの間で、多様な長さおよび柔軟性のリンカーを使用してもよい（例えば、 (GGGS)_n、(GGGGS)_n、および(G)_nの型の非常に柔軟なリンカーから、(EAAAK)_n、 (SGGS)_n、SGSETPGTSESATPESの型のより剛性の高いリンカーまで(例えばGuilinger JP, Thompson DB, Liu DR. Fusion of catalytically inactive Cas9 to FokI nuclease improves the specificity of genome modification. Nat. Biotechnol. 2014; 32(6): 577-82を参照のこと。その全内容は参照により本明細書に組み込まれる）、および(XP)_nモチーフ)。いくつかの実施形態では、nは、1、2、3、4、5、6、7、8、9、10、11、12、13、14または15である。いくつかの実施形態では、リンカーは、(GGS)_nモチーフを含み、ここで、nは、1、3、または7である。いくつかの実施形態では、本明細書で提供される任意の融合タンパク質のアデノシンデアミナーゼおよびCas9ドメインは、アミノ酸配列SGSETPGTSESATPESを含むリンカー（例えばXTENリンカー）を介して融合される。

［ガイドRNAを含むCas9複合体］
本開示のいくつかの態様は、本明細書に提供される融合タンパク質のいずれか、および融合タンパク質のCAS9ドメイン（例えばdCas9、ヌクレアーゼ活性Cas9、またはCas9ニッカーゼ）に結合したガイドRNA（例えばA＼突然変異を標的とするガイド）を含む複合体を提供する。融合タンパク質ドメインを連結するための任意の方法を使用して (例えば、 (GGGS)_n、(GGGGS)_n、および(G)_nの型の非常に柔軟なリンカーから、(EAAAK)_n、 (SGGS)_n、SGSETPGTSESATPESの型のより剛性の高いリンカーまで(例えばGuilinger JP, Thompson DB, Liu DR. Fusion of catalytically inactive Cas9 to FokI nuclease improves the specificity of genome modification. Nat. Biotechnol. 2014; 32(6): 577-82を参照のこと。その全内容は参照によりここに組み込まれる)、および (XP)_n)、核酸塩基エディターの活性のための最適な長さを達成することができる。いくつかの実施形態では、nは、1、2、3、4、5、6、7、8、9、10、11、12、13、14または15である。いくつかの実施形態では、リンカーは、(GGS)_nモチーフを含み、ここで、nは、1、3、または7である。いくつかの実施形態では、本明細書で提供される融合タンパク質のCas9ドメインは、アミノ酸配列SGSETPGTSESATPESを含むリンカーを介して融合される。

いくつかの実施形態では、ガイド核酸(例えばガイドRNA)は、長さ15～100ヌクレオチドであり、標的配列に相補的である少なくとも10の連続するヌクレオチドの配列を含む。いくつかの実施形態では、ガイドRNAは、長さ15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、または50ヌクレオチドである。いくつかの実施形態では、ガイドRNAは、標的配列に相補的な15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、または40の連続したヌクレオチドの配列を含む。いくつかの実施形態では、標的配列はDNA配列である。いくつかの実施形態では、標的配列は、細菌、酵母、真菌、昆虫、植物または動物のゲノムにおける配列である。いくつかの実施形態では、標的配列は、ヒトのゲノムにおける配列である。いくつかの実施形態では、標的配列の3’端は、カノニカルPAM配列 (NGG) にすぐ隣接している。いくつかの実施形態では、標的配列の3’端は、非カノニカルPAM配列（例えば、表１に列挙されている配列または5’-NAA-3’）にすぐ隣接している。いくつかの実施形態では、ガイド核酸（例えばガイドRNA）は、関心対象の遺伝子（例えば疾患または障害に関連する遺伝子）における配列に相補的である。いくつかの実施形態では、ガイド核酸（例えばガイドRNA）は、アルファ-1アンチトリプシン不全（A1AD）と関連する配列に相補的である。

本開示のいくつかの態様は、本明細書に提供される融合タンパク質または複合体を使用する方法を提供する。例えば、本開示のいくつかの態様は、DNA分子を、本明細書中に提供される融合タンパク質のいずれか、および少なくとも1つのガイドRNAと接触させる工程を含む方法を提供し、ここで、ガイドRNAは、長さ約15～100ヌクレオチドであり、標的配列に相補的である少なくとも10の連続したヌクレオチドの配列を含む。いくつかの実施形態では、標的配列の3’端は、AGC、GAG、TTT、GTG、またはCAA配列にすぐ隣接している。いくつかの実施形態では、標的配列の3’端は、NGA、NGCG、NGN、NNGRRT、NNNRRT、NGCG、NGCN、NGTN、NGTN、NGTN、または5’ (TTTV) 配列にすぐ隣接している。

それぞれの配列における特定の位または残基の番号付けは、使用される特定のタンパク質および番号付けスキームに依存することが理解されるであろう。例えば、成熟タンパク質の前駆体と成熟タンパク質そのものとでは番号付けが異なることがあり、種ごとの配列の違いが番号付けに影響することがある。当業者は、当技術分野に周知の方法、例えば、配列アラインメントおよび相同残基の決定によって、任意の相同タンパク質およびそれぞれのコード核酸中のそれぞれの残基を同定することができる。

本明細書に開示された融合タンパク質のいずれかを標的部位、例えば、編集される突然変異を含む部位にターゲティング（標的指向化）するためには、融合タンパク質をガイドRNAとともに共発現させることが典型的に必要であることは当業者には明らかであろう。本明細書の他の箇所でより詳細に説明されるように、ガイドRNAは、典型的には、Cas9結合を可能にするtracrRNAフレームワークおよびCas9:核酸編集酵素/ドメイン融合タンパク質に配列特異性を付与するガイド配列を含む。あるいは、ガイドRNAおよびtracrRNAは、2つの核酸分子として別々に提供され得る。いくつかの実施形態では、ガイドRNAは、ガイド配列が標的配列に相補的な配列を含む構造を含む。ガイド配列は典型的には長さ20ヌクレオチドである。Cas9:核酸編集酵素/ドメイン融合タンパク質を特定のゲノム標的部位にターゲティングするための適切なガイドRNAの配列は、本開示に基づいて当業者に明らかであろう。そのような適切なガイドRNA配列は、典型的には、編集される標的ヌクレオチドの上流または下流50ヌクレオチド以内の核酸配列に相補的なガイド配列を含む。提供された融合タンパク質のいずれかを特定の標的配列にターゲティングするのに適したいくつかの例示的なガイドRNA配列が本明細書に提供される。

［ガイドRNAを含むCas12複合体］
本開示のいくつかの態様は、本明細書に提供する融合タンパク質、およびガイドRNA(例えば編集のため標的ポリヌクレオチドを標的化するガイド)のいずれかを含む複合体を提供する。

いくつかの実施形態では、ガイド核酸（例えばガイドRNA）は、長さ15～100ヌクレオチド長であり、標的配列に相補的である少なくとも10の連続するヌクレオチドの配列を含む。いくつかの実施形態では、ガイドRNAは、長さ15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、または50ヌクレオチドである。いくつかの実施形態では、ガイドRNAは、標的配列に相補的な15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、または40の連続したヌクレオチドの配列を含む。いくつかの実施形態では、標的配列はDNA配列である。いくつかの実施形態では、標的配列は、細菌、酵母、真菌、昆虫、植物または動物のゲノムにおける配列である。いくつかの実施形態では、標的配列は、ヒトのゲノムにおける配列である。いくつかの実施形態では、標的配列の3’端は、カノニカルPAM配列にすぐ隣接している。いくつかの実施形態では、標的配列の3’端は、非カノニカルPAM配列にすぐ隣接している。

本開示のいくつかの態様は、本明細書に提供される融合タンパク質または複合体を使用する方法を提供する。例えば、本開示のいくつかの態様は、DNA分子を、本明細書中に提供される融合タンパク質のいずれか、および少なくとも1つのガイドRNAと接触させる工程を含む方法を提供し、ここで、ガイドRNAは、長さ約15～100ヌクレオチドであり、標的配列に相補的である少なくとも10の連続したヌクレオチドの配列を含む。いくつかの実施形態では、標的配列の3’端は、例えばTTN、DTTN、GTTN、ATTN、ATTC、DTTNT、WTTN、HATY、TTTN、TTTV、TTTC、TG、RTR、またはYTN PAM部位にすぐ隣接している。

それぞれの配列における特定の位または残基の番号付けは、使用される特定のタンパク質および番号付けスキームに依存することが理解されるであろう。例えば、成熟タンパク質の前駆体と成熟タンパク質そのものとでは番号付けが異なることがあり、種ごとの配列の違いが番号付けに影響することがある。当業者は、当業者に周知の方法、例えば、配列アラインメントおよび相同残基の決定によって、任意の相同タンパク質およびそれぞれのコード核酸中のそれぞれの残基を同定することができる。

本明細書に開示された融合タンパク質のいずれかを標的部位、例えば、編集される突然変異を含む部位にターゲティングするためには、融合タンパク質をガイドRNAとともに共発現させることが典型的に必要であることは当業者には明らかであろう。本明細書の他の箇所でより詳細に説明されるように、ガイドRNAは、典型的には、Cas12結合を可能にするtracrRNAフレームワークおよびCas12:核酸編集酵素/ドメイン融合タンパク質に配列特異性を付与するガイド配列を含む。あるいは、ガイドRNAおよびtracrRNAは、2つの核酸分子として別々に提供され得る。いくつかの実施形態では、ガイドRNAは、ガイド配列が標的配列に相補的な配列を含む構造を含む。ガイド配列は典型的には長さ20ヌクレオチドである。Cas12:核酸編集酵素/ドメイン融合タンパク質を特定のゲノム標的部位にターゲティングするための適切なガイドRNAの配列は、本開示に基づいて当業者に明らかであろう。そのような適切なガイドRNA配列は、典型的には、編集される標的ヌクレオチドの上流または下流50ヌクレオチド以内の核酸配列に相補的なガイド配列を含む。提供された融合タンパク質のいずれかを特定の標的配列にターゲティングするのに適したいくつかの例示的なガイドRNA配列が本明細書に提供される。

デアミナーゼドメインが、Cas12タンパク質中に内在化されている限り、本明細書に開示する塩基エディターのドメインを、任意の順序で配置してもよい。例えば、Cas12ドメインおよびデアミナーゼドメインを含む融合タンパク質を含む塩基エディターの限定されない例を以下のように配置してもよい：
NH2-[Cas12ドメイン]-リンカー1-[ABE8]-リンカー2-[Cas12ドメイン]-COOH;
NH2-[Cas12ドメイン]-リンカー1-[ABE8]-[Cas12ドメイン]-COOH;
NH2-[Cas12ドメイン]-[ABE8]-リンカー2-[Cas12ドメイン]-COOH;
NH2-[Cas12ドメイン]-[ABE8]-[Cas12ドメイン]-COOH;
NH2-[Cas12ドメイン]-リンカー1-[ABE8]-リンカー2-[Cas12ドメイン]-[イノシン BER阻害因子]-COOH;
NH2-[Cas12ドメイン]-リンカー1-[ABE8]-[Cas12ドメイン]-[イノシン BER阻害因子]-COOH;
NH2-[Cas12ドメイン]-[ABE8]-リンカー2-[Cas12ドメイン]-[イノシン BER阻害因子]-COOH;;
NH2-[Cas12ドメイン]-[ABE8]-[Cas12ドメイン]-[イノシン BER阻害因子]-COOH;
NH2-[イノシン BER阻害因子]-[Cas12ドメイン]-リンカー1-[ABE8]-リンカー2-[Cas12ドメイン]-COOH;
NH2-[イノシン BER阻害因子]-[Cas12ドメイン]-リンカー1-[ABE8]-[Cas12ドメイン]-COOH;
NH2-[イノシン BER阻害因子]-[Cas12ドメイン]-[ABE8]-リンカー2-[Cas12ドメイン]-COOH;
NH2-[イノシン BER阻害因子]NH2-[Cas12ドメイン]-[ABE8]-[Cas12ドメイン]-COOH

さらに、いくつかの場合、Gamタンパク質を塩基エディターのN末端に融合させてもよい。いくつかの場合、Gamタンパク質を塩基エディターのC末端に融合させてもよい。バクテリオファージMuのGamタンパク質は二本鎖切断 (DSB) の末端に結合し、それらを分解から保護することができる。いくつかの実施形態では、Gamを使用してDSBの遊離末端を結合することにより、塩基編集のプロセス中のインデル形成を低減することができる。いくつかの実施形態では、174残基のGamタンパク質は、塩基エディターのN末端に融合される。Komor, A.C., et al., “Improved base excision repair inhibition and bacteriophage Mu Gam protein yields C:G-to-T:A base editors with higher efficiency and product purity” Science Advances 3:eaao4774 (2017)を参照のこと。いくつかの実施形態では、1つまたは複数の突然変異が、野生型ドメインと比較して、塩基編集ドメインの長さを変化させることができる。例えば、少なくとも1つのドメインにおける少なくとも1つのアミノ酸の欠失は、塩基エディターの長さを短くすることができる。別の場合、1つまたは複数の突然変異は、野生型ドメインに対するドメインの長さを変化させない。例えば、いずれかのドメインにおける置換（複数可）は塩基エディターの長さを変えない。

いくつかの実施形態では、本明細書で提供される塩基編集融合タンパク質は、正確な位置、例えば、標的塩基が定義された領域(例えば「脱アミノ化ウィンドウ」)内に配置されるような位置に配置される必要がある。場合によっては、標的は4塩基領域内にあり得る。場合によっては、そのような定義された標的領域は、PAMの約15塩基上流にあり得る。Komor, A.C., et al., “Programmable editing of a target base in genomic DNA without double-stranded DNA cleavage” Nature 533, 420-424 (2016); Gaudelli, N.M., et al., “Programmable base editing of A・T to G・C in genomic DNA without DNA cleavage” Nature 551, 464-471 (2017); およびKomor, A.C., et al., “Improved base excision repair inhibition and bacteriophage Mu Gam protein yields C:G-to-T:A base editors with higher efficiency and product purity” Science Advances 3:eaao4774 (2017) を参照のこと；その全内容が参照により本明細書に組み入れられる。

定義される標的領域は脱アミノ化ウィンドウであってもよい。脱アミノ化ウィンドウは、塩基エディターが標的ヌクレオチドに作用して脱アミノ化する、定義された領域であり得る。いくつかの実施形態では、脱アミノ化ウィンドウは、2、3、4、5、6、7、8、9または10塩基領域内にある。いくつかの実施形態では、脱アミノ化ウィンドウは、PAMの5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24または25塩基上流にある。

本開示の塩基エディターは、標的ポリヌクレオチド配列の編集を容易にする任意のドメイン、特徴またはアミノ酸配列を含んでもよい。例えば、いくつかの実施形態では、塩基エディターは、核局在化配列(NLS) を含む。いくつかの実施形態では、塩基エディターのNLSは、デアミナーゼドメインおよびnapDNAbpドメインの間に位置する。いくつかの実施形態では、塩基エディターのNLSは、napDNAbpドメインのC末端に位置する。

融合タンパク質に含まれるタンパク質ドメインは、異種機能ドメインであってもよい。融合タンパク質に含まれてもよいタンパク質ドメインの非限定的な例には、デアミナーゼドメイン（例えばアデノシンデアミナーゼ）、ウラシルグリコシラーゼ阻害因子（UGI）ドメイン、エピトープタグ、およびレポーター遺伝子配列が含まれる。タンパク質ドメインは、例えば以下の活性の1つ以上を有する異種機能ドメインであってもよい：転写活性化活性、転写抑制活性、転写放出因子活性、遺伝子サイレンシング活性、クロマチン修飾活性、エピジェネティック修飾活性、ヒストン修飾活性、RNA切断活性、および核酸結合活性。こうした異種機能ドメインは、機能活性、例えば標的DNAと会合する標的ポリペプチド（例えばヒストン、DNA結合タンパク質等）の修飾を与えてもよく、例えばヒストンメチル化、ヒストンアセチル化、ヒストンユビキチン化等を導いてもよい。与えられる他の機能および/または活性には、トランスポザーゼ活性、インテグラーゼ活性、レコンビナーゼ活性、リガーゼ活性、ユビキチンリガーゼ活性、脱ユビキチン化活性、アデニル化活性、脱アデニル化活性、SUMO化活性、脱SUMO化活性、または上記の任意の組み合わせが含まれてもよい。

エピトープタグ、レポータータンパク質、他の結合ドメインでドメインを検出するかまたは標識してもよい。エピトープタグの非限定的な例は、ヒスチジン (His) タグ、V5タグ、FLAGタグ、インフルエンザ赤血球凝集素 (HA) タグ、Mycタグ、VSV-Gタグ、およびチオレドキシン (Trx) タグを含む。レポーター遺伝子の例には、グルタチオン-5-トランスフェラーゼ (GST) 、西洋ワサビペルオキシダーゼ (HRP) 、クロラムフェニコールアセチルトランスフェラーゼ (CAT) 、ベータ-ガラクトシダーゼ、ベータ-グルクロニダーゼ、ルシフェラーゼ、緑色蛍光タンパク質 (GFP) 、HcRed、DsRed、シアン蛍光タンパク質 (CFP) 、黄色蛍光タンパク質 (YFP) 、および青色蛍光タンパク質 (BFP) を含む自己蛍光タンパク質が含まれるが、これらに限定されない。追加のタンパク質配列には、DNA分子に結合するかまたは他の細胞分子に結合するアミノ酸配列が含まれてもよく、これらには、マルトース結合タンパク質 (MBP) 、Sタグ、Lex A DNA結合ドメイン (DBD) 融合体、GAL4 DNA結合ドメイン融合体、および単純ヘルペスウイルス (HSV) BP16タンパク質融合体が含まれるが、これらに限定されない。

いくつかの実施形態では、BhCas12bガイドポリヌクレオチドは、以下の配列を有する：
BhCas12b sgRNA 足場 (下線) + 20nt～23nt gガイド配列 (N_nによって示される)
5’GTTCTGTCTTTTGGTCAGGACAACCGTCTAGCTATAAGTGCTGCAGGGTGTGAGAAACTCCTATTGCTGGACGATGTCTCTTACGAGGCATTAGCACNNNNNNNNNNNNNNNNNNNN-3’

いくつかの実施形態では、BvCas12bおよびAaCas12b ガイドポリヌクレオチドは、以下の配列を有する：
BvCas12b sgRNA 足場 (下線) + 20nt～23nt gガイド配列 (N_nによって示される)
5’GACCTATAGGGTCAATGAATCTGTGCGTGTGCCATAAGTAATTAAAAATTACCCACCACAGGAGCACCTGAAAACAGGTGCTTGGCACNNNNNNNNNNNNNNNNNNNN-3’

AaCas12b sgRNA 足場 (下線) + 20nt～23nt gガイド配列 (N_nによって示される)
5’GTCTAAAGGACAGAATTTTTCAACGGGTGTGCCAATGGCCACTTTCCAGGTGGCAAAGCCCGTTGAACTTCTCAAAAAGAACGATCTGAGAAGTGGCACNNNNNNNNNNNNNNNNNNNN-3’

［アデノシンデアミナーゼバリアントおよびCas9ドメインを含む融合タンパク質を用いる方法］
本開示のいくつかの態様は、本明細書に提供される融合タンパク質または複合体を使用する方法を提供する。例えば、本開示のいくつかの態様は、タンパク質の突然変異型をコードするDNA分子を、本明細書中に提供される融合タンパク質のいずれか、および少なくとも1つのガイドRNAと接触させることを含む方法を提供し、ここで、ガイドRNAは、長さ約15～100ヌクレオチドであり、標的配列に相補的である少なくとも10の連続したヌクレオチドの配列を含む。いくつかの実施形態では、標的配列の3'端は、カノニカルPAM配列（NGG）にすぐ隣接している。いくつかの実施形態では、標的配列の3'端はカノニカルPAM配列（NGG）にすぐ隣接していない。いくつかの実施形態では、標的配列の3’端は、AGC、GAG、TTT、GTG、またはCAA配列にすぐ隣接している。いくつかの実施形態では、標的配列の3’端は、NGA、NGCG、NGN、NNGRRT、NNNRRT、NGCG、NGCN、NGTN、NGTN、NGTN、または5’ (TTTV) 配列にすぐ隣接している。

本明細書に開示するような、Cas9ドメインおよびアデノシンデアミナーゼバリアント（例えばABE8）を含む融合タンパク質のいずれかを標的部位、例えば、編集される突然変異を含む部位にターゲティングするためには、融合タンパク質をガイドRNA、例えばsgRNAとともに共発現させることが典型的に必要であることは当業者には明らかであろう。本明細書の他の箇所でより詳細に説明されるように、ガイドRNAは、典型的には、Cas9結合を可能にするtracrRNAフレームワークおよびCas9:核酸編集酵素/ドメイン融合タンパク質に配列特異性を付与するガイド配列を含む。あるいは、ガイドRNAおよびtracrRNAは、2つの核酸分子として別々に提供され得る。いくつかの実施形態では、ガイドRNAは、ガイド配列が標的配列に相補的な配列を含む構造を含む。ガイド配列は典型的には長さ20ヌクレオチドである。Cas9:核酸編集酵素/ドメイン融合タンパク質を特定のゲノム標的部位にターゲティングするための適切なガイドRNAの配列は、本開示に基づいて当業者に明らかであろう。そのような適切なガイドRNA配列は、典型的には、編集される標的ヌクレオチドの上流または下流50ヌクレオチド以内の核酸配列に相補的なガイド配列を含む。提供された融合タンパク質のいずれかを特定の標的配列にターゲティングするのに適したいくつかの例示的なガイドRNA配列が本明細書に提供される。

［塩基エディター効率］
CRISPR-Cas9ヌクレアーゼは、標的化ゲノム編集を仲介するために広く使用されている。ほとんどのゲノム編集適用において、Cas9はガイドポリヌクレオチド(例えばシングルガイドRNA (sgRNA))と複合体を形成し、sgRNA配列により指定される標的部位で二本鎖DNA切断 (DSB) を誘導する。細胞は主に非相同末端結合 (NHEJ) 修復経路を介してこのDSBに応答し、遺伝子を破壊するフレームシフト突然変異を生じ得る確率的挿入または欠失 (インデル) を生じる。DSBに隣接する配列と高度の相同性を有するドナーDNAテンプレートの存在下で、相同性指向性修復 (HDR) として知られる代替経路を介して遺伝子修正が達成され得る。残念ながら、ほとんどの非侵襲的条件下では、HDRは非効率であり、細胞状態および細胞タイプに依存し、より高いインデルの頻度によって支配される。ヒトの疾患に関連する既知の遺伝的変異の大部分は点突然変異であるため、より効率的かつクリーンに正確な点突然変異を作製できる方法が必要である。本明細書に提供される塩基編集システムは、二本鎖DNA切断を生じることなく、ドナーDNAテンプレートを必要とせず、かつ過剰な確率的挿入および欠失を誘導することなく、ゲノム編集を提供するための新しい方法を提供する。

本発明の融合タンパク質は、好適に、有意な割合のインデルを生成することなく、突然変異を含むタンパク質をコードする特定のヌクレオチド塩基を改変する。「インデル（indel）」という用語は、本明細書において使用される場合、核酸内のヌクレオチド塩基の挿入または欠失を指す。このような挿入または欠失は、遺伝子のコード領域内でフレームシフト突然変異を引き起こす可能性がある。いくつかの実施形態では、核酸内で多数の挿入（insertion）または欠失（deletion）（すなわちインデル：indel）を生じることなく、核酸内の特定のヌクレオチドを効率的に改変（例えば突然変異）する塩基エディターを生成することが望ましい。特定の実施形態では、本明細書に提供される塩基エディターのいずれも、インデルに対して意図される改変（例えば突然変異）のより大きな割合を生成することができる。

いくつかの実施形態では、本明細書で提供される塩基エディターシステムのいずれも、標的ポリヌクレオチド配列において、50%未満、40%未満、30%未満、20%未満、19%未満、18%未満、17%未満、16%未満、15%未満、14%未満、13%未満、12%未満、11%未満、10%未満、9%未満、8%未満、7%未満、6%未満、5%未満、4%未満、3%未満、2%未満、1%未満、0.9%未満、0.8%未満、0.7%未満、0.6%未満、0.5%未満、0.4%未満、0.3%未満、0.2%未満、0.1%未満、0.09%未満、0.08%未満、0.07%未満、0.06%未満、0.05%未満、0.04%未満、0.03%未満、0.02%未満、または0.01%未満のインデル形成をもたらす。

本開示のいくつかの態様は、本明細書に提供される任意の塩基エディターが、有意な数の非意図的な突然変異、例えば非意図的な点突然変異を生成することなく、核酸(例えば対象のゲノム内の核酸)において、意図される突然変異、例えば点突然変異を効率的に生成することができるという認識に基づく。いくつかの実施形態では、本明細書に提供される塩基エディターは、少なくとも0.01%の意図される突然変異(すなわち少なくとも0.01%の塩基編集効率)を生じることができる。いくつかの実施形態では、本明細書に提供される塩基エディターはいずれも、少なくとも0.01%、1%、2%、3%、4%、5%、10%、15%、20%、25%、30%、40%、45%、50%、60%、70%、80%、90%、95%、または99%の意図される突然変異を生成することができる。

いくつかの実施形態では、本明細書に提供される塩基エディターは、1:1より大きい、意図される点突然変異対インデルの比を生成することができる。いくつかの実施形態では、本明細書に提供される塩基エディターは、少なくとも1.5:1、少なくとも2:1、少なくとも2.5:1、少なくとも3:1、少なくとも3.5:1、少なくとも4:1、少なくとも4.5:1、少なくとも5:1、少なくとも5.5:1、少なくとも6:1、少なくとも6.5:1、少なくとも7:1、少なくとも7.5:1、少なくとも8:1、少なくとも10:1、少なくとも12:1、少なくとも15:1、少なくとも20:1、少なくとも25:1、少なくとも30:1、少なくとも40:1、少なくとも50:1、少なくとも100:1、少なくとも200:1、少なくとも300:1、少なくとも400:1、少なくとも500:1、少なくとも600:1、少なくとも700:1、少なくとも800:1、少なくとも900:1、もしくは少なくとも1000:1、またはそれより高い、意図される点突然変異対インデルの比を生じることができる。

意図される突然変異およびインデルの数は、例えば、国際PCT出願番号PCT/2017/045381 (WO2018/027078) およびPCT/US2016/058344 (WO2017/070632)；Komor, A.C., et al., “Programmable editing of a target base in genomic DNA without double-stranded DNA cleavage” Nature 533, 420-424 (2016); Gaudelli, N.M., et al., “Programmable base editing of A・T to G・C in genomic DNA without DNA cleavage” Nature 551, 464-471 (2017); および Komor, A.C., et al., “Improved base excision repair inhibition and bacteriophage Mu Gam protein yields C:G-to-T:A base editors with higher efficiency and product purity,” Science Advances 3:eaao4774 (2017)（その全内容は参照により本明細書に組み込まれる）に記載されているもののような、任意の適切な方法を用いて決定することができる。

いくつかの実施形態では、インデル頻度を計算するために、インデルが生じ得るウィンドウの両側に隣接する2つの10 bp配列に対する正確なマッチについて配列決定リードがスキャンされる。正確なマッチが見つからない場合、そのリードは解析から除外される。このインデルウィンドウの長さが参照配列と正確にマッチする場合、リードはインデルを含まないものとして分類される。インデルウィンドウが参照配列よりも2塩基以上長いかまたは短い場合、配列決定リードは、それぞれ挿入または欠失として分類される。いくつかの実施形態では、本明細書において提供される塩基エディターは、核酸の領域におけるインデルの形成を制限することができる。いくつかの実施形態では、その領域は、塩基エディターによって標的化されるヌクレオチドのところにあるか、または塩基エディターによって標的化されるヌクレオチドの2、3、4、5、6、7、8、9または10ヌクレオチド以内の領域である。

標的ヌクレオチド領域で形成されるインデルの数は、核酸(例えば細胞のゲノム内の核酸)が塩基エディターに曝露される時間の量に依存し得る。いくつかの実施形態では、インデルの数または割合は、標的ヌクレオチド配列(例えば細胞のゲノム内の核酸)を塩基エディターに曝露してから少なくとも1時間、少なくとも2時間、少なくとも6時間、少なくとも12時間、少なくとも24時間、少なくとも36時間、少なくとも48時間、少なくとも3日、少なくとも4日、少なくとも5日、少なくとも7日、少なくとも10日、または少なくとも14日後に決定される。本明細書に記載されるような塩基エディターの特徴は、本明細書に提供される融合タンパク質、または融合タンパク質を使用する方法のいずれにも適用され得ることが理解されるべきである。

いくつかの実施形態では、本明細書に提供される塩基エディターは、核酸領域中のインデルの形成を制限することが可能である。いくつかの実施形態では、領域は、塩基エディターによって標的化されるヌクレオチドのところにあるか、あるいは塩基エディターによって標的化されるヌクレオチドの2、3、4、5、6、7、8、9または10ヌクレオチド以内の領域である。いくつかの実施形態では、本明細書に提供される塩基エディターはいずれも、核酸領域でのインデルの形成を、1%未満、1.5%未満、2%未満、2.5%未満、3%未満、3.5%未満、4%未満、4.5%未満、5%未満、6%未満、7%未満、8%未満、9%未満、10%未満、12%未満、15%未満、または20%未満に限定することが可能である。核酸領域で形成されるインデルの数は、核酸（例えば細胞ゲノム内の核酸）が塩基エディターに曝露される時間量に応じ得る。いくつかの実施形態では、塩基エディターへの核酸（例えば細胞ゲノム内の核酸）の曝露の、少なくとも1時間後、少なくとも2時間後、少なくとも6時間後、少なくとも12時間後、少なくとも24時間後、少なくとも36時間後、少なくとも48時間後、少なくとも3日後、少なくとも4日後、少なくとも5日後、少なくとも7日後、少なくとも10日後、または少なくとも14日後、インデルの任意の数または比率を決定する。

本開示のいくつかの態様は、有意な数の意図されない突然変異を生じることなく、核酸（例えば対象のゲノム内の核酸）において、意図される突然変異を効率的に生じることが可能であるという認識に基づく。いくつかの実施形態では、意図される突然変異、HBG突然変異を改変または修正するために特に設計された、gRNAと結合された特定の塩基エディターによって生じる突然変異である。

いくつかの実施形態では、本明細書に提供される任意の塩基エディターは、1:1より大きい、意図されない突然変異に対する意図される突然変異の比（例えば意図される突然変異：意図されない突然変異）を生成することができる。いくつかの実施形態では、本明細書に提供される塩基エディターは、少なくとも1.5:1、少なくとも2:1、少なくとも2.5:1、少なくとも3:1、少なくとも3.5:1、少なくとも4:1、少なくとも4.5:1、少なくとも5:1、少なくとも5.5:1、少なくとも6:1、少なくとも6.5:1、少なくとも7:1、少なくとも7.5:1、少なくとも8:1、少なくとも10:1、少なくとも12:1、少なくとも15:1、少なくとも20:1、少なくとも25:1、少なくとも30:1、少なくとも40:1、少なくとも50:1、少なくとも100:1、少なくとも150:1、少なくとも200:1、少なくとも250:1、少なくとも500:1、または少なくとも1000:1、あるいはそれより高い、意図される突然変異対意図されない突然変異の比を生じることができる。本明細書に記載される塩基エディターの特性を、本明細書に提供される融合タンパク質またはこうした融合タンパク質を用いる方法のいずれに適用してもよいことを認識すべきである。

［多重編集］
いくつかの実施形態では、本明細書に提供される塩基エディターシステムは、1つ以上の遺伝子における複数の核酸塩基対の多重編集を可能にする。いくつかの実施形態では、複数の核酸塩基対は、同一遺伝子中に位置する。いくつかの実施形態では、複数の核酸塩基対は、1つ以上の遺伝子に位置し、ここで、少なくとも1つの遺伝子は、異なる遺伝子座に位置する。いくつかの実施形態では、多重編集は、1つ以上のガイドポリヌクレオチドを含むことができる。いくつかの実施形態では、多重編集は、1つ以上の塩基エディターシステムを含むことができる。いくつかの実施形態では、多重編集は、シングルガイドポリヌクレオチドを有する1つ以上の塩基エディターシステムを含むことができる。いくつかの実施形態では、多重編集は、複数のガイドポリヌクレオチドを有する1つ以上の塩基エディターシステムを含むことができる。いくつかの実施形態では、多重編集は、単一塩基エディターシステムを有する1つ以上のガイドポリヌクレオチドを含むことができる。いくつかの実施形態では、多重編集は、標的ポリヌクレオチド配列への結合を標的化するためにPAM配列を必要としない少なくとも1つのガイドポリヌクレオチドを含むことができる。いくつかの実施形態では、多重編集は、標的ポリヌクレオチド配列への結合を標的化するためにPAM配列を必要とする少なくとも1つのガイドポリヌクレオチドを含むことができる。いくつかの実施形態では、多重編集は、標的ポリヌクレオチド配列への結合を標的化するためにPAM配列を必要としない少なくとも1つのガイドポリヌクレオチド、および標的ポリヌクレオチド配列への結合を標的化するためにPAM配列を必要とする少なくとも1つのガイドポリヌクレオチドの混合物を含むことができる。本明細書に記載されるような塩基エディターのいずれかを使用する多重編集の特徴は、本明細書に提供される塩基エディターのいずれかを使用する方法の任意の組み合わせに適用され得ることを認識すべきである。また、本明細書に記載されるような塩基エディターのいずれかを使用する多重編集は、複数の核酸塩基対の順次的編集を含むことができることを認識すべきである。

いくつかの実施形態では、複数の核酸塩基対は、1つ以上の遺伝子中にある。いくつかの実施形態では、複数の核酸塩基対は、同じ遺伝子中にある。いくつかの実施形態では、もう1つの遺伝子における少なくとも1つの遺伝子は、異なる遺伝子座に位置する。

いくつかの実施形態では、編集は、少なくとも1つのタンパク質コード領域における複数の核酸塩基対の編集である。いくつかの実施形態では、編集は、少なくとも1つのタンパク質非コード領域における複数の核酸塩基対の編集である。いくつかの実施形態では、編集は、少なくとも1つのタンパク質コード領域および少なくとも1つのタンパク質非コード領域における複数の核酸塩基対の編集である。

いくつかの実施形態では、編集は、1つ以上のガイドポリヌクレオチドを伴う。いくつかの実施形態では、塩基エディターシステムは、1つ以上の塩基エディターシステムを含むことができる。いくつかの実施形態では、塩基エディターシステムは、シングルガイドポリヌクレオチドとともに1つ以上の塩基エディターシステムを含むことができる。いくつかの実施形態では、塩基エディターシステムは、複数のガイドポリヌクレオチドとともに1つ以上の塩基エディターシステムを含むことができる。いくつかの実施形態では、編集は、単一の塩基エディターシステムを有する1つ以上のガイドポリヌクレオチドを伴う。いくつかの実施形態では、編集は、標的ポリヌクレオチド配列への結合を標的化するためにPAM配列を必要としない少なくとも1つのガイドポリヌクレオチドを伴う。いくつかの実施形態では、編集は、標的ポリヌクレオチド配列への結合を標的化するためにPAM配列を必要とする少なくとも1つのガイドポリヌクレオチドを伴う。いくつかの実施形態では、編集は、標的ポリヌクレオチド配列への結合を標的化するためにPAM配列を必要としない少なくとも1つのガイドポリヌクレオチド、および標的ポリヌクレオチド配列への結合を標的化するためにPAM配列を必要とする少なくとも1つのガイドポリヌクレオチドの混合物を伴う。本明細書に記載される塩基エディターのいずれかを使用する多重編集の特徴は、本明細書に提供される塩基エディターのいずれかを使用する方法の任意の組み合わせに適用され得ることを認識すべきである。また、編集は、複数の核酸塩基対の順次的編集を含むことができることを認識すべきである。

［核酸を編集するための方法］
本開示のいくつかの態様は、核酸を編集するための方法を提供する。いくつかの実施形態では、本方法は、タンパク質をコードする核酸分子の核酸塩基（例えば二本鎖DNA配列の塩基対）を編集するための方法である。いくつかの実施形態では、本方法は：a) 核酸（例えば二本鎖DNA配列）の標的領域を、塩基エディターおよびガイド核酸（例えばgRNA）を含む複合体と接触させる工程と、b) 前記標的領域の鎖分離を誘導する工程と、c) 標的領域の一本鎖における前記標的核酸塩基対の第一の核酸塩基を第二の核酸塩基に変換する工程と、d) nCas9を用いて、前記標的領域の、一本を超えない数の鎖を切断する工程とを含み、ここで、第一の核酸塩基に相補的な第三の核酸塩基が、第二の核酸塩基に相補的な第四の核酸塩基によって置き換えられる。いくつかの実施形態では、本方法は、核酸において20%未満のインデル形成をもたらす。いくつかの実施形態では、工程bが省略されることが理解されるべきである。いくつかの実施形態では、本方法は、19%未満、18%未満、16%未満、14%未満、12%未満、10%未満、8%未満、6%未満、4%未満、2%未満、1%未満、0.5%未満、0.2%未満、または0.1%未満のインデル形成をもたらす。いくつかの実施形態では、本方法は、第二の核酸塩基を、第四の核酸塩基に相補的な第五の核酸塩基で置き換え、それによって意図される編集塩基対（例えばG・CからA・T）を生成することをさらに含む。いくつかの実施形態では、意図される塩基対の少なくとも5%が編集される。いくつかの実施形態では、意図される塩基対の少なくとも10%、15%、20%、25%、30%、35%、40%、45%、または50%が編集される。

いくつかの実施形態では、標的ヌクレオチドにおける意図される産物対意図されない産物の比は、少なくとも2:1、少なくとも5:1、少なくとも10:1、少なくとも20:1、少なくとも30:1、少なくとも40:1、少なくとも50:1、少なくとも60:1、少なくとも70:1、少なくとも80:1、少なくとも90:1、少なくとも100:1、もしくは少なくとも200:1、またはそれより大きい。いくつかの実施形態では、意図される突然変異対インデル形成の比は、1:1超、10:1超、50:1超、100:1超、500:1超、もしくは1000:1超、またはそれより大きい。いくつかの実施形態では、切断された一本鎖（ニック鎖）が、ガイド核酸にハイブリダイズされる。いくつかの実施形態では、切断された一本鎖は、第一の核酸塩基を含む鎖とは反対の鎖である。いくつかの実施形態では、塩基エディターはdCas9ドメインを含む。いくつかの実施形態では、塩基エディターは、編集されていない鎖を保護するかまたはこうした鎖に結合する。いくつかの実施形態では、意図される編集塩基対は、PAM部位の上流にある。いくつかの実施形態では、意図される編集塩基対は、PAM部位の1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、または20ヌクレオチド上流である。いくつかの実施形態では、意図される編集塩基対は、PAM部位の下流にある。いくつかの実施形態では、意図される編集塩基対は、PAM部位の1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、または20ヌクレオチド下流にある。いくつかの実施形態では、本方法は、カノニカルな（例えばNGG）PAMサイトを必要としない。いくつかの実施形態では、核酸塩基エディターはリンカーを含む。いくつかの実施形態では、リンカーは、長さ1～25アミノ酸である。いくつかの実施形態では、リンカーは、長さ5～20アミノ酸である。いくつかの実施形態では、リンカーは、長さ10、11、12、13、14、15、16、17、18、19、または20アミノ酸である。一実施形態では、リンカーは、長さ32アミノ酸である。別の実施形態では、「長いリンカー（long linker）」は、長さ少なくとも約60アミノ酸である。他の実施形態では、リンカーは、長さ約3～100アミノ酸の間である。いくつかの実施形態では、標的領域は標的ウィンドウを含み、標的ウィンドウは標的核酸塩基対を含む。ある実施形態では、標的ウィンドウは、1～10ヌクレオチドを含む。いくつかの実施形態では、標的ウィンドウは、長さ1～9、1～8、1～7、1～6、1～5、1～4、1～3、1～2、または1ヌクレオチドである。いくつかの実施形態では、標的ウィンドウは、長さ1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、または20ヌクレオチドである。いくつかの実施形態では、意図される編集塩基対は、標的ウィンドウ内にある。いくつかの実施形態では、標的ウィンドウは、意図される編集塩基対を含む。いくつかの実施形態では、本方法は、本明細書に提供される塩基エディターのいずれかを用いて実施される。

いくつかの実施形態では、本開示は、ヌクレオチド（例えばタンパク質をコードする遺伝子中のSNP）を編集するための方法を提供する。いくつかの実施形態では、本開示は、二本鎖DNA配列の核酸塩基対を編集するための方法を提供する。いくつかの実施形態では、本方法は、a) 二本鎖DNA配列の標的領域を、塩基エディターおよびガイド核酸（例えばgRNA）を含む複合体と接触させ、ここで、標的領域が標的核酸塩基対を含む、工程と、b) 前記標的領域の鎖分離を誘導する工程と、c) 標的領域の一本鎖における前記標的核酸塩基対の第一の核酸塩基を第二の核酸塩基に変換する工程と、d) 前記標的領域の一本を超えない数の鎖を切断する工程と、を含み、ここで、第一の核酸塩基に相補的な第三の核酸塩基が、第二の核酸塩基に相補的な第四の核酸塩基によって置き換えられ、第二の核酸塩基が、第四の核酸塩基に相補的な第五の核酸塩基によって置き換えられ、それによって、意図される編集塩基対を生成し、ここで意図される編集塩基対を生成する効率は少なくとも5%である。いくつかの実施形態では、工程bは省略されることが認識されるべきである。いくつかの実施形態では、意図される塩基対の少なくとも5%が編集される。いくつかの実施形態では、意図される塩基対の少なくとも10%、15%、20%、25%、30%、35%、40%、45%、または50%が編集される。いくつかの実施形態では、本方法は、19%未満、18%未満、16%未満、14%未満、12%未満、10%未満、8%未満、6%未満、4%未満、2%未満、1%未満、0.5%未満、0.2%未満、または0.1%未満のインデル形成を引き起こす。いくつかの実施形態では、標的ヌクレオチドでの意図される産物対意図されない産物の比は、少なくとも2:1、少なくとも5:1、少なくとも10:1、少なくとも20:1、少なくとも30:1、少なくとも40:1、少なくとも50:1、少なくとも60:1、少なくとも70:1、少なくとも80:1、少なくとも90:1、少なくとも100:1、もしくは少なくとも200:1、またはそれより大きい。いくつかの実施形態では、意図される突然変異対インデル形成の比は、1:1超、10:1超、50:1超、100:1超、500:1超、もしくは1000:1超、またはそれより大きい。いくつかの実施形態では、切断された一本鎖が、ガイド核酸にハイブリダイズされる。いくつかの実施形態では、切断された一本鎖は、第一の核酸塩基を含む鎖とは反対の鎖である。いくつかの実施形態では、意図される編集塩基対は、PAM部位の上流にある。いくつかの実施形態では、意図される編集塩基対は、PAM部位の1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、または20ヌクレオチド上流である。いくつかの実施形態では、意図される編集塩基対は、PAM部位の下流にある。いくつかの実施形態では、意図される編集塩基対は、PAM部位の1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、または20ヌクレオチド下流にある。いくつかの実施形態では、本方法は、カノニカル（例えばNGG）PAMサイトを必要としない。いくつかの実施形態では、リンカーは、長さ1～25アミノ酸である。いくつかの実施形態では、リンカーは、長さ5～20アミノ酸である。ある実施形態では、リンカーは、長さ10、11、12、13、14、15、16、17、18、19、または20アミノ酸である。いくつかの実施形態では、標的領域は標的ウィンドウを含み、標的ウィンドウは標的核酸塩基対を含む。いくつかの実施形態では、標的ウィンドウは、1～10ヌクレオチドを含む。いくつかの実施形態では、標的ウィンドウは、長さ1～9、1～8、1～7、1～6、1～5、1～4、1～3、1～2、または1ヌクレオチドである。いくつかの実施形態では、標的ウィンドウは、長さ1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、または20ヌクレオチドである。いくつかの実施形態では、意図される編集塩基対は、標的ウィンドウ内で起こる。いくつかの実施形態では、標的ウィンドウは、意図される編集塩基対を含む。いくつかの実施形態では、核酸塩基エディターは、本明細書に提供される塩基エディターのいずれかである。

［宿主細胞における融合タンパク質の発現］
アデノシンデアミナーゼバリアントを含む本発明の融合タンパク質は、当業者に知られるルーチンの方法を用いて、細菌、酵母、真菌、昆虫、植物、および動物細胞を含むがこれらに限定されない実質的に任意の関心対象の宿主細胞において発現され得る。例えば、cDNA配列に基づいて、CDSの上流および下流に対する適切なプライマーを設計することによって、本発明のアデノシンデアミナーゼをコードするDNAをクローニングしてもよい。クローニングされたDNAを直接、または望ましい場合には制限酵素で消化した後、あるいは適切なリンカーおよび/または核局在化シグナルの付加後、塩基編集システムの1つ以上の追加の構成要素をコードするDNAと連結してもよい。塩基編集システムは、宿主細胞において翻訳されて、複合体を形成する。

本明細書中に記載されるタンパク質ドメインをコードするDNAは、DNAを化学的に合成することによって、またはPCR法およびGibsonアセンブリ法を利用することによって、合成された部分的に重複するオリゴDNA短鎖を連結してその全長をコードするDNAを構築することにより、得られ得る。化学合成またはPCR法もしくはGibsonアセンブリ法の組み合わせによって全長DNAを構築する利点は、DNAを導入する宿主にしたがって、CDS全長で、用いるコドンを設計可能であることである。異種DNAの発現において、タンパク質発現レベルは、DNA配列を、宿主生物において非常に頻繁に用いられるコドンに変換することによって、増加すると予期される。使用しようとする宿主におけるコドン使用頻度のデータとしては、例えばかずさDNA研究所のホームページに開示されている遺伝子コード使用頻度データベース（http://www.kazusa.or.jp/codon/index.html）を用いてもよいし、または各宿主におけるコドン使用頻度を示す文書を参照してもよい。得られたデータおよび導入しようとするDNA配列を参照することによって、DNA配列に関して用いられるものの中から、宿主において低い使用頻度を示すコドンを、同じアミノ酸をコードし、かつ高い使用頻度を示すコドンに変換してもよい。

例えば、適切な発現ベクター中のプロモーター下流にDNAを連結することによって、核酸配列認識モジュールおよび/または核酸塩基変換酵素をコードするDNAを含有する発現ベクターを産生してもよい。

発現ベクターとして、Escherichia coli由来プラスミド（例えばpBR322、pBR325、pUC12、pUC13）；Bacillus subtilis由来プラスミド（例えばpUB110、pTP5、pC194）；酵母由来プラスミド（例えばpSH19、pSH15）；昆虫細胞発現プラスミド（例えばpFast-Bac）；動物細胞発現プラスミド（例えばpA1-11、pXT1、pRc/CMV、pRc/RSV、pcDNAI/Neo）；ラムダファージなどのバクテリオファージ；バキュロウイルスなどの昆虫ウイルスベクター（例えばBmNPV、AcNPV）；レトロウイルス、ワクシニアウイルス、アデノウイルスなど、動物ウイルスベクター等を用いる。

プロモーターとして、遺伝子発現のために用いられる、宿主に適した任意のプロモーターを用いてもよい。DSBを用いた慣用法では、宿主細胞の生存率は、ときに、毒性のため、顕著に減少するため、誘導性プロモーターを用いることによる誘導の開始によって、細胞の数を増加させることが望ましい。しかし、本発明の核酸改変酵素複合体を発現させることによって、十分な細胞増殖がまた提供され得るため、制限なしに恒常的プロモーター（constitution promoter）もまた、用いてもよい。

例えば、宿主が動物細胞である場合には、SRアルファプロモーター、SV40プロモーター、LTRプロモーター、CMV (サイトメガロウイルス) プロモーター、RSV (ラウス肉腫ウイルス)プロモーター、MoMuLV (モロニーマウス白血病ウイルス) LTR、HSV-TK (単純ヘルペスウイルスチミジンキナーゼ)プロモーター等が用いられる。これらのうち、CMVプロモーター、SRアルファプロモーター等が好ましい。

宿主がEscherichia coliである場合、trpプロモーター、lacプロモーター、recAプロモーター、ラムダP_Lプロモーター、lppプロモーター、T7プロモーター等が好ましい。

宿主がBacillus属である場合、SPO1プロモーター、SPO2プロモーター、penPプロモーター等が好ましい。

宿主が酵母の場合には、Gal1/10プロモーター、PHO5プロモーター、PGKプロモーター、GAPプロモーター、ADHプロモーター等が好ましい。

宿主が昆虫細胞である場合には、ポリヘドリンプロモーター、P10プロモーター等が好ましい。

宿主が植物細胞である場合、CaMV35Sプロモーター、CaMV19Sプロモーター、NOSプロモーター等が好ましい。

発現ベクターとして、上述のものに加えて、オン・デマンドで、エンハンサー、スプライシングシグナル、ターミネーター、ポリA付加シグナル、選択マーカー、例えば、薬剤耐性遺伝子、栄養要求性相補遺伝子等、複製起点等を含有するものを用いてもよい。

本明細書に記載されるタンパク質ドメインをコードするRNAは、例えば、上述の核酸配列認識モジュールおよび/または核酸塩基変換酵素をコードするDNAをコードするベクターをテンプレートとして用いることにより、それ自体公知であるin vitro転写システムにおいてmRNAに転写することによって調製することができる。

核酸配列認識モジュールおよび/または核酸塩基変換酵素をコードするDNAを含有する発現ベクターを宿主細胞に導入し、該宿主細胞を培養することにより、本発明の融合タンパク質を細胞内で発現させることができる。

宿主としてEscherichia属、Bacillus属、酵母、昆虫細胞、動物細胞等を用いる。

Escherichia属として、Escherichia coli K12.cndot.DH1［Proc. Natl. Acad. Sci. USA, 60, 160 (1968)］、Escherichia coli JM103［Nucleic Acids Research, 9, 309 (1981)］、Escherichia coli JA221［Journal of Molecular Biology, 120, 517 (1978)］、Escherichia coli HB101［Journal of Molecular Biology, 41, 459 (1969)］、Escherichia coli C600［Genetics, 39, 440 (1954)］等を用いる。

Bacillus属として、Bacillus subtilis M1114 [Gene, 24, 255 (1983)]、Bacillus subtilis 207-21 [Journal of Biochemistry, 95, 87 (1984)] 等を用いる。

酵母として、Saccharomyces cerevisiae AH22、AH22R^-、NA87-11A、DKD-5D、20B-12、Schizosaccharomyces pombe NCYC1913、NCYC2036、Pichia pastoris KM71等を用いる。

ウイルスがAcNPVである場合、昆虫細胞として、ヨトウガ（cabbage armyworm）幼虫由来樹立株の細胞（Spodoptera frugiperda細胞；Sf細胞）、Trichoplusia niの中腸由来MG1細胞、Trichoplusia niの卵由来のHigh Five TM細胞、Mamestra brassicae由来細胞、Estigmena acrea由来細胞等が用いられる。ウイルスがBmNPVの場合には、昆虫細胞としてBombyx mori由来樹立株の細胞（Bombyx mori N 細胞；BmN細胞）等を用いる。Sf細胞としては、例えば、Sf9細胞（ATCC CRL1711）、Sf 21細胞［上記すべて、In Vivo, 13, 213-217 (1977)］等を用いる。

昆虫として、例えば、Bombyx moriの幼虫、Drosophila、コオロギ等を用いる[Nature, 315,592 (1985)]。

動物細胞として、サルCOS-7細胞、サルVero細胞、チャイニーズハムスター卵巣 (CHO) 細胞、dhfr遺伝子欠損CHO細胞、マウスL細胞、マウスAtT-20細胞、マウスミエローマ細胞、ラットGH3細胞、ヒトFL細胞など、ヒトおよび他の哺乳動物のiPS細胞、ES細胞などの多能性幹細胞、ならびに多様な組織から調製された初代培養細胞が使用される。さらに、ゼブラフィッシュ胚、Xenopus卵母細胞などを用いることもできる。

植物細胞として、多様な植物（例えば、イネ、コムギ、トウモロコシ等の穀物、トマト、キュウリ、ナス等の生産作物、カーネーション、Eustoma russellianum等の園芸植物、タバコ、Arabidopsis thaliana等の実験植物等）から調製される、懸濁培養細胞、カルス、プロトプラスト、葉断片、根断片等を用いる。

上記の宿主細胞はすべて、ハプロイド（一倍体）または倍数体（例えば二倍体、三倍体、四倍体など）であり得る。慣用的な突然変異導入法では、突然変異は、原則として、1つの相同染色体内にのみ導入されて、ヘテロ遺伝子型を生じる。従って、望ましい表現型は、ドミナント突然変異が起こらない限り発現されず、かつホモ接合は不都合に労力と時間を要する。対照的に、本発明に従えば、突然変異は、ゲノム中の相同染色体上の任意のアレルに導入され得るため、劣性突然変異の場合であっても単一の世代で所望の表現型を発現可能であり、これは慣用法の問題を解決し得るため、非常に有用である。

宿主の種類に従って、公知の方法（例えばリゾチーム法、コンピテント法、PEG法、CaCl₂共沈法、エレクトロポレーション法、マイクロインジェクション法、粒子銃法、リポフェクション法、アグロバクテリウム法等）によって発現ベクターを導入してもよい。

Escherichia coliは、例えばProc. Natl. Acad. Sci. USA, 69, 2110 (1972)、Gene, 17, 107 (1982)等に記載された方法に従って形質転換され得る。

Bacillus属には、例えば、Molecular & General Genetics, 168, 111 (1979) 等に記載される方法に従って、ベクターが導入され得る。

酵母には、例えばMethods in Enzymology, 194, 182-187 (1991)、Proc. Natl. Acad. Sci. USA, 75, 1929 (1978) 等に記載される方法に従って、ベクターが導入され得る。

昆虫細胞および昆虫には、例えばBio/Technology, 6, 47-55 (1988)等に記載される方法に従って、ベクターが導入され得る。

動物細胞には、例えば、Cell Engineering additional volume 8, New Cell Engineering Experiment Protocol, 263-267 (1995)（秀潤社刊行）、およびVirology, 52, 456 (1973) に記載される方法に従って、ベクターが導入され得る。

ベクターを導入された細胞は、宿主の種類に従った公知の方法に従って培養され得る。

例えば、Escherichia coliまたはBacillus属を培養する場合、培養に用いる培地としては、液体培地が好ましい。培地は、好ましくは、炭素源、窒素源、無機物質、および形質転換体の成長に必要な他の成分を含有する。炭素源の例には、グルコース、デキストリン、可溶性デンプン、スクロースなどが含まれる。窒素源の例には、アンモニウム塩、硝酸塩、コーンスティープリカー、ペプトン、カゼイン、肉エキス、大豆かす、ジャガイモエキス等のような無機または有機物質が含まれ、無機物質には、塩化カルシウム、リン酸二水素ナトリウム、塩化マグネシウム等が含まれる。培地はまた、酵母エキス、ビタミン、成長促進因子などを含有してもよい。培地のpHは好ましくは約5～約8である。

Escherichia coliを培養するための培地としては、例えば、グルコース、カザミノ酸を含有するM 9培地［Journal of Experiments in Molecular Genetics, 431-433, Cold Spring Harbor Laboratory, New York 1972］が好ましい。必要な場合、例えば、3.ベータ-インドリルアクリル酸などの剤を培地に添加して、プロモーターの効率的な機能を確実にしてもよい。Escherichia coliは通常約15～約43℃で培養される。必要な場合、曝気および攪拌を行ってもよい。

Bacillus属は一般に約30～約40°Cで培養される。必要な場合、曝気および攪拌を行ってもよい。

酵母培養用の培地の例には、バークホルダー最少培地［Proc. Natl. Acad. Sci. USA, 77, 4505 (1980)］、0.5%カザミノ酸含有SD培地［Proc. Natl. Acad. Sci. USA, 81, 5330 (1984)］等が含まれる。培地のpHは好ましくは約5～約8である。培養は、一般に約20℃～約35℃で行う。必要な場合、曝気および攪拌を行ってもよい。

昆虫細胞や昆虫を培養するための培地としては、適切なように、不活化10%ウシ血清などの添加物を含有するグレース昆虫培地（Nature, 195, 788 (1962)）等が用いられる。培地のpHは好ましくは約6.2～約6.4である。培養は一般的に約27℃で実行される。必要な場合、曝気および撹拌を行ってもよい。

動物細胞を培養するための培地として、例えば、約5～約20%のウシ胎児血清を含有する最小必須培地 (MEM)[Science, 122, 501 (1952)]、Dulbecco修正イーグル培地 (DMEM)[Virology, 8, 396 (1959)]、RPMI 1640培地[The Journal of the American Medical Association, 199, 519 (1967)]、199培地[Proceeding of the Society for the Biological Medicine, 73, 1 (1950)]等を用いる。培地のpHは好ましくは約6～約8である。培養は、約30℃～約40℃で行われる。必要な場合、曝気および撹拌を行ってもよい。

植物細胞を培養するための培地として、例えば、MS培地、LS培地、B5培地等が用いられる。培地のpHは好ましくは約5～約8である。培養は、一般に約20℃～約30℃で行われる。必要な場合、曝気および攪拌を行ってもよい。

より高次の真核細胞、例えば動物細胞、昆虫細胞、植物細胞等を宿主細胞として用いる場合、本発明の塩基編集システムをコードする（例えばアデノシンデアミナーゼバリアントを含む）DNAを、誘導性プロモーター（例えばメタロチオネインプロモーター（重金属イオンによって誘導される）、熱ショックタンパク質プロモーター（熱ショックによって誘導される）、Tet-ON/Tet-OFFシステムプロモーター（テトラサイクリンまたはその誘導体の添加または除去によって誘導される）、ステロイド応答性プロモーター（ステロイドホルモンまたはその誘導体によって誘導される）等）の制御下で、宿主細胞内に導入して、適切な段階で誘導剤を培地に添加して（または培地から除去して）、核酸改変酵素複合体の発現を誘導し、所定の期間、培養を行って、塩基編集および標的遺伝子内への突然変異の導入を実行し、塩基編集システムの一過性発現を達成する。

Escherichia coliなどの原核細胞は誘導性プロモーターを利用することができる。誘導性プロモーターの例には、lacプロモーター（IPTGによって誘導される）、cspAプロモーター（寒冷ショックによって誘導される）、araBADプロモーター（アラビノースによって誘導される）などが含まれるが、これらに限定されない。

あるいは、より高次の真核細胞、例えば動物細胞、昆虫細胞、植物細胞等を宿主細胞として用いる場合、上述の誘導性プロモーターをベクター除去機構として利用してもよい。すなわち、ベクターには、宿主細胞において機能する複製起点、および複製のために必要なタンパク質をコードする核酸（例えば動物細胞に関しては、SV40 onおよびラージT抗原、oriPおよびEBNA-1等）が搭載され、タンパク質をコードする核酸の発現は、上述の誘導性プロモーターによって制御される。その結果、ベクターは誘導物質の存在下で自律性に複製可能である一方、誘導物質が除去されると、自律性複製は利用可能でなくなり、ベクターは、細胞分裂とともに自然に脱落する（自律性複製は、Tet-OFFシステムベクターにおいては、テトラサイクリンおよびドキシサイクリンの添加によって可能でなくなる）。

［送達システム］
［核酸塩基エディターおよびgRNAの核酸に基づく送達］
当技術分野に公知の方法によって、または本明細書に記載されるように、本開示に従った塩基編集システムをコードする核酸を対象に投与するか、あるいはin vitroまたはin vivoで細胞内に送達してもよい。一実施形態では、例えばベクター（例えばウイルスまたは非ウイルスベクター）、ベクターに基づかない方法（例えば裸のDNA、DNA複合体、脂質ナノ粒子）、またはその組み合わせによって、核酸塩基エディターを送達してもよい。一実施形態では、核酸塩基エディターを細胞（例えば肝細胞、胚性幹細胞、人工多能性幹細胞（iPSC）、オルガノイド）に選択的に送達する。他の実施形態では、核酸塩基エディターをコードする核酸を、アルファ1アンチトリプシン（A1AT）遺伝子に突然変異を含む肝（肝臓）細胞もしくはその前駆細胞、および/または人工多能性幹細胞に送達する。こうした細胞を用いて、アルファ1アンチトリプシン遺伝子編集の機能的効果をアッセイしてもよい。一実施形態では、改変アルファ1アンチトリプシン遺伝子の効果を肝細胞において調べる。

核酸塩基エディターをコードする核酸を、例えばトランスフェクションまたはエレクトロポレーションによって、裸のDNAまたはRNAとして細胞（例えば造血細胞またはその前駆細胞、造血幹細胞、および/または人工多能性幹細胞）に直接送達してもよいし、あるいは、標的細胞による取り込みを促進する分子（例えばN-アセチルガラクトサミン）にコンジュゲート化させてもよい。本明細書に記載するベクターなどの核酸ベクターもまた使用できる。

核酸ベクターは、本明細書に記載される融合タンパク質のドメインをコードする1つ以上の配列を含むことができる。ベクターはまた、タンパク質をコードする配列に付随する（例えば、挿入されているか、融合されている）シグナルペプチド（例えば、核局在化、核小体局在化、またはミトコンドリア局在化のためのもの）をコードする配列も含むことができる。一例として、核酸ベクターは、1つ以上の核局在化配列（例えばSV40からの核局在化配列）を含むCas9コード配列、およびアデノシンデアミナーゼバリアント（例えばABE8）を含むことができる。

核酸ベクターはまた、任意の適切な数の調節/制御要素、例えばプロモーター、エンハンサー、イントロン、ポリアデニル化シグナル、Kozakコンセンサス配列、または内部リボソームエントリー部位 (IRES) も含むことができる。これらの要素は当技術分野でよく知られている。造血細胞に関しては、適切なプロモーターにはIFNベータまたはCD45が含まれ得る。

本開示による核酸ベクターは、組換えウイルスベクターを含む。例示的なウイルスベクターを本明細書に示す。当技術分野で知られる他のウイルスベクターも使用することができる。さらに、ウイルス粒子を用いて、核酸および/またはペプチドの形態の塩基編集システム構成要素を送達することができる。例えば、「空の」ウイルス粒子は、任意の適切なカーゴを含有するように組み立てられ得る。ウイルスベクターおよびウイルス粒子はまた、標的指向化リガンドを組み込んで標的組織特異性を変化させるように操作することができる。

ウイルス性ベクターに加えて、本開示に従ったゲノム編集システムをコードする核酸を送達するために非ウイルス性ベクターを用いてもよい。非ウイルス性核酸ベクターの1つの重要なカテゴリーは、有機または無機であり得るナノ粒子である。ナノ粒子は当技術分野でよく知られている。任意の適切なナノ粒子設計を用いて、ゲノム編集システム構成要素またはそのような構成要素をコードする核酸を送達することができる。例えば、有機（例えば、脂質および/またはポリマー）ナノ粒子が、本開示の特定の実施形態における送達ビヒクルとして使用に適している可能性もある。ナノ粒子配合物、および/または遺伝子導入において使用するための例示的な脂質を、下記表10に示す。

表11は、遺伝子トランスファーおよび/またはナノ粒子配合物において使用するための例示的なポリマーを列挙する。

表12は、本明細書記載の融合タンパク質をコードするポリヌクレオチドのための送達法を要約する。

別の態様において、例えばCas9もしくはそのバリアントなどの核酸結合タンパク質および関心対象のゲノム核酸配列を標的とするgRNAのような、ゲノム編集システム構成要素またはそのような構成要素をコードする核酸の送達は、リボ核タンパク質 (RNP) を細胞に送達することによって達成され得る。RNPは、標的化gRNAと複合体形成した核酸結合タンパク質、例えばCas9を含む。RNPは、エレクトロポレーション、ヌクレオフェクション、またはカチオン性脂質仲介法、例えば、Zuris, J.A. et al., 2015, Nat. Biotechnology, 33(1):73-80によって報告されているもののような、公知の方法を用いて細胞に送達することができる。RNPは、CRISPR塩基編集システムにおける使用のために好適であり、特に初代細胞のようなトランスフェクションが困難な細胞のために好適である。さらに、RNPはまた、細胞におけるタンパク質発現で起こり得る困難を軽減することもでき、特に、CRISPRプラスミドにおいて使用され得るCMVまたはEF1Aなどの真核プロモーターがよく発現されない場合にはそうである。好適なことに、RNPの使用は、細胞への外来DNAの送達を必要としない。さらに、核酸結合タンパク質およびgRNA複合体を含むRNPは、経時的に分解されるため、RNPの使用は、オフターゲット効果を制限する可能性を有する。プラスミドに基づく技術の場合と同様の方法で、RNPは、結合タンパク質(例えばCas9バリアント) を送達するために、そして相同性指向性修復（HDR）を導くために使用され得る。

核酸分子発現をコードする塩基エディターを駆動するために使用されるプロモーターは、AAV ITRを含み得る。これは、ベクター中のスペースを占領してしまい得る追加のプロモーター要素の必要性を排除するために有利であり得る。解放された追加のスペースは、ガイド核酸または選択可能マーカーなどの追加の要素の発現を駆動するために使用することができる。ITR活性は比較的弱いので、これは選択したヌクレアーゼの過剰発現による潜在的毒性を低減するために使用できる。

塩基エディター、および適切な場合、ガイド核酸の発現を駆動するため、任意の適切なプロモーターを用いてもよい。遍在性の発現のため、用いてもよいプロモーターには、CMV、CAG、CBh、PGK、SV40、フェリチン重鎖または軽鎖等が含まれる。脳または他のCNS細胞発現のため、適切なプロモーターには：すべてのニューロンに関してシナプシンI、興奮性ニューロンに関してはCaMKIIアルファ、GABA作動性ニューロンに関してはGAD67またはGAD65またはVGAT等が含まれる。肝細胞での発現に関しては、適切なプロモーターには、アルブミンプロモーターが含まれ得る。肺細胞の発現に関しては、適切なプロモーターにはSP-Bプロモーターが含まれ得る。内皮細胞に関しては、適切なプロモーターにはICAMプロモーターが含まれ得る。造血細胞に関しては、適切なプロモーターにはIFNベータまたはCD45プロモーターが含まれ得る。骨芽細胞に関しては、適切なプロモーターにはOG-2が含まれ得る。

いくつかの実施形態では、本開示の塩基エディターは、同じ核酸分子内で別々のプロモーターが塩基エディターおよび適合性ガイド核酸の発現を駆動することを可能にするのに十分に小さいサイズである。例えば、ベクターまたはウイルスベクターは、塩基エディターをコードする核酸に機能可能であるように連結された第一のプロモーター、およびガイド核酸に機能可能であるように連結された第二のプロモーターを含むことができる。

ガイド核酸の発現を駆動するために使用されるプロモーターには、U6またはH1などのPol IIIプロモーター、gRNAアデノ随伴ウイルス (AAV) を発現するためのPol IIプロモーターとイントロンのカセットの使用が含まれ得る。

［ウイルスベクター］
従って、本明細書記載の塩基エディターをウイルスベクターで送達してもよい。いくつかの実施形態では、本明細書に開示する塩基エディターは、ウイルスベクター中に含有される核酸上にコードされてもよい。いくつかの実施形態では、塩基エディターシステムの1つ以上の構成要素が1つ以上のウイルスベクター上にコードされてもよい。例えば、塩基エディターおよびガイド核酸が単一のウイルスベクター上にコードされてもよい。他の実施形態では、塩基エディターおよびガイド核酸が異なるウイルスベクター上にコードされる。いずれの場合でも、塩基エディターおよびガイド核酸が、プロモーターおよびターミネーターに、互いに機能可能であるように連結されてもよい。ウイルスベクター上にコードされる構成要素の組み合わせは、選択したウイルスベクターのカーゴサイズの制約によって決定され得る。

塩基エディターの送達のためのRNAまたはDNAウイルスに基づくシステムの使用は、培養中または宿主中の特定の細胞にウイルスをターゲティングし、ウイルスの積荷を核または宿主細胞ゲノムに輸送する、高度に進化したプロセスを利用する。ウイルスベクターは、培養中の細胞、患者(in vivo)に直接投与することができ、またはそれらを用いて細胞をin vitroで処理してもよく、改変された細胞を任意で患者に投与することができる(ex vivo)。ウイルスに基づく従来のシステムは、遺伝子導入のためのレトロウイルス、レンチウイルス、アデノウイルス、アデノ随伴および単純ヘルペスウイルスベクターを含み得る。レトロウイルス、レンチウイルス、およびアデノ随伴ウイルスの遺伝子導入法では、宿主ゲノムへの組込みが可能であり、しばしば挿入された導入遺伝子の長期発現をもたらす。さらに、多くの異なる細胞タイプおよび標的組織において高い形質導入効率が観察されている。

ウイルスベクターには、レンチウイルス（例えば、HIVおよびFIVに基づくベクター）アデノウイルスベクター（例えばAD100）、レトロウイルス（例えばMaloneyネズミ白血病ウイルス、MML-V）、ヘルペスウイルスベクター（例えばHSV-2）、およびアデノ随伴ウイルス（AAV）、あるいは他のプラスミドまたはウイルスベクタータイプを用いて、特に、例えば、米国特許第8,454,972号(アデノウイルスの配合物、用量)、米国特許第8,404,658号(AAVの配合物、用量)、米国特許第5,846,946号(DNAプラスミドの配合物、用量)からの配合物および用量を用いるもの、ならびにレンチウイルス、AAVおよびアデノウイルスが関わる臨床試験および臨床試験に関する刊行物からの配合物および用量を用いるものが含まれる。例えば、AAVに関しては、投与経路、配合物および用量は、米国特許第8,454,972号およびAAVが関わる臨床試験におけるようにすることができる。アデノウイルスに関しては、投与経路、配合物および用量は、米国特許第8,404,658号およびアデノウイルスが関わる臨床試験におけるようにすることができる。プラスミド送達に関しては、投与経路、配合物および用量は、米国特許第5,846,946号およびプラスミドが関わる臨床試験におけるようにすることができる。投与量は平均的な70 kgの個体(例えば成人男性)に基づいて算出するか、またはそれに外挿することができ、体重および動物種の異なる患者、対象、哺乳動物に関して調節することができる。投与の頻度は、年齢、性別、全般的な健康状態、患者または対象の他の状態および対処される特定の状態または症状を含む通常の要因に依存して、医学または獣医学の実施者(例えば医師、獣医師)の技量の範囲内である。ウイルスベクターを関心対象の組織に注射することができる。細胞タイプ特異的塩基編集のために、塩基エディターおよび任意のガイド核酸の発現を、細胞型特異的プロモーターによって駆動し得る。いくつかの態様では、本開示は、例えばウイルスベクター、例えばレンチウイルスベクターまたは組換えアデノ随伴ウイルスベクターを用いて、アルファ1アンチトリプシン突然変異を標的化する核酸塩基エディターのウイルス送達に関する。

レトロウイルスの指向性は、外来のエンベロープタンパク質を組み込み、標的細胞の潜在的な標的集団を拡大することによって改変することができる。レンチウイルスベクターは、非分裂細胞を形質導入または感染させることができ、典型的には高いウイルス力価を産生するレトロウイルスベクターである。従って、レトロウイルス遺伝子導入システムの選択は標的組織に依存する。レトロウイルスベクターは、6～10 kbまでの外来配列のパッケージング能力を有するシス作用性の末端反復配列から構成される。最小シス作用性LTRは、ベクターの複製およびパッケージングのために十分であり、次いでそれを用いて療法遺伝子が標的細胞に組み込まれ、永続的な導入遺伝子発現が提供される。広く使用されているレトロウイルスベクターには、ネズミ白血病ウイルス (MuLV) 、テナガザル（gibbon ape）白血病ウイルス (GaLV) 、サル免疫不全ウイルス (SIV) 、ヒト免疫不全ウイルス (HIV) 、およびそれらの組み合わせに基づくものが含まれる(例えばBuchscher et al., J. Virol. 66:2731-2739 (1992); Johann et al., J. Virol. 66:1635-1640 (1992); Sommnerfelt et al., Virol. 176:58-59 (1990); Wilson et al., J. Virol. 63:2374-2378 (1989); Miller et al., J. Virol. 65:2220-2224 (1991); PCT/US94/05700を参照のこと)。

レトロウイルスベクター、特にレンチウイルスベクターは、標的細胞への効率的な組み込みのために所定の長さより小さいポリヌクレオチド配列を必要とし得る。例えば、9 kbを超える長さのレトロウイルスベクターは、より小さいサイズのものと比較して低いウイルス力価をもたらし得る。いくつかの態様において、本開示の塩基エディターは、レトロウイルスベクターを介して効率的なパッケージングおよび標的細胞への送達を可能にするのに十分なサイズである。いくつかの実施形態では、塩基エディターは、ガイド核酸および/または標的化可能なヌクレアーゼシステムの他の構成要素とともに発現された場合でも、効率的なパッキングおよび送達を可能にするサイズである。

一過性発現が好ましい用途では、アデノウイルスに基づくシステムを使用することができる。アデノウイルスに基づくベクターは、多くの細胞タイプにおいて非常に高い形質導入効率が可能であり、細胞分裂を必要としない。このようなベクターでは、高い力価および発現レベルが得られている。このベクターは比較的簡単なシステムで大量に生成できる。アデノ随伴ウイルス（「AAV」）ベクターもまた、例えば核酸およびペプチドのin vitro産生において、ならびにin vivoおよびex vivoの遺伝子療法手順のために、標的核酸で細胞を形質導入することに使用され得る（例えば、West et al., Virology 160:38-47 (1987); 米国特許第4,797,368号; WO 93/24641; Kotin, Human Gene Therapy 5:793-801 (1994); Muzyczka, J. Clin. Invest. 94:1351 (1994)を参照のこと）。組換えAAVベクターの構築は、米国特許第5,173,414号; Tratschin et al., Mol. Cell. Biol. 5:3251-3260 (1985); Tratschin, et al., Mol. Cell. Biol. 4:2072-2081 (1984); Hermonat & Muzyczka, PNAS 81:6466-6470 (1984); およびSamulski et al., J. Virol. 63:03822-3828 (1989)を含む多くの刊行物に記載されている。

AAVはパルボウイルスファミリーに属する小さな一本鎖DNA依存性ウイルスである。4.7 kbの野生型 (wt) AAVゲノムは、それぞれ4つの複製タンパク質および3つのキャプシドタンパク質をコードする2つの遺伝子からなり、いずれかの側に145 bpの逆方向末端反復配列 (ITR) が隣接する。ビリオンは3つのキャプシドタンパク質Vp1、Vp2およびVp3からなり、これらは同じオープンリーディングフレームから1:1:10の比で産生されるが、異なるスプライシング (Vp1) および選択的翻訳開始部位(Vp2とVp3のそれぞれ)から産生される。Vp3はビリオン中に最も豊富に存在するサブユニットであり、細胞表面での受容体認識に関与し、それによってウイルスの指向性を定義する。ウイルス感染性に寄与するホスホリパーゼドメインがVp1のユニークなN末端に同定されている。

組換えAAV (rAAV) は、wt AAVと同様に、ベクター導入遺伝子カセットに隣接するシス作用性145 bp ITRを利用し、外来DNAのパッケージングのために最大4.5 kbを提供する。感染後、rAAVは本発明の融合タンパク質を発現することができ、環状のヘッド・トゥー・テール・コンカテマーの状態のエピソームとして存在することにより、宿主ゲノムに組み込まれることなく存続することができる。このシステムを用いたrAAVの成功例は数多くあるが、in vitroおよびin vivoでは、パッケージング能力が限られているため、遺伝子のコード配列の長さがwt AAVゲノムの長さ以上である場合にAAV仲介遺伝子送達の使用が制限されている。

適用に基づいて、ウイルスベクターを選択してもよい。例えばin vivo遺伝子送達に関しては、AAVは他のウイルスベクターよりも好適であり得る。いくつかの実施形態では、AAVベクターは低い毒性を有し、これは、免疫応答を活性化させ得る細胞粒子の超遠心分離を必要としない精製法のためであり得る。いくつかの実施形態では、AAVは、宿主ゲノムに組み込まれないため、挿入突然変異誘発を引き起こす確率を低くする。アデノウイルスは、誘導する免疫原反応が強いため、一般的にワクチンとして用いられる。ウイルスベクターのパッケージング容量は、ベクター内にパッケージング可能な塩基エディターのサイズを制限し得る。

AAVは、2つの145塩基末端逆位配列（ITR）を含み、約4.5 Kbまたは4.75 Kbのパッケージング容量を有する。これは、開示する塩基エディターならびにプロモーターおよび転写ターミネーターが単一のウイルスベクター内に収容可能であることを意味する。4.5 Kbまたは4.75 Kbを超える構築物は、ウイルス産生を有意に減少させ得る。例えば、SpCas9は非常に大きく、遺伝子自体が4.1 Kbを超え、AAVに詰め込むことが困難である。従って、本開示の実施形態は、従来の塩基エディターよりも短い長さの開示された塩基エディターを利用することを含む。いくつかの例では、塩基エディターは4 kb未満である。開示される塩基エディターは、4.5 kb、4.4 kb、4.3 kb、4.2 kb、4.1 kb、4 kb、3.9 kb、3.8 kb、3.7 kb、3.6 kb、3.5 kb、3.4 kb、3.3 kb、3.2 kb、3.1 kb、3 kb、2.9 kb、2.8 kb、2.7 kb、2.6 kb、2.5 kb、2 kb、または1.5 kb未満であり得る。いくつかの実施形態では、開示された塩基エディターは、長さ4.5 kb以下である。

AAVは、AAV1、AAV2、AAV5、またはそれらの任意の組み合わせであり得る。標的とする細胞に関してAAVのタイプを選択することができる。例えば、AAV血清型1、2、5またはハイブリッドキャプシドAAV1、AAV2、AAV5またはそれらの任意の組み合わせを選択して、脳または神経細胞を標的化することができる；心臓組織を標的とするAAV4を選択してもよい。AAV8は肝臓への送達に有用である。これらの細胞に関する特定のAAV血清型の表は、Grimm, D. et al, J. Virol. 82: 5887-5911 (2008)に見出され得る。

レンチウイルスは複雑なレトロウイルスであり、有糸分裂細胞と有糸分裂後細胞の両方に感染してその遺伝子を発現する能力をもつ。最も一般的に知られているレンチウイルスはヒト免疫不全ウイルス (HIV) であり、これは広範囲の細胞タイプを標的とするために他のウイルスのエンベロープ糖タンパク質を使用する。

レンチウイルスは以下のように調製できる。（レンチウイルストランスファープラスミド主鎖を含有する）pCasES 10をクローニングした後、低継代(p=5)のHEK293FTを、T-75フラスコ中に播種し、抗生物質なしで、10%ウシ胎児血清を含むDMEM中でトランスフェクションの前日に50%集密にする。20時間後、培地をOptiMEM (無血清) 培地に変え、トランスフェクションを4時間後に行う。10μgのレンチウイルストランスファープラスミド (pCasES 10) および以下のパッケージングプラスミド：5μgのpMD2.G (VSV-g偽型)および7.5μgのpsPAX2 (gag/pol/rev/tat) で細胞をトランスフェクションする。トランスフェクションは4 mlのOptiMEM中でカチオン性脂質送達剤(50μlのリポフェクタミン2000および100μlのプラス試薬)を用いて行うことができる。6時間後、10%ウシ胎児血清を含む抗生物質不含DMEMに培地を変更する。これらの方法は細胞培養中に血清を用いるが、無血清法が好ましい。

レンチウイルスは以下のように精製できる。ウイルス上清を48時間後に採取する。上清からまず破片を除去し、0.45μm低タンパク質結合 (PVDF) フィルターを通して濾過する。次いで、これらを24,000 rpmで2時間、超遠心機で遠心する。ウイルスペレットを50μlのDMEM中に4℃で一晩再懸濁する。次いでそれらをアリコットし、直ちに-80℃で凍結する。

別の実施形態では、ウマ伝染性貧血ウイルス (EIAV) に基づく最小の非霊長類レンチウイルスベクターもまた意図される。別の実施形態では、血管新生抑制タンパク質エンドスタチンおよびアンジオスタチンを発現するウマ伝染性貧血ウイルスに基づくレンチウイルス遺伝子療法ベクター、RETINOSTAT（登録商標）を、網膜下注射を介して送達することが意図される。別の実施形態では、自己不活化レンチウイルスベクターの使用が意図される。

システムの任意のRNA、例えばガイドRNAまたは塩基エディターをコードするmRNAを、RNAの形態で細胞に送達することができる。塩基エディターをコードするmRNAは、in vitro転写を用いて生成することができる。例えば、ヌクレアーゼmRNAは、以下の要素を含有するPCRカセットを用いて合成することができる：T7プロモーター、任意でコザック配列 (GCCACC) 、ヌクレアーゼ配列、およびベータグロビン-ポリAテールからの3’UTRのような3’UTR。このカセットは、T7ポリメラーゼによる転写のために用いられ得る。ガイドポリヌクレオチド(例えばgRNA)もまた、in vitro転写を用いて、T7プロモーター、次いで配列「GG」、およびガイドポリヌクレオチド配列を含有するカセットから転写され得る。

発現を増強し、毒性の可能性を低減するために、塩基エディターコード配列および/またはガイド核酸は、1つ以上の修飾ヌクレオシド、例えばプソイドUまたは5-メチル-Cを含むように修飾され得る。

AAVベクターのパッケージング容量が小さいため、このサイズを超える多くの遺伝子および/または巨大な生理学的制御要素の使用は困難である。例えば、送達すべきタンパク質を2つ以上の断片に分割し、N末端の断片をスプリットインテイン-Nに融合させ、C末端断片をスプリットインテイン-Cに融合させることによって、これらの困難に対処してもよい。次いで、これらの断片を2つ以上のAAVベクター内にパッケージングする。本明細書において、「インテイン」は、隣接するN末端およびC末端エクステイン（例えば連結しようとする断片）を連結する、自己スプライシングタンパク質イントロン（例えばペプチド）を指す。異種タンパク質断片を連結するための特定のインテインの使用は、例えばWood et al., J. Biol. Chem. 289(21); 14512-9 (2014) に記載される。例えば、別個のタンパク質断片に融合された場合、インテインIntNおよびIntCは互いを認識し、それ自体をスプライシングして取り出し、融合したタンパク質断片のN末端およびC末端を同時に連結して、それによって2つのタンパク質断片から全長タンパク質を再構成する。他の適切なインテインは、当業者には明らかであろう。

本発明の融合タンパク質の断片は、長さを変えることができる。いくつかの実施形態では、タンパク質断片は、長さ2アミノ酸～約1000アミノ酸の範囲である。いくつかの実施形態では、タンパク質断片は、長さ約5アミノ酸～約500アミノ酸の範囲である。いくつかの実施形態では、タンパク質断片は、長さ約20アミノ酸～約200アミノ酸の範囲である。いくつかの実施形態では、タンパク質断片は、長さ約10アミノ酸～約100アミノ酸の範囲である。他の長さの適切なタンパク質断片は、当業者には明らかであろう。

一実施形態では、大きな導入遺伝子発現カセットを2つの別々の半分(5’および3’端、またはヘッドおよびテール)に分割することによって二重AAVベクターが生成され、カセットの各半分が単一のAAVベクター(5 kb未満)内にパッケージングされる。次いで、両方の二重AAVベクターによる同じ細胞の同時感染に続いて、(1) 5’および3’ゲノム（二重AAV重複ベクター）間の相同組換え (HR)；(2) ITRを介した5'および3'ゲノム(二重AAVトランススプライシングベクター)のテール・トゥー・ヘッド・コンカテマー化；または (3) それら2つの機構の組み合わせ(二重AAVハイブリッドベクター)により、全長導入遺伝子発現カセットの再構築が達成される。in vivoでの二重AAVベクターの使用は完全長タンパク質の発現をもたらす。二重AAVベクタープラットフォームの使用は、>4.7 kbのサイズの導入遺伝子のための効率的で実行可能な遺伝子導入戦略を表す。

［インテイン］
いくつかの実施形態では、ヌクレアーゼ(例えばCas9)の一部または断片は、インテインに融合される。ヌクレアーゼは、インテインのN末端またはC末端に融合され得る。いくつかの実施形態では、融合タンパク質の一部または断片は、インテインに融合され、AAVキャプシドタンパク質に融合される。インテイン、ヌクレアーゼおよびキャプシドタンパク質は、任意の配置(例えば、ヌクレアーゼ-インテイン-キャプシド、インテイン-ヌクレアーゼ-キャプシド、キャプシド-インテイン-ヌクレアーゼなど)で一緒に融合され得る。いくつかの実施形態では、インテインのN末端は融合タンパク質のC末端に融合され、インテインのC末端はAAVキャプシドタンパク質のN末端に融合される。

インテイン（介在タンパク質）は、多種多様な生物に見出される自己プロセシングドメインであり、タンパク質スプライシングとして知られるプロセスを行うものである。タンパク質スプライシングは、ペプチド結合の切断と形成の両方で構成される多段階の生化学的反応である。タンパク質スプライシングの内因性基質は、インテインを含有する生物に見出されるタンパク質であるが、インテインはまた、実質的にあらゆるポリペプチド主鎖を化学的に操作するために使用することもできる。

タンパク質スプライシングでは、インテインは、2つのペプチド結合を切断することによって前駆体ポリペプチドから自身を切り出し、それによって、隣接するエクステイン（外部タンパク質）配列を、新しいペプチド結合の形成を介して連結する。この再配置は翻訳後に起こる（翻訳と同時に起こる可能性もある）。インテイン仲介性タンパク質スプライシングは自発的に起こり、インテインドメインの折りたたみだけを必要とする。

インテインの約5%が分割インテインであり、これらはN-インテインとC-インテインという2つの別個のポリペプチドとして転写され翻訳され、その各々が1つのエクステインに融合している。翻訳の際に、インテイン断片は、自発的にかつ非共有結合的にカノニカルなインテイン構造へと組み立てられ、トランスにタンパク質スプライシングを行う。タンパク質スプライシングの機構には一連のアシル転移反応が関わっており、これが、インテイン-エクステイン接合部での2つのペプチド結合の切断と、N-エクステインとC-エクステインの間の新しいペプチド結合の形成とをもたらす。このプロセスは、N‐エクステインとインテインのN‐末端とを連結するペプチド結合の活性化によって開始される。事実上すべてのインテインは、N末端にシステインまたはセリンを有し、これがN-エクステインのC末端残基のカルボニル炭素を攻撃する。このNからO/Sへのアシル基の移動は、保存されたトレオニンとヒスチジン（TXXHモチーフと呼ばれる）とともに、一般的に見出されるアスパラギン酸によって促進され、直鎖状 (チオ)エステル中間体の形成をもたらす。次に、この中間体は、システイン、セリン、またはトレオニンであるC-エクステインの最初の残基 (+1) の求核攻撃によってトランス-(チオ)エステル化される。生成された分枝 (チオ)エステル中間体は、インテインの高度に保存されたC末端アスパラギンの環化というユニークな変換によって、解消される。この過程は、ヒスチジン（高度に保存されたHNFモチーフに見出されるもの）と最後から2番目のヒスチジンによって促進され、アスパラギン酸も関与し得る。このスクシンイミド形成反応は、反応複合体からインテインを切除し、非ペプチド連結を介して付着されたエクステインを残す。この構造は、インテイン非依存方式で迅速に安定なペプチド結合に再編成される。

いくつかの実施形態では、塩基エディター（例えばABE、CBE）のN末端断片が分割インテイン-Nに融合され、C末端断片が分割インテイン-Cに融合される。次いで、これらの断片を2つ以上のAAVベクターにパッケージングする。異種タンパク質断片を連結するための特定のインテインの使用は、例えば、Wood et al., J. Biol. Chem. 289(21); 14512-9 (2014) に記載されている。例えば、インテインIntNおよびIntCは、別個のタンパク質断片に融合された場合、互いを認識して、自身をスプライシングして排出し、それと同時に、融合しているタンパク質断片の隣接するN-およびC末端エクステインを連結して、それによって2つのタンパク質断片から全長タンパク質を再構成する。他の適切なインテインは当業者に明らかであろう。

いくつかの実施形態では、ABEが、SpCas9の選択された領域内のAla、Ser、ThrまたはCys残基でN-およびC末端断片に分割された。これらの領域は、Cas9結晶構造分析により同定されたループ領域に対応する。各断片のN末端をインテイン-Nに融合させ、各断片のC末端を、アミノ酸位S303、T310、T313、S355、A456、S460、A463、T466、S469、T472、T474、C574、S577、A589、およびS590（下記配列で太字の大文字で示されている）でインテインCに融合させた。
1 mdkkysigld igtnsvgwav itdeykvpsk kfkvlgntdr hsikknliga llfdsgetae
61 atrlkrtarr rytrrknric ylqeifsnem akvddsffhr leesflveed kkherhpifg
121 nivdevayhe kyptiyhlrk klvdstdkad lrliylalah mikfrghfli egdlnpdnsd
181 vdklfiqlvq tynqlfeenp inasgvdaka ilsarlsksr rlenliaqlp gekknglfgn
241 lialslgltp nfksnfdlae daklqlskdt ydddldnlla qigdqyadlf laaknlsdai
301 llSdilrvnT eiTkaplsas mikrydehhq dltllkalvr qqlpekykei ffdqSkngya
361 gyidggasqe efykfikpil ekmdgteell vklnredllr kqrtfdngsi phqihlgelh
421 ailrrqedfy pflkdnreki ekiltfripy yvgplArgnS rfAwmTrkSe eTiTpwnfee
481 vvdkgasaqs fiermtnfdk nlpnekvlpk hsllyeyftv yneltkvkyv tegmrkpafl
541 sgeqkkaivd llfktnrkvt vkqlkedyfk kieCfdSvei sgvedrfnAS lgtyhdllki
601 ikdkdfldne enedilediv ltltlfedre mieerlktya hlfddkvmkq lkrrrytgwg
661 rlsrklingi rdkqsgktil dflksdgfan rnfmqlihdd sltfkediqk aqvsgqgdsl
721 hehianlags paikkgilqt vkvvdelvkv mgrhkpeniv iemarenqtt qkgqknsrer
781 mkrieegike lgsqilkehp ventqlqnek lylyylqngr dmyvdqeldi nrlsdydvdh
841 ivpqsflkdd sidnkvltrs dknrgksdnv pseevvkkmk nywrqllnak litqrkfdnl
901 tkaergglse ldkagfikrq lvetrqitkh vaqildsrmn tkydendkli revkvitlks
961 klvsdfrkdf qfykvreinn yhhahdayln avvgtalikk ypklesefvy gdykvydvrk
1021 miakseqeig katakyffys nimnffktei tlangeirkr plietngetg eivwdkgrdf
1081 atvrkvlsmp qvnivkktev qtggfskesi lpkrnsdkli arkkdwdpkk yggfdsptva
1141 ysvlvvakve kgkskklksv kellgitime rssfeknpid fleakgykev kkdliiklpk
1201 yslfelengr krmlasagel qkgnelalps kyvnflylas hyeklkgspe dneqkqlfve
1261 qhkhyldeii eqisefskrv iladanldkv lsaynkhrdk pireqaenii hlftltnlga
1321 paafkyfdtt idrkrytstk evldatlihq sitglyetri dlsqlggd

［突然変異を標的とするための核酸塩基エディターの使用］
突然変異を標的とする核酸塩基エディターの適合性を、本明細書に記載するように評価する。一実施形態では、塩基編集システムとともに、レポーター（例えばGFP）をコードする少量のベクターで、関心対象の単細胞が形質導入される。これらの細胞は、293T、K562またはU20Sなどの不死化ヒト細胞株を含む、当技術分野に公知の任意の細胞株であってもよい。あるいは、初代細胞（例えばヒト）を用いてもよい。こうした細胞は、最終的な細胞標的に関連したものであり得る。

ウイルスベクターを用いて、送達を実行してもよい。一実施形態では、トランスフェクションは、脂質トランスフェクション(LipofectamineやFugeneなど)を用いて、またはエレクトロポレーションによって実施することができる。トランスフェクション後、GFPの発現を蛍光顕微鏡またはフローサイトメトリーのいずれかによって測定して、一貫した高レベルのトランスフェクションを確認することができる。最も高い活性を与えるエディターの組み合わせを決定するために、これらの予備的なトランスフェクションは異なる核酸塩基エディターを含むことができる。

核酸塩基エディターの活性は、本明細書に記載されるように、すなわち細胞のゲノムを配列決定して標的配列の改変を検出することによって評価される。サンガー配列決定のためには、精製されたPCRアンプリコンをプラスミド主鎖内にクローニングし、形質転換し、ミニプレップし、単一プライマーで配列決定する。配列決定はまた、次世代配列決定技術を用いて実施されてもよい。次世代配列決定を使用する場合、アンプリコンは、意図される切断部位が非対称に配置された300～500 bpであり得る。PCRに続いて、例えばハイスループット配列決定(例えばIllumina MiSeq上でのもの)で使用するために、次世代配列決定のアダプターおよびバーコード(例えば、Illumina多重アダプターとインデックス)をアンプリコンの末端に付加し得る。

最初の試験で最大レベルの標的特異的改変を誘導する融合タンパク質を、さらなる評価のために選択し得る。

特定の実施形態では、核酸塩基エディターを用いて、関心対象のポリヌクレオチドを標的とする。一実施形態では、本発明の核酸塩基エディターを、細胞ゲノム内の関心対象の突然変異を標的とするために用いるガイドRNAとともに、細胞（例えば造血細胞またはその前駆細胞、造血幹細胞、および/または人工多能性幹細胞）に送達し、それによって突然変異を改変する。いくつかの実施形態では、ガイドRNAによって塩基エディターをターゲティングして、関心対象の遺伝子配列に、1つ以上の編集を導入する。

システムは、1つ以上の異なるベクターを含むことができる。一態様では、塩基エディターは、所望の細胞タイプ、優先的には真核細胞、好ましくは哺乳類細胞またはヒト細胞における発現のために最適化される。

一般に、コドン最適化とは、関心対象の宿主細胞における発現を増強するために、天然配列の少なくとも1つのコドン(例えば約1、2、3、4、5、10、15、20、25、50以上のコドンまたはそれより多く)を、天然アミノ酸配列を維持しながら、その宿主細胞の遺伝子においてより頻繁にまたは最も頻繁に使用されるコドンで置換することによって、核酸配列を改変するプロセスをいう。多様な種は特定のアミノ酸の特定のコドンについて特定の偏りを示す。コドンバイアス(生物間のコドン利用の違い)は、メッセンジャーRNA (mRNA) の翻訳効率としばしば相関し、それは次に、とりわけ翻訳されるコドンの性質および特定のトランスファーRNA (tRNA) 分子の利用可能性に依存すると考えられている。細胞において、選択されたtRNAの優位性は、一般にペプチド合成で最も頻繁に使われるコドンを反映している。従って、遺伝子は、コドン最適化に基づいて、所定の生物における最適な遺伝子発現に合わせて調整することができる。コドン使用表は、例えば、www.kazusa.orjp/codon/ (2002年7月9日に訪問)で入手可能な「コドン使用データベース」で容易に入手可能であり、これらの表は、多くの方法で適合させることができる。Nakamura, Y., et al. "Codon usage tabulated from the international DNA sequence databases: status for the year 2000" Nucl. Acids Res. 28:292 (2000)を参照のこと。例えばGene Forge (Aptagen; Jacobus, Pa.)のような、特定の宿主細胞における発現のために特定の配列をコドン最適化するためのコンピュータアルゴリズムも利用可能である。いくつかの実施形態では、操作されたヌクレアーゼをコードする配列中の1つ以上のコドン(例えば1、2、3、4、5、10、15、20、25、50以上、またはすべてのコドン)は、特定のアミノ酸について最も頻繁に使用されるコドンに対応する。

パッケージング細胞は、典型的には、宿主細胞に感染可能なウイルス粒子を形成するために使用される。そのような細胞は、アデノウイルスをパッケージングする293細胞、およびレトロウイルスをパッケージングするpsi.2細胞またはPA317細胞を含む。遺伝子療法に使用されるウイルスベクターは、通常、核酸ベクターをウイルス粒子にパッケージする細胞株を作製することによって生成される。ベクターは、典型的には、パッケージングおよびその後の宿主への組み込みに必要な最小のウイルス配列を含有し、他のウイルス配列は、発現されるべきポリヌクレオチド（複数可）のための発現カセットによって置き換えられる。欠けているウイルス機能は、典型的にはパッケージング細胞株によってトランスに供給される。例えば、遺伝子療法に使用されるAAVベクターは、典型的には、パッケージングおよび宿主ゲノムへの組み込みに必要なAAVゲノム由来のITR配列のみを有する。ウイルスDNAは、他のAAV遺伝子、すなわちrepおよびcapをコードするがITR配列を欠くヘルパープラスミドを含有する細胞株においてパッケージングされ得る。細胞株はまた、ヘルパーとしてのアデノウイルスによっても感染され得る。ヘルパーウイルスは、AAVベクターの複製およびヘルパープラスミドからのAAV遺伝子の発現を促進することができる。ヘルパープラスミドは、ある場合には、ITR配列の欠如のために、有意な量ではパッケージングされない。アデノウイルスによる汚染は、例えばAAVよりもアデノウイルスの方が感受性である熱処理によって減少させることができる。

［薬学的組成物］
本開示の他の態様は、本明細書に記載する塩基エディター、融合タンパク質、または融合タンパク質-ガイドポリヌクレオチド複合体のいずれかを含む薬学的組成物に関する。用語「薬学的組成物」は、本明細書で使用される場合、薬学的使用のために処方される組成物を指す。いくつかの実施形態では、薬学的組成物は、薬学的に許容され得るキャリアーをさらに含む。いくつかの実施形態では、薬学的組成物は、追加の剤(例えば特異的送達、半減期の延長のためのもの、または他の療法化合物)を含む。

本明細書で用いた際、用語「薬学的に許容され得るキャリアー」は、液体または固体の充填剤、希釈剤、賦形剤、製造助剤(例えば潤滑剤、タルクマグネシウム、ステアリン酸カルシウムまたはステアリン酸亜鉛、あるいはステアリン酸)、または溶媒被包材料などの、身体のある部位(例えば送達部位)から別の部位(例えば臓器、組織または身体の一部)への化合物の運搬または輸送に関与する薬学的に許容され得る材料、組成物またはビヒクルを意味する。薬学的に許容され得るキャリアーは、配合物の他の成分と適合し、対象の組織に有害でないという意味で「許容され得る」(例えば生理的適合性、無菌性、生理的pH等)。

薬学的に許容され得るキャリアーとして役立つことができる物質のいくつかの非限定的な例は、以下を含む: (1) ラクトース、グルコースおよびスクロースのような糖;(2) コーンスターチ、ジャガイモデンプン等のデンプン;(3) セルロースおよびその誘導体、例えばカルボキシメチルセルロースナトリウム、メチルセルロース、エチルセルロース、微結晶セルロース、酢酸セルロース;(4) トラガント末;(5) モルト;(6)ゼラチン;(7) ステアリン酸マグネシウム、ラウリル硫酸ナトリウム、タルク等の潤滑剤;(8) ココアバター、坐剤用ワックス等の賦形剤;(9) 落花生油、綿実油、ベニバナ油、ゴマ油、オリーブ油、コーン油、大豆油等の油;(10) プロピレングリコール等のグリコール;(11) ポリオール、例えばグリセリン、ソルビトール、マンニトールおよびポリエチレングリコール (PEG); (12) エステル、例えばオレイン酸エチルおよびラウリン酸エチル;(13) 寒天;(14) 水酸化マグネシウム、水酸化アルミニウム等の緩衝剤;(15) アルギン酸;(16) 発熱物質不含水;(17) 等張食塩液;(18) リンゲル液;(19)エチルアルコール;(20) pH緩衝液;(21) ポリエステル、ポリカーボネートおよび/またはポリ無水物;(22) ポリペプチドおよびアミノ酸のような増量剤 (23) エタノールのような血清アルコール;および (23) 製剤処方に使用される他の非毒性適合性物質。湿潤剤、着色剤、放出剤、コーティング剤、甘味剤、フレーバー剤、香料、保存剤および酸化防止剤も配合物中に存在させることができる。「賦形剤」、「キャリアー」、「薬学的に許容され得るキャリアー」、「ビヒクル」などの用語は、本明細書では交換可能に使用される。

薬学的組成物は、約5.0～約8.0の範囲などの生理学的pHを反映するあらかじめ決定されたレベルに配合物のpHを維持するために、1つ以上のpH緩衝化合物を含むことができる。水性液体配合物で使用されるpH緩衝化合物は、アミノ酸またはヒスチジンなどのアミノ酸の混合物、またはヒスチジンおよびグリシンなどのアミノ酸の混合物であり得る。あるいは、pH緩衝化合物は、好ましくは、配合物のpHをあらかじめ決定されたレベル、例えば約5.0～約8.0の範囲に維持し、カルシウムイオンをキレートしない剤である。このようなpH緩衝化合物の例示的な例には、イミダゾールおよび酢酸イオンが含まれるが、これらに限定されない。pH緩衝化合物は、配合物のpHをあらかじめ決定されたレベルに維持するのに適した任意の量で存在し得る。

薬学的組成物はまた、1つ以上の浸透圧調節剤、すなわち、配合物の浸透圧特性(例えば、等張性、モル浸透圧濃度、および/または浸透圧)を、レシピエント個体の血流および血液細胞にとって許容可能なレベルに調節する化合物を含有することができる。浸透圧調節剤は、カルシウムイオンをキレートしない薬剤であり得る。浸透圧調節剤は、配合物の浸透圧特性を調節する当業者に公知または入手可能な任意の化合物であり得る。当業者は、本発明の配合物における使用のための所定の浸透圧調節剤の適合性を経験的に決定することができる。適切なタイプの浸透圧調節剤の例示的な例には、塩化ナトリウムおよび酢酸ナトリウムのような塩；スクロース、デキストロース、マンニトールなどの糖;グリシンなどのアミノ酸;これらの剤および/または剤タイプの1つ以上の混合物が含まれるが、これらに限定されない。浸透圧調節剤（複数可）は、配合物の浸透圧特性を調節するのに十分な任意の濃度で存在し得る。

いくつかの実施形態では、薬学的組成物は、対象への送達のために、例えば遺伝子編集のために配合される。本明細書に記載の薬学的組成物を投与する適切な経路は、限定されるものではないが、局所、皮下、経皮、皮内、病巣内、関節内、腹腔内、膀胱内、経粘膜、歯肉、歯内、蝸牛内、鼓室内（transtympanic）、臓器内、硬膜外、クモ膜下腔内、筋内、静脈内、血管内、骨内、眼周囲、腫瘍内、脳内、および脳室内投与を含む。

いくつかの実施形態では、本明細書に記載される薬学的組成物は、患部（例えば腫瘍部位）に局所的に投与される。いくつかの実施形態では、本明細書に記載される薬学的組成物は、注射、カテーテル、坐剤、またはインプラントによって、対象に投与され、インプラントは、多孔質、非多孔質、またはゼラチン質材料であり、例えば、シアラスティック（sialastic）膜、または繊維などの膜を含む。

他の実施形態では、本明細書に記載される薬学的組成物は、制御放出システムにおいて送達される。一実施形態では、ポンプを使用することができる(例えばLanger, 1990, Science 249: 1527-1533; Sefton, 1989, CRC Crit. Ref. Biomed. Eng. 14:201; Buchwald et al., 1980, Surgery 88:507; Saudek et al., 1989, N. Engl. J. Med. 321:574を参照のこと)。別の実施形態では、ポリマー材料を使用することができる。(例えばMedical Applications of Controlled Release (Langer and Wise eds., CRC Press, Boca Raton, Fla., 1974); Controlled Drug Bioavailability, Drug Product Design and Performance (Smolen and Ball eds., Wiley, New York, 1984); Ranger and Peppas, 1983, Macromol. Sci. Rev. Macromol. Chem. 23:61. See also Levy et al., 1985, Science 228: 190; During et al., 1989, Ann. Neurol. 25:351; Howard et ah, 1989, J. Neurosurg. 71: 105.)。他の制御放出システムは、例えば、上記Langerに記載されている。

いくつかの実施形態では、薬学的組成物は、対象、例えばヒトへの静脈内または皮下投与に適合された組成物として、ルーチンの手順に従って配合される。いくつかの実施形態では、注射による投与のための薬学的組成物は、可溶化剤としての無菌等張使用の溶液および注射部位の痛みを緩和するためのリグノカインなどの局所麻酔薬である。一般に、成分は、単位投与形態、例えば、活性剤の量を示すアンプルまたはサシェ剤（sachette）のような密閉容器内の乾燥凍結乾燥粉末または水を含まない濃縮物として、別々にまたは一緒に供給される。薬剤が注入によって投与される場合には、無菌の医薬等級の水または生理食塩水を含有する注入ボトルを用いてそれを分注することができる。薬学的組成物が注射によって投与される場合、投与前に成分を混合することができるように、注射用滅菌水または生理食塩水のアンプルを提供することができる。

全身投与のための薬学的組成物は、液体、例えば滅菌生理食塩水、乳酸化リンゲル液またはハンク液であり得る。さらに、薬学的組成物は、固体形態であって、使用の直前に再溶解または懸濁され得る。凍結乾燥型もまた考えられる。薬学的組成物は、非経口投与にも適した、リポソームまたは微結晶などの脂質粒子または小胞内に含有されることができる。粒子は、組成物がその中に含まれる限り、単層または多層（plurilamellar）のような任意の適切な構造であり得る。化合物は、融合性脂質ジオレオイルホスファチジルエタノールアミン(DOPE)、低レベル(5～10モル%)のカチオン性脂質を含み、ポリエチレングリコール (PEG) コーティングにより安定化された、「安定化プラスミド脂質粒子」(SPLP)中に捕捉され得る (Zhang Y. P. et ah, Gene Ther. 1999, 6: 1438-47)。このような粒子および小胞には、N-[l-(2,3-ジオレオイルキシ)プロピル]-N,N,N-トリメチル-アモニウムメチル硫酸塩、あるいは「DOTAP」のような正電荷脂質が特に好ましい。このような脂質粒子の調製はよく知られている。例えば、米国特許第4,880,635号; 第4,906,477号; 第4,911,928号; 第4,917,951号; 第4,920,016号;および第4,921,757号を参照のこと（その各々は、参照により本明細書に組み込まれる）。

本明細書に記載の薬学的組成物は、例えば、単位用量として投与またはパッケージングすることができる。「単位用量」という用語は、本開示の薬学的組成物に関して使用される場合、対象のための単一用量として適した物理的に個別の単位を指し、各単位は、必要な希釈剤、すなわちキャリアー、またはビヒクルと合わせて所望の療法効果を生じるように計算された、あらかじめ決定された量の活性物質を含有する。

さらに、薬学的組成物は、 (a) 凍結乾燥型の本発明の化合物を含有する容器、および (b) 本発明の凍結乾燥化合物の再構成または希釈のために使用される、薬学的に許容される希釈剤 (例えば無菌のもの) を含有する第二の容器を含む薬学的キットとして提供することができる。必要に応じて、そのような容器（複数可）には、医薬品または生物学的製剤の製造、使用または販売を規制する政府機関によって規定された様式の通知であって、ヒトに投与するための製造、使用または販売の機関による承認を反映するものが付随してもよい。

別の態様では、上記疾患の治療に有用な材料を含有する製品が含まれる。いくつかの実施形態では、製品は、容器およびラベルを含む。適切な容器は、例えばボトル、バイアル、シリンジ、および試験管を含む。容器は、ガラスまたはプラスチックなどの多様な材料から形成することができる。いくつかの実施形態では、容器は、本明細書に記載される疾患を治療するために有効である組成物を保持し、無菌アクセスポートを有し得る。例えば、容器は、静脈内溶液バッグ、または皮下注射針によって穿刺可能なストッパーを有するバイアルであり得る。組成物中の活性剤は、本発明の化合物である。いくつかの実施形態では、容器上のまたは容器に付随するラベルは、選択される疾患を治療するために組成物が使用されることを示す。製品は、リン酸緩衝生理食塩水、リンゲル液、またはデキストロース溶液などの薬学的に許容され得る緩衝液を含む第二の容器をさらに含むことができる。さらに、他の緩衝剤、希釈剤、フィルター、針、シリンジ、および使用説明書付き添付文書を含め、商業的観点および使用者の観点から望ましい他の物質を含むことができる。

いくつかの実施形態では、本明細書に記載される融合タンパク質、gRNA、および/または複合体のいずれかは、薬学的組成物の一部として提供される。いくつかの実施形態では、薬学的組成物は、本明細書に提供される融合タンパク質のいずれかを含む。いくつかの実施形態では、薬学的組成物は、本明細書に提供される複合体のいずれかを含む。いくつかの実施形態では、薬学的組成物は、gRNAおよびカチオン性脂質と複合体を形成するRNA-ガイドヌクレアーゼ(例えばCas9)を含むリボ核タンパク質複合体を含む。いくつかの実施形態では、薬学的組成物は、gRNA、核酸プログラム可能DNA結合タンパク質、カチオン性脂質、および薬学的に許容され得る賦形剤を含む。薬学的組成物は、場合により、1つ以上の追加の療法活性物質を含むことができる。

いくつかの実施形態では、本明細書で提供される組成物は、対象内で標的化ゲノム改変を行うために、対象、例えばヒト対象に投与される。いくつかの実施形態では、細胞が対象から取得され、本明細書に提供される薬学的組成物のいずれかと接触される。いくつかの実施形態では、対象から取り除かれ、ex vivoで薬学的組成物と接触された細胞は、随意に、細胞において所望のゲノム改変が達成されたかまたは検出された後に、対象内に再導入される。ヌクレアーゼを含む薬学的組成物を送達する方法は公知であり、例えば、米国特許第6,453,242号; 第6,503,717号; 第6,534,261号; 第6,599,692号; 第6,607,882号; 第6,689,558号; 第6,824,978号; 第6,933,113号; 第6,979,539号; 第7,013,219号; および第7,163,824号に記載されており、その開示全体が参照により本明細書に組み込まれる。本明細書に提供される薬学的組成物の説明は、主に、ヒトへの投与に適した薬学的組成物に向けられているが、そのような組成物は、一般に、あらゆる種類の動物または生物への投与、例えば、獣医学的使用に適していることが、当業者によって理解されるであろう。

多様な動物への投与に適した組成物を与えるための、ヒトへの投与に適した薬学的組成物の改変は十分に理解されており、通常の熟練した獣医薬理学者は、もし必要だとしても単に通常の実験で、そのような改変を設計および/または実施することができる。薬学的組成物の投与が意図される対象には、限定されるものではないが、ヒトおよび/または他の霊長類;哺乳動物、家畜、ペット、およびウシ、ブタ、ウマ、ヒツジ、ネコ、イヌ、マウス、および/またはラットなどの商業的に関連のある哺乳動物;ならびに/あるいはニワトリ、カモ、ガチョウおよび/または七面鳥のような商業的に関連のある鳥類を含む鳥類が含まれる。

本明細書に記載される薬学的組成物の配合物は、薬学の分野において公知の、または今後開発される任意の方法によって調製することができる。一般に、このような調製法は、活性成分（複数可）を賦形剤および/または1つ以上の他の補助成分と会合させ、次いで、必要および/または所望であれば、製品を所望の単回または複数回投与単位に成形および/またはパッケージングする工程を含む。薬学的配合物はさらに、薬学的に許容され得る賦形剤を含むことができ、それは、本明細書で使用される場合、所望の特定の剤形に適した、あらゆる溶媒、分散媒体、希釈剤、または他の液体ビヒクル、分散または懸濁助剤、界面活性剤、等張剤、増粘剤または乳化剤、保存剤、固体結合剤、潤滑剤などを含む。Remington’s The Science and Practice of Pharmacy, 21st Edition, A. R. Gennaro (Lippincott, Williams & Wilkins, Baltimore, MD, 2006（参照によりその全体が本明細書に組み込まれる）は、薬学的組成物を配合する際に使用される多様な賦形剤およびその調製のための公知の技術を開示する。ヌクレアーゼを含む薬学的組成物を製造するためのさらなる適切な方法、試薬、賦形剤および溶媒については、参照によりその全体が本明細書に組み込まれるPCT出願PCT/US2010/055131(2010年11月2日出願、公開番号WO2011/053982 A8) も参照のこと。

あらゆる慣用的な賦形剤媒体は、望ましくない生物学的効果を生じさせること、またはそうでなければ薬学的組成物の何らかの他の構成要素（複数可）と有害な様式で相互作用することなどによって、物質またはその誘導体と不適合である場合を除き、その使用が本開示の範囲内にあると意図される。

上記の組成物は、有効量で投与することができる。有効量は、投与様式、治療される特定の状態、および所望の結果に依存する。それはまた、状態のステージ、対象の年齢および身体的状態、もしあれば併用療法の性質、および医師によく知られた同様の要因に依存し得る。療法用途のためには、それは医学的に望ましい結果を達成するのに十分な量である。

いくつかの実施形態では、本開示に従った組成物を、任意の多様な疾患、障害、および/または状態の治療に用いてもよい。

［キット］
本開示の多様な態様は、塩基エディターシステムを含むキットを提供する。一実施形態では、キットは、核酸塩基エディター融合タンパク質をコードするヌクレオチド配列を含む核酸構築物を含む。この融合タンパク質は、デアミナーゼ（例えばアデノシンデアミナーゼ）および核酸プログラム可能DNA結合タンパク質（napDNAbp）を含む。いくつかの実施形態では、キットは、関心対象の核酸分子を標的化可能である少なくとも1つのガイドRNAを含む。いくつかの実施形態では、キットは、少なくとも1つのガイドRNAをコードするヌクレオチド配列を含む核酸構築物を含む。一実施形態では、キットは、デアミナーゼを含む核酸塩基エディター融合タンパク質をコードするヌクレオチド配列と、アルファ-1アンチトリプシンポリヌクレオチドを標的化可能なガイドRNAとを含む、核酸構築物を含む。

キットは、いくつかの実施形態では、1つ以上の突然変異を編集するためにキットを使用するための説明書を提供する。説明書は、一般に、核酸分子を編集するためのキットの使用に関する情報を含む。他の実施形態では、説明書は、以下のうちの少なくとも1つを含む：注意事項；警告；臨床試験；および/または参考資料。使用説明書は、容器（もしあれば）に直接印刷するか、容器に貼付するラベルとして印刷するか、または容器内にもしくは容器とともに提供される独立したシート、パンフレット、カードまたはフォルダーとして印刷され得る。さらなる実施形態では、キットは、適切な動作パラメータのためのラベルまたは別個のインサート(添付文書)の形態で説明書を含むことができる。さらに別の実施形態では、キットは、検出、較正、または正規化のための標準（複数可）として使用される、適切な陽性および陰性対照または対照試料を有する1つ以上の容器を含むことができる。キットは、(滅菌) リン酸緩衝生理食塩水、リンゲル液、またはデキストロース溶液などの薬学的に許容され得る緩衝液を含む第二の容器をさらに含むことができる。さらに、他の緩衝剤、希釈剤、フィルター、針、シリンジ、および使用説明書付きの添付文書を含む、商業的観点および使用者の観点から望ましい他の物質を含むことができる。

［内部挿入を有する融合タンパク質］
本明細書に提供するのは、核酸プログラム可能核酸結合タンパク質、例えばnapDNAbpに融合した異種ポリペプチドを含む融合タンパク質である。異種ポリペプチドは、天然または野生型napDNAbpポリペプチド配列に見られないポリペプチドであってもよい。異種ポリペプチドをnapDNAbpのC末端かnapDNAbpのN末端で、napDNAbpに融合させてもよいし、napDNAbpの内部位置で挿入してもよい。いくつかの実施形態では、異種ポリペプチドをnapDNAbpの内部位置で挿入する。

いくつかの実施形態では、異種ポリペプチドはデアミナーゼまたはその機能的断片である。例えば、融合タンパク質は、Cas9またはCas12（例えばCas12b/C2cl）ポリペプチドのN末端断片およびC末端断片が隣接したデアミナーゼを含んでもよい。融合タンパク質中のデアミナーゼは、アデノシンデアミナーゼであってもよい。いくつかの実施形態では、アデノシンデアミナーゼはTadA(例えばTadA7.10またはTadA*8)である。いくつかの実施形態では、TadAはTadA*8である。本明細書に記載するようなTadA配列(例えばTadA7.10またはTadA*8)は、上述の融合タンパク質に適したデアミナーゼである。

デアミナーゼは循環置換体デアミナーゼであってもよい。例えば、デアミナーゼは循環置換体アデノシンデアミナーゼであってもよい。いくつかの実施形態では、デアミナーゼは循環置換体TadAであり、TadA参照配列における番号付けでアミノ酸残基116で循環置換されている。いくつかの実施形態では、デアミナーゼは循環置換体TadAであり、TadA参照配列における番号付けでアミノ酸残基136で循環置換されている。いくつかの実施形態では、デアミナーゼは循環置換体TadAであり、TadA参照配列における番号付けでアミノ酸残基65で循環置換されている。

融合タンパク質は、1つより多いデアミナーゼを含んでもよい。融合タンパク質は、例えば、1、2、3、4、5またはそれより多いデアミナーゼを含んでもよい。いくつかの実施形態では、融合タンパク質は1つのデアミナーゼを含む。いくつかの実施形態では、融合タンパク質は2つのデアミナーゼを含む。融合タンパク質中の2つ以上のデアミナーゼは、例えばPCT/US19/44935に記載されるように、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはその組み合わせであってもよい。2つ以上のデアミナーゼはホモダイマーであってもよい。2つ以上のデアミナーゼはヘテロダイマーであってもよい。2つ以上のデアミナーゼは、napDNAbp中、タンデムに挿入されてもよい。いくつかの実施形態では、2つ以上のデアミナーゼは、napDNAbp中、タンデムでなくてもよい。

いくつかの実施形態では、融合タンパク質中のnapDNAbpはCas9ポリペプチドまたはその断片である。Cas9ポリペプチドはバリアントCas9ポリペプチドであってもよい。いくつかの実施形態では、Cas9ポリペプチドはCas9ニッカーゼ（nCas9）ポリペプチドまたはその断片である。いくつかの実施形態では、Cas9ポリペプチドはヌクレアーゼ不活性Cas9（dCas9）ポリペプチドまたはその断片である。融合タンパク質中のCas9ポリペプチドは全長Cas9ポリペプチドであってもよい。いくつかの場合、融合タンパク質中のCas9ポリペプチドは全長Cas9ポリペプチドでなくてもよい。Cas9ポリペプチドは、例えば天然存在Cas9タンパク質に対してN末端またはC末端で一部切除されていてもよい。Cas9ポリペプチドは、循環置換Cas9タンパク質であってもよい。Cas9ポリペプチドは、標的ポリヌクレオチドおよびガイド核酸配列になお結合可能である、Cas9ポリペプチドの断片、部分、またはドメインであってもよい。

いくつかの実施形態では、Cas9ポリペプチドは、Streptococcus pyogenes Cas9（SpCas9）、Staphylococcus aureus Cas9（SaCas9）、Streptococcus thermophilus 1 Cas9（St1Cas9）、またはその断片もしくはバリアントである。

融合タンパク質のCas9ポリペプチドは、天然存在Cas9ポリペプチドに、少なくとも85％、少なくとも90％、少なくとも91％、少なくとも92％、少なくとも93％、少なくとも94％、少なくとも95％、少なくとも96％、少なくとも97％、少なくとも98％、少なくとも99％、または少なくとも99.5％同一であってもよい。

融合タンパク質のCas9ポリペプチドは、以下に示すCas9アミノ酸配列（以下、「Cas9参照配列」と呼ばれる）に、少なくとも85％、少なくとも90％、少なくとも91％、少なくとも92％、少なくとも93％、少なくとも94％、少なくとも95％、少なくとも96％、少なくとも97％、少なくとも98％、少なくとも99％、または少なくとも99.5％同一であるアミノ酸配列を含んでもよい：

（一重下線：HNHドメイン；二重下線：RuvCドメイン）

いくつかの実施形態では、融合タンパク質中のnapDNAbpはCas12ポリペプチド、例えばCas12b/C2cl、またはその断片である。Cas12ポリペプチドは、バリアントCas12ポリペプチドであってもよい。

異種ポリペプチド（例えばデアミナーゼ）を、適切な位置で、例えばnapDNAbpが標的ポリヌクレオチドおよびガイド核酸に結合する能力を保持するように、napDNAbp（例えばCas9またはCas12(例えばCas12b/C2cl)）中に挿入してもよい。デアミナーゼの機能（例えば塩基編集活性）またはnapDNAbpの機能（例えば標的核酸およびガイド核酸に結合する能力）を損なうことなく、デアミナーゼ（例えばアデノシンデアミナーゼ）をnapDNAbp内に挿入してもよい。デアミナーゼ（例えばアデノシンデアミナーゼ）を、例えば結晶研究によって示されるような、無秩序な領域、あるいは高温因子またはB因子を含む領域で、napDNAbp中に挿入してもよい。より秩序だっていない、無秩序な、または構造不定のタンパク質領域、例えば溶媒に曝露される領域およびループは、構造または機能に影響を与えずに、挿入に用いられ得る。デアミナーゼ（例えばアデノシンデアミナーゼ）を、柔軟なループ領域または溶媒曝露領域でnapDNAbp中に挿入してもよい。いくつかの実施形態では、デアミナーゼ（例えばアデノシンデアミナーゼ）を、Cas9またはCas12b/C2clポリペプチドの柔軟なループ中に挿入する。

いくつかの実施形態では、デアミナーゼ（例えばアデノシンデアミナーゼ）の挿入位置は、Cas9ポリペプチドの結晶構造のB因子分析によって決定される。いくつかの実施形態では、デアミナーゼ（例えばアデノシンデアミナーゼ）を、平均より高いB因子（例えば、総タンパク質または損傷を受けた領域を含むタンパク質ドメインに比較してより高いB因子）を含むCas9ポリペプチドの領域中に挿入する。B因子または温度因子は、平均位置からの原子のゆらぎを示し得る（例えば、温度依存性原子振動または結晶格子中の静的障害の結果として）。主鎖原子に関する高いB因子（例えば平均B因子より高い）は、局所可動性が比較的高い領域の指標であり得る。構造または機能を損なうことなく、デアミナーゼを挿入するためにこうした領域を用いてもよい。総タンパク質に関する平均B因子よりも50%、60%、70%、80%、90%、100%、110%、120%、130%、140%、150%、160%、170%、180%、190%、200%高い、または200%を超えて高いB因子を有するCα原子を有する残基を含む位置で、デアミナーゼ（例えばアデノシンデアミナーゼ）を挿入してもよい。以下のような残基を含むCas9タンパク質ドメインに関する平均B因子よりも50%、60%、70%、80%、90%、100%、110%、120%、130%、140%、150%、160%、170%、180%、190%、200%高い、または200%を超えて高いB因子を有するCα原子を有する残基を含む位置で、デアミナーゼ（例えばアデノシンデアミナーゼ）を挿入してもよい。平均B因子より高いB因子を含むCas9ポリペプチド位には、上記Cas9参照配列中で番号付けされるような、例えば残基768、792、1052、1015、1022、1026、1029、1067、1040、1054、1068、1246、1247、および1248が含まれてもよい。平均B因子より高いB因子を含むCas9ポリペプチド領域には、上記Cas9参照配列中で番号付けされるような、例えば残基792～872、792～906、および2～791が含まれてもよい。

上記Cas9参照配列中で番号付けされるような768、791、792、1015、1016、1022、1023、1026、1029、1040、1052、1054、1067、1068、1069、1246、1247、および1248からなる群より選択されるアミノ酸残基、または別のCas9ポリペプチド中の対応するアミノ酸残基で、napDNAbp中に異種ポリペプチド（例えばデアミナーゼ）を挿入してもよい。いくつかの実施形態では、上記Cas9参照配列中で番号付けされるようなアミノ酸位768～769、791～792、792～793、1015～1016、1022～1023、1026～1027、1029～1030、1040～1041、1052～1053、1054～1055、1067～1068、1068～1069、1247～1248、または1248～1249、あるいはその対応するアミノ酸位の間で、異種ポリペプチドを挿入する。いくつかの実施形態では、上記Cas9参照配列中で番号付けされるようなアミノ酸位769～770、792～793、793～794、1016～1017、1023～1024、1027～1028、1030～1031、1041～1042、1053～1054、1055～1056、1068～1069、1069～1070、1248～1249、または1249～1250、あるいはその対応するアミノ酸位の間で、異種ポリペプチドを挿入する。いくつかの実施形態では、異種ポリペプチドは: 上記Cas9参照配列中で番号付けされるような768、791、792、1015、1016、1022、1023、1026、1029、1040、1052、1054、1067、1068、1069、1246、1247、および1248からなる群、または別のCas9ポリペプチド中の対応するアミノ酸残基より選択されるアミノ酸残基を、異種ポリペプチドが置換する。挿入位に関する上記Cas9参照配列に対する言及は、例示目的のためであることが理解されなければならない。本明細書に論じるような挿入は、上記Cas9参照配列のCas9ポリペプチド配列に限定されず、バリアントCas9ポリペプチド、例えばCas9ニッカーゼ(nCas9)、ヌクレアーゼ不活性Cas9 (dCas9)、ヌクレアーゼドメインを欠くCas9バリアント、一部切除Cas9、あるいは部分的または全長HNHドメインを欠くCas9ドメインが含まれる。

異種ポリペプチド（例えばデアミナーゼ）を: 上記Cas9参照配列中で番号付けされるような768、792、1022、1026、1040、1068、および1247からなる群、または別のCas9ポリペプチド中の対応するアミノ酸残基より選択されるアミノ酸残基で、napDNAbp中に挿入してもよい。いくつかの実施形態では、異種ポリペプチドを、上記Cas9参照配列中で番号付けされるようなアミノ酸位768～769、792～793、1022～1023、1026～1027、1029～1030、1040～1041、1068～1069、または1247～1248、あるいはその対応するアミノ酸位の間で挿入する。いくつかの実施形態では、異種ポリペプチドを、上記Cas9参照配列中で番号付けされるようなアミノ酸位769～770、793～794、1023～1024、1027～1028、1030～1031、1041～1042、1069～1070、または1248～1249、あるいはその対応するアミノ酸位の間で挿入する。いくつかの実施形態では、異種ポリペプチドは: 上記Cas9参照配列中で番号付けされるような768、792、1022、1026、1040、1068、および1247からなる群、または別のCas9ポリペプチド中の対応するアミノ酸残基より選択されるアミノ酸残基を置換する。

異種ポリペプチド（例えばデアミナーゼ）を、本明細書に記載するようなアミノ酸残基、または別のCas9ポリペプチド中の対応するアミノ酸残基で、napDNAbp中に挿入してもよい。一実施形態では、異種ポリペプチド（例えばデアミナーゼ）を: 上記Cas9参照配列中で番号付けされるような1002、1003、1025、1052～1056、1242～1247、1061～1077、943～947、686～691、569～578、530～539、および1060～1077からなる群、または別のCas9ポリペプチド中の対応するアミノ酸残基より選択されるアミノ酸残基で、napDNAbp中に挿入してもよい。デアミナーゼ（例えばアデノシンデアミナーゼ）を残基のN末端またはC末端で挿入してもよいし、あるいはデアミナーゼ（例えばアデノシンデアミナーゼ）が残基を置換してもよい。いくつかの実施形態では、デアミナーゼ（例えばアデノシンデアミナーゼ）を残基のC末端に挿入する。

いくつかの実施形態では、アデノシンデアミナーゼ（例えばTadA）を：上記Cas9参照配列中で番号付けされるような1015、1022、1029、1040、1068、1247、1054、1026、768、1067、1248、1052、および1246からなる群、または別のCas9ポリペプチド中の対応するアミノ酸残基より選択されるアミノ酸残基で挿入する。いくつかの実施形態では、アデノシンデアミナーゼ（例えばTadA）を、上記Cas9参照配列中で番号付けされるような残基792～872、792～906、または2～791、あるいは別のCas9ポリペプチド中の対応するアミノ酸残基の代わりに挿入する。いくつかの実施形態では、アデノシンデアミナーゼを：上記Cas9参照配列中で番号付けされるような1015、1022、1029、1040、1068、1247、1054、1026、768、1067、1248、1052、および1246からなる群、または別のCas9ポリペプチドより選択されるアミノ酸のN末端に挿入する。いくつかの実施形態では、アデノシンデアミナーゼを：上記Cas9参照配列中で番号付けされるような1015、1022、1029、1040、1068、1247、1054、1026、768、1067、1248、1052、および1246からなる群、または別のCas9ポリペプチド中の対応するアミノ酸残基より選択されるアミノ酸のC末端に挿入する。いくつかの実施形態では、アデノシンデアミナーゼを：上記Cas9参照配列中で番号付けされるような1015、1022、1029、1040、1068、1247、1054、1026、768、1067、1248、1052、および1246からなる群、または別のCas9ポリペプチド中の対応するアミノ酸残基より選択されるアミノ酸を置換するよう挿入する。

いくつかの実施形態では、デアミナーゼ（例えばアデノシンデアミナーゼ）を、上記Cas9参照配列中で番号付けされるようなアミノ酸残基768、または別のCas9ポリペプチド中の対応するアミノ酸残基で挿入する。いくつかの実施形態では、デアミナーゼ（例えばアデノシンデアミナーゼ）を、上記Cas9参照配列中で番号付けされるようなアミノ酸残基768、または別のCas9ポリペプチド中の対応するアミノ酸残基のN末端で挿入する。いくつかの実施形態では、デアミナーゼ（例えばアデノシンデアミナーゼ）を、上記Cas9参照配列中で番号付けされるようなアミノ酸残基768、または別のCas9ポリペプチド中の対応するアミノ酸残基のC末端で挿入する。いくつかの実施形態では、デアミナーゼ（例えばアデノシンデアミナーゼ）を、上記Cas9参照配列中で番号付けされるようなアミノ酸残基768、または別のCas9ポリペプチド中の対応するアミノ酸残基を置換するように挿入する。

いくつかの実施形態では、デアミナーゼ（例えばアデノシンデアミナーゼ）を、上記Cas9参照配列中で番号付けされるようなアミノ酸残基791で挿入するか、またはアミノ酸残基792で挿入するか、あるいは別のCas9ポリペプチド中の対応するアミノ酸残基で挿入する。いくつかの実施形態では、デアミナーゼ（例えばアデノシンデアミナーゼ）を、上記Cas9参照配列中で番号付けされるようなアミノ酸残基791のN末端で、またはアミノ酸残基792のN末端で、あるいは別のCas9ポリペプチド中の対応するアミノ酸残基のN末端で挿入する。いくつかの実施形態では、デアミナーゼ（例えばアデノシンデアミナーゼ）を、上記Cas9参照配列中で番号付けされるようなアミノ酸残基791のC末端で、またはアミノ酸残基792のN末端で、あるいは別のCas9ポリペプチド中の対応するアミノ酸残基で挿入する。いくつかの実施形態では、デアミナーゼ（例えばアデノシンデアミナーゼ）を、上記Cas9参照配列中で番号付けされるようなアミノ酸残基791を置換するように挿入するか、またはアミノ酸残基792を置換するように挿入するか、あるいは別のCas9ポリペプチド中の対応するアミノ酸残基を置換するように挿入する。

いくつかの実施形態では、デアミナーゼ（例えばアデノシンデアミナーゼ）を、上記Cas9参照配列中で番号付けされるようなアミノ酸残基1016、または別のCas9ポリペプチド中の対応するアミノ酸残基で挿入する。いくつかの実施形態では、デアミナーゼ（例えばアデノシンデアミナーゼ）を、上記Cas9参照配列中で番号付けされるようなアミノ酸残基1016、または別のCas9ポリペプチド中の対応するアミノ酸残基のN末端で挿入する。いくつかの実施形態では、デアミナーゼ（例えばアデノシンデアミナーゼ）を、上記Cas9参照配列中で番号付けされるようなアミノ酸残基1016、または別のCas9ポリペプチド中の対応するアミノ酸残基のC末端で挿入する。いくつかの実施形態では、デアミナーゼ（例えばアデノシンデアミナーゼ）を、上記Cas9参照配列中で番号付けされるようなアミノ酸残基1016、または別のCas9ポリペプチド中の対応するアミノ酸残基を置換するように挿入する。

いくつかの実施形態では、デアミナーゼ（例えばアデノシンデアミナーゼ）を、上記Cas9参照配列中で番号付けされるようなアミノ酸残基1022で挿入するか、またはアミノ酸残基1023で挿入するか、あるいは別のCas9ポリペプチド中の対応するアミノ酸残基で挿入する。いくつかの実施形態では、デアミナーゼ（例えばアデノシンデアミナーゼ）を、上記Cas9参照配列中で番号付けされるようなアミノ酸残基1022のN末端で、またはアミノ酸残基1023のN末端で、あるいは別のCas9ポリペプチド中の対応するアミノ酸残基のN末端で挿入する。いくつかの実施形態では、デアミナーゼ（例えばアデノシンデアミナーゼ）を、上記Cas9参照配列中で番号付けされるようなアミノ酸残基1022のC末端で、またはアミノ酸残基1023のC末端で、あるいは別のCas9ポリペプチド中の対応するアミノ酸残基のC末端で挿入する。いくつかの実施形態では、デアミナーゼ（例えばアデノシンデアミナーゼ）を、上記Cas9参照配列中で番号付けされるようなアミノ酸残基1022を置換するように挿入するか、またはアミノ酸残基1023を置換するように挿入するか、あるいは別のCas9ポリペプチド中の対応するアミノ酸残基を置換するように挿入する。

いくつかの実施形態では、デアミナーゼ（例えばアデノシンデアミナーゼ）を、上記Cas9参照配列中で番号付けされるようなアミノ酸残基1026で挿入するか、またはアミノ酸残基1029で挿入するか、あるいは別のCas9ポリペプチド中の対応するアミノ酸残基で挿入する。いくつかの実施形態では、デアミナーゼ（例えばアデノシンデアミナーゼ）を、上記Cas9参照配列中で番号付けされるようなアミノ酸残基1026のN末端で、またはアミノ酸残基1029のN末端で、あるいは別のCas9ポリペプチド中の対応するアミノ酸残基のN末端で挿入する。いくつかの実施形態では、デアミナーゼ（例えばアデノシンデアミナーゼ）を、上記Cas9参照配列中で番号付けされるようなアミノ酸残基1026のC末端で、またはアミノ酸残基1029のC末端で、あるいは別のCas9ポリペプチド中の対応するアミノ酸残基のC末端で挿入する。いくつかの実施形態では、デアミナーゼ（例えばアデノシンデアミナーゼ）を、上記Cas9参照配列中で番号付けされるようなアミノ酸残基1026を置換するように挿入するか、またはアミノ酸残基1029を置換するように挿入するか、あるいは別のCas9ポリペプチド中の対応するアミノ酸残基を置換するように挿入する。

いくつかの実施形態では、デアミナーゼ（例えばアデノシンデアミナーゼ）を、上記Cas9参照配列中で番号付けされるようなアミノ酸残基1040、または別のCas9ポリペプチド中の対応するアミノ酸残基で挿入する。いくつかの実施形態では、デアミナーゼ（例えばアデノシンデアミナーゼ）を、上記Cas9参照配列中で番号付けされるようなアミノ酸残基1040、または別のCas9ポリペプチド中の対応するアミノ酸残基のN末端で挿入する。いくつかの実施形態では、デアミナーゼ（例えばアデノシンデアミナーゼ）を、上記Cas9参照配列中で番号付けされるようなアミノ酸残基1040、または別のCas9ポリペプチド中の対応するアミノ酸残基のC末端で挿入する。いくつかの実施形態では、デアミナーゼ（例えばアデノシンデアミナーゼ）を、上記Cas9参照配列中で番号付けされるようなアミノ酸残基1040、または別のCas9ポリペプチド中の対応するアミノ酸残基を置換するように挿入する。

いくつかの実施形態では、デアミナーゼ（例えばアデノシンデアミナーゼ）を、上記Cas9参照配列中で番号付けされるようなアミノ酸残基1052で挿入するか、またはアミノ酸残基1054で挿入するか、あるいは別のCas9ポリペプチド中の対応するアミノ酸残基で挿入する。いくつかの実施形態では、デアミナーゼ（例えばアデノシンデアミナーゼ）を、上記Cas9参照配列中で番号付けされるようなアミノ酸残基1052のN末端で、またはアミノ酸残基1054のN末端で、あるいは別のCas9ポリペプチド中の対応するアミノ酸残基のN末端で挿入する。いくつかの実施形態では、デアミナーゼ（例えばアデノシンデアミナーゼ）を、上記Cas9参照配列中で番号付けされるようなアミノ酸残基1052のC末端で、またはアミノ酸残基1054のC末端で、あるいは別のCas9ポリペプチド中の対応するアミノ酸残基のC末端で挿入する。いくつかの実施形態では、デアミナーゼ（例えばアデノシンデアミナーゼ）を、上記Cas9参照配列中で番号付けされるようなアミノ酸残基1052を置換するように挿入するか、またはアミノ酸残基1054を置換するように挿入するか、あるいは別のCas9ポリペプチド中の対応するアミノ酸残基を置換するように挿入する。

いくつかの実施形態では、デアミナーゼ（例えばアデノシンデアミナーゼ）を、上記Cas9参照配列中で番号付けされるようなアミノ酸残基1067で挿入するか、またはアミノ酸残基1068で挿入するか、またはアミノ酸残基1069で挿入するか、あるいは別のCas9ポリペプチド中の対応するアミノ酸残基で挿入する。いくつかの実施形態では、デアミナーゼ（例えばアデノシンデアミナーゼ）を、上記Cas9参照配列中で番号付けされるようなアミノ酸残基1067のN末端で、またはアミノ酸残基1068のN末端で、またはアミノ酸残基1069のN末端で、あるいは別のCas9ポリペプチド中の対応するアミノ酸残基のN末端で挿入する。いくつかの実施形態では、デアミナーゼ（例えばアデノシンデアミナーゼ）を、上記Cas9参照配列中で番号付けされるようなアミノ酸残基1067のC末端で、またはアミノ酸残基1068のC末端で、またはアミノ酸残基1069のC末端で、あるいは別のCas9ポリペプチド中の対応するアミノ酸残基のC末端で挿入する。いくつかの実施形態では、デアミナーゼ（例えばアデノシンデアミナーゼ）を、上記Cas9参照配列中で番号付けされるようなアミノ酸残基1067を置換するように挿入するか、またはアミノ酸残基1068を置換するように挿入するか、またはアミノ酸残基1069を置換するように挿入するか、あるいは別のCas9ポリペプチド中の対応するアミノ酸残基を置換するように挿入する。

いくつかの実施形態では、デアミナーゼ（例えばアデノシンデアミナーゼ）を、上記Cas9参照配列中で番号付けされるようなアミノ酸残基1246で挿入するか、またはアミノ酸残基1247で挿入するか、またはアミノ酸残基1248で挿入するか、あるいは別のCas9ポリペプチド中の対応するアミノ酸残基で挿入する。いくつかの実施形態では、デアミナーゼ（例えばアデノシンデアミナーゼ）を、上記Cas9参照配列中で番号付けされるようなアミノ酸残基1246のN末端で、またはアミノ酸残基1247のN末端で、またはアミノ酸残基1248のN末端で、あるいは別のCas9ポリペプチド中の対応するアミノ酸残基のN末端で挿入する。いくつかの実施形態では、デアミナーゼ（例えばアデノシンデアミナーゼ）を、上記Cas9参照配列中で番号付けされるようなアミノ酸残基1246のC末端で、またはアミノ酸残基1247のC末端で、またはアミノ酸残基1248のC末端で、あるいは別のCas9ポリペプチド中の対応するアミノ酸残基のC末端で挿入する。いくつかの実施形態では、デアミナーゼ（例えばアデノシンデアミナーゼ）を、上記Cas9参照配列中で番号付けされるようなアミノ酸残基1246を置換するように挿入するか、またはアミノ酸残基1247を置換するように挿入するか、またはアミノ酸残基1248を置換するように挿入するか、あるいは別のCas9ポリペプチド中の対応するアミノ酸残基を置換するように挿入する。

いくつかの実施形態では、異種ポリペプチド（例えばデアミナーゼ）をCas9ポリペプチドの柔軟なループ中に挿入する。柔軟なループ部分は、上記Cas9参照配列中で番号付けされるような530～537、569～570、686～691、943～947、1002～1025、1052～1077、1232～1247、または1298～1300からなる群、あるいは別のCas9ポリペプチド中の対応するアミノ酸残基より選択されてもよい。柔軟なループ部分は：上記Cas9参照配列中で番号付けされるような1～529、538～568、580～685、692～942、948～1001、1026～1051、1078～1231、または1248～1297からなる群、あるいは別のCas9ポリペプチド中の対応するアミノ酸残基より選択されてもよい。

異種ポリペプチド（例えばアデニンデアミナーゼ）を：上記Cas9参照配列中で番号付けされるようなアミノ酸残基1017～1069、1242～1247、1052～1056、1060～1077、1002～1003、943～947、530～537、568～579、686～691,1242～1247、1298～1300、1066～1077、1052～1056、または1060～1077、あるいは別のCas9ポリペプチド中の対応するアミノ酸残基に対応するCas9ポリペプチド領域に挿入してもよい。

異種ポリペプチド（例えばアデニンデアミナーゼ）をCas9ポリペプチドの欠失領域の代わりに挿入してもよい。欠失領域は、Cas9ポリペプチドのN末端またはC末端部分に対応してもよい。いくつかの実施形態では、欠失領域は、上記Cas9参照配列中で番号付けされるような残基792～872、または別のCas9ポリペプチド中の対応するアミノ酸残基に対応する。いくつかの実施形態では、欠失領域は、上記Cas9参照配列中で番号付けされるような残基792～906、または別のCas9ポリペプチド中の対応するアミノ酸残基に対応する。いくつかの実施形態では、欠失領域は、上記Cas9参照配列中で番号付けされるような残基2～791、または別のCas9ポリペプチド中の対応するアミノ酸残基に対応する。いくつかの実施形態では、欠失領域は、上記Cas9参照配列中で番号付けされるような残基1017～1069、またはその対応するアミノ酸残基に対応する。

例示的な内部融合塩基エディターを以下の表13Aに提供し、これはまた、PCT/US20/16285にも記載される。

表13A： Cas9タンパク質中の挿入遺伝子座

異種ポリペプチド（例えばデアミナーゼ）を、Cas9ポリペプチドの構造または機能ドメイン内に挿入してもよい。異種ポリペプチド（例えばデアミナーゼ）を、Cas9ポリペプチドの2つの構造または機能ドメインの間に挿入してもよい。例えばCas9ポリペプチドから構造または機能ドメインを欠失させた後、Cas9ポリペプチドのそのドメインの代わりに、異種ポリペプチド（例えばデアミナーゼ）を挿入してもよい。Cas9ポリペプチドの構造または機能ドメインには、例えば、RuvC I、RuvC II、RuvC III、Rec1、Rec2、PI、またはHNHが含まれてもよい。

いくつかの実施形態では、Cas9ポリペプチドは：RuvC I、RuvC II、RuvC III、Rec1、Rec2、PI、またはHNHドメインからなる群より選択される1つ以上のドメインを欠く。いくつかの実施形態では、Cas9ポリペプチドはヌクレアーゼドメインを欠く。いくつかの実施形態では、Cas9ポリペプチドはHNHドメインを欠く。いくつかの実施形態では、Cas9ポリペプチドのHNH活性が減少しているかまたは無効になっているように、Cas9ポリペプチドはHNHドメインの部分を欠く。

いくつかの実施形態では、Cas9ポリペプチドはヌクレアーゼドメインの欠失を含み、デアミナーゼが挿入されてヌクレアーゼドメインを置換する。いくつかの実施形態では、HNHドメインが欠失され、デアミナーゼがその代わりに挿入される。いくつかの実施形態では、1つ以上のRuvCドメインが欠失され、デアミナーゼがその代わりに挿入される。

異種ポリペプチドを含む融合タンパク質には、napDNAbpのN末端およびC末端断片が隣接していてもよい。いくつかの実施形態では、融合タンパク質は、Cas9ポリペプチドのN末端断片およびC末端断片が隣接するデアミナーゼを含む。N末端断片またはC末端断片は標的ポリヌクレオチド配列に結合可能である。N末端断片のC末端またはC末端断片のN末端は、Cas9ポリペプチドの柔軟なループの一部を含んでもよい。N末端断片のC末端またはC末端断片のN末端は、Cas9ポリペプチドのアルファらせん構造の一部を含んでもよい。N末端断片またはC末端断片は、DNA結合ドメインを含んでもよい。N末端断片またはC末端断片は、RuvCドメインを含んでもよい。N末端断片またはC末端断片は、HNHドメインを含んでもよい。いくつかの実施形態では、N末端断片およびC末端断片のいずれも、HNHドメインを含まない。

いくつかの実施形態では、N末端Cas9断片のC末端は、融合タンパク質が標的核酸塩基を脱アミノ化する際、標的核酸塩基の近傍にあるアミノ酸を含む。いくつかの実施形態では、C末端Cas9断片のN末端は、融合タンパク質が標的核酸塩基を脱アミノ化する際、標的核酸塩基の近傍にあるアミノ酸を含む。N末端Cas9断片のC末端またはC末端Cas9断片のN末端において、標的核酸塩基およびアミノ酸の間が近接するように、異なるデアミナーゼの挿入位置は異なってもよい。例えば、ABEの挿入位置は、上記Cas9参照配列中で番号付けされるような1015、1022、1029、1040、1068、1247、1054、1026、768、1067、1248、1052、および1246からなる群、または別のCas9ポリペプチド中の対応するアミノ酸残基より選択されるアミノ酸残基であってもよい。

融合タンパク質のN末端Cas9断片（すなわち融合タンパク質中のデアミナーゼに隣接するN末端Cas9断片）は、Cas9ポリペプチドのN末端を含んでもよい。融合タンパク質のN末端Cas9断片は、少なくとも約100、200、300、400、500、600、700、800、900、1000、1100、1200、または1300アミノ酸残基の長さを含んでもよい。融合タンパク質のN末端Cas9断片は、上記Cas9参照配列中で番号付けされるようなアミノ酸残基: 1～56、1～95、1～200、1～300、1～400、1～500、1～600、1～700、1～718、1～765、1～780、1～906、1～918、または1～1100、あるいは別のCas9ポリペプチド中の対応するアミノ酸残基に対応する配列を含んでもよい。N末端Cas9断片は、上記Cas9参照配列中で番号付けされるようなアミノ酸残基：1～56、1～95、1～200、1～300、1～400、1～500、1～600、1～700、1～718、1～765、1～780、1～906、1～918、または1～1100に、あるいは別のCas9ポリペプチド中の対応するアミノ酸残基に、少なくとも85%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも99.5%の配列同一性を含む配列を含んでもよい。

融合タンパク質のC末端Cas9断片（すなわち融合タンパク質中のデアミナーゼに隣接するC末端Cas9断片）は、Cas9ポリペプチドのC末端を含んでもよい。融合タンパク質のC末端Cas9断片は、少なくとも約100、200、300、400、500、600、700、800、900、1000、1100、1200、または1300アミノ酸の長さを含んでもよい。融合タンパク質のC末端Cas9断片は、上記Cas9参照配列中で番号付けされるようなアミノ酸残基:1099～1368、918～1368、906～1368、780～1368、765～1368、718～1368、94～1368、または56～1368、あるいは別のCas9ポリペプチド中の対応するアミノ酸残基に対応する配列を含んでもよい。N末端Cas9断片は、上記Cas9参照配列中で番号付けされるようなアミノ酸残基：1099～1368、918～1368、906～1368、780～1368、765～1368、718～1368、94～1368、または56～1368、あるいは別のCas9ポリペプチド中の対応するアミノ酸残基に、少なくとも85%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも99.5%の配列同一性を含む配列を含んでもよい。

融合タンパク質のN末端Cas9断片およびC末端Cas9断片は、ともに、例えば上記Cas9参照配列に示すような、全長天然存在Cas9ポリペプチド配列に対応しない可能性もある。

本明細書記載の融合タンパク質は、非標的部位（例えばオフターゲット部位）での脱アミノ化が減少した、例えばゲノム全体の目的外（spurious）脱アミノ化が減少した、標的化脱アミノ化を達成し得る。本明細書記載の融合タンパク質は、非標的部位でのバイスタンダー脱アミノ化が減少した標的化脱アミノ化を達成し得る。望ましくない脱アミノ化またはオフターゲット脱アミノ化は、例えば、Cas9ポリペプチドのN末端またはC末端に融合したデアミナーゼを含む末端融合タンパク質と比較して、少なくとも30%、少なくとも40%、少なくとも50%、少なくとも60%、少なくとも70%、少なくとも80%、少なくとも90%、少なくとも95%、または少なくとも99%、減少し得る。望ましくない脱アミノ化またはオフターゲット脱アミノ化は、例えば、Cas9ポリペプチドのN末端またはC末端に融合したデアミナーゼを含む末端融合タンパク質と比較して、少なくとも1倍、少なくとも2倍、少なくとも3倍、少なくとも4倍、少なくとも5倍、少なくとも10倍、少なくとも15倍、少なくとも20倍、少なくとも30倍、少なくとも40倍、少なくとも50倍、少なくとも60倍、少なくとも70倍、少なくとも80倍、少なくとも90倍、または少なくとも100倍、減少し得る。

いくつかの実施形態では、融合タンパク質のデアミナーゼ（例えばアデノシンデアミナーゼ）は、Rループの範囲内で2つより多い核酸塩基を脱アミノ化しない。いくつかの実施形態では、融合タンパク質のデアミナーゼは、Rループの範囲内で3つより多くの核酸塩基を脱アミノ化しない。いくつかの実施形態では、融合タンパク質のデアミナーゼは、Rループの範囲内で2、3、4、5、6、7、8、9、または10より多くの核酸塩基を脱アミノ化しない。RループはDNA:RNAハイブリッド、DNA:DNAまたはRNA:RNA相補構造を含み、一本鎖DNAと会合する三本鎖核酸構造である。本明細書において使用する際、Rループは、標的ポリヌクレオチドがCRISPR複合体または塩基編集複合体と接触した際に形成可能であり、ここで、ガイドポリヌクレオチド、例えばガイドRNAの部分が、標的ポリヌクレオチド、例えば標的DNAの部分とハイブリダイズし、そしてこれを置換する。いくつかの実施形態では、Rループは、スペーサー配列および標的DNA相補配列のハイブリダイズした領域を含む。Rループ領域は、長さ約5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、または50核酸塩基対であってもよい。いくつかの実施形態では、Rループ領域は長さ約20核酸塩基対である。本明細書で使用する際、Rループ領域はガイドポリヌクレオチドとハイブリダイズする標的DNA鎖に限定されないことを理解すべきである。例えば、Rループ領域内の標的核酸塩基の編集は、ガイドRNAに対する相補鎖を含むDNA鎖に対してでもよいし、またはガイドRNAに相補的な鎖の反対の鎖であるDNA鎖に対してであってもよい。いくつかの実施形態では、Rループ領域中の編集は、標的DNA配列において、ガイドRNAに対する非相補鎖（プロトスペーサー鎖）上の核酸塩基の編集を含む。

本明細書記載の融合タンパク質は、カノニカルな塩基編集とは異なる編集ウィンドウの標的脱アミノ化を達成し得る。いくつかの実施形態では、標的核酸塩基は、標的ポリヌクレオチド配列において、PAM配列の約1～約20塩基上流である。いくつかの実施形態では、標的核酸塩基は、標的ポリヌクレオチド配列において、PAM配列の約2～約12塩基上流である。いくつかの実施形態では、標的核酸塩基は、PAM配列から、約1～9塩基対、約2～10塩基対、約3～11塩基対、約4～12塩基対、約5～13塩基対、約6～14塩基対、約7～15塩基対、約8～16塩基対、約9～17塩基対、約10～18塩基対、約11～19塩基対、約12～20塩基対、約1～7塩基対、約2～8塩基対、約3～9塩基対、約4～10塩基対、約5～11塩基対、約6～12塩基対、約7～13塩基対、約8～14塩基対、約9～15塩基対、約10～16塩基対、約11～17塩基対、約12～18塩基対、約13～19塩基対、約14～20塩基対、約1～5塩基対、約2～6塩基対、約3～7塩基対、約4～8塩基対、約5～9塩基対、約6～10塩基対、約7～11塩基対、約8～12塩基対、約9～13塩基対、約10～14塩基対、約11～15塩基対、約12～16塩基対、約13～17塩基対、約14～18塩基対、約15～19塩基対、約16～20塩基対、約1～3塩基対、約2～4塩基対、約3～5塩基対、約4～6塩基対、約5～7塩基対、約6～8塩基対、約7～9塩基対、約8～10塩基対、約9～11塩基対、約10～12塩基対、約11～13塩基対、約12～14塩基対、約13～15塩基対、約14～16塩基対、約15～17塩基対、約16～18塩基対、約17～19塩基対、約18～20塩基対、離れているかまたは上流である。いくつかの実施形態では、標的核酸塩基は、PAM配列から、約1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20塩基対、またはそれより多く離れているかまたは上流である。いくつかの実施形態では、標的核酸塩基は、PAM配列の約1、2、3、4、5、6、7、8、または9塩基対上流である。いくつかの実施形態では、標的核酸塩基は、PAM配列の約2、3、4、または6塩基対上流である。

融合タンパク質は、1つより多い異種ポリペプチドを含んでもよい。例えば、融合タンパク質は、1つ以上のUGIドメインおよび/または1つ以上の核局在化シグナルをさらに含んでもよい。2つ以上の異種ドメインをタンデムに挿入してもよい。NapDNAbpとタンデムでないような位置で2つ以上の異種ドメインを挿入してもよい。

融合タンパク質は、デアミナーゼおよびnapDNAbpポリペプチドの間にリンカーを含んでもよい。リンカーは、ペプチドまたは非ペプチドリンカーであってもよい。例えば、リンカーは、XTEN、(GGGS)n、(GGGGS)n、(G)n、(EAAAK)n、(GGS)n、SGSETPGTSESATPESであってもよい。いくつかの実施形態では、融合タンパク質は、N末端Cas9断片およびデアミナーゼの間にリンカーを含む。いくつかの実施形態では、融合タンパク質は、C末端Cas9断片およびデアミナーゼの間にリンカーを含む。いくつかの実施形態では、napDNAbpのN末端およびC末端断片は、リンカーでデアミナーゼに連結される。いくつかの実施形態では、N末端およびC末端断片は、リンカーを伴わずにデアミナーゼドメインに連結される。いくつかの実施形態では、融合タンパク質は、N末端Cas9断片およびデアミナーゼの間にリンカーを含むが、C末端Cas9断片およびデアミナーゼの間にリンカーを含まない。いくつかの実施形態では、融合タンパク質は、C末端Cas9断片およびデアミナーゼの間にリンカーを含むが、N末端Cas9断片およびデアミナーゼの間にリンカーを含まない。

他の実施形態では、Cas12ポリペプチドのNまたはC末端断片は、核酸プログラム可能DNA結合ドメインまたはRuvCドメインを含む。他の実施形態では、融合タンパク質は、Cas12ポリペプチドおよび触媒ドメインの間にリンカーを含有する。他の実施形態では、リンカーのアミノ酸配列は、GGSGGSまたはGSSGSETPGTSESATPESSGである。他の実施形態では、リンカーは剛性リンカーである。上記態様の他の実施形態では、リンカーは、GGAGGCTCTGGAGGAAGCまたはGGCTCTTCTGGATCTGAAACACCTGGCACAAGCGAGAGCGCCACCCCTGAGAGCTCTGGCによってコードされる。

Cas9またはCas12ポリペプチドのNおよびC末端断片が隣接する異種触媒ドメインを含む融合タンパク質はまた、本明細書に記載するような方法において、塩基編集のために有用である。Cas9またはCas12および1つ以上のデアミナーゼドメイン、例えばアデノシンデアミナーゼドメインを含むか、あるいはCas9またはCas12が隣接したアデノシンデアミナーゼドメインを含む融合タンパク質もまた、標的配列の非常に特異的で効率的な塩基編集のために有用である。一実施形態では、キメラCas9またはCas12融合タンパク質は、Cas12ポリペプチド内に挿入された異種触媒ドメインを含有する。

多様な実施形態では、触媒ドメインは、DNA改変活性（例えばデアミナーゼ活性）、例えばアデノシンデアミナーゼ活性を有する。いくつかの実施形態では、アデノシンデアミナーゼはTadA（例えばTadA7.10）である。いくつかの実施形態では、TadAはTadA*8である。他の実施形態では、融合タンパク質は、1つ以上の触媒ドメインを含有する。他の実施形態では、1つ以上の触媒ドメインの少なくとも1つをCas12ポリペプチド内に挿入するか、あるいはCas12 N末端またはC末端に融合させる。他の実施形態では、1つ以上の触媒ドメインの少なくとも１つを、Cas12ポリペプチドのループ、アルファらせん領域、非構造化部分、または溶媒アクセス可能部分に挿入する。他の実施形態では、Cas12ポリペプチドは、Cas12a、Cas12b、Cas12c、Cas12d、Cas12e、Cas12g、Cas12h、またはCas12iである。他の実施形態では、Cas12ポリペプチドは、Bacillus hisashii Cas12b、Bacillus thermoamylovorans Cas12b、Bacillus種 V3-13 Cas12b、またはAlicyclobacillus acidiphilus Cas12bに、少なくとも約85%のアミノ酸配列同一性を有する。他の実施形態では、Cas12ポリペプチドは、Bacillus hisashii Cas12b、Bacillus thermoamylovorans Cas12b、Bacillus種 V3-13 Cas12b、またはAlicyclobacillus acidiphilus Cas12bに、少なくとも約90%のアミノ酸配列同一性を有する。他の実施形態では、Cas12ポリペプチドは、Bacillus hisashii Cas12b、Bacillus thermoamylovorans Cas12b、Bacillus種 V3-13 Cas12b、またはAlicyclobacillus acidiphilus Cas12bに、少なくとも約95%のアミノ酸配列同一性を有する。他の実施形態では、Cas12ポリペプチドは、Bacillus hisashii Cas12b、Bacillus thermoamylovorans Cas12b、Bacillus種 V3-13 Cas12b、またはAlicyclobacillus acidiphilus Cas12bの断片を含有するか、または本質的にこうした断片からなる。

他の実施形態では、触媒ドメインは、BhCas12bのアミノ酸位153～154、255～256、306～307、980～981、1019～1020、534～535、604～605、または344～345の間、あるいはCas12a、Cas12c、Cas12d、Cas12e、Cas12g、Cas12h、またはCas12iの対応するアミノ酸残基の間に挿入される。他の実施形態では、触媒ドメインは、BhCas12bのP153およびS154の間に挿入される。他の実施形態では、触媒ドメインは、BhCas12bのK255およびE256の間に挿入される。他の実施形態では、触媒ドメインは、BhCas12bのD980およびG981の間に挿入される。他の実施形態では、触媒ドメインは、BhCas12bのK1019およびL1020の間に挿入される。他の実施形態では、触媒ドメインは、BhCas12bのF534およびP535の間に挿入される。他の実施形態では、触媒ドメインは、BhCas12bのK604およびG605の間に挿入される。他の実施形態では、触媒ドメインは、BhCas12bのH344およびF345の間に挿入される。他の実施形態では、触媒ドメインは、BvCas12bのアミノ酸位147および148、248および249、299および300、991および992、または1031および1032の間、あるいはCas12a、Cas12c、Cas12d、Cas12e、Cas12g、Cas12h、またはCas12iの対応するアミノ酸残基の間に挿入される。他の実施形態では、触媒ドメインは、BvCas12bのP147およびD148の間に挿入される。他の実施形態では、触媒ドメインは、BvCas12bのG248およびG249の間に挿入される。他の実施形態では、触媒ドメインは、BvCas12bのP299およびE300の間に挿入される。他の実施形態では、触媒ドメインは、BvCas12bのG991およびE992の間に挿入される。他の実施形態では、触媒ドメインは、BvCas12bのK1031およびM1032の間に挿入される。他の実施形態では、触媒ドメインは、AaCas12bのアミノ酸位157および158、258および259、310および311、1008および1009、または1044および1045の間、あるいはCas12a、Cas12c、Cas12d、Cas12e、Cas12g、Cas12h、またはCas12iの対応するアミノ酸残基の間に挿入される。他の実施形態では、触媒ドメインは、AaCas12bのP157およびG158の間に挿入される。他の実施形態では、触媒ドメインは、AaCas12bのV258およびG259の間に挿入される。他の実施形態では、触媒ドメインは、AaCas12bのD310およびP311の間に挿入される。他の実施形態では、触媒ドメインは、AaCas12bのG1008およびE1009の間に挿入される。他の実施形態では、触媒ドメインは、AaCas12bのG1044およびK104の間に挿入される。

他の実施形態では、融合タンパク質は、核局在化シグナル（例えば二部分核局在化シグナル）を含有する。他の実施形態では、核局在化シグナルのアミノ酸配列は、MAPKKKRKVGIHGVPAAである。上記態様の他の実施形態では、核局在化シグナルは、以下の配列：
ATGGCCCCAAAGAAGAAGCGGAAGGTCGGTATCCACGGAGTCCCAGCAGCC
にコードされる。他の実施形態では、Cas12bポリペプチドは、RuvCドメインの触媒活性をサイレンシングする突然変異を含有する。他の実施形態では、Cas12bポリペプチドは、D574A、D829Aおよび/またはD952A突然変異を含有する。他の実施形態では、融合タンパク質は、タグ（例えばインフルエンザ赤血球凝集素タグ）をさらに含有する。

いくつかの実施形態では、融合タンパク質は、内部に融合した核酸塩基編集ドメイン（例えばデアミナーゼドメイン、例えばアデノシンデアミナーゼドメインのすべてまたは部分）を含むnapDNAbpドメイン（例えばCas12由来ドメイン）を含む。いくつかの実施形態では、napDNAbpはCas12bである。いくつかの実施形態では、塩基エディターは、以下の表13Bに提供する遺伝子座で挿入された内部融合TadA*8ドメインを含むBhCas12bを含む。

表13B：Cas12bタンパク質中の挿入遺伝子座

限定されない例として、アデノシンデアミナーゼ（例えばABE8.13）をBhCas12b内に挿入して、核酸配列を有効に編集する融合タンパク質（例えばABE8.13-BｈCas12b）を産生してもよい。

例としてではあるが限定ではなく、融合タンパク質は、米国仮出願第62/852,228号および第62/852,224号に記載され、その全内容は、参照により本明細書に組み込まれる。

本発明の実施は、別段の表示がない限り、分子生物学（組換え技術を含む）、微生物学、細胞生物学、生化学および免疫学の従来の技術を利用し、これらは当業者の技量の範囲内である。そのような技術は、“Molecular Cloning: A Laboratory Manual”, second edition (Sambrook, 1989); “Oligonucleotide Synthesis” (Gait, 1984); “Animal Cell Culture” (Freshney, 1987); “Methods in Enzymology” “Handbook of Experimental Immunology” (Weir, 1996); “Gene Transfer Vectors for Mammalian Cells” (Miller and Calos, 1987); “Current Protocols in Molecular Biology” (Ausubel, 1987); “PCR: The Polymerase Chain Reaction”, (Mullis, 1994); “Current Protocols in Immunology” (Coligan, 1991)などの文献で詳しく説明されている。これらの技術は、本発明のポリヌクレオチドおよびポリペプチドの製造に適用可能であり、従って、本発明の製造および実施において考慮され得る。特定の実施形態のために特に有用な技術は、以下のセクションで論じられる。

以下の実施例は、一般の当業者に本発明のアッセイ、スクリーニング、および治療方法をいかに作製して使用するかの完全な開示および説明を提供するために記載されており、本発明者らがその発明とみなすものの範囲を限定することを意図するものではない。

［実施例1：編集効率が増加した、進化されたアデノシン塩基エディター］
Tad7.10-dCas9融合タンパク質を含む塩基編集システムは、およそ10～20%の効率で、標的ポリヌクレオチドを編集可能であるが、より高い効率を必要とするユーザーには、その使用は限定され得る。効率および特異性が増加したアデニン塩基エディターを同定する努力の中で、アデノシンデアミナーゼTadA7.10を含む構築物が、誤りがちなPCRによって突然変異誘発され、続いて、核酸プログラム可能DNA結合タンパク質であるdCas9をコードする核酸配列に隣接して、発現ベクター内にクローニングされた（図1A）。突然変異誘発TadA-dCas9塩基エディターは、これらの実施例において、ABE8（アデノシンデアミナーゼバリアント）と称される。アデノシンデアミナーゼバリアントを含む発現ベクターを、クロラムフェニコール耐性（CamR）およびスペクチノマイシン耐性（SpectR）をコードし、2つの点突然変異によって機能性でなくなったカナマイシン耐性遺伝子を有する選択プラスミドとともに、コンピテント細菌細胞内に同時形質転換した（進化ラウンド7戦略）（図1B）。アデノシンデアミナーゼ活性の結果である、カナマイシン耐性の回復に関して細胞を選択した。続く選択ラウンドでは、クロラムフェニコール耐性（CamR）およびスペクチノマイシン耐性（SpectR）をコードし、3つの点突然変異によって機能性でなくなったカナマイシン耐性遺伝子を有するプラスミドとともに、発現ベクターをコンピテント細胞内に同時形質転換した（進化ラウンド8戦略）（図1C）。不活性化カナマイシン耐性遺伝子核酸配列を以下に提供する：

上記配列において、小文字はカナマイシン耐性プロモーター領域を示し、太字配列は標的とされる不活性化部分（Q4^*およびW15^*）を示し、斜字配列はカナマイシン耐性遺伝子の標的とされる不活性部位（D208N）を示し、下線配列はPAM配列を示す。

再び、カナマイシン濃度を増加させた一連のアガロースプレート上に細胞をプレーティングした。効率的な塩基編集活性を有するアデノシンデアミナーゼバリアントは、カナマイシン耐性遺伝子中に存在する突然変異を修正可能であり、これらをさらなる分析のために選択した。細菌細胞において効率的な塩基編集を示すアデノシンデアミナーゼバリアント塩基エディターを表14に記載する。選択したアデノシンデアミナーゼバリアントを含む塩基エディターをコードする哺乳動物発現ベクターを生成した。

表14：新規アデニン塩基エディターABE8

［実施例2：ABE8を用いたアルファ-1アンチトリプシン突然変異の修正］
E342K突然変異を含むA1ATを発現するHEK293細胞（HEK293T-E342K）における塩基編集活性に関して、選択したABE8構築物を試験した。1つのアプローチでは、250ngのgRNAプラスミドおよび750ngのABE8プラスミド[0407]を用いて、3μl:1μg比で、HEK293細胞用に最適化された高効率低毒性DNAトランスフェクション試薬、Mirus TransIT293を用い、HEK293T-E342K細胞を一過性にトランスフェクションした。2.5ug Var-3 ABE mRNAおよび1000ng gRNA 191、長さ20ntを用い、Neonエレクトロポレーションによって、HEK293T-E342Kをトランスフェクションした。spCas9塩基エディター用のsgRNAとして、以下のようなgRNA主鎖を提供した：
5’- GUUUUAGAGC UAGAAAUAGC AAGUUAAAAU AAGGCUAGUC CGUUAUCAAC UUGAAAAAGU GGCACCGAGU CGGUGCUUUU-3’

記載する方法において有用なgRNAには以下が含まれた：
5’-ACCAUCGACAAGAAAGGGACUGA GUUUUAGAGC UAGAAAUAGC AAGUUAAAAU AAGGCUAGUC CGUUAUCAAC UUGAAAAAGU GGCACCGAGU CGGUGCUUUU-3’
5’-CCAUCGACAAGAAAGGGACUGA GUUUUAGAGC UAGAAAUAGC AAGUUAAAAU AAGGCUAGUC CGUUAUCAAC UUGAAAAAGU GGCACCGAGU CGGUGCUUUU-3’
5’-CAUCGACAAGAAAGGGACUGA GUUUUAGAGC UAGAAAUAGC AAGUUAAAAU AAGGCUAGUC CGUUAUCAAC UUGAAAAAGU GGCACCGAGU CGGUGCUUUU-3’
5’-AUCGACAAGAAAGGGACUGA GUUUUAGAGC UAGAAAUAGC AAGUUAAAAU AAGGCUAGUC CGUUAUCAAC UUGAAAAAGU GGCACCGAGU CGGUGCUUUU-3’
5’-UCGACAAGAAAGGGACUGA GUUUUAGAGC UAGAAAUAGC AAGUUAAAAU AAGGCUAGUC CGUUAUCAAC UUGAAAAAGU GGCACCGAGU CGGUGCUUUU-3’
5’-CGACAAGAAAGGGACUGA GUUUUAGAGC UAGAAAUAGC AAGUUAAAAU AAGGCUAGUC CGUUAUCAAC UUGAAAAAGU GGCACCGAGU CGGUGCUUUU-3’

プラスミドトランスフェクションでは4日後、RNAエレクトロポレーションでは2日後、ゲノムDNAを、0.05%SDS、25μg/mlプロテイナーゼK、10mM Tris pH 8.0の単純な溶解緩衝液で抽出した後、85℃で熱不活化した。ゲノム部位をPCR増幅し、MiSeq上で配列決定した。各位の塩基頻度に関して、かつインデルパーセントに関して、以前に記載されるように結果を分析した。インデル計算の詳細は、国際PCT出願第PCT/2017/045381号および第PCT/US2016/058344号に記載され、これらは各々、その全体が参照により本明細書に組み込まれる。Komor, A.C., et al., “Programmable editing of a target base in genomic DNA without double-stranded DNA cleavage” Nature 533, 420-424 (2016); Gaudelli, N.M., et al., “Programmable base editing of A・T to G・C in genomic DNA without DNA cleavage” Nature 551, 464-471 (2017); およびKomor, A.C., et al., “Improved base excision repair inhibition and bacteriophage Mu Gam protein yields C:G-to-T:A base editors with higher efficiency and product purity” Science Advances 3:eaao4774 (2017)もまた参照のこと（これらの全内容は参照により本明細書に組み込まれる）。

異なる製造者（AxoLabs, GermanyおよびSynthego, Menlo Park, CA）によって産生された19または20ヌクレオチドのガイドRNAを用いて、選択したABE8（表15を参照のこと）の編集活性をHEK293T-E342Kにおいてアッセイした。図3、4A、および4Bに示すように、ABE8は、対象エディター（AVT686）に比較して、顕著な効率および特異性を示した。

表15：アデノシン塩基エディター

さらに、ABE8は、バイスタンダーAに対して、オンターゲットアデニン（A）塩基の正確な編集を提供し（図5）、A1AD標的部位での非常に効率的で療法的に適切な編集を可能にする。特に、ABE8は、図5で見られるように、A1AD部位で、編集（すなわちA・TからG・Cへの変換）の5倍の増加を生じる。ABE8を用いたE342Kの塩基編集を通じた正確な突然変異修正は、例えば、11μMを超えて循環AATレベルを回復させ、A1ADに罹患した対象において、肺および肝臓機能の両方を改善した。

図6A～6Dは、連続したエディター操作を通じて、初代PiZ線維芽細胞において、改善された率の核酸塩基修正を生じることに関するデータおよび結果を示す。図7A～7Dは、NSG-PiZトランスジェニックマウスにおいて、脂質ナノ粒子（LNP）仲介性送達および塩基編集によって生じる血清A1ATにおける増加に関連するデータおよび結果を提示する。

［他の実施形態］
上記の説明から、多様な用途および条件に取り入れるために、本明細書に記述する本発明に変形および修正を加えることができることが明らかであろう。そのような実施形態もまた、以下の特許請求の範囲の範囲内である。

本明細書における可変要素の任意の定義における要素のリストの記載は、リストされた要素のいずれかの単一要素または組み合わせ（またはサブコンビネーション）としてのその可変要素の定義を含む。本明細書における実施形態の説明は、いずれかの単一の実施形態としての、または任意の他の実施形態もしくはその一部との組み合わせにおける、その実施形態を含む。

本明細書に言及されているすべての刊行物、特許、および特許出願は、それぞれの個々の刊行物、特許、または特許出願が具体的かつ個別に参照により組み込まれることが示されているのと同じ程度に、参照により本明細書に組み込まれる。別段の表示がない限り、本明細書に言及されている刊行物、特許および特許出願は、その全体が参照により本明細書に組み込まれる。

Claims

アルファ-1アンチトリプシン不全と関連する一塩基多型（SNP）を含むアルファ-1アンチトリプシンポリヌクレオチドを編集する方法であって、該ポリヌクレオチドを、1つ以上のガイドRNA、ならびにポリヌクレオチドプログラム可能DNA結合ドメインおよび
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPRQVFNAQKKAQSSTD
のアミノ酸82位または166位に改変を含むアデノシンデアミナーゼバリアントを含む少なくとも1つの塩基エディタードメインを含む塩基エディターと接触させる工程を含み、前記ガイドRNAが、前記塩基エディターをターゲティングしてアルファ-1アンチトリプシン不全と関連するSNPの改変をもたらす、前記方法。
アデノシンデアミナーゼバリアントがアミノ酸82位および166位に改変を含む、請求項1の方法。
アデノシンデアミナーゼバリアントがV82S改変を含む、請求項1の方法。
アデノシンデアミナーゼバリアントがT166R改変を含む、請求項1の方法。
アデノシンデアミナーゼバリアントがV82SおよびT166R改変を含む、請求項1の方法。
アデノシンデアミナーゼバリアントが、以下の改変：Y147T、Y147R、Q154S、Y123H、およびQ154Rの1つ以上をさらに含む、請求項1～5のいずれか一項の方法。
アデノシンデアミナーゼバリアントが、以下の改変：Y147T + Q154R; Y147T + Q154S; Y147R + Q154S; V82S + Q154S; V82S + Y147R; V82S + Q154R; V82S + Y123H; I76Y + V82S; V82S + Y123H + Y147T; V82S + Y123H + Y147R; V82S + Y123H + Q154R; Y147R + Q154R +Y123H; Y147R + Q154R + I76Y; Y147R + Q154R + T166R; Y123H + Y147R + Q154R + I76Y; V82S + Y123H + Y147R + Q154R;およびI76Y + V82S + Y123H + Y147R + Q154Rを含む、請求項1～6のいずれか一項の方法。
アデノシンデアミナーゼバリアントが、149、150、151、152、153、154、155、156、および157からなる群より選択される残基で始まる、C末端の欠失を含む、請求項1～6のいずれか一項の方法。
塩基エディタードメインがアデノシンデアミナーゼバリアントモノマーを含み、アデノシンデアミナーゼモノマーがV82SおよびT166R改変を含む、請求項1～6のいずれか一項の方法。
塩基エディタードメインが、野生型アデノシンデアミナーゼドメインおよびアデノシンデアミナーゼバリアントを含むアデノシンデアミナーゼヘテロダイマーを含む、請求項1の方法。
アデノシンデアミナーゼバリアントが、Y147T、Y147R、Q154S、Y123H、V82S、T166R、およびQ154Rからなる群より選択される改変をさらに含む、請求項10の方法。
塩基エディタードメインが、TadA7.10ドメインおよびアデノシンデアミナーゼバリアントドメインを含むアデノシンデアミナーゼヘテロダイマーを含む、請求項1の方法。
アデノシンデアミナーゼバリアントが、Y147T、Y147R、Q154S、Y123H、V82S、T166R、およびQ154Rからなる群より選択される改変をさらに含む、請求項12の方法。
塩基エディターが、TadA7.10ドメイン、ならびに：Y147T + Q154R; Y147T + Q154S; Y147R + Q154S; V82S + Q154S; V82S + Y147R; V82S + Q154R; V82S + Y123H; I76Y + V82S; V82S + Y123H + Y147T; V82S + Y123H + Y147R; V82S + Y123H + Q154R; Y147R + Q154R +Y123H; Y147R + Q154R + I76Y; Y147R + Q154R + T166R; Y123H + Y147R + Q154R + I76Y; V82S + Y123H + Y147R + Q154R;およびI76Y + V82S + Y123H + Y147R + Q154Rからなる群より選択される改変を含むアデノシンデアミナーゼバリアントを含む、請求項1の方法。
アデノシンデアミナーゼバリアントが、アデノシンデアミナーゼ活性を有する以下の配列またはその断片：
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCTFFRMPRQVFNAQKKAQSSTD
を含むかまたはこうした配列から本質的になるABE8である、請求項1の方法。
アデノシンデアミナーゼバリアントが、全長ABE8に比較して、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、6、17、18、19、または20のN末端アミノ酸残基を欠く一部切除ABE8である、請求項1～15のいずれか一項の方法。
アデノシンデアミナーゼバリアントが、全長ABE8に比較して、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、6、17、18、19、または20のC末端アミノ酸残基を欠く一部切除ABE8である、請求項1～15のいずれか一項の方法。
アルファ-1アンチトリプシン不全と関連する一塩基多型（SNP）を含むアルファ-1アンチトリプシンポリヌクレオチドを編集する方法であって、アルファ-1アンチトリプシンポリヌクレオチドを、1つ以上のガイドRNA、ならびに以下の配列：

（太字配列はCas9由来の配列を示し、斜字配列はリンカー配列を示し、下線配列は、二部分核局在化配列を示す）を含むポリヌクレオチドDNA結合ドメイン、および
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPRQVFNAQKKAQSSTD
のアミノ酸82位および/または166位で改変を含むアデノシンデアミナーゼバリアントを含む少なくとも1つの塩基エディターを含む融合タンパク質と接触させる工程を含む、前記方法。
アデノシンデアミナーゼバリアントがアミノ酸82位および166位で改変を含む、請求項18の方法。
アデノシンデアミナーゼバリアントがV82S改変を含む、請求項18の方法。
アデノシンデアミナーゼバリアントがT166R改変を含む、請求項18の方法。
アデノシンデアミナーゼバリアントがV82SおよびT166R改変を含む、請求項18の方法。
アデノシンデアミナーゼバリアントが、以下の改変：Y147T、Y147R、Q154S、Y123H、およびQ154Rの1つ以上をさらに含む、請求項18～22のいずれか一項の方法。
アデノシンデアミナーゼバリアントが、以下の改変：Y147T + Q154R; Y147T + Q154S; Y147R + Q154S; V82S + Q154S; V82S + Y147R; V82S + Q154R; V82S + Y123H; I76Y + V82S; V82S + Y123H + Y147T; V82S + Y123H + Y147R; V82S + Y123H + Q154R; Y147R + Q154R +Y123H; Y147R + Q154R + I76Y; Y147R + Q154R + T166R; Y123H + Y147R + Q154R + I76Y; V82S + Y123H + Y147R + Q154R; およびI76Y + V82S + Y123H + Y147R + Q154Rを含む、請求項18の方法。
細胞がin vivoまたはex vivoである、請求項1～24のいずれか一項の方法。
アルファ-1アンチトリプシン不全と関連するSNPでのA・TからG・Cへの改変が、アミノ酸342位のグルタミン酸をリジンに変化させる、請求項1～24のいずれか一項の方法。
アルファ-1アンチトリプシン不全と関連するSNPが、アミノ酸342位でリジンを有するアルファ-1アンチトリプシンポリペプチドの発現を生じる、請求項1～24のいずれか一項の方法。
アルファ-1アンチトリプシン不全と関連するSNPが、グルタミン酸をリジンで置換する、請求項1～24のいずれか一項の方法。
アデノシンデアミナーゼバリアントがY147R + Q154R +Y123Hを含む、請求項24の方法。
アデノシンデアミナーゼバリアントがY147R + Q154R + I76Yを含む、請求項24の方法。
アデノシンデアミナーゼバリアントがY147R + Q154R + T166Rを含む、請求項24の方法。
アデノシンデアミナーゼバリアントがY147T + Q154Rを含む、請求項24の方法。
アデノシンデアミナーゼバリアントがY147T + Q154Sを含む、請求項24の方法。
アデノシンデアミナーゼバリアントがY147R + Q154Sを含む、請求項24の方法。
アデノシンデアミナーゼバリアントがV82S + Q154Sを含む、請求項24の方法。
アデノシンデアミナーゼバリアントがV82S + Y147Rを含む、請求項24の方法。
アデノシンデアミナーゼバリアントがV82S + Q154Rを含む、請求項24の方法。
アデノシンデアミナーゼバリアントがV82S + Y123Hを含む、請求項24の方法。
アデノシンデアミナーゼバリアントがI76Y + V82Sを含む、請求項24の方法。
アデノシンデアミナーゼバリアントがV82S + Y123H + Y147Tを含む、請求項24の方法。
アデノシンデアミナーゼバリアントがV82S + Y123H + Y147Rを含む、請求項24の方法。
アデノシンデアミナーゼバリアントがV82S + Y123H + Q154Rを含む、請求項24の方法。
アデノシンデアミナーゼバリアントがY123H + Y147R + Q154R + I76Yを含む、請求項24の方法。
アデノシンデアミナーゼバリアントがV82S + Y123H + Y147R + Q154Rを含む、請求項24の方法。
アデノシンデアミナーゼバリアントがI76Y + V82S + Y123H + Y147R + Q154Rを含む、請求項24の方法。
ポリヌクレオチドプログラム可能DNA結合ドメインが、改変Staphylococcus aureus Cas9 (SaCas9)、Streptococcus thermophilus 1 Cas9 (St1Cas9)、改変Streptococcus pyogenes Cas9 (SpCas9)、またはそのバリアントである、請求項1～45のいずれか一項の方法。
ポリヌクレオチドプログラム可能DNA結合ドメインが、改変プロトスペーサー隣接モチーフ（PAM）特異性または非G PAMに対する特異性を有する、SpCas9のバリアントを含む、請求項46の方法。
改変PAMが核酸配列5’-NGC-3’に対する特異性を有する、請求項47の方法。
改変SpCas9が、アミノ酸置換D1135M、S1136Q、G1218K、E1219F、A1322R、D1332A、R1335E、およびT1337R、またはその対応するアミノ酸置換を含む、請求項47または請求項48の方法。
ポリヌクレオチドプログラム可能DNA結合ドメインがヌクレアーゼ不活性またはニッカーゼバリアントである、請求項1～49のいずれか一項の方法。
ニッカーゼバリアントが、アミノ酸置換D10Aまたはその対応するアミノ酸置換を含む、請求項50の方法。
塩基エディターがジンクフィンガードメインをさらに含む、請求項1～51のいずれか一項の方法。
アデノシンデアミナーゼドメインが、デオキシリボ核酸（DNA）中のアデニンを脱アミノ化可能である、請求項1～52のいずれか一項の方法。
アデノシンデアミナーゼが、天然には存在しない改変アデノシンデアミナーゼである、請求項1～53のいずれか一項の方法。
アデノシンデアミナーゼがTadAデアミナーゼである、請求項1～54のいずれか一項の方法。
TadAデアミナーゼがTadA*7.10である、請求項55の方法。
1つ以上のガイドRNAがCRISPR RNA（crRNA）およびトランスエンコードされる小分子RNA（tracrRNA）を含み、crRNAが、アルファ-1アンチトリプシン不全と関連するSNPを含むアルファ-1アンチトリプシン核酸配列に相補的な核酸配列を含む、請求項1～56のいずれか一項の方法。
塩基エディターが、アルファ-1アンチトリプシン不全と関連するSNPを含むアルファ-1アンチトリプシン核酸配列に相補的な核酸配列を含むシングルガイドRNA（sgRNA）と複合体形成している、請求項1～57のいずれか一項の方法。
請求項1～58のいずれか一項の塩基エディター、および：
5′-ACCAUCGACAAGAAAGGGACUGA GUUUUAGAGC UAGAAAUAGC AAGUUAAAAU AAGGCUAGUC CGUUAUCAAC UUGAAAAAGU GGCACCGAGU CGGUGCUUUU-3′
5′-CCAUCGACAAGAAAGGGACUGA GUUUUAGAGC UAGAAAUAGC AAGUUAAAAU AAGGCUAGUC CGUUAUCAAC UUGAAAAAGU GGCACCGAGU CGGUGCUUUU-3′
5′-CAUCGACAAGAAAGGGACUGA GUUUUAGAGC UAGAAAUAGC AAGUUAAAAU AAGGCUAGUC CGUUAUCAAC UUGAAAAAGU GGCACCGAGU CGGUGCUUUU-3′
5′-AUCGACAAGAAAGGGACUGA GUUUUAGAGC UAGAAAUAGC AAGUUAAAAU AAGGCUAGUC CGUUAUCAAC UUGAAAAAGU GGCACCGAGU CGGUGCUUUU-3′
5′-UCGACAAGAAAGGGACUGA GUUUUAGAGC UAGAAAUAGC AAGUUAAAAU AAGGCUAGUC CGUUAUCAAC UUGAAAAAGU GGCACCGAGU CGGUGCUUUU-3′
5′-CGACAAGAAAGGGACUGA GUUUUAGAGC UAGAAAUAGC AAGUUAAAAU AAGGCUAGUC CGUUAUCAAC UUGAAAAAGU GGCACCGAGU CGGUGCUUUU-3′
からなる群より選択される核酸配列を含むガイドRNAを含む、塩基編集システム。
gRNAが、核酸配列
5′- GUUUUAGAGC UAGAAAUAGC AAGUUAAAAU AAGGCUAGUC CGUUAUCAAC UUGAAAAAGU GGCACCGAGU CGGUGCUUUU-3′
をさらに含む、請求項59の塩基編集システム。
細胞内に：
前記細胞に対する、塩基エディターまたは前記塩基エディターをコードするポリヌクレオチドであって、前記塩基エディターがポリヌクレオチドプログラム可能DNA結合ドメインおよび請求項1～60のいずれか一項に記載されるアデノシンデアミナーゼドメインを含む、前記塩基エディターまたはポリヌクレオチド；および
塩基エディターをターゲティングしてアルファ-1アンチトリプシン不全と関連するSNPのA・TからG・Cへの改変をもたらす、1つ以上のガイドポリヌクレオチド
を導入することによって産生された細胞、またはその前駆細胞。
産生された細胞が肝細胞またはその前駆細胞である、請求項61の細胞。
細胞がアルファ-1アンチトリプシン不全を有する対象に由来するものである、請求項61または請求項62の細胞。
細胞が哺乳動物細胞またはヒト細胞である、請求項61～63のいずれか一項の細胞。
アルファ-1アンチトリプシン不全と関連するSNPでのA・TからG・Cへの改変が、アルファ-1アンチトリプシンポリペプチドにおいてグルタミン酸をリジンに変化させる、請求項61～64のいずれか一項の細胞。
アルファ-1アンチトリプシン不全と関連するSNPが、アミノ酸42位でリジンを有するアルファ-1アンチトリプシンポリペプチドの発現を生じる、請求項61～65のいずれか一項の細胞。
アルファ-1アンチトリプシン不全と関連するSNPがグルタミン酸をリジンで置換する、請求項61～65のいずれか一項の細胞。
アルファ-1アンチトリプシン不全と関連するSNPのA・TからG・Cへの改変に関して細胞を選択する、請求項61～67のいずれか一項の細胞。
ポリヌクレオチドプログラム可能DNA結合ドメインが、改変Staphylococcus aureus Cas9 (SaCas9)、Streptococcus thermophilus 1 Cas9 (St1Cas9)、改変Streptococcus pyogenes Cas9 (SpCas9)、またはそのバリアントである、請求項61～68のいずれか一項の細胞。
ポリヌクレオチドプログラム可能DNA結合ドメインが、改変プロトスペーサー隣接モチーフ（PAM）特異性または非G PAMに対する特異性を有する、SpCas9のバリアントを含む、請求項69の細胞。
改変PAMが核酸配列5’-NGC-3’に対する特異性を有する、請求項70の細胞。
改変SpCas9が、アミノ酸置換D1135M、S1136Q、G1218K、E1219F、A1322R、D1332A、R1335E、およびT1337R、またはその対応するアミノ酸置換を含む、請求項70または請求項71の細胞。
ポリヌクレオチドプログラム可能DNA結合ドメインがヌクレアーゼ不活性またはニッカーゼバリアントである、請求項61～72のいずれか一項の細胞。
ニッカーゼバリアントが、アミノ酸置換D10Aまたはその対応するアミノ酸置換を含む、請求項73の細胞。
塩基エディターがジンクフィンガードメインをさらに含む、請求項71～74のいずれか一項の細胞。
アデノシンデアミナーゼドメインが、デオキシリボ核酸（DNA）中のアデニンを脱アミノ化可能である、請求項71～75のいずれか一項の細胞。
1つ以上のガイドポリヌクレオチドがCRISPR RNA（crRNA）およびトランスエンコードされる小分子RNA（tracrRNA）を含み、crRNAが、アルファ-1アンチトリプシン不全と関連するSNPを含むアルファ-1アンチトリプシン核酸配列に相補的な核酸配列を含む、請求項71～76のいずれか一項の細胞。
塩基エディターおよび前記の1つ以上のガイドポリヌクレオチドが、細胞中で複合体を形成する、請求項71～77のいずれか一項の細胞。
塩基エディターが、アルファ-1アンチトリプシン不全と関連するSNPを含むアルファ-1アンチトリプシン核酸配列に相補的な核酸配列を含むシングルガイドRNA(sgRNA)と複合体形成している、請求項78の細胞。
対象において、アルファ-1アンチトリプシン不全を治療する方法であって、前記対象に請求項71～79のいずれか一項の細胞を投与する工程を含む、前記方法。
前記細胞が前記対象に対して自己である、請求項80の方法。
前記細胞が前記対象に対して同種である、請求項80の方法。
請求項71～82のいずれか一項の細胞から増殖したかまたは拡張された、単離細胞または細胞集団。
肝細胞またはその前駆細胞を産生する方法であって：
（a）アルファ-1アンチトリプシン不全と関連するSNPを含む肝細胞前駆細胞内に、
塩基エディター、または前記塩基エディターをコードするポリヌクレオチドであって、前記塩基エディターがポリヌクレオチドプログラム可能ヌクレオチド結合ドメインおよび請求項1～60のいずれか一項記載のアデノシンデアミナーゼバリアントドメインを含む、前記塩基エディターまたはポリヌクレオチド；ならびに
1つ以上のガイドポリヌクレオチドであって、前記塩基エディターをターゲティングしてアルファ-1アンチトリプシン不全と関連するSNPのA・TからG・Cへの改変をもたらす、前記ガイドポリヌクレオチド
を導入する工程と；
（b）肝細胞前駆細胞を肝細胞に分化させる工程
とを含む、前記方法。
肝細胞を産生する方法であって：
（a）アルファ-1アンチトリプシン不全と関連するSNPを含む肝細胞内に、
塩基エディター、または前記塩基エディターをコードするポリヌクレオチドであって、前記塩基エディターがポリヌクレオチドプログラム可能ヌクレオチド結合ドメインおよび請求項1～60のいずれか一項記載のアデノシンデアミナーゼバリアントドメインを含む、前記塩基エディターまたはポリヌクレオチド；ならびに
1つ以上のガイドポリヌクレオチドであって、前記塩基エディターをターゲティングしてアルファ-1アンチトリプシン不全と関連するSNPのA・TからG・Cへの改変を達成する、前記ガイドポリヌクレオチド
を導入する工程を含む、前記方法。
肝細胞または肝細胞前駆細胞が哺乳動物細胞またはヒト細胞である、請求項85の方法。
アルファ-1アンチトリプシン不全と関連するSNPでのA・TからG・Cへの改変が、アルファ-1アンチトリプシンポリペプチドにおいてグルタミン酸をリジンに変化させる、請求項85または請求項86の方法。
アルファ-1アンチトリプシン不全と関連するSNPが、アミノ酸342位でリジンを有するアルファ-1アンチトリプシン不全ポリペプチドの発現を生じる、請求項85～87のいずれか一項の方法。
アルファ-1アンチトリプシン不全と関連するSNPがグルタミン酸をリジンで置換する、請求項85～88のいずれか一項の方法。
アルファ-1アンチトリプシン不全と関連するSNPのA・TからG・Cへの改変に関して細胞を選択する、請求項85～89のいずれか一項の方法。
ポリヌクレオチドプログラム可能DNA結合ドメインが、改変Staphylococcus aureus Cas9 (SaCas9)、Streptococcus thermophilus 1 Cas9 (St1Cas9)、改変Streptococcus pyogenes Cas9 (SpCas9)、またはそのバリアントを含む、請求項85～90のいずれか一項の方法。
ポリヌクレオチドプログラム可能DNA結合ドメインが、改変プロトスペーサー隣接モチーフ（PAM）特異性を有する、改変SpCas9を含む、請求項85～91のいずれか一項の方法。
改変PAMが核酸配列5’-NGC-3’に対する特異性を有する、請求項92の方法。
改変SpCas9が、アミノ酸置換D1135M、S1136Q、G1218K、E1219F、A1322R、D1332A、R1335E、およびT1337R、またはその対応するアミノ酸置換を含む、請求項92または請求項93の方法。
ポリヌクレオチドプログラム可能DNA結合ドメインがヌクレアーゼ不活性またはニッカーゼバリアントである、請求項85～94のいずれか一項の方法。
ニッカーゼ変異体が、アミノ酸置換D10Aまたはその対応するアミノ酸置換を含む、請求項95の方法。
塩基エディターがジンクフィンガードメインをさらに含む、請求項85～96のいずれか一項の方法。
1つ以上のガイドRNAがCRISPR RNA（crRNA）およびトランスエンコードされる小分子RNA（tracrRNA）を含み、crRNAが、アルファ-1アンチトリプシン不全と関連するSNPを含むアルファ-1アンチトリプシン核酸配列に相補的な核酸配列を含む、請求項85～97のいずれか一項の方法。
塩基エディターおよび前記の1つ以上のガイドポリヌクレオチドが、細胞中で複合体を形成する、請求項85～98のいずれか一項の方法。
塩基エディターが、アルファ-1アンチトリプシン不全と関連するSNPを含むアルファ-1アンチトリプシン核酸配列に相補的な核酸配列を含むシングルガイドRNA（sgRNA）と複合体形成している、請求項99の方法。
Cas9がStCas9またはSaCas9である、請求項1～58のいずれか一項の方法。
Cas9が改変SaCas9である、請求項1～58のいずれか一項の方法。
改変SaCas9が、置換E782K、N968K、およびR1015H、またはその対応するアミノ酸置換を含む、請求項102の方法。
改変SaCas9がアミノ酸配列：
KRNYILGLAIGITSVGYGIIDYETRDVIDAGVRLFKEANVENNEGRRSKRGARRLKRRRRHRIQRVKKLLFDYNLLTDHSELSGINPYEARVKGLSQKLSEEEFSAALLHLAKRRGVHNVNEVEEDTGNELSTKEQISRNSKALEEKYVAELQLERLKKDGEVRGSINRFKTSDYVKEAKQLLKVQKAYHQLDQSFIDTYIDLLETRRTYYEGPGEGSPFGWKDIKEWYEMLMGHCTYFPEELRSVKYAYNADLYNALNDLNNLVITRDENEKLEYYEKFQIIENVFKQKKKPTLKQIAKEILVNEEDIKGYRVTSTGKPEFTNLKVYHDIKDITARKEIIENAELLDQIAKILTIYQSSEDIQEELTNLNSELTQEEIEQISNLKGYTGTHNLSLKAINLILDELWHTNDNQIAIFNRLKLVPKKVDLSQQKEIPTTLVDDFILSPVVKRSFIQSIKVINAIIKKYGLPNDIIIELAREKNSKDAQKMINEMQKRNRQTNERIEEIIRTTGKENAKYLIEKIKLHDMQEGKCLYSLEAIPLEDLLNNPFNYEVDHIIPRSVSFDNSFNNKVLVKQEENSKKGNRTPFQYLSSSDSKISYETFKKHILNLAKGKGRISKTKKEYLLEERDINRFSVQKDFINRNLVDTRYATRGLMNLLRSYFRVNNLDVKVKSINGGFTSFLRRKWKFKKERNKGYKHHAEDALIIANADFIFKEWKKLDKAKKVMENQMFEEKQAESMPEIETEQEYKEIFITPHQIKHIKDFKDYKYSHRVDKKPNRKLINDTLYSTRKDDKGNTLIVNNLNGLYDKDNDKLKKLINKSPEKLLMYHHDPQTYQKLKLIMEQYGDEKNPLYKYYEETGNYLTKYSKKDNGPVIKKIKYYGNKLNAHLDITDDYPNSRNKVVKLSLKPYRFDVYLDNGVYKFVTVKNLDVIKKENYYEVNSKCYEEAKKLKKISNQAEFIASFYKNDLIKINGELYRVIGVNNDLLNRIEVNMIDITYREYLENMNDKRPPHIIKTIASKTQSIKKYSTDILGNLYEVKSKKHPQIIKKG
を含む、請求項102の方法。
対象においてアルファ-1アンチトリプシン不全（A1AD）を治療するための方法であって、対象に、Cas9またはCas12ポリペプチド内に挿入されたアデノシンデアミナーゼバリアントを含む融合タンパク質、あるいはその融合タンパク質をコードするポリヌクレオチド；およびこの融合タンパク質をターゲティングしてA1ADと関連する一塩基多型（SNP）のA・TからG・Cへの改変をもたらす、1つ以上のガイドポリヌクレオチドを投与し、それによって対象においてA1ADを治療する工程を含む、前記方法。
対象においてアルファ-1アンチトリプシン不全（A1AD）を治療する方法であって、アデノシン塩基エディター8（ABE8）または前記塩基エディターをコードするポリヌクレオチドであって、ABE8がCas9またはCas12ポリペプチド内に挿入されたアデノシンデアミナーゼバリアントを含む、前記塩基エディター8またはポリヌクレオチド；およびABE8をターゲティングしてA1ADと関連するSNPのA・TからG・Cへの改変をもたらす、1つ以上のガイドポリヌクレオチドを投与し、それによって対象においてA1ADを治療する工程を含む、前記方法。
ABE8が、ABE8.1-m、ABE8.2-m、ABE8.3-m、ABE8.4-m、ABE8.5-m、ABE8.6-m、ABE8.7-m、ABE8.8-m、ABE8.9-m、ABE8.10-m、ABE8.11-m、ABE8.12-m、ABE8.13-m、ABE8.14-m、ABE8.15-m、ABE8.16-m、ABE8.17-m、ABE8.18-m、ABE8.19-m、ABE8.20-m、ABE8.21-m、ABE8.22-m、ABE8.23-m、ABE8.24-m、ABE8.1-d、ABE8.2-d、ABE8.3-d、ABE8.4-d、ABE8.5-d、ABE8.6-d、ABE8.7-d、ABE8.8-d、ABE8.9-d、ABE8.10-d、ABE8.11-d、ABE8.12-d、ABE8.13-d、ABE8.14-d、ABE8.15-d、ABE8.16-d、ABE8.17-d、ABE8.18-d、ABE8.19-d、ABE8.20-d、ABE8.21-d、ABE8.22-d、ABE8.23-d、またはABE8.24-dより選択される、請求項105または請求項106の方法。
アデノシンデアミナーゼバリアントが：
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPRQVFNAQKKAQSSTD
のアミノ酸配列を含み；このアミノ酸配列が少なくとも1つの改変を含む、請求項105～107のいずれか一項の方法。
アデノシンデアミナーゼバリアントが、アミノ酸82位および/または166位で改変を含む、請求項108の方法。
少なくとも1つの改変が：V82S、T166R、Y147T、Y147R、Q154S、Y123H、および/またはQ154Rを含む、請求項108または請求項109の方法。
アデノシンデアミナーゼバリアントが改変の以下の組み合わせ：Y147T + Q154R; Y147T + Q154S; Y147R + Q154S; V82S + Q154S; V82S + Y147R; V82S + Q154R; V82S + Y123H; I76Y + V82S; V82S + Y123H + Y147T; V82S + Y123H + Y147R; V82S + Y123H + Q154R; Y147R + Q154R +Y123H; Y147R + Q154R + I76Y; Y147R + Q154R + T166R; Y123H + Y147R + Q154R + I76Y; V82S + Y123H + Y147R + Q154R;およびI76Y + V82S + Y123H + Y147R + Q154Rの1つを含む、請求項105～110のいずれか一項の方法。
アデノシンデアミナーゼバリアントが、TadA*8.1、TadA*8.2、TadA*8.3、TadA*8.4、TadA*8.5、TadA*8.6、TadA*8.7、TadA*8.8、TadA*8.9、TadA*8.10、TadA*8.11、TadA*8.12、TadA*8.13、TadA*8.14、TadA*8.15、TadA*8.16、TadA*8.17、TadA*8.18、TadA*8.19、TadA*8.20、TadA*8.21、TadA*8.22、TadA*8.23、またはTadA*8.24である、請求項105～111のいずれか一項の方法。
アデノシンデアミナーゼバリアントが、149、150、151、152、153、154、155、156、および157からなる群より選択される残基で始まるC末端の欠失を含む、請求項105～112のいずれか一項の方法。
アデノシンデアミナーゼバリアントが、TadA*8アデノシンデアミナーゼバリアントドメインを含むアデノシンデアミナーゼモノマーである、請求項105～113のいずれか一項の方法。
アデノシンデアミナーゼバリアントが、野生型アデノシンデアミナーゼドメインおよびTadA*8アデノシンデアミナーゼバリアントドメインを含むアデノシンデアミナーゼヘテロダイマーである、請求項105～113のいずれか一項の方法。
アデノシンデアミナーゼバリアントが、TadAドメインおよびTadA*8アデノシンデアミナーゼバリアントドメインを含むアデノシンデアミナーゼヘテロダイマーである、請求項105～113のいずれか一項の方法。
A1ADと関連するSNPでのA・TからG・Cへの改変が、アミノ酸342位でのグルタミン酸をリジンに変化させる、請求項105～116のいずれか一項の方法。
A1ADと関連するSNPが、アミノ酸342位でリジンを有するアルファ-1アンチトリプシンポリペプチドの発現を生じる、請求項105～116のいずれか一項の方法。
アルファ-1アンチトリプシン不全と関連するSNPが、グルタミン酸をリジンで置換する、請求項105～116のいずれか一項の方法。
アデノシンデアミナーゼバリアントが、Cas9またはCas12ポリペプチドの柔軟なループ、アルファらせん領域、非構造化部分、または溶媒アクセス可能部分内に挿入される、請求項105～119のいずれか一項の方法。
アデノシンデアミナーゼバリアントが、Cas9またはCas12ポリペプチドのN末端断片およびC末端断片に隣接する、請求項105～119のいずれか一項の方法。
融合タンパク質またはABE8が、構造NH₂-[Cas9またはCas12ポリペプチドのN末端断片]-[アデノシンデアミナーゼバリアント]-[Cas9またはCas12ポリペプチドのC末端断片]-COOHであり、ここで「]-[」の各例は任意のリンカーである、請求項121の方法。
N末端断片のC末端またはC末端断片のN末端が、Cas9またはCas12ポリペプチドの柔軟なループの一部を含む、請求項121または請求項122の方法。
柔軟なループが、アデノシンデアミナーゼバリアントが標的核酸塩基を脱アミノ化する際、標的核酸塩基の近傍にあるアミノ酸を含む、請求項120のいずれか一項の方法。
A1ADと関連するSNP標的核酸塩基の脱アミノ化を達成するための、ガイド核酸配列を対象に投与する工程をさらに含む、請求項105～124のいずれか一項の方法。
SNP標的核酸塩基の脱アミノ化が、標的核酸塩基を野生型核酸塩基で、または非野生型核酸塩基で置換し、標的核酸塩基の脱アミノ化がA1ADの症状を軽減する、請求項125の方法。
A1ADと関連するSNPの脱アミノ化が、グルタミン酸をリジンで置換する、請求項126の方法。
標的核酸塩基が、標的ポリヌクレオチド配列において、PAM配列から1～20核酸塩基離れている、請求項105～127のいずれか一項の方法。
標的核酸塩基が、PAM配列の2～12核酸塩基上流である、請求項128の方法。
Cas9またはCas12ポリペプチドのN末端断片またはC末端断片が、標的ポリヌクレオチド配列に結合する、請求項121～129のいずれか一項の方法。
N末端断片またはC末端断片が、RuvCドメインを含むか；
N末端断片またはC末端断片が、HNHドメインを含むか；
N末端断片またはC末端断片のいずれも、HNHドメインを含まないか；あるいは
N末端断片またはC末端断片のいずれも、RuvCドメインを含まない、
請求項130の方法。
Cas9またはCas12ポリペプチドが、1つ以上の構造ドメイン中に部分的または完全欠失を含み、デアミナーゼがCas9またはCas12ポリペプチドの部分的または完全欠失の位置に挿入されている、請求項115～131のいずれか一項の方法。
欠失がRuvCドメイン内であるか；または
欠失がHNHドメイン内である
請求項132の方法。
融合タンパク質またはABE8がCas9ポリペプチドを含む、請求項105～133のいずれか一項の方法。
Cas9ポリペプチドが、Streptococcus pyogenes Cas9(SpCas9)、Staphylococcus aureus Cas9（SaCas9）、Streptococcus thermophilus1 Cas9（St1Cas9）、またはそのバリアントである、請求項134の方法。
Cas9ポリペプチドが、以下のアミノ酸配列（Cas9参照配列）：

（一重下線：HNHドメイン；二重下線：RuvCドメイン；（Cas9参照配列））、またはその対応する領域を含む、請求項134または請求項135の方法。
Cas9ポリペプチドが、Cas9ポリペプチド参照配列における番号付けでアミノ酸1017～1069またはその対応するアミノ酸の欠失を含むか；
Cas9ポリペプチドが、Cas9ポリペプチド参照配列における番号付けでアミノ酸792～872またはその対応するアミノ酸の欠失を含むか；あるいは
Cas9ポリペプチドが、Cas9ポリペプチド参照配列における番号付けでアミノ酸792～906またはその対応するアミノ酸の欠失を含む
請求項136の方法。
アデノシンデアミナーゼバリアントが、Cas9ポリペプチドの柔軟なループ内に挿入されている、請求項134～137のいずれか一項の方法。
柔軟なループが、Cas9参照配列における番号付けで530～537、569～579、686～691、768～793、943～947、1002～1040、1052～1077、1232～1248、および1298～1300位のアミノ酸残基、あるいはその対応するアミノ酸位からなる群より選択される領域を含む、請求項138の方法。
デアミナーゼバリアントが、Cas9参照配列における番号付けで、アミノ酸位768～769、791～792、792～793、1015～1016、1022～1023、1026～1027、1029～1030、1040～1041、1052～1053、1054～1055、1067～1068、1068～1069、1247～1248、または1248～1249、あるいはその対応するアミノ酸位の間に挿入されている、請求項136の方法。
デアミナーゼバリアントが、Cas9参照配列における番号付けで、アミノ酸位768～769、792～793、1022～1023、1026～1027、1040～1041、1068～1069、または1247～1248、あるいはその対応するアミノ酸位の間に挿入されている、請求項136の方法。
デアミナーゼバリアントが、Cas9参照配列における番号付けで、アミノ酸位1016～1017、1023～1024、1029～1030、1040～1041、1069～1070、または1247～1248、あるいはその対応するアミノ酸位の間に挿入されている、請求項136の方法。
アデノシンデアミナーゼバリアントが、表13Aに同定される遺伝子座で、Cas9ポリペプチド内に挿入されている、請求項136の方法。
N末端断片が、Cas9参照配列のアミノ酸残基1～529、538～568、580～685、692～942、948～1001、1026～1051、1078～1231、および/または1248～1297、あるいはその対応する残基を含む、請求項136の方法。
C末端断片が、Cas9参照配列のアミノ酸残基1301～1368、1248～1297、1078～1231、1026～1051、948～1001、692～942、580～685、および/または538～568、あるいはその対応する残基を含む、請求項136の方法。
Cas9ポリペプチドが改変Cas9であり、改変PAMまたは非G PAMに対する特異性を有する、請求項134～145のいずれか一項の方法。
Cas9ポリペプチドがニッカーゼであるかまたはCas9ポリペプチドがヌクレアーゼ不活性である、請求項134～146のいずれか一項の方法。
Cas9ポリペプチドが改変SpCas9ポリペプチドである、請求項134～145のいずれか一項の方法。
改変SpCas9ポリペプチドが、アミノ酸置換D1135M、S1136Q、G1218K、E1219F、A1322R、D1332A、R1335E、およびT1337R（SpCas9-MQKFRAER）であり、改変PAM 5’-NGC-3’に対する特異性を有する、請求項148の方法。
融合タンパク質またはABE8がCas12ポリペプチドを含む、請求項105～133のいずれか一項の方法。
アデノシンデアミナーゼバリアントが、Cas12ポリペプチド内に挿入されている、請求項150の方法。
Cas12ポリペプチドが、Cas12a、Cas12b、Cas12c、Cas12d、Cas12e、Cas12g、Cas12h、またはCas12iである、請求項150または請求項151の方法。
アデノシンデアミナーゼバリアントが、アミノ酸位:
a) BhCas12bの153～154、255～256、306～307、980～981、1019～1020、534～535、604～605、もしくは344～345、またはCas12a、Cas12c、Cas12d、Cas12e、Cas12g、Cas12h、もしくはCas12iの対応するアミノ酸残基;
b) BvCas12bの147～148、248～249、299～300、991～992、もしくは1031～1032、またはCas12a、Cas12c、Cas12d、Cas12e、Cas12g、Cas12h、もしくはCas12iの対応するアミノ酸残基; あるいは
c) AaCas12bの157～158、258～259、310～311、1008～1009、もしくは1044～1045、またはCas12a、Cas12c、Cas12d、Cas12e、Cas12g、Cas12h、もしくはCas12iの対応するアミノ酸残基の間に挿入されている、請求項151または請求項152の方法。
アデノシンデアミナーゼバリアントが、表13Bに同定される遺伝子座で、Cas12ポリペプチド内に挿入されている、請求項151の方法。
Cas12ポリペプチドがCas12bである、請求項154の方法。
Cas12ポリペプチドが、BhCas12bドメイン、BvCas12bドメイン、またはAACas12bドメインを含む、請求項154の方法。
ガイドRNAがCRISPR RNA（crRNA）およびトランス活性化crRNA（tracrRNA）を含む、請求項105～156のいずれか一項の方法。
対象が哺乳動物またはヒトである、請求項105～157のいずれか一項の方法。
請求項59または請求項60の塩基編集システム、および薬学的に許容され得るキャリアー、ビヒクル、または賦形剤を含む薬学的組成物。
請求項61～79のいずれか一項の細胞、および薬学的に許容され得るキャリアー、ビヒクル、または賦形剤を含む薬学的組成物。
請求項59または請求項60の塩基編集システムを含むキット。
請求項61～79のいずれか一項の細胞を含むキット。
さらに、使用のための説明書を含むパッケージ挿入物を含む、請求項161または請求項162のキット。
ポリヌクレオチドプログラム可能DNA結合ドメイン、および
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPRQVFNAQKKAQSSTD
のアミノ酸82位または166位で改変を含むアデノシンデアミナーゼバリアントを含む少なくとも1つの塩基エディタードメイン、ならびにガイドRNAを含む塩基エディターシステムであって、前記ガイドRNAが前記塩基エディターをターゲティングしてアルファ-1アンチトリプシン不全と関連するSNPの改変をもたらす、前記塩基エディターシステム。
アデノシンデアミナーゼバリアントが、V82S改変および/またはT166R改変を含む、請求項164の塩基エディターシステム。
アデノシンデアミナーゼバリアントが、以下の改変: Y147T、Y147R、Q154S、Y123H、およびQ154Rの1つ以上をさらに含む、請求項165の塩基エディターシステム。
塩基エディタードメインが、野生型アデノシンデアミナーゼドメインおよびアデノシンデアミナーゼバリアントを含むアデノシンデアミナーゼヘテロダイマーを含む、請求項165または166の塩基エディターシステム。
アデノシンデアミナーゼバリアントが、全長TadA8に比較して、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、6、17、18、19、または20のN末端アミノ酸残基が欠けている一部切除TadA8である、請求項164～167のいずれか一項の塩基エディター。
アデノシンデアミナーゼバリアントが、全長TadA8に比較して、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、6、17、18、19、または20のC末端アミノ酸残基が欠けている一部切除TadA8である、請求項164～167のいずれか一項の塩基エディター。
ポリヌクレオチドプログラム可能DNA結合ドメインが、改変Staphylococcus aureus Cas9（SaCas9）、Streptococcus thermophilus 1 Cas9（St1Cas9）、改変Streptococcus pyogenes（SpCas9）、またはそのバリアントである、請求項164～169のいずれか一項の塩基エディターシステム。
ポリヌクレオチドプログラム可能DNA結合ドメインが、改変プロトスペーサー隣接モチーフ（PAM）特異性または非G PAMに対する特異性を有するSpCas9のバリアントである、請求項170の塩基エディターシステム。
ポリヌクレオチドプログラム可能DNA結合ドメインがヌクレアーゼ不活性Cas9である、請求項170の塩基エディターシステム。
ポリヌクレオチドプログラム可能DNA結合ドメインがCas9ニッカーゼである、請求項170の塩基エディターシステム。
1つ以上のガイドRNA、ならびに以下の配列：

（太字配列はCas9由来の配列を示し、斜字配列はリンカー配列を示し、下線配列は二部分核局在化配列を示す）を含むポリヌクレオチドプログラム可能DNA結合ドメイン、および
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPRQVFNAQKKAQSSTD
のアミノ酸82位および/または166位で改変を含むアデノシンデアミナーゼバリアントを含む少なくとも１つの塩基エディタードメインを含む融合タンパク質を含む、塩基エディターシステム。
請求項164～174のいずれか一項の塩基エディターシステムを含む細胞。
細胞がヒト細胞または哺乳動物細胞である、請求項175の細胞。
細胞がex vivo、in vivo、またはin vitroである、請求項175の細胞。