JP2024534639A

JP2024534639A - Ｂ型肝炎ウイルス感染症を治療するための組成物及び方法

Info

Publication number: JP2024534639A
Application number: JP2024518996A
Authority: JP
Inventors: ファビエンゾウリム、; マリアグアダループマルティネス、; バーバラテストニ、; エレナスメカロヴァ、; ルイスバレラ、
Original assignee: Individual
Current assignee: Individual
Priority date: 2021-09-27
Filing date: 2022-09-27
Publication date: 2024-09-20
Also published as: KR20240111821A; US20240294914A1; EP4408986A1; CN119013394A; WO2023049935A1; AU2022353130A1; CA3233413A1

Abstract

B型肝炎は、B型肝炎ウイルス(HBV)によって引き起こされる重篤な肝臓感染症である。HBV感染症に対する現在の治療アプローチには、重大な制限がある。抗ウイルス薬、例えば、ヌクレオチド逆転写酵素阻害剤であるテノホビルは、ウイルス複製を減少させることはできるが、HBV感染患者を治癒しない。HBVによって引き起こされる肝臓損傷の程度により、場合によっては移植が必要となる。臓器移植に固有のリスクに加えて、コストが高い可能性がある。したがって、HBV感染症を治療するための改善された方法が緊急に必要とされている。本発明は、B型肝炎ウイルス(HBV)ゲノムに変異を導入するための組成物及び方法を特徴とする。

Description

関連出願の相互参照
本出願は、2022年8月16日に出願された米国仮出願第63/371,634号、2022年6月30日に出願された米国仮出願第63/357,623号、及び2021年9月27日に出願された米国仮出願第63/248,938号の優先権及び利益を主張し、その内容全体が、参照により本明細書に援用される。

電子配列表の参照
電子配列表の内容(180802_053004_PCT_SL.xml;サイズ:10,086,238バイト、及び作成日:2022年9月26日)は、その全体が参照により本明細書に援用される。

B型肝炎は、B型肝炎ウイルス(HBV)によって引き起こされる重篤な肝臓感染症である。HBVは、RNA中間体を介して複製する小型DNAヘパドナウイルスであり、宿主のゲノムに組み込むことによって、感染した細胞内に残留することができる。世界中でおよそ2億5700万人(米国の85万～220万人を含む)が慢性的にHBVに感染している。慢性HBV感染症は、慢性肝炎、肝硬変、及び/または肝細胞癌として現れる。慢性HBV感染症を有する成人の20%～30%が、肝細胞癌または肝硬変を発症する。年間60万～100万人が、HBV感染で死亡している。

HBV感染症に対する現在の治療アプローチには、重大な制限がある。抗ウイルス薬、例えば、ヌクレオチド逆転写酵素阻害剤であるテノホビルは、ウイルス複製を減少させることはできるが、HBV感染患者を治癒しない。患者は、これらの抗ウイルス療法に毎月500～1500ドルも払う可能性がある。HBVによって引き起こされる肝臓損傷の程度により、場合によっては移植が必要となる。臓器移植に固有のリスクに加えて、コストが高い可能性がある。したがって、HBV感染症を治療するための改善された方法が緊急に必要とされている。

以下に記載されるように、本発明は、B型肝炎ウイルス(HBV)ゲノムに改変を導入することによってHBV感染症を治療するための組成物及び方法を特徴とする。特定の実施形態では、本発明は、HBVゲノムを修飾して、変化、例えば、未熟終止コドンもしくはHBVのコード配列における変化、またはHBV共有結合閉鎖環状DNA(cccDNA)中の核酸塩基の脱アミノ化を導入するための塩基エディターシステム(例えば、プログラマブルDNA結合タンパク質と、核酸塩基エディターと、gRNAと、を含む融合タンパク質)を提供する。

一態様では、本開示の本発明は、B型肝炎ウイルス(HBV)ゲノムの核酸塩基を編集する方法を特徴とする。方法は、HBVゲノムを、1つ以上のガイドRNA、ならびにポリヌクレオチドプログラマブルDNA結合ドメイン及びアデノシンデアミナーゼを含有する塩基エディターと接触させることを含む。ガイドRNAは、塩基エディターを標的指向化(target)して、HBVゲノムの核酸塩基の改変をもたらす。1つ以上のガイドRNAは、ACAAGAAUCCUCACAAUACC(配列番号405)、UCGCUGGAUGUGUCUGCGGC(配列番号406)、CACCUGUAUUCCCAUCCCAU(配列番号407)、GGGGCCAAGUCUGUACAGCA(配列番号408)、GCUGACGCAACCCCCACUGG(配列番号409)、GGAGCUACUGUGGAGUUACU(配列番号410)、UUCUUCUAGGGGACCUGCCU(配列番号411)、GAGGACAAACGGGCAACAUA(配列番号412)、UUGUCAACAAGAAAAACCCC(配列番号413)、CCCAAGGUCUUACAUAAGAG(配列番号414)、CCGGGCAACGGGGUAAAGGU(配列番号415)、ACACAGAAAGGCCUUGUAAG(配列番号416)、及びCACGCACGCGCUGAUGGCCC(配列番号417)のうちの1つ以上から選択される、5’から3’へのヌクレオチド配列、あるいはその1、2、3、4もしくは5個のヌクレオチド5’及び/または3’の切断断片を含有する。

別の態様では、本開示の本発明は、B型肝炎ウイルス(HBV)ゲノムの核酸塩基を編集する方法を特徴とする。方法は、(i)HBVゲノムを含有する細胞を、1つ以上のガイドRNA、ならびにポリヌクレオチドプログラマブルDNA結合ドメイン及びアデノシンデアミナーゼまたはシチジンデアミナーゼを含有する塩基エディターと接触させることを含む。ガイドRNAは、塩基エディターを標的指向化して、HBVゲノムの核酸塩基の改変をもたらし、それによって、HBVゲノム中の核酸塩基を編集する。方法は、(ii)細胞を抗レトロウイルス薬と接触させることを更に含む。細胞を抗レトロウイルス薬と接触させることは、抗レトロウイルス薬と接触していない参照細胞と比較して塩基編集効率の増加と関連している。

別の態様では、本開示の本発明は、B型肝炎ウイルス(HBV)ゲノムの核酸塩基を編集する方法を特徴とする。方法は、(i)HBVゲノムを含有する細胞を、BE4をコードするmRNA、ならびにガイドRNAであるgRNA37及びgRNA40と接触させることを含む。ガイドRNAは、塩基エディターを標的指向化して、HBVゲノムの核酸塩基の改変をもたらし、それによって、HBVゲノム中の核酸塩基を編集する。方法は、(ii)細胞をラミブジンと接触させることを更に含む。細胞を抗レトロウイルス薬と接触させることは、抗レトロウイルス薬と接触していない参照細胞と比較して塩基編集効率の増加と関連している。

別の態様では、本開示の本発明は、B型肝炎ウイルス(HBV)ゲノムの核酸塩基を編集する方法を特徴とする。方法は、HBVゲノムを含有する細胞を、ポリヌクレオチドプログラマブルDNA結合ドメイン及びアデノシンデアミナーゼまたはシチジンデアミナーゼを含む塩基エディターをコードするmRNA、ならびに配列GAAAGCCCAGGAUGAUGGGA(配列番号657)及びCCAUGCCCCAAAGCCACCCA(配列番号662)を含むガイドRNAと接触させることを含む。ガイドRNAは、塩基エディターを標的指向化して、HBVゲノムの核酸塩基の改変をもたらし、それによって、HBVゲノム中の核酸塩基を編集する。

別の態様では、本開示の本発明は、対象におけるB型肝炎ウイルス(HBV)感染症を治療する方法を特徴とする。方法は、その治療を必要とする対象に、融合タンパク質、タンパク質複合体、または融合タンパク質もしくはタンパク質複合体をコードするポリヌクレオチドを投与することを含む。融合タンパク質またはタンパク質複合体は、ポリヌクレオチドプログラマブルDNA結合ドメインと、アデノシンデアミナーゼドメインである塩基エディタードメインと、塩基エディタードメインを標的指向化してHBVゲノムの核酸塩基のA・TからG・Cへの改変をもたらす1つ以上のガイドRNAと、を含有する。1つ以上のガイドRNAは、ACAAGAAUCCUCACAAUACC(配列番号405)、UCGCUGGAUGUGUCUGCGGC(配列番号406)、CACCUGUAUUCCCAUCCCAU(配列番号407)、GGGGCCAAGUCUGUACAGCA(配列番号408)、GCUGACGCAACCCCCACUGG(配列番号409)、GGAGCUACUGUGGAGUUACU(配列番号410)、UUCUUCUAGGGGACCUGCCU(配列番号411)、GAGGACAAACGGGCAACAUA(配列番号412)、UUGUCAACAAGAAAAACCCC(配列番号413)、CCCAAGGUCUUACAUAAGAG(配列番号414)、CCGGGCAACGGGGUAAAGGU(配列番号415)、ACACAGAAAGGCCUUGUAAG(配列番号416)、及びCACGCACGCGCUGAUGGCCC(配列番号417)のうちの1つ以上から選択される、5’から3’へのヌクレオチド配列、あるいはその1、2、3、4もしくは5個のヌクレオチド5’及び/または3’の切断断片を含有する。

別の態様では、本開示の本発明は、対象におけるB型肝炎ウイルス(HBV)感染症を治療する方法を特徴とする。方法は、その治療を必要とする対象に、ポリヌクレオチドプログラマブルDNA結合ドメイン及びアデノシンデアミナーゼドメインである塩基エディタードメインをコードする1つ以上のポリヌクレオチドと、塩基エディタードメインを標的指向化して、HBVゲノムの核酸塩基のA・TからG・Cへの改変をもたらす1つ以上のガイドRNAと、を投与することを含む。1つ以上のガイドRNAは、ACAAGAAUCCUCACAAUACC(配列番号405)、UCGCUGGAUGUGUCUGCGGC(配列番号406)、CACCUGUAUUCCCAUCCCAU(配列番号407)、GGGGCCAAGUCUGUACAGCA(配列番号408)、GCUGACGCAACCCCCACUGG(配列番号409)、GGAGCUACUGUGGAGUUACU(配列番号410)、UUCUUCUAGGGGACCUGCCU(配列番号411)、GAGGACAAACGGGCAACAUA(配列番号412)、UUGUCAACAAGAAAAACCCC(配列番号413)、CCCAAGGUCUUACAUAAGAG(配列番号414)、CCGGGCAACGGGGUAAAGGU(配列番号415)、ACACAGAAAGGCCUUGUAAG(配列番号416)、及びCACGCACGCGCUGAUGGCCC(配列番号417)のうちの1つ以上から選択される、5’から3’へのヌクレオチド配列、あるいはその1、2、3、4もしくは5個のヌクレオチド5’及び/または3’の切断断片を含有する。

別の態様では、本開示の本発明は、対象におけるB型肝炎ウイルス(HBV)感染症を治療する方法を特徴とする。方法は、その治療を必要とする対象に、1つ以上のガイドRNAと、ポリヌクレオチドプログラマブルDNA結合ドメイン及びアデノシンデアミナーゼまたはシチジンデアミナーゼを含有する塩基エディターと、を投与することを含む。1つ以上のガイドRNAは、塩基エディターを標的指向化して、HBVゲノムの核酸塩基の改変をもたらす配列GAAAGCCCAGGAUGAUGGGA(配列番号657)及びCCAUGCCCCAAAGCCACCCA(配列番号662)を含有し、それによって、HBVゲノム中の核酸塩基を編集する。

別の態様では、本開示の本発明は、ガイドRNA(複数可)に結合した塩基エディター(複数可)を含有する組成物を特徴とする。ガイドRNA(複数可)は、ACAAGAAUCCUCACAAUACC(配列番号405)、UCGCUGGAUGUGUCUGCGGC(配列番号406)、CACCUGUAUUCCCAUCCCAU(配列番号407)、GGGGCCAAGUCUGUACAGCA(配列番号408)、GCUGACGCAACCCCCACUGG(配列番号409)、GGAGCUACUGUGGAGUUACU(配列番号410)、UUCUUCUAGGGGACCUGCCU(配列番号411)、GAGGACAAACGGGCAACAUA(配列番号412)、UUGUCAACAAGAAAAACCCC(配列番号413)、CCCAAGGUCUUACAUAAGAG(配列番号414)、CCGGGCAACGGGGUAAAGGU(配列番号415)、ACACAGAAAGGCCUUGUAAG(配列番号416)、及びCACGCACGCGCUGAUGGCCC(配列番号417)のうちの1つ以上から選択される、5’から3’へのヌクレオチド配列、あるいはその1、2、3、4もしくは5個のヌクレオチド5’及び/または3’の切断断片を含有する。

別の態様では、本開示の本発明は、HBV感染症の治療のための医薬組成物を特徴とする。組成物は、(i)塩基エディター、または塩基エディターをコードする核酸と、薬学的に許容される賦形剤中のHBV遺伝子に相補的な核酸配列を含有する1つ以上のガイドRNA(gRNA)と、を含有する。1つ以上のガイドRNAは、ACAAGAAUCCUCACAAUACC(配列番号405)、UCGCUGGAUGUGUCUGCGGC(配列番号406)、CACCUGUAUUCCCAUCCCAU(配列番号407)、GGGGCCAAGUCUGUACAGCA(配列番号408)、GCUGACGCAACCCCCACUGG(配列番号409)、GGAGCUACUGUGGAGUUACU(配列番号410)、UUCUUCUAGGGGACCUGCCU(配列番号411)、GAGGACAAACGGGCAACAUA(配列番号412)、UUGUCAACAAGAAAAACCCC(配列番号413)、CCCAAGGUCUUACAUAAGAG(配列番号414)、CCGGGCAACGGGGUAAAGGU(配列番号415)、ACACAGAAAGGCCUUGUAAG(配列番号416)、及びCACGCACGCGCUGAUGGCCC(配列番号417)のうちの1つ以上から選択される、5’から3’へのヌクレオチド配列、あるいはその1、2、3、4もしくは5個のヌクレオチド5’及び/または3’の切断断片を含有する。

別の態様では、本開示の本発明は、HBV感染症を治療する方法を特徴とする。方法は、その治療を必要とする対象に、上記の態様のうちのいずれか1つの組成物を投与することを含む。

別の態様では、本開示の本発明は、HBV感染症を治療する方法を特徴とし、本方法は、その治療を必要とする対象に、上記の態様のうちのいずれか1つの医薬組成物を投与することを含む。

別の態様では、本開示の本発明は、対象におけるHBV感染症の治療における上記の態様のうちのいずれか1つの組成物の使用を特徴とする。

別の態様では、本開示の本発明は、対象におけるHBV感染症の治療における上記の態様のうちのいずれか1つの医薬組成物の使用を特徴とする。

別の態様では、本開示の本発明は、ガイドRNAであって、ACAAGAAUCCUCACAAUACC(配列番号405)、UCGCUGGAUGUGUCUGCGGC(配列番号406)、CACCUGUAUUCCCAUCCCAU(配列番号407)、GGGGCCAAGUCUGUACAGCA(配列番号408)、GCUGACGCAACCCCCACUGG(配列番号409)、GGAGCUACUGUGGAGUUACU(配列番号410)、UUCUUCUAGGGGACCUGCCU(配列番号411)、GAGGACAAACGGGCAACAUA(配列番号412)、UUGUCAACAAGAAAAACCCC(配列番号413)、CCCAAGGUCUUACAUAAGAG(配列番号414)、CCGGGCAACGGGGUAAAGGU(配列番号415)、ACACAGAAAGGCCUUGUAAG(配列番号416)、及びCACGCACGCGCUGAUGGCCC(配列番号417)のうちの1つ以上から選択される、5’から3’へのヌクレオチド配列、あるいはその1、2、3、4もしくは5個のヌクレオチド5’及び/または3’の切断断片を含有する、ガイドRNAを特徴とする。

別の態様では、本開示の本発明は、(i)塩基エディターをコードする核酸と、(ii)上記の態様のうちのいずれか1つのガイドRNAと、を含有する、医薬組成物を特徴とする。

上記の態様のうちのいずれかでは、抗レトロウイルス薬は、ラミブジン、エンテカビル、テノホビル、インターフェロン、及びPeg-インターフェロンのうちの1つ以上から選択される。上記の態様のうちのいずれかでは、レトロウイルス薬は、ラミブジンである。

上記の態様のうちのいずれかでは、工程(i)が工程(ii)に先行するか、または工程(ii)が工程(i)に先行する。

上記の態様のうちのいずれかでは、細胞を、工程(i)の約1、2、3、4、5、6、7、8、9、10、11、12、13、もしくは14日前に、または少なくとも約1、2、3、4、5、6、7、8、9、10、11、12、13、もしくは14日前に、抗レトロウイルス薬と最初に接触させる。上記の態様のうちのいずれかでは、細胞は、以前に抗レトロウイルス薬と接触していない。上記の態様のうちのいずれかでは、細胞は、対象内にある。上記の態様のうちのいずれかでは、接触させることは、真核細胞、哺乳動物細胞、またはヒト細胞内である。上記の態様のうちのいずれかでは、細胞は、インビトロまたはインビボである。上記の態様のうちのいずれか、またはその実施形態では、対象は、哺乳動物またはヒトである。上記の態様のうちのいずれか、またはその実施形態では、対象は、哺乳動物である。上記の態様のうちのいずれか、またはその実施形態では、対象は、ヒトである。

上記の態様のうちのいずれかでは、HBVゲノムを、2つ以上のガイドRNAと同時に接触させる。

上記の態様のうちのいずれかでは、ガイドRNAは、ACAAGAAUCCUCACAAUACC(配列番号405)、UCGCUGGAUGUGUCUGCGGC(配列番号406)、CACCUGUAUUCCCAUCCCAU(配列番号407)、GGGGCCAAGUCUGUACAGCA(配列番号408)、GCUGACGCAACCCCCACUGG(配列番号409)、GGAGCUACUGUGGAGUUACU(配列番号410)、UUCUUCUAGGGGACCUGCCU(配列番号411)、GAGGACAAACGGGCAACAUA(配列番号412)、UUGUCAACAAGAAAAACCCC(配列番号413)、CCCAAGGUCUUACAUAAGAG(配列番号414)、CCGGGCAACGGGGUAAAGGU(配列番号415)、ACACAGAAAGGCCUUGUAAG(配列番号416)、及びCACGCACGCGCUGAUGGCCC(配列番号417)のうちの1つ以上から選択される。

上記の態様のうちのいずれかでは、1つ以上のガイドRNAは、表2A、表2B、表2C、及び/または配列番号3105～5485及び8220～10830に列挙される配列から選択されるスペーサー配列を含有する。

上記の態様のうちのいずれかでは、1つ以上のガイドRNAは、ヌクレオチド配列GAAAGCCCAGGAUGAUGGGA(配列番号657)及びCCAUGCCCCAAAGCCACCCA(配列番号662)を含有するスペーサーを含有する。上記の態様のうちのいずれかでは、1つ以上のガイドRNAは、ヌクレオチド配列mG*mA*mA*AGCCCAGGAUGAUGGGAGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUmU*mU*mU*(配列番号424)及びmC*mC*mA*UGCCCCAAAGCCACCCAGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUmU*mU*mU*(配列番号422)を含有する。

上記の態様のうちのいずれかでは、塩基編集効率は、少なくとも約5%、10%、15%、または20%改善される。

上記の態様のうちのいずれかでは、アデノシンデアミナーゼが、B型肝炎ウイルス(HBV)ゲノム内の標的A・TをG・Cに変換する。

上記の態様のうちのいずれかでは、核酸塩基は、HBVタンパク質をコードするポリヌクレオチド内にある。上記の態様のうちのいずれかにおいて、核酸塩基は、HBVコアタンパク質(ｈ)、HBVポリメラーゼ(Pol)、HBV表面タンパク質、またはHBVタンパク質Xから選択されるHBVタンパク質をコードするポリヌクレオチド配列内にある。上記の態様のうちのいずれかの実施形態では、HBVタンパク質をコードするポリヌクレオチドにおける核酸塩基の改変は、ミスセンス変異をもたらす。上記の態様のうちのいずれかの実施形態では、核酸塩基の改変は、HBVタンパク質をコードするポリヌクレオチド配列の転写の減少と関連している。上記の態様のうちのいずれかの実施形態では、HBVタンパク質は、HBVポリメラーゼ(Pol)、及び/またはHBVタンパク質Xである。上記の態様のうちのいずれかの実施形態では、ミスセンス変異は、HBV pol遺伝子内にある。上記の態様のうちのいずれかの実施形態では、ミスセンス変異は、HBV pol遺伝子によってコードされるHBVポリメラーゼタンパク質においてE24G、L25F、P26F、R27C、V48A、V48I、S382F、V378I、V378A、V379I、V379A、L377F、D380G、D380N、F381P、R376G、A422T、F423P、A432V、M433V、P434S、D540G、A688V、D689G、A717T、E718K、P713S、P713L、またはL719Pをもたらす。上記の態様のうちのいずれかの実施形態では、ミスセンス変異は、HBVコア遺伝子内にある。上記の態様のうちのいずれかの実施形態では、ミスセンス変異は、HBVコア遺伝子によってコードされるHBVコアタンパク質において、T160A、T160A、P161F、S162L、C183R、または*184Qをもたらす。上記の態様のうちのいずれかの実施形態では、ミスセンス変異は、HBV X遺伝子内にある。上記の態様のうちのいずれかの実施形態では、ミスセンス変異は、HBV X遺伝子によってコードされるHBV Xタンパク質において、H86R、W120R、E122K、E121K、またはL141Pをもたらす。上記の態様のうちのいずれかの実施形態では、ミスセンス変異は、HBV S遺伝子内にある。上記の態様のうちのいずれかの実施形態では、ミスセンス変異は、HBV S遺伝子によってコードされるHBV Sタンパク質において、S38F、L39F、W35R、W36R、T37I、T37A、R78Q、S34L、F80P、またはD33Gをもたらす。

上記の態様のうちのいずれかでは、核酸塩基は、転写部位と関連している。上記の態様のうちのいずれかの実施形態では、転写部位は、エンハンサーIIボックスA、エンハンサーI、及びHBXプロモーターのうちの1つ以上から選択される。

上記の態様のうちのいずれかでは、ポリヌクレオチドプログラマブルDNA結合ドメインは、Cas12ポリペプチドを含有する。上記の態様のうちのいずれかでは、ポリヌクレオチドプログラマブルDNA結合ドメインは、Cas12a、Cas12b、Cas12c、Cas12d、Cas12e、Cas12g、Cas12h、またはCas12iを含有する。上記の態様のいずれかにおいて、ポリヌクレオチドプログラマブルDNA結合ドメインは、Bacillus hisashii Cas12b、Bacillus thermoamylovorans Cas12b、Bacillus sp.V3-13 Cas12b、またはAlicyclobacillus acidiphilus Cas12bと少なくとも約85%のアミノ酸配列同一性を有する配列を含有する。上記の態様のうちのいずれかでは、ポリヌクレオチドプログラマブルDNA結合ドメインは、Bacillus hiasashii Cas12b(bhCas12b)と少なくとも約85%のアミノ酸配列同一性を有する配列を含有する。上記の態様のうちのいずれかでは、ポリヌクレオチドプログラマブルDNA結合ドメインは、ヌクレアーゼ不活性バリアントまたはニッカーゼバリアントを含有する。上記の態様のうちのいずれかの実施形態では、ヌクレアーゼ不活性バリアントまたはニッカーゼバリアントは、アミノ酸置換D952A、S893R、K846R、及びE837G、またはそれらの対応するアミノ酸置換を含有するヌクレアーゼ不活性化bhCas12bを含有する。上記の態様のうちのいずれかでは、塩基エディターは、bhCas12b、またはアミノ酸置換D952A、S893R、K846R、及びE837Gを含有するbhCas12bバリアントを含有する。

上記の態様のうちのいずれかでは、塩基エディターは、アデノシンデアミナーゼを含有する。上記の態様のうちのいずれか、またはその実施形態では、アデノシンデアミナーゼドメインは、デオキシリボ核酸(DNA)中のアデニンを脱アミノすることができる。上記の態様のうちのいずれか、またはその実施形態では、デアミナーゼドメインは、TadAドメインである。一部の実施形態では、TadAデアミナーゼは、TadA*7.10、TadA*8.1、TadA*8.2、TadA*8.3、TadA*8.4、TadA*8.5、TadA*8.6、TadA*8.7、TadA*8.8、TadA*8.9、TadA*8.10、TadA*8.11、TadA*8.12、TadA*8.13、TadA*8.14、TadA*8.15、TadA*8.16、TadA*8.17、TadA*8.18、TadA*8.19、TadA*8.20、TadA*8.21、TadA*8.22、TadA*8.23、またはTadA*8.24である。上記の態様のうちのいずれかの実施形態では、TadAデアミナーゼは、TadA*8.13である。

上記の態様のうちのいずれかでは、1つ以上のガイドRNAは、CRISPR RNA(crRNA)及びトランスコード化低分子RNA(tracrRNA)を含有し、crRNAは、HBV核酸配列に相補的な核酸配列を含有する。上記の態様のうちのいずれかでは、1つ以上のガイドRNAは、HBVゲノムの3、4、または5個の核酸塩基を標的化する。

上記の態様のうちのいずれかでは、塩基エディターは、HBV核酸配列に相補的な核酸配列を含有する単一のガイドRNA(sgRNA)と複合体を形成している。

上記の態様のうちのいずれかでは、方法は、2つ以上の核酸塩基を編集することを含む。

上記の態様のうちのいずれかでは、方法は、HBVゲノムを、2つ以上のHBV核酸配列を標的化する2つ以上のガイドRNAと接触させることを含む。上記の態様のうちのいずれかでは、方法は、融合タンパク質、融合タンパク質をコードするポリヌクレオチド、またはポリヌクレオチドプログラマブルDNA結合ドメイン及び塩基エディタードメインをコードする1つ以上のポリヌクレオチド、及び1つ以上のガイドRNAを対象の細胞に送達することを含む。上記の態様のうちのいずれか、またはその実施形態では、細胞は、肝細胞である。

上記の態様のうちのいずれかでは、塩基エディターは、(i)ヌクレアーゼ不活性bhCas12bを含有するか、または(ii)MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLYDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHHPGMNHRVEITEGILADECAALLCRFFRMPRRVFNAQKKAQSSTDGSSGSETPGTSESATPESSGAPKKKRKVGIHGVPAAATRSFILKIEPNEEVKKGLWKTHEVLNHGIAYYMNILKLIRQEAIYEHHEQDPKNPKKVSKAEIQAELWDFVLKMQKCNSFTHEVDKDEVFNILRELYEELVPSSVEKKGEANQLSNKFLYPLVDPNSQSGKGTASSGRKPRWYNLKIAGDPSWEEEKKKWEEDKKKDPLAKILGKLAEYGLIPLFIPYTDSNEPIVKEIKWMEKSRNQSVRRLDKDMFIQALERFLSWESWNLKVKEEYEKVEKEYKTLEERIKEDIQALKALEQYEKERQEQLLRDTLNTNEYRLSKRGLRGWREIIQKWLKMDENEPSEKYLEVFKDYQRKHPREAGDYSVYEFLSKKENHFIWRNHPEYPYLYATFCEIDKKKKDAKQQATFTLADPINHPLWVRFEERSGSNLNKYRILTEQLHTEKLKKKLTVQLDRLIYPTESGGWEEKGKVDIVLLPSRQFYNQIFLDIEEKGKHAFTYKDESIKFPLKGTLGGARVQFDRDHLRRYPHKVESGNVGRIYFNMTVNIEPTESPVSKSLKIHRDDFPKVVNFKPKELTEWIKDSKGKKLKSGIESLEIGLRVMSIALGQRQAAAASIFEVVDQKPDIEGKLFFPIKGTELYAVHRASFNIKLPGETLVKSREVLRKAREDNLKLMNQKLNFLRNVLHFQQFEDITEREKRVTKWISRQENSDVPLVYQDELIQIRELMYKPYKDWVAFLKQLHKRLEVEIGKEVKHWRKSLSDGRKGLYGISLKNIDEIDRTRKFLLRWSLRPTEPGEVRRLEPGQRFAIDQLNHLNALKEDRLKKMANTIIMHALGYCYDVRKKKWQAKNPACQIILFEDLSNYNPYKERSRFENSRLMKWSRREIPRQVALQGEIYGLQVGEVGAQFSSRFHAKTGSPGIRCRVVTKEKLQDNRFFKNLQREGRLTLDKIAVLKEGDLYPDKGGEKFISLSKDRKCVTTHADINAAQNLQKRFWTRTHGFYKVYCKAYQVDGQTVYIPESKDQKQKIIEEFGEGYFILKDGVYEWVNAGKLKIKKGSSKQSSSELVDSDILKDSFDLASELKGEKLMLYRDPSGNVFPSDKWMAAGVFFGKLERILISKLTNQYSISTIEDDSSKQSMKRPAATKKAGQAKKKK(配列番号418)と少なくとも80%、85%、90%、95%、96%、97%、98%、99%、もしくは100%同一であるアミノ酸配列を含有する。

上記の態様のうちのいずれかでは、組成物または医薬組成物は、脂質を更に含有する。上記の態様のうちのいずれかの実施形態では、脂質は、カチオン性脂質である。

上記の態様のうちのいずれかでは、組成物は、薬学的に許容される賦形剤を含有する。

上記の態様のうちのいずれかでは、1つ以上のgRNA及び塩基エディターは、一緒に製剤化される。上記の態様のうちのいずれかでは、1つ以上のgRNA及び塩基エディターは、別々に製剤化される。

上記の態様のうちのいずれかでは、組成物または医薬組成物は、哺乳動物細胞内での発現に好適なベクターを更に含み、ベクターは、塩基エディターをコードするポリヌクレオチドを含有する。上記の態様のうちのいずれか、またはその実施形態では、ベクターは、ウイルスベクターである。上記の態様のうちのいずれか、またはその実施形態では、ウイルスベクターは、レトロウイルスベクター、アデノウイルスベクター、レンチウイルスベクター、ヘルペスウイルスベクター、またはアデノ随伴ウイルスベクター(AAV)である。上記の態様のうちのいずれか、またはその実施形態では、組成物または医薬組成物は、哺乳動物細胞における発現に好適なリボ核粒子を更に含有する。

上記の態様のうちのいずれかでは、HBVは、遺伝子型Aのもの、または遺伝子型Dのものである。上記の態様のいずれかでは、方法は、B型肝炎表面抗原、B型肝炎E抗原、B型肝炎ウイルス全DNA、B型肝炎3.5kb RNA、及びB型肝炎共有結合閉鎖環状DNAのうちの1つ以上から選択されるマーカーのレベルを低下させる。上記の態様のうちのいずれかでは、方法は、B型肝炎S抗原部位及びPreCore部位を編集する。上記の態様のうちのいずれか、またはその実施形態では、編集効率は、S抗原部位で約30%であり、PreCore部位で約60%である。

上記の態様のうちのいずれかでは、塩基エディターをコードする核酸は、mRNAである。

上記の態様のうちのいずれかでは、1つ以上のガイドRNAは、以下の足場配列:gUUUUAGagcuagaaauagcaaGUUaAaAuAaggcuaGUccGUUAucAAcuugaaaaagugGcaccgagucggugcusususu(配列番号317)を含み、式中、a、c、uまたはgは、2’O-メチル(M)修飾を有する塩基を表し、as、cs、usまたはgsは、2’-O-メチル3’-ホスホロチオエート(MS)修飾を有する塩基を表す。上記の態様のうちのいずれかでは、1つ以上のガイドRNAが、ヌクレオチド配列gsasasAGCCCAGGAUGAUGGGAgUUUUAGagcuagaaauagcaaGUUaAaAuAaggcuaGUccGUUAucAAcuugaaaaagugGcaccgagucggugcusususu(配列番号424)及びcscsasUGCCCCAAAGCCACCCAgUUUUAGagcuagaaauagcaaGUUaAaAuAaggcuaGUccGUUAucAAcuugaaaaagugGcaccgagucggugcusususu(配列番号422)を含み、式中、a、c、u、またはgは、それぞれ、2’O-メチル(M)修飾を含有するA、C、U、またはGヌクレオチドを表し、as、cs、us、またはgsは、2’-O-メチル3’-ホスホロチオエート(MS)修飾を含有するA、C、U、またはGヌクレオチドを表す。

上記の態様のうちのいずれかでは、細胞を、第1及び第2の時点で、1つ以上のガイドRNA及び塩基エディターと接触させる。実施形態では、細胞を接触させる第1の時間と第2の時間との間隔は、少なくとも1週間である。実施形態では、細胞を接触させる第1の時間と第2の時間との間隔は、少なくとも2週間である。

上記の態様のうちのいずれかでは、塩基エディターは、BE4である。上記の態様のうちのいずれかでは、gRNAは、GAAAGCCCAAGAUGAUGGGA(配列番号10834)を含む。

本発明によって定義される組成物及び物品を、以下に提供される実施例に関連して単離したか、またはそうでなければ製造した。本発明の他の特徴及び利点は、詳細な説明及び特許請求の範囲から明らかであろう。

定義
別段定義されない限り、本明細書で使用される全ての技術用語及び科学用語は、本発明が属する技術分野の当業者によって一般的に理解されている意味を有する。以下の参考文献は、本発明において使用する多くの用語の一般的な定義を当業者に提供する:Singleton et al.,Dictionary of Microbiology and Molecular Biology(2nd ed.1994)、The Cambridge Dictionary of Science and Technology(Walker ed.,1988)、The Glossary of Genetics,5th Ed.,R.Rieger et al.(eds.),Springer Verlag(1991)、及びHale & Marham,The Harper Collins Dictionary of Biology(1991)。本明細書で使用される場合、以下の用語は、別途指定されない限り、以下の意味を有する。

「BE4ポリペプチド」とは、以下のアミノ酸配列と少なくとも約85%の同一性を有するポリペプチド、またはシチジンデアミナーゼ活性を有するその断片を意味する:
MSSETGPVAVDPTLRRRIEPHEFEVFFDPRELRKETCLLYEINWGGRHSIWRHTSQNTNKHVEVNFIEKFTTERYFCPNTRCSITWFLSWSPCGECSRAITEFLSRYPHVTLFIYIARLYHHADPRNRQGLRDLISSGVTIQIMTEQESGYCWRNFVNYSPSNEAHWPRYPHLWVRLYVLELYCIILGLPPCLNILRRKQPQLTFFTIALQSCHYQRLPPHILWATGLKSGGSSGGSSGSETPGTSESATPESSGGSSGGSDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGDSGGSGGSGGSTNLSDIIEKETGKQLVIQESILMLPEEVEEVIGNKPESDILVHTAYDESTDENVMLLTSDAPEYKPWALVIQDSNGENKIKMLSGGSGGSGGSTNLSDIIEKETGKQLVIQESILMLPEEVEEVIGNKPESDILVHTAYDESTDENVMLLTSDAPEYKPWALVIQDSNGENKIKMLSGGSPKKKRK(配列番号10832)。

「BE4ポリヌクレオチド」とは、BE4ポリペプチドをコードするポリヌクレオチドを意味する。

「HBVポリメラーゼ(pol)タンパク質」とは、B型肝炎ウイルス感染症において機能する、野生型HBVポリメラーゼのアミノ酸配列と少なくとも約95%の同一性を有するポリペプチドまたはその断片を意味する。一実施形態では、HBVポリメラーゼは、HBV A、B、C、D、E、F、G、またはH遺伝子型によってコードされる。一実施形態では、HBVポリメラーゼアミノ酸配列は、UniPro受託番号Q8B5R0-1で提供され、これを以下に再現する。
MPLSYQHFRRLLLLDDEAGPLEEELPRLADEGLNRRVAEDLNLGNLNVSIPWTHKVGNFTGLYSSTVPVFNPHWKTPSFPNIHLHQDIIKKCEQFVGPLTVNEKRRLQLIMPARFYPKVTKYLPLDKGIKPYYPEHLVNHYFQTRHYLHTLWKAGILYKRETTHSASFCGSPYSWEQDLQHGAESFHQQS(配列番号370)。

HBVポリメラーゼにおける変異としては、上記の態様のうちのいずれか、またはその実施形態では、E24G、L25F、P26F、R27C、V48A、V48I、S382F、V378I、V378A、V379I、V379A、L377F、D380G、D380N、F381P、R376G、A422T、F423P、A432V、M433V、P434S、D540G、A688V、D689G、A717T、E718K、P713S、P713L、またはL719Pが挙げられる。

他の例示的なHBV DNAポリメラーゼとしては、例えば、以下の配列を有するNCBI受託番号AAB59972.1が挙げられる。
MPLSYQHFRKLLLLDDEAGPLEEELPRLADEGLNRRVAEDLNLGNLNVSIPWTHKVGNFTGLYSSTVPVFNPHWKTPSFPNIHLHQDIIKKCEQFVGPLTVNEKRRLQLIMPARFYPKVTKYLPLDKGIKPYYPEHLVNHYFQTRHYLHTLWKAGILYKRETTHSASFCGSPYSWEQDLQHGAESFHQQSSGILSRPPVGSSLQSKHSKSRLGLQSQQGHLARRQQGRSWSIRAGFHPTARRPFGVEPSGSGHTTNFASKSASCLHQSPDRKAAYPAVSTFEKHSSSGHAVEFHNLSPNSARSQSERPVFPCWWLQFRSSKPCSDYCLSLIVNLLEDWGPCAEHGEHHIRIPRTPSRVTGGVFLVDKNPHNTAESRLVVDFSQFSRGNYRVSWPKFAVPNLQSLTNLLSSNLSWLSLDVSAAFYHLPLHPAAMPHLLVGSSGLSRYVARLSSNSRILNHQHGTMPNLHDYCSRNLYVSLLLLYQTFGRKLHLYSHPIILGFRKIPMGVGLSPFLLAQFTSAICSVVRRAFPHCLAFSYMDDVVLGAKSVQHLESLFTAVTNFLLSLGIHLNPNKTKRWGYSLNFMGYVIGSYGSLPQEHIIQKIKECFRKLPINRPIDWKVCQRIVGLLGFAAPFTQCGYPALMPLYACIQSKQAFTFSPTYKAFLCKQYLNLYPVARQRPGLCQVFADATPTGWGLVMGHQRVRGTFSAPLPIHTAELLAACFARSRSGANIIGTDNSVVLSRKYTSYPWLLGCAANWILRGTSFVYVPSALNPADDPSRGRLGLSRPLLRLPFRPTTGRTSLYADSPSVPSHLPDRVHFASPLHVAWRPP(配列番号371)。

「HBVポリメラーゼ遺伝子」とは、HBVポリメラーゼをコードするポリヌクレオチドを意味する。

「B型肝炎表面抗原(HBsAg)ポリペプチド」または「HBV表面タンパク質(S)」とは、HBVウイルス感染において機能するNCBI受託番号AAB59969.1と少なくとも約85%の同一性を有する抗原タンパク質またはその断片を意味する。例示的なHBsAgアミノ酸配列を以下に提供する。
MENITSGFLGPLLVLQAGFFLLTRILTIPQSLDSWWTSLNFLGGTTVCLGQNSQSPTSNHSPTSCPPTCPGYRWMCLRRFIIFLFILLLCLIFLLVLLDYQGMLPVCPLIPGSSTTSTGPCRTCMTTAQGTSMYPSCCCTKPSDGNCTCIPIPSSWAFGKFLWEWASARFSWLSLLVPFVQWFVGLSPTVWLSVIWMMWYWGPSLYSILSPFLPLLPIFFCLWVYI(配列番号372)。

「HbsAgポリヌクレオチド」とは、HBsAgタンパク質をコードするポリヌクレオチドを意味する。

「HBV Xタンパク質」または「HBVタンパク質X」とは、HBVウイルス感染症において機能するNCBI受託番号AAB59970.1と少なくとも約85%の同一性を有するポリペプチドまたはその断片を意味する。例示的なアミノ酸配列を以下に提供する:
MAARLCCQLDPARDVLCLRPVGAESCGRPFSGSLGTLSSPSPSAVPTDHGAHLSLRGLPVCAFSSAGPCALRFTSARRMETTVNAHRMLPKVLHKRTLGLSAMSTTDLEAYFKDCLFKDWEELGEEIRLKVFVLGGCRHKLVCAPAPCNFFTSA(配列番号373)。

「コア抗原前駆体」、「precoreタンパク質」、または「B型肝炎e抗原(HBeAg)」とは、HBVウイルス感染において機能するNCBI受託番号AAB59971.1と少なくとも約85%の同一性を有するポリペプチドまたはその断片を意味する。
MQLFHLCLIISCSCPTVQASKLCLGWLWGMDIDPYKEFGATVELLSFLPSDFFPSVRDLLDTASALYREALESPEHCSPHHTALRQAILCWGELMTLATWVGVNLEDPASRDLVVSYVNTNMGLKFRQLLWFHISCLTFGRETVIEYLVSFGVWIRTPPAYRPPNAPILSTLPETTVVRRRGRSPRRRTPSPRRRRSQSPRRRRSQSREPQC(配列番号10831)。

「HBVコアタンパク質」、「HBc」、または「コアタンパク質」とは、野生型HBVコアタンパク質のアミノ酸配列またはその断片と少なくとも約95%の同一性を有するポリペプチドを意味する。一実施形態では、HBVコアタンパク質は、B型肝炎ウイルス感染症において機能する。一実施形態では、HBVコアタンパク質は、HBV A、B、C、D、E、F、G、またはH遺伝子型によってコードされる。一実施形態では、HBVコアタンパク質アミノ酸配列は、NCBI GenBank受託番号AXG50928.1で提供され、以下に提供される:
MDIDPYKEFGASVELLSFLPSDFFPSIRDLLDTASALYREALESPEHCSPHHTALRQAILCWGELMNLATWVGSNLEDPASRELVVSYVNVNMGLKIRQLLWFHISCLTFGRETVLEYLVSFGVWIRTPPAYRPPNAPILSTLPETTVVRRRGRSPRRRTPSPRRRRSQSPRRRRSQSRESQC(配列番号374)。「HBV Xタンパク質」とは、HBV Xタンパク質をコードするポリヌクレオチドを意味する。

「HBV Xタンパク質(遺伝子型B)」とは、野生型HBV遺伝子型B Xタンパク質のアミノ酸配列またはその断片と少なくとも約95%の同一性を有するポリペプチドを意味する。一実施形態では、HBV Xタンパク質は、B型肝炎ウイルス感染症において機能する。一実施形態では、HBV遺伝子型B Xタンパク質アミノ酸配列は、NCBI GenBank受託番号BAQ95575.1で提供され、以下に提供される:
MAARLCCQLDPARDVLCLRPVGAESRGRPLPGPLGALPPASPPVVPSDHGAHLSLRGLPVCAFSSXGPCALRFTSARRMETTVNAHRNLPKVLHKRTLGLSAMSTTDLEAYFKDCVFXEWEELGEEXRLKVFVLGGCRHKLVCSPAPCNFFTSA(配列番号375)。

「HBV Xタンパク質(遺伝子型C)」とは、野生型HBV遺伝子型C Xタンパク質のアミノ酸配列またはその断片と少なくとも約95%の同一性を有するポリペプチドを意味する。一実施形態では、HBV Xタンパク質は、B型肝炎ウイルス感染症において機能する。一実施形態では、HBV遺伝子型C Xタンパク質アミノ酸配列は、NCBI GenBank受託番号BAQ95563.1で提供され、以下に提供される:
MAARVCCQLDPARDVLCLRPVGAESRGRPVSGPFGPLPSPSSSAVPADYGAHLSLRGLPVCAFSSAGPCALRFTSARRMETTVNAHQVLPKLLHKRTLGLSAMSTTDLEAYFKDCLFKDWEELGEEIRLKVFVLGGCRHKLVCSPAPCNFFTSA(配列番号376)。

「HBV Sタンパク質」とは、野生型HBV Sタンパク質アミノ酸配列またはその断片と少なくとも約95%の同一性を有するポリペプチドを意味する。一実施形態では、HBV Sタンパク質は、B型肝炎ウイルス感染症において機能する。一実施形態では、HBV Sタンパク質は、HBV A、B、C、D、E、F、G、またはH遺伝子型によってコードされる。一実施形態では、HBV Sタンパク質アミノ酸配列は、NCBI GenBank受託番号ABV02793.1で提供され、以下に提供される:
MENTTSGFLGPLLVLQAGFFLLTRNLTIPQSLDSWWTSLNFLGGAPTCPGQNSQSPTSNHSPTSCPPICPGYRWMCLRRFIIFLFILLLCLIFLLVLLDYQGMLPVCPLLPGTSTTSTGPCKTCTIPAQGTSMFPSCCCTKPSDGNCTCIPIPSSWAFARFLWEWASVRFSWLSLLVPFVQWFVGLSPTVWLSVIWMMWYWGPSLYNILSPFLPLLPIFFCLWVYI(配列番号377)。

HBVポリメラーゼ、HBsAgタンパク質、HBV Xタンパク質、及びコア抗原前駆体をコードするポリヌクレオチドを含むB型肝炎ウイルスサブタイプayw(完全ゲノム)の完全ゲノムは、GenBank受託番号U95551.1で提供され、以下に再現される。B型肝炎ウイルスゲノム内の調節エレメント(例えば、エンハンサーI、エンハンサーIIボックスA、HBXプロモーター)及びポリペプチドをコードする配列に対応する領域のヌクレオチド位置は、当該技術分野において既知である(例えば、Panjaworayan,et al.“HBVRegDB:Annotation,comparison,detection and visualization of regulatory elements in hepatitis B virus sequences,”Virol.J.,4:136,DOI:10.1186/1743-422X-4-136を参照されたい)。
AATTCCACAACCTTTCACCAAACTCTGCAAGATCCCAGAGTGAGAGGCCTGTATTTCCCTGCTGGTGGCTCCAGTTCAGGAGCAGTAAACCCTGTTCCGACTACTGCCTCTCCCTTATCGTCAATCTTCTCGAGGATTGGGGACCCTGCGCTGAACATGGAGAACATCACATCAGGATTCCTAGGACCCCTTCTCGTGTTACAGGCGGGGTTTTTCTTGTTGACAAGAATCCTCACAATACCGCAGAGTCTAGACTCGTGGTGGACTTCTCTCAATTTTCTAGGGGGAACTACCGTGTGTCTTGGCCAAAATTCGCAGTCCCCAACCTCCAATCACTCACCAACCTCCTGTCCTCCAACTTGTCCTGGTTATCGCTGGATGTGTCTGCGGCGTTTTATCATCTTCCTCTTCATCCTGCTGCTATGCCTCATCTTCTTGTTGGTTCTTCTGGACTATCAAGGTATGTTGCCCGTTTGTCCTCTAATTCCAGGATCCTCAACCACCAGCACGGGACCATGCCGAACCTGCATGACTACTGCTCAAGGAACCTCTATGTATCCCTCCTGTTGCTGTACCAAACCTTCGGACGGAAATTGCACCTGTATTCCCATCCCATCATCCTGGGCTTTCGGAAAATTCCTATGGGAGTGGGCCTCAGCCCGTTTCTCCTGGCTCAGTTTACTAGTGCCATTTGTTCAGTGGTTCGTAGGGCTTTCCCCCACTGTTTGGCTTTCAGTTATATGGATGATGTGGTATTGGGGGCCAAGTCTGTACAGCATCTTGAGTCCCTTTTTACCGCTGTTACCAATTTTCTTTTGTCTTTGGGTATACATTTAAACCCTAACAAAACAAAGAGATGGGGTTACTCTCTGAATTTTATGGGTTATGTCATTGGAAGTTATGGGTCCTTGCCACAAGAACACATCATACAAAAAATCAAAGAATGTTTTAGAAAACTTCCTATTAACAGGCCTATTGATTGGAAAGTATGTCAACGAATTGTGGGTCTTTTGGGTTTTGCTGCCCCATTTACACAATGTGGTTATCCTGCGTTAATGCCCTTGTATGCATGTATTCAATCTAAGCAGGCTTTCACTTTCTCGCCAACTTACAAGGCCTTTCTGTGTAAACAATACCTGAACCTTTACCCCGTTGCCCGGCAACGGCCAGGTCTGTGCCAAGTGTTTGCTGACGCAACCCCCACTGGCTGGGGCTTGGTCATGGGCCATCAGCGCGTGCGTGGAACCTTTTCGGCTCCTCTGCCGATCCATACTGCGGAACTCCTAGCCGCTTGTTTTGCTCGCAGCAGGTCTGGAGCAAACATTATCGGGACTGATAACTCTGTTGTCCTCTCCCGCAAATATACATCGTATCCATGGCTGCTAGGCTGTGCTGCCAACTGGATCCTGCGCGGGACGTCCTTTGTTTACGTCCCGTCGGCGCTGAATCCTGCGGACGACCCTTCTCGGGGTCGCTTGGGACTCTCTCGTCCCCTTCTCCGTCTGCCGTTCCGACCGACCACGGGGCGCACCTCTCTTTACGCGGACTCCCCGTCTGTGCCTTCTCATCTGCCGGACCGTGTGCACTTCGCTTCACCTCTGCACGTCGCATGGAGACCACCGTGAACGCCCACCGAATGTTGCCCAAGGTCTTACATAAGAGGACTCTTGGACTCTCTGCAATGTCAACGACCGACCTTGAGGCATACTTCAAAGACTGTTTGTTTAAAGACTGGGAGGAGTTGGGGGAGGAGATTAGATTAAAGGTCTTTGTACTAGGAGGCTGTAGGCATAAATTGGTCTGCGCACCAGCACCATGCAACTTTTTCACCTCTGCCTAATCATCTCTTGTTCATGTCCTACTGTTCAAGCCTCCAAGCTGTGCCTTGGGTGGCTTTGGGGCATGGACATCGACCCTTATAAAGAATTTGGAGCTACTGTGGAGTTACTCTCGTTTTTGCCTTCTGACTTCTTTCCTTCAGTACGAGATCTTCTAGATACCGCCTCAGCTCTGTATCGGGAAGCCTTAGAGTCTCCTGAGCATTGTTCACCTCACCATACTGCACTCAGGCAAGCAATTCTTTGCTGGGGGGAACTAATGACTCTAGCTACCTGGGTGGGTGTTAATTTGGAAGATCCAGCATCTAGAGACCTAGTAGTCAGTTATGTCAACACTAATATGGGCCTAAAGTTCAGGCAACTCTTGTGGTTTCACATTTCTTGTCTCACTTTTGGAAGAGAAACCGTTATAGAGTATTTGGTGTCTTTCGGAGTGTGGATTCGCACTCCTCCAGCTTATAGACCACCAAATGCCCCTATCCTATCAACACTTCCGGAAACTACTGTTGTTAGACGACGAGGCAGGTCCCCTAGAAGAAGAACTCCCTCGCCTCGCAGACGAAGGTCTCAATCGCCGCGTCGCAGAAGATCTCAATCTCGGGAACCTCAATGTTAGTATTCCTTGGACTCATAAGGTGGGGAACTTTACTGGTCTTTATTCTTCTACTGTACCTGTCTTTAATCCTCATTGGAAAACACCATCTTTTCCTAATATACATTTACACCAAGACATTATCAAAAAATGTGAACAGTTTGTAGGCCCACTTACAGTTAATGAGAAAAGAAGATTGCAATTGATTATGCCTGCTAGGTTTTATCCAAAGGTTACCAAATATTTACCATTGGATAAGGGTATTAAACCTTATTATCCAGAACATCTAGTTAATCATTACTTCCAAACTAGACACTATTTACACACTCTATGGAAGGCGGGTATATTATATAAGAGAGAAACAACACATAGCGCCTCATTTTGTGGGTCACCATATTCTTGGGAACAAGATCTACAGCATGGGGCAGAATCTTTCCACCAGCAATCCTCTGGGATTCTTTCCCGACCACCAGTTGGATCCAGCCTTCAGAGCAAACACAGCAAATCCAGATTGGGACTTCAATCCCAACAAGGACACCTGGCCAGACGCCAACAAGGTAGGAGCTGGAGCATTCGGGCTGGGTTTCACCCCACCGCACGGAGGCCTTTTGGGGTGGAGCCCTCAGGCTCAGGGCATACTACAAACTTTGCCAGCAAATCCGCCTCCTGCCTCCACCAATCGCCAGACAGGAAGGCAGCCTACCCCGCTGTCTCCACCTTTGAGAAACACTCATCCTCAGGCCATGCAGTGG(配列番号378)。

「アデニン」または「9H-プリン-6-アミン」とは、分子式C₅H₅N₅を有し、構造

を有し、CAS番号73-24-5に対応するプリン核酸塩基を意味する。

「アデノシン」または「4-アミノ-1-[(2R,3R,4S,5R)-3,4-ジヒドロキシ-5-(ヒドロキシメチル)オキソラン-2-イル]ピリミジン-2(1H)-オン」とは、グリコシド結合を介してリボース糖に結合しており、構造

を有し、CAS番号65-46-3に対応するアデニン分子を意味する。その分子式は、C₁₀H₁₃N₅O₄である。

「アデノシンデアミナーゼ」または「アデニンデアミナーゼ」とは、アデニンまたはアデノシンの加水分解的な脱アミノ化を触媒することができるポリペプチドまたはその断片を意味する。一部の実施形態では、デアミナーゼまたはデアミナーゼドメインは、アデノシンからイノシンへの、またはデオキシアデノシンからデオキシイノシンへの加水分解的な脱アミノ化を触媒するアデノシンデアミナーゼである。一部の実施形態では、アデノシンデアミナーゼは、デオキシリボ核酸(DNA)中のアデニンまたはアデノシンの加水分解的な脱アミノ化を触媒する。本明細書で提供されるアデノシンデアミナーゼ(例えば、改変されたアデノシンデアミナーゼ、進化したアデノシンデアミナーゼ)は、任意の生物(例えば、真核生物、原核生物)に由来し得、これには、藻類、細菌、菌類、植物、無脊椎動物(例えば、昆虫)、脊椎動物(例えば、両生類、哺乳類)が含まれるが、これらに限定されない。一部の実施形態では、アデノシンデアミナーゼは、1つ以上の改変を有するアデノシンデアミナーゼバリアントであり、標的ポリヌクレオチド(例えば、DNA、RNA)中のアデニン及びシトシンの両方を脱アミノ化することができる。一部の実施形態では、標的ポリヌクレオチドは、一本鎖または二本鎖である。一部の実施形態では、アデノシンデアミナーゼバリアントは、DNA中のアデニン及びシトシンの両方を脱アミノ化することができる。一部の実施形態では、アデノシンデアミナーゼバリアントは、一本鎖DNA中のアデニン及びシトシンの両方を脱アミノ化することができる。一部の実施形態では、アデノシンデアミナーゼバリアントは、RNA中のアデニン及びシトシンの両方を脱アミノ化することができる。

「アデノシンデアミナーゼ活性」とは、ポリヌクレオチドにおけるアデニンまたはアデノシンのグアニンへの脱アミノ化を触媒することを意味する。一部の実施形態では、本明細書で提供されるアデノシンデアミナーゼバリアントは、アデノシンデアミナーゼ活性を維持している(例えば、参照アデノシンデアミナーゼ(例えば、TadA*8.20またはTadA*8.19)の活性の少なくとも約30%、40%、50%、60%、70%、80%、90%、またはそれ以上)。

「アデノシン塩基エディター(ABE)」とは、アデノシンデアミナーゼを含む塩基エディターを意味する。

「アデノシン塩基エディター(ABE)ポリヌクレオチド」とは、ABEをコードするポリヌクレオチドを意味する。「アデノシンデアミナーゼ塩基エディター8(ABE8)ポリペプチド」または「ABE8」とは、アデノシンデアミナーゼバリアントを含む、本明細書で定義される塩基エディターを意味し、アデノシンデアミナーゼバリアントは、表15に列挙される改変のうちの1つ以上、表15に列挙される改変の組み合わせのうちの1つ、または表15に列挙される部位のうちの1つ以上での改変(例えば、82及び/または166)を含み、このような改変は、以下の参照配列に対するものである:MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPRQVFNAQKKAQSSTD(配列番号1)。

一部の実施形態では、ABE8は、参照配列に対して、本明細書に記載するように、更なる改変を含む。

「アデノシンデアミナーゼ塩基エディター8(ABE8)ポリヌクレオチド」とは、ABE8をコードするポリヌクレオチドを意味する。

「投与すること」は、本明細書に記載の1つ以上の組成物を患者または対象に提供することとして、本明細書中では言及される。

「薬剤」とは、任意の小分子化学化合物、抗体、核酸分子、もしくはポリペプチド、またはその断片を意味する。

「改変」とは、当該技術分野で既知の標準的な方法、例えば、本明細書に記載の方法によって検出される、分析物、遺伝子またはポリペプチドのレベル、構造または活性における変化(増加または低下)を意味する。本明細書で使用される場合、改変には、発現レベルにおける10%の変化、発現レベルにおける25%の変化、40%の変化及び50%以上の変化が含まれる。一部の実施形態では、改変は、核酸塩基またはアミノ酸の挿入、欠失または置換を含む。

「寛解する」は、疾患の発症または進行を、低下、抑制、減弱化、減少、抑止、または安定化することを意味する。

「類似体」とは、同一ではないが類似した機能的または構造的特徴を有する分子を意味する。例えば、ポリペプチド類似体は、対応する天然に存在するポリペプチドの生物活性を保持する一方で、類似体の機能を天然に存在するポリペプチドに対して高める特定の生化学的修飾を有する。そのような生化学的修飾は、類似体のプロテアーゼ耐性、膜透過性または半減期を、例えば、リガンド結合を改変させることなく増加させ得る。類似体は、非天然のアミノ酸を含んでいてもよい。

「塩基エディター(BE)」または「核酸塩基エディターポリペプチド(NBE)」とは、ポリヌクレオチドに結合し、核酸塩基修飾活性を有する薬剤を意味する。様々な実施形態では、塩基エディターは、核酸塩基修飾ポリペプチド(例えば、デアミナーゼ)及びガイドポリヌクレオチド(例えば、ガイドRNA(gRNA))と組み合わせたポリヌクレオチドプログラマブルヌクレオチド結合ドメイン(例えば、Cas9またはCpf1)を含む。塩基エディターの代表的な核酸及びタンパク質配列は、配列表で配列番号2～11として提供される。

「塩基編集活性」とは、ポリヌクレオチド内の塩基を化学的に改変させるように作用することを意味する。一実施形態では、第1の塩基を、第2の塩基に変換する。一実施形態では、塩基編集活性は、シチジンデアミナーゼ活性、例えば、標的C・GからT・Aへの変換である。別の実施形態では、塩基編集活性は、アデノシンまたはアデニンデアミナーゼ活性、例えば、A・TからG・Cへの変換である。

「塩基エディターシステム」という用語は、標的ヌクレオチド配列の核酸塩基を編集するための分子間複合体を指す。様々な実施形態では、塩基エディター(BE)システムは、(1)標的ヌクレオチド配列中の核酸塩基を脱アミノ化するための、ポリヌクレオチドプログラマブルヌクレオチド結合ドメイン、デアミナーゼドメイン(例えば、シチジンデアミナーゼまたはアデノシンデアミナーゼ)、ならびに(2)ポリヌクレオチドプログラマブルヌクレオチド結合ドメインと組み合わせた1つ以上のガイドポリヌクレオチド(例えば、ガイドRNA)を含む。様々な実施形態では、塩基エディター(BE)システムは、アデノシンデアミナーゼまたはシチジンデアミナーゼから選択される核酸塩基エディタードメイン、及び核酸配列特異的結合活性を有するドメインを含む。一部の実施形態では、塩基エディターシステムは、(1)標的ヌクレオチド配列中の1つ以上の核酸塩基を脱アミノ化するための、ポリヌクレオチドプログラマブルDNA結合ドメイン及びデアミナーゼドメインを含む塩基エディター(BE)、ならびに(2)ポリヌクレオチドプログラマブルDNA結合ドメインと組み合わせた1つ以上のガイドRNAを含む。一部の実施形態では、ポリヌクレオチドプログラマブルヌクレオチド結合ドメインは、ポリヌクレオチドプログラマブルDNA結合ドメインである。一部の実施形態では、塩基エディターは、シチジン塩基エディター(CBE)である。一部の実施形態では、塩基エディターは、アデニンまたはアデノシン塩基エディター(ABE)である。一部の実施形態では、塩基エディターは、アデニンまたはアデノシン塩基エディター(ABE)またはシチジン塩基エディター(CBE)である。

「塩基編集活性」とは、ポリヌクレオチド内の塩基を化学的に改変させるように作用することを意味する。一実施形態では、第1の塩基を、第2の塩基に変換する。一実施形態では、塩基編集活性は、シチジンデアミナーゼ活性、例えば、標的C・GからT・Aへの変換である。別の実施形態では、塩基編集活性は、アデノシンデアミナーゼ活性、例えば、A・TからG・Cへの変換である。

「Cas9」または「Cas9ドメイン」という用語は、Cas9タンパク質またはその断片(例えば、Cas9の活性、不活性、もしくは部分的に活性なDNA切断ドメイン、及び/またはCas9のgRNA結合ドメインを含む、タンパク質)を含む、RNAガイドヌクレアーゼを指す。Cas9ヌクレアーゼは、casnlヌクレアーゼまたはCRISPR(クラスター化して規則的な配置の短い回文配列リピート)関連ヌクレアーゼと呼ばれることもある。

「保存的アミノ酸置換」または「保存的変異」という用語は、あるアミノ酸が、共通の特性を有する別のアミノ酸に置換されることを指す。個々のアミノ酸間の共通の特性を定義する機能的な方法は、相同生物の対応するタンパク質間のアミノ酸変化の正規化された頻度を分析することである(Schulz,G.E.and Schirmer,R.H.,Principles of Protein Structure,Springer-Verlag,New York(1979))。そのような分析によれば、アミノ酸のグループは、グループ内のアミノ酸が互いに優先的に交換される場合に定義することができ、したがって、全体的なタンパク質構造への影響が互いに最も類似している(Schulz,G.E.and Schirmer,R.H.、上記)。保存的変異の非限定的な例として、アミノ酸置換、例えば、正電荷を維持することができるような、アルギニンからリジンへのアミノ酸置換、及びその逆、負電荷を維持することができるように、アスパラギン酸からグルタミン酸へ、及びその逆、遊離-OHを維持することができるように、スレオニンからセリンへ、ならびに遊離-NH2を維持することができるような、アスパラギンからグルタミンへの置換が挙げられる。

本明細書で互換的に使用される「コード配列」または「タンパク質コード配列」という用語は、タンパク質をコードするポリヌクレオチドのセグメントを指す。コード配列は、オープンリーディングフレームとも呼ばれ得る。領域または配列は、開始コドンによって5’末端の近位に、そして終止コドンによって3’末端の近位に境界付けられている。本明細書に記載の塩基エディターで有用な終止コドンとして、以下が挙げられる:

「複合体」とは、相互作用が分子間力に依存する2つ以上の分子の組み合わせを意味する。分子間力の非限定的な例としては、共有結合性相互作用及び非共有結合性相互作用が挙げられる。非共有結合性相互作用の非限定的な例としては、水素結合、イオン結合、ハロゲン結合、疎水性結合、ファンデルワールス相互作用(例えば、双極子間相互作用、双極子誘起双極子相互作用、及びロンドン分散力)、ならびにπ効果が挙げられる。一実施形態では、複合体は、ポリペプチド、ポリヌクレオチド、または1つ以上のポリペプチドと1つ以上のポリヌクレオチドの組み合わせを含む。一実施形態では、複合体は、会合して塩基エディター(例えば、Cas9などの核酸プログラマブルDNA結合タンパク質、及びデアミナーゼを含む塩基エディター)及びポリヌクレオチド(例えば、ガイドRNA)を形成する1つ以上のポリペプチドを含む。一実施形態では、複合体は、水素結合によって一緒に保持される。塩基エディターの1つ以上の成分(例えば、デアミナーゼ、または核酸プログラマブルDNA結合タンパク質)は、共有結合または非共有結合で会合し得ることを理解されたい。一例として、塩基エディターは、(例えば、ペプチド結合により)核酸プログラマブルDNA結合タンパク質に共有結合したデアミナーゼを含み得る。代替として、塩基エディターは、非共有結合的に会合するデアミナーゼ及び核酸プログラマブルDNA結合タンパク質を含み得る(例えば、塩基エディターの1つ以上の成分がトランスで供給され、直接またはタンパク質もしくは核酸などの別の分子を介して会合する場合)。一実施形態では、複合体の1つ以上の成分は、水素結合によって一緒に保持される。

「シトシン」または「4-アミノピリミジン-2(1H)-オン」とは、分子式C₄H₅N₃Oを有し、構造

を有し、CAS番号71-30-7に対応するプリン核酸塩基を意味する。

「シチジン」とは、グリコシド結合を介してリボース糖に結合しており、構造

を有し、CAS番号65-46-3に対応するシトシン分子を意味する。その分子式は、C₉H₁₃N₃O₅である。

「シチジン塩基エディター(CBE)」とは、シチジンデアミナーゼを含む塩基エディターを意味する。

「シチジン塩基エディター(CBE)ポリヌクレオチド」とは、CBEを含むポリヌクレオチドを意味する。

「シチジンデアミナーゼ」または「シトシンデアミナーゼ」とは、シチジンまたはシトシンを脱アミノ化することができるポリペプチドまたはその断片を意味する。一実施形態では、シチジンデアミナーゼは、シトシンをウラシルに、または5-メチルシトシンをチミンに変換する。「シチジンデアミナーゼ」及び「シトシンデアミナーゼ」という用語は、本出願全体を通じて同じ意味で使用される。Petromyzon marinusシトシンデアミナーゼ1(PmCDA1)(配列番号13～14)、活性化誘導性シチジンデアミナーゼ(AICDA)(配列番号15～21)及びAPOBEC(配列番号12～61)は、例示的なシチジンデアミナーゼである。更に例示的なシチジンデアミナーゼ(CDA)配列を、配列番号62～66及び配列番号67～189として配列表に示す。実施形態では、シチジンデアミナーゼは、BE4、rrA3F、またはppApoである。

「rra3Fポリペプチド」とは、シチジンデアミナーゼ活性を有し、以下の配列と約85%、90%、95%、99%、もしくは100%または少なくとも約85%、90%、95%、99%、もしくは100%の配列同一性を有するアミノ酸配列を有するシチジンデアミナーゼを意味する:
MKPQIRDHRPNPMEAMYPHIFYFHFENLEKAYGRNETWLCFTVEIIKQYLPVPWKKGVFRNQVDPETHCHAEKCFLSWFCNNTLSPKKNYQVTWYTSWSPCPECAGEVAEFLAEHSNVKLTIYTARLYYFWDTDYQEGLRSLSEEGASVEIMDYEDFQYCWENFVYDDGEPFKRWKGLKYNFQSLTRRLREILQ(配列番号67)。

「ppAPOBEC-1(ppApo)」とは、シチジンデアミナーゼ活性を有し、以下の配列と約85%、90%、95%、99%、もしくは100%または少なくとも約85%、90%、95%、99%、もしくは100%の配列同一性を有するアミノ酸配列を有するシチジンデアミナーゼを意味する:
MTSEKGPSTGDPTLRRRIESWEFDVFYDPRELRKETCLLYEIKWGMSRKIWRSSGKNTTNHVEVNFIKKFTSERRFHSSISCSITWFLSWSPCWECSQAIREFLSQHPGVTLVIYVARLFWHMDQRNRQGLRDLVNSGVTIQIMRASEYYHCWRNFVNYPPGDEAHWPQYPPLWMMLYALELHCIILSLPPCLKISRRWQNHLAFFRLHLQNCHYQTIPPHILLATGLIHPSVTWR(配列番号23)。

「シトシン」とは、分子式C₄H₅N₃Oを有するピリミジン核酸塩基を意味する。

「シトシンデアミナーゼ活性」とは、シトシンまたはシチジンの脱アミノ化を触媒することを意味する。一実施形態では、シトシンデアミナーゼ活性を有するポリペプチドは、アミノ基をカルボニル基に変換する。一実施形態では、シトシンデアミナーゼは、シトシンをウラシルに(すなわち、CからUに)変換するか、または5-メチルシトシンをチミンに(すなわち、5mCからTに)変換する。一部の実施形態では、本明細書で提供されるシトシンデアミナーゼは、参照シトシンデアミナーゼに対して、高いシトシンデアミナーゼ活性(例えば、少なくとも10倍、20倍、30倍、40倍、50倍、60倍、70倍、80倍、90倍、100倍、またはそれ以上)を有する。

本明細書で使用される場合、「デアミナーゼ」または「デアミナーゼドメイン」という用語は、脱アミノ化反応を触媒するタンパク質またはその断片を指す。

「検出」とは、検出される分析物の存在、非存在、または量を同定することを指す。一実施形態では、ポリヌクレオチドまたはポリペプチドにおける配列改変が検出される。別の実施形態では、インデルの存在が検出される。

「検出可能な標識」とは、目的の分子に連結した場合に、分光学的、光化学的、生化学的、免疫化学的、または化学的手段を介して、目的の分子を検出可能にする組成物を意味する。例えば、有用な標識として、放射性同位元素、磁気ビーズ、金属ビーズ、コロイド粒子、蛍光色素、高電子密度試薬、酵素(例えば、酵素結合免疫吸着測定法(ELISA)で一般的に使用される酵素)、ビオチン、ジゴキシゲニンまたはハプテンが挙げられる。

「疾患」とは、細胞、組織、または器官の正常な機能を損傷または妨害するあらゆる病態または障害を意味する。疾患の例としては、HBV感染症、ならびに肝硬変、肝細胞癌(HCC)、及びHBV感染症に関連する、またはそれに起因する任意の他の疾患を含む関連疾患及び障害が挙げられる。

「有効量」とは、未治療の患者と比較して、疾患の症状を緩和するために必要とされる量を意味する。疾患の治療的処置のために本発明を実施するために使用される活性化合物(複数可)の有効量は、投与様式、対象の年齢、体重、及び一般的健康によって異なる。最終的には、担当医師または獣医が適切な量及び投薬レジメンを決定するだろう。そのような量は、「有効」量と呼ばれる。一実施形態では、有効量は、細胞(例えば、インビトロまたはインビボの細胞)内のHBVゲノムにおける改変を導入するのに十分である、本発明の塩基エディターの量である。一実施形態では、有効量は、治療効果を達成するために(例えば、HBV感染症を低減または制御するために)必要とされる塩基エディターの量である。そのような治療効果は、対象、組織または臓器の全ての細胞内のHBVゲノムを改変するのに十分である必要はなく、対象、組織または臓器に存在する約1%、5%、10%、25%、50%、75%またはそれ以上の細胞内のHBVゲノムを改変するのに十分であればよい。一実施形態では、有効量は、HBVの1つ以上の症状を寛解させるのに十分である。

「エンテカビル」とは、CAS番号142217-69-4に対応する構造

を有する分子、及びその薬学的に許容される塩を意味する。エンテカビルは、抗レトロウイルス活性を有する。

「断片」とは、ポリペプチドまたは核酸分子の一部分を意味する。この部分は、参照核酸分子またはポリペプチドの全長の少なくとも約10%、20%、30%、40%、50%、60%、70%、80%、または90%を含有する。断片は、10、20、30、40、50、60、70、80、90、または100、200、300、400、500、600、700、800、900、または1000個のヌクレオチドまたはアミノ酸を含有し得る。

「ガイドポリヌクレオチド」とは、標的配列に特異的であり、ポリヌクレオチドプログラマブルヌクレオチド結合ドメインタンパク質(例えば、Cas9またはCpf1)と複合体を形成することができるポリヌクレオチドまたはポリヌクレオチド複合体を意味する。一実施形態では、ガイドポリヌクレオチドは、ガイドRNA(gRNA)である。gRNAは、2つ以上のRNAの複合体として、または単一RNA分子として存在し得る。

「ハイブリダイゼーション」とは水素結合を意味し、それは、相補的な核酸塩基間のワトソン・クリック型、フーグスティーン型、または逆フーグスティーン型の水素結合であってもよい。例えば、アデニンとチミンは、水素結合の形成を通じて対になる相補的な核酸塩基である。

「増加」とは、少なくとも10%、25%、50%、75%、または100%の正の変化を意味する。

「塩基修復の阻害剤」、「塩基修復阻害剤」、「IBR」という用語またはそれらの文法的均等物は、核酸修復酵素、例えば、塩基除去修復酵素の活性を阻害することが可能であるタンパク質を指す。

「インテイン」は、タンパク質スプライシングとして知られているプロセスにおいて、自身を切除し、残りの断片(エクステイン)をペプチド結合で連結することができるタンパク質の断片である。

「単離された」、「精製された」、または「生物学的に純粋な」という用語は、天然状態で見出されるような通常それに付随する成分を、異なる程度で含まない材料を指す。「単離する」とは、元の供給源または周囲からの分離の程度を示す。「精製する」とは、単離よりも高い分離度を示す。「精製された」または「生物学的に純粋な」タンパク質は、他の物質を十分に含まないため、いかなる不純物もタンパク質の生物学的特性に実質的に影響を与えたり、他の有害事象を引き起こしたりしない。すなわち、本発明の核酸またはペプチドは、組換えDNA技術によって生成された場合は、細胞性物質、ウイルス性物質、もしくは培養培地を実質的に含んでいなければ精製され、または化学的に合成された場合は、化学前駆体もしくは他の化学物質を実質的に含んでいなければ精製される。純度及び均質性は、通常、分析化学技法、例えば、ポリアクリルアミドゲル電気泳動または高速液体クロマトグラフィーを使用して決定される。「精製された」という用語は、核酸またはタンパク質が、電気泳動ゲルにおいて本質的に1つのバンドを生じさせることを示し得る。例えば、リン酸化またはグリコシル化などの修飾に供され得るタンパク質の場合、異なる修飾は、別々に精製することができる異なる単離されたタンパク質を生じさせ得る。

「単離されたポリヌクレオチド」は、本発明の核酸分子が由来する生物の天然に存在するゲノムにおいて、遺伝子に隣接する遺伝子を含まない核酸(例えば、DNA)を意味する。したがって、この用語は、例えば、ベクター、自律的に複製するプラスミドもしくはウイルス、または原核生物もしくは真核生物のゲノムDNAに組み込まれる組換えDNA、または他の配列とは独立して別個の分子(例えば、cDNA、またはPCRもしくは制限エンドヌクレアーゼ消化によって産生されたゲノムもしくはcDNA断片)として存在する組換えDNAを含む。加えて、この用語は、DNA分子から転写されるRNA分子、ならびに追加のポリペプチド配列をコードするハイブリッド遺伝子の一部である組換えDNAを含む。

「単離されたポリペプチド」とは、それに天然に付随する成分から分離された、本発明のポリペプチドを意味する。一般的には、ポリペプチドは、それが少なくとも60重量%であり、タンパク質及びそれが天然に関連する天然に存在する有機分子を含まない場合に、単離されている。好ましくは、調製物は、本発明のポリペプチドが、少なくとも75重量%、より好ましくは、少なくとも90重量%、最も好ましくは、少なくとも99重量%である。本発明の単離されたポリペプチドを、例えば、天然の供給源からの抽出によって、そのようなポリペプチドをコードする組換え核酸の発現によって、またはそのタンパク質を化学的に合成することによって、取得することができる。純度は、任意の適切な方法、例えば、カラムクロマトグラフィー、ポリアクリルアミドゲル電気泳動、またはHPLC分析によって測定することができる。

「ラミブジン」または「3TC」とは、CAS番号134678-17-4に対応し、IUPAC名2’,3’-ジデオキシ-3’-チアシチジン4-アミノ-1-[(2R,5S)-2-(ヒドロキシメチル)-1,3-オキサチオラン-5-イル]-1,2-ジヒドロピリミジン-2-オン、及びその薬学的に許容される塩を有する構造

を有する分子を意味する。ラミブジンは、抗レトロウイルス活性を有する。ラミブジンは、ヌクレオシド/ヌクレオチド逆転写酵素阻害剤(NRTI)として分類される。

本明細書で使用される場合、「リンカー」という用語は、2つの部分を連結する分子を指す。実施形態では、「リンカー」という用語は、共有結合リンカー(例えば、共有結合)または非共有結合リンカーを指す。

「マーカー」とは、疾患または障害に関連する発現レベルまたは活性の変化を有する任意のタンパク質またはポリヌクレオチドを意味する。疾患の例としては、HBV感染症、ならびに肝硬変、肝細胞癌(HCC)、及びHBV感染症に関連する、またはそれに起因する任意の他の疾患を含む関連疾患及び障害が挙げられる。マーカーは、HBVポリヌクレオチド及び/またはポリペプチドであり得る。B型肝炎ウイルスマーカーの非限定的な例としては、HBsAg、HBeAg、コアタンパク質、3.5kbウイルスRNA、及びcccDNAが挙げられる(例えば、Bai,et al.“Quantification of Pregenomic RNA and Covalently Closed Circular DNA in Hepatitis B Virus-Related Hepatocellular Carcinoma,”Int J Hepatol,2013:849290(2013),DOI:10.1155/2013/849290を参照されたい)。

本明細書で使用される場合、「変異」という用語は、配列内の残基、例えば、核酸またはアミノ酸配列の別の残基による置換、または配列内の1つ以上の残基の欠失または挿入を指す。変異は、通常、元の残基を明らかにし、続いて配列内の残基の位置を明らかにし、そして新たに置換された残基を明らかにすることによって、本明細書に記載される。本明細書中で提供されるアミノ酸置換(変異)を行うための様々な方法は、当該技術分野で周知であり、例えば、Green and Sambrook,Molecular Cloning:A Laboratory Manual(4^th ed.,Cold Spring Harbor Laboratory Press,Cold Spring Harbor,N.Y.(2012))に提供されている。

本明細書で使用される場合、「核酸」及び「核酸分子」という用語は、核酸塩基及び酸性部分を含む化合物、例えば、ヌクレオシド、ヌクレオチド、またはヌクレオチドの重合体を指す。通常、高分子核酸、例えば、3つ以上のヌクレオチドを含む核酸分子は、直鎖状分子であり、隣接するヌクレオチドがホスホジエステル結合を介して互いに連結されている。一部の実施形態では、「核酸」は、個々の核酸残基(例えば、ヌクレオチド及び/またはヌクレオシド)を指す。一部の実施形態では、「核酸」は、3つ以上の個々のヌクレオチド残基を含むオリゴヌクレオチド鎖を指す。本明細書で使用される場合、「オリゴヌクレオチド」及び「ポリヌクレオチド」という用語は、ヌクレオチドの重合体(例えば、少なくとも3つのヌクレオチドのストリング)を指すために同じ意味で用いられ得る。一部の実施形態では、「核酸」は、RNAならびに一本鎖及び/または二本鎖DNAを包含する。核酸は、例えば、ゲノム、転写産物、mRNA、tRNA、rRNA、siRNA、snRNA、プラスミド、コスミド、染色体、クロマチド、または他の天然に存在する核酸分子の状況下で、天然に存在し得る。一方、核酸分子は、天然に存在しない分子、例えば、組換えDNAもしくはRNA、人工染色体、操作されたゲノムもしくはその断片、または合成DNA、RNA、DNA/RNAハイブリッドであり得るか、または天然に存在しないヌクレオチドもしくはヌクレオシドを含んでもよい。更に、「核酸」、「DNA」、「RNA」、及び/または同様の用語には、核酸類似体、例えば、ホスホジエステル骨格以外を有する類似体が含まれる。核酸は、天然の供給源から精製することができ、組換え発現系を使用して生成し、任意選択的に精製したり化学合成したりすることができる。必要に応じて、例えば、化学的に合成された分子の場合、核酸は、化学的に修飾された塩基または糖を有する類似体などのヌクレオシド類似体、及び骨格修飾を含み得る。核酸配列は、別段の指示がない限り、5’から3’方向に提示される。一部の実施形態では、核酸は、天然のヌクレオシド(例えば、アデノシン、チミジン、グアノシン、シチジン、ウリジン、デオキシアデノシン、デオキシチミジン、デオキシグアノシン、及びデオキシシチジン)、ヌクレオチド類似体(例えば、2-アミノアデノシン、2-チオチミジン、イノシン、ピロロ-ピリミジン、3-メチルアデノシン、5-メチルシチジン、2-アミノアデノシン、C5-ブロモウリジン、C5-フルオロウリジン、C5-ヨードウリジン、C5-プロピニル-ウリジン、C5-プロピニル-シチジン、C5-メチルシチジン、2-アミノアデノシン、7-デアザアデノシン、7-デアザグアノシン、8-オキソアデノシン、8-オキソグアノシン、O(6)-メチルグアニン、及び2-チオシチジン)、化学的に修飾された塩基、生物学的に修飾された塩基(例えば、メチル化された塩基)、インターカレートされた塩基、修飾された糖(例えば、2’-フルオロリボース、リボース、2’-デオキシリボース、アラビノース、及びヘキソース)、及び/または修飾されたリン酸基(例えば、ホスホロチオエート及び5’-N-ホスホラミダイト結合)であるか、またはそれらを含む。

用語「核局在化配列」、「核局在化シグナル」、または「NLS」とは、細胞核へのタンパク質の輸入を促進するアミノ酸配列を指す。核局在化配列は、当該技術分野で既知であり、例えば、Plankらの2000年11月23日に出願された国際PCT出願PCT/EP2000/011690(WO/2001/038547として2001年5月31日に公開)に記載されている(それらの内容は、例示的な核局在化配列のそれらの開示のために、参照により本明細書に援用される)。他の実施形態では、NLSは、例えば、Koblan et al.,Nature Biotech.2018 doi:10.1038/nbt.4172に記載されている最適化NLSである。一部の実施形態では、NLSは、アミノ酸配列KRTADGSEFESPKKKRKV(配列番号190)、KRPAATKKAGQAKKKK(配列番号191)、KKTELQTTNAENKTKKL(配列番号192)、KRGINDRNFWRGENGRKTR(配列番号193)、RKSGKIAAIVVKRPRK(配列番号194)、PKKKRKV(配列番号195)またはMDSLLMNRRKFLYQFKNVRWAKGRRETYLC(配列番号196)を含む。

「核酸塩基」、「窒素塩基」、または「塩基」という用語は、本明細書で互換的に使用され、ヌクレオチドの成分であるヌクレオシドを形成する窒素含有生物学的化合物を指す。核酸塩基が塩基対を形成し、互いに積み重なる能力は、リボ核酸(RNA)及びデオキシリボ核酸(DNA)などの長鎖ヘリックス構造に直接つながる。アデニン(A)、シトシン(C)、グアニン(G)、チミン(T)及びウラシル(U)の5つの核酸塩基は、一次または正準と称される。アデニン及びグアニンは、プリンに由来し、シトシン、ウラシル、及びチミンは、ピリミジンに由来する。DNA及びRNAはまた、修飾された他の(非一次)塩基を含有することができる。非限定的な例示的な修飾核酸塩基としては、ヒポキサンチン、キサンチン、7-メチルグアニン、5,6-ジヒドロウラシル、5-メチルシトシン(m5C)、及び5-ヒドロメチルシトシン(hydromethylcytosine)が挙げられる。ヒポキサンチンとキサンチンは、両方とも、変異誘発物質の存在により、脱アミノ化(アミン基をカルボニル基で置換すること)を介して生成され得る。ヒポキサンチンは、アデニンから修飾され得る。キサンチンは、グアニンから修飾され得る。ウラシルは、シトシンの脱アミノから生じ得る。「ヌクレオシド」は、核酸塩基及び五炭糖(リボースまたはデオキシリボースのいずれか)からなる。ヌクレオシドの例として、アデノシン、グアノシン、ウリジン、シチジン、5-メチルウリジン(m5U)、デオキシアデノシン、デオキシグアノシン、チミジン、デオキシウリジン、及びデオキシシチジンが挙げられる。修飾核酸塩基を有するヌクレオシドの例としては、イノシン(I)、キサントシン(X)、7-メチルグアノシン(m7G)、ジヒドロウリジン(D)、5-メチルシチジン(m5C)、及びシュードウリジン(Ψ)が挙げられる。「ヌクレオチド」は、核酸塩基、五炭糖(リボースまたはデオキシリボースのいずれか)、及び少なくとも1つのリン酸基からなる。

用語「核酸プログラマブルDNA結合タンパク質」または「napDNAbp」は、「ポリヌクレオチドプログラマブルヌクレオチド結合ドメイン」と同じ意味で用いられる場合があり、napDNAbpを特定の核酸配列に誘導するガイド核酸またはガイドポリヌクレオチド(例えば、gRNA)などの核酸(例えば、DNAまたはRNA)と会合するタンパク質を指し得る。一部の実施形態では、ポリヌクレオチドプログラマブルヌクレオチド結合ドメインは、ポリヌクレオチドプログラマブルDNA結合ドメインである。一部の実施形態では、ポリヌクレオチドプログラマブルヌクレオチド結合ドメインは、ポリヌクレオチドプログラマブルRNA結合ドメインである。一部の実施形態では、ポリヌクレオチドプログラマブルヌクレオチド結合ドメインは、Cas9タンパク質である。Cas9タンパク質は、ガイドRNAに相補的な特定のDNA配列にCas9タンパク質をガイドするガイドRNAと会合することができる。一部の実施形態では、napDNAbpは、Cas9ドメイン、例えば、ヌクレアーゼ活性Cas9、Cas9ニッカーゼ(nCas9)、またはヌクレアーゼ不活性Cas9(dCas9)である。核酸プログラマブルDNA結合タンパク質の非限定的な例としては、Cas9(例えば、dCas9及びnCas9)、Cas12a/Cpfl、Cas12b/C2cl、Cas12c/C2c3、Cas12d/CasY、Cas12e/CasX、Cas12g、Cas12h、Cas12i及びCas12j/CasΦ(Cas12j/Casphi)が挙げられる。Cas酵素の非限定的な例としては、Cas1、Cas1B、Cas2、Cas3、Cas4、Cas5、Cas5d、Cas5t、Cas5h、Cas5a、Cas6、Cas7、Cas8、Cas8a、Cas8b、Cas8c、(Csn1またはCsx12としても知られる)Cas9、Cas10、Cas10d、Cas12a/Cpfl、Cas12b/C2cl、Cas12c/C2c3、Cas12d/CasY、Cas12e/CasX、Cas12g、Cas12h、Cas12i、Cas12j/CasΦ、Cpf1、Csy1、Csy2、Csy3、Csy4、Cse1、Cse2、Cse3、Cse4、Cse5e、Csc1、Csc2、Csa5、Csn1、Csn2、Csm1、Csm2、Csm3、Csm4、Csm5、Csm6、Cmr1、Cmr3、Cmr4、Cmr5、Cmr6、Csb1、Csb2、Csb3、Csx17、Csx14、Csx10、Csx16、CsaX、Csx3、Csx1、Csx1S、Csx11、Csf1、Csf2、CsO、Csf4、Csd1、Csd2、Cst1、Cst2、Csh1、Csh2、Csa1、Csa2、Csa3、Csa4、Csa5、II型Casエフェクタータンパク質、V型Casエフェクタータンパク質、VI型Casエフェクタータンパク質、CARF、DinG、それらの相同体、またはそれらの修飾もしくは操作されたバージョンが挙げられる。他の核酸プログラマブルDNA結合タンパク質もまた、本開示の範囲内であるが、それらは本開示に具体的に列挙されていない可能性がある。例えば、Makarova et al.“Classification and Nomenclature of CRISPR-Cas Systems:Where from Here?”CRISPRJ.2018 Oct;1:325-336.doi:10.1089/crispr.2018.0033、Yan et al.,“Functionally diverse type V CRISPR-Cas systems”Science.2019 Jan 4;363(6422):88-91.doi:10.1126/science.aav7271を参照されたい(各々の内容全体が参照により本明細書に援用される)。例示的な核酸プログラマブルDNA結合タンパク質及び核酸プログラマブルDNA結合タンパク質をコードする核酸配列は、配列表で配列番号197～230として提供される。

本明細書で使用される場合、「核酸塩基編集ドメイン」または「核酸塩基編集タンパク質」という用語は、シトシン(もしくはシチジン)からウラシル(もしくはウリジン)またはチミン(もしくはチミジン)への脱アミノ化、及びアデニン(もしくはアデノシン)からヒポキサンチン(もしくはイノシン)への脱アミノ化、ならびに非鋳型ヌクレオチド付加及び挿入などの、RNAもしくはDNAにおける核酸塩基修飾を触媒することができる、タンパク質または酵素を指す。一部の実施形態では、核酸塩基編集ドメインは、デアミナーゼドメイン(例えば、アデニンデアミナーゼまたはアデノシンデアミナーゼ;またはシチジンデアミナーゼまたはシトシンデアミナーゼ)である。

本明細書で使用される場合、「薬剤の入手」における「入手」には、薬剤の合成、購入、または他の方法での入手が含まれる。

「対象」とは、哺乳動物を意味し、ヒトまたは非ヒト哺乳動物(例えば、ウシ、ウマ、イヌ、ウシ、げっ歯類、またはネコ)を含むが、これらに限定されない。一実施形態では、「患者」とは、疾患または障害を発症する可能性が平均よりも高い哺乳動物対象を指す。例示的な患者は、ヒト、非ヒト霊長類、ネコ、イヌ、ブタ、ウシ、ネコ、ウマ、ラクダ、ラマ、ヤギ、ヒツジ、げっ歯類(例えば、マウス、ウサギ、ラット、またはモルモット)及び本明細書に開示される療法から利益を得ることができる他の哺乳動物であり得る。例示的なヒト患者は、男性及び/または女性であり得る。疾患の例としては、HBV感染症、ならびに肝硬変、肝細胞癌(HCC)、及びHBV感染症に関連する、またはそれに起因する任意の他の疾患を含む関連疾患及び障害が挙げられる。

「それを必要としている患者」または「それを必要としている対象」とは、本明細書中では、疾患または障害と診断されている患者、そのリスクがあるもしくはそれを有する患者、それを有すると予め決定されている患者、またはそれを有すると疑われている患者を指す。

「病原性変異」、「病原性バリアント」、「疾患ケーシング(disease casing)変異」、「病因性バリアント」、「有害な変異」、または「素因のある変異」という用語は、特定の疾患または障害に対する個体の感受性もしくは素因を増加させる遺伝子の変化または変異を指す。一部の実施形態では、病原性変異は、遺伝子によってコードされるタンパク質内の少なくとも1つの病原性アミノ酸によって置換された少なくとも1つの野生型アミノ酸を含む。

用語「タンパク質」、「ペプチド」、「ポリペプチド」、及びそれらの文法上の同等物は、本明細書中では同じ意味で使用され、ペプチド(アミド)結合によって一緒に連結されたアミノ酸残基の重合体を指す。タンパク質、ペプチド、またはポリペプチドは、天然に存在する、組換え、もしくは合成、またはそれらの任意の組み合わせであり得る。

本明細書で使用される「融合タンパク質」という用語は、少なくとも2つの異なるタンパク質に由来するタンパク質ドメインを含む、ハイブリッドポリペプチドを指す。

タンパク質または核酸の文脈で本明細書で使用される「組換え」という用語は、天然には存在しないが、人間工学の産物であるタンパク質または核酸を指す。例えば、一部の実施形態では、組換えタンパク質または核酸分子は、任意の天然に存在する配列と比較して、少なくとも1つ、少なくとも2つ、少なくとも3つ、少なくとも4つ、少なくとも5つ、少なくとも6つ、または少なくとも7つの変異を含むアミノ酸配列またはヌクレオチド配列を含む。

「減少」とは、少なくとも10%、25%、50%、75%、または100%の負の変化を意味する。

「参照」とは、標準または対照の条件を意味する。一実施形態では、参照は、野生型または健康な細胞である。他の実施形態では、参照は、未処理細胞であり、試験条件に供されないか、あるいはプラセボもしくは生理食塩水、培地、緩衝液、及び/または目的のポリヌクレオチドを保有しない対照ベクターに供される。参照は、HBV感染症のない細胞または対象であり得る。参照は、処置を受ける前、または処置の改変の前の対象であり得る。

「参照配列」とは、配列比較の基礎として使用される規定の配列である。参照配列は、特定の配列のサブセットまたはその全体、例えば、全長のcDNAもしくは遺伝子配列のセグメント、または完全なcDNAもしくは遺伝子配列であってもよい。ポリペプチドの場合、参照ポリペプチド配列の長さは、一般的に、少なくとも約16アミノ酸、少なくとも約20アミノ酸、少なくとも約25アミノ酸、約35アミノ酸、約50アミノ酸、または約100アミノ酸である。核酸の場合、参照核酸配列の長さは、一般的に、少なくとも約50ヌクレオチド、少なくとも約60ヌクレオチド、少なくとも約75ヌクレオチド、約100ヌクレオチド、または約300ヌクレオチド、またはその周辺またはそれらの間の任意の整数である。一部の実施形態では、参照配列は、目的のタンパク質の野生型配列である。他の実施形態では、参照配列は、野生型タンパク質をコードするポリヌクレオチド配列である。

「RNAプログラマブルヌクレアーゼ」及び「RNAガイドヌクレアーゼ」という用語は、切断の標的ではない1つ以上のRNA(複数可)とともに(例えば、それと結合または会合して)使用される。一部の実施形態では、RNAプログラマブルヌクレアーゼは、RNAと複合体を形成している場合、ヌクレアーゼ:RNA複合体と称され得る。通常、結合したRNA(複数可)はガイドRNA(gRNA)と呼ばれる。一部の実施形態では、RNAプログラマブルヌクレアーゼは、(CRISPR関連システム)Cas9エンドヌクレアーゼ、例えば、Streptococcus pyogenes由来のCas9(Csnl)である。

用語「一塩基多型(SNP)」とは、ゲノム内の特定の位置で発生する単一ヌクレオチドの変異であり、各変異は集団内に一定程度(例えば、>1%)存在する。

「特異的に結合する」とは、試料、例えば、生物学的試料において、核酸分子、ポリペプチド、ポリペプチド/ポリヌクレオチド複合体、化合物または分子が、本発明のポリペプチド及び/または核酸分子を認識しそれに結合するが、他の分子を実質的に認識せずそれらに実質的に結合しないことを意味する。

「実質的に同一」とは、参照アミノ酸配列に対して少なくとも50%の同一性を示すポリペプチドまたは核酸分子を意味する。一実施形態では、参照配列は、野生型のアミノ酸配列または核酸配列である。別の実施形態では、参照配列は、本明細書に記載のアミノ酸配列または核酸配列のいずれか1つである。一実施形態では、そのような配列は、アミノ酸レベルまたは核酸レベルにおいて、比較に使用する配列と少なくとも60%、80%、85%、90%、95%、または更には99%同一である。

配列同一性は、通常、配列解析ソフトウェア(例えば、Genetics Computer Group,University of Wisconsin Biotechnology Center,1710 University Avenue,Madison,Wis.53705の配列解析ソフトウェアパッケージ、BLAST、BESTFIT、GAPまたはPILEUP/PRETTYBOXプログラム)を使用して測定される。そのようなソフトウェアは、様々な置換、欠失、及び/または他の修飾に対して相同性の程度を割り当てることによって、同一または類似の配列を照合する。保存的置換は、通常、以下の群内の置換が含まれる:グリシン、アラニン;バリン、イソロイシン、ロイシン;アスパラギン酸、グルタミン酸、アスパラギン、グルタミン;セリン、スレオニン;リジン、アルギニン;及びフェニルアラニン、チロシン。同一性の程度を決定するための例示的なアプローチでは、密接に関連した配列を示すe-3～e-100の確率スコアを用いたBLASTプログラムを使用してもよい。

COBALTを、例えば、以下のパラメータとともに使用する。
a)アラインメントパラメータ:ギャップペナルティ-11,-1及びエンドギャップペナルティ-5,-1、
b)CDDパラメータ:RPS BLASTを使用、Blast E値0.003、保存された列を見つけて再計算、及び
c)クエリクラスタリングパラメータ:クエリクラスターを使用、ワードサイズ4、最大クラスター距離0.8、アルファベット通常。
EMBOSS Needleを、例えば、以下のパラメータとともに使用する。
a)マトリックス:BLOSUM62、
b)GAP OPEN:10、
c)GAP EXTEND:0.5、
d)OUTPUT FORMAT:対、
e)END GAP PENALTY:偽、
f)END GAP OPEN:10、及び
g)END GAP EXTEND:0.5。

本発明の方法において有用な核酸分子には、本発明のポリペプチドまたはその断片をコードする任意の核酸分子が含まれる。そのような核酸分子は、内在性核酸配列と100%同一である必要はないが、典型的には、実質的な同一性を示すであろう。内在性配列に対して「実質的同一性」を有するポリヌクレオチドは、典型的には、二本鎖核酸分子の少なくとも1つの鎖とハイブリダイズすることができる。本発明の方法において有用な核酸分子には、本発明のポリペプチドまたはその断片をコードする任意の核酸分子が含まれる。そのような核酸分子は、内在性核酸配列と100%同一である必要はないが、典型的には、実質的な同一性を示すであろう。内在性配列に対して「実質的同一性」を有するポリヌクレオチドは、典型的には、二本鎖核酸分子の少なくとも1つの鎖とハイブリダイズすることができる。「ハイブリダイズする」とは、対が、様々なストリンジェンシー条件下で、相補的ポリヌクレオチド配列(例えば、本明細書に記載の遺伝子)またはその一部の間で二本鎖分子を形成することを意味する。(例えば、Wahl,G.M.and S.L.Berger(1987)Methods Enzymol.152:399、Kimmel,A.R.(1987)Methods Enzymol.152:507を参照のこと)。

例えば、ストリンジェントな塩濃度は、通常、約750mM未満のNaCl及び75mM未満のクエン酸三ナトリウムであり、好ましくは、約500mM未満のNaCl及び50mM未満のクエン酸三ナトリウムであり、より好ましくは、約250mM未満のNaCl及び25mM未満のクエン酸三ナトリウムである。有機溶媒、例えば、ホルムアミドの非存在下では、低いストリンジェンシーのハイブリダイゼーションを得ることができる一方で、少なくとも約35%のホルムアミド、より好ましくは少なくとも約50%のホルムアミドの存在下では、高いストリンジェンシーのハイブリダイゼーションを得ることができる。ストリンジェントな温度条件には、通常は、少なくとも約30℃、より好ましくは少なくとも約37℃、最も好ましくは少なくとも約42℃の温度が含まれる。ハイブリダイゼーションの時間、界面活性剤、例えば、ドデシル硫酸ナトリウム(SDS)の濃度、及び担体DNAの包含または除外などの様々な追加のパラメータは、当業者に周知である。必要に応じて、これらの様々な条件を組み合わせることによって、様々なレベルのストリンジェンシーが達成される。好ましい実施形態では、ハイブリダイゼーションを、750mMのNaCl、75mMのクエン酸三ナトリウム及び1%SDS中にて30℃で実施する。より好ましい実施形態では、ハイブリダイゼーションを、500mMのNaCl、50mMのクエン酸三ナトリウム、1%SDS、35%ホルムアミド、及び100μg/mlの変性サケ精子DNA(ssDNA)中にて37℃で実施する。最も好ましい実施形態では、ハイブリダイゼーションを、250mMのNaCl、25mMのクエン酸三ナトリウム、1%SDS、50%ホルムアミド、及び200μg/mlのssDNA中にて42℃で実施する。これらの条件の有用な変形は、当業者には容易に明らかであろう。

ほとんどの用途では、ハイブリダイゼーションに続く洗浄工程もまた、ストリンジェンシーが異なるであろう。洗浄のストリンジェンシー条件は、塩濃度及び温度によって定義することができる。上記のように、洗浄のストリンジェンシーは、塩濃度を下げるか、または温度を上げることによって、高めることができる。例えば、洗浄ステップのためのストリンジェントな塩濃度は、好ましくは約30mM未満のNaCl及び3mM未満のクエン酸三ナトリウム、及び最も好ましくは約15mM未満のNaCl及び1.5mM未満のクエン酸三ナトリウムである。洗浄ステップのためのストリンジェントな温度条件には、通常、少なくとも約25℃、より好ましくは少なくとも約42℃、更により好ましくは少なくとも約68℃の温度が含まれる。一実施形態では、洗浄ステップを、30mMのNaCl、3mMのクエン酸三ナトリウム、及び0.1%のSDS中にて、25℃で実施する。別の実施形態では、洗浄ステップを、15mMのNaCl、1.5mMのクエン酸三ナトリウム及び0.1%SDS中にて42℃で実施する。より好ましい実施形態では、洗浄ステップを、15mMのNaCl、1.5mMのクエン酸三ナトリウム、及び0.1%のSDS中にて、68℃で実施する。これらの条件における追加の変形は、当業者には容易に明らかであろう。ハイブリダイゼーション技術は、当業者に周知であり、例えば、Benton and Davis(Science 196:180,1977)、Grunstein and Hogness(Proc.Natl.Acad.Sci.,USA 72:3961,1975)、Ausubel et al.(Current Protocols in Molecular Biology,Wiley Interscience,New York,2001)、Berger and Kimmel(Guide to Molecular Cloning Techniques,1987,Academic Press,New York)、及びSambrook et al.,Molecular Cloning:A Laboratory Manual,Cold Spring Harbor Laboratory Press,New Yorkに記載されている。

「スプリット(split)」とは、2つ以上の断片に分割されることを意味する。

「スプリットCas9タンパク質」または「スプリットCas9」とは、2つの別個のヌクレオチド配列によってコードされるN末端断片及びC末端断片として提供されるCas9タンパク質を指す。Cas9タンパク質のN末端部分及びC末端部分に対応するポリペプチドは、スプライシングされて「再構築された」Cas9タンパク質を形成し得る。

「標的部位」という用語は、デアミナーゼ(例えば、シチジンデアミナーゼもしくはアデニンデアミナーゼ)またはデアミナーゼを含む融合タンパク質(例えば、dCas9-アデノシンデアミナーゼ融合タンパク質または本明細書に開示される塩基エディター)によって脱アミノ化される核酸分子内の配列を指す。

「テノホビル」とは、CAS番号147127-20-6に対応する構造

を有する分子、及びその薬学的に許容される塩を意味する。テノホビルは、抗レトロウイルス活性を有する。テノホビルは、ヌクレオシド/ヌクレオチド逆転写酵素阻害剤(NRTI)として分類される。

本明細書で使用される場合、「治療する」、「治療すること」、及び「治療」などの用語は、障害及び/またはそれに関連する症状を低減するもしくは寛解させること、または所望の薬理学的及び/または生理学的効果を得ることを指す。障害または状態を治療することは、障害、状態、またはそれらに関連する症状が完全に排除されることを、除外はしないものの、必ずしも必要としないことが理解されるだろう。一部の実施形態では、効果は治療的であり、すなわち、限定されないが、その効果は、疾患及び/または疾患に起因する有害な症状を、部分的または完全に、低減、減少、抑制、軽減、緩和、強度を低下させるか、または治癒する。一部の実施形態では、効果は予防的であり、すなわち、効果は、疾患または状態の発生または再発を、防御または予防する。この目的のために、本明細書に開示する方法は、本明細書に記載するような治療有効量の組成物を投与することを含む。一実施形態では、本発明は、HBV感染症の治療を提供する。

「ウラシルグリコシラーゼ阻害剤」または「UGI」とは、ウラシル除去修復系を阻害する薬剤を意味する。シチジンデアミナーゼを含む塩基エディターは、シトシンをウラシルに変換し、次いで、ウラシルは、DNA複製または修復を介して、チミンに変換される。ウラシルDNAグリコシラーゼ(UGI)の阻害剤を塩基エディターにおいて含めることは、UをCに変化させ戻す塩基除去修復を防止する。例示的なUGIは、以下のアミノ酸配列を含む:
>splP14739IUNGI_BPPB2 ウラシルDNAグリコシラーゼ阻害剤
MTNLSDIIEKETGKQLVIQESILMLPEEVEEVIGNKPESDILVHTAYDESTDENVMLLTSD APEYKPWALVIQDSNGENKIKML(配列番号231)。

本明細書に提供される範囲は、範囲内の全ての値の略記であることが理解される。例えば、1～50の範囲は、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、または50からなる群からの任意の数、数字の組み合わせ、または部分範囲を含むことが理解される。

本明細書の変数の任意の定義の中の化学基のリストの列挙は、任意の単一の基、または列挙した基の組み合わせとして、その変数の定義を含む。本明細書の変数または態様についての実施形態の列挙は、任意の単一の実施形態として、または任意の他の実施形態もしくはその一部と組み合わせて、その実施形態を含む。

全ての用語は、当業者によって理解されるように理解されることが意図されている。別途定義されない限り、本明細書で使用される全ての技術及び科学用語は、本開示が属する当該技術分野の当業者によって一般的に理解されるのと同じ意味を有する。

本出願では、単数形の使用は、特に断りのない限り、複数形を含む。本明細書で使用される場合、単数形の「a」、「an」及び「the」は、別途文脈により明らかに指示されない限り、複数の言及を含むことに留意されたい。本出願において、「または」の使用は、別段の定めのない限り、「及び/または」を意味する。更に、「含む(including)」という用語、ならびに「含む(include)」、「含む(includes)」及び「含まれる(included)」などの他の形態の使用は、限定的でない。

本明細書及び特許請求の範囲で使用される場合、「含む(comprising)」(ならびに、「含む(comprise)」及び「含む(comprises)」などのその任意の形態)、「有する(having)」(ならびに、「有する(have)」及び「有する(has)」などのその任意の形態)、「含む(including)」(ならびに、「含む(”includes)」及び「含む」(include)などのその任意の形態)、または「含有する(containing)」(ならびに、「含有する(contains)」及び「含有する(contain)」などのその任意の形態)という単語は、包含的またはオープンエンドであり、追加の列挙されていない要素または方法ステップを除外しない。本明細書で論じられる任意の実施形態は、本開示の任意の方法または組成物に関して実施され得、逆もまた同様であることが企図される。更に、本開示の組成物を使用して、本開示の方法を達成することができる。

「約」または「およそ」という用語は、当業者によって決定される特定の値に対する許容誤差の範囲内であることを意味し、それは、部分的には、どのようにその値が測定または決定されるか(すなわち、測定システムの限界)に依存する。例えば、「約」は、当該技術分野における慣例に従って、1標準偏差以内または1を超える標準偏差以内を意味し得る。代替として、「約」は、所与の値の最大20%、最大10%、最大5%、または最大1%の範囲を意味し得る。代替として、特に生物学的なシステムまたはプロセスに関して、この用語は、1桁以内、例えば、値の5倍以内、2倍以内であることを意味し得る。本出願及び特許請求の範囲において特定の値が記載される場合、別段の記載がない限り、特定の値について許容誤差の範囲内であることを意味する。

本明細書における「一部の実施形態」、「実施形態」、「一実施形態」または「他の実施形態」への言及は、実施形態に関連して説明される特定の特徴、構造、または特徴が、本開示の少なくとも一部の実施形態に含まれるが、必ずしも全ての実施形態に含まれるわけではないことを意味する。

B型肝炎表面抗原(HBsAg)遺伝子、ポリメラーゼ遺伝子、タンパク質X遺伝子、及びコア遺伝子についての部分的に二本鎖であり、重複するオープンリーディングフレーム(ORF)を示す図である。HBsAg遺伝子は、ORF PreS1、ORF PreS2、及びORF Sを含み、これらは、それぞれ、大、中、及び小の表面タンパク質をコードする。ORFコア及びPre Cは、カプシドタンパク質をコードする。 HBVライフサイクルを示す図である。「ER」という用語は、小胞体を示す。「HBsAg」という用語は、B型肝炎表面抗原を示す。「HBx転写活性化剤」は、ポリメラーゼII及びIIIプロモーターのHBV特異的転写活性化剤である。地図及びプレゼンテーションスライドを提示する。世界中のB型肝炎ウイルス遺伝子型の地理的分布の地図である。地図及びプレゼンテーションスライドを提示する。ウイルス遺伝子に終止コドンを導入し、慢性HBVを治療するための脱塩基性部位を生成するための塩基編集戦略の要約を提供する。示された塩基エディターと組み合わせて使用される示されたガイドRNA配列の%A～Gの編集効率を示す棒グラフを提供する。HEK293 lenti HBV系を使用し、RNAトランスフェクションフォーマットを行った。ガイドRNA配列のうちのいくつかは、50%を超える編集効率に関連していた。ガイドRNAは、HBV転写エレメントを標的化するか、またはHBV遺伝子にミスセンス変異を導入した。x軸に列挙されるのは、示された塩基エディターと組み合わせて使用されるガイドRNA配列である(表1を参照されたい)。 HBV-原発性ヒト肝細胞(HBV-PHH)系において、示されたガイドRNA(x軸上に列挙される)と組み合わせて使用される、示された塩基エディターの抗ウイルス有効性を示す棒グラフを提供する。図5A～5Cでは、「HBsAG」という用語は「B型肝炎表面抗原」を表し、「HBeAg」という用語は「B型肝炎e抗原」を表す。図5では、y軸は、無処理試料に対する倍率変化を表す。 HBV-原発性ヒト肝細胞(HBV-PHH)系において、示されたガイドRNA(x軸上に列挙される)と組み合わせて使用される、示された塩基エディターの抗ウイルス有効性を示す棒グラフを提供する。図5A～5Cでは、「HBsAG」という用語は「B型肝炎表面抗原」を表し、「HBeAg」という用語は「B型肝炎e抗原」を表す。図5では、y軸は、無処理試料に対する倍率変化を表す。 HBV-原発性ヒト肝細胞(HBV-PHH)系において、示されたガイドRNA(x軸上に列挙される)と組み合わせて使用される、示された塩基エディターの抗ウイルス有効性を示す棒グラフを提供する。図5A～5Cでは、「HBsAG」という用語は「B型肝炎表面抗原」を表し、「HBeAg」という用語は「B型肝炎e抗原」を表す。図5では、y軸は、無処理試料に対する倍率変化を表す。 HBV感染HepG2-NTCP細胞における機能的gRNAスクリーニングの実験手順を概説する概略図を提供する。 HBVゲノムの概略マップを提供する。ゲノムマップは、BE4と組み合わせて使用されるgRNA37及びgRNA40に関連する塩基編集の位置を示すために注釈付けされる。 HBV感染HepG2pNTCP細胞内の機能的gRNAスクリーニングの結果を示す棒グラフの集合を提供する。HBsAg及びCore遺伝子を標的化する2つのリードgRNA(すなわち、gRNA37及びgRNA40)を同定した。ガイドgRNA37(Stop-S)はHBsAgの減少に関連し、gRNA40(Stop-PreCore)はHBeAgの減少に関連していた。ガイドRNAであるgRNA37及びgRNA40はともに、全HBV DNA及び3.5kbのRNAレベルの低下と関連していた。x軸上には、BE4と組み合わせて使用されるgRNA(すなわち、gRNA12、gRNA37、gRNA19、gRNA190、及びgRNA40)が列挙されている。陰性対照(-)は未処理細胞であり、対照(contr)はPCSK9遺伝子を標的化するgRNAであった。 gRNAの多重化が、HepG2-NTCP内のそれぞれのHBVウイルスパラメータを同時に減少させたことを示す棒グラフの集合を提供する。x軸には、BE4と組み合わせて使用されるgRNA(すなわち、gRNA37及びgRNA40)が列挙されている。両方のgRNAは、同じ共有結合で閉鎖環状DNA鎖(cccDNA)を標的化し、標的配列を約1kb間隔で配置した。多重化gRNA37及びgRNA40は、HBsAg及びHbBeAg、ならびに全HBV DNA及び3.5kbのRNAを減少させた。使用された塩基エディターは、BE4であった。陰性対照(-)は未処理細胞であり、対照(contr)はPCSK9遺伝子を標的化するgRNAであった。 BE4及びガイドRNA(複数可)を含有する塩基エディターシステムが、cccDNAのレベルを低下させることなくcccDNA編集を実施したことを示す棒グラフを提供する。陰性対照(-)は未処理細胞であり、対照(contr)はPCSK9遺伝子を標的化するgRNAであった。編集に対するラミブジン前処理の影響を評価するための実験プロトコルを要約する概略図を提供する。ラミブジンを用いた前処理が、増加した編集効率と関連していたことを示す棒グラフを提供する。塩基編集効率は、ラミブジンによる前処理によって、HepG2-NTCP細胞において約20%改善された。ラミブジン前処理細胞における高cccDNA編集は、CBEがcccDNAを直接標的化することを示唆した。ラミブジン前処理と組み合わせたgRNA40と組み合わせたgRNA37(すなわち、組み合わせ/多重gRNA処理)を用いた塩基編集が、B型肝炎ウイルス(HBV)マーカーの堅牢な減少と関連していたことを示す棒グラフのセットを提供する。陰性対照(-)は未処理細胞であり、対照(contr)はPCSK9遺伝子を標的化するgRNAであった。ラミブジンに対する塩基編集の抗ウイルス活性を評価するための実験プロトコルを要約する概略図を提供する。図14は、測定されたHBVパラメータを列挙する。 gRNA40と組み合わせてgRNA37を用いた塩基編集(すなわち、組み合わせ/多重gRNA処置)が、処理後25日目に全てのHBVウイルスマーカーの約70%～約80%の減少をもたらしたが、一方、ラミブジン(LAM)による8日間の処理はそうではなかったことを示す一連の棒グラフを提供する。陰性対照(-)は未処理細胞であり、対照(contr)はPCSK9遺伝子を標的化するgRNAであった。示された処理についての細胞外HBV DNAレベルの時間経過を提示するプロットを提供する。塩基編集は、初代肝細胞共培養におけるリバウンドを防止した。HBVは、ラミブジンのみでの処理を中止した後にリバウンドした。対照gRNAは、PCSK9遺伝子を標的化した。「HBV」試料は、未処理の試料であった。塩基編集試薬による2回目のトランスフェクションの2週間後に、HBVリバウンドは観察されなかった。HBV複製を、s/nでのHBV DNA qPCRによって評価した。 2つのgRNAをBE4と組み合わせてHBV cccDNAを編集するために使用した場合の、gRNA37及びgRNA40によって標的化された部位での個々の塩基編集効率を示す棒グラフを提供する。S抗原部位では約30%の編集効率が観察され、PreCore遺伝子では約60%の編集効率が観察された。これらの編集効率は、高い抗ウイルス有効性を可能にし、初代ヒト肝細胞(PHH)におけるリバウンドを防止するのに十分であった。ラミブジン及びBE4及びgRNA37及び40を含む塩基編集システムによる併用治療を評価する実験の概要を提供する概略図である。示された処理についての細胞外HBV DNAレベルの時間経過を提示するプロットを提供する。「HBV」試料は、未処理の試料であった。ラミブジンによる前処理は、初代肝細胞における編集を改善した。塩基エディターシステム及びラミブジンとの併用治療は、HBVリバウンドを防止した。HBV複製を、s/nでのHBV DNA qPCRによって評価した。 gRNA37及びgRNA40によって標的化された部位での塩基編集効率を示す棒グラフを提供する。細胞をgRNA37及びgRNA40と組み合わせてBE4と接触させ、またラミブジン(LAM)で処理した。ラミブジンによる前処理は、初代肝細胞における編集を改善した。対照細胞(-)は、ラミブジンで処理しなかった。一次肝細胞におけるラミブジン処置と組み合わせた塩基編集が、全てのHBVマーカーの約70%～約80%の減少をもたらしたことを示す棒グラフを提供する。「HBV」という表記は、未処理の対照を示す。 gRNA37及びgRNA40によって標的化された部位での塩基編集を示す棒グラフを提供する。gRNA37及びgRNA40と組み合わせてBE4、ppApo、またはrrA3Fと細胞を接触させた。BE4の代わりに、オフターゲット活性を低減し、非特異的効果を低減したppApo及びrrA3F塩基エディターの使用は、BE4と比較して塩基編集効率を悪化させなかった。全ての塩基エディターは、同等の編集効率に関連していた。 gRNA37及びgRNA40と組み合わせて、塩基エディターBE4、ppApo、またはrrA3Fと細胞を接触させることが、HBV感染細胞におけるHBsAgレベルの低下をもたらしたことを示す棒グラフを提供する。したがって、3つの塩基エディターシステムは全て、抗ウイルス活性を有した。陰性対照(HBV)は、未処理細胞であり、対照(contr)は、PCSK9遺伝子を標的化するgRNAであった。 BE4をコードするポリヌクレオチドならびにガイドRNAであるgRNA37及びgRNA40を含有するB型肝炎ウイルス(HBV)抗原のインビボレベルを、BE4をコードするポリヌクレオチド、ならびにガイドRNAであるgRNA37及びgRNA40をコードする脂質ナノ粒子の、1日目の注射後の複製能のあるHBVサークルマウスモデル(n=5)で測定したB型肝炎ウイルス(HBV)抗原のインビボレベルを示すプロットを提供する。図24Aは、平均%HBsAgを経時的にIU/mlとしてプロットする。図24Bは、HBeAgをPEI(Paul Elrich Institut国際標準血清)U/mlとして経時的にプロットする。図24Cは、HBV DNAを経時的にコピー/mlとしてプロットする。図24A～24Cでは、「HM」という用語は、「重修飾」(すなわち、重修飾ガイドRNA)を有するgRNA37-HM及びgRNA40-HM含有足場を指し、「SOC」という用語は、「標準的なケア」を示し、「SEM」は、「平均の標準的な誤差」を示す。図24A～24Cでは、「1x」は、1日目の注射のみを示し(「LNP-1^stinj.」)、「2x」は、1日目の注射(「LNP-1^st inj.」)及び14日目の注射を示す(「LNP 2^nd inj.」)。 BE4をコードするポリヌクレオチドならびにガイドRNAであるgRNA37及びgRNA40を含有するB型肝炎ウイルス(HBV)抗原のインビボレベルを、BE4をコードするポリヌクレオチド、ならびにガイドRNAであるgRNA37及びgRNA40をコードする脂質ナノ粒子の、1日目の注射後の複製能のあるHBVサークルマウスモデル(n=5)で測定したB型肝炎ウイルス(HBV)抗原のインビボレベルを示すプロットを提供する。図24Aは、平均%HBsAgを経時的にIU/mlとしてプロットする。図24Bは、HBeAgをPEI(Paul Elrich Institut国際標準血清)U/mlとして経時的にプロットする。図24Cは、HBV DNAを経時的にコピー/mlとしてプロットする。図24A～24Cでは、「HM」という用語は、「重修飾」(すなわち、重修飾ガイドRNA)を有するgRNA37-HM及びgRNA40-HM含有足場を指し、「SOC」という用語は、「標準的なケア」を示し、「SEM」は、「平均の標準的な誤差」を示す。図24A～24Cでは、「1x」は、1日目の注射のみを示し(「LNP-1^stinj.」)、「2x」は、1日目の注射(「LNP-1^st inj.」)及び14日目の注射を示す(「LNP 2^nd inj.」)。 BE4をコードするポリヌクレオチドならびにガイドRNAであるgRNA37及びgRNA40を含有するB型肝炎ウイルス(HBV)抗原のインビボレベルを、BE4をコードするポリヌクレオチド、ならびにガイドRNAであるgRNA37及びgRNA40をコードする脂質ナノ粒子の、1日目の注射後の複製能のあるHBVサークルマウスモデル(n=5)で測定したB型肝炎ウイルス(HBV)抗原のインビボレベルを示すプロットを提供する。図24Aは、平均%HBsAgを経時的にIU/mlとしてプロットする。図24Bは、HBeAgをPEI(Paul Elrich Institut国際標準血清)U/mlとして経時的にプロットする。図24Cは、HBV DNAを経時的にコピー/mlとしてプロットする。図24A～24Cでは、「HM」という用語は、「重修飾」(すなわち、重修飾ガイドRNA)を有するgRNA37-HM及びgRNA40-HM含有足場を指し、「SOC」という用語は、「標準的なケア」を示し、「SEM」は、「平均の標準的な誤差」を示す。図24A～24Cでは、「1x」は、1日目の注射のみを示し(「LNP-1^stinj.」)、「2x」は、1日目の注射(「LNP-1^st inj.」)及び14日目の注射を示す(「LNP 2^nd inj.」)。 BE4をコードするポリヌクレオチドならびにガイドRNAであるgRNA37及びgRNA40を含有するB型肝炎ウイルス(HBV)抗原のインビボレベルを、BE4をコードするポリヌクレオチド、ならびにガイドRNAであるgRNA37及びgRNA40をコードする脂質ナノ粒子の、1日目の注射後の複製能のあるHBVサークルマウスモデル(n=5)で測定したB型肝炎ウイルス(HBV)抗原のインビボレベルを示すプロットを提供する。図25Aは、平均%HBsAgを経時的にIU/mLとしてプロットする。図25Bは、HBeAgをPEI(Paul Elrich Institut国際標準血清)U/mlとして経時的にプロットする。図25Cは、HBV DNAを経時的にコピー/mlとしてプロットする。図25A～25Cでは、「HM」という用語は、「重修飾」(すなわち、重修飾ガイドRNA)を有するgRNA37-HM及びgRNA40-HM含有足場を指し、「ETV」という用語は「エンテカビル」を示し、「SD」は「標準偏差」を示す。図25A～25Cでは、「1x」は、1日目の注射のみを示し(「LNP-1^stinj.」)、「2x」は、1日目の注射(「LNP-1^st inj.」)及び14日目の注射を示す(「LNP 2^nd inj.」)。 BE4をコードするポリヌクレオチドならびにガイドRNAであるgRNA37及びgRNA40を含有するB型肝炎ウイルス(HBV)抗原のインビボレベルを、BE4をコードするポリヌクレオチド、ならびにガイドRNAであるgRNA37及びgRNA40をコードする脂質ナノ粒子の、1日目の注射後の複製能のあるHBVサークルマウスモデル(n=5)で測定したB型肝炎ウイルス(HBV)抗原のインビボレベルを示すプロットを提供する。図25Aは、平均%HBsAgを経時的にIU/mLとしてプロットする。図25Bは、HBeAgをPEI(Paul Elrich Institut国際標準血清)U/mlとして経時的にプロットする。図25Cは、HBV DNAを経時的にコピー/mlとしてプロットする。図25A～25Cでは、「HM」という用語は、「重修飾」(すなわち、重修飾ガイドRNA)を有するgRNA37-HM及びgRNA40-HM含有足場を指し、「ETV」という用語は「エンテカビル」を示し、「SD」は「標準偏差」を示す。図25A～25Cでは、「1x」は、1日目の注射のみを示し(「LNP-1^stinj.」)、「2x」は、1日目の注射(「LNP-1^st inj.」)及び14日目の注射を示す(「LNP 2^nd inj.」)。 BE4をコードするポリヌクレオチドならびにガイドRNAであるgRNA37及びgRNA40を含有するB型肝炎ウイルス(HBV)抗原のインビボレベルを、BE4をコードするポリヌクレオチド、ならびにガイドRNAであるgRNA37及びgRNA40をコードする脂質ナノ粒子の、1日目の注射後の複製能のあるHBVサークルマウスモデル(n=5)で測定したB型肝炎ウイルス(HBV)抗原のインビボレベルを示すプロットを提供する。図25Aは、平均%HBsAgを経時的にIU/mLとしてプロットする。図25Bは、HBeAgをPEI(Paul Elrich Institut国際標準血清)U/mlとして経時的にプロットする。図25Cは、HBV DNAを経時的にコピー/mlとしてプロットする。図25A～25Cでは、「HM」という用語は、「重修飾」(すなわち、重修飾ガイドRNA)を有するgRNA37-HM及びgRNA40-HM含有足場を指し、「ETV」という用語は「エンテカビル」を示し、「SD」は「標準偏差」を示す。図25A～25Cでは、「1x」は、1日目の注射のみを示し(「LNP-1^stinj.」)、「2x」は、1日目の注射(「LNP-1^st inj.」)及び14日目の注射を示す(「LNP 2^nd inj.」)。 gRNAの選択及びスクリーニングのための戦略を説明する概略図を提供する。この戦略は、世界中で最も一般的であり、細胞モデルと動物モデルの両方が存在する遺伝子型Dに焦点を当てた、保存されたHBV領域を標的化することを含む。インシリコgRNAの選択は、HBV遺伝子をサイレンシングするgRNAの可能性に基づいていた。ウイルス遺伝子に終止コドンを導入する100個のgRNA(NGG、NGA、NNNRRT PAM)を設計した。24個の保存されたgRNAが、HBVゲノムにミスセンス変異を導入すると予測された。最後の工程は、Hek293-Lenti-HBV細胞株での編集の検出を伴った。 gRNAの選択及びスクリーニングのための戦略を説明する概略図を提供する。この戦略は、世界中で最も一般的であり、細胞モデルと動物モデルの両方が存在する遺伝子型Dに焦点を当てた、保存されたHBV領域を標的化することを含む。インシリコgRNAの選択は、HBV遺伝子をサイレンシングするgRNAの可能性に基づいていた。ウイルス遺伝子に終止コドンを導入する100個のgRNA(NGG、NGA、NNNRRT PAM)を設計した。24個の保存されたgRNAが、HBVゲノムにミスセンス変異を導入すると予測された。最後の工程は、Hek293-Lenti-HBV細胞株での編集の検出を伴った。塩基編集が、原発性ヒト肝細胞(PHH)におけるHBVリバウンドを防止することを示す。Aは、PHHに使用される実験スケジュールを示す概略図を提供する。Bは、トランスフェクション後の異なる日におけるPHH上清中のHBV DNA qPCRによって評価されるHBV複製を示すグラフである。3TCの中止はHBVリバウンドにつながるが、塩基編集はこのリバウンドを防止する。Cは、塩基編集が、HBsAg、HBeAg、3.5kbRNA、及びHBV DNAの効率的な低減をもたらし、PHHにおけるHBV複製阻害を更に改善することを示すグラフである。Dは、S抗原の約30%の編集、及びPreCore遺伝子の約60%の編集が、高い抗ウイルス効果を可能にし、PHHでのリバウンドを防止するのに十分であったことを示すグラフである。 2つのリードgRNAを多重化することが、肝腫細胞株(HepG2-NTCP)におけるHBVパラメータを低減することを示す。実験スケジュールを示す。 2つのリードgRNAを多重化することが、肝腫細胞株(HepG2-NTCP)におけるHBVパラメータを低減することを示す。塩基編集が、ウイルス細胞外(HBsAg、HBeAg)ならびに細胞内(3.5kbRNA、及びHBV DNA)パラメータの効率的な低減をもたらすことを示すいくつかのグラフを含む。 2つのリードgRNAを多重化することが、肝腫細胞株(HepG2-NTCP)におけるHBVパラメータを低減することを示す。3TC処理時にHBsAg、HBeAg、及び3.5kbRNAについて観察された結果を示す一連のグラフを提供する。 2つのリードgRNAを多重化することが、肝腫細胞株(HepG2-NTCP)におけるHBVパラメータを低減することを示す。gRNA B+gRNA Hの組み合わせがまた、ウェスタンブロッティングで観察されるように、全てのHBアイソフォームを阻害したことを示す。塩基編集が、天然に組み込まれたHBVからHBを低減したことを示す。Aは、PLC/PRF5細胞に使用される実験プロトコルを提供する。Bは、BE4 mRNA及びgRNA B*のトランスフェクション後6日目に、細胞外HBs AgレベルがELISAによって決定されたことを示すグラフである。Cは、S抗原部位の約50%の編集が、HBs Agの堅牢な減少を可能にするのに十分であったことを示すグラフである。塩基エディターが、cccDNAレベルを低下させることなく、cccDNA編集を介して機能することを示す。Aは、グラフである。ウイルス複製中間体を排除するために、ExoI/IIIで前処理したDNA試料上のqPCRによって、cccDNAレベルを評価した。3TCの非存在下または存在下で、gRNA B+gRNA Hによる塩基編集時に、cccDNAの低下は観察されなかった。Bは、cccDNA濃縮試料上でNGSによって評価された機能編集を示すグラフである。3TCの存在下でより高い編集効率が検出された。 BE4塩基エディターを用いた2つのgRNAの多重化が、HepG2-NTCPにおけるHBVウイルスパラメータを同時に低減したことを示す。図31Aは、塩基編集が、無関係のPCSK9遺伝子を標的化する塩基編集試薬で処理された対照試料と比較して、ウイルス細胞外(HBsAg、HBeAg)、ならびに細胞内(3.5kbRNA、及びHBV DNA)パラメータの効率的な低減をもたらすことを示す一連のグラフを提供する。BE4/gRNA(S1+C2)処理は、ウェスタンブロットで観察されるように、全てのHBアイソフォームを阻害した。図31Bは、ラミブジンによる前処理の場合の実験スケジュールを提供する。図31Cは、パネルAに示される結果と同様に、ラミブジンを用いた併用療法が、HBVウイルスマーカーの堅牢な低減をもたらすことを示す。図31Dは、塩基編集がHepG2-NTCPにおけるcccDNAレベルを低下させないことを示すグラフである。図31Eは、HepG2-NTCPにおいて、ラミブジンを用いた前処理が、塩基編集率を20%増加させたことを示す。理論に拘束されることを意図するものではないが、ラミブジン前処理条件下での高いcccDNA編集は、CBEがcccDNAを直接標的化する可能性が高いことを示す。 BE4塩基エディターを用いた2つのgRNAの多重化が、HepG2-NTCPにおけるHBVウイルスパラメータを同時に低減したことを示す。図31Aは、塩基編集が、無関係のPCSK9遺伝子を標的化する塩基編集試薬で処理された対照試料と比較して、ウイルス細胞外(HBsAg、HBeAg)、ならびに細胞内(3.5kbRNA、及びHBV DNA)パラメータの効率的な低減をもたらすことを示す一連のグラフを提供する。BE4/gRNA(S1+C2)処理は、ウェスタンブロットで観察されるように、全てのHBアイソフォームを阻害した。図31Bは、ラミブジンによる前処理の場合の実験スケジュールを提供する。図31Cは、パネルAに示される結果と同様に、ラミブジンを用いた併用療法が、HBVウイルスマーカーの堅牢な低減をもたらすことを示す。図31Dは、塩基編集がHepG2-NTCPにおけるcccDNAレベルを低下させないことを示すグラフである。図31Eは、HepG2-NTCPにおいて、ラミブジンを用いた前処理が、塩基編集率を20%増加させたことを示す。理論に拘束されることを意図するものではないが、ラミブジン前処理条件下での高いcccDNA編集は、CBEがcccDNAを直接標的化する可能性が高いことを示す。 BE4塩基エディターを用いた2つのgRNAの多重化が、HepG2-NTCPにおけるHBVウイルスパラメータを同時に低減したことを示す。図31Aは、塩基編集が、無関係のPCSK9遺伝子を標的化する塩基編集試薬で処理された対照試料と比較して、ウイルス細胞外(HBsAg、HBeAg)、ならびに細胞内(3.5kbRNA、及びHBV DNA)パラメータの効率的な低減をもたらすことを示す一連のグラフを提供する。BE4/gRNA(S1+C2)処理は、ウェスタンブロットで観察されるように、全てのHBアイソフォームを阻害した。図31Bは、ラミブジンによる前処理の場合の実験スケジュールを提供する。図31Cは、パネルAに示される結果と同様に、ラミブジンを用いた併用療法が、HBVウイルスマーカーの堅牢な低減をもたらすことを示す。図31Dは、塩基編集がHepG2-NTCPにおけるcccDNAレベルを低下させないことを示すグラフである。図31Eは、HepG2-NTCPにおいて、ラミブジンを用いた前処理が、塩基編集率を20%増加させたことを示す。理論に拘束されることを意図するものではないが、ラミブジン前処理条件下での高いcccDNA編集は、CBEがcccDNAを直接標的化する可能性が高いことを示す。 BE4塩基エディターを用いた2つのgRNAの多重化が、HepG2-NTCPにおけるHBVウイルスパラメータを同時に低減したことを示す。図31Aは、塩基編集が、無関係のPCSK9遺伝子を標的化する塩基編集試薬で処理された対照試料と比較して、ウイルス細胞外(HBsAg、HBeAg)、ならびに細胞内(3.5kbRNA、及びHBV DNA)パラメータの効率的な低減をもたらすことを示す一連のグラフを提供する。BE4/gRNA(S1+C2)処理は、ウェスタンブロットで観察されるように、全てのHBアイソフォームを阻害した。図31Bは、ラミブジンによる前処理の場合の実験スケジュールを提供する。図31Cは、パネルAに示される結果と同様に、ラミブジンを用いた併用療法が、HBVウイルスマーカーの堅牢な低減をもたらすことを示す。図31Dは、塩基編集がHepG2-NTCPにおけるcccDNAレベルを低下させないことを示すグラフである。図31Eは、HepG2-NTCPにおいて、ラミブジンを用いた前処理が、塩基編集率を20%増加させたことを示す。理論に拘束されることを意図するものではないが、ラミブジン前処理条件下での高いcccDNA編集は、CBEがcccDNAを直接標的化する可能性が高いことを示す。 BE4塩基エディターを用いた2つのgRNAの多重化が、HepG2-NTCPにおけるHBVウイルスパラメータを同時に低減したことを示す。図31Aは、塩基編集が、無関係のPCSK9遺伝子を標的化する塩基編集試薬で処理された対照試料と比較して、ウイルス細胞外(HBsAg、HBeAg)、ならびに細胞内(3.5kbRNA、及びHBV DNA)パラメータの効率的な低減をもたらすことを示す一連のグラフを提供する。BE4/gRNA(S1+C2)処理は、ウェスタンブロットで観察されるように、全てのHBアイソフォームを阻害した。図31Bは、ラミブジンによる前処理の場合の実験スケジュールを提供する。図31Cは、パネルAに示される結果と同様に、ラミブジンを用いた併用療法が、HBVウイルスマーカーの堅牢な低減をもたらすことを示す。図31Dは、塩基編集がHepG2-NTCPにおけるcccDNAレベルを低下させないことを示すグラフである。図31Eは、HepG2-NTCPにおいて、ラミブジンを用いた前処理が、塩基編集率を20%増加させたことを示す。理論に拘束されることを意図するものではないが、ラミブジン前処理条件下での高いcccDNA編集は、CBEがcccDNAを直接標的化する可能性が高いことを示す。塩基編集が、PHHにおけるウイルスリバウンドを防止することを示す。図32Aは、PHH上清液中のHBV DNA qPCRによって評価されるHBV複製を示すグラフである。ラミブジンの中止はHBVリバウンドにつながるが、塩基編集はウイルスリバウンドを防止した。塩基編集が、PHHにおけるウイルスリバウンドを防止することを示す。塩基編集が、HBsAg、HBeAg、3.5kbRNA、及びHBV DNAの効率的な低減につながることを示す4つのグラフを含む。塩基編集が、PHHにおけるウイルスリバウンドを防止することを示す。高い抗ウイルス有効性を可能にし、PHHにおけるリバウンドを防止するのに十分な、約55%の編集S抗原及び約80%の編集PreCore遺伝子を示すグラフである。 BE4 mRNA及びgRNA S1/C2のLNP媒介送達が、HBVミニサークルモデルにおけるウイルスマーカーの持続的な減少をもたらすことを示す。Aは、>2対数の平均HBsAgの減少があったことを示すグラフである。有意に、5/9マウスは、検出限界を下回るHBsAgの減少を示した。Bは、HBVがエンテカビル処置群(陽性対照)でリバウンドすることを示すグラフである。塩基編集で処理した群では、血清HBV DNAの>3対数の持続的な減少があった。塩基編集群では、HBVリバウンドは観察されなかった。図33Cは、第1のLNP注射の2週間後の検出限界未満の全てのマウスにおけるHBeAg発現の喪失を示す。平均+/-SEMとして表されるデータ、群当たりn=4または5。 BE4 mRNA及びgRNA S1/C2のLNP媒介送達が、HBVミニサークルモデルにおけるウイルスマーカーの持続的な減少をもたらすことを示す。Cは、第1のLNP注射の2週間後の検出限界未満の全てのマウスにおけるHBeAg発現の喪失を示す。平均+/-SEMとして表されるデータ、群当たりn=4または5。 BE4が、配列番号578のスペーサー配列を有するgRNA EMSbeam12及び配列番号10834のスペーサー配列を有するMSPbeam37-PLCと組み合わせて、アレキサンダー肝腫細胞株PLC/PRF/5に存在する天然に組み込まれたHBVゲノムを編集し(A)、これがHBsAg分泌を減少させた(B)ことを示すグラフである。プロトスペーサー配列も含まれる。MSPbeam37プロトスペーサーは、配列番号508に対応し、MSPbeam37-PLCプロトスペーサー(配列番号10833)は、配列番号508に対して単一の核酸塩基変化を含む。ラミブジン(LAM)による前処理の有無を問わず、インビトロでのHepG2.2.15細胞における塩基編集を評価するための実験設計を示す概略図を提供する。図35において、「D0」、「D1」などは、実験の開始から0日目、1日目などを表し、「SN」は、「上清」を示し、「6dpt」は、「形質導入後6日間」を示す。ガイドgRNA37(g37)またはgRNA12(g12)(HBsAgの発現を低下させるための塩基編集用)と組み合わせて、及び/またはガイドgRNA40(g40)(HBeAgの発現を低下させるための塩基編集用)と組み合わせて、BE4塩基エディターを使用した塩基編集後のHepG2.2.15細胞内のHBsAg及びHBeAgポリペプチドレベルを示す棒グラフを提供する。対照として、細胞を、PCSK9遺伝子を標的化するガイドと組み合わせて、BE4塩基エディターと接触させた。細胞を、ラミブジン(LAM)での前処理を伴って、及び伴わずに塩基編集した。図36Aは、示されたガイドと組み合わせてBE4塩基エディターを使用したLAMによる前処理を伴って、及び伴わずに編集されたHepG2.2.15細胞におけるHBsAg発現レベルを示す。図36Bは、示されたガイドと組み合わせたBE4塩基エディターを使用したLAMによる前処理を伴って、及び伴わずに編集されたHepG2.2.15細胞におけるHBeAg発現レベルを示す。発現レベルを、ANOVA/非パラメトリック検定/マッチングペアなし/PCSK9との多重比較を使用して比較した。ガイドgRNA37(g37)またはgRNA12(g12)(HBsAgの発現を低下させるための塩基編集用)と組み合わせて、及び/またはガイドgRNA40(g40)(HBeAgの発現を低下させるための塩基編集用)と組み合わせて、BE4塩基エディターを使用した塩基編集後のHepG2.2.15細胞内のHBsAg及びHBeAgポリペプチドレベルを示す棒グラフを提供する。対照として、細胞を、PCSK9遺伝子を標的化するガイドと組み合わせて、BE4塩基エディターと接触させた。細胞を、ラミブジン(LAM)での前処理を伴って、及び伴わずに塩基編集した。図36Aは、示されたガイドと組み合わせてBE4塩基エディターを使用したLAMによる前処理を伴って、及び伴わずに編集されたHepG2.2.15細胞におけるHBsAg発現レベルを示す。図36Bは、示されたガイドと組み合わせたBE4塩基エディターを使用したLAMによる前処理を伴って、及び伴わずに編集されたHepG2.2.15細胞におけるHBeAg発現レベルを示す。発現レベルを、ANOVA/非パラメトリック検定/マッチングペアなし/PCSK9との多重比較を使用して比較した。

本開示の本発明は、HBVゲノムを編集するための組成物及び方法を特徴とする。例えば、本明細書で企図される組成物は、一部の実施形態では、塩基エディター、HBV遺伝子内の特定のヌクレオチドを標的化するガイド核酸を含むことができる。一部の実施形態では、編集は、ウイルスタンパク質のうちの1つのコード配列に未熟終止コドンを導入する。別の実施形態では、編集は、1つ以上のHBVタンパク質のコード配列に1つ以上の置換(例えば、ミスセンス変異)を導入する。一実施形態では、編集は、転写要素(例えば、ポリA部位、エンハンサー、またはプロモーター)内の核酸塩基を改変させる。

最近の研究では、より新しい世代のABE(例えば、ABE8)がより高い編集速度を誘導することができることが示されている。更に、それらは、初期世代のシチジン塩基エディター(CBE)と比較して、より低いgRNA非依存性オフターゲット編集を有し、したがって、潜在的な治療アプローチとして関心がある。ABEは、終止コドンの生成を可能にしないが、HBVゲノム内のATリッチ領域を標的化することを可能にする。

HBVを治療するための塩基編集の使用は、cccDNAに永続的な変異を安全に導入することによってHBVリバウンドを有利に防止し、DSBを含まない組み込まれたHBV DNAからのHBsAg発現を不可逆的にサイレンシングする。

以下により詳細に記載されるように、本開示は、シトシン塩基エディター(CBE、CからTへの変換)を使用して、確立されたHBV共有結合閉鎖環状DNA(cccDNA)プールを標的化することを提供する。感染したHepG2-NTCP細胞及び長期初代ヒト肝細胞培養物(PHH)を、選択されたHBV標的gRNA及びCBEをコードするmRNAで共トランスフェクトした。DNA増幅子配列決定によって塩基編集効率を評価し、異なるウイルスパラメータを分析することによって、ウイルス複製に対する塩基編集の結果を決定した。cccDNAの完全性に影響を与えることなく、塩基編集は、HBまたはHBe/HBcオープンリーディングフレーム(ORF)に非センス変異を導入し、全HBV DNA及びHBs/HBe抗原の放出を効率的に阻害した。更に、塩基編集率は、HBV DNA複製中間体のレベルを低下させたヌクレオシド類似体(NA)での前処理の状況で高いままであり、これは、CBEが直接cccDNAを標的化することができることを示している。2つのgRNAをCBEで多重化することにより、HBsAg、HBeAg、全HBV DNA及び3.5kbウイルスプレゲノムRNAのより大きな減少をもたらした。重要なことに、二重gRNA/CBE処理は、HBVリバウンドを防止した。全体として、これらの結果は、CBEがcccDNAを直接標的化し、HBV複製を妨げるHB及びHBe/HBc ORFにおいて非センス変異を生成することができることを示す。更に、これらの効果は、CBE分解後に持続し、HBV cccDNAの永続的な機能的変化を示す。

塩基編集を使用したcccDNA転写活性の標的化
cccDNA転写活性に関与する領域は、ATリッチ領域であり、HBV治癒のためのcccDNA分解への代理物は、cccDNA転写活性の永続的な破壊であり、これは現在達成不可能である。

cccDNA転写活性に関与する領域の一例は、ポリアデニル化シグナル(PAS)であり、これは、全てのHBVウイルスRNAに固有であり、調節エレメント(TATAボックス)としても機能する。cccDNAにおけるこの領域を標的化することは、そのゲノム成分pgRNAを含む全てのウイルスRNA種を不安定化し、cccDNAサイレンシングをもたらす可能性がある。

本明細書に提供される実施例に記載されるように、sgRNAは、cccDNAの調節領域(例えば、エンハンサーI、エンハンサーII、基底コアプロモーター、クリプティック及びカノニカルポリアデニル化シグナル(PAS)、S及びX遺伝子プロモーター)を標的化するインシリコ分析によって同定された。250を超えるsgRNAが同定され、これらの候補がキュレーションされ、高いシリコ予測効率を有するいくつかの候補がHek293-lentiHBVシステムで試験された。

実施例に更に記載されるように、本開示の一部の態様は、HBV遺伝子にミスセンス変異を導入すると予測される高度に保存されたABE gRNAを選択することを含む。例えば、gRNAは、HBV遺伝子型にわたる高い保存性に基づいて、遺伝子型D及びAに焦点を当てて選択された。高い配列保存は、より広い患者集団の標的化を可能にし、また、HBVウイルスが塩基編集処理を逃れることを可能にするウイルス変異の出現を回避するために必要である。選択基準の別の例は、ミスセンス変異をもたらすであろうHBVゲノムにおける編集を生成するgRNAの能力であった。塩基編集試薬によって生成されたアミノ酸の変化について、天然に存在するHBV遺伝子型でめったに検出されない配列を有するミスセンスアミノ酸の変化を生成するであろうgRNAを選択した(<0.05%の頻度のアミノ酸変化)。このようにして、gRNAがHBVタンパク質/ゲノムの破壊につながる変異を導入する可能性が高まった。

HBVゲノム
HBVゲノムは、7つのタンパク質をコードする部分的二本鎖DNA及びオープンリードフレーム(ORF)の約3.2kbである。図1を参照すると、オープンリーディングフレーム(ORF)Pは、ウイルスポリメラーゼをコードする。ORF C/PreCは、キャプシドタンパク質をコードする。ORF PreS1、ORF PreS2、及びORF Sは、それぞれ、大(L)、中(M)、及び小(S)の表面タンパク質をコードする。ORF Xは、分泌Xタンパク質をコードする。

部分的二本鎖のHBVゲノムは、宿主因子によって共有結合閉鎖環状DNA(cccDNA)に変換される。cccDNAは、宿主RNAポリメラーゼによって転写され、プレゲノムRNA(pgRNA)を含むウイルスmRNAを産生する。pgRNAは、HBVポリメラーゼによって、cccDNAに変換されたり、ビリオンにパッケージ化されたり、宿主細胞のゲノムに組み込まれたりすることができるゲノムHBV DNAに転写される(図2)。HBVライフサイクルの重要な成分であるcccDNAは、慢性HBV感染症に関与する安定した分子である。HBVゲノムの編集は、cccDNAの形成を破壊することができ、それによって、ウイルスの病原性を低下させる。

10の異なるHBV遺伝子型(A～J)がある(図3A)。「遺伝子型」は、任意の他のゲノムとの92%未満の配列同一性を特徴とし、サブ遺伝子型は、96%未満～92%の配列同一性を特徴とする。遺伝子型DのHBVは、米国で最も一般的である(図3A)。HBV遺伝子型Dの研究モデルは、ウイルスストック(例えば、遺伝子型D、サブ遺伝子型ayw(Imquest))及びマウスモデル(例えば、ヒト化マウスモデル(Phoenixbio))を含み、利用可能である。
標的ポリヌクレオチドの編集

本開示の本発明は、編集のためのHBV ORFを標的化する方法及び組成物を提供する。これらの組成物は、Cas9または他の核酸プログラマブルDNA結合タンパク質ドメインと、アデノシンまたはシトシンデアミナーゼドメインと、を有する核酸塩基エディターを含むことができる。一部の実施形態では、塩基エディターは、HBV ORFに1つ以上の改変を導入する。一部の実施形態では、変化は、HBVタンパク質の保存された部分における変異をもたらす。特定の実施形態では、改変は、1つ以上の終止コドンを導入する。本明細書を通して、タンパク質の早期終結をもたらす終止コドンの導入は、アミノ酸記号、アミノ酸位置、及び終止という用語によって表される(例えば、R87STOPは、アミノ酸87位でアルギニンをコードするコドンが終止コドンによって置き換えられることを示す)。有利には、本発明の方法は、HBVゲノムに二本鎖切断を導入しない。本発明は、塩基編集を使用して慢性HBVを治療するための戦略を提供する(図3B)。本明細書に記載の方法及び組成物を使用して、終止コドンをウイルス遺伝子に導入することは、二本鎖切断を生成することなく達成され得、それによって、HBVが宿主のゲノムに組み込まれた後に宿主の遺伝物質を切断するリスクを排除または低減する。加えて、組成物は、天然のHBV抗ウイルス制限因子であるデアミナーゼを用いることができる。例えば、インターフェロンアルファまたはリンホトキシンβ受容体(LTBR)によるAPOBECシチジンデアミナーゼの誘導は、脱塩基性部位形成及びcccDNA分解を促進する(図3B)。更に、ウラシルグリコシラーゼ阻害剤ドメインのない塩基エディターを使用することで、細胞ウラシルグリコシラーゼをcccDNAに標的化し、その分解を促進することができる。

実施形態では、HBV ORFは、アデノシンデアミナーゼを含む塩基エディター(すなわち、アデノシン塩基エディター(ABE))を使用して編集される。ABEは、第1世代のrAPOBEC1ベースのCBEと比較して、堅牢なオンターゲット編集及び低gRNA非依存性オフターゲット編集を含むいくつかの利点を有する。ABEは、ウラシルN-グリコシラーゼ(UNG)応答を誘導しない。A>I cccDNA脱アミノ化は、HBVについて記載されていない。ABEは、HBV転写産物に共通するRNAポリアデニル化部位TATAAAを含むポリメラーゼ活性部位及び/またはcccDNA転写部位を編集するために使用することができる。cccDNA転写活性に関与する重要な領域は、ATリッチ領域及びcccDNA分解の代理物である。

一部の態様では、シチジンデアミナーゼまたはアデノシンデアミナーゼドメインを含む塩基エディターを用いてHBV cccDNAを編集するための方法及び組成物が提供される。

以下の表1に、例示的なガイドRNAが提供される。更なる例示的なガイドRNAとしては、表1、2A、2B、及び/または2Cのいずれかで提供されるか、または配列表に列挙される(例えば、配列番号3105～5485及び8220～10830で)スペーサー配列を含有するガイドRNAが挙げられる。様々な実施形態では、複数のガイドRNAを、任意選択的に1つ以上の核酸塩基エディターポリペプチドと組み合わせて、同時に、対象または細胞に投与することができる。実施形態では、マルチプルガイドRNAには、2、3、4、5、6、7、8、9、10個、またはそれ以上のガイドが含まれ、任意選択的に、ガイドRNAは、cas12b-4、cas12b-5、cas12b-11、cas12b-17、cas12b-30、cas12b-42、cas12b-100、cas12b-147、cas12b-154、cas12b-35、cas12b-124、cas12b-127、及びcas12b-122bのうちの2つ以上から選択される(表1を参照されたい)。実施形態では、対象または細胞に投与される複数のガイドRNAは、2つのガイドRNA(例えば、gRNA37及びgRNA40、表1を参照されたい)を含有する。ガイドは、任意選択的に、1つ以上の核酸塩基エディターポリペプチド(複数可)(例えば、mRNA分子(複数可)によってコードされる塩基エディター(複数可))と同時にまたは連続して投与することができる。本開示のガイドRNA分子での使用に好適なスペーサー配列の非限定的な例としては、B型肝炎ウイルスゲノムの任意の部分を標的化する任意のスペーサー配列が挙げられる。そのようなスペーサー配列は、当業者に利用可能な方法を使用して設計及び選択することができる(例えば、特定の配列を標的化するgRNAの設計は、市販サービスとしてInvitrogenから入手可能である)。gRNA選択には、非限定的な例として、1)HBV転写エレメントを標的化すること、及び2)HBV遺伝子にミスセンス変異を導入すると予測される高度に保存されたABE gRNAを選択することを含む、様々な戦略を使用することができる。実施形態では、ガイドRNAを使用して、HBV遺伝子(例えば、cas12b-4、cas12b-5、cas12b-11、cas12b-17、cas12b-30、cas12b-42、cas12b-100、cas12b-147、またはcas12b-154)へのミスセンス変異の導入のための塩基エディターを標的指向化することができる。表1に列挙されているガイドRNA、または表2A、表2B、表2Cに列挙されているか、もしくは配列表の配列番号3105～5485及び8220～10830の中もしくは任意の場所に列挙されているスペーサー配列を含む任意選択のガイドRNAはまた、転写部位(例えば、cas12b-35、cas12b-124、cas12b-127、またはcas12b-122b)で核酸塩基を改変するための塩基エディターを標的指向化するために使用することができる。表1のガイドRNA、または表2A、表2B、表2Cに列挙されているか、もしくは配列表の任意の場所(例えば、配列番号3105～5485及び8220～10830の中)に列挙されているスペーサー配列を含む任意のガイドRNAによって塩基編集のために標的とされ得る転写部位としては、エンハンサーIIボックスA(例えば、cas12b-35)、エンハンサーI(例えば、cas12b-124またはcas12b-127)、及びHBXプロモーター(例えば、cas12b-122b)が挙げられる。転写部位の非限定的な例としては、基底コアプロモーター(BCP)、エンハンサーI、エンハンサーII、HBVポリA部位、HBXプロモーター、及びSプロモーター-CCAATC-領域IIが挙げられる。本発明のガイドRNAは、任意の塩基エディター(例えば、Cas12b-ABE(ABE-bhCas12b);配列番号418)と組み合わせて使用することができる。塩基エディターは、以下の表2Aまたは表2Bに列挙されたPAM配列(例えば、RTTN配列)を標的化することができる。

実施形態では、2つ以上のガイドRNAが、任意選択的に同時に、対象に導入される。実施形態では、2つ以上のガイドRNAとしては、cas12b-5及びcas12b-4;cas12b-11及びcas12b-4;cas12b-17及びcas12b-4;cas12b-30及びcas12b-4;cas12b-42及びcas12b-4;cas12b-100及びcas12b-4;cas12b-147及びcas12b-4;cas12b-154及びcas12b-4;cas12b-35及びcas12b-4;cas12b-124及びcas12b-4;cas12b-127及びcas12b-4;cas12b-122b及びcas12b-4;cas12b-11及びcas12b-5;cas12b-17及びcas12b-5;cas12b-30及びcas12b-5;cas12b-42及びcas12b-5;cas12b-100及びcas12b-5;cas12b-147及びcas12b-5;cas12b-154及びcas12b-5;cas12b-35及びcas12b-5;cas12b-124及びcas12b-5;cas12b-127及びcas12b-5;cas12b-122b及びcas12b-5;cas12b-17及びcas12b-11;cas12b-30及びcas12b-11;cas12b-42及びcas12b-11;cas12b-100及びcas12b-11;cas12b-147及びcas12b-11;cas12b-154及びcas12b-11;cas12b-35及びcas12b-11;cas12b-124及びcas12b-11;cas12b-127及びcas12b-11;cas12b-122b及びcas12b-11;cas12b-30及びcas12b-17;cas12b-42及びcas12b-17;cas12b-100及びcas12b-17;cas12b-147及びcas12b-17;cas12b-154及びcas12b-17;cas12b-35及びcas12b-17;cas12b-124及びcas12b-17;cas12b-127及びcas12b-17;cas12b-122b及びcas12b-17;cas12b-42及びcas12b-30;cas12b-100及びcas12b-30;cas12b-147及びcas12b-30;cas12b-154及びcas12b-30;cas12b-35及びcas12b-30;cas12b-124及びcas12b-30;cas12b-127及びcas12b-30;cas12b-122b及びcas12b-30;cas12b-100及びcas12b-42;cas12b-147及びcas12b-42;cas12b-154及びcas12b-42;cas12b-35及びcas12b-42;cas12b-124及びcas12b-42;cas12b-127及びcas12b-42;cas12b-122b及びcas12b-42;cas12b-147及びcas12b-100;cas12b-154及びcas12b-100;cas12b-35及びcas12b-100;cas12b-124及びcas12b-100;cas12b-127及びcas12b-100;cas12b-122b及びcas12b-100;cas12b-154及びcas12b-147;cas12b-35及びcas12b-147;cas12b-124及びcas12b-147;cas12b-127及びcas12b-147;cas12b-122b及びcas12b-147;cas12b-35及びcas12b-154;cas12b-124及びcas12b-154;cas12b-127及びcas12b-154;cas12b-122b及びcas12b-154;cas12b-124及びcas12b-35;cas12b-127及びcas12b-35;cas12b-122b及びcas12b-35;cas12b-127及びcas12b-124;cas12b-122b及びcas12b-124;またはcas12b-122b及びcas12b-127が挙げられる(表1を参照されたい)。

上に記載の遺伝子編集を生成するために、細胞(例えば、肝細胞)を、2つ以上のガイドRNA及び核酸塩基エディターポリペプチド(核酸プログラマブルDNA結合タンパク質(napDNAbp)とシチジンデアミナーゼまたはアデノシンデアミナーゼとを含む)と接触させる。一部の実施形態では、編集される細胞は、少なくとも1つの核酸と接触する。ここで、少なくとも1つの核酸は、2つ以上のガイドRNA及び核酸塩基エディターポリペプチド(核酸プログラマブルDNA結合タンパク質(napDNAbp)とシチジンデアミナーゼとを含む)をコードする。一部の実施形態では、gRNAは、ヌクレオチド類似体(例えば、mA*、mC*、mG*、及び/またはmU*)を含む。これらのヌクレオチド類似体は、細胞プロセスによるgRNAの分解を阻害することができる。表2A～2Cは、gRNAに使用される例示的な標的及びスペーサー配列を提供する。更に例示的な標的配列及びスペーサー配列を、それぞれ配列番号724～3104及び5609～8219、ならびに配列番号3105～5485及び8220～10830として配列表に示す。gRNAは、全てのHBV遺伝子型(例えば、A、B、C、D、E、F、G、及び/またはH)の全部または一部分を標的化することができる。gRNAは、特定の遺伝子型または遺伝子型のセットのB型肝炎ウイルスの50%、55%、60%、65%、70%、75%、80%、85%、90%、85%、または全てを標的化することができる。

様々な実施形態では、本開示のgRNA(例えば、gRNA37-HMまたはgRNA40-HM)は、以下の「重度修飾」(HM)足場を含有する:gUUUUAGagcuagaaauagcaaGUUaAaAuAaggcuaGUccGUUAucAAcuugaaaaagugGcaccgagucggugcusususu(配列番号317)。式中、「a」、「c」、「u」、または「g」は、それぞれ、2’O-メチル(M)修飾を含有するA、C、U、またはGヌクレオチドを表し、as、cs、us、またはgsは、それぞれ、2’-O-メチル3’-ホスホロチオエート(MS)修飾を含有するA、C、U、またはGヌクレオチドを表す。実施形態では、本開示のガイドRNAは、HM足場及び表2A～2Cのいずれか1つに列挙されたスペーサー配列を含有する。

gRNAは、HBVコアタンパク質、HBVポリメラーゼ遺伝子、HBV表面タンパク質、またはHBV Xタンパク質を標的化することができる。実施形態では、gRNAによって標的化された配列に関連するPAM配列は、限定的ではない。他の標的は、cccDNA転写活性に関与し、全ての重要なRNAに固有のポリアデニル化シグナル(PAS)を挙げることができる。PASは、調節エレメント(TATAボックス)としても機能する。cccDNA中のPASを標的化することは、pgRNAを含む全てのウイルスRNA種を不安定化させ、cccDNAサイレンシングをもたらす可能性がある。sgRNAは、cccDNAの主な調節領域(例えば、エンハンサーI、エンハンサーII、基底コアプロモーター、クリプティック及びカノニカルポリアデニル化シグナル(PAS)、ならびにS及びX遺伝子プロモーター)を標的化することができる。gRNAは、細胞(例えば、HEK293-lentiHBVシステム)で試験される前に、インシリコで設計及び評価することができる。

実施形態では、ガイドE1～E24のいずれか1つは、SaCas9を含む核酸塩基エディターポリペプチドと組み合わせて使用され、及び/またはNNRRT、NGG、またはNGA PAM配列に関連する配列を標的化する。実施形態では、本明細書に提供されるスペーサー配列(例えば、表2A～2Cのうちのいずれかまたは配列表に列挙されるもの)のうちのいずれか、またはそれらのバリアントを含むガイドRNAを、本明細書に提供される塩基エディター及び/または核酸プログラマブルDNA結合タンパク質(例えば、BE4またはCas12b)のうちのいずれかと組み合わせて使用する。

特定の実施形態では、本明細書に提供される融合タンパク質は、融合タンパク質の塩基編集活性を改善する1つ以上の特徴を含む。例えば、本明細書に提供される融合タンパク質のいずれかは、減少したヌクレアーゼ活性を有するCas9ドメインを含み得る。一部の実施形態では、本明細書に提供される融合タンパク質のいずれかは、ヌクレアーゼ活性を有しないCas9ドメイン(dCas9)、または二重鎖DNA分子の1つの鎖を切断するCas9ドメイン(Cas9ニッカーゼ(nCas9)と称される)を有し得る。任意の特定の理論に拘束されることを望むものではないが、触媒残基(例えば、H840)の存在により、標的核酸塩基の反対側の未編集(例えば、メチル化されていない)鎖を切断するCas9の活性が維持される。触媒残基の変異(例えば、D10からA10)は、標的A残基を含有する編集された鎖の切断を防ぐ。そのようなCas9バリアントは、gRNAで定義された標的配列に基づいて、特定の位置で一本鎖DNA切断(ニック)を生成することができ、未編集鎖の修復をもたらし、最終的には、未編集鎖で核酸塩基の変化をもたらす。

一部の実施形態では、HBV遺伝子の正確な改変は、ウイルスの毒性を低下させる、及び/またはインビトロで増殖するウイルスの能力を低下させる。修飾は、未熟終止コドンまたはHBVタンパク質の活性を損なうか、さもなければ低下させる他の変異であり得る。一部の実施形態では、修飾のために標的とされるHBV遺伝子は、pol、X、S、pre-S1、pre-S2、pre-core遺伝子のコア、転写部位、またはそれらの組み合わせである。

核酸塩基エディター
ポリヌクレオチドの標的ヌクレオチド配列を編集、修飾または改変する核酸塩基エディターは、本明細書に記載の方法及び組成物において有用である。本明細書に記載される核酸塩基エディターは、通常、ポリヌクレオチドプログラマブルヌクレオチド結合ドメイン及び核酸塩基編集ドメイン(例えば、アデノシンデアミナーゼまたはシチジンデアミナーゼ)を含む。ポリヌクレオチドプログラマブルヌクレオチド結合ドメインは、結合したガイドポリヌクレオチド(例えば、gRNA)と結合した場合、標的ポリヌクレオチド配列に特異的に結合することができ、それによって塩基エディターを編集したい標的核酸配列に局在化させることができる。

ポリヌクレオチドプログラマブルヌクレオチド結合ドメイン
ポリヌクレオチドプログラマブルヌクレオチド結合ドメインは、ポリヌクレオチド(例えば、RNA、DNA)に結合する。塩基エディターのポリヌクレオチドプログラマブルヌクレオチド結合ドメインは、それ自体、1つ以上のドメイン(例えば、1つ以上のヌクレアーゼドメイン)を含み得る。一部の実施形態では、ポリヌクレオチドプログラマブルヌクレオチド結合ドメインのヌクレアーゼドメインは、エンドヌクレアーゼまたはエキソヌクレアーゼを含み得る。エンドヌクレアーゼは、二本鎖核酸分子の一本鎖、または二本鎖核酸分子の両方の鎖を切断することができる。一部の実施形態では、ポリヌクレオチドプログラマブルヌクレオチド結合ドメインのヌクレアーゼドメインは、標的ポリヌクレオチドの0本、1本、または2本の鎖を切断することができる。

塩基エディターに組み込むことができるポリヌクレオチドプログラマブルヌクレオチド結合ドメインの非限定的な例として、CRISPRタンパク質由来ドメイン、制限ヌクレアーゼ、メガヌクレアーゼ、TALヌクレアーゼ(TALEN)、及びジンクフィンガーヌクレアーゼ(ZFN)が挙げられる。一部の実施形態では、塩基エディターは、天然もしくは修飾タンパク質またはその一部を含むポリヌクレオチドプログラマブルヌクレオチド結合ドメインを含み、結合したガイド核酸を介して、CRISPR(すなわち、クラスター化して規則的な配置の短い回文配列リピート)を介した核酸の修飾中に核酸配列に結合することができる。そのようなタンパク質は、本明細書において「CRISPRタンパク質」と呼ばれる。したがって、本明細書において、CRISPRタンパク質の全部または一部を含むポリヌクレオチドプログラマブルヌクレオチド結合ドメインを含む塩基エディター(すなわち、塩基エディターの「CRISPRタンパク質由来ドメイン」とも呼ばれる、CRISPRタンパク質の全部または一部をドメインとして含む塩基エディター)が開示される。塩基エディターに組み込まれたCRISPRタンパク質由来ドメインは、野生型または天然バージョンのCRISPRタンパク質と比較して、修飾され得る。例えば、以下に記載するように、CRISPRタンパク質由来ドメインは、CRISPRタンパク質の野生型または天然バージョンに対して、1つ以上の変異、挿入、欠失、再編、及び/または組換えを含み得る。

本明細書で使用され得るCasタンパク質には、クラス1及びクラス2が挙げられる。Casタンパク質の非限定的な例として、Cas1、Cas1B、Cas2、Cas3、Cas4、Cas5、Cas5d、Cas5t、Cas5h、Cas5a、Cas6、Cas7、Cas8、(Csn1またはCsx12としても知られる)Cas9、Cas10、Csy1、Csy2、Csy3、Csy4、Cse1、Cse2、Cse3、Cse4、Cse5e、Csc1、Csc2、Csa5、Csn1、Csn2、Csm1、Csm2、Csm3、Csm4、Csm5、Csm6、Cmr1、Cmr3、Cmr4、Cmr5、Cmr6、Csb1、Csb2、Csb3、Csx17、Csx14、Csx10、Csx16、CsaX、Csx3、Csx1、Csx1S、Csf1、Csf2、CsO、Csf4、Csd1、Csd2、Cst1、Cst2、Csh1、Csh2、Csa1、Csa2、Csa3、Csa4、Csa5、Cas12a/Cpf1、Cas12b/C2c1(例えば、配列番号232)、Cas12c/C2c3、Cas12d/CasY、Cas12e/CasX、Cas12g、Cas12h、Cas12i及びCas12j/CasΦ、CARF、DinG、それらの相同体、またはそれらの修飾されたバージョンが挙げられる。CRISPR酵素は、標的配列で、例えば、標的配列内及び/または標的配列の相補配列内で、一方または両方の鎖の切断を指示することができる。例えば、CRISPR酵素は、標的配列の最初または最後のヌクレオチドから約1、2、3、4、5、6、7、8、9、10、15、20、25、50、100、200、500、またはそれ以上の塩基対内の一方または両方の鎖の切断を指示することができる。

変異型CRISPR酵素が、標的配列を含有する標的ポリヌクレオチドの一方または両方の鎖を切断する能力を欠くように、対応する野生型酵素に対して変異導入したCRISPR酵素をコードするベクターを使用することができる。Casタンパク質(例えば、Cas9、Cas12)またはCasドメイン(例えば、Cas9、Cas12)は、野生型の例示的なCasポリペプチドまたはCasドメインに対して、少なくともまたは少なくとも約50%、60%、70%、80%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、または100%の配列同一性及び/または配列相同性を有するポリペプチドまたはドメインを指し得る。Cas(例えば、Cas9、Cas12)は、欠失、挿入、置換、バリアント、変異、融合、キメラ、またはそれらの任意の組み合わせなどのアミノ酸変化を含み得るCasタンパク質の野生型または修飾形態を指し得る。

一部の実施形態では、塩基エディターのCRISPRタンパク質由来ドメインは、Corynebacterium ulcerans(NCBI参照:NC_015683.1、NC_017317.1)、Corynebacterium diphtheria(NCBI参照:NC_016782.1、NC_016786.1)、Spiroplasma syrphidicola(NCBI参照:NC_021284.1)、Prevotella intermedia(NCBI参照:NC_017861.1)、Spiroplasma taiwanense(NCBI参照:NC_021846.1)、Streptococcus iniae(NCBI参照:NC_021314.1)、Belliella baltica(NCBI参照:NC_018010.1)、Psychroflexus torquis(NCBI参照:NC_018721.1)、Streptococcus thermophilus(NCBI参照:YP_820832.1)、Listeria innocua(NCBI参照:NP_472073.1)、Campylobacter jejuni(NCBI参照:YP_002344900.1)、Neisseria meningitidis(NCBI参照:YP_002342100.1)、Streptococcus pyogenes、またはStaphylococcus aureus由来のCas9の全部または一部を含み得る。

Cas9ヌクレアーゼの配列及び構造は、当業者に周知である(例えば、“Complete genome sequence of an Ml strain of Streptococcus pyogenes.”Ferretti et al.,Proc.Natl.Acad.Sci.U.S.A.98:4658-4663(2001)、“CRISPR RNA maturation by trans-encoded small RNA and host factor RNase III.”Deltcheva E.,et al.,Nature 471:602-607(2011)、及び“A programmable dual-RNA-guided DNA endonuclease in adaptive bacterial immunity.”Jinek M.,et al.,Science 337:816-821(2012)を参照されたい。それらの各々の内容全体が、参照により本明細書に援用される)。Cas9オルソログは、これらに限定されないが、S.pyogenes及びS.thermophilusを含む様々な種で記載されている。更なる好適なCas9ヌクレアーゼ及び配列は、本開示に基づいて当業者には明らかであり、そのようなCas9ヌクレアーゼ及び配列として、Chylinski,Rhun,and Charpentier,“The tracrRNA and Cas9 families of type II CRISPR-Cas immunity systems”(2013)RNA Biology 10:5,726-737に開示されている生物及び遺伝子座に由来するCas9配列が挙げられ、その内容全体が、参照により本明細書に援用される。

高忠実度Cas9ドメイン
本開示の一部の態様は、高忠実度Cas9ドメインを提供する。高忠実度Cas9ドメインは、当該技術分野で既知であり、例えば、Kleinstiver,B.P.,et al.“High-fidelity CRISPR-Cas9 nucleases with no detectable genome-wide off-target effects.”Nature 529,490-495(2016)及びSlaymaker,I.M.,et al.“Rationally engineered Cas9 nucleases with improved specificity.”Science 351,84-88(2015)に記載されており、それらの各々の内容全体は、参照により本明細書に援用される。例示的な高忠実度Cas9ドメインを、配列番号233として配列表に示す。一部の実施形態では、高忠実度Cas9ドメインは、対応する野生型Cas9ドメインに対して、Cas9ドメインとDNAの糖-リン酸骨格との間の静電相互作用を低下させる1つ以上の変異を含む改変Cas9ドメインである。DNAの糖リン酸骨格との静電相互作用が低下した高忠実度Cas9ドメインは、オフターゲット効果がより少ない。一部の実施形態では、Cas9ドメイン(例えば、野生型Cas9ドメイン(配列番号197及び200))は、Cas9ドメインとDNAの糖リン酸骨格との間の会合を低下させる1つ以上の変異を含む。一部の実施形態では、Cas9ドメインは、Cas9ドメインとDNAの糖リン酸骨格との間の会合を少なくとも1%、少なくとも2%、少なくとも3%、少なくとも4%、少なくとも5%、少なくとも10%、少なくとも15%、少なくとも20%、少なくとも25%、少なくとも30%、少なくとも35%、少なくとも40%、少なくとも45%、少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、または少なくとも70%低下させる1つ以上の変異を含む。

一部の実施形態では、本明細書で提供されるCas9融合タンパク質のうちのいずれかは、D10A、N497X、R661X、Q695X及び/またはQ926X変異のうちの1つ以上、または本明細書で提供されるアミノ酸配列のうちのいずれかにおける対応する変異を含み、Xは、いずれかのアミノ酸である。一部の実施形態では、高忠実度Cas9酵素は、SpCas9(K855A)、eSpCas9(1.1)、SpCas9-HF1、または超正確Cas9バリアント(HypaCas9)である。一部の実施形態では、修飾されたCas9であるeSpCas9(1.1)は、アラニン置換を含有し、アラニン置換は、HNH/RuvCグルーブと非標的DNA鎖との間の相互作用を弱め、鎖分離及びオフターゲット部位での切断を防止する。同様に、SpCas9-HF1は、Cas9とDNAリン酸骨格との相互作用を破壊するアラニン置換を介してオフターゲット編集を低下させる。HypaCas9は、REC3ドメイン内に、Cas9プルーフリーディング及び標的識別を高める変異(SpCas9 N692A/M694A/Q695A/H698A)を含有する。3つ全ての高忠実度酵素は、野生型Cas9よりも少ないオフターゲット編集を生成する。

排他性が低下したCas9ドメイン
典型的には、Cas9タンパク質、例えば、S.pyogenesからのCas9(spCas9)は、「プロトスペーサー隣接モチーフ(PAM)」またはPAM様モチーフを必要とし、PAMまたはPAM様モチーフは、CRISPR細菌適応免疫系におけるCas9ヌクレアーゼによって標的とされるDNA配列の直後の2～6つの塩基対のDNA配列である。NGG PAM配列の存在は、特定の核酸領域に結合するために必要とされ、「NGG」における「N」は、アデノシン(A)、チミジン(T)またはシトシン(C)であり、Gは、グアノシンである。これにより、ゲノム内で所望の塩基を編集する能力が制限され得る。一部の実施形態では、本明細書に提供される塩基編集融合タンパク質は、正確な位置(例えば、PAMの上流にある標的塩基を含む領域)に配置される必要があり得る。例えば、Komor,A.C.,et al.,“Programmable editing of a target base in genomic DNA without double-stranded DNA cleavage”Nature 533,420-424(2016)を参照されたい(その内容全体が、参照により本明細書に援用される)。PAM配列に結合することができるspCas9タンパク質の例示的なポリペプチド配列を、配列番号197、201、及び234～237として配列表に示す。したがって、一部の実施形態では、本明細書に提供される融合タンパク質のいずれかは、正準(例えば、NGG)PAM配列を含有しないヌクレオチド配列に結合することができるCas9ドメインを含有し得る。非正準PAM配列に結合するCas9ドメインは、当該技術分野で記載されており、当業者には明らかであろう。例えば、非正準PAM配列に結合するCas9ドメインは、Kleinstiver,B.P.,et al.,“Engineered CRISPR-Cas9 nucleases with altered PAM specificities”Nature 523,481-485(2015)、及びKleinstiver,B.P.,et al.,“Broadening the targeting range of Staphylococcus aureus CRISPR-Cas9 by modifying PAM recognition”Nature Biotechnology 33,1293-1298(2015)に記載されている(各々の内容全体が、参照により本明細書に援用される)。

ニッカーゼ
一部の実施形態では、ポリヌクレオチドプログラマブルヌクレオチド結合ドメインは、ニッカーゼドメインを含むことができる。本明細書において、「ニッカーゼ」という用語は、二重鎖核酸分子(例えばDNA)の2本鎖のうちの1つの鎖のみを切断することができるヌクレアーゼドメインを含む、ポリヌクレオチドプログラマブルヌクレオチド結合ドメインを指す。一部の実施形態では、ニッカーゼは、活性ポリヌクレオチドプログラマブルヌクレオチド結合ドメインに1つ以上の変異を導入することによって、ポリヌクレオチドプログラマブルヌクレオチド結合ドメインの完全な触媒活性(例えば、天然)形態に由来し得る。例えば、ポリヌクレオチドプログラマブルヌクレオチド結合ドメインが、Cas9に由来するニッカーゼドメインを含む場合、Cas9由来ニッカーゼドメインは、D10A変異及び位置840のヒスチジンを含み得る。そのような実施形態では、残基H840は、触媒活性を保持し、それによって、核酸二重鎖の一本鎖を切断することができる。別の例では、Cas9由来のニッカーゼドメインは、H840A変異を含んでもよいが、位置10のアミノ酸残基はDのままである。一部の実施形態では、ニッカーゼは、ニッカーゼ活性に必要とされないヌクレアーゼドメインの全部または一部を除去することによって、完全に触媒活性な(例えば、天然の)形態のポリヌクレオチドプログラマブルヌクレオチド結合ドメインに由来し得る。例えば、ポリヌクレオチドプログラマブルヌクレオチド結合ドメインがCas9に由来するニッカーゼドメインを含む場合、Cas9由来ニッカーゼドメインは、RuvCドメインまたはHNHドメインの全部または一部の欠失を含み得る。

一部の実施形態では、野生型Cas9は、以下のアミノ酸配列に対応するか、またはそれを含む:

一部の実施形態では、ニッカーゼドメイン(例えば、Cas9由来ニッカーゼドメイン、Cas12由来ニッカーゼドメイン)を含む塩基エディターによって切断される、核酸二重鎖標的ポリヌクレオチド配列の鎖は、塩基エディターによって編集されない鎖である(すなわち、塩基エディターによって切断される鎖は、編集される塩基を含む鎖と反対である)。他の実施形態では、ニッカーゼドメイン(例えば、Cas9由来ニッカーゼドメイン、Cas12由来ニッカーゼドメイン)を含む塩基エディターは、編集のために標的とされているDNA分子の鎖を切断することができる。そのような実施形態では、非標的鎖は切断されない。

一部の実施形態では、Cas9ヌクレアーゼは、不活性(例えば、不活性化)DNA切断ドメインを有し、すなわち、(「ニッカーゼ」Cas9の場合)Cas9は、ニッカーゼであり、「nCas9」タンパク質と称される。Cas9ニッカーゼは、二重鎖核酸分子(例えば、二重鎖DNA分子)の一方の鎖のみを切断することができるCas9タンパク質であり得る。一部の実施形態では、Cas9ニッカーゼは、二重鎖核酸分子の標的鎖を切断するが、これはCas9ニッカーゼが、Cas9に結合しているgRNA(例えば、sgRNA)と塩基対形成する(相補的である)鎖を切断することを意味する。一部の実施形態では、Cas9ニッカーゼは、D10A変異を含み、840位にヒスチジンを有する。一部の実施形態では、Cas9ニッカーゼは、二重鎖核酸分子の非標的の未塩基編集鎖を切断し、つまり、Cas9ニッカーゼが、Cas9に結合しているgRNA(例えば、sgRNA)と塩基対を形成していない鎖を切断することを意味する。一部の実施形態では、Cas9ニッカーゼは、H840A変異を含み、位置10にアスパラギン酸残基、または対応する変異を有する。一部の実施形態では、Cas9ニッカーゼは、本明細書に提供されるCas9ニッカーゼのいずれか1つと、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも99.5%同一であるアミノ酸配列を含む。更なる好適なCas9ニッカーゼは、本開示及び当該分野の知識に基づいて、当業者には明らかであり、本開示の範囲内である。

例示的な触媒性Cas9ニッカーゼ(nCas9)のアミノ酸配列は、以下のとおりである:
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD(配列番号201)。

Cas9ヌクレアーゼは、2つの機能的なエンドヌクレアーゼドメイン(RuvC及びHNH)を有する。Cas9は、標的結合時にコンフォメーション変化を起こし、ヌクレアーゼドメインを標的DNAの反対側の鎖を切断するように位置付ける。Cas9媒介性DNA切断の最終結果は、標的DNA内の二本鎖切断(DSB)である(PAM配列の約3～4ヌクレオチド上流)。次いで、得られたDSBは、以下の2つの一般的な修復経路のうちの1つによって修復される:(1)効率的だがエラーを起こしやすい非相同末端結合(NHEJ)経路、または(2)効率は低いが忠実度が高い相同組換え修復(HDR)経路。

非相同末端結合(NHEJ)及び/または相同組換え修復(HDR)の「効率」は、任意の好都合な方法によって計算することができる。例えば、一部の実施形態では、効率は、成功したHDRのパーセンテージで表すことができる。例えば、サーベイヤーヌクレアーゼアッセイを使用して切断生成物を生成することができ、生成物と基質との比を使用してパーセンテージを計算することができる。例えば、サーベイヤーヌクレアーゼ酵素を使用して、HDRの成功で得られる新たに組み込まれた制限配列を含有するDNAを、直接切断することができる。より多くの基質の切断は、より高いパーセントのHDRを示す(より高い効率のHDR)。例示的な例として、HDRの割合(パーセンテージ)は、以下の式[(切断生成物)/(基質+切断生成物)]を使用して計算することができる(例えば、(b+c)/(a+b+c)。式中、「a」はDNA基質のバンド強度であり、「b」及び「c」は切断生成物のバンド強度である)。

一部の実施形態では、効率は、成功したNHEJのパーセンテージで表し得る。例えば、T7エンドヌクレアーゼIアッセイを使用して、切断生成物を生成することができ、生成物と基質との比を使用して、NHEJの割合を計算することができる。T7エンドヌクレアーゼIは、野生型及び変異型DNA鎖のハイブリダイゼーションから生じる不一致のヘテロ二重鎖DNAを切断する(NHEJは、元の切断部位で小さなランダムな挿入または欠失(インデル)を生成する)。より多くの切断は、より高いパーセントのNHEJ(より高い効率のNHEJ)を示す。例示的な例として、NHEJの割合(パーセンテージ)を、以下の式を使用して計算することができる:(1-(1-(b+c)/(a+b+c))^1/2)×100(式中、「a」は、DNA基質のバンド強度であり、「b」及び「c」は、切断産物である)(Ran et.al.,Cell.2013 Sep.12;154(6):1380-9及びRan et al.,Nat Protoc.2013 Nov.;8(11):2281-2308)。

NHEJ修復経路は、最も活性な修復機構であり、DSB部位において小さなヌクレオチドの挿入または欠失(インデル)を頻繁に引き起こす。Cas9及びgRNA、またはガイドポリヌクレオチドを発現する細胞集団は、多様な変異をもたらし得るため、NHEJ媒介性DSB修復のランダム性は、重要な実用的な意味を有する。ほとんどの実施形態では、NHEJは、標的DNA内に小さなインデルを生じさせ、標的遺伝子のオープンリーディングフレーム(ORF)内の未熟終止コドンにつながるアミノ酸の欠失、挿入、またはフレームシフト変異をもたらす。理想的な最終結果は、標的遺伝子内の機能喪失変異である。

NHEJ媒介性DSB修復は、しばしば遺伝子のオープンリーディングフレームを破壊するが、相同組換え修復(HDR)を使用して、単一のヌクレオチド変化から大きな挿入(例えば、フルオロフォアまたはタグの添加)までの範囲の特定のヌクレオチド変化を生成することができる。

HDRを遺伝子編集に利用するために、所望の配列を含有するDNA修復鋳型を、gRNA(複数可)及びCas9またはCas9ニッカーゼを用いて目的の細胞型に送達することができる。修復鋳型は、所望の編集、ならびに標的のすぐ上流及び下流の追加の相同配列(左相同性アーム及び右相同性アームと称される)を含有することができる。各相同性アームの長さは、導入される変化のサイズに依存し得、より大きな挿入は、より長い相同性アームを必要とする。修復鋳型は、一本鎖オリゴヌクレオチド、二本鎖オリゴヌクレオチド、または二本鎖DNAプラスミドであってもよい。Cas9、gRNA、及び外因性修復鋳型を発現する細胞でさえ、HDRの効率は概して低い(修飾アレルの10%未満)。HDRは、細胞周期のS期及びG2期の間に行われるため、HDRの効率は、細胞を同期させることによって増強され得る。NHEJに関与する遺伝子を化学的または遺伝的に阻害することで、HDR頻度を増加させることもできる。

一部の実施形態では、Cas9は、修飾されたCas9である。所与のgRNA標的指向化配列は、部分的な相同性が存在するゲノム全体に追加の部位を有し得る。これらの部位はオフターゲットと呼ばれ、gRNAを設計する際に考慮する必要がある。gRNA設計の最適化に加えて、Cas9への修飾を通じて、CRISPRの特異性を高めることもできる。Cas9は、RuvCとHNHの2つのヌクレアーゼドメインの複合活性を介して二本鎖切断(DSB)を生成する。SpCas9のD10A変異体であるCas9ニッカーゼは、1つのヌクレアーゼドメインを保持し、DSBではなくDNAニックを生成する。ニッカーゼシステムは、特定の遺伝子編集のためのHDRを介した遺伝子編集と組み合わせることもできる。

触媒的に不活性なヌクレアーゼ
また、触媒的に不活性な(すなわち、標的ポリヌクレオチド配列を切断することができない)ポリヌクレオチドプログラマブルヌクレオチド結合ドメインを含む塩基エディターも本明細書に提供される。本明細書において、用語「触媒的に不活性な(catalytically dead)」及び「ヌクレアーゼ不活性型(nuclease dead)」は、核酸の鎖を切断することができないという結果をもたらす1つ以上の変異及び/または欠失を有するポリヌクレオチドプログラマブルヌクレオチド結合ドメインを指すために同じ意味で用いられる。一部の実施形態では、触媒的に不活性なポリヌクレオチドプログラマブルヌクレオチド結合ドメイン塩基エディターは、1つ以上のヌクレアーゼドメインにおける特定の点変異の結果として、ヌクレアーゼ活性を欠損し得る。例えば、Cas9ドメインを含む塩基エディターの場合、Cas9はD10A変異及びH840A変異の両方を含み得る。そのような変異は、両方のヌクレアーゼドメインを不活性化し、それによってヌクレアーゼ活性の喪失をもたらす。他の実施形態では、触媒的に不活性なポリヌクレオチドプログラマブルヌクレオチド結合ドメインは、触媒ドメイン(例えば、RuvC1及び/またはHNHドメイン)の全部または一部の1つ以上の欠失を含み得る。更なる実施形態では、触媒的に不活性なポリヌクレオチドプログラマブルヌクレオチド結合ドメインは、点変異(例えば、D10AまたはH840A)、及びヌクレアーゼドメインの全部または一部の欠失を含む。dCas9ドメインは、当該技術分野で既知であり、例えば、Qi et al.,“Repurposing CRISPR as an RNA-guided platform for sequence-specific control of gene expression.”Cell.2013;152(5):1173-83に記載されており、その内容全体は、参照により本明細書に援用される。

更なる好適なヌクレアーゼ不活性dCas9ドメインは、本開示及び当該分野の知識に基づいて、当業者には明らかであり、本開示の範囲内である。そのような更なる例示的で好適なヌクレアーゼ不活性Cas9ドメインとして、D10A/H840A、D10A/D839A/H840A、及びD10A/D839A/H840A/N863A変異体ドメインが挙げられるが、これらに限定されない(例えば、Prashant et al.,CAS9 transcriptional activators for target specificity screening and paired nickases for cooperative genome engineering.Nature Biotechnology.2013;31(9):833-838を参照されたく、その内容全体は、参照により本明細書に援用される)。

一部の実施形態では、dCas9は、Cas9ヌクレアーゼ活性を不活性化する1つ以上の変異を有するCas9アミノ酸配列に対応するか、または部分的もしくは全体的にそれを含む。一部の実施形態では、ヌクレアーゼ不活性dCas9ドメインは、本明細書に記載のアミノ酸配列のD10X変異及びH840X変異、または本明細書中で提供する任意のアミノ酸配列における対応する変異を含み、Xは、任意のアミノ酸変化である。一部の実施形態では、ヌクレアーゼ不活性dCas9ドメインは、本明細書に記載のアミノ酸配列のD10A変異及びH840A変異、または本明細書中で提供する任意のアミノ酸配列における対応する変異を含む。一部の実施形態では、ヌクレアーゼ不活性Cas9ドメインは、クローニングベクターpPlatTET-gRNA2(受託番号BAV54124)に記載されているアミノ酸配列を含む。

一部の実施形態では、バリアントCas9タンパク質は、ガイド標的配列の相補鎖を切断することができるが、二本鎖ガイド標的配列の非相補鎖を切断する能力が低下している。例えば、バリアントCas9タンパク質は、RuvCドメインの機能を低下させる変異(アミノ酸置換)を有し得る。非限定的な例として、一部の実施形態では、バリアントCas9タンパク質は、D10A(アミノ酸位置10でのアスパラギン酸からアラニンへ)を有し、したがって、二本鎖ガイド標的配列の相補鎖を切断することができるが、二本鎖ガイド標的配列の非相補鎖を切断する能力が低下している(したがって、バリアントCas9タンパク質が二本鎖標的核酸を切断する場合に、二本鎖切断(DSB)の代わりに、一本鎖切断(SSB)を生じさせる)(例えば、Jinek et al.,Science.2012 Aug.17;337(6096):816-21を参照のこと)。

一部の実施形態では、バリアントCas9タンパク質は、二本鎖ガイド標的配列の非相補鎖を切断することができるが、ガイド標的配列の相補鎖を切断する能力が低下している。例えば、バリアントCas9タンパク質は、HNHドメイン(RuvC/HNH/RuvCドメインモチーフ)の機能を低下させる変異(アミノ酸置換)を有し得る。非限定的な例として、一部の実施形態では、バリアントCas9タンパク質は、H840A(アミノ酸位置840のヒスチジンからアラニンへ)を有し、したがって、ガイド標的配列の非相補鎖を切断することができるが、ガイド標的配列の相補鎖を切断する能力が低下している(したがって、バリアントCas9タンパク質が二本鎖ガイド標的配列を切断した場合に、DSBではなくSSBが生じる)。そのようなCas9タンパク質は、ガイド標的配列(例えば、一本鎖ガイド標的配列)を切断する能力が低下しているが、ガイド標的配列(例えば、一本鎖ガイド標的配列)に結合する能力は保持している。

別の非限定的な例として、一部の実施形態では、バリアントCas9タンパク質は、W476A及びW1126A変異を有し、それにより、このポリペプチドは標的DNAを切断する能力が低下している。そのようなCas9タンパク質は、標的DNA(例えば、一本鎖標的DNA)を切断する能力が低下しているが、標的DNA(例えば、一本鎖標的DNA)に結合する能力を保持している。

別の非限定的な例として、一部の実施形態では、バリアントCas9タンパク質は、P475A、W476A、N477A、D1125A、W1126A、及びD1127A変異を有し、それにより、このポリペプチドは標的DNAを切断する能力が低下している。そのようなCas9タンパク質は、標的DNA(例えば、一本鎖標的DNA)を切断する能力が低下しているが、標的DNA(例えば、一本鎖標的DNA)に結合する能力を保持している。

別の非限定的な例として、一部の実施形態では、バリアントCas9タンパク質は、H840A、W476A、及びW1126A変異を有し、それにより、このポリペプチドは標的DNAを切断する能力が低下している。そのようなCas9タンパク質は、標的DNA(例えば、一本鎖標的DNA)を切断する能力が低下しているが、標的DNA(例えば、一本鎖標的DNA)に結合する能力を保持している。別の非限定的な例として、一部の実施形態では、バリアントCas9タンパク質は、H840A、D10A、W476A、及びW1126A変異を有し、それにより、このポリペプチドは標的DNAを切断する能力が低下している。そのようなCas9タンパク質は、標的DNA(例えば、一本鎖標的DNA)を切断する能力が低下しているが、標的DNA(例えば、一本鎖標的DNA)に結合する能力を保持している。一部の実施形態では、バリアントCas9は、Cas9 HNHドメイン(A840H)の位置840に触媒His残基を回復させている。

別の非限定的な例として、一部の実施形態では、バリアントCas9タンパク質は、H840A、P475A、W476A、N477A、D1125A、W1126A、及びD1127A変異を有し、それにより、このポリペプチドは標的DNAを切断する能力が低下している。そのようなCas9タンパク質は、標的DNA(例えば、一本鎖標的DNA)を切断する能力が低下しているが、標的DNA(例えば、一本鎖標的DNA)に結合する能力を保持している。別の非限定的な例として、一部の実施形態では、バリアントCas9タンパク質は、D10A、H840A、P475A、W476A、N477A、D1125A、W1126A、及びD1127A変異を有し、それにより、このポリペプチドは標的DNAを切断する能力が低下している。そのようなCas9タンパク質は、標的DNA(例えば、一本鎖標的DNA)を切断する能力が低下しているが、標的DNA(例えば、一本鎖標的DNA)に結合する能力を保持している。一部の実施形態では、バリアントCas9タンパク質がW476A及びW1126A変異を有する場合、またはバリアントCas9タンパク質がP475A、W476A、N477A、D1125A、W1126A、及びD1127A変異を有する場合、バリアントCas9タンパク質は、PAM配列に効率的に結合しない。したがって、一部のそのような実施形態では、そのようなバリアントCas9タンパク質を結合方法で使用する場合、本方法は、PAM配列を必要としない。言い換えれば、一部の実施形態では、そのようなバリアントCas9タンパク質を結合方法で使用する場合、本方法は、ガイドRNAを含むことができるが、本方法は、PAM配列の不在下で実施することができる(したがって、結合の特異性が、ガイドRNAの標的指向化セグメントによって提供される)。他の残基は、上記の効果を達成するために変異させることができる(すなわち、1つまたは他のヌクレアーゼ部分を不活性化する)。非限定的な例として、残基D10、G12、G17、E762、H840、N854、N863、H982、H983、A984、D986、及び/またはA987を改変(すなわち、置換)することができる。また、アラニン置換以外の変異も好適である。

一部の実施形態では、触媒活性が低下したバリアントCas9タンパク質(例えば、Cas9タンパク質が、D10、G12、G17、E762、H840、N854、N863、H982、H983、A984、D986、及び/またはA987変異(例えば、D10A、G12A、G17A、E762A、H840A、N854A、N863A、H982A、H983A、A984A、及び/またはD986A)を有する場合)、バリアントCas9タンパク質は、それがガイドRNAと相互作用する能力を保持する限り、依然として部位特異的な様式で標的DNAに結合することができる(依然としてガイドRNAによって標的DNA配列に誘導されるため)。

一部の実施形態では、バリアントCasタンパク質は、spCas9、spCas9-VRQR、spCas9-VRER、xCas9(sp)、saCas9、saCas9-KKH、spCas9-MQKSER、spCas9-LRKIQK、またはspCas9-LRVSQLであり得る。

一部の実施形態では、Cas9ドメインは、Staphylococcus aureus(SaCas9)由来のCas9ドメインである。一部の実施形態では、SaCas9ドメインは、ヌクレアーゼ活性SaCas9、ヌクレアーゼ不活性SaCas9(SaCas9d)、またはSaCas9ニッカーゼ(SaCas9n)である。一部の実施形態では、SaCas9は、N579A変異または本明細書とともに提出される配列表で提供されるアミノ酸配列のうちのいずれかにおける対応する変異を含む。

一部の実施形態では、SaCas9ドメイン、SaCas9dドメイン、またはSaCas9nドメインは、非正準PAMを有する核酸配列に結合することができる。一部の実施形態では、SaCas9ドメイン、SaCas9dドメインまたはSaCas9nドメインは、NNGRRTまたはNNGRRV PAM配列を有する核酸配列に結合することができる。一部の実施形態では、SaCas9ドメインは、E781X、N967X、及びR1014X変異、または本明細書に提供されるアミノ酸配列のうちのいずれかにおける対応する変異のうちの1つ以上を含む(ここで、Xは、任意のアミノ酸である)。一部の実施形態では、SaCas9ドメインは、E781K、N967K、及びR1014H変異、または本明細書に提供されるアミノ酸配列のうちのいずれかにおける対応する変異のうちの1つ以上を含む。一部の実施形態では、SaCas9ドメインは、E781K、N967K、またはR1014H変異、または本明細書に提供されるアミノ酸配列のうちのいずれかにおける対応する変異を含む。

一部の実施形態では、融合タンパク質に存在するCas9ドメインのうちの1つは、PAM配列を必要としないガイドヌクレオチド配列プログラマブルDNA結合タンパク質ドメインで置き換えられ得る。一部の実施形態では、Cas9は、SaCas9である。SaCas9の残基A579は、N579から変異して、SaCas9ニッカーゼを得ることができる。残基K781、K967及びH1014は、E781、N967及びR1014から変異して、SaKKH Cas9を得ることができる。

一部の実施形態では、アミノ酸置換D1135M、S1136Q、G1218K、E1219F、A1322R、D1332A、R1335E及びT1337R(SpCas9-MQKFRAER)を含み、改変PAM 5’-NGC-3’に対する特異性を有する修飾されたSpCas9を使用した。

S.pyogenes Cas9の代替物としては、哺乳動物細胞において切断活性を示すCpf1ファミリー由来のRNAガイドエンドヌクレアーゼを挙げることができる。Prevotella及びFrancisella 1由来のCRISPR(CRISPR/Cpf1)は、CRISPR/Cas9システムに類似したDNA編集技術である。Cpf1は、クラスIIのCRISPR/CasシステムのRNAガイドエンドヌクレアーゼである。この後天性免疫機構は、Prevotella菌及びFrancisella菌で見られる。Cpf1遺伝子は、CRISPR遺伝子座と関連付けられ、ガイドRNAを使用してウイルスDNAを発見及び切断するエンドヌクレアーゼをコードしている。Cpf1は、Cas9よりも小さく単純なエンドヌクレアーゼであり、CRISPR/Cas9システムのいくつかの制約を克服している。Cas9ヌクレアーゼとは異なり、Cpf1媒介性DNA切断は、短い3’オーバーハングを有する二本鎖切断をもたらす。Cpf1の互い違い(staggered)の切断パターンは、従来の制限酵素によるクローニングに類似した定方向遺伝子導入の可能性を開き、遺伝子編集の効率を高めることができる。上に記載のCas9バリアント及びオルソログと同様に、Cpf1はまた、CRISPRによって標的化され得る部位の数を、SpCas9に適したNGG PAM部位を欠くATリッチ領域またはATリッチゲノムまで拡張することができる。Cpf1遺伝子座は、混合されたアルファ/ベータドメイン、RuvC-I、続いてヘリカル領域、RuvC-II、及びジンクフィンガー様ドメインを含有する。Cpf1タンパク質は、Cas9のRuvCドメインに類似したRuvC様エンドヌクレアーゼドメインを有する。

更に、Cpf1は、Cas9とは異なり、HNHエンドヌクレアーゼドメインを有さず、Cpf1のN末端は、Cas9のアルファヘリカル認識ローブを有しない。Cpf1 CRISPR-Casドメインアーキテクチャは、Cpf1が機能的に固有であり、クラス2のV型CRISPRシステムとして分類されることを示す。Cpf1遺伝子座は、II型システムよりもI型及びIII型システムに類似したCas1、Cas2、及びCas4タンパク質をコードする。機能的なCpf1は、トランス活性化CRISPR RNA(tracrRNA)を必要とせず、したがって、CRISPR(crRNA)のみが必要である。これは、Cpf1がCas9よりも小さいだけでなく、より小さなsgRNA分子(Cas9のおよそ半分のヌクレオチド数)を有するため、ゲノム編集に有益である。Cpf1-crRNA複合体は、Cas9によって標的とされるGリッチPAMとは対照的に、プロトスペーサー隣接モチーフ5’-YTN-3’または5’-TTN-3’を特定することによって標的DNAまたはRNAを切断する。PAMの識別後、Cpf1は、4または5ヌクレオチドのオーバーハングを有する粘着末端様のDNA二本鎖切断を導入する。

一部の実施形態では、Cas9は、改変PAM配列に対する特異性を有するCas9バリアントである。一部の実施形態では、追加のCas9バリアント及びPAM配列は、Miller,S.M.,et al.Continuous evolution of SpCas9 variants compatible with non-G PAMs,Nat.Biotechnol.(2020)に記載されており、その全体が、参照により本明細書に援用される。一部の実施形態では、Cas9バリアントは、特定のPAM要件を有しない。一部の実施形態では、Cas9バリアント、例えば、SpCas9バリアントは、NRNH PAMに対する特異性を有し、Rは、AまたはGであり、Hは、A、C、またはTである。一部の実施形態では、SpCas9バリアントは、PAM配列AAA、TAA、CAA、GAA、TAT、GAT、またはCACに対する特異性を有する。一部の実施形態では、SpCas9バリアントは、1114、1134、1135、1137、1139、1151、1180、1188、1211、1218、1219、1221、1249、1256、1264、1290、1318、1317、1320、1321、1323、1332、1333、1335、1337、もしくは1339の位置、またはそれらの対応する位置に、アミノ酸置換を含む。一部の実施形態では、SpCas9バリアントは、1114、1135、1218、1219、1221、1249、1320、1321、1323、1332、1333、1335、もしくは1337の位置、またはそれらの対応する位置に、アミノ酸置換を含む。一部の実施形態では、SpCas9バリアントは、1114、1134、1135、1137、1139、1151、1180、1188、1211、1219、1221、1256、1264、1290、1318、1317、1320、1323、1333の位置、またはそれらの対応する位置に、アミノ酸置換を含む。一部の実施形態では、SpCas9バリアントは、1114、1131、1135、1150、1156、1180、1191、1218、1219、1221、1227、1249、1253、1286、1293、1320、1321、1332、1335、1339の位置、またはそれらの対応する位置に、アミノ酸置換を含む。一部の実施形態では、SpCas9バリアントは、1114、1127、1135、1180、1207、1219、1234、1286、1301、1332、1335、1337、1338、1349の位置、またはそれらの対応する位置に、アミノ酸置換を含む。表3A～3Dに、SpCas9バリアントの例示的なアミノ酸置換及びPAM特異性を示す。

一部の実施形態では、核酸プログラマブルDNA結合タンパク質(napDNAbp)は、微生物CRISPR-Casシステムの単一エフェクターである。微生物CRISPR-Casシステムの単一エフェクターには、限定されないが、Cas9、Cpf1、Cas12b/C2c1、及びCas12c/C2c3が含まれる。通常、微生物CRISPR-Casシステムは、クラス1及びクラス2システムに分けられる。クラス1システムは、マルチサブユニットエフェクター複合体を有し、クラス2システムは、単一のタンパク質エフェクターを有する。例えば、Cas9及びCpf1は、クラス2エフェクターである。Cas9及びCpf1に加えて、3つの異なるクラス2のCRISPR-Casシステム(Cas12b/C2c1及びCas12c/C2c3)が、Shmakov et al.,“Discovery and Functional Characterization of Diverse Class 2 CRISPR Cas Systems”,Mol.Cell,2015 Nov.5;60(3):385-397により記載され、その内容全体は、参照により本明細書に援用される。システムのうちの2つのエフェクター、Cas12b/C2c1及びCas12c/C2c3は、Cpf1に関連するRuvC様エンドヌクレアーゼドメインを含有する。第3のシステムは、2つの予測HEPN RNaseドメインを有するエフェクターを含有する。成熟CRISPR RNAの生成は、Cas12b/C2c1によるCRISPR RNAの生成とは異なり、tracrRNAに依存しない。Cas12b/C2c1は、DNA切断に関してCRISPR RNA及びtracrRNAの両方に依存する。

一部の実施形態では、napDNAbpは環状置換体である(例えば、配列番号238)。

キメラ単一分子ガイドRNA(sgRNA)と複合体を形成しているAlicyclobaccillus acidoterrastris Cas12b/C2c1(AacC2c1)の結晶構造が報告されている。例えば、Liu et al.,“C2c1-sgRNA Complex Structure Reveals RNA-Guided DNA Cleavage Mechanism”,Mol.Cell,2017 Jan.19;65(2):310-322を参照されたく、その内容全体は、参照により本明細書に援用される。結晶構造は、三元複合体として標的DNAに結合したAlicyclobacillus acidoterrestris C2c1でも報告されている。例えば、Yang et al.,“PAM-dependent Target DNA Recognition and Cleavage by C2C1 CRISPR-Cas endonuclease”,Cell,2016 Dec.15;167(7):1814-1828を参照されたく、その内容全体は、参照により本明細書に援用される。標的DNA鎖と非標的DNA鎖の両方で、単一のRuvC触媒ポケット内に独立して配置され、Cas12b/C2c1を介した切断により、標的DNAのねじれ形の7か所のヌクレオチド切断を生じさせる、AacC2c1の触媒能力のあるコンフォメーションが捕捉されている。Cas12b/C2c1の三元複合体と、以前に同定されたCas9及びCpf1対応物との構造比較は、CRISPR-Cas9システムによって使用されるメカニズムの多様性を示している。

一部の実施形態では、本明細書中で提供する融合タンパク質のいずれかの核酸プログラマブルDNA結合タンパク質(napDNAbp)は、Cas12b/C2c1またはCas12c/C2c3タンパク質であり得る。一部の実施形態では、napDNAbpは、Cas12b/C2c1タンパク質である。一部の実施形態では、napDNAbpは、Cas12c/C2c3タンパク質である。一部の実施形態では、napDNAbpは、天然のCas12b/C2c1またはCas12c/C2c3タンパク質と、少なくとも85%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも99.5%同一であるアミノ酸配列を含む。一部の実施形態では、napDNAbpは、天然に存在するCas12b/C2c1またはCas12c/C2c3タンパク質である。一部の実施形態では、napDNAbpは、本明細書中で提供するnapDNAbp配列のいずれか1つと、少なくとも85%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも99.5%同一であるアミノ酸配列を含む。他の細菌種由来のCas12b/C2c1またはCas12c/C2c3もまた、本開示に従って使用してもよいことを理解されたい。

一部の実施形態では、napDNAbpは、Cas12cを指す。一部の実施形態では、Cas12cタンパク質は、Cas12c1(配列番号239)またはCas12c1のバリアントである。一部の実施形態では、Cas12タンパク質は、Cas12c2(配列番号240)またはCas12c2のバリアントである。一部の実施形態では、Cas12タンパク質は、Oleiphilus種HI0009(すなわち、OspCas12c、配列番号241)またはOspCas12cのバリアント由来のCas12cタンパク質である。これらのCas12c分子は、Yan et al.,“Functionally Diverse Type V CRISPR-Cas Systems,”Science,2019 Jan.4;363:88-91に記載されており、その内容全体は、参照により本明細書に援用される。一部の実施形態では、napDNAbpは、天然に存在するCas12c1、Cas12c2、またはOspCas12cタンパク質と、少なくとも85%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも99.5%同一であるアミノ酸配列を含む。一部の実施形態では、napDNAbpは、天然に存在するCas12c1、Cas12c2、またはOspCas12cタンパク質である。一部の実施形態では、napDNAbpは、本明細書に記載の任意のCas12c1、Cas12c2、またはOspCas12cタンパク質と、少なくとも85%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも99.5%同一であるアミノ酸配列を含む。他の細菌種由来のCas12c1、Cas12c2、またはOspCas12cもまた、本開示に従って使用してもよいことを理解されたい。

一部の実施形態では、napDNAbpとは、例えば、Yan et al.,“Functionally Diverse Type V CRISPR-Cas Systems,”Science,2019 Jan.4;363:88-91に記載されている、Cas12g、Cas12hまたはCas12iを指し、各々の内容全体は、参照により本明細書に援用される。例示的なCas12g、Cas12h、及びCas12iポリペプチド配列を、配列番号242～245として配列表に示す。10テラバイトを超える配列データを集約することにより、Cas12g、Cas12h、及びCas12iなどの、以前に特徴付けられたクラスVタンパク質と弱い類似性を示すV型Casタンパク質の新しい分類が特定された。一部の実施形態では、Cas12タンパク質は、Cas12gまたはCas12gのバリアントである。一部の実施形態では、Cas12タンパク質は、Cas12hまたはCas12hのバリアントである。一部の実施形態では、Cas12タンパク質は、Cas12iまたはCas12iのバリアントである。他のRNAガイドDNA結合タンパク質が、napDNAbpとして使用されてもよく、本開示の範囲内であることを理解されたい。一部の実施形態では、napDNAbpは、天然のCas12g、Cas12h、またはCas12iタンパク質と、少なくとも85%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも99.5%同一であるアミノ酸配列を含む。一部の実施形態では、napDNAbpは、天然に存在するCas12g、Cas12h、またはCas12iタンパク質である。一部の実施形態では、napDNAbpは、本明細書に記載の任意のCas12g、Cas12h、またはCas12iタンパク質と、少なくとも85%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも99.5%同一であるアミノ酸配列を含む。他の細菌種由来のCas12g、Cas12h、またはCas12iもまた、本開示に従って使用してもよいことを理解されたい。一部の実施形態では、Cas12iは、Cas12i1またはCas12i2である。

一部の実施形態では、本明細書で提供される融合タンパク質のいずれかの核酸プログラマブルDNA結合タンパク質(napDNAbp)は、Cas12j/CasΦタンパク質であり得る。Cas12j/CasΦは、Pausch et al.,“CRISPR-CasΦ from huge phages is a hypercompact genome editor,”Science,17 July 2020,Vol.369,Issue 6501,pp.333-337に記載されており、これは、その全体が参照により本明細書に援用される。一部の実施形態では、napDNAbpは、天然に存在するCas12j/CasΦタンパク質と、少なくとも85%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも99.5%同一であるアミノ酸配列を含む。一部の実施形態では、napDNAbpは、天然に存在するCas12j/CasΦタンパク質である。一部の実施形態では、napDNAbpは、ヌクレアーゼ不活性(「不活性型(dead)」)Cas12j/CasΦタンパク質である。本開示に従って、他の種由来のCas12j/CasΦも使用され得ることを理解されたい。

内部挿入を伴う融合タンパク質
本明細書において、核酸プログラマブル核酸結合タンパク質、例えば、napDNAbpに融合させた異種ポリペプチドを含む融合タンパク質を提供する。異種ポリペプチドは、天然または野生型napDNAbpポリペプチド配列には見られないポリペプチドであり得る。異種ポリペプチドは、napDNAbpのC末端、napDNAbpのN末端でnapDNAbpに融合するか、またはnapDNAbpの内部位置に挿入することができる。一部の実施形態では、異種ポリペプチドは、デアミナーゼ(例えば、アデノシンデアミナーゼのシチジン)またはその機能的断片である。例えば、融合タンパク質は、Cas9またはCas12(例えば、Cas12b/C2c1)ポリペプチドのN末端断片及びC末端断片に隣接するデアミナーゼを含むことができる。一部の実施形態では、シチジンデアミナーゼは、APOBECデアミナーゼ(例えば、APOBEC1)である。一部の実施形態では、アデノシンデアミナーゼは、TadA(例えば、TadA*7.10またはTadA*8)である。一部の実施形態では、TadAは、TadA*8またはTadA*9である。本明細書に記載されるTadA配列(例えば、TadA7.10またはTadA*8)は、上記の融合タンパク質に好適なデアミナーゼである。

一部の実施形態では、融合タンパク質は、以下の構造:
NH2-[napDNAbpのN末端断片]-[デアミナーゼ]-[napDNAbpのC末端断片]-COOH、
NH2-[Cas9のN末端断片]-[アデノシンデアミナーゼ]-[Cas9のC末端断片]-COOH、
NH2-[Cas12のN末端断片]-[アデノシンデアミナーゼ]-[Cas12のC末端断片]-COOH、
NH2-[Cas9のN末端断片]-[シチジンデアミナーゼ]-[Cas9のC末端断片]-COOH、
NH2-[Cas12のN末端断片]-[シチジンデアミナーゼ]-[Cas12のC末端断片]-COOHを含み、
式中、「]-[」の各インスタンスは、任意選択のリンカーである。

デアミナーゼは、円順列変異体(circular permutant)デアミナーゼであり得る。例えば、デアミナーゼは、円順列変異体アデノシンデアミナーゼであり得る。一部の実施形態では、デアミナーゼは、TadA参照配列において番号付けされたアミノ酸残基116、136または65で環状に置換された円順列変異型TadAである。

融合タンパク質は、複数のデアミナーゼを含み得る。融合タンパク質は、例えば、1、2、3、4、5つ、またはそれ以上のデアミナーゼを含み得る。一部の実施形態では、融合タンパク質は、1つまたは2つのデアミナーゼを含む。融合タンパク質の2つ以上のデアミナーゼは、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはそれらの組み合わせであり得る。2つ以上のデアミナーゼは、ホモ二量体またはヘテロ二量体であり得る。2つ以上のデアミナーゼは、napDNAbpにおいて直列に挿入され得る。一部の実施形態では、2つ以上のデアミナーゼは、napDNAbpにおいて直列ではない場合がある。

一部の実施形態では、融合タンパク質内のnapDNAbpは、Cas9ポリペプチドまたはその断片である。Cas9ポリペプチドは、バリアントCas9ポリペプチドであり得る。一部の実施形態では、Cas9ポリペプチドは、Cas9ニッカーゼ(nCas9)ポリペプチドまたはその断片である。一部の実施形態では、Cas9ポリペプチドは、ヌクレアーゼ不活性型Cas9(dCas9)ポリペプチドまたはその断片である。融合タンパク質内のCas9ポリペプチドは、全長のCas9ポリペプチドであり得る。いくつかの場合では、融合タンパク質内のCas9ポリペプチドは、全長のCas9ポリペプチドでなくてもよい。Cas9ポリペプチドは、例えば、天然に存在するCas9タンパク質と比較して、N末端またはC末端で短縮され得る。Cas9ポリペプチドは、環状に置換されたCas9タンパク質であり得る。Cas9ポリペプチドは、Cas9ポリペプチドの断片、一部、またはドメインであり得るが、それは依然として標的ポリヌクレオチド及びガイド核酸配列に結合することができる。

一部の実施形態では、Cas9ポリペプチドは、Streptococcus pyogenes Cas9(SpCas9)、Staphylococcus aureus Cas9(SaCas9)、Streptococcus thermophilus 1 Cas9(St1Cas9)、または本明細書に記載されるCas9ポリペプチドのうちのいずれかの断片もしくはバリアントである。

一部の実施形態では、融合タンパク質は、Cas9内に挿入されたアデノシンデアミナーゼドメイン及びシチジンデアミナーゼドメインを含む。一部の実施形態では、アデノシンデアミナーゼを、Cas9内で融合させ、シチジンデアミナーゼを、C末端に融合させる。一部の実施形態では、アデノシンデアミナーゼを、Cas9内で融合させ、シチジンデアミナーゼを、N末端に融合させる。一部の実施形態では、シチジンデアミナーゼを、Cas9内で融合させ、アデノシンデアミナーゼを、C末端に融合させる。一部の実施形態では、シチジンデアミナーゼを、Cas9内で融合させ、アデノシンデアミナーゼを、N末端に融合させる。

アデノシンデアミナーゼ及びシチジンデアミナーゼならびにCas9を有する融合タンパク質の例示的な構造は、以下のように提供される:
NH2-[Cas9(アデノシンデアミナーゼ)]-[シチジンデアミナーゼ]-COOH、
NH2-[シチジンデアミナーゼ]-[Cas9(アデノシンデアミナーゼ)]-COOH、
NH2-[Cas9(シチジンデアミナーゼ)]-[アデノシンデアミナーゼ]-COOH、または
NH2-[アデノシンデアミナーゼ]-[Cas9(シチジンデアミナーゼ)]-COOH。

一部の実施形態では、上記の一般的なアーキテクチャで使用される「-」は、任意選択のリンカーの存在を示す。

様々な実施形態では、触媒ドメインは、アデノシンデアミナーゼ活性などのDNA修飾活性(例えば、デアミナーゼ活性)を有する。一部の実施形態では、アデノシンデアミナーゼは、TadA(例えば、TadA*7.10)である。一部の実施形態では、TadAは、TadA*8である。一部の実施形態では、TadA*8を、Cas9内で融合させ、シチジンデアミナーゼを、C末端に融合させる。一部の実施形態では、TadA*8を、Cas9内で融合させ、シチジンデアミナーゼを、N末端に融合させる。一部の実施形態では、シチジンデアミナーゼを、Cas9内で融合させ、TadA*8を、C末端に融合させる。一部の実施形態では、シチジンデアミナーゼを、Cas9内で融合させ、TadA*8を、N末端に融合させる。TadA*8及びシチジンデアミナーゼならびにCas9を有する融合タンパク質の例示的な構造は、以下のように提供される:
NH2-[Cas9(TadA*8)]-[シチジンデアミナーゼ]-COOH、
NH2-[シチジンデアミナーゼ]-[Cas9(TadA*8)]-COOH、
NH2-[Cas9(シチジンデアミナーゼ)]-[TadA*8]-COOHまたは
NH2-[TadA*8]-[Cas9(シチジンデアミナーゼ)]-COOH。

異種ポリペプチド(例えば、デアミナーゼ)は、例えば、napDNAbpが標的ポリヌクレオチド及びガイド核酸に結合する能力を保持するように、好適な位置でnapDNAbp(例えば、Cas9またはCas12(例えば、Cas12b/C2c1))に挿入することができる。デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼ及びシチジンデアミナーゼ)は、デアミナーゼ(例えば、塩基編集活性)またはnapDNAbp(例えば、標的核酸及びガイド核酸に結合する能力)の機能を損なうことなく、napDNAbpに挿入することができる。デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼ及びシチジンデアミナーゼ)は、結晶学的研究によって示されるように、例えば、無秩序領域、または高温因子(high temperature factor)もしくはB因子を含む領域で、napDNAbpに挿入することができる。タンパク質の秩序領域、無秩序領域、または非構造化領域(例えば、溶媒曝露領域及びループ)は、構造または機能を損なうことなく、挿入に使用することができる。デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼ及びシチジンデアミナーゼ)は、可動性ループ(flexible loop)領域または溶媒曝露領域においてnapDNAbpに挿入することができる。一部の実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼ及びシチジンデアミナーゼ)は、Cas9またはCas12b/C2c1ポリペプチドの可動性ループに挿入される。

一部の実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼ及びシチジンデアミナーゼ)の挿入位置は、Cas9ポリペプチドの結晶構造のB因子分析によって決定される。一部の実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼ及びシチジンデアミナーゼ)は、平均B因子よりも高い(例えば、全タンパク質または無秩序領域を含むタンパク質ドメインと比較して、より高いB因子)を含むCas9ポリペプチドの領域に挿入される。B因子または温度因子は、(例えば、温度依存性の原子振動または結晶格子内の静的乱れ(static disorder)の結果としての)原子のそれらの平均位置からの変動を示し得る。骨格原子の高いB因子(例えば、平均よりも高いB因子)は、比較的高い局所移動度(local mobility)を有する領域を示し得る。そのような領域は、構造または機能を損なうことなくデアミナーゼを挿入するために使用することができる。デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼ及びシチジンデアミナーゼ)は、全タンパク質の平均B因子よりも、50%、60%、70%、80%、90%、100%、110%、120%、130%、140%、150%、160%、170%、180%、190%、200%、または200%超であるB因子を有するCα原子を有する残基を含む位置に挿入することができる。デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼ及びシチジンデアミナーゼ)は、残基を含むCas9タンパク質ドメインの平均B因子よりも、50%、60%、70%、80%、90%、100%、110%、120%、130%、140%、150%、160%、170%、180%、190%、200%、または200%超であるB因子を有する残基を含む位置に挿入することができる。平均よりも高いB因子を含むCas9ポリペプチドの位置は、例えば、上記のCas9参照配列において番号付けされた残基768、792、1052、1015、1022、1026、1029、1067、1040、1054、1068、1246、1247、及び1248を含むことができる。平均B因子よりも高いB因子を含むCas9ポリペプチド領域は、例えば、上記のCas9参照配列において番号付けされた残基792～872、792～906、及び2～791を含むことができる。

異種ポリペプチド(例えば、デアミナーゼ)は、以下からなる群から選択されるアミノ酸残基において、napDNAbpに挿入され得る:上記のCas9参照配列において番号付けされた残基768、791、792、1015、1016、1022、1023、1026、1029、1040、1052、1054、1067、1068、1069、1246、1247、及び1248、または別のCas9ポリペプチドの対応するアミノ酸残基。一部の実施形態では、異種ポリペプチドは、上記のCas9参照配列において番号付けされたアミノ酸位置768-769、791-792、792-793、1015-1016、1022-1023、1026-1027、1029-1030、1040-1041、1052-1053、1054-1055、1067-1068、1068-1069、1247-1248、もしくは1248-1249、またはそれらの対応するアミノ酸位置の間に挿入される。一部の実施形態では、異種ポリペプチドは、上記のCas9参照配列またはその対応するアミノ酸位置において番号付けされるアミノ酸位置769-770、792-793、793-794、1016-1017、1023-1024、1027-1028、1030-1031、1041-1042、1053-1054、1055-1056、1068-1069、1069-1070、1248-1249、または1249-1250の間に挿入される。一部の実施形態では、異種ポリペプチドは、以下からなる群から選択されるアミノ酸残基を置き換える:上記のCas9参照配列において番号付けされた残基768、791、792、1015、1016、1022、1023、1026、1029、1040、1052、1054、1067、1068、1069、1246、1247、及び1248、または別のCas9ポリペプチドの対応するアミノ酸残基。挿入位置に関して、上記のCas9参照配列への言及は、例示的な目的のためであることを理解されたい。本明細書で論じられる挿入は、上記のCas9参照配列のCas9ポリペプチド配列に限定されないが、バリアントCas9ポリペプチド(例えば、Cas9ニッカーゼ(nCas9)、ヌクレアーゼ不活性型Cas9(dCas9)、ヌクレアーゼドメインを欠くCas9バリアント、切断型Cas9、またはHNHドメインを部分的または完全に欠くCas9ドメイン)における対応する場所における挿入を含む。

異種ポリペプチド(例えば、デアミナーゼ)は、以下からなる群から選択されるアミノ酸残基において、napDNAbpに挿入され得る:上記のCas9参照配列において番号付けされたアミノ酸残基768、792、1022、1026、1040、1068、及び1247、または別のCas9ポリペプチドの対応するアミノ酸残基。一部の実施形態では、異種ポリペプチドは、上記のCas9参照配列において番号付けされたアミノ酸位置768-769、792-793、1022-1023、1026-1027、1029-1030、1040-1041、1068-1069、もしくは1247-1248、またはそれらの対応するアミノ酸位置の間に挿入される。一部の実施形態では、異種ポリペプチドは、上記のCas9参照配列において番号付けされたアミノ酸位置769-770、793-794、1023-1024、1027-1028、1030-1031、1041-1042、1069-1070、もしくは1248-1249、またはそれらの対応するアミノ酸位置の間に挿入される。一部の実施形態では、異種ポリペプチドは、以下からなる群から選択されるアミノ酸残基を置き換える:上記のCas9参照配列において番号付けされたアミノ酸残基768、792、1022、1026、1040、1068、及び1247、または別のCas9ポリペプチドの対応するアミノ酸残基。

異種ポリペプチド(例えば、デアミナーゼ)は、本明細書に記載のアミノ酸残基または別のCas9ポリペプチドの対応するアミノ酸残基において、napDNAbpに挿入され得る。一実施形態では、異種ポリペプチド(例えば、デアミナーゼ)は、以下からなる群から選択されるアミノ酸残基において、napDNAbpに挿入され得る:上記のCas9参照配列において番号付けされたアミノ酸残基1002、1003、1025、1052～1056、1242～1247、1061～1077、943～947、686～691、569～578、530～539、及び1060～1077、または別のCas9ポリペプチドの対応するアミノ酸残基。デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼ及びシチジンデアミナーゼ)は、残基のN末端またはC末端で挿入されるか、または残基を置き換えることができる。一部の実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼ及びシチジンデアミナーゼ)は、残基のC末端において挿入される。

一部の実施形態では、アデノシンデアミナーゼ(例えば、TadA)は、以下からなる群から選択されるアミノ酸残基において挿入され得る:上記のCas9参照配列において番号付けされたアミノ酸残基1015、1022、1029、1040、1068、1247、1054、1026、768、1067、1248、1052、及び1246、または別のCas9ポリペプチドの対応するアミノ酸残基。一部の実施形態では、アデノシンデアミナーゼ(例えば、TadA)は、上記のCas9参照配列において番号付けされた残基792～872、792～906、もしくは2～791、または別のCas9ポリペプチドの対応するアミノ酸残基の代わりに挿入される。一部の実施形態では、アデノシンデアミナーゼは、以下からなる群から選択されるアミノ酸のN末端において挿入される:上記のCas9参照配列において番号付けされたアミノ酸残基1015、1022、1029、1040、1068、1247、1054、1026、768、1067、1248、1052、及び1246、または別のCas9ポリペプチドの対応するアミノ酸残基。一部の実施形態では、アデノシンデアミナーゼは、以下からなる群から選択されるアミノ酸のC末端において挿入される:上記のCas9参照配列において番号付けされたアミノ酸残基1015、1022、1029、1040、1068、1247、1054、1026、768、1067、1248、1052、及び1246、または別のCas9ポリペプチドの対応するアミノ酸残基。一部の実施形態では、アデノシンデアミナーゼは、以下からなる群から選択されるアミノ酸を置き換えるために挿入される:上記のCas9参照配列において番号付けされたアミノ酸残基1015、1022、1029、1040、1068、1247、1054、1026、768、1067、1248、1052、及び1246、または別のCas9ポリペプチドの対応するアミノ酸残基。

一部の実施形態では、シチジンデアミナーゼ(例えば、APOBEC1)は、以下からなる群から選択されるアミノ酸残基において挿入される:上記のCas9参照配列において番号付けされたアミノ酸残基1016、1023、1029、1040、1069、及び1247、または別のCas9ポリペプチドの対応するアミノ酸残基。一部の実施形態では、シチジンデアミナーゼは、以下からなる群から選択されるアミノ酸のN末端において挿入される:上記のCas9参照配列において番号付けされたアミノ酸残基1016、1023、1029、1040、1069、及び1247、または別のCas9ポリペプチドの対応するアミノ酸残基。一部の実施形態では、シチジンデアミナーゼは、以下からなる群から選択されるアミノ酸のC末端において挿入される:上記のCas9参照配列において番号付けされたアミノ酸残基1016、1023、1029、1040、1069、及び1247、または別のCas9ポリペプチドの対応するアミノ酸残基。一部の実施形態では、シチジンデアミナーゼは、以下からなる群から選択されるアミノ酸を置き換えるために挿入される:上記のCas9参照配列において番号付けされたアミノ酸残基1016、1023、1029、1040、1069、及び1247、または別のCas9ポリペプチドの対応するアミノ酸残基。

一部の実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼ及びシチジンデアミナーゼ)は、上記のCas9参照配列において番号付けされたアミノ酸残基768、または別のCas9ポリペプチドの対応するアミノ酸残基において挿入される。一部の実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼ及びシチジンデアミナーゼ)は、上記のCas9参照配列において番号付けされたアミノ酸残基768、または別のCas9ポリペプチドの対応するアミノ酸残基のN末端において挿入される。一部の実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼ及びシチジンデアミナーゼ)は、上記のCas9参照配列において番号付けされたアミノ酸残基768、または別のCas9ポリペプチドの対応するアミノ酸残基のC末端において挿入される。一部の実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼ及びシチジンデアミナーゼ)は、上記のCas9参照配列において番号付けされたアミノ酸残基768、または別のCas9ポリペプチドの対応するアミノ酸残基を置き換えるために挿入される。

一部の実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼ及びシチジンデアミナーゼ)は、上記のCas9参照配列において番号付けされたアミノ酸残基791もしくはアミノ酸残基792、または別のCas9ポリペプチドの対応するアミノ酸残基において挿入される。一部の実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼ及びシチジンデアミナーゼ)は、上記のCas9参照配列において番号付けされたアミノ酸残基791のN末端もしくはアミノ酸792のN末端、または別のCas9ポリペプチドの対応するアミノ酸残基のN末端において挿入される。一部の実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼ及びシチジンデアミナーゼ)は、上記のCas9参照配列において番号付けされたアミノ酸791のC末端もしくはアミノ酸792のN末端、または別のCas9ポリペプチドの対応するアミノ酸残基において挿入される。一部の実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼ及びシチジンデアミナーゼ)は、上記のCas9参照配列において番号付けされたアミノ酸791もしくはアミノ酸792、または別のCas9ポリペプチドの対応するアミノ酸残基を置き換えるために挿入される。

一部の実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼ及びシチジンデアミナーゼ)は、上記のCas9参照配列において番号付けされたアミノ酸残基1016、または別のCas9ポリペプチドの対応するアミノ酸残基において挿入される。一部の実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼ及びシチジンデアミナーゼ)は、上記のCas9参照配列において番号付けされたアミノ酸残基1016、または別のCas9ポリペプチドの対応するアミノ酸残基のN末端において挿入される。一部の実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼ及びシチジンデアミナーゼ)は、上記のCas9参照配列において番号付けされたアミノ酸残基1016、または別のCas9ポリペプチドの対応するアミノ酸残基のC末端において挿入される。一部の実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼ及びシチジンデアミナーゼ)は、上記のCas9参照配列において番号付けされたアミノ酸残基1016、または別のCas9ポリペプチドの対応するアミノ酸残基を置き換えるために挿入される。

一部の実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼ及びシチジンデアミナーゼ)は、上記のCas9参照配列において番号付けされたアミノ酸残基1022もしくはアミノ酸残基1023、または別のCas9ポリペプチドの対応するアミノ酸残基において挿入される。一部の実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼ及びシチジンデアミナーゼ)は、上記のCas9参照配列において番号付けされたアミノ酸残基1022のN末端もしくはアミノ酸残基1023のN末端、または別のCas9ポリペプチドの対応するアミノ酸残基のN末端において挿入される。一部の実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼ及びシチジンデアミナーゼ)は、上記のCas9参照配列において番号付けされたアミノ酸残基1022のC末端もしくはアミノ酸残基1023のC末端、または別のCas9ポリペプチドの対応するアミノ酸残基のC末端において挿入される。一部の実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼ及びシチジンデアミナーゼ)は、上記のCas9参照配列において番号付けされたアミノ酸残基1022もしくはアミノ酸残基1023、または別のCas9ポリペプチドの対応するアミノ酸残基を置き換えるために挿入される。

一部の実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼ及びシチジンデアミナーゼ)は、上記のCas9参照配列において番号付けされたアミノ酸残基1026もしくはアミノ酸残基1029、または別のCas9ポリペプチドの対応するアミノ酸残基において挿入される。一部の実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼ及びシチジンデアミナーゼ)は、上記のCas9参照配列において番号付けされたアミノ酸残基1026のN末端もしくはアミノ酸残基1029のN末端、または別のCas9ポリペプチドの対応するアミノ酸残基のN末端において挿入される。一部の実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼ及びシチジンデアミナーゼ)は、上記のCas9参照配列において番号付けされたアミノ酸残基1026のC末端もしくはアミノ酸残基1029のC末端、または別のCas9ポリペプチドの対応するアミノ酸残基のC末端において挿入される。一部の実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼ及びシチジンデアミナーゼ)は、上記のCas9参照配列において番号付けされたアミノ酸残基1026もしくはアミノ酸残基1029、または別のCas9ポリペプチドの対応するアミノ酸残基を置き換えるために挿入される。

一部の実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼ及びシチジンデアミナーゼ)は、上記のCas9参照配列において番号付けされたアミノ酸残基1040、または別のCas9ポリペプチドの対応するアミノ酸残基において挿入される。一部の実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼ及びシチジンデアミナーゼ)は、上記のCas9参照配列において番号付けされたアミノ酸残基1040、または別のCas9ポリペプチドの対応するアミノ酸残基のN末端において挿入される。一部の実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼ及びシチジンデアミナーゼ)は、上記のCas9参照配列において番号付けされたアミノ酸残基1040、または別のCas9ポリペプチドの対応するアミノ酸残基のC末端において挿入される。一部の実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼ及びシチジンデアミナーゼ)は、上記のCas9参照配列において番号付けされたアミノ酸残基1040、または別のCas9ポリペプチドの対応するアミノ酸残基を置き換えるために挿入される。

一部の実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼ及びシチジンデアミナーゼ)は、上記のCas9参照配列において番号付けされたアミノ酸残基1052もしくはアミノ酸残基1054、または別のCas9ポリペプチドの対応するアミノ酸残基において挿入される。一部の実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼ及びシチジンデアミナーゼ)は、上記のCas9参照配列において番号付けされたアミノ酸残基1052のN末端もしくはアミノ酸残基1054のN末端、または別のCas9ポリペプチドの対応するアミノ酸残基のN末端において挿入される。一部の実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼ及びシチジンデアミナーゼ)は、上記のCas9参照配列において番号付けされたアミノ酸残基1052のC末端もしくはアミノ酸残基1054のC末端、または別のCas9ポリペプチドの対応するアミノ酸残基のC末端において挿入される。一部の実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼ及びシチジンデアミナーゼ)は、上記のCas9参照配列において番号付けされたアミノ酸残基1052もしくはアミノ酸残基1054、または別のCas9ポリペプチドの対応するアミノ酸残基を置き換えるために挿入される。

一部の実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼ及びシチジンデアミナーゼ)は、上記のCas9参照配列において番号付けされたアミノ酸残基1067もしくはアミノ酸残基1068もしくはアミノ酸残基1069、または別のCas9ポリペプチドの対応するアミノ酸残基において挿入される。一部の実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼ及びシチジンデアミナーゼ)は、上記のCas9参照配列において番号付けされたアミノ酸残基1067のN末端もしくはアミノ酸残基1068のN末端もしくはアミノ酸残基1069のN末端、または別のCas9ポリペプチドの対応するアミノ酸残基のN末端において挿入される。一部の実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼ及びシチジンデアミナーゼ)は、上記のCas9参照配列において番号付けされたアミノ酸残基1067のC末端もしくはアミノ酸残基1068のC末端もしくはアミノ酸残基1069のC末端、または別のCas9ポリペプチドの対応するアミノ酸残基のC末端において挿入される。一部の実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼ及びシチジンデアミナーゼ)は、上記のCas9参照配列において番号付けされたアミノ酸残基1067もしくはアミノ酸残基1068もしくはアミノ酸残基1069、または別のCas9ポリペプチドの対応するアミノ酸残基を置き換えるために挿入される。

一部の実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼ及びシチジンデアミナーゼ)は、上記のCas9参照配列において番号付けされたアミノ酸残基1246もしくはアミノ酸残基1247もしくはアミノ酸残基1248、または別のCas9ポリペプチドの対応するアミノ酸残基において挿入される。一部の実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼ及びシチジンデアミナーゼ)は、上記のCas9参照配列において番号付けされたアミノ酸残基1246のN末端もしくはアミノ酸残基1247のN末端もしくはアミノ酸残基1248のN末端、または別のCas9ポリペプチドの対応するアミノ酸残基のN末端において挿入される。一部の実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼ及びシチジンデアミナーゼ)は、上記のCas9参照配列において番号付けされたアミノ酸残基1246のC末端もしくはアミノ酸残基1247のC末端もしくはアミノ酸残基1248のC末端、または別のCas9ポリペプチドの対応するアミノ酸残基のC末端において挿入される。一部の実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼ及びシチジンデアミナーゼ)は、上記のCas9参照配列において番号付けされたアミノ酸残基1246もしくはアミノ酸残基1247もしくはアミノ酸残基1248、または別のCas9ポリペプチドの対応するアミノ酸残基を置き換えるために挿入される。

一部の実施形態では、異種ポリペプチド(例えば、デアミナーゼ)は、Cas9ポリペプチドの可動性ループに挿入される。可動性ループ部分は、上記のCas9参照配列において番号付けされたアミノ酸残基530～537、569～570、686～691、943～947、1002～1025、1052～1077、1232～1247、もしくは1298～1300、または別のCas9ポリペプチドの対応するアミノ酸残基からなる群から選択することができる。可動性ループ部分は、以下からなる群から選択することができる:上記のCas9参照配列において番号付けされたアミノ酸残基1～529、538～568、580～685、692～942、948～1001、1026～1051、1078～1231、もしくは1248～1297、または別のCas9ポリペプチドの対応するアミノ酸残基。

異種ポリペプチド(例えば、アデニンデアミナーゼ)は、以下のアミノ酸残基に対応するCas9ポリペプチド領域に挿入され得る:上記のCas9参照配列において番号付けされたアミノ酸残基1017～1069、1242～1247、1052～1056、1060～1077、1002～1003、943～947、530～537、568～579、686～691、1242～1247、1298～1300、1066～1077、1052～1056、もしくは1060～1077、または別のCas9ポリペプチドの対応するアミノ酸残基。

異種ポリペプチド(例えば、アデニンデアミナーゼ)は、Cas9ポリペプチドの欠失領域の代わりに挿入され得る。欠失領域は、Cas9ポリペプチドのN末端部分またはC末端部分に対応し得る。一部の実施形態では、欠失領域は、上記のCas9参照配列において番号付けされた残基792～872、または別のCas9ポリペプチドの対応するアミノ酸残基に対応する。一部の実施形態では、欠失領域は、上記のCas9参照配列において番号付けされた残基792～906、または別のCas9ポリペプチドの対応するアミノ酸残基に対応する。一部の実施形態では、欠失領域は、上記のCas9参照配列において番号付けされた残基2～791、または別のCas9ポリペプチドの対応するアミノ酸残基に対応する。一部の実施形態では、欠失領域は、上記のCas9参照配列において番号付けされた残基1017～1069、またはその対応するアミノ酸残基に対応する。

以下の表4に、例示的な内部融合塩基エディターが提供される。

異種ポリペプチド(例えば、デアミナーゼ)は、Cas9ポリペプチドの構造または機能ドメイン内に挿入され得る。異種ポリペプチド(例えば、デアミナーゼ)は、Cas9ポリペプチドの2つの構造または機能ドメイン間に挿入され得る。異種ポリペプチド(例えば、デアミナーゼ)は、例えば、Cas9ポリペプチドからドメインを欠失させた後に、Cas9ポリペプチドの構造または機能ドメインの代わりに挿入され得る。Cas9ポリペプチドの構造または機能ドメインは、例えば、RuvCI、RuvCII、RuvCIII、Rec1、Rec2、PI、またはHNHを含むことができる。

一部の実施形態では、Cas9ポリペプチドは、以下からなる群から選択される1つ以上のドメインを欠く:RuvCI、RuvCII、RuvCIII、Rec1、Rec2、PI、またはHNHドメイン。一部の実施形態では、Cas9ポリペプチドは、ヌクレアーゼドメインを欠く。一部の実施形態では、Cas9ポリペプチドは、HNHドメインを欠く。一部の実施形態では、Cas9ポリペプチドは、HNHドメインの一部を欠き、そのため、Cas9ポリペプチドは、HNH活性が低下または消失している。一部の実施形態では、Cas9ポリペプチドは、ヌクレアーゼドメインの欠失を含み、デアミナーゼが、ヌクレアーゼドメインを置き換えるために挿入される。一部の実施形態では、HNHドメインが欠失され、デアミナーゼが、その場所に挿入される。一部の実施形態では、RuvCドメインのうちの1つ以上が欠失され、デアミナーゼが、その場所に挿入される。

異種ポリペプチドを含む融合タンパク質は、napDNAbpのN末端断片及びC末端断片に隣接し得る。一部の実施形態では、融合タンパク質は、Cas9ポリペプチドのN末端断片及びC末端断片に隣接するデアミナーゼを含む。N末端断片またはC末端断片は、標的ポリヌクレオチド配列に結合することができる。N末端断片のC末端またはC末端断片のN末端は、Cas9ポリペプチドの可動性ループの一部を含むことができる。N末端断片のC末端またはC末端断片のN末端は、Cas9ポリペプチドのアルファヘリックス構造の一部を含むことができる。N末端断片またはC末端断片は、DNA結合ドメインを含むことができる。N末端断片またはC末端断片は、RuvCドメインを含むことができる。N末端断片またはC末端断片は、HNHドメインを含むことができる。一部の実施形態では、N末端断片及びC末端断片のいずれかは、HNHドメインを含まない。

一部の実施形態では、N末端Cas9断片のC末端は、融合タンパク質が標的核酸塩基を脱アミノ化するときに標的核酸塩基に近接しているアミノ酸を含む。一部の実施形態では、C末端Cas9断片のN末端は、融合タンパク質が標的核酸塩基を脱アミノ化するときに標的核酸塩基に近接しているアミノ酸を含む。異なるデアミナーゼの挿入場所は、標的核酸塩基とN末端Cas9断片のC末端またはC末端Cas9断片のN末端のアミノ酸との間に近接性を持たせるために、異なり得る。例えば、デアミナーゼの挿入位置は、以下からなる群から選択されるアミノ酸残基にあり得る:上記のCas9参照配列において番号付けされたアミノ酸残基1015、1022、1029、1040、1068、1247、1054、1026、768、1067、1248、1052、及び1246、または別のCas9ポリペプチドの対応するアミノ酸残基。

融合タンパク質のN末端Cas9断片(すなわち、融合タンパク質のデアミナーゼに隣接するN末端Cas9断片)は、Cas9ポリペプチドのN末端を含むことができる。融合タンパク質のN末端Cas9断片は、少なくとも約:100、200、300、400、500、600、700、800、900、1000、1100、1200、または1300アミノ酸の長さを含むことができる。融合タンパク質のN末端Cas9断片は、以下のアミノ酸残基に対応する配列を含むことができる:上記のCas9参照配列において番号付けされたアミノ酸残基1～56、1～95、1～200、1～300、1～400、1～500、1～600、1～700、1～718、1～765、1～780、1～906、1～918、もしくは1～1100、または別のCas9ポリペプチドの対応するアミノ酸残基。N末端Cas9断片は、上記のCas9参照配列において番号付けされたアミノ酸残基1～56、1～95、1～200、1～300、1～400、1～500、1～600、1～700、1～718、1～765、1～780、1～906、1～918、もしくは1～1100、または別のCas9ポリペプチドの対応するアミノ酸残基と、少なくとも85%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも99.5%の配列同一性を含む配列を含むことができる。

融合タンパク質のC末端Cas9断片(すなわち、融合タンパク質のデアミナーゼに隣接するC末端Cas9断片)は、Cas9ポリペプチドのC末端を含むことができる。融合タンパク質のC末端Cas9断片は、少なくとも約:100、200、300、400、500、600、700、800、900、1000、1100、1200、または1300アミノ酸の長さを含むことができる。融合タンパク質のC末端Cas9断片は、以下のアミノ酸残基に対応する配列を含むことができる:上記のCas9参照配列において番号付けされたアミノ酸残基1099～1368、918～1368、906～1368、780～1368、765～1368、718～1368、94～1368もしくは56～1368、または別のCas9ポリペプチドにおける対応するアミノ酸残基。N末端Cas9断片は、上記のCas9参照配列において番号付けされたアミノ酸残基1099～1368、918～1368、906～1368、780～1368、765～1368、718～1368、94～1368もしくは56～1368、または別のCas9ポリペプチドにおける対応するアミノ酸残基と、少なくとも85%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも99.5%の配列同一性を含む配列を含むことができる。

融合タンパク質のN末端Cas9断片及びC末端Cas9断片は、一緒にまとめて、例えば、上記のCas9参照配列に記載されるような、天然の全長のCas9ポリペプチド配列に対応しない場合がある。

本明細書に記載の融合タンパク質は、標的化された脱アミノ化をもたらすことができ、非標的部位(例えば、オフターゲット部位)における脱アミノ化が低減される(例えば、ゲノムワイドの擬脱アミノ化が低減される)。本明細書に記載の融合タンパク質は、標的化された脱アミノ化をもたらすことができ、非標的部位におけるバイスタンダー(bystander)脱アミノが低減される。望ましくない脱アミノまたはオフターゲット脱アミノ化は、例えば、Cas9ポリペプチドのN末端またはC末端に融合されたデアミナーゼを含む末端(end terminus)融合タンパク質と比較して、少なくとも30%、少なくとも40%、少なくとも50%、少なくとも60%、少なくとも70%、少なくとも80%、少なくとも90%、少なくとも95%、または少なくとも99%低減され得る。望ましくない脱アミノ化またはオフターゲット脱アミノ化は、例えば、Cas9ポリペプチドのN末端またはC末端に融合されたデアミナーゼを含む末端融合タンパク質と比較して、少なくとも1倍、少なくとも2倍、少なくとも3倍、少なくとも4倍、少なくとも5倍、少なくとも10倍、少なくとも15倍、少なくとも20倍、少なくとも30倍、少なくとも40倍、少なくとも50倍、少なくとも60倍、少なくとも70倍、少なくとも80倍、少なくとも90倍、または少なくとも100倍低減され得る。

一部の実施形態では、融合タンパク質のデアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼ及びシチジンデアミナーゼ)は、Rループの範囲内の2つ以下の核酸塩基を脱アミノ化する。一部の実施形態では、融合タンパク質のデアミナーゼは、Rループの範囲内の3つ以下の核酸塩基を脱アミノ化する。一部の実施形態では、融合タンパク質のデアミナーゼは、Rループの範囲内の2、3、4、5、6、7、8、9、または10個以下の核酸塩基を脱アミノ化する。Rループは、三本鎖核酸構造であり、DNA:RNAハイブリッド、DNA:DNA、またはRNA:RNA相補構造を含み、一本鎖DNAと会合している。本明細書で使用される場合、Rループは、標的ポリヌクレオチドがCRISPR複合体または塩基編集複合体と接触すると形成され得、ガイドポリヌクレオチドの一部分(例えば、ガイドRNA)が、標的ポリヌクレオチドの一部分(例えば、標的DNA)とハイブリダイズし、それを置換する。一部の実施形態では、Rループは、スペーサー配列及び標的DNA相補配列のハイブリダイズした領域を含む。Rループ領域は、約5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、または50核酸塩基対長の領域であり得る。一部の実施形態では、Rループ領域は、約20核酸塩基対長である。本明細書で使用される場合、Rループ領域は、ガイドポリヌクレオチドとハイブリダイズする標的DNA鎖に限定されないことを理解されたい。例えば、Rループ領域内の標的核酸塩基の編集は、ガイドRNAに対する相補鎖を含むDNA鎖に対するものであってもよく、またはガイドRNAに対する相補鎖の反対側の鎖であるDNA鎖に対するものであってもよい。一部の実施形態では、Rループの領域における編集は、標的DNA配列におけるガイドRNAに対する非相補鎖(プロトスペーサー鎖)上の核酸塩基を編集することを含む。

本明細書に記載の融合タンパク質は、正準塩基編集とは異なる編集ウィンドウにおける標的脱アミノ化をもたらすことができる。一部の実施形態では、標的核酸塩基は、標的ポリヌクレオチド配列におけるPAM配列の約1～約20塩基上流にある。一部の実施形態では、標的核酸塩基は、標的ポリヌクレオチド配列におけるPAM配列の約2～約12塩基上流にある。一部の実施形態では、標的核酸塩基は、約1～9塩基対、約2～10塩基対、約3～11塩基対、約4～12塩基対、約5～13塩基対、約6～14塩基対、約7～15塩基対、約8～16塩基対、約9～17塩基対、約10～18塩基対、約11～19塩基対、約12～20塩基対、約1～7塩基対、約2～8塩基対、約3～9塩基対、約4～10塩基対、約5～11塩基対、約6～12塩基対、約7～13塩基対、約8～14塩基対、約9～15塩基対、約10～16塩基対、約11～17塩基対、約12～18塩基対、約13～19塩基対、約14～20塩基対、約1～5塩基対、約2～6塩基対、約3～7塩基対、約4～8塩基対、約5～9塩基対、約6～10塩基対、約7～11塩基対、約8～12塩基対、約9～13塩基対、約10～14塩基対、約11～15塩基対、約12～16塩基対、約13～17塩基対、約14～18塩基対、約15～19塩基対、約16～20塩基対、約1～3塩基対、約2～4塩基対、約3～5塩基対、約4～6塩基対、約5～7塩基対、約6～8塩基対、約7～9塩基対、約8～10塩基対、約9～11塩基対、約10～12塩基対、約11～13塩基対、約12～14塩基対、約13～15塩基対、約14～16塩基対、約15～17塩基対、約16～18塩基対、約17～19塩基対、約18～20塩基対、PAM配列から離れているか、またはPAM配列の上流にある。一部の実施形態では、標的核酸塩基は、約1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20塩基対、もしくはそれ以上、PAM配列から離れているか、またはPAM配列の上流にある。一部の実施形態では、標的核酸塩基は、PAM配列の約1、2、3、4、5、6、7、8、または9塩基対上流にある。一部の実施形態では、標的核酸塩基は、PAM配列の約2、3、4、または6塩基対上流にある。

融合タンパク質は、複数の異種ポリペプチドを含むことができる。例えば、融合タンパク質は、1つ以上のUGIドメイン及び/または1つ以上の核局在化シグナルを更に含むことができる。2つ以上の異種ドメインは、直列に挿入され得る。2つ以上の異種ドメインは、それらがNapDNAbpにおいて直列ではないような位置に挿入され得る。

融合タンパク質は、デアミナーゼとnapDNAbpポリペプチドとの間にリンカーを含むことができる。リンカーは、ペプチドまたは非ペプチドリンカーであってもよい。例えば、リンカーは、XTEN、(GGGS)n(配列番号246)、(GGGGS)n(配列番号247)、(G)n、(EAAAK)n(配列番号248)、(GGS)n、SGSETPGTSESATPES(配列番号249)であり得る。一部の実施形態では、融合タンパク質は、N末端Cas9断片とデアミナーゼとの間にリンカーを含む。一部の実施形態では、融合タンパク質は、C末端Cas9断片とデアミナーゼとの間にリンカーを含む。一部の実施形態では、napDNAbpのN末端断片及びC末端断片は、リンカーでデアミナーゼに接続されている。一部の実施形態では、N末端断片及びC末端断片は、リンカーなしでデアミナーゼドメインに連結される。一部の実施形態では、融合タンパク質は、N末端Cas9断片とデアミナーゼとの間にリンカーを含むが、C末端Cas9断片とデアミナーゼとの間にリンカーを含まない。一部の実施形態では、融合タンパク質は、C末端Cas9断片とデアミナーゼとの間にリンカーを含むが、N末端Cas9断片とデアミナーゼとの間にリンカーを含まない。

一部の実施形態では、融合タンパク質中のnapDNAbpは、Cas12ポリペプチド(例えば、Cas12b/C2c1)またはその断片である。Cas12ポリペプチドは、バリアントCas12ポリペプチドであり得る。他の実施形態では、Cas12ポリペプチドのN末端断片またはC末端断片は、核酸プログラマブルDNA結合ドメインまたはRuvCドメインを含む。他の実施形態では、融合タンパク質は、Cas12ポリペプチドと触媒ドメインとの間にリンカーを含有する。他の実施形態では、リンカーのアミノ酸配列は、GGSGGS(配列番号250)またはGSSGSETPGTSESATPESSG(配列番号251)である。他の実施形態では、リンカーは、剛性リンカー(rigid linker)である。上記の態様の他の実施形態では、リンカーは、GGAGGCTCTGGAGGAAGC(配列番号252)またはGGCTCTTCTGGATCTGAAACACCTGGCACAAGCGAGAGCGCCACCCCTGAGAGCTCTGGC(配列番号253)によってコードされる。

Cas12ポリペプチドのN末端断片及びC末端断片に隣接する異種触媒ドメインを含む融合タンパク質は、本明細書に記載される方法における塩基編集にも有用である。Cas12及び1つ以上のデアミナーゼドメインを含む(例えば、アデノシンデアミナーゼ、またはCas12配列に隣接するアデノシンデアミナーゼドメインを含む)融合タンパク質は、標的配列の非常に特異的かつ効率的な塩基編集にも有用である。一実施形態では、キメラCas12融合タンパク質は、Cas12ポリペプチド内に挿入された異種触媒ドメイン(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼ及びシチジンデアミナーゼ)を含有する。一部の実施形態では、融合タンパク質は、Cas12内に挿入されたアデノシンデアミナーゼドメイン及びシチジンデアミナーゼドメインを含む。一部の実施形態では、アデノシンデアミナーゼを、Cas12内で融合させ、シチジンデアミナーゼを、C末端に融合させる。一部の実施形態では、アデノシンデアミナーゼを、Cas12内で融合させ、シチジンデアミナーゼを、N末端に融合させる。一部の実施形態では、シチジンデアミナーゼを、Cas12内で融合させ、アデノシンデアミナーゼを、C末端に融合させる。一部の実施形態では、シチジンデアミナーゼを、Cas12内で融合させ、アデノシンデアミナーゼを、N末端に融合させる。アデノシンデアミナーゼ及びシチジンデアミナーゼならびにCas12を有する融合タンパク質の例示的な構造は、以下のように提供される:
NH2-[Cas12(アデノシンデアミナーゼ)]-[シチジンデアミナーゼ]-COOH、
NH2-[シチジンデアミナーゼ]-[Cas12(アデノシンデアミナーゼ)]-COOH、
NH2-[Cas12(シチジンデアミナーゼ)]-[アデノシンデアミナーゼ]-COOH、または
NH2-[アデノシンデアミナーゼ]-[Cas12(シチジンデアミナーゼ)]-COOH、
一部の実施形態では、上記の一般的なアーキテクチャで使用される「-」は、任意選択のリンカーの存在を示す。

様々な実施形態では、触媒ドメインは、アデノシンデアミナーゼ活性などのDNA修飾活性(例えば、デアミナーゼ活性)を有する。一部の実施形態では、アデノシンデアミナーゼは、TadA(例えば、TadA*7.10)である。一部の実施形態では、TadAは、TadA*8である。一部の実施形態では、TadA*8を、Cas12内で融合させ、シチジンデアミナーゼを、C末端に融合させる。一部の実施形態では、TadA*8を、Cas12内で融合させ、シチジンデアミナーゼを、N末端に融合させる。一部の実施形態では、シチジンデアミナーゼを、Cas12内で融合させ、TadA*8を、C末端に融合させる。一部の実施形態では、シチジンデアミナーゼを、Cas12内で融合させ、TadA*8を、N末端に融合させる。TadA*8及びシチジンデアミナーゼならびにCas12を有する融合タンパク質の例示的な構造は、以下のように提供される:
N-[Cas12(TadA*8)]-[シチジンデアミナーゼ]-C、
N-[シチジンデアミナーゼ]-[Cas12(TadA*8)]-C、
N-[Cas12(シチジンデアミナーゼ)]-[TadA*8]-C、または
N-[TadA*8]-[Cas12(シチジンデアミナーゼ)]-C。
一部の実施形態では、上記の一般的なアーキテクチャで使用される「-」は、任意選択のリンカーの存在を示す。

他の実施形態では、融合タンパク質は1つ以上の触媒ドメインを含有する。他の実施形態では、1つ以上の触媒ドメインのうちの少なくとも1つは、Cas12ポリペプチド内に挿入されるか、またはCas12のN末端もしくはC末端で融合される。他の実施形態では、1つ以上の触媒ドメインのうちの少なくとも1つは、Cas12ポリペプチドのループ、アルファヘリックス領域、非構造化部分、または溶媒アクセス可能部分内に挿入される。他の実施形態では、Cas12ポリペプチドは、Cas12a、Cas12b、Cas12c、Cas12d、Cas12e、Cas12g、Cas12h、Cas12i、またはCas12j/CasΦである。他の実施形態では、Cas12ポリペプチドは、Bacillus hisashii Cas12b、Bacillus thermoamylovorans Cas12b、Bacillus種V3-13 Cas12bまたはAlicyclobacillus acidiphilus Cas12b(配列番号254)に対して少なくとも約85%のアミノ酸配列同一性を有する。他の実施形態では、Cas12ポリペプチドは、Bacillus hisashii Cas12b(配列番号255)、Bacillus thermoamylovorans Cas12b、Bacillus種V3-13 Cas12b、またはAlicyclobacillus acidiphilus Cas12bに対して、少なくとも約90%のアミノ酸配列同一性を有する。他の実施形態では、Cas12ポリペプチドは、Bacillus hisashii Cas12b、Bacillus thermoamylovorans Cas12b(配列番号256)、Bacillus種V3-13 Cas12b、またはAlicyclobacillus acidiphilus Cas12b(配列番号257)に対して、少なくとも約95%のアミノ酸配列同一性を有する。他の実施形態では、Cas12ポリペプチドは、Bacillus hisashii Cas12b、Bacillus thermoamylovorans Cas12b、Bacillus種V3-13 Cas12b、もしくはAlicyclobacillus acidiphilus Cas12bの断片を含有するか、または本質的にそれからなる。実施形態では、Cas12ポリペプチドは、BvCas12b(V4)を含有し、これは、一部の実施形態では、5’mRNA Cap---5’UTR---bhCas12b---終止配列---3’UTR---120ポリAテール(配列番号258～260)として表現される。

他の実施形態では、触媒ドメインは、BhCas12bのアミノ酸位置153-154、255-256、306-307、980-981、1019-1020、534-535、604-605、もしくは344-345の間、またはCas12a、Cas12c、Cas12d、Cas12e、Cas12g、Cas12h、Cas12i、もしくはCas12j/CasΦの対応するアミノ酸残基の間に挿入される。他の実施形態では、触媒ドメインは、BhCas12bのアミノ酸P153とS154との間に挿入される。他の実施形態では、触媒ドメインは、BhCas12bのアミノ酸K255とE256との間に挿入される。他の実施形態では、触媒ドメインは、BhCas12bのアミノ酸D980とG981との間に挿入される。他の実施形態では、触媒ドメインは、BhCas12bのアミノ酸K1019とL1020との間に挿入される。他の実施形態では、触媒ドメインは、BhCas12bのアミノ酸F534とP535との間に挿入される。他の実施形態では、触媒ドメインは、BhCas12bのアミノ酸K604とG605との間に挿入される。他の実施形態では、触媒ドメインは、BhCas12bのアミノ酸H344とF345との間に挿入される。他の実施形態では、触媒ドメインは、BvCas12bのアミノ酸位置147と148、248と249、299と300、991と992、もしくは1031と1032との間、またはCas12a、Cas12c、Cas12d、Cas12e、Cas12g、Cas12h、Cas12i、もしくはCas12j/CasΦの対応するアミノ酸残基の間に挿入される。他の実施形態では、触媒ドメインは、BvCas12bのアミノ酸P147とD148との間に挿入される。他の実施形態では、触媒ドメインは、BvCas12bのアミノ酸G248とG249との間に挿入される。他の実施形態では、触媒ドメインは、BvCas12bのアミノ酸P299とE300との間に挿入される。他の実施形態では、触媒ドメインは、BvCas12bのアミノ酸G991とE992との間に挿入される。他の実施形態では、触媒ドメインは、BvCas12bのアミノ酸K1031とM1032との間に挿入される。他の実施形態では、触媒ドメインは、AaCas12bのアミノ酸位置157と158、258と259、310と311、1008と1009、もしくは1044と1045との間、またはCas12a、Cas12c、Cas12d、Cas12e、Cas12g、Cas12h、Cas12i、もしくはCas12j/CasΦの対応するアミノ酸残基の間に挿入される。他の実施形態では、触媒ドメインは、AaCas12bのアミノ酸P157とG158との間に挿入される。他の実施形態では、触媒ドメインは、AaCas12bのアミノ酸V258とG259との間に挿入される。他の実施形態では、触媒ドメインは、AaCas12bのアミノ酸D310とP311との間に挿入される。他の実施形態では、触媒ドメインは、AaCas12bのアミノ酸G1008とE1009との間に挿入される。他の実施形態では、触媒ドメインは、AaCas12bのアミノ酸G1044とK1045との間に挿入される。

他の実施形態では、融合タンパク質は、核局在化シグナル(例えば、二分核局在化シグナル)を含有する。他の実施形態では、核局在化シグナルのアミノ酸配列は、MAPKKKRKVGIHGVPAA(配列番号261)である。上記の態様の他の実施形態では、核局在化シグナルは、以下の配列によってコードされる:
ATGGCCCCAAAGAAGAAGCGGAAGGTCGGTATCCACGGAGTCCCAGCAGCC(配列番号262)。他の実施形態では、Cas12bポリペプチドは、RuvCドメインの触媒活性をサイレンシングする変異を含有する。他の実施形態では、Cas12bポリペプチドは、D574A、D829A及び/またはD952A変異を含有する。他の実施形態では、融合タンパク質は、タグ(例えば、インフルエンザヘマグルチニンタグ)を更に含有する。

一部の実施形態では、融合タンパク質は、napDNAbpドメイン(例えば、Cas12由来ドメイン)を含み、内部融合核酸塩基編集ドメイン(例えば、デアミナーゼドメイン(例えば、アデノシンデアミナーゼドメイン)の全部または一部)を有する。一部の実施形態では、napDNAbpは、Cas12bである。一部の実施形態では、塩基エディターは、BhCas12bドメインを含み、以下の表5に提供される遺伝子座に挿入された内部融合TadA*8ドメインを有する。

非限定的な例として、アデノシンデアミナーゼ(例えば、TadA*8.13)をBhCas12bに挿入して、核酸配列を効果的に編集する融合タンパク質(例えば、TadA*8.13-BhCas12b)を生成することができる。

一部の実施形態では、本明細書に記載の塩基エディターシステムは、TadAがCas9に挿入されたABEである。Cas9内に挿入されたTadAを有する関連するABEのポリペプチド配列は、添付の配列表で配列番号263～308として提供される。

一部の実施形態では、アデノシンデアミナーゼ塩基エディターを生成して、TadAまたはそのバリアントを、特定された位置でCas9ポリペプチドに挿入した。

例示的であるが非限定的な融合タンパク質は、国際PCT出願第PCT/US2020/016285号及び米国仮出願第62/852,228号及び同第62/852,224号に記載されている(これらの内容は、その全体が参照により本明細書に援用される)。

AからGの編集
一部の実施形態では、本明細書に記載の塩基エディターは、アデノシンデアミナーゼドメインを含む。塩基エディターのそのようなアデノシンデアミナーゼドメインは、Aを脱アミノ化して、Gの塩基対形成の特性を示すイノシン(I)を形成することによって、アデニン(A)核酸塩基のグアニン(G)核酸塩基への編集を促進することができる。アデノシンデアミナーゼは、デオキシリボ核酸(DNA)のデオキシアデノシン残基のアデニンを脱アミノ化する(すなわち、アミン基を除去する)ことができる。一部の実施形態では、AからGの(A-to-G)塩基エディターは、イノシン塩基除去修復の阻害剤、例えば、ウラシルグリコシラーゼ阻害剤(UGI)ドメインまたは触媒不活性のイノシン特異的ヌクレアーゼを更に含む。任意の特定の理論に拘束されることを望むものではないが、UGIドメインまたは触媒不活性イノシン特異的ヌクレアーゼは、脱アミノ化アデノシン残基(例えば、イノシン)の塩基除去修復を阻害または防止することができ、これは、塩基エディターの活性または効率を改善することができる。

アデノシンデアミナーゼを含む塩基エディターは、DNA、RNA、及びDNA-RNAハイブリッドを含む任意のポリヌクレオチドに作用することができる。特定の実施形態では、アデノシンデアミナーゼを含む塩基エディターは、RNAを含むポリヌクレオチドの標的Aを脱アミノ化することができる。例えば、塩基エディターは、RNAポリヌクレオチド及び/またはDNA-RNAハイブリッドポリヌクレオチドの標的Aを脱アミノ化することができるアデノシンデアミナーゼドメインを含むことができる。一実施形態では、塩基エディターに組み込まれるアデノシンデアミナーゼは、RNA(ADAR、例えば、ADAR1またはADAR2)またはtRNA(ADAT)に作用するアデノシンデアミナーゼの全部または一部を含む。アデノシンデアミナーゼドメインを含む塩基エディターは、DNAポリヌクレオチドのA核酸塩基を脱アミノ化することもできる。一実施形態では、塩基エディターのアデノシンデアミナーゼドメインは、ADATがDNA中の標的Aを脱アミノ化することを可能にする1つ以上の変異を含むADATの全部または一部を含む。例えば、塩基エディターは、以下の変異のうちの1つ以上を含むEscherichia coli由来のADAT(EcTadA)の全部または一部を含むことができる:D108N、A106V、D147Y、E155V、L84F、H123Y、I156F、または別のアデノシンデアミナーゼにおける対応する変異。例示的なADAT相同体ポリペプチド配列は、配列表で配列番号1及び309～315として提供される。

アデノシンデアミナーゼは、任意の好適な生物(例えば、E.coli)に由来し得る。一部の実施形態では、アデノシンデアミナーゼは、原核生物由来である。一部の実施形態では、アデノシンデアミナーゼは、細菌由来である。一部の実施形態では、アデノシンデアミナーゼは、Escherichia coli、Staphylococcus aureus、Salmonella typhi、Shewanella putrefaciens、Haemophilus influenzae、Caulobacter crescentus、またはBacillus subtilis由来である。一部の実施形態では、アデノシンデアミナーゼは、E.coli由来である。一部の実施形態では、アデニンデアミナーゼは、本明細書に提供される変異(例えば、ecTadAにおける変異)のいずれかに対応する1つ以上の変異を含む、天然のアデノシンデアミナーゼである。任意の相同タンパク質における対応する残基は、例えば、配列アラインメント及び相同残基の決定によって特定することができる。本明細書に記載の変異のいずれか(例えば、ecTadAにおいて特定された変異のいずれか)に対応する、任意の天然に存在するアデノシンデアミナーゼにおける(例えば、ecTadAと相同性を有する)変異は、それに応じて生成することができる。

一部の実施形態では、アデノシンデアミナーゼは、本明細書に提供されるアデノシンデアミナーゼのいずれかに記載のアミノ酸配列のいずれか1つと、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも99.5%同一であるアミノ酸配列を含む。本明細書に提供されるアデノシンデアミナーゼが、1つ以上の変異(例えば、本明細書に提供される変異のいずれか)を含み得ることを理解されたい。本開示は、特定のパーセント同一性、加えて、本明細書に記載の変異またはそれらの組み合わせのうちのいずれかを有する、任意のデアミナーゼドメインを提供する。一部の実施形態では、アデノシンデアミナーゼは、参照配列または本明細書に提供されるアデノシンデアミナーゼのいずれかと比較して、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、21、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50個、またはそれ以上の変異を有するアミノ酸配列を含む。一部の実施形態では、アデノシンデアミナーゼは、当該技術分野で既知であるか、または本明細書に記載のアミノ酸配列のいずれか1つと比較して、少なくとも5、少なくとも10、少なくとも15、少なくとも20、少なくとも25、少なくとも30、少なくとも35、少なくとも40、少なくとも45、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90、少なくとも100、少なくとも110、少なくとも120、少なくとも130、少なくとも140、少なくとも150、少なくとも160、または少なくとも170個の同一の連続したアミノ酸残基を有するアミノ酸配列を含む。

本明細書に提供される変異のいずれか(例えば、TadA参照配列に基づく)が、E.coli TadA(ecTadA)、S.aureus TadA(saTadA)、または他のアデノシンデアミナーゼ(例えば、細菌アデノシンデアミナーゼ)などの他のアデノシンデアミナーゼに導入され得ることを理解されたい。追加のデアミナーゼを、同様に整列させて相同アミノ酸残基を特定することができ、本明細書に提供されるように変異導入され得ることは、当業者には明らかであろう。したがって、TadA参照配列において特定された変異のいずれかは、相同アミノ酸残基を有する他のアデノシンデアミナーゼ(例えば、ecTada)において作製され得る。本明細書に提供される変異のいずれかは、TadA参照配列または別のアデノシンデアミナーゼにおいて、個別に、または任意の組み合わせで作製され得ることも理解されたい。

一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるD108X変異または別のアデノシンデアミナーゼにおける対応する変異を含み、Xは、野生型のアデノシンデアミナーゼにおける対応するアミノ酸以外のいずれかのアミノ酸を示す。一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるD108G、D108N、D108V、D108A、もしくはD108Y変異、または別のアデノシンデアミナーゼにおける対応する変異を含む。しかしながら、追加のデアミナーゼを、同様に整列させて相同アミノ酸残基を特定することができ、本明細書に提供されるように変異導入され得ることを理解されたい。

一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるA106X変異または別のアデノシンデアミナーゼにおける対応する変異を含み、Xは、野生型のアデノシンデアミナーゼにおける対応するアミノ酸以外のいずれかのアミノ酸を示す。一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるA106V変異、または別のアデノシンデアミナーゼ(例えばecTadA)における対応する変異を含む。

一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるE155X変異または別のアデノシンデアミナーゼにおける対応する変異を含み、Xの存在は、野生型のアデノシンデアミナーゼにおける対応するアミノ酸以外のいずれかのアミノ酸を示す。一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるE155D、E155G、またはE155V変異、または別のアデノシンデアミナーゼにおける対応する変異(例えば、ecTadA)を含む。

一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるD147X変異または別のアデノシンデアミナーゼにおける対応する変異を含み、Xの存在は、野生型のアデノシンデアミナーゼにおける対応するアミノ酸以外のいずれかのアミノ酸を示す。一部の実施形態では、アデノシンデアミナーゼは、D147Y、TadA参照配列における変異、または別のアデノシンデアミナーゼにおける対応する変異(例えば、ecTadA)を含む。

一部の実施形態では、アデノシンデアミナーゼは、A106X、E155X、またはD147X、TadA参照配列における変異、または別のアデノシンデアミナーゼ(例えばecTadA)における対応する変異を含む(ここで、Xは、野生型アデノシンデアミナーゼの対応するアミノ酸以外の任意のアミノ酸を示す)。一部の実施形態では、アデノシンデアミナーゼは、E155D、E155G、またはE155V変異を含む。一部の実施形態では、アデノシンデアミナーゼは、D147Yを含む。

本明細書に提供される変異のいずれかは、ecTadAまたは別のアデノシンデアミナーゼにおいて、個別に、または任意の組み合わせで作製され得ることも理解されたい。例えば、アデノシンデアミナーゼは、TadA参照配列におけるD108N、A106V、E155V、及び/またはD147Y変異、または別のアデノシンデアミナーゼ(例えば、ecTadA)における対応する変異を含有し得る。一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列における以下の変異群(変異群は、「;」によって分離される)、または別のアデノシンデアミナーゼにおける対応する変異を含む:D108N及びA106V;D108N及びE155V;D108N及びD147Y;A106V及びE155V;A106V及びD147Y;E155V及びD147Y;D108N、A106V、及びE155V;D108N、A106V、及びD147Y;D108N、E155V、及びD147Y;A106V、E155V、及びD147Y;ならびにD108N、A106V、E155V、及びD147Y。しかしながら、本明細書に提供される対応する変異の任意の組み合わせが、アデノシンデアミナーゼ(例えば、ecTadA)において作製され得ることを理解されたい。

一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるH8X、T17X、L18X、W23X、L34X、W45X、R51X、A56X、E59X、E85X、M94X、I95X、V102X、F104X、A106X、R107X、D108X、K110X、M118X、N127X、A138X、F149X、M151X、R153X、Q154X、I156X及び/またはK157X変異のうちの1つ以上、または別のアデノシンデアミナーゼにおける1つ以上の対応する変異を含み、Xの存在は、野生型のアデノシンデアミナーゼにおける対応するアミノ酸以外のいずれかのアミノ酸を示す。一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるH8Y、T17S、L18E、W23L、L34S、W45L、R51H、A56EもしくはA56S、E59G、E85KもしくはE85G、M94L、I95L、V102A、F104L、A106V、R107CもしくはR107HもしくはR107P、D108GもしくはD108NもしくはD108VもしくはD108AもしくはD108Y、K110I、M118K、N127S、A138V、F149Y、M151V、R153C、Q154L、I156D、及び/またはK157R変異のうちの1つ以上、あるいは別のアデノシンデアミナーゼにおける1つ以上の対応する変異を含む。

一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるH8X、D108X及び/またはN127X変異のうちの1つ以上、または別のアデノシンデアミナーゼにおける1つ以上の対応する変異を含み、Xは、いずれかのアミノ酸の存在を示す。一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるH8Y、D108N、及び/またはN127S変異、または別のアデノシンデアミナーゼにおける1つ以上の対応する変異のうちの1つ以上を含む。

一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるH8X、R26X、M61X、L68X、M70X、A106X、D108X、A109X、N127X、D147X、R152X、Q154X、E155X、K161X、Q163X及び/またはT166X変異のうちの1つ以上、または別のアデノシンデアミナーゼにおける1つ以上の対応する変異を含み、Xは、野生型のアデノシンデアミナーゼにおける対応するアミノ酸以外のいずれかのアミノ酸の存在を示す。一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるH8Y、R26W、M61I、L68Q、M70V、A106T、D108N、A109T、N127S、D147Y、R152C、Q154HもしくはQ154R、E155GもしくはE155VもしくはE155D、K161Q、Q163H、及び/またはT166Pのうちの1つ以上、または別のアデノシンデアミナーゼにおける1つ以上の対応する変異を含む。

一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるH8X、D108X、N127X、D147X、R152X、及びQ154Xからなる群から選択される1、2、3、4、5、もしくは6つの変異、または別のアデノシンデアミナーゼ(例えばecTadA)における対応する変異を含む(ここで、Xは、野生型アデノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸の存在を示す)。一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるH8X、M61X、M70X、D108X、N127X、Q154X、E155X、及びQ163Xからなる群から選択される1、2、3、4、5、6、7、もしくは8つの変異、または別のアデノシンデアミナーゼ(例えばecTadA)における対応する変異を含む(ここで、Xは、野生型アデノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸の存在を示す)。一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるH8X、D108X、N127X、E155X、及びT166Xからなる群から選択される1、2、3、4、もしくは5つの変異、または別のアデノシンデアミナーゼ(例えばecTadA)における対応する変異(複数可)を含む(ここで、Xは、野生型アデノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸の存在を示す)。

一部の実施形態では、アデノシンデアミナーゼは、H8X、A106X、及びD108Xからなる群から選択される1、2、3、4、5、もしくは6つの変異、または別のアデノシンデアミナーゼにおける対応する変異(複数可)を含む(ここで、Xは、野生型アデノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸の存在を示す)。一部の実施形態では、アデノシンデアミナーゼは、H8X、R26X、L68X、D108X、N127X、D147X、及びE155Xからなる群から選択される1、2、3、4、5、6、7、もしくは8つの変異、または別のアデノシンデアミナーゼにおける対応する変異を含む(ここで、Xは、野生型アデノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸の存在を示す)。

一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるH8X、R126X、L68X、D108X、N127X、D147X、及びE155Xからなる群から選択される1、2、3、4、5、6、もしくは7つの変異、または別のアデノシンデアミナーゼにおける対応する変異を含む(ここで、Xは、野生型アデノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸の存在を示す)。一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるH8X、D108X、A109X、N127X、及びE155Xからなる群から選択される1、2、3、4、もしくは5つの変異、または別のアデノシンデアミナーゼにおける対応する変異(複数可)を含む(ここで、Xは、野生型アデノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸の存在を示す)。

一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるH8Y、D108N、N127S、D147Y、R152C、及びQ154Hからなる群から選択される1、2、3、4、5、もしくは6つの変異、または別のアデノシンデアミナーゼ(例えばecTadA)における対応する変異(複数可)を含む。一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるH8Y、M61I、M70V、D108N、N127S、Q154R、E155G、及びQ163Hからなる群から選択される1、2、3、4、5、6、7、もしくは8つの変異、または別のアデノシンデアミナーゼ(例えばecTadA)における対応する変異(複数可)を含む。一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるH8Y、D108N、N127S、E155V、及びT166Pからなる群から選択される1、2、3、4、もしくは5つの変異、または別のアデノシンデアミナーゼ(例えばecTadA)における対応する変異(複数可)を含む。一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるH8Y、A106T、D108N、N127S、E155D、及びK161Qからなる群から選択される1、2、3、4、5、もしくは6つの変異、または別のアデノシンデアミナーゼ(例えばecTadA)における対応する変異(複数可)を含む。一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるH8Y、R26W、L68Q、D108N、N127S、D147Y、及びE155Vからなる群から選択される1、2、3、4、5、6、7、もしくは8つの変異、または別のアデノシンデアミナーゼ(例えばecTadA)における対応する変異(複数可)を含む。一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるH8Y、D108N、A109T、N127S、及びE155Gからなる群から選択される1、2、3、4、もしくは5つの変異、または別のアデノシンデアミナーゼ(例えばecTadA)における対応する変異(複数可)を含む。

一部の実施形態では、アデノシンデアミナーゼは、上記の変異のうちの1つ以上または別のアデノシンデアミナーゼにおける1つ以上の対応する変異を含む。一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるD108N、D108G、もしくはD108V変異、または別のアデノシンデアミナーゼにおける対応する変異を含む。一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるA106V及びD108N変異、または別のアデノシンデアミナーゼにおける対応する変異を含む。一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるR107C及びD108N変異、または別のアデノシンデアミナーゼにおける対応する変異を含む。一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるH8Y、D108N、N127S、D147Y、及びQ154H変異、または別のアデノシンデアミナーゼにおける対応する変異を含む。一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるH8Y、D108N、N127S、D147Y、及びE155V変異、または別のアデノシンデアミナーゼにおける対応する変異を含む。一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるD108N、D147Y、及びE155V変異、または別のアデノシンデアミナーゼにおける対応する変異を含む。一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるH8Y、D108N、及びN127S変異、または別のアデノシンデアミナーゼにおける対応する変異を含む。一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるA106V、D108N、D147Y、及びE155Vの変異、または別のアデノシンデアミナーゼ(例えばecTadA)における対応する変異を含む。

一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるS2X、H8X、I49X、L84X、H123X、N127X、I156X及び/またはK160X変異のうちの1つ以上、または別のアデノシンデアミナーゼにおける1つ以上の対応する変異を含み、Xの存在は、野生型のアデノシンデアミナーゼにおける対応するアミノ酸以外のいずれかのアミノ酸を示す。一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるS2A、H8Y、I49F、L84F、H123Y、N127S、I156F、及び/またはK160S変異、または別のアデノシンデアミナーゼ(例えばecTadA)における1つ以上の対応する変異のうちの1つ以上を含む。

一部の実施形態では、アデノシンデアミナーゼは、L84X変異アデノシンデアミナーゼを含む(ここで、Xは、野生型アデノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸を示す)。一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるL84F変異、または別のアデノシンデアミナーゼ(例えばecTadA)における対応する変異を含む。

一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるH123X変異または別のアデノシンデアミナーゼにおける対応する変異を含み、Xは、野生型のアデノシンデアミナーゼにおける対応するアミノ酸以外のいずれかのアミノ酸を示す。一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるH123Y変異、または別のアデノシンデアミナーゼにおける対応する変異を含む。

一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるI156X変異または別のアデノシンデアミナーゼにおける対応する変異を含み、Xは、野生型のアデノシンデアミナーゼにおける対応するアミノ酸以外のいずれかのアミノ酸を示す。一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるI156F変異、または別のアデノシンデアミナーゼにおける対応する変異を含む。

一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるL84X、A106X、D108X、H123X、D147X、E155X及びI156Xからなる群から選択される1、2、3、4、5、6もしくは7つの変異、または別のアデノシンデアミナーゼにおける対応する1つ以上の変異を含み、Xは、野生型のアデノシンデアミナーゼにおける対応するアミノ酸以外のいずれかのアミノ酸の存在を示す。一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるS2X、I49X、A106X、D108X、D147X、及びE155Xからなる群から選択される1、2、3、4、5、もしくは6つの変異、または別のアデノシンデアミナーゼにおける対応する変異を含む(ここで、Xは、野生型アデノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸の存在を示す)。一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるH8X、A106X、D108X、N127X、及びK160Xからなる群から選択される1、2、3、4、もしくは5つの変異、または別のアデノシンデアミナーゼにおける対応する変異(複数可)を含む(ここで、Xは、野生型アデノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸の存在を示す)。

一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるL84F、A106V、D108N、H123Y、D147Y、E155V及びI156Fからなる群から選択される1、2、3、4、5、6もしくは7つの変異、または別のアデノシンデアミナーゼにおける対応する1つ以上の変異を含む。一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるS2A、I49F、A106V、D108N、D147Y、及びE155Vからなる群から選択される1、2、3、4、5、または6つの変異を含む。

一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるH8Y、A106T、D108N、N127S及びK160Sからなる群から選択される1、2、3、4もしくは5つの変異、または別のアデノシンデアミナーゼにおける対応する1つ以上の変異を含む。

一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるE25X、R26X、R107X、A142X及び/またはA143X変異のうちの1つ以上、または別のアデノシンデアミナーゼにおける1つ以上の対応する変異を含み、Xの存在は、野生型のアデノシンデアミナーゼにおける対応するアミノ酸以外のいずれかのアミノ酸を示す。一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるE25M、E25D、E25A、E25R、E25V、E25S、E25Y、R26G、R26N、R26Q、R26C、R26L、R26K、R107P、R107K、R107A、R107N、R107W、R107H、R107S、A142N、A142D、A142G、A143D、A143G、A143E、A143L、A143W、A143M、A143S、A143Q、及び/またはA143Rのうちの1つ以上、または別のアデノシンデアミナーゼにおける1つ以上の対応する変異を含む。一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列に対応する本明細書に記載の変異、または別のアデノシンデアミナーゼにおける1つ以上の対応する変異のうちの1つ以上を含む。

一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるE25X変異または別のアデノシンデアミナーゼにおける対応する変異を含み、Xは、野生型のアデノシンデアミナーゼにおける対応するアミノ酸以外のいずれかのアミノ酸を示す。一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるE25M、E25D、E25A、E25R、E25V、E25S、もしくはE25Y変異、または別のアデノシンデアミナーゼ(例えばecTadA)における対応する変異を含む。

一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるR26X変異または別のアデノシンデアミナーゼにおける対応する変異を含み、Xは、野生型のアデノシンデアミナーゼにおける対応するアミノ酸以外のいずれかのアミノ酸を示す。一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるR26G、R26N、R26Q、R26C、R26L、もしくはR26K変異、または別のアデノシンデアミナーゼ(例えばecTadA)における対応する変異を含む。

一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるR107X変異または別のアデノシンデアミナーゼにおける対応する変異を含み、Xは、野生型のアデノシンデアミナーゼにおける対応するアミノ酸以外のいずれかのアミノ酸を示す。一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるR107P、R107K、R107A、R107N、R107W、R107H、もしくはR107S変異、または別のアデノシンデアミナーゼ(例えばecTadA)における対応する変異を含む。

一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるA142X変異または別のアデノシンデアミナーゼにおける対応する変異を含み、Xは、野生型のアデノシンデアミナーゼにおける対応するアミノ酸以外のいずれかのアミノ酸を示す。一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるA142N、A142D、A142G変異、または別のアデノシンデアミナーゼ(例えばecTadA)の対応する変異を含む。

一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるA143X変異または別のアデノシンデアミナーゼにおける対応する変異を含み、Xは、野生型のアデノシンデアミナーゼにおける対応するアミノ酸以外のいずれかのアミノ酸を示す。一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるA143D、A143G、A143E、A143L、A143W、A143M、A143S、A143Q、及び/またはA143Rの変異、または別のアデノシンデアミナーゼ(例えばecTadA)における対応する変異を含む。

一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるH36X、N37X、P48X、I49X、R51X、M70X、N72X、D77X、E134X、S146X、Q154X、K157X及び/またはK161X変異のうちの1つ以上、または別のアデノシンデアミナーゼにおける1つ以上の対応する変異を含み、Xの存在は、野生型のアデノシンデアミナーゼにおける対応するアミノ酸以外のいずれかのアミノ酸を示す。一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるH36L、N37T、N37S、P48T、P48L、I49V、R51H、R51L、M70L、N72S、D77G、E134G、S146R、S146C、Q154H、K157N、及び/またはK161Tの変異のうちの1つ以上、または別のアデノシンデアミナーゼ(例えばecTadA)における1つ以上の対応する変異を含む。

一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるH36X変異または別のアデノシンデアミナーゼにおける対応する変異を含み、Xは、野生型のアデノシンデアミナーゼにおける対応するアミノ酸以外のいずれかのアミノ酸を示す。一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるH36L変異、または別のアデノシンデアミナーゼにおける対応する変異を含む。

一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるN37X変異または別のアデノシンデアミナーゼにおける対応する変異を含み、Xは、野生型のアデノシンデアミナーゼにおける対応するアミノ酸以外のいずれかのアミノ酸を示す。一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるN37TもしくはN37S変異、または別のアデノシンデアミナーゼにおける対応する変異を含む。

一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるP48X変異または別のアデノシンデアミナーゼにおける対応する変異を含み、Xは、野生型のアデノシンデアミナーゼにおける対応するアミノ酸以外のいずれかのアミノ酸を示す。一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるP48TもしくはP48L変異、または別のアデノシンデアミナーゼにおける対応する変異を含む。

一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるR51X変異または別のアデノシンデアミナーゼにおける対応する変異を含み、Xは、野生型のアデノシンデアミナーゼにおける対応するアミノ酸以外のいずれかのアミノ酸を示す。一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるR51HもしくはR51L変異、または別のアデノシンデアミナーゼにおける対応する変異を含む。

一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるS146X変異または別のアデノシンデアミナーゼにおける対応する変異を含み、Xは、野生型のアデノシンデアミナーゼにおける対応するアミノ酸以外のいずれかのアミノ酸を示す。一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるS146RもしくはS146C変異、または別のアデノシンデアミナーゼにおける対応する変異を含む。

一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるK157X変異または別のアデノシンデアミナーゼにおける対応する変異を含み、Xは、野生型のアデノシンデアミナーゼにおける対応するアミノ酸以外のいずれかのアミノ酸を示す。一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるK157N変異、または別のアデノシンデアミナーゼにおける対応する変異を含む。

一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるP48X変異または別のアデノシンデアミナーゼにおける対応する変異を含み、Xは、野生型のアデノシンデアミナーゼにおける対応するアミノ酸以外のいずれかのアミノ酸を示す。一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるP48S、P48T、もしくはP48A変異、または別のアデノシンデアミナーゼにおける対応する変異を含む。

一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるA142X変異または別のアデノシンデアミナーゼにおける対応する変異を含み、Xは、野生型のアデノシンデアミナーゼにおける対応するアミノ酸以外のいずれかのアミノ酸を示す。一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるA142N変異、または別のアデノシンデアミナーゼにおける対応する変異を含む。

一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるW23X変異または別のアデノシンデアミナーゼにおける対応する変異を含み、Xは、野生型のアデノシンデアミナーゼにおける対応するアミノ酸以外のいずれかのアミノ酸を示す。一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるW23RもしくはW23L変異、または別のアデノシンデアミナーゼにおける対応する変異を含む。

一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるR152X変異または別のアデノシンデアミナーゼにおける対応する変異を含み、Xは、野生型のアデノシンデアミナーゼにおける対応するアミノ酸以外のいずれかのアミノ酸を示す。一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるR152PもしくはR52H変異、または別のアデノシンデアミナーゼにおける対応する変異を含む。

一実施形態では、アデノシンデアミナーゼは、変異H36L、R51L、L84F、A106V、D108N、H123Y、S146C、D147Y、E155V、I156F及びK157Nを含み得る。一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列に対して以下の変異の組み合わせを含む(ここで、組み合わせの各変異は、「_」によって区切られ、変異の各組み合わせは、括弧の間にある:
(A106V_D108N),
(R107C_D108N)、
(H8Y_D108N_N127S_D147Y_Q154H)、
(H8Y_D108N_N127S_D147Y_E155V)、
(D108N_D147Y_E155V)、
(H8Y_D108N_N127S)、
(H8Y_D108N_N127S_D147Y_Q154H)、
(A106V_D108N_D147Y_E155V)、
(D108Q_D147Y_E155V)、
(D108M_D147Y_E155V)、
(D108L_D147Y_E155V)、
(D108K_D147Y_E155V)、
(D108I_D147Y_E155V)、
(D108F_D147Y_E155V)、
(A106V_D108N_D147Y)、
(A106V_D108M_D147Y_E155V)、
(E59A_A106V_D108N_D147Y_E155V)、
(E59A cat dead_A106V_D108N_D147Y_E155V)、
(L84F_A106V_D108N_H123Y_D147Y_E155V_I156Y)、
(L84F_A106V_D108N_H123Y_D147Y_E155V_I156F)、
(D103A_D104N)、
(G22P_D103A_D104N)、
(D103A_D104N_S138A)、
(R26G_L84F_A106V_R107H_D108N_H123Y_A142N_A143D_D147Y_E155V_I156F)、
(E25G_R26G_L84F_A106V_R107H_D108N_H123Y_A142N_A143D_D147Y_E155V_I156F)、
(E25D_R26G_L84F_A106V_R107K_D108N_H123Y_A142N_A143G_D147Y_E155V_I156F)、(R26Q_L84F_A106V_D108N_H123Y_A142N_D147Y_E155V_I156F)、
(E25M_R26G_L84F_A106V_R107P_D108N_H123Y_A142N_A143D_D147Y_E155V_I156F)、(R26C_L84F_A106V_R107H_D108N_H123Y_A142N_D147Y_E155V_I156F)、(L84F_A106V_D108N_H123Y_A142N_A143L_D147Y_E155V_I156F)、
(R26G_L84F_A106V_D108N_H123Y_A142N_D147Y_E155V_I156F)、
(E25A_R26G_L84F_A106V_R107N_D108N_H123Y_A142N_A143E_D147Y_E155V_I156F)、(R26G_L84F_A106V_R107H_D108N_H123Y_A142N_A143D_D147Y_E155V_I156F)、
(A106V_D108N_A142N_D147Y_E155V)、
(R26G_A106V_D108N_A142N_D147Y_E155V)、
(E25D_R26G_A106V_R107K_D108N_A142N_A143G_D147Y_E155V)、(R26G_A106V_D108N_R107H_A142N_A143D_D147Y_E155V)、
(E25D_R26G_A106V_D108N_A142N_D147Y_E155V)、
(A106V_R107K_D108N_A142N_D147Y_E155V)、
(A106V_D108N_A142N_A143G_D147Y_E155V)、
(A106V_D108N_A142N_A143L_D147Y_E155V)、
(H36L_R51L_L84F_A106V_D108N_H123Y_S146C_D147Y_E155V_I156F_K157N)、
(N37T_P48T_M70L_L84F_A106V_D108N_H123Y_D147Y_I49V_E155V_I156F)、
(N37S_L84F_A106V_D108N_H123Y_D147Y_E155V_I156F_K161T)、
(H36L_L84F_A106V_D108N_H123Y_D147Y_Q154H_E155V_I156F)、
(N72S_L84F_A106V_D108N_H123Y_S146R_D147Y_E155V_I156F)、
(H36L_P48L_L84F_A106V_D108N_H123Y_E134G_D147Y_E155V_I156F)、
(H36L_L84F_A106V_D108N_H123Y_D147Y_E155V_I156F_K157N)(H36L_L84F_A106V_D108N_H123Y_S146C_D147Y_E155V_I156F)、
(L84F_A106V_D108N_H123Y_S146R_D147Y_E155V_I156F_K161T)、
(N37S_R51H_D77G_L84F_A106V_D108N_H123Y_D147Y_E155V_I156F)、
(R51L_L84F_A106V_D108N_H123Y_D147Y_E155V_I156F_K157N)、
(D24G_Q71R_L84F_H96L_A106V_D108N_H123Y_D147Y_E155V_I156F_K160E)、
(H36L_G67V_L84F_A106V_D108N_H123Y_S146T_D147Y_E155V_I156F)、
(Q71L_L84F_A106V_D108N_H123Y_L137M_A143E_D147Y_E155V_I156F)、
(E25G_L84F_A106V_D108N_H123Y_D147Y_E155V_I156F_Q159L)、
(L84F_A91T_F104I_A106V_D108N_H123Y_D147Y_E155V_I156F)、
(N72D_L84F_A106V_D108N_H123Y_G125A_D147Y_E155V_I156F)、
(P48S_L84F_S97C_A106V_D108N_H123Y_D147Y_E155V_I156F)、
(W23G_L84F_A106V_D108N_H123Y_D147Y_E155V_I156F)、
(D24G_P48L_Q71R_L84F_A106V_D108N_H123Y_D147Y_E155V_I156F_Q159L)、
(L84F_A106V_D108N_H123Y_A142N_D147Y_E155V_I156F)、
(H36L_R51L_L84F_A106V_D108N_H123Y_A142N_S146C_D147Y_E155V_I156F_K157N)、(N37S_L84F_A106V_D108N_H123Y_A142N_D147Y_E155V_I156F_K161T)、
(L84F_A106V_D108N_D147Y_E155V_I156F)、
(R51L_L84F_A106V_D108N_H123Y_S146C_D147Y_E155V_I156F_K157N_K161T)、
(L84F_A106V_D108N_H123Y_S146C_D147Y_E155V_I156F_K161T)、
(L84F_A106V_D108N_H123Y_S146C_D147Y_E155V_I156F_K157N_K160E_K161T)、
(L84F_A106V_D108N_H123Y_S146C_D147Y_E155V_I156F_K157N_K160E)、(R74Q_L84F_A106V_D108N_H123Y_D147Y_E155V_I156F)、
(R74A_L84F_A106V_D108N_H123Y_D147Y_E155V_I156F)、
(L84F_A106V_D108N_H123Y_D147Y_E155V_I156F)、
(R74Q_L84F_A106V_D108N_H123Y_D147Y_E155V_I156F)、
(L84F_R98Q_A106V_D108N_H123Y_D147Y_E155V_I156F)、
(L84F_A106V_D108N_H123Y_R129Q_D147Y_E155V_I156F)、
(P48S_L84F_A106V_D108N_H123Y_A142N_D147Y_E155V_I156F)、
(P48S_A142N)、
(P48T_I49V_L84F_A106V_D108N_H123Y_A142N_D147Y_E155V_I156F_L157N)、
(P48T_I49V_A142N)、
(H36L_P48S_R51L_L84F_A106V_D108N_H123Y_S146C_D147Y_E155V_I156F_K157N)、(H36L_P48S_R51L_L84F_A106V_D108N_H123Y_S146C_A142N_D147Y_E155V_I156F(H36L_P48T_I49V_R51L_L84F_A106V_D108N_H123Y_S146C_D147Y_E155V_I156F_K157N)、
(H36L_P48T_I49V_R51L_L84F_A106V_D108N_H123Y_A142N_S146C_D147Y_E155V_I156F_K157N)、
(H36L_P48A_R51L_L84F_A106V_D108N_H123Y_S146C_D147Y_E155V_I156F_K157N)、
(H36L_P48A_R51L_L84F_A106V_D108N_H123Y_A142N_S146C_D147Y_E155V_I156F_K157N)、(H36L_P48A_R51L_L84F_A106V_D108N_H123Y_S146C_A142N_D147Y_E155V_I156F_K157N)、
(W23L_H36L_P48A_R51L_L84F_A106V_D108N_H123Y_S146C_D147Y_E155V_I156F_K157N)、(W23R_H36L_P48A_R51L_L84F_A106V_D108N_H123Y_S146C_D147Y_E155V_I156F_K157N)、(W23L_H36L_P48A_R51L_L84F_A106V_D108N_H123Y_S146R_D147Y_E155V_I156F_K161T)、
(H36L_P48A_R51L_L84F_A106V_D108N_H123Y_S146C_D147Y_R152H_E155V_I156F_K157N)、
(H36L_P48A_R51L_L84F_A106V_D108N_H123Y_S146C_D147Y_R152P_E155V_I156F_K157N)、
(W23L_H36L_P48A_R51L_L84F_A106V_D108N_H123Y_S146C_D147Y_R152P_E155V_I156F_K157N)、
(W23L_H36L_P48A_R51L_L84F_A106V_D108N_H123Y_A142A_S146C_D147Y_E155V_I156F_K157N)、
(W23L_H36L_P48A_R51L_L84F_A106V_D108N_H123Y_A142A_S146C_D147Y_R152P_E155V_I156F_K157N)、
(W23L_H36L_P48A_R51L_L84F_A106V_D108N_H123Y_S146R_D147Y_E155V_I156F_K161T)、
(W23R_H36L_P48A_R51L_L84F_A106V_D108N_H123Y_S146C_D147Y_R152P_E155V_I156F_K157N)、(H36L_P48A_R51L_L84F_A106V_D108N_H123Y_A142N_S146C_D147Y_R152P_E155 V_I156F_K157N)。

一部の実施形態では、TadAデアミナーゼは、TadAバリアントである。一部の実施形態では、TadAバリアントは、TadA*7.10である。特定の実施形態では、融合タンパク質は、(例えば、単量体として提供される)単一のTadA*7.10ドメインを含む。他の実施形態では、融合タンパク質は、ヘテロ二量体を形成することができるTadA*7.10及びTadA(wt)を含む。一実施形態では、本発明の融合タンパク質は、TadA*7.10に結合した野生型TadAを含み、これはCas9ニッカーゼに結合している。

一部の実施形態では、TadA*7.10は、少なくとも1つの改変を含む。一部の実施形態では、アデノシンデアミナーゼは、以下の配列における改変を含む:
TadA*7.10
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPRQVFNAQKKAQSSTD(配列番号1)。

一部の実施形態では、TadA*7.10は、アミノ酸82及び/または166における改変を含む。特定の実施形態では、TadA*7.10は、以下の改変のうちの1つ以上を含む:Y147T、Y147R、Q154S、Y123H、V82S、T166R、及び/またはQ154R。他の実施形態では、TadA*7.10のバリアントは、以下の群から選択される改変の組み合わせを含む:Y147T+Q154R、Y147T+Q154S、Y147R+Q154S、V82S+Q154S、V82S+Y147R、V82S+Q154R、V82S+Y123H、I76Y+V82S、V82S+Y123H+Y147T、V82S+Y123H+Y147R、V82S+Y123H+Q154R、Y147R+Q154R+Y123H、Y147R+Q154R+I76Y、Y147R+Q154R+T166R、Y123H+Y147R+Q154R+I76Y、V82S+Y123H+Y147R+Q154R、及びI76Y+V82S+Y123H+Y147R+Q154R。

一部の実施形態では、アデノシンデアミナーゼのバリアント(例えば、TadA*8)は、欠失を含む。一部の実施形態では、アデノシンデアミナーゼのバリアントは、C末端の欠失を含む。特定の実施形態では、アデノシンデアミナーゼのバリアントは、TadA*7.10、TadA参照配列に対して、残基149、150、151、152、153、154、155、156、及び157から始まるC末端の欠失、または別のTadAにおける対応する変異を含む。

他の実施形態では、アデノシンデアミナーゼのバリアント(例えば、TadA*8)は、以下の改変のうちの1つ以上を含む単量体である:TadA*7.10、TadA参照配列に対してY147T、Y147R、Q154S、Y123H、V82S、T166R、及び/またはQ154R、または別のTadAにおける対応する変異。他の実施形態では、アデノシンデアミナーゼのバリアント(TadA*8)は、以下の群から選択される改変の組み合わせを含む単量体である:TadA*7.10、TadA参照配列に対してY147T+Q154R、Y147T+Q154S、Y147R+Q154S、V82S+Q154S、V82S+Y147R、V82S+Q154R、V82S+Y123H、I76Y+V82S、V82S+Y123H+Y147T、V82S+Y123H+Y147R、V82S+Y123H+Q154R、Y147R+Q154R+Y123H、Y147R+Q154R+I76Y、Y147R+Q154R+T166R、Y123H+Y147R+Q154R+I76Y、V82S+Y123H+Y147R+Q154R、及びI76Y+V82S+Y123H+Y147R+Q154R、または別のTadAにおける対応する変異。

他の実施形態では、アデノシンデアミナーゼのバリアントは、2つのアデノシンデアミナーゼドメイン(例えば、TadA*8)を含むホモ二量体であり、各々、TadA*7.10、TadA参照配列に対して以下の改変Y147T、Y147R、Q154S、Y123H、V82S、T166R、及び/またはQ154Rのうちの1つ以上、または別のTadAにおける対応する変異を有する。他の実施形態では、アデノシンデアミナーゼのバリアントは、2つのアデノシンデアミナーゼドメイン(例えば、TadA*8)を含む単量体であり、各々、以下の群から選択される改変の組み合わせを有する:TadA*7.10、TadA参照配列に対してY147T+Q154R、Y147T+Q154S、Y147R+Q154S、V82S+Q154S、V82S+Y147R、V82S+Q154R、V82S+Y123H、I76Y+V82S、V82S+Y123H+Y147T、V82S+Y123H+Y147R、V82S+Y123H+Q154R、Y147R+Q154R+Y123H、Y147R+Q154R+I76Y、Y147R+Q154R+T166R、Y123H+Y147R+Q154R+I76Y、V82S+Y123H+Y147R+Q154R、及びI76Y+V82S+Y123H+Y147R+Q154R、または別のTadAにおける対応する変異。

他の実施形態では、アデノシンデアミナーゼのバリアントは、野生型アデノシンデアミナーゼドメインと、TadA*7.10、TadA参照配列に対して以下の改変Y147T、Y147R、Q154S、Y123H、V82S、T166R、及び/またはQ154Rのうちの1つ以上、または別のTadAにおける対応する変異を含むアデノシンデアミナーゼバリアントドメイン(例えば、TadA*8)とのヘテロ二量体である。他の実施形態では、アデノシンデアミナーゼのバリアントは、野生型アデノシンデアミナーゼドメインと、以下の群から選択される改変の組み合わせを含むアデノシンデアミナーゼバリアントドメイン(例えば、TadA*8)とのヘテロ二量体である:TadA*7.10、TadA参照配列に対してY147T+Q154R、Y147T+Q154S、Y147R+Q154S、V82S+Q154S、V82S+Y147R、V82S+Q154R、V82S+Y123H、I76Y+V82S、V82S+Y123H+Y147T、V82S+Y123H+Y147R、V82S+Y123H+Q154R、Y147R+Q154R+Y123H、Y147R+Q154R+I76Y、Y147R+Q154R+T166R、Y123H+Y147R+Q154R+I76Y、V82S+Y123H+Y147R+Q154R、及びI76Y+V82S+Y123H+Y147R+Q154R、または別のTadAにおける対応する変異。

他の実施形態では、アデノシンデアミナーゼのバリアントは、TadA*7.10ドメインと、TadA*7.10、TadA参照配列に対して以下の改変Y147T、Y147R、Q154S、Y123H、V82S、T166R、及び/またはQ154Rのうちの1つ以上、または別のTadAにおける対応する変異を含むアデノシンデアミナーゼバリアントドメイン(例えば、TadA*8)とのヘテロ二量体である。他の実施形態では、アデノシンデアミナーゼバリアントは、TadA*7.10ドメインと、アデノシンデアミナーゼバリアントドメイン(例えば、TadA*8)とのヘテロ二量体であり、アデノシンデアミナーゼバリアントドメインは、TadA参照配列TadA*7.10に対する以下の群から選択される改変の組み合わせまたは別のTadAにおける対応する変異を含む:Y147T+Q154R、Y147T+Q154S、Y147R+Q154S、V82S+Q154S、V82S+Y147R、V82S+Q154R、V82S+Y123H、I76Y+V82S、V82S+Y123H+Y147T、V82S+Y123H+Y147R、V82S+Y123H+Q154R、Y147R+Q154R+Y123H、Y147R+Q154R+I76Y、Y147R+Q154R+T166R、Y123H+Y147R+Q154R+I76Y、V82S+Y123H+Y147R+Q154R及びI76Y+V82S+Y123H+Y147R+Q154R。

特定の実施形態では、アデノシンデアミナーゼヘテロ二量体は、TadA*8ドメインと、Staphylococcus aureus(S.aureus)TadA、Bacillus subtilis(B.subtilis)TadA、Salmonella typhimurium(S.typhimurium)TadA、Shewanella putrefaciens(S.putrefaciens)TadA、Haemophilus influenzae F3031(H.influenzae)TadA、Caulobacter crescentus(C.crescentus)TadA、Geobacter sulfurreducens(G.sulfurreducens)TadA、またはTadA*7.10.から選択されるアデノシンデアミナーゼドメインと、を含む。

一部の実施形態では、アデノシンデアミナーゼは、TadA*8である。一実施形態では、アデノシンデアミナーゼは、以下の配列またはアデノシンデアミナーゼ活性を有するその断片を含むか、または本質的にそれからなるTadA*8である。
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCTFFRMPRQVFNAQKKAQSSTD(配列番号316)。

一部の実施形態では、TadA*8は、切断型(truncated)である。一部の実施形態では、切断型TadA*8は、全長TadA*8に対して、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、6、17、18、19または20個のN末端アミノ酸残基を欠く。一部の実施形態では、切断型TadA*8は、全長TadA*8に対して、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、6、17、18、19または20個のC末端アミノ酸残基を欠く。一部の実施形態では、アデノシンデアミナーゼのバリアントは、全長TadA*8である。

一部の実施形態では、TadA*8は、TadA*8.1、TadA*8.2、TadA*8.3、TadA*8.4、TadA*8.5、TadA*8.6、TadA*8.7、TadA*8.8、TadA*8.9、TadA*8.10、TadA*8.11、TadA*8.12、TadA*8.13、TadA*8.14、TadA*8.15、TadA*8.16、TadA*8.17、TadA*8.18、TadA*8.19、TadA*8.20、TadA*8.21、TadA*8.22、TadA*8.23、またはTadA*8.24である。

他の実施形態では、本開示の塩基エディターは、アデノシンデアミナーゼのバリアント(例えば、TadA*8)単量体を含み、以下の改変のうちの1つ以上を含む:TadA*7.10、TadA参照配列に対してR26C、V88A、A109S、T111R、D119N、H122N、Y147D、F149Y、T166I及び/またはD167N、または別のTadAにおける対応する変異。他の実施形態では、アデノシンデアミナーゼのバリアント(TadA*8)単量体は、以下の群から選択される改変の組み合わせを含む:TadA*7.10、TadA参照配列に対してR26C+A109S+T111R+D119N+H122N+Y147D+F149Y+T166I+D167N、V88A+A109S+T111R+D119N+H122N+F149Y+T166I+D167N、R26C+A109S+T111R+D119N+H122N+F149Y+T166I+D167N、V88A+T111R+D119N+F149Y、及びA109S+T111R+D119N+H122N+Y147D+F149Y+T166I+D167N、または別のTadAにおける対応する変異。

他の実施形態では、塩基エディターは、野生型アデノシンデアミナーゼドメインと、TadA*7.10、TadA参照配列に対して以下の改変R26C、V88A、A109S、T111R、D119N、H122N、Y147D、F149Y、T166I、及び/またはD167Nのうちの1つ以上、または別のTadAにおける対応する変異を含むアデノシンデアミナーゼバリアントドメイン(例えば、TadA*8)とのヘテロ二量体を含む。他の実施形態では、塩基エディターは、野生型アデノシンデアミナーゼドメインのヘテロ二量体と、以下の群から選択される改変の組み合わせを含むアデノシンデアミナーゼバリアントドメイン(例えば、TadA*8)とを含む:TadA*7.10、TadA参照配列に対してR26C+A109S+T111R+D119N+H122N+Y147D+F149Y+T166I+D167N、V88A+A109S+T111R+D119N+H122N+F149Y+T166I+D167N、R26C+A109S+T111R+D119N+H122N+F149Y+T166I+D167N、V88A+T111R+D119N+F149Y、及びA109S+T111R+D119N+H122N+Y147D+F149Y+T166I+D167N、または別のTadAにおける対応する変異。

他の実施形態では、塩基エディターは、TadA*7.10ドメインと、TadA*7.10、TadA参照配列に対して以下の改変R26C、V88A、A109S、T111R、D119N、H122N、Y147D、F149Y、T166I及び/またはD167Nのうちの1つ以上、または別のTadAにおける対応する変異を含むアデノシンデアミナーゼバリアントドメイン(例えば、TadA*8)とのヘテロ二量体である。他の実施形態では、塩基エディターは、TadA*7.10ドメインと、以下の群から選択される改変の組み合わせを含むアデノシンデアミナーゼバリアントドメイン(例えば、TadA*8)とのヘテロ二量体を含む:TadA*7.10、TadA参照配列に対してR26C+A109S+T111R+D119N+H122N+Y147D+F149Y+T166I+D167N、V88A+A109S+T111R+D119N+H122N+F149Y+T166I+D167N、R26C+A109S+T111R+D119N+H122N+F149Y+T166I+D167N、V88A+T111R+D119N+F149Y、及びA109S+T111R+D119N+H122N+Y147D+F149Y+T166I+D167N、または別のTadAにおける対応する変異。

一部の実施形態では、TadA*8は、表6に示されるバリアントである。表6は、TadAアミノ酸配列における特定のアミノ酸位置の番号、及びTadA-7.10アデノシンデアミナーゼにおけるそれらの位置に存在するアミノ酸を示す。また、表6は、M.Richter et al.,2020,Nature Biotechnology,doi.org/10.1038/s41587-020-0453-z(その内容全体が、参照により本明細書に援用される)に記載されているファージ支援非持続的進化(PANCE)及びファージ支援持続的進化(PACE)後のTadA-7.10に対するTadAバリアントのアミノ酸変化を示す。一部の実施形態では、TadA*8は、TadA*8a、TadA*8b、TadA*8c、TadA*8d、またはTadA*8eである。一部の実施形態では、TadA*8は、TadA*8eである。

一実施形態では、本発明の融合タンパク質は、野生型TadAを含み、本明細書に記載のアデノシンデアミナーゼのバリアント(例えば、TadA*8)に連結され、Cas9ニッカーゼに連結される。特定の実施形態では、融合タンパク質は、単一のTadA*8ドメイン(例えば、単量体として提供される)を含む。他の実施形態では、融合タンパク質は、TadA*8とTadA(wt)とを含み、これらは、ヘテロ二量体を形成することができる。

特定の実施形態では、TadA*8は、太字で示される以下の位置のいずれかにおいて、1つ以上の変異を含む。他の実施形態では、TadA*8は、以下の下線で示される位置のいずれかにおいて、1つ以上の変異を含む:

(配列番号1)

例えば、TadA*8は、TadA*7.10、TadA参照配列に対して、アミノ酸位置82及び/または166(例えば、V82S、T166R)単独での改変、または以下のY147T、Y147R、Q154S、Y123H、及び/またはQ154Rのうちのいずれか1つ以上との組み合わせでの改変、あるいは別のTadAにおける対応する変異を含む。特定の実施形態では、改変の組み合わせは、以下の群から選択される:TadA*7.10、TadA参照配列に対してY147T+Q154R、Y147T+Q154S、Y147R+Q154S、V82S+Q154S、V82S+Y147R、V82S+Q154R、V82S+Y123H、I76Y+V82S、V82S+Y123H+Y147T、V82S+Y123H+Y147R、V82S+Y123H+Q154R、Y147R+Q154R+Y123H、Y147R+Q154R+I76Y、Y147R+Q154R+T166R、Y123H+Y147R+Q154R+I76Y、V82S+Y123H+Y147R+Q154R、及びI76Y+V82S+Y123H+Y147R+Q154R、または別のTadAにおける対応する変異。

一実施形態では、本発明の融合タンパク質は、野生型TadAを含み、本明細書に記載のアデノシンデアミナーゼのバリアント(例えば、TadA*8)に連結され、Cas9ニッカーゼに連結される。特定の実施形態では、融合タンパク質は、単一のTadA*8ドメイン(例えば、単量体として提供される)を含む。他の実施形態では、塩基エディターは、TadA*8とTadA(wt)とを含み、ヘテロ二量体を形成することができる。

特定の実施形態では、融合タンパク質は、単一の(例えば、単量体として提供される)TadA*8を含む。一部の実施形態では、TadA*8は、Cas9ニッカーゼに連結される。一部の実施形態では、本発明の融合タンパク質は、ヘテロ二量体としてのTadA*8に連結された野生型TadA(TadA(wt))を含む。他の実施形態では、本発明の融合タンパク質は、ヘテロ二量体としてのTadA*8に連結されたTadA*7.10を含む。一部の実施形態では、塩基エディターは、TadA*8バリアント単量体を含むABE8である。一部の実施形態では、塩基エディターは、TadA*8とTadA(wt)とのヘテロ二量体を含むABE8である。一部の実施形態では、塩基エディターは、TadA*8とTadA*7.10とのヘテロ二量体を含むABE8である。一部の実施形態では、塩基エディターは、TadA*8のヘテロ二量体を含むABE8である。一部の実施形態では、TadA*8は、表6、12、または13から選択される。一部の実施形態では、ABE8は、表12、13、または15から選択される。

一部の実施形態では、アデノシンデアミナーゼは、TadA*9バリアントである。一部の実施形態では、アデノシンデアミナーゼは、TadA*9バリアントであり、以下に記載されるバリアントから選択され、以下の配列(TadA*7.10と称される)を参照する:

一部の実施形態では、アデノシンデアミナーゼは、以下の改変のうちの1つ以上を含む:R21N、R23H、E25F、N38G、L51W、P54C、M70V、Q71M、N72K、Y73S、V82T、M94V、P124W、T133K、D139L、D139M、C146R、及びA158K。1つ以上の改変が、下線及び太字で上記の配列に示されている。

一部の実施形態では、アデノシンデアミナーゼは、以下の改変の組み合わせのうちの1つ以上を含む:V82S+Q154R+Y147R、V82S+Q154R+Y123H、V82S+Q154R+Y147R+Y123H、Q154R+Y147R+Y123H+I76Y+V82S、V82S+I76Y、V82S+Y147R、V82S+Y147R+Y123H、V82S+Q154R+Y123H、Q154R+Y147R+Y123H+I76Y、V82S+Y147R、V82S+Y147R+Y123H、V82S+Q154R+Y123H、V82S+Q154R+Y147R、V82S+Q154R+Y147R、Q154R+Y147R+Y123H+I76Y、Q154R+Y147R+Y123H+I76Y+V82S、I76Y_V82S_Y123H_Y147R_Q154R、Y147R+Q154R+H123H、及びV82S+Q154R。

一部の実施形態では、アデノシンデアミナーゼは、以下の改変の組み合わせのうちの1つ以上を含む:E25F+V82S+Y123H,T133K+Y147R+Q154R、E25F+V82S+Y123H+Y147R+Q154R、L51W+V82S+Y123H+C146R+Y147R+Q154R、Y73S+V82S+Y123H+Y147R+Q154R、P54C+V82S+Y123H+Y147R+Q154R、N38G+V82T+Y123H+Y147R+Q154R、N72K+V82S+Y123H+D139L+Y147R+Q154R、E25F+V82S+Y123H+D139M+Y147R+Q154R、Q71M+V82S+Y123H+Y147R+Q154R、E25F+V82S+Y123H+T133K+Y147R+Q154R、E25F+V82S+Y123H+Y147R+Q154R、V82S+Y123H+P124W+Y147R+Q154R、L51W+V82S+Y123H+C146R+Y147R+Q154R、P54C+V82S+Y123H+Y147R+Q154R、Y73S+V82S+Y123H+Y147R+Q154R、N38G+V82T+Y123H+Y147R+Q154R、R23H+V82S+Y123H+Y147R+Q154R、R21N+V82S+Y123H+Y147R+Q154R、V82S+Y123H+Y147R+Q154R+A158K、N72K+V82S+Y123H+D139L+Y147R+Q154R、E25F+V82S+Y123H+D139M+Y147R+Q154R、及びM70V+V82S+M94V+Y123H+Y147R+Q154R。

一部の実施形態では、アデノシンデアミナーゼは、以下の改変の組み合わせのうちの1つ以上を含む:Q71M+V82S+Y123H+Y147R+Q154R、E25F+I76Y+V82S+Y123H+Y147R+Q154R、I76Y+V82T+Y123H+Y147R+Q154R、N38G+I76Y+V82S+Y123H+Y147R+Q154R、R23H+I76Y+V82S+Y123H+Y147R+Q154R、P54C+I76Y+V82S+Y123H+Y147R+Q154R、R21N+I76Y+V82S+Y123H+Y147R+Q154R、I76Y+V82S+Y123H+D139M+Y147R+Q154R、Y73S+I76Y+V82S+Y123H+Y147R+Q154R、E25F+I76Y+V82S+Y123H+Y147R+Q154R、I76Y+V82T+Y123H+Y147R+Q154R、N38G+I76Y+V82S+Y123H+Y147R+Q154R、R23H+I76Y+V82S+Y123H+Y147R+Q154R、P54C+I76Y+V82S+Y123H+Y147R+Q154R、R21N+I76Y+V82S+Y123H+Y147R+Q154R、I76Y+V82S+Y123H+D139M+Y147R+Q154R、Y73S+I76Y+V82S+Y123H+Y147R+Q154R、及びV82S+Q154R、N72K_V82S+Y123H+Y147R+Q154R、Q71M_V82S+Y123H+Y147R+Q154R、V82S+Y123H+T133K+Y147R+Q154R、V82S+Y123H+T133K+Y147R+Q154R+A158K、M70V+Q71M+N72K+V82S+Y123H+Y147R+Q154R、N72K_V82S+Y123H+Y147R+Q154R、Q71M_V82S+Y123H+Y147R+Q154R、M70V+V82S+M94V+Y123H+Y147R+Q154R、V82S+Y123H+T133K+Y147R+Q154R、V82S+Y123H+T133K+Y147R+Q154R+A158K、及びM70V+Q71M+N72K+V82S+Y123H+Y147R+Q154R。一部の実施形態では、アデノシンデアミナーゼは、単量体として発現される。他の実施形態では、アデノシンデアミナーゼは、ヘテロ二量体として発現される。一部の実施形態では、デアミナーゼまたは他のポリペプチド配列は、例えば、融合タンパク質の成分として含まれる場合、メチオニンを欠く。これにより、位置の番号付けが改変する場合がある。しかしながら、当業者は、そのような対応する変異が、同じ変異(例えば、Y73S及びY72S、ならびにD139M及びD138M)を指すことを理解するであろう。

一部の実施形態では、TadA*9バリアントは、本明細書に記載されるように、表16に記載の改変を含む。一部の実施形態では、TadA*9バリアントは、単量体である。一部の実施形態では、TadA*9バリアントは、野生型TadAアデノシンデアミナーゼを有するヘテロ二量体である。一部の実施形態では、TadA*9バリアントは、別のTadAバリアント(例えば、TadA*8、TadA*9)を有するヘテロ二量体である。TadA*9アデノシンデアミナーゼの更なる詳細は、国際PCT出願第2020/049975号に記載されている(その全体が、参照により本明細書に援用される)。

本明細書に提供される変異のいずれか、及び(例えば、ecTadAアミノ酸配列に基づく)任意の追加の変異は、任意の他のアデノシンデアミナーゼに導入され得る。本明細書に提供される変異のいずれかは、TadA参照配列または別のアデノシンデアミナーゼ(例えば、ecTadA)において個別にまたは任意の組み合わせで作製され得る。

AからGへの核酸塩基編集タンパク質の詳細は、国際PCT出願第2017/045381号(WO2018/027078)及びGaudelli,N.M.,et al.,“Programmable base editing of A・T to G・C in genomic DNA without DNA cleavage”Nature,551,464-471(2017)に記載されており、それらの内容全体は、参照により本明細書に援用される。

CからTの編集
一部の実施形態では、本明細書に開示される塩基エディターは、シチジンデアミナーゼを含む融合タンパク質を含み、ポリヌクレオチドの標的シチジン(C)塩基を脱アミノ化して、チミンの塩基対形成の特性を有するウリジン(U)を生成することができる。一部の実施形態では、例えば、ポリヌクレオチドが二本鎖(例えば、DNA)である場合、ウリジン塩基は、次いで、(例えば、細胞の修復機構によって)チミジン塩基で置換されて、C:GからT:Aへの遷移が生じ得る。他の実施形態では、塩基エディターによる核酸のCからUへの脱アミノ化は、UからTへの置換を伴うことはできない。

Uを生じさせるためのポリヌクレオチドの標的Cの脱アミノ化は、塩基編集の種類の非限定的な例であり、本明細書に記載の塩基エディターによって実行され得る。別の例では、シチジンデアミナーゼドメインを含む塩基エディターは、シトシン(C)塩基のグアニン(G)塩基への変換を媒介することができる。例えば、塩基エディターのシチジンデアミナーゼドメインによるシチジンの脱アミノ化によって産生されたポリヌクレオチドのUは、塩基除去修復機構によって(例えば、ウラシルDNAグリコシラーゼ(UDG)ドメインによって)ポリヌクレオチドから除去され、脱塩基部位を産生することができる。次いで、脱塩基部位と反対側の核酸塩基を、別の塩基(例えば、C)で、例えば、損傷乗り越え(translesion)ポリメラーゼによって(例えば、塩基修復機構によって)置換することができる。脱塩基部位と反対側の核酸塩基がCで置き換わることが典型的であるが、他の置換(例えば、A、GまたはT)も生じ得る。

したがって、一部の実施形態では、本明細書に記載の塩基エディターは、ポリヌクレオチドの標的CをUに脱アミノ化することができる脱アミノ化ドメイン(例えば、シチジンデアミナーゼドメイン)を含む。更に、以下に記載されるように、塩基エディターは、一部の実施形態では、脱アミノ化から生じるUからTまたはUからGの変換を促進する追加のドメインを含み得る。例えば、シチジンデアミナーゼドメインを含む塩基エディターは、TによるUの置換を媒介するウラシルグリコシラーゼ阻害剤(UGI)ドメインを更に含み得、CからTの塩基編集事象を完了する。別の例では、損傷乗り越えポリメラーゼが、脱塩基部位と反対側のCの組み込みを促進することができる(すなわち、脱塩基部位でGの組み込みをもたらし、CからGの塩基性編集事象を完了する)ため、塩基エディターに、損傷乗り越えポリメラーゼを組み込んで、CからGの塩基編集の効率を向上させることができる。

ドメインとしてシチジンデアミナーゼを含む塩基エディターは、DNA、RNA、及びDNA-RNAハイブリッドを含む、任意のポリヌクレオチドの標的Cを脱アミノ化することができる。典型的には、シチジンデアミナーゼは、ポリヌクレオチドの一本鎖部分の文脈に位置するC核酸塩基を触媒する。一部の実施形態では、標的Cを含むポリヌクレオチド全体が、一本鎖であり得る。例えば、塩基エディターに組み込まれたシチジンデアミナーゼは、一本鎖RNAポリヌクレオチドの標的Cを脱アミノ化することができる。他の実施形態では、シチジンデアミナーゼドメインを含む塩基エディターは、二本鎖ポリヌクレオチドに作用し得るが、標的Cは、脱アミノ化反応時に一本鎖状態にあるポリヌクレオチドの一部に位置し得る。例えば、NAGPBドメインがCas9ドメインを含む実施形態では、いくつかのヌクレオチドは、Cas9-gRNA標的DNA複合体の形成中に不対のままであり得、Cas9の「R-ループ複合体」の形成をもたらす。これらの不対のヌクレオチドは、一本鎖DNAのバブル(bubble)を形成することができ、一本鎖特異的ヌクレオチドデアミナーゼ酵素(例えば、シチジンデアミナーゼ)の基質として機能することができる。

一部の実施形態では、塩基エディターのシチジンデアミナーゼは、アポリポタンパク質B mRNA編集複合体(APOBEC)ファミリーデアミナーゼの全部または一部を含むことができる。APOBECは進化的に保存されたシチジンデアミナーゼのファミリーである。このファミリーのメンバーは、CからUの編集酵素である。APOBEC様タンパク質のN末端ドメインは、触媒ドメインであり、C末端ドメインは、偽触媒ドメインである。より具体的には、触媒ドメインは、亜鉛依存性シチジンデアミナーゼドメインであり、シチジンの脱アミノ化に重要である。APOBECファミリーメンバーには、APOBEC1、APOBEC2、APOBEC3A、APOBEC3B、APOBEC3C、APOBEC3D(現在、「APOBEC3E」は、これを指す)、APOBEC3F、APOBEC3G、APOBEC3H、APOBEC4、及び活性化誘導(シチジン)デアミナーゼが含まれる。一部の実施形態では、塩基エディターに組み込まれるデアミナーゼは、APOBEC1デアミナーゼの全部または一部を含む。一部の実施形態では、塩基エディターに組み込まれるデアミナーゼは、APOBEC2デアミナーゼの全部または一部を含む。一部の実施形態では、塩基エディターに組み込まれるデアミナーゼは、APOBEC3デアミナーゼの全部または一部を含む。一部の実施形態では、塩基エディターに組み込まれるデアミナーゼは、APOBEC3Aデアミナーゼの全部または一部を含む。一部の実施形態では、塩基エディターに組み込まれるデアミナーゼは、APOBEC3Bデアミナーゼの全部または一部を含む。一部の実施形態では、塩基エディターに組み込まれるデアミナーゼは、APOBEC3Cデアミナーゼの全部または一部を含む。一部の実施形態では、塩基エディターに組み込まれるデアミナーゼは、APOBEC3Dデアミナーゼの全部または一部を含む。一部の実施形態では、塩基エディターに組み込まれるデアミナーゼは、APOBEC3Eデアミナーゼの全部または一部を含む。一部の実施形態では、塩基エディターに組み込まれるデアミナーゼは、APOBEC3Fデアミナーゼの全部または一部を含む。一部の実施形態では、塩基エディターに組み込まれるデアミナーゼは、APOBEC3Gデアミナーゼの全部または一部を含む。一部の実施形態では、塩基エディターに組み込まれるデアミナーゼは、APOBEC3Hデアミナーゼの全部または一部を含む。一部の実施形態では、塩基エディターに組み込まれるデアミナーゼは、APOBEC4デアミナーゼの全部または一部を含む。一部の実施形態では、塩基エディターに組み込まれるデアミナーゼは、活性化誘導デアミナーゼ(AID)の全部または一部を含む。一部の実施形態では、塩基エディターに組み込まれるデアミナーゼは、シチジンデアミナーゼ1(CDA1)の全部または一部を含む。塩基エディターは、任意の好適な生物(例えば、ヒトまたはラット)由来のデアミナーゼを含み得ることを理解されたい。一部の実施形態では、塩基エディターのデアミナーゼドメインは、ヒト、チンパンジー、ゴリラ、サル、ウシ、イヌ、ラット、またはマウス由来である。一部の実施形態では、塩基エディターのデアミナーゼドメインは、ラット(例えば、ラットAPOBEC1)に由来する。一部の実施形態では、塩基エディターのデアミナーゼドメインは、ヒトAPOBEC1である。一部の実施形態では、塩基エディターのデアミナーゼドメインは、pmCDA1である。

本開示の態様に従って、Cas9に融合され得る他の例示的なデアミナーゼを、以下に提供する。実施形態では、デアミナーゼは、活性化誘導デアミナーゼ(AID)である。一部の実施形態では、それぞれの配列の活性ドメイン、例えば、局在化シグナルがないドメイン(核局在化配列、核輸送シグナルなし、細胞質局在化シグナル)が使用され得ることを理解されたい。

本開示の一部の態様は、例えば、デアミナーゼドメインにおける点変異を作製することによって、本明細書に記載の融合タンパク質のいずれかのデアミナーゼドメインの触媒活性を調節することが、融合タンパク質(例えば、塩基エディター)の処理性に影響するという認識に基づく。例えば、塩基編集融合タンパク質内のデアミナーゼドメインの触媒活性を低下させるが除去しない変異は、デアミナーゼドメインが標的残基に隣接する残基の脱アミノ化を触媒し、それによって、脱アミノ化のウィンドウを狭める可能性を低くすることができる。脱アミノ化のウィンドウを狭める能力は、特定の標的残基に隣接する残基の望ましくない脱アミノ化を防ぐことができ、オフターゲット効果を低下または防止することができる。

例えば、一部の実施形態では、塩基エディターに組み込まれるAPOBECデアミナーゼは、rAPOBEC1のH121X、H122X、R126X、R126X、R118X、W90X、W90X、及びR132X(ここで、Xは、任意のアミノ酸である)からなる群から選択される1つ以上の変異、または別のAPOBECデアミナーゼにおける1つ以上の対応する変異を含むことができる。一部の実施形態では、塩基エディターに組み込まれるAPOBECデアミナーゼは、rAPOBEC1のH121R、H122R、R126A、R126E、R118A、W90A、W90Y、及びR132Eからなる群から選択される1つ以上の変異、または別のAPOBECデアミナーゼにおける1つ以上の対応する変異を含むことができる。

一部の実施形態では、塩基エディターに組み込まれるAPOBECデアミナーゼは、hAPOBEC3GのD316X、D317X、R320X、R320X、R313X、W285X、W285X、R326X(ここで、Xは、任意のアミノ酸である)からなる群から選択される1つ以上の変異、または別のAPOBECデアミナーゼにおける1つ以上の対応する変異を含むことができる。一部の実施形態では、本明細書に提供される融合タンパク質のいずれかは、hAPOBEC3GのD316R、D317R、R320A、R320E、R313A、W285A、W285Y、R326Eからなる群から選択される1つ以上の変異、または別のAPOBECデアミナーゼにおける1つ以上の対応する変異を含むAPOBECデアミナーゼを含む。

一部の実施形態では、塩基エディターに組み込まれるAPOBECデアミナーゼは、rAPOBEC1のH121R及びH122R変異、または別のAPOBECデアミナーゼにおける1つ以上の対応する変異を含むことができる。一部の実施形態では、塩基エディターに組み込まれるAPOBECデアミナーゼは、rAPOBEC1のR126A変異、または別のAPOBECデアミナーゼにおける1つ以上の対応する変異を含むAPOBECデアミナーゼを含むことができる。一部の実施形態では、塩基エディターに組み込まれるAPOBECデアミナーゼは、rAPOBEC1のR126E変異、または別のAPOBECデアミナーゼにおける1つ以上の対応する変異を含むAPOBECデアミナーゼを含むことができる。一部の実施形態では、塩基エディターに組み込まれるAPOBECデアミナーゼは、rAPOBEC1のR118A変異、または別のAPOBECデアミナーゼにおける1つ以上の対応する変異を含むAPOBECデアミナーゼを含むことができる。一部の実施形態では、塩基エディターに組み込まれるAPOBECデアミナーゼは、rAPOBEC1のW90A変異、または別のAPOBECデアミナーゼにおける1つ以上の対応する変異を含むAPOBECデアミナーゼを含むことができる。一部の実施形態では、塩基エディターに組み込まれるAPOBECデアミナーゼは、rAPOBEC1のW90Y変異、または別のAPOBECデアミナーゼにおける1つ以上の対応する変異を含むAPOBECデアミナーゼを含むことができる。一部の実施形態では、塩基エディターに組み込まれるAPOBECデアミナーゼは、rAPOBEC1のR132E変異、または別のAPOBECデアミナーゼにおける1つ以上の対応する変異を含むAPOBECデアミナーゼを含むことができる。一部の実施形態では、塩基エディターに組み込まれるAPOBECデアミナーゼは、rAPOBEC1のW90Y及びR126E変異、または別のAPOBECデアミナーゼにおける1つ以上の対応する変異を含むAPOBECデアミナーゼを含むことができる。一部の実施形態では、塩基エディターに組み込まれるAPOBECデアミナーゼは、rAPOBEC1のR126E及びR132E変異、または別のAPOBECデアミナーゼにおける1つ以上の対応する変異を含むAPOBECデアミナーゼを含むことができる。一部の実施形態では、塩基エディターに組み込まれるAPOBECデアミナーゼは、rAPOBEC1のW90Y及びR132E変異、または別のAPOBECデアミナーゼにおける1つ以上の対応する変異を含むAPOBECデアミナーゼを含むことができる。一部の実施形態では、塩基エディターに組み込まれるAPOBECデアミナーゼは、rAPOBEC1のW90Y、R126E、及びR132E変異、または別のAPOBECデアミナーゼにおける1つ以上の対応する変異を含むAPOBECデアミナーゼを含むことができる。

一部の実施形態では、塩基エディターに組み込まれるAPOBECデアミナーゼは、hAPOBEC3GのD316R及びD317R変異、または別のAPOBECデアミナーゼにおける1つ以上の対応する変異を含むAPOBECデアミナーゼを含むことができる。一部の実施形態では、本明細書に提供される融合タンパク質のいずれかは、hAPOBEC3GのR320A変異、または別のAPOBECデアミナーゼにおける1つ以上の対応する変異を含むAPOBECデアミナーゼを含む。一部の実施形態では、塩基エディターに組み込まれるAPOBECデアミナーゼは、hAPOBEC3GのR320E変異、または別のAPOBECデアミナーゼにおける1つ以上の対応する変異を含むAPOBECデアミナーゼを含むことができる。一部の実施形態では、塩基エディターに組み込まれるAPOBECデアミナーゼは、hAPOBEC3GのR313A変異、または別のAPOBECデアミナーゼにおける1つ以上の対応する変異を含むAPOBECデアミナーゼを含むことができる。一部の実施形態では、塩基エディターに組み込まれるAPOBECデアミナーゼは、hAPOBEC3GのW285A変異、または別のAPOBECデアミナーゼにおける1つ以上の対応する変異を含むAPOBECデアミナーゼを含むことができる。一部の実施形態では、塩基エディターに組み込まれるAPOBECデアミナーゼは、hAPOBEC3GのW285Y変異、または別のAPOBECデアミナーゼにおける1つ以上の対応する変異を含むAPOBECデアミナーゼを含むことができる。一部の実施形態では、塩基エディターに組み込まれるAPOBECデアミナーゼは、hAPOBEC3GのR326E変異、または別のAPOBECデアミナーゼにおける1つ以上の対応する変異を含むAPOBECデアミナーゼを含むことができる。一部の実施形態では、塩基エディターに組み込まれるAPOBECデアミナーゼは、hAPOBEC3GのW285Y及びR320E変異、または別のAPOBECデアミナーゼにおける1つ以上の対応する変異を含むAPOBECデアミナーゼを含むことができる。一部の実施形態では、塩基エディターに組み込まれるAPOBECデアミナーゼは、hAPOBEC3GのR320E及びR326E変異、または別のAPOBECデアミナーゼにおける1つ以上の対応する変異を含むAPOBECデアミナーゼを含むことができる。一部の実施形態では、塩基エディターに組み込まれるAPOBECデアミナーゼは、hAPOBEC3GのW285Y及びR326E変異、または別のAPOBECデアミナーゼにおける1つ以上の対応する変異を含むAPOBECデアミナーゼを含むことができる。一部の実施形態では、塩基エディターに組み込まれるAPOBECデアミナーゼは、hAPOBEC3GのW285Y、R320E、及びR326E変異、または別のAPOBECデアミナーゼにおける1つ以上の対応する変異を含むAPOBECデアミナーゼを含むことができる。

いくつかの修飾シチジンデアミナーゼが市販されており、これらに限定されないが、SaBE3、SaKKH-BE3、VQR-BE3、EQR-BE3、VRER-BE3、YE1-BE3、EE-BE3、YE2-BE3、及びYEE-BE3が挙げられ、これらは、Addgeneから入手可能である(プラスミド85169、85170、85171、85172、85173、85174、85175、85176、85177)。一部の実施形態では、塩基エディターに組み込まれるデアミナーゼは、APOBEC1デアミナーゼの全部または一部を含む。

一部の実施形態では、本発明の融合タンパク質は、1つ以上のシチジンデアミナーゼドメインを含む。一部の実施形態では、本明細書に提供されるシチジンデアミナーゼは、シトシンまたは5-メチルシトシンをウラシルまたはチミンに脱アミノすることができる。一部の実施形態では、本明細書に提供されるシチジンデアミナーゼは、DNAのシトシンを脱アミノ化することができる。シチジンデアミナーゼは、任意の好適な生物に由来し得る。一部の実施形態では、シチジンデアミナーゼは、本明細書に提供される変異のいずれかに対応する1つ以上の変異を含む、天然のシチジンデアミナーゼである。当業者は、例えば、配列アラインメント及び相同残基の決定によって、任意の相同タンパク質の対応する残基を特定することができるであろう。したがって、当業者であれば、本明細書に記載の変異のいずれかに対応する任意の天然に存在するシチジンデアミナーゼにおける変異を生成することができるであろう。一部の実施形態では、シチジンデアミナーゼは、原核生物由来である。一部の実施形態では、シチジンデアミナーゼは、細菌由来である。一部の実施形態では、シチジンデアミナーゼは、哺乳動物(例えば、ヒト)由来である。

一部の実施形態では、シチジンデアミナーゼは、本明細書に記載のアミノ酸配列のいずれか1つと、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも99.5%同一であるアミノ酸配列を含む。本明細書に提供されるシチジンデアミナーゼが、1つ以上の変異(例えば、本明細書に提供される変異のいずれか)を含み得ることを理解されたい。一部の実施形態は、任意の以前の態様または本明細書に記載のシチジンデアミナーゼ核酸塩基エディターポリペプチドをコードするポリヌクレオチド分子を提供する。一部の実施形態では、ポリヌクレオチドは、コドン最適化されている。

本開示は、特定のパーセント同一性、加えて、本明細書に記載の変異またはそれらの組み合わせのうちのいずれかを有する、任意のデアミナーゼドメインを提供する。一部の実施形態では、シチジンデアミナーゼは、参照配列または本明細書に提供されるシチジンデアミナーゼのいずれかと比較して、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、21、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50個、またはそれ以上の変異を有するアミノ酸配列を含む。一部の実施形態では、シチジンデアミナーゼは、当該技術分野で既知であるか、または本明細書に記載のアミノ酸配列のいずれか1つと比較して、少なくとも5、少なくとも10、少なくとも15、少なくとも20、少なくとも25、少なくとも30、少なくとも35、少なくとも40、少なくとも45、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90、少なくとも100、少なくとも110、少なくとも120、少なくとも130、少なくとも140、少なくとも150、少なくとも160、または少なくとも170個の同一の連続したアミノ酸残基を有するアミノ酸配列を含む。

本発明の融合タンパク質は、2つ以上の核酸編集ドメインを含む。

CからTの核酸塩基編集タンパク質の詳細は、国際PCT出願第PCT/US2016/058344号(WO2017/070632)及びKomor,A.C.,et al.,“Programmable editing of a target base in genomic DNA without double-stranded DNA cleavage”Nature 533,420-424(2016)に記載されている(それらの内容全体が、参照により本明細書に援用される)。

ガイドポリヌクレオチド
ポリヌクレオチドプログラマブルヌクレオチド結合ドメインは、結合したガイドポリヌクレオチド(例えば、gRNA)と併せた場合、標的ポリヌクレオチド配列に特異的に結合し(すなわち、結合したガイド核酸の塩基と標的ポリヌクレオチド配列の塩基との間の相補的な塩基対形成を介して)、それによって、塩基エディターを編集が望まれる標的核酸配列に局在化させ得る。一部の実施形態では、標的ポリヌクレオチド配列は、一本鎖DNAまたは二本鎖DNAを含む。一部の実施形態では、標的ポリヌクレオチド配列は、RNAを含む。一部の実施形態では、標的ポリヌクレオチド配列は、DNA-RNAハイブリッドを含む。

CRISPRは、可動遺伝要素(ウイルス、転位要素、及び接合性プラスミド)に対する保護を提供する適応免疫系である。CRISPRクラスターは、スペーサー、先行可動要素に相補的な配列、及び標的侵入核酸を含有する。CRISPRクラスターが転写され、CRISPR RNA(crRNA)に加工される。II型CRISPRシステムでは、crRNA前駆体の正しいプロセシングには、トランスコード化低分子RNA(tracrRNA)、内因性リボヌクレアーゼ3(rnc)、及びCas9タンパク質が必要である。tracrRNAは、crRNA前駆体のリボヌクレアーゼ3支援プロセシングのガイドとして機能する。続いて、Cas9/crRNA/tracrRNAは、スペーサーに相補的な直鎖または環状のdsDNA標的をエンドヌクレアーゼ分解的に切断する。crRNAに相補的でない標的鎖は、まず、エンドヌクレアーゼ分解的に切断され、次いで、3’-5’エキソヌクレアーゼ分解的にトリミングされる。本質的に、DNA結合及びDNA切断は、典型的には、タンパク質及び両方のRNAを必要とする。しかしながら、シングルガイドRNA(「sgRNA」または単純に「gRNA」)は、crRNA及びtracrRNAの両方の態様をシングルRNA種内に組み込むように操作され得る。例えば、Jinek M.,Chylinski K.,Fonfara I.,Hauer M.,DoudnaJ.A.,Charpentier E.Science 337:816-821(2012)を参照されたい(その内容全体が、参照により本明細書に援用される)。Cas9は、CRISPR反復配列の短いモチーフ(PAMまたはプロトスペーサー隣接モチーフ)を認識して、自己と非自己の区別を助ける。例えば、“Complete genome sequence of an M1 strain of Streptococcus pyogenes.”Ferretti,J.J.et al.,Natl.Acad.Sci.U.S.A.98:4658-4663(2001)、“CRISPR RNA maturation by trans-encoded small RNA and host factor RNase III.”Deltcheva E.,et al.,Nature 471:602-607(2011)、及び“Programmable dual-RNA-guided DNA endonuclease in adaptive bacterial immunity.”Jinek M.,et al.,Science 337:816-821(2012)を参照されたい。それらの各々の内容全体が、参照により本明細書に援用される)。

PAM配列は、当該技術分野で既知の任意のPAM配列であり得る。好適なPAM配列は、NGG、NGA、NGC、NGN、NGT、NGCG、NGAG、NGAN、NGNG、NGCN、NGCG、NGTN、NNGRRT、NNNRRT、NNGRR(N)、TTTV、TYCV、TYCV、TATV、NNNNGATT、NNAGAAWまたはNAAAACを含むが、これらに限定されない。Yは、ピリミジンであり、Nは、任意のヌクレオチド塩基であり、Wは、AまたはTである。

一実施形態では、本明細書に記載されるガイドポリヌクレオチドは、RNAまたはDNAであることができる。一実施形態では、ガイドポリヌクレオチドは、gRNAである。RNA/Cas複合体は、Casタンパク質を標的DNAへ「ガイド」するのを支援することができる。Cas9/crRNA/tracrRNAは、スペーサーに相補的な直鎖または環状dsDNA標的をエンドヌクレアーゼ分解的に切断する。crRNAに相補的でない標的鎖は、まず、エンドヌクレアーゼ分解的に切断され、次いで、3’-5’エキソヌクレアーゼ分解的にトリミングされる。本質的に、DNA結合及びDNA切断は、典型的には、タンパク質及び両方のRNAを必要とする。しかしながら、シングルガイドRNA(「sgRNA」または単純に「gRNA」)は、crRNA及びtracrRNAの両方の態様をシングルRNA種内に組み込むように操作され得る。例えば、Jinek M.,et al.Science 337:816-821(2012)を参照されたい(その内容全体が、参照により本明細書に援用される)。

一部の実施形態では、ガイドポリヌクレオチドは、少なくとも1つのシングルガイドRNA(「sgRNA」または「gRNA」)である。一部の実施形態では、ガイドポリヌクレオチドは、2つ以上の個々のポリヌクレオチドを含み、これらのポリヌクレオチドは、例えば、相補的塩基対形成(例えば、デュアルガイドポリヌクレオチド、デュアルgRNA)を介して、互いに相互作用することができる。例えば、ガイドポリヌクレオチドは、CRISPR RNA(crRNA)及びトランス活性化CRISPR RNA(tracrRNA)を含んでもよく、または1つ以上のトランス活性化CRISPR RNA(tracrRNA)を含んでもよい。

一部の実施形態では、ガイドポリヌクレオチドは、少なくとも1つのtracrRNAである。一部の実施形態では、ガイドポリヌクレオチドは、ポリヌクレオチドプログラマブルDNA結合ドメイン(例えば、Cas9またはCpf1)を標的ヌクレオチド配列に誘導するためのPAM配列を必要としない。

ガイドポリヌクレオチドは、天然のまたは天然でない(または非天然の)ヌクレオチド(例えば、ペプチド核酸またはヌクレオチド類似体)を含み得る。一部の場合では、ガイド核酸配列の標的領域は、少なくとも15、16、17、18、19、20、21、22、23、24、25、26、27、28、29または30ヌクレオチド長であることができる。ガイド核酸の標的領域は、10～30ヌクレオチド長、または15～25ヌクレオチド長、または15～20ヌクレオチド長であり得る。

一部の実施形態では、本明細書に提供される塩基エディターは、1つ以上のガイドポリヌクレオチド(例えば、マルチプルgRNA)を利用する。一部の実施形態では、シングルガイドポリヌクレオチドは、本明細書に記載の異なる塩基エディター用に利用される。例えば、シングルガイドポリヌクレオチドは、シチジン塩基エディター及びアデノシン塩基エディター用に利用され得る。

一部の実施形態では、本明細書に記載の方法は、操作されたCasタンパク質を利用することができる。ガイドRNA(gRNA)は、Cas結合のために必要な足場配列と、修飾されるゲノム標的を定義する、ユーザー定義の約20ヌクレオチドスペーサーとから構成された短い合成RNAである。例示的なgRNA足場配列は、配列番号317～327として配列表に示す。したがって、当業者は、Casタンパク質特異性のゲノム標的を変えることができ、gRNAの標的配列がゲノムの残部と比較して、ゲノム標的に対してどの程度特異的であるかによって部分的に決定される。

他の実施形態では、ガイドポリヌクレオチドは、単一分子(すなわち、単一分子ガイド核酸)中の核酸のポリヌクレオチド標的化部分と核酸の足場部分との両方を含むことができる。例えば、単一分子ガイドポリヌクレオチドは、シングルガイドRNA(sgRNAまたはgRNA)であり得る。本明細書において、ガイドポリヌクレオチド配列という用語は、塩基エディターと相互作用し、標的ポリヌクレオチド配列に誘導し得る任意のシングル、デュアル、またはマルチプル核酸を企図する。

典型的には、ガイドポリヌクレオチド(例えば、crRNA/trRNA複合体またはgRNA)は、標的ポリヌクレオチド配列を認識して結合することができる配列を含む「ポリヌクレオチド標的化セグメント」、及び塩基エディターのポリヌクレオチドプログラマブルヌクレオチド結合ドメイン成分内のガイドポリヌクレオチドを安定化する「タンパク質結合セグメント」を含む。一部の実施形態では、ガイドポリヌクレオチドのポリヌクレオチド標的化セグメントは、DNAポリヌクレオチドを認識して結合し、それによって、DNA中の塩基の編集を促進する。他の場合では、ガイドポリヌクレオチドのポリヌクレオチド標的化セグメントは、RNAポリヌクレオチドを認識しそれに結合し、それによって、RNAにおける塩基の編集を容易にする。本明細書では、「セグメント」とは、分子のセクションまたは領域、例えば、ガイドポリヌクレオチドにおけるヌクレオチドの連続したストレッチを指す。セグメントはまた、セグメントが複数の分子の領域を含むことができるような、複合体の領域/セクションも指し得る。例えば、ガイドポリヌクレオチドが複数の核酸分子を含む場合、のタンパク質結合セグメントは、例えば、相補領域に沿ってハイブリダイズする複数の別個の分子の全部または一部を含み得る。一部の実施形態では、2つの別個の分子を含むDNA標的化RNAのタンパク質結合セグメントは、(i)長さが100塩基対である第1のRNA分子の40～75塩基対、及び(ii)長さが50塩基対である第2のRNA分子の10～25塩基対、を含み得る。「セグメント」の定義は、特定の文脈において別途具体的に定義されない限り、特定の数の総塩基対に限定されず、所与のRNA分子からの任意の特定の数の塩基対に限定されず、複合体内の特定の数の別個の分子に限定されず、任意の全長であり、かつ他の分子と相補性を有する領域を含み得るRNA分子の領域を含み得る。

ガイドポリヌクレオチドは、化学的に合成されてもよく、酵素的に合成されてもよくまたはそれらの組み合わせで合成されてもよい。例えば、gRNAは、標準的なホスホラミダイトベースの固相合成法を使用して合成され得る。代替として、gRNAは、gRNAをコードするDNAを、ファージRNAポリメラーゼによって認識されるプロモーター制御配列に動作可能に連結することによって、インビトロで合成され得る。好適なファージプロモーター配列の例としては、T7、T3、SP6プロモーター配列、またはそれらのバリエーションが挙げられる。gRNAが2つの別個の分子(例えば、crRNA及びtracrRNA)を含む実施形態では、crRNAは、化学的に合成され得、tracrRNAは、酵素的に合成され得る。

gRNA分子は、インビトロで転写され得る。

ガイドポリヌクレオチドは、例えば、gRNAをコードするDNA、例えば、gRNAをコードする配列を含むDNAベクターによって発現され得る。gRNAは、単独でコードされてもよくまたはコードされた塩基エディターと一緒にコードされてもよい。そのようなDNA配列は、発現システム(例えば、細胞)に、一緒にまたは別々に導入され得る。例えば、ポリヌクレオチドプログラマブルヌクレオチド結合ドメイン及びgRNAをコードするDNA配列は、細胞内に導入され得、各々のDNA配列は、別個の分子(例えば、ポリヌクレオチドプログラマブルヌクレオチド結合ドメインコード配列を含有する1つのベクター及びgRNAコード配列を含有する第2のベクター)の一部分であってもよくまたは両方が、同じ分子(例えば、ポリヌクレオチドプログラマブルヌクレオチド結合ドメイン及びgRNAの両方のためのコード(及び調節)配列を含有する1つのベクター)の一部分であってもよい。RNAは、合成DNA分子、例えば、gBlocks(登録商標)遺伝子断片から転写され得る。

gRNAまたはガイドポリヌクレオチドは、以下の3つの領域:染色体配列における標的部位に相補的であることができる、5’末端での第1の領域と、ステムループ構造を形成することができる第2の内部領域と、一本鎖であることができる第3の3’領域とを含むことができる。各々のgRNAの第1の領域はまた、各々のgRNAが融合タンパク質を特定の標的部位へガイドするように異なることができる。更に、各々のgRNAの第2の領域及び第3の領域は、全てのgRNAにおいて同一であることができる。

gRNAまたはガイドポリヌクレオチドの第1の領域は、gRNAの第1の領域が標的部位と塩基対形成することができるように、染色体配列における標的部位での配列に相補的であることができる。一部の場合では、gRNAの第1の領域は、10個のヌクレオチド～25個のヌクレオチドもしくは約10個のヌクレオチド～約25個のヌクレオチド(すなわち、10個のヌクレオチド～25個のヌクレオチドまたは約10個のヌクレオチド～約25個のヌクレオチドまたは10個のヌクレオチド～約25個のヌクレオチドまたは約10個のヌクレオチド～25個のヌクレオチド)、またはそれ以上を含むことができる。例えば、gRNAの第1の領域と染色体配列における標的部位との間の塩基対形成の領域は、10、11、12、13、14、15、16、17、18、19、20、22、23、24もしくは25ヌクレオチド長以上であってもよく、または約10、11、12、13、14、15、16、17、18、19、20、22、23、24もしくは25ヌクレオチド長以上であってもよい。しばしば、gRNAの第1の領域は、19、20もしくは21ヌクレオチド長であってもよく、または約19、20もしくは21ヌクレオチド長であってもよい。

gRNAまたはガイドポリヌクレオチドはまた、二次構造を形成する第2の領域を含むことができる。例えば、gRNAによって形成された二次構造は、ステム(またはヘアピン)及びループを含むことができる。ループ及びステムの長さは、異なり得る。例えば、ループは、3～10ヌクレオチド長または約3～10ヌクレオチド長の範囲であり得、ステムは、6～20塩基対長または約6～20塩基対長の範囲であり得る。ステムは、1～10ヌクレオチドまたは約10ヌクレオチドの1つ以上のバルジを含むことができる。第2の領域の全長は、16～60ヌクレオチド長または約16～60ヌクレオチド長の範囲であり得る。例えば、ループは、4ヌクレオチド長または約4ヌクレオチド長であり得、ステムは、12塩基対長または約12塩基対であり得る。

gRNAまたはガイドポリヌクレオチドはまた、本質的に一本鎖であることができる、3’末端での第3の領域を含むことができる。例えば、第3の領域は、しばしば、目的の細胞内のいずれかの染色体配列に相補的でなく、しばしば、gRNAの残部に相補的でない。更に、第3の領域の長さは、異なり得る。第3の領域は、4ヌクレオチド長以上または約4ヌクレオチド長以上であり得る。例えば、第3の領域の長さは、5～60ヌクレオチド長または約5～60ヌクレオチド長の範囲であり得る。

gRNAまたはガイドポリヌクレオチドは、遺伝子標的のいずれかのエキソンまたはイントロンを標的とすることができる。一部の場合では、ガイドは、遺伝子のエキソン1または2を標的とすることができ、他の場合では、ガイドは、遺伝子のエキソン3または4を標的とすることができる。一部の実施形態では、組成物は、全てが同じエキソンを標的とする複数のgRNAまたは異なるエキソンを標的とする複数のgRNAを含む。遺伝子のエキソン及び/またはイントロンが標的とされ得る。

gRNAまたはガイドポリヌクレオチドは、約20個のヌクレオチドもしくは約20個未満のヌクレオチド(例えば、少なくとも約5、10、15、16、17、18、19、20、21、22、23、24、25、30個のヌクレオチド)、または約1～100個のうちのいずれかの個数(例えば、5、10、15、16、17、18、19、20、21、22、23、24、25、30、40、50、60、70、80、90、100個)のヌクレオチドの核酸配列を標的とすることができる。標的核酸配列は、PAMの第1のヌクレオチドのすぐ5’の20個の塩基であってもよくまたは約20個の塩基であってもよい。gRNAは、核酸配列を標的とすることができる。標的核酸は、少なくともまたは少なくとも約1～10、1～20、1～30、1～40、1～50、1～60、1～70、1～80、1～90、または1～100ヌクレオチドであり得る。

ガイドポリヌクレオチド、例えば、gRNA及び標的配列を選択、設計及び検証するための方法は、本明細書に記載され、当業者に既知である。例えば、核酸塩基エディターシステムにおけるデアミナーゼドメイン(例えば、AIDドメイン)の潜在的な基質混乱の影響を最小化するために、脱アミノ化のために意図せずに標的とされ得る残基(例えば、標的核酸遺伝子座内の一本鎖DNAにおいて潜在的に存在し得るオフターゲットC残基)の数が、最小化され得る。加えて、ソフトウェアツールを使用して、標的核酸配列に対応するgRNAを最適化し、例えば、ゲノムにわたって総オフターゲット活性を最小化することができる。例えば、S.pyogenes Cas9を使用する各可能な標的化ドメインの選択の場合、全てのオフターゲット配列(前述の選択されたPAM、例えば、NAGまたはNGG)は、最大で一定数(例えば、1、2、3、4、5、6、7、8、9、または10)の不一致塩基対を含有するゲノムにわたって特定され得る。標的部位に相補的なgRNAの第1の領域を特定することができ、全ての第1の領域(例えば、crRNA)は、その総予測オフターゲットスコアに従ってランク付けすることができ、上位の標的化ドメインは、最大のオンターゲット活性及び最小のオフターゲット活性を有する可能性が高いものを表す。gRNAを標的とする候補は、当該技術分野で既知である方法、及び/または本明細書に記載の方法を使用することによって機能的に評価することができる。

非限定的な例として、Cas9とともに使用するための、gRNAのcrRNAにおける標的DNAハイブリダイズ配列は、DNA配列検索アルゴリズムを使用して特定され得る。gRNA設計は、パブリックツールcas-OFFinderに基づくカスタムgRNA設計ソフトウェアを使用して実施され、これは、Bae S.,Park J.,& Kim J.-S.Cas-OFFinder:A fast and versatile algorithm that searches for potential off-target sites of Cas9 RNA-guided endonucleases.Bioinformatics 30,1473-1475(2014)に記載されている。このソフトウェアは、ゲノム全体のオフターゲット傾向を計算した後、ガイドをスコア付けする。典型的には、長さが17～24の範囲のガイドの場合、完全一致から7つの不一致までの範囲の一致が考慮される。オフターゲット部位が計算的に決定されると、各ガイドについて集計スコアが計算され、ウェブインターフェースを使用して表形式出力で要約される。本ソフトウェアは、PAM配列に隣接する潜在的な標的部位を特定することに加えて、選択された標的部位から1、2、3個、または3個超のヌクレオチドが異なる全てのPAM隣接配列も特定する。標的核酸配列(例えば、標的遺伝子)のゲノムDNA配列を取得してもよく、公的に利用可能なツール(例えば、RepeatMaskerプログラム)を使用して、反復エレメントをスクリーニングしてもよい。RepeatMaskerは、入力DNA配列を、反復エレメント及び低複雑度領域について検索する。出力は、所与のクエリ配列に存在する反復の詳細な注釈である。

特定後に、gRNAの第1の領域、例えば、crRNAは、標的部位へのそれらの距離、それらの直交性及び関連するPAM配列との密接な一致についての5’ヌクレオチドの存在(例えば、関連するPAM、例えば、S.pyogenesについてはNGG PAM、S.aureusについてはNNGRRTまたはNNGRRV PAMを含有するヒトゲノム内での密接な一致の特定に基づく5’G)に基づいて、階層にランク付けされる。本明細書で使用される場合、直交性(orthogonality)は、標的配列に対する最小数の不一致を含有するヒトゲノム内の配列の数を指す。「高レベルの直交性」または「良好な直交性」は、例えば、ヒトゲノム中に、意図された標的以外に同一の配列を有しないか、または標的配列中に1つもしくは2つの不一致を含有する任意の配列も有しない20量体の標的化ドメインを指し得る。良好な直交性を有する標的化ドメインは、オフターゲットDNA切断を最小化するために選択され得る。

次いで、gRNAは、RNA分子としてまたは非RNA核酸分子、例えば、DNA分子として、細胞または胚内に導入され得る。一実施形態では、gRNAをコードするDNAは、目的の細胞または胚内でのgRNAの発現のためのプロモーター制御配列に動作可能に連結されている。RNAコード配列は、RNAポリメラーゼIII(Pol III)によって認識されるプロモーター配列に動作可能に連結され得る。gRNAを発現させるために使用され得るプラスミドベクターは、px330ベクター及びpx333ベクターを含むが、これらに限定されない。一部の場合では、プラスミドベクター(例えば、px333ベクター)は、gRNAをコードする少なくとも2つのDNA配列を含むことができる。更に、ベクターは、追加の発現制御配列(例えば、エンハンサー配列、コザック配列、ポリアデニル化配列、転写終結配列など)、選択可能なマーカー配列(例えば、GFPまたはピューロマイシンなどの抗生物質耐性遺伝子)及び複製起点などを含むことができる。gRNAをコードするDNA分子はまた、直鎖であることができる。gRNAまたはガイドポリヌクレオチドをコードするDNA分子はまた、環状であることができる。

一部の実施形態では、レポーターシステムは、塩基編集活性を検出し候補ガイドポリヌクレオチドを試験するために使用される。一部の実施形態では、レポーターシステムは、レポーター遺伝子ベースのアッセイを含み、このアッセイにおいて、塩基編集活性は、レポーター遺伝子の発現をもたらす。例えば、レポーターシステムは、非活性化開始コドン(例えば、鋳型鎖上の3’-TAC-5’から3’-CAC-5’への変異)を含むレポーター遺伝子を含み得る。標的Cの脱アミノ化に成功すると、対応するmRNAは、5’-GUG-3’の代わりに5’-AUG-3’として転写され、レポーター遺伝子の翻訳を可能にする。好適なレポーター遺伝子は、当業者には明らかであろう。レポーター遺伝子の非限定的な例としては、緑色蛍光タンパク質(GFP)、赤色蛍光タンパク質(RFP)、ルシフェラーゼ、分泌型アルカリホスファターゼ(SEAP)をコードする遺伝子、または当業者にとって検出可能であり、かつ明らかな任意の他の遺伝子が挙げられる。レポーターシステムは、多くの異なるgRNAを試験するために使用され得、gRNAは、例えば、標的DNA配列に対して、対応するデアミナーゼが標的とする残基(複数可)を決定するために試験される。非鋳型鎖を標的とするsgRNAもまた、特定の塩基編集タンパク質、例えば、Cas9デアミナーゼ融合タンパク質のオフターゲット効果を評価するために試験され得る。一部の実施形態では、そのようなgRNAは、変異した開始コドンがgRNAと塩基対を形成しないように設計することができる。ガイドポリヌクレオチドは、標準的なリボヌクレオチド、修飾されたリボヌクレオチド(例えば、プソイドウリジン)、リボヌクレオチド異性体及び/またはリボヌクレオチド類似体を含むことができる。一部の実施形態では、ガイドポリヌクレオチドは少なくとも1つの検出可能な標識を含むことができる。検出可能な標識は、フルオロフォア(例えば、FAM、TMR、Cy3、Cy5、テキサスレッド、Oregon Green、Alexa Fluor、Halo tagまたは好適な蛍光色素)、検出タグ(例えば、ビオチン及びジゴキシゲニンなど)、量子ドットまたは金粒子であることができる。

一部の実施形態では、塩基エディターシステムは、複数のガイドポリヌクレオチド(例えば、gRNA)を含み得る。例えば、gRNAは、塩基エディターシステムにおいて含まれる1つ以上の標的遺伝子座(例えば、少なくとも1つのgRNA、少なくとも2つのgRNA、少なくとも5つのgRNA、少なくとも10個のgRNA、少なくとも20個のgRNA、少なくとも30個のgRNA、少なくとも50個のgRNA)を標的とし得る。複数のgRNA配列は、直列に配置され得、好ましくは、ダイレクトリピートによって分離されている。

ガイドポリヌクレオチドは、新しい特徴または増強された特徴を有する核酸を提供するために、1つ以上の修飾を含むことができる。ガイドポリヌクレオチドは、核酸親和性タグを含むことができる。ガイドポリヌクレオチドは、合成ヌクレオチド、合成ヌクレオチド類似体、ヌクレオチド誘導体、及び/または修飾ヌクレオチドを含むことができる。

一部の場合では、gRNAまたはガイドポリヌクレオチドは、修飾を含むことができる。修飾は、gRNAまたはガイドポリヌクレオチドの任意の位置で行われ得る。単一のgRNAまたはガイドポリヌクレオチドに対して、複数の修飾を行うことができる。gRNAまたはガイドポリヌクレオチドは、修飾後に、品質管理に供され得る。一部の場合では、品質管理は、PAGE、HPLC、MSまたはそれらのいずれかの組み合わせを含むことができる。

gRNAまたはガイドポリヌクレオチドの修飾は、置換、挿入、欠失、化学的修飾、物理修飾、安定化、精製、またはそれらの任意の組み合わせであり得る。
また、gRNAまたはガイドポリヌクレオチドは、5’アデニル酸、5’グアノシン三リン酸キャップ、5’N7-メチルグアノシン三リン酸キャップ、5’三リン酸キャップ、3’リン酸、3’チオリン酸、5’リン酸、5’チオリン酸、Cis-Synチミジン二量体、三量体、C12スペーサー、C3スペーサー、C6スペーサー、dスペーサー、PCスペーサー、rスペーサー、スペーサー18、スペーサー9,3’-3’修飾、5’-5’修飾、脱塩基、アクリジン、アゾベンゼン、ビオチン、ビオチンBB、ビオチンTEG、コレステリルTEG、デスチオビオチンTEG、DNP TEG、DNP-X、DOTA、dT-ビオチン、デュアルビオチン、PCビオチン、ソラレンC2、ソラレンC6、TINA、3’DABCYL、ブラックホールクエンチャー1、ブラックホールクエンチャー2、DABCYL SE、dT-DABCYL、IRDye QC-1、QSY-21、QSY-35、QSY-7、QSY-9、カルボキシルリンカー、チオールリンカー、2’-デオキシリボヌクレオシド類似体プリン、2’-デオキシリボヌクレオシド類似体ピリミジン、リボヌクレオシド類似体、2’-O-メチルリボヌクレオシド類似体、糖修飾類似体、ウォブル/ユニバーサル塩基、蛍光色素標識、2’-フルオロRNA、2’-O-メチルRNA、メチルホスホネート、ホスホジエステルDNA、ホスホジエステルRNA、ホスホチオエートDNA、ホスホロチオエートRNA、UNA、シュードウリジン-5’-三リン酸、5’-メチルシチジン-5’-三リン酸、またはそれらの任意の組み合わせによって修飾されてもよい。

一部の場合では、修飾は、永続的である。他の場合では、修飾は、一過的である。一部の場合では、複数の修飾が、gRNAまたはガイドポリヌクレオチドになされる。gRNAまたはガイドポリヌクレオチド修飾は、ヌクレオチドの生理化学的特性(例えば、ヌクレオチドの立体構造、極性、疎水性、化学反応性、塩基対相互作用、またはそれらの任意の組み合わせ)を改変させることができる。

ガイドポリヌクレオチドは、細胞を、単離されたgRNAで、またはガイドRNA及びプロモーターをコードする配列を含むプラスミドDNAでトランスフェクトすることによって、細胞内に移入され得る。gRNAまたはガイドポリヌクレオチドはまた、他の様式で、例えば、ウイルス媒介性遺伝子送達を使用して、細胞内に移入され得る。gRNAまたはガイドポリヌクレオチドは、単離され得る。例えば、gRNAは、単離されたRNAの形態で、細胞または生物内にトランスフェクトされ得る。gRNAは、インビトロ転写によって、当該技術分野で既知のいずれかのインビトロ転写システムを使用して調製され得る。gRNAは、gRNAについてのコード配列を含むプラスミドの形態ではなく、単離されたRNAの形態で、細胞に移入され得る。

修飾は、ホスホロチオエート置換体であり得る。一部の場合では、天然のホスホジエステル結合は、細胞ヌクレアーゼによって急速に分解されやすいことがあり、ホスホロチオエート(PS)結合置換を使用するヌクレオチド間連結の修飾は、細胞分解による加水分解に対してより安定していることがある。修飾は、gRNAまたはガイドポリヌクレオチドにおける安定性を増加させることができる。修飾はまた、生物学的活性を増強することもできる。一部の場合では、ホスホロチオエートで増強されたRNAであるgRNAは、RNase A、RNase T1、ウシ血清ヌクレアーゼまたはそれらのいずれかの組み合わせを阻害することができる。これらの特性は、インビボまたはインビトロでヌクレアーゼに曝露される可能性が高い用途において、PS-RNA gRNAの使用を可能にすることができる。例えば、ホスホロチオエート(PS)結合は、gRNAの5’または3’末端での最後の3～5つのヌクレオチド間に導入され得、これは、エキソヌクレアーゼ分解を阻害することができる。一部の場合では、ホスホロチオエート結合は、エンドヌクレアーゼによる攻撃を低減するために、gRNA全体にわたって付加され得る。

一部の実施形態では、ガイドRNAは、スプライス部位(すなわち、スプライスアクセプター(SA)またはスプライスドナー(SD))を破壊するように設計される。一部の実施形態では、ガイドRNAは、塩基編集が未熟終止コドンをもたらすように設計される。

プロトスペーサー隣接モチーフ
「プロトスペーサー隣接モチーフ(PAM)」またはPAM様モチーフという用語は、CRISPR細菌適応免疫系において、Cas9ヌクレアーゼによって標的化されるDNA配列の直後の2～6塩基対のDNA配列を指す。一部の実施形態では、PAMは、5’PAM(すなわち、プロトスペーサーの5’末端の上流に位置するPAM)であることができる。他の実施形態では、PAMは、3’PAM(すなわち、プロトスペーサーの5’末端の下流に位置するPAM)であることができる。PAM配列は、標的結合に必須であるが、正確な配列はCasタンパク質の種類に依存する。PAM配列は、当該技術分野で既知の任意のPAM配列であり得る。好適なPAM配列には、NGG、NGA、NGC、NGN、NGT、NGTT、NGCG、NGAG、NGAN、NGNG、NGCN、NGCG、NGTN、NNGRRT、NNNRRT、NNGRR(N)、TTTV、TYCV、TYCV、TATV、NNNNGATT、NNAGAAW、またはNAAAACが含まれるが、これらに限定されない。Yは、ピリミジンであり、Nは、任意のヌクレオチド塩基であり、Wは、AまたはTである。

本明細書に提供される塩基エディターは、CRISPRタンパク質由来ドメインを含むことができ、これは、正準または非正準プロトスペーサー隣接モチーフ(PAM)配列を含有するヌクレオチド配列に結合することができる。PAM部位は、標的ポリヌクレオチド配列に近接したヌクレオチド配列である。本開示の一部の態様は、塩基エディターを提供し、異なるPAM特異性を有するCRISPRタンパク質の全部または一部を含む。

例えば、典型的には、S.pyogenes(spCas9)由来のCas9などのCas9タンパク質は、特定の核酸領域に結合するために正準NGG PAM配列を必要とする(ここで、「NGG」における「N」は、アデニン(A)、チミン(T)、グアニン(G)、またはシトシン(C)であり、Gは、グアニンである)。PAMは、CRISPRタンパク質特異的であり得、異なるCRISPRタンパク質由来ドメインを含む異なる塩基エディター間で異なり得る。PAMは、標的配列の5’または3’であることができる。PAMは、標的配列の上流または下流であり得る。PAMは、1、2、3、4、5、6、7、8、9、10ヌクレオチド長、またはそれ以上であり得る。多くの場合、PAMは、2～6ヌクレオチド長である。

一部の実施形態では、PAMは、「NRN」PAMであるか(ここで、「NRN」の「N」は、アデニン(A)、チミン(T)、グアニン(G)、またはシトシン(C)であり、Rは、アデニン(A)またはグアニン(G)である)、またはPAMは、「NYN」PAMである(ここで、「NYN」の「N」は、アデニン(A)、チミン(T)、グアニン(G)、またはシトシン(C)であり、Yは、シチジン(C)またはチミン(T)である)。例えば、－R.T.Walton et al.,2020,Science,10.1126/science.aba8853(2020)に記載されている(その内容全体が、参照により本明細書に援用される)。

以下の表7に、いくつかのPAMバリアントを記載する。

一部の実施形態では、PAMは、NGCである。一部の実施形態では、NGC PAMは、Cas9バリアントによって認識される。一部の実施形態では、NGC PAMバリアントは、D1135M、S1136Q、G1218K、E1219F、A1322R、D1332A、R1335E、及びT1337Rから選択される1つ以上のアミノ酸置換を含む(総称して「MQKFRAER」)。

一部の実施形態では、PAMは、NGTである。一部の実施形態では、NGT PAMは、Cas9バリアントによって認識される。一部の実施形態では、NGT PAMバリアントは、1つ以上の残基1335、1337、1135、1136、1218、及び/または1219における標的化変異導入を介して作製される。一部の実施形態では、NGT PAMバリアントは、1つ以上の残基1219、1335、1337、1218における標的化変異導入を介して作製される。一部の実施形態では、NGT PAMバリアントは、1つ以上の残基1135、1136、1218、1219、及び1335における標的化変異導入を介して作製される。一部の実施形態では、NGT PAMバリアントは、以下の表8A及び8Bに示す標的変異のセットから選択される。

一部の実施形態では、NGT PAMバリアントは、表8A及び8Bのバリアント5、7、28、31、または36から選択される。一部の実施形態では、バリアントは、改善されたNGT PAM認識を有する。

一部の実施形態では、NGT PAMバリアントは、残基1219、1335、1337、及び/または1218に変異を有する。一部の実施形態では、NGT PAMバリアントは、認識を改善するための変異を有する、以下の表9に提供されるバリアントから選択される。

一部の実施形態では、NGT PAMは、以下の表10に提供されるバリアントから選択される。

一部の実施形態では、NGTNバリアントは、バリアント1である。一部の実施形態では、NGTNバリアントは、バリアント2である。一部の実施形態では、NGTNバリアントは、バリアント3である。一部の実施形態では、NGTNバリアントは、バリアント4である。一部の実施形態では、NGTNバリアントは、バリアント5である。一部の実施形態では、NGTNバリアントは、バリアント6である。

一部の実施形態では、Cas9ドメインは、Streptococcus pyogenes(SpCas9)由来のCas9ドメインである。一部の実施形態では、SpCas9ドメインは、ヌクレアーゼ活性SpCas9、ヌクレアーゼ不活性SpCas9(SpCas9d)、またはSpCas9ニッカーゼ(SpCas9n)である。一部の実施形態では、SpCas9は、D9X変異、または本明細書に提供されるアミノ酸配列のうちのいずれかにおける対応する変異を含み、Xは、Dを除く任意のアミノ酸である。一部の実施形態では、SpCas9は、D9A変異、または本明細書に提供されるアミノ酸配列のうちのいずれかにおける対応する変異を含む。一部の実施形態では、SpCas9ドメイン、SpCas9dドメイン、またはSpCas9nドメインは、非正準PAMを有する核酸配列に結合することができる。一部の実施形態では、SpCas9ドメイン、SpCas9dドメイン、またはSpCas9nドメインは、NGG、NGA、またはNGCG PAM配列を有する核酸配列に結合することができる。

一部の実施形態では、SpCas9ドメインは、D1135X、R1335X、及びT1337X変異、または本明細書に提供されるアミノ酸配列のうちのいずれかにおける対応する変異のうちの1つ以上を含む(ここで、Xは、任意のアミノ酸である)。一部の実施形態では、SpCas9ドメインは、D1135E、R1335Q、及びT1337R変異、または本明細書に提供されるアミノ酸配列のうちのいずれかにおける対応する変異のうちの1つ以上を含む。一部の実施形態では、SpCas9ドメインは、D1135E、R1335Q、及びT1337R変異、または本明細書に提供されるアミノ酸配列のうちのいずれかにおける対応する変異を含む。一部の実施形態では、SpCas9ドメインは、D1135X、R1335X、及びT1337X変異、または本明細書に提供されるアミノ酸配列のうちのいずれかにおける対応する変異のうちの1つ以上を含む(ここで、Xは、任意のアミノ酸である)。一部の実施形態では、SpCas9ドメインは、D1135V、R1335Q、及びT1337R変異、または本明細書に提供されるアミノ酸配列のうちのいずれかにおける対応する変異のうちの1つ以上を含む。一部の実施形態では、SpCas9ドメインは、D1135V、R1335Q、及びT1337R変異、または本明細書に提供されるアミノ酸配列のうちのいずれかにおける対応する変異を含む。一部の実施形態では、SpCas9ドメインは、D1135X、G1218X、R1335X、及びT1337X変異、または本明細書に提供されるアミノ酸配列のうちのいずれかにおける対応する変異のうちの1つ以上を含む(ここで、Xは、任意のアミノ酸である)。一部の実施形態では、SpCas9ドメインは、D1135V、G1218R、R1335Q、及びT1337R変異、または本明細書に提供されるアミノ酸配列のうちのいずれかにおける対応する変異のうちの1つ以上を含む。一部の実施形態では、SpCas9ドメインは、D1135V、G1218R、R1335Q、及びT1337R変異、または本明細書に提供されるアミノ酸配列のうちのいずれかにおける対応する変異を含む。

一部の実施例では、本明細書に開示される塩基エディターのCRISPRタンパク質由来ドメインによって認識されるPAMは、塩基エディターをコードする挿入物(例えば、AAV挿入物)に別個に対するオリゴヌクレオチド上で、細胞に提供され得る。そのような実施形態では、別個のオリゴヌクレオチド上にPAMを提供することで、標的配列の切断を可能になり、さもなければ、隣接するPAMが標的配列と同じポリヌクレオチド上に存在しないため、切断することができない。

一実施形態では、S.pyogenes Cas9(SpCas9)は、ゲノム操作のためのCRISPRエンドヌクレアーゼとして使用することができる。ただし、他のものも使用することができる。一部の実施形態では、異なるエンドヌクレアーゼを使用して、特定のゲノム標的を標的とすることができる。一部の実施形態では、非NGG PAM配列を有する合成SpCas9由来バリアントを使用することができる。加えて、様々な種に由来する他のCas9オルソログが同定されており、これらの「非SpCas9」は、本開示にも有用であり得る様々なPAM配列に結合することができる。例えば、比較的大きなサイズのSpCas9(およそ4kbのコード配列)は、細胞内で効率的に発現され得ないSpCas9 cDNAを有するプラスミドをもたらす可能性がある。逆に、Staphylococcus aureus Cas9(SaCas9)のコード配列は、SpCas9よりもおよそ1キロ塩基短く、おそらく、細胞内でそれを効率的に発現させる。SpCas9と同様に、SaCas9エンドヌクレアーゼは、インビトロ及びマウスにおけるインビボで、哺乳動物細胞の標的遺伝子を修飾することができる。一部の実施形態では、Casタンパク質は、異なるPAM配列を標的とすることができる。一部の実施形態では、標的遺伝子は、例えば、Cas9 PAMである5’-NGGに隣接することができる。他の実施形態では、他のCas9オルソログは、異なるPAM要件を有し得る。例えば、S.thermophilusのPAM(CRISPR1については5’-NNAGAA及びCRISPR3については5’-NGGNG)及びNeisseria meningitidisのPAM(5’-NNNNGATT)などの他のPAMもまた、標的遺伝子に隣接して見出され得る。

一部の実施形態では、S.pyogenesシステムについては、標的遺伝子配列は、5’-NGG PAMに先行する(すなわち、5’側である)ことができ、20ntガイドRNA配列は、反対の鎖と塩基対形成して、PAMに隣接するCas9切断を媒介することができる。一部の実施形態では、隣接カットは、PAMの3塩基対上流であり得るか、または約3塩基対上流であり得る。一部の実施形態では、隣接カットは、PAMの10塩基対上流であり得るか、または約10塩基対上流であり得る。一部の実施形態では、隣接カットは、PAMの0～20塩基対上流であり得るか、または約0～20塩基対上流であり得る。例えば、隣接カットは、PAMの1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、または30塩基対上流に隣接し得る。隣接カットは、PAMの1～30塩基対下流であり得る。PAM配列に結合することができる例示的なSpCas9タンパク質の配列は、以下のとおりである。

一部の実施形態では、操作されたSpCas9バリアントは、3’H(非G PAM)に隣接するプロトスペーサー隣接モチーフ(PAM)配列を認識することができる(表3A～3Dを参照されたい)。一部の実施形態では、SpCas9バリアントは、NRNH PAMを認識する(ここで、Rは、AまたはGであり、Hは、A、C、またはTである)。一部の実施形態では、非G PAMは、NRRH、NRTH、またはNRCHである(例えば、Miller,S.M.,et al.Continuous evolution of SpCas9 variants compatible with non-G PAMs,Nat.Biotechnol.(2020)を参照されたい(その内容は、その全体が参照により本明細書に援用される)。

一部の実施形態では、Cas9ドメインは、組換えCas9ドメインである。一部の実施形態では、組換えCas9ドメインは、SpyMacCas9ドメインである。一部の実施形態では、SpyMacCas9ドメインは、ヌクレアーゼ活性SpyMacCas9、ヌクレアーゼ不活性SpyMacCas9(SpyMacCas9d)、またはSpyMacCas9ニッカーゼ(SpyMacCas9n)である。一部の実施形態では、SaCas9ドメイン、SaCas9dドメイン、またはSaCas9nドメインは、非正準PAMを有する核酸配列に結合することができる。一部の実施形態では、SpyMacCas9ドメイン、SpCas9dドメイン、またはSpCas9nドメインは、NAA PAM配列を有する核酸配列に結合することができる。

天然の5’-NAAN-3’PAM特異性を有するStreptococcus macacaeにおけるSpy Cas9の例示的なCas9 A相同体の配列は、当技術分野で既知であり、例えば、Jakimo et al.,(Chatterjee,et al.,“A Cas9 with PAM recognition for adenine dinucleotides”,Nature Communications,vol.11,article no.2474(2020)によって記載されており、配列表で配列番号237としてある。

一部の実施形態では、バリアントCas9タンパク質は、ポリペプチドが標的DNAまたはRNAを切断する能力が低下するように、H840A、P475A、W476A、N477A、D1125A、W1126A、及びD1218A変異を有する。そのようなCas9タンパク質は、標的DNA(例えば、一本鎖標的DNA)を切断する能力が低下しているが、標的DNA(例えば、一本鎖標的DNA)に結合する能力を保持する。別の非限定的な例として、一部の実施形態では、バリアントCas9タンパク質は、D10A、H840A、P475A、W476A、N477A、D1125A、W1126A、及びD1218A変異を有し、そのため、ポリペプチドが標的DNAを切断する能力が低下している。そのようなCas9タンパク質は、標的DNA(例えば、一本鎖標的DNA)を切断する能力が低下しているが、標的DNA(例えば、一本鎖標的DNA)に結合する能力を保持する。一部の実施形態では、バリアントCas9タンパク質がW476A及びW1126A変異を有する場合、またはバリアントCas9タンパク質がP475A、W476A、N477A、D1125A、W1126A、及びD1218A変異を有する場合、バリアントCas9タンパク質は、PAM配列に効率的に結合しない。したがって、一部のそのような事例では、そのようなバリアントCas9タンパク質が結合方法に使用される場合、本方法は、PAM配列を必要としない。言い換えると、一部の実施形態では、そのようなバリアントCas9タンパク質が結合方法に使用される場合、本方法は、ガイドRNAを含み得るが、本方法は、PAM配列の不在下で実施することができる(したがって、結合の特異性が、ガイドRNAの標的化セグメントによって提供される)。他の残基を変異させて、上記の効果を達成することができる(すなわち、一方または他方のヌクレアーゼ部分を不活性化する)。非限定的な例として、残基D10、G12、G17、E762、H840、N854、N863、H982、H983、A984、D986、及び/またはA987を改変(すなわち、置換)することができる。また、アラニン置換以外の変異も好適である。

一部の実施形態では、塩基エディターのCRISPRタンパク質由来ドメインは、正準PAM配列(NGG)を有するCas9タンパク質の全部または一部を含み得る。他の実施形態では、塩基エディターのCas9由来ドメインは、非正準PAM配列を用いることができる。そのような配列は当該技術分野において記載されており、当業者には明らかであろう。例えば、非正準PAM配列に結合するCas9ドメインは、Kleinstiver,B.P.,et al.,“Engineered CRISPR-Cas9 nucleases with altered PAM specificities”Nature 523,481-485(2015)、及びKleinstiver,B.P.,et al.,“Broadening the targeting range of Staphylococcus aureus CRISPR-Cas9 by modifying PAM recognition”Nature Biotechnology 33,1293-1298(2015)、R.T.Walton et al.“Unconstrained genome targeting with near-PAMless engineered CRISPR-Cas9 variants”Science 10.1126/science.aba8853(2020)、Hu et al.“Evolved Cas9 variants with broad PAM compatibility and high DNA specificity,”Nature,2018 Apr.5,556(7699),57-63、Miller et al.,“Continuous evolution of SpCas9 variants compatible with non-G PAMs”Nat.Biotechnol.,2020 Apr;38(4):471-481によって記載されており、各々の内容全体は、参照により本明細書に援用される。

NapDNAbpとシチジンデアミナーゼ及び/またはアデノシンデアミナーゼを含む融合タンパク質
本開示の一部の態様は、Cas9ドメインまたは他の核酸プログラマブルDNA結合タンパク質(例えば、Cas12)と、1つ以上のシチジンデアミナーゼまたはアデノシンデアミナーゼドメインと、を含む融合タンパク質を提供する。Cas9ドメインは、本明細書に提供されるCas9ドメインまたはCas9タンパク質(例えば、dCas9またはnCas9)のいずれであり得ることを理解されたい。一部の実施形態では、本明細書に提供されるCas9ドメインまたはCas9タンパク質(例えば、dCas9またはnCas9)のうちのいずれかが、本明細書に提供されるシチジンデアミナーゼ及び/またはアデノシンデアミナーゼのうちのいずれかと融合され得る。本明細書に開示される塩基エディターのドメインは、任意の順序で配置され得る。

一部の実施形態では、融合タンパク質は、以下のドメインA～C、A～D、またはA～Eを含み:
NH₂-[A-B-C]-COOH、
NH₂-[A-B-C-D]-COOH、または
NH₂-[A-B-C-D-E]-COOH、
式中、A及びC、またはA、C、及びEは、各々、以下のうちの1つ以上を含み:
アデノシンデアミナーゼドメインまたはその活性断片、
シチジンデアミナーゼドメインまたはその活性断片、
式中、B、またはB及びDは、各々、核酸配列特異的結合活性を有する1つ以上のドメインを含む。

一部の実施形態では、融合タンパク質は、以下の構造を含み:
NH₂-[A_n-B_o-C_n]-COOH、
NH₂-[A_n-B_o-C_n-D_o]-COOH、または
NH₂-[A_n-B_o-C_p-D_o-E_q]-COOH、
式中、A及びC、またはA、C、及びEは、各々、以下のうちの1つ以上を含み:
アデノシンデアミナーゼドメインまたはその活性断片、
シチジンデアミナーゼドメインまたはその活性断片、
式中、nは整数:1、2、3、4、または5であり、pは、整数:0、1、2、3、4、または5であり、qは、整数:0、1、2、3、4、または5であり、式中、B、またはB及びDは、各々、核酸配列特異的結合活性を有するドメインを含み、式中、oは、整数:1、2、3、4、または5である。

例えば、限定されないが、一部の実施形態では、融合タンパク質は、以下の構造を含む:
NH2-[アデノシンデアミナーゼ]-[Cas9ドメイン]-COOH、
NH2-[Cas9ドメイン]-[アデノシンデアミナーゼ]-COOH、
NH2-[シチジンデアミナーゼ]-[Cas9ドメイン]-COOH、
NH2-[Cas9ドメイン]-[シチジンデアミナーゼ]-COOH、
NH2-[シチジンデアミナーゼ]-[Cas9ドメイン]-[アデノシンデアミナーゼ]-COOH、
NH2-[アデノシンデアミナーゼ]-[Cas9ドメイン]-[シチジンデアミナーゼ]-COOH、
NH2-[アデノシンデアミナーゼ]-[シチジンデアミナーゼ]-[Cas9ドメイン]-COOH、
NH2-[シチジンデアミナーゼ]-[アデノシンデアミナーゼ]-[Cas9ドメイン]-COOH、
NH2-[Cas9ドメイン]-[アデノシンデアミナーゼ]-[シチジンデアミナーゼ]-COOH、または
NH2-[Cas9ドメイン]-[シチジンデアミナーゼ]-[アデノシンデアミナーゼ]-COOHを含む。

一部の実施形態では、本明細書に提供されるCas12ドメインまたはCas12タンパク質のうちのいずれかが、本明細書に提供されるシチジンデアミナーゼまたはアデノシンデアミナーゼのうちのいずれかと融合され得る。例えば、限定されないが、一部の実施形態では、融合タンパク質は、以下の構造を含む:
NH2-[アデノシンデアミナーゼ]-[Cas12ドメイン]-COOH、
NH2-[Cas12ドメイン]-[アデノシンデアミナーゼ]-COOH、
NH2-[シチジンデアミナーゼ]-[Cas12ドメイン]-COOH、
NH2-[Cas12ドメイン]-[シチジンデアミナーゼ]-COOH、
NH2-[シチジンデアミナーゼ]-[Cas12ドメイン]-[アデノシンデアミナーゼ]-COOH、
NH2-[アデノシンデアミナーゼ]-[Cas12ドメイン]-[シチジンデアミナーゼ]-COOH、
NH2-[アデノシンデアミナーゼ]-[シチジンデアミナーゼ]-[Cas12ドメイン]-COOH、
NH2-[シチジンデアミナーゼ]-[アデノシンデアミナーゼ]-[Cas12ドメイン]-COOH、
NH2-[Cas12ドメイン]-[アデノシンデアミナーゼ]-[シチジンデアミナーゼ]-COOH、または
NH2-[Cas12ドメイン]-[シチジンデアミナーゼ]-[アデノシンデアミナーゼ]-COOHを含む。

一部の実施形態では、アデノシンデアミナーゼは、TadA*8である。例示的な融合タンパク質の構造としては、以下が挙げられる:
NH2-[TadA*8]-[Cas9ドメイン]-COOH、
NH2-[Cas9ドメイン]-[TadA*8]-COOH、
NH2-[TadA*8]-[Cas12ドメイン]-COOH、または
NH2-[Cas12ドメイン]-[TadA*8]-COOH、

一部の実施形態では、融合タンパク質のアデノシンデアミナーゼは、TadA*8と、シチジンデアミナーゼ及び/またはアデノシンデアミナーゼとを含む。一部の実施形態では、TadA*8は、TadA*8.1、TadA*8.2、TadA*8.3、TadA*8.4、TadA*8.5、TadA*8.6、TadA*8.7、TadA*8.8、TadA*8.9、TadA*8.10、TadA*8.11、TadA*8.12、TadA*8.13、TadA*8.14、TadA*8.15、TadA*8.16、TadA*8.17、TadA*8.18、TadA*8.19、TadA*8.20、TadA*8.21、TadA*8.22、TadA*8.23、またはTadA*8.24である。

例示的な融合タンパク質の構造としては、以下が挙げられる:
NH2-[TadA*8]-[Cas9/Cas12]-[アデノシンデアミナーゼ]-COOH、
NH2-[アデノシンデアミナーゼ]-[Cas9/Cas12]-[TadA*8]-COOH、
NH2-[TadA*8]-[Cas9/Cas12]-[シチジンデアミナーゼ]-COOH、または
NH2-[シチジンデアミナーゼ]-[Cas9/Cas12]-[TadA*8]-COOH。

一部の実施形態では、融合タンパク質のアデノシンデアミナーゼは、TadA*9と、シチジンデアミナーゼ及び/またはアデノシンデアミナーゼとを含む。例示的な融合タンパク質の構造としては、以下が挙げられる:
NH2-[TadA*9]-[Cas9/Cas12]-[アデノシンデアミナーゼ]-COOH、
NH2-[アデノシンデアミナーゼ]-[Cas9/Cas12]-[TadA*9]-COOH、
NH2-[TadA*9]-[Cas9/Cas12]-[シチジンデアミナーゼ]-COOH、または
NH2-[シチジンデアミナーゼ]-[Cas9/Cas12]-[TadA*9]-COOH。

一部の実施形態では、融合タンパク質は、N末端断片に隣接するデアミナーゼと、Cas9またはCas12ポリペプチドのC末端断片とを含む。一部の実施形態では、融合タンパク質は、N末端断片に隣接するシチジンデアミナーゼと、Cas9またはCas12ポリペプチドのC末端断片とを含む。一部の実施形態では、融合タンパク質は、N末端断片に隣接するアデノシンデアミナーゼと、Cas9またはCas12ポリペプチドのC末端断片とを含む。

一部の実施形態では、シチジンデアミナーゼまたはアデノシンデアミナーゼと、napDNAbp(例えば、Cas9またはCas12ドメイン)とを含む融合タンパク質は、リンカー配列を含まない。一部の実施形態では、リンカーは、シチジンデアミナーゼまたはアデノシンデアミナーゼとnapDNAbpとの間に存在する。一部の実施形態では、上記の一般的なアーキテクチャで使用される「-」は、任意選択のリンカーの存在を示す。一部の実施形態では、シチジンデアミナーゼまたはアデノシンデアミナーゼと、napDNAbpとは、本明細書に提供されるリンカーのいずれかを介して融合される。例えば、一部の実施形態では、シチジンデアミナーゼまたはアデノシンデアミナーゼと、napDNAbpとは、本明細書に提供されるリンカーのいずれかを介して融合される。

本開示の融合タンパク質は、1つ以上の追加の特徴を含み得ることを理解されたい。例えば、一部の実施形態では、融合タンパク質は、阻害剤、細胞質局在化配列、輸送配列(例えば、核外輸送配列)、または他の局在化配列、ならびに融合タンパク質の可溶化、精製、または検出に有用な配列タグを含んでもよい。本明細書に提供される好適なタンパク質タグとしては、これらに限定されないが、ビオチンカルボキシラーゼキャリアタンパク質(BCCP)タグ、mycタグ、カルモジュリンタグ、FLAGタグ、ヘマグルチニン(HA)タグ、ヒスチジンタグまたはHisタグとも呼ばれるポリヒスチジンタグ、マルトース結合タンパク質(MBP)タグ、nusタグ、グルタチオン-S-トランスフェラーゼ(GST)タグ、緑色蛍光タンパク質(GFP)タグ、チオレドキシンタグ、Sタグ、ソフトタグ(例えば、ソフトタグ1、ソフトタグ3)、ストレプタグ、ビオチンリガーゼタグ、FlAsHタグ、V5タグ、及びSBPタグが挙げられる。更なる好適な配列は、当業者には明らかであろう。一部の実施形態では、融合タンパク質は、1つ以上のHisタグを含む。

例示的であるが非限定的な融合タンパク質は、国際PCT出願第2017/044935号、第PCT/US2019/044935号、及び第PCT/US2020/016288号に記載されている(これらの各々は、その全体が参照により本明細書に援用される)。

核局在化配列(NLS)を含む融合タンパク質
一部の実施形態では、本明細書に提供される融合タンパク質は、1つまたは複数の(例えば、2、3、4、5)核標的化配列、例えば、核局在化配列(NLS)を更に含む。一実施形態では、二分NLSが使用される。一部の実施形態では、NLSは、(例えば、核内輸送によって)細胞核へのNLSを含むタンパク質の移入を促進するアミノ酸配列を含む。一部の実施形態では、NLSは、融合タンパク質のN末端またはC末端に融合されている。一部の実施形態では、NLSは、nCas9ドメインまたはdCas9ドメインのC末端またはN末端に融合されている。一部の実施形態では、NLSは、Cas12ドメインのN末端またはC末端に融合されている。一部の実施形態では、NLSは、シチジンまたはアデノシンデアミナーゼのN末端またはC末端に融合されている。一部の実施形態では、NLSは、1つ以上のリンカーを介して融合タンパク質に融合される。一部の実施形態では、NLSは、リンカーなしで融合タンパク質に融合される。一部の実施形態では、NLSは、本明細書で提供または参照されるNLS配列のいずれか1つのアミノ酸配列を含む。追加の核局在化配列は、当該技術分野で既知であり、当業者には明らかであろう。例えば、NLS配列は、Plank et al.,PCT/EP2000/011690に記載されている(それらの内容は、例示的な核局在化配列の開示のために、参照により本明細書に援用される)。一部の実施形態では、NLSは、アミノ酸配列PKKKRKVEGADKRTADGSEFESPKKKRKV(配列番号328)、KRTADGSEFESPKKKRKV(配列番号190)、KRPAATKKAGQAKKKK(配列番号191)、KKTELQTTNAENKTKKL(配列番号192)、KRGINDRNFWRGENGRKTR(配列番号193)、RKSGKIAAIVVKRPRKPKKKRKV(配列番号329)またはMDSLLMNRRKFLYQFKNVRWAKGRRETYLC(配列番号196)を含む。

一部の実施形態では、シチジンデアミナーゼまたはアデノシンデアミナーゼ、Cas9ドメイン、及びNLSを含む融合タンパク質は、リンカー配列を含まない。一部の実施形態では、ドメインまたはタンパク質(例えば、シチジンデアミナーゼもしくはアデノシンデアミナーゼ、Cas9ドメイン、またはNLS)のうちの1つ以上の間に、リンカー配列が存在する。一部の実施形態では、リンカーは、シチジンデアミナーゼ及びアデノシンデアミナーゼドメインと、napDNAbpとの間に存在する。一部の実施形態では、以下の一般的なアーキテクチャで使用される「-」は、任意選択のリンカーの存在を示す。一部の実施形態では、シチジンデアミナーゼ及びアデノシンデアミナーゼと、napDNAbpとは、本明細書に提供されるリンカーのいずれかを介して融合される。例えば、一部の実施形態では、シチジンデアミナーゼ及びアデノシンデアミナーゼと、napDNAbpとが、本明細書に提供されるリンカーのいずれかを介して融合される。

一部の実施形態では、シチジンまたはアデノシンデアミナーゼと、napDNAbp(例えば、Cas9またはCas12)ドメインとを有する例示的なnapDNAbp(例えば、Cas9またはCas12)融合タンパク質の一般的なアーキテクチャは、以下の構造のうちのいずれか1つを含み、以下の構造において、NLSは、核局在化配列(例えば、本明細書で提供されるいずれかのNLS)であり、NH2は、融合タンパク質のN末端であり、COOHは、融合タンパク質のC末端である:
NH₂-NLS-[シチジンデアミナーゼ]-[napDNAbpドメイン]-COOH、
NH₂-NLS-[napDNAbpドメイン]-[シチジンデアミナーゼ]-COOH、
NH₂-[シチジンデアミナーゼ]-[napDNAbpドメイン]-NLS-COOH、
NH₂-[napDNAbpドメイン]-[シチジンデアミナーゼ]-NLS-COOH、
NH₂-NLS-[アデノシンデアミナーゼ]-[napDNAbpドメイン]-COOH、
NH₂-NLS-[napDNAbpドメイン]-[アデノシンデアミナーゼ]-COOH、
NH₂-[アデノシンデアミナーゼ]-[napDNAbpドメイン]-NLS-COOH、
NH₂-[napDNAbpドメイン]-[アデノシンデアミナーゼ]-NLS-COOH、
NH₂-NLS-[シチジンデアミナーゼ]-[napDNAbpドメイン]-[アデノシンデアミナーゼ]-COOH、
NH₂-NLS-[アデノシンデアミナーゼ]-[napDNAbpドメイン]-[シチジンデアミナーゼ]-COOH、
NH₂-NLS-[アデノシンデアミナーゼ]-[シチジンデアミナーゼ]-[napDNAbpドメイン]-COOH、
NH₂-NLS-[シチジンデアミナーゼ]-[アデノシンデアミナーゼ]-[napDNAbpドメイン]-COOH、
NH₂-NLS-[napDNAbpドメイン]-[アデノシンデアミナーゼ]-[シチジンデアミナーゼ]-COOH、
NH₂-NLS-[napDNAbpドメイン]-[シチジンデアミナーゼ]-[アデノシンデアミナーゼ]-COOH、
NH₂-[シチジンデアミナーゼ]-[napDNAbpドメイン]-[アデノシンデアミナーゼ]-NLS-COOH、
NH₂-[アデノシンデアミナーゼ]-[napDNAbpドメイン]-[シチジンデアミナーゼ]-NLS-COOH、
NH₂-[アデノシンデアミナーゼ]-[シチジンデアミナーゼ]-[napDNAbpドメイン]-NLS-COOH、
NH₂-[シチジンデアミナーゼ]-[アデノシンデアミナーゼ]-[napDNAbpドメイン]-NLS-COOH、
NH₂-[napDNAbpドメイン]-[アデノシンデアミナーゼ]-[シチジンデアミナーゼ]-NLS-COOH、または
NH₂-[napDNAbpドメイン]-[シチジンデアミナーゼ]-[アデノシンデアミナーゼ]-NLS-COOH。

一部の実施形態では、NLSは、例えば、本明細書に記載されるように、リンカー内に存在するか、またはNLSは、リンカーに隣接している。二分NLSは、2つの塩基性アミノ酸クラスターを含み、比較的短いスペーサー配列によって分離されている(したがって、二分(bipartite)-2つの部分であり、一方、一分(monopartite)NLSはそうではない)。ヌクレオプラスミンのNLSであるKR[PAATKKAGQA]KKKK(配列番号191)は、ユビキタスな双節型シグナルのプロトタイプであり、約10アミノ酸のスペーサーによって分離された塩基性アミノ酸の2つのクラスターである。例示的な二分NLSの配列は、以下のとおりである:
PKKKRKVEGADKRTADGSEFESPKKKRKV(配列番号328)。

1つ以上の核局在化配列(NLS)を含むCRISPR酵素をコードするベクターを使用することができる。例えば、1、2、3、4、5、6、7、8、9、10個、または約1、2、3、4、5、6、7、8、9、10個のNLSが使用され得る。CRISPR酵素は、アミノ末端もしくはその近くにNLSを含むか、カルボキシ末端もしくはその近くに約1、2、3、4、5、6、7、8、9、10個もしくは約1、2、3、4、5、6、7、8、9、10個以上のNLSを含むか、またはそれらの任意の組み合わせのNLS(例えば、アミノ末端に1つ以上のNLS、及びカルボキシ末端に1つ以上のNLS)を含むことができる。複数のNLSが存在する場合、単一のNLSが複数のコピーに存在し得るように、及び/または1つ以上の他のNLSとの組み合わせで1つ以上のコピーに存在し得るように、各々が、他とは独立して選択され得る。

本方法で使用されるCRISPR酵素は、約6個のNLSを含むことができる。NLSは、NLSに最も近いアミノ酸が、N末端またはC末端から、ポリペプチド鎖に沿って、約50アミノ酸以内(例えば、1、2、3、4、5、10、15、20、25、30、40、または50アミノ酸以内)にある場合、N末端またはC末端付近とみなされる。

追加のドメイン
本明細書に記載の塩基エディターは、ポリヌクレオチドの核酸塩基の編集、修飾、または改変を促進するのを助ける任意のドメインを含むことができる。一部の実施形態では、塩基エディターは、ポリヌクレオチドプログラマブルヌクレオチド結合ドメイン(例えば、Cas9)、核酸塩基編集ドメイン(例えば、デアミナーゼドメイン)、及び1つ以上の追加のドメインを含む。一部の実施形態では、追加のドメインは、塩基エディターの酵素機能もしくは触媒機能、塩基エディターの結合機能を促進させ得るか、または所望の塩基編集結果を妨げ得る細胞機構(例えば、酵素)の阻害因子であり得る。一部の実施形態では、塩基エディターは、ヌクレアーゼ、ニッカーゼ、リコンビナーゼ、デアミナーゼ、メチルトランスフェラーゼ、メチラーゼ、アセチラーゼ、アセチルトランスフェラーゼ、転写活性化因子、または転写リプレッサードメインを含むことができる。

一部の実施形態では、塩基エディターは、ウラシルグリコシラーゼ阻害剤(UGI)ドメインを含むことができる。一部の実施形態では、U:Gヘテロ二重鎖DNAの存在に対する細胞のDNA修復応答は、細胞における核酸塩基編集効率の低下の原因となり得る。そのような実施形態では、ウラシルDNAグリコシラーゼ(UDG)は、細胞のDNAからのUの除去を触媒することができ、塩基除去修復(BER)を開始して、主に、U:G対からC:G対への復帰をもたらすことができる。そのような実施形態では、BERは、一本鎖に結合し、編集された塩基をブロックし、UGIを阻害し、BERを阻害し、編集された塩基を保護し、かつ/または未編集鎖の修復を促進する、1つ以上のドメインを含む塩基エディターで阻害され得る。したがって、本開示は、UGIドメインを含む塩基エディター融合タンパク質を企図する。

一部の実施形態では、塩基エディターは、ドメインとして、二本鎖切断(DSB)結合タンパク質の全部または一部を含む。例えば、DSB結合タンパク質は、DSBの末端に結合し、それらを分解から保護することができるバクテリオファージMuのGamタンパク質を含むことができる。Komor,A.C.,et al.,“Improved base excision repair inhibition and bacteriophage Mu Gam protein yields C:G-to-T:A base editors with higher efficiency and product purity”Science Advances 3:eaao4774(2017)を参照されたい(その内容全体が、参照により本明細書に援用される)。

加えて、一部の実施形態では、Gamタンパク質は、塩基エディターのN末端に融合され得る。一部の実施形態では、Gamタンパク質は、塩基エディターのC末端に融合され得る。バクテリオファージMuのGamタンパク質は、二本鎖切断(DSB)の末端に結合し、それらを分解から保護することができる。一部の実施形態では、DSBの遊離末端に結合するGamを使用して、塩基編集のプロセス中のインデルの形成を低減することができる。一部の実施形態では、174残基のGamタンパク質が、塩基エディターのN末端に融合される。Komor,A.C.,et al.,“Improved base excision repair inhibition and bacteriophage Mu Gam protein yields C:G-to-T:A base editors with higher efficiency and product purity”Science Advances 3:eaao4774(2017)を参照されたい。一部の実施形態では、変異(複数可)は、野生型ドメインに対して、塩基エディタードメインの長さを変化させることができる。例えば、少なくとも1つのドメインにおける少なくとも1つのアミノ酸の欠失は、塩基エディターの長さを減少させ得る。別の場合、変異(複数可)は、野生型ドメインに対して、ドメインの長さを変化させない。例えば、任意のドメインにおける置換は、塩基エディターの長さを変化させない。

全てのドメインの長さが野生型ドメインと同じである場合、そのような塩基エディターの非限定的な例としては、以下が挙げられる:
NH2-[核酸塩基編集ドメイン]-リンカー1-[APOBEC1]-リンカー2-[核酸塩基編集ドメイン]-COOH、
NH2-[核酸塩基編集ドメイン]-リンカー1-[APOBEC1]-[核酸塩基編集ドメイン]-COOH、
NH2-[核酸塩基編集ドメイン]-[APOBEC1]-リンカー2-[核酸塩基編集ドメイン]-COOH、
NH2-[核酸塩基編集ドメイン]-[APOBEC1]-[核酸塩基編集ドメイン]-COOH、
NH2-[核酸塩基編集ドメイン]-リンカー1-[APOBEC1]-リンカー2-[核酸塩基編集ドメイン]-[UGI]-COOH、
NH2-[核酸塩基編集ドメイン]-リンカー1-[APOBEC1]-[核酸塩基編集ドメイン]-[UGI]-COOH、
NH2-[核酸塩基編集ドメイン]-[APOBEC1]-リンカー2-[核酸塩基編集ドメイン]-[UGI]-COOH、
NH2-[核酸塩基編集ドメイン]-[APOBEC1]-[核酸塩基編集ドメイン]-[UGI]-COOH、
NH2-[UGI]-[核酸塩基編集ドメイン]-リンカー1-[APOBEC1]-リンカー2-[核酸塩基編集ドメイン]-COOH、
NH2-[UGI]-[核酸塩基編集ドメイン]-リンカー1-[APOBEC1]-[核酸塩基編集ドメイン]-COOH、
NH2-[UGI]-[核酸塩基編集ドメイン]-[APOBEC1]-リンカー2-[核酸塩基編集ドメイン]-COOH、または
NH2-[UGI]-[核酸塩基編集ドメイン]-[APOBEC1]-[核酸塩基編集ドメイン]-COOH。

塩基エディターシステム
塩基エディターシステムを使用して核酸塩基を編集するためのシステム、組成物、及び方法が本明細書に提供される。一部の実施形態では、塩基エディターシステムは、(1)塩基エディター(BE)であって、ポリヌクレオチドプログラマブルヌクレオチド結合ドメイン及び核酸塩基を編集するための核酸塩基編集ドメイン(例えば、デアミナーゼドメイン)を含む、塩基エディターと、(2)ポリヌクレオチドプログラマブルヌクレオチド結合ドメインと併せてガイドポリヌクレオチド(例えば、ガイドRNA)と、を含む。一部の実施形態では、塩基エディターシステムは、シチジン塩基エディター(CBE)またはアデノシン塩基エディター(ABE)である。一部の実施形態では、ポリヌクレオチドプログラマブルヌクレオチド結合ドメインは、ポリヌクレオチドプログラマブルDNAまたはRNA結合ドメインである。一部の実施形態では、核酸塩基編集ドメインは、デアミナーゼドメインである。一部の実施形態では、デアミナーゼドメインは、シチジンデアミナーゼまたはシトシンデアミナーゼであり得る。一部の実施形態では、デアミナーゼドメインは、アデニンデアミナーゼまたはアデノシンデアミナーゼであり得る。一部の実施形態では、アデノシン塩基エディターは、DNAのアデニンを脱アミノ化することができる。一部の実施形態では、塩基エディターは、DNAのシチジンを脱アミノ化することができる。

一部の実施形態では、本明細書で提供される塩基編集システムは、ゲノム編集への新しい手法を提供し、このゲノム編集は、触媒欠損型Streptococcus pyogenes Cas9と、デアミナーゼ(例えば、シチジンまたはアデノシンデアミナーゼ)と、塩基除去修復の阻害剤とを含有する融合タンパク質を使用して、二本鎖DNA切断をもたらすことなく、ドナーDNA鋳型を必要とすることなく、かつ過剰な確率的挿入及び欠失を誘導することなく、DNAにおけるプログラマブル単一ヌクレオチド(C→TまたはA→G)変化を誘導する。

核酸塩基編集タンパク質の詳細は、国際PCT出願第PCT/2017/045381号(WO2018/027078)及び第PCT/US2016/058344号(WO2017/070632)に記載されている(これらの各々は、その全体が参照により本明細書に援用される)。また、Komor,A.C.,et al.,“Programmable editing of a target base in genomic DNA without double-stranded DNA cleavage”Nature 533,420-424(2016)、Gaudelli,N.M.,et al.,“Programmable base editing of A・T to G・C in genomic DNA without DNA cleavage”Nature 551,464-471(2017)及びKomor,A.C.,et al.,“Improved base excision repair inhibition and bacteriophage Mu Gam protein yields C:G-to-T:A base editors with higher efficiency and product purity”Science Advances 3:eaao4774(2017)を参照されたく、それらの内容全体は、参照により本明細書に援用される。

本明細書に提供される塩基エディターシステムの使用は、(a)対象のポリヌクレオチド(例えば、二本鎖もしくは一本鎖DNAまたはRNA)の標的ヌクレオチド配列を、核酸塩基エディター(例えば、アデノシン塩基エディターまたはシチジン塩基エディター)とガイドポリ核酸(例えば、gRNA)とを含む塩基エディターシステムと接触させるステップであって、標的ヌクレオチド配列が、標的核酸塩基対を含む、接触させるステップと、(b)当該標的領域の鎖分離を誘導するステップと、(c)標的領域の一本鎖における当該標的核酸塩基対の第1の核酸塩基を第2の核酸塩基に変換するステップと、(d)当該標的領域の1つ以下の鎖を切断するステップであって、第1の核酸塩基塩基に相補的な第3の核酸塩基が、第2の核酸塩基に相補的な第4の核酸塩基によって置き換えられる、切断するステップと、を含む。一部の実施形態では、ステップ(b)が省略されることを理解されたい。一部の実施形態では、当該標的核酸塩基対は、1つ以上の遺伝子における複数の核酸塩基対である。一部の実施形態では、本発明に提供される塩基エディターシステムは、1つ以上の遺伝子において、複数の核酸塩基対を多重編集することができる。一部の実施形態では、複数の核酸塩基対は、同じ遺伝子に位置する。一部の実施形態では、複数の核酸塩基対は、1つ以上の遺伝子に位置し、少なくとも1つの遺伝子は、異なる遺伝子座に位置する。

一部の実施形態では、切断された一本鎖(ニック鎖)は、ガイド核酸にハイブリダイズする。一部の実施形態では、切断された一本鎖は、第1の核酸塩基を含む鎖と反対側である。一部の実施形態では、塩基エディターは、Cas9ドメインを含む。一部の実施形態では、第1の塩基は、アデニンであり、第2の塩基は、G、C、A、またはTではない。一部の実施形態では、第2の塩基は、イノシンである。

一部の実施形態では、シングルガイドポリヌクレオチドを利用して、デアミナーゼを標的核酸配列に標的指向化してもよい。一部の実施形態では、一対のガイドポリヌクレオチドを利用して、異なるデアミナーゼを標的核酸配列に標的指向化してもよい。

塩基エディターシステムの核酸塩基成分及びポリヌクレオチドプログラマブルヌクレオチド結合成分は、互いに共有結合的または非共有結合的に会合することができる。例えば、一部の実施形態では、デアミナーゼドメインは、ポリヌクレオチドプログラマブルヌクレオチド結合ドメインによって、標的ヌクレオチド配列を標的化することができる。一部の実施形態では、ポリヌクレオチドプログラマブルヌクレオチド結合ドメインは、デアミナーゼドメインに融合または連結され得る。一部の実施形態では、ポリヌクレオチドプログラマブルヌクレオチド結合ドメインは、デアミナーゼドメインと非共有結合的に相互作用するか、またはデアミナーゼドメインと会合することによって、デアミナーゼドメインを標的ヌクレオチド配列に標的指向化することができる。例えば、一部の実施形態では、核酸塩基編集成分(例えば、デアミナーゼ成分)は、ポリヌクレオチドプログラマブルヌクレオチド結合ドメインの一部である追加の異種部分もしくは異種ドメインと相互作用し得るか、会合し得るか、または複合体を形成し得る追加の異種部分または異種ドメインを含むことができる。一部の実施形態では、追加の異種部分は、ポリペプチドに結合し得るか、ポリペプチドと相互作用し得るか、ポリペプチドと会合し得るか、またはポリペプチドと複合体を形成し得る場合がある。一部の実施形態では、追加の異種部分は、ポリヌクレオチドに結合し得るか、ポリヌクレオチドと相互作用し得るか、ポリヌクレオチドと会合し得るか、またはポリヌクレオチドと複合体を形成し得る場合がある。一部の実施形態では、追加の異種部分は、ガイドポリヌクレオチドに結合し得る場合がある。一部の実施形態では、追加の異種部分は、ポリペプチドリンカーに結合し得る場合がある。一部の実施形態では、追加の異種部分は、ポリヌクレオチドリンカーに結合し得る場合がある。追加の異種部分は、タンパク質ドメインであり得る。一部の実施形態では、追加の異種部分は、K相同性(KH)ドメイン、MS2コートタンパク質ドメイン、PP7コートタンパク質ドメイン、SfMu Comコートタンパク質ドメイン、ステリルアルファモチーフ、テロメラーゼKu結合モチーフ及びKuタンパク質、テロメラーゼSm7結合モチーフ及びSm7タンパク質、またはRNA認識モチーフであり得る。

塩基エディターシステムは、ガイドポリヌクレオチド成分を更に含んでもよい。塩基エディターシステムの成分が、共有結合、非共有結合性相互作用、またはそれらの会合及び相互作用の任意の組み合わせを介して互いに会合し得ることを理解されたい。一部の実施形態では、デアミナーゼドメインは、ガイドポリヌクレオチドによって標的ヌクレオチド配列に標的指向化され得る。例えば、一部の実施形態では、塩基エディターシステムの核酸塩基編集成分(例えば、デアミナーゼ成分)は、追加の異種部分または異種ドメイン(例えば、RNA結合タンパク質またはDNA結合タンパク質などのポリヌクレオチド結合ドメイン)を含むことができ、ガイドポリヌクレオチドの一部分またはセグメント(例えば、ポリヌクレオチドモチーフ)と相互作用し得るか、会合し得るか、または複合体を形成し得る。一部の実施形態では、追加の異種部分または異種ドメイン(例えば、RNA結合タンパク質またはDNA結合タンパク質などのポリヌクレオチド結合ドメイン)は、デアミナーゼドメインに融合または連結され得る。一部の実施形態では、追加の異種部分は、ポリペプチドに結合し得るか、ポリペプチドと相互作用し得るか、ポリペプチドと会合し得るか、またはポリペプチドと複合体を形成し得る場合がある。一部の実施形態では、追加の異種部分は、ポリヌクレオチドに結合し得るか、ポリヌクレオチドと相互作用し得るか、ポリヌクレオチドと会合し得るか、またはポリヌクレオチドと複合体を形成し得る場合がある。一部の実施形態では、追加の異種部分は、ガイドポリヌクレオチドに結合し得る場合がある。一部の実施形態では、追加の異種部分は、ポリペプチドリンカーに結合し得る場合がある。一部の実施形態では、追加の異種部分は、ポリヌクレオチドリンカーに結合し得る場合がある。追加の異種部分は、タンパク質ドメインであり得る。一部の実施形態では、追加の異種部分は、K相同性(KH)ドメイン、MS2コートタンパク質ドメイン、PP7コートタンパク質ドメイン、SfMu Comコートタンパク質ドメイン、ステリルアルファモチーフ、テロメラーゼKu結合モチーフ及びKuタンパク質、テロメラーゼSm7結合モチーフ及びSm7タンパク質、またはRNA認識モチーフであり得る。

一部の実施形態では、塩基エディターシステムは、塩基除去修復(BER)成分の阻害剤を更に含み得る。塩基エディターシステムの成分が、共有結合、非共有結合性相互作用、またはそれらの会合及び相互作用の任意の組み合わせを介して互いに会合し得ることを理解されたい。BER成分の阻害剤は、塩基除去修復阻害剤を含んでもよい。一部の実施形態では、塩基除去修復の阻害剤は、ウラシルDNAグリコシラーゼ阻害剤(UGI)であり得る。一部の実施形態では、塩基除去修復の阻害剤は、イノシン塩基除去修復阻害剤であり得る。一部の実施形態では、塩基除去修復の阻害因子は、ポリヌクレオチドプログラマブルヌクレオチド結合ドメインによって、標的ヌクレオチド配列に標的指向化され得る。一部の実施形態では、ポリヌクレオチドプログラマブルヌクレオチド結合ドメインは、塩基除去修復の阻害因子に融合または連結され得る。一部の実施形態では、ポリヌクレオチドプログラマブルヌクレオチド結合ドメインは、デアミナーゼドメイン及び塩基除去修復の阻害因子に融合または連結され得る。一部の実施形態では、ポリヌクレオチドプログラマブルヌクレオチド結合ドメインは、塩基除去修復の阻害因子と非共有結合的に相互作用するか、または塩基除去修復の阻害因子と会合することによって、塩基除去修復の阻害因子を標的ヌクレオチド配列に標的指向化することができる。例えば、一部の実施形態では、塩基除去修復成分の阻害因子は、追加の異種部分または異種ドメインを含むことができ、ポリヌクレオチドプログラマブルヌクレオチド結合ドメインの一部である追加の異種部分または異種ドメインと相互作用し得るか、会合し得るか、または複合体を形成し得る。一部の実施形態では、塩基除去修復の阻害因子は、ガイドポリヌクレオチドによって、標的ヌクレオチド配列に標的指向化され得る。例えば、一部の実施形態では、塩基除去修復の阻害因子は、追加の異種部分または異種ドメイン(例えば、RNA結合タンパク質またはDNA結合タンパク質などのポリヌクレオチド結合ドメイン)を含むことができ、ガイドポリヌクレオチドの一部またはセグメント(例えば、ポリヌクレオチドモチーフ)と相互作用し得るか、会合し得るか、または複合体を形成し得る。一部の実施形態では、ガイドポリヌクレオチドの追加の異種部分または異種ドメイン(例えば、RNA結合タンパク質またはDNA結合タンパク質などのポリヌクレオチド結合ドメイン)は、塩基除去修復の阻害因子に融合または連結され得る。一部の実施形態では、追加の異種部分は、ポリヌクレオチドに結合し得るか、ポリヌクレオチドと相互作用し得るか、ポリヌクレオチドと会合し得るか、またはポリヌクレオチドと複合体を形成し得る場合がある。一部の実施形態では、追加の異種部分は、ガイドポリヌクレオチドに結合し得る場合がある。一部の実施形態では、追加の異種部分は、ポリペプチドリンカーに結合し得る場合がある。一部の実施形態では、追加の異種部分は、ポリヌクレオチドリンカーに結合し得る場合がある。追加の異種部分は、タンパク質ドメインであり得る。一部の実施形態では、追加の異種部分は、K相同性(KH)ドメイン、MS2コートタンパク質ドメイン、PP7コートタンパク質ドメイン、SfMu Comコートタンパク質ドメイン、ステリルアルファモチーフ、テロメラーゼKu結合モチーフ及びKuタンパク質、テロメラーゼSm7結合モチーフ及びSm7タンパク質、またはRNA認識モチーフであり得る。

一部の実施形態では、塩基エディターは、編集された鎖の塩基除去修復(BER)を阻害する。一部の実施形態では、塩基エディターは、未編集鎖を保護または結合する。一部の実施形態では、塩基エディターは、UGI活性を含む。一部の実施形態では、塩基エディターは、触媒不活性イノシン特異的ヌクレアーゼを含む。一部の実施形態では、塩基エディターは、ニッカーゼ活性を含む。一部の実施形態では、塩基対の意図される編集は、PAM部位の上流にある。一部の実施形態では、塩基対の意図される編集は、PAM部位の1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、または20ヌクレオチド上流にある。一部の実施形態では、塩基対の意図される編集は、PAM部位の下流にある。一部の実施形態では、意図される編集塩基対は、PAM部位の1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、または20ヌクレオチド下流にある。

一部の実施形態では、本方法は、正準(例えば、NGG)PAM部位を必要としない。一部の実施形態では、核酸塩基エディターは、リンカーまたはスペーサーを含む。一部の実施形態では、リンカーまたはスペーサーは、1～25アミノ酸長である。一部の実施形態では、リンカーまたはスペーサーは、5～20アミノ酸長である。一部の実施形態では、リンカーまたはスペーサーは、10、11、12、13、14、15、16、17、18、19、または20アミノ酸長である。

一部の実施形態では、本明細書に提供される塩基編集融合タンパク質は、正確な位置に配置される必要があり、例えば、標的塩基が所定の領域(例えば、「脱アミノ化ウィンドウ」)内に配置される必要がある。一部の実施形態では、標的は、4塩基領域内にあり得る。一部の実施形態では、そのような定義された標的領域は、PAMのおよそ15塩基上流にあり得る。Komor,A.C.,et al.,“Programmable editing of a target base in genomic DNA without double-stranded DNA cleavage”Nature 533,420-424(2016)、Gaudelli,N.M.,et al.,“Programmable base editing of A・T to G・C in genomic DNA without DNA cleavage”Nature 551,464-471(2017)及びKomor,A.C.,et al.,“Improved base excision repair inhibition and bacteriophage Mu Gam protein yields C:G-to-T:A base editors with higher efficiency and product purity”Science Advances 3:eaao4774(2017)を参照されたく、それらの内容全体は、参照により本明細書に援用される。

一部の実施形態では、標的領域は、標的ウィンドウを含み、標的ウィンドウは標的核酸塩基対を含む。一部の実施形態では、標的ウィンドウは、1～10ヌクレオチドを含む。一部の実施形態では、標的ウィンドウは、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、または20ヌクレオチド長である。一部の実施形態では、塩基対の意図される編集は、標的ウィンドウ内にある。一部の実施形態では、標的ウィンドウは、塩基対の意図された編集を含む。一部の実施形態では、本方法は、本明細書に提供される塩基エディターのいずれかを使用して実施される。一部の実施形態では、標的ウィンドウは、脱アミノ化ウィンドウである。脱アミノ化ウィンドウは、塩基エディターが標的ヌクレオチドに作用し、脱アミノ化する所定の領域であり得る。一部の実施形態では、脱アミノ化ウィンドウは、2、3、4、5、6、7、8、9、または10塩基領域内にある。一部の実施形態では、脱アミノ化ウィンドウは、PAMの5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、または25塩基上流にある。

本開示の塩基エディターは、標的ポリヌクレオチド配列の編集を容易にする任意のドメイン、特徴、またはアミノ酸配列を含むことができる。例えば、一部の実施形態では、塩基エディターは、核局在化配列(NLS)を含む。一部の実施形態では、塩基エディターのNLSは、デアミナーゼドメインとポリヌクレオチドプログラマブルヌクレオチド結合ドメインとの間に局在する。一部の実施形態では、塩基エディターのNLSは、ポリヌクレオチドプログラマブルヌクレオチド結合ドメインのC末端に局在する。

本明細書に開示される塩基エディターに存在し得る他の例示的な特徴は、細胞質局在化配列、輸送配列(例えば、核外輸送配列)、または他の局在化配列、ならびに融合タンパク質の可溶化、精製、または検出に有用な配列タグなどの局在化配列である。本明細書に提供される好適なタンパク質タグとしては、これらに限定されないが、ビオチンカルボキシラーゼキャリアタンパク質(BCCP)タグ、mycタグ、カルモジュリンタグ、FLAGタグ、ヘマグルチニン(HA)タグ、ヒスチジンタグまたはHisタグとも呼ばれるポリヒスチジンタグ、マルトース結合タンパク質(MBP)タグ、nusタグ、グルタチオン-S-トランスフェラーゼ(GST)タグ、緑色蛍光タンパク質(GFP)タグ、チオレドキシンタグ、Sタグ、ソフトタグ(例えば、ソフトタグ1、ソフトタグ3)、ストレプタグ、ビオチンリガーゼタグ、FlAsHタグ、V5タグ、及びSBPタグが挙げられる。更なる好適な配列は、当業者には明らかであろう。一部の実施形態では、融合タンパク質は、1つ以上のHisタグを含む。

一部の実施形態では、非限定的な例示的なシチジン塩基エディター(CBE)は、BE1(APOBEC1-XTEN-dCas9)、BE2(APOBEC1-XTEN-dCas9-UGI)、BE3(APOBEC1-XTEN-dCas9(A840H)-UGI)、BE3-Gam、saBE3、saBE4-Gam、BE4、BE4-Gam、saBE4、またはsaB4E-Gamを含む。BE4は、32アミノ酸のAPOBEC1-Cas9n(D10A)リンカー及び9アミノ酸のCas9n-UGIリンカーが延び、UGIの第2のコピーが、別の9アミノ酸のリンカーとともに、構築物のC末端に付加されて、単一の塩基エディター構築物になる。塩基エディターであるsaBE3及びsaBE4は、より小さいS.aureus Cas9n(D10A)で置き換えられたS.pyogenes Cas9n(D10A)を有する。BE3-Gam、saBE3-Gam、BE4-Gam、及びsaBE4-Gamは、16アミノ酸XTENリンカーを介して、BE3、saBE3、BE4、及びsaBE4のN末端に融合された174残基のGamタンパク質を有する。

一部の実施形態では、アデノシン塩基エディター(ABE)は、DNAのアデニンを脱アミノ化することができる。一部の実施形態では、ABEは、BE3のAPOBEC1成分を、天然または操作されたE.coli TadA、ヒトADAR2、マウスADA、またはヒトADAT2で置き換えることによって生成される。一部の実施形態では、ABEは、進化したTadAバリアントを含む。一部の実施形態では、ABEは、ABE1.2(TadA*-XTEN-nCas9-NLS)である。一部の実施形態では、TadA*は、A106V及びD108N変異を含む。

一部の実施形態では、ABEは、第2世代のABEである。一部の実施形態では、ABEは、ABE2.1であり、TadA*(TadA*2.1)における追加の変異D147Y及びE155Vを含む。一部の実施形態では、ABEは、ABE2.2であり、触媒不活性化バージョンのヒトアルキルアデニンDNAグリコシラーゼ(E125Q変異を有するAAG)に融合されたABE2.1である。一部の実施形態では、ABEは、ABE2.3であり、触媒不活性化(D35A変異による不活性化)バージョンのE.coli EndoVに融合された、ABE2.1である。一部の実施形態では、ABEは、ABE2.6であり、ABE2.6は、ABE2.1におけるリンカーの2倍の長さ(32個のアミノ酸、(SGGS)2(配列番号330)-XTEN-(SGGS)2(配列番号330))のリンカーを有する。一部の実施形態では、ABEは、ABE2.7であり、追加の野生型TadA単量体で繋がれたABE2.1である。一部の実施形態では、ABEは、ABE2.8であり、追加のTadA*2.1単量体で繋がれたABE2.1である。一部の実施形態では、ABEは、ABE2.9であり、進化したTadA(TadA*2.1)のABE2.1のN末端への直接融合物である。一部の実施形態では、ABEは、ABE2.10であり、野生型TadAのABE2.1のN末端への直接融合物である。一部の実施形態では、ABEは、ABE2.11であり、TadA*単量体のN末端に不活性化E59A変異を有するABE2.9である。一部の実施形態では、ABEは、ABE2.12であり、TadA*単量体の内部に不活性化E59A変異を有するABE2.9である。

一部の実施形態では、ABEは、第3世代のABEである。一部の実施形態では、ABEは、ABE3.1であり、3つの追加のTadA変異(L84F、H123Y、及びI156F)を有するABE2.3である。

一部の実施形態では、ABEは、第4世代のABEである。一部の実施形態では、ABEは、ABE4.3であり、追加のTadA変異A142N(TadA*4.3)を有するABE3.1である。

一部の実施形態では、ABEは、第5世代のABEである。一部の実施形態では、ABEは、ABE5.1であり、生存クローンからのコンセンサスセットの変異(H36L、R51L、S146C、及びK157N)をABE3.1に移入することによって生成される。一部の実施形態では、ABEは、ABE5.3であり、進化したTadA*の内部に融合された野生型E.coli TadAを含有するヘテロ二量体構築物を有する。一部の実施形態では、ABEは、ABE5.2、ABE5.4、ABE5.5、ABE5.6、ABE5.7、ABE5.8、ABE5.9、ABE5.10、ABE5.11、ABE5.12、ABE5.13、またはABE5.14であり、以下の表11に示される。一部の実施形態では、ABEは、第6世代のABEである。一部の実施形態では、ABEは、ABE6.1、ABE6.2、ABE6.3、ABE6.4、ABE6.5、またはABE6.6であり、以下の表11に示される。一部の実施形態では、ABEは、第7世代のABEである。一部の実施形態では、ABEは、ABE7.1、ABE7.2、ABE7.3、ABE7.4、ABE7.5、ABE7.6、ABE7.7、ABE7.8、ABE7.9、またはABE7.10であり、以下の表11に示される。

一部の実施形態では、塩基エディターは、第8世代のABE(ABE8)である。一部の実施形態では、ABE8は、TadA*8バリアントを含有する。一部の実施形態では、ABE8は、TadA*8バリアントを含有する単量体構築物(「ABE8.x-m」)を有する。一部の実施形態では、ABE8は、ABE8.1-mであり、Y147T変異を有するTadA*7.10(TadA*8.1)を含有する単量体構築物を有する。一部の実施形態では、ABE8は、ABE8.2-mであり、Y147R変異を有するTadA*7.10(TadA*8.2)を含有する単量体構築物を有する。一部の実施形態では、ABE8は、ABE8.3-mであり、Q154S変異を有するTadA*7.10(TadA*8.3)を含有する単量体構築物を有する。一部の実施形態では、ABE8は、ABE8.4-mであり、Y123H変異を有するTadA*7.10(TadA*8.4)を含有する単量体構築物を有する。一部の実施形態では、ABE8は、ABE8.5-mであり、V82S変異を有するTadA*7.10(TadA*8.5)を含有する単量体構築物を有する。一部の実施形態では、ABE8は、ABE8.6-mであり、T166R変異を有するTadA*7.10(TadA*8.6)を含有する単量体構築物を有する。一部の実施形態では、ABE8は、ABE8.7-mであり、Q154R変異を有するTadA*7.10(TadA*8.7)を含有する単量体構築物を有する。一部の実施形態では、ABE8は、ABE8.8-mであり、Y147R、Q154R、及びY123H変異を有するTadA*7.10(TadA*8.8)を含有する単量体構築物を有する。一部の実施形態では、ABE8は、ABE8.9-mであり、Y147R、Q154R、及びI76Y変異を有するTadA*7.10(TadA*8.9)を含有する単量体構築物を有する。一部の実施形態では、ABE8は、ABE8.10-mであり、Y147R、Q154R、及びT166R変異を有するTadA*7.10(TadA*8.10)を含有する単量体構築物を有する。一部の実施形態では、ABE8は、ABE8.11-mであり、Y147T及びQ154R変異を有するTadA*7.10(TadA*8.11)を含有する単量体構築物を有する。一部の実施形態では、ABE8は、ABE8.12-mであり、Y147T及びQ154S変異を有するTadA*7.10(TadA*8.12)を含有する単量体構築物を有する。

一部の実施形態では、ABE8は、ABE8.13-mであり、Y123H(H123Yから復帰したY123H)、Y147R、Q154R、及びI76Y変異を有するTadA*7.10(TadA*8.13)を含有する単量体構築物を有する。一部の実施形態では、ABE8は、ABE8.14-mであり、I76Y及びV82S変異を有するTadA*7.10(TadA*8.14)を含有する単量体構築物を有する。一部の実施形態では、ABE8は、ABE8.15-mであり、V82S及びY147R変異を有するTadA*7.10(TadA*8.15)を含有する単量体構築物を有する。一部の実施形態では、ABE8は、ABE8.16-mであり、V82S、Y123H(H123Yから復帰したY123H)、及びY147R変異を有するTadA*7.10(TadA*8.16)を含有する単量体構築物を有する。一部の実施形態では、ABE8は、ABE8.17-mであり、V82S及びQ154R変異を有するTadA*7.10(TadA*8.17)を含有する単量体構築物を有する。一部の実施形態では、ABE8は、ABE8.18-mであり、V82S、Y123H(H123Yから復帰したY123H)、及びQ154R変異を有するTadA*7.10(TadA*8.18)を含有する単量体構築物を有する。一部の実施形態では、ABE8は、ABE8.19-mであり、V82S、Y123H(H123Yから復帰したY123H)、Y147R、及びQ154R変異を有するTadA*7.10(TadA*8.19)を含有する単量体構築物を有する。一部の実施形態では、ABE8は、ABE8.20-mであり、I76Y、V82S、Y123H(H123Yから復帰したY123H)、Y147R、及びQ154R変異を有するTadA*7.10(TadA*8.20)を含有する単量体構築物を有する。一部の実施形態では、ABE8は、ABE8.21-mであり、Y147R及びQ154S変異を有するTadA*7.10(TadA*8.21)を含有する単量体構築物を有する。一部の実施形態では、ABE8は、ABE8.22-mであり、V82S及びQ154S変異を有するTadA*7.10(TadA*8.22)を含有する単量体構築物を有する。一部の実施形態では、ABE8は、ABE8.23-mであり、V82S及びY123H(H123Yから復帰したY123H)変異を有するTadA*7.10(TadA*8.23)を含有する単量体構築物を有する。一部の実施形態では、ABE8は、ABE8.24-mであり、V82S、Y123H(H123Yから復帰したY123H)、及びY147T変異を有するTadA*7.10(TadA*8.24)を含有する単量体構築物を有する。

一部の実施形態では、ABE8は、TadA*8バリアントに融合された野生型E.coli TadAを含有するヘテロ二量体構築物(「ABE8.x-d」)を有する。一部の実施形態では、ABE8は、ABE8.1-dであり、Y147T変異を有するTadA*7.10(TadA*8.1)に融合された野生型E.coli TadAを含有するヘテロ二量体構築物を有する。一部の実施形態では、ABE8は、ABE8.2-dであり、Y147R変異を有するTadA*7.10(TadA*8.2)に融合された野生型E.coli TadAを含有するヘテロ二量体構築物を有する。一部の実施形態では、ABE8は、ABE8.3-dであり、Q154S変異を有するTadA*7.10(TadA*8.3)に融合された野生型E.coli TadAを含有するヘテロ二量体構築物を有する。一部の実施形態では、ABE8は、ABE8.4-dであり、Y123H変異を有するTadA*7.10(TadA*8.4)に融合された野生型E.coli TadAを含有するヘテロ二量体構築物を有する。一部の実施形態では、ABE8は、ABE8.5-dであり、V82S変異を有するTadA*7.10(TadA*8.5)に融合された野生型E.coli TadAを含有するヘテロ二量体構築物を有する。一部の実施形態では、ABE8は、ABE8.6-dであり、T166R変異を有するTadA*7.10(TadA*8.6)に融合された野生型E.coli TadAを含有するヘテロ二量体構築物を有する。一部の実施形態では、ABE8は、ABE8.7-dであり、Q154R変異を有するTadA*7.10(TadA*8.7)に融合された野生型E.coli TadAを含有するヘテロ二量体構築物を有する。一部の実施形態では、ABE8は、ABE8.8-dであり、Y147R、Q154R、及びY123H変異を有するTadA*7.10(TadA*8.8)に融合された野生型E.coli TadAを含有するヘテロ二量体構築物を有する。一部の実施形態では、ABE8は、ABE8.9-dであり、Y147R、Q154R、及びI76Y変異を有するTadA*7.10(TadA*8.9)に融合された野生型E.coli TadAを含有するヘテロ二量体構築物を有する。一部の実施形態では、ABE8は、ABE8.10-dであり、Y147R、Q154R、及びT166R変異を有するTadA*7.10(TadA*8.10)に融合された野生型E.coli TadAを含有するヘテロ二量体構築物を有する。一部の実施形態では、ABE8は、ABE8.11-dであり、Y147T及びQ154R変異を有するTadA*7.10(TadA*8.11)に融合された野生型E.coli TadAを含有するヘテロ二量体構築物を有する。一部の実施形態では、ABE8は、ABE8.12-dであり、Y147T及びQ154S変異を有するTadA*7.10(TadA*8.12)に融合された野生型E.coli TadAを含有するヘテロ二量体構築物を有する。一部の実施形態では、ABE8は、ABE8.13-dであり、Y123H(H123Yから復帰したY123H)、Y147R、Q154R、及びI76Y変異を有するTadA*7.10(TadA*8.13)に融合された野生型E.coli TadAを含有するヘテロ二量体構築物を有する。一部の実施形態では、ABE8は、ABE8.14-dであり、I76Y及びV82S変異を有するTadA*7.10(TadA*8.14)に融合された野生型E.coli TadAを含有するヘテロ二量体構築物を有する。一部の実施形態では、ABE8は、ABE8.15-dであり、V82S及びY147R変異を有するTadA*7.10(TadA*8.15)に融合された野生型E.coli TadAを含有するヘテロ二量体構築物を有する。一部の実施形態では、ABE8は、ABE8.16-dであり、V82S、Y123H(H123Yから復帰したY123H)、及びY147R変異を有するTadA*7.10(TadA*8.16)に融合された野生型E.coli TadAを含有するヘテロ二量体構築物を有する。一部の実施形態では、ABE8は、ABE8.17-dであり、V82S及びQ154R変異を有するTadA*7.10(TadA*8.17)に融合された野生型E.coli TadAを含有するヘテロ二量体構築物を有する。一部の実施形態では、ABE8は、ABE8.18-dであり、V82S、Y123H(H123Yから復帰したY123H)、及びQ154R変異を有するTadA*7.10(TadA*8.18)に融合された野生型E.coli TadAを含有するヘテロ二量体構築物を有する。一部の実施形態では、ABE8は、ABE8.19-dであり、V82S、Y123H(H123Yから復帰したY123H)、Y147R、及びQ154R変異を有するTadA*7.10(TadA*8.19)に融合された野生型E.coli TadAを含有するヘテロ二量体構築物を有する。一部の実施形態では、ABE8は、ABE8.20-dであり、I76Y、V82S、Y123H(H123Yから復帰したY123H)、Y147R、及びQ154R変異を有するTadA*7.10(TadA*8.20)に融合された野生型E.coli TadAを含有するヘテロ二量体構築物を有する。一部の実施形態では、ABE8は、ABE8.21-dであり、Y147R及びQ154S変異を有するTadA*7.10(TadA*8.21)に融合された野生型E.coli TadAを含有するヘテロ二量体構築物を有する。一部の実施形態では、ABE8は、ABE8.22-dであり、V82S及びQ154S変異を有するTadA*7.10(TadA*8.22)に融合された野生型E.coli TadAを含有するヘテロ二量体構築物を有する。一部の実施形態では、ABE8は、ABE8.23-dであり、V82S及びY123H(H123Yから復帰したY123H)変異を有するTadA*7.10(TadA*8.23)に融合された野生型E.coli TadAを含有するヘテロ二量体構築物を有する。一部の実施形態では、ABE8は、ABE8.24-dであり、V82S、Y123H(H123Yから復帰したY123H)、及びY147T変異を有するTadA*7.10(TadA*8.24)に融合された野生型E.coli TadAを含有するヘテロ二量体構築物を有する。

一部の実施形態では、ABE8は、TadA*8バリアントに融合されたTadA*7.10を含有するヘテロ二量体構築物(「ABE8.x-7」)を有する。一部の実施形態では、ABE8は、ABE8.1-7であり、Y147T変異を有するTadA*7.10(TadA*8.1)に融合されたTadA*7.10を含有するヘテロ二量体構築物を有する。一部の実施形態では、ABE8は、ABE8.2-7であり、Y147R変異を有するTadA*7.10(TadA*8.2)に融合されたTadA*7.10を含有するヘテロ二量体構築物を有する。一部の実施形態では、ABE8は、ABE8.3-7であり、Q154S変異を有するTadA*7.10(TadA*8.3)に融合されたTadA*7.10を含有するヘテロ二量体構築物を有する。一部の実施形態では、ABE8は、ABE8.4-7であり、Y123H変異を有するTadA*7.10に融合されたTadA*7.10(TadA*8.4)を含有するヘテロ二量体構築物を有する。一部の実施形態では、ABE8は、ABE8.5-7であり、V82S変異を有するTadA*7.10(TadA*8.5)に融合されたTadA*7.10を含有するヘテロ二量体構築物を有する。一部の実施形態では、ABE8は、ABE8.6-7であり、T166R変異を有するTadA*7.10(TadA*8.6)に融合されたTadA*7.10を含有するヘテロ二量体構築物を有する。一部の実施形態では、ABE8は、ABE8.7-7であり、Q154R変異を有するTadA*7.10(TadA*8.7)に融合されたTadA*7.10を含有するヘテロ二量体構築物を有する。一部の実施形態では、ABE8は、ABE8.8-7であり、Y147R、Q154R、及びY123H変異を有するTadA*7.10(TadA*8.8)に融合されたTadA*7.10を含有するヘテロ二量体構築物を有する。一部の実施形態では、ABE8は、ABE8.9-7であり、Y147R、Q154R、及びI76Y変異を有するTadA*7.10(TadA*8.9)に融合されたTadA*7.10を含有するヘテロ二量体構築物を有する。一部の実施形態では、ABE8は、ABE8.10-7であり、Y147R、Q154R、及びT166R変異を有するTadA*7.10(TadA*8.10)に融合されたTadA*7.10を含有するヘテロ二量体構築物を有する。一部の実施形態では、ABE8は、ABE8.11-7であり、Y147T及びQ154R変異を有するTadA*7.10(TadA*8.11)に融合されたTadA*7.10を含有するヘテロ二量体構築物を有する。一部の実施形態では、ABE8は、ABE8.12-7であり、Y147T及びQ154S変異を有するTadA*7.10(TadA*8.12)に融合されたTadA*7.10を含有するヘテロ二量体構築物を有する。一部の実施形態では、ABE8は、ABE8.13-7であり、Y123H(H123Yから復帰したY123H)、Y147R、Q154R、及びI76Y変異を有するTadA*7.10(TadA*8.13)に融合されたTadA*7.10を含有するヘテロ二量体構築物を有する。一部の実施形態では、ABE8は、ABE8.14-7であり、I76Y、及びV82S変異を有するTadA*7.10(TadA*8.14)に融合されたTadA*7.10を含有するヘテロ二量体構築物を有する。一部の実施形態では、ABE8は、ABE8.15-7であり、V82S、及びY147R変異を有するTadA*7.10(TadA*8.15)に融合されたTadA*7.10を含有するヘテロ二量体構築物を有する。一部の実施形態では、ABE8は、ABE8.16-7であり、V82S、Y123H(H123Yから復帰したY123H)、及びY147R変異を有するTadA*7.10(TadA*8.16)に融合されたTadA*7.10を含有するヘテロ二量体構築物を有する。一部の実施形態では、ABE8は、ABE8.17-7であり、V82S及びQ154R変異を有するTadA*7.10(TadA*8.17)に融合されたTadA*7.10を含有するヘテロ二量体構築物を有する。一部の実施形態では、ABE8は、ABE8.18-7であり、V82S、Y123H(H123Yから復帰したY123H)、及びQ154R変異を有するTadA*7.10(TadA*8.18)に融合されたTadA*7.10を含有するヘテロ二量体構築物を有する。一部の実施形態では、ABE8は、ABE8.19-7であり、V82S、Y123H(H123Yから復帰したY123H)、Y147R、及びQ154R変異を有するTadA*7.10(TadA*8.19)に融合されたTadA*7.10を含有するヘテロ二量体構築物を有する。一部の実施形態では、ABE8は、ABE8.20-7であり、I76Y、V82S、Y123H(H123Yから復帰したY123H)、Y147R、及びQ154R変異を有するTadA*7.10(TadA*8.20)に融合されたTadA*7.10を含有するヘテロ二量体構築物を有する。一部の実施形態では、ABE8は、ABE8.21-7であり、Y147R及びQ154S変異を有するTadA*7.10(TadA*8.21)に融合されたTadA*7.10を含有するヘテロ二量体構築物を有する。一部の実施形態では、ABE8は、ABE8.22-7であり、V82S及びQ154S変異を有するTadA*7.10(TadA*8.22)に融合されたTadA*7.10を含有するヘテロ二量体構築物を有する。一部の実施形態では、ABE8は、ABE8.23-7であり、V82S及びY123H(H123Yから復帰したY123H)変異を有するTadA*7.10(TadA*8.23)に融合されたTadA*7.10を含有するヘテロ二量体構築物を有する。一部の実施形態では、ABE8は、ABE8.24-7であり、V82S、Y123H(H123Yから復帰したY123H)、及びY147T変異を有するTadA*7.10(TadA*8.24)に融合されたTadA*7.10を含有するヘテロ二量体構築物を有する。

一部の実施形態では、ABEは、ABE8.1-m、ABE8.2-m、ABE8.3-m、ABE8.4-m、ABE8.5-m、ABE8.6-m、ABE8.7-m、ABE8.8-m、ABE8.9-m、ABE8.10-m、ABE8.11-m、ABE8.12-m、ABE8.13-m、ABE8.14-m、ABE8.15-m、ABE8.16-m、ABE8.17-m、ABE8.18-m、ABE8.19-m、ABE8.20-m、ABE8.21-m、ABE8.22-m、ABE8.23-m、ABE8.24-m、ABE8.1-d、ABE8.2-d、ABE8.3-d、ABE8.4-d、ABE8.5-d、ABE8.6-d、ABE8.7-d、ABE8.8-d、ABE8.9-d、ABE8.10-d、ABE8.11-d、ABE8.12-d、ABE8.13-d、ABE8.14-d、ABE8.15-d、ABE8.16-d、ABE8.17-d、ABE8.18-d、ABE8.19-d、ABE8.20-d、ABE8.21-d、ABE8.22-d、ABE8.23-d、またはABE8.24-dであり、以下の表12に示されている。

一部の実施形態では、ABE8は、ABE8a-mであり、R26C、A109S、T111R、D119N、H122N、Y147D、F149Y、T166I、及びD167N変異を有するTadA*7.10(TadA*8a)を含有する単量体構築物を有する。一部の実施形態では、ABE8は、ABE8b-mであり、V88A、A109S、T111R、D119N、H122N、F149Y、T166I、及びD167N変異を有するTadA*7.10(TadA*8b)を含有する単量体構築物を有する。一部の実施形態では、ABE8は、ABE8c-mであり、R26C、A109S、T111R、D119N、H122N、F149Y、T166I、及びD167N変異を有するTadA*7.10(TadA*8c)を含有する単量体構築物を有する。一部の実施形態では、ABE8は、ABE8d-mであり、V88A、T111R、D119N、及びF149Y変異を有するTadA*7.10(TadA*8d)を含有する単量体構築物を有する。一部の実施形態では、ABE8は、ABE8e-mであり、A109S、T111R、D119N、H122N、Y147D、F149Y、T166I、及びD167N変異を有するTadA*7.10(TadA*8e)を含有する単量体構築物を有する。

一部の実施形態では、ABE8は、ABE8a-dであり、R26C、A109S、T111R、D119、H122N、Y147D、F149Y、T166I、及びD167N変異を有するTadA*7.10(TadA*8a)に融合された野生型E.coli TadAを含有するヘテロ二量体構築物を有する。一部の実施形態では、ABE8は、ABE8b-dであり、V88A、A109S、T111R、D119N、H122N、F149Y、T166I、及びD167Nの変異を有するTadA*7.10(TadA*8b)に融合された野生型E.coli TadAを含有するヘテロ二量体構築物を有する。一部の実施形態では、ABE8は、ABE8c-dであり、R26C、A109S、T111R、D119N、H122N、F149Y、T166I、及びD167N変異を有するTadA*7.10(TadA*8c)に融合された野生型E.coli TadAを含有するヘテロ二量体構築物を有する。一部の実施形態では、ABE8は、ABE8d-dであり、V88A、T111R、D119N、及びF149Y変異を有するTadA*7.10(TadA*8d)に融合された野生型E.coli TadAを含有するヘテロ二量体構築物を有する。一部の実施形態では、ABE8は、ABE8e-dであり、A109S、T111R、D119N、H122N、Y147D、F149Y、T166I、及びD167N変異を有するTadA*7.10(TadA*8e)に融合された野生型E.coli TadAを含有するヘテロ二量体構築物を有する。

一部の実施形態では、ABE8は、ABE8a-7であり、R26C、A109S、T111R、D119、H122N、Y147D、F149Y、T166I、及びD167N変異を有するTadA*7.10(TadA*8a)に融合されたTadA*7.10を含有するヘテロ二量体構築物を有する。一部の実施形態では、ABE8は、ABE8b-7であり、V88A、A109S、T111R、D119N、H122N、F149Y、T166I、及びD167N変異を有するTadA*7.10(TadA*8b)に融合されたTadA*7.10を含有するヘテロ二量体構築物を有する。一部の実施形態では、ABE8は、ABE8c-7であり、R26C、A109S、T111R、D119N、H122N、F149Y、T166I、及びD167N変異を有するTadA*7.10(TadA*8c)に融合されたTadA*7.10を含有するヘテロ二量体構築物を有する。一部の実施形態では、ABE8は、ABE8d-7であり、V88A、T111R、D119N、及びF149Y変異を有するTadA*7.10(TadA*8d)に融合されたTadA*7.10を含有するヘテロ二量体構築物を有する。一部の実施形態では、ABE8は、ABE8e-7であり、A109S、T111R、D119N、H122N、Y147D、F149Y、T166I、及びD167N変異を有するTadA*7.10(TadA*8e)に融合されたTadA*7.10を含有するヘテロ二量体構築物を有する。

一部の実施形態では、ABEは、ABE8a-m、ABE8b-m、ABE8c-m、ABE8d-m、ABE8e-m、ABE8a-d、ABE8b-d、ABE8c-d、ABE8d-d、またはABE8e-dであり、以下の表13に示される。一部の実施形態では、ABEは、ABE8e-mまたはABE8e-dである。ABE8eは、SpCas9以外のCas相同体(例えば、SaCas9、SaCas9-KKH、Cas12a相同体(例えば、LbCas12a、enAs-Cas12a)、SpCas9-NG、及び円順列変異体CP1028-SpCas9及びCP1041-SpCas9)とともに使用した場合、効率的なアデニン塩基編集活性及び低いインデル形成を示す。表13に示されるABE8eの変異に加えて、TadAドメインにV106W置換を導入することによって、オフターゲットのRNA編集及びDNA編集が低減された(M.Richter et al.,2020,Nature Biotechnology,doi.org/10.1038/s41587-020-0453-zに記載されている。その内容全体が、参照により本明細書に援用される)。

一部の実施形態では、塩基エディター(例えば、ABE8)は、アデノシンデアミナーゼのバリアント(例えば、TadA*8)を、円順列変異体Cas9(例えば、CP5またはCP6)及び二部核局在化配列を含む足場内にクローニングすることによって生成される。一部の実施形態では、塩基エディター(例えば、ABE7.9、ABE7.10、またはABE8)は、NGC PAM CP5バリアント(S.pyogenes Cas9またはspVRQR Cas9)である。一部の実施形態では、塩基エディター(例えば、ABE7.9、ABE7.10、またはABE8)は、AGA PAM CP5バリアント(S.pyogenes Cas9またはspVRQR Cas9)である。一部の実施形態では、塩基エディター(例えば、ABE7.9、ABE7.10、またはABE8)は、NGC PAM CP6バリアント(S.pyogenes Cas9またはspVRQR Cas9)である。一部の実施形態では、塩基エディター(例えば、ABE7.9、ABE7.10、またはABE8)は、AGA PAM CP6バリアント(S.pyogenes Cas9またはspVRQR Cas9)である。

一部の実施形態では、ABEは、以下の表14に示される遺伝子型を有する。

以下の表15に示されるように、40個のABE8の遺伝子型が記載されている。進化したE.coli TadA部分のABEの残基位置を示す。ABE7.10変異とは異なる場合に、ABE8の変異変化が示される。一部の実施形態では、ABEは、以下の表15に示されるABEのうちの1つの遺伝子型を有する。

一部の実施形態では、塩基エディターは、アデノシンデアミナーゼ活性を有する以下の配列またはその断片を含むか、または本質的にそれからなるABE8.1である:
ABE8.1_Y147T_CP5_NGC PAM_単量体

上記の配列において、平文は、アデノシンデアミナーゼ配列を示し、太字の配列は、Cas9に由来する配列を示し、斜体の配列は、リンカー配列を示し、下線の配列は、二分核局在化配列を示す。他のABE8配列を、添付の配列表に示す(配列番号332～354)。

一部の実施形態では、塩基エディターは、第9世代ABE(ABE9)である。一部の実施形態では、ABE9は、TadA*9バリアントを含有する。ABE9塩基エディターは、アデノシンデアミナーゼのバリアントを含み、本明細書に記載されるように、ABE7*10参照配列に対して改変を含むアミノ酸配列を含有する。例示的なABE9バリアントは、表16に列挙される。ABE9塩基エディターの詳細は、国際PCT出願第2020/049975号に記載されている(その全体が、参照により本明細書に援用される)。

一部の実施形態では、塩基エディターは、ウラシルグリコシラーゼ阻害剤(UGI)の全てまたは一部分を含むドメインを含む。一部の実施形態では、塩基エディターは、核酸ポリメラーゼの全部または一部を含むドメインを含む。一部の実施形態では、塩基エディターは、核酸ポリメラーゼ(NAP)の全部または一部をドメインとして含み得る。例えば、塩基エディターは、真核生物のNAPの全部または一部を含み得る。一部の実施形態では、塩基エディターに組み込まれるNAPまたはその一部は、DNAポリメラーゼである。一部の実施形態では、塩基エディターに組み込まれるNAPまたはその一部は、損傷乗り越えポリメラーゼ活性を有する。一部の実施形態では、塩基エディターに組み込まれるNAPまたはその一部は、損傷乗り越えDNAポリメラーゼである。一部の実施形態では、塩基エディターに組み込まれるNAPまたはその一部は、Rev7、Rev1複合体、ポリメラーゼイオタ、ポリメラーゼカッパ、またはポリメラーゼエータである。一部の実施形態では、塩基エディターに組み込まれるNAPまたはその一部は、真核生物ポリメラーゼアルファ、ベータ、ガンマ、デルタ、イプシロン、ガンマ、エータ、イオタ、カッパ、ラムダ、ミュー、またはニュー成分である。一部の実施形態では、塩基エディターに組み込まれるNAPまたはその一部は、核酸ポリメラーゼ(例えば、損傷乗り越えDNAポリメラーゼ)と、少なくとも75%、80%、85%、90%、95%、96%、97%、98%、99%、または99.5%同一であるアミノ酸配列を含む。一部の実施形態では、塩基エディターに組み込まれる核酸ポリメラーゼまたはその一部は、損傷乗り越えDNAポリメラーゼである。

一部の実施形態では、塩基エディターのドメインは、複数のドメインを含むことができる。例えば、Cas9に由来するポリヌクレオチドプログラマブルヌクレオチド結合ドメインを含む塩基エディターは、野生型または天然のCas9のRECローブ及びNUCローブに対応するRECローブ及びNUCローブを含むことができる。別の例では、塩基エディターは、RuvCIドメイン、BHドメイン、REC1ドメイン、REC2ドメイン、RuvCIIドメイン、L1ドメイン、HNHドメイン、L2ドメイン、RuvCIIIドメイン、WEDドメイン、TOPOドメイン、またはCTDドメインのうちの1つ以上を含み得る。一部の実施形態では、塩基エディターの1つ以上のドメインは、ドメインを含むポリペプチドの野生型バージョンに対して変異(例えば、置換、挿入、欠失)を含む。例えば、ポリヌクレオチドプログラマブルDNA結合ドメインのHNHドメインは、H840A置換を含むことができる。別の例では、ポリヌクレオチドプログラマブルDNA結合ドメインのRuvCIドメインは、D10A置換を含むことができる。

本明細書に開示される塩基エディターの異なるドメイン(例えば、隣接ドメイン)は、1つ以上のリンカードメイン(例えば、XTENリンカードメイン)の使用の有無にかかわらず、互いに接続され得る。一部の実施形態では、リンカードメインは、結合(例えば、共有結合)、化学基、または2つの分子もしくは部分(例えば、融合タンパク質の2つのドメイン、例えば、第1のドメイン(例えば、Cas9由来ドメイン)及び第2のドメイン(例えば、アデノシンデアミナーゼドメインもしくはシチジンデアミナーゼドメイン))を連結する分子であり得る。一部の実施形態では、リンカーは、共有結合(例えば、炭素-炭素結合、ジスルフィド結合、炭素-ヘテロ原子結合など)である。特定の実施形態では、リンカーは、アミド結合の炭素-窒素結合である。特定の実施形態では、リンカーは、環式または非環式、置換または非置換、分岐または非分岐の脂肪族または複素脂肪族のリンカーである。特定の実施形態では、リンカーは、ポリマー(例えば、ポリエチレン、ポリエチレングリコール、ポリアミド、ポリエステルなど)である。特定の実施形態では、リンカーは、アミノアルカン酸の単量体、二量体、またはポリマーを含む。一部の実施形態では、リンカーは、アミノアルカン酸(例えば、グリシン、エタン酸、アラニン、ベータ-アラニン、3-アミノプロパン酸、4-アミノブタン酸、5-ペンタン酸など)を含む。一部の実施形態では、リンカーは、アミノヘキサン酸(Ahx)の単量体、二量体、またはポリマーを含む。特定の実施形態では、リンカーは、炭素環式部分(例えば、シクロペンタン、シクロヘキサン)に基づく。他の実施形態では、リンカーは、ポリエチレングリコール部分(PEG)を含む。特定の実施形態では、リンカーは、アリール部分またはヘテロアリール部分を含む。特定の実施形態では、リンカーは、フェニル環に基づく。リンカーは、ペプチドからリンカーへの求核剤(例えば、チオール、アミノ)の結合を促進する官能化部分を含むことができる。任意の求電子剤をリンカーの一部として使用することができる。例示的な求電子剤としては、活性化エステル、活性化アミド、マイケルアクセプター、ハロゲン化アルキル、ハロゲン化アリール、ハロゲン化アシル、及びイソチオシアネートが挙げられるが、これらに限定されない。一部の実施形態では、リンカーは、RNAプログラマブルヌクレアーゼ(Cas9ヌクレアーゼドメインを含む)のgRNA結合ドメインと、核酸編集タンパク質の触媒ドメインとを結合する。一部の実施形態では、リンカーは、dCas9と、第2のドメイン(例えば、UGIなど)とを連結する。

リンカー
特定の実施形態では、リンカーを使用して、本発明のペプチドまたはペプチドドメインのいずれかを結合し得る。リンカーは、共有結合のように単純であってもよく、または数原子の長さの高分子リンカーであってもよい。特定の実施形態では、リンカーは、ポリペプチドであるか、またはアミノ酸に基づく。他の実施形態では、リンカーは、ペプチド様ではない。特定の実施形態では、リンカーは、共有結合(例えば、炭素-炭素結合、ジスルフィド結合、炭素-ヘテロ原子結合など)である。特定の実施形態では、リンカーは、アミド結合の炭素-窒素結合である。特定の実施形態では、リンカーは、環式または非環式、置換または非置換、分岐または非分岐の脂肪族または複素脂肪族のリンカーである。特定の実施形態では、リンカーは、ポリマー(例えば、ポリエチレン、ポリエチレングリコール、ポリアミド、ポリエステルなど)である。特定の実施形態では、リンカーは、アミノアルカン酸の単量体、二量体、またはポリマーを含む。特定の実施形態では、リンカーは、アミノアルカン酸(例えば、グリシン、エタン酸、アラニン、ベータ-アラニン、3-アミノプロパン酸、4-アミノブタン酸、5-ペンタン酸など)を含む。特定の実施形態では、リンカーは、アミノヘキサン酸(Ahx)の単量体、二量体、またはポリマーを含む。特定の実施形態では、リンカーは、炭素環式部分(例えば、シクロペンタン、シクロヘキサン)に基づく。他の実施形態では、リンカーは、ポリエチレングリコール部分(PEG)を含む。他の実施形態では、リンカーは、アミノ酸を含む。特定の実施形態では、リンカーは、ペプチドを含む。特定の実施形態では、リンカーは、アリール部分またはヘテロアリール部分を含む。特定の実施形態では、リンカーは、フェニル環に基づく。リンカーは、ペプチドからリンカーへの求核剤(例えば、チオール、アミノ)の結合を促進する官能化部分を含むことができる。任意の求電子剤をリンカーの一部として使用することができる。例示的な求電子剤としては、活性化エステル、活性化アミド、マイケルアクセプター、ハロゲン化アルキル、ハロゲン化アリール、ハロゲン化アシル、及びイソチオシアネートが挙げられるが、これらに限定されない。

典型的には、リンカーは、2つの基、分子、もしくは他の部分の間に配置されるか、またはそれらに隣接し、共有結合を介して各々に連結され、したがって、両者を連結する。一部の実施形態では、リンカーは、アミノ酸または複数のアミノ酸(例えば、ペプチドまたはタンパク質)である。一部の実施形態では、リンカーは、有機分子、基、ポリマー、または化学部分である。一部の実施形態では、リンカーは、2～100アミノ酸長、例えば、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、30～35、35～40、40～45、45～50、50～60、60～70、70～80、80～90、90～100、100～150、または150～200アミノ酸長である。一部の実施形態では、リンカーは、約3～約104(例えば、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、55、60、65、70、75、80、85、90、95、または100)アミノ酸長である。また、より長いまたはより短いリンカーも企図される。

一部の実施形態では、本明細書に提供される融合タンパク質のいずれかは、リンカーを介して互いに融合されるシチジンデアミナーゼまたはアデノシンデアミナーゼとCas9ドメインとを含む。シチジンまたはアデノシンデアミナーゼとCas9ドメインとの間の様々なリンカー長さ及び柔軟性(例えば、(GGGS)n(配列番号246)、(GGGGS)n(配列番号247)及び(G)nの形態の非常に柔軟なリンカーから、(EAAAK)n(配列番号248)、(SGGS)n(配列番号355)、SGSETPGTSESATPES(配列番号249)(例えば、Guilinger JP,et al.Fusion of catalytically inactive Cas9 to FokI nuclease improves the specificity of genome modification.Nat.Biotechnol.2014;32(6):577-82を参照されたく、内容全体は、参照により本明細書に援用される)及び(XP)nの形態のより剛性なリンカーまでの範囲)が、シチジンまたはアデノシンデアミナーゼ核酸塩基エディターの活性に最適な長さを達成するために用いられ得る。一部の実施形態では、nは、1、2、3、4、5、6、7、8、9、10、11、12、13、14、または15である。一部の実施形態では、リンカーは、(GGS)nモチーフを含み、nは、1、3、または7である。一部の実施形態では、本明細書に提供される融合タンパク質のうちのいずれかのシチジンデアミナーゼまたはアデノシンデアミナーゼとCas9ドメインとは、アミノ酸配列SGSETPGTSESATPES(配列番号249)を含むリンカー(これは、XTENリンカーとも称され得る)を介して融合される。

一部の実施形態では、塩基エディターのドメインは、以下のアミノ酸配列:
SGGSSGSETPGTSESATPESSGGS(配列番号356)、SGGSSGGSSGSETPGTSESATPESSGGSSGGS(配列番号357)、またはGGSGGSPGSPAGSPTSTEEGTSESATPESGPGTSTEPSEGSAPGSPAGSPTSTEEGTSTEPSEGSAPGTSTEPSEGSAPGTSESATPESGPGSEPATSGGSGGS(配列番号358)を含むリンカーを介して融合される。

一部の実施形態では、塩基エディターのドメインは、アミノ酸配列SGSETPGTSESATPES(配列番号249)を含むリンカー(これは、XTENリンカーとも称され得る)を介して融合される。一部の実施形態では、リンカーは、アミノ酸配列SGGSを含む。一部の実施形態では、リンカーは、24アミノ酸長である。一部の実施形態では、リンカーは、アミノ酸配列SGGSSGGSSGSETPGTSESATPES(配列番号359)を含む。一部の実施形態では、リンカーは、40アミノ酸長である。一部の実施形態では、リンカーは、アミノ酸配列:SGGSSGGSSGSETPGTSESATPESSGGSSGGSSGGSSGGS(配列番号360)。一部の実施形態では、リンカーは、64アミノ酸長である。一部の実施形態では、リンカーは、アミノ酸配列:SGGSSGGSSGSETPGTSESATPESSGGSSGGSSGGSSGGSSGSETPGTSESATPESSGGSSGGS(配列番号361)。一部の実施形態では、リンカーは、92アミノ酸長である。一部の実施形態では、リンカーは、アミノ酸配列:PGSPAGSPTSTEEGTSESATPESGPGTSTEPSEGSAPGSPAGSPTSTEEGTSTEPSEGSAPGTSTEPSEGSAPGTSESATPESGPGSEPATS(配列番号362)。

一部の実施形態では、リンカーは、複数のプロリン残基を含み、5～21、5～14、5～9、5～7アミノ酸長であり、例えば、PAPAP(配列番号363)、PAPAPA(配列番号364)、PAPAPAP(配列番号365)、PAPAPAPA(配列番号366)、P(AP)4(配列番号367)、P(AP)7(配列番号368)、P(AP)10(配列番号369)である(例えば、Tan J,Zhang F,Karcher D,Bock R.Engineering of high-precision base editors for site-specific single nucleotide replacement.Nat Commun.2019 Jan 25;10(1):439を参照されたく、内容全体は、参照により本明細書に援用される)。そのようなプロリンに富むリンカーは、「剛性」リンカーとも称される。

別の実施形態では、塩基エディターシステムは、デアミナーゼ(DNAデアミナーゼ、例えば、アデノシンデアミナーゼまたはシチジンデアミナーゼ)と非共有結合的に相互作用し、かつ、特定の編集のために、アデノシンデアミナーゼまたはシチジンデアミナーゼを標的ポリヌクレオチド配列内の標的核酸塩基に一過的に引き付ける成分(タンパク質)を含み、バイスタンダー効果または標的隣接効果が最小化または低減される。デアミナーゼ相互作用タンパク質を伴うそのような非共有結合のシステム及び方法は、DNAデアミナーゼを特定のゲノム標的核酸塩基に引き付ける役割を果たし、オンターゲット及び標的隣接編集の事象を切り離し、したがって、より正確な単一塩基置換変異の達成を強化する。一実施形態では、デアミナーゼ相互作用タンパク質は、デアミナーゼ(例えば、アデノシンデアミナーゼまたはシチジンデアミナーゼ)に結合し、デアミナーゼの活性(触媒)部位が標的核酸塩基(例えば、それぞれ、アデノシンまたはシチジン)に結合するのを遮断または妨害しない。「MagnEdit」と称されるシステムなどは、Cas9とgRNAとの複合体に繋がれた相互作用タンパク質を含み、共発現された(外因性または内因性のいずれかの)アデノシンまたはシチジンデアミナーゼを引き付けて、特定のゲノム標的部位を編集することができ、McCann,J.et al.,2020,“MagnEdit-interacting factors that recruit DNA-editing enzymes to single base targets,”Life-Science-Alliance,Vol.3,No.4(e201900606),(doi 10.26508/Isa.201900606)に記載されており、それらの内容は、それらの全体が参照により本明細書に援用される。一実施形態では、DNAデアミナーゼは、本明細書に記載のアデノシンデアミナーゼのバリアント(例えば、TadA*8)である。

別の実施形態では、「Suntag」と称されるシステムは、非共有結合的に相互作用する構成要素を含み、これらの構成要素は、塩基エディターのタンパク質(例えば、アデノシンデアミナーゼまたはシチジンデアミナーゼ)構成要素またはそれらの複数のコピーを、ポリヌクレオチド標的部位にリクルートして、隣接する標的編集が低減された部位での塩基編集を達成するために使用され、これは、例えば、Tanenbaum,M.E.et al.,“A protein tagging system for signal amplification in gene expression and fluorescence imaging,”Cell.2014 October 23;159(3):635-646.doi:10.1016/j.cell.2014.09.039及びHuang,Y.-H.et al.,2017,“DNA epigenome editing using CRISPR-Cas SunTag-directed DNMT3A,”Genome Biol 18:176.doi:10.1186/s13059-017-1306-zに記載されており、それらの各々の内容は、それらの全体が参照により本明細書に援用される。一実施形態では、DNAデアミナーゼは、本明細書に記載のアデノシンデアミナーゼのバリアント(例えば、TadA*8)である。

ガイドRNAを有する核酸プログラマブルDNA結合タンパク質
細胞内で塩基編集するための組成物及び方法が本明細書で提供される。ガイドポリ核酸配列(例えば、ガイドRNA配列)または本明細書に提供される2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20個、またはそれ以上のガイドRNAの組み合わせを含む組成物が本明細書に更に提供される。一部の実施形態では、本明細書に提供される塩基編集のための組成物は、塩基エディター(例えば、C塩基エディターまたはA塩基エディター)をコードするポリヌクレオチドを更に含む。例えば、塩基編集のための組成物は、BE、BE4、ABE、及び提供される1つ以上のガイドRNAの組み合わせをコードするmRNA配列を含み得る。塩基編集のための組成物は、塩基エディターポリペプチドと、本明細書に提供される任意のガイドRNAのうちの1つ以上の組み合わせとを含み得る。かかる組成物を使用して、異なる送達アプローチ(例えば、エレクトロポレーション、ヌクレオフェクション、ウイルス形質導入、またはトランスフェクション)を介して、細胞で塩基編集を実現してもよい。一部の実施形態では、組成物は、エレクトロポレーションのために、塩基エディターをコードするmRNA配列と、本明細書に提供される1つ以上のガイドRNA配列の組み合わせとを含む。

本開示の一部の態様は、複合体を提供し、本明細書に提供される融合タンパク質のうちのいずれかと、融合タンパク質の核酸プログラマブルDNA結合タンパク質(napDNAbp)ドメイン(例えば、Cas9(例えば、dCas9、ヌクレアーゼ活性Cas9、またはCas9ニッカーゼ)またはCas12)に結合したガイドRNAと、を含む。これらの複合体は、リボ核タンパク質(RNP)とも呼ばれる。一部の実施形態では、ガイド核酸(例えば、ガイドRNA)は、15～100ヌクレオチド長であり、標的配列に相補的な、少なくとも10個の連続したヌクレオチドの配列を含む。一部の実施形態では、ガイドRNAは、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、または50ヌクレオチド長である。一部の実施形態では、ガイドRNAは、標的配列に相補的な15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、または40個の連続したヌクレオチドの配列を含む。一部の実施形態では、標的配列は、DNA配列である。一部の実施形態では、標的配列は、RNA配列である。一部の実施形態では、標的配列は、細菌、酵母、真菌、昆虫、植物、または動物のゲノムの配列である。一部の実施形態では、標的配列は、ヒトのゲノムの配列である。一部の実施形態では、標的配列の3’末端は、正準PAM配列(NGG)に直接隣接する。一部の実施形態では、標的配列の3’末端は、非正準PAM配列(例えば、表7で列挙される配列または5’-NAA-3’)に直接隣接する。一部の実施形態では、ガイド核酸(例えば、ガイドRNA)は、目的の遺伝子(例えば、疾患または障害に関連する遺伝子)の配列に相補的である。

本開示の一部の態様は、本明細書に提供される融合タンパク質または複合体を使用する方法を提供する。例えば、本開示の一部の態様は、DNA分子を、本明細書に提供される融合タンパク質のいずれかと、少なくとも1つのガイドRNAと接触させることを含む方法を提供し、ガイドRNAは、約15～100ヌクレオチド長であり、標的配列に相補的な少なくとも10個の連続したヌクレオチドの配列を含む。一部の実施形態では、標的配列の3’末端は、AGC、GAG、TTT、GTG、またはCAA配列に直接隣接する。一部の実施形態では、標的配列の3’末端は、NGA、NGCG、NGN、NNGRRT、NNNRRT、NGCG、NGCN、NGTN、NGTN、NGTN、または5’(TTTV)配列に直接隣接する。一部の実施形態では、標的配列の3’末端は、例えば、TTN、DTTN、GTTN、ATTN、ATTC、DTTNT、WTTN、HATY、TTTN、TTTV、TTTC、TG、RTR、またはYTN PAM部位に直接隣接している。

それぞれの配列における特定の位置または残基の番号付けは、使用される特定のタンパク質及び番号付けのスキームに依存することが理解されるであろう。番号付けは、例えば、成熟タンパク質の前駆体及び成熟タンパク質自体において異なる場合があり、種ごとの配列の違いは番号付けに影響を及ぼす場合がある。当業者であれば、当該技術分野で周知の方法(例えば、配列アラインメント及び相同残基の決定)によって、任意の相同タンパク質及びそれぞれのコード核酸におけるそれぞれの残基を特定することができるであろう。

本明細書に開示される融合タンパク質のいずれかを標的部位(例えば、編集される変異を含む部位)に標的指向化するために、典型的には、融合タンパク質をガイドRNAとともに共発現させる必要があることは、当業者には明らかであろう。本明細書の他箇所でより詳細に説明されるように、ガイドRNAは、典型的には、napDNAbp(例えば、Cas9またはCas12)結合を可能にするtracrRNAフレームワークと、napDNAbp:核酸編集酵素/ドメイン融合タンパク質に配列特異性を付与するガイド配列と、を含む。代替として、ガイドRNA及びtracrRNAは、2つの核酸分子として別々に提供され得る。一部の実施形態では、ガイドRNAは、構造を含み、ガイド配列は、標的配列に相補的な配列を含む。ガイド配列は、典型的には、20ヌクレオチド長である。特定のゲノム標的部位にnapDNAbp:核酸編集酵素/ドメイン融合タンパク質を標的指向化するための好適なガイドRNAの配列は、本開示に基づいて、当業者には明らかであろう。そのような好適なガイドRNA配列は、典型的には、編集される標的ヌクレオチドの50ヌクレオチド上流または下流以内の核酸配列に相補的なガイド配列を含む。提供される融合タンパク質のいずれかを特定の標的配列に標的指向化するのに好適ないくつかの例示的なガイドRNA配列が本明細書に提供される。

sgRNAの異なる部分は、Cas9(例えば、SpyCas9)及び/またはDNA標的と相互作用する様々な特徴を形成することが予測される。6つの保存されたモジュールが、天然のcrRNA:tracrRNA二重鎖及びCas9エンドヌクレアーゼ活性を指示するシングルガイドRNA(sgRNA)内で特定されている(Briner et al.,Guide RNA Functional Modules Direct Cas9 Activity and Orthogonality Mol Cell.2014 Oct 23;56(2):333-339を参照されたい)。6つのモジュールには、DNA標的化を担うスペーサー、CRISPRリピート:tracrRNA二重鎖によって形成される上部ステム、バルジ、下部ステム、連結部、及びtracrRNAの3’末端からのヘアピンが含まれる。上部ステム及び下部ステムは、主に、リン酸骨格との配列非依存性相互作用を通してCas9と相互作用する。一部の実施形態では、上部ステムは、不要である。一部の実施形態では、下部ステムの基部の保存されたウラシルヌクレオチド配列は、不要である。バルジは、Cas9のRec1ドメインとの特定の側鎖相互作用に関与する。U44の核酸塩基は、Tyr325及びHis328の側鎖と相互作用し、G43は、Tyr329と相互作用する。ネクサスは、sgRNA:Cas9相互作用のコアを形成し、sgRNAと、Cas9及び標的DNAの両方との間の交点にある。A51及びA52の核酸塩基は、Phe1105の側鎖と相互作用し、U56は、Arg457及びAsn459と相互作用し、U59の核酸塩基は、Arg74、Asn77、Pro475、Leu455、Phe446、及びIle448の側鎖によって既定される疎水性ポケットに挿入し、C60は、Leu455、Ala456、及びAsn459と相互作用し、C61は、Arg70の側鎖と相互作用し、次に、C15と相互作用する。一部の実施形態では、これらの変異のうちの1つ以上は、sgRNA:Cas9相互作用を最適化するために、Cas9(例えば、spyCas9)に対するsgRNAのバルジ及び/またはネクサスにおいて作製される。

更に、tracrRNAのネクサス及びヘアピンは、Cas9の対形成にとって重要であり、異なるCas9タンパク質を分離する直交性障壁(orthogonality barrier)を交差するようにスワップ(swap)することができ、これは、直交Cas9(orthogonal Cas9)タンパク質の更なる利用に役立つ。一部の実施形態では、ネクサス及びヘアピンは、直交Cas9タンパク質を標的とするようにスワップされる。一部の実施形態では、sgRNAは、よりコンパクトで、立体構造的に安定なガイドRNAを設計するために、上部ステム、ヘアピン1、及び/または下部ステムの配列柔軟性が省かれる。一部の実施形態では、モジュールは、様々なキメラガイドを有する単一のCas9を使用するか、またはキメラsgRNAの異なる組み合わせを有する直交系を同時に使用することによって、多重編集を最適化するように修飾される。ガイド機能的モジュール及びそれらの方法に関する詳細は、例えば、Briner et al.,Guide RNA Functional Modules Direct Cas9 Activity and Orthogonality Mol Cell.2014 Oct 23;56(2):333-339に記載されており、その内容は、その全体が参照により本明細書に援用される。

本明細書に開示される塩基エディターのドメインは、任意の順序で配置され得る。例えば、ポリヌクレオチドプログラマブルヌクレオチド結合ドメイン(例えば、Cas9またはCas12)及びデアミナーゼドメイン(例えば、シチジンデアミナーゼまたはアデノシンデアミナーゼ)を含む融合タンパク質を含む塩基エディターの非限定的な例としては、以下のように配置することができる:
NH2-[核酸塩基編集ドメイン]-リンカー1-[核酸塩基編集ドメイン]-COOH、
NH2-[デアミナーゼ]-リンカー1-[核酸塩基編集ドメイン]-COOH、
NH2-[デアミナーゼ]-リンカー1-[核酸塩基編集ドメイン]-リンカー2-[UGI]-COOH、
NH2-[デアミナーゼ]-リンカー1-[核酸塩基編集ドメイン]-COOH、
NH2-[アデノシンデアミナーゼ]-リンカー1-[核酸塩基編集ドメイン]-COOH、
NH2-[核酸塩基編集ドメイン]-[デアミナーゼ]-COOH、
NH2-[デアミナーゼ]-[核酸塩基編集ドメイン]-[イノシンBER阻害剤]-COOH、
NH2-[デアミナーゼ]-[イノシンBER阻害剤]-[核酸塩基編集ドメイン]-COOH、
NH2-[イノシンBER阻害剤]-[デアミナーゼ]-[核酸塩基編集ドメイン]-COOH、
NH2-[核酸塩基編集ドメイン]-[デアミナーゼ]-[イノシンBER阻害剤]-COOH、
NH2-[核酸塩基編集ドメイン]-[イノシンBER阻害剤]-[デアミナーゼ]-COOH、
NH2-[イノシンBER阻害剤]-[核酸塩基編集ドメイン]-[デアミナーゼ]-COOH、
NH2-[核酸塩基編集ドメイン]-リンカー1-[デアミナーゼ]-リンカー2-[核酸塩基編集ドメイン]-COOH、
NH2-[核酸塩基編集ドメイン]-リンカー1-[デアミナーゼ]-[核酸塩基編集ドメイン]-COOH、
NH2-[核酸塩基編集ドメイン]-[デアミナーゼ]-リンカー2-[核酸塩基編集ドメイン]-COOH、
NH2-[核酸塩基編集ドメイン]-[デアミナーゼ]-[核酸塩基編集ドメイン]-COOH、
NH2-[核酸塩基編集ドメイン]-リンカー1-[デアミナーゼ]-リンカー2-[核酸塩基編集ドメイン]-[イノシンBER阻害剤]-COOH、
NH2-[核酸塩基編集ドメイン]-リンカー1-[デアミナーゼ]-[核酸塩基編集ドメイン]-[イノシンBER阻害剤]-COOH、
NH2-[核酸塩基編集ドメイン]-[デアミナーゼ]-リンカー2-[核酸塩基編集ドメイン]-[イノシンBER阻害剤]-COOH、
NH2-[核酸塩基編集ドメイン]-[デアミナーゼ]-[核酸塩基編集ドメイン]-[イノシンBER阻害剤]-COOH、
NH2-[イノシンBER阻害剤]-[核酸塩基編集ドメイン]-リンカー1-[デアミナーゼ]-リンカー2-[核酸塩基編集ドメイン]-COOH、
NH2-[イノシンBER阻害剤]-[核酸塩基編集ドメイン]-リンカー1-[デアミナーゼ]-[核酸塩基編集ドメイン]-COOH、
NH2-[イノシンBER阻害剤]-[核酸塩基編集ドメイン]-[デアミナーゼ]-リンカー2-[核酸塩基編集ドメイン]-COOH、または
NH2-[イノシンBER阻害剤]NH2-[核酸塩基編集ドメイン]-[デアミナーゼ]-[核酸塩基編集ドメイン]-COOH。

一部の実施形態では、本明細書に提供される塩基編集融合タンパク質は、正確な位置に配置される必要があり、例えば、標的塩基が所定の領域(例えば、「脱アミノ化ウィンドウ」)内に配置される必要がある。一部の実施形態では、標的は、4塩基領域内にあることができる。一部の実施形態では、そのような定義された標的領域は、PAMのおよそ15塩基上流にあり得る。Komor,A.C.,et al.,“Programmable editing of a target base in genomic DNA without double-stranded DNA cleavage”Nature 533,420-424(2016)、Gaudelli,N.M.,et al.,“Programmable base editing of A・T to G・C in genomic DNA without DNA cleavage”Nature 551,464-471(2017)及びKomor,A.C.,et al.,“Improved base excision repair inhibition and bacteriophage Mu Gam protein yields C:G-to-T:A base editors with higher efficiency and product purity”Science Advances 3:eaao4774(2017)を参照されたく、それらの内容全体は、参照により本明細書に援用される。

定義された標的領域は、脱アミノ化ウィンドウであり得る。脱アミノ化ウィンドウは、塩基エディターが標的ヌクレオチドに作用し、脱アミノ化する所定の領域であり得る。一部の実施形態では、脱アミノ化ウィンドウは、2、3、4、5、6、7、8、9、または10塩基領域内にある。一部の実施形態では、脱アミノ化ウィンドウは、PAMの5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、または25塩基上流にある。

本開示の塩基エディターは、標的ポリヌクレオチド配列の編集を容易にする任意のドメイン、特徴、またはアミノ酸配列を含むことができる。例えば、一部の実施形態では、塩基エディターは、核局在化配列(NLS)を含む。一部の実施形態では、塩基エディターのNLSは、デアミナーゼドメインとnapDNAbpドメインとの間に局在する。一部の実施形態では、塩基エディターのNLSは、napDNAbpドメインに局在するC末端である。

融合タンパク質内に含まれ得るタンパク質ドメインの非限定的な例としては、デアミナーゼドメイン(例えば、アデノシンデアミナーゼまたはシチジンデアミナーゼ)、ウラシルグリコシラーゼ阻害剤(UGI)ドメイン、エピトープタグ、レポーター遺伝子配列及び/または本明細書に記載される活性のうちの1つ以上を有するタンパク質ドメインが挙げられる。

ドメインは、エピトープタグ、レポータータンパク質、及び他の結合ドメインで検出または標識され得る。エピトープタグの非限定的な例としては、ヒスチジン(His)タグ、V5タグ、FLAGタグ、インフルエンザヘマグルチニン(HA)タグ、Mycタグ、VSV-Gタグ、及びチオレドキシン(Trx)タグが挙げられる。レポーター遺伝子の例としては、これらに限定されないが、グルタチオン-5-トランスフェラーゼ(GST)、セイヨウワサビペルオキシダーゼ(HRP)、クロラムフェニコールアセチルトランスフェラーゼ(CAT)、ベータ-ガラクトシダーゼ、ベータ-グルクロニダーゼ、ルシフェラーゼ、緑色蛍光タンパク質(GFP)、HcRed、DsRed、シアン蛍光タンパク質(CFP)、黄色蛍光タンパク質(YFP)、及び青色蛍光タンパク質(BFP)を含む自家蛍光タンパク質が挙げられる。追加のタンパク質配列としては、DNA分子に結合するアミノ酸配列、または他の細胞分子に結合するアミノ酸配列を挙げることができ、これらに限定されないが、マルトース結合タンパク質(MBP)、Sタグ、Lex A DNA結合ドメイン(DBD)融合物、GAL4 DNA結合ドメイン融合物、及び単純ヘルペスウイルス(HSV)BP16タンパク質融合物が含まれる。

シチジンまたはアデノシンデアミナーゼと、Cas9ドメインとを含む融合タンパク質を使用する方法
本開示の一部の態様は、本明細書に提供される融合タンパク質または複合体を使用する方法を提供する。例えば、本開示の一部の態様は、DNA分子を、本明細書で提供される融合タンパク質のうちのいずれかと接触させ、本明細書に記載される少なくとも1つのガイドRNAと接触させることを含む方法を提供する。

一部の実施形態では、本発明の融合タンパク質は、目的の標的遺伝子を編集するために使用される。特に、本明細書に記載のシチジンデアミナーゼまたはアデノシンデアミナーゼ核酸塩基エディターは、標的配列内で複数の変異を作製することができる。これらの変異は、標的の機能に影響を及ぼし得る。例えば、シチジンデアミナーゼまたはアデノシンデアミナーゼの核酸塩基エディターを使用して調節領域を標的化すると、調節領域の機能が改変し、下流タンパク質の発現が低減または排除される。

本明細書に開示されるCas9ドメインとシチジンデアミナーゼまたはアデノシンデアミナーゼとを含む融合タンパク質のいずれかを標的部位(例えば、編集される変異を含む部位)に標的指向化するために、典型的には、融合タンパク質をガイドRNA(例えば、sgRNA)と共発現させる必要があることは、当業者には明らかであろう。本明細書の他箇所でより詳細に説明されるように、ガイドRNAは、典型的には、Cas9結合を可能にするtracrRNAフレームワークと、Cas9:核酸編集酵素/ドメイン融合タンパク質に配列特異性を付与するガイド配列と、を含む。代替として、ガイドRNA及びtracrRNAは、2つの核酸分子として別々に提供され得る。一部の実施形態では、ガイドRNAは、構造を含み、ガイド配列は、標的配列に相補的な配列を含む。ガイド配列は、典型的には、20ヌクレオチド長である。Cas9:核酸編集酵素/ドメイン融合タンパク質を特定のゲノム標的部位に標的指向化するための好適なガイドRNAの配列は、本開示に基づいて、当業者には明らかであろう。そのような好適なガイドRNA配列は、典型的には、編集される標的ヌクレオチドの50ヌクレオチド上流または下流以内の核酸配列に相補的なガイド配列を含む。提供される融合タンパク質のいずれかを特定の標的配列に標的指向化するのに好適ないくつかの例示的なガイドRNA配列が本明細書に提供される。

塩基エディターの効率
一部の実施形態では、本発明で提供される方法の目的は、遺伝子編集を介して、遺伝子及び/または遺伝子産物を改変することである。本明細書で提供される核酸塩基編集タンパク質は、遺伝子編集ベースのヒト治療薬のために、インビトロまたはインビボで使用され得る。本明細書に提供される核酸塩基編集タンパク質(例えば、ポリヌクレオチドプログラマブルヌクレオチド結合ドメイン(例えば、Cas9)と核酸塩基編集ドメイン(例えば、アデノシンデアミナーゼドメインまたはシチジンデアミナーゼドメイン)とを含む融合タンパク質)を使用して、AからGまたはCからTのヌクレオチドを編集できることが、当業者には理解されるであろう。

有利には、本明細書で提供される塩基編集システムは、CRISPRが行い得るように、二本鎖DNA切断をもたらすことなく、ドナーDNA鋳型を必要とすることなく、かつ過剰な確率的挿入及び欠失を誘導することなく、ゲノム編集を提供する。一部の実施形態では、本開示は、著しい数の意図されない変異、例えば、意図されない点変異を生成することなく、核酸(例えば、対象のゲノム内の核酸)における意図された変異、例えば、終止コドンを効率的に生成する塩基エディターを提供する。一部の実施形態では、意図された変異は、意図された変異を生成するように特異的に設計されたガイドポリヌクレオチド(例えば、gRNA)に結合した特異的な塩基エディター(例えば、アデノシン塩基エディターまたはシチジン塩基エディター)によって生成される変異である。一部の実施形態では、意図された変異は、疾患または障害、例えば、HBV感染症、ならびに肝硬変、肝細胞癌(HCC)、及びHBV感染症に関連するかまたはそれに起因する任意の他の疾患を含む関連疾患及び障害に関連する標的抗原に関連する遺伝子に存在する。一部の実施形態では、意図された変異は、疾患または障害、例えば、HBV感染症、ならびに肝硬変、肝細胞癌(HCC)、及びHBV感染症に関連するか、またはそれに起因する任意の他の疾患を含む関連疾患及び障害に関連する標的抗原に関連する遺伝子におけるアデニン(A)からグアニン(G)への点変異(例えば、SNP)である。一部の実施形態では、意図された変異は、遺伝子のコード領域または非コード領域(例えば、調節領域または調節要素)内のアデニン(A)からグアニン(G)への点変異である。一部の実施形態では、意図された変異は、疾患または障害、例えば、HBV感染症、ならびに肝硬変、肝細胞癌(HCC)、及びHBV感染症に関連するかまたはそれに起因する任意の他の疾患を含む関連疾患及び障害に関連する標的抗原に関連する遺伝子におけるシトシン(C)からチミン(T)への点変異(例えば、SNP)である。一部の実施形態では、意図された変異は、遺伝子のコード領域または非コード領域(例えば、調節領域または調節要素)内のチミン(T)からシトシン(C)への点変異である。一部の実施形態では、意図された変異は、終止コドン(例えば、遺伝子のコード領域内の未熟終止コドン)を生成する点変異である。一部の実施形態では、意図された変異は、終止コドンを排除する変異である。

本発明の塩基エディターは、有利には、著しい割合のインデルを生成することなく、タンパク質をコードする特定のヌクレオチド塩基を修飾する。本明細書で使用される場合、「インデル」は、核酸内のヌクレオチド塩基の挿入または欠失を指す。そのような挿入または欠失は、遺伝子のコード領域内のフレームシフト変異をもたらし得る。一部の実施形態では、核酸内に多数の挿入または欠失(すなわち、インデル)を生成することなく、核酸内の特定のヌクレオチドを効率的に修飾(例えば、変異)する塩基エディターを生成することが望ましい。一部の実施形態では、核酸内に多数の挿入または欠失(すなわち、インデル)を生成することなく、核酸内の特定のヌクレオチドを効率的に修飾(例えば、変異またはメチル化)する塩基エディターを生成することが望ましい。特定の実施形態では、本明細書に提供される塩基エディターのいずれかは、インデルに対してより大きな割合の意図された修飾(例えば、メチル化)を生成することができる。特定の実施形態では、本明細書に提供される塩基エディターのいずれかは、インデルに対してより大きな割合の意図された修飾(例えば、変異)を生成することができる。

一部の実施形態では、本明細書に提供される塩基エディターは、1:1(すなわち、意図された点変異:意図されていない点変異)を超えるインデルに対する意図された変異の比率を生成することができる。一部の実施形態では、本明細書に提供される塩基エディターは、少なくとも1.5:1、少なくとも2:1、少なくとも2.5:1、少なくとも3:1、少なくとも3.5:1、少なくとも4:1、少なくとも4.5:1、少なくとも5:1、少なくとも5.5:1、少なくとも6:1、少なくとも6.5:1、少なくとも7:1、少なくとも7.5:1、少なくとも8:1、少なくとも10:1、少なくとも12:1、少なくとも15:1、少なくとも20:1、少なくとも25:1、少なくとも30:1、少なくとも40:1、少なくとも50:1、少なくとも100:1、少なくとも200:1、少なくとも300:1、少なくとも400:1、少なくとも500:1、少なくとも600:1、少なくとも700:1、少なくとも800:1、少なくとも900:1、もしくは少なくとも1000:1、またはそれ以上であるインデルに対する意図された変異の比率を生成することができる。意図された変異及びインデルの数は、任意の好適な方法を使用して決定され得る。

一部の実施形態では、本明細書に提供される塩基エディターは、核酸の領域におけるインデルの形成を制限し得る。一部の実施形態では、この領域は、塩基エディターによって標的化されるヌクレオチドにあるか、または塩基エディターによって標的化されるヌクレオチドの2、3、4、5、6、7、8、9、もしくは10ヌクレオチド以内の領域にある。一部の実施形態では、本明細書に提供される塩基エディターのいずれかは、核酸の領域におけるインデルの形成を、1%未満、1.5%未満、2%未満、2.5%未満、3%未満、3.5%未満、4%未満、4.5%未満、5%未満、6%未満、7%未満、8%未満、9%未満、10%未満、12%未満、15%未満、または20%未満に制限し得る。核酸領域で形成されるインデルの数は、核酸(例えば、細胞のゲノム内の核酸)が塩基エディターに曝露される時間の量に依存し得る。一部の実施形態では、インデルの数または割合は、核酸(例えば、細胞のゲノム内の核酸)を塩基エディターに曝露して少なくとも1時間、少なくとも2時間、少なくとも6時間、少なくとも12時間、少なくとも24時間、少なくとも36時間、少なくとも48時間、少なくとも3日、少なくとも4日、少なくとも5日、少なくとも7日、少なくとも10日、または少なくとも14日後に決定される。

本開示の一部の態様は、本明細書に提供される塩基エディターのいずれかが、相当数の意図しない変異(例えば、偽オフターゲット編集またはバイスタンダー編集)を生成することなく、核酸(例えば、対象のゲノム内の核酸)において意図された変異を効率的に生成することができるという認識に基づく。一部の実施形態では、意図された変異は、意図された変異を生成するように特別に設計された、gRNAに結合した特定の塩基エディターによって生成される変異である。一部の実施形態では、意図された変異は、終止コドン(例えば、遺伝子のコード領域内の未熟終止コドン)を生成する変異である。一部の実施形態では、意図された変異は、終止コドンを排除する変異である。一部の実施形態では、意図された変異は、遺伝子のスプライシングを改変させる変異である。一部の実施形態では、意図された変異は、遺伝子の調節配列(例えば、遺伝子のプロモーターまたは遺伝子のリプレッサー)を改変させる変異である。一部の実施形態では、本明細書に提供される塩基エディターは、1:1(すなわち、意図された点変異:意図されていない点変異)を超える意図された変異:意図されていない変異の比率を生成することができる。一部の実施形態では、本明細書に提供される塩基エディターのいずれかは、少なくとも1.5:1、少なくとも2:1、少なくとも2.5:1、少なくとも3:1、少なくとも3.5:1、少なくとも4:1、少なくとも4.5:1、少なくとも5:1、少なくとも5.5:1、少なくとも6:1、少なくとも6.5:1、少なくとも7:1、少なくとも7.5:1、少なくとも8:1、少なくとも10:1、少なくとも12:1、少なくとも15:1、少なくとも20:1、少なくとも25:1、少なくとも30:1、少なくとも40:1、少なくとも50:1、少なくとも100:1、少なくとも150:1、少なくとも200:1、少なくとも250:1、少なくとも500:1、もしくは少なくとも1000:1、またはそれ以上である、意図された変異:意図されていない変異の比率を生成することができる。本明細書に記載の塩基エディターの特徴が、融合タンパク質、または本明細書に提供される融合タンパク質を使用する方法のいずれかに適用され得ることを理解されたい。

塩基編集は、遺伝的修飾、遺伝子修飾、及び核酸配列の修飾などの「修飾(modification)」と呼ばれることが多く、修飾が塩基編集修飾である文脈に基づいて、明確に理解され得る。したがって、塩基編集修飾は、例えば、本開示全体通して論じられるデアミナーゼ活性の結果として、ヌクレオチド塩基レベルでの修飾であり、これは次いで、遺伝子配列の変化をもたらし、遺伝子産物に影響を及ぼし得る。したがって、本質的には、本明細書に記載される遺伝子編集修飾は、遺伝子の修飾を構造的及び/または機能的にもたらし得、遺伝子産物の発現が修飾されてもよく(例えば、遺伝子の発現がノックアウトまたは逆に増強される)、または一部の状況では、遺伝子機能もしくは活性が修飾されてもよい。本明細書に開示される方法を使用して、塩基編集効率は、塩基編集が実行される遺伝子のノックダウン効率として決定され得、塩基編集は、遺伝子の発現をノックダウンするように意図されている。ノックダウンレベルは、タンパク質発現レベルのアッセイなどの任意の検出アッセイ(例えば、フローサイトメトリー)、定量的RT-PCR、ノーザンブロット分析などのRNA発現の検出アッセイ、またはパイロ配列決定などの任意の他の好適なアッセイによって発現レベルを決定することによって定量的に検証することができ、ヌクレオチド配列決定反応によって定性的に検証することができる。

一部の実施形態では、修飾、例えば、単一塩基編集は、標的遺伝子の発現の少なくとも10%の低減をもたらす。一部の実施形態では、塩基編集効率は、遺伝子標的化発現の少なくとも10%の低減をもたらし得る。一部の実施形態では、塩基編集効率は、遺伝子標的化発現の少なくとも20%の低減をもたらし得る。一部の実施形態では、塩基編集効率は、遺伝子標的化発現の少なくとも30%の低減をもたらし得る。一部の実施形態では、塩基編集効率は、標的遺伝子の発現の少なくとも40%の低減をもたらし得る。一部の実施形態では、塩基編集効率は、遺伝子標的化発現の少なくとも50%の低減をもたらし得る。一部の実施形態では、塩基編集効率は、標的化遺伝子発現の少なくとも60%の低減をもたらし得る。一部の実施形態では、塩基編集効率は、標的化遺伝子発現の少なくとも70%の低減をもたらし得る。一部の実施形態では、塩基編集効率は、標的化遺伝子発現の少なくとも80%の低減をもたらし得る。一部の実施形態では、塩基編集効率は、標的化遺伝子発現の少なくとも90%の低減をもたらし得る。一部の実施形態では、塩基編集効率は、標的化遺伝子発現の少なくとも91%の低減をもたらし得る。一部の実施形態では、塩基編集効率は、標的化遺伝子発現の少なくとも92%の低減をもたらし得る。一部の実施形態では、塩基編集効率は、標的化遺伝子発現の少なくとも93%の低減をもたらし得る。一部の実施形態では、塩基編集効率は、標的化遺伝子発現の少なくとも94%の低減をもたらし得る。一部の実施形態では、塩基編集効率は、標的化遺伝子発現の少なくとも95%の低減をもたらし得る。一部の実施形態では、塩基編集効率は、標的化遺伝子発現の少なくとも96%の低減をもたらし得る。一部の実施形態では、塩基編集効率は、標的化遺伝子発現の少なくとも97%の低減をもたらし得る。一部の実施形態では、塩基編集効率は、標的化遺伝子発現の少なくとも98%の低減をもたらし得る。一部の実施形態では、塩基編集効率は、標的化遺伝子発現の少なくとも99%の低減をもたらし得る。一部の実施形態では、塩基編集効率は、標的化される遺伝子のノックアウト(遺伝子発現の100%ノックダウン)をもたらし得る。

一部の実施形態では、本明細書に提供される塩基エディターシステムのいずれかは、標的ポリヌクレオチド配列において、50%未満、40%未満、30%未満、20%未満、19%未満、18%未満、17%未満、16%未満、15%未満、14%未満、13%未満、12%未満、11%未満、10%未満、9%未満、8%未満、7%未満、6%未満、5%未満、4%未満、3%未満、2%未満、1%未満、0.9%未満、0.8%未満、0.7%未満、0.6%未満、0.5%未満、0.4%未満、0.3%未満、0.2%未満、0.1%未満、0.09%未満、0.08%未満、0.07%未満、0.06%未満、0.05%未満、0.04%未満、0.03%未満、0.02%未満、または0.01%未満のインデル形成をもたらす。

一部の実施形態では、標的とされる修飾、例えば、単一塩基編集は、異なるガイドRNAでの塩基編集のための少なくとも4、5、6、7、8、9、10、11、12 13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49または50個の異なる内因性配列を標的化するために同時に使用される。一部の実施形態では、標的とされる修飾、例えば、単一塩基編集は、異なるガイドRNAでの塩基編集のための少なくとも4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49または50個以上の異なる内因性遺伝子配列を順次標的とするために使用される。

本開示の一部の態様は、本明細書に提供される塩基エディターのいずれかが、意図しない点変異(すなわち、バイスタンダーの変異)などの相当数の意図しない変異を生成することなく、核酸(例えば、対象のゲノム内の核酸)において意図された変異(例えば、点変異)を効率的に生成することができるという認識に基づく。一部の実施形態では、本明細書に提供される塩基エディターのいずれかは、少なくとも0.01%の意図された変異(すなわち、少なくとも0.01%の塩基編集効率)を生成することができる。一部の実施形態では、本明細書に提供される塩基エディターのいずれかは、意図された変異の少なくとも0.01%、1%、2%、3%、4%、5%、10%、15%、20%、25%、30%、40%、45%、50%、60%、70%、80%、90%、95%、または99%を生成することができる。

一部の実施形態では、本明細書に記載のABE8塩基エディターバリアントのうちの1つを含む塩基エディターシステムのいずれかは、標的ポリヌクレオチド配列において、50%未満、40%未満、30%未満、20%未満、19%未満、18%未満、17%未満、16%未満、15%未満、14%未満、13%未満、12%未満、11%未満、10%未満、9%未満、8%未満、7%未満、6%未満、5%未満、4%未満、3%未満、2%未満、1%未満、0.9%未満、0.8%未満、0.7%未満、0.6%未満、0.5%未満、0.4%未満、0.3%未満、0.2%未満、0.1%未満、0.09%未満、0.08%未満、0.07%未満、0.06%未満、0.05%未満、0.04%未満、0.03%未満、0.02%未満、または0.01%未満のインデル形成をもたらす。一部の実施形態では、本明細書に記載のABE8塩基エディターバリアントのうちの1つを含む塩基エディターシステムのいずれかは、標的ポリヌクレオチド配列において、0.8%未満のインデル形成をもたらす。一部の実施形態では、本明細書に記載のABE8塩基エディターバリアントのうちの1つを含む塩基エディターシステムのいずれかは、標的ポリヌクレオチド配列において、最大0.8%のインデル形成をもたらす。一部の実施形態では、本明細書に記載のABE8塩基エディターバリアントのうちの1つを含む塩基エディターシステムのいずれかは、標的ポリヌクレオチド配列において、0.3%未満のインデル形成をもたらす。一部の実施形態では、記載されるABE8塩基エディターバリアントのうちの1つを含む塩基エディターシステムのいずれかは、ABE7塩基エディターのうちの1つを含む塩基エディターシステムと比較して、標的ポリヌクレオチド配列において、より低いインデル形成をもたらす。一部の実施形態では、本明細書に記載のABE8編集バリアントのうちの1つを含む塩基エディターシステムのいずれかは、ABE7.10を含む塩基エディターシステムと比較して、標的ポリヌクレオチド配列において、より低いインデル形成をもたらす。

一部の実施形態では、本明細書に記載のABE8塩基エディターバリアントのうちの1つを含む塩基エディターシステムのいずれかは、ABE7塩基エディターのうちの1つを含む塩基エディターシステムと比較して、減少したインデル頻度を有する。一部の実施形態では、本明細書に記載のABE8塩基エディターバリアントのうちの1つを含む塩基エディターシステムのいずれかは、ABE7塩基エディターのうちの1つを含む塩基エディターシステムと比較して、少なくとも0.01%、少なくとも1%、少なくとも2%、少なくとも3%、少なくとも4%、少なくとも5%、少なくとも10%、少なくとも15%、少なくとも20%、少なくとも25%、少なくとも30%、少なくとも35%、少なくとも40%、少なくとも45%、少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、または少なくとも95%減少したインデル頻度を有する。一部の実施形態では、本明細書に記載のABE8塩基エディターバリアントのうちの1つを含む塩基エディターシステムは、ABE7.10を含む塩基エディターシステムと比較して、少なくとも0.01%、少なくとも1%、少なくとも2%、少なくとも3%、少なくとも4%、少なくとも5%、少なくとも10%、少なくとも15%、少なくとも20%、少なくとも25%、少なくとも30%、少なくとも35%、少なくとも40%、少なくとも45%、少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、または少なくとも95%減少したインデル頻度を有する。

本発明は、効率及び特異性の増加を有するアデノシンデアミナーゼのバリアント(例えば、ABE8バリアント)を提供する。特に、本明細書に記載のアデノシンデアミナーゼのバリアントは、ポリヌクレオチド内の所望の塩基を編集する可能性がより高く、改変されることを意図しない塩基(例えば、「バイスタンダー」)を編集する可能性がより低い。

一部の実施形態では、本明細書に記載のABE8塩基エディターバリアントのうちの1つを含む塩基エディターシステムのいずれかは、減少したバイスタンダー編集または変異を有する。一部の実施形態では、意図しない編集または変異は、標的ヌクレオチド配列の標的ウィンドウにおける意図しない位置または非標的位置における標的塩基(例えば、AまたはC)のバイスタンダー変異またはバイスタンダー編集である。一部の実施形態では、本明細書に記載のABE8塩基エディターバリアントのうちの1つを含む塩基エディターシステムのいずれかは、ABE7塩基エディター(例えば、ABE7.10)を含む塩基エディターシステムと比較して、バイスタンダー編集または変異の減少を有する。一部の実施形態では、本明細書に記載のABE8塩基エディターバリアントのうちの1つを含む塩基エディターシステムのいずれかは、ABE7塩基エディター(例えば、ABE7.10)を含む塩基エディターシステムと比較して、少なくとも1%、少なくとも2%、少なくとも3%、少なくとも4%、少なくとも5%、少なくとも10%、少なくとも15%、少なくとも20%、少なくとも25%、少なくとも30%、少なくとも35%、少なくとも40%、少なくとも45%、少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、または少なくとも99%減少したバイスタンダー編集または変異を有する。一部の実施形態では、本明細書に記載のABE8塩基エディターバリアントのうちの1つを含む塩基エディターシステムのいずれかは、ABE7塩基エディター(例えば、ABE7.10)を含む塩基エディターシステムと比較して、少なくとも1.1倍、少なくとも1.2倍、少なくとも1.3倍、少なくとも1.4倍、少なくとも1.5倍、少なくとも1.6倍、少なくとも1.7倍、少なくとも1.8倍、少なくとも1.9倍、少なくとも2.0倍、少なくとも2.1倍、少なくとも2.2倍、少なくとも2.3倍、少なくとも2.4倍、少なくとも2.5倍、少なくとも2.6倍、少なくとも2.7倍、少なくとも2.8倍、少なくとも2.9倍、または少なくとも3.0倍減少したバイスタンダー編集または変異を有する。

一部の実施形態では、本明細書に記載のABE8塩基エディターバリアントのうちの1つを含む塩基編集システムのいずれかは、減少した偽編集を有する。一部の実施形態では、意図しない編集または意図しない変異は、偽変異または偽編集(例えば、ゲノムの意図しない領域または非標的領域における標的塩基(例えば、AまたはC)の非特異的編集またはガイド非依存性編集)である。一部の実施形態では、本明細書に記載のABE8塩基エディターバリアントのうちの1つを含む塩基エディターシステムのいずれかは、ABE7塩基エディター(例えば、ABE7.10)を含む塩基エディターシステムと比較して、偽編集または偽変異の減少を有する。一部の実施形態では、本明細書に記載のABE8塩基エディターバリアントのうちの1つを含む塩基エディターシステムのいずれかは、ABE7塩基エディター(例えば、ABE7.10)を含む塩基エディターシステムと比較して、少なくとも1%、少なくとも2%、少なくとも3%、少なくとも4%、少なくとも5%、少なくとも10%、少なくとも15%、少なくとも20%、少なくとも25%、少なくとも30%、少なくとも35%、少なくとも40%、少なくとも45%、少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、または少なくとも99%減少した偽編集を有する。一部の実施形態では、本明細書に記載のABE8塩基エディターバリアントのうちの1つを含む塩基エディターシステムのいずれかは、ABE7塩基エディター(例えば、ABE7.10)を含む塩基エディターシステムと比較して、少なくとも1.1倍、少なくとも1.2倍、少なくとも1.3倍、少なくとも1.4倍、少なくとも1.5倍、少なくとも1.6倍、少なくとも1.7倍、少なくとも1.8倍、少なくとも1.9倍、少なくとも2.0倍、少なくとも2.1倍、少なくとも2.2倍、少なくとも2.3倍、少なくとも2.4倍、少なくとも2.5倍、少なくとも2.6倍、少なくとも2.7倍、少なくとも2.8倍、少なくとも2.9倍、または少なくとも3.0倍減少した偽編集または偽変異を有する。

一部の実施形態では、本明細書に記載のABE8塩基エディターバリアントのいずれかは、少なくとも0.01%、少なくとも1%、少なくとも2%、少なくとも3%、少なくとも4%、少なくとも5%、少なくとも10%、少なくとも15%、少なくとも20%、少なくとも25%、少なくとも30%、少なくとも35%、少なくとも40%、少なくとも45%、少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、または少なくとも99%の塩基編集効率を有する。一部の実施形態では、塩基編集効率は、細胞集団における編集された核酸塩基の割合を計算することによって測定され得る。一部の実施形態では、本明細書に記載のABE8塩基エディターバリアントのいずれかは、細胞集団における編集された核酸塩基によって測定した場合、少なくとも0.01%、少なくとも1%、少なくとも2%、少なくとも3%、少なくとも4%、少なくとも5%、少なくとも10%、少なくとも15%、少なくとも20%、少なくとも25%、少なくとも30%、少なくとも35%、少なくとも40%、少なくとも45%、少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、または少なくとも99%の塩基編集効率を有する。

一部の実施形態では、本明細書に記載のABE8塩基エディターバリアントのいずれかは、ABE7塩基エディターと比較して、より高い塩基編集効率を有する。一部の実施形態では、本明細書に記載のABE8塩基エディターバリアントのいずれかは、ABE7塩基エディター(例えば、ABE7.10)と比較して、少なくとも1%、少なくとも2%、少なくとも3%、少なくとも4%、少なくとも5%、少なくとも10%、少なくとも15%、少なくとも20%、少なくとも25%、少なくとも30%、少なくとも35%、少なくとも40%、少なくとも45%、少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも99%、少なくとも100%、少なくとも105%、少なくとも110%、少なくとも115%、少なくとも120%、少なくとも125%、少なくとも130%、少なくとも135%、少なくとも140%、少なくとも145%、少なくとも150%、少なくとも155%、少なくとも160%、少なくとも165%、少なくとも170%、少なくとも175%、少なくとも180%、少なくとも185%、少なくとも190%、少なくとも195%、少なくとも200%、少なくとも210%、少なくとも220%、少なくとも230%、少なくとも240%、少なくとも250%、少なくとも260%、少なくとも270%、少なくとも280%、少なくとも290%、少なくとも300%、少なくとも310%、少なくとも320%、少なくとも330%、少なくとも340%、少なくとも350%、少なくとも360%、少なくとも370%、少なくとも380%、少なくとも390%、少なくとも400%、少なくとも450%、または少なくとも500%高い塩基編集効率を有する。

一部の実施形態では、本明細書に記載のABE8塩基エディターバリアントのいずれかは、ABE7塩基エディター(例えば、ABE7.10)と比較して、少なくとも1.1倍、少なくとも1.2倍、少なくとも1.3倍、少なくとも1.4倍、少なくとも1.5倍、少なくとも1.6倍、少なくとも1.7倍、少なくとも1.8倍、少なくとも1.9倍、少なくとも2.0倍、少なくとも2.1倍、少なくとも2.2倍、少なくとも2.3倍、少なくとも2.4倍、少なくとも2.5倍、少なくとも2.6倍、少なくとも2.7倍、少なくとも2.8倍、少なくとも2.9倍、少なくとも3.0倍、少なくとも3.1倍、少なくとも3.2、少なくとも3.3倍、少なくとも3.4倍、少なくとも3.5倍、少なくとも3.6倍、少なくとも3.7倍、少なくとも3.8倍、少なくとも3.9倍、少なくとも4.0倍、少なくとも4.1倍、少なくとも4.2倍、少なくとも4.3倍、少なくとも4.4倍、少なくとも4.5倍、少なくとも4.6倍、少なくとも4.7倍、少なくとも4.8倍、少なくとも4.9倍、または少なくとも5.0倍高い塩基編集効率を有する。

一部の実施形態では、本明細書に記載のABE8塩基エディターバリアントのいずれかは、少なくとも0.01%、少なくとも1%、少なくとも2%、少なくとも3%、少なくとも4%、少なくとも5%、少なくとも10%、少なくとも15%、少なくとも20%、少なくとも25%、少なくとも30%、少なくとも35%、少なくとも40%、少なくとも45%、少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、または少なくとも99%のオンターゲット塩基編集効率を有する。一部の実施形態では、本明細書に記載のABE8塩基エディターバリアントのいずれかは、細胞集団における編集された標的核酸塩基によって測定した場合、少なくとも0.01%、少なくとも1%、少なくとも2%、少なくとも3%、少なくとも4%、少なくとも5%、少なくとも10%、少なくとも15%、少なくとも20%、少なくとも25%、少なくとも30%、少なくとも35%、少なくとも40%、少なくとも45%、少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、または少なくとも99%のオンターゲット塩基編集効率を有する。

一部の実施形態では、本明細書に記載のABE8塩基エディターバリアントのいずれかは、ABE7塩基エディターと比較して、より高いオンターゲット塩基編集効率を有する。一部の実施形態では、本明細書に記載のABE8塩基エディターバリアントのいずれかは、ABE7塩基エディター(例えば、ABE7.10)と比較して、少なくとも1%、少なくとも2%、少なくとも3%、少なくとも4%、少なくとも5%、少なくとも10%、少なくとも15%、少なくとも20%、少なくとも25%、少なくとも30%、少なくとも35%、少なくとも40%、少なくとも45%、少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも99%、少なくとも100%、少なくとも105%、少なくとも110%、少なくとも115%、少なくとも120%、少なくとも125%、少なくとも130%、少なくとも135%、少なくとも140%、少なくとも145%、少なくとも150%、少なくとも155%、少なくとも160%、少なくとも165%、少なくとも170%、少なくとも175%、少なくとも180%、少なくとも185%、少なくとも190%、少なくとも195%、少なくとも200%、少なくとも210%、少なくとも220%、少なくとも230%、少なくとも240%、少なくとも250%、少なくとも260%、少なくとも270%、少なくとも280%、少なくとも290%、少なくとも300%、少なくとも310%、少なくとも320%、少なくとも330%、少なくとも340%、少なくとも350%、少なくとも360%、少なくとも370%、少なくとも380%、少なくとも390%、少なくとも400%、少なくとも450%、または少なくとも500%高いオンターゲット塩基編集効率を有する。

一部の実施形態では、本明細書に記載のABE8塩基エディターバリアントのいずれかは、ABE7塩基エディター(例えば、ABE7.10)と比較して、少なくとも1.1倍、少なくとも1.2倍、少なくとも1.3倍、少なくとも1.4倍、少なくとも1.5倍、少なくとも1.6倍、少なくとも1.7倍、少なくとも1.8倍、少なくとも1.9倍、少なくとも2.0倍、少なくとも2.1倍、少なくとも2.2倍、少なくとも2.3倍、少なくとも2.4倍、少なくとも2.5倍、少なくとも2.6倍、少なくとも2.7倍、少なくとも2.8倍、少なくとも2.9倍、少なくとも3.0倍、少なくとも3.1倍、少なくとも3.2倍、少なくとも3.3倍、少なくとも3.4倍、少なくとも3.5倍、少なくとも3.6倍、少なくとも3.7倍、少なくとも3.8倍、少なくとも3.9倍、少なくとも4.0倍、少なくとも4.1倍、少なくとも4.2倍、少なくとも4.3倍、少なくとも4.4倍、少なくとも4.5倍、少なくとも4.6倍、少なくとも4.7倍、少なくとも4.8倍、少なくとも4.9倍、または少なくとも5.0倍高いオンターゲット塩基編集効率を有する。

本明細書に記載のABE8塩基エディターバリアントは、プラスミド、ベクター、LNP複合体、またはmRNAを介して宿主細胞に送達され得る。一部の実施形態では、本明細書に記載のABE8塩基エディターバリアントのいずれかは、mRNAとして宿主細胞に送達される。一部の実施形態では、核酸ベースの送達システム(例えば、mRNA)を介して送達されるABE8塩基エディターは、編集された核酸塩基によって測定した場合、少なくとも1%、少なくとも2%、少なくとも3%、少なくとも4%、少なくとも5%、少なくとも10%、少なくとも15%、少なくとも20%、少なくとも25%、少なくとも30%、少なくとも35%、少なくとも40%、少なくとも45%、少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、または少なくとも99%のオンターゲット編集効率を有する。一部の実施形態では、mRNAシステムによって送達されるABE8塩基エディターは、プラスミドまたはベクターシステムによって送達されるABE8塩基エディターと比較して、より高い塩基編集効率を有する。一部の実施形態では、本明細書に記載のABE8塩基エディターバリアントのいずれかは、mRNAシステムによって送達された場合、プラスミドまたはベクターシステムによって送達された場合と比較して、少なくとも1%、少なくとも2%、少なくとも3%、少なくとも4%、少なくとも5%、少なくとも10%、少なくとも15%、少なくとも20%、少なくとも25%、少なくとも30%、少なくとも35%、少なくとも40%、少なくとも45%、少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも99%、少なくとも100%、少なくとも105%、少なくとも110%、少なくとも115%、少なくとも120%、少なくとも125%、少なくとも130%、少なくとも135%、少なくとも140%、少なくとも145%、少なくとも150%、少なくとも155%、少なくとも160%、少なくとも165%、少なくとも170%、少なくとも175%、少なくとも180%、少なくとも185%、少なくとも190%、少なくとも195%、少なくとも200%、少なくとも210%、少なくとも220%、少なくとも230%、少なくとも240%、少なくとも250%、少なくとも260%、少なくとも270%、少なくとも280%、少なくとも290%、少なくとも300%、少なくとも310%、少なくとも320%、少なくとも330%、少なくとも340%、少なくとも350%、少なくとも360%、少なくとも370%、少なくとも380%、少なくとも390%、少なくとも400%、少なくとも450%、または少なくとも500%高いオンターゲット編集効率を有する。一部の実施形態では、本明細書に記載のABE8塩基エディターバリアントのいずれかは、mRNAシステムによって送達された場合、プラスミドまたはベクターシステムによって送達された場合と比較して、少なくとも1.1倍、少なくとも1.2倍、少なくとも1.3倍、少なくとも1.4倍、少なくとも1.5倍、少なくとも1.6倍、少なくとも1.7倍、少なくとも1.8倍、少なくとも1.9倍、少なくとも2.0倍、少なくとも2.1倍、少なくとも2.2倍、少なくとも2.3倍、少なくとも2.4倍、少なくとも2.5倍、少なくとも2.6倍、少なくとも2.7倍、少なくとも2.8倍、少なくとも2.9倍、少なくとも3.0倍、少なくとも3.1倍、少なくとも3.2倍、少なくとも3.3倍、少なくとも3.4倍、少なくとも3.5倍、少なくとも3.6倍、少なくとも3.7倍、少なくとも3.8倍、少なくとも3.9倍、少なくとも4.0倍、少なくとも4.1倍、少なくとも4.2倍、少なくとも4.3倍、少なくとも4.4倍、少なくとも4.5倍、少なくとも4.6倍、少なくとも4.7倍、少なくとも4.8倍、少なくとも4.9倍、または少なくとも5.0倍高いオンターゲット編集効率を有する。

一部の実施形態では、本明細書に記載のABE8塩基エディターバリアントのうちの1つを含む塩基エディターシステムのいずれかは、標的ポリヌクレオチド配列において、50%未満、40%未満、30%未満、20%未満、19%未満、18%未満、17%未満、16%未満、15%未満、14%未満、13%未満、12%未満、11%未満、10%未満、9%未満、8%未満、7%未満、6%未満、5%未満、4%未満、3%未満、2%未満、1%未満、0.9%未満、0.8%未満、0.7%未満、0.6%未満、0.5%未満、0.4%未満、0.3%未満、0.2%未満、0.1%未満、0.09%未満、0.08%未満、0.07%未満、0.06%未満、0.05%未満、0.04%未満、0.03%未満、0.02%未満、または0.01%未満のオフターゲット編集をもたらす。

一部の実施形態では、本明細書に記載のABE8塩基エディターバリアントのいずれかは、mRNAシステムによって送達された場合、プラスミドまたはベクターシステムによって送達された場合と比較して、より低いガイドオフターゲット編集効率を有する。一部の実施形態では、本明細書に記載のABE8塩基エディターバリアントのいずれかは、mRNAシステムによって送達された場合、プラスミドまたはベクターシステムによって送達された場合と比較して、少なくとも1%、少なくとも2%、少なくとも3%、少なくとも4%、少なくとも5%、少なくとも10%、少なくとも15%、少なくとも20%、少なくとも25%、少なくとも30%、少なくとも35%、少なくとも40%、少なくとも45%、少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、または少なくとも99%低いガイドオフターゲット編集効率を有する。一部の実施形態では、本明細書に記載のABE8塩基エディターバリアントのいずれかは、mRNAシステムによって送達された場合、プラスミドまたはベクターシステムによって送達された場合と比較して、少なくとも1.1倍、少なくとも1.2倍、少なくとも1.3倍、少なくとも1.4倍、少なくとも1.5倍、少なくとも1.6倍、少なくとも1.7倍、少なくとも1.8倍、少なくとも1.9倍、少なくとも2.0倍、少なくとも2.1倍、少なくとも2.2倍、少なくとも2.3倍、少なくとも2.4倍、少なくとも2.5倍、少なくとも2.6倍、少なくとも2.7倍、少なくとも2.8倍、少なくとも2.9倍、または少なくとも3.0倍低いガイドオフターゲット編集効率を有する。一部の実施形態では、本明細書に記載のABE8塩基エディターバリアントのいずれかは、mRNAシステムによって送達された場合、プラスミドまたはベクターシステムによって送達された場合と比較して、少なくとも約2.2倍低下したガイドオフターゲット編集効率を有する。

一部の実施形態では、本明細書に記載のABE8塩基エディターバリアントのいずれかは、mRNAシステムによって送達された場合、プラスミドまたはベクターシステムによって送達された場合と比較して、ガイド非依存性オフターゲット編集効率が低い。一部の実施形態では、本明細書に記載のABE8塩基エディターバリアントのいずれかは、mRNAシステムによって送達された場合、プラスミドまたはベクターシステムによって送達された場合と比較して、少なくとも1%、少なくとも2%、少なくとも3%、少なくとも4%、少なくとも5%、少なくとも10%、少なくとも15%、少なくとも20%、少なくとも25%、少なくとも30%、少なくとも35%、少なくとも40%、少なくとも45%、少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、または少なくとも99%低いガイド非依存性オフターゲット編集効率を有する。一部の実施形態では、本明細書に記載のABE8塩基エディターバリアントのいずれかは、mRNAシステムによって送達された場合、プラスミドまたはベクターシステムによって送達された場合と比較して、少なくとも1.1倍、少なくとも1.2倍、少なくとも1.3倍、少なくとも1.4倍、少なくとも1.5倍、少なくとも1.6倍、少なくとも1.7倍、少なくとも1.8倍、少なくとも1.9倍、少なくとも2.0倍、少なくとも2.1倍、少なくとも2.2倍、少なくとも2.3倍、少なくとも2.4倍、少なくとも2.5倍、少なくとも2.6倍、少なくとも2.7倍、少なくとも2.8倍、少なくとも2.9倍、少なくとも3.0倍、少なくとも5.0倍、少なくとも10.0倍、少なくとも20.0倍、少なくとも50.0倍、少なくとも70.0倍、少なくとも100.0倍、少なくとも120.0倍、少なくとも130.0倍、または少なくとも150.0倍低いガイド非依存性オフターゲット編集効率を有する。一部の実施形態では、本明細書に記載のABE8塩基エディターバリアントは、mRNAシステムによって送達された場合、プラスミドまたはベクターシステムによって送達された場合と比較して、134.0倍低いガイド非依存性オフターゲット編集効率(例えば、偽RNA脱アミノ化)有する。一部の実施形態では、本明細書に記載のABE8塩基エディターバリアントは、ゲノムにわたってガイド非依存性変異率を増加させない。

一部の実施形態では、単一の遺伝子送達事象を使用して(例えば、形質導入、トランスフェクション、エレクトロポレーション、または任意の他の方法により)、細胞のゲノム内の5つの配列の塩基編集を標的化することができる。一部の実施形態では、単一の遺伝子送達事象を使用して、細胞のゲノム内の6個の配列の塩基編集を標的化することができる。一部の実施形態では、単一の遺伝子送達事象を使用して、細胞のゲノム内の7個の配列の塩基編集を標的化することができる。一部の実施形態では、単一のエレクトロポレーション事象を使用して、細胞のゲノム内の8つの配列の塩基編集を標的化することができる。一部の実施形態では、単一の遺伝子送達事象を使用して、細胞のゲノム内の9個の配列の塩基編集を標的化することができる。一部の実施形態では、単一の遺伝子送達事象を使用して、細胞のゲノム内の10個の配列の塩基編集を標的化することができる。一部の実施形態では、単一の遺伝子送達事象を使用して、細胞のゲノム内の20個の配列の塩基編集を標的化することができる。一部の実施形態では、単一の遺伝子送達事象を使用して、細胞のゲノム内の30個の配列の塩基編集を標的化することができる。一部の実施形態では、単一の遺伝子送達事象を使用して、細胞のゲノム内の40個の配列の塩基編集を標的化することができる。一部の実施形態では、単一の遺伝子送達事象を使用して、細胞のゲノム内の50個の配列の塩基編集を標的化することができる。

一部の実施形態では、本明細書に記載される方法、例えば、塩基編集方法は、最小オフターゲット効果から無オフターゲット効果までを有する。

一部の実施形態では、本明細書に記載される塩基編集方法は、細胞集団の少なくとも50%が、正常に編集されている(すなわち、細胞が、正常に操作されている)ことをもたらす。一部の実施形態では、本明細書に記載の塩基編集方法は、少なくとも55%の正常に編集された細胞集団をもたらす。一部の実施形態では、本明細書に記載の塩基編集方法は、少なくとも60%の正常に編集された細胞集団をもたらす。一部の実施形態では、本明細書に記載の塩基編集方法は、少なくとも65%の正常に編集された細胞集団をもたらす。一部の実施形態では、本明細書に記載の塩基編集方法は、少なくとも70%の正常に編集された細胞集団をもたらす。一部の実施形態では、本明細書に記載の塩基編集方法は、少なくとも75%の正常に編集された細胞集団をもたらす。一部の実施形態では、本明細書に記載の塩基編集方法は、少なくとも80%の正常に編集された細胞集団をもたらす。一部の実施形態では、本明細書に記載の塩基編集方法は、少なくとも85%の正常に編集された細胞集団をもたらす。一部の実施形態では、本明細書に記載の塩基編集方法は、少なくとも90%の正常に編集された細胞集団をもたらす。一部の実施形態では、本明細書に記載の塩基編集方法は、少なくとも95%の正常に編集された細胞集団をもたらす。一部の実施形態では、本明細書に記載の塩基編集方法は、約91%、92%、93%、94%、95%、96%、97%、98%、99%、または100%の正常に編集された細胞集団をもたらす。

一部の実施形態では、塩基編集介入後の生細胞回収率は、塩基編集事象の時点での開始細胞集団の少なくとも60%、70%、80%、90%超である。一部の実施形態では、上に記載される生細胞の回収率は、約70%である。一部の実施形態では、上に記載される生細胞の回収率は、約75%である。一部の実施形態では、上に記載される生細胞の回収率は、約80%である。一部の実施形態では、上に記載される生細胞の回収率は、約85%である。一部の実施形態では、上に記載される生細胞の回収率は、塩基編集事象の時点で、細胞集団のうちの約90%、または約91%、92%、93%、94%、95%、96%、97%、98%、または99%、または100%である。

一部の実施形態では、操作された細胞集団は、インビトロで更に約2倍、約3倍、約4倍、約5倍、約6倍、約7倍、約8倍、約9倍、約10倍、約15倍、約20倍、約25倍、約30倍、約35倍、約40倍、約45倍、約50倍、または約100倍に増殖され得る。

意図された変異及びインデルの数は、いずれかの好適な方法を使用して決定され得、好適な方法は、例えば、国際PCT出願第2017/045381号(WO2018/027078)及び同第PCT/US2016/058344号(WO2017/070632)、Komor,A.C.,et al.,“Programmable editing of a target base in genomic DNA without double-stranded DNA cleavage”Nature 533,420-424(2016)、Gaudelli,N.M.,et al.,“Programmable base editing of A・T to G・C in genomic DNA without DNA cleavage”Nature 551,464-471(2017)及びKomor,A.C.,et al.,“Improved base excision repair inhibition and bacteriophage Mu Gam protein yields C:G-to-T:A base editors with higher efficiency and product purity”Science Advances 3:eaao4774(2017)に記載されており、それらの内容全体は、参照により本明細書に援用される。

一部の実施形態では、インデル頻度を計算するために、配列決定リード(sequencing reads)は、インデルが生じ得るウィンドウの両側に隣接する2つの10bp配列と正確に一致するようにスキャンされる。正確な一致が見つからない場合、リードは、分析から除外される。このインデルウィンドウの長さが参照配列と完全に一致する場合、リードは、インデルを含有しないものとして分類される。インデルウィンドウが参照配列よりも2塩基以上長いまたは短い場合、配列決定リードは、それぞれ、挿入または欠失として分類される。一部の実施形態では、本明細書に提供される塩基エディターは、核酸の領域におけるインデルの形成を制限し得る。一部の実施形態では、この領域は、塩基エディターによって標的化されるヌクレオチドにあるか、または塩基エディターによって標的化されるヌクレオチドの2、3、4、5、6、7、8、9、もしくは10ヌクレオチド以内の領域にある。

標的ヌクレオチド領域で形成されるインデルの数は、核酸(例えば、細胞のゲノム内の核酸)が塩基エディターに曝露される時間の量に依存し得る。一部の実施形態では、インデルの数または割合は、標的ヌクレオチド配列(例えば、細胞のゲノム内の核酸)を塩基エディターに曝露して少なくとも1時間、少なくとも2時間、少なくとも6時間、少なくとも12時間、少なくとも24時間、少なくとも36時間、少なくとも48時間、少なくとも3日、少なくとも4日、少なくとも5日、少なくとも7日、少なくとも10日、または少なくとも14日後に決定される。本明細書に記載される塩基エディターの特徴は、融合タンパク質、または本明細書に提供される融合タンパク質を使用する方法のいずれかに適用され得ることを理解されたい。

塩基エディター効率の詳細は、国際PCT出願第2017/045381号(WO2018/027078)及び第PCT/US2016/058344号(WO2017/070632)に記載されている(これらの各々は、その全体が参照により本明細書に援用される)。また、Komor,A.C.,et al.,“Programmable editing of a target base in genomic DNA without double-stranded DNA cleavage”Nature 533,420-424(2016)、Gaudelli,N.M.,et al.,“Programmable base editing of A・T to G・C in genomic DNA without DNA cleavage”Nature 551,464-471(2017)及びKomor,A.C.,et al.,“Improved base excision repair inhibition and bacteriophage Mu Gam protein yields C:G-to-T:A base editors with higher efficiency and product purity”Science Advances 3:eaao4774(2017)を参照されたく、それらの内容全体は、参照により本明細書に援用される。一部の実施形態では、本明細書に提供される方法を使用して、1つ以上の遺伝子における複数の核酸塩基対を編集することで、少なくとも1つの意図された変異の形成がもたらされる。一部の実施形態では、当該少なくとも1つの意図された変異の当該形成は、遺伝子の正常な機能の破壊をもたらす。一部の実施形態では、当該少なくとも1つの意図された変異の当該形成は、遺伝子によってコードされるタンパク質の発現を低下または排除する。多重編集が、本明細書に提供される任意の方法または方法の組み合わせを使用して達成され得ることを理解されたい。

多重編集
一部の実施形態では、本発明に提供される塩基エディターシステムは、1つ以上の遺伝子において、複数の核酸塩基対を多重編集することができる。実施形態では、多重編集は、2つ以上の異なるgRNA(例えば、gRNA37及びgRNA40)と組み合わせて、1つ以上の塩基エディターを細胞及び/または対象に投与することを伴う。表1に列挙されるガイドRNAのうちのいずれか2つ以上、または表2A～2Cもしくは配列表(例えば、配列番号3105～5485及び8220～10830)に列挙されるスペーサー配列(複数可)を含むgRNAを、多重編集のために対象または細胞に同時に投与することができる。一部の実施形態では、複数の核酸塩基対は、同じ遺伝子内または1つ以上の遺伝子内に位置し、少なくとも1つの遺伝子は、異なる遺伝子座内に位置する。一部の実施形態では、多重編集は、1つ以上のガイドポリヌクレオチドを含むことができる。一部の実施形態では、多重編集は、1つ以上の塩基エディターシステムを含むことができる。一部の実施形態では、多重編集は、単一ガイドポリヌクレオチドまたは複数のガイドポリヌクレオチドを有する1つ以上の塩基エディターシステムを含むことができる。一部の実施形態では、多重編集は、単一の塩基エディターシステムを有する1つ以上のガイドポリヌクレオチドを含むことができる。一部の実施形態では、多重編集は、標的ポリヌクレオチド配列への結合を標的とするために、PAM配列を必要とする少なくとも1つのガイドポリヌクレオチドまたはPAM配列を必要としない少なくとも1つのガイドポリヌクレオチドを含むことができる。一部の実施形態では、多重編集は、標的ポリヌクレオチド配列への標的結合に対してPAM配列を必要としない少なくとも1つのガイドポリヌクレオチドと、標的ポリヌクレオチド配列への標的結合に対してPAM配列を必要とする少なくとも1つのガイドポリヌクレオチドとの混合物を含むことができる。本明細書に記載される塩基エディターのいずれかを使用する多重編集の特徴は、本明細書に提供される任意の塩基エディターを使用する方法の任意の組み合わせに適用され得ることを理解されたい。本明細書に記載される塩基エディターのいずれを使用した多重編集は、複数の核酸塩基対の順次編集を含むこともできることを理解されたい。

一部の実施形態では、複数の核酸塩基対は、1つ以上の遺伝子内にある。一部の実施形態では、複数の核酸塩基対は、同じ遺伝子内にある。一部の実施形態では、1つ以上の遺伝子内の少なくとも1つの遺伝子が、異なる遺伝子座に位置する。

一部の実施形態では、編集は、少なくとも1つのタンパク質コード領域内、少なくとも1つのタンパク質非コード領域内、または少なくとも1つのタンパク質コード領域及び少なくとも1つのタンパク質非コード領域内の複数の核酸塩基対の編集である。

一部の実施形態では、編集は、1つ以上のガイドポリヌクレオチドと併される。一部の実施形態では、塩基エディターシステムは、1つ以上の塩基エディターシステムを含むことができる。一部の実施形態では、塩基エディターシステムは、1つ以上の塩基エディターシステムを、単一ガイドポリヌクレオチドまたは複数のガイドポリヌクレオチドとともに含むことができる。一部の実施形態では、編集は、単一の塩基エディターシステムを有する1つ以上のガイドポリヌクレオチドと併される。一部の実施形態では、編集は、標的ポリヌクレオチド配列への結合を標的とするためにPAM配列を必要としない少なくとも1つのガイドポリヌクレオチドとともに、または標的ポリヌクレオチド配列への結合を標的とするためにPAM配列を必要とする少なくとも1つのガイドポリヌクレオチドとともに、または標的ポリヌクレオチド配列への結合を標的とするためにPAM配列を必要としない少なくとも1つのガイドポリヌクレオチド及び標的ポリヌクレオチド配列への結合を標的とするためにPAM配列を必要とする少なくとも1つのガイドポリヌクレオチドの混合とともに行われる。本明細書に記載される塩基エディターのいずれかを使用する多重編集の特徴は、本明細書に提供される塩基エディターのいずれかを使用する方法の組み合わせのいずれかに適用され得ることを理解されたい。また、編集は、複数の核酸塩基対の順次編集を含むことができることも理解されたい。

一部の実施形態では、1つ以上の遺伝子における複数の核酸塩基対を多重編集することが可能である塩基エディターシステムは、ABE7、ABE8及び/またはABE9塩基エディターのうちの1つを含む。一部の実施形態では、本明細書に記載されるABE8塩基エディターバリアントのうちの1つを含む、多重編集することが可能である塩基エディターシステムは、ABE7塩基エディターのうちの1つを含む、多重編集することが可能である塩基エディターシステムと比較してより高い多重編集効率を有する。一部の実施形態では、本明細書に記載のABE8塩基エディターバリアントのうちの1つを含む多重編集が可能な塩基エディターシステムは、ABE7塩基エディターのうちの1つを含む多重編集が可能な塩基エディターシステムと比較して、少なくとも1%、少なくとも2%、少なくとも3%、少なくとも4%、少なくとも5%、少なくとも10%、少なくとも15%、少なくとも20%、少なくとも25%、少なくとも30%、少なくとも35%、少なくとも40%、少なくとも45%、少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも99%、少なくとも100%、少なくとも105%、少なくとも110%、少なくとも115%、少なくとも120%、少なくとも125%、少なくとも130%、少なくとも135%、少なくとも140%、少なくとも145%、少なくとも150%、少なくとも155%、少なくとも160%、少なくとも165%、少なくとも170%、少なくとも175%、少なくとも180%、少なくとも185%、少なくとも190%、少なくとも195%、少なくとも200%、少なくとも210%、少なくとも220%、少なくとも230%、少なくとも240%、少なくとも250%、少なくとも260%、少なくとも270%、少なくとも280%、少なくとも290%、少なくとも300%、少なくとも310%、少なくとも320%、少なくとも330%、少なくとも340%、少なくとも350%、少なくとも360%、少なくとも370%、少なくとも380%、少なくとも390%、少なくとも400%、少なくとも450%、または少なくとも500%高い多重編集効率を有する。一部の実施形態では、本明細書に記載のABE8塩基エディターバリアントのうちの1つを含む多重編集可能な塩基エディターシステムは、ABE7塩基エディターのうちの1つを含む多重編集が可能な塩基エディターシステムと比較して、少なくとも1.1倍、少なくとも1.2倍、少なくとも1.3倍、少なくとも1.4倍、少なくとも1.5倍、少なくとも1.6倍、少なくとも1.7倍、少なくとも1.8倍、少なくとも1.9倍、少なくとも2.0倍、少なくとも2.1倍、少なくとも2.2倍、少なくとも2.3倍、少なくとも2.4倍、少なくとも2.5倍、少なくとも2.6倍、少なくとも2.7倍、少なくとも2.8倍、少なくとも2.9倍、少なくとも3.0倍、少なくとも3.1倍、少なくとも3.2倍、少なくとも3.3倍、少なくとも3.4倍、少なくとも3.5倍、少なくとも4.0倍、少なくとも4.5倍、少なくとも5.0倍、少なくとも5.5倍、または少なくとも6.0倍高い多重編集効率を有する。

送達システム
遺伝子(例えば、HBVコアタンパク質(Core)、HBVポリメラーゼ遺伝子(Pol)、HBV表面タンパク質(S)、またはHBVタンパク質X遺伝子(X))における1つ以上のヌクレオチドを標的化するための核酸塩基エディターの適合性は、本明細書に記載されるように評価される。一実施形態では、目的の単一細胞は、本明細書に記載される塩基エディターシステムをコードする1つ以上の核酸分子で、レポーター(例えば、GFP)をコードする少量のベクターと一緒にトランスフェクト、形質導入またはそうでなければ修飾される。これらの細胞は、当該技術分野で既知のいずれかの細胞株(肝細胞及びHEK293細胞を含む)であることができる。代替として、初代細胞(例えば、ヒト)を使用してもよい。細胞は、対象または個体から(例えば、組織生検、手術、血液、血漿、血清、または他の生体液からも得ることができる。そのような細胞は、最終的な細胞標的に関連し得る。

送達は、ウイルスベクターを使用して行ってもよい。一実施形態では、トランスフェクションは、脂質トランスフェクション(例えば、LipofectamineまたはFugene)を使用して、またはエレクトロポレーションによって行ってもよい。トランスフェクション後、レポーター(例えば、GFP)の発現は、蛍光顕微鏡法またはフローサイトメトリーのいずれかによって決定して、一貫した高レベルのトランスフェクションを確認することができる。これらの予備トランスフェクションは、どのエディターの組み合わせが最大の活性を与えるかを決定するために、異なる核酸塩基エディターを含むことができる。システムは、1つ以上の異なるベクターを含むことができる。一実施形態では、塩基エディターは、所望の細胞型、好ましくは真核細胞、好ましくは哺乳動物細胞またはヒト細胞の発現のために、コドン最適化される。

核酸塩基エディターの活性は、本明細書に記載のように、すなわち、細胞のゲノムを配列決定して標的配列における改変を検出することによって、評価される。サンガー配列決定の場合、精製されたPCRアンプリコンをプラスミド骨格にクローニングし、形質転換し、ミニプレッドし、単一のプライマーを用いて配列決定する。配列決定は、次世代配列決定(NGS)技術を使用してもよい。次世代配列決定を使用する場合、アンプリコンは、300～500bpであり得、非対称に配置された意図された切断部位を有する。PCR後、次世代配列決定のアダプター及びバーコード(例えば、Illumina多重アダプター及びマルチプレックスインデックス)を、例えば、ハイスループット配列決定(例えば、Illumina MiSeq)で使用するために、アンプリコンの末端に添加してもよい。初期試験において最大レベルの標的特異的改変を誘導する融合タンパク質を、更なる評価のために選択することができる。

特定の実施形態では、核酸塩基エディターは、目的のポリヌクレオチドを標的化するために使用される。一実施形態では、本発明の核酸塩基エディターは、細胞のゲノム内の1つ以上の目的の核酸配列を標的化するために使用される1つ以上のガイドRNAと併せて、細胞(例えば、肝細胞またはHEK293細胞)に送達され、それによって、標的遺伝子(複数可)(例えば、HBVコアタンパク質(Core)、HBVポリメラーゼ遺伝子(Pol)、HBV表面タンパク質(S)、またはHBVタンパク質X遺伝子(X))を改変させる。一部の実施形態では、塩基エディターは、1つ以上のガイドRNAによって標的指向化されて、1つ以上の目的の遺伝子(例えば、HBVコアタンパク質(Core)、HBVポリメラーゼ遺伝子(Pol)、HBV表面タンパク質(S)、またはHBVタンパク質X遺伝子(X))の配列に、1つ以上の編集を導入する。一部の実施形態では、1つ以上の目的の遺伝子の配列への1つ以上の編集は、宿主細胞(例えば、肝細胞またはHEK293細胞)内の遺伝子によってコードされたタンパク質の発現を低下させるまたは排除する。一部の実施形態では、1つ以上の目的の遺伝子(例えば、HBVコアタンパク質(Core)、HBVポリメラーゼ遺伝子(Pol)、HBV表面タンパク質(S)、またはHBVタンパク質X遺伝子(X))によってコードされる1つ以上のタンパク質の発現は、宿主細胞(例えば、肝細胞またはHEK293細胞)内で完全にノックアウトまたは排除される。

一部の実施形態では、宿主細胞は、哺乳動物細胞である。一部の実施形態では、宿主細胞は、ヒト細胞である。

塩基エディターシステムの核酸ベースの送達
本開示による塩基エディターシステムをコードする核酸分子は、当技術分野で既知の方法により、または本明細書に記載されるように、対象に投与するか、またはインビトロもしくはインビボで細胞に送達することができる。例えば、デアミナーゼ(例えば、シチジンまたはアデニンデアミナーゼ)を含む塩基エディターシステムを、ベクター(例えば、ウイルスまたは非ウイルスベクター)によって、または裸のDNA、DNA複合体、脂質ナノ粒子、もしくは前述の組成物の組み合わせによって送達することができる。

有機または無機のナノ粒子は、塩基エディターシステムまたはその成分を送達する上で有用である。ナノ粒子は当技術分野で周知であり、任意の好適なナノ粒子を使用して、塩基エディターシステムもしくはその成分、またはそのような成分をコードする核酸分子を送達することができる。一例では、有機(例えば、脂質及び/またはポリマー)ナノ粒子は、本開示の特定の実施形態における送達ビヒクルとしての使用に好適である。表17(以下)に、ナノ粒子製剤、及び/または遺伝子導入に使用するための例示的な脂質を示す。

表18は、遺伝子導入及び/またはナノ粒子製剤に使用される例示的なポリマーを列挙する。

表19は、本明細書に記載の融合タンパク質をコードするポリヌクレオチドの送達方法を要約する。

別の態様では、塩基エディターシステム構成要素またはそのような構成要素をコードする核酸、例えば、ポリヌクレオチドプログラマブルヌクレオチド結合ドメイン(例えば、Cas9)、例えば、Cas9またはそのバリアント、及び目的の核酸配列を標的とするgRNAの送達は、リボ核タンパク質(RNP)を細胞に送達することによって達成され得る。RNPは、ポリヌクレオチドプログラマブルヌクレオチド結合ドメイン(例えば、Cas9)を、標的gRNAとの複合体内に含む。本明細書に記載されるRNPまたはポリヌクレオチドは、既知の方法、例えば、エレクトロポレーション、ヌクレオフェクションまたはカチオン性脂質を媒介する方法を使用して、細胞に送達され得、カチオン性脂質を媒介する方法は、例えば、Zuris,J.A.et al.,2015,Nat.Biotechnology,33(1):73-80に報告されており、これは、その全体が参照により援用される。RNPは、CRISPR塩基エディターシステムでの使用に有利であり、特に、トランスフェクトが困難な細胞(例えば、初代細胞)に有利である。加えて、RNPはまた、特に、CRISPRプラスミドにおいて使用され得る真核生物プロモーター(例えば、CMVまたはEF1A)が十分に発現していない場合、細胞内のタンパク質発現で生じ得る困難を緩和することができる。有利には、RNPの使用は、細胞内への外来DNAの送達を必要としない。更に、核酸結合タンパク質とgRNA複合体とを含むRNPは、時間とともに分解されるため、RNPの使用は、オフターゲット効果を制限する可能性がある。プラスミドベースの技術の場合と同様の様式で、RNPを使用して、結合タンパク質(例えば、Cas9バリアント)を送達し、相同組換え修復(HDR)を誘導することができる。

塩基エディターシステムをコードする核酸分子は、ネイキッドDNAもしくはRNAとして、例えば、トランスフェクションもしくはエレクトロポレーションによって、細胞(例えば、肝細胞)に直接送達されてもよく、または標的細胞による取り込みを促進する分子(例えば、N-アセチルガラクトサミン)にコンジュゲートされてもよい。塩基エディターシステム及び/またはそれらの構成要素をコードするベクターもまた、使用され得る。特定の実施形態では、ポリヌクレオチド、例えば、塩基エディターシステムまたはその機能的構成要素をコードするmRNAは、本明細書に記載される1つ以上のガイドRNAとともに共エレクトロポレーションされ得る。

核酸ベクターは、本明細書に記載の融合タンパク質のドメインをコードする1つ以上の配列を含むことができる。ベクターはまた、核局在化シグナル、核小体局在化シグナルまたはミトコンドリア局在化シグナルに動作可能に連結された、塩基エディターシステムのタンパク質構成要素をコードすることができる。一例として、ベクターは、Cas9コード配列を含むことができ、Cas9コード配列は、1つ以上の核局在化配列(例えば、SV40からの核局在化配列)と、1つ以上のデアミナーゼとを含む。

ベクターはまた、いずれかの好適な数の調節/制御エレメント、例えば、プロモーター、エンハンサー、イントロン、ポリアデニル化シグナル、コザックコンセンサス配列または配列内リボソーム進入部位(IRES)を含むことができる。これらのエレメントは、当該技術分野で周知である。

本開示によるベクターは、組換えウイルスベクターを含む。例示的なウイルスベクターは、上記の本明細書に記載されている。当該技術分野で既知の他のウイルスベクターも使用することができる。加えて、ウイルス粒子は、核酸及び/またはタンパク質の形態の塩基エディターシステム構成要素を送達するために使用され得る。例えば、「空の」ウイルス粒子は、カーゴとしての塩基エディターシステムまたは構成要素を含有するように構築され得る。ウイルスベクター及びウイルス粒子は、標的組織特異性を改変するために、標的指向化リガンドを組み込むように操作することもできる。

本明細書に記載されるベクターは、塩基エディターシステムまたはその構成要素の発現を駆動するための調節エレメントを含み得る。そのようなベクターは、長い逆位末端リピート(AAV ITR)を有するアデノ随伴ウイルスを含む。AAV ITRの使用は、ベクターにおけるスペースを取り得る追加のプロモーターエレメントの必要性を排除するために有利であり得る。解放された追加の空間を使用して、追加のエレメント(例えば、ガイド核酸または選択可能なマーカー)の発現を駆動することができる。ITR活性は、過剰発現に起因する潜在的な毒性を低減するために使用され得る。

いずれかの好適なプロモーターが、塩基エディターシステムまたはその構成要素の発現を駆動するために使用され得、適切な場合、ガイド核酸の発現を駆動するために使用され得る。遍在的発現については、プロモーターは、CMV、CAG、CBh、PGK、SV40、フェリチン重鎖または軽鎖を含む。脳または他のCNS細胞発現については、好適なプロモーターは、全てのニューロンのためのシナプシンI、興奮性ニューロンのためのCaMKIIアルファ、GABA作動性ニューロンのためのGAD67またはGAD65またはVGATを含む。肝細胞発現については、好適なプロモーターは、アルブミンプロモーターを含む。肺細胞発現については、好適なプロモーターは、SP-Bを含む。内皮細胞については、好適なプロモーターは、ICAMを含む。造血細胞発現については、好適なプロモーターは、IFNベータまたはCD45を含む。骨芽細胞発現については、好適なプロモーターは、OG-2を含むことができる。

一部の実施形態では、本開示の塩基エディターは、別個のプロモーターが同じ核酸分子内の塩基エディター及び適合性ガイド核酸の発現を駆動することを可能にするのに十分に小さいサイズのものである。例えば、ベクターまたはウイルスベクターは、塩基エディターをコードする核酸に作動可能に連結された第1のプロモーターと、ガイド核酸に作動可能に連結された第2のプロモーターとを含むことができる。

ガイド核酸の発現を駆動するために使用されるプロモーターは、U6またはH1などのPol IIIプロモーター、gRNAアデノ随伴ウイルス(AAV)を発現させるための、Pol IIプロモーター及びイントロンカセットの使用を含むことができる。

特定の実施形態では、本発明の融合タンパク質は、ウイルスベクター(例えば、アデノ随伴ウイルス(AAV)、AAV3、AAV3b、AAV4、AAV5、AAV6、AAV7、AAV8、AAV9、AAVrh8、AAV10、及びそれらのバリアント)中に存在するポリヌクレオチド、または任意のウイルスベクターの好適なカプシドタンパク質によってコードされる。したがって、一部の態様では、本開示は、融合タンパク質のウイルス送達に関する。ウイルスベクターの例としては、レトロウイルスベクター(例えば、マロニー(Maloney)マウス白血病ウイルス、MML-V)、アデノウイルスベクター(例えば、AD100)、レンチウイルスベクター(HIV及びFIVベースのベクター)、ヘルペスウイルスベクター(例えば、HSV-2)が挙げられる。

一部の態様では、細胞における特定の遺伝子を編集するための本明細書に記載の方法を使用して、細胞を遺伝子修飾することができる。

ウイルスベクター
したがって、本明細書に記載の塩基エディターは、ウイルスベクターとともに送達され得る。一部の実施形態では、本明細書に開示される塩基エディターは、ウイルスベクターに含有される核酸上にコードされ得る。一部の実施形態では、塩基エディターシステムの1つ以上の成分は、1つ以上のウイルスベクター上にコードされ得る。例えば、塩基エディター及びガイド核酸は、単一のウイルスベクター上にコードされ得る。他の実施形態では、塩基エディター及びガイド核酸は、異なるウイルスベクター上にコードされる。いずれの場合も、塩基エディター及びガイド核酸は、各々、プロモーター及びターミネーターに作動可能に連結され得る。ウイルスベクター上にコードされる成分の組み合わせは、選択されたウイルスベクターのカーゴサイズ制約によって決定され得る。

塩基エディターの送達のためのRNAまたはDNAウイルスベースのシステムの使用は、培養物中または宿主内の特定の細胞にウイルスを標的指向化し、ウイルスペイロードを核または宿主細胞ゲノムに輸送するための高度に進化したプロセスを利用する。ウイルスベクターは、培養物中の細胞、患者に(インビボで)直接投与することができ、または、インビトロで細胞を処理するためにそれらを使用することができ、修飾細胞は、任意選択的に(エクスビボで)患者に投与され得る。従来のウイルスベースのシステムは、遺伝子導入用のレトロウイルス、レンチウイルス、アデノウイルス、アデノ随伴ウイルス、及び単純ヘルペスウイルスのベクターを含み得る。宿主ゲノムへの組み込みは、レトロウイルス、レンチウイルス、及びアデノ随伴ウイルスの遺伝子導入法で可能であり、多くの場合、挿入された導入遺伝子の長期発現をもたらす。加えて、多くの異なる細胞型及び標的組織において、高い形質導入効率が観察されている。

ウイルスベクターとしては、レンチウイルスベクター(例えば、HIV及びFIVベースのベクター)、アデノウイルスベクター(例えば、AD100)、レトロウイルスベクター(例えば、マロニーマウス白血病ウイルス、MML-V)、ヘルペスウイルスベクター(例えば、HSV-2)、及びアデノ随伴ウイルス(AAV)ベクター、または他のプラスミドまたはウイルスベクタータイプが挙げられ得、例えば、米国特許第8,454,972号(アデノウイルスのための製剤、用量)、米国特許第8,404,658号(AAVのための製剤、用量)、及び米国特許第5,846,946号(DNAプラスミドのための製剤、用量)からの製剤及び用量、ならびにレンチウイルス、AAV、及びアデノウイルスを伴う臨床試験に関する臨床試験及び刊行物からの製剤及び用量が使用される。例えば、AAVの場合、投与経路、製剤、及び投与量は、米国特許第8,454,972号及びAAVを伴う臨床試験と同様であり得る。アデノウイルスの場合、投与経路、製剤、及び投与量は、米国特許第8,404,658号及びアデノウイルスを伴う臨床試験と同様であり得る。プラスミド送達の場合、投与経路、製剤、及び投与量は、米国特許第5,846,946号及びプラスミドを伴う臨床試験と同様であり得る。用量は、平均70kgの個体(例えば、成体ヒト男性)に基づくか、または推定され得、患者、対象、異なる体重及び種の哺乳類に対して調整され得る。投与頻度は、年齢、性別、全般的な健康状態、患者もしくは対象の他の状態、及び対処される特定の状態もしくは症状を含む通常の要因に応じて、医師または獣医(例えば、医師、獣医)の範疇である。ウイルスベクターは、目的の組織に注射され得る。細胞型特異的塩基エディターの場合、塩基エディター及び任意選択のガイド核酸の発現は、細胞型特異的プロモーターによって駆動され得る。

レトロウイルスの内性を、外来のエンベロープタンパク質を組み込むことによって変化させることができ、標的細胞の可能性のある標的集団を拡大する。レンチウイルスベクターは、非分裂細胞を形質導入または感染させることができ、典型的には、高いウイルス力価を生成するレトロウイルスベクターである。したがって、レトロウイルス遺伝子導入システムの選択は、標的組織に依存することになる。レトロウイルスベクターは、最大6～10kbの外来配列のパッケージング容量を有する、シス作用性の長鎖末端反復からなる。最小のシス作用性LTRは、ベクターの複製及びパッケージングに十分であり、次いで、治療用遺伝子を標的細胞に組み込んで、永続的な導入遺伝子の発現を提供するために使用される。広く使用されているレトロウイルスベクターは、マウス白血病ウイルス(MuLV)、テナガザル白血病ウイルス(GaLV)、サル免疫不全ウイルス(SIV)、ヒト免疫不全ウイルス(HIV)及びそれらの組み合わせに基づくものを含む(例えば、Buchscher et al.,J.Virol.66:2731-2739(1992)、Johann et al.,J.Virol.66:1635-1640(1992)、Sommnerfelt et al.,Virol.176:58-59(1990)、Wilson et al.,J.Virol.63:2374-2378(1989)、Miller et al.,J.Virol.65:2220-2224(1991)、PCT/US94/05700を参照されたい)。

レトロウイルスベクター、特に、レンチウイルスベクターは、標的細胞への効率的な組み込みのために、所与の長さよりも小さいポリヌクレオチド配列を必要とし得る。例えば、9kbを超える長さのレトロウイルスベクターは、より小さいサイズのものと比較して、低いウイルス力価をもたらし得る。一部の態様では、本開示の塩基エディターは、効率的なパッケージング及びレトロウイルスベクターを介した標的細胞への送達を可能にするように十分なサイズである。一部の実施形態では、塩基エディターは、ガイド核酸及び/または標的指向化可能なヌクレアーゼシステムの他の成分と一緒に発現された場合でも、効率的なパッキング及び送達を可能にするようなサイズである。

パッケージング細胞は、典型的には、宿主細胞に感染することが可能なウイルス粒子を形成するために使用される。そのような細胞には、アデノウイルスをパッケージングする293細胞、及びレトロウイルスをパッケージングするpsi.2細胞またはPA317細胞が含まれる。遺伝子療法に使用されるウイルスベクターは、通常、核酸ベクターをウイルス粒子にパッケージングする細胞株を産生することによって生成される。ベクターは、典型的には、パッケージング及びその後の宿主への組み込みに必要な最小限のウイルス配列を含有し、他のウイルス配列は、発現されるポリヌクレオチド(複数可)のための発現カセットによって置き換えられる。欠損したウイルス機能は、典型的には、パッケージング細胞株によってトランスで供給される。例えば、遺伝子療法で使用されるアデノ随伴ウイルス(「AAV」)ベクターは、典型的には、宿主ゲノムへのパッケージング及び組み込みに必要なAAVゲノム由来のITR配列のみを有する。ウイルスDNAは、他のAAV遺伝子(すなわち、rep及びcap)をコードするがITR配列を欠くヘルパープラスミドを含有する細胞株にパッケージングすることができる。細胞株は、ヘルパーとしてアデノウイルスで感染され得る。ヘルパーウイルスは、AAVベクターの複製及びヘルパープラスミド由来のAAV遺伝子の発現を促進することができる。場合によっては、ヘルパープラスミドは、ITR配列を欠くために、かなりの量でパッケージ化されない。アデノウイルスによる汚染は、例えば、アデノウイルスがAAVよりも感受性が高い熱処理によって低減され得る。

一過的な発現が好ましい用途では、アデノウイルスベースのシステムを使用することができる。アデノウイルスベースのベクターは、多くの細胞型において非常に高い形質導入効率を有することが可能であり、細胞分裂を必要としない。このようなベクターを用いて、高い力価及び発現レベルが得られている。このベクターは、比較的単純なシステムで大量に産生され得る。アデノ随伴ウイルス(「AAV」)ベクターは、例えば、核酸及びペプチドのインビトロ産生において、インビボ及びエクスビボ遺伝子療法手順のために、標的核酸を用いて細胞を形質導入するために使用することもできる(例えば、West et al.,Virology 160:38-47(1987)、米国特許第4,797,368号、WO93/24641、Kotin,Human Gene Therapy 5:793-801(1994)、Muzyczka,J.Clin.Invest.94:1351(1994)を参照されたい)。組換えAAVベクターの構築は、いくつかの刊行物に記載されており、これらの刊行物は、米国特許第5,173,414号、Tratschin et al.,Mol.Cell.Biol.5:3251-3260(1985)、Tratschin,et al.,Mol.Cell.Biol.4:2072-2081(1984)、Hermonat & Muzyczka,PNAS 81:6466-6470(1984)及びSamulski et al.,J.Virol.63:03822-3828(1989)を含む。

AAVは、パルボウイルス科に属する小型の一本鎖DNA依存性ウイルスである。4.7kbの野生型(wt)AAVゲノムは、それぞれ4つの複製タンパク質と3つのカプシドタンパク質とをコードする2つの遺伝子で構成され、両側に145bpの逆位末端反復(ITR)が隣接している。ビリオンは、3つのカプシドタンパク質であるVp1、Vp2、及びVp3から構成され、同じオープンリーディングフレームから1:1:10の比率で生成されるが、差次的スプライシング(Vp1)及び選択的翻訳開始部位(それぞれ、Vp2及びVp3)から産生される。Vp3は、ビリオン内で最も豊富なサブユニットであり、ウイルスのトロピズムを定義する細胞表面での受容体認識に関与する。ウイルス感染性において機能するホスホリパーゼドメインは、Vp1の固有のN末端に特定されている。

wt AAVと同様に、組換えAAV(rAAV)は、隣接ベクター導入遺伝子カセットに対する145bpのシス作用性ITRを利用し、外来DNAのパッケージングのために最大4.5kbを提供する。感染後、rAAVは、本発明の融合タンパク質を発現することができ、環状ヘッド・トゥ・テール(head-to-tail)コンカテマーでエピソーム的に存在することによって、宿主ゲノムに組み込まれることなく持続する。このシステムをインビトロ及びインビボで使用したrAAVの成功例は多数あるが、遺伝子のコード配列の長さがwt AAVゲノムと同等またはそれ以上である場合、パッケージング容量の制限により、AAV媒介性遺伝子送達の使用が制限される。

ウイルスベクターは、用途に基づいて選択することができる。例えば、インビボでの遺伝子送達の場合、AAVは、他のウイルスベクターよりも有利であり得る。一部の実施形態では、AAVは低毒性を可能にし、これは、免疫応答を活性化し得る細胞粒子の超遠心分離を必要としない精製方法に起因し得る。一部の実施形態では、AAVは、宿主ゲノムに組み込まれないため、挿入変異誘発を引き起こす可能性が低くなる。アデノウイルスは、それらが強い免疫原性応答を誘導するため、ワクチンとして一般的に使用される。ウイルスベクターのパッケージング容量は、ベクターにパッケージングされ得る塩基エディターのサイズを制限し得る。

AAVは、2つの145塩基の逆位末端反復(ITR)を含む、約4.5Kbまたは4.75Kbのパッケージング容量を有する。これは、開示される塩基エディター、ならびにプロモーター及び転写ターミネーターが、単一のウイルスベクターに適合され得ることを意味する。4.5Kbまたは4.75Kbを超える構築物は、ウイルス産生の著しい低減をもたらし得る。例えば、SpCas9はかなり大きく、遺伝子自体は4.1Kb超であり、これは、AAV内へのパッケージングを困難にする。したがって、本開示の実施形態は、従来の塩基エディターよりも長さが短い開示される塩基エディターの利用を含む。一部の実施例では、塩基エディターは、4kb未満である。開示される塩基エディターは、4.5kb、4.4kb、4.3kb、4.2kb、4.1kb、4kb、3.9kb、3.8kb、3.7kb、3.6kb、3.5kb、3.4kb、3.3kb、3.2kb、3.1kb、3kb、2.9kb、2.8kb、2.7kb、2.6kb、2.5kb、2kb、または1.5kb未満であり得る。一部の実施形態では、本開示の塩基エディターの長さは、4.5kb以下である。

AAVは、AAV1、AAV2、AAV5、またはそれらの任意の組み合わせであり得る。AAVのタイプは、標的とされる細胞に関して選択され得、例えば、AAV血清型1、2、5もしくはハイブリッドカプシドAAV1、AAV2、AAV5、またはそれらのいずれかの組み合わせが、脳またはニューロン細胞を標的化するために選択され得、AAV4が、心臓組織を標的化するために選択され得る。AAV8は、肝臓への送達に有用である。これらの細胞に関する特定のAAV血清型の表は、Grimm,D.et al,J.Virol.82:5887-5911(2008)に見出すことができる。

一部の実施形態では、レンチウイルスベクターは、目的の細胞を、塩基エディターシステムをコードするポリヌクレオチドで形質導入するために使用される。レンチウイルスは複雑なレトロウイルスであり、分裂細胞と分裂終了細胞の両方において感染し、それらの遺伝子を発現する能力を有する。最も一般的に既知のレンチウイルスは、ヒト免疫不全ウイルス(HIV)であり、他のウイルスのエンベロープ糖タンパク質を使用して、広範囲の細胞型を標的化する。

レンチウイルスは、以下のように調製することができる。pCasES10(レンチウイルス転写プラスミド骨格を含有する)をクローニングした後、トランスフェクションの前日に、低継代(p=5)のHEK293FTを、10%ウシ胎仔血清を含み抗生物質を含まないDMEM中で、T-75フラスコ内で50%コンフルエンスに播種した。20時間後、培地をOptiMEM(無血清)培地に交換し、4時間後にトランスフェクションを行った。細胞に、10μgのレンチウイルス導入プラスミド(pCasES10)及び以下のパッケージングプラスミドをトランスフェクトする:5μgのpMD2.G(VSV-gシュードタイプ)、及び7.5μgのpsPAX2(gag/pol/rev/tat)。トランスフェクションは、カチオン性脂質送達剤(50μlのLipofectamine 2000及び100μlのPlus試薬)を含む4mLのOptiMEM中で行うことができる。6時間後、培地を、10%胎仔ウシ血清を含み抗生物質を含まないDMEMに交換する。これらの方法は、細胞培養中に血清を使用するが、無血清の方法が好ましい。

レンチウイルスは、以下のように精製することができる。ウイルス上清を48時間後に回収する。上清は、最初にデブリを除去し、0.45μmの低タンパク質結合(PVDF)フィルターを通して濾過する。次いで、超遠心分離機で、24,000rpmで2時間スピンする。ウイルスペレットを、50μlのDMEM中に、4℃で一晩再懸濁する。次いで、それらをアリコートし、-80℃ですぐに凍結する。

別の実施形態では、ウマ伝染性貧血ウイルス(EIAV)に基づく最小非霊長類レンチウイルスベクターも企図される。別の実施形態では、RetinoStat(登録商標)は、ウマ伝染性貧血ウイルスベースのレンチウイルス遺伝子療法ベクターであり、血管新生抑制タンパク質であるエンドスタチン及びアンジオスタチンを発現し、これは、網膜下注射によって送達されることが企図される。別の実施形態では、自己不活性化レンチウイルスベクターの使用が企図される。

システムの任意のRNA、例えば、ガイドRNAまたは塩基エディターをコードするmRNAは、RNAの形態で送達され得る。塩基エディターをコードするmRNAは、インビトロ転写を使用して生成することができる。例えば、ヌクレアーゼのmRNAは、以下のエレメントを含有するPCRカセットを使用して合成することができる:T7プロモーター、任意選択のコザック配列(GCCACC)、ヌクレアーゼ配列及び3’UTR、例えば、ベータグロビン-ポリAテールからの3’UTR。カセットは、T7ポリメラーゼによる転写に使用することができる。ガイドポリヌクレオチド(例えば、gRNA)は、T7プロモーター、続いて、配列「GG」、及びガイドポリヌクレオチド配列を含有するカセットからのインビトロ転写を使用して転写することもできる。

発現を増強し、可能性のある毒性を低減するために、塩基エディターのコード配列及び/またはガイド核酸は、例えば、シュードUまたは5-メチルCを使用して、1つ以上の修飾ヌクレオシドを含むように修飾され得る。

AAVベクターの小さなパッケージング容量は、このサイズを超えるいくつかの遺伝子の送達及び/または大きな生理学的調節エレメントの使用を困難にする。これらの課題は、例えば、送達されるタンパク質(複数可)を2つ以上の断片に分割することによって対処することができ、N末端断片は、スプリットインテイン-Nに融合され、C末端断片は、スプリットインテイン-Cに融合される。次いで、これらの断片は、2つ以上のAAVベクターにパッケージングされる。本明細書で使用される場合、「インテイン」とは、隣接するN末端及びC末端のエクステイン(例えば、連結される断片)をライゲーションする自己スプライシングタンパク質のイントロン(例えば、ペプチド)を指す。異種タンパク質断片を結合するための、特定のインテインの使用は、例えば、Wood et al.,J.Biol.Chem.289(21);14512-9(2014)に記載されている。インテインのIntN及びIntCは、例えば、タンパク質断片を分離するために融合された場合、互いを認識し、それらがスプライシングで除かれ、同時に、それらが融合されたタンパク質断片の隣接するN末端エクステイン及びC末端エクステインがライゲーションされ、それによって、2つのタンパク質断片から全長タンパク質が再構成される。他の好適なインテインは、当業者には明らかであろう。

本発明の融合タンパク質の断片は、長さが変化し得る。一部の実施形態では、タンパク質断片は、2アミノ酸長～約1000アミノ酸長の範囲である。一部の実施形態では、タンパク質断片は、約5アミノ酸長～約500アミノ酸長の範囲である。一部の実施形態では、タンパク質断片は、約20アミノ酸長～約200アミノ酸長の範囲である。一部の実施形態では、タンパク質断片は、約10アミノ酸長～約100アミノ酸長の範囲である。他の長さの好適なタンパク質断片は、当業者には明らかであろう。

一実施形態では、デュアルAAVベクターは、大きな導入遺伝子発現カセットを2つの別々の半分(5’末端及び3’末端、または頭部及び尾部)に分割することによって生成され、カセットの各半分は、単一のAAVベクター(5kb未満)にパッケージングされる。次いで、全長の導入遺伝子発現カセットの再構築は、両方のデュアルAAVベクター、続いて、(1)5’ゲノムと3’ゲノムとの間の相同組換え(HR)(デュアルAAV重複ベクター)、(2)5’ゲノムと3’ゲノムとのITR媒介性テール・トゥ・ヘッド(tail-to-head)コンカテマー化(デュアルAAVトランススプライシングベクター)、または(3)これらの2つの機構の組み合わせ(デュアルAAVハイブリッドベクター)によって同じ細胞を同時感染させると達成される。インビボでのデュアルAAVベクターの使用は、全長タンパク質の発現をもたらす。デュアルAAVベクタープラットフォームの使用は、サイズが4.7kb超の導入遺伝子のための効率的かつ実行可能な遺伝子導入戦略を表す。

インテイン
インテイン(介在タンパク質)は、タンパク質スプライシングとして知られるプロセスを行う様々な多様な生物に見られる自動処理ドメインである。タンパク質スプライシングは、ペプチド結合の切断及び形成の両方からなる多段階の生化学反応である。タンパク質スプライシングの内因性基質は、インテイン含有生物に見出されるが、インテインは、事実上、任意のポリペプチド骨格を化学的に操作するために使用することもできる。

タンパク質スプライシングでは、インテインは、2つのペプチド結合を切断することによって前駆体ポリペプチドから自ら切除し、それによって、新たなペプチド結合の形成を介して隣接するエクセイン(外部タンパク質)配列をライゲーションする。この再編成は、翻訳後(または、場合によっては翻訳時(co-translationally))に起こる。インテイン媒介性タンパク質スプライシングは、インテインドメインのフォールディングのみを必要とする、自発的に起こる。

インテインの約5%はスプリットインテインであり、これらは2つの別個のポリペプチド(N-インテイン及びC-インテイン)として転写及び翻訳され、各々が1つのエクステインに融合される。翻訳時に、インテイン断片は、正準インテイン構造に自発的かつ非共有結合的に構築され、トランスでタンパク質スプライシングを行う。タンパク質スプライシングのメカニズムは、インテイン-エクステイン接合部における2つのペプチド結合の切断、及びN-エクステインとC-エクステインとの間の新しいペプチド結合の形成をもたらす一連のアシル転位反応を伴う。このプロセスは、N-エクステインとインテインのN末端とを結合するペプチド結合の活性化によって開始される。ほぼ全てのインテインは、C末端N-エクステイン残基のカルボニル炭素を攻撃するシステインまたはセリンを、N末端に有する。このN～O/Sアシル転位(acyl-shift)は、一般的に見出されるアスパラギン酸とともに、保存されたスレオニン及びヒスチジン(TXXHモチーフと称される)によって促進され、直鎖(チオ)エステル中間体の形成をもたらす。次に、この中間体は、システイン、セリン、またはスレオニンである第1のC-エクステイン残基(+1)の求核攻撃によるトランス(チオ)エステル化に供される。得られた分枝(チオ)エステル中間体は、インテインの高度に保存されたC末端アスパラギンの環化という固有の変換によって解決される。このプロセスは、ヒスチジン(高度に保存されたHNFモチーフ中に見出される)及び最後から2番目のヒスチジンによって促進され、アスパラギン酸もまた関与し得る。このスクシンイミド形成反応は、反応性複合体からインテインを切除し、非ペプチド結合を介して結合したエクステインを残す。この構造は、インテイン非依存的な様式で急速に安定なペプチド結合に再編成される。

一部の実施形態では、ヌクレアーゼ(例えば、Cas9)の一部分または断片がインテインに融合される。ヌクレアーゼは、インテインのN末端またはC末端に融合され得る。一部の実施形態では、融合タンパク質の一部分または断片は、インテインに融合され、AAVカプシドタンパク質に融合される。インテイン、ヌクレアーゼ、及びカプシドタンパク質は、任意の配置(例えば、ヌクレアーゼ-インテイン-カプシド、インテイン-ヌクレアーゼ-カプシド、カプシド-インテイン-ヌクレアーゼなど)で一緒に融合され得る。一部の実施形態では、塩基エディターのN末端断片(例えば、ABE、CBE)は、スプリットインテイン-Nに融合され、C末端断片は、スプリットインテイン-Cに融合される。これらの断片は、次いで、2つ以上のAAVベクターにパッケージングされる。一部の実施形態では、インテインのN末端は、融合タンパク質のC末端に融合され、インテインのC末端は、AAVカプシドタンパク質のN末端に融合される。

一実施形態では、インテインは、AAVカプシドタンパク質上に移植されるシチジンデアミナーゼまたはアデノシンデアミナーゼ塩基エディタータンパク質の断片または部分を接合するために利用される。異種タンパク質断片を結合するための、特定のインテインの使用は、例えば、Wood et al.,J.Biol.Chem.289(21);14512-9(2014)に記載されている。インテインのIntN及びIntCは、例えば、タンパク質断片を分離するために融合された場合、互いを認識し、それらがスプライシングで除かれ、同時に、それらが融合されたタンパク質断片の隣接するN末端エクステイン及びC末端エクステインがライゲーションされ、それによって、2つのタンパク質断片から全長タンパク質が再構成される。他の好適なインテインは、当業者には明らかであろう。

一部の実施形態では、ABEは、SpCas9の選択された領域内のAla、Ser、Thr、またはCys残基において、N末端断片及びC末端断片に分割された。これらの領域は、Cas9結晶構造解析によって特定されたループ領域に対応する。

アミノ酸位置S303、T310、T313、S355、A456、S460、A463、T466、S469、T472、T474、C574、S577、A589及びS590で、各々の断片のN末端は、インテイン-Nに融合されており、各々の断片のC末端は、インテイン-Cに融合されており、これらのアミノ酸位置は、(「Cas9参照配列」と称される)以下の配列において大文字で示される。

医薬組成物
一部の態様では、本発明は、本明細書に記載の遺伝子修飾細胞、塩基エディター、融合タンパク質、または融合タンパク質-ガイドポリヌクレオチド複合体のうちのいずれかを含む医薬組成物を提供する。

実施形態では、本開示の医薬組成物は、レトロウイルス感染症(例えば、HBV感染症)の治療のための抗レトロウイルス薬(例えば、ラミブジン)を含む。抗レトロウイルス薬の非限定的な例としては、アデホビル、テノホビル、テルビブジン、インターフェロン(例えば、インターフェロンアルファ-2b(イントロンA)、Peg-インターフェロン)、リンホトキシンβ受容体(LTBR)、ヌクレオシド/ヌクレオチド逆転写酵素阻害剤(NRTI)(例えば、アバカビル(Ziagen)、ジダノシン、エムトリシタビン(Emtriva)、ラミブジン(Epivir)、スタブジン、テノホビル・ジソプロキシル・フマル酸塩(Viread)、テノホビル・アラフェナミド、及びジドブジン(Retrovir))、非ヌクレオシド逆転写酵素阻害剤(NNRTI)(例えば、デラビルジン、ドラビリン(Pifeltro)、エファビレンツ(Sustiva)、エトラビリン(Intelence)、ネビラピン(Viramune)、リルピビリン(Edurant)、及びデラビルジン)、付着後阻害剤またはモノクローナル抗体(例えば、Ibalizumab-uiyk)、CCR5アンタゴニスト(例えば、マラビロク)、アタザナビル、ダルナビル、コビシスタット、ロピナビル、マラビロク、ネビラピン、リルピビリン、エルビテグラビル+TDF+FTC+コビシスタット、エルビテグラビル+TAF+FTC+コビシスタット、インテグラーゼ阻害剤(例えば、ビクテグラビル、カボテグラビル、カボテグラビルとリルピビリン、ドルテグラビル、エルビテグラビル、ホスアンプレナビル(Lexiva、Telzir)、及びラルテグラビル)、融合阻害剤(エンフビルチドなど)、進入阻害剤(例えば、マラビロク)、プロテアーゼ阻害剤(PI)(例えば、アタザナビル、ダルナビル、ロピナビル、インジナビル(Crixivan)、ロピナビル/リトナビル(Kaletra)、リトナビル(Norvir)、サキナビル(Invirase)、及びチプラナビル(Aptivus))、付着及び付着後阻害剤(例えば、フォステムサビル、イバリズマブ)、ならびにエンテカビルが挙げられる。一実施形態では、抗レトロウイルス薬は、ラミブジン、エンテカビル、テノホビル、インターフェロン、及びPeg-インターフェロンのうちの1つ以上から選択される。

本発明の医薬組成物は、既知の技術に従って調製することができる。例えば、Remington,The Science And Practice of Pharmacy(21st ed.2005)を参照されたい。概して、細胞、その集団、塩基エディター、融合タンパク質、または本開示の組成物の任意の他の成分は、投与または貯蔵の前に、好適な担体と混合され、一部の実施形態では、医薬組成物は、薬学的に許容される担体を更に含む。好適な薬学的に許容される担体は、概して、不活性物質を含み、医薬組成物を対象に投与するのを助けるか、医薬組成物を送達可能な調製物に加工するのを助けるか、または投与前に医薬組成物を保管するのを助ける。薬学的に許容される担体は、製剤の形態、一貫性、粘性、pH、薬物動態、溶解性を、安定化、最適化、またはその他改変させ得る薬剤を含むことができる。そのような薬剤には、緩衝剤、湿潤剤、乳化剤、希釈剤、封入剤、及び皮膚浸透促進剤が含まれる。例えば、担体には、生理食塩水、緩衝生理食塩水、デキストロース、アルギニン、スクロース、水、グリセロール、エタノール、ソルビトール、デキストラン、カルボキシメチルセルロースナトリウム、及びそれらの組み合わせが含まれ得るが、これらに限定されない。

薬学的に許容される担体としての役割を果たすことができる材料のいくつかの非限定的な例としては、以下が挙げられる:(1)糖類(例えば、乳糖、グルコース及びスクロース)、(2)デンプン(例えば、トウモロコシデンプン及びジャガイモデンプン)、(3)セルロース及びその誘導体(例えば、カルボキシメチルセルロースナトリウム、メチルセルロース、エチルセルロース、微結晶セルロース、及び酢酸セルロース)、(4)粉末トラガント、(5)麦芽、(6)ゼラチン、(7)潤滑剤(例えば、ステアリン酸マグネシウム、ラウリル硫酸ナトリウム、及びタルク)、(8)賦形剤(例えば、ココアバター及び坐剤ワックス)、(9)油(例えば、ピーナッツ油、綿実油、紅花油、ゴマ油、オリーブ油、トウモロコシ油、及び大豆油)、(10)グリコール(例えば、プロピレングリコール)、(11)ポリオール(例えば、グリセリン、ソルビトール、マンニトール、及びポリエチレングリコール(PEG))、(12)エステル(例えば、オレイン酸エチル及びラウリン酸エチル)、(13)寒天、(14)緩衝剤(例えば、水酸化マグネシウム及び水酸化アルミニウム)、(15)アルギン酸、(16)パイロジェンフリー水、(17)等張生理食塩水、(18)リンゲル溶液、(19)エチルアルコール、(20)pH緩衝溶液、(21)ポリエステル、ポリカーボネート、及び/またはポリ酸無水物、(22)膨張剤(例えば、ポリペプチド及びアミノ酸)、(23)血清アルコール(例えば、エタノール)、ならびに(23)薬学的製剤に用いられる他の非毒性の適合性物質。湿潤剤、着色剤、剥離剤、コーティング剤、甘味剤、香味剤、芳香剤、防腐剤、及び抗酸化剤も、製剤中に存在してもよい。

医薬組成物は、製剤のpHを、生理学的pHを反映する所定のレベルに(例えば、約5.0～約8.0の範囲に)維持するために、1つ以上のpH緩衝化合物を含むことができる。水性液体製剤に使用されるpH緩衝化合物は、アミノ酸、またはアミノ酸の混合物(例えば、ヒスチジン、またはヒスチジン及びグリシンなどのアミノ酸の混合物)であり得る。代替として、pH緩衝化合物は、好ましくは、製剤のpHを所定のレベル、例えば、約5.0～約8.0の範囲に維持し、カルシウムイオンをキレート化しない薬剤である。そのようなpH緩衝化合物の例示的な例としては、イミダゾール及び酢酸イオンが挙げられるが、これらに限定されない。pH緩衝化合物は、製剤のpHを所定のレベルに維持するのに好適な任意の量で存在してもよい。

医薬組成物はまた、1つ以上の浸透圧調節剤、すなわち、製剤の浸透圧特性(例えば、張力、オスモラリティ、及び/または浸透圧)を、レシピエント個体の血流及び血液細胞で許容されるレベルに調節する化合物を含有し得る。浸透圧調節剤は、カルシウムイオンをキレートしない薬剤であり得る。浸透圧調節剤は、製剤の浸透圧特性を調節する、当業者に既知または利用可能な任意の化合物であり得る。当業者は、本発明の製剤で使用される所与の浸透圧調節剤の適合性を経験的に決定することができる。好適なタイプの浸透圧調節剤の例示的な例としては、塩、例えば、塩化ナトリウム及び酢酸ナトリウム;糖、例えば、スクロース、デキストロース及びマンニトール;アミノ酸、例えば、グリシン;ならびにこれらの薬剤及び/またはこれらのタイプの薬剤のうちの1つ以上の混合物が挙げられるが、これらに限定されない。浸透圧調節剤(複数可)は、製剤の浸透圧特性を調節するのに十分な任意の濃度で存在してもよい。

本発明の医薬組成物は、疾患の治療において有用な少なくとも1つの追加の治療剤を含むことができる。例えば、本明細書に記載の医薬組成物の一部の実施形態は、化学療法剤を更に含む。一部の実施形態では、医薬組成物は、サイトカインペプチドまたはサイトカインペプチドをコードする核酸配列を更に含む。一部の実施形態では、細胞またはその集団を含む医薬組成物は、追加の治療剤とは別個に投与され得る。

本発明の組成物の治療的使用に関する1つの考慮事項は、最適または良好な効果を達成するために必要な薬剤の量である。例えば、投与される修飾された細胞の量は、処置される対象によって異なり得る。一実施形態では、10⁴～10¹⁰、10⁵～10⁹、または10⁶～10⁸個の本発明の遺伝子修飾された細胞が、ヒト対象に投与される。一部の実施形態では、少なくとも約1×10⁸、2×10⁸、3×10⁸、4×10⁸及び5×10⁸個の本発明の遺伝子修飾された細胞が、ヒト対象に投与される。正確な有効用量の決定は、各個々の対象の要因(サイズ、年齢、性別、体重、及び状態を含む)に基づいてもよい。用量は、本開示及び当該技術分野における知識から、当業者によって容易に確かめられ得る。

当業者は、組成物中の及び本発明の方法において投与される、薬剤の量ならびに任意選択の添加剤、ビヒクル、及び/または担体の量を容易に決定することができる。典型的には、添加剤は、リン酸緩衝生理食塩水中の0.001～50%(重量)溶液の量で存在し、活性成分は、マイクログラム～ミリグラムのオーダーで存在し、例えば、約0.0001～約5重量%、好ましくは、約0.0001～約1重量%、更により好ましくは、約0.0001～約0.05重量%または約0.001～約20重量%、好ましくは、約0.01～約10重量%、更により好ましくは、約0.05～約5重量%で存在する。もちろん、動物またはヒトに投与される任意の組成物、及び任意の特定の投与方法に対して、したがって、毒性を決定すること(例えば、好適な動物モデル(例えば、マウスなどのげっ歯類)における致死量(LD)及びLD50を決定することによる)、ならびに好適な応答を誘発する組成物の投薬量(複数可)、その中の成分の濃度、及び組成物の投与のタイミング(複数可)を決定することが好ましい。そのような決定は、当業者の知識、本開示、及び本明細書で引用される文書から、過度の実験を必要としない。また、順次投与の時間は、過度の実験なしに確かめることができる。

一部の実施形態では、医薬組成物は、対象への送達のために製剤化される。本明細書に記載の医薬組成物を投与する好適な経路としては、局所、皮下、皮内、皮内、病巣内、関節内、腹腔内、膀胱内、経粘膜、歯肉、歯内、蝸牛内、鼓室内、臓器内、硬膜外、髄腔内、筋肉内、静脈内、血管内、骨内、眼周囲、腫瘍内、脳内、及び脳室内投与が挙げられるが、これらに限定されない。

一部の実施形態では、本明細書に記載の医薬組成物は、疾患部位(例えば、肝臓)に局所的に投与される。一部の実施形態では、本明細書に記載の医薬組成物は、注射によって、カテーテルによって、坐剤によって、またはインプラントによって、対象に投与され、インプラントは、シアラスティック(sialastic)膜または繊維などの膜を含む、多孔性、非多孔性、またはゲル状物質である。

他の実施形態では、本明細書に記載の医薬組成物は、制御放出システムにおいて送達される。一実施形態では、ポンプが使用され得る(例えば、Langer,1990,Science 249:1527-1533;、Sefton,1989,CRC Crit.Ref.Biomed.Eng.14:201、Buchwald et al.,1980,Surgery 88:507、Saudek et al.,1989,N.Engl.J.Med.321:574を参照されたい)。別の実施形態では、ポリマー材料が使用され得る。(例えば、Medical Applications of Controlled Release(Langer and Wise eds.,CRC Press,Boca Raton,Fla.,1974)、Controlled Drug Bioavailability,Drug Product Design and Performance(Smolen and Ball eds.,Wiley,New York,1984)、Ranger and Peppas,1983,Macromol.Sci.Rev.Macromol.Chem.23:61を参照されたい。また、Levy et al.,1985,Science 228:190、During et al.,1989,Ann.Neurol.25:351、Howard et al.,1989,J.Neurosurg.71:105を参照されたい)。他の制御放出システムは、例えば、上記のLangerで考察されている。

一部の実施形態では、医薬組成物は、対象(例えば、ヒト)への静脈内または皮下投与に適した組成物として、通常の手順に従って製剤化される。一部の実施形態では、注射による投与のための医薬組成物は、可溶化剤としての滅菌等張使用における溶液、及び注射部位の疼痛を緩和するためのリグノカインなどの局所麻酔剤である。一般的に、成分は、単位剤形で、例えば、活性剤の量を示すアンプルもしくはサシェなどの気密封止容器内に乾燥させた凍結乾燥粉末または水不含濃縮物として、別々に供給するか、あるいは一緒に混合して供給される。医薬品が注入によって投与される場合、医薬品は、滅菌医薬品グレードの水または生理食塩水を含有する注入ボトルを用いて分注され得る。医薬組成物が注射によって投与される場合、投与前に成分が混合され得るように、注射用の滅菌水または生理食塩水のアンプルが提供され得る。

全身投与のための医薬組成物は、液体(例えば、滅菌生理食塩水、乳酸リンゲル溶液、またはハンクス溶液)であってもよい。加えて、医薬組成物は、固体形態であってもよく、使用の直前に再溶解または懸濁され得る。凍結乾燥形態も企図される。医薬組成物は、脂質粒子または小胞(例えば、非経口投与にも好適なリポソームまたは微結晶)内に含有され得る。粒子は、組成物がその中に含有されている限り、単層(unilamellar)または多層(plurilamellar)などの任意の好適な構造の粒子であり得る。化合物は、膜融合性脂質ジオレオイルホスファチジルエタノールアミン(DOPE)、低いレベル(5～10mol%)のカチオン性脂質を含有する「安定化されたプラスミド-脂質粒子」(SPLP)内に捕捉され得、ポリエチレングリコール(PEG)コーティングによって安定化され得る(Zhang Y.P.et al.,Gene Ther.1999,6:1438-47を参照されたい)。そのような粒子及び小胞には、N-[1-(2,3-ジオレオイルオキシ)プロピル]-N,N,N-トリメチル-アンモニウムメチルサルフェートまたは「DOTAP」などの正に帯電した脂質が特に好ましい。そのような脂質粒子の調製は周知である。例えば、米国特許第4,880,635号、同第4,906,477号、同第4,911,928号、同第4,917,951号、同第4,920,016号、及び同第4,921,757号を参照されたい(それらの各々は、参照により本明細書に援用される)。

本明細書に記載の医薬組成物は、例えば、単位用量として投与または包装され得る。「単位用量」という用語は、本開示の医薬組成物に関して使用される場合、対象のための単位投薬量として好適な物理的に分離された単位を指し、各単位は、必要な希釈剤(すなわち、担体またはビヒクル)と関連して所望の治療効果がもたらされるように計算された所定の量の活性物質を含有する。

更に、医薬組成物は、薬学的キットとして提供され得、(a)凍結乾燥形態の本発明の化合物を含有する容器、及び(b)薬学的に許容される希釈剤(例えば、本発明の凍結乾燥化合物の再構築または希釈に使用される滅菌物)を含有する第2の容器を含む。任意選択的に、そのような容器(複数可)に付随するものが、医薬品または生物学的製品の製造、使用、または販売を規制する政府機関によって規定される形態の通知であってもよく、この通知は、ヒトへの投与のための製造、使用、または販売の機関による承認を反映する。

別の態様では、上に記載の疾患の治療に有用な材料を含有する製造品(article of manufacture)が含まれる。一部の実施形態では、製造品は、容器及びラベルを含む。好適な容器としては、例えば、ボトル、バイアル、注射器、及び試験管が挙げられる。容器は、ガラスまたはプラスチックなどの様々な材料から形成され得る。一部の実施形態では、容器は、本明細書に記載の疾患を治療するのに有効な組成物を保持し、無菌アクセスポートを有し得る。例えば、容器は、皮下注射針によって貫通可能なストッパーを有する、静脈内輸液バッグまたはバイアルであり得る。組成物中の活性剤は、本発明の化合物である。一部の実施形態では、容器上の、または容器に付随するラベルは、組成物が、選択された疾患を治療するために使用されることを示す。製造品は、リン酸緩衝生理食塩水、リンゲル溶液、またはデキストロース溶液などの、薬学的に許容される緩衝液を含む第2の容器を更に含み得る。これには、商業及び使用者の観点から望ましい他の材料が更に含まれ得、他の緩衝液、希釈剤、フィルター、針、シリンジ、及び使用説明書を含む添付文書が挙げられる。

一部の実施形態では、本明細書に記載の融合タンパク質、gRNA、及び/または複合体のいずれかは、医薬組成物の一部として提供される。一部の実施形態では、医薬組成物は、本明細書に提供される融合タンパク質のいずれかを含む。一部の実施形態では、医薬組成物は、本明細書に提供される複合体のいずれかを含む。一部の実施形態では、医薬組成物は、gRNAとカチオン性脂質との複合体を形成するRNAガイドヌクレアーゼ(例えば、Cas9)を含むリボ核タンパク質複合体を含む。一部の実施形態では、医薬組成物は、gRNA、核酸プログラマブルDNA結合タンパク質、カチオン性脂質、及び薬学的に許容される賦形剤を含む。医薬組成物は、任意選択的に、1つ以上の追加の治療活性物質を含むことができる。

一部の実施形態では、本明細書に提供される組成物は、対象内の標的ゲノム修飾をもたらすように、対象に(例えば、ヒト対象に)投与される。一部の実施形態では、細胞は、対象から得られ、本明細書に提供される医薬組成物のいずれかと接触する。一部の実施形態では、対象から取り出され、エクスビボで医薬組成物と接触させた細胞は、任意選択的に、所望のゲノム修飾が細胞内で実施または検出された後、対象に再導入される。ヌクレアーゼを含む医薬組成物を送達する方法は既知であり、例えば、米国特許第6,453,242号、同第6,503,717号、同第6,534,261号、同第6,599,692号、同第6,607,882号、同第6,689,558号、同第6,824,978号、同第6,933,113号、同第6,979,539号、同第7,013,219号、及び同第7,163,824号に記載されている(それらの全ての開示は、それらの全体が参照により本明細書に援用される)。本明細書に提供される医薬組成物の説明は、主に、ヒトへの投与に好適な医薬組成物を対象とするが、そのような組成物が、概して、あらゆる種類の動物または生物への投与に(例えば、獣医学的使用に)好適であることが、当業者によって理解されるであろう。

組成物が様々な動物への投与に好適であるようにするため、ヒトへの投与に好適な医薬組成物を修飾することは十分に理解されており、通常の熟練した獣医薬理学者は、もしあったとしても単に通常の実験で、そのような修飾を設計及び/または実施することができる。医薬組成物の投与が企図される対象としては、ヒト及び/または他の霊長類、哺乳類、家畜化された動物、ペット、ならびに商業的に関連する哺乳類(例えば、ウシ、ブタ、ウマ、ヒツジ、ネコ、イヌ、マウス、及び/またはラット)、及び/または鳥類(ニワトリ、アヒル、ガチョウ、及び/またはシチメンチョウなどの商業的に関連する鳥類を含む)が挙げられるが、これらに限定されない。

本明細書に記載の医薬組成物の製剤は、薬理学の分野で既知のまたは今後開発される任意の方法によって調製することができる。一般に、そのような調製方法は、活性成分(複数可)を、賦形剤及び/または1つ以上の他の副成分と会合させるステップと、次いで、必要及び/または望ましい場合、製品を所望の単回用量単位または複数回用量単位に成形及び/または包装するステップと、を含む。薬学的製剤は、薬学的に許容される賦形剤を更に含むことができ、本明細書で使用される場合、所望の特定の剤形に適した、あらゆる溶媒、分散媒、希釈剤、または他の液体ビヒクル、分散助剤または懸濁助剤、表面活性剤、等張剤、増粘剤または乳化剤、防腐剤、固体結合剤、潤滑剤などが含まれる。Remington’s The Science and Practice of Pharmacy,21st Edition,A.R.Gennaro(Lippincott,Williams & Wilkins,Baltimore,MD,2006(その全体が参照により本明細書に援用される)には、医薬組成物の製剤化に使用される様々な賦形剤及びそれらの調製のための既知の技術が開示されている。また、ヌクレアーゼを含む医薬組成物を製造するための追加の好適な方法、試薬、賦形剤及び溶媒については、PCT出願第PCT/US2010/055131号(2010年11月2日に出願された公開番号WO2011/053982(A8))を参照されたく、これは、その全体が参照により本明細書に援用される。

任意の従来の賦形剤媒体が、任意の望ましくない生物学的作用を生み出すことによって、またはその他、医薬組成物の任意の他の成分(複数可)と有害な様式で相互作用することによって、物質またはその誘導体と適合しない場合を除いて、その使用は、本開示の範囲内であることとが企図される。

組成物は、上に記載のように、有効量で投与され得る。有効量は、投与様式、治療される特定の状態、及び所望の転帰に依存する。これはまた、状態のステージ、対象の年齢及び身体状態、同時療法の性質(もしあれば)、ならびに医師に周知の同様の要因に依存し得る。それは、治療用途において、医学的に望ましい結果を達成するのに十分な量である。

一部の実施形態では、本開示による組成物は、様々な疾患、障害、及び/または状態のうちのいずれかの治療に使用することができる。

治療の方法
本発明の一部の態様は、治療を必要とする対象を治療する方法を提供し、本方法は、その治療を必要とする対象に、有効量の本明細書に記載の医薬組成物を投与することを含む。他の実施形態では、本発明の方法は、細胞内で、塩基エディターポリペプチドと、少なくとも1つのポリペプチドをコードする核酸分子を標的化することが可能である1つ以上のガイドRNAとを発現させること、またはこれらを細胞内に導入することを含む。

実施形態では、治療の方法は、レトロウイルス感染症(例えば、HBV感染症)の治療のための抗レトロウイルス薬(複数可)(例えば、ラミブジン)による前処理、共処理、または同時処理を含む。実施形態では、処理(例えば、前処理、共処理、または同時処理)は、約1日、2日、3日、4日、5日、6日、7日、8日、9日、10日、11日、12日、13日、14日、15日、16日、17日、18日、19日、20日、30日、40日、50日、60日、70日、80日、90日、もしくは100日、または少なくとも約1日、2日、3日、4日、5日、6日、7日、8日、9日、10日、11日、12日、13日、14日、15日、16日、17日、18日、19日、20日、30日、40日、50日、60日、70日、80日、90日、もしくは100日の持続時間を有する。処理は、約1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、30、40、50、60、70、80、90、もしくは100日以内の持続時間を有する。実施形態では、前処理を投与された対象または細胞への塩基編集システムの投与の約1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、もしくは20日前、または少なくとも約1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、もしくは20日前(すなわち、「前処理」)に、抗レトロウイルス薬の投与を停止する。実施形態では、前処理を投与された対象または細胞への塩基編集システムの投与前の約1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、もしくは20日以内に、抗レトロウイルス薬の投与を停止する。実施形態では、前処理を投与された対象または細胞への塩基編集システムの投与の約1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、もしくは20日前、または少なくとも約1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、もしくは20日前に、抗レトロウイルス薬の投与を開始する。実施形態では、前処理を投与された対象または細胞への塩基編集システムの投与前の約1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、もしくは20日以内に、または少なくとも約1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、もしくは20日以内に、抗レトロウイルス薬の投与を終了する。実施形態では、塩基編集システム及び治療の投与から約1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、または20日以内に、抗レトロウイルス薬の投与を終了する。実施形態では、抗レトロウイルス薬を、まず、対象または細胞に、当該対象または細胞への塩基編集システムの投与の約0、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、もしくは20日前、または少なくとも約0、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、もしくは20日前に投与し、塩基編集システムの投与から約0、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、もしくは20日間、少なくとも約0、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、もしくは20日間、または約0、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、もしくは20日以内の間、継続する。一部の例では、塩基編集システムの投与は、塩基編集システムの第1の投与である。

抗レトロウイルス薬の非限定的な例としては、アデホビル、テノホビル、テルビブジン、インターフェロン(例えば、インターフェロンアルファ-2b(イントロンA)またはインターフェロンアルファ-2a、ペグインターフェロン(例えば、pegインターフェロンアルファ-2aまたはpegインターフェロンアルファ-2b))、リンホトキシンβ受容体(LTBR)、ヌクレオシド/ヌクレオチド逆転写酵素阻害剤(NRTI)(例えば、アバカビル(Ziagen)、ジダノシン、エムトリシタビン(Emtriva)、ラミブジン(Epivir)、スタブジン、テノホビル・ジソプロキシル・フマル酸塩(Viread)、テノホビル・アラフェナミド、及びジドブジン(Retrovir))、非ヌクレオシド逆転写酵素阻害剤(NNRTI)(例えば、デラビルジン、ドラビリン(Pifeltro)、エファビレンツ(Sustiva)、エトラビリン(Intelence)、ネビラピン(Viramune)、リルピビリン(Edurant)、及びデラビルジン)、付着後阻害剤またはモノクローナル抗体(例えば、Ibalizumab-uiyk)、CCR5アンタゴニスト(例えば、マラビロク)、アタザナビル、ダルナビル、コビシスタット、ロピナビル、マラビロク、ネビラピン、リルピビリン、エルビテグラビル+TDF+FTC+コビシスタット、エルビテグラビル+TAF+FTC+コビシスタット、インテグラーゼ阻害剤(例えば、ビクテグラビル、カボテグラビル、カボテグラビルとリルピビリン、ドルテグラビル、エルビテグラビル、ホスアンプレナビル(Lexiva、Telzir)、及びラルテグラビル)、融合阻害剤(エンフビルチドなど)、進入阻害剤(例えば、マラビロク)、プロテアーゼ阻害剤(PI)(例えば、アタザナビル、ダルナビル、ロピナビル、インジナビル(Crixivan)、ロピナビル/リトナビル(Kaletra)、リトナビル(Norvir)、サキナビル(Invirase)、及びチプラナビル(Aptivus))、付着及び付着後阻害剤(例えば、フォステムサビル、イバリズマブ)、ならびにエンテカビルが挙げられる。一実施形態では、抗レトロウイルス薬は、ラミブジン、エンテカビル、テノホビル、インターフェロン、及びPeg-インターフェロンのうちの1つ以上から選択される。

実施形態では、対象及び/または細胞の抗レトロウイルス薬(複数可)のうちの1つ以上での(例えば、本開示の塩基エディターシステムと組み合わせた)前処理、共処理、または同時処理は、抗レトロウイルス薬を投与されていない参照対象及び/または細胞と比較して、ポリヌクレオチド(例えば、cccDNA中)中の標的配列(複数可)の塩基編集効率の約1%、2%、3%、4%、5%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、100%、150%、200%、300%、400%、500%、またはそれ以上の増加と関連している。

特定の実施形態で企図される医薬組成物の複数回投与が、所望の療法に影響を及ぼすために必要とされ得ることを、当業者は理解するであろう。例えば、組成物は、対象に、1週間、2週間、3週間、1ヶ月、2ヶ月、3ヶ月、4ヶ月、5ヶ月、6ヶ月、1年、2年、5年、10年、またはそれ以上の期間にわたって、1、2、3、4、5、6、7、8、9、もしくは10回、またはそれ以上投与され得る。そのような方法のうちのいずれかにおいて、方法は、対象に、有効量の編集された細胞または塩基エディターシステムまたはそのようなシステムをコードするポリヌクレオチドを投与することを含み得る。かかる方法のうちのいずれかにおいて、方法は、1以上の用量の有効量の塩基エディターシステムを投与することを含み得、任意選択的に、用量は、約1時間、12時間、1日、2日、3日、4日、5日、6日、7日、8日、9日、10日、11日、12日、13日、14日、またはそれ以上の期間分離される。このような方法のうちのいずれかにおいて、方法は、2以上の用量の有効量の塩基エディターシステムを投与することを含み得る。

本明細書で企図される医薬組成物の投与は、これらに限定されないが、注入、輸液、または非経口を含む従来の技術を使用して実施され得る。一部の実施形態では、非経口投与は、血管内、静脈内、筋肉内、動脈内、髄腔内、腫瘍内、皮内、腹腔内、経気管、皮下、表皮下、関節内、嚢下、くも膜下、及び胸骨内に注入または注射を含む。

一部の実施形態では、本明細書に記載される組成物及び/または薬剤(例えば、編集された細胞、塩基編集システム及び/または抗ウイルス薬)は、ヒト対象の体重1キログラム当たり約0.5～30mgである投与量で投与される。別の実施形態では、投与される組成物の量は、ヒト対象の体重1キログラム当たり約0.5～20mgである。別の実施形態では、投与される組成物の量は、ヒト対象の体重1キログラム当たり約0.5～10mgである。別の実施形態では、投与される組成物の量は、ヒト対象の体重1キログラム当たり約0.04mg、約0.08mg、約0.16mg、約0.32mg、約0.64mg、約1.25mg、約1.28mg、約1.92mg、約2.5mg、約3.56mg、約3.75mg、約5.0mg、約7.12mg、約7.5mg、約10mg、約14.24mg、約15mg、約20mgまたは約30mgである。別の実施形態では、投与される組成物の量は、ヒト対象の体重1キログラム当たり約1.92mg、約3.75mg、約7.5mg、約15.0mgまたは約30.0mgであり、組成物は、1週間2回投与される。別の実施形態では、投与される組成物の量は、ヒト対象の体重1キログラム当たり約1.28mg、約2.56mg、約5.0mg、約10mgまたは約20mgであり、組成物は、1週間2回投与される。別の実施形態では、投与される組成物の量は、ヒト対象の体重1キログラム当たり約1.92mg、約3.75mg、約7.5mg、約15.0mgまたは約30.0mgであり、組成物は、1週間1回投与される。別の実施形態では、投与される組成物の量は、ヒト対象の体重1キログラム当たり約1.28mg、約2.56mg、約5.0mg、約10mgまたは約20mgであり、組成物は、1週間1回投与される。別の実施形態では、投与される組成物の量は、ヒト対象の体重1キログラム当たり約1.92mg、約3.75mg、約7.5mg、約15.0mgまたは約30.0mgであり、組成物は、1日1回、7日間の期間3回、5回または7回投与される。別の実施形態では、組成物は、1日1回、7日間の期間7回静脈内投与される。別の実施形態では、投与される組成物の量は、ヒト対象の体重1キログラム当たり約1.28mg、約2.56mg、約5.0mg、約10mgまたは約20mgであり、組成物は、1日1回、7日間の期間3回、5回または7回投与される。別の実施形態では、組成物は、1日1回、7日間の期間7回静脈内投与される。

一部の実施形態では、組成物は、約実質的に瞬時(例えば、組成物が注射として投与される場合のように、1秒未満の期間にわたって)、1秒、10秒、30秒、1分、0.1時間、0.25時間、0.5時間、1時間、2時間、3時間、4時間、5時間、6時間、7時間、8時間、9時間、10時間、11時間もしくは12時間、少なくとも約実質的に瞬時、1秒、10秒、30秒、1分、0.1時間、0.25時間、0.5時間、1時間、2時間、3時間、4時間、5時間、6時間、7時間、8時間、9時間、10時間、11時間もしくは12時間、または約実質的に瞬時、1秒、10秒、30秒、1分、0.1時間、0.25時間、0.5時間、1時間、2時間、3時間、4時間、5時間、6時間、7時間、8時間、9時間、10時間、11時間もしくは12時間未満の期間にわたって投与される。別の実施形態では、組成物は、0.25～2時間の期間にわたって投与される。別の実施形態では、組成物は、1時間の期間にわたって徐々に投与される。別の実施形態では、組成物は、2時間の期間にわたって徐々に投与される。

HBV感染症を治療する方法
本発明は、HBV感染症またはその症状を治療する方法であって、対象(例えば、ヒトなどの哺乳動物)に、治療有効量の、本明細書に記載の塩基エディターシステム(例えば、塩基エディター及びgRNA)をコードするポリヌクレオチドを含む医薬組成物を投与することを含む、方法を提供する。一部の実施形態では、塩基エディターは、ポリヌクレオチドプログラマブルDNA結合ドメイン及びアデノシンデアミナーゼドメインまたはシチジンデアミナーゼドメインを含む融合タンパク質である。対象の細胞を、塩基エディター及び塩基エディターを標的指向化する1つ以上のガイドポリヌクレオチドで形質導入して、HBVポリペプチドをコードする核酸配列のA・TからG・Cへの改変(細胞がアデノシンデアミナーゼドメインで形質導入された場合)またはC・GからU・Aへの改変(細胞がシチジンデアミナーゼドメインで形質導入された場合)をもたらす。

一部の実施形態では、慢性B型肝炎の治療は、アプローチの組み合わせを含む。例えば、HBVに感染した対象に、HBV cccDNAを標的化し、修飾する上記の治療有効量の医薬の組み合わせを投与することができる。例えば、UGIドメインを有しないBE4塩基エディターは、HBVゲノムの領域を標的化するgRNAとともに使用され得る。理論に拘束されることなく、阻害剤を省略すると、C->U脱アミノ化は、HBV cccDNAを損傷するウラシルグリコシラーゼの影響を受けやすくなり、したがって不安定化する。この治療は、本明細書に記載の塩基エディター及びガイドRNAを使用して、HBVゲノムのSまたはpol遺伝子を標的化するなど、HBsAg発現(組み込まれたHBV DNAからのものを含む)を低減または阻害する治療と組み合わせることができる。治療はまた、免疫系を刺激することを含むことができる。一部の実施形態では、これらの3つの異なる治療目標の各々は、本明細書に記載の塩基編集試薬及び技術を使用して達成することができる。

本明細書の方法は、対象(かかる治療を必要とすると特定された対象を含む)に、有効量の本明細書に記載の組成物を投与することを含む。そのような治療を必要とする対象を特定することは、対象または医療従事者の判断であり得、主観的(例えば、意見)または客観的(例えば、試験または診断方法によって測定可能)であり得る。

本発明の治療法は、一般に、治療有効量の医薬組成物を投与することを含み、医薬組成物は、例えば、塩基エディターをコードするベクターと、その治療を必要とする対象(例えば、ヒト)に目的のHBV遺伝子を標的化するgRNAと、を含む。そのような治療は、HBV感染症に罹患しているか、HBV感染症を有するか、HBV感染症に罹患しやすいか、またはHBV感染症の危険性がある対象、特にヒトに適切に投与されるであろう。本明細書の組成物は、HBV感染症が関与し得る任意の他の障害の治療にも使用され得る。

一実施形態では、本発明は、治療の進行を監視する方法を提供する。方法は、疾患またはその症状を治療するのに十分な治療量の本明細書の組成物を投与されたHBV感染に関連する障害またはその症状に罹患しているか、もしくは罹患しやすい対象における診断マーカー(マーカー)(例えば、ウイルス負荷)または診断測定(例えば、スクリーニング、アッセイ)のレベルを決定する工程を含む。本方法で決定されるマーカーのレベルは、対象の疾患状態を確立するために、健康な正常対照または他の罹患した患者のいずれかにおける既知のレベルのマーカーと比較することができる。好ましい実施形態では、対象における第2のレベルのマーカーは、第1のレベルの決定よりも後の時点で決定され、2つのレベルを比較して、疾患の経過または治療の有効性を監視する。特定の好ましい実施形態では、対象におけるマーカーの治療前レベルは、本発明による治療を開始する前に決定され、次いで、この治療前レベルのマーカーを、治療開始後の対象におけるマーカーのレベルと比較して、治療の有効性を決定することができる。

キット
本発明は、対象におけるHBV感染症、ならびに肝硬変、肝細胞癌(HCC)、及びHBV感染症に関連する、またはそれに起因する任意の他の疾患を含む関連疾患及び障害の治療のためのキットを提供する。一部の実施形態では、キットは、塩基エディターシステムまたは塩基エディターシステムをコードするポリヌクレオチドを更に含み、塩基エディターシステムは、核酸プログラマブルDNA結合タンパク質(napDNAbp)と、デアミナーゼと、ガイドRNAと、を含む。一部の実施形態では、napDNAbpは、Cas9またはCas12である。一部の実施形態では、塩基エディターをコードするポリヌクレオチドは、mRNA配列である。一部の実施形態では、デアミナーゼは、シチジンデアミナーゼまたはアデノシンデアミナーゼである。一部の実施形態では、キットは、編集された細胞と、そのような細胞の使用に関する説明書と、を含む。

キットは、塩基エディターシステム及び/または編集された細胞の使用についての書面による説明書を更に含んでもよい。他の実施形態では、説明書は、注意事項、警告、臨床試験、及び/または参考文献のうちの少なくとも1つを含む。説明書は、(存在する場合)容器に直接印刷されてもよく、あるいは容器に適用されるラベルとして、または容器内にもしくは容器とともに、供給される別個のシート、パンフレット、カード、もしくはフォルダとして印刷されてもよい。更なる実施形態では、キットは、好適な操作パラメータのためのラベルまたは別個のインサート(添付文書)の形態の説明書を含むことができる。更に別の実施形態では、キットは、適切な陽性対照及び陰性対照または対照試料を有する1つ以上の容器を含み、検出、較正、または正規化のための標準(複数可)として使用され得る。キットは、(滅菌)リン酸緩衝生理食塩水、リンゲル溶液、またはデキストロース溶液などの、薬学的に許容される緩衝液を含む第2の容器を更に含み得る。これには、商業及び使用者の観点から望ましい他の材料が更に含まれ得、他の緩衝液、希釈剤、フィルター、針、シリンジ、及び使用説明書を含む添付文書が挙げられる。

本発明の実践には、別段の指示がない限り、分子生物学(組換え技法を含む)、微生物学、細胞生物学、生化学、及び免疫学の従来の技術が用いられ、十分に当業者の範囲内である。そのような技術は、文献、例えば、「Molecular Cloning:A Laboratory Manual」,second edition(Sambrook,1989)、「Oligonucleotide Synthesis」(Gait,1984)、「Animal Cell Culture」(Freshney,1987)、「Methods in Enzymology」「Handbook of Experimental Immunology」(Weir,1996)、「Gene Transfer Vectors for Mammalian Cells」(Miller and Calos,1987)、「Current Protocols in Molecular Biology」(Ausubel,1987)、「PCR:The Polymerase Chain Reaction」,(Mullis,1994)、「Current Protocols in Immunology」(Coligan,1991)で十分に説明されている。これらの技術は、本発明のポリヌクレオチド及びポリペプチドの産生に適用可能であり、したがって、作製及び本発明を実施する際に考慮され得る。特定の実施形態のための特に有用な技術は、以下のセクションで論じられる。

以下の実施例は、当業者に対して、本発明のアッセイ、スクリーニング、及び治療法を行いかつ使用する方法の完全な開示ならびに説明を提供するために提示されており、本発明者らが自身の発明とみなすものの範囲を限定することを意図しない。

実施例１：HBVゲノムの標的化塩基編集は、HBVゲノムにおけるミスセンス変異または転写開始部位の改変をもたらした。
ガイドRNA(表1及び2を参照されたい)は、HBV遺伝子の保存領域(表20Aを参照されたい)にミスセンス変異または転写部位核酸塩基改変を導入するために、Cas12b-ABE塩基エディターを標的指向化するようにインシリコで設計された。HBV遺伝子型D、サブ遺伝子型aywを、Benchling Softwareで利用可能なCRISPR設計ツールを使用して分析して、潜在的なガイドRNAを同定し、全てのHBV遺伝子型にわたる配列保存のレベルを、各ガイドRNAについて決定した。13のガイドRNAを試験のために選択した(表1及び2)。これらのガイドRNAは、RTTN PAM配列に隣接または近接していた。比較のために、図4に示される追加の塩基エディターシステムを評価した。追加の塩基エディターシステムは、表1に列挙されるNGG-ABE8.8-m、Cas12b-ABE、VRQR-ABE、またはNGC-ABE塩基エディター及びガイドRNAを含有した。これらの追加の塩基エディターシステムによって標的化された配列のHBVゲノムにわたる保存、ならびに追加の塩基エディターによってもたらされる塩基編集に起因する機能的変化を、以下の表20B及び20Cに提供する。

gRNAは、HBV遺伝子型にわたる高い保存性に基づいて選択され、遺伝子型D及びAに焦点を当てた。このような高度に保存された領域を標的化する設計戦略は、より広い患者集団を標的化するのに好適なgRNAの設計を可能にし、HBVウイルスが塩基編集処理を逃れることを可能にするウイルス変異の出現を回避する。

ミスセンス変異を導入するためのgRNAの設計に使用される選択基準は、ミスセンス変異につながるHBVゲノム内で編集を生成する能力であった。更に、塩基編集試薬によって生成されたアミノ酸変化のインシリコ分析、及び天然に存在するHBVゲノムにおいてめったに検出されない配列を有するミスセンスアミノ酸変化を生成するであろうgRNAを選択した(アミノ酸変化の頻度が<0.05%)。この戦略は、gRNAがHBVタンパク質/ゲノムの破壊につながる変異を導入する可能性を増加させた。

遺伝子編集効率を以下のように評価した。プラスミドトランスフェクションについて、ガイドRNAをコードするベクター及び塩基エディターをコードするベクターを、HBVゲノムを含むレンチウイルスベクター(すなわち、Hek293-lentiHBVシステム)を以前に形質導入されたHEK293T細胞に一過的にトランスフェクトした。塩基エディターは、Cas12b-ABE(bhCas12b-ABE8.13 D952A,_S893R,_K846R,_E837G)であった。

トランスフェクションは、250ngのgRNAプラスミド及び750ngの塩基エディタープラスミドを使用して、3:1の比でHek293細胞に対して最適化された高効率、低毒性DNAトランスフェクション試薬(Mirus TransIT293またはLipofectamine 2000)を使用して実施した。プラスミドトランスフェクションの4日後、ゲノムDNAを、0.05% SDS、25μg/mlのプロテイナーゼK、及び10mMのTris pH8.0の単純な溶解緩衝液で抽出し、続いて85℃で熱不活性化した。ゲノム部位をPCR増幅し、MiSeqで配列決定した。各gRNAについて決定された編集効率を、以下の表21及び図4に示す。

ガイドcas12b-4、cas12b-5、cas12b-11、cas12b-17、cas12b-30、cas12b-42、cas12b-100、cas12b-147、及びcas12b-154は、塩基エディターを標的指向化して、それぞれの標的配列にミスセンス変異を導入した(表2Aを参照されたい)。ガイドcas12b-35は、塩基エディターを標的指向化して、エンハンサーIIボックスAに核酸塩基改変を導入した。ガイドcas12b-124及びcas12b-127は、各々、塩基エディターを標的指向化して、エンハンサーIに核酸塩基改変を導入した。ガイドcas12b-122bは、塩基エディターを標的指向化して、HBXプロモーターに核酸塩基改変を導入した。

実施例２：塩基エディターシステムの抗ウイルス及び編集有効性
実施例1で評価したガイドRNAを比較する塩基エディターシステムを、続いて、B型肝炎ウイルス-初代ヒト肝細胞(HBV-PHH)システムを使用して、抗ウイルス及び編集有効性について試験した。細胞に、実施例1に記載されるように、塩基エディターをコードするガイドRNA及びmRNAをトランスフェクトした。ABE-133、ABE-41、MSPbeam94、ABE-85、PolyA-NGC1、PolyA-NGC2、Cas12b-11、及び/またはCas12b-152を含む塩基エディターシステムは、無処理対照と比較して全てのHBVマーカーの堅牢な減少によって示されるように、HBV-PHHシステムにおける共有結合閉鎖環状HBV DNA(cccDNA)を効果的に編集し、及び/またはウイルス複製を減少させることが決定された(図5A～5C及び表22)。ガイドRNA ABE-133、MSPbeam94、及びABE-85は、対照と比較して、HBV DNAの70～80%の減少と関連していた。ガイドRNA PolyA-NGC1及びPolyA-NGC2は、高い編集と、それに続くHbeAgの減少における90%の有効性に関連していた。

B型肝炎ウイルスを研究するためのHBV-PHHシステムは、例えば、Winer,et al.,“Long-term hepatitis B infection in a scalable hepatic co-culture system,”Nat.Commun.8:125(2017)及びZhou,et al.“Long-term maintenance of human fetal hepatocytes and prolonged susceptibility to HBV infection by co-culture with non-parenchymal cells,”J.Virol Methods,195:185-93(2014)によって記載され、ImQuest BioSciences(imquestbio.com/programs/virology/hbv/)によって市販されている。

実施例３：多重化gRNAは、HepG2-NTCP細胞におけるHBVウイルスパラメータを減少させた。
HBV感染細胞の治療に有効なガイドRNAの組み合わせを同定するために、表1に列挙されたガイドRNAを使用して実験を完了した。HepG2-NTCP細胞に、BE4をコードするmRNAと、gRNA12、gRNA37、gRNA19、gRNA190、及びgRNA40から選択されるガイドRNA(複数可)とをトランスフェクトした。HepG2-NTCP細胞は、Sun,et al.“NTCP-Reconstituted In Vitro HBV Infection System,”Methods Mol.Biol.1540:1-14(2017),DOI:10.1007/978-1-4939-6700-1_1に記載されており、その開示は、その全体が全ての目的で参照により本明細書に援用される。細胞を0日目にHBVに感染させ、次いで4日目にmRNA及びgRNA(複数可)を細胞にトランスフェクトした(図6を参照)。HBsAg、HBeAg、全HBV DNA、及び3.5kbウイルスDNAの測定を14日目に行った(図6を参照されたい)。ガイドRNA、gRNA37、標的化HBsAg、及びgRNA40は、HBVコアタンパク質を標的指向化した(図7を参照されたい)。gRNA37の使用は、HBsAgレベルの低下に関連し、gRNA40の使用は、HBeAgレベルの低下に関連していた(図8を参照されたい)。また、gRNA37及びgRNA40の各々は、全HBV DNA及び3.5kb RNAレベルの低下と関連していた。図8に示されるように、ガイドRNAであるgRNA37及びgRNA40は、特に有効なgRNAとして同定された。

gRNA37及びgRNA40を有効なgRNAとして同定した後、BE4、gRNA37及びgRNA40を含有する塩基エディターシステムの抗ウイルス効果(すなわち、gRNAの多重化)を評価した(図8～10)。2つのgRNAと多重化された塩基エディターシステムが、HepG2-NTCP細胞におけるHBVウイルスパラメータの低下と関連していることが判定された(図9を参照されたい)。図10に示すように、塩基エディターシステムは、cccdNAレベルを低下させることなく、cccdNA編集を通じて機能し、塩基エディターシステム(gRNA37及びgRNA40を含有する)は、堅牢なccdNA編集(gRNA37については約38%、gRNA40については約60%)と関連していた。cccDNAの編集の評価のために、cccDNAを、Hirt抽出及びExoI/ExoIIIヌクレアーゼ処理を介して濃縮して、rcDNA(緩和された環状DNA)を除去した。本明細書に提供される実施例を通して、このように濃縮されたcccDNAを使用して完了した次世代配列決定を使用して、cccDNAの編集を評価した。したがって、HBVゲノムを改変するために、複数の異なるgRNA分子(例えば、gRNA37及びgRNA40)を塩基エディター(例えば、BE4)と組み合わせて投与することは、観察された抗ウイルス効果の観点から有利であることが実証された。

実施例４：ラミブジン処理と組み合わせた塩基編集の抗ウイルス有効性
本明細書に記載される塩基エディターシステムを、ラミブジンなどの抗ウイルス薬(具体的には、抗レトロウイルス薬)と組み合わせることに何らかの利点があるかどうかを決定するために、実験を行った。

まず、図11に提供される概略図に記載されるように実験を実施した。HepG2-NTCP細胞を、0日目にHBVに感染させ、4日目に、ラミブジンによる8日間の処理を開始し(これは、合計8日以内の3日間の前処理期間を含む)、7日目に、細胞に、BE4及びgRNA37及び40をコードするmRNAをトランスフェクトし、15日目に測定を行った。図12及び13に示されるように、ラミブジンによる3日間の前処理(8日間の総処理期間)は、約20%の塩基編集の改善と関連していることが見出された(図12)。理論に拘束されず、ラミブジンでの前処理は、中間HBV DNA種を除去し、cccDNAのみを残す。この改善は、HepG2-NTCP細胞における高い抗ウイルス有効性と更に関連していた。理論に拘束されず、ラミブジン前処理条件下での高共有結合閉鎖環状DNA(cccDNA)編集は、cccDNAを直接標的化する塩基エディターシステムと一致する。gRNA38及びgRNA40の併用による処理は、HBVウイルスマーカーの堅牢な減少をもたらす(図13)。

実施例５：塩基エディターは、抗ウイルス薬よりも効果的である
HBV感染症は、ラミブジンなどの抗レトロウイルス薬を使用して処理され得ることを考慮して、ラミブジンによる処置と比較して塩基エディターシステムの有効性を決定するために実験を行った。

実験の設計を図14に概略的に説明する。初代ヒト肝細胞(PHH)細胞に、0日目にHBVを感染させた。4日目及び11日目に、細胞に、BE4をコードするmRNA、ならびにgRNA37及びgRNA40をトランスフェクトした。HBV DNAの測定を経時的に行い、HBsAg、HBeAG、HBV全DNA、3.5kb RNA、及びcccDNA編集の測定を25日目に行った。実験は、PhoenixBioから入手可能なPHH共培養システムを使用して実施した。PHH共培養システムは、30日以上にわたって肝細胞の分化及び代謝活性を維持した。細胞内のHBV感染は持続し、cccDNAレベルは維持された。

図16に示されるように、HBVは、ラミブジンの中止後にリバウンドしたが、HBVは、塩基編集試薬による第2の形質導入後少なくとも2週間はリバウンドしなかった。更に、塩基エディターシステムでトランスフェクトした細胞は、25日目に、全てのHBVマーカーの約70%～約80%の減少を示した(図15を参照されたい)。したがって、BE4及び2つのガイドRNA(gRNA37及びgRNA40)を含有する塩基エディターシステムは、抗レトロウイルス薬による治療よりもHBV感染の制御においてより効果的であった。

更に、塩基エディターシステムは、S抗原部位で約30%、PreCore遺伝子部位で約60%の編集効率と関連していた(図17を参照されたい)。これらの編集レベルは、高抗ウイルス有効性を可能にし、初代ヒト肝細胞(PHH)細胞におけるHBVのリバウンドを防止するのに十分である。

シトシン塩基編集は、関連するインビトロシステムにおけるHBVウイルスマーカーのgRNA特異的減少をもたらした。多重編集は、HepG2-NTCP細胞及び一次肝細胞におけるHBsAg、HBeAg、HBV DNA、及び3.5kb RNAの同時減少をもたらした。理論に拘束されず、ウイルスマーカーの減少は、cccDNAの塩基編集によって引き起こされた可能性が高いが、cccDNAレベルの減少によって引き起こされたわけではない。塩基編集試薬及び標準抗ウイルスラミブジンによる細胞の併用処理は、より高い塩基編集効率をもたらした。塩基編集は、感染した原発性肝細胞におけるHBVリバウンドの予防に関連していた。理論に拘束されず、シトシン塩基編集は、臨床的に関連するインビトロモデルにおいて、HBVリバウンドを防止するcccDNAに永続的な変異を導入した。

実施例６：初代肝細胞における塩基編集効率に対するラミブジンの影響
BE4及びgRNA37及び40を含有する塩基編集システムを使用して、塩基編集に対する抗レトロウイルス薬ラミブジンの影響を更に調査するための実験を行った。

実験の設計を図18に概略的に記載する。初代ヒト肝細胞(PHH)細胞に、0日目、4日目及び8日目にHBVを感染させた。ラミブジンによる処理を開始し(これは、合計8日以内の3日間の前処理期間を含む)、細胞に、BE4をコードするmRNA、ならびにgRNA37及びgRNA40を、7日目及び14日目にトランスフェクトした。HBV DNAレベルを経時的に測定し、追加のHBVマーカーを21日目に測定した。

ラミブジンによる前処理は、初代肝細胞における編集を改善した(図19及び20を参照されたい)。ラミブジンと塩基エディターシステムとの併用治療は、HBVのリバウンドを防止した(図19を参照)。図21に示されるように、塩基エディターシステムの併用処理及び投与の両方が、21日目にHBVマーカーの約70%～80%の減少をもたらした。

実施例７：低減されたオフターゲット活性を有する塩基エディターの塩基編集効率及び抗ウイルス有効性
編集効率を損なうことなく、(例えば、BE4と比較して)オフターゲット活性が減少し、非特異的効果が低い塩基エディターを使用することが有利であり得る。したがって、ppApoまたはrrA3Fを含有する塩基エディターシステムの抗ウイルス有効性を評価するために実験を行った。この実験は、Yu,et al.“Cytoxine base editors with minimized unguided DNA and RNA off-target events and high on-target activity,”Nature Communications,11:2052(2020),DOI:10.1038/s41467-020-15887-5に記載されており、その開示は、その全体が全ての目的で参照により本明細書に援用される。

図22及び23に示されるように、BE4、ppApo、またはrrA3F、ならびにgRNA37及びgRNA40を含有する塩基エディターシステムは、同等の編集効率を有し、HBVマーカーHBsAgの減少と関連していることが見出された。

実施例８：シトシン塩基編集は、インビトロ及びインビボで、B型肝炎ウイルスの複製を阻害し、HBsAgの発現を低下させた
塩基編集戦略は、2つの異なるgRNAを使用して、HBV遺伝子(例えば、HB及びPrecore)に終止コドンを導入するように考案された。このアプローチの抗ウイルス有効性は、2つの異なるHBV感染細胞モデルにおいてインビトロで評価された。HepG2-NTCP及び初代ヒト肝細胞。HepG2-NTCP及び初代ヒト肝細胞に、CBE BE4をコードするmRNA、ならびにgRNA37及びgRNA40をトランスフェクトした。このトランスフェクションは、堅牢なcccDNA編集(例えば、B型肝炎表面抗原(HBsAg)をコードする遺伝子における最大50%の編集、及びPrecore遺伝子における最大80%の編集)をもたらし、コードされたウイルスマーカーの減少をもたらした。CBS mRNA及び両方のgRNAによるトランスフェクションは、以下の各々の持続的な減少をもたらした:HBsAg、HBeAg(HBVウイルスタンパク質である)、3.5kbウイルスRNA、及び全細胞内HBV DNA。このHBsAg、HBeAg、3.5kbウイルスRNA、及び全細胞内HBV DNAの有意な減少は、CBE及びgRNAを単一の処理として投与したとき、ならびにそれらをヌクレオシド類似体と組み合わせて使用したときに観察された。

インビトロでのこれらの塩基編集試薬の有効性を確認した後、HBVミニサークルマウスモデルを使用して、インビボでの抗ウイルス有効性についてこれらの同じ塩基編集試薬を評価するために実験を行った。このインビボモデルは、cccDNA様プラスミドによる流体力学的注射から生じる持続的なHBV複製及び抗原発現を示す。HBVウイルス複製を確立した後、塩基編集試薬の肝臓送達は、以下の塩基編集試薬で製剤化された脂質ナノ粒子(LNP)の全身投与によって達成された:CBE mRNA及びHBV標的gRNA(例えば、gRNA37及びgRNA40(表1を参照されたい))。マウスに塩基エディターの組み合わせを投与し、その組み合わせは、gRNA37及びgRNA40、またはgRNA37-HM及びgRNA40-HMのいずれかであった。ガイドgRNA37-HM及びgRNA40-HMは、各々、重度に修飾された(HM)スカフォールドを含んだ(表1を参照されたい)。

塩基編集試薬を含有する脂質ナノ粒子(LNP)の静脈内注射は、マウス血清HBV DNA、HBsAg及びHBeAgの著しい減少をもたらした。この減少は、第1の注射が行われ、2週間後に第2の注射が行われたときにより顕著であった(図24A～24C及び25A～25C)。2mg/kgでのBE4/gRNA(37+40)LNPの2回の注射は、マウス血清中のHBsAg及びHBV DNAのおよそ2logの減少、ならびにHBeAgの検出不能なレベルをもたらした。また、重度に修飾された足場を用いてガイドRNAを投与することが有益であることが見出された(例えば、図25Aを参照されたい)。1日目及び14日目にBE4/gRNA(37+40)-HM(Heavy mod.gRNA)を投与したマウスも、対照と比較して、HBsAgのおよそ2対数の減少を示した。塩基編集試薬を用いた全ての単回投与(すなわち、D1でのみ)及び2回投与(すなわち、D1及びD14で)の処理は、2週間後にHBeAgを検出を下回るレベルに低下させた。エンテカビルまたは塩基編集試薬のいずれかで処置したマウスは、21日目にHBV DNAの血清レベルの約2対数の減少を示した。

以下の表23は、インビボで塩基編集試薬を評価するために使用される実験設計の要約を提供する。マウスは、インビボでのHBV複製を可能にするHBVサークルポリヌクレオチドを含有した。例えば、例示的なマウスモデルの記載については、Yan et al.,J.Hepatol 2017 66:1149-1157を参照されたい。マウスに、BE4(シチジン塩基エディター)をコードするmRNA、ならびにガイドRNAであるgRNA37及びgRNA40、または重修飾(HM)を有する足場を含有するガイドRNAであるgRNA37-HM及びgRNA-40-HMのいずれかを含有する脂質ナノ粒子(BL4 LNP)を投与した。塩基編集試薬を使用した処置の有効性を、エンテカビルを使用した処理の有効性と比較した。マウスに、1日目から14日目まで毎日エンテカビルを投与するか、またはマウスに、1日目のみに1回または2回のいずれかの塩基編集試薬を投与し、第1の投与は1日目にあり、第2の投与は14日目にある。エンテカビル(ETV)を経口投与した。血清中のHBsAg、HbeAg、及びHBV DNAレベルを毎週測定した(図24A～24C及び25A～25C)。

要約すると、データには、塩基編集が、HBV複製を抑制し、ウイルスタンパク質発現をサイレンシングする変異を導入することによって、cccDNAを不活性化することができることが示されている。

実施例９：シトシン塩基編集によるB型肝炎ウイルスゲノムリザーバーの機能不活性化
HBVゲノムの保存された領域を標的化するgRNAを設計し、スクリーニングした(図26A及び26B)。興味深いことに、BE4及び以下のgRNAによる塩基編集:
gRNA S1(gRNA H)プロトスペーサー:GAAAGCCCAGGATGATGGGA
gRNA C2(gRNA B)プロトスペーサー:CCATGCCCCAAAGCCACCCA
gRNA EMSbeam12プロトスペーサー:GACTTCTCTCAATTTTCTAG
は、初代ヒト肝細胞におけるHBVリバウンドを防止した(図27A～D)。CBEで終止コドンを導入する2つのgRNAの多重化は、HepG2-NTCP(図28A～D)及び初代ヒト肝細胞におけるHBsAg、HBeAg、HBV DNA、及び3.5kb RNAを低減した。塩基編集は、天然に組み込まれたHBBからHBを減少させた(図29A～C)。理論に拘束されることを意図するものではないが、ウイルスマーカーの減少は、cccDNAレベルに影響を与えることなく、cccDNAの塩基編集によって駆動される可能性が高い。図30A～Cに示されるように、塩基編集は、天然に組み込まれたHBVからのHBを強く低減した。標準的な抗ウイルス3TC(ラミブジン)による塩基編集試薬の組み合わせ処理により、塩基編集効率のより高い検出がもたらされた。

実施例１０：シトシン塩基編集は、インビトロ及びインビボで、B型肝炎ウイルスの複製を阻害し、HBsAgの発現を低下させた
実施例９のgRNAをBE4塩基エディターで多重化することにより、HepG2-NTCPにおけるHBVウイルスパラメータが同時に減少した(図31A～E)。塩基エディターは、cccDNAレベルを低下させることなく、cccDNA編集を介して機能する。塩基編集は、初代ヒト肝細胞(PHH)におけるウイルスリバウンドを防止した(図32A～C)。

BE4 mRNA及びgRNA S1/C2の脂質ナノ粒子媒介送達は、HBVミニサークルマウスモデルにおけるウイルスマーカーの持続的な減少をもたらす(図33A～C)。HBVミニサークルマウスモデルは、免疫能のあるマウスにおけるHBV様ウイルス粒子の持続的産生及びHBV抗原発現を支持する。cccDNA様ミニサークルプラスミドによる流体力学的注射の4週間後、マウスは、1または2用量(2×)の塩基編集試薬(脂質ナノ粒子(LNP)に製剤化されたmRNA及びgRNA、2mg/kg)を受けた。エンテカビル(ETV)処理マウスに、0.03mg/kgの抗ウイルス剤を2週間経口投与し、次いで処理を中止した。

要約すると、HBV遺伝子HB及びPrecoreに終止コドンを導入する2つのgRNAをCBEで多重化することにより、HepG2-NTCP及びヒト初代肝細胞におけるHBsAg、HBeAg、HBV DNA、及び3.5kb RNAが同時に減少する。理論に拘束されることを意図するものではないが、ウイルスマーカーの減少は、cccDNAの塩基編集によって駆動される可能性が高いが、cccDNAレベルの減少は駆動されない。

HBVミニサークルマウスモデルにおけるインビボの概念実証:2mg/kgのHBV標的化塩基エディターで製剤化されたLNPを用いたIV注射(複数可)は、HBsAgの持続的な減少をもたらし、数匹のマウスは、HBsAgの喪失、ならびにHBeAg及び血清HBV DNAの減少を示す。合わせて、データは、塩基編集が、HBV複製を抑制し、ウイルスタンパク質発現をサイレンシングする変異を導入することによって、cccDNAを不活性化することができることを示した(図29)。

BE4をgRNA EMSbeam12及びMSPbeam37-PLCと組み合わせて、アレキサンダー肝腫細胞株、PLC/PRF/5に存在する天然に組み込まれたHBVゲノムを編集した(図34A)。この編集は、HBsAg分泌を減少させた(図34B)。

以下の材料及び方法を、上記の実施例において用いた。

HBV感染症を研究するための一次ヒト肝細胞系
HBVに感染した原発性肝細胞(PHH)共培養物を使用して、塩基編集システムの抗ウイルス有効性を試験した。HBVウイルスに感染した原発性肝細胞共培養(PHH)は、塩基編集システムの抗ウイルス活性を評価するための臨床的に関連するシステムである。塩基編集試薬(塩基エディター(複数可)をコードするmRNA及び合成gRNA)を、2週間にわたってリポフェクションを介して2回トランスフェクションした。第1のトランスフェクションは、感染の約3、4、または7日後(感染後の日数(dpi))に実行した。理論に拘束されないが、この3～7日間の期間は、トランスフェクション時にcccDNAが完全に形成されることを確実にした。第2のトランスフェクションは、感染後約7、10、11、または14日であった。細胞外パラメータ(例えば、HBsAg、HBeAg、及びHBV DNA)を実験の経過にわたって(実験の終了を含む)モニタリングし、細胞内パラメータ(HBV DNA、ウイルスRNA、及び編集)を実験の終了時に測定した。細胞を、実験の終了時(例えば、15、17、21または25日)に溶解した。

トランスフェクションの詳細:RNAフォーマット、ベンダープロトコルに従ってリポフェクション(lipofectamin messengerMax、thermofisher Scientific)を介してトランスフェクトされた24ウェルプレート(600ng塩基エディターをコードするmRNA+200ng gRNA)内のウェル当たり800ng全RNA。

実施例１１：ラミブジン(LAM)による前処理を伴う、及び伴わないインビトロでの肝腫細胞株HepG2.2.15のシトシン塩基編集は、HBsAg及びHBeAgのレベルを低下させた。
ラミブジン(LAM)による前処理を伴う、及び伴わない肝腫細胞株HepG2.2.15のインビトロでの塩基編集を評価するための実験を行った。HepG2.2.15細胞を塩基編集し、続いて、図35に示される実験スキームに従って、ポリペプチド発現を評価した。細胞を0日目に播種した(D0)。1日目(D1)に、LAMで前処理した細胞について、LAM前処理を開始した。4日目(D4)に、LAMの有無にかかわらず、細胞を新しいウェルに移した。5日目(D5)に、BE4塩基エディターをコードするmRNA、ならびにガイドポリヌクレオチドgRNA12(HBs遺伝子を標的化するEMSbeam12)、gRNA37(HBS遺伝子を標的化するMSPbeam37)、及びgRNA40(HBeAgをコードする遺伝子を標的化するMSPbeam40)のうちの1つ以上を細胞にトランスフェクトした(図36A及び36B)。増殖培地を8日目に交換した(D8)。11日目(形質導入後D11及び6日目)に、酵素結合免疫吸着アッセイを使用して分析のために培養上清を収集し、HBsAg及びHBeAgの発現レベルを測定した。HBs遺伝子を標的化するガイドgRNA37またはgRNA12を使用して編集された細胞については、HBsAg発現の堅牢な低下が観察され、HBeAgをコードする遺伝子を標的化するガイドgRNA40を使用して編集された細胞については、HBeAg発現の堅牢な低下が観察された。gRNA40及びgRNA37の両方を使用して編集した細胞は、HBsAg及びHBeAgの両方の発現の低下を示した。

他の実施形態
前述の説明から、本明細書に記載の発明に変形及び修正を加えて、それを様々な用法及び条件に採用することができることは明らかであろう。そのような実施形態もまた、以下の特許請求の範囲の範囲内である。

本明細書における変数の任意の定義における要素のリストの列挙は、任意の単一の要素として、または列挙された要素の組み合わせ(またはサブコンビネーション)として、その変数の定義を含む。本明細書における実施形態の列挙は、任意の単一の実施形態として、または任意の他の実施形態もしくはその一部と組み合わせて、その実施形態を含む。

本明細書において言及される全ての特許及び刊行物は、各個別の特許及び刊行物が、具体的かつ個々に参照により組み込まれることが示されているのと同程度に、参照により本明細書に組み込まれる。本開示は、PCT/US20/32226に関連し得、その開示は、その全体が全ての目的で参照により本明細書に援用される。

Claims

B型肝炎ウイルス(HBV)ゲノムの核酸塩基を編集する方法であって、前記HBVゲノムを、1つ以上のガイドRNA、ならびにポリヌクレオチドプログラマブルDNA結合ドメイン及びアデノシンデアミナーゼを含む塩基エディターと接触させることを含み、前記ガイドRNAが、前記塩基エディターを標的指向化して、前記HBVゲノムの前記核酸塩基の改変をもたらし、前記1つ以上のガイドRNAが、ACAAGAAUCCUCACAAUACC(配列番号405)、UCGCUGGAUGUGUCUGCGGC(配列番号406)、CACCUGUAUUCCCAUCCCAU(配列番号407)、GGGGCCAAGUCUGUACAGCA(配列番号408)、GCUGACGCAACCCCCACUGG(配列番号409)、GGAGCUACUGUGGAGUUACU(配列番号410)、UUCUUCUAGGGGACCUGCCU(配列番号411)、GAGGACAAACGGGCAACAUA(配列番号412)、UUGUCAACAAGAAAAACCCC(配列番号413)、CCCAAGGUCUUACAUAAGAG(配列番号414)、CCGGGCAACGGGGUAAAGGU(配列番号415)、ACACAGAAAGGCCUUGUAAG(配列番号416)、GAAAGCCCAAGAUGAUGGGA(配列番号10834)、及びCACGCACGCGCUGAUGGCCC(配列番号417)のうちの1つ以上から選択される、5’から3’へのヌクレオチド配列、あるいはその1、2、3、4もしくは5個のヌクレオチド5’及び/または3’の切断断片を含む、前記方法。
B型肝炎ウイルス(HBV)ゲノムの核酸塩基を編集する方法であって、
(i)HBVゲノムを含む細胞を、1つ以上のガイドRNA、ならびにポリヌクレオチドプログラマブルDNA結合ドメイン及びアデノシンデアミナーゼまたはシチジンデアミナーゼを含む塩基エディターと接触させることであって、前記ガイドRNAが、前記塩基エディターを標的指向化して、前記HBVゲノムの前記核酸塩基の改変をもたらし、それによって、前記HBVゲノム中の核酸塩基を編集する、前記接触させることと、
(ii)前記細胞を抗レトロウイルス薬と接触させることであって、前記細胞を前記抗レトロウイルス薬と接触させることが、前記抗レトロウイルス薬と接触していない参照細胞と比較して塩基編集効率の増加と関連している、前記接触させることと、を含む、前記方法。
組み込まれたHBV DNAから産生されるHBsAgを低減する方法であって、HBVゲノムを含む細胞を、1つ以上のガイドRNA、ならびにポリヌクレオチドプログラマブルDNA結合ドメイン及びアデノシンデアミナーゼまたはシチジンデアミナーゼを含む塩基エディターと接触させることを含み、前記ガイドRNAが、前記塩基エディターを標的指向化して、前記HBVゲノムの核酸塩基の改変をもたらし、それによって、組み込まれたHBV DNAからのHBsAg産生を低減する、前記方法。
前記抗レトロウイルス薬が、ラミブジン、エンテカビル、テノホビル、インターフェロン、及びPeg-インターフェロンからなる群から選択される、請求項2に記載の方法。
工程(i)が工程(ii)に先行するか、または工程(ii)が工程(i)に先行する、請求項2～4のいずれか1項に記載の方法。
前記細胞を、工程(i)の約1、2、3、4、5、6、7、8、9、10、11、12、13、もしくは14日前に、または少なくとも約1、2、3、4、5、6、7、8、9、10、11、12、13、もしくは14日前に、前記抗レトロウイルス薬と最初に接触させる、請求項2～5のいずれか1項に記載の方法。
前記細胞が、以前に前記抗レトロウイルス薬と接触していない、請求項2～6のいずれか1項に記載の方法。
前記細胞が、対象内にある、請求項2～7のいずれか1項に記載の方法。
前記HBVゲノムを、2つ以上のガイドRNAと同時に接触させる、請求項1～8のいずれか1項に記載の方法。
前記ガイドRNAが、ACAAGAAUCCUCACAAUACC(配列番号405)、UCGCUGGAUGUGUCUGCGGC(配列番号406)、CACCUGUAUUCCCAUCCCAU(配列番号407)、GGGGCCAAGUCUGUACAGCA(配列番号408)、GCUGACGCAACCCCCACUGG(配列番号409)、GGAGCUACUGUGGAGUUACU(配列番号410)、UUCUUCUAGGGGACCUGCCU(配列番号411)、GAGGACAAACGGGCAACAUA(配列番号412)、UUGUCAACAAGAAAAACCCC(配列番号413)、CCCAAGGUCUUACAUAAGAG(配列番号414)、CCGGGCAACGGGGUAAAGGU(配列番号415)、ACACAGAAAGGCCUUGUAAG(配列番号416)、及びCACGCACGCGCUGAUGGCCC(配列番号417)のうちの1つ以上から選択される、請求項2～9のいずれか1項に記載の方法。
前記1つ以上のガイドRNAが、表2A、表2B、表2C、及び/または配列番号3105～5485及び8220～10830に列挙された配列から選択されるスペーサー配列を含む、請求項2～10のいずれか1項に記載の方法。
前記1つ以上のガイドRNAが、ヌクレオチド配列GAAAGCCCAGGAUGAUGGGA(配列番号657)、5’-GAAAGCCCAAGATGATGGGA-3’、及びCCAUGCCCCAAAGCCACCCA(配列番号662)を含むスペーサーを含む、請求項2～11のいずれか1項に記載の方法。
前記1つ以上のガイドRNAが、ヌクレオチド配列mG*mA*mA*AGCCCAGGAUGAUGGGAGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUmU*mU*mU*(配列番号424)及びmC*mC*mA*UGCCCCAAAGCCACCCAGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUmU*mU*mU*(配列番号422)を含む、請求項2～12のいずれか1項に記載の方法。
前記1つ以上のガイドRNAが、以下の足場配列:gUUUUAGagcuagaaauagcaaGUUaAaAuAaggcuaGUccGUUAucAAcuugaaaaagugGcaccgagucggugcusususu(配列番号317)を含み、式中、a、c、u、またはgが、2’O-メチル(M)修飾を有する塩基を表し、as、cs、us、またはgsが、2’-O-メチル3’-ホスホロチオエート(MS)修飾を有する塩基を表す、請求項1～13のいずれか1項に記載の方法。
前記1つ以上のガイドRNAが、以下のヌクレオチド配列gsasasAGCCCAGGAUGAUGGGAgUUUUAGagcuagaaauagcaaGUUaAaAuAaggcuaGUccGUUAucAAcuugaaaaagugGcaccgagucggugcusususu(配列番号424)、及び
cscsasUGCCCCAAAGCCACCCAgUUUUAGagcuagaaauagcaaGUUaAaAuAaggcuaGUccGUUAucAAcuugaaaaagugGcaccgagucggugcusususu(配列番号422)を含み、式中、a、c、u、またはgが、それぞれ、2’O-メチル(M)修飾を含有するA、C、U、またはGヌクレオチドを表し、as、cs、us、またはgsが、それぞれ、2’-O-メチル3’-ホスホロチオエート(MS)修飾を含有するA、C、U、またはGヌクレオチドを表す、請求項2～12のいずれか1項に記載の方法。
前記細胞を、第1及び第2の時点で、前記1つ以上のガイドRNA及び前記塩基エディターと接触させる、請求項2～15のいずれか1項に記載の方法。
前記細胞を接触させる第1の時間と第2の時間との間隔が、少なくとも1週間である、請求項16に記載の方法。
前記細胞を接触させる第1の時間と第2の時間との間隔が、少なくとも2週間である、請求項16に記載の方法。
前記塩基編集効率が、少なくとも約5%、10%、15%、または20%改善される、請求項2～18のいずれか1項に記載の方法。
B型肝炎ウイルス(HBV)ゲノムの核酸塩基を編集する方法であって、HBVゲノムを含む細胞を、ポリヌクレオチドプログラマブルDNA結合ドメイン及びアデノシンデアミナーゼまたはシチジンデアミナーゼを含む塩基エディターをコードするmRNA、ならびに配列GAAAGCCCAGGAUGAUGGGA(配列番号657)及びCCAUGCCCCAAAGCCACCCA(配列番号662)を含む1つ以上のガイドRNAと接触させることを含み、前記1つ以上のガイドRNAが、前記塩基エディターを標的指向化して、前記HBVゲノムの前記核酸塩基の改変をもたらし、それによって、前記HBVゲノム内の核酸塩基を編集する、前記方法。
前記細胞をラミブジンと接触させることを更に含み、前記細胞をラミブジンと接触させることが、抗レトロウイルス薬と接触していない参照細胞と比較して塩基編集効率の増加と関連している、請求項20に記載の方法。
前記ガイドRNAが、以下の足場配列:gUUUUAGagcuagaaauagcaaGUUaAaAuAaggcuaGUccGUUAucAAcuugaaaaagugGcaccgagucggugcusususu(配列番号317)を含み、式中、a、c、uまたはgが、2’O-メチル(M)修飾を有する塩基を表し、as、cs、usまたはgsが、2’-O-メチル3’-ホスホロチオエート(MS)修飾を有する塩基を表す、請求項20または請求項21に記載の方法。
前記ガイドRNAが、以下の足場配列:GUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUmU*mU*mU*(配列番号422)を含み、式中、mA*、mC*、mG*、及びmU*が、2’-O-メチル3’-ホスホロチオエート修飾を有する塩基を表す、請求項20または請求項21に記載の方法。
前記細胞を、第1及び第2の時点で、前記1つ以上のガイドRNA及び前記塩基エディターと接触させる、請求項20～23のいずれか1項に記載の方法。
前記細胞を接触させる第1の時間と第2の時間との間隔が、少なくとも1週間である、請求項24に記載の方法。
前記塩基エディターが、BE4である、請求項20～25のいずれか1項に記載の方法。
前記核酸塩基が、HBVタンパク質をコードするポリヌクレオチド内にある、請求項1～26のいずれか1項に記載の方法。
前記接触させることが、真核細胞、哺乳動物細胞、またはヒト細胞内である、請求項1～26のいずれか1項に記載の方法。
前記細胞が、インビボまたはエクスビボである、請求項2～28のいずれか1項に記載の方法。
前記アデノシンデアミナーゼが、前記B型肝炎ウイルス(HBV)ゲノム内の標的A・TをG・Cに変換する、請求項1～29のいずれか1項に記載の方法。
前記核酸塩基が、HBVコアタンパク質(Core)、HBVポリメラーゼ(Pol)、HBV表面タンパク質、またはHBVタンパク質Xから選択されるHBVタンパク質をコードするポリヌクレオチド配列内にある、請求項1～29のいずれか1項に記載の方法。
前記HBVタンパク質をコードする前記ポリヌクレオチド内の前記核酸塩基の改変が、ミスセンス変異をもたらす、請求項1～31のいずれか1項に記載の方法。
前記核酸塩基が、転写部位と関連している、請求項1～32のいずれか1項に記載の方法。
前記転写部位が、エンハンサーIIボックスA、エンハンサーI、及びHBXプロモーターのうちの1つ以上から選択される、請求項33に記載の方法。
前記核酸塩基の改変が、HBVタンパク質をコードするポリヌクレオチド配列の転写の減少と関連している、請求項1～34のいずれか1項に記載の方法。
前記HBVタンパク質が、HBVポリメラーゼ(Pol)、及び/またはHBVタンパク質Xである、請求項35に記載の方法。
前記ミスセンス変異が、HBV pol遺伝子内にある、請求項32に記載の方法。
前記ミスセンス変異が、前記HBV pol遺伝子によってコードされるHBVポリメラーゼタンパク質においてE24G、L25F、P26F、R27C、V48A、V48I、S382F、V378I、V378A、V379I、V379A、L377F、D380G、D380N、F381P、R376G、A422T、F423P、A432V、M433V、P434S、D540G、A688V、D689G、A717T、E718K、P713S、P713L、またはL719Pをもたらす、請求項37に記載の方法。
前記ミスセンス変異が、HBVコア遺伝子内にある、請求項32に記載の方法。
前記ミスセンス変異が、前記HBVコア遺伝子によってコードされるHBVコアタンパク質において、T160A、T160A、P161F、S162L、C183R、または*184Qをもたらす、請求項39に記載の方法。
前記ミスセンス変異が、HBV X遺伝子内にある、請求項32に記載の方法。
前記ミスセンス変異が、前記HBV X遺伝子によってコードされるHBV Xタンパク質において、H86R、W120R、E122K、E121K、またはL141Pをもたらす、請求項41に記載の方法。
前記ミスセンス変異が、HBV S遺伝子内にある、請求項32に記載の方法。
前記ミスセンス変異が、前記HBV S遺伝子によってコードされるHBV Sタンパク質において、S38F、L39F、W35R、W36R、T37I、T37A、R78Q、S34L、F80P、またはD33Gをもたらす、請求項43に記載の方法。
前記ポリヌクレオチドプログラマブルDNA結合ドメインが、Cas12ポリペプチドを含む、請求項1～44のいずれか1項に記載の方法。
前記ポリヌクレオチドプログラマブルDNA結合ドメインが、Cas12a、Cas12b、Cas12c、Cas12d、Cas12e、Cas12g、Cas12h、またはCas12iを含む、請求項1～45のいずれか1項に記載の方法。
前記ポリヌクレオチドプログラマブルDNA結合ドメインが、Bacillus hisashii Cas12b、Bacillus thermoamylovorans Cas12b、Bacillus sp.V3-13 Cas12b、またはAlicyclobacillus acidiphilus Cas12bと少なくとも約85%のアミノ酸配列同一性を有する配列を含む、請求項1～46のいずれか1項に記載の方法。
前記ポリヌクレオチドプログラマブルDNA結合ドメインが、Bacillus hiasashii Cas12b(bhCas12b)と少なくとも約85%のアミノ酸配列同一性を有する配列を含む、請求項47に記載の方法。
前記ポリヌクレオチドプログラマブルDNA結合ドメインが、ヌクレアーゼ不活性バリアントまたはニッカーゼバリアントを含む、請求項1～48のいずれか1項に記載の方法。
前記ヌクレアーゼ不活性バリアントまたは前記ニッカーゼバリアントが、アミノ酸置換D952A、S893R、K846R、及びE837G、またはそれらの対応するアミノ酸置換を含む、ヌクレアーゼ不活性化bhCas12bを含む、請求項49に記載の方法。
アデノシンデアミナーゼドメインが、デオキシリボ核酸(DNA)中のアデニンを脱アミノ化することができる、請求項1～50のいずれか1項に記載の方法。
前記アデノシンデアミナーゼが、TadAデアミナーゼである、請求項1～51のいずれか1項に記載の方法。
前記TadAデアミナーゼが、TadA*7.10、TadA*8.1、TadA*8.2、TadA*8.3、TadA*8.4、TadA*8.5、TadA*8.6、TadA*8.7、TadA*8.8、TadA*8.9、TadA*8.10、TadA*8.11、TadA*8.12、TadA*8.13、TadA*8.14、TadA*8.15、TadA*8.16、TadA*8.17、TadA*8.18、TadA*8.19、TadA*8.20、TadA*8.21、TadA*8.22、TadA*8.23、またはTadA*8.24である、請求項52に記載の方法。
前記TadAデアミナーゼが、TadA*8.13である、請求項53に記載の方法。
前記1つ以上のガイドRNAが、CRISPR RNA(crRNA)及びトランスコード化低分子RNA(tracrRNA)を含み、前記crRNAが、HBV核酸配列に相補的な核酸配列を含む、請求項1～54のいずれか1項に記載の方法。
前記塩基エディターが、HBV核酸配列に相補的な核酸配列を含む単一ガイドRNA(sgRNA)と複合体を形成している、請求項1～55のいずれか1項に記載の方法。
2つ以上の核酸塩基を編集することを含む、請求項1～56のいずれか1項に記載の方法。
前記HBVゲノムを、2つ以上のHBV核酸配列を標的化する2つ以上のガイドRNAと接触させることを含む、請求項1～57のいずれか1項に記載の方法。
対象におけるB型肝炎ウイルス(HBV)感染症を治療する方法であって、その治療を必要とする対象に、融合タンパク質、タンパク質複合体、または前記融合タンパク質もしくは前記タンパク質複合体をコードするポリヌクレオチドを投与することを含み、前記融合タンパク質または前記タンパク質複合体が、ポリヌクレオチドプログラマブルDNA結合ドメインと、アデノシンデアミナーゼドメインである塩基エディタードメインと、前記塩基エディタードメインを標的指向化してHBVゲノムの核酸塩基のA・TからG・Cへの改変をもたらす1つ以上のガイドRNAと、を含み、前記1つ以上のガイドRNAが、ACAAGAAUCCUCACAAUACC(配列番号405)、UCGCUGGAUGUGUCUGCGGC(配列番号406)、CACCUGUAUUCCCAUCCCAU(配列番号407)、GGGGCCAAGUCUGUACAGCA(配列番号408)、GCUGACGCAACCCCCACUGG(配列番号409)、GGAGCUACUGUGGAGUUACU(配列番号410)、UUCUUCUAGGGGACCUGCCU(配列番号411)、GAGGACAAACGGGCAACAUA(配列番号412)、UUGUCAACAAGAAAAACCCC(配列番号413)、CCCAAGGUCUUACAUAAGAG(配列番号414)、CCGGGCAACGGGGUAAAGGU(配列番号415)、ACACAGAAAGGCCUUGUAAG(配列番号416)、及びCACGCACGCGCUGAUGGCCC(配列番号417)のうちの1つ以上から選択される、5’から3’へのヌクレオチド配列、あるいはその1、2、3、4もしくは5個のヌクレオチド5’及び/または3’の切断断片を含む、前記方法。
対象におけるB型肝炎ウイルス(HBV)感染症を治療する方法であって、その治療を必要とする対象に、ポリヌクレオチドプログラマブルDNA結合ドメイン及びアデノシンデアミナーゼドメインである塩基エディタードメインをコードする1つ以上のポリヌクレオチドと、前記塩基エディタードメインを標的指向化して、HBVゲノムの核酸塩基のA・TからG・Cへの改変をもたらす1つ以上のガイドRNAと、を投与することを含み、前記1つ以上のガイドRNAが、ACAAGAAUCCUCACAAUACC(配列番号405)、UCGCUGGAUGUGUCUGCGGC(配列番号406)、CACCUGUAUUCCCAUCCCAU(配列番号407)、GGGGCCAAGUCUGUACAGCA(配列番号408)、GCUGACGCAACCCCCACUGG(配列番号409)、GGAGCUACUGUGGAGUUACU(配列番号410)、UUCUUCUAGGGGACCUGCCU(配列番号411)、GAGGACAAACGGGCAACAUA(配列番号412)、UUGUCAACAAGAAAAACCCC(配列番号413)、CCCAAGGUCUUACAUAAGAG(配列番号414)、CCGGGCAACGGGGUAAAGGU(配列番号415)、ACACAGAAAGGCCUUGUAAG(配列番号416)、及びCACGCACGCGCUGAUGGCCC(配列番号417)のうちの1つ以上から選択される、5’から3’へのヌクレオチド配列、あるいはその1、2、3、4もしくは5個のヌクレオチド5’及び/または3’の切断断片を含む、前記方法。
対象におけるB型肝炎ウイルス(HBV)感染症を治療する方法であって、その治療を必要とする対象に、1つ以上のガイドRNAと、ポリヌクレオチドプログラマブルDNA結合ドメイン及びアデノシンデアミナーゼまたはシチジンデアミナーゼを含む塩基エディターと、を投与することを含み、前記1つ以上のガイドRNAが、前記塩基エディターを標的指向化して、HBVゲノムの核酸塩基の改変をもたらす配列GAAAGCCCAGGAUGAUGGGA(配列番号657)及びCCAUGCCCCAAAGCCACCCA(配列番号662)を含み、それによって、前記HBVゲノム中の前記核酸塩基を編集する、前記方法。
前記対象が、哺乳動物またはヒトである、請求項59～61のいずれか1項に記載の方法。
前記融合タンパク質、前記融合タンパク質をコードする前記ポリヌクレオチド、または前記ポリヌクレオチドプログラマブルDNA結合ドメイン及び前記塩基エディタードメインをコードする前記1つ以上のポリヌクレオチド、ならびに前記1つ以上のガイドRNAを前記対象の細胞に送達することを含む、請求項59～62のいずれか1項に記載の方法。
前記細胞が、肝細胞である、請求項63に記載の方法。
前記核酸塩基が、HBVタンパク質をコードするポリヌクレオチド内にある、請求項59～64のいずれか1項に記載の方法。
前記HBVタンパク質が、HBVコアタンパク質(Core)、HBVポリメラーゼ(Pol)、HBV表面タンパク質、またはHBVタンパク質Xである、請求項65に記載の方法。
前記HBVタンパク質をコードする前記ポリヌクレオチドにおける前記核酸塩基の改変が、ミスセンス変異をもたらす、請求項65または請求項66に記載の方法。
前記核酸塩基が、転写部位と関連している、請求項59～67のいずれか1項に記載の方法。
前記転写部位が、エンハンサーIIボックスA、エンハンサーI、及びHBXプロモーターのうちの1つ以上から選択される、請求項68に記載の方法。
前記核酸塩基の改変が、HBVタンパク質をコードするポリヌクレオチド配列の転写の減少と関連している、請求項59～69のいずれか1項に記載の方法。
前記HBVタンパク質が、HBVポリメラーゼ(Pol)、及び/またはHBVタンパク質Xである、請求項70に記載の方法。
前記ミスセンス変異が、HBV pol遺伝子内にある、請求項67に記載の方法。
前記ミスセンス変異が、前記HBV pol遺伝子によってコードされるHBVポリメラーゼタンパク質においてE24G、L25F、P26F、R27C、V48A、V48I、S382F、V378I、V378A、V379I、V379A、L377F、D380G、D380N、F381P、R376G、A422T、F423P、A432V、M433V、P434S、D540G、A688V、D689G、A717T、E718K、P713S、P713L、またはL719Pをもたらす、請求項72に記載の方法。
前記ミスセンス変異が、HBVコア遺伝子内にある、請求項67に記載の方法。
前記ミスセンス変異が、前記HBVコア遺伝子によってコードされるHBVコアタンパク質において、T160A、T160A、P161F、S162L、C183R、または*184Qをもたらす、請求項74に記載の方法。
前記ミスセンス変異が、HBV X遺伝子内にある、請求項67に記載の方法。
前記ミスセンス変異が、前記HBV X遺伝子によってコードされるHBV Xタンパク質において、H86R、W120R、E122K、E121K、またはL141Pをもたらす、請求項76に記載の方法。
前記ミスセンス変異が、HBV S遺伝子内にある、請求項67に記載の方法。
前記ミスセンス変異が、前記HBV S遺伝子によってコードされるHBV Sタンパク質において、S38F、L39F、W35R、W36R、T37I、T37A、R78Q、S34L、F80P、またはD33Gをもたらす、請求項78に記載の方法。
前記ポリヌクレオチドプログラマブルDNA結合ドメインが、Cas12ポリペプチドを含む、請求項59～79のいずれか1項に記載の方法。
前記ポリヌクレオチドプログラマブルDNA結合ドメインが、Cas12a、Cas12b、Cas12c、Cas12d、Cas12e、Cas12g、Cas12h、またはCas12iを含む、請求項59～80のいずれか1項に記載の方法。
前記ポリヌクレオチドプログラマブルDNA結合ドメインが、Bacillus hisashii Cas12b、Bacillus thermoamylovorans Cas12b、Bacillus sp.V3-13 Cas12b、またはAlicyclobacillus acidiphilus Cas12bと少なくとも約85%のアミノ酸配列同一性を有する配列を含む、請求項59～81のいずれか1項に記載の方法。
前記ポリヌクレオチドプログラマブルDNA結合ドメインが、Bacillus hiasashii Cas12b(bhCas12b)と少なくとも約85%のアミノ酸配列同一性を有する配列を含む、請求項82に記載の方法。
前記ポリヌクレオチドプログラマブルDNA結合ドメインが、ヌクレアーゼ不活性バリアントまたはニッカーゼバリアントである、請求項59～83のいずれか1項に記載の方法。
前記ヌクレアーゼ不活性バリアントまたは前記ニッカーゼバリアントが、アミノ酸置換D952A、S893R、K846R、及びE837G、またはそれらの対応するアミノ酸置換を含む、ヌクレアーゼ不活性化bhCas12bである、請求項84に記載の方法。
前記アデノシンデアミナーゼドメインが、デオキシリボ核酸(DNA)中のアデニンを脱アミノ化することができる、請求項59～85のいずれか1項に記載の方法。
前記アデノシンデアミナーゼが、TadAデアミナーゼである、請求項59～86のいずれか1項に記載の方法。
前記TadAデアミナーゼが、TadA*7.10、TadA*8.1、TadA*8.2、TadA*8.3、TadA*8.4、TadA*8.5、TadA*8.6、TadA*8.7、TadA*8.8、TadA*8.9、TadA*8.10、TadA*8.11、TadA*8.12、TadA*8.13、TadA*8.14、TadA*8.15、TadA*8.16、TadA*8.17、TadA*8.18、TadA*8.19、TadA*8.20、TadA*8.21、TadA*8.22、TadA*8.23、またはTadA*8.24である、請求項87に記載の方法。
前記TadAデアミナーゼが、TadA*8.13である、請求項88に記載の方法。
前記1つ以上のガイドRNAが、CRISPR RNA(crRNA)及びトランスコード化低分子RNA(tracrRNA)を含み、前記crRNAが、HBV核酸配列に相補的な核酸配列を含む、請求項59～89のいずれか1項に記載の方法。
前記塩基エディターが、HBV核酸配列に相補的な核酸配列を含む単一ガイドRNA(sgRNA)と複合体を形成している、請求項59～90のいずれか1項に記載の方法。
2つ以上の核酸塩基を編集することを含む、請求項59～91のいずれか1項に記載の方法。
前記HBVゲノムを、2つ以上のHBV核酸配列を標的化する2つ以上のガイドRNAと接触させることを含む、請求項59～92のいずれか1項に記載の方法。
前記HBVゲノムの3、4、または5個の核酸塩基を標的化する2つ以上のガイドRNAを含む、請求項92または請求項93に記載の方法。
前記ガイドRNAが、以下の足場配列:gUUUUAGagcuagaaauagcaaGUUaAaAuAaggcuaGUccGUUAucAAcuugaaaaagugGcaccgagucggugcusususu(配列番号317)を含み、式中、a、c、uまたはgが、2’O-メチル(M)修飾を有する塩基を表し、as、cs、usまたはgsが、2’-O-メチル3’-ホスホロチオエート(MS)修飾を有する塩基を表す、請求項59～93のいずれか1項に記載の方法。
前記ガイドRNAが、以下の足場配列:GUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUmU*mU*mU*(配列番号422)を含み、式中、mA*、mC*、mG*、及びmU*が、2’-O-メチル3’-ホスホロチオエート修飾を有する塩基を表す、請求項59～93のいずれか1項に記載の方法。
前記細胞を、第1及び第2の時点で、前記1つ以上のガイドRNA及び前記塩基エディターと接触させる、請求項63または請求項64に記載の方法。
前記細胞を接触させる第1の時間と第2の時間との間隔が、少なくとも1週間である、請求項97に記載の方法。
前記細胞を接触させる第1の時間と第2の時間との間隔が、少なくとも2週間である、請求項97に記載の方法。
ガイドRNA(複数可)に結合した塩基エディター(複数可)を含む、組成物であって、前記ガイドRNA(複数可)が、ACAAGAAUCCUCACAAUACC(配列番号405)、UCGCUGGAUGUGUCUGCGGC(配列番号406)、CACCUGUAUUCCCAUCCCAU(配列番号407)、GGGGCCAAGUCUGUACAGCA(配列番号408)、GCUGACGCAACCCCCACUGG(配列番号409)、GGAGCUACUGUGGAGUUACU(配列番号410)、UUCUUCUAGGGGACCUGCCU(配列番号411)、GAGGACAAACGGGCAACAUA(配列番号412)、UUGUCAACAAGAAAAACCCC(配列番号413)、CCCAAGGUCUUACAUAAGAG(配列番号414)、CCGGGCAACGGGGUAAAGGU(配列番号415)、ACACAGAAAGGCCUUGUAAG(配列番号416)、及びCACGCACGCGCUGAUGGCCC(配列番号417)のうちの1つ以上から選択される、5’から3’へのヌクレオチド配列、あるいはその1、2、3、4もしくは5個のヌクレオチド5’及び/または3’の切断断片を含む、前記組成物。
前記ガイドRNAが、以下の足場配列:gUUUUAGagcuagaaauagcaaGUUaAaAuAaggcuaGUccGUUAucAAcuugaaaaagugGcaccgagucggugcusususu(配列番号317)を含み、式中、a、c、uまたはgが、2’O-メチル(M)修飾を有する塩基を表し、as、cs、usまたはgsが、2’-O-メチル3’-ホスホロチオエート(MS)修飾を有する塩基を表す、請求項100に記載の組成物。
前記ガイドRNAが、以下の足場配列:GUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUmU*mU*mU*(配列番号422)を含み、式中、mA*、mC*、mG*、及びmU*が、2’-O-メチル3’-ホスホロチオエート修飾を有する塩基を表す、請求項100に記載の組成物。
前記塩基エディターが、アデノシンデアミナーゼである、請求項100～102のいずれか1項に記載の組成物。
前記アデノシンデアミナーゼが、デオキシリボ核酸(DNA)中のアデニンを脱アミノ化することができる、請求項103に記載の組成物。
前記アデノシンデアミナーゼが、TadAデアミナーゼである、請求項104に記載の組成物。
前記TadAデアミナーゼが、TadA*7.10、TadA*8.1、TadA*8.2、TadA*8.3、TadA*8.4、TadA*8.5、TadA*8.6、TadA*8.7、TadA*8.8、TadA*8.9、TadA*8.10、TadA*8.11、TadA*8.12、TadA*8.13、TadA*8.14、TadA*8.15、TadA*8.16、TadA*8.17、TadA*8.18、TadA*8.19、TadA*8.20、TadA*8.21、TadA*8.22、TadA*8.23、またはTadA*8.24である、請求項105に記載の組成物。
前記TadAデアミナーゼが、TadA*8.13である、請求項106に記載の組成物。
前記塩基エディターが、
(i)ヌクレアーゼ不活性bhCas12bを含むか、または
(ii)以下のものと少なくとも80%、85%、90%、95%、96%、97%、98%、99%、もしくは100%同一であるアミノ酸配列を含む、請求項100～106のいずれか1項に記載の組成物。
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLYDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHHPGMNHRVEITEGILADECAALLCRFFRMPRRVFNAQKKAQSSTDGSSGSETPGTSESATPESSGAPKKKRKVGIHGVPAAATRSFILKIEPNEEVKKGLWKTHEVLNHGIAYYMNILKLIRQEAIYEHHEQDPKNPKKVSKAEIQAELWDFVLKMQKCNSFTHEVDKDEVFNILRELYEELVPSSVEKKGEANQLSNKFLYPLVDPNSQSGKGTASSGRKPRWYNLKIAGDPSWEEEKKKWEEDKKKDPLAKILGKLAEYGLIPLFIPYTDSNEPIVKEIKWMEKSRNQSVRRLDKDMFIQALERFLSWESWNLKVKEEYEKVEKEYKTLEERIKEDIQALKALEQYEKERQEQLLRDTLNTNEYRLSKRGLRGWREIIQKWLKMDENEPSEKYLEVFKDYQRKHPREAGDYSVYEFLSKKENHFIWRNHPEYPYLYATFCEIDKKKKDAKQQATFTLADPINHPLWVRFEERSGSNLNKYRILTEQLHTEKLKKKLTVQLDRLIYPTESGGWEEKGKVDIVLLPSRQFYNQIFLDIEEKGKHAFTYKDESIKFPLKGTLGGARVQFDRDHLRRYPHKVESGNVGRIYFNMTVNIEPTESPVSKSLKIHRDDFPKVVNFKPKELTEWIKDSKGKKLKSGIESLEIGLRVMSIALGQRQAAAASIFEVVDQKPDIEGKLFFPIKGTELYAVHRASFNIKLPGETLVKSREVLRKAREDNLKLMNQKLNFLRNVLHFQQFEDITEREKRVTKWISRQENSDVPLVYQDELIQIRELMYKPYKDWVAFLKQLHKRLEVEIGKEVKHWRKSLSDGRKGLYGISLKNIDEIDRTRKFLLRWSLRPTEPGEVRRLEPGQRFAIDQLNHLNALKEDRLKKMANTIIMHALGYCYDVRKKKWQAKNPACQIILFEDLSNYNPYKERSRFENSRLMKWSRREIPRQVALQGEIYGLQVGEVGAQFSSRFHAKTGSPGIRCRVVTKEKLQDNRFFKNLQREGRLTLDKIAVLKEGDLYPDKGGEKFISLSKDRKCVTTHADINAAQNLQKRFWTRTHGFYKVYCKAYQVDGQTVYIPESKDQKQKIIEEFGEGYFILKDGVYEWVNAGKLKIKKGSSKQSSSELVDSDILKDSFDLASELKGEKLMLYRDPSGNVFPSDKWMAAGVFFGKLERILISKLTNQYSISTIEDDSSKQSMKRPAATKKAGQAKKKK(配列番号418)。
脂質を更に含む、請求項100～108のいずれか1項に記載の組成物。
前記脂質が、カチオン性脂質である、請求項109に記載の組成物。
薬学的に許容される賦形剤を更に含む、請求項100～110のいずれか1項に記載の組成物。
HBV感染症の治療のための医薬組成物であって、
(i)塩基エディター、または前記塩基エディターをコードする核酸と、薬学的に許容される賦形剤中のHBV遺伝子に相補的な核酸配列を含む1つ以上のガイドRNA(gRNA)と、を含み、前記1つ以上のガイドRNAが、ACAAGAAUCCUCACAAUACC(配列番号405)、UCGCUGGAUGUGUCUGCGGC(配列番号406)、CACCUGUAUUCCCAUCCCAU(配列番号407)、GGGGCCAAGUCUGUACAGCA(配列番号408)、GCUGACGCAACCCCCACUGG(配列番号409)、GGAGCUACUGUGGAGUUACU(配列番号410)、UUCUUCUAGGGGACCUGCCU(配列番号411)、GAGGACAAACGGGCAACAUA(配列番号412)、UUGUCAACAAGAAAAACCCC(配列番号413)、CCCAAGGUCUUACAUAAGAG(配列番号414)、CCGGGCAACGGGGUAAAGGU(配列番号415)、ACACAGAAAGGCCUUGUAAG(配列番号416)、及びCACGCACGCGCUGAUGGCCC(配列番号417)のうちの1つ以上から選択される、5’から3’へのヌクレオチド配列、あるいはその1、2、3、4もしくは5個のヌクレオチド5’及び/または3’の切断断片を含む、前記医薬組成物。
前記塩基エディターが、
(i)ヌクレアーゼ不活性bhCas12bを含むか、または
(ii)以下のものと少なくとも80%、85%、90%、95%、96%、97%、98%、99%、もしくは100%同一であるアミノ酸配列を含む、請求項112に記載の医薬組成物。
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLYDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHHPGMNHRVEITEGILADECAALLCRFFRMPRRVFNAQKKAQSSTDGSSGSETPGTSESATPESSGAPKKKRKVGIHGVPAAATRSFILKIEPNEEVKKGLWKTHEVLNHGIAYYMNILKLIRQEAIYEHHEQDPKNPKKVSKAEIQAELWDFVLKMQKCNSFTHEVDKDEVFNILRELYEELVPSSVEKKGEANQLSNKFLYPLVDPNSQSGKGTASSGRKPRWYNLKIAGDPSWEEEKKKWEEDKKKDPLAKILGKLAEYGLIPLFIPYTDSNEPIVKEIKWMEKSRNQSVRRLDKDMFIQALERFLSWESWNLKVKEEYEKVEKEYKTLEERIKEDIQALKALEQYEKERQEQLLRDTLNTNEYRLSKRGLRGWREIIQKWLKMDENEPSEKYLEVFKDYQRKHPREAGDYSVYEFLSKKENHFIWRNHPEYPYLYATFCEIDKKKKDAKQQATFTLADPINHPLWVRFEERSGSNLNKYRILTEQLHTEKLKKKLTVQLDRLIYPTESGGWEEKGKVDIVLLPSRQFYNQIFLDIEEKGKHAFTYKDESIKFPLKGTLGGARVQFDRDHLRRYPHKVESGNVGRIYFNMTVNIEPTESPVSKSLKIHRDDFPKVVNFKPKELTEWIKDSKGKKLKSGIESLEIGLRVMSIALGQRQAAAASIFEVVDQKPDIEGKLFFPIKGTELYAVHRASFNIKLPGETLVKSREVLRKAREDNLKLMNQKLNFLRNVLHFQQFEDITEREKRVTKWISRQENSDVPLVYQDELIQIRELMYKPYKDWVAFLKQLHKRLEVEIGKEVKHWRKSLSDGRKGLYGISLKNIDEIDRTRKFLLRWSLRPTEPGEVRRLEPGQRFAIDQLNHLNALKEDRLKKMANTIIMHALGYCYDVRKKKWQAKNPACQIILFEDLSNYNPYKERSRFENSRLMKWSRREIPRQVALQGEIYGLQVGEVGAQFSSRFHAKTGSPGIRCRVVTKEKLQDNRFFKNLQREGRLTLDKIAVLKEGDLYPDKGGEKFISLSKDRKCVTTHADINAAQNLQKRFWTRTHGFYKVYCKAYQVDGQTVYIPESKDQKQKIIEEFGEGYFILKDGVYEWVNAGKLKIKKGSSKQSSSELVDSDILKDSFDLASELKGEKLMLYRDPSGNVFPSDKWMAAGVFFGKLERILISKLTNQYSISTIEDDSSKQSMKRPAATKKAGQAKKKK(配列番号418)。
前記塩基エディターが、bhCas12b、またはアミノ酸置換D952A、S893R、K846R、及びE837Gを含むbhCas12bバリアントを含む、請求項112または請求項113に記載の医薬組成物。
前記1つ以上のgRNA及び前記塩基エディターが、一緒に製剤化される、請求項112～114のいずれか1項に記載の医薬組成物。
前記1つ以上のgRNA及び前記塩基エディターが、別々に製剤化される、請求項112～115のいずれか1項に記載の医薬組成物。
哺乳動物細胞における発現に好適なベクターを更に含み、前記ベクターが、前記塩基エディターをコードするポリヌクレオチドを含む、請求項112～116のいずれか1項に記載の医薬組成物。
前記ベクターが、ウイルスベクターである、請求項117に記載の医薬組成物。
前記ウイルスベクターが、レトロウイルスベクター、アデノウイルスベクター、レンチウイルスベクター、ヘルペスウイルスベクター、またはアデノ随伴ウイルスベクター(AAV)である、請求項118に記載の医薬組成物。
哺乳動物細胞における発現に好適なリボ核粒子を更に含む、請求項112～119のいずれか1項に記載の医薬組成物。
前記ガイドRNAが、以下の足場配列:gUUUUAGagcuagaaauagcaaGUUaAaAuAaggcuaGUccGUUAucAAcuugaaaaagugGcaccgagucggugcusususu(配列番号317)を含み、式中、a、c、uまたはgが、2’O-メチル(M)修飾を有する塩基を表し、as、cs、usまたはgsが、2’-O-メチル3’-ホスホロチオエート(MS)修飾を有する塩基を表す、請求項112～120のいずれか1項に記載の組成物。
前記ガイドRNAが、以下の足場配列:GUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUmU*mU*mU*(配列番号422)を含み、式中、mA*、mC*、mG*、及びmU*が、2’-O-メチル3’-ホスホロチオエート修飾を有する塩基を表す、請求項112～120のいずれか1項に記載の組成物。
HBV感染症を治療する方法であって、その治療を必要とする対象に、請求項100～111のいずれか1項に記載の組成物を投与することを含む、前記方法。
HBV感染症を治療する方法であって、その治療を必要とする対象に、請求項112～123のいずれか1項に記載の医薬組成物を投与することを含む、前記方法。
前記HBVが、遺伝子型Aのもの、または遺伝子型Dのものである、先行請求項のいずれか1項に記載の方法。
前記方法が、B型肝炎表面抗原、B型肝炎E抗原、B型肝炎ウイルス全DNA、B型肝炎3.5kb RNA、及びB型肝炎共有結合閉鎖環状DNAからなる群から選択されるマーカーのレベルを低下させる、先行請求項のいずれか1項に記載の方法。
前記方法が、B型肝炎S抗原部位及びPreCore部位を編集する、先行請求項のいずれか1項に記載の方法。
前記編集効率が、前記S抗原部位で約30%であり、前記PreCore部位で約60%である、先行請求項のいずれか1項に記載の方法。
対象におけるHBV感染症の治療における、請求項100～111のいずれか1項に記載の組成物の、使用。
対象におけるHBV感染症の治療における、請求項112～123のいずれか1項に記載の医薬組成物の、使用。
前記対象が、哺乳動物である、請求項129または130に記載の使用。
前記対象が、ヒトである、請求項129～131のいずれか1項に記載の使用。
ガイドRNAであって、ACAAGAAUCCUCACAAUACC(配列番号405)、UCGCUGGAUGUGUCUGCGGC(配列番号406)、CACCUGUAUUCCCAUCCCAU(配列番号407)、GGGGCCAAGUCUGUACAGCA(配列番号408)、GCUGACGCAACCCCCACUGG(配列番号409)、GGAGCUACUGUGGAGUUACU(配列番号410)、UUCUUCUAGGGGACCUGCCU(配列番号411)、GAGGACAAACGGGCAACAUA(配列番号412)、UUGUCAACAAGAAAAACCCC(配列番号413)、CCCAAGGUCUUACAUAAGAG(配列番号414)、CCGGGCAACGGGGUAAAGGU(配列番号415)、ACACAGAAAGGCCUUGUAAG(配列番号416)、及びCACGCACGCGCUGAUGGCCC(配列番号417)のうちの1つ以上から選択される、5’から3’へのヌクレオチド配列、あるいはその1、2、3、4もしくは5個のヌクレオチド5’及び/または3’の切断断片を含む、前記ガイドRNA。
前記ガイドRNAが、以下の足場配列:gUUUUAGagcuagaaauagcaaGUUaAaAuAaggcuaGUccGUUAucAAcuugaaaaagugGcaccgagucggugcusususu(配列番号317)を含み、式中、a、c、uまたはgが、2’O-メチル(M)修飾を有する塩基を表し、as、cs、usまたはgsが、2’-O-メチル3’-ホスホロチオエート(MS)修飾を有する塩基を表す、請求項133に記載のガイドRNA。
前記ガイドRNAが、以下の足場配列:GUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUmU*mU*mU*(配列番号422)を含み、式中、mA*、mC*、mG*、及びmU*が、2’-O-メチル3’-ホスホロチオエート修飾を有する塩基を表す、請求項133に記載のガイドRNA。
(i)塩基エディターをコードする核酸と、(ii)請求項133～135のいずれか1項に記載のガイドRNAと、を含む、医薬組成物。
脂質を更に含む、請求項136に記載の医薬組成物。
前記塩基エディターをコードする前記核酸が、mRNAである、請求項136または請求項137に記載の医薬組成物。