JP2024503437A

JP2024503437A - プライム編集効率及び精度を向上させるためのプライム編集因子バリアント、構築物、及び方法

Info

Publication number: JP2024503437A
Application number: JP2023542569A
Authority: JP
Inventors: リュウ，デイビッド，アール．; チェン，ピーター，ジェイ．; アダムソン，ブリタニー; ハスマン，ジェフリー
Original assignee: University of California; Princeton University; Broad Institute Inc
Current assignee: University of California; Princeton University; Broad Institute Inc
Priority date: 2021-01-11
Filing date: 2022-01-11
Publication date: 2024-01-25
Also published as: WO2022150790A2; EP4274894A2; CA3203876A1; WO2022150790A3; AU2022206476A1

Abstract

本開示は、標的部位のプライム編集を行いながらDNAミスマッチ修復経路を阻害することによって、改善された編集効率及び/又は低減されたインデル形成を有するプライム編集のための組成物及び方法を提供する。したがって、本開示は、プライム編集によって核酸分子を編集するための方法であって、核酸分子をプライム編集因子、pegRNA、及びDNAミスマッチ修復経路の阻害剤と接触させ、それによって編集効率を高め、及び/又はインデル形成を低下させて、標的部位に核酸分子に対する1つ以上の修飾をインストールすることを伴う、方法を提供する。本開示は更に、napDNAbpをコードする核酸配列、ポリメラーゼ、及びDNAミスマッチ修復経路の阻害剤を含むプライム編集によってDNA標的部位を編集するためのポリヌクレオチドを提供し、ここでnapDNAbp及びポリメラーゼは、編集効率の向上及び/又はインデル形成の低下を伴ってDNA標的部位に1つ以上の修飾をインストールするpegRNAの存在下で可能である。本開示は更に、本開示の組成物及びポリヌクレオチドを含むベクター、細胞及びキットを提供する。本開示はまた、修飾されたプライム編集因子融合タンパク質による、改良された編集効率及び/又は低減されたインデル形成を伴うプライム編集のための組成物及び方法を提供する。本開示は更に、本開示の組成物及びポリヌクレオチドを含むベクター、細胞及びキットを提供する。

Description

政府支援
本発明は、国立衛生研究所によって授与された助成金番号AI142756、AI150551、HG009490、EB022376、EB031172、GM118062、CA072720、GM138167、U01AI142756、RM1HG009490、R01EB022376、及びR35GM118062、並びに国防総省によって授与された助成金番号HR0011-17-2-0049の下で政府の支援を受けてなされた。政府は、本発明に一定の権利を有する。

関連出願
本出願は、米国特許法第119条(e)の下で、それぞれ参照により本明細書に組み込まれる、2021年10月14日に出願された、米国仮特許出願第63/255,897号、2021年8月9日に出願された米国仮特許出願第63/231,230号、2021年5月28日に出願された米国仮特許出願第63/194,913号、2021年5月28日に出願された米国仮特許出願第63/194,865号、2021年4月16日に出願された米国仮特許出願第63/176,202号、及び2021年1月11日に出願された米国仮特許出願第63/136,194号の優先権を主張する。

参照による組み込み
更に、本出願は、本発明者の1人以上によって先に出願されたプライム編集を対象とする以下の特許出願:2019年3月19日に出願された米国仮特許出願第62/820,813号;2019年6月7日に出願された米国仮特許出願第62/858,958号;2019年8月21日に出願された米国仮特許出願第62/889,996号;2019年8月21日に出願された米国仮特許出願第62/922,654号;2019年10月10日に出願された米国仮特許出願第62/913,553号;2019年10月10日に出願された米国仮特許出願第62/973,558号;2019年11月5日に出願された米国仮特許出願第62/931,195号;2019年12月5日に出願された米国仮特許出願第62/944,231号;2019年12月5日に出願された米国仮特許出願第62/974,537号;2020年3月17日に出願された米国仮特許出願第62/991,069号;2020年3月17日に出願された米国仮特許出願第63/100,548号;2020年3月19日に出願された国際PCT出願第PCT/US2020/023721号;2020年3月19日に出願された国際PCT出願第PCT/US2020/023553号;2020年3月19日に出願された国際PCT出願第PCT/US2020/023583号;2020年3月19日に出願された国際PCT出願第PCT/US2020/023730号;2020年3月19日に出願された国際PCT出願第PCT/US2020/023713号;2020年3月19日に出願された国際PCT出願第PCT/US2020/023712号;2020年3月19日に出願された国際PCT出願第PCT/US2020/023727号;2020年3月19日に出願された国際PCT出願第PCT/US2020/023724号;2020年3月19日に出願された国際PCT出願第PCT/US2020/023725号;2020年3月19日に出願された国際PCT出願第PCT/US2020/023728号;2020年3月19日に出願された国際PCT出願第PCT/US2020/023732号;及び2020年3月19日に出願された国際PCT出願第PCT/US2020/023723号の各々の内容全体を参照することによって、参照し、組み込む。

プライム編集の最近の発展は、エラーを起こしやすい二本鎖DNA切断を必要とせずに、ゲノムDNA配列の挿入、欠失、及び/又は置換を可能にする。その内容が参照により本明細書に組み込まれる、Anzalone et al.,「Search-and-replace genome editing without double-strand breaks or donor DNA,」Nature,2019,Vol.576,pp.149-157を参照。プライム編集は、Cas9を標的ゲノム部位に向けるだけでなく、所望の編集をインストールするための情報をコードする操作されたプライム編集ガイドRNA(pegRNA)と対になった操作されたCas9ニッカーゼ-逆転写酵素融合タンパク質(例として、PE1又はPE2)を使用する。いかなる特定の理論にも束縛されることを望まないが、プライム編集は、推定される多段階の編集プロセスを介して進行する:1)Cas9ドメインは、pegRNAのスペーサ配列によって特定される標的ゲノムDNA部位に結合し、標的ゲノムDNA部位にニックを入れる;2)逆転写酵素ドメインは、逆転写のための鋳型としてpegRNA上の操作された伸長を使用して編集されたDNA鎖の合成を開始するためのプライマーとしてニックの入ったゲノムDNAを使用する-これは編集されたDNA配列を含有する一本鎖3'フラップを生成する;3)細胞DNA修復は、編集された3'フラップによる侵入を介して生じる5'フラップ種の置換、元のDNA配列を含む5'フラップの切除、及び編集されたDNA鎖を組み込むための新しい3'フラップのライゲーションによって3'フラップ中間体を分解し、1つの編集された鎖と1つの編集されていない鎖のヘテロ二本鎖を形成する;並びに4)細胞DNA修復は、編集された鎖を修復のための鋳型として使用してヘテロ二本鎖内の編集されていない鎖を置換し、編集プロセスを完了する。

2019年以来、プライム編集は、多種多様な細胞及び/又は生物に遺伝的変化を導入するために適用されてきた。その迅速な採用を考えると、プライム編集はゲノム編集のための強力なツールを提示する。その汎用性及び広範な使用にもかかわらず、プライム編集効率は、異なる編集クラス、標的遺伝子座、及び細胞タイプにわたって大きく異なり得る(Anzalone et al.,2019)。したがって、プライム編集プロセスの特異性及び/又は効率の向上をもたらすプライム編集システムへの修正は、当該技術の進歩に大きく役立つであろう。特に、プライム編集因子によって合成された編集されたDNA鎖の標的ゲノム部位へのより効率的な組み込みを容易にする修飾が望ましい。プライム編集の結果として形成され得るインデル副産物の頻度を減少させることも望ましい。プライム編集に対するそのような更なる修正は、当該技術を進歩させるであろう。

一側面では、本開示は、プライム編集の効率及び/又は特異性が細胞自身のDNAミスマッチ修復(MMR)DNA修復経路によって影響されるという観察に関する。MMRは、DNA複製及び組換え中に生成される塩基対ミスマッチ及び挿入/欠失ミス対の修正を伴う多因子経路である。本明細書に記載されるように、本発明者らは、一態様では「プライム編集結果のためのプールされたCRISPRiスクリーニング」と呼ばれる新規な遺伝子スクリーニング方法を開発し、プライム編集の効率及び/又は特異性に影響を及ぼすものとして、MMRを包含する様々な遺伝子決定の同定をもたらした。したがって、一側面では、本開示は、MMRの効果を阻害及び/又は回避し、それによってプライム編集の効率及び/又は特異性を高めるための手段を含む新規なプライム編集システムを提供する。一態様では、本開示は、限定するものではないが、ドミナントネガティブMLH1タンパク質(すなわち、「MLH1dn」)等のMMRタンパク質のドミナントネガティブバリアント等のMMR阻害タンパク質を含むプライム編集システムを提供する。別の態様において、プライム編集システムは、意図される編集の近くに1つ以上のサイレント変異をインストールすることを含み、それにより、MLH1dn等のMMR阻害タンパク質が存在しない場合であっても、意図される編集がMMR認識を回避することを可能にする。別の側面では、本開示は、プライム編集の効率及び/又は特異性に影響を及ぼすMMR等の遺伝子決定基を同定するための新規な遺伝子スクリーニングを提供する。なお更なる側面では、本開示は、本明細書に記載の改良されたプライム編集システムをコードする核酸構築物を提供する。他の側面における開示はまた、本明細書中に記載される改良されたプライム編集システムをコードする核酸を含むベクター(例として、AAV又はレンチウイルスベクター)を提供する。更に他の側面では、本開示は、本明細書に記載の改良されたプライム編集システムを含む細胞を提供する。本開示はまた、他の側面では、核酸及び/又はベクター構築物、ガイドRNA、pegRNA、細胞(例として、CRISPRi細胞)、並びに本明細書に開示される遺伝子スクリーニングを行うための他の試薬及び/又は材料を包含する遺伝子スクリーニングの成分を提供する。更に他の側面では、本開示は、本明細書に記載の改良されたプライム編集システムを含み、遺伝子療法、mRNA送達、ウイルス様粒子送達又はリボ核タンパク質(RNP)送達等の任意の適切な手段によって細胞、組織又は生物に投与することができる組成物及びキット、例として医薬組成物を提供する。更に別の側面では、本開示は、改良されたプライム編集システムを使用して、標的核酸分子、例としてゲノム遺伝子座に1つ以上の編集をインストールする方法を提供する。更に別の側面では、本開示は、改良されたプライム編集システムを使用して疾患又は障害を治療して、標的核酸分子、例として1つ以上の疾患を引き起こす突然変異を含むゲノム遺伝子座における1つ以上の遺伝子変化(例として、一塩基多型)を修正又はさもなければ修復する方法を提供する。

したがって、様々な側面において、本開示は、プライム編集中にDNAミスマッチ修復(MMR)系を阻害することを含む、プライム編集のための改善及び修飾されたアプローチを記載する。本発明者らは、驚くべきことに、(MMRのMLH1dn阻害剤を使用する等)プライム編集中にDNAミスマッチ修復(MMR)系の1つ以上の機能が阻害、遮断又は他の様態で不活性化される場合、プライム編集の編集効率が有意に増加されてもよいこと(例として、少なくとも2倍の増加、少なくとも3倍の増加、少なくとも4倍の増加、少なくとも5倍の増加、少なくとも6倍の増加、少なくとも7倍の増加、少なくとも8倍の増加、少なくとも9倍の増加、少なくとも10倍の増加、又はそれを超える増加)を見出した。加えて、本発明者らは、驚くべきことに、プライム編集から生じるインデル形成の頻度が、DNAミスマッチ修復(MMR)系の1つ以上の機能がプライム編集中に阻害されるか、阻止されるか、又は他の様態で不活性化されるとき、有意に低下してもよい(例として、約2倍の減少、約3倍の減少、約4倍の減少、約5倍の減少、約6倍の減少、約7倍の減少、約8倍の減少、約9倍の減少、又は約10倍の減少又はそれ以下)ことを見出した。

本開示はまた、他の態様において、プライム編集中にDNAミスマッチ修復(MMR)系を回避することを含む、プライム編集のための改善及び修飾されたアプローチを記載する。本発明者らは、驚くべきことに、MMRの阻害剤の存在下又は非存在下で、プライム編集によって遺伝子変化をインストールするための所望の部位の近くに1つ以上のサイレント変異がインストールされると、プライム編集の編集効率が有意に増加されてもよい(例として、少なくとも1.5倍、少なくとも2.0倍、少なくとも2.5倍、少なくとも3.0倍、少なくとも3.5倍、少なくとも4.0倍、少なくとも4.5倍、少なくとも5.0倍、少なくとも5.5倍、少なくとも6.0倍、少なくとも6.5倍、少なくとも7.0倍、少なくとも7.5倍、少なくとも8.0倍、少なくとも8.5倍、少なくとも9.0倍、少なくとも9.5倍、少なくとも10.0倍、少なくとも11倍、少なくとも12倍、少なくとも13倍、少なくとも14倍、少なくとも15倍、少なくとも16倍、少なくとも17倍、少なくとも18倍、少なくとも19倍、少なくとも20倍、少なくとも21倍、少なくとも22倍、少なくとも23倍、少なくとも24倍、少なくとも25倍、少なくとも26倍、少なくとも27倍、少なくとも28倍、少なくとも29倍、少なくとも30倍、少なくとも31倍、少なくとも32倍、少なくとも33倍、少なくとも34倍、少なくとも35倍、少なくとも36倍、少なくとも37倍、少なくとも38倍、少なくとも39倍、少なくとも40倍、少なくとも41倍、少なくとも42倍、少なくとも43倍、少なくとも44倍、少なくとも45倍、少なくとも46倍、少なくとも47倍、少なくとも48倍、少なくとも49倍、少なくとも50倍、少なくとも51倍、少なくとも52倍、少なくとも53倍、少なくとも54倍、少なくとも55倍、少なくとも56倍、少なくとも57倍、少なくとも58倍、少なくとも59倍、少なくとも60倍、少なくとも61倍、少なくとも62倍、少なくとも63倍、少なくとも64倍、少なくとも65倍、少なくとも66倍、少なくとも67倍、少なくとも68倍、少なくとも69倍、少なくとも70倍、少なくとも71倍、少なくとも72倍、少なくとも73倍、少なくとも74倍、又は少なくとも75倍増加される)ことを見出した。本発明者らは、驚くべきことに、MMRの阻害剤の存在下又は非存在下で、プライム編集によって遺伝子変化をインストールするための所望の部位の近くに1つ以上のサイレント変異がインストールされると、インデル形成の頻度が有意に減少されてもよい(例として、少なくとも1.5倍、少なくとも2.0倍、少なくとも2.5倍、少なくとも3.0倍、少なくとも3.5倍、少なくとも4.0倍、少なくとも4.5倍、少なくとも5.0倍、少なくとも5.5倍、少なくとも6.0倍、少なくとも6.5倍、少なくとも7.0倍、少なくとも7.5倍、少なくとも8.0倍、少なくとも8.5倍、少なくとも9.0倍、少なくとも9.5倍、少なくとも10.0倍、少なくとも11倍、少なくとも12倍、少なくとも13倍、少なくとも14倍、少なくとも15倍、少なくとも16倍、少なくとも17倍、少なくとも18倍、少なくとも19倍、少なくとも20倍、少なくとも21倍、少なくとも22倍、少なくとも23倍、少なくとも24倍、少なくとも25倍、少なくとも26倍、少なくとも27倍、少なくとも28倍、少なくとも29倍、少なくとも30倍、少なくとも31倍、少なくとも32倍、少なくとも33倍、少なくとも34倍、少なくとも35倍、少なくとも36倍、少なくとも37倍、少なくとも38倍、少なくとも39倍、少なくとも40倍、少なくとも41倍、少なくとも42倍、少なくとも43倍、少なくとも44倍、少なくとも45倍、少なくとも46倍、少なくとも47倍、少なくとも48倍、少なくとも49倍、少なくとも50倍、少なくとも51倍、少なくとも52倍、少なくとも53倍、少なくとも54倍、少なくとも55倍、少なくとも56倍、少なくとも57倍、少なくとも58倍、少なくとも59倍、少なくとも60倍、少なくとも61倍、少なくとも62倍、少なくとも63倍、少なくとも64倍、少なくとも65倍、少なくとも66倍、少なくとも67倍、少なくとも68倍、少なくとも69倍、少なくとも70倍、少なくとも71倍、少なくとも72倍、少なくとも73倍、少なくとも74倍、又は少なくとも75倍増加される)ことを見出した。

いくつかの態様では、本開示は、PE2＋MLH1ドミナントネガティブタンパク質(例として、本明細書に更に記載されるように、アミノ酸754～756が切断された野生型MLH1)を包含する、本明細書で「PE4」と呼ばれる改良されたプライム編集システムを記載する。特定の態様では、MLH1dnは、PE2融合タンパク質を含む細胞においてトランスで発現される。MLH1dn及びPE2は、例として、別々のプラスミド、別々のベクター(例として、AAV又はレンチウイルスベクター)、別々のベクター様粒子、別々のリボ核タンパク質複合体(RNP)への送達によって、又は同じプラスミド、同じベクター(例として、AAV又はレンチウイルスベクター)、同じベクター様粒子、同じリボ核タンパク質複合体(RNP)への送達によって、一緒に又は別々に提供されてもよい。他の態様では、MLH1dnは、それらが同時送達されるように、PE2に融合されてもよく、又は他の方法でPE2に会合、結合、若しくは結合されてもよい。

他の態様では、本開示は、PE3(PE2＋第2鎖ニッキングガイドRNA)＋MLH1ドミナントネガティブタンパク質(例として、本明細書に更に記載されるように、アミノ酸754～756が切断された野生型MLH1)を包含する、「PE5」と呼ばれる改良されたプライム編集システムを記載する。特定の態様では、MLH1dnは、PE3プライム編集因子を含む細胞においてトランスで発現される。MLH1dn及びPE3は、例として、別々のプラスミド、別々のベクター(例として、AAV又はレンチウイルスベクター)、別々のベクター様粒子、別々のリボ核タンパク質複合体(RNP)への送達によって、又は同じプラスミド、同じベクター(例として、AAV又はレンチウイルスベクター)、同じベクター様粒子、同じリボ核タンパク質複合体(RNP)への送達によって、一緒に又は別々に提供されてもよい。他の態様では、MLH1dnは、それらが同時送達されるように、PE3に融合されてもよく、又は他の方法でPE3に会合、結合、若しくは結合されてもよい。

他の側面では、本開示は、本明細書で「PEmax」と呼ばれる最適化されたPE2プライム編集因子アーキテクチャを説明する。PEmaxは、修飾逆転写酵素コドン使用頻度、SpCas9変異、NLS配列を含むPE2の修飾形態であり、図54Bに記載されている。具体的には、PEmaxは、以下の構造を有するCas9(R221K N394K H840A)及びバリアントMMLV RT五変異体(D200N T306K W313F T330P L603W)を含む融合タンパク質を含むPE複合体を指す:［二部分NLS］-［Cas9(R221K)(N394K)(H840A)］-［リンカー］-［MMLV_RT(D200N)(T330P)(L603W)］-［二部分NLS］-［NLS］＋所望のPEgRNA、ここで、PE融合体は、以下に示される配列番号99のアミノ酸配列を有する。

いくつかの態様では、PE4は、PE2融合タンパク質をPEmaxで置換するように修飾されてもよい。そのような場合、修正プライム編集システムは「PE4max」と呼ばれてもよい。

いくつかの態様では、PE5は、PE3プライム編集因子をPEmaxで置換するように修飾されてもよい。そのような場合、修飾されたプライム編集システムは「PE5max」と呼ばれてもよく、第2のストランドニッキングガイドRNAを包含する。

本発明者らは、エラーを起こしやすい二本鎖DNA切断を必要とせずにゲノムDNA配列の挿入、欠失及び/又は置換を可能にするプライム編集を開発した。本開示はここで、プライム編集中のMMR経路(例として、MLH1を包含するMMR経路タンパク質を阻害、遮断又は不活性化することによって)の遮断、阻害、回避、又は不活性化を伴うプライム編集の改善された方法を提供し、それによって驚くべきことに、そのようにすることは編集効率の増加及びインデル形成の減少をもたらす。本明細書で使用される場合、プライム編集「中」は、MMR経路(例として、MLH1の阻害を標的化することによって)を遮断する、阻害する、回避する、又は不活性化する工程の前、同時に、又は後にプライム編集工程が適用され得るように、任意の適切な一連の事象を受け入れることができる。

様々な側面において、いかなる特定の理論にも束縛されることを望まないが、プライム編集は、Cas9を標的ゲノム部位に向かわせ、所望の編集をインストールするための情報をコードする操作されたプライム編集ガイドRNA(pegRNA)と対になる操作されたCas9ニッカーゼ-逆転写酵素融合タンパク質(例として、PE1又はPE2)を使用する。プライム編集は、多段階の編集プロセスを介して進行する:1)Cas9ドメインは、pegRNAのスペーサ配列によって特定される標的ゲノムDNA部位に結合し、標的ゲノムDNA部位にニックを入れる;2)逆転写酵素ドメインは、逆転写のための鋳型としてpegRNA上の操作された伸長を使用して編集されたDNA鎖の合成を開始するためのプライマーとしてニックの入ったゲノムDNAを使用する-これは編集されたDNA配列を含有する一本鎖3'フラップを生成する;3)細胞DNA修復は、編集された3'フラップによる侵入を介して生じる5'フラップ種の置換、元のDNA配列を含む5'フラップの切除、及び編集されたDNA鎖を組み込むための新しい3'フラップのライゲーションによって3'フラップ中間体を分解し、1つの編集された鎖と1つの編集されていない鎖のヘテロ二本鎖を形成する;並びに4)細胞DNA修復は、編集された鎖を修復のための鋳型として使用してヘテロ二本鎖内の編集されていない鎖を置換し、編集プロセスを完了する。

所望の編集の効率的な組み込みは、新たに合成された3'フラップがゲノムDNA部位に相同な配列の一部を含むことを必要とする。この相同性により、編集された3'フラップは、DNA二重鎖への組み込みに関して内因性DNA鎖(対応する5'フラップ)と競合することが可能になる。編集された3'フラップは内因性5'フラップよりも少ない配列相同性を含むので、競合は5'フラップ鎖を優先すると予想される。したがって、プライム編集の効率における潜在的な制限要因は、編集を含有する3'フラップが5'フラップストランドに効果的に侵入し変位しないことであってもよい。更に、成功した3'フラップの浸潤及び5'フラップの除去は、二本鎖DNAゲノムの一方の鎖に編集を組み込むだけである。編集の永続的なインストールは、編集された鎖を鋳型として使用して未編集の相補的DNA鎖を置換するための細胞DNA修復を必要とする。二次sgRNA(すなわち、PE3系)を使用して編集に隣接する未編集の鎖にニックを導入することによって、編集された鎖よりも未編集の鎖の置換を促進するように細胞が作製され得るが(上の工程4)、このプロセスは依然としてDNA修復の第2段階に依存する。

本開示は、DNAミスマッチ修復(MMR)系を更に阻害すること、遮断すること、又はそうでなければ不活性化することを含む、プライム編集に対する修飾されたアプローチを記載する。特定の態様では、DNAミスマッチ修復(MMR)系の、MLH1、PMS2(又はMutLアルファ)、PMS1(又はMutLベータ)、MLH3(又はMutLガンマ)、MutSアルファ(MSH2-MSH6)、MutSベータ(MSH2-MSH3)、MSH2、MSH6、PCNA、RFC、EXO1、POLδ、及びPCNAを包含するがこれらに限定されないMMR系の1つ以上のタンパク質が阻害、遮断、又は他の方法で不活性化され得る。本開示は、例として、MMR系のタンパク質をコードする遺伝子、例として、MLH1、PMS2(又はMutLアルファ)、PMS1(又はMutLベータ)、MLH3(又はMutLガンマ)、MutSアルファ(MSH2-MSH6)、MutSベータ(MSH2-MSH3)、MSH2、MSH6、PCNA、RFC、EXO1、POLδ及びPCNAに1つ以上の突然変異を導入することによる、遺伝子レベルでのMMR系の1つ以上の重要なタンパク質の不活性化を包含するが、これらに限定されない、DNAミスマッチ修復(MMR)系を阻害するか、阻止するか、そうでなければ不活性化する任意の適切な手段を企図する。

したがって、一側面では、本開示は、DNAミスマッチ修復(MMR)系を遮断、阻害、回避、又は他の方法で不活性化しながら、プライム編集を使用してヌクレオチド分子(例として、ゲノム)を編集するための方法を提供する。

別の側面では、本開示は、MMR系のタンパク質、例としてMLH1、PMS2(又はMutLアルファ)、PMS1(又はMutLベータ)、MLH3(又はMutLガンマ)、MutSアルファ(MSH2-MSH6)、MutSベータ(MSH2-MSH3)、MSH2、MSH6、PCNA、RFC、EXO1、POLδ、及びPCNAを遮断、阻害、回避、又はそうでなければ不活性化しながら、プライム編集を使用してヌクレオチド分子(例として、ゲノム)を編集するための方法を提供する。

更に別の側面では、本開示は、MLH1又はそのバリアントを遮断、阻害、回避、又は他の方法で不活性化しながら、プライム編集を使用してヌクレオチド分子(例として、ゲノム)を編集するための方法を提供する。

別の側面では、本開示は、PMS2(又はMutLアルファ)又はそのバリアントを遮断し、阻害し、回避し、又はそうでなければ不活性化しながら、プライム編集を使用してヌクレオチド分子(例として、ゲノム)を編集するための方法を提供する。

更に別の側面では、本開示は、PMS1(又はMutLベータ)又はそのバリアントを遮断し、阻害し、回避し、又はそうでなければ不活性化しながら、プライム編集を使用してヌクレオチド分子(例として、ゲノム)を編集するための方法を提供する。

更に別の側面では、本開示は、MLH3(又はMutLガンマ)又はそのバリアントを遮断し、阻害し、回避し、又はそうでなければ不活性化しながら、プライム編集を使用してヌクレオチド分子(例として、ゲノム)を編集するための方法を提供する。

別の側面では、本開示は、MutS alpha(MSH2-MSH6)又はそのバリアントを遮断し、阻害し、回避し、又はそうでなければ不活性化しながら、プライム編集を使用してヌクレオチド分子(例として、ゲノム)を編集するための方法を提供する。

更に別の側面では、本開示は、MSH2又はそのバリアントを遮断、阻害、回避、又は他の方法で不活性化しながら、プライム編集を使用してヌクレオチド分子(例として、ゲノム)を編集するための方法を提供する。

別の側面では、本開示は、MSH6又はそのバリアントを遮断、阻害、回避、又は他の方法で不活性化しながら、プライム編集を使用してヌクレオチド分子(例として、ゲノム)を編集するための方法を提供する。

更に別の側面では、本開示は、PCNA又はそのバリアントを遮断、阻害、回避、又は他の方法で不活性化しながら、プライム編集を使用してヌクレオチド分子(例として、ゲノム)を編集するための方法を提供する。

更に別の側面では、本開示は、RFC又はそのバリアントを遮断、阻害、回避、又は他の方法で不活性化しながら、プライム編集を使用してヌクレオチド分子(例として、ゲノム)を編集するための方法を提供する。

別の側面では、本開示は、EXO1又はそのバリアントを遮断、阻害、回避、又は他の方法で不活性化しながら、プライム編集を使用してヌクレオチド分子(例として、ゲノム)を編集するための方法を提供する。

更に別の側面では、本開示は、POLδ又はそのバリアントを遮断、阻害、回避、又は他の方法で不活性化しながら、プライム編集を使用してヌクレオチド分子(例として、ゲノム)を編集するための方法を提供する。

別の側面では、本開示は、意図された編集の近くに1つ以上のサイレント変異をインストールすることによってMMRを回避する方法を提供し、その結果、MMRを回避し、それによってプライム編集の編集効率を改善する。種々の態様では、インストールされるサイレント変異の数は、1つ、又は2つ、又は3つ、又は4つ、又は5つ、又は6つ、又は7つ、又は8つ、又は9つ、又は10、又は11、又は12、又は13、又は14、又は15、又は16、又は17、又は18、又は19、又は20以上であり得る。もう1つのサイレント突然変異は、意図された編集部位の上流又は下流(又は複数のサイレント突然変異を伴う場合は組み合わせ)、意図された編集部位と同じ又は反対のDNA鎖上(又は複数のサイレント突然変異を伴う場合は組み合わせ)に位置されてもよい。サイレント変異は、意図された編集の上流又は下流に、意図された編集から1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、又はそれ以上のヌクレオチド位置離れて位置されてもよい。様々な態様において、サイレント突然変異インストールによって回避する方法は、1つ以上のサイレント突然変異が、MMRの阻害剤の存在下又は非存在下で、プライム編集によって遺伝子変化をインストールするための所望の部位の近くにインストールされる場合、プライム編集の編集効率の有意な増加をもたらす(例として、少なくとも1.5倍、少なくとも2.0倍、少なくとも2.5倍、少なくとも3.0倍、少なくとも3.5倍、少なくとも4.0倍、少なくとも4.5倍、少なくとも5.0倍、少なくとも5.5倍、少なくとも6.0倍、少なくとも6.5倍、少なくとも7.0倍、少なくとも7.5倍、少なくとも8.0倍、少なくとも8.5倍、少なくとも9.0倍、少なくとも9.5倍、少なくとも10.0倍、少なくとも11倍、少なくとも12倍、少なくとも13倍、少なくとも14倍、少なくとも15倍、少なくとも16倍、少なくとも17倍、少なくとも18倍、少なくとも19倍、少なくとも20倍、少なくとも21倍、少なくとも22倍、少なくとも23倍、少なくとも24倍、少なくとも25倍、少なくとも26倍、少なくとも27倍、少なくとも28倍、少なくとも29倍、少なくとも30倍、少なくとも31倍、少なくとも32倍、少なくとも33倍、少なくとも34倍、少なくとも35倍、少なくとも36倍、少なくとも37倍、少なくとも38倍、少なくとも39倍、少なくとも40倍、少なくとも41倍、少なくとも42倍、少なくとも43倍、少なくとも44倍、少なくとも45倍、少なくとも46倍、少なくとも47倍、少なくとも48倍、少なくとも49倍、少なくとも50倍、少なくとも51倍、少なくとも52倍、少なくとも53倍、少なくとも54倍、少なくとも55倍、少なくとも56倍、少なくとも57倍、少なくとも58倍、少なくとも59倍、少なくとも60倍、少なくとも61倍、少なくとも62倍、少なくとも63倍、少なくとも64倍、少なくとも65倍、少なくとも66倍、少なくとも67倍、少なくとも68倍、少なくとも69倍、少なくとも70倍、少なくとも71倍、少なくとも72倍、少なくとも73倍、少なくとも74倍、又は少なくとも75倍増加される)。様々な態様において、サイレント突然変異インストールによってMMRを回避する方法は、1つ以上のサイレント突然変異が、MMRの阻害剤の存在下又は非存在下で、プライム編集によって遺伝子変化をインストールするための所望の部位の近くにインストールされる場合、プライム編集のインデル形成の頻度の減少をもたらす(例として、少なくとも1.5倍、少なくとも2.0倍、少なくとも2.5倍、少なくとも3.0倍、少なくとも3.5倍、少なくとも4.0倍、少なくとも4.5倍、少なくとも5.0倍、少なくとも5.5倍、少なくとも6.0倍、少なくとも6.5倍、少なくとも7.0倍、少なくとも7.5倍、少なくとも8.0倍、少なくとも8.5倍、少なくとも9.0倍、少なくとも9.5倍、少なくとも10.0倍、少なくとも11倍、少なくとも12倍、少なくとも13倍、少なくとも14倍、少なくとも15倍、少なくとも16倍、少なくとも17倍、少なくとも18倍、少なくとも19倍、少なくとも20倍、少なくとも21倍、少なくとも22倍、少なくとも23倍、少なくとも24倍、少なくとも25倍、少なくとも26倍、少なくとも27倍、少なくとも28倍、少なくとも29倍、少なくとも30倍、少なくとも31倍、少なくとも32倍、少なくとも33倍、少なくとも34倍、少なくとも35倍、少なくとも36倍、少なくとも37倍、少なくとも38倍、少なくとも39倍、少なくとも40倍、少なくとも41倍、少なくとも42倍、少なくとも43倍、少なくとも44倍、少なくとも45倍、少なくとも46倍、少なくとも47倍、少なくとも48倍、少なくとも49倍、少なくとも50倍、少なくとも51倍、少なくとも52倍、少なくとも53倍、少なくとも54倍、少なくとも55倍、少なくとも56倍、少なくとも57倍、少なくとも58倍、少なくとも59倍、少なくとも60倍、少なくとも61倍、少なくとも62倍、少なくとも63倍、少なくとも64倍、少なくとも65倍、少なくとも66倍、少なくとも67倍、少なくとも68倍、少なくとも69倍、少なくとも70倍、少なくとも71倍、少なくとも72倍、少なくとも73倍、少なくとも74倍、又は少なくとも75倍減少される)。

別の側面では、本開示は、ヌクレオチド分子(例として、ゲノム)を編集するための方法を提供し、標的ヌクレオチド分子を、プライム編集因子及びMMR系の阻害剤、例として、MLH1、PMS2(又はMutLアルファ)、PMS1(又はMutLベータ)、MLH3(又はMutLガンマ)、MutSアルファ(MSH2-MSH6)、MutSベータ(MSH2-MSH3)、MSH2、MSH6、PCNA、RFC、EXO1、POLδ、又はPCNAの1つ以上の阻害剤と接触させることを含む。様々な態様では、阻害剤は小分子阻害剤であり得る。他の態様では、阻害剤は、抗体、例として中和抗体であり得る。更に他の態様では、阻害剤は、MMRタンパク質のバリアント(例として、本明細書で「ドミナントネガティブ変異体」、「ドミナントネガティブバリアント」又は「ドミナントネガティブタンパク質」、例として「ドミナントネガティブMMRタンパク質」とも呼ばれる、正常な野生型MMRタンパク質の機能又は発現に悪影響を及ぼすMMRタンパク質をコードする遺伝子のドミナントネガティブ変異体によってコードされるバリアント)であり得る。いくつかの態様では、阻害剤は、野生型MMRタンパク質の活性を阻害するMMRタンパク質のドミナントネガティブバリアントである。例えば、阻害剤は、MLH1、PMS2(又はMutLアルファ)、PMS1(又はMutLベータ)、MLH3(又はMutLガンマ)、MutSアルファ(MSH2-MSH6)、MutSベータ(MSH2-MSH3)、MSH2、MSH6、PCNA、RFC、EXO1、POLδ、又はPCNAの1つ以上のMLH1タンパク質バリアント(例として、ドミナントネガティブ変異体)、例として、MLH1のドミナントネガティブ変異体であり得る。更に他の態様では、阻害剤は、転写のレベル、例として、MLH1、PMS2(又はMutLアルファ)、PMS1(又はMutLベータ)、MLH3(又はMutLガンマ)、MutSアルファ(MSH2-MSH6)、MutSベータ(MSH2-MSH3)、MSH2、MSH6、PCNA、RFC、EXO1、POLδ又はPCNAをコードする転写物のレベルをノックダウンするsiRNA又は他の核酸薬剤で標的化され得る。更に他の態様では、「標的ヌクレオチド分子をプライム編集因子と接触させる」工程は、(i)脂質送達システムと複合体化した有効量のプライム編集因子融合タンパク質(例として、PE1又はPE2)を細胞に直接送達することと、(ii)プライム編集融合タンパク質及び/又は適切なpegRNAをコードするmRNAを含むmRNA又は送達複合体を細胞に送達することと、(iii)1つ以上のDNAベクター上のプライム編集因子融合タンパク質及び/又は適切なpegRNAをコードするDNAベクター(例として、AAV又はレンチウイルスベクター、プラスミド、又は他の核酸送達ベクター)と、を包含し得る。

更に別の側面では、本開示は、MLH1又はそのバリアントを遮断、阻害、又は他の方法で不活性化しながら、プライム編集を使用してヌクレオチド分子(例として、ゲノム)を編集するための方法を提供する。別の側面では、本開示は、標的ヌクレオチド分子をMLH1のプライム編集因子及び阻害剤と接触させることを含む、ヌクレオチド分子(例として、ゲノム)を編集するための方法を提供する。様々な態様では、阻害剤は小分子阻害剤であり得る。他の態様では、阻害剤は、抗MLH1抗体、例として、MLH1を不活性化する中和抗体であり得る。更に他の態様では、阻害剤は、MLH1のドミナントネガティブ変異体であり得る。更に他の態様では、阻害剤は、MLH1の転写物、例として、MLH1をコードする転写物のレベルをノックダウンするsiRNA又は他の核酸薬剤のレベルで標的化され得る。更に他の態様では、「標的ヌクレオチド分子をプライム編集因子と接触させる」工程は、(i)脂質送達システムと複合体化した有効量のプライム編集因子融合タンパク質(例として、PE1又はPE2)を細胞に直接送達することと、(ii)プライム編集融合タンパク質及び/又は適切なpegRNAをコードするmRNAを含むmRNA又は送達複合体を細胞に送達することと、(iii)1つ以上のDNAベクター上のプライム編集因子融合タンパク質及び/又は適切なpegRNAをコードするDNAベクター(例として、AAV又はレンチウイルスベクター、プラスミド、又は他の核酸送達ベクター)と、を包含し得る。

更に別の側面では、本開示は、PMS2(又はMutLアルファ)又はそのバリアントを遮断し、阻害し、又はそうでなければ不活性化しながら、プライム編集を使用してヌクレオチド分子(例として、ゲノム)を編集するための方法を提供する。別の側面では、本開示は、標的ヌクレオチド分子をPMS2(又はMutLアルファ)のプライム編集因子及び阻害剤と接触させることを含む、ヌクレオチド分子(例として、ゲノム)を編集するための方法を提供する。様々な態様では、阻害剤は小分子阻害剤であり得る。他の態様では、阻害剤は、抗PMS2(又はMutLアルファ)抗体、例としてPMS2(又はMutLアルファ)を不活性化する中和抗体であり得る。更に他の態様では、阻害剤は、PMS2(又はMutLアルファ)のドミナントネガティブ変異体であり得る。更に他の態様では、阻害剤は、PMS2(又はMutLアルファ)、例としてsiRNA又はML PMS2(又はMutLアルファ)をコードする転写物のレベルをノックダウンする他の核酸作用物質の転写レベルで標的化され得る。更に他の態様では、「標的ヌクレオチド分子をプライム編集因子と接触させる」工程は、(i)脂質送達システムと複合体化した有効量のプライム編集因子融合タンパク質(例として、PE1又はPE2)を細胞に直接送達することと、(ii)プライム編集融合タンパク質及び/又は適切なpegRNAをコードするmRNAを含むmRNA又は送達複合体を細胞に送達することと、(iii)1つ以上のDNAベクター上のプライム編集因子融合タンパク質及び/又は適切なpegRNAをコードするDNAベクター(例として、AAV又はレンチウイルスベクター、プラスミド、又は他の核酸送達ベクター)と、を包含し得る。

更に別の側面では、本開示は、PMS1(又はMutLベータ)又はそのバリアントを遮断し、阻害し、又はそうでなければ不活性化しながら、プライム編集を使用してヌクレオチド分子(例として、ゲノム)を編集するための方法を提供する。別の側面では、本開示は、標的ヌクレオチド分子をPMS1(又はMutLベータ)のプライム編集因子及び阻害剤と接触させることを含む、ヌクレオチド分子(例として、ゲノム)を編集するための方法を提供する。様々な態様では、阻害剤は小分子阻害剤であり得る。他の態様では、阻害剤は、抗PMS1(又はMutLベータ)抗体、例としてPMS1(又はMutLベータ)を不活性化する中和抗体であり得る。更に他の態様では、阻害剤は、PMS1(又はMutLベータ)のドミナントネガティブ変異体であり得る。更に他の態様では、阻害剤は、PMS1(又はMutLベータ)、例として、PMS1(又はMutLベータ)をコードする転写物のレベルをノックダウンするsiRNA又は他の核酸薬剤の転写レベルで標的化され得る。更に他の態様では、「標的ヌクレオチド分子をプライム編集因子と接触させる」工程は、(i)脂質送達システムと複合体化した有効量のプライム編集因子融合タンパク質(例として、PE1又はPE2)を細胞に直接送達することと、(ii)プライム編集融合タンパク質及び/又は適切なpegRNAをコードするmRNAを含むmRNA又は送達複合体を細胞に送達することと、(iii)1つ以上のDNAベクター上のプライム編集因子融合タンパク質及び/又は適切なpegRNAをコードするDNAベクター(例として、AAV又はレンチウイルスベクター、プラスミド、又は他の核酸送達ベクター)と、を包含し得る。

更に別の側面では、本開示は、MLH3(又はMutLガンマ)又はそのバリアントを遮断し、阻害し、又はそうでなければ不活性化しながら、プライム編集を使用してヌクレオチド分子(例として、ゲノム)を編集するための方法を提供する。別の側面では、本開示は、標的ヌクレオチド分子をMLH3(又はMutLガンマ)のプライム編集因子及び阻害剤と接触させることを含む、ヌクレオチド分子(例として、ゲノム)を編集するための方法を提供する。様々な態様では、阻害剤は小分子阻害剤であり得る。他の態様では、阻害剤は、抗MLH3(又はMutLガンマ)抗体、例としてMLH3(又はMutLガンマ)を不活性化する中和抗体であり得る。更に他の態様では、阻害剤は、MLH3(又はMutLガンマ)のドミナントネガティブ変異体であり得る。更に他の態様では、阻害剤は、P MLH3(又はMutLガンマ)、例として、MLH3(又はMutLガンマ)をコードする転写物のレベルをノックダウンするsiRNA又は他の核酸薬剤の転写レベルで標的化され得る。更に他の態様では、「標的ヌクレオチド分子をプライム編集因子と接触させる」工程は、(i)脂質送達システムと複合体化した有効量のプライム編集因子融合タンパク質(例として、PE1又はPE2)を細胞に直接送達することと、(ii)プライム編集融合タンパク質及び/又は適切なpegRNAをコードするmRNAを含むmRNA又は送達複合体を細胞に送達することと、(iii)1つ以上のDNAベクター上のプライム編集因子融合タンパク質及び/又は適切なpegRNAをコードするDNAベクター(例として、AAV又はレンチウイルスベクター、プラスミド、又は他の核酸送達ベクター)と、を包含し得る。

更に別の側面では、本開示は、MutS alpha(MSH2-MSH6)又はそのバリアントを遮断し、阻害し、又はそうでなければ不活性化しながら、プライム編集を使用してヌクレオチド分子(例として、ゲノム)を編集するための方法を提供する。別の側面において、本開示は、ヌクレオチド分子(例として、ゲノム)を編集するための方法であって、標的ヌクレオチド分子をプライム編集因子及びMutSアルファ(MSH2-MSH6)の阻害剤と接触させることを含む、方法を提供する。様々な態様では、阻害剤は小分子阻害剤であり得る。他の態様では、阻害剤は、抗MutSアルファ(MSH2-MSH6)抗体、例として、MutSアルファ(MSH2-MSH6)を不活性化する中和抗体であり得る。更に他の態様では、阻害剤は、MutSアルファ(MSH2-MSH6)のドミナントネガティブ変異体であり得る。更に他の態様では、阻害剤は、MutSアルファ(MSH2-MSH6)、例として、MutSアルファ(MSH2-MSH6)をコードする転写物のレベルをノックダウンするsiRNA又は他の核酸薬剤の転写レベルで標的化され得る。更に他の態様では、「標的ヌクレオチド分子をプライム編集因子と接触させる」工程は、(i)脂質送達システムと複合体化した有効量のプライム編集因子融合タンパク質(例として、PE1又はPE2)を細胞に直接送達することと、(ii)プライム編集融合タンパク質及び/又は適切なpegRNAをコードするmRNAを含むmRNA又は送達複合体を細胞に送達することと、(iii)1つ以上のDNAベクター上のプライム編集因子融合タンパク質及び/又は適切なpegRNAをコードするDNAベクター(例として、AAV又はレンチウイルスベクター、プラスミド、又は他の核酸送達ベクター)と、を包含し得る。

更に別の側面では、本開示は、MSH2又はそのバリアントを遮断、阻害、又は他の方法で不活性化しながら、プライム編集を使用してヌクレオチド分子(例として、ゲノム)を編集するための方法を提供する。別の側面では、本開示は、標的ヌクレオチド分子をMSH2のプライム編集因子及び阻害剤と接触させることを含む、ヌクレオチド分子(例として、ゲノム)を編集するための方法を提供する。様々な態様では、阻害剤は小分子阻害剤であり得る。他の態様では、阻害剤は、抗MSH2抗体、例として、MSH2を不活性化する中和抗体であり得る。更に他の態様では、阻害剤は、MSH2のドミナントネガティブ変異体であり得る。更に他の態様では、阻害剤は、MSH2の転写物、例として、MSH2をコードする転写物のレベルをノックダウンするsiRNA又は他の核酸薬剤のレベルで標的化され得る。更に他の態様では、「標的ヌクレオチド分子をプライム編集因子と接触させる」工程は、(i)脂質送達システムと複合体化した有効量のプライム編集因子融合タンパク質(例として、PE1又はPE2)を細胞に直接送達することと、(ii)プライム編集融合タンパク質及び/又は適切なpegRNAをコードするmRNAを含むmRNA又は送達複合体を細胞に送達することと、(iii)1つ以上のDNAベクター上のプライム編集因子融合タンパク質及び/又は適切なpegRNAをコードするDNAベクター(例として、AAV又はレンチウイルスベクター、プラスミド、又は他の核酸送達ベクター)と、を包含し得る。

更に別の側面では、本開示は、MSH6又はそのバリアントを遮断、阻害、又は他の方法で不活性化しながら、プライム編集を使用してヌクレオチド分子(例として、ゲノム)を編集するための方法を提供する。別の側面では、本開示は、標的ヌクレオチド分子をMSH6のプライム編集因子及び阻害剤と接触させることを含む、ヌクレオチド分子(例として、ゲノム)を編集するための方法を提供する。様々な態様では、阻害剤は小分子阻害剤であり得る。他の態様では、阻害剤は、抗MSH6抗体、例として、MSH6を不活性化する中和抗体であり得る。更に他の態様では、阻害剤は、MSH6のドミナントネガティブ変異体であり得る。更に他の態様では、阻害剤は、MSH6の転写物、例として、MSH6をコードする転写物のレベルをノックダウンするsiRNA又は他の核酸薬剤のレベルで標的化され得る。更に他の態様では、「標的ヌクレオチド分子をプライム編集因子と接触させる」工程は、(i)脂質送達システムと複合体化した有効量のプライム編集因子融合タンパク質(例として、PE1又はPE2)を細胞に直接送達することと、(ii)プライム編集融合タンパク質及び/又は適切なpegRNAをコードするmRNAを含むmRNA又は送達複合体を細胞に送達することと、(iii)1つ以上のDNAベクター上のプライム編集因子融合タンパク質及び/又は適切なpegRNAをコードするDNAベクター(例として、AAV又はレンチウイルスベクター、プラスミド、又は他の核酸送達ベクター)と、を包含し得る。

更に別の側面では、本開示は、PCNA又はそのバリアントを遮断、阻害、又は他の方法で不活性化しながら、プライム編集を使用してヌクレオチド分子(例として、ゲノム)を編集するための方法を提供する。別の側面では、本開示は、標的ヌクレオチド分子をPCNAのプライム編集因子及び阻害剤と接触させることを含む、ヌクレオチド分子(例として、ゲノム)を編集するための方法を提供する。様々な態様では、阻害剤は小分子阻害剤であり得る。他の態様では、阻害剤は、抗PCNA抗体、例として、PCNAを不活性化する中和抗体であり得る。更に他の態様では、阻害剤は、PCNAのドミナントネガティブ変異体であり得る。更に他の態様では、阻害剤は、PCNAの転写物、例として、PCNAをコードする転写物のレベルをノックダウンするsiRNA又は他の核酸薬剤のレベルで標的化され得る。更に他の態様では、「標的ヌクレオチド分子をプライム編集因子と接触させる」工程は、(i)脂質送達システムと複合体化した有効量のプライム編集因子融合タンパク質(例として、PE1又はPE2)を細胞に直接送達することと、(ii)プライム編集融合タンパク質及び/又は適切なpegRNAをコードするmRNAを含むmRNA又は送達複合体を細胞に送達することと、(iii)1つ以上のDNAベクター上のプライム編集因子融合タンパク質及び/又は適切なpegRNAをコードするDNAベクター(例として、AAV又はレンチウイルスベクター、プラスミド、又は他の核酸送達ベクター)と、を包含し得る。

更に別の側面では、本開示は、RFC又はそのバリアントを遮断、阻害、又は他の方法で不活性化しながら、プライム編集を使用してヌクレオチド分子(例として、ゲノム)を編集するための方法を提供する。別の側面では、本開示は、標的ヌクレオチド分子をRFCのプライム編集因子及び阻害剤と接触させることを含む、ヌクレオチド分子(例として、ゲノム)を編集するための方法を提供する。様々な態様では、阻害剤は小分子阻害剤であり得る。他の態様では、阻害剤は、抗RFC抗体、例として、RFCを不活性化する中和抗体であり得る。更に他の態様では、阻害剤は、RFCのドミナントネガティブ変異体であり得る。更に他の態様では、阻害剤は、RFCの転写物、例として、RFCをコードする転写物のレベルをノックダウンするsiRNA又は他の核酸薬剤のレベルで標的化され得る。更に他の態様では、「標的ヌクレオチド分子をプライム編集因子と接触させる」工程は、(i)脂質送達システムと複合体化した有効量のプライム編集因子融合タンパク質(例として、PE1又はPE2)を細胞に直接送達することと、(ii)プライム編集融合タンパク質及び/又は適切なpegRNAをコードするmRNAを含むmRNA又は送達複合体を細胞に送達することと、(iii)1つ以上のDNAベクター上のプライム編集因子融合タンパク質及び/又は適切なpegRNAをコードするDNAベクター(例として、AAV又はレンチウイルスベクター、プラスミド、又は他の核酸送達ベクター)と、を包含し得る。

更に別の側面では、本開示は、EXO1又はそのバリアントを遮断、阻害、又は他の方法で不活性化しながら、プライム編集を使用してヌクレオチド分子(例として、ゲノム)を編集するための方法を提供する。別の側面では、本開示は、標的ヌクレオチド分子をEXO1のプライム編集因子及び阻害剤と接触させることを含む、ヌクレオチド分子(例として、ゲノム)を編集するための方法を提供する。様々な態様では、阻害剤は小分子阻害剤であり得る。他の態様では、阻害剤は、抗EXO1抗体、例として、EXO1を不活性化する中和抗体であり得る。更に他の態様では、阻害剤は、EXO1のドミナントネガティブ変異体であり得る。更に他の態様では、阻害剤は、EXO1の転写物、例として、EXO1をコードする転写物のレベルをノックダウンするsiRNA又は他の核酸薬剤のレベルで標的化され得る。更に他の態様では、「標的ヌクレオチド分子をプライム編集因子と接触させる」工程は、(i)脂質送達システムと複合体化した有効量のプライム編集因子融合タンパク質(例として、PE1又はPE2)を細胞に直接送達することと、(ii)プライム編集融合タンパク質及び/又は適切なpegRNAをコードするmRNAを含むmRNA又は送達複合体を細胞に送達することと、(iii)1つ以上のDNAベクター上のプライム編集因子融合タンパク質及び/又は適切なpegRNAをコードするDNAベクター(例として、AAV又はレンチウイルスベクター、プラスミド、又は他の核酸送達ベクター)と、を包含し得る。

更に別の側面では、本開示は、POLδ又はそのバリアントを遮断、阻害、又は他の方法で不活性化しながら、プライム編集を使用してヌクレオチド分子(例として、ゲノム)を編集するための方法を提供する。別の側面では、本開示は、標的ヌクレオチド分子をPOLδのプライム編集因子及び阻害剤と接触させることを含む、ヌクレオチド分子(例として、ゲノム)を編集するための方法を提供する。様々な態様では、阻害剤は小分子阻害剤であり得る。他の態様では、阻害剤は、抗POLδ抗体、例として、POLδを不活性化する中和抗体であり得る。更に他の態様では、阻害剤は、POLδのドミナントネガティブ変異体であり得る。更に他の態様では、阻害剤は、POLδの転写物、例として、POLδをコードする転写物のレベルをノックダウンするsiRNA又は他の核酸薬剤のレベルで標的化され得る。更に他の態様では、「標的ヌクレオチド分子をプライム編集因子と接触させる」工程は、(i)脂質送達システムと複合体化した有効量のプライム編集因子融合タンパク質(例として、PE1又はPE2)を細胞に直接送達することと、(ii)プライム編集融合タンパク質及び/又は適切なpegRNAをコードするmRNAを含むmRNA又は送達複合体を細胞に送達することと、(iii)1つ以上のDNAベクター上のプライム編集因子融合タンパク質及び/又は適切なpegRNAをコードするDNAベクター(例として、AAV又はレンチウイルスベクター、プラスミド、又は他の核酸送達ベクター)と、を包含し得る。

一側面では、本開示は、プライム編集によって核酸分子を編集するための方法を提供する。いくつかの態様において、方法は、核酸分子を、プライム編集因子、pegRNA及びDNAミスマッチ修復経路の阻害剤と接触させ、それによって標的部位において核酸分子に対する1つ以上の修飾をインストールすることを含む。

方法は、プライム編集の効率を高め、及び/又はインデル形成の頻度を低下させてもよい。いくつかの態様では、プライム編集効率は、DNAミスマッチ修復経路の阻害剤の存在下で、少なくとも1.5倍、少なくとも2.0倍、少なくとも2.5倍、少なくとも3.0倍、少なくとも3.5倍、少なくとも4.0倍、少なくとも4.5倍、少なくとも5.0倍、少なくとも5.5倍、少なくとも6.0倍、少なくとも6.5倍、少なくとも7.0倍、少なくとも7.5倍、少なくとも8.0倍、少なくとも8.5倍、少なくとも9.0倍、少なくとも9.5倍、又は少なくとも10.0倍増加される。いくつかの態様において、インデル形成の頻度は、DNAミスマッチ修復経路の阻害剤の存在下において、少なくとも1.5倍、少なくとも2.0倍、少なくとも2.5倍、少なくとも3.0倍、少なくとも3.5倍、少なくとも4.0倍、少なくとも4.5倍、少なくとも5.0倍、少なくとも5.5倍、少なくとも6.0倍、少なくとも6.5倍、少なくとも7.0倍、少なくとも7.5倍、少なくとも8.0倍、少なくとも8.5倍、少なくとも9.0倍、少なくとも9.5倍、又は少なくとも10.0倍にて減少する。

いくつかの態様において、DNAミスマッチ修復経路の阻害剤はDNAミスマッチ修復経路の1つ以上のタンパク質を阻害する。いくつかの態様において、1つ以上のタンパク質は、MLH1、PMS2(又はMutLアルファ)、PMS1(又はMutLベータ)、MLH3(又はMutLガンマ)、MutSアルファ(MSH2-MSH6)、MutSベータ(MSH2-MSH3)、MSH2、MSH6、PCNA、RFC、EXO1、POLδ及びPCNAからなる群から選択される。特定の態様では、1つ以上のタンパク質はMLH1である。いくつかの態様では、MLH1は、配列番号204のアミノ酸配列、又は配列番号204と少なくとも70％、少なくとも75％、少なくとも80％、少なくとも85％、少なくとも90％、少なくとも95％、少なくとも96％、少なくとも97％、少なくとも98％、少なくとも99％、又は最大100％(100％を包含する)の配列同一性を有するアミノ酸配列を含む。

方法で利用される阻害剤は、抗体、小分子、低分子干渉RNA(siRNA)、低分子非コードマイクロRNA、又は野生型MMRタンパク質の活性を阻害するMMRタンパク質のドミナントネガティブバリアント(例として、MLH1のドミナントネガティブバリアント)であってもよい。特定の態様では、阻害剤は、DNAミスマッチ修復経路の1つ以上のタンパク質の活性を阻害する抗体である。いくつかの態様において、阻害剤は、DNAミスマッチ修復経路の1つ以上のタンパク質の活性を阻害する小分子である。特定の態様では、阻害剤は、DNAミスマッチ修復経路の1つ以上のタンパク質の活性を阻害する低分子干渉RNA(siRNA)又は低分子非コードマイクロRNAである。いくつかの態様では、阻害剤は、MLH1を阻害するMLH1のドミナントネガティブバリアントである。

いくつかの態様では、ドミナントネガティブバリアントは、(a)MLH1 E34A(配列番号222)、(b)MLH1 Δ756(配列番号208)、(c)MLH1 Δ754-756(配列番号209)、(d)MLH1 E34A Δ754-756(配列番号210)、(e)MLH1 1-335(配列番号211)、(f)MLH1 1-335 E34A(配列番号212)、(g)MLH1 1-335 NLS^SV40(配列番号213)、(h)MLH1 501-756(配列番号215)、(i)MLH1 501-753(配列番号216)、(j)MLH1 461-753(配列番号218)、又は(k)NLS^SV40MLH1 501-753(配列番号223)、あるいは配列番号208～213、215、216、218、222又は223のいずれかと少なくとも70％、少なくとも75％、少なくとも80％、少なくとも85％、少なくとも90％、少なくとも95％、少なくとも96％、少なくとも97％、少なくとも98％、少なくとも99％、又は最大100％(100％を包含する)の配列同一性を有するアミノ酸配列を含むポリペプチドである。

本開示の方法で利用されるプライム編集因子は、複数の構成要素を含んでもよい。いくつかの態様では、プライム編集因子は、napDNAbp及びポリメラーゼを含む。いくつかの態様では、napDNAbpは、ヌクレアーゼ活性Cas9ドメイン、ヌクレアーゼ不活性Cas9ドメイン、又はCas9ニッカーゼドメイン若しくはそのバリアントである。特定の態様では、napDNAbpは、Cas9、Cas12e、Cas12d、Cas12a、Cas12b1、Cas13a、Cas12c、Cas12b2、Cas13a、Cas12c、Cas12d、Cas12e、Cas12h、Cas12i、Cas12g、Cas12f(Cas14)、Cas12f1、Cas12j(CasΦ)、及びアルゴノートからなる群から選択され、任意選択でニッカーゼ活性を有する。特定の態様では、napDNAbpは、配列番号2、4～67、若しくは99(PEmax)のいずれか1つのアミノ酸配列、又は配列番号2、4～67、若しくは99(PEmax)のいずれか1つと少なくとも80％、85％、90％、95％、若しくは99％の配列同一性を有するアミノ酸配列を含む。特定の態様では、napDNAbpは、配列番号2若しくは配列番号37(例として、PE1及びPE2のnapDNAbp)のアミノ酸配列、又は配列番号2と少なくとも80％、85％、90％、95％、若しくは99％の配列同一性を有するアミノ酸配列を含む。いくつかの態様では、ポリメラーゼは、DNA依存性DNAポリメラーゼ又はRNA依存性DNAポリメラーゼである。いくつかの態様において、ポリメラーゼは逆転写酵素である。特定の態様では、逆転写酵素は、配列番号69～98のいずれか1つのアミノ酸配列、又は配列番号69～98のいずれか1つと少なくとも80％、85％、90％、95％、若しくは99％の配列同一性を有するアミノ酸配列を含む。

napDNAbp及びプライム編集因子のポリメラーゼは、融合タンパク質を形成するために一緒に結合されてもよい。いくつかの態様では、napDNAbp及びプライム編集因子のポリメラーゼは、リンカーによって連結されて融合タンパク質を形成する。特定の態様では、リンカーは、配列番号102、若しくは118～131のいずれか1つのアミノ酸配列、又は配列番号102、若しくは118～131のいずれか1つと少なくとも80％、85％、90％、95％、若しくは99％の配列同一性を有するアミノ酸配列を含む。いくつかの態様において、リンカーは、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、38、38、39、40、41、42、43、44、45、46、47、48、49、又は50アミノ酸長である。

方法(例として、プライム編集因子、pegRNA、及び/又はDNAミスマッチ修復経路の阻害剤)で使用される成分は、DNAベクター上にコードされてもよい。いくつかの態様では、プライム編集因子、pegRNA、及びDNAミスマッチ修復経路の阻害剤は、1つ以上のDNAベクター上にコードされる。特定の態様では、1つ以上のDNAベクターは、AAV又はレンチウイルスDNAベクターを含む。いくつかの態様では、AAVベクターは、血清型1、2、3、4、5、6、7、8、9、又は10である。

本開示の方法で利用されるプライム編集因子は、追加の構成要素に更に結合されてもよい。いくつかの態様において、融合タンパク質としてのプライム編集因子は、第2のリンカーによってDNAミスマッチ修復経路の阻害剤に更に結合される。ある特定の態様において、第2のリンカーは、自己加水分解性リンカーである。特定の態様では、第2のリンカーは、配列番号102、118～131、若しくは233～236のいずれか1つのアミノ酸配列、又は配列番号102、118～131、若しくは233～236のいずれか1つと少なくとも80％、85％、90％、95％、若しくは99％の配列同一性を有するアミノ酸配列を含む。いくつかの態様では、第2のリンカーは、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49又は50アミノ酸長である。

いくつかの態様では、標的部位にインストールされた核酸分子に対する1つ以上の修飾は、1つ以上のトランジション、1つ以上のトランスバージョン、1つ以上の挿入、1つ以上の欠失、又は1つ以上の逆位を含む。特定の態様では、1つ以上のトランジションは、(a)TからC;(b)AからG;(c)CからT;(d)GからAからなる群から選択される。特定の態様では、1つ以上のトランスバージョンは、(a)TからA;(b)TからG;(c)CからG;(d)CからA;(e)AからT;(f)AからC;(g)GからC;及び(h)GからTからなる群から選択される。特定の態様では、1つ以上の修飾は、(1)G:C塩基対をT:A塩基対に、(2)G:C塩基対をA:T塩基対に、(3)G:C塩基対をC:G塩基対に、(4)T:A塩基対をG:C塩基対に、(5)T:A塩基対をA:T塩基対に、(6)T:A塩基対をC:G塩基対に、(7)C:G塩基対をG:C塩基対に、(8)C:G塩基対をT:A塩基対に、(9)C:G塩基対をA:T塩基対に、(10)A:T塩基対をT:A塩基対に、(11)A:T塩基対をG:C塩基対に、又は(12)A:T塩基対をC:G塩基対に変更することを含む。いくつかの態様において、1つ以上の修飾は、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24又は25ヌクレオチドの挿入又は欠失を含む。

本開示の方法は、1つ以上の疾患関連遺伝子に対する修正を行うために使用されてもよい。いくつかの態様において、1つ以上の修飾は、疾患関連遺伝子に対する修正を含む。特定の態様では、疾患関連遺伝子は、以下からなる群:心疾患;高血圧;アルツハイマー病;関節炎;糖尿病;癌;及び肥満から選択される多遺伝子性障害に関連される。特定の態様では、疾患関連遺伝子は、アデノシンデアミナーゼ(ADA)欠損症;α1アンチトリプシン欠損症;嚢胞性線維症;デュシェンヌ型筋ジストロフィ;ガラクトース血症;ヘモクロマトーシス;ハンチントン病;メープルシロップ尿症;マルファン症候群;神経線維腫症1型;先天性爪甲厚膜;フェニルケトン尿症;重度の複合免疫不全;鎌状赤血球症;スミス・レムリ・オピッツ症候群;トリヌクレオチド反復障害;プリオン病;及びテイ・サックス病からなる群から選択される一遺伝子性障害に関連される。

別の側面では、本開示は、プライム編集によって核酸分子を編集するための組成物を提供する。いくつかの態様では、組成物は、プライム編集因子、pegRNA、及びDNAミスマッチ修復経路の阻害剤を含み、組成物は、標的部位で核酸分子に1つ以上の修飾をインストールすることができる。

組成物は、プライム編集の効率を高め、及び/又はインデル形成の頻度を低下させてもよい。いくつかの態様では、プライム編集効率は、DNAミスマッチ修復経路の阻害剤の存在下で、少なくとも1.5倍、少なくとも2.0倍、少なくとも2.5倍、少なくとも3.0倍、少なくとも3.5倍、少なくとも4.0倍、少なくとも4.5倍、少なくとも5.0倍、少なくとも5.5倍、少なくとも6.0倍、少なくとも6.5倍、少なくとも7.0倍、少なくとも7.5倍、少なくとも8.0倍、少なくとも8.5倍、少なくとも9.0倍、少なくとも9.5倍、又は少なくとも10.0倍増加される。いくつかの態様において、インデル形成の頻度は、DNAミスマッチ修復経路の阻害剤の存在下において、少なくとも1.5倍、少なくとも2.0倍、少なくとも2.5倍、少なくとも3.0倍、少なくとも3.5倍、少なくとも4.0倍、少なくとも4.5倍、少なくとも5.0倍、少なくとも5.5倍、少なくとも6.0倍、少なくとも6.5倍、少なくとも7.0倍、少なくとも7.5倍、少なくとも8.0倍、少なくとも8.5倍、少なくとも9.0倍、少なくとも9.5倍、又は少なくとも10.0倍にて減少する。

組成物で利用される阻害剤は、抗体、小分子、低分子干渉RNA(siRNA)、低分子非コードマイクロRNA、又は野生型MMRタンパク質の活性を阻害するMMRタンパク質のドミナントネガティブバリアント(例として、MLH1のドミナントネガティブバリアント)であってもよい。特定の態様では、阻害剤は、DNAミスマッチ修復経路の1つ以上のタンパク質の活性を阻害する抗体である。いくつかの態様において、阻害剤は、DNAミスマッチ修復経路の1つ以上のタンパク質の活性を阻害する小分子である。特定の態様では、阻害剤は、DNAミスマッチ修復経路の1つ以上のタンパク質の活性を阻害する低分子干渉RNA(siRNA)又は低分子非コードマイクロRNAである。いくつかの態様では、阻害剤は、MLH1を阻害するMLH1のドミナントネガティブバリアントである。

本開示の組成物に利用されるプライム編集因子は、複数の成分を含む。いくつかの態様では、プライム編集因子は、napDNAbp及びポリメラーゼを含む。いくつかの態様では、napDNAbpは、ヌクレアーゼ活性Cas9ドメイン、ヌクレアーゼ不活性Cas9ドメイン、又はCas9ニッカーゼドメイン若しくはそのバリアントである。特定の態様では、napDNAbpは、Cas9、Cas12e、Cas12d、Cas12a、Cas12b1、Cas13a、Cas12c、Cas12b2、Cas13a、Cas12c、Cas12d、Cas12e、Cas12h、Cas12i、Cas12g、Cas12f(Cas14)、Cas12f1、Cas12j(CasΦ)、及びアルゴノートからなる群から選択され、任意選択でニッカーゼ活性を有する。特定の態様では、napDNAbpは、配列番号2、4～67、若しくは99(PEmax)のいずれか1つのアミノ酸配列、又は配列番号2、4～67、若しくは99(PEmax)のいずれか1つと少なくとも80％、85％、90％、95％、若しくは99％の配列同一性を有するアミノ酸配列を含む。特定の態様では、napDNAbpは、配列番号2若しくは配列番号37(すなわち、PE1及びPE2のnapDNAbp)のアミノ酸配列、又は配列番号2若しくは配列番号37と少なくとも80％、85％、90％、95％、若しくは99％の配列同一性を有するアミノ酸配列を含む。いくつかの態様では、ポリメラーゼは、DNA依存性DNAポリメラーゼ又はRNA依存性DNAポリメラーゼである。いくつかの態様において、ポリメラーゼは逆転写酵素である。特定の態様では、逆転写酵素は、配列番号69～98のいずれか1つのアミノ酸配列、又は配列番号69～98のいずれか1つと少なくとも80％、85％、90％、95％、若しくは99％の配列同一性を有するアミノ酸配列を含む。

napDNAbp及びプライム編集因子のポリメラーゼは、融合タンパク質を形成するために一緒に結合されてもよい。いくつかの態様では、napDNAbp及びプライム編集因子のポリメラーゼは、リンカーによって連結されて融合タンパク質を形成する。特定の態様では、リンカーは、配列番号102、118～131のいずれか1つのアミノ酸配列、又は配列番号102、118～131のいずれか1つと少なくとも80％、85％、90％、95％、若しくは99％の配列同一性を有するアミノ酸配列を含む。いくつかの態様において、リンカーは、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、38、38、39、40、41、42、43、44、45、46、47、48、49、又は50アミノ酸長である。

本明細書に開示される組成物で使用される成分(例として、プライム編集因子、pegRNA、及び/又はDNAミスマッチ修復経路の阻害剤)で使用される成分は、DNAベクター上にコードされてもよい。いくつかの態様では、プライム編集因子、pegRNA、及びDNAミスマッチ修復経路の阻害剤は、1つ以上のDNAベクター上にコードされる。特定の態様では、1つ以上のDNAベクターは、AAV又はレンチウイルスDNAベクターを含む。いくつかの態様では、AAVベクターは、血清型1、2、3、4、5、6、7、8、9、又は10である。

本開示の組成物で利用されるプライム編集因子は、追加の構成要素に更に結合されてもよい。いくつかの態様において、融合タンパク質としてのプライム編集因子は、第2のリンカーによってDNAミスマッチ修復経路の阻害剤に更に結合される。ある特定の態様において、第2のリンカーは、自己加水分解性リンカーである。特定の態様では、第2のリンカーは、配列番号102、118～131、若しくは233～236のいずれか1つのアミノ酸配列、又は配列番号102、118～131、若しくは233～236のいずれか1つと少なくとも80％、85％、90％、95％、若しくは99％の配列同一性を有するアミノ酸配列を含む。いくつかの態様では、第2のリンカーは、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49又は50アミノ酸長である。

本開示の組成物は、1つ以上の疾患関連遺伝子に対する修正を行うために使用されてもよい。いくつかの態様において、1つ以上の修飾は、疾患関連遺伝子に対する修正を含む。特定の態様では、疾患関連遺伝子は、以下からなる群:心疾患;高血圧;アルツハイマー病;関節炎;糖尿病;癌;及び肥満から選択される多遺伝子性障害に関連される。特定の態様では、疾患関連遺伝子は、アデノシンデアミナーゼ(ADA)欠損症;α1アンチトリプシン欠損症;嚢胞性線維症;デュシェンヌ型筋ジストロフィ;ガラクトース血症;ヘモクロマトーシス;ハンチントン病;メープルシロップ尿症;マルファン症候群;神経線維腫症1型;先天性爪甲厚膜;フェニルケトン尿症;重度の複合免疫不全;鎌状赤血球症;スミス・レムリ・オピッツ症候群;トリヌクレオチド反復障害;プリオン病;及びテイ・サックス病からなる群から選択される一遺伝子性障害に関連される。

別の側面において、本開示は、プライム編集によってDNA標的部位を編集するためのポリヌクレオチドを提供する。いくつかの態様では、ポリヌクレオチドは、napDNAbp、ポリメラーゼ、及びDNAミスマッチ修復経路の阻害剤をコードする核酸配列を含み、napDNAbp及びポリメラーゼは、DNA標的部位に1つ以上の修飾をインストールするpegRNAの存在下で可能である。

ポリヌクレオチドは、プライム編集の効率を高め、及び/又はインデル形成の頻度を低下させてもよい。いくつかの態様では、プライム編集効率は、DNAミスマッチ修復経路の阻害剤の存在下で、少なくとも1.5倍、少なくとも2.0倍、少なくとも2.5倍、少なくとも3.0倍、少なくとも3.5倍、少なくとも4.0倍、少なくとも4.5倍、少なくとも5.0倍、少なくとも5.5倍、少なくとも6.0倍、少なくとも6.5倍、少なくとも7.0倍、少なくとも7.5倍、少なくとも8.0倍、少なくとも8.5倍、少なくとも9.0倍、少なくとも9.5倍、又は少なくとも10.0倍増加される。いくつかの態様において、インデル形成の頻度は、DNAミスマッチ修復経路の阻害剤の存在下において、少なくとも1.5倍、少なくとも2.0倍、少なくとも2.5倍、少なくとも3.0倍、少なくとも3.5倍、少なくとも4.0倍、少なくとも4.5倍、少なくとも5.0倍、少なくとも5.5倍、少なくとも6.0倍、少なくとも6.5倍、少なくとも7.0倍、少なくとも7.5倍、少なくとも8.0倍、少なくとも8.5倍、少なくとも9.0倍、少なくとも9.5倍、又は少なくとも10.0倍にて減少する。

ポリヌクレオチドで利用される阻害剤は、抗体、小分子、低分子干渉RNA(siRNA)、低分子非コードマイクロRNA、又は野生型MMRタンパク質の活性を阻害するMMRタンパク質のドミナントネガティブバリアント(例として、(MLH1のドミナントネガティブバリアント)であってもよい。特定の態様では、阻害剤は、DNAミスマッチ修復経路の1つ以上のタンパク質の活性を阻害する抗体である。いくつかの態様において、阻害剤は、DNAミスマッチ修復経路の1つ以上のタンパク質の活性を阻害する小分子である。特定の態様では、阻害剤は、DNAミスマッチ修復経路の1つ以上のタンパク質の活性を阻害する低分子干渉RNA(siRNA)又は低分子非コードマイクロRNAである。いくつかの態様では、阻害剤は、MLH1を阻害するMLH1のドミナントネガティブバリアントである。

本開示のポリヌクレオチドにおいて利用されるプライム編集因子は、複数の成分(例として、napDNAbp及びポリメラーゼ)を含む。いくつかの態様では、napDNAbpは、ヌクレアーゼ活性Cas9ドメイン、ヌクレアーゼ不活性Cas9ドメイン、又はCas9ニッカーゼドメイン若しくはそのバリアントである。特定の態様では、napDNAbpは、Cas9、Cas12e、Cas12d、Cas12a、Cas12b1、Cas13a、Cas12c、Cas12b2、Cas13a、Cas12c、Cas12d、Cas12e、Cas12h、Cas12i、Cas12g、Cas12f(Cas14)、Cas12f1、Cas12j(CasΦ)、及びアルゴノートからなる群から選択され、任意選択でニッカーゼ活性を有する。特定の態様では、napDNAbpは、配列番号2、4～67、若しくは99(PEmax)のいずれか1つのアミノ酸配列、又は配列番号2、4～67、若しくは99(PEmax)のいずれか1つと少なくとも80％、85％、90％、95％、若しくは99％の配列同一性を有するアミノ酸配列を含む。特定の態様では、napDNAbpは、配列番号2若しくは配列番号37(すなわち、PE1及びPE2のnapDNAbp)のアミノ酸配列、又は配列番号2若しくは配列番号37と少なくとも80％、85％、90％、95％、若しくは99％の配列同一性を有するアミノ酸配列を含む。いくつかの態様では、ポリメラーゼは、DNA依存性DNAポリメラーゼ又はRNA依存性DNAポリメラーゼである。いくつかの態様において、ポリメラーゼは逆転写酵素である。特定の態様では、逆転写酵素は、配列番号69～98のいずれか1つのアミノ酸配列、又は配列番号69～98のいずれか1つと少なくとも80％、85％、90％、95％、若しくは99％の配列同一性を有するアミノ酸配列を含む。

本明細書に開示されるポリヌクレオチドはベクターを含んでもよい。いくつかの態様において、ポリヌクレオチドはDNAベクターである。特定の態様では、DNAベクターはAAV又はレンチウイルスDNAベクターである。いくつかの態様では、AAVベクターは、血清型1、2、3、4、5、6、7、8、9、又は10である。

本明細書に開示されるポリヌクレオチドによってコードされるプライム編集因子はまた、更なる成分に更に結合されてもよい。いくつかの態様において、融合タンパク質としてのプライム編集因子は、第2のリンカーによってDNAミスマッチ修復経路の阻害剤に更に結合される。ある特定の態様において、第2のリンカーは、自己加水分解性リンカーを含む。特定の態様では、第2のリンカーは、配列番号102、118～131、若しくは233～236のいずれか1つのアミノ酸配列、又は配列番号102、118～131、若しくは233～236のいずれか1つと少なくとも80％、85％、90％、95％、若しくは99％の配列同一性を有するアミノ酸配列を含む。いくつかの態様では、第2のリンカーは、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49又は50アミノ酸長である。

本開示のポリヌクレオチドは、1つ以上の疾患関連遺伝子に対する修正を行うために使用されてもよい。いくつかの態様において、1つ以上の修飾は、疾患関連遺伝子に対する修正を含む。特定の態様では、疾患関連遺伝子は、以下からなる群:心疾患;高血圧;アルツハイマー病;関節炎;糖尿病;癌;及び肥満から選択される多遺伝子性障害に関連される。特定の態様では、疾患関連遺伝子は、アデノシンデアミナーゼ(ADA)欠損症;α1アンチトリプシン欠損症;嚢胞性線維症;デュシェンヌ型筋ジストロフィ;ガラクトース血症;ヘモクロマトーシス;ハンチントン病;メープルシロップ尿症;マルファン症候群;神経線維腫症1型;先天性爪甲厚膜;フェニルケトン尿症;重度の複合免疫不全;鎌状赤血球症;スミス・レムリ・オピッツ症候群;トリヌクレオチド反復障害;プリオン病;及びテイ・サックス病からなる群から選択される一遺伝子性障害に関連される。

別の側面では、本開示は細胞を提供する。いくつかの態様において、細胞は、本明細書中に記載されるポリヌクレオチドのいずれかを含む。

別の側面では、本開示は医薬組成物を提供する。いくつかの態様では、医薬組成物は、本明細書に開示される組成物のいずれかを含む。いくつかの態様では、医薬組成物は、本明細書に開示される組成物のいずれか及び薬学的に許容される賦形剤を含む。いくつかの態様では、医薬組成物は、本明細書に開示されるポリヌクレオチドのいずれかを含む。いくつかの態様では、医薬組成物は、本明細書に開示されるポリヌクレオチドのいずれか及び薬学的に許容される賦形剤を含む。

別の側面では、本開示はキットを提供する。いくつかの態様では、キットは、本明細書に開示される組成物のいずれか、医薬賦形剤、及びプライム編集によってDNA標的部位を編集するための説明書を含む。いくつかの態様では、キットは、本明細書に開示されるポリヌクレオチドのいずれか、医薬賦形剤、及びプライム編集によってDNA標的部位を編集するための説明書を含む。

本開示はまた、MMR経路の阻害剤を提供する必要なしに、標的核酸分子に導入された変化のMMR経路による修正が回避されるプライム編集のための方法及びpegRNAを提供する。驚くべきことに、標的核酸上の標的部位の内因性配列と比較して連続したヌクレオチドのミスマッチで設計されたpegRNA、例えば3つ以上の連続したミスマッチを有するpegRNAは、MMR経路による修正を回避することができ、その結果、プライム編集を使用した単一ヌクレオチドのミスマッチの導入と比較して、プライム編集効率の増加及びインデル形成の頻度の減少をもたらす。加えて、プライム編集によって導入される、標的核酸の標的部位における連続するヌクレオチドの挿入又は欠失、例えば、10ヌクレオチド長を超える挿入又は欠失もまた、MMR経路による修正を回避し、その結果、プライム編集を使用した10ヌクレオチド長未満の挿入又は欠失の導入と比較して、プライム編集効率の増加及びインデル形成の頻度の減少をもたらす。

したがって、別の側面では、本開示は、プライム編集によって核酸分子を編集するための方法であって、核酸分子をプライム編集因子(例として、PE2、PE3、又は本明細書中に記載される他のプライム編集因子のいずれか)と接触させることと、核酸分子上の標的部位の内因性配列と比較して3つ以上の連続するヌクレオチドミスマッチを含むその伸長アーム上のDNA合成鋳型とpegRNAを接触させることと、を含む方法を提供する。いくつかの態様では、連続するヌクレオチドのミスマッチの少なくとも1つは、核酸分子から発現されるタンパク質のアミノ酸配列の変化をもたらすが、残りのヌクレオチドのミスマッチの少なくとも1つはサイレント変異である。サイレント変異は、標的核酸分子のコード領域(すなわち、タンパク質をコードする遺伝子の一部)にあってもよく、又はサイレント変異は、標的核酸分子の非コード領域にあってもよい。いくつかの態様では、サイレント変異がコード領域内にある場合、サイレント変異は、未編集核酸分子と同じアミノ酸をコードする1つ以上の代替コドンを核酸分子に導入する。いくつかの態様では、サイレント変異が非コード領域にある場合、サイレント変異は、スプライシング、遺伝子調節、RNA寿命、又は核酸分子上の標的部位の他の生物学的特性に影響を及ぼさない核酸分子の領域に存在する。

MMR経路による修正の回避の利益を達成し、それによってプライム編集効率を高め、及び/又はインデル形成を減少させるために、標的部位の配列と比較して任意の数の連続するヌクレオチドのミスマッチがpegRNAのDNA合成鋳型において設計され得る。いくつかの態様では、DNA合成鋳型は、標的部位の配列と比較して少なくとも3つの連続するヌクレオチドのミスマッチを含む。いくつかの態様では、pegRNA上の伸長アームのDNA合成テンプレートは、プライム編集によって編集された核酸分子内の標的部位の内因性配列に対して2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、又は25個の連続するヌクレオチドミスマッチを含む。いくつかの態様では、pegRNA上の伸長アームのDNA合成鋳型は、核酸分子上の標的部位の内因性配列と比較して、3つ以上、4つ以上、5つ以上、6つ以上、7つ以上、8つ以上、9つ以上、又は10個以上の連続するヌクレオチドミスマッチを含む。特定の態様では、3つ以上の連続するヌクレオチド不一致の使用は、核酸分子上の標的部位の内因性配列と比較して、1つの連続するヌクレオチド不一致のみを含むDNA合成鋳型を含むpegRNAを使用する方法と比較して、プライム編集効率の少なくとも1.5倍、少なくとも2.0倍、少なくとも2.5倍、少なくとも3.0倍、少なくとも3.5倍、少なくとも4.0倍、少なくとも4.5倍、少なくとも5.0倍、少なくとも5.5倍、少なくとも6.0倍、少なくとも6.5倍、少なくとも7.0倍、少なくとも7.5倍、少なくとも8.0倍、少なくとも8.5倍、少なくとも9.0倍、少なくとも9.5倍、又は少なくとも10.0倍の増加をもたらす。特定の態様では、3つ以上の連続するヌクレオチド不一致の使用は、核酸分子上の標的部位の内因性配列と比較して、1つの連続するヌクレオチド不一致のみを含むDNA合成鋳型を含むpegRNAを使用する方法と比較して、インデル形成頻度の少なくとも1.5倍、少なくとも2.0倍、少なくとも2.5倍、少なくとも3.0倍、少なくとも3.5倍、少なくとも4.0倍、少なくとも4.5倍、少なくとも5.0倍、少なくとも5.5倍、少なくとも6.0倍、少なくとも6.5倍、少なくとも7.0倍、少なくとも7.5倍、少なくとも8.0倍、少なくとも8.5倍、少なくとも9.0倍、少なくとも9.5倍、又は少なくとも10.0倍の減少をもたらす。

別の側面では、本開示は、プライム編集によって核酸分子を編集するための方法であって、核酸分子をプライム編集因子(例として、PE2、PE3、又は本明細書中に記載される他のプライム編集因子のいずれか)と接触させることと、核酸分子上の標的部位の内因性配列に対して10個以上の連続するヌクレオチドの挿入又は欠失を含むその伸長アーム上のDNA合成テンプレートとpegRNAとを接触させることと、を含む方法を提供する。いくつかの態様では、pegRNAのDNA合成鋳型は、細胞MMR経路によるミスマッチ修正の影響を回避又は低減し、それによってプライム編集効率を改善するために、3ヌクレオチドを超える挿入又は欠失を導入するように設計され得る。いくつかの態様では、pegRNAのDNA合成鋳型は、細胞MMR経路によるミスマッチ修正の影響を回避又は低減するために、3、4、5、6、7、8、9、10個又はそれ以上の連続するヌクレオチドの1つ以上の挿入及び/又は欠失を導入し、それによってプライム編集効率を改善するように設計される。いくつかの態様では、10個を超える連続するヌクレオチドの任意の長さの挿入又は欠失を使用が使用されて、MMR経路による修正を回避する利点を達成し得る。いくつかの態様では、DNA合成鋳型は、プライム編集によって編集された核酸分子上の標的部位の内因性配列に対して3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、又は25個の連続ヌクレオチドの挿入を含む。いくつかの態様では、DNA合成鋳型は、プライム編集によって編集された核酸分子上の標的部位の内因性配列に対して3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、又は25個の連続ヌクレオチドの欠失を含む。いくつかの態様では、DNA合成鋳型は、プライム編集によって編集された核酸分子上の標的部位の内因性配列に対して10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、又は40個の連続ヌクレオチドの挿入を含む。いくつかの態様では、DNA合成鋳型は、プライム編集によって編集された核酸分子上の標的部位の内因性配列に対して10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、又は40個の連続ヌクレオチドの欠失を含む。いくつかの態様において、DNA合成鋳型は、核酸分子上の標的部位に対して11個以上の連続したヌクレオチド、12個以上の連続したヌクレオチド、13個以上の連続したヌクレオチド、14個以上の連続したヌクレオチド、15個以上の連続したヌクレオチド、16個以上の連続したヌクレオチド、17個以上の連続したヌクレオチド、18個以上の連続したヌクレオチド、19個以上の連続したヌクレオチド、20個以上の連続したヌクレオチド、21個以上の連続したヌクレオチド、22個以上の連続したヌクレオチド、23個以上の連続したヌクレオチド、24個以上の連続したヌクレオチド、又は25個以上の連続したヌクレオチドの挿入又は欠失を含む。特定の態様では、DNA合成鋳型は、核酸分子上の標的部位の内因性配列に対して15個以上の連続するヌクレオチドの挿入又は欠失を含む。

いくつかの態様では、標的部位の内因性配列と比較して、複数の連続したヌクレオチド、例えば3つ以上の連続したヌクレオチドの挿入及び/又は欠失を導入するように設計されたpegRNAによるプライム編集は、対応する対照pegRNA(例として、3つ以上の連続するヌクレオチドの挿入又は欠失を導入しない対照pegRNA)によるプライム編集と比較して、少なくとも1.5倍、少なくとも2.0倍、少なくとも2.5倍、少なくとも3.0倍、少なくとも3.5倍、少なくとも4.0倍、少なくとも4.5倍、少なくとも5.0倍、少なくとも5.5倍、少なくとも6.0倍、少なくとも6.5倍、少なくとも7.0倍、少なくとも7.5倍、少なくとも8.0倍、少なくとも8.5倍、少なくとも9.0倍、少なくとも9.5倍、又は少なくとも10.0倍、プライム編集効率の増加をもたらす。いくつかの態様において、標的部位の内因性配列に対して3、4、5、6、7、8、9、10又はそれ以上の連続するヌクレオチドの挿入又は欠失を導入するように設計されたpegRNAによるプライム編集は、対応するコントロールpegRNA(例として、3つ以上の連続するヌクレオチドの挿入又は欠失を導入しない対照pegRNA)によるプライム編集と比較して、プライム編集効率の少なくとも1.5倍、少なくとも2.0倍、少なくとも2.5倍、少なくとも3.0倍、少なくとも3.5倍、少なくとも4.0倍、少なくとも4.5倍、少なくとも5.0倍、少なくとも5.5倍、少なくとも6.0倍、少なくとも6.5倍、少なくとも7.0倍、少なくとも7.5倍、少なくとも8.0倍、少なくとも8.5倍、少なくとも9.0倍、少なくとも9.5倍又は少なくとも10.0倍の増加をもたらす。いくつかの態様では、10個以上の連続するヌクレオチドの挿入又は欠失を作製することは、核酸分子上の標的部位の内因性配列と比較して10個未満のヌクレオチドの挿入又は欠失を含むDNA合成鋳型を含むpegRNAを使用する方法と比較して、プライム編集効率の少なくとも1.5倍、少なくとも2.0倍、少なくとも2.5倍、少なくとも3.0倍、少なくとも3.5倍、少なくとも4.0倍、少なくとも4.5倍、少なくとも5.0倍、少なくとも5.5倍、少なくとも6.0倍、少なくとも6.5倍、少なくとも7.0倍、少なくとも7.5倍、少なくとも8.0倍、少なくとも8.5倍、少なくとも9.0倍、少なくとも9.5倍、又は少なくとも10.0倍の増加をもたらす。いくつかの態様では、10個以上のヌクレオチドの挿入又は欠失を作製することは、核酸分子上の標的部位の内因性配列と比較して10個未満のヌクレオチドの挿入又は欠失を含むDNA合成鋳型を含むpegRNAを使用する方法と比較して、インデル形成頻度の少なくとも1.5倍、少なくとも2.0倍、少なくとも2.5倍、少なくとも3.0倍、少なくとも3.5倍、少なくとも4.0倍、少なくとも4.5倍、少なくとも5.0倍、少なくとも5.5倍、少なくとも6.0倍、少なくとも6.5倍、少なくとも7.0倍、少なくとも7.5倍、少なくとも8.0倍、少なくとも8.5倍、少なくとも9.0倍、少なくとも9.5倍、又は少なくとも10.0倍の減少をもたらす。

別の側面では、本開示はまた、核酸分子に導入された変化のMMR経路による修正を回避しながら、プライム編集によって核酸分子を編集し、それによってプライム編集効率を高め、及び/又はインデル形成を減少させるのに有用なpegRNAを提供する。いくつかの態様では、本開示によって提供されるpegRNAの伸長アームは、核酸分子上の標的部位の内因性配列に対して3つ以上の連続するヌクレオチドミスマッチを含む。いくつかの態様において、標的部位の内因性配列に対する3つの連続するヌクレオチドミスマッチのうちの少なくとも1つは、サイレント変異である。いくつかの態様では、連続するヌクレオチドのミスマッチの少なくとも1つは、標的核酸分子から発現されるタンパク質のアミノ酸配列の変化をもたらすが、残りのヌクレオチドのミスマッチの少なくとも1つはサイレント変異である。サイレント変異は、標的核酸分子のコード領域(すなわち、タンパク質をコードする遺伝子の一部)にあってもよく、又はサイレント変異は、標的核酸分子の非コード領域にあってもよい。いくつかの態様では、サイレント変異がコード領域内にある場合、サイレント変異は、未編集核酸分子と同じアミノ酸をコードする1つ以上の代替コドンを核酸分子に導入する。いくつかの態様では、サイレント変異が非コード領域にある場合、サイレント変異は、スプライシング、遺伝子調節、RNA寿命、又は核酸分子上の標的部位の他の生物学的特性に影響を及ぼさない核酸分子の領域に存在する。

MMR経路による修正を回避する利点を達成するために、3つ以上の任意の数の連続するヌクレオチドのミスマッチが、本明細書に記載のpegRNAの伸長アームに組み込まれ得る。いくつかの態様では、pegRNAの伸長アームのDNA合成テンプレートは、プライム編集によって編集された核酸分子上の標的部位の内因性配列に対して2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、又は25個の連続するヌクレオチドミスマッチを含む。いくつかの態様では、pegRNAの伸長アームのDNA合成鋳型は、プライム編集によって編集された核酸分子上の標的部位の内因性配列に対して少なくとも3つの連続したヌクレオチドのミスマッチを含む。いくつかの態様では、pegRNAの伸長アームのDNA合成鋳型は、プライム編集によって編集された核酸分子上の標的部位の内因性配列に対して3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、又は20個の連続するヌクレオチドミスマッチを含む。いくつかの態様では、pegRNAの伸長アームのDNA合成鋳型は、プライム編集によって編集された核酸分子上の標的部位の内因性配列に対して3、4、5、6、7、8、9、又は10個の連続するヌクレオチドミスマッチを含む。いくつかの態様では、pegRNA上の伸長アームのDNA合成鋳型は、核酸分子上の標的部位の内因性配列と比較して、3つ以上、4つ以上、5つ以上、6つ以上、7つ以上、8つ以上、9つ以上、又は10個以上の連続するヌクレオチドミスマッチを含む。特定の態様では、pegRNAの伸長アーム上の3つ以上の連続するヌクレオチドミスマッチの存在は、核酸分子上の標的部位の内因性配列と比較して、1つの連続するヌクレオチドミスマッチのみを含むDNA合成鋳型を含むpegRNAと比較して、プライム編集効率の少なくとも1.5倍、少なくとも2.0倍、少なくとも2.5倍、少なくとも3.0倍、少なくとも3.5倍、少なくとも4.0倍、少なくとも4.5倍、少なくとも5.0倍、少なくとも5.5倍、少なくとも6.0倍、少なくとも6.5倍、少なくとも7.0倍、少なくとも7.5倍、少なくとも8.0倍、少なくとも8.5倍、少なくとも9.0倍、少なくとも9.5倍、又は少なくとも10.0倍の増加をもたらす。特定の態様では、3つ以上の連続するヌクレオチド不一致の使用は、核酸分子上の標的部位の内因性配列と比較して、1つの連続するヌクレオチド不一致のみを含むDNA合成鋳型を含むpegRNAと比較して、インデル形成頻度の少なくとも1.5倍、少なくとも2.0倍、少なくとも2.5倍、少なくとも3.0倍、少なくとも3.5倍、少なくとも4.0倍、少なくとも4.5倍、少なくとも5.0倍、少なくとも5.5倍、少なくとも6.0倍、少なくとも6.5倍、少なくとも7.0倍、少なくとも7.5倍、少なくとも8.0倍、少なくとも8.5倍、少なくとも9.0倍、少なくとも9.5倍、又は少なくとも10.0倍の減少をもたらす。

別の側面において、本開示は、(a)(i)核酸プログラム可能DNA結合タンパク質(napDNAbp)及び(ii)DNAポリメラーゼを含むプライム編集因子、並びに(b)DNAミスマッチ修復経路の阻害剤を含む、部位特異的ゲノム修飾のためのプライム編集因子システムを提供する。いくつかの態様において、DNAミスマッチ修復経路の阻害剤は、DNAミスマッチ修復経路の1つ以上のタンパク質(例として、MLH1、PMS2(又はMutLアルファ)、PMS1(又はMutLベータ)、MLH3(又はMutLガンマ)、MutSアルファ(MSH2-MSH6)、MutSベータ(MSH2-MSH3)、MSH2、MSH6、PCNA、RFC、EXO1、POLδ及び/又はPCNA)を阻害する。いくつかの態様では、1つ以上のタンパク質はMLH1である。特定の態様では、MLH1は、配列番号204のアミノ酸配列、又は配列番号204と少なくとも70％、少なくとも75％、少なくとも80％、少なくとも85％、少なくとも90％、少なくとも95％、少なくとも96％、少なくとも97％、少なくとも98％、少なくとも99％、又は最大100％(100％を包含する)の配列同一性を有するアミノ酸配列を含む。

DNAミスマッチ修復経路の任意の阻害剤が、本明細書中に記載されるシステムにおいて使用されてもよい。いくつかの態様では、阻害剤は、DNAミスマッチ修復経路の1つ以上のタンパク質の活性を阻害する抗体である。いくつかの態様において、阻害剤は、DNAミスマッチ修復経路の1つ以上のタンパク質の活性を阻害する小分子である。いくつかの態様では、阻害剤は、DNAミスマッチ修復経路の1つ以上のタンパク質の活性を阻害する低分子干渉RNA(siRNA)又は低分子非コードマイクロRNAである。いくつかの態様では、阻害剤は、野生型MMRタンパク質の活性を阻害するMMRタンパク質のドミナントネガティブバリアント(例として、MLH1を阻害するMLH1のドミナントネガティブバリアント)である。

特定の態様では、本開示のシステムで使用されるドミナントネガティブバリアントは、(a)MLH1 E34A(配列番号222)、(b)MLH1 Δ756(配列番号208)、(c)MLH1 Δ754-756(配列番号209)、(d)MLH1 E34A Δ754-756(配列番号210)、(e)MLH1 1-335(配列番号211)、(f)MLH1 1-335 E34A(配列番号212)、(g)MLH1 1-335 NLSSV40(配列番号213)、(h)MLH1 501-756(配列番号215)、(i)MLH1 501-753(配列番号216)、(j)MLH1 461-753(配列番号218)、又は(k)NLSSV40 MLH1 501-753(配列番号223)、あるいは配列番号208～213、215、216、218、222又は223のいずれかと少なくとも70％、少なくとも75％、少なくとも80％、少なくとも85％、少なくとも90％、少なくとも95％、少なくとも96％、少なくとも97％、少なくとも98％、少なくとも99％、又は最大100％(100％を包含する)の配列同一性を有するアミノ酸配列を含むポリペプチドである。本開示はまた、MMR活性が完全にノックアウトされた細胞(例として、細胞のゲノム内のMMR経路を伴う1つ以上の遺伝子をノックダウンすることによって)中の核酸分子に対してプライム編集を行うための方法を企図する。そのような方法は、MMRの阻害剤を提供する必要なしに、MMRを阻害する利点(例として、編集効率の改善及びインデル形成の減少)を提供する。したがって、別の側面では、本開示は、プライム編集によって核酸分子を編集するための方法を提供し、該方法は、核酸分子をプライム編集因子及びpegRNAと接触させ、それによって標的部位に核酸分子に対する1つ以上の修飾をインストールすることを含み、核酸分子は、DNAミスマッチ修復(MMR)経路を伴う1つ以上の遺伝子のノックアウトを含む細胞内にある。いくつかの態様では、方法は、核酸分子を第2鎖ニッキングgRNAと接触させることを更に含む。特定の態様では、プライム編集効率は、MMRを伴う1つ以上の遺伝子のノックアウトを含まない細胞で行われる方法と比較して、少なくとも1.5倍、少なくとも2.0倍、少なくとも2.5倍、少なくとも3.0倍、少なくとも3.5倍、少なくとも4.0倍、少なくとも4.5倍、少なくとも5.0倍、少なくとも5.5倍、少なくとも6.0倍、少なくとも6.5倍、少なくとも7.0倍、少なくとも7.5倍、少なくとも8.0倍、少なくとも8.5倍、少なくとも9.0倍、少なくとも9.5倍、又は少なくとも10.0倍増加される。特定の態様では、インデル形成頻度は、MMRを伴う1つ以上の遺伝子のノックアウトを含まない細胞で行われる方法と比較して、少なくとも1.5倍、少なくとも2.0倍、少なくとも2.5倍、少なくとも3.0倍、少なくとも3.5倍、少なくとも4.0倍、少なくとも4.5倍、少なくとも5.0倍、少なくとも5.5倍、少なくとも6.0倍、少なくとも6.5倍、少なくとも7.0倍、少なくとも7.5倍、少なくとも8.0倍、少なくとも8.5倍、少なくとも9.0倍、少なくとも9.5倍、又は少なくとも10.0倍減少される。いくつかの態様では、MMRを伴う1つ以上の遺伝子は、タンパク質MLH1、PMS2(又はMutLアルファ)、PMS1(又はMutLベータ)、MLH3(又はMutLガンマ)、MutSアルファ(MSH2-MSH6)、MutSベータ(MSH2-MSH3)、MSH2、MSH6、PCNA、RFC、EXO1、POLδ及びPCNAをコードする遺伝子からなる群から選択される。特定の態様では、1つ以上の遺伝子は、MLH1をコードする遺伝子(例として、配列番号204のアミノ酸配列、又は配列番号204と少なくとも70％、少なくとも75％、少なくとも80％、少なくとも85％、少なくとも90％、少なくとも95％、少なくとも96％、少なくとも97％、少なくとも98％、少なくとも99％、又は最大100％(100％を包含する)の配列同一性を有するアミノ酸配列を含む)である。

別の側面では、本開示は、プライム編集によって核酸分子を編集するための方法を提供し、該方法は、核酸分子をプライム編集因子、pegRNA、及びp53の阻害剤と接触させ、それによって標的部位に核酸分子に対する1つ以上の修飾をインストールすることを含む。いくつかの態様では、方法は、核酸分子を第2鎖ニッキングgRNAと接触させることを更に含む。

いくつかの態様において、プライム編集効率は、p53阻害剤の存在下で、少なくとも1.5倍、少なくとも2.0倍、少なくとも2.5倍、少なくとも3.0倍、少なくとも3.5倍、少なくとも4.0倍、少なくとも4.5倍、少なくとも5.0倍、少なくとも5.5倍、少なくとも6.0倍、少なくとも6.5倍、少なくとも7.0倍、少なくとも7.5倍、少なくとも8.0倍、少なくとも8.5倍、少なくとも9.0倍、少なくとも9.5倍、少なくとも10.0倍、少なくとも11倍、少なくとも12倍、少なくとも13倍、少なくとも14倍、少なくとも15倍、少なくとも16倍、少なくとも17倍、少なくとも18倍、少なくとも19倍、少なくとも20倍、少なくとも21倍、少なくとも22倍、少なくとも23倍、少なくとも24倍、少なくとも25倍、少なくとも26倍、少なくとも27倍、少なくとも28倍、少なくとも29倍、少なくとも30倍、少なくとも31倍、少なくとも32倍、少なくとも33倍、少なくとも34倍、少なくとも35倍、少なくとも36倍、少なくとも37倍、少なくとも38倍、少なくとも39倍、少なくとも40倍、少なくとも41倍、少なくとも42倍、少なくとも43倍、少なくとも44倍、少なくとも45倍、少なくとも46倍、少なくとも47倍、少なくとも48倍、少なくとも49倍、少なくとも50倍、少なくとも51倍、少なくとも52倍、少なくとも53倍、少なくとも54倍、少なくとも55倍、少なくとも56倍、少なくとも57倍、少なくとも58倍、少なくとも59倍、少なくとも60倍、少なくとも61倍、少なくとも62倍、少なくとも63倍、少なくとも64倍、少なくとも65倍、少なくとも66倍、少なくとも67倍、少なくとも68倍、少なくとも69倍、少なくとも70倍、少なくとも71倍、少なくとも72倍、少なくとも73倍、少なくとも74倍、又は少なくとも75倍増加される。いくつかの態様において、インデル形成の頻度は、p53阻害剤の存在下で、少なくとも1.5倍、少なくとも2.0倍、少なくとも2.5倍、少なくとも3.0倍、少なくとも3.5倍、少なくとも4.0倍、少なくとも4.5倍、少なくとも5.0倍、少なくとも5.5倍、少なくとも6.0倍、少なくとも6.5倍、少なくとも7.0倍、少なくとも7.5倍、少なくとも8.0倍、少なくとも8.5倍、少なくとも9.0倍、少なくとも9.5倍、少なくとも10.0倍、少なくとも11倍、少なくとも12倍、少なくとも13倍、少なくとも14倍、少なくとも15倍、少なくとも16倍、少なくとも17倍、少なくとも18倍、少なくとも19倍、少なくとも20倍、少なくとも21倍、少なくとも22倍、少なくとも23倍、少なくとも24倍、少なくとも25倍、少なくとも26倍、少なくとも27倍、少なくとも28倍、少なくとも29倍、少なくとも30倍、少なくとも31倍、少なくとも32倍、少なくとも33倍、少なくとも34倍、少なくとも35倍、少なくとも36倍、少なくとも37倍、少なくとも38倍、少なくとも39倍、少なくとも40倍、少なくとも41倍、少なくとも42倍、少なくとも43倍、少なくとも44倍、少なくとも45倍、少なくとも46倍、少なくとも47倍、少なくとも48倍、少なくとも49倍、少なくとも50倍、少なくとも51倍、少なくとも52倍、少なくとも53倍、少なくとも54倍、少なくとも55倍、少なくとも56倍、少なくとも57倍、少なくとも58倍、少なくとも59倍、少なくとも60倍、少なくとも61倍、少なくとも62倍、少なくとも63倍、少なくとも64倍、少なくとも65倍、少なくとも66倍、少なくとも67倍、少なくとも68倍、少なくとも69倍、少なくとも70倍、少なくとも71倍、少なくとも72倍、少なくとも73倍、少なくとも74倍、又は少なくとも75倍減少される。

いくつかの態様では、p53の阻害剤はタンパク質である。ある特定の態様において、p53の阻害剤は、タンパク質i53である。いくつかの態様では、p53の阻害剤は、p53の活性を阻害する抗体である。いくつかの態様では、p53の阻害剤は、p53の活性を阻害する小分子である。いくつかの態様では、p53の阻害剤は、p53の活性を阻害する低分子干渉RNA(siRNA)又は低分子非コードマイクロRNAである。

別の側面では、本開示は、配列番号99のPEmaxを包含する改良されたプライム編集因子融合タンパク質を記載する。本開示はまた、配列番号99と少なくとも80％、少なくとも85％、少なくとも90％、少なくとも95％、少なくとも96％、少なくとも97％、少なくとも98％、少なくとも99％、又は少なくとも最大100％の配列同一性を有するアミノ酸配列を有する融合タンパク質を企図する。

本発明者らは、驚くべきことに、プライム編集の編集効率が、標準的な(canonical)プライム編集因子融合タンパク質(すなわち、PE2)の1つ以上の構成要素が修飾されると、有意に増加されてもよい(例として、2倍増加、3倍増加、4倍増加、5倍増加、6倍増加、7倍増加、8倍増加、9倍増加、又は10倍以上増加)ことを見出した。修飾は、1つ以上の成分(例として、Cas9成分、逆転写酵素成分、又はリンカー)の修飾アミノ酸配列を包含してもよい。

他の側面では、本開示はまた、PEmax、PEmaxを使用するプライム編集の方法、PEmaxをコードするポリヌクレオチド及びベクター、並びにPEmaxを含むキット及び細胞を含む組成物及び医薬組成物を提供する。

前述の概念、及び後述する追加の概念は、本開示がこの点に関して限定されないため、任意の適切な組み合わせで配置されてもよいことを了解されるべきである。更に、本開示の他の利点及び新規な特徴は、添付の図面と併せて考慮すると、様々な非限定的な態様の以下の詳細な説明から明らかになるであろう。

以下の図面は、本明細書の一部を形成し、本明細書に提示される特定の側面の詳細な説明と組み合わせてこれらの図面の1つ以上を参照することによってよりよく理解され得る本開示の特定の態様を更に実証するために包含される。

プライム編集がガイドRNA鋳型ゲノム操作を可能にすることを示す概略図を提供する。細胞因子によって修復されることができるDNAプライム編集中間体がボックスで示される。

プライム編集結果のためのDNA修復CRISPRiスクリーニングの概略図を提供する。

標的部位でのプライム編集効率の最適化を示す。図3Aは、最適化プロセスの概略図を提供する。図3Bは、HeLa細胞における標的部位における特定の修飾を伴うリード％を示す。図3Cは、HeLa細胞におけるブラストサイジン選択による標的部位での特定の修飾を伴うリード％を示す。

DNA修復ライブラリーを用いたプライム編集CRISPRiスクリーニングを示す。図4Aは、スクリーニングプロセスの概略図を提供する。図4Bは、ポストスクリーニングHeLa細胞のバルク編集における特定の修飾を伴うリード％を示す。

CRISPRiスクリーニングが、DNAミスマッチ修復がプライム編集効率を制限することを明らかにすることを示す。ミスマッチ修復タンパク質(MSH2、MSH6、PMS2及びMLH1)のノックダウンは、PE2の効率を3倍改善し、PE3の効率を2倍改善する。 CRISPRiスクリーニングが、DNAミスマッチ修復がプライム編集効率を制限することを明らかにすることを示す。ミスマッチ修復タンパク質(MSH2、MSH6、PMS2及びMLH1)のノックダウンは、PE2の効率を3倍改善し、PE3の効率を2倍改善する。

MMRのsiRNAノックダウンがHEK293T細胞におけるプライム編集を改善することを示す。複数の内因性遺伝子座における編集結果は、CRISPRiスクリーニングの所見を検証する。 MMRのsiRNAノックダウンがHEK293T細胞におけるプライム編集を改善することを示す。複数の内因性遺伝子座における編集結果は、CRISPRiスクリーニングの所見を検証する。 MMRのsiRNAノックダウンがHEK293T細胞におけるプライム編集を改善することを示す。複数の内因性遺伝子座における編集結果は、CRISPRiスクリーニングの所見を検証する。

完全なMMRノックアウトがプライム編集を劇的に向上させることを示す。MMRが存在しない場合、PE2編集効率はPE3編集効率と一致することが示される。完全なMMRノックアウトがプライム編集を劇的に向上させることを示す。MMRが存在しない場合、PE2編集効率はPE3編集効率と一致することが示される。

ミスマッチ修復(MMR)の機構の概略図を提供する。第1の工程では、MSH2:MSH6(MutSα)がミスマッチに結合し、MLH1:PMS2(MutLα)を動員する。DNAニックは、修復すべき鎖であるMMRにシグナル伝達する。第2の工程において、MutLαは、ミスマッチのニックが入った鎖5'及び3'を無差別に切り裂く。第3の工程において、EXO1は、MutLαが生成したニックからミスマッチを切除する。第4の工程では、POLδが切除された鎖を再合成し、続いてLIG1ライゲーションを行う。

真核細胞におけるミスマッチ修復機構MMRの更に別の概略図を提供する。概略図の左側は、5'MMRを示す。(A)MutSホモログタンパク質(MSH、紫色)MutSα(MSH2-MSH6)又はMutSβ(MSH2-MSH3)はミスマッチを認識し、結合する。一本鎖DNAに結合したRPAは、EXO1がDNAにアクセスし、分解するのを妨げる。(B)スライディングクランプモデルでは、ミスマッチのMutSα/βがATPに結合し、ヌクレオチドスイッチの活性化を受け、DNAに沿って拡散するスライディングクランプになる。複数のMSHクランプが単一のミスマッチで負荷される。EXO1とMSHスライディングクランプとの相互作用は、RPAバリアを克服し、5'ニックからの5'から3'への切除のためにEXO1を活性化する。MutLホモログタンパク質(MLH)(MutLαはScMlh1-Pms1又はHsMLH1-PMS2である)はATPに結合し、MSHスライディングクランプと相互作用してもよいが、MLHは5'MMRのためにin vitroで絶対に必要とされるわけではない。他のモデルでは、MSHは、切除を許可するためにミスマッチのままであるか、又はミスマッチの近傍のDNAに複数のMLHクランプを負荷し得る(図示せず)。(C)スライディングクランプモデルでは、数百ヌクレオチドを切り出した後にEXO1/MSH複合体が解離する。反復的な回数のMSH-EXO1切除は、5'ニックからミスマッチをちょうど超えて延びるRPAでコーティングされた切除路を作り出す。MLHは、DNA上のMSHクランプの数を調節することによって切除を制限してもよい。(D)RFC(図示せず)は、PCNAクランプに鎖切断又はギャップの3'端に特定の配向を負荷し、PCNAはPolδ又はεによる高忠実度DNA合成を容易にする。(E)DNAリガーゼIはニックを密封する。概略図の右側は、3'MMRを示す。(A)MSHはミスマッチを認識する。(B)スライディングクランプモデルでは、ATP依存性結合及びヌクレオチドスイッチングが、ミスマッチから拡散するMSHスライディングクランプを作り出す。ATP結合MLHヘテロダイマーとMSHスライドクランプ及び3'端に対して配向されたPCNAとの相互作用は、MLH鎖特異的ニッキングを活性化する。あるいは、ATP活性化MSHは、MLHをロードし、ニッキングを活性化するためにミスマッチのままであってもよい(図示せず)。(C)切除はEXO1依存性又は非依存性であり、RPA被覆切除トラックをもたらす。EXO1非依存性Polδ鎖置換経路は示されていない。(D)PCNAを用いたPolδ又はεはギャップ充填を完了する。(E)DNAリガーゼIはニックを密封する。

PE2中間体のミスマッチ修復の概略図を提供する。MMR阻害は、フラップライゲーションのための更なる時間を提供し、ヘテロ二本鎖の修復のための鎖識別シグナルを除去する。 PE2中間体のミスマッチ修復の概略図を提供する。MMR阻害は、フラップライゲーションのための更なる時間を提供し、ヘテロ二本鎖の修復のための鎖識別シグナルを除去する。 PE2中間体のミスマッチ修復の概略図を提供する。MMR阻害は、フラップライゲーションのための更なる時間を提供し、ヘテロ二本鎖の修復のための鎖識別シグナルを除去する。

ドミナントネガティブMLH1変異体の発現がPE2効率を高めることを示す。MLH1ドミナントネガティブ変異体は、PE2効率を2～4倍改善する。RNF2＋3 GからCは、MMR阻害に応答しない。

PE3に対するMLH1変異体の効果を示す。MLH1変異体は、PE3インデルを半分に減少させる。 PE3に対するMLH1変異体の効果を示す。MLH1変異体は、PE3インデルを半分に減少させる。

MLH1変異体の改善が他の部位に翻訳されることを示す。図12Aは、PE2編集効率がMLH1変異体で増加し、RNF2＋3 GからCのみがMMR阻害に耐性であることを示す。図12Bは、MLH1変異体がインデルの発生を半減させることを示す。

PE3中間体のミスマッチ修復を示す概略図を提供する。

ミスマッチ修復がPE3中間体を差次的に分解することを示す概略図を提供する。一方の編集優先中間体にはミスマッチ修復が必要とされる。

より小さいサイズ及び改善された活性についてのMLH1変異体のスクリーニングを示す。図15Aは、MLH1 Δ754-756がPE2編集(以下、MLH1dnと呼ぶ)を最も強く促進することを示す。MLH1 N末端ドメインは、MLH1dn(以下、MLH1dn^NTDと呼ぶ)の有効性に近づく。MLH1ドミナントネガティブ変異体は、MutSの結合を飽和させることによって機能してもよい。図15Bは、MLH1 N末端ドメイン＋NLSがMLH1negの活性に近づくことを示す。図15Cは、自己切断性P2Aリンカー(PE-2A-MLH1dn)によるPEへのMLH1dn融合がプライム編集効率を改善し得ることを示す。図15D～図15Fは、MMR KDがMLH1neg発現を表現型模写することを示す。図15D～図15Fは、MMR KDがMLH1neg発現を表現型模写することを示す。図15D～図15Fは、MMR KDがMLH1neg発現を表現型模写することを示す。図15G～図15Hは、PE2及びPE3の効率がMMRの非存在下で等しいことを示し、相補的ニックがMMRを偏らせるのにのみ役立つことを示唆している。図15G～図15Hは、PE2及びPE3の効率がMMRの非存在下で等しいことを示し、相補的ニックがMMRを偏らせるのにのみ役立つことを示唆している。

MLH1dnがPE3のインデルを減少させることを示す。サイレントpegRNAは、編集をコードしないか又はミスマッチを生成しないpegRNAである。MLH1dnは、ミスマッチが生成された場合にPE3インデルのみを減少させる。

PEヘテロ二重鎖のミスマッチ修復が、拡散したインデルパターンを生じることを示す。これらの編集のためにPE3のインデル分布は広いが、MLH1dnでMMRを阻害するとその分布が狭くなる。これは、MMRが、PE3によって生成されたインデルに寄与するミスマッチ認識後に切開を行うことを示唆している。

PE3中間体のミスマッチ修復を示す。

標的遺伝子座のMMR切除がPE3にインデルを生成することを示す。標的遺伝子座のMMR切除がPE3にインデルを生成することを示す。

MMRノックダウン又はノックアウトがRNF2＋3 GからCに影響を及ぼさないことを示す。これは、RNF2部位がMMRによって修復されないか、又は結果として生じるC:CミスマッチがMMRによって修復されないことを示唆する。 MMRノックダウン又はノックアウトがRNF2＋3 GからCに影響を及ぼさないことを示す。これは、RNF2部位がMMRによって修復されないか、又は結果として生じるC:CミスマッチがMMRによって修復されないことを示唆する。

MLH1dnを用いてRNF2での他の置換編集が改善され得ることを示す。 MLH1dnを用いてRNF2での他の置換編集が改善され得ることを示す。 MLH1dnを用いてRNF2での他の置換編集が改善され得ることを示す。

MLH1dnがHEK3を包含する他の部位での置換編集を改善することを示す。MLH1dnはPE2編集を強く増強し、PE3インデルを低下させる。 MLH1dnがHEK3を包含する他の部位での置換編集を改善することを示す。MLH1dnはPE2編集を強く増強し、PE3インデルを低下させる。

MLH1dnが、FANCFを包含する他の部位での置換編集を改善することを示す。MLH1dnはPE2編集を強く増強し、PE3インデルを低下させる。 MLH1dnが、FANCFを包含する他の部位での置換編集を改善することを示す。MLH1dnはPE2編集を強く増強し、PE3インデルを低下させる。 MLH1dnが、FANCFを包含する他の部位での置換編集を改善することを示す。MLH1dnはPE2編集を強く増強し、PE3インデルを低下させる。 MLH1dnが、FANCFを包含する他の部位での置換編集を改善することを示す。MLH1dnはPE2編集を強く増強し、PE3インデルを低下させる。

MHL1dnによるPE改善がミスマッチ依存性であることを示す。MLH1dnは、HEK293T細胞においてPE2編集を平均で2倍増加させる。図24Aは、GからCへの編集(C:Cミスマッチ)がHEK293T細胞においてMMRに影響されないことを示す。これは、GからCへの編集が他の置換よりも高いベースライン効率を有することを示唆している。図24Bは、PE3と共に使用されるMLH1dnからの編集:インデル純度の比の実質的な増加を示し、これもミスマッチ依存性である。

MLH1dnが小さな挿入及び削除編集の効率も改善することを示す。MMRは、15ヌクレオチド長未満の挿入及び欠失を修復することが知られている。 MLH1dnが小さな挿入及び削除編集の効率も改善することを示す。MMRは、15ヌクレオチド長未満の挿入及び欠失を修復することが知られている。 MLH1dnが小さな挿入及び削除編集の効率も改善することを示す。MMRは、15ヌクレオチド長未満の挿入及び欠失を修復することが知られている。 MLH1dnが小さな挿入及び削除編集の効率も改善することを示す。MMRは、15ヌクレオチド長未満の挿入及び欠失を修復することが知られている。

MLH1dnがpegRNA足場の組み込みを減少させたことを示す。これらの部位での足場組み込み事象は、二本鎖切断(DSB)中間体を介して起こる。 MLH1dnがpegRNA足場の組み込みを減少させたことを示す。これらの部位での足場組み込み事象は、二本鎖切断(DSB)中間体を介して起こる。

MLH1dnが実質的なPEオフターゲット編集を促進しないことを示す。オフターゲット(OT)編集のわずかな増加が、HEK4オフターゲット部位3で観察された。

MLH1dnがバイオマーカー遺伝子座で検出可能なマイクロサテライト不安定性を誘導しないことを示す。MMR阻害は、ホモポリマーマイクロサテライト領域の短縮を引き起こすことが知られている。 MLH1dnがバイオマーカー遺伝子座で検出可能なマイクロサテライト不安定性を誘導しないことを示す。MMR阻害は、ホモポリマーマイクロサテライト領域の短縮を引き起こすことが知られている。

MLH1dnが、HEK4等の良好なngRNAのない部位でプライム編集効率を高める方法を提供することを示す。

MLH1dnが疾患部位でPEを改善することを示す。

MLH1dnがマウスアストロサイトにおける保護的APOEクライストチャーチ対立遺伝子のインストールを増強することを示す。編集効率の50％の向上及びインデルの大幅な減少が示されている。

HEK293T細胞がMMRを損なわれていることを示す。MLH1プロモータは、HEF293Tにおいて過剰メチル化されており、MLH1発現が低下する。

MLH1dnがHeLa細胞においてプライム編集を増強することを示す。図33Aは、PE2によるプライム編集を示す。図33Bは、PE3によるプライム編集を示す。

MLH1dnがHeLa細胞においてプライム編集を増強することを示す。図34Aは、PRNP＋6 GからTの編集を示す。図34Bは、APOE＋6 GからT及び＋10 CからAの編集を示す。

MLH1dnがHeLaのようなMMRコンピテントセル株においてより大きな効果を有することを示す。 MLH1dnがHeLaのようなMMRコンピテントセル株においてより大きな効果を有することを示す。

MLH1dnの改善が安定化されたpegRNAと相乗作用することを示す。 MLH1dnの改善が安定化されたpegRNAと相乗作用することを示す。 MLH1dnの改善が安定化されたpegRNAと相乗作用することを示す。 MLH1dnの改善が安定化されたpegRNAと相乗作用することを示す。

連続的な置換がMMRを回避するための別の戦略として有用であることを示す。連続的な置換がMMRを回避するための別の戦略として有用であることを示す。

MMRが3つ以上の連続した置換を効率的に修復しないことを示す。したがって、連続的な置換は、MMRを回避し、PE効率を高める方法を提供する。

MLH1negがHeLa細胞においてPEを改善することを示す。 MLH1negがHeLa細胞においてPEを改善することを示す。 MLH1negがHeLa細胞においてPEを改善することを示す。

プールされたRepair-seq CRISPRiスクリーニングが、プライム編集結果に対する置換の遺伝的決定因子を明らかにすることを示す。図40Aは、PE2系によるプライム編集が、PE2酵素(逆転写酵素に融合したStreptococcus pyogenes Cas9(SpCas9)H840Aニッカーゼ)及びプライム編集ガイドRNA(pegRNA)によって媒介されることを示す。PE3システムは、編集されていない鎖にニックを入れ、より高い編集効率を得るために追加のシングルガイドRNA(sgRNA)を使用する。PBS、プライマー結合部位。RT鋳型、逆転写鋳型。図40Bは、プライム編集Repair-seq CRISPRiスクリーンの概要を提供する。CRISPRi sgRNAのライブラリー及び事前に検証されたプライム編集部位がCRISPRi細胞株に形質導入され、編集部位を標的とするプライム編集因子でトランスフェクトされる。CRISPRi sgRNA同一性及びプライム編集部位は、ゲノムDNAから一緒に増幅され、ペアエンドシーケンシングされて、各遺伝子摂動を編集結果と結び付ける。SaCas9、Staphylococcus aureus Cas9。図40Cは、プールされたCRISPRiスクリーニングにおける標的編集部位での意図されたG・CからC・Gプライム編集を報告するシーケンシングリードのパーセンテージに対する各CRISPRi sgRNAの効果を示す。各値は、同じCRISPRi sgRNAを有する全ての配列決定リードを示す。図40Dは、全てのスクリーニング条件における編集効率に対するCRISPRi sgRNAの効果を示す。黒い点は個々の非標的化sgRNAを表し、黒い線は全ての非標的化sgRNAの平均を示し、灰色の陰影は全てのsgRNAの分布のカーネル密度推定値を表す。図40E～図40Gは、異なるスクリーニング条件にわたる、意図されたG・CからC・Gプライム編集に対するCRISPRi標的化の遺伝子レベルの影響の比較を示す。(図40E)K562 PE2対HeLa PE2。(図40F)K562 PE3＋50対HeLa PE3＋50。(図40G)K562 PE2対K562 PE3＋50。各遺伝子の効果は、遺伝子を標的化する2つの最も極端なsgRNAについての非標的化sgRNAからの頻度の平均log2倍変化として計算される。プロットされた量は、各細胞型に対するn＝2の独立した生物学的反復の平均であり、バーは、反復によってまたがる値の範囲を示す。黒い点は、3つの非標的化sgRNAの20個のランダムなセットを表す。図40E～図40Gは、異なるスクリーニング条件にわたる、意図されたG・CからC・Gプライム編集に対するCRISPRi標的化の遺伝子レベルの影響の比較を示す。(図40E)K562 PE2対HeLa PE2。(図40F)K562 PE3＋50対HeLa PE3＋50。(図40G)K562 PE2対K562 PE3＋50。各遺伝子の効果は、遺伝子を標的化する2つの最も極端なsgRNAについての非標的化sgRNAからの頻度の平均log2倍変化として計算される。プロットされた量は、各細胞型に対するn＝2の独立した生物学的反復の平均であり、バーは、反復によってまたがる値の範囲を示す。黒い点は、3つの非標的化sgRNAの20個のランダムなセットを表す。図40E～図40Gは、異なるスクリーニング条件にわたる、意図されたG・CからC・Gプライム編集に対するCRISPRi標的化の遺伝子レベルの影響の比較を示す。(図40E)K562 PE2対HeLa PE2。(図40F)K562 PE3＋50対HeLa PE3＋50。(図40G)K562 PE2対K562 PE3＋50。各遺伝子の効果は、遺伝子を標的化する2つの最も極端なsgRNAについての非標的化sgRNAからの頻度の平均log2倍変化として計算される。プロットされた量は、各細胞型に対するn＝2の独立した生物学的反復の平均であり、バーは、反復によってまたがる値の範囲を示す。黒い点は、3つの非標的化sgRNAの20個のランダムなセットを表す。

意図しないプライム編集結果の遺伝的モジュレーターを示す。図41A～図41Dは、CRISPRiスクリーニングで観察された意図しないプライム編集結果の4つのカテゴリーの代表例を示す。各パネルにおいて、黒色バーは編集結果の配列を示し、青色バーは標的編集部位周辺のゲノム配列を示し、オレンジ色バーはpegRNA配列を示す。編集結果とゲノム又はpegRNAとの間の青色及びオレンジ色の線は、結果配列と関連する参照配列との間の局所アラインメントを示す。アライメントのミスマッチはXでマークされ、挿入は下向きのくぼみでマークされる。プログラムされた編集の位置は灰色のボックスでマークされる。ゲノム上の赤色及びシアンの長方形はSaCas9プロトスペーサ及びPAMを示し、黒色の縦線はSaCas9ニック部位の位置を示す。pegRNA上のオレンジ色、ベージュ色、灰色、及び赤色の長方形は、それぞれプライマー結合部位(PBS)、逆転写鋳型(RTT)、足場、及びスペーサを示す。図41A～図41Dは、CRISPRiスクリーニングで観察された意図しないプライム編集結果の4つのカテゴリーの代表例を示す。各パネルにおいて、黒色バーは編集結果の配列を示し、青色バーは標的編集部位周辺のゲノム配列を示し、オレンジ色バーはpegRNA配列を示す。編集結果とゲノム又はpegRNAとの間の青色及びオレンジ色の線は、結果配列と関連する参照配列との間の局所アラインメントを示す。アライメントのミスマッチはXでマークされ、挿入は下向きのくぼみでマークされる。プログラムされた編集の位置は灰色のボックスでマークされる。ゲノム上の赤色及びシアンの長方形はSaCas9プロトスペーサ及びPAMを示し、黒色の縦線はSaCas9ニック部位の位置を示す。pegRNA上のオレンジ色、ベージュ色、灰色、及び赤色の長方形は、それぞれプライマー結合部位(PBS)、逆転写鋳型(RTT)、足場、及びスペーサを示す。図41A～図41Dは、CRISPRiスクリーニングで観察された意図しないプライム編集結果の4つのカテゴリーの代表例を示す。各パネルにおいて、黒色バーは編集結果の配列を示し、青色バーは標的編集部位周辺のゲノム配列を示し、オレンジ色バーはpegRNA配列を示す。編集結果とゲノム又はpegRNAとの間の青色及びオレンジ色の線は、結果配列と関連する参照配列との間の局所アラインメントを示す。アライメントのミスマッチはXでマークされ、挿入は下向きのくぼみでマークされる。プログラムされた編集の位置は灰色のボックスでマークされる。ゲノム上の赤色及びシアンの長方形はSaCas9プロトスペーサ及びPAMを示し、黒色の縦線はSaCas9ニック部位の位置を示す。pegRNA上のオレンジ色、ベージュ色、灰色、及び赤色の長方形は、それぞれプライマー結合部位(PBS)、逆転写鋳型(RTT)、足場、及びスペーサを示す。図41A～図41Dは、CRISPRiスクリーニングで観察された意図しないプライム編集結果の4つのカテゴリーの代表例を示す。各パネルにおいて、黒色バーは編集結果の配列を示し、青色バーは標的編集部位周辺のゲノム配列を示し、オレンジ色バーはpegRNA配列を示す。編集結果とゲノム又はpegRNAとの間の青色及びオレンジ色の線は、結果配列と関連する参照配列との間の局所アラインメントを示す。アライメントのミスマッチはXでマークされ、挿入は下向きのくぼみでマークされる。プログラムされた編集の位置は灰色のボックスでマークされる。ゲノム上の赤色及びシアンの長方形はSaCas9プロトスペーサ及びPAMを示し、黒色の縦線はSaCas9ニック部位の位置を示す。pegRNA上のオレンジ色、ベージュ色、灰色、及び赤色の長方形は、それぞれプライマー結合部位(PBS)、逆転写鋳型(RTT)、足場、及びスペーサを示す。図41E～図41Fは、K562細胞におけるPE2スクリーニング(図41E)及びPE3＋50スクリーニング(図41F)で観察された編集結果カテゴリーの要約を提供する。プロットされた量は、n＝2の独立した生物学的反復にわたって平均化された、示された各遺伝子(60非標的sgRNA、標的遺伝子当たり3つのsgRNA)に対する全てのsgRNAの平均±SDである。図41E～図41Fは、K562細胞におけるPE2スクリーニング(図41E)及びPE3＋50スクリーニング(図41F)で観察された編集結果カテゴリーの要約を提供する。プロットされた量は、n＝2の独立した生物学的反復にわたって平均化された、示された各遺伝子(60非標的sgRNA、標的遺伝子当たり3つのsgRNA)に対する全てのsgRNAの平均±SDである。図41G～図41Hは、CRISPRiスクリーニングで標的とされた全ての遺伝子のノックダウンが、PE3＋50からの意図しない位置での逆転写配列の連結の頻度(図41G)又は欠失の頻度(図41H)に及ぼす影響の比較を示す。各遺伝子の効果は、遺伝子を標的化する2つの最も極端なsgRNAについての非標的化sgRNAからの頻度の平均log2倍変化として計算される。プロットされた量は、各細胞型に対するn＝2の独立した生物学的反復の平均であり、バーは、反復によってまたがる値の範囲を示す。黒い点は、3つの非標的化sgRNAの20個のランダムなセットを表す。図41Iは、示されているCRISPRi sgRNAセット(黒線:60個の非標的化sgRNA;オレンジ色及び緑色の線:MSH2、MSH6、MLH1及びPMS2の各々を標的とする3つのsgRNA)の全リードにわたる、K562スクリーニング複製1におけるプログラムされたPE3＋50ニック(破線の垂直線)に対するゲノム位置の関数としての欠失の頻度を示す(上)。非標的化sgRNAと比較した、MSH2、MSH6、MLH1及びPMS2 sgRNAからのゲノム位置の関数としての欠失頻度のLog2倍変化(下)。図41Jは、K562スクリーニングにおいて、プログラムされたPE3＋50ニックの外側の少なくとも25-ntの配列を除去する、観察された全ての欠失の割合に対する遺伝子ノックダウンの効果を示す。各ドットは、各遺伝子を標的とする全てのsgRNAに対する全てのリードを表す。黒い点は、20セットの3つのランダムな非標的化sgRNAを表す。

プライム編集中間体のミスマッチ修復のモデルを示す。図42Aは、PE2中間体のDNAミスマッチ修復(MMR)のモデルを示す。MMRは、プライム編集因子によって生成されたヘテロ二本鎖基質の修復中にニックされた鎖を切除し、置き換える。MMR認識前のニックの低頻度のライゲーションは、MMRのための鎖識別シグナルを奪い取り、ヘテロ二本鎖の不偏分解をもたらす。図42Bは、PE3中間体のMMRのモデルを示す。PE3は、編集されていない鎖を置き換えるようにMMRに指示し得る編集されていない鎖に追加のニックをインストールする。編集された鎖ニックのライゲーションは、MMRによるシグナル修復のために相補鎖ニックのみを残し、所望のプライム編集結果をもたらす。図42Cは、MSH2、MSH6、MLH1又はPMS2転写物に対するノックダウンsiRNAで前処理したHEK293T細胞における内因性部位(HEK3、EMX1及びRUNX1)でのPE2及びPE3プライム編集因子のプライム編集効率を示す。細胞は、プライム編集因子成分及びsiRNAによるトランスフェクションの3日前にsiRNAでプレトランスフェクトされた。ゲノムDNAは、プライム編集因子及び更なるsiRNAによるトランスフェクションの3日後に回収され、次いで配列決定された。バーは、n＝3の独立した生物学的反復の平均を表す。図42Dは、HAP1 ΔMSH2及びHAP1 ΔMLH1細胞におけるプライム編集効率を示す(n＝3の独立した生物学的複製の平均)。Δ、遺伝子ノックアウト。

操作されたドミナントネガティブMMRタンパク質(MSH2、MSH6、PMS2及びMLH1のドミナントネガティブバリアント)がプライム編集を増強することを示す。図43Aは、HEK293T細胞におけるヒトMMRタンパク質又はドミナントネガティブバリアントとのトランスでのPE2の同時発現によるHEK2、EMX1及びRUNX1部位での編集改善を示す。MMRタンパク質は、MSH2、MSH6、PMS2及びMLH1を包含する。ドミナントネガティブバリアントは、MSH2 K675R、MSH6 K1140R、PMS2 E41A、PMS2 E705K、MLH1 E34A、及びMLH1 Δ756と命名される。n＝3の独立した生物学的反復からの全ての値が示される。図43Bは、ATPaseドメイン、MSH2相互作用ドメイン、NLSドメイン、PMS2二量体化ドメイン及びエンドヌクレアーゼドメインを包含する756aaのヒトMLH1タンパク質の機能的アノテーションを示す。図43Cは、HEK3、EMX1及びRUNX1部位のHEK293T細胞においてPE2と共発現されるMLH1バリアントの編集増強を示す。赤色のボックスは、MLH1 ATPase又はエンドヌクレアーゼの機能を不活性化する突然変異を示す。MLH1dn、MLH1 Δ754-756。MLH1NTD-NLS、コドン最適化MLH1 1-335-NLSSV40。n＝3の独立した生物学的反復からの全ての値が示される。図43Dは、追加のプライム編集における上位3つのドミナントネガティブMLH1バリアントの比較を示す。n＝3の独立した生物学的反復からの全ての値が示される。図43Eは、HEK293T細胞におけるPE2及びMLH1dnのトランス、PE2及びMLH1^NTD-NLSのトランス及びPE2-P2A-MLH1dn(ヒトコドン最適化)でのプライム編集を示す。バーは、n＝3の独立した生物学的反復の平均を表す。図43Fは、PE2、PE3、PE4、及びPE5の構造を比較している。特に、PE4編集システムは、プライム編集因子酵素(ニッカーゼCas9-RT融合物)、MLH1dn及びpegRNAからなる。PE5編集システムは、プライム編集因子酵素、MLH1dn、pegRNA及び第2鎖ニッキングsgRNAからなる。図43Gは、HEK293T細胞におけるPE2、PE3、PE4及びPE5系の編集効率を示す。バーは、n＝3の独立した生物学的反復の平均を表す。

多様なプライム編集クラス及び細胞型にわたるPE4及びPE5の特徴付けを示す。図44Aは、HEK293T細胞における7つの内因性部位にわたる84の一塩基置換編集(各置換タイプについて7つ)について、PE2及びPE3と比較したPE4及びPE5によるプライム編集強化の概要を提供する。n＝3の独立した生物学的複製物の全ての個々の値の総合平均±SDが示される。図44Bは、HEK293T細胞におけるPE2、PE3、PE4及びPE5を有するFANCF遺伝子座での一塩基変異のインストールを示す。バーは、n＝3の独立した生物学的反復の平均を表す。図44Cは、PE4が、HEK293T細胞におけるPE2と比較して、1bp及び3bpの挿入及び欠失のプライム編集を改善することを示す。バーは、n＝3の独立した生物学的反復の平均を表す。図44Dは、33の異なる挿入及び欠失プライム編集にわたるPE2に対するPE4編集強化を示す。バーは、n＝3の独立した生物学的反復の全ての個々の値の平均を表す。図44E～図44Fは、HEK293T細胞における5つの内因性部位での1～5個の連続する塩基の35の異なる置換についてのPE2及びPE4編集効率の要約を提供する。変化した各連続塩基数について、7つのpegRNAが試験された。n＝3の独立した生物学的複製物の全ての個々の値の平均±SDが示される。図44E～図44Fは、HEK293T細胞における5つの内因性部位での1～5個の連続する塩基の35の異なる置換についてのPE2及びPE4編集効率の要約を提供する。変化した各連続塩基数について、7つのpegRNAが試験された。n＝3の独立した生物学的複製物の全ての個々の値の平均±SDが示される。図44G～図44Hは、意図された編集の近くに追加のサイレント変異又は良性変異をインストールすると、MMRを回避するヘテロ二重鎖基質を生成することによって編集効率を高め得ることを示す。各ターゲットのPAMシーケンス(NGG)に下線が引かれている。標的遺伝子のアミノ酸配列は、各DNAコドンの上にセンタリングされる。値は、n＝3の独立した生物学的反復実験の平均±SDを表す。図44G～図44Hは、意図された編集の近くに追加のサイレント変異又は良性変異をインストールすると、MMRを回避するヘテロ二重鎖基質を生成することによって編集効率を高め得ることを示す。各ターゲットのPAMシーケンス(NGG)に下線が引かれている。標的遺伝子のアミノ酸配列は、各DNAコドンの上にセンタリングされる。値は、n＝3の独立した生物学的反復実験の平均±SDを表す。図44Iは、異なる細胞タイプにおけるプライム編集強化の比較を示す。PE4及びPE5系は、MMR機能正常細胞(MMR＋)よりもMMR欠損細胞(MMR-)においてプライム編集をより大きく増強する。一塩基置換編集をコードする30個のpegRNAの同じセットが、HEK293T細胞及びHeLa細胞で試験された。K562細胞及びU2OS細胞は、HEK293T細胞及びHeLa細胞において試験された30個のpegRNAの直接のサブセットである10個のpegRNAで編集された。n＝3の独立した生物学的複製物のセットの全ての個々の値の平均±SDが示される。P値は、マン・ホイットニーのU検定を用いて計算された。図44Jは、HeLa、K562及びU2OS細胞におけるPE2、PE3、PE4及びPE5によるプライム編集を示す。バーは、n＝3の独立した生物学的反復の平均を表す。

プライム編集生成物の純度及びオフターゲティングに対するドミナントネガティブMLH1の効果を示す。図45Aは、編集をコードするpegRNAが新生3'DNAフラップ内で塩基変化をプログラムし、フラップ相互変換後にヘテロ二本鎖を生成することを示す。非編集pegRNAは、ゲノム標的部位に対して完全な相補性を有する3'DNAフラップを鋳型とする。図45Bは、単一塩基変異又は4つの非編集pegRNAをプログラムする4つの編集コードpegRNAを有するPE3又はPE5由来のインデルの頻度を示す。短い水平バーは、n＝3の独立した生物学的複製物のセットの全ての個々の値の平均を示す。図45Cは、単一塩基変異をプログラムする4つの編集をコードするpegRNA又は単一塩基変異をプログラムする4つの編集をコードするpegRNA又は4つの非編集pegRNAを有するPE3に対するPE5からのインデル頻度の比を示す。短い水平バーは、n＝3の独立した生物学的複製物のセットの全ての個々の値の平均を示す。図45Dは、HEK293T細胞における内因性DNMT1及びRNF2遺伝子座で12個の置換をコードするpegRNAを使用して、PE3及びPE5によって形成されたゲノム標的DNAにおける欠失の分布を示す。点線は、pegRNA及びsgRNA指向ニックの位置を示す。データは、n＝3の独立した生物学的反復の平均±SDを表す。図45Eは、HEK293T細胞におけるpegRNA及びsgRNA指向性ニックの外側の25-ntを超える配列を除去する欠失の頻度のPE5/PE3比を示す。各ドットは、組み合わされた7つの遺伝子座(n＝3の独立した生物学的複製の平均)において置換編集をプログラムする84の全pegRNAのうちの1つを表す。図45Fは、HEK293T細胞における意図しないpegRNA足場配列の取込み又は意図しないフラップの再結合を伴う編集結果の頻度のPE5/PE3比を示す。各ドットは、組み合わされた7つの遺伝子座(n＝3の独立した生物学的複製の平均)において置換編集をプログラムする84の全pegRNAのうちの1つを表す。図45Gは、HEK293T細胞におけるPE2及びPE4によるオフターゲットプライム編集を示す。バーは、n＝3の独立した生物学的反復の平均を表す。図45Hは、MMR欠損症の臨床診断に使用される17個の感受性マイクロサテライトリピート遺伝子座のハイスループットシーケンシング分析を示す。HAP1及びHeLa細胞はMMR機能があり、HCT116細胞はMMRが損なわれている。HAP1 ΔMSH2細胞は、MSH2ノックアウト後に60回の細胞分裂を受けた。HeLa細胞をPE2又はPE4成分で一過性にトランスフェクトし、配列決定の前に3日間インキュベートした。wt、野生型。n＝2の独立した生物学的反復からの全ての値が示される。

PE4及びPE5編集システムを有するPEmaxアーキテクチャが疾患関連遺伝子標的及び細胞型における編集を増強することを示す。図46Aは、PE2及びPEmaxエディタアーキテクチャの概略図を示す。bpNLSSV40、二部分SV40 NLS核局在化シグナル。MMLV RT、モロニーマウス白血病ウイルス逆転写酵素五変異体;コドンopt.、ヒトコドン最適化。図46Bは、操作されたpegRNA(epegRNA)が、プライム編集性能を改善する3'RNA構造モチーフを含有することを示す。図46Cは、PEmaxアーキテクチャ及びepegRNAと組み合わせたPE4及びPE5のプライム編集効率を示す。HeLa及びHEK293T細胞において、異なる遺伝子座を標的とする7つの一塩基置換編集が試験された。倍数変化は、試験した各編集からの倍数増加の平均を示す。n＝3の独立した生物学的複製物の全ての個々の値の平均±SDが示される。図46Dは、野生型HeLa及びHEK293T細胞における治療関連部位でのプライム編集を示す。HBB遺伝子座は、鎌状赤血球症(E6V)患者において一般的に変異しているE6コドンで編集されている。CDKL5の編集は、c.1412delA変異がCDKL5欠損症を引き起こす部位にある。epegRNAは、HBB、PRNP及びCDKL5遺伝子座を編集するために使用された。バーは、n＝3の独立した生物学的反復の平均を表す。図46Eは、対立遺伝子についてヘテロ接合性の患者に由来するiPSCにおけるA・T挿入及びサイレントG・CからA・Tの編集を介したCDKL5 c.1412delAの修正を示す。編集効率は、突然変異を有する編集可能な対立遺伝子からのc.1412delA修正を有するシーケンシングリードのパーセンテージを示す。インデル頻度は、任意のインデルを含有する全ての配列決定リードを反映する。バーは、n＝3の独立した生物学的反復の平均を表す。図46Fは、初代ヒトT細胞におけるプライム編集を示す。バーは、異なる健康なT細胞ドナーからのn＝3の独立した生物学的複製の平均を表す。

置換プライム編集結果のためのRepair-seqスクリーニングの設計及び結果を示す。図47Aは、HEK293T細胞においてSaPE2を使用して、レンチウイルス組み込みHBB配列内にG・CからC・G編集をインストールするためのStaphylococcus aureus(Sa)-pegRNAの最適化を示す。PBS、プライマー結合部位。データは、n＝3の独立した生物学的反復の平均を表す。図47Bは、プライム編集Repair-seqレンチウイルスベクター(pPC1000)の設計を示す。Repair-seqスクリーニングでは、CRISPRi sgRNA配列及びプライム編集結果を含有する453bp領域は、ペアエンドイルミナ配列決定のためにゲノムDNAから増幅される。CRISPRi sgRNAは、44-ntのIlluminaフォーワードリード(R1)で配列決定され、プライム編集部位(＋50及び-50のニック部位を包含する)は、263-ntのIlluminaリバースリード(R2)で配列決定される。黒い三角は、Sa-pegRNA及びSa-sgRNAによってプログラムされたSaPE2誘導ニックの位置を示す。全てのベクトル成分のサイズは縮尺通りである。図47Cは、SaPE2タンパク質(操作されたMMLV RTに融合されたSaCas9 N580A)を用いたPE2、PE3＋50及びPE3-50プライム編集構成の概略図を示す。図47Dは、dCas9-BFP-KRAB細胞を発現するHeLa細胞におけるレンチウイルス組み込みRepair-seq編集部位での意図されたG・CからC・G編集の検証を示す。バーは、n＝2の独立した生物学的反復の平均を表す。図47Eは、dCas9-BFP-KRABを発現するHeLa細胞におけるブラストサイジン選択あり及びなしのRepair-seq編集部位でのプライム編集を示す。SaPE2-P2A-BlastRプライム編集因子が全ての条件に使用された。バーはn＝2の平均を表す。図47Fは、Repair-seqスクリーニングで使用されるプールされたCRISPRi sgRNAライブラリーによって標的化された遺伝子の機能的アノテーションクラスを示す。図47G～図47Jは、MSH2、MSH6、MLH1及びPMS2のノックダウンが、全てのRepair-seqスクリーニングにおいて意図された＋6 G・CからC・Gプライム編集の頻度を増加させることを示す。ドットは、個々のCRISPRi sgRNAからのリードを表す。図47G～図47Jは、MSH2、MSH6、MLH1及びPMS2のノックダウンが、全てのRepair-seqスクリーニングにおいて意図された＋6 G・CからC・Gプライム編集の頻度を増加させることを示す。ドットは、個々のCRISPRi sgRNAからのリードを表す。図47G～図47Jは、MSH2、MSH6、MLH1及びPMS2のノックダウンが、全てのRepair-seqスクリーニングにおいて意図された＋6 G・CからC・Gプライム編集の頻度を増加させることを示す。ドットは、個々のCRISPRi sgRNAからのリードを表す。図47G～図47Jは、MSH2、MSH6、MLH1及びPMS2のノックダウンが、全てのRepair-seqスクリーニングにおいて意図された＋6 G・CからC・Gプライム編集の頻度を増加させることを示す。ドットは、個々のCRISPRi sgRNAからのリードを表す。

意図しないプライム編集結果の遺伝的モジュレーターを示す。図48Aは、HeLa CRISPRiスクリーニングにおけるPE3-50転帰の概要を示す。TP53BP1ノックダウンは、全ての意図しない編集結果の形成を劇的に減少させる。図48Bは、図41Hを補足する、K562 CRISPRiスクリーニングにおけるPE2結果の更なる詳細を示す。図48Cは、図41Gの情報を補足する、K562 CRISPRiスクリーニングにおけるPE3＋50の結果の更なる詳細を示す。図48D～図48Iは、示されたスクリーニング条件における示された結果カテゴリーの頻度に対する遺伝子ノックダウンの効果の比較を示す。プロットされた量は、1遺伝子当たり2つの最も極端なsgRNAについての非標的sgRNAからのlog2倍変化の平均であり、1条件当たりn＝2の独立した生物学的反復にわたって平均される。エラーバーは、複製によってまたがる値の範囲を示す。黒い点は、3つの非標的化sgRNAの20個のランダムなセットを表す。図48Dは、MSH2、MLH1及びPMS2ノックダウンが、K562 PE2スクリーンにおける意図された編集よりも、追加の編集のインストールにおいて大きな倍率変化をもたらすことを示す。図48Eは、K562におけるPE2スクリーニングにおける逆転写配列の意図しない連結を示し、HeLa細胞は、ファンコーニ貧血遺伝子(赤色)並びにRAD51ホモログのセット及び相同組換えを伴う他の遺伝子(青色)のノックダウンによって最も増加される。図48Fは、K562及びHeLa細胞におけるPE2スクリーニングにおける欠失を示し、RAD51ホモログ及び相同組換えを伴う他の遺伝子のセットによって最も増加される(青色)。図48Gは、MSH2、MLH1及びPMS2に加えて、HLTFノックダウンが、K562 PE3＋50スクリーンにおける意図された編集よりも、追加の編集のインストールにおいて大きな倍数変化を生じることを示す。図48Hは、HeLa及びK562 PE3＋50スクリーニングにおけるタンデム重複が、POLD及びRFCサブユニットのノックダウンによって最も減少することを示す。図48Iは、HeLa PE3＋50及びPE3-50スクリーニングにおける欠失が劇的に異なる遺伝的調節因子を有することを示し、異なるオーバーハング構成の処理における違いを強調している。

プライム編集Repair-seqスクリーニング結果の検証を示す。図49A～図49Bは、Sa-pegRNA、SaPE2逆転写後のそれらの鋳型3'DNAフラップ、及びゲノム標的配列のアラインメントを示す(上)。Repair-seqスクリーニングで使用されるSa-pegRNA(図49A)と比較して、記録された足場配列(図49B)を有するSa-pegRNAは、ゲノム標的配列との相同性が低下した伸長3'DNAフラップを鋳型とする。記録されたSa-pegRNAは、足場内の塩基対形成相互作用を保存する2つの塩基対変化を含有する。Sa-pegRNA足場の逆転写は、ゲノムに組み込まれる誤って伸長した3'フラップを生成し得る。縦線は塩基対合を示す。Xは、誤って伸長した逆転写された3'フラップとゲノム配列との間のミスマッチを示す。図49A～図49Bはまた、HeLa CRISPRi細胞におけるアレイ化PE2及びPE3＋50実験からのスクリーニング編集部位で観察された編集結果カテゴリーの頻度を示す(下)。siteRepair-seqスクリーニング(図49A)又は記録されたSa-pegRNA(図49B)で使用されるSa-pegRNAによるプライム編集は、ほぼ一致した足場からの意図しない編集のインストールの異なる頻度をもたらす。プロットされた量は、MSH2又は非標的CRISPRi sgRNAを含有する各細胞株について、n＝4の独立した生物学的複製物の平均±SDである。図49A～図49Bは、Sa-pegRNA、SaPE2逆転写後のそれらの鋳型3'DNAフラップ、及びゲノム標的配列のアラインメントを示す(上)。Repair-seqスクリーニングで使用されるSa-pegRNA(図49A)と比較して、記録された足場配列(図49B)を有するSa-pegRNAは、ゲノム標的配列との相同性が低下した伸長3'DNAフラップを鋳型とする。記録されたSa-pegRNAは、足場内の塩基対形成相互作用を保存する2つの塩基対変化を含有する。Sa-pegRNA足場の逆転写は、ゲノムに組み込まれる誤って伸長した3'フラップを生成し得る。縦線は塩基対合を示す。Xは、誤って伸長した逆転写された3'フラップとゲノム配列との間のミスマッチを示す。図49A～図49Bはまた、HeLa CRISPRi細胞におけるアレイ化PE2及びPE3＋50実験からのスクリーニング編集部位で観察された編集結果カテゴリーの頻度を示す(下)。siteRepair-seqスクリーニング(図49A)又は記録されたSa-pegRNA(図49B)で使用されるSa-pegRNAによるプライム編集は、ほぼ一致した足場からの意図しない編集のインストールの異なる頻度をもたらす。プロットされた量は、MSH2又は非標的CRISPRi sgRNAを含有する各細胞株について、n＝4の独立した生物学的複製物の平均±SDである。図49Cは、ヒトにおけるDNAミスマッチ修復の機構を示す。図49Dは、プライム編集ヘテロ二重鎖中間体のミスマッチ修復が、MutLαエンドヌクレアーゼ活性からの更なる非プログラム化ニックをインストールし得たことを示す。これらのプログラムされていないニックからの切除及び結果として生じる中間体のその後の修復は、MMR活性から観察されるより大きくより頻繁なインデル副産物に寄与してもよい。図49Eは、HEK293T細胞における非標的化siRNA対照と比較したsiRNA処理のノックダウン効率を示す。細胞にsiRNAがトランスフェクトされ、3日間インキュベートされ、PE2、pegRNA、及び同じsiRNAがトランスフェクトされ、次いで更に3日間インキュベートされた後、相対的RNA存在量がRT-qPCRによってアッセイされた。NT、非標的化。データは、n＝3の独立した生物学的反復の平均を表す。各ドットは、n＝3回の技術的反復の平均を表す。図49Fは、プライム編集因子成分及びsiRNAと同時トランスフェクトされたHEK293T細胞における編集を示す。細胞は、プライム編集因子によるトランスフェクションの前にsiRNAで前処理されなかった。バーは、n＝3の独立した生物学的反復の平均を表す。

プライム編集を増強するドミナントネガティブMMRタンパク質の開発及び特徴付けを示す。図50Aは、HEK293T細胞においてPE2とトランスで発現されるか又はPE2に直接融合されたMMRタンパク質又はドミナントネガティブバリアントからのプライム編集効率を示す。32aaリンカー、(SGGS)×2-XTEN-(SGGS)×2(配列番号125)(SGGSSGGSSGSETPGTSESATPES SGGSSGGS(配列番号125)又は構造的には、［SGGS］-［SGGS］-［SGSETPGTSESATPES］-［SGGS］-［SGGS］(配列番号125))。コドンopt、ヒトコドン最適化。同じグラフ内のデータは、同時に行われた実験に由来する。データは、n＝3の独立した生物学的反復の平均±SDを表す。図50Bは、HEK293T細胞におけるMLH1dnプラスミド及びPE2プラスミドトランスフェクション用量の滴定を示す。試験した最大プラスミド量は、200ngのPE2及び100ngのMLH1dnであった。データは、n＝3の独立した生物学的反復の平均±SDを表す。図50Cは、MLH1に二対立遺伝子欠失を含有するMMR欠損HCT116細胞におけるMLH1dn共発現によるプライム編集を示す。バーは3回の反復の平均を表す。図50Dは、ヒトHEK293T細胞におけるヒトMLH1dn(ヒトコドン最適化)又はマウスMLH1dn(マウスコドン最適化)とのプライム編集の比較を示す。バーは、n＝3の独立した生物学的反復の平均を表す。図50Eは、マウスN2A細胞におけるヒトMLH1dn(ヒトコドン最適化)又はマウスMLH1dn(マウスコドン最適化)とのプライム編集の比較を示す。バーは、n＝3反復の平均を表す。図50Fは、クローンHeLa細胞株におけるMLH1ノックアウトが、クローン野生型HeLa細胞におけるMLH1共発現よりも大幅にプライム編集効率を高めることを示す。△、ノックアウト。バーは、n＝3又は4の独立した生物学的反復の平均を表す。図50Gは、HEK293T細胞におけるPE3b及びPE5b(編集された配列に特異的な相補鎖ニック)によるFANCF遺伝子座での編集を示す。MLH1dn共発現を有するPE5b、PE3b編集システム。バーは、n＝3の独立した生物学的反復の平均を表す。図50Hは、HEK293T細胞における相補鎖ニックによるHEK2遺伝子座での編集を示す。「None」はニックがないことを示し、これはPE2又はPE4編集戦略を示す。バーは、n＝3の独立した生物学的反復の平均を表す。

多様なプライム編集クラス及び細胞型にわたるPE4及びPE5の特徴付けを示す。図51Aは、HEK293T細胞における7つの内因性部位にわたる84個の一塩基置換プライム編集についてのPE2、PE3、PE4及びPE5の比較を示す。バーは、n＝3の独立した生物学的反復の平均を表す)。図51Bは、HEK293T細胞における7つの内因性部位にわたる84の一塩基置換編集についてのPE2に対する編集効率のPE4増強の概要を提供する。PE4/PE2倍数改善は、PAM編集のための高い基本編集効率又はG・CからC・G編集の高い表現(このカテゴリーでは15個のうち5個)のために、PAM編集についてはより低くなってもよい。データは、n＝3の独立した生物学的反復の平均±SDを表す。図51Cは、HEK293T細胞におけるプライム編集標的プロトスペーサのPAM(＋5 G塩基及び＋6 G塩基)を変化させる一塩基置換プライム編集の効率を示す。組み合わせた7つの内因性部位にわたる4つのG・CからA・T、5つのG・CからC・G、及び6つのG・CからT・A PAM編集が示される。n＝3の独立した生物学的反復の全ての個々の値の平均が示される。図51Dは、HEK293T細胞におけるRNF2遺伝子座でのG・CからC・G編集に対するMMR遺伝子のsiRNAノックダウンの効果を示す。バーは、n＝3の独立した生物学的反復の平均を表す。図51Eは、HAP1細胞におけるRNF2遺伝子座でのG・CからC・G編集に対するMMR遺伝子ノックアウトの効果を示す。Δ、遺伝子ノックアウト。バーは、n＝3の独立した生物学的反復の平均を表す。図51Fは、HeLa CRISPRi細胞におけるCRISPRiノックダウンによる組み込みスクリーン編集部位でのプライム編集を示す。PE2は、SaPE2タンパク質及びSa-pegRNAによる編集を示す。PE3＋50は、＋50相補鎖ニックをプログラムするSaPE2タンパク質、Sa-pegRNA及びSa-sgRNAによる編集を示す。バーは、n＝5の独立した生物学的反復の平均を表す。図51Gは、HEK293T細胞における84回の一塩基置換編集について、PE3よりも編集効率が向上したPE5の概要を提供する。n＝3の独立した生物学的複製物の全ての個々の値の総合平均±SDが示される。図51Hは、HEK293T細胞におけるある範囲の挿入及び欠失プライム編集長にわたるPE2に対する編集効率のPE4増強を示す。組み合わせた3つの内因性遺伝子座における合計33の異なるプライム編集が示されている。n＝3の独立した生物学的反復の全ての個々の値の平均が示される。図51Iは、PE5が、HEK293T細胞における小さな挿入及び欠失プライム編集にわたって、PE3と比較して編集効率を改善し、インデル副産物を減少させることを示す。図51Jは、組み合わせた3つの内因性遺伝子座にわたる33の異なる挿入及び欠失プライム編集でのPE2及びPE4編集効率を示す。バーは、n＝3の独立した生物学的反復の全ての個々の値の平均を表す。

PE4及びPE5系の特徴付け、並びに更なるサイレント変異によるプライム編集効率の改善を示す。図52Aは、HEK293T細胞におけるPE2及びPE4による連続塩基の置換を示す。上の配列は、元の編集されていないゲノム配列を示す。数字は、PE2ニック部位に対する編集されたヌクレオチドの位置を示す。SpCas9 PAM配列(NGG)内のヌクレオチドに下線が引かれる。意図された編集産物の配列が以下に示され、編集されたヌクレオチドが赤色でマークされる。バーは、n＝3の独立した生物学的反復の平均を表す。図52Bは、更なるサイレント変異のインストールが、MMRを回避することによってプライム編集効率を高め得ることを示す。編集頻度のPE4/PE2倍率変化は、MMR活性が示されたプライム編集を妨げる程度を反映する。示されたコード変異を作製する編集されたヌクレオチドは赤色でマークされ、サイレント変異を作製する編集されたヌクレオチドは緑色でマークされる。データは、n＝3の独立した生物学的反復実験の平均±SDを表す。図52Cは、PE2、PE3、PE4及びPE5を有するHeLa細胞における7つの内因性部位にわたる22個の一塩基置換プライム編集のインストールを示す。バーは、n＝3の独立した生物学的反復の平均を表す。

プライム編集生成物の純度及びオフターゲティングに対するドミナントネガティブMLH1の効果を示す。図53Aは、MLH1dnあり及びなしで、pegRNA、ニッキングsgRNA及びPE2酵素、RT障害PE2(PE2-dRT)又はニッカーゼCas9(SpCas9 H840A)で処理したHEK293T細胞におけるインデルの頻度を示す。非編集pegRNAは、ゲノム標的と完全な相同性を有する3'DNAフラップをコードする。バーは、n＝3の独立した生物学的反復の平均を表す。図53Bは、HEK293T細胞における内因性遺伝子座でのPE3及びPE5からの欠失結果の分布を示す。各示された遺伝子座で、一塩基置換をプログラムする12個の異なるpegRNAが試験された。点線は、pegRNA及びsgRNA指向ニックの位置を示す。データは、n＝3の独立した生物学的反復の平均±SDを表す。図53Cは、HEK293T細胞における、編集をコードする及び非編集pegRNAを有するPE3及びPE5からの欠失結果の分布を示す。非編集pegRNAは、ゲノム標的配列に対して完全な相補性を有する3'DNAフラップを鋳型とする。データは、n＝3の独立した生物学的反復の平均±SDを表す。図53Dは、HEK293T細胞における意図しないpegRNA足場配列の取込み又は意図しないフラップの再結合を伴う全てのプライム編集結果の頻度を示す。異なる一塩基置換をそれぞれプログラムする12個のpegRNAが、示された7つの遺伝子座のそれぞれで試験された。各ドットは、示された遺伝子座における個々のpegRNAを表す(n＝3の独立した生物学的複製の平均)。図53Eは、HEK293T細胞におけるPE2及びPE4によるオフターゲットプライム編集を示す(n＝3の独立した生物学的複製の平均)。図53Fは、示された細胞タイプ及び処理におけるマイクロサテライトリピート長の分布及び累積分布を示す。HAP1及びHeLa細胞はMMR機能があり、HCT116細胞はMMRが損なわれている。HAP1 ΔMSH2細胞は、MSH2のノックアウト後に60回の細胞分裂を受けた。HeLa細胞は、PE2又はPE4成分で一過性にトランスフェクトされ、その後3日間成長させた後、配列決定された。wt、野生型。n＝2の独立した生物学的反復からの全ての値が示される。図53Gは、PE2又はPE4成分でトランスフェクトしたHeLa細胞におけるオンターゲット遺伝子座でのプライム編集を示す。バーは、n＝2の独立した生物学的反復の平均を表す。これらのPE2及びPE4処理HeLa細胞から採取したゲノムDNAからマイクロサテライト長がアッセイされた。

PE4及びPE5編集システムを用いたPEmaxアーキテクチャの使用が、疾患関連遺伝子標的及び細胞型における編集を増強することを示す。図54Aは、PE2及びPEmaxエディタアーキテクチャの概略図を示す。bpNLS^SV40、二部分SV40 NLS。MMLV RT、モロニーマウス白血病ウイルス逆転写酵素五変異体。GSコドン、Genscriptヒトコドン最適化。図54Bは、プライム編集性能を改善する3'RNA構造モチーフを含有する操作されたpegRNA(epegRNA)を示す。図54Cは、PEmaxアーキテクチャ及びepegRNAと組み合わせたPE4及びPE5のプライム編集効率を示す。HeLa及びHEK293T細胞において、異なる遺伝子座を標的とする7つの一塩基置換編集が試験された。倍数変化は、試験した各編集からの倍数増加の平均を示す。n＝3の独立した生物学的複製物の全ての個々の値の平均±SDが示される。図54Dは、野生型HeLa及びHEK293T細胞における治療関連部位でのプライム編集を示す。HBB遺伝子座は、鎌状赤血球症(E6V)患者において一般的に変異しているE6コドンで編集されている。CDKL5の編集は、c.1412delA変異がCDKL5欠損症を引き起こす部位にある。epegRNAは、HBB、PRNP及びCDKL5遺伝子座を編集するために使用された。バーは、n＝3の独立した生物学的反復の平均を表す。図54Eは、対立遺伝子についてヘテロ接合性の患者に由来するiPSCにおけるA・T挿入及びサイレントG・CからA・Tの編集を介したCDKL5 c.1412delAの修正を示す。編集効率は、突然変異を有する編集可能な対立遺伝子からのc.1412delA修正を有するシーケンシングリードのパーセンテージを示す。インデル頻度は、任意のインデルを含有する全ての配列決定リードを反映する。バーは、n＝3の独立した生物学的反復の平均を表す。図54Fは、初代T細胞におけるプライム編集を示す。バーは、異なる健康なT細胞ドナーからのn＝3の独立した生物学的複製の平均を表す。

PEmaxの発達並びに初代細胞型へのPE4及びPE5の適用を示す。図55A～図55Bは、HeLa細胞における編集効率を最大化するためのプライム編集因子バリアントのスクリーニングを示す。全てのプライム編集因子アーキテクチャは、標的プロトスペーサにおける相補的DNA鎖のニッキングを防止するためのCas9 H840A変異を有する。＊NLSSV40は、PKKKRKV(配列番号132)NLSSV40コンセンサス配列の外側に1-aa欠失を含有する。n＝3の独立した生物学的反復の全ての個々の値が示される。 PEmaxの発達並びに初代細胞型へのPE4及びPE5の適用を示す。図55A～図55Bは、HeLa細胞における編集効率を最大化するためのプライム編集因子バリアントのスクリーニングを示す。全てのプライム編集因子アーキテクチャは、標的プロトスペーサにおける相補的DNA鎖のニッキングを防止するためのCas9 H840A変異を有する。＊NLSSV40は、PKKKRKV(配列番号132)NLSSV40コンセンサス配列の外側に1-aa欠失を含有する。n＝3の独立した生物学的反復の全ての個々の値が示される。

PEmaxの発達並びに初代細胞型へのPE4及びPE5の適用を示す。図56Aは、HeLa細胞におけるPE3系での編集効率を改善するためのプライム編集因子バリアントのスクリーンを示す。全てのプライム編集因子アーキテクチャは、標的プロトスペーサにおける相補的DNA鎖のニッキングを防止するためのSpCas9 H840A変異を有する。NLSSV40は、二部分SV40 NLSを示す。＊NLSSV40は、PKKKRKV(配列番号132)NLSSV40コンセンサス配列の外側に1-aa欠失を含有する。n＝3の独立した生物学的反復の全ての個々の値が示される。図56Bは、元のPE2エディタ(Anzalone et al.,2019)、PE2＊(Liu et al.,2021)、CMP-PE-V1(Park et al.,2021)、及びこの研究で開発されたプライム編集因子バリアント(PEmax、CMP-PEmax)のアーキテクチャを示す。HN1、HMGN1;H1G、ヒストンH1中央球状ドメイン;コドンopt、ヒトコドン最適化。図56Cは、PEmaxが、HeLa細胞におけるPE3系を有する他のプライム編集因子アーキテクチャよりも優れていることを示す。バーは、n＝3の独立した生物学的反復の平均を表す。図56Dは、HeLa細胞におけるPE3系を有するPE2と比較した、プライム編集因子アーキテクチャの編集効率の倍率変化を示す。n＝3の独立した生物学的複製物の全ての個々の値の平均±SDが示される。図56Eは、HeLa及びHEK293T細胞におけるPE4、PE4max(PEmaxアーキテクチャを有するPE4編集システム)、PE5及びPE5max(PEmaxアーキテクチャを有するPE5編集システム)からの意図される編集及びインデル頻度を示す。異なる内因性遺伝子座を標的とする7つの置換プライム編集が各条件について試験された。n＝3の独立した生物学的複製物の全ての個々の値の平均±SDが示される。図56Fは、疾患対立遺伝子についてヘテロ接合性である患者に由来するiPSCにおけるA・T挿入及びG・CからA・Tの編集を介したCDKL5 c.1412delAの修正を示す。編集効率は、突然変異を有する編集可能な対立遺伝子からのc.1412delA修正を有するシーケンシングリードのパーセンテージを示す。インデル頻度は、c.1412delA対立遺伝子又は野生型配列にマッピングしない任意のインデルを含含有する全ての配列決定リードを反映する。1μgのPE2 mRNAが、示されている全ての条件で使用された。バーは、n＝3の独立した生物学的反復の平均を表す。図56Gは、初代T細胞におけるプライム編集を示す。バーは、異なるT細胞ドナーからのn＝3の独立した反復の平均を表す。

記録されたpegRNA足場が足場配列取込みからの意図しない結果を減少させることを示す。図57Aは、プライム編集Repair-seq標的部位と、(上)Repair-seqスクリーニングに使用されるSa-pegRNA、又は(下)記録された足場配列を有するSa-pegRNAによって鋳型化されたSaPE2生成3'DNAフラップとのアラインメントを示す。3'フラップ配列は、上に示されるSa-pegRNAの鋳型領域(RT鋳型又は足場)と整列される。赤色は、両方のSa-pegRNAによってプログラムされた意図された＋6 G・CからC・Gへの編集の位置を示す。青色は、ゲノム標的配列が、Sa-pegRNA足場によって鋳型される3'フラップ配列と整列しない位置を示す。逆転写されたSa-pegRNA足場配列を含有する3'フラップの組み込みからの意図しない編集は、これらの青色表示ヌクレオチドで起こってもよい。図57Bは、HeLa CRISPRi細胞におけるPE2及びPE3＋50実験で観察された編集結果カテゴリーの要約を示す。スクリーニングpegRNAは、プライム編集Repair-seqスクリーニングに使用されるSa-pegRNAを示す。記録された足場(図54Aに示すシーケンス)を有するSa-pegRNAは、Repair-seq編集部位との配列相同性を回避する。プロットされた量は、n＝4の独立した生物学的反復にわたって平均化された、示された各標的(MSH2及び非標的化)に対する1つのCRISPRi sgRNAの平均±SDである。

HeLa細胞におけるPE3max(PEmaxタンパク質を含むPE3編集システム)及びPE3(PE2タンパク質を含むPE3編集システム)の比較を示す(n＝3の独立した生物学的複製の平均)。

MLH1dnによるPE改善がプライム編集サイズに依存することを示す。MMRは、約13bp以下の長さの置換並びに挿入及び欠失エラーを最も効率的に修復する。

PE4及びepegRNAが単一のpegRNAインテグラントによるプライム編集を可能にすることを示す。

PE5がAPOE4マウスアストロサイトモデルにおける保護的クライストチャーチ対立遺伝子のインストールを改善することを示す。

p53の阻害がPE3プライム編集の効率及び精度を高めることを示す。これは、ニッキングsgRNAが、pegRNAに向けられたニックの上流(-側)にニックを入れる場合に特に当てはまる。グラフ上の各点は、Repair-seqスクリーニングにおける個々のCRISPRi遺伝子ノックダウンを表す。軸は、対照と比較したlog2倍数変化を示す。TP53BP1(p53遺伝子)のノックダウンは、意図された編集(x軸)を増加させ、3つのタイプの意図しない編集(y軸)を減少させ、これは、意図しない位置での逆転写配列の連結(図62A)、意図しない欠失(図62B)及び意図しないタンデム重複(図62C)を包含する。 p53の阻害がPE3プライム編集の効率及び精度を高めることを示す。これは、ニッキングsgRNAが、pegRNAに向けられたニックの上流(-側)にニックを入れる場合に特に当てはまる。グラフ上の各点は、Repair-seqスクリーニングにおける個々のCRISPRi遺伝子ノックダウンを表す。軸は、対照と比較したlog2倍数変化を示す。TP53BP1(p53遺伝子)のノックダウンは、意図された編集(x軸)を増加させ、3つのタイプの意図しない編集(y軸)を減少させ、これは、意図しない位置での逆転写配列の連結(図62A)、意図しない欠失(図62B)及び意図しないタンデム重複(図62C)を包含する。 p53の阻害がPE3プライム編集の効率及び精度を高めることを示す。これは、ニッキングsgRNAが、pegRNAに向けられたニックの上流(-側)にニックを入れる場合に特に当てはまる。グラフ上の各点は、Repair-seqスクリーニングにおける個々のCRISPRi遺伝子ノックダウンを表す。軸は、対照と比較したlog2倍数変化を示す。TP53BP1(p53遺伝子)のノックダウンは、意図された編集(x軸)を増加させ、3つのタイプの意図しない編集(y軸)を減少させ、これは、意図しない位置での逆転写配列の連結(図62A)、意図しない欠失(図62B)及び意図しないタンデム重複(図62C)を包含する。

p53阻害剤(i53)がPE3プライム編集の効率及び精度を高め得ることを示す。これは、ニッキングsgRNAが、pegRNAに向けられたニックの上流(-側)にニックを入れる場合に特に当てはまる。EMX1部位のみが「-」側にニックを使用する。図64は、プライム編集の結果に影響を及ぼすミスマッチ修復遺伝子を包含する細胞遺伝子を明らかにするためのCRISPRiスクリーニングの使用、プライム編集の効率及び精度を高めるためのミスマッチ修復(MMR)経路の遺伝子操作されたMLH1の使用、及び本明細書に記載される改良されたプライム編集システム(例として、PE4及びPE5システム、並びにPEmaxエディタ)が多くの細胞型において同じ有益な効果を示すことが示されたという実証を包含する、本開示の様々な側面を表す。

CRISPRiスクリーニングがプライムゲノム編集の細胞決定因子を明らかにすること、操作されたMLH1タンパク質がプライム編集効率及び精度を高めること、並びに改良されたプライム編集システムが編集及び細胞型にわたって特徴付けられたことを示す。

PE2タンパク質の最適化を示す概略図を提供する。

ある範囲の遺伝子標的(HEK3、EMX1、RNF2、FANCF、FUNX1、DNMT1、VEGFA、HEK4、PRNP、APOE、CXCR4、HEK3)でのHEK293T細胞(低プラスミド用量)におけるPE2及び様々な他のPE構築物を使用した意図した編集の頻度の倍率変化を示す。

ある範囲の遺伝子標的(HEK3、FANCF、RUNX1、VEGFA)でのHeLa細胞におけるPE3及び様々なプライム編集因子構築物を使用した意図した編集の頻度の倍率変化を示す。

様々なPE構築物を使用したHEK293T編集対HeLa編集におけるプライム編集の比較を示す。

HeLa細胞におけるPE3のNLSアーキテクチャ最適化を示す。

配列番号99に対応する最終PEmax構築物を示す概略図を提供する。

PEmaxが意図された編集に加えてインデルを増加させることを示す。

定義
他に定義されない限り、本明細書で使用される全ての技術用語及び科学用語は、本発明が属する技術分野の当業者によって一般的に理解される意味を有する。以下の参考文献は、当業者に、本発明で使用される多くの用語の一般的な定義を提供する:Singleton et al.,Dictionary of Microbiology and Molecular Biology(2nd ed.1994);The Cambridge Dictionary of Science and Technology(Walker ed.,1988);The Glossary of Genetics,5th Ed.,R.Rieger et al.(eds.),Springer Verlag(1991);and Hale&Marham,The Harper Collins Dictionary of Biology(1991)。本明細書で使用される場合、以下の用語は、特に指定されない限り、それらに帰する意味を有する。

Cas9
用語「Cas9」又は「Cas9ヌクレアーゼ」は、Cas9ドメイン又はそのフラグメントを含む、RNAにガイドされるヌクレアーゼ(例として、Cas9の活性若しくは不活性なDNA切断ドメイン及び/又はCas9のgRNA結合ドメインを含むタンパク質)を指す。「Cas9ドメイン」は、本明細書に使用されるとき、Cas9の活性若しくは不活性な切断ドメイン及び/又はCas9のgRNA結合ドメインを含むタンパク質フラグメントである。「Cas9タンパク質」は、全長Cas9タンパク質である。Cas9ヌクレアーゼはまた、ときにcasn1ヌクレアーゼ又はCRISPR(クラスター化して規則的な配置の短い回文配列反復(Clustered Regularly Interspaced Short Palindromic Repeat))関連ヌクレアーゼとしても言及される。CRISPRは、可動遺伝因子(ウイルス、転移因子、及び接合性プラスミド)に対して保護を提供する適応免疫系である。CRISPRクラスターは、スペーサ、先行する可動因子に相補的な配列、及び標的化侵入核酸を含有する。CRISPRクラスターは転写され、プロセスを受けて(processed)CRISPR RNA(crRNA)になる。II型CRISPR系において、pre-crRNAの正しいプロセシングは、transでコードされた低分子(small)RNA(tracrRNA)、内因性リボヌクレアーゼ3(rnc)、及びCas9ドメインを要求する。tracrRNAは、pre-crRNAの、リボヌクレアーゼ3に補助された(-aided)プロセシングのためのガイドとして働く。続いて、Cas9/crRNA/tracrRNAは、スペーサに相補的な線状又は環状のdsDNA標的をエンドヌクレアーゼ的に切断する。crRNAに相補的ではない標的鎖は、最初にエンドヌクレアーゼ的に切られ、次いで3'-5'エキソヌクレアーゼ的に切り取られる。本来、DNAの結合及び切断は、典型的には、タンパク質及び両RNAを要求する。しかしながら、crRNA及びtracrRNA両方の側面を単一のRNA種に組み込むようにして、シングルガイドRNA(「sgRNA」又は単純に「gNRA」)が操作され得る。例として、Jinek M.,Chylinski K.,Fonfara I.,Hauer M.,Doudna J.A.,Charpentier E.Science 337:816-821(2012)を参照(この内容全体は参照により本明細書に組み込まれる)。Cas9は、CRISPR反復配列(PAM又はプロトスペーサ隣接モチーフ)中の短いモチーフを認識することで、自己・対・非自己を区別するのに役立つ。Cas9ヌクレアーゼ配列及び構造は当業者に周知である(例として、「Complete genome sequence of an M1 strain of Streptococcus pyogenes.」Ferretti et al.,J.J.,McShan W.M.,Ajdic D.J.,Savic D.J.,Savic G.,Lyon K.,Primeaux C.,Sezate S.,Suvorov A.N.,Kenton S.,Lai H.S.,Lin S.P.,Qian Y.,Jia H.G.,Najar F.Z.,Ren Q.,Zhu H.,Song L.,White J.,Yuan X.,Clifton S.W.,Roe B.A.,McLaughlin R.E.,Proc.Natl.Acad.Sci.U.S.A.98:4658-4663(2001);「CRISPR RNA maturation by trans-encoded small RNA and host factor RNase III.」Deltcheva E.,Chylinski K.,Sharma C.M.,Gonzales K.,Chao Y.,Pirzada Z.A.,Eckert M.R.,Vogel J.,Charpentier E.,Nature 471:602-607(2011);及び「A programmable dual-RNA-guided DNA endonuclease in adaptive bacterial immunity.」Jinek M.,Chylinski K.,Fonfara I.,Hauer M.,Doudna J.A.,Charpentier E.Science 337:816-821(2012)を参照(これら各々の内容全体は参照により本明細書に組み込まれる))。Cas9オルソログは、これらに限定されないが、S.pyogenes及びS.thermophilusを包含する様々な種において記載されている。追加の好適なCas9ヌクレアーゼ及び配列は、本開示に基づき当業者に明らかであろう。またかかるCas9ヌクレアーゼ及び配列は、Chylinski,Rhun,and Charpentier,「The tracrRNA and Cas9 families of type II CRISPR-Cas immunity systems」(2013)RNA Biology 10:5,726-737(この内容全体は参照により本明細書に組み込まれる)に開示された生物及び遺伝子座からのCas9配列を包含する。いくつかの態様において、Cas9ヌクレアーゼは、DNA切断ドメインを部分的に損なうか又は不活性化させる1以上の突然変異を含む。

ヌクレアーゼが不活性化されたCas9ドメインは、互換的に「dCas9」タンパク質(ヌクレアーゼが「不活性型」のCas9を表す)と呼ばれてもよい。不活性なDNA切断ドメインを有するCas9ドメイン(又はそのフラグメント)を生成するための方法は知られている(例として、Jinek et al.,Science.337:816-821(2012);Qi et al.,「Repurposing CRISPR as an RNA-Guided Platform for Sequence-Specific Control of Gene Expression」(2013)Cell.28;152(5):1173-83を参照(これら各々の内容全体は参照により本明細書に組み込まれる))。例えば、Cas9のDNA切断ドメインは、2つのサブドメイン、HNHヌクレアーゼサブドメイン及びRuvC1サブドメインを包含することが知られている。HNHサブドメインはgRNAに相補的な鎖を切断するのに対し、RuvC1サブドメインは非相補鎖を切断する。これらのサブドメイン内の突然変異は、Cas9のヌクレアーゼ活性をサイレンシングさせ(silence)得る。例えば、突然変異D10A及びH840Aは、S.pyogenes Cas9のヌクレアーゼ活性を完全に不活性化する(Jinek et al.,Science.337:816-821(2012);Qi et al.,Cell.28;152(5):1173-83(2013))。いくつかの態様において、Cas9のフラグメントを含むタンパク質が提供される。例えば、いくつかの態様において、タンパク質は、2つのCas9ドメイン:(1)Cas9のgRNA結合ドメイン;又は(2)Cas9のDNA切断ドメインのうち一方を含む。いくつかの態様において、Cas9を含むタンパク質又はそのフラグメントは、「Cas9バリアント」と呼ばれる。Cas9バリアントは、Cas9又はそのフラグメントとの相同性を共有する。例えば、Cas9バリアントは、野生型Cas9(例として、配列番号2のSpCas9)と、少なくとも約70％同一、少なくとも約80％同一、少なくとも約90％同一、少なくとも約95％同一、少なくとも約96％同一、少なくとも約97％同一、少なくとも約98％同一、少なくとも約99％同一、少なくとも約99.5％同一、少なくとも約99.8％同一、又は少なくとも約99.9％同一である。いくつかの態様において、Cas9バリアントは、野生型Cas9(例として、配列番号2のSpCas9)と比較して、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、21、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、又はそれ以上のアミノ酸変化を有していてもよい。いくつかの態様において、Cas9バリアントは、そのフラグメントが、野生型Cas9(例として、配列番号2のSpCas9)の対応するフラグメントと、少なくとも約70％同一、少なくとも約80％同一、少なくとも約90％同一、少なくとも約95％同一、少なくとも約96％同一、少なくとも約97％同一、少なくとも約98％同一、少なくとも約99％同一、少なくとも約99.5％同一、又は少なくとも約99.9％同一となるように、配列番号2 Cas9のフラグメント(例として、gRNA結合ドメイン又はDNA切断ドメイン)を含む。いくつかの態様において、フラグメントは、対応する野生型Cas9(例として、配列番号2のSpCas9)のアミノ酸の長さの、少なくとも30％、少なくとも35％、少なくとも40％、少なくとも45％、少なくとも50％、少なくとも55％、少なくとも60％、少なくとも65％、少なくとも70％、少なくとも75％、少なくとも80％、少なくとも85％、少なくとも90％、少なくとも95％同一の、少なくとも96％、少なくとも97％、少なくとも98％、少なくとも99％、又は少なくとも99.5％である。

循環置換体
本明細書に使用されるとき、用語「循環置換体(circular permutant)」は、タンパク質のアミノ酸配列中に現れるアミノ酸の順序の変化を伴うタンパク質の構造上の立体配置における変化である循環置換(circular permutation)を含むタンパク質又はポリペプチド(例として、Cas9)を指す。換言すれば、循環置換体は、野生型対応物と比較してN末端及びC末端が変更されたタンパク質であり、例として、野生型タンパク質のC末端半分が新しいN末端半分になっている。循環置換(又はCP)は本質的に、そのN末端及びC末端が接続され、しばしばペプチドリンカーをもつ、タンパク質1次配列の形態上の再配置であるが、同時にその配列を異なる位置にて分裂させることで、隣接していた新しいN末端及びC末端を作成する。その結果は、接続が異なるが、しばしば同じか全体的には同様の3次元の(3D)形状を有し得るタンパク質構造であって、おそらく、改善又は変更された特徴(タンパク分解への低減された感受性、改善された触媒活性、変更された基質結合若しくはリガンド結合、及び/又は改善された熱安定性を包含する)を包含する。循環置換タンパク質は天然に存在し得る(例として、コンカナバリンA及びレクチン)。加えて、循環置換は、翻訳後修飾の結果として生じ得るか、又は組換え技法を使用して操作されてもよい。

循環置換されたCas9
用語「循環置換されたCas9」は、循環置換体として生じるものであり、これによってそのN末端及びC末端が局所的に再配置された、いずれのCas9タンパク質又はそのバリアントも指す。循環置換されたかかるCas9タンパク質(「CP-Cas9」)、又はそれらのバリアントは、ガイドRNA(gRNA)と複合体化されたときのDNAへの結合能を保持している。Oakes et al.,「Protein Engineering of Cas9 for enhanced function,」Methods Enzymol,2014,546:491-511及びOakes et al.,「CRISPR-Cas9 Circular Permutants as Programmable Scaffolds for Genome Modification,」Cell,January 10,2019,176:254-267を参照(これらの各々は参照により本明細書に組み込まれる)。本開示は、これまでに知られているいずれのCP-Cas9も企図するか、又は新しいCP-Cas9を、その結果得られた循環置換タンパク質がガイドRNA(gRNA)と複合体化されたときのDNAへの結合能を保持している限り、使用する。例示のCP-Cas9タンパク質は、配列番号54～63である。

CRISPR
CRISPRは、原核生物に侵入したウイルスによる先行する感染のスニペットを表す細菌及び古細菌におけるDNA配列(すなわちCRISPRクラスター)のファミリーである。DNAのスニペットは、類似のウイルスによる続く攻撃からのDNAを検出及び破壊するために原核細胞によって用いられ、CRISPR関連タンパク質(Cas9及びそのホモログを包含する)及びCRISPR関連RNAのアレイと併せて、有効に原核生物免疫防御システムを成す。天然では、CRISPRクラスターはCRISPR RNA(crRNA)へと転写及びプロセシングされる。ある種のタイプのCRISPRシステム(例として、II型CRISPRシステム)では、プレcrRNAの正しいプロセシングは、transでコードされた低分子RNA(tracrRNA)、内因性リボヌクレアーゼ3(rnc)、及びCas9タンパク質を要求する。tracrRNAは、pre-crRNAの、リボヌクレアーゼ3に補助された(-aided)プロセシングのためのガイドとして働く。続いてCas9/crRNA/tracrRNAはRNAに対して相補的な直線状又は環状dsDNA標的をエンド的に切断する。具体的には、crRNAに対して相補的でない標的鎖が第1にエンド的にカットされ、次いで3'-5'エキソ的にトリミングされる。本来、DNAの結合及び切断は、典型的には、タンパク質及び両RNAを要求する。しかしながら、シングルガイドRNA(「sgRNA」又は単純に「gNRA」)が、crRNA及びtracrRNA両方の側面を単一のRNA種のガイドRNAに組み込むようにして操作され得る。例として、Jinek M.,Chylinski K.,Fonfara I.,Hauer M.,Doudna J.A.,Charpentier E.Science 337:816-821(2012)を参照。これの内容全体は参照によってここに組み込まれる。Cas9は、CRISPR反復配列(PAM又はプロトスペーサ隣接モチーフ)中の短いモチーフを認識することで、自己・対・非自己を区別するのに役立つ。CRISPR生物学並びにCas9ヌクレアーゼ配列及び構造は当業者には周知である(例として、「Complete genome sequence of an M1 strain of Streptococcus pyogenes.」Ferretti et al.,J.J.,McShan W.M.,Ajdic D.J.,Savic D.J.,Savic G.,Lyon K.,Primeaux C.,Sezate S.,Suvorov A.N.,Kenton S.,Lai H.S.,Lin S.P.,Qian Y.,Jia H.G.,Najar F.Z.,Ren Q.,Zhu H.,Song L.,White J.,Yuan X.,Clifton S.W.,Roe B.A.,McLaughlin R.E.,Proc.Natl.Acad.Sci.U.S.A.98:4658-4663(2001);「CRISPR RNA maturation by trans-encoded small RNA and host factor RNase III.」Deltcheva E.,Chylinski K.,Sharma C.M.,Gonzales K.,Chao Y.,Pirzada Z.A.,Eckert M.R.,Vogel J.,Charpentier E.,Nature 471:602-607(2011);及び「A programmable dual-RNA-guided DNA endonuclease in adaptive bacterial immunity.」Jinek M.,Chylinski K.,Fonfara I.,Hauer M.,Doudna J.A.,Charpentier E.Science 337:816-821(2012)を参照。これらの夫々の内容全体は参照によって本明細書に組み込まれる)。Cas9オルソログは、これらに限定されないが、S.pyogenes及びS.thermophilusを包含する様々な種において記載されている。追加の好適なCas9ヌクレアーゼ及び配列は、本開示に基づき当業者に明らかであろう。またかかるCas9ヌクレアーゼ及び配列は、Chylinski,Rhun,and Charpentier,「The tracrRNA and Cas9 families of type II CRISPR-Cas immunity systems」(2013)RNA Biology 10:5,726-737(この内容全体は参照により本明細書に組み込まれる)に開示された生物及び遺伝子座からのCas9配列を包含する。

ある種のタイプのCRISPRシステム(例として、II型CRISPRシステム)では、プレcrRNAの正しいプロセシングは、transでコードされた低分子RNA(tracrRNA)、内因性リボヌクレアーゼ3(rnc)、及びCas9タンパク質を要求する。tracrRNAは、pre-crRNAの、リボヌクレアーゼ3に補助された(-aided)プロセシングのためのガイドとして働く。続いてCas9/crRNA/tracrRNAはRNAに対して相補的な直線状又は環状核酸標的をエンド的に切断する。具体的には、crRNAに対して相補的でない標的鎖が第1にエンド的にカットされ、次いで3'-5'エキソ的にトリミングされる。本来、DNAの結合及び切断は、典型的には、タンパク質及び両RNAを要求する。しかしながら、シングルガイドRNA(「sgRNA」又は単純に「gRNA」)が、crRNA及びtracrRNA両方の態様を単一のRNA種のガイドRNAに組み込むようにして操作され得る。

一般的に、「CRISPRシステム」は、集合的に、CRISPR関連(「Cas」)遺伝子の発現を伴うか、又はそれの活性を導く転写物及び他のエレメントを指し、Cas遺伝子、tracr(トランス活性化CRISPR)配列(例として、tracrRNA又は活性な部分的なtracrRNA)、tracr mate配列(内因性CRISPRシステムという文脈において、「ダイレクト反復」及びtracrRNAによってプロセシングされる部分的なダイレクト反復を包摂する)、ガイド配列(内因性CRISPRシステムという文脈において「スペーサ」ともまた呼ばれる)、又はCRISPR遺伝子座からの他の配列及び転写物をコードする配列を包含する。システムのtracrRNAはガイドRNA上に存在するtracr mate配列に対して(完全に又は部分的に)相補的である。

DNA合成鋳型
本明細書に使用されるとき、用語「DNA合成鋳型」は、プライム編集因子のポリメラーゼによって鋳型鎖(所望の編集を含有しており、次いでプライム編集の機序を通して、対応する内因性DNAの鎖を標的部位にて置き換える、3'単鎖DNAフラップをコードする)として利用される、PEgRNAの伸長アームの領域又は部分を指す。伸長アームは、DNA合成鋳型を包含しており、DNA又はRNAから構成されていてもよい。RNAのケースにおいて、プライム編集因子のポリメラーゼは、RNA依存性DNAポリメラーゼ(例として、逆転写酵素)であり得る。DNAのケースにおいて、プライム編集因子のポリメラーゼは、DNA依存性DNAポリメラーゼであり得る。様々な態様において、DNA合成鋳型は、「編集鋳型」及び「相同アーム」、並びに任意の5'端修飾領域e2の全部又は一部を含んでもよい。つまり、e2領域の性質に応じて(例として、これが、ヘアピン、トゥーループ、又はステム/ループの2次構造を包含するかどうかにかかわらず)、ポリメラーゼは、e2領域を何もコードしていなくても、又はその一部若しくは全部をコードしていてもよい。別の言い方をすれば、3'伸長アームのケースにおいて、DNA合成鋳型は、ポリメラーゼ(例として、逆転写酵素)によるDNAの単鎖の合成のための鋳型として動作してもよい、プライマー結合部位(PBS)の5'端からgRNAコアの3'端までに及ぶ伸長アームの部分を包含し得る。5'伸長アームのケースにおいて、DNA合成鋳型は、PEgRNA分子の5'端から編集鋳型の3'端までに及ぶ伸長アームの部分を包含し得る。いくつかの態様では、DNA合成鋳型は、3'伸長アーム又は5'伸長アームのいずれかを有するPEgRNAのプライマー結合部位(PBS)を排除する。本明細書に記載のある態様は、編集鋳型及び相同アーム、すなわち、DNA合成の最中に鋳型として実際に使用されるPEgRNA伸長アームの配列を包含する「RT鋳型」を指す。「RT鋳型」という用語は、「DNA合成鋳型」という用語と同等である。ある特定の態様において、RT鋳型は、逆転写のための鋳型ポリヌクレオチドを、例として、逆転写酵素であるポリメラーゼを有するプライム編集因子を使用するプライム編集システム、複合体又は方法において指すために使用されてもよい。いくつかの態様では、DNA合成鋳型は、例として、RNA依存性DNAポリメラーゼ又はDNA依存性DNAポリメラーゼであるポリメラーゼを有するプライム編集因子を使用するプライム編集システム、複合体又は方法における、DNA重合、例としてRNA依存性DNA重合又はDNA依存性DNA重合のための鋳型ポリヌクレオチドを指すために使用されてもよい。

いくつかの態様では、DNA合成鋳型は、PBSの5'であり、PAM鎖に対する相補性領域(すなわち、非標的鎖又は編集鎖)を含み、二本鎖標的DNAの内因性配列と比較して1つ以上のヌクレオチド編集を含む、PEgRNAの一本鎖部分である。いくつかの態様において、DNA合成鋳型は、意図されたヌクレオチド編集位置における1つ以上の非相補的ヌクレオチドを除いて、ニック部位の下流にある非標的鎖上の配列に相補的又は実質的に相補的である。いくつかの態様において、DNA合成鋳型は、意図されたヌクレオチド編集位置における1つ以上の非相補的ヌクレオチドを除いて、ニック部位のすぐ下流(すなわち、直接下流に)にある非標的鎖上の配列に相補的又は実質的に相補的である。いくつかの態様において、意図されたヌクレオチド編集位置における非相補的ヌクレオチドの1つ以上は、ニック部位のすぐ下流にある。いくつかの態様では、DNA合成鋳型は、二本鎖標的DNA配列に対して1つ以上のヌクレオチド編集を含む。いくつかの態様では、DNA合成鋳型は、二本鎖標的DNA配列の非標的鎖に対して1つ以上のヌクレオチド編集を含む。本明細書に記載の各PEgRNAについて、ニック部位は、PEgRNAのgRNAコアが会合する特定のnapDNAbpに特徴的であり、napDNAbpの認識及び機能に必要な特定のPAMに特徴的である。例えば、SpCas9と会合するgRNAコアを含むPEgRNAの場合、3塩基(PAM配列の1位に対して「-3」位置)と4塩基(PAM配列の1位に対して「-4」位置)との間のホスホジエステル結合におけるニック部位。いくつかの態様において、DNA合成鋳型及びプライマー結合部位は、互いに直接隣接している。「ヌクレオチド編集」、「ヌクレオチド変化」、「所望のヌクレオチド変化」、及び「所望のヌクレオチド編集」という用語は、特定のヌクレオチド編集、例として、標的DNA配列に組み込まれるべきPEgRNAのDNA合成鋳型の特定の位置における1つ以上のヌクレオチドの特定の欠失、1つ以上のヌクレオチドの特定の挿入、1つ以上のヌクレオチドの特定の置換(又は複数の置換)、又はそれらの組み合わせを指すために互換的に使用される。いくつかの態様では、DNA合成鋳型は、二本鎖標的DNA配列に対して2つ以上のヌクレオチド編集を含む。そのような態様では、各ヌクレオチド編集は、DNA合成鋳型内の特定の位置における特定のヌクレオチド編集であり、各ヌクレオチド編集は、DNA合成鋳型内の他のヌクレオチド編集のいずれかと比較して異なる特定の位置にあり、各ヌクレオチド編集は、1つ以上のヌクレオチドの特定の欠失、1つ以上のヌクレオチドの特定の挿入、1つ以上のヌクレオチドの特定の置換(又は複数の置換)、又はそれらの組み合わせから独立して選択される。ヌクレオチド編集は、標的遺伝子の標的鎖上の配列と比較したDNA合成鋳型上の編集を指してもよく、又はヌクレオチド編集は、非標的鎖上の内因性標的DNA配列を置換する新たに合成された一本鎖DNA上のDNA合成鋳型によってコードされる編集を指してもよい。

ドミナントネガティブバリアント
用語「ドミナントネガティブバリアント」及び「ドミナントネガティブ変異体」は、野生型遺伝子産物に対して拮抗的に作用する(すなわち、その活性を阻害する)遺伝子産物をもたらす変異を含む遺伝子又は遺伝子産物(例として、タンパク質)を指す。ドミナントネガティブ変異は、一般に、分子機能の変化をもたらす(しばしば不活性である)。例えば、本開示は、野生型MMRタンパク質(例として、本明細書中に記載のドミナントネガティブMLH1タンパク質)の活性を阻害するMMRタンパク質のドミナントネガティブバリアントを提供する。

編集鋳型
用語「編集鋳型」は、ポリメラーゼ、例として、DNA依存性DNAポリメラーゼ、RNA依存性DNAポリメラーゼ(例として、逆転写酵素)によって合成される一本鎖3'DNAフラップ上に所望の編集をコードする伸長アームの部分を指す。本明細書に記載のある態様は、編集鋳型と相同アームとの両方一緒、すなわち、DNA合成の最中に鋳型として実際に使用されるPEgRNA伸長アームの配列を指す「RT鋳型」を指す。用語「RT編集鋳型」はまた、用語「DNA合成鋳型」とも等価であるが、ここでRT編集鋳型は、逆転写酵素であるポリメラーゼを有するプライム編集因子の使用を反映し、DNA合成鋳型は、いずれのポリメラーゼも有するプライム編集因子の使用をより広く反映する。

伸長アーム
用語「伸長アーム」は、プライマー結合部位及びポリメラーゼ(例として、逆転写酵素)のためのDNA合成鋳型(例として、編集鋳型及び相同アーム)を含むPEgRNAのヌクレオチド配列構成要素を指す。いくつかの態様、伸長アームは、ガイドRNAの3'端にて位置付けされる。他の態様、伸長アームは、ガイドRNAの5'端にて位置付けされる。いくつかの態様において、伸長アームは、DNA合成鋳型及びプライマー結合部位を含む。いくつかの態様では、伸長アームは、5'から3'方向に以下の構成要素:DNA合成鋳型及びプライマー結合部位を含む。いくつかの態様において、伸長アームはまた、相同アームも包含する。様々な態様において、伸長アームは、5'→3'方向に以下の構成要素:相同アーム、編集鋳型、及びプライマー結合部位を含む。様々な態様において、伸長アームは、5'→3'方向に以下の構成要素:相同アーム、編集鋳型、及びプライマー結合部位を含む。逆転写酵素の重合活性が5'→3'方向であるから、相同アーム、編集鋳型、及びプライマー結合部位の好ましい配置は、逆転写酵素が、アニールされたプライマー配列によって一旦プライムされると、編集鋳型を相補的な鋳型鎖として使用して単鎖DNAを重合するように、5'→3'方向にある。

伸長アームはまた、一般に2つの領域:例えば、プライマー結合部位(PBS)及びDNA合成鋳型を含むものとしても記載されていてもよい。プライマー結合部位は、プライム編集因子複合体によってニックが入れられるようになり、これによってニックが入った内因性の鎖上に3'端が晒されたとき、標的部位の内因性DNA鎖から形成されるプライマー配列へ結合する。本明細書に説明される通り、プライマー配列の、PEgRNAの伸長アーム上のプライマー結合部位への結合は、晒された3'端(すなわち、プライマー配列の3')をもつ二重鎖領域を作り出し、これは次いで、晒された3'端からDNA合成鋳型の長さに沿ってDNAの単鎖を重合し始めるポリメラーゼのための基質を提供する。単鎖DNA産物の配列は、DNA合成鋳型の相補体である。重合は、重合が終止するまでDNA合成鋳型(又は伸長アーム)の5'へ続く。よって、DNA合成鋳型は、プライム編集因子複合体のポリメラーゼによって単鎖DNA産物(すなわち、所望の遺伝子編集情報を含有する3'単鎖DNAフラップ)中へコードされる伸長アームの部分を表し、単鎖DNA産物は、PEに誘導されたニック部位のすぐ下流にある標的部位の対応する内因性DNA鎖に置き換える。理論に束縛されるものではないが、DNA合成鋳型の重合は、終止という事象まで、伸長アームの5'端へ続く。重合は、これらに限定されないが、(a)PEgRNAの5'端に達すること(例として、5'伸長アームのケースにおいて、DNAポリメラーゼが単に鋳型を使い果たす)、(b)通り抜けられないRNA2次構造(例として、ヘアピン若しくはステム/ループ)に達すること、あるいは(c)複製終止シグナル、例として、ポリメラーゼを遮断若しくは阻害する特定のヌクレオチド配列、又はスーパーコイル状のDNA若しくはRNA等の核酸形態上のシグナルに達すること、を包含する様々な形で終止してもよい。

融合タンパク質
用語「融合タンパク質」は、本明細書に使用されるとき、少なくとも2つの異なるタンパク質からタンパク質ドメインを含むハイブリッドポリペプチドを指す。あるタンパク質は、融合タンパク質のアミノ末端(N末端)部分にて、又はカルボキシ末端(C末端)タンパク質にて位置付けられ、よって「アミノ末端の融合タンパク質」又は「カルボキシ末端の融合タンパク質」の夫々を形成してもよい。タンパク質は、異なるドメイン、例えば、核酸結合ドメイン(例として、タンパク質を標的部位への結合へ向かわせる、Cas9のgRNA結合ドメイン)と、核酸編集タンパク質の核酸切断ドメイン又は触媒ドメインとを含んでいてもよい。別の例は、逆転写酵素と融合したCas9又はその等価物を包含する。本明細書に提供されるタンパク質のいずれも、当該技術分野において知られているいずれの方法によって産生されてもよい。例えば、本明細書に提供されるタンパク質は、ペプチドリンカーを含む融合タンパク質に特に適した、組換えタンパク質の発現及び精製を介して産生されてもよい。組換えタンパク質の発現及び精製のための方法は周知であり、Green and Sambrook,Molecular Cloning:A Laboratory Manual(4th ed.,Cold Spring Harbor Laboratory Press,Cold Spring Harbor,N.Y.(2012)(これらの内容全体は参照により本明細書に組み込まれる))によって記載されるものを包含する。

ガイドRNA(「gRNA」)
本明細書に使用されるとき、用語「ガイドRNA」は、大部分が一般的にCRISPR-Cas9のCasタンパク質に関連し、Cas9に結び付いてCas9タンパク質をDNA分子中の特定の配列(ガイドRNAのプロトスペーサ配列との相補性を包含する)へ向かわせる特定のタイプのガイド核酸である。しかしながら、この用語はまた、天然に存在するか若しくは天然には存在しない(例として、操作又は組換え)かにかかわらず、Cas9等価物、ホモログ、オルソログ、又はパラログに結び付き、またCas9等価物を特定の標的ヌクレオチド配列へ局在化するよう別にプログラムする、等価なガイド核酸分子も受け入れる。Cas9等価物は、Cpf1(V型CRISPR-Cas系)、C2c1(V型CRISPR-Cas系)、C2c2(VI型CRISPR-Cas系)及びC2c3(V型CRISPR-Cas系)を包含する、いずれのタイプのCRISPR系(例として、II型、V型、VI型)からの他のnapDNAbpも包含していてもよい。更なるCas等価物は、Makarova et al.,「C2c2 is a single-component programmable RNA-guided RNA-targeting CRISPR effector,」Science 2016;353(6299)(この内容は参照により本明細書に組み込まれる)に記載されている。ガイドRNAの例示の配列及び構造は本明細書に提供されている。加えて、適切なガイドRNA配列をデザインするための方法も、本明細書に提供されている。本明細書で使用される場合、「ガイドRNA」は、「プライム編集ガイドRNA」(又は「PEgRNA」)と呼ばれるガイドRNAの修飾形態と対照的に、「伝統的なガイドRNA」とも呼ばれてもよい。

ガイドRNA又はPEgRNAは、これらに限定されないが、以下を包含する様々な構造要素を含んでいてもよい:

スペーサ配列-標的DNA中のプロトスペーサへ結合するガイドRNA又はPEgRNA(長さが約20ntを有する)中の配列。

gRNAコア(又はgRNA骨格若しくはバックボーン配列)-は、Cas9結合を担うgRNA内の配列を指し、これは、Cas9を標的DNAへガイドするのに使用される20bpのスペーサ/標的化配列を包含していない。いくつかの態様では、gRNAコア又は足場は、天然に存在するCRISPR-CasガイドRNA足場、例えばCas9ガイドRNA足場と比較して1つ以上のヌクレオチド変化を含む配列を含む。いくつかの態様では、gRNAコアの配列は、標的部位での標的核酸の内因性配列に対して最小の配列相同性を含むか又は配列相同性を含まないように設計され、それによって意図しない編集を減少させる。例えば、いくつかの態様において、意図しない編集を減らすために、Cas9 gRNAコアの第2のステムループ内の1つ以上の塩基対が「フリップ」されてもよい(例として、図49Aに例示されるようなG-U塩基対及びU-A塩基対)。いくつかの態様において、gRNAコアは、1つ以上のヌクレオチド編集の位置の上流又は下流の5、10、15、20、25、30、35、40、45又は50ヌクレオチドに隣接する二本鎖標的DNAの配列に対して1％、5％、10％、15％、20％、25％又は30％以下の配列相同性を含む。

伸長アーム-PEgRNAの3'端又は5'端の一本鎖伸長、これは、プライマー結合部位とポリメラーゼ(例として、逆転写酵素)によって目当ての遺伝子変化を含有する一本鎖DNAフラップをコードするDNA合成鋳型配列とを含み、これが、次いで、対応する内因性の鎖を置き換えることによって内因性DNA上に組み込み、それによって所望の遺伝子変化をインストールする。

転写ターミネータ-ガイドRNA又はPEgRNAは分子の3'に転写終結配列を含んでもよい。いくつかの態様では、PEgRNAは、DNA合成鋳型とgRNAコアとの間に転写終結配列を含む。

相同性
本明細書で使用される「相同」、「相同性」又は「パーセント相同性」という用語は、アミノ酸又はポリヌクレオチド配列と対応する参照配列との間の配列同一性の程度を指す。「相同性」は、ポリマー配列、例として、類似するポリペプチド又はDNA配列を指し得る。相同性は、例えば、少なくとも約50％、55％、60％、65％、70％、75％、80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％又は100％の同一性を有する核酸配列を意味し得る。他の態様では、核酸配列の「相同配列」は、参照核酸配列に対して93％、95％、又は98％の配列同一性を示してもよい。例えば、「ゲノム領域と相同性の領域」は、ゲノム内の所与のゲノム領域と同様の配列を有するDNAの領域であり得る。相同性の領域は、ゲノム領域へのスペーサ又はプロトスペーサ配列の結合を促進するのに十分な任意の長さであり得る。例えば、相同性領域は、相同性領域が対応するゲノム領域との結合を受けるのに十分な相同性を有するように、少なくとも5、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100、200、300、400、500、600、700、800、900、1000、1100、1200、1300、1400、1500、1600、1700、1800、1900、2000、2100、2200、2300、2400、2500、2600、2700、2800、2900、3000、3100、又はそれを超える長さの塩基を含み得る。

配列相同性又は配列同一性のパーセンテージが指定される場合、2つの核酸配列又は2つのポリペプチド配列の文脈において、相同性又は配列同一性のパーセンテージは、一般に、最大の対応のために比較及びアラインメントされたときのそれらの長さの一部にわたる2つ以上の配列のアラインメントを指す。比較される配列中の位置が同じ塩基又はアミノ酸によって占められ得る場合、分子はその位置で相同であり得る。別段の記載がない限り、配列相同性又は配列同一性は、核酸、ポリペプチド又はその一部の特定の長さにわたって評価される。いくつかの態様において、相同性又は同一性は、その長さの機能的部分又は特定の部分にわたって評価される。

配列相同性を評価するための配列のアラインメントは、Altschul et al,J.Mol.Biol.215:403-410,1990に記載されているBasic Local Alignment Search Tool(BLAST)アルゴリズム等の当技術分野で公知のアルゴリズムによって行われ得る。BLAST分析を行うための公的に利用可能なインターネットインターフェースは、国立生物工学情報センター(National Center for Biotechnology Information)からアクセス可能である。更なる既知のアルゴリズムは、Smith&Waterman,「Comparison of Biosequences」,Adv.Appl.Math.2:482,1981;Needleman&Wunsch,「A general method applicable to the search for similarities in the amino acid sequence of two proteins」J.Mol.Biol.48:443,1970;Pearson&Lipman 「Improved tools for biological sequence comparison」,Proc.Natl.Acad.Sci.USA 85:2444,1988;又は、これら又は類似のアルゴリズムの自動化された実施によるものを包含する。グローバルアライメントプログラムが使用されて、ほぼ等しいサイズの同様のシーケンスをアライメントしてもよい。グローバルアライメントプログラムの例は、EMBOSSパッケージ(Rice P et al.,Trends Genet.,2000;16:276-277)の一部であるNEEDLE(www.ebi.ac.uk/Tools/psa/emboss_needle/で入手可能)、及びFASTAパッケージ(Pearson W and Lipman D,1988,Proc.Natl.Acad.Sci.USA,85:2444-2448)の一部であるGGSEARCHプログラムfasta.bioch.virginia.edu/fasta_www2/を包含する。これらのプログラムは両方とも、Needleman-Wunschアルゴリズムに基づいており、これは、それらの全長に沿った2つの配列の最適なアラインメント(ギャップを包含する)を見つけるために使用される。配列分析の詳細な議論は、Unit 19.3 of Ausubel et al(「Current Protocols in Molecular Biology」John Wiley&Sons Inc,1994-1998,Chapter 15,1998)にも見出され得る。

当業者は、アミノ酸(又はヌクレオチド)位置が、アラインメントに基づいて相同配列において決定されてもよいことを理解する。例えば、参照Cas9配列中の「H840」は、H839、又は参照Cas9配列にアラインメントされたときのCas9ホモログ中の別の対応する位置に対応してもよい。

宿主細胞
本明細書で使用される「宿主細胞」という用語は、本明細書に記載のベクター、例としてMLH1バリアントをコードする核酸分子とCas9又はCas9同等物及び逆転写酵素を含む融合タンパク質とを含むベクターを宿主、複製及び発現し得る細胞を指す。

阻害
本明細書で使用される場合、タンパク質及び酵素の文脈、例えばDNAミスマッチ修復経路を伴う酵素の文脈における「阻害する」、「阻害する」又は「阻害」という用語は、タンパク質又は酵素の活性の低下を指す。いくつかの態様において、この用語は、酵素活性のレベル、例として、DNAミスマッチ修復経路における1つ以上の酵素の活性のレベルが、例えば、酵素活性のベースラインレベルであってもよい初期レベルよりも統計学的に有意に低いレベルまで低下することを指す。いくつかの態様において、この用語は、酵素活性のレベル、例として、DNAミスマッチ修復経路における1つ以上の酵素の活性が、例えば、酵素活性のベースラインレベルであってもよい初期レベルの75％未満、50％未満、40％未満、30％未満、25％未満、20％未満、10％未満、9％未満、8％未満、7％未満、6％未満、5％未満、4％未満、3％未満、2％未満、1％未満、0.5％未満、0.1％未満、0.01％未満、0.001％未満、又は0.0001％未満であるレベルまで低下することを指す。

リンカー
本明細書において用いられる用語「リンカー」は、2つの他の分子又は部分を連結するある分子を指す。リンカーは、2つの融合タンパク質を連結するリンカーのケースではアミノ酸配列であり得る。例えば、Cas9は、アミノ酸リンカー配列によって逆転写酵素に融合され得る。リンカーは、2つのヌクレオチド配列を一緒に連結するケースではヌクレオチド配列でもまたあり得る。例えば、本ケースでは、従来のガイドRNAは、スペーサ又はリンカーヌクレオチド配列を介して、RT鋳型配列とRTプライマー結合部位とを含んでもよいプライム編集ガイドRNAのRNA伸長に連結される。他の態様において、リンカーは有機分子、基、ポリマー、又は化学的部分である。いくつかの態様では、リンカーは、長さが5-100アミノ酸、例えば長さが5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、30～35、35～40、40～45、45～50、50～60、60～70、70～80、80～90、90～100、100～150、又は150～200アミノ酸である。より長い又はより短いリンカーもまた企図される。特定の態様では、リンカーは自己加水分解性リンカー(例として、本明細書中に更に記載されるような2A自己切断性ペプチド)である。2A自己切断ペプチド等の自己加水分解性リンカーは、タンパク質翻訳中にリボソームスキッピングを誘導することができ、その結果、リボソームは2つの遺伝子又は遺伝子断片間でペプチド結合を形成することができない。

MLH1
「MLH1」という用語は、DNAミスマッチ修復酵素であるMLH1(又はMutLホモログ1)をコードする遺伝子を指す。この遺伝子によってコードされるタンパク質は、ミスマッチ修復エンドヌクレアーゼPMS2とヘテロ二量体化して、DNAミスマッチ修復系の一部であるMutLアルファ(MutLα)を形成し得る。MLH1は、ミスマッチ認識、鎖識別、及び鎖除去中にタンパク質-タンパク質相互作用を媒介する。ミスマッチ修復において、ヘテロ二量体MSH2:MSH6(MutSα)がミスマッチを形成し、これに結合する。次いで、MLH1は、PMS2(MutLα)とヘテロ二量体を形成し、MSH2:MSH6ヘテロ二量体に結合する。次いで、MutLαヘテロ二量体は、ミスマッチのニックが入った鎖5'及び3'を切り、続いてEXO1によってMutLαが生成したニックからミスマッチを切除する。最後に、POLδは切断された鎖を再合成し、続いてLIG1ライゲーションを行う。

MLH1の例示的なアミノ酸配列は、ヒトアイソフォーム1、P40692-1:＞sp｜P40692｜MLH1_HUMAN DNAミスマッチ修復タンパク質Mlh1 OS＝Homo sapiens OX＝9606 GN＝MLH1 PE＝1 SV＝1:
MSFVAGVIRRLDETVVNRIAAGEVIQRPANAIKEMIENCLDAKSTSIQVIVKEGGLKLIQIQDNGTGIRKEDLDIVCERFTTSKLQSFEDLASISTYGFRGEALASISHVAHVTITTKTADGKCAYRASYSDGKLKAPPKPCAGNQGTQITVEDLFYNIATRRKALKNPSEEYGKILEVVGRYSVHNAGISFSVKKQGETVADVRTLPNASTVDNIRSIFGNAVSRELIEIGCEDKTLAFKMNGYISNANYSVKKCIFLLFINHRLVESTSLRKAIETVYAAYLPKNTHPFLYLSLEISPQNVDVNVHPTKHEVHFLHEESILERVQQHIESKLLGSNSSRMYFTQTLLPGLAGPSGEMVKSTTSLTSSSTSGSSDKVYAHQMVRTDSREQKLDAFLQPLSKPLSSQPQAIVTEDKTDISSGRARQQDEEMLELPAPAEVAAKNQSLEGDTTKGTSEMSEKRGPTSSNPRKRHREDSDVEMVEDDSRKEMTAACTPRRRIINLTSVLSLQEEINEQGHEVLREMLHNHSFVGCVNPQWALAQHQTKLYLLNTTKLSEELFYQILIYDFANFGVLRLSEPAPLFDLAMLALDSPESGWTEEDGPKEGLAEYIVEFLKKKAEMLADYFSLEIDEEGNLIGLPLLIDNYVPPLEGLPIFILRLATEVNWDEEKECFESLSKECAMFYSIRKQYISEESTLSGQQSEVPGSIPNSWKWTVEHIVYKALRSHILPPKHFTEDGNILQLANLPDLYKVFERC(配列番号204)、
又は配列番号204と少なくとも70％、少なくとも75％、少なくとも80％、少なくとも85％、少なくとも90％、少なくとも95％、少なくとも96％、少なくとも97％、少なくとも98％、少なくとも99％、又は最大100％(100％を包含する)の配列同一性を有するアミノ酸配列である。

MLH1の別の例示的なアミノ酸配列は、ヒトアイソフォーム2、P40692-2(アイソフォーム1のアミノ酸1～241が欠損している):DNAミスマッチ修復タンパク質Mlh1 OS＝Homo sapiens OX＝9606 GN＝MLH1の＞sp｜P40692-2｜MLH1_HUMANアイソフォーム2:
MNGYISNANYSVKKCIFLLFINHRLVESTSLRKAIETVYAAYLPKNTHPFLYLSLEISPQNVDVNVHPTKHEVHFLHEESILERVQQHIESKLLGSNSSRMYFTQTLLPGLAGPSGEMVKSTTSLTSSSTSGSSDKVYAHQMVRTDSREQKLDAFLQPLSKPLSSQPQAIVTEDKTDISSGRARQQDEEMLELPAPAEVAAKNQSLEGDTTKGTSEMSEKRGPTSSNPRKRHREDSDVEMVEDDSRKEMTAACTPRRRIINLTSVLSLQEEINEQGHEVLREMLHNHSFVGCVNPQWALAQHQTKLYLLNTTKLSEELFYQILIYDFANFGVLRLSEPAPLFDLAMLALDSPESGWTEEDGPKEGLAEYIVEFLKKKAEMLADYFSLEIDEEGNLIGLPLLIDNYVPPLEGLPIFILRLATEVNWDEEKECFESLSKECAMFYSIRKQYISEESTLSGQQSEVPGSIPNSWKWTVEHIVYKALRSHILPPKHFTEDGNILQLANLPDLYKVFERC(配列番号205)、
又は配列番号205と少なくとも70％、少なくとも75％、少なくとも80％、少なくとも85％、少なくとも90％、少なくとも95％、少なくとも96％、少なくとも97％、少なくとも98％、少なくとも99％、又は最大100％(100％を包含する)の配列同一性を有するアミノ酸配列である。

MLH1の別の例示的なアミノ酸配列は、ヒトアイソフォーム3、P40692-3(アミノ酸1～101(MSFVAGVIRR…ASISTYGFRG(配列番号206)はMAFで置き換えられる):DNAミスマッチ修復タンパク質Mlh1 OS＝Homo sapiens OX＝9606 GN＝MLH1の＞sp｜P40692-2｜MLH1_HUMANアイソフォーム2:
MAFEALASISHVAHVTITTKTADGKCAYRASYSDGKLKAPPKPCAGNQGTQITVEDLFYNIATRRKALKNPSEEYGKILEVVGRYSVHNAGISFSVKKQGETVADVRTLPNASTVDNIRSIFGNAVSRELIEIGCEDKTLAFKMNGYISNANYSVKKCIFLLFINHRLVESTSLRKAIETVYAAYLPKNTHPFLYLSLEISPQNVDVNVHPTKHEVHFLHEESILERVQQHIESKLLGSNSSRMYFTQTLLPGLAGPSGEMVKSTTSLTSSSTSGSSDKVYAHQMVRTDSREQKLDAFLQPLSKPLSSQPQAIVTEDKTDISSGRARQQDEEMLELPAPAEVAAKNQSLEGDTTKGTSEMSEKRGPTSSNPRKRHREDSDVEMVEDDSRKEMTAACTPRRRIINLTSVLSLQEEINEQGHEVLREMLHNHSFVGCVNPQWALAQHQTKLYLLNTTKLSEELFYQILIYDFANFGVLRLSEPAPLFDLAMLALDSPESGWTEEDGPKEGLAEYIVEFLKKKAEMLADYFSLEIDEEGNLIGLPLLIDNYVPPLEGLPIFILRLATEVNWDEEKECFESLSKECAMFYSIRKQYISEESTLSGQQSEVPGSIPNSWKWTVEHIVYKALRSHILPPKHFTEDGNILQLANLPDLYKVFERC(配列番号207)、
又は配列番号207と少なくとも70％、少なくとも75％、少なくとも80％、少なくとも85％、少なくとも90％、少なくとも95％、少なくとも96％、少なくとも97％、少なくとも98％、少なくとも99％、又は最大100％(100％を包含する)の配列同一性を有するアミノ酸配列である。

本開示は、配列番号204、208～213、215、216、218、222、又は223のいずれかと少なくとも70％、又は75％、又は80％、又は85％、又は90％、又は95％、又は99％又はそれ以上の配列同一性を有する任意のアミノ酸配列、又は任意のMLH1若しくはMLH1のバリアント(例として、本明細書中に記載のMLH1のドミナントネガティブ変異体)をコードする核酸分子を包含する、MLH1の任意の野生型又は天然に存在するバリアントを包含する、MLH1と相互作用するMLH1及び/又はMMR経路の構成要素を、MMR経路の野生型MLH1機能を阻害、遮断、又は他の様態で不活性化し、その結果、例としてプライム編集因子を用いたゲノム編集中に、MMR経路を阻害、遮断、又は他の様態で不活性化するために標的化することを企図している。

いくつかの態様では、MMR経路の不活性化は、MLH1タンパク質の野生型機能を破壊、遮断、干渉、又はそうでなければ不活性化する阻害剤を伴う。いくつかの態様では、MMR経路の不活性化は、MLH1タンパク質の変異体、例えば標的細胞をMLH1変異体タンパク質と接触させること、又は標的細胞においてMLH1変異体タンパク質をコードするMLH1変異体核酸を発現させることを伴う。いくつかの態様では、MLH1変異体タンパク質は、MMR経路における野生型MLH1タンパク質の機能を妨害し、それによって不活性化する。いくつかの態様では、MLH1変異体はドミナントネガティブ変異体である。いくつかの態様では、MLH変異体タンパク質は、MLH1相互作用タンパク質、例えばMutSに結合することができる。

理論に拘束されるものではないが、MLH1ドミナントネガティブ変異体は、MutSの結合を飽和させることによって機能し、それによってMutS-野生型MLH1結合を遮断し、MMR経路における野生型MLH1タンパク質の機能を妨害する。

様々な態様では、ドミナントネガティブMLH1は、例えば、配列番号222に基づき、以下のアミノ酸配列を有するMLH1 E34A(E34A変異を示すために下線及び太字):

(配列番号222)、
又は配列番号222と少なくとも70％、少なくとも75％、少なくとも80％、少なくとも85％、少なくとも90％、少なくとも95％、少なくとも96％、少なくとも97％、少なくとも98％、少なくとも99％、又は最大100％(100％を包含する)の配列同一性を有するアミノ酸配列を包含し得る。

様々な他の態様では、ドミナントネガティブMLH1は、例えば、配列番号208に基づき、以下のアミノ酸配列を有するMLH1 Δ756(配列のC末端におけるΔ756突然変異を示すために下線及び太字):

(配列番号208)、
又は配列番号208と少なくとも70％、少なくとも75％、少なくとも80％、少なくとも85％、少なくとも90％、少なくとも95％、少なくとも96％、少なくとも97％、少なくとも98％、少なくとも99％、又は最大100％(100％を包含する)の配列同一性を有するアミノ酸配列(［-］は、親又は野生型配列と比較して欠失したアミノ酸残基(複数可)を示す)を包含し得る。

更なる他の態様では、ドミナントネガティブMLH1は、例えば、配列番号209に基づき、以下のアミノ酸配列を有するMLH1 Δ754-Δ756(配列のC末端におけるΔ754-Δ756突然変異を示すために下線及び太字):

(配列番号209)、
又は配列番号209と少なくとも70％、少なくとも75％、少なくとも80％、少なくとも85％、少なくとも90％、少なくとも95％、少なくとも96％、少なくとも97％、少なくとも98％、少なくとも99％、又は最大100％(100％を包含する)の配列同一性を有するアミノ酸配列(

は、親又は野生型配列と比較して欠失したアミノ酸残基(複数可)を示す)を包含し得る。

更に他の態様では、ドミナントネガティブMLH1は、例えば、配列番号210に基づき、以下のアミノ酸配列を有するMLH1 E34A Δ754-Δ756(E34A及びΔ754-Δ756変異を示すために下線及び太字):

(配列番号210)、
又は配列番号210と少なくとも70％、少なくとも75％、少なくとも80％、少なくとも85％、少なくとも90％、少なくとも95％、少なくとも96％、少なくとも97％、少なくとも98％、少なくとも99％、又は最大100％(100％を包含する)の配列同一性を有するアミノ酸配列を包含し得る。

特定の態様では、ドミナントネガティブMLH1は、例えば、配列番号211に基づき、以下のアミノ酸配列を有するMLH1 1-335(配列番号204のアミノ酸1～335を含有する);
MSFVAGVIRRLDETVVNRIAAGEVIQRPANAIKEMIENCLDAKSTSIQVIVKEGGLKLIQIQDNGTGIRKEDLDIVCERFTTSKLQSFEDLASISTYGFRGEALASISHVAHVTITTKTADGKCAYRASYSDGKLKAPPKPCAGNQGTQITVEDLFYNIATRRKALKNPSEEYGKILEVVGRYSVHNAGISFSVKKQGETVADVRTLPNASTVDNIRSIFGNAVSRELIEIGCEDKTLAFKMNGYISNANYSVKKCIFLLFINHRLVESTSLRKAIETVYAAYLPKNTHPFLYLSLEISPQNVDVNVHPTKHEVHFLHEESILERVQQHIESKLL(配列番号211)、
又は配列番号211と少なくとも70％、少なくとも75％、少なくとも80％、少なくとも85％、少なくとも90％、少なくとも95％、少なくとも96％、少なくとも97％、少なくとも98％、少なくとも99％、又は最大100％(100％を包含する)の配列同一性を有するアミノ酸配列を包含し得る。

他の態様では、ドミナントネガティブMLH1は、例えば、配列番号212に基づき、以下のアミノ酸配列を有するMLH1 1-335 E34A(配列番号204のアミノ酸1～335及び配列番号204に対するE34A変異を含有する)

(配列番号212)、
又は配列番号212と少なくとも70％、少なくとも75％、少なくとも80％、少なくとも85％、少なくとも90％、少なくとも95％、少なくとも96％、少なくとも97％、少なくとも98％、少なくとも99％、又は最大100％(100％を包含する)の配列同一性を有するアミノ酸配列を包含し得る。

更に他の態様では、ドミナントネガティブMLH1は、例えば、配列番号204に基づき、以下のアミノ酸配列を有する、MLH1 1-335 NLS^SV40(又はMLH1dn^NTDと呼ばれる)(配列番号204のアミノ酸1～335及びSV40のNLS配列を含有する):

(配列番号213)、
下線及び太字部分はSV40のNLSを指す)、又は配列番号213と少なくとも70％、少なくとも75％、少なくとも80％、少なくとも85％、少なくとも90％、少なくとも95％、少なくとも96％、少なくとも97％、少なくとも98％、少なくとも99％、又は最大100％(100％を包含する)の配列同一性を有するアミノ酸配列を包含し得る。

更に他の態様では、ドミナントネガティブMLH1は、例えば、MLH1 1-335 NLS^代替(配列番号204に基づき、以下のアミノ酸配列を有する(配列番号204のアミノ酸1～335及び代替のNLS配列を含有する):
MSFVAGVIRRLDETVVNRIAAGEVIQRPANAIKEMIENCLDAKSTSIQVIVKEGGLKLIQIQDNGTGIRKEDLDIVCERFTTSKLQSFEDLASISTYGFRGEALASISHVAHVTITTKTADGKCAYRASYSDGKLKAPPKPCAGNQGTQITVEDLFYNIATRRKALKNPSEEYGKILEVVGRYSVHNAGISFSVKKQGETVADVRTLPNASTVDNIRSIFGNAVSRELIEIGCEDKTLAFKMNGYISNANYSVKKCIFLLFINHRLVESTSLRKAIETVYAAYLPKNTHPFLYLSLEISPQNVDVNVHPTKHEVHFLHEESILERVQQHIESKLL-［代替NLS配列］(配列番号214)-［代替NLS配列］
又は配列番号214と少なくとも70％、少なくとも75％、少なくとも80％、少なくとも85％、少なくとも90％、少なくとも95％、少なくとも96％、少なくとも97％、少なくとも98％、少なくとも99％、又は最大100％(100％を包含する)の配列同一性を有するアミノ酸配列を包含し得る。代替NLS配列は、限定するものではないが、以下を包含する任意の適切なNLS配列であり得る。

いくつかの態様において、NLS配列は、タンパク質のN末端に付加され、メチオニン(「M」)で始まる。他の態様では、NLS配列は、タンパク質のC末端に、又は融合タンパク質の複数のドメインの間に付加されてもよく、メチオニンで始まっていない(すなわち、例えば、配列番号101、1及び134のMは、融合タンパク質のC末端又は2つのドメインの間に付加される場合、NLSに包含されない)。

更に他の態様では、ドミナントネガティブMLH1は、例えば、配列番号204のアミノ酸501～756に対応する配列番号204のC末端断片に対応するMLH1 501～756:
INLTSVLSLQEEINEQGHEVLREMLHNHSFVGCVNPQWALAQHQTKLYLLNTTKLSEELFYQILIYDFANFGVLRLSEPAPLFDLAMLALDSPESGWTEEDGPKEGLAEYIVEFLKKKAEMLADYFSLEIDEEGNLIGLPLLIDNYVPPLEGLPIFILRLATEVNWDEEKECFESLSKECAMFYSIRKQYISEESTLSGQQSEVPGSIPNSWKWTVEHIVYKALRSHILPPKHFTEDGNILQLANLPDLYKVFERC(配列番号215)、
又は配列番号215と少なくとも70％、少なくとも75％、少なくとも80％、少なくとも85％、少なくとも90％、少なくとも95％、少なくとも96％、少なくとも97％、少なくとも98％、少なくとも99％、又は最大100％(100％を包含する)の配列同一性を有するアミノ酸配列を包含し得る。

更に他の態様では、ドミナントネガティブMLH1は、例えば、配列番号204のアミノ酸501～753に対応する配列番号204のC末端断片に対応するMLH1 501～753:

(配列番号216)、
又は配列番号216と少なくとも70％、少なくとも75％、少なくとも80％、少なくとも85％、少なくとも90％、少なくとも95％、少なくとも96％、少なくとも97％、少なくとも98％、少なくとも99％、又は最大100％(100％を包含する)の配列同一性を有するアミノ酸配列を包含し得る。

更に他の態様では、ドミナントネガティブMLH1は、例えば、配列番号204のアミノ酸461～756に対応する配列番号204のC末端断片であるMLH1 461～756:
KRGPTSSNPRKRHREDSDVEMVEDDSRKEMTAACTPRRRIINLTSVLSLQEEINEQGHEVLREMLHNHSFVGCVNPQWALAQHQTKLYLLNTTKLSEELFYQILIYDFANFGVLRLSEPAPLFDLAMLALDSPESGWTEEDGPKEGLAEYIVEFLKKKAEMLADYFSLEIDEEGNLIGLPLLIDNYVPPLEGLPIFILRLATEVNWDEEKECFESLSKECAMFYSIRKQYISEESTLSGQQSEVPGSIPNSWKWTVEHIVYKALRSHILPPKHFTEDGNILQLANLPDLYKVFERC(配列番号217)、
又は配列番号217と少なくとも70％、少なくとも75％、少なくとも80％、少なくとも85％、少なくとも90％、少なくとも95％、少なくとも96％、少なくとも97％、少なくとも98％、少なくとも99％、又は最大100％(100％を包含する)の配列同一性を有するアミノ酸配列を包含し得る。

様々な態様では、ドミナントネガティブMLH1は、例えば、配列番号204のアミノ酸461～753に対応する配列番号204のC末端断片であるMLH1 461～753:

(配列番号218)、
又は配列番号218と少なくとも70％、少なくとも75％、少なくとも80％、少なくとも85％、少なくとも90％、少なくとも95％、少なくとも96％、少なくとも97％、少なくとも98％、少なくとも99％、又は最大100％(100％を包含する)の配列同一性を有するアミノ酸配列を包含し得る。
様々な他の態様では、ドミナントネガティブMLH1は、例えば、配列番号204のアミノ酸461～753に対応する配列番号204のC末端断片であり、N末端NLS、例としてNLS^SV40を更に含むMLH1 461～753:

(配列番号218)、
又は配列番号218と少なくとも70％、少なくとも75％、少なくとも80％、少なくとも85％、少なくとも90％、少なくとも95％、少なくとも96％、少なくとも97％、少なくとも98％、少なくとも99％、又は最大100％(100％を包含する)の配列同一性を有するアミノ酸配列を包含し得る。NLS配列は、配列番号1、101、103、133～139を包含するがこれらに限定されない任意の適切なNLS配列であり得る。

napDNAbp
本明細書に使用されるとき、用語「核酸プログラム可能DNA結合タンパク質」又は「napDNAbp」(そのCas9が一例である)は、DNA分子中の特定の配列を標的にし、結合するためにRNA:DNAハイブリダイゼーションを使用するタンパク質を指す。各napDNAbpは、ガイド核酸又はこの一部(例として、ガイドRNAのプロトスペーサ)に相補的なDNA鎖(すなわち、標的鎖)を含むDNA配列へnapDNAbpを局在化する、少なくとも1つのガイド核酸(例として、ガイドRNA)に関連されている。換言すれば、ガイド核酸は、相補的な配列へ局在化し結合するようnapDNAbp(例として、Cas9又は等価物)を「プログラム」する。

理論に束縛されるものではないが、napDNAbp-ガイドRNA複合体の結合機序は、一般に、napDNAbpが二本鎖DNA標的の巻き戻しを誘導するRループを形成する(これによってnapDNAbpによって結合された領域中の鎖が分離される)工程を包含する。次いで、ガイドRNAスペーサ配列は、「標的鎖」にハイブリダイズする。これは、標的鎖に相補的な「非標的鎖」に取って代わり、これはRループの単鎖領域を形成する。いくつかの態様において、napDNAbpは1つ以上のヌクレアーゼ活性を包含しており、次いでDNAを切ることで、様々なタイプの病変を切り離す。例えば、napDNAbpは、非標的鎖を第1の場所にて切るか、及び/又は標的鎖を第2の場所にて切る、ヌクレアーゼ活性を含んでいてもよい。ヌクレアーゼ活性に応じて標的DNAが切られることで、両鎖とも切られた「二本鎖切断」を形成し得る。他の態様において、標的DNAは単一の部位でしか切られ得ない、すなわち、DNAは一方の鎖上に「ニックが入っている(nicked)」。種々のヌクレアーゼ活性をもつ例示のnapDNAbpは、「Cas9ニッカーゼ」(「nCas9」)、及びヌクレアーゼ活性を一切有さない不活性化Cas9(「不活性型Cas9」又は「dCas9」)を包含する。これらの及び他のnapDNAbpへの例示の配列は、本明細書に提供されている。

ニッカーゼ
本明細書で使用される「ニッカーゼ」という用語は、2つのヌクレアーゼドメインのうちの1つが不活性化されたCas9を指してもよい。この酵素は、標的DNAの一方の鎖のみを切断することができる。本明細書で使用される場合、「ニッカーゼ」は、二本鎖標的DNA配列の2つの相補鎖の一方のみを切断し、それによってその鎖にニックを生成することができるnapDNAbp(例として、Casタンパク質)を指してもよい。いくつかの態様では、ニッカーゼは、二本鎖標的DNA配列の非標的鎖を切断する。いくつかの態様では、ニッカーゼは、標準的なnapDNAbp(例として、Casタンパク質)の触媒ドメインに1つ以上の変異を有するアミノ酸配列を含み、1つ以上の変異は、触媒ドメインのヌクレアーゼ活性を低減又は消失させる。特定の態様では、napDNAbpは、Cas9ニッカーゼ、Cas12aニッカーゼ、又はCas12b1ニッカーゼである。いくつかの態様において、ニッカーゼは、野生型Cas9配列に対する、又は他のCas9バリアント若しくはCas9等価物における等価なアミノ酸位置に対するRuvC様ドメインにおける1つ以上の変異を含むCas9である。いくつかの態様において、ニッカーゼは、野生型Cas9配列に対する、又は他のCas9バリアント若しくはCas9等価物における等価なアミノ酸位置に対するHNH様ドメインにおける1つ以上の変異を含むCas9である。いくつかの態様において、ニッカーゼは、標準的なCas9配列に対する、又は他のCas9バリアント若しくはCas9等価物における等価なアミノ酸位置に対する、Cas9のRuvC I触媒ドメインにおけるアスパラギン酸からアラニンへの置換(D10A)を含むCas9である。いくつかの態様において、ニッカーゼは、標準的なCas9配列に対する、又は他のCas9バリアント若しくはCas9等価物における等価なアミノ酸位置に対するH840A、N854A及び/又はN863A変異を含むCas9である。いくつかの態様において、「Cas9ニッカーゼ」という用語は、2つのヌクレアーゼドメインのうちの1つが不活性化されたCas9を指す。この酵素は、標的DNAの一方の鎖のみを切断することができる。いくつかの態様において、ニッカーゼはCas9ニッカーゼではないCasタンパク質である。

いくつかの態様では、プライム編集複合体のnapDNAbpは、核酸プログラム可能DNA結合能力を有するエンドヌクレアーゼを含む。いくつかの態様では、napDNAbpは、二本鎖標的DNAの両方の鎖を切断することができる活性エンドヌクレアーゼを含む。いくつかの態様では、napDNAbpは、各鎖にニックを生成することによって二本鎖標的DNAの両方の鎖を切断し得る、ヌクレアーゼ活性エンドヌクレアーゼ、例としてヌクレアーゼ活性Casタンパク質である。例えば、ヌクレアーゼ活性Casタンパク質は、二本鎖標的DNAの各鎖に切断(ニック)を生成し得る。いくつかの態様では、両方の鎖上の2つのニックは、例えばCas12a又はCas12b1を含むnapDNAbpによって生成される互い違いのニックである。いくつかの態様では、両方の鎖上の2つのニックは、同じゲノム位置にあり、例えば、ヌクレアーゼ活性Cas9を含むnapDNAbpによって生成される。いくつかの態様では、napDNAbpは、ニッカーゼであるエンドヌクレアーゼを含む。例えば、いくつかの態様では、napDNAbpは、エンドヌクレアーゼのヌクレアーゼ活性を低下させ、それをニッカーゼにする1つ以上の突然変異を含むエンドヌクレアーゼを含む。いくつかの態様では、napDNAbpは、不活性エンドヌクレアーゼを含む。例えば、いくつかの態様では、napDNAbpは、ヌクレアーゼ活性を無効にする1つ以上の突然変異を含むエンドヌクレアーゼを含む。様々な態様では、napDNAbpはCas9タンパク質又はその変異体である。napDNAbpはまた、ヌクレアーゼ活性Cas9、ヌクレアーゼ不活性Cas9(dCas9)、又はCas9ニッカーゼ(nCas9)であり得る。好ましい態様では、napDNAbpは、一本鎖のみにニックを入れるCas9ニッカーゼ(nCas9)である。特定の態様では、napDNAbpは、Cas9ニッカーゼ、Cas12aニッカーゼ、又はCas12b1ニッカーゼである。いくつかの態様では、napDNAbpは、Cas9、Cas12e、Cas12d、Cas12a、Cas12b1、Cas12b2、Cas13a、Cas12c、Cas12d、Cas12e、Cas12h、Cas12i、Cas12g、Cas12f(Cas14)、Cas12f1、Cas12j(CasΦ)、及びアルゴノートからなる群から選択され得、任意選択で、1本の鎖のみが切断されるようにニッカーゼ活性を有しする。いくつかの態様では、napDNAbpは、Cas9、Cas12e、Cas12d、Cas12a、Cas12b1、Cas12b2、Cas13a、Cas12c、Cas12d、Cas12e、Cas12h、Cas12i、Cas12g、Cas12f(Cas14)、Cas12f1、Cas12j(CasΦ)、及びアルゴノートから選択され、任意選択で、一方のDNA鎖が他方のDNA鎖に対して優先的に切断されるようにニッカーゼ活性を有する。

ニック部位
プライム編集の文脈において本明細書で互換的に使用される「切断部位」、「ニック部位」及び「切断部位」という用語は、二本鎖標的DNA配列中の2つのヌクレオチド又は2つの塩基対の間の特定の位置を指す。いくつかの態様において、ニック部位の位置は、特定のPAM配列の位置に対して決定される。いくつかの態様では、ニック部位は、特定のPAM配列を認識する二本鎖標的DNAが、napDNAbp、例としてCasニッカーゼ等のニッカーゼと接触されたときにニックが発生する特定の位置である。本明細書に記載の各PEgRNAについて、ニック部位は、PEgRNAのgRNAコアが会合する特定のnapDNAbpに特徴的であり、napDNAbpの認識及び機能に必要な特定のPAMに特徴的である。例えば、SpCas9と会合するgRNAコアを含むPEgRNAの場合、3塩基(PAM配列の1位に対して「-3」位置)と4塩基(PAM配列の1位に対して「-4」位置)との間のホスホジエステル結合におけるニック部位。

いくつかの態様では、ニック部位は、二本鎖標的DNA配列の標的鎖にある。いくつかの態様では、ニック部位は、二本鎖標的DNA配列の非標的鎖にある。いくつかの態様では、ニック部位はプロトスペーサ配列にある。いくつかの態様では、ニック部位はプロトスペーサ配列に隣接している。いくつかの態様では、ニック部位は、PEgRNAのプライマー結合部位に相補的な、例として、非標的鎖上の領域の下流にある。いくつかの態様では、ニック部位は、PEgRNAのプライマー結合部位に結合する領域の下流、例として、非標的鎖上にある。いくつかの態様では、ニック部位は、PEgRNAのプライマー結合部位に相補的な、例として、非標的鎖上の領域のすぐ下流にある。いくつかの態様では、ニック部位は、二本鎖標的DNAの非標的鎖上の特定のPAM配列の上流にあり、PAM配列は、PEgRNAのgRNAコアと会合するnapDNAbpによる認識に特異的である。いくつかの態様では、ニック部位は、二本鎖標的DNAの非標的鎖上の特定のPAM配列の下流にあり、PAM配列は、PEgRNAのgRNAコアと会合するnapDNAbpによる認識に特異的である。いくつかの態様では、ニック部位はPAM配列の3ヌクレオチド上流であり、PAM配列は、Streptococcus pyogene Cas9ニッカーゼ、P.lavamentivorans Cas9ニッカーゼ、C.diphtheriae Cas9ニッカーゼ、N.cinerea Cas9、S.aureus Cas9、又はN.lari Cas9ニッカーゼによって認識される。いくつかの態様において、ニック部位はPAM配列の3ヌクレオチド上流にあり、PAM配列はCas9ニッカーゼによって認識され、Cas9ニッカーゼはヌクレアーゼ活性HNHドメイン及びヌクレアーゼ不活性RuvCドメインを含む。いくつかの態様において、ニック部位はPAM配列の2塩基対上流にあり、PAM配列はS.thermophilus Cas9ニッカーゼによって認識される。

核酸分子
用語「核酸」は、本明細書に使用されるとき、ヌクレオチドのポリマーを指す。ポリマーは、天然のヌクレオシド(すなわち、アデノシン、チミジン、グアノシン、シチジン、ウリジン、デオキシアデノシン、デオキシチミジン、デオキシグアノシン、及びデオキシシチジン)、ヌクレオシド類似体(例として、2-アミノアデノシン、2-チオチミジン、イノシン、ピロロ-ピリミジン、3-メチルアデノシン、5-メチルシチジン、C5ブロモウリジン、C5フルオロウリジン、C5ヨードウリジン、C5プロピニルウリジン、C5プロピニルシチジン、C5メチルシチジン、7デアザアデノシン、7デアザグアノシン、8オキソアデノシン、8オキソグアノシン、O(6)メチルグアニン、4-アセチルシチジン、5-(カルボキシヒドロキシメチル)ウリジン、ジヒドロウリジン、メチルシュードウリジン、1-メチルアデノシン、1-メチルグアノシン、N6-メチルアデノシン、及び2-チオシチジン)、化学修飾された塩基、生物学的に修飾された塩基(例として、メチル化された塩基)、インターカレートされた(intercalated)塩基、修飾された糖(例として、2'-フルオロリボース、リボース、2'-デオキシリボース、2'-O-メチルシチジン、アラビノース、及びヘキソース)、又は修飾されたホスファート基(例として、ホスホロチオアート及び5'-Nホスホラミダイト連結)を包含していてもよい。

P53
本明細書で使用される場合、「p53」は腫瘍タンパク質53を指す。他の機能の中でも、p53は、DNA損傷及び修復において、特に、細胞周期、アポトーシス及びゲノム安定性の調節におけるその役割において役割を果たす。P53は、DNAが損傷した場合にDNA修復タンパク質を活性化し得る。P53はまた、細胞周期をDNA損傷認識のG1/S調節点に保持することによって細胞増殖を停止してもよく、それによって、細胞が細胞周期を継続することを可能にする前にDNA損傷を修復するためのより多くの時間をDNA修復タンパク質に提供する。したがって、本明細書中に記載される方法のいくつかの態様において、p53は、プライム編集の効率を高めるために阻害される(例として、p53阻害タンパク質「i53」又は別のp53阻害剤)。

PEgRNA
本明細書に使用されるとき、用語「プライム編集ガイドRNA」又は「PEgRNA」又は「伸長されたガイドRNA」は、本明細書に記載のプライム編集方法及び組成物を実践するための1つ以上の追加の配列を包含するよう修飾されたガイドRNAの特化された形態を指す。本明細書に記載の通り、プライム編集ガイドRNAは、核酸配列の1以上の「伸長された領域」を含む。伸長された領域は、これらに限定されないが、単鎖のRNA又はDNAを含んでいてもよい。更に、伸長された領域は、既存のガイドRNAの3'端にて生じていてもよい。他の配置において、伸長された領域は、既存のガイドRNAの5'端にて生じていてもよい。また他の配置において、伸長された領域は、既存のガイドRNAの末端の分子内のある領域にて(例えば、napDNAbpへ結び付き及び/又は結合するgRNAコア領域中)生じていてもよい。伸長された領域は、単鎖DNAを(プライム編集因子のポリメラーゼによって)コードする「DNA合成鋳型」を含むが、分子は次に(a)編集されるべき内因性標的DNAと相同であるようデザインされており、及び(b)内因性標的DNA中へ誘導又は取り入れられるべき少なくとも1の所望のヌクレオチド変化(例として、トランジション、トランスバージョン、欠失、若しくは挿入)を含んでいる。伸長された領域はまた、他の機能的配列要素(これらに限定されないが、「プライマー結合部位」及び「スペーサ若しくはリンカー」配列等)、又は他の構造的要素(これらに限定されないが、アプタマー、ステムループ、ヘアピン、トゥーループ(例として、3'トゥーループ)、若しくはRNA-タンパク質動員ドメイン(例として、MS2ヘアピン)等)も含んでいてもよい。本明細書に使用されるとき「プライマー結合部位」は、Rループのニックが入ったDNAから生成された3'端を有する単鎖DNA配列とハイブリダイズする配列を含む。

特定の態様では、PEgRNAは、5'伸長アーム、スペーサ、及びgRNAコアを有する。5'伸長は、5'→3'方向に逆転写酵素鋳型、プライマー結合部位、及びリンカーを更に含む。逆転写酵素鋳型はより幅広く「DNA合成鋳型」ともまた呼ばれてもよく、ここで、本明細書に記載のプライム編集因子のポリメラーゼはRTではなく別のタイプのポリメラーゼである。

特定の他の態様では、PEgRNAは、5'伸長アーム、スペーサ、及びgRNAコアを有する。5'伸長は、5'→3'方向に逆転写酵素鋳型、プライマー結合部位、及びリンカーを更に含む。逆転写酵素鋳型はより幅広く「DNA合成鋳型」ともまた呼ばれてもよく、ここで、本明細書に記載のプライム編集因子のポリメラーゼはRTではなく別のタイプのポリメラーゼである。

更に他の態様では、PEgRNAは、5'から3'方向に、スペーサ(1)、gRNAコア(2)、及び伸長アーム(3)を有する。伸長アーム(3)はPEgRNAの3'端にある。伸長アーム(3)は、5'から3'方向に「相同アーム」、「編集テンプレート」、及び「プライマー結合部位」を更に含む。特定の態様では、PEgRNAは、5'から3'、空間、DNA合成鋳型、及びプライマー結合部位を含む。伸長アーム(3)は任意選択の修飾領域をもまた3'及び5'端に含んでもよく、これらは同じ配列又は異なる配列であってもよい。PEgRNAの3'端は、転写ターミネータ配列を含んでいてもよい。PEgRNAのこれらの配列要素は更に、本明細書に記載、定義される。

更に他の態様では、PEgRNAは、5'から3'方向に、伸長アーム(3)、スペーサ(1)、及びgRNAコア(2)を有する。伸長アーム(3)はPEgRNAの5'端にある。伸長アーム(3)は、3'から5'方向に「相同アーム」、「編集テンプレート」、及び「プライマー結合部位」を更に含む。伸長アーム(3)は任意選択の修飾領域をもまた3'及び5'端に含んでもよく、これらは同じ配列又は異なる配列であってもよい。PEgRNAはまた、3'端に転写ターミネータ配列を含んでいてもよい。PEgRNAのこれらの配列要素は更に、本明細書に記載、定義される。

PE1
本明細書で使用される場合、「PE1」は、以下の構造:［NLS］-［Cas9(H840A)］-［リンカー］-［MMLV_RT(wt)］＋所望のPEgRNAを有するCas9(H840A)及び野生型MMLV RTを含む融合タンパク質を含むプライム編集因子システムを指し、ここで、PE融合は、以下のように示される配列番号100のアミノ酸配列を有する。

あるいは、PE1はまた、配列番号100の、すなわちそれと複合体化したpegRNAを含まない、プライム編集因子融合タンパク質を指してもよい。PE1は、操作中及び/又はプライム編集での使用中にpegRNAと複合体化されてもよい。

PE2
本明細書で使用される場合、「PE2」は、Cas9(H840A)と、以下の構造:［NLS］-［Cas9(H840A)］-［リンカー］-［MMLV_RT(D200N)(T330P)(L603W)(T306K)(W313F)］＋所望のPEgRNAを有するバリアントMMLV RTとを含む融合タンパク質を含むプライム編集システムを指し、PE融合体は、以下のように示される配列番号107のアミノ酸配列を有する。

あるいは、PE2はまた、配列番号107の、すなわちそれと複合体化したpegRNAを含まない、プライム編集因子融合タンパク質を指してもよい。PE2は、操作中及び/又はプライム編集での使用中にpegRNAと複合体化されてもよい。

PE3
本明細書において用いられる「PE3」は、PE2、プラスPE2と複合体化する第2鎖ニッキングガイドRNAを指し、編集される鎖の選好的置き換えを誘導するために非編集DNA鎖上にニックを導入する。

PE3b
本明細書において用いられる「PE3b」はPE3を指すが、第2鎖ニッキングガイドRNAは、所望の編集の組み入れ後までは第2鎖ニックが組み入れされないようにして時間的コントロールのためにデザインされる。これは、元のアレルではなく編集された鎖のみにマッチするスペーサ配列を有するgRNAをデザインすることによって達成される。以降ではPE3bと呼ばれるこの戦略を用いると、プロトスペーサと編集されないアレルとの間のミスマッチは、PAM鎖上の編集イベントが生起する後までは、sgRNAによるニッキングを好まないはずである。

PE4
本明細書で使用される場合、「PE4」は、PE2と、トランスで発現されるMLH1ドミナントネガティブタンパク質(すなわち、本明細書に更に記載されるように、アミノ酸754～756が切断された野生型MLH1)とを含む系を指す。いくつかの態様では、PE4は、任意選択のリンカーを介して連結されたPE2及びMLH1ドミナントネガティブタンパク質を含む融合タンパク質を指す。

PE5
本明細書で使用される場合、「PE5」は、PE3と、トランスで発現されるMLH1ドミナントネガティブタンパク質(すなわち、本明細書で更に記載されるようにアミノ酸754～756が欠失した野生型MLH1(これは「MLH1 Δ754-756」又は「MLH1dn」と呼ばれてもよい))とを含む系を指す。いくつかの態様では、PE5は、任意選択のリンカーを介して連結されたPE3及びMLH1ドミナントネガティブタンパク質を含む融合タンパク質を指す。

PEmax
本明細書で使用される場合、「PEmax」(図54Bを参照)は、以下の構造:［二部分NLS］-［Cas9(R221K)(N394K)(H840A)］-［リンカー］-［MMLV_RT(D200N)(T330P)(L603W)］-［二部分NLS］-［NLS］＋所望のPEgRNAを有する、Cas9(R221K N394K H840A)及びバリアントMMLV RT五変異体(D200N T306K W313F T330P L603W)を含む融合タンパク質を含むPE複合体を指し、PE融合体は、配列番号99のアミノ酸配列を有する。

PE4max
本明細書で使用される場合、「PE4max」はPE4を指すが、PE2成分はPEmaxで置換されている。

PE5max
本明細書で使用される場合、「PE5max」はPE5を指すが、PE3のPE2成分はPEmaxで置換されている。

PE-短
本明細書で使用される場合、「PE-短」は、C末端切断逆転写酵素に融合され、以下のアミノ酸配列を有するPE構築物を指す:

ポリメラーゼ
本明細書において用いられる用語「ポリメラーゼ」は、本明細書に記載のプライム編集因子システムに関して用いられてもよいヌクレオチド鎖を合成する酵素を指す。ポリメラーゼは「鋳型依存性」ポリメラーゼであり得る(すなわち、鋳型鎖のヌクレオチド塩基の順序に基づいてヌクレオチド鎖を合成するポリメラーゼ)。ポリメラーゼは「鋳型非依存性」ポリメラーゼでもまたあり得る(すなわち、鋳型鎖の要件なしにヌクレオチド鎖を合成するポリメラーゼ)。ポリメラーゼは更に「DNAポリメラーゼ」又は「RNAポリメラーゼ」としてもまた類別されてもよい。種々の態様において、プライム編集因子システムはDNAポリメラーゼを含む。種々の態様において、DNAポリメラーゼは「DNA依存性DNAポリメラーゼ」であり得る(すなわち、それによると、鋳型分子はDNAの鎖である)。かかるケースでは、DNA鋳型分子はPEgRNAであり得、伸長アームはDNAの鎖を含む。かかるケースでは、PEgRNAはキメラ又はハイブリッドPEgRNAと呼ばれてもよく、これはRNA部分(すなわち、スペーサ及びgRNAコアを包含するガイドRNA構成要素)とDNA部分(すなわち伸長アーム)とを含む。種々の他の態様において、DNAポリメラーゼは「RNA依存性DNAポリメラーゼ」であり得る(すなわち、それによると、鋳型分子はRNAの鎖である)。かかるケースでは、PEgRNAはRNAであり、すなわちRNA伸長を包含する。用語「ポリメラーゼ」はまた、ヌクレオチドの重合を触媒する酵素を指してもよい(すなわちポリメラーゼ活性)。一般的に、酵素は、ポリヌクレオチド鋳型配列にアニーリングしたプライマー(例として、PEgRNAのプライマー結合部位にアニーリングしたプライマー配列等)の3'端において合成を開始し、鋳型鎖の5'端の方へ進むであろう。「DNAポリメラーゼ」はデオキシヌクレオチドの重合を触媒する。DNAポリメラーゼを参照して本明細書において用いられる用語DNAポリメラーゼは、「その機能的フラグメント」を包含する。「その機能的フラグメント」は、少なくとも1つのセットの条件下においてはポリヌクレオチドの重合を触媒する能力を保持する、ポリメラーゼのアミノ酸配列全体未満を包摂する野生型又は変異体DNAポリメラーゼのいずれかの部分を指す。かかる機能的フラグメントは別個の実態として存在し得てもよいか、又はそれは融合タンパク質等のより大きいポリペプチドの構成要素であってもよい。

プライム編集
本明細書において用いられる用語「プライム編集」は、遺伝子編集のためのアプローチを指し、napDNAbp、ポリメラーゼ(例として、逆転写酵素)、及び次いで標的DNA配列上に組み込まれる所望の新たな遺伝情報をコードする(又は遺伝情報を欠失する)ためのDNA合成鋳型を包含する特殊化したガイドRNAを用いる。プライム編集の特定の態様は、図1の態様に記載されている。古典的なプライム編集は、Anzalone,A.V.et al.Search-and-replace genome editing without double-strand breaks or donor DNA.Nature 576,149-157(2019)(参照によりその全体が本明細書に組み込まれる)の発明者らの刊行物に記載されている。

プライム編集は、規定されたDNA部位に新たな遺伝情報を直接的に書き込む汎用的な且つ精密なゲノム編集法であるゲノム編集のためのプラットフォームを表し、ポリメラーゼ(すなわち、融合タンパク質の形態で、又はさもなければnapDNAbpとトランスで提供されて)と共同で働く核酸プログラム可能DNA結合タンパク質(「napDNAbp」)を用いる。プライム編集システムはプライム編集(PE)ガイドRNA(「PEgRNA」)によってプログラムされ、これは、標的部位を規定すると共に、ガイドRNA上に(例として、ガイドRNAの5'若しくは3'端に又は内部の部分に)操作された伸長(DNA又はRNAどちらか)によって置き換えDNA鎖の形態での所望の編集の合成の鋳型となる。所望の編集(例として、1核酸塩基置換)を含有する置き換え鎖は、編集されるべき標的部位の(ニック部位の直ちに下流の)内因性の鎖と同じ配列を共有する(又はそれに対して相同的である)(それが所望の編集を包含するということを例外とする)。DNA修復及び/又は複製機構によって、ニック部位の下流の内因性の鎖は、所望の編集を含有する新たに合成された置き換え鎖によって置き換えられる。いくつかのケースでは、プライム編集は「検索置換」ゲノム編集テクノロジーと考えられてもよい。なぜなら、本明細書に記載のプライム編集因子は、編集されるべき所望の標的部位を検索し位置付けるのみならず、同時に、対応する標的部位の内因性DNA鎖の代わりに組み入れされる所望の編集を含有する置き換え鎖をコードするからである。本開示のプライム編集因子は、部分的には、高効率及び遺伝的柔軟性を有する精密なCRISPR/Casベースのゲノム編集を行うために操作され得る、ターゲット・プライミング逆転写(TPRT)の機構に関する。TPRTは、哺乳動物非LTRレトロトランスポゾン及び細菌グループIIイントロン等の可動DNAエレメントによって用いられる。本発明者らは、本明細書において、Casタンパク質-逆転写酵素融合体又は関係するシステムを用いて、ガイドRNAによって特定のDNA配列を標的化し、標的部位に一本鎖ニックを生成し、ガイドRNAに取り入れされた操作された逆転写酵素鋳型の逆転写のためのプライマーとして、ニックが入ったDNAを用いた。しかしながら、概念はDNAポリメラーゼ構成要素として逆転写酵素を用いるプライム編集因子から始まるが、本明細書に記載のプライム編集因子は逆転写酵素に限定されず、実質的にいずれかのDNAポリメラーゼの使用を包含してもよい。実に、本明細書は、至る所で、「逆転写酵素」を有するプライム編集因子を指してもよいが、逆転写酵素は、プライム編集で働いてもよいDNAポリメラーゼの1つの型であるのみであるということがここで明示される。それゆえに、本明細書が「逆転写酵素」に言及するところではいつも、当業者は、いずれかの好適なDNAポリメラーゼが逆転写酵素の代わりに用いられてもよいということを了解するべきである。それゆえに、一側面において、プライム編集因子はCas9(又は同等のnapDNAbp)を含んでもよく、これは、標的DNA上の相補的なプロトスペーサにアニールするスペーサ配列を含有する特殊化したガイドRNA(すなわちPEgRNA)とそれを会合させることによって、DNA配列を標的化するようにプログラムされる。特殊化したガイドRNAは、所望の遺伝子変改を含有するDNAの置き換え鎖をコードする伸長の形態の新たな遺伝情報をもまた含有し、これは、標的部位における対応する内因性DNA鎖を置き換えるために用いられる。PEgRNAからの情報を標的DNAに移入するために、プライム編集の機序には、DNAの1つの鎖上の標的部位へニックを入れて3'ヒドロキシル基を暴露することを伴う。次いで、暴露された3'ヒドロキシル基は、直接的に標的部位へのPEgRNA上の編集をコードする伸長のDNA重合をプライムするために用いられ得る。種々の態様において、編集を含有する置き換え鎖の重合のための鋳型を提供する伸長は、RNA又はDNAから形成され得る。RNA伸長のケースでは、プライム編集因子のポリメラーゼはRNA依存性DNAポリメラーゼ(例えば逆転写酵素)であり得る。DNA伸長のケースでは、プライム編集因子のポリメラーゼはDNA依存性DNAポリメラーゼであってもよい。本明細書に開示のプライム編集因子によって形成される新たに合成された鎖(すなわち、所望の編集を含有する置き換えDNA鎖)は、所望のヌクレオチド変化(例として、1ヌクレオチド変化、欠失、若しくは挿入、又はそれらの組み合わせ)の包含を例外として、ゲノム標的配列に対して相同的である(すなわち、それと同じ配列を有する)であろう。DNAの新たに合成された(又は置き換え)鎖は一本鎖DNAフラップともまた呼ばれてもよい。これは相補的な相同的な内因性DNA鎖とのハイブリダイゼーションについて競合し、それによって対応する内因性の鎖に取って代わるであろう。ある態様において、システムは、エラーを起こしやすい逆転写酵素酵素の使用と組み合わせられ得る(例として、Cas9ドメインとの融合タンパク質として提供されるか、又はCas9ドメインに対してトランスで提供される)。エラーを起こしやすい逆転写酵素酵素は一本鎖DNAフラップの合成の間に変改を導入し得る。それゆえに、ある態様において、エラーを起こしやすい逆転写酵素は、標的DNAへのヌクレオチド変化を導入するために利用され得る。システムに用いられるエラーを起こしやすい逆転写酵素に依存して、変化はランダム又は非ランダムであり得る。ハイブリダイズした中間体(内因性DNA鎖にハイブリダイズした逆転写酵素によって合成される一本鎖DNAフラップを含む)の分解は、内因性DNAのもたらされる取って代わられたフラップの除去(例として、5'端DNAフラップエンドヌクレアーゼFEN1による)、標的DNAに対する合成された一本鎖DNAフラップのライゲーション、並びに細胞性のDNA修復及び/又は複製プロセスの結果としての所望のヌクレオチド変化の同化を包含し得る。鋳型によるDNA合成は挿入及び欠失を包含するいずれかのヌクレオチドの修飾について1ヌクレオチド精度をオファーするので、このアプローチの範囲は非常に幅広く、予見可能には、基礎研究及び処置学において無数の適用に用いられ得る。

種々の態様において、プライム編集は、プライム編集ガイドRNA(PEgRNA)と複合体化した核酸プログラム可能DNA結合タンパク質(napDNAbp)と標的DNA分子(これについて、ヌクレオチド配列の変化が導入されることが望まれる)を接触させることによって作動する。様々な態様では、プライム編集ガイドRNA(PEgRNA)は、ガイドRNAの3'若しくは5'端、又はガイドRNA内の分子内位置に伸長を含み、所望のヌクレオチド変化(例として、単一ヌクレオチドの変化、挿入又は欠失)をコードする。工程(a)において、napDNAbp/伸長gRNA複合体はDNA分子と接触し、伸長gRNAはnapDNAbpを誘導して標的遺伝子座に結合させる。工程(b)では、標的遺伝子座のDNAの鎖の1つにニックが導入され(例として、ヌクレアーゼ又は化学的薬剤による)、それによって利用可能な3'端を標的遺伝子座の鎖の1つに作成する。ある態様において、ニックは、Rループ鎖に対応するDNAの鎖、すなわちガイドRNA配列にハイブリダイズされない鎖、すなわち「非標的鎖」上に作成される。しかしながら、ニックは鎖のどちらかに導入され得る。すなわち、ニックは、Rループの「標的鎖」(すなわち、伸長されたgRNAのプロトスペーサにハイブリダイズした鎖)又は「非標的鎖」(すなわち、Rループの一本鎖部分を形成し、標的鎖に相補的な鎖)に導入され得た。工程(c)では、DNA鎖の3'端(ニックによって形成される)は、逆転写をプライムするためにガイドRNAの伸長された部分と相互作用する(すなわち、「プライム標的にプライムされたRT」)。ある態様において、3'端DNA鎖は、ガイドRNAの伸長された部分の特異的なRTプライム配列、すなわちPEgRNA上の「逆転写酵素プライム配列」又は「プライマー結合部位」にハイブリダイズする。工程(d)では、逆転写酵素(又は他の好適なDNAポリメラーゼ)が導入される。これは、プライムされた部位の3'端からプライム編集ガイドRNAの5'端の方へDNAの一本鎖を合成する。DNAポリメラーゼ(例として逆転写酵素)はnapDNAbpに融合され得るか、又は代替的にはnapDNAbpに対してトランスで提供され得る。これは、ニック部位の又はそれに隣接する内因性DNAに対してさもなければ相同的である所望のヌクレオチド変化(例として、1塩基変化、挿入、若しくは欠失、又はそれらの組み合わせ)を含む一本鎖DNAフラップを形成する。工程(e)では、napDNAbp及びガイドRNAがリリースされる。工程(f)及び(g)は一本鎖DNAフラップの分解に関し、その結果、所望のヌクレオチド変化が標的遺伝子座に組み込まれるようになる。このプロセスは、ひとたび3'一本鎖DNAフラップが内因性DNA配列に侵入及びハイブリダイズすると形成する対応する5'内因性DNAフラップを除去することによって、所望の産物形成の方へ駆動され得る。理論に束縛されるものではないが、細胞の内因性DNA修復及び複製プロセスは、ミスマッチのDNAを分解して、ヌクレオチド変化(単数又は複数)を組み込んで、所望の変改された産物を形成する。プロセスはまた、「第2の鎖ニッキング」による生成物形成に向けて推進され得る。このプロセスは次の遺伝子変化の少なくとも1以上を導入してもよい:トランスバージョン、トランジション、欠失、及び挿入。

「プライム編集因子(PE)システム」又は「プライム編集因子(PE)」又は「PEシステム」又は「PE編集システム」という用語は、本明細書に記載のターゲット・プライミング逆転写(TPRT)を使用するゲノム編集の方法を伴う組成物を指し、それは、限定するものではないが、napDNAbps、逆転写酵素(又は別のDNAポリメラーゼ)、融合タンパク質(例として、napDNAbps及び逆転写酵素を含むか、又はnapDNAbps及びDNAポリメラーゼを含む)、プライム編集ガイドRNA、並びに融合タンパク質及びプライム編集ガイドRNAを含む複合体、並びに編集生成物形成に向けてプライム編集プロセスを推進するのを助けるための第2鎖ニッキング成分(例として、第2鎖sgRNA)及び5'内因性DNAフラップ除去エンドヌクレアーゼ(例として、FEN1)等の補助要素を包含する。

ここまで記載された態様では、PEgRNAは、ガイドRNA(これは、それ自体が、スペーサ配列及びgRNAコア又は足場を含む)とプライマー結合部位及びDNA合成鋳型を含む5'又は3'伸長アームとを含む単一分子を構成するが、PEgRNAは2つの個々の分子の形態をもまたとってもよく、ガイドRNAと、トランスプライム編集因子RNA鋳型(tPERT)とからなる。これは、本質的に、伸長アーム(特に、プライマー結合部位及びDNA合成ドメインを包含する)及びRNA-タンパク質動員ドメイン(例として、MS2アプタマー又はヘアピン)を同じ分子上に収容する。これは、tPERT動員タンパク質(例として、MS2アプタマーに結合するMS2cpタンパク質)を含む修飾されたプライム編集因子複合体へと共局在又は動員されるようになる。

プライム編集因子
用語「プライム編集因子」は、napDNAbp(例として、Cas9ニッカーゼ)及び逆転写酵素を含む融合構築物を指し、PEgRNA(又は「伸長されたガイドRNA」)の存在下で標的ヌクレオチド配列上にプライム編集を遂行することが可能である。用語「プライム編集因子」は、融合タンパク質、又はPEgRNAと複合体化された融合タンパク質、及び/又は第2鎖へニックを入れるsgRNAと更に複合体化された融合タンパク質を指してもよい。いくつかの態様において、プライム編集因子はまた、本明細書に記載の通りの非編集済鎖の第2部位へのニック入れ工程へ向かうことが可能な、融合タンパク質(napDNAbpと融合した逆転写酵素)、PEgRNA、及び定例の(regular)ガイドRNAを含む複合体も指してもよい。特定の態様では、プライム編集因子(例として、PE1、PE2、又はPE3)が、ドミナントネガティブMLH1タンパク質等のDNAミスマッチ修復経路の阻害剤と共にシステムとして提供されてもよい。様々な態様では、ドミナントネガティブMLH1タンパク質等のDNAミスマッチ修復経路の阻害剤は、プライム編集因子にトランスで提供されてもよい。他の態様では、ドミナントネガティブMLH1タンパク質等のDNAミスマッチ修復経路の阻害剤は、プライム編集因子に複合体化されてもよく、例としてリンカーを介してプライム編集因子融合タンパク質にカップリングされてもよい。

プライマー結合部位
「プライマー結合部位」又は「PBS」という用語は、伸長アーム(例えば、伸張アームの3'端において)の構成要素としてのPEgRNAの部分を指す。「プライマー結合部位」という用語は、非標的鎖上の配列と相補性の領域を含む伸長アームの構成要素としてのPEgRNAの一本鎖部分を指す。いくつかの態様において、プライマー結合部位は、非標的鎖におけるニック部位の上流の領域に相補的である。いくつかの態様において、プライマー結合部位は、非標的鎖におけるニック部位のすぐ上流の領域に相補的である。いくつかの態様において、プライマー結合部位は、プライム編集因子による標的配列のニッキング(例として、プライム編集因子のニッカーゼ成分、例えばCas9ニッケース)後に形成されるプライマー配列に結合することができる。プライム編集因子が標的DNA配列の1つの鎖を切断すると(例として、プライム編集因子のCasニッカーゼ構成要素)、3'端ssDNAフラップが形成され、これは、逆転写をプライミングするためにPEgRNA上のプライマー結合部位にアニーリングするプライマー配列に役立つ。いくつかの態様では、PBSは、ニック部位の二本鎖標的DNAの非標的鎖上の遊離3'端に相補的又は実質的に相補的であり、アニールし得る。いくつかの態様では、非標的鎖上の遊離3'端にアニーリングしたPBSは、標的プライミングDNA合成を開始し得る。

プロトスペーサ
本明細書において用いられる用語「プロトスペーサ」はPAM(プロトスペーサ隣接モチーフ)配列に隣接するDNA上の配列(～20bp)を指す。プロトスペーサはガイドRNAのスペーサ配列と同じ配列を共有する。ガイドRNAは標的DNA上のプロトスペーサ配列の相補体(具体的には、それの1つの鎖、すなわち標的DNA配列の「非標的鎖」に対する「標的鎖」)にアニールする。いくつかの態様では、プライム編集因子のCasニッカーゼ成分が機能するためには、Casタンパク質成分自体、例としてCasタンパク質の種類に応じて変化する特定のプロトスペーサ隣接モチーフ(PAM)も必要である。例えば、S.pyogenesに由来する最も普通に用いられるCas9ヌクレアーゼは、ゲノムDNA上の標的配列の直接的に下流であると見出される非標的鎖上のNGGというPAM配列を認識する。当業者は、現況技術の文献が、場合によっては、それを「スペーサ」と指すよりもむしろ、ガイドRNAそれ自体の上の～20-nt標的特異的ガイド配列として「プロトスペーサ」を指すということを了解するであろう。それゆえに、いくつかのケースでは、本明細書において用いられる用語「プロトスペーサ」は用語「スペーサ」と交換可能に用いられてもよい。「プロトスペーサ」又は「スペーサ」どちらかの出現の周囲の記載という文脈は、用語がgRNA又はDNA標的を参照しているかどうかについて読み手に情報提供することを助けるであろう。

プロトスペーサ隣接モチーフ(PAM)
本明細書において用いられる用語「プロトスペーサ隣接配列」又は「PAM」は、Cas9ヌクレアーゼの重要な標的化構成要素であるおよそ2-6塩基対のDNA配列を指す。典型的には、PAM配列はどちらかの鎖上にあり、Cas9によってカットされる部位の5'→3'方向においては下流である。標準的なPAM配列(すなわち、Streptococcus pyogenesのCas9ヌクレアーゼ又はSpCas9に会合されるPAM配列)は5'-NGG-3'であり、「N」は2つのグアニン(「G」)核酸塩基によって後続されるいずれかの核酸塩基である。異なるPAM配列が異なる生物からの異なるCas9ヌクレアーゼ又は同等タンパク質と関連され得る。加えて、いずれかの所与のCas9ヌクレアーゼ、例としてSpCas9は、ヌクレアーゼが代替的なPAM配列を認識するようにしてヌクレアーゼのPAM特異性を変改するように修飾されてもよい。

例えば、配列番号2の標準的なSpCas9アミノ酸配列を参照して、PAM配列は1つ以上の変異を導入することによって修飾され得る。(a)PAM特異性をNGAN又はNGNGへと変改するD1135V、R1335Q、及びT1337R「VQRバリアント」、(b)PAM特異性をNGAGへと変改するD1135E、R1335Q、及びT1337R「EQRバリアント」、並びに(c)PAM特異性をNGCGへと変改するD1135V、G1218R、R1335E、及びT1337R「VRERバリアント」を包含する。加えて、標準的なSpCas9のD1135EバリアントはなおNGGを認識するが、それは野生型SpCas9タンパク質と比較して選択的である。

異なる細菌種からのCas9酵素(すなわち、Cas9オルソログ)は様々なPAM特異性を有し得るということもまた了解されるであろう。例えば、Staphylococcus aureusからのCas9(SaCas9)はNGRRT又はNGRRNを認識する。加えて、Neisseria meningitisからのCas9(NmCas)はNNNNGATTを認識する。別の例では、Streptococcus thermophilisからのCas9(StCas9)はNNAGAAWを認識する。なお別の例では、Treponema denticolaからのCas9(TdCas)はNAAAACを認識する。これらは例であって、限定することを意味されない。更に、非SpCas9が種々のPAM配列に結合するということは了解されるであろう。これは、好適なSpCas9 PAM配列が所望の標的のカットされる部位に存在しないときにそれらを有用にする。更にその上、非SpCas9は、それらをSpCas9よりも有用にする他の特徴を有してもよい。例えば、Staphylococcus aureusからのCas9(SaCas9)はSpCas9よりも約1キロベース小さい。そのため、それはアデノ随伴ウイルス(AAV)にパッケージングされ得る。Shah et al.,「Protospacer recognition motifs:mixed identities and functional diversity,」RNA Biology,10(5):891-899の更なる参照がなされてもよい(これは参照によって本明細書に組み込まれる)。

逆転写酵素
用語「逆転写酵素」はRNA依存性DNAポリメラーゼとして特徴付けられるポリメラーゼのあるクラスを記述する。全ての公知の逆転写酵素はRNA鋳型からDNA転写物を合成するためにはプライマーを要求する。歴史的には、逆転写酵素は主としてmRNAをcDNAに転写するために用いられている。これは次いで更なる操作のためにベクター上にクローニングされ得る。トリ骨髄芽球症(myoblastosis)ウイルス(AMV)逆転写酵素は最初の広く用いられるRNA依存性DNAポリメラーゼであった(Verma,Biochim.Biophys.Acta 473:1(1977))。酵素は、5'-3'RNA指令型DNAポリメラーゼ活性、5'-3'DNA指令型DNAポリメラーゼ活性、及びRNase H活性を有する。RNase HはRNA-DNAハイブリッドのRNA鎖に特異的なプロセッシブな5'及び3'リボヌクレアーゼである(Perbal,A Practical Guide to Molecular Cloning,New York:Wiley&Sons(1984))。公知のウイルス逆転写酵素はプルーフリーディングにとって必要な3'-5'エキソヌクレアーゼ活性を欠くので、転写のエラーは逆転写酵素によって修正され得ない(Saunders and Saunders,Microbial Genetics Applied to Biotechnology,London:Croom Helm(1987))。AMV逆転写酵素の活性及びその関連するRNase H活性の詳細な研究は、Berger et al.,Biochemistry 22:2365-2372(1983)によって提示されている。分子生物学に鋭意用いられる別の逆転写酵素はモロニーマウス白血病ウイルス(M-MLV)を起源とする逆転写酵素である。例として、Gerard,G.R.,DNA 5:271-279(1986)及びKotewicz,M.L.,et al.,Gene 35:249-258(1985)を参照。RNase H活性を実質的に欠くM-MLV逆転写酵素もまた記載されている。例としてU.S.Pat.No.5,244,797を参照。本発明はいずれかのかかる逆転写酵素又はそれらのバリアント若しくは変異体の使用を企図する。

加えて、本発明は、エラーを起こしやすい、すなわちエラーを起こしやすい逆転写酵素と呼ばれてもよい逆転写酵素、又は重合の間にヌクレオチドの高忠実性組み込みを支持しない逆転写酵素の使用を企図する。ガイドRNAと取り入れされたRT鋳型に基づく一本鎖DNAフラップの合成の間に、エラーを起こしやすい逆転写酵素は、RT鋳型配列とミスマッチである1以上のヌクレオチドを導入し得、それによって、一本鎖DNAフラップの誤りがちな重合によってヌクレオチド配列に変化を導入する。次いで、一本鎖DNAフラップの合成の間に導入されるこれらのエラーは、対応する内因性標的鎖に対するハイブリダイゼーション、取って代わられた内因性の鎖の除去、ライゲーション、並びに次いで内因性DNA修復及び/又は配列決定プロセスのもう1つのラウンドによって、二本鎖分子上に取り入れられるようになる。

逆転写
本明細書において用いられる用語「逆転写」は、酵素がRNAを鋳型として用いてDNA鎖(つまり、相補的なDNA又はcDNA)を合成する能力を指示する。いくつかの態様では、逆転写は「エラーを起こしやすい逆転写」であり得る。これは、それらのDNA重合活性がエラーを起こしやすい、ある種の逆転写酵素の特性を指す。

タンパク質、ペプチド、及びポリペプチド
用語「タンパク質」、「ペプチド」、及び「ポリペプチド」は本明細書中、互換的に使用され、ペプチド(アミド)結合によって一緒に連結されたアミノ酸残基の重合体を指す。用語は、いずれのサイズ、構造、若しくは機能の、タンパク質、ペプチド、又はポリペプチドを指す。典型的には、タンパク質、ペプチド、又はポリペプチドは、少なくとも3アミノ酸長であろう。タンパク質、ペプチド、又はポリペプチドは、個々のタンパク質又はタンパク質の一群を指してもよい。タンパク質、ペプチド又はポリペプチド中のアミノ酸の1つ以上は、例えば、炭水化物基、ヒドロキシル基、リン酸基、ファルネシル基、イソファルネシル基、脂肪酸基、コンジュゲーション、官能化又は他の修飾のためのリンカー等の化学的実体の添加によって修飾されてもよい。タンパク質、ペプチド又はポリペプチドはまた、単一分子であってもよく、又は多分子複合体であってもよい。タンパク質、ペプチド、又はポリペプチドは、天然に存在するタンパク質又はペプチドのただのフラグメントであってもよい。タンパク質、ペプチド、又はポリペプチドは、天然に存在するもの、組換え体、又は合成物、又はいずれのそれらの組み合わせであってもよい。本明細書に提供されるタンパク質のいずれも、当該技術分野において知られているいずれの方法によって産生されてもよい。例えば、本明細書に提供されるタンパク質は、ペプチドリンカーを含む融合タンパク質に特に適した、組換えタンパク質の発現及び精製を介して産生されてもよい。組換えタンパク質の発現及び精製のための方法は周知であり、Green and Sambrook,Molecular Cloning:A Laboratory Manual(4th ed.,Cold Spring Harbor Laboratory Press,Cold Spring Harbor,N.Y.(2012)(これらの内容全体は参照により本明細書に組み込まれる))によって記載されるものを包含する。

サイレント変異
本明細書で使用される場合、「サイレント変異」という用語は、核酸分子の表現型、又はタンパク質をコードする場合にそれが産生するタンパク質に影響を及ぼさない核酸分子の変異を指す。サイレント変異は、核酸のコード領域(すなわち、タンパク質をコードする遺伝子のセグメント)に存在し得るか、又は核酸の非コード領域に存在し得る。核酸配列、例として標的DNA配列又は標的配列にインストールされるDNA合成鋳型配列におけるサイレント変異は、核酸配列によってコードされるアミノ酸配列の発現又は機能、あるいは標的核酸配列の他の機能的特徴をもたらさないヌクレオチド変化であってもよい。コード領域にサイレント変異が存在する場合、それらは同義変異であってもよい。同義変異は、遺伝子によって産生されるタンパク質の対応するアミノ酸残基が修飾されないような、遺伝子内のある塩基の別の塩基への置換を指す。これは、特定の生物において同じアミノ酸をコードする複数の異なるコドンを可能にする遺伝暗号の冗長性に起因する。サイレント突然変異が非コード領域又はコード領域と非コード領域との接合部(例として、イントロン/エクソン接合部)にある場合、それは核酸分子のいかなる生物学的特性にも影響を及ぼさない領域(例として、スプライシング、遺伝子調節、RNA寿命等)にあってもよい。サイレント変異は、例えば、本明細書に記載のMMR経路による編集の修正を回避するためにプライム編集を使用して標的ヌクレオチド配列に対して行われる編集の長さを増加させるために有用であってもよい。ある特定の態様において、インストールされるサイレント変異の数は、1つ、又は2つ、又は3つ、又は4つ、又は5つ、又は6つ、又は7つ、又は8つ、又は9つ、又は10以上であってもよい。少なくとも2つのサイレント変異を伴う特定の他の態様では、サイレント変異は、意図された編集部位から1、又は2、又は3、又は4、又は5、又は6、又は7、又は8、又は9、又は10、又は11、12、13、14、15、16、17、18、19、20、21、22、23、24、又は25ヌクレオチド以内にインストールされてもよい。

スペーサ配列
本明細書で使用される場合、ガイドRNA又はPEgRNAに関連する「スペーサ配列」という用語は、標的DNA配列中のプロトスペーサ配列と同じ配列を共有するヌクレオチド配列を含有する約20ヌクレオチド(例として、16、17、18、19、20、21、22、23又は24ヌクレオチド)のガイドRNA又はPEgRNAの部分を指す。スペーサ配列は、プロトスペーサ配列の相補体にアニールして、標的部位にssRNA/ssDNAハイブリッド構造及び内因性DNA鎖の対応するRループssDNA構造を形成する。

標的部位
用語「標的部位」は、本明細書に開示のプライム編集因子(PE)によって編集される核酸分子上の配列を指す。標的部位は、編集される核酸分子内の内因性配列、例として、DNA合成テンプレート上に存在するインストールされる1つ以上のヌクレオチド編集を除いて(及びDNA合成テンプレートがチミンの代わりにウラシルを含有することを除いて)DNA合成テンプレートの配列と同一である標的ゲノムの内因性ゲノム配列、又はDNA合成テンプレート上に存在するインストールされる1つ以上のヌクレオチド編集の位置における1つ以上のミスマッチを除いてDNA合成テンプレートと相補的な非標的鎖上の対応する内因性配列を指してもよい。更に、標的部位はまた、プライム編集因子(PE)及びgRNAの複合体が結合する核酸分子上の配列を指してもよい。

バリアント
本明細書に使用されるとき、用語「バリアント」は、天然に存在するものから逸脱したパターンを有する属性(qualities)を呈するものを意味するとして解釈されるはずであり、例として、バリアントCas9は、野生型Cas9アミノ酸配列と比較してアミノ酸残基中に1以上の変化を含むCas9である。用語「バリアント」は、参照配列と少なくとも75％、又は少なくとも80％、又は少なくとも85％、又は少なくとも90％、又は少なくとも95％、又は少なくとも99％のパーセント同一性を有し、参照配列と同じか又は実質的に同じ機能活性(単数若しくは複数)を有する、相同のタンパク質を包括する(encompasses)。用語はまた、参照配列の突然変異体、トランケーション体(truncations)、又はドメインであって、参照配列と同じか又は実質的に同じ機能活性(単数若しくは複数)を呈示するものも包括する。

ベクター
用語「ベクター」は、本明細書に使用されるとき、着目する遺伝子をコードするよう修飾され得る核酸であって、宿主細胞中へ入って宿主細胞内で突然変異又は複製する(次いでベクターの複製形態を別の宿主細胞中へ移す)ことができる核酸を指す。例示の好適なベクターは、レトロウイルスベクター又はバクテリオファージ及び繊維状ファージ、及び接合性プラスミド等の、ウイルスベクターを包含する。追加の好適なベクターは、本開示に基づき当業者に明らかであろう。

特定の態様の詳細な説明
本開示は、標的部位のプライム編集を行いながらDNAミスマッチ修復経路を阻害することによって、改善された編集効率及び/又は低減されたインデル形成を有するプライム編集のための組成物及び方法を提供する。本発明者らは、驚くべきことに、プライム編集の編集効率が、DNAミスマッチ修復(MMR)系の1つ以上の機能がプライム編集中に阻害され、阻止され、又はそうでなければ不活性化されるときに有意に増加(例として、2倍増加、3倍増加、4倍増加、5倍増加、6倍増加、7倍増加、8倍増加、9倍増加、10倍増加、11倍増加、12倍増加、13倍増加、14倍増加、15倍増加、16倍増加、17倍増加、18倍増加、19倍増加、20倍増加、21倍増加、22倍増加、23倍増加、24倍増加、26倍増加、27倍増加、28倍増加、29倍増加、30倍増加、31倍増加、32倍増加、33倍増加、34倍増加、35倍増加、36倍増加、37倍増加、38倍増加、39倍増加、40倍増加、41倍増加、42倍増加、43倍増加、44倍増加、45倍増加、46倍増加、47倍増加、48倍増加、49倍増加、50倍増加、51倍増加、52倍増加、53倍増加、54倍増加、55倍増加、56倍増加、57倍増加、58倍増加、59倍増加、60倍増加、61倍増加、62倍増加、63倍増加、64倍増加、65倍増加、66倍増加、67倍増加、68倍増加、69倍増加、70倍増加、71倍増加、72倍増加、73倍増加、74倍増加、75倍増加、76倍増加、77倍増加、78倍増加、79倍増加、80倍増加、81倍増加、82倍増加、83倍増加、84倍増加、85倍増加、86倍増加、87倍増加、88倍増加、89倍増加、90倍増加、91倍増加、92倍増加、93倍増加、94倍増加、95倍増加、96倍増加、97倍増加、98倍増加、99倍増加、100倍以上増加)されてもよいことを見出した。加えて、本発明者らは、驚くべきことに、プライム編集から生じるインデル形成の頻度が、DNAミスマッチ修復(MMR)系の1つ以上の機能がプライム編集中に阻害されるか、阻止されるか、又は他の様態で不活性化されるとき、有意に低下してもよい(例として、2倍の減少、3倍の減少、4倍の減少、5倍の減少、6倍の減少、7倍の減少、8倍の減少、9倍の減少、又は10倍の減少又はそれ以下)ことを見出した。

本開示は、プライム編集の効率及び/又は特異性が細胞自身のDNAミスマッチ修復(MMR)DNA修復経路によって影響を受けるという驚くべき発見に関する。本明細書に記載されるように(例として、実施例1において)、本発明者らは、一態様では「プライム編集結果のためのプールされたCRISPRiスクリーニング」と呼ばれる新規な遺伝子スクリーニング方法を開発し、プライム編集の効率及び/又は特異性に影響を及ぼすものとして、MMRを包含する様々な遺伝子決定の同定をもたらした。したがって、一側面では、本開示は、MMRの効果を阻害及び/又は回避し、それによってプライム編集の効率及び/又は特異性を高めるための手段を含む新規なプライム編集システムを提供する。一態様では、本開示は、限定するものではないが、ドミナントネガティブMLH1タンパク質(すなわち、「MLH1dn」)等のドミナントネガティブMMRタンパク質等のMMR阻害タンパク質を含むプライム編集システムを提供する。別の態様において、プライム編集システムは、意図される編集の近くに1つ以上のサイレント変異をインストールすることを含み、それにより、MLH1dn等のMMR阻害タンパク質が存在しない場合であっても、意図される編集がMMR認識を回避することを可能にする。別の側面では、本開示は、プライム編集の効率及び/又は特異性に影響を及ぼすMMR等の遺伝子決定基を同定するための新規な遺伝子スクリーニングを提供する。なお更なる側面では、本開示は、本明細書に記載の改良されたプライム編集システムをコードする核酸構築物を提供する。他の側面における開示はまた、本明細書中に記載される改良されたプライム編集システムをコードする核酸を含むベクター(例として、AAV又はレンチウイルスベクター)を提供する。更に他の側面では、本開示は、本明細書に記載の改良されたプライム編集システムを含む細胞を提供する。本開示はまた、他の側面では、核酸及び/又はベクター構築物、ガイドRNA、pegRNA、細胞(例として、CRISPRi細胞)、並びに本明細書に開示される遺伝子スクリーニングを行うための他の試薬及び/又は材料を包含する遺伝子スクリーニングの成分を提供する。更に他の側面では、本開示は、本明細書に記載の改良されたプライム編集システムを含み、遺伝子療法、mRNA送達、ウイルス様粒子送達又はリボ核タンパク質(RNP)送達等の任意の適切な手段によって細胞、組織又は生物に投与することができる組成物及びキット、例として医薬組成物を提供する。更に別の側面では、本開示は、改良されたプライム編集システムを使用して、標的核酸分子、例としてゲノム遺伝子座に1つ以上の編集をインストールする方法を提供する。更に別の側面では、本開示は、改良されたプライム編集システムを使用して疾患又は障害を治療して、標的核酸分子、例として1つ以上の疾患を引き起こす突然変異を含むゲノム遺伝子座における1つ以上の遺伝子変化(例として、単一の多型)を修正又はさもなければ修復する方法を提供する。

一態様では、MLH1タンパク質は、阻害されるか、ブロックされるか、又はそうでなければ不活性化される。他の態様では、PMS2(又はMutLアルファ)、PMS1(又はMutLベータ)、MLH3(又はMutLガンマ)、MutSアルファ(MSH2-MSH6)、MutSベータ(MSH2-MSH3)、MSH2、MSH6、PCNA、RFC、EXO1、POLδ、及びPCNAを包含するがこれらに限定されない、MMR系の他のタンパク質が阻害、遮断、又は不活性化される。阻害は、阻害剤(例として、抗体若しくは小分子阻害剤、又はタンパク質の機能を破壊、遮断若しくは別の場合では不活性化するタンパク質のドミナントネガティブバリアント、例としてMLH1のドミナントネガティブ形態)でタンパク質を阻害することを伴ってもよい。阻害はまた、タンパク質分解(例として、MLH1のPROTACベースの分解)、転写レベルの阻害(例として、MLH1転写物の翻訳のsiRNA転写物分解/遺伝子サイレンシング又はマイクロRNAに基づく阻害)、又は遺伝子レベルでの阻害(すなわち、MLH1遺伝子の発現を不活性化若しくは低下させる変異をMLH1遺伝子(又は調節領域)にインストールすること、又はコードされたMLH1産物の活性を不活性化、遮断若しくは最小化する変異をインストールすること)等の任意の他の適切な手段を伴ってもよい。更に、本開示は、プライム編集因子(例として、逆転写酵素に融合したCas9ニッカーゼ等の、napDNAbpとポリメラーゼとを含む融合タンパク質として送達される)がDNAミスマッチ修復経路の任意の阻害剤と一緒に投与されてもよいことを企図する。

したがって、本開示は、プライム編集によって核酸分子を編集するための方法であって、核酸分子をプライム編集因子、pegRNA、及びDNAミスマッチ修復経路の阻害剤と接触させ、それによって編集効率を高め、及び/又はインデル形成を低下させて、標的部位に核酸分子に対する1つ以上の修飾をインストールすることを伴う、方法を提供する。本開示は更に、napDNAbpをコードする核酸配列、ポリメラーゼ、及びDNAミスマッチ修復経路の阻害剤を含むプライム編集によってDNA標的部位を編集するためのポリヌクレオチドを提供し、ここでnapDNAbp及びポリメラーゼは、編集効率の向上及び/又はインデル形成の低下を伴ってDNA標的部位に1つ以上の修飾をインストールするpegRNAの存在下で可能である。本開示は更に、本開示の組成物及びポリヌクレオチドを含むベクター、細胞及びキット、並びにそのようなベクター、細胞及びキットを作製する方法、並びにそのような組成物、ポリヌクレオチド、ベクター、細胞及びキットをin vitro、ex vivo(例として、体外の細胞を修飾する細胞ベースの治療中に)及びin vivoで細胞に送達する方法を提供する。

MMR経路
上に示されるように、本開示は、プライム編集の効率及び/又は特異性が細胞自身のDNAミスマッチ修復(MMR)DNA修復経路によって影響されるという観察に関する。DNAミスマッチ修復(MMR)は、ゲノム安定性の維持において重要な役割を果たす高度に保存された生物学的経路である(例として、図8A及び図8Bを参照)。Escherichia coli MutS及びMutL並びにそれらの真核生物ホモログ、それぞれMutSα及びMutLαは、MMR関連ゲノム維持における重要なプレイヤーである。様々な側面では、本開示は、DNAミスマッチ修復(MMR)システムを阻害、遮断、又はそうでなければ不活性化する任意の適切な手段を企図し、それは、遺伝子レベルで、例として、MMRシステムのタンパク質をコードする遺伝子(複数可)に1つ以上の突然変異を導入することによって、MMRシステムの1つ以上の重要なタンパク質を不活性化することを包含するが、これらに限定されない。そのようなタンパク質は、MLH1、PMS2(又はMutLアルファ)、PMS1(又はMutLベータ)、MLH3(又はMutLガンマ)、MutSアルファ(MSH2-MSH6)、MutSベータ(MSH2-MSH3)、MSH2、MSH6、PCNA、RFC、EXO1、POLδ及びPCNAを包含するが、これらに限定されない。そのような天然に存在するタンパク質及びそのバリアントのヌクレオチド及びアミノ酸配列は、当技術分野で知られている。例示の配列は次の通りである:本開示は、該MMRタンパク質又はそのバリアントの1つ以上の阻害、遮断、又は他の方法での不活性化がMMR経路の阻害、遮断、又は不活性化をもたらす限り、そのようなMMRタンパク質の任意の野生型又は天然に存在するバリアント、及びそのようなMMRタンパク質の任意の操作されたバリアント(単一又は複数のアミノ酸置換、欠失、挿入、再編成又は融合を包含する)を包含する、MMRを伴う任意の既知のタンパク質(「MMRタンパク質」)を不活性化する任意の阻害剤、遮断剤、ノックダウン戦略、又は他の手段の使用を受け入れる。任意の1つ以上のMMRタンパク質又はバリアントの阻害、遮断、又は不活性化は、遺伝子レベル(例として、MMRタンパク質又はそのバリアントを不活性化する突然変異を導入すること等、1つ以上のMMRタンパク質をコードする遺伝子において)、転写レベル(例として、転写ノックダウンによって)、翻訳レベル(例として、それらの同族転写物からの1つ以上のMMRタンパク質の翻訳を遮断することによって)、又はタンパク質レベルで適用される任意の適切な手段によるものであってもよい(例として、阻害剤(例として、小分子、抗体、ドミナントネガティブタンパク質バリアント)の投与、又は標的化タンパク質分解(例として、PROTACベースの分解)による)。

一側面では、本開示は、MLH1又はそのバリアントを阻害、遮断、又は不活性化することによって、プライム編集中にDNAミスマッチ修復(MMR)系を更に阻害することを含む、改良されたプライム編集方法を提供する。

理論に束縛されるものではないが、MLH1は、PMS2とヘテロ二量体化して、複製後DNAミスマッチ修復系(MMR)の成分であるMutLアルファを形成する重要なMMRタンパク質である。DNA修復は、MutSアルファ(MSH2-MSH6)又はMutSベータ(MSH2-MSH3)がdsDNAミスマッチに結合することによって開始され、次いでMutLアルファがヘテロ二本鎖に動員される。RFC及びPCNAの存在下でのMutL-MutS-ヘテロ二本鎖三元複合体の構築は、PMS2のエンドヌクレアーゼ活性を活性化するのに十分である。これは、ミスマッチの近くに一本鎖切断を導入し、したがって、エキソヌクレアーゼEXO1がミスマッチを含有する鎖を分解するための新しい侵入点を生成する。DNAメチル化は、切断を防止し、したがって、新たに変異したDNA鎖のみが修正されることを保証する。MutLアルファ(MLH1-PMS2)は、DNAポリメラーゼIIIのクランプローダサブユニットと物理的に相互作用し、MMRの部位にDNAポリメラーゼIIIを動員する役割を果たしてもよいことを示唆している。細胞周期停止を誘導し、主要なDNA損傷の場合にアポトーシスをもたらし得るプロセスであるDNA損傷シグナル伝達にも関与する。MLH1はまた、MLH3とヘテロ二量体化してMutLガンマを形成し、これは、分裂において役割を果たす。

「標準的な」ヒトMLH1アミノ酸配列は、配列番号204によって表される。

MLH1はまた、標準的な配列の残基1～241が欠損しているという点で標準的な配列とは異なる、P40692-2(配列番号205)を包含する、他のヒトアイソフォームを包含してもよい。

MLH1はまた、P40692-3(配列番号207)として公知の第3の公知のアイソフォームを包含してもよく、これは、MSFVAGVIRR…ASISTYGFRG(配列番号206)の)残基1～101がMAFで置換されているという点で標準的な配列とは異なる。

MMR阻害剤及びMMR阻害方法
本開示は、プライム編集によって核酸分子を編集するための方法であって、核酸分子をプライム編集因子、pegRNA、及びDNAミスマッチ修復経路の阻害剤と接触させ、それによって編集効率を高め、及び/又はインデル形成を低下させて、標的部位に核酸分子に対する1つ以上の修飾をインストールすることを伴う、方法を提供する。したがって、本開示は、MMRを阻害するための任意の適切な手段を企図する。一態様では、本開示は、有効量のMMR経路の阻害剤を投与することを受け入れる。様々な態様では、MMR経路は、遺伝子レベル(例としてMMRタンパク質又はそのバリアントを不活性化する突然変異を導入する等、1つ以上のMMRタンパク質をコードする遺伝子において)、転写レベル(例として、転写ノックダウンによって)、翻訳レベル(例として、それらの同族転写物からの1つ以上のMMRタンパク質の翻訳を遮断することによって)又はタンパク質レベル(例として、阻害剤の適用(例として、小分子、抗体、ドミナントネガティブタンパク質パートナー)又は標的化タンパク質分解(例として、PROTACベースの分解)で任意の1つ以上のMMRタンパク質又はバリアントを阻害、遮断又は不活性化することによって阻害されてもよい。本開示はまた、MMR阻害剤を提供する必要なしに、MMR経路による修正を回避する核酸分子への修飾をインストールするように設計されたプライム編集の方法を企図する。

本発明者らは、エラーを起こしやすい二本鎖DNA切断を必要とせずにゲノムDNA配列の挿入、欠失又は置換を可能にするプライム編集を開発した。本開示はここで、プライム編集中のMMR経路(例として、MLH1を包含するMMR経路タンパク質を阻害、遮断又は不活性化することによって)の遮断、阻害、又は不活性化を伴うプライム編集の改善された方法を提供し、それによって驚くべきことに、そのようにすることは編集効率の増加及びインデル形成の減少をもたらす。本明細書で使用される場合、プライム編集「中」は、MMR経路(例として、MLH1の阻害を標的化することによって)を遮断する、阻害する、又は不活性化する工程の前、同時に、又は後にプライム編集工程が適用され得るように、任意の適切な一連の事象を包含することができる。

プライム編集は、Cas9を標的ゲノム部位に向かわせ、所望の編集をインストールするための情報をコードする操作されたプライム編集ガイドRNA(pegRNA)と対になった操作されたCas9ニッカーゼ-逆転写酵素融合タンパク質(例として、PE1又はPE2)を使用する。プライム編集は、多段階の編集プロセスを介して進行する:1)Cas9ドメインは、pegRNAのスペーサ配列によって特定される標的ゲノムDNA部位に結合し、標的ゲノムDNA部位にニックを入れる;2)逆転写酵素ドメインは、逆転写のための鋳型としてpegRNA上の操作された伸長を使用して編集されたDNA鎖の合成を開始するためのプライマーとしてニックの入ったゲノムDNAを使用する-これは編集されたDNA配列を含有する一本鎖3'フラップを生成する;3)細胞DNA修復は、編集された3'フラップによる侵入を介して生じる5'フラップ種の置換、元のDNA配列を含む5'フラップの切除、及び編集されたDNA鎖を組み込むための新しい3'フラップのライゲーションによって3'フラップ中間体を分解し、1つの編集された鎖と1つの編集されていない鎖のヘテロ二本鎖を形成する;並びに4)細胞DNA修復は、編集された鎖を修復のための鋳型として使用してヘテロ二本鎖内の編集されていない鎖を置換し、編集プロセスを完了する。

所望の編集の効率的な組み込みは、新たに合成された3'フラップがゲノムDNA部位に相同な配列の一部を含むことを必要とする。この相同性により、編集された3'フラップは、DNA二重鎖への組み込みに関して内因性DNA鎖(対応する5'フラップ)と競合することが可能になる。編集された3'フラップは内因性5'フラップよりも少ない配列相同性を含むので、競合は5'フラップ鎖を優先すると予想される。したがって、プライム編集の効率における潜在的な制限要因は、編集を含有する3'フラップが5'フラップストランドに効果的に侵入し変位しないことであってもよい。更に、成功した3'フラップの浸潤及び5'フラップの除去は、二本鎖DNAゲノムの一方の鎖に編集を組み込むだけである。編集の永続的なインストールは、編集された鎖を鋳型として使用して未編集の相補的DNA鎖を置換するための細胞DNA修復を必要とする。二次sgRNA(PE3系)を使用して編集に隣接する未編集の鎖にニックを導入することによって、編集された鎖よりも未編集の鎖の置換を促進するように細胞が作製され得るが(上の工程4)、このプロセスは依然としてDNA修復の第2段階に依存する。

本開示は、DNAミスマッチ修復(MMR)系を更に阻害すること、遮断すること、又はそうでなければ不活性化することを含む、プライム編集に対する修飾されたアプローチを記載する。いくつかの態様では、MMR阻害剤は、プライム編集システムの他の成分と共に標的核酸に提供され、例えば、siRNA等の外因性MMR阻害剤は、標的核酸を含む細胞に提供され得る。いくつかの態様では、プライム編集システム構成要素、例として、pegRNAは、阻害剤を提供する必要なしに、MMR系を回避する修飾を標的核酸にインストールするように設計される。特定の態様では、DNAミスマッチ修復(MMR)系の、MLH1、PMS2(又はMutLアルファ)、PMS1(又はMutLベータ)、MLH3(又はMutLガンマ)、MutSアルファ(MSH2-MSH6)、MutSベータ(MSH2-MSH3)、MSH2、MSH6、PCNA、RFC、EXO1、POLδ、及びPCNAを包含するがこれらに限定されないMMR系の1つ以上のタンパク質が阻害、遮断、又は他の方法で不活性化され得る。本開示は、例として、MMR系のタンパク質をコードする遺伝子、例として、MLH1、PMS2(又はMutLアルファ)、PMS1(又はMutLベータ)、MLH3(又はMutLガンマ)、MutSアルファ(MSH2-MSH6)、MutSベータ(MSH2-MSH3)、MSH2、MSH6、PCNA、RFC、EXO1、POLδ及びPCNAに1つ以上の突然変異を導入することによる、遺伝子レベルでのMMR系の1つ以上の重要なタンパク質の不活性化を包含するが、これらに限定されない、DNAミスマッチ修復(MMR)系を阻害するか、阻止するか、そうでなければ不活性化する任意の適切な手段を企図する。

したがって、一側面では、本開示は、DNAミスマッチ修復(MMR)系を遮断、阻害、又は他の方法で不活性化しながら、プライム編集を使用してヌクレオチド分子(例として、ゲノム)を編集するための方法を提供する。

別の側面では、本開示は、MMR系のタンパク質、例としてMLH1、PMS2(又はMutLアルファ)、PMS1(又はMutLベータ)、MLH3(又はMutLガンマ)、MutSアルファ(MSH2-MSH6)、MutSベータ(MSH2-MSH3)、MSH2、MSH6、PCNA、RFC、EXO1、POLδ、及びPCNAを遮断、阻害、又はそうでなければ不活性化しながら、プライム編集を使用してヌクレオチド分子(例として、ゲノム)を編集するための方法を提供する。

一側面では、本開示は、MLH1又はそのバリアントを阻害、遮断、又は不活性化することによって、プライム編集中にDNAミスマッチ修復(MMR)系を更に阻害することを含む、改良されたプライム編集方法を提供する。理論に束縛されるものではないが、MLH1は、PMS2とヘテロ二量体化して、複製後DNAミスマッチ修復系(MMR)の成分であるMutLアルファを形成する重要なMMRタンパク質である。DNA修復は、MutSアルファ(MSH2-MSH6)又はMutSベータ(MSH2-MSH3)がdsDNAミスマッチに結合することによって開始され、次いでMutLアルファがヘテロ二本鎖に動員される。RFC及びPCNAの存在下でのMutL-MutS-ヘテロ二本鎖三元複合体の構築は、PMS2のエンドヌクレアーゼ活性を活性化するのに十分である。これは、ミスマッチの近くに一本鎖切断を導入し、したがって、エキソヌクレアーゼEXO1がミスマッチを含有する鎖を分解するための新しい侵入点を生成する。DNAメチル化は、切断を防止し、したがって、新たに変異したDNA鎖のみが修正されることを保証する。MutLアルファ(MLH1-PMS2)は、DNAポリメラーゼIIIのクランプローダサブユニットと物理的に相互作用し、MMRの部位にDNAポリメラーゼIIIを動員する役割を果たしてもよいことを示唆している。細胞周期停止を誘導し、主要なDNA損傷の場合にアポトーシスをもたらし得るプロセスであるDNA損傷シグナル伝達にも関与する。MLH1はまた、MLH3とヘテロ二量体化してMutLガンマを形成し、これは、分裂において役割を果たす。「標準的な」ヒトMLH1アミノ酸配列は、配列番号204によって表される。

本開示は、プライム編集中にMMR経路を阻害するために、以下のMLH1タンパク質のいずれかが阻害剤によって阻害されてもよいか、あるいはそうでなければブロック又は不活性化されてもよいことを企図する。更に、そのような例示的なタンパク質はまた、MMRを遮断する、不活性化する、又は阻害する有効量で投与された場合、ある種の阻害剤として使用されてもよいドミナントネガティブバリアントを操作するか、そうでなければ作製するために使用されてもよい。理論に束縛されるものではないが、MLH1ドミナントネガティブ変異体は、MutSの結合を飽和させ得ると考えられる。例示的なMLH1タンパク質は、以下のアミノ酸配列、又は以下の配列のいずれかと少なくとも70％、少なくとも75％、少なくとも80％、少なくとも85％、少なくとも90％、少なくとも95％、少なくとも96％、少なくとも97％、少なくとも98％、少なくとも99％、若しくは最大100％の配列同一性を有するアミノ酸配列を包含する。

本明細書に記載の方法及び組成物は、MLH1変異体又は切断型バリアントを利用する。いくつかの態様では、ヒトMLH1野生型タンパク質の変異体及び切断バリアントが利用される。

一側面では、ヒトMLH1の切断型バリアントが本開示によって提供される。いくつかの態様では、野生型ヒトMLH1タンパク質のアミノ酸754～756は、切断型(Δ754-756、以下MLH1dnと称する)である。いくつかの態様では、N末端ドメイン(アミノ酸1～335)のみを含むヒトMLH1の切断型バリアントが提供される(以下、MLH1dn^NTDと呼ぶ。様々な態様では、以下のMLH1バリアントが本開示で提供される。

別の側面では、本開示は、PMS2(又はMutLアルファ)又はそのバリアントを遮断し、阻害し、又はそうでなければ不活性化しながら、プライム編集を使用してヌクレオチド分子(例として、ゲノム)を編集するための方法を提供する。

更に別の側面では、本開示は、PMS1(又はMutLベータ)又はそのバリアントを遮断し、阻害し、又はそうでなければ不活性化しながら、プライム編集を使用してヌクレオチド分子(例として、ゲノム)を編集するための方法を提供する。

更に別の側面では、本開示は、MLH3(又はMutLガンマ)又はそのバリアントを遮断し、阻害し、又はそうでなければ不活性化しながら、プライム編集を使用してヌクレオチド分子(例として、ゲノム)を編集するための方法を提供する。

別の側面では、本開示は、MutSアルファ(MSH2-MSH6)又はそのバリアントを遮断し、阻害し、又はそうでなければ不活性化しながら、プライム編集を使用してヌクレオチド分子(例として、ゲノム)を編集するための方法を提供する。

更に別の側面では、本開示は、MSH2又はそのバリアントを遮断、阻害、又は他の方法で不活性化しながら、プライム編集を使用してヌクレオチド分子(例として、ゲノム)を編集するための方法を提供する。

別の側面では、本開示は、MSH6又はそのバリアントを遮断、阻害、又は他の方法で不活性化しながら、プライム編集を使用してヌクレオチド分子(例として、ゲノム)を編集するための方法を提供する。

別の側面では、本開示は、PCNA又はそのバリアントを遮断、阻害、又は他の方法で不活性化しながら、プライム編集を使用してヌクレオチド分子(例として、ゲノム)を編集するための方法を提供する。

更に別の側面では、本開示は、RFC又はそのバリアントを遮断、阻害、又は他の方法で不活性化しながら、プライム編集を使用してヌクレオチド分子(例として、ゲノム)を編集するための方法を提供する。

別の側面では、本開示は、EXO1又はそのバリアントを遮断、阻害、又は他の方法で不活性化しながら、プライム編集を使用してヌクレオチド分子(例として、ゲノム)を編集するための方法を提供する。

別の側面では、本開示は、POLδ又はそのバリアントを遮断、阻害、又は他の方法で不活性化しながら、プライム編集を使用してヌクレオチド分子(例として、ゲノム)を編集するための方法を提供する。

これらのMMRタンパク質(PMS2(又はMutLアルファ)、PMS1(又はMutLベータ)、MLH3(又はMutLガンマ)、MutSアルファ(MSH2-MSH6)、MutSベータ(MSH2-MSH3)、MSH2、MSH6、PCNA、RFC、EXO1、POLδ及びPCNA)の例示的なアミノ酸配列は以下の通りである。

別の側面では、本開示は、ヌクレオチド分子(例として、ゲノム)を編集するための方法を提供し、標的ヌクレオチド分子を、プライム編集因子及びMMR系の阻害剤、例として、MLH1、PMS2(又はMutLアルファ)、PMS1(又はMutLベータ)、MLH3(又はMutLガンマ)、MutSアルファ(MSH2-MSH6)、MutSベータ(MSH2-MSH3)、MSH2、MSH6、PCNA、RFC、EXO1、POLδ、又はPCNAの1つ以上の阻害剤と接触させることを含む。様々な態様では、阻害剤は小分子阻害剤であり得る。他の態様では、阻害剤は、抗体、例として中和抗体であり得る。更に他の態様では、阻害剤は、MLH1、PMS2(又はMutLアルファ)、PMS1(又はMutLベータ)、MLH3(又はMutLガンマ)、MutSアルファ(MSH2-MSH6)、MutSベータ(MSH2-MSH3)、MSH2、MSH6、PCNA、RFC、EXO1、POLδ、又はPCNAの1つ以上のドミナントネガティブ変異体、例として、MLH1のドミナントネガティブ変異体であり得る。更に他の態様では、阻害剤は、転写のレベル、例として、MLH1、PMS2(又はMutLアルファ)、PMS1(又はMutLベータ)、MLH3(又はMutLガンマ)、MutSアルファ(MSH2-MSH6)、MutSベータ(MSH2-MSH3)、MSH2、MSH6、PCNA、RFC、EXO1、POLδ又はPCNAをコードする転写物のレベルをノックダウンするsiRNA又は他の核酸薬剤で標的化され得る。更に他の態様では、「標的ヌクレオチド分子をプライム編集因子と接触させる」工程は、(i)脂質送達システムと複合体化した有効量のプライム編集因子融合タンパク質(例として、PE1又はPE2)を細胞に直接送達することと、(ii)プライム編集融合タンパク質及び/又は適切なpegRNAをコードするmRNAを含むmRNA又は送達複合体を細胞に送達することと、(iii)1つ以上のDNAベクター上のプライム編集因子融合タンパク質及び/又は適切なpegRNAをコードするDNAベクター(例として、AAV又はレンチウイルスベクター、プラスミド、又は他の核酸送達ベクター)と、を包含し得る。

更に他の側面では、本開示は、MMR経路の阻害剤を提供する必要なしに、標的核酸分子に導入された変化のMMR経路による修正が回避されるプライム編集のための方法を提供する。驚くべきことに、標的核酸上の標的部位と比較して連続したヌクレオチドのミスマッチで設計されたpegRNA、例えば3つ以上の連続したミスマッチを有するpegRNAは、MMR経路による修正を回避することができ、その結果、プライム編集を使用した単一ヌクレオチドのミスマッチの導入と比較して、プライム編集効率の増加及び/又はインデル形成の頻度の減少をもたらす。更に、複数の連続したヌクレオチド、例えば、3個以上の連続したヌクレオチド、又はプライム編集によって導入された10個以上の連続したヌクレオチド長の挿入及び欠失もまた、MMR経路による修正を回避してもよく、その結果、対応する対照pegRNA(例として、3つ以上の連続するヌクレオチドの挿入又は欠失を導入しない対照pegRNA)によるプライム編集と比較して、プライム編集効率の増加及び/又はインデル形成の頻度の減少がもたらされる。いくつかの態様において、10個又はそれを超える連続するヌクレオチドの挿入又は欠失を導入するプライム編集は、プライム編集を用いる10ヌクレオチド長未満の挿入又は欠失の導入と比較して、プライム編集効率の増加及び/又はインデル頻度の減少をもたらす。

したがって、一側面では、本開示は、核酸分子を、プライム編集因子及び核酸分子上の標的部位に対して3つ以上の連続するヌクレオチドミスマッチを含むその伸長アーム上のDNA合成テンプレートを含むpegRNAと接触させることを含む、プライム編集によって核酸分子を編集するための方法を提供する。いくつかの態様では、pegRNAは、編集対象の核酸分子(例として、二本鎖標的DNA)の内因性配列と比較して1つ以上のヌクレオチド編集を含むDNA合成テンプレートを含み、1つ以上のヌクレオチド編集は、(i)意図された変化が、核酸分子内の突然変異(例として、疾患関連変異)を修正するx個の連続するヌクレオチドの挿入、欠失、又は置換であること、及び(ii)x個のヌクレオチドに直接隣接するy個の連続するヌクレオチドの挿入、欠失、又は置換であることを含み、(x＋y)は3以上の整数である。いくつかの態様において、y個の連続するヌクレオチドの挿入、欠失又は置換はサイレント変異である。いくつかの態様において、y個の連続するヌクレオチドの挿入、欠失又は置換は良性変異である。サイレント変異は、標的核酸分子のコード領域又は標的核酸分子の非コード領域に存在してもよい。サイレント変異がコード領域に存在する場合、それらは、未編集核酸分子と同じアミノ酸をコードする1つ以上の代替コドンを核酸分子に導入する。あるいは、サイレント変異が非コード領域又はコード領域と非コード領域との接合部(例として、イントロン/エクソン接合部)にある場合、サイレント変異は、スプライシング、遺伝子調節、RNA寿命、又は核酸分子上の標的部位の他の生物学的特性に影響を及ぼさない核酸分子の領域に存在してもよい。良性変異は、標的核酸配列によってコードされるタンパク質又はポリペプチドのアミノ酸配列を変化させるが、タンパク質又はポリペプチドの発現及び/又は機能を損なわないか又は実質的に損なわないヌクレオチド変化又はアミノ酸変化を指してもよい。いくつかの態様において、xは、1～50の整数である。いくつかの態様において、yは、1～50の整数である。いくつかの態様では、yは1以上の整数である。いくつかの態様では、サイレント変異(複数可)を含めることにより、効率を増加させ、意図しないインデル頻度を低下させ、及び/又はプライム編集によって編集結果の純度を改善する。本明細書で使用される場合、「プライム編集結果の純度」という用語は、プライム編集から生じる意図しないインデルに対する意図した編集の比を指してもよい。いくつかの態様において、サイレント変異(複数可)を含めることにより、サイレント変異(複数可)を含まない対照pegRNA、例として、x個の連続するヌクレオチドの挿入、欠失、又は置換を包含し、y個の連続するヌクレオチドの挿入、欠失、又は置換を包含しない対照pegRNAによるプライム編集と比較して、少なくとも1.5倍、少なくとも2.0倍、少なくとも2.5倍、少なくとも3.0倍、少なくとも3.5倍、少なくとも4.0倍、少なくとも4.5倍、少なくとも5.0倍、少なくとも5.5倍、少なくとも6.0倍、少なくとも6.5倍、少なくとも7.0倍、少なくとも7.5倍、少なくとも8.0倍、少なくとも8.5倍、少なくとも9.0倍、少なくとも9.5倍、少なくとも10.0倍、少なくとも11倍、少なくとも12倍、少なくとも13倍、少なくとも14倍、少なくとも15倍、少なくとも16倍、少なくとも17倍、少なくとも18倍、少なくとも19倍、少なくとも20倍、少なくとも21倍、少なくとも22倍、少なくとも23倍、少なくとも24倍、少なくとも25倍、少なくとも26倍、少なくとも27倍、少なくとも28倍、少なくとも29倍、少なくとも30倍、少なくとも31倍、少なくとも32倍、少なくとも33倍、少なくとも34倍、少なくとも35倍、少なくとも36倍、少なくとも37倍、少なくとも38倍、少なくとも39倍、少なくとも40倍、少なくとも41倍、少なくとも42倍、少なくとも43倍、少なくとも44倍、少なくとも45倍、少なくとも46倍、少なくとも47倍、少なくとも48倍、少なくとも49倍、少なくとも50倍、少なくとも51倍、少なくとも52倍、少なくとも53倍、少なくとも54倍、少なくとも55倍、少なくとも56倍、少なくとも57倍、少なくとも58倍、少なくとも59倍、少なくとも60倍、少なくとも61倍、少なくとも62倍、少なくとも63倍、少なくとも64倍、少なくとも65倍、少なくとも66倍、少なくとも67倍、少なくとも68倍、少なくとも69倍、少なくとも70倍、少なくとも71倍、少なくとも72倍、少なくとも73倍、少なくとも74倍、又は少なくとも75倍、プライム編集によって、効率を増加させ、意図しないインデル頻度を低下させ、及び/又は編集結果純度を改善する。

いくつかの態様では、3つ以上の連続するヌクレオチドのミスマッチの少なくとも1つは、核酸分子から発現されるタンパク質のアミノ酸配列の変化をもたらす。いくつかの態様では、連続するヌクレオチドのミスマッチのうちの2つ以上が、核酸分子から発現されるタンパク質のアミノ酸配列の変化をもたらす。いくつかの態様では、ヌクレオチドのミスマッチの少なくとも1つは、核酸分子から発現されるタンパク質のアミノ酸配列の変化をもたらさないサイレント変異である。サイレント変異は、標的核酸分子のコード領域又は標的核酸分子の非コード領域に存在してもよい。サイレント変異がコード領域に存在する場合、それらは、未編集核酸分子と同じアミノ酸をコードする1つ以上の代替コドンを核酸分子に導入する。あるいは、サイレント変異が非コード領域にある場合、サイレント変異は、スプライシング、遺伝子調節、RNA寿命、又は核酸分子上の標的部位の他の生物学的特性に影響を及ぼさない核酸分子の領域に存在してもよい。

3つ以上の任意の数の連続するヌクレオチドのミスマッチを使用して、MMR経路による修正を回避する利点を達成し得る。いくつかの態様では、pegRNA上の伸長アームのDNA合成テンプレートは、プライム編集によって編集された核酸分子内の標的部位の内因性配列に対して3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、又は25個の連続するヌクレオチドミスマッチを含む。いくつかの態様では、pegRNA上の伸長アームのDNA合成テンプレートは、プライム編集によって編集された核酸分子内の標的部位の内因性配列に対して3、4、又は5個の連続するヌクレオチドミスマッチを含む。いくつかの態様では、pegRNA上の伸長アームのDNA合成テンプレートは、プライム編集によって編集された核酸分子内の標的部位の内因性配列に対して6、7、8、9、10、11、12、13、14、15、16、17、18、19、又は20の連続するヌクレオチドミスマッチを含む。いくつかの態様では、pegRNA上の伸長アームのDNA合成鋳型は、核酸分子上の標的部位と比較して、3つ以上、4つ以上、5つ以上、6つ以上、7つ以上、8つ以上、9つ以上、又は10個以上の連続するヌクレオチドミスマッチを含む。

別の側面では、本開示は、プライム編集によって核酸分子を編集するための方法であって、核酸分子を、プライム編集因子、及び核酸分子上の標的部位に対して10個以上のヌクレオチドの挿入又は欠失を含むその伸長アーム上のDNA合成鋳型を含むpegRNAと接触させることを含む、方法を提供する。10ヌクレオチド以上の長さの挿入及び欠失は、プライム編集によって導入された場合、MMR経路による修正を回避し、したがって、MMRの阻害剤を提供する必要なしにMMR経路の阻害から利益を取得し得る。10ヌクレオチドを超える任意の長さの挿入及び欠失が使用されて、MMR経路による修正を回避する利益を達成し得る。いくつかの態様において、DNA合成鋳型は、プライム編集によって編集された核酸分子の標的部位における内因性配列に対して10、11、12、13、14、15、16、17、18、19、20、21、22、23、24又は25ヌクレオチドの挿入又は欠失を含む。いくつかの態様において、DNA合成鋳型は、核酸分子上の標的部位に対して11個以上のヌクレオチド、12個以上のヌクレオチド、13個以上のヌクレオチド、14個以上のヌクレオチド、15個以上のヌクレオチド、16個以上のヌクレオチド、17個以上のヌクレオチド、18個以上のヌクレオチド、19個以上のヌクレオチド、20個以上のヌクレオチド、21個以上のヌクレオチド、22個以上のヌクレオチド、23個以上のヌクレオチド、24個以上のヌクレオチド、又は25個以上のヌクレオチドの挿入又は欠失を含む。特定の態様では、DNA合成鋳型は、核酸分子上の標的部位に対して15個以上のヌクレオチドの挿入又は欠失を含む。

本開示は、標的部位のプライム編集を行いながらDNAミスマッチ修復経路を阻害することによって、改善された編集効率及び/又は低減されたインデル形成を有するプライム編集のための組成物及び方法を提供する。したがって、本開示は、プライム編集によって核酸分子を編集するための方法であって、核酸分子をプライム編集因子、pegRNA、及びDNAミスマッチ修復経路の阻害剤と接触させ、それによって編集効率を高め、及び/又はインデル形成を低下させて、標的部位に核酸分子に対する1つ以上の修飾をインストールすることを伴う、方法を提供する。本開示は更に、napDNAbpをコードする核酸配列、ポリメラーゼ、及びDNAミスマッチ修復経路の阻害剤を含むプライム編集によってDNA標的部位を編集するためのポリヌクレオチドを提供し、ここでnapDNAbp及びポリメラーゼは、編集効率の向上及び/又はインデル形成の低下を伴ってDNA標的部位に1つ以上の修飾をインストールするpegRNAの存在下で可能である。したがって、本明細書に記載の方法及び組成物は、核酸プログラム可能DNA結合タンパク質(napDNAbp)を含んでもよいプライム編集因子を利用する。

プライム編集因子:napDNAbpドメイン
一側面では、本明細書に記載されるプライム編集因子のnapDNAbpは、ガイド核酸又はその一部(例として、DNA標的のプロトスペーサにアニーリングするガイドRNAのスペーサ)に相補的なDNA鎖(すなわち、標的鎖)を含むDNA配列にnapDNAbpを局在化する少なくとも1つのガイド核酸(例として、ガイドRNA又はPEgRNA)と会合又は複合体化され得る。換言すれば、ガイド核酸は、DNA中のプロトスペーサの相補的配列に局在して結合するようにnapDNAbp(例として、Cas9又は同等物)を「プログラム」する。

任意の適切なnapDNAbpは、本明細書に記載の方法及び組成物で利用されるプライム編集因子で使用されてもよい。様々な態様では、napDNAbpは、任意のII型、V型、又はVI型CRISPR-Cas酵素を包含する、任意のクラス2 CRISPR-Casシステムであってもよい。ゲノム編集のためのツールとしてのCRISPR-Casの急速な発展を考えると、Cas9及びCas9オルソログ等のCRISPR-Cas酵素を記載及び/又は同定するために使用される命名法が絶えず開発されてきた。本出願は、古い及び/又は新しくてもよい命名法を有するCRISPR-Cas酵素を参照する。当業者は、使用されている命名法に基づいて、それが古い(すなわち、「レガシー」)命名法であるか新しい命名法であるかにかかわらず、本出願で言及されている特定のCRISPR-Cas酵素を同定することができる。CRISPR-Cas命名法は、Makarova et al.,「Classification and Nomenclature of CRISPR-Cas Systems:Where from Here？,」The CRISPR Journal,Vol.1.No.5,2018で広く議論されており、その全内容は参照により本明細書に組み込まれる。本出願の任意の所与の例で使用される特定のCRISPR-Cas命名法は、決して限定するものではなく、当業者は、どのCRISPR-Cas酵素が参照されているかを識別することができる。

例えば、以下のタイプII、タイプV及びタイプVIクラス2 CRISPR-Cas酵素は、当技術分野で認識されている以下の古い(すなわち、レガシー)及び新しい名称を有する。これらの酵素及び/又はそのバリアントのそれぞれは、本明細書に記載の方法及び組成物で利用されるプライム編集因子と共に使用されてもよい。

理論に束縛されるものではないが、本明細書で企図される特定のnapDNAbpの作用機序は、Rループを形成し、それによってnapDNAbpが二本鎖DNA標的の巻き戻しを誘導し、それによってnapDNAbpによって結合された領域内の鎖を分離する工程を包含する。次いで、ガイドRNAスペーサは、プロトスペーサ配列に相補的な領域で「標的鎖」にハイブリダイズする。これは、標的鎖に相補的な「非標的鎖」に取って代わり、これはRループの単鎖領域を形成する。いくつかの態様において、napDNAbpは1以上のヌクレアーゼ活性を包含しており、次いでDNAを切ることで、様々なタイプの病変を切り離す。例えば、napDNAbpは、非標的鎖を第1の場所にて切るか、及び/又は標的鎖を第2の場所にて切る、ヌクレアーゼ活性を含んでいてもよい。ヌクレアーゼ活性に応じて標的DNAが切られることで、両鎖とも切られた「二本鎖切断」を形成し得る。他の態様において、標的DNAは単一の部位でしか切られ得ない、すなわち、DNAは一方の鎖上に「ニックが入っている(nicked)」。種々のヌクレアーゼ活性をもつ例示のnapDNAbpは、「Cas9ニッカーゼ」(「nCas9」)、及びヌクレアーゼ活性を一切有さない不活性化Cas9(「不活性型Cas9」又は「dCas9」)を包含する。

本開示の方法及び組成物で利用されるプライム編集因子に関連して使用され得る様々なnapDNAbpの以下の説明は、決して限定することを意味されるものではない。プライム編集因子は、知られているか又は指向性進化若しくは別様の変異プロセスによって作られ得るか若しくは進化させられ得る標準的なSpCas9又はいずれかのオルソログCas9タンパク質又はいずれかのバリアントCas9タンパク質を含んでもよく、Cas9のいずれかの天然に存在するバリアント、変異体、又は別様に操作されたバージョンを包含する。種々の態様において、Cas9又はCas9バリアントはニッカーゼ活性を有し、すなわち標的DNA配列の一方の鎖のみを切断する。他の態様において、Cas9又はCas9バリアントは不活性なヌクレアーゼを有し、すなわち「不活性型」Cas9タンパク質である。用いられてもよい他のバリアントCas9タンパク質は、(例として、より容易な送達のために)標準的なSpCas9よりも小さい分子量を有するか又は修飾若しくは再配置された一次アミノ酸構造(例として循環置換体フォーマット)を有するものである。

本明細書中に記載される方法及び組成物において利用されるプライム編集因子はまた、収束進化の結果であるCas12a(Cpf1)及びCas12b1タンパク質を包含するCas9同等物を含んでもよい。本明細書において用いられるnapDNAbp(例として、SpCas9、Cas9バリアント、又はCas9等価物)は、それらのPAM特異性を変改/増強する種々の修飾をもまた含有してもよい。最後に、本明細書は、少なくとも70％、少なくとも75％、少なくとも80％、少なくとも85％、少なくとも90％、少なくとも91％、少なくとも92％、少なくとも93％、少なくとも94％、少なくとも95％、少なくとも96％、少なくとも97％、少なくとも98％、少なくとも99％、又は少なくとも99.9％配列同一性を参照Cas9配列、例えば参照SpCas9標準的な配列又は参照Cas9等価物(例として、Cas12a(Cpf1))に対して有するいずれかのCas9、Cas9バリアント、又はCas9等価物を企図する。

napDNAbpは、CRISPR(clustered regularly interspaced short palindromic repeat)関連ヌクレアーゼであり得る。上に概説したように、CRISPRは、可動遺伝因子(ウイルス、転移因子、及び接合性プラスミド)に対して保護を提供する適応免疫系である。CRISPRクラスターは、スペーサ、先行する可動因子に相補的な配列、及び標的化侵入核酸を含有する。CRISPRクラスターは転写され、プロセスを受けて(processed)CRISPR RNA(crRNA)になる。II型CRISPR系において、pre-crRNAの正しいプロセシングは、transでコードされた低分子(small)RNA(tracrRNA)、内因性リボヌクレアーゼ3(rnc)、及びCas9タンパク質を要求する。tracrRNAは、pre-crRNAの、リボヌクレアーゼ3に補助された(-aided)プロセシングのためのガイドとして働く。続いて、Cas9/crRNA/tracrRNAは、スペーサに相補的な線状又は環状のdsDNA標的をエンドヌクレアーゼ的に切断する。crRNAに相補的ではない標的鎖は、最初にエンドヌクレアーゼ的に切られ、次いで3'-5'エキソヌクレアーゼ的に切り取られる。本来、DNAの結合及び切断は、典型的には、タンパク質及び両RNAを要求する。しかしながら、シングルガイドRNA(「sgRNA」、又は単に「gRNA」)は、crRNAとtracrRNAとの両方の側面を単一RNA種中へ組み込むために、操作され得る。例として、その全内容が参照により本明細書に組み込まれるJinek M.et al.,Science 337:816-821(2012)を参照。

いくつかの態様では、napDNAbpは、標的配列上において及び/又は標的配列の相補体上等、標的配列の位置付けにおける一方又は両方の鎖の切断を導く。いくつかの態様では、napDNAbpは、標的配列の最初の又は最後のヌクレオチドから約1、2、3、4、5、6、7、8、9、10、15、20、25、50、100、200、500、又はより多くの塩基対以内において、一方又は両方の鎖の切断を導く。いくつかの態様では、ベクターは、変異したnapDNAbpが標的配列を含有する標的ポリヌクレオチドの一方又は両方の鎖を切断する能力を欠くようにして対応する野生型酵素に対して変異しているnapDNAbpをコードする。例えば、S.pyogenesからのCas9のRuvC I触媒ドメイン上のアスパラギン酸からアラニンの置換(D10A)は、両鎖を切断するヌクレアーゼからニッカーゼ(一本鎖を切断する)へとCas9を変換する。Cas9をニッカーゼにする変異の他の例は、限定なしに、標準的なSpCas9配列を又は他のCas9バリアント若しくはCas9等価物の同等のアミノ酸位置を参照して、H840A、N854A、及びN863Aを包含する。

本明細書において用いられる用語「Casタンパク質」は、天然から得られる全長Casタンパク質、天然に存在するCasタンパク質とは異なる配列を有する組換えCasタンパク質、又は本開示の方法に必要とされる全て若しくは有意な量の不可欠の基本機能、すなわち(i)標的DNAに対するCasタンパク質の核酸プログラム可能結合の所有及び(ii)1つの鎖上で標的DNA配列へニックを入れる能力をそれでもなお保持するCasタンパク質のいずれかのフラグメントを指す。本明細書において企図されるCasタンパク質は、CRISPR Cas9タンパク質、及びCas9等価物、バリアント(例として、Cas9ニッカーゼ(nCas9)又はヌクレアーゼ不活性型Cas9(dCas9))ホモログ、オルソログ、又はパラログを、天然に存在するか又は天然に存在しないか(例として、操作されたか又は組み換えか)にかかわらず包摂し、いずれかのクラス2 CRISPRシステム(例としてII、V、VI型)からのCas9等価物を包含してもよく、Cas12a(Cpf1)、Cas12e(CasX)、Cas12b1(C2c1)、Cas12b2、Cas12c(C2c3)、C2c4、C2c8、C2c5、C2c10、C2c9 Cas13a(C2c2)、Cas13d、Cas13c(C2c7)、Cas13b(C2c6)、及びCas13bを包含する。更なるCas等価物は、Makarova et al.,「C2c2 is a single-component programmable RNA-guided RNA-targeting CRISPR effector,」Science 2016;353(6299)and Makarova et al.,「Classification and Nomenclature of CRISPR-Cas Systems:Where from Here？,」The CRISPR Journal,Vol.1.No.5,2018に記載されており、その内容は参照により本明細書に組み込まれる。

用語「Cas9」又は「Cas9ヌクレアーゼ」又は「Cas9部分」又は「Cas9ドメイン」は、いずれかの生物からのいずれかの天然に存在するCas9、いずれかの天然に存在するCas9等価物又はその機能的フラグメント、いずれかの生物からのいずれかのCas9ホモログ、オルソログ、又はパラログ、及び天然に存在するか又は操作されたCas9のいずれかの変異体又はバリアントを包摂する。用語Cas9は特に限定することを意味されず、「Cas9又は等価物」と呼ばれてもよい。例示のCas9タンパク質は更に本明細書に記載及び/又は当該技術分野において記載されており、参照によって本明細書に組み込まれる。本開示は、本明細書中に記載される方法及び組成物において利用されるプライム編集因子において使用される特定のCas9に関して制限されない。

本明細書に記されるCas9ヌクレアーゼ配列及び構造は当業者には周知である(例として、「Complete genome sequence of an M1 strain of Streptococcus pyogenes.」Ferretti et al.,J.J.,McShan W.M.,Ajdic D.J.,Savic D.J.,Savic G.,Lyon K.,Primeaux C.,Sezate S.,Suvorov A.N.,Kenton S.,Lai H.S.,Lin S.P.,Qian Y.,Jia H.G.,Najar F.Z.,Ren Q.,Zhu H.,Song L.,White J.,Yuan X.,Clifton S.W.,Roe B.A.,McLaughlin R.E.,Proc.Natl.Acad.Sci.U.S.A.98:4658-4663(2001);「CRISPR RNA maturation by trans-encoded small RNA and host factor RNase III.」Deltcheva E.,Chylinski K.,Sharma C.M.,Gonzales K.,Chao Y.,Pirzada Z.A.,Eckert M.R.,Vogel J.,Charpentier E.,Nature 471:602-607(2011);及び「A programmable dual-RNA-guided DNA endonuclease in adaptive bacterial immunity.」Jinek M.,Chylinski K.,Fonfara I.,Hauer M.,Doudna J.A.,Charpentier E.Science 337:816-821(2012)(これら各々の内容全体は参照により本明細書に組み込まれる)を参照)。

Cas9及びCas9等価物の例が次の通り提供される;しかしながら、これらの特定の例は限定することを意味されない。本開示の方法及び組成物で利用されるプライム編集因子は、任意の適切なCas9又はCas9同等物を包含する任意の適切なnapDNAbpを使用してもよい。

A.野生型標準SpCas9
一態様において、本明細書中に記載される方法及び組成物において利用されるプライム編集因子構築物は、S.pyogenes由来の「標準的なSpCas9」ヌクレアーゼを含んでもよく、これは、ゲノム工学のためのツールとして広く使用されており、クラス2 CRISPR-Cas系の酵素のタイプIIサブグループとして分類される。このCas9タンパク質は、2つの別物のヌクレアーゼドメインを含有する大きいマルチドメインタンパク質である。1つの又は両方のヌクレアーゼ活性を廃止するための点変異がCas9上に導入され得、夫々ニッカーゼCas9(nCas9)又は不活性型Cas9(dCas9)をもたらす。これは、sgRNAによってプログラムされる様式でDNAに結合するその能力をなお保持する。原理的には、別のタンパク質又はドメインに融合されるときに、Cas9又はそのバリアント(例としてnCas9)は、単純に適当なsgRNAとの共発現によって、そのタンパク質を実質的にいずれかのDNA配列へと標的化し得る。本明細書において用いられる標準的なSpCas9タンパク質は、次のアミノ酸配列を有するStreptococcus pyogenesからの野生型タンパク質を指す:

本明細書に記載の方法及び組成物で利用されるプライム編集因子は、標準SpCas9、又は上に提供される野生型Cas9配列と少なくとも80％、少なくとも85％、少なくとも90％、少なくとも95％、若しくは少なくとも99％の配列同一性を有するその任意のバリアントを包含してもよい。これらのバリアントは、1つ以上の変異を含有するSpCas9バリアントを包含してもよく、SwissProtアクセッションNo.Q99ZW2(配列番号2)エントリーで報告されているいずれかの公知の変異を包含してもよい。これらは以下を包含する。

本開示に用いられてもよい他の野生型SpCas9配列は以下を包含する。

本明細書に記載の方法及び組成物で利用されるプライム編集因子は、上のSpCas9配列のいずれか、又は少なくとも80％、少なくとも85％、少なくとも90％、少なくとも95％、又は少なくとも99％配列同一性をそれに対して有するそのいずれかのバリアントを包含してもよい。

B.野生型Cas9オルソログ
他の態様において、Cas9タンパク質は、S.pyogenesからの標準的なCas9とは異なる別の細菌種からの野生型Cas9オルソログであり得る。例えば、以下のCas9オルソログは、本明細書中に記載される方法及び組成物において利用されるプライム編集因子構築物に関連して使用され得る。加えて、少なくとも80％、少なくとも85％、少なくとも90％、少なくとも95％、又は少なくとも99％配列同一性を下のオルソログのいずれかに対して有するいずれかのバリアントCas9オルソログもまたプライム編集因子に用いられてもよい。

本明細書に記載の方法及び組成物で利用されるプライム編集因子は、上のCas9オルソログ配列のいずれか、又は少なくとも80％、少なくとも85％、少なくとも90％、少なくとも95％、又は少なくとも99％配列同一性をそれに対して有するそのいずれかのバリアントを包含してもよい。

napDNAbpは、Cas9等の任意の適切なホモログ及び/又はオルソログ又は天然に存在する酵素を包含してもよい。Cas9ホモログ及び/又はオルソログはS.pyogenes及びS.thermophilusを包含するがこれらに限定されない種々の種において記載されている。好ましくは、Cas部分はニッカーゼとして構成される(例として、変異導入されるか、組換え操作されるか、又は別様に天然から得られる)。すなわち、標的二本鎖DNAの一本鎖のみを切断することができる。追加の好適なCas9ヌクレアーゼ及び配列は、本開示に基づき当業者に明らかであろう。またかかるCas9ヌクレアーゼ及び配列は、Chylinski,Rhun,and Charpentier,「The tracrRNA and Cas9 families of type II CRISPR-Cas immunity systems」(2013)RNA Biology 10:5,726-737(この内容全体は参照により本明細書に組み込まれる)に開示された生物及び遺伝子座からのCas9配列を包含する。いくつかの態様では、Cas9ヌクレアーゼは不活性な(例として不活性化された)DNA切断ドメインを有する。つまり、Cas9はニッカーゼである。いくつかの態様では、Cas9タンパク質は、表3のバリアントのいずれか1つによって提供されるCas9タンパク質のアミノ酸配列と少なくとも80％同一であるアミノ酸配列を含む。いくつかの態様では、Cas9タンパク質は、上の表のCas9オルソログのいずれか1つによって提供されるCas9タンパク質のアミノ酸配列と少なくとも85％、少なくとも90％、少なくとも92％、少なくとも95％、少なくとも96％、少なくとも97％、少なくとも98％、少なくとも99％、又は少なくとも99.5％同一であるアミノ酸配列を含む。

C.Dead Cas9バリアント
ある態様において、本明細書に記載の方法及び組成物で利用されるプライム編集因子は、不活性型Cas9、例として不活性型SpCas9を包含してもよい。これは、Cas9の両方のヌクレアーゼドメイン、つまりRuvCドメイン(これは、非プロトスペーサDNA鎖を切断する)及びHNHドメイン(これはプロトスペーサDNA鎖を切断する)を不活性化する1つ以上の変異を原因として、ヌクレアーゼ活性を有さない。ヌクレアーゼ不活性化は、コードされるタンパク質、又は少なくとも80％、少なくとも85％、少なくとも90％、少なくとも95％、若しくは少なくとも99％配列同一性をそれに対して有するそのいずれかのバリアントのアミノ酸配列に1以上の置換及び/又は欠失をもたらす1以上の変異を原因としてもよい。

本明細書で使用される場合、「dCas9」という用語は、ヌクレアーゼ不活性Cas9若しくはヌクレアーゼdead Cas9、又はその機能的断片を指し、任意の生物由来の任意の天然に存在するdCas9、任意の天然に存在するdCas9の等価物若しくは機能的断片、任意の操作されたdCas9バリアント若しくはその機能的断片、任意の生物由来の任意のdCas9ホモログ、オルソログ若しくはパラログ、及び天然に存在する若しくは操作されたdCas9の任意の変異体若しくはバリアントを受け入れる。用語dCas9は特に限定することを意味されず、「dCas9又は等価物」と呼ばれてもよい。例示のdCas9タンパク質とdCas9タンパク質を作るための方法とは、更に本明細書に記載及び/又は当該技術分野において記載されており、参照によって本明細書に組み込まれる。

他の態様において、dCas9は、部分的に又は丸ごとで、Cas9ヌクレアーゼ活性を不活性化する1以上の変異を有するCas9アミノ酸配列に対応するか又はそれを含む。他の態様において、D10A及びH840A以外の変異を有するCas9バリアントが提供され、これらは内因性Cas9ヌクレアーゼ活性の完全な又は部分的な不活性化物をもたらしてもよい(例として、夫々nCas9又はdCas9)。かかる変異は、例として、D10及びH840における他のアミノ酸置換、又はCas9のヌクレアーゼドメイン上の他の置換(例として、HNHヌクレアーゼサブドメイン及び/又はRuvC1サブドメイン上の置換)を、Streptococcus pyogenesからのCas9(NCBI参照配列:NC_017053.1)等の野生型配列を参照して包含する。いくつかの態様では、Cas9のバリアント又はホモログ(例として、Streptococcus pyogenesからのCas9(NCBI参照配列:NC_017053.1(配列番号4))のバリアント)が提供され、これらは、NCBI参照配列:NC_017053.1と少なくとも約70％同一、少なくとも約80％同一、少なくとも約90％同一、少なくとも約95％同一、少なくとも約98％同一、少なくとも約99％同一、少なくとも約99.5％同一、又は少なくとも約99.9％同一である。いくつかの態様では、dCas9のバリアント(例として、NCBI参照配列:NC_017053.1(配列番号4)のバリアント)が提供され、NC_017053.1(配列番号4)よりも約5アミノ酸、約10アミノ酸、約15アミノ酸、約20アミノ酸、約25アミノ酸、約30アミノ酸、約40アミノ酸、約50アミノ酸、約75アミノ酸、約100アミノ酸、又はより多くだけ短いか又は長いアミノ酸配列を有する。

1つの態様では、不活性型Cas9はQ99ZW2の標準的なSpCas9配列に基づいてもよく、D10X及びH810X置換(下線付き且つ太字)を含む次の配列を有してもよく、Xはいずれかのアミノ酸であってもよく、又はバリアントは少なくとも80％、少なくとも85％、少なくとも90％、少なくとも95％、若しくは少なくとも99％配列同一性をそれに対して有する配列番号40のバリアントであり得る。

1つの態様では、不活性型Cas9はQ99ZW2の標準的なSpCas9配列に基づいてもよく、D10A及びH810A置換(下線付き且つ太字)を含む次の配列を有してもよく、又は少なくとも80％、少なくとも85％、少なくとも90％、少なくとも95％、若しくは少なくとも99％配列同一性をそれに対して有する配列番号23のバリアントであってもよい。

D.Cas9ニッカーゼバリアント
1つの態様において、本明細書中に記載される方法及び組成物において利用されるプライム編集因子は、Cas9ニッカーゼを含む。用語「Cas9ニッカーゼ」又は「nCas9」は、二本鎖DNA分子標的上に一本鎖切断を導入することができるCas9のバリアントを指す。いくつかの態様では、Cas9ニッカーゼは単一の機能するヌクレアーゼドメインのみを含む。野生型Cas9(例として標準的なSpCas9)は、2つの別個のヌクレアーゼドメイン、つまりRuvCドメイン(これは非プロトスペーサDNA鎖を切断する)及びHNHドメイン(これはプロトスペーサDNA鎖を切断する)を含む。1つの態様では、Cas9ニッカーゼはRuvCヌクレアーゼ活性を不活性化するRuvCドメインの変異を含む。例えば、アスパラギン酸(D)10、ヒスチジン(H)983、アスパラギン酸(D)986、又はグルタミン酸(E)762の変異は、RuvCヌクレアーゼドメインの機能喪失変異及び機能的なCas9ニッカーゼの作成として報告されている(例として、Nishimasu et al.,「Crystal structure of Cas9 in complex with guide RNA and target DNA,」Cell 156(5),935-949。これは参照によって本明細書に組み込まれる)。それゆえに、RuvCドメインのニッカーゼ変異はD10X、H983X、D986X、又はE762Xを包含し得、Xは野生型アミノ酸以外のいずれかのアミノ酸である。ある態様において、ニッカーゼはD10A、若しくは(of)H983A、D986A、若しくはE762A、又はそれらの組み合わせであり得る。

種々の態様において、Cas9ニッカーゼはRuvCヌクレアーゼドメインに変異を有し得、次のアミノ酸配列の1つ、又は少なくとも80％、少なくとも85％、少なくとも90％、少なくとも95％、若しくは少なくとも99％配列同一性をそれに対して有するアミノ酸配列を有するそのバリアントを有し得る。

別の態様では、Cas9ニッカーゼはHNHヌクレアーゼ活性を不活性化するHNHドメインの変異を含む。例えば、ヒスチジン(H)840又はアスパラギン(R)863の変異は、HNHヌクレアーゼドメインの機能喪失変異及び機能的なCas9ニッカーゼの作成として報告されている(例として、Nishimasu et al.,「Crystal structure of Cas9 in complex with guide RNA and target DNA,」Cell 156(5),935-949。これは参照によって本明細書に組み込まれる)。それゆえに、HNHドメインのニッカーゼ変異はH840X及びR863Xを包含し得、Xは野生型アミノ酸以外のいずれかのアミノ酸である。ある態様において、ニッカーゼはH840A若しくはR863A又はそれらの組み合わせであり得る。

種々の態様において、Cas9ニッカーゼはHNHヌクレアーゼドメインの変異を有し得、次のアミノ酸配列の1つ、又は少なくとも80％、少なくとも85％、少なくとも90％、少なくとも95％、又は少なくとも99％配列同一性をそれに対して有するアミノ酸配列を有するそのバリアントを有し得る。

いくつかの態様では、N末端メチオニンが、Cas9ニッカーゼから、又は本明細書において開示若しくは企図されるいずれかのCas9バリアント、オルソログ、若しくは等価物から除去される。例えば、メチオニンマイナスCas9ニッカーゼは、次の配列、又は少なくとも80％、少なくとも85％、少なくとも90％、少なくとも95％、若しくは少なくとも99％配列同一性をそれらに対して有するアミノ酸配列を有するそれらのバリアントを包含する。

E.他のCas9バリアント
不活性型Cas9及びCas9ニッカーゼバリアントの他に、本明細書において用いられるCas9タンパク質は、本明細書に開示のか又は当該技術分野において公知のいずれかの野生型Cas9又は変異体Cas9(例として、不活性型Cas9又はCas9ニッカーゼ)、又はフラグメントCas9、又は循環置換体Cas9、又はCas9の他のバリアントを包含するいずれかの参照Cas9タンパク質と少なくとも約70％同一、少なくとも約80％同一、少なくとも約90％同一、少なくとも約95％同一、少なくとも約96％同一、少なくとも約97％同一、少なくとも約98％同一、少なくとも約99％同一、少なくとも約99.5％同一、又は少なくとも約99.9％同一である他の「Cas9バリアント」をもまた包含してもよい。いくつかの態様では、Cas9バリアントは、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、21、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、又はより多くのアミノ酸変化を、参照Cas9と比較して有してもよい。いくつかの態様では、Cas9バリアントは参照Cas9のフラグメント(例として、gRNA結合ドメイン又はDNA切断ドメイン)を含み、その結果、フラグメントは、野生型Cas9の対応するフラグメントと少なくとも約70％同一、少なくとも約80％同一、少なくとも約90％同一、少なくとも約95％同一、少なくとも約96％同一、少なくとも約97％同一、少なくとも約98％同一、少なくとも約99％同一、少なくとも約99.5％同一、又は少なくとも約99.9％同一である。いくつかの態様では、フラグメントは、対応する野生型Cas9(例として配列番号2)のアミノ酸長さの少なくとも30％、少なくとも35％、少なくとも40％、少なくとも45％、少なくとも50％、少なくとも55％、少なくとも60％、少なくとも65％、少なくとも70％、少なくとも75％、少なくとも80％、少なくとも85％、少なくとも90％、少なくとも95％同一、少なくとも96％、少なくとも97％、少なくとも98％、少なくとも99％、又は少なくとも99.5％である。

いくつかの態様では、本開示は、本明細書に開示のいずれかのCas9タンパク質のフラグメントであるそれらの機能性を保持するCas9フラグメントをもまた利用してもよい。いくつかの態様では、Cas9フラグメントは長さが少なくとも100アミノ酸である。いくつかの態様では、フラグメントは長さが少なくとも100、150、200、250、300、350、400、450、500、550、600、650、700、750、800、850、900、950、1000、1050、1100、1150、1200、1250、又は少なくとも1300アミノ酸である。

種々の態様において、本明細書に開示の方法及び組成物で利用されるプライム編集因子は、次の通り記載されるCas9バリアントの1つ、又はいずれかの参照Cas9バリアントと少なくとも約70％同一、少なくとも約80％同一、少なくとも約90％同一、少なくとも約95％同一、少なくとも約96％同一、少なくとも約97％同一、少なくとも約98％同一、少なくとも約99％同一、少なくとも約99.5％同一、若しくは少なくとも約99.9％同一であるそのCas9バリアントを含んでもよい。

F.小さいサイズのCas9バリアント
いくつかの態様では、本明細書において企図される方法及び組成物で利用されるプライム編集因子は、標準的なSpCas9配列よりも小さい分子量であるCas9タンパク質を包含し得る。いくつかの態様では、より小さいサイズのCas9バリアントは、例として発現ベクター、ナノ粒子、又は送達の他の手段による細胞への送達を容易化してもよい。ある態様において、より小さいサイズのCas9バリアントは、クラス2 CRISPR-CasシステムのII型酵素として類別される酵素を包含し得る。いくつかの態様では、より小さいサイズのCas9バリアントは、クラス2 CRISPR-CasシステムのV型酵素として類別される酵素を包含し得る。他の態様において、より小さいサイズのCas9バリアントは、クラス2 CRISPR-CasシステムのVI型酵素として類別される酵素を包含し得る。

標準的なSpCas9タンパク質は、1368アミノ酸長であり、158キロダルトンの予測分子量を有する。本明細書で使用される「小型Cas9変異体」という用語は、少なくとも1300アミノ酸未満、又は少なくとも1290アミノ酸未満、又は1280アミノ酸未満、又は1270アミノ酸未満、又は1260アミノ酸未満、又は1250アミノ酸未満、又は1240アミノ酸未満、又は1230アミノ酸未満、又は1220アミノ酸未満、又は1210アミノ酸未満、又は1200アミノ酸未満、又は1190アミノ酸未満、又は1180アミノ酸未満、又は1170アミノ酸未満、又は1160アミノ酸未満、又は1150アミノ酸未満、又は1140アミノ酸未満、又は1130アミノ酸未満、又は1120アミノ酸未満、又は1110アミノ酸未満、又は1100アミノ酸未満、又は1050アミノ酸未満、又は1000アミノ酸未満、又は950アミノ酸未満、又は900アミノ酸未満、又は850アミノ酸未満、又は800アミノ酸未満、又は750アミノ酸未満、又は700アミノ酸未満、又は650アミノ酸未満、又は600アミノ酸未満、又は550アミノ酸未満、又は500アミノ酸未満であるが、少なくとも400アミノ酸超であり、Cas9タンパク質の必要な機能を保持する、天然に存在する、操作された、又はその他の任意のCas9変異体を指す。Cas9変異体は、クラス2 CRISPR-Cas系のII型、V型又はVI型酵素として分類されるものを包含し得る。

様々な態様において、本明細書に開示される方法及び組成物で利用されるプライム編集因子は、以下のように記載される小型Cas9バリアント、又は任意の参照小型Cas9タンパク質と少なくとも約70％同一、少なくとも約80％同一、少なくとも約90％同一、少なくとも約95％同一、少なくとも約96％同一、少なくとも約97％同一、少なくとも約98％同一、少なくとも約99％同一、少なくとも約99.5％同一、又は少なくとも約99.9％同一であるそのCas9バリアントの1つを含んでもよい。

G.Cas9等価物
いくつかの態様において、本明細書中に記載される方法及び組成物において利用されるプライム編集因子は、任意のCas9同等物を包含し得る。本明細書において用いられる用語「Cas9等価物」は、幅広い用語であり、これは、そのアミノ酸一次配列及び/又はその三次元構造が異なってもよく及び/又は進化的立場からは無関係であってもよいにもかかわらず、プライム編集因子においてCas9と同じ機能を供するいずれかのnapDNAbpタンパク質を包摂する。それゆえに、Cas9等価物は進化的に関係する本明細書に記載又は受け入れられるいずれかのCas9オルソログ、ホモログ、変異体、又はバリアントを包含するが、Cas9等価物は、Cas9と同じか又は類似の機能を有するように収斂進化プロセスによって進化してもよいが、アミノ酸配列及び/又は三次元構造についていずれかの類似性を必ずしも有さないタンパク質をもまた受け入れる。Cas9等価物が収斂進化によって発生したタンパク質に基づいてもよいにもかかわらず、ここで記載される方法及び組成物で利用されるプライム編集因子は、Cas9と同じか又は類似の機能を提供するであろういずれかのCas9等価物を受け入れる。例えば、Cas9がCRISPR-CasシステムのII型酵素を指す場合には、Cas9等価物はCRISPR-CasシステムのV型又はVI型酵素を指し得る。

例えば、Cas12e(CasX)は、報告によるとCas9と同じ機能を有するが、収斂進化によって進化したCas9等価物である。したがって、Liu et al.,「CasX enzymes comprises a distinct family of RNA-guided genome editors,」Nature,2019,Vol.566:218-223に記載されているCas12e(CasX)タンパク質は、本明細書に記載の方法及び組成物で利用されるプライム編集因子と共に使用されることが企図されている。加えて、Cas12e(CasX)のいずれかのバリアント又は修飾が想像され、本開示の範囲内である。

Cas9は広い種々の種において進化した細菌酵素である。しかしながら、本明細書において企図されるCas9等価物は古細菌からもまた得られてもよい。これらは細菌とは異なる単細胞原核微生物のドメイン及び界を構成する。
いくつかの態様では、Cas9等価物はCas12e(CasX)又はCas12d(CasY)を指してもよい。これらは例えばBurstein et al.,「New CRISPR-Cas systems from uncultivated microbes.」Cell Res.2017 Feb 21.doi:10.1038/cr.2017.21に記載されている。これの内容全体は参照によってここに組み込まれる。ゲノム分解能メタゲノミクスを用いて、生命の古細菌ドメインにおける最初に報告されたCas9を包含するいくつものCRISPR-Casシステムが同定された。この分岐したCas9タンパク質は、わずかにしか研究されていないナノ古細菌から活性なCRISPR-Casシステムの一部として見出された。細菌では、2つの先には未知のシステムCRISPR-Cas12e及びCRISPR-Cas12dが発見された。これらはこれまでに発見された最もコンパクトなシステムのうちである。いくつかの態様では、Cas9はCas12e又はCas12eのバリアントを指す。いくつかの態様では、Cas9はCas12d又はCas12dのバリアントを指す。他のRNAによってガイドされるDNA結合タンパク質が核酸プログラム可能DNA結合タンパク質(napDNAbp)として用いられてもよく、本開示の範囲内であるということは了解されるはずである。Liu et al.,「CasX enzymes comprises a distinct family of RNA-guided genome editors,」Nature,2019,Vol.566:218-223をもまた参照。これらのCas9等価物のいずれかが企図される。

いくつかの態様では、Cas9等価物は、天然に存在するCas12e(CasX)又はCas12d(CasY)タンパク質と少なくとも85％、少なくとも90％、少なくとも91％、少なくとも92％、少なくとも93％、少なくとも94％、少なくとも95％、少なくとも96％、少なくとも97％、少なくとも98％、少なくとも99％、又は少なくとも99.5％同一であるアミノ酸配列を含む。いくつかの態様では、napDNAbpは天然に存在するCas12e(CasX)又はCas12d(CasY)タンパク質である。いくつかの態様では、napDNAbpは、本明細書において提供される野生型Cas部分又はいずれかのCas部分と少なくとも85％、少なくとも90％、少なくとも91％、少なくとも92％、少なくとも93％、少なくとも94％、少なくとも95％、少なくとも96％、少なくとも97％、少なくとも98％、少なくとも99％、又は少なくとも99.5％同一であるアミノ酸配列を含む。

種々の態様において、核酸プログラム可能DNA結合タンパク質は、限定なしに、Cas9(例として、dCas9及びnCas9)、Cas12e(CasX)、Cas12d(CasY)、Cas12a(Cpf1)、Cas12b1(C2c1)、Cas13a(C2c2)、Cas12c(C2c3)、アルゴノート、及びCas12b1を包含する。Cas9とは異なるPAM特異性を有する核酸プログラム可能DNA結合タンパク質の1つの例は、Prevotella及びFrancisellaからのクラスター化規則的間隔短回文反復1である(すなわちCas12a(Cpf1))。Cas9と類似に、Cas12a(Cpf1)もまたクラス2 CRISPRエフェクターであるが、それはII型サブグループよりもむしろ酵素のV型サブグループである。Cas12a(Cpf1)はCas9とは別物の特色を有するロバストなDNA干渉を媒介するということが示されている。Cas12a(Cpf1)は、tracrRNAを欠く単一のRNAによってガイドされるエンドヌクレアーゼであり、それは、Tリッチなプロトスペーサ隣接モチーフ(TTN、TTTN、又はYTN)を利用する。その上、Cpf1は互い違いのDNA二本鎖切断によってDNAを切断する。16のCpf1ファミリータンパク質のうち、Acidaminococcus及びLachnospiraceaeからの2つの酵素はヒト細胞における効率的なゲノム編集活性を有することが示される。Cpf1タンパク質は当技術分野で知られており、以前に、例えばYamano et al.,「Crystal structure of Cpf1 in complex with guide RNA and target DNA.」Cell(165)2016,p.949-962に記載されており、その全内容が参照により本明細書に組み込まれる。

なお他の態様において、Casタンパク質はいずれかのCRISPR関連タンパク質を包含してもよく、Cas12a、Cas12b1、Cas1、Cas1B、Cas2、Cas3、Cas4、Cas5、Cas6、Cas7、Cas8、Cas9(Csn1及びCsx12としてもまた公知)、Cas10、Csy1、Csy2、Csy3、Cse1、Cse2、Csc1、Csc2、Csa5、Csn2、Csm2、Csm3、Csm4、Csm5、Csm6、Cmr1、Cmr3、Cmr4、Cmr5、Cmr6、Csb1、Csb2、Csb3、Csx17、Csx14、Csx10、Csx16、CsaX、Csx3、Csx1、Csx15、Csf1、Csf2、Csf3、Csf4、それらのホモログ、又はそれらの修飾されたバージョンを包含するが、これらに限定されず、好ましくはニッカーゼ変異を含む(例として、配列番号2の野生型Cas9ポリペプチドのD10A変異に対応する変異)。

種々の他の態様において、napDNAbpは次のタンパク質のいずれかであり得る:Cas9、Cas12a(Cpf1)、Cas12e(CasX)、Cas12d(CasY)、Cas12b1(C2c1)、Cas13a(C2c2)、Cas12c(C2c3)、GeoCas9、CjCas9、Cas12g、Cas12h、Cas12i、Cas13b、Cas13c、Cas13d、Cas14、Csn2、xCas9、SpCas9-NG、循環置換Cas9、若しくはアルゴノート(Ago)ドメイン、又はそのバリアント。

例示のCas9等価物タンパク質配列は次を包含し得る:

本明細書に記載の方法及び組成物で利用されるプライム編集因子は、ガイドヌクレオチド配列によってプログラム可能なDNA結合タンパク質ドメインとして用いられてもよいCas12a(Cpf1)(dCpf1)バリアントをもまた含んでもよい。Cas12a(Cpf1)タンパク質は、Cas9のRuvCドメインに類似であるRuvC様エンドヌクレアーゼドメインを有するが、HNHエンドヌクレアーゼドメインは有さず、Cas12a(Cpf1)のN末端はCas9のアルファヘリックス系の認識ローブを有さない。Zetsche et al.,Cell,163,759-771,2015(これは参照によって本明細書に組み込まれる)においては、Cas12a(Cpf1)のRuvC様ドメインは両方のDNA鎖を切断することを担い、RuvC様ドメインの不活性化がCas12a(Cpf1)ヌクレアーゼ活性を不活性化するということが示された。
いくつかの態様では、napDNAbpは微生物CRISPR-Casシステムの単一のエフェクターである。微生物CRISPR-Casシステムの単一のエフェクターは、限定なしに、Cas9、Cas12a(Cpf1)、Cas12b1(C2c1)、Cas13a(C2c2)、及びCas12c(C2c3)を包含する。典型的には、微生物CRISPR-Casシステムはクラス1及びクラス2システムに分けられる。クラス1システムはマルチサブユニットエフェクター複合体を有するが、クラス2システムは単一のタンパク質エフェクターを有する。例えば、Cas9及びCas12a(Cpf1)はクラス2エフェクターである。Cas9及びCas12a(Cpf1)に加えて、3つの別物のクラス2 CRISPR-Casシステム(Cas12b1、Cas13a、及びCas12c)がShmakov et al.,「Discovery and Functional Characterization of Diverse Class 2 CRISPR Cas Systems」,Mol.Cell,2015 Nov 5;60(3):385-397によって記載されている。これの内容全体は参照によってここに組み込まれる。

システムの2つCas12b1及びCas12cのエフェクターは、Cas12aに関係するRuvC様エンドヌクレアーゼドメインを含有する。第3のシステムのCas13aは、2つの予測される(predicted)HEPN RNaseドメインを有するエフェクターを含有する。Cas12b1によるCRISPR RNAの生産とは違って、成熟CRISPR RNAの生産はtracrRNA非依存的である。Cas12b1はDNA切断についてはCRISPR RNA及びtracrRNA両方に依存する。細菌Cas13aは、そのRNAによって活性化される一本鎖RNA分解活性とは別物のCRISPR RNA成熟のための固有のRNase活性を所有することが示されている。これらのRNase機能は、互いとは、及びCas12aのCRISPR RNAプロセシング挙動とは異なる。例として、East-Seletsky,et al.,「Two distinct RNase activities of CRISPR-Cas13a enable guide-RNA processing and RNA detection」,Nature,2016 Oct 13;538(7624):270-273を参照。これの内容全体は参照によってここに組み込まれる。Leptotrichia shahiiのCas13aのin vitroの生化学分析は、Cas13aが単一のCRISPR RNAによってガイドされ、相補的なプロトスペーサを持つssRNA標的を切断するようにプログラムされ得るということを示している。2つの保存されたHEPNドメイン上の触媒残基が切断を媒介する。触媒残基の変異は触媒的に不活性なRNA結合タンパク質を生成する。例として、Abudayyeh et al.,「C2c2 is a single-component programmable RNA-guided RNA-targeting CRISPR effector」,Science,2016 Aug 5;353(6299)を参照。これの内容全体は参照によってここに組み込まれる。

Alicyclobaccillus acidoterrastris Cas12b1(AacC2c1)の結晶構造がキメラ単分子ガイドRNA(sgRNA)との複合体として報告されている。例として、Liu et al.,「C2c1-sgRNA Complex Structure Reveals RNA-Guided DNA Cleavage Mechanism」,Mol.Cell,2017 Jan 19;65(2):310-322を参照。これの内容全体は参照によってここに組み込まれる。結晶構造は三者複合体として標的DNAに結合したAlicyclobacillus acidoterrestris C2c1としてもまた報告されている。例として、Yang et al.,「PAM-dependent Target DNA Recognition and Cleavage by C2C1 CRISPR-Cas endonuclease」,Cell,2016 Dec 15;167(7):1814-1828を参照。これの内容全体は参照によってここに組み込まれる。AacC2c1の触媒的に有能な立体配座は、独立して単一のRuvC触媒ポケット内に配置された標的及び非標的DNA鎖両方によって、キャプチャされている。C2c1によって媒介される切断は、標的DNAの互い違いの7ヌクレオチド切断をもたらす。C2c1三者複合体と先に同定されたCas9及びCpf1カウンターパートとの間の構造比較は、CRISPR-Cas9システムによって用いられる機序の多様性を実証する。
いくつかの態様では、napDNAbpはC2c1、C2c2、又はC2c3タンパク質であってもよい。いくつかの態様では、napDNAbpはC2c1タンパク質である。いくつかの態様では、napDNAbpはCas13aタンパク質である。いくつかの態様では、napDNAbpはCas12cタンパク質である。いくつかの態様では、napDNAbpは、天然に存在するCas12b1(C2c1)、Cas13a(C2c2)、又はCas12c(C2c3)タンパク質と少なくとも85％、少なくとも90％、少なくとも91％、少なくとも92％、少なくとも93％、少なくとも94％、少なくとも95％、少なくとも96％、少なくとも97％、少なくとも98％、少なくとも99％、又は少なくとも99.5％同一であるアミノ酸配列を含む。いくつかの態様では、napDNAbpは天然に存在するCas12b1(C2c1)、Cas13a(C2c2)、又はCas12c(C2c3)タンパク質である。

H.Cas9循環置換体
種々の態様において、本明細書に開示の方法及び組成物で利用されるプライム編集因子はCas9の循環置換体を含んでもよい。

用語「循環置換Cas9」又はCas9の「循環置換体」又は「CP-Cas9」は、循環置換体バリアントとして生起するか又は修飾されているか又は操作されるいずれかのCas9タンパク質又はそのバリアントを指す。これは、Cas9タンパク質(例として、野生型Cas9タンパク質)のN末端及びC末端が局所的に再配置されているということを意味する。かかる循環置換Cas9タンパク質又はそれらのバリアントは、ガイドRNA(gRNA)と複合体化したときにDNAに結合する能力を保持する。Oakes et al.,「Protein Engineering of Cas9 for enhanced function,」Methods Enzymol,2014,546:491-511及びOakes et al.,「CRISPR-Cas9 Circular Permutants as Programmable Scaffolds for Genome Modification,」Cell,January 10,2019,176:254-267を参照。夫々は参照によって本明細書に組み込まれる。もたらされる循環置換タンパク質がガイドRNA(gRNA)と複合体化したときにDNAに結合する能力を保持する限り、本開示は、いずれかの先に公知のCP-Cas9を企図するか、又は新たなCP-Cas9を用いる。
いずれかのバリアント、オルソログ、又は任意の操作された若しくは天然に存在するCas9を包含する本明細書に記載のCas9タンパク質のいずれか、又はその等価物が、循環置換体バリアントとして再構成されてもよい。
様々な態様において、Cas9の環状順列は、以下の構造を有してもよい。
N末端-［元のC末端］-［任意選択のリンカー］-［元のN末端］-C末端。

例として、本開示は標準的なS.pyogenes Cas9の次の循環置換体を企図する(UniProtKB-Q99ZW2(CAS9_STRP1)の1368アミノ酸(付番は配列番号2のアミノ酸位置に基づく)):
N末端-［1268～1368］-［任意選択のリンカー］-［1～1267］-C末端;
N末端-［1168～1368］-［任意選択のリンカー］-［1～1167］-C末端;
N末端-［1068～1368］-［任意選択のリンカー］-［1～1067］-C末端;
N末端-［968～1368］-［任意選択のリンカー］-［1～967］-C末端;
N末端-［868～1368］-［任意選択のリンカー］-［1～867］-C末端;
N末端-［768～1368］-［任意選択のリンカー］-［1～767］-C末端;
N末端-［668～1368］-［任意選択のリンカー］-［1～667］-C末端;
N末端-［568～1368］-［任意選択のリンカー］-［1～567］-C末端;
N末端-［468～1368］-［任意選択のリンカー］-［1～467］-C末端;
N末端-［368～1368］-［任意選択のリンカー］-［1～367］-C末端;
N末端-［268～1368］-［任意選択のリンカー］-［1～267］-C末端;
N末端-［168～1368］-［任意選択のリンカー］-［1～167］-C末端;
N末端-［68～1368］-［任意選択のリンカー］-［1～67］-C末端;若しくは
N末端-［10～1368］-［任意選択のリンカー］-［1～9］-C末端、又は
他のCas9タンパク質(他のCas9オルソログ、バリアント等を包含する)の対応する循環置換体。

具体的な態様では、循環置換体(circular permutant)Cas9は次の構造を有する(S.pyogenes Cas9(UniProtKB-Q99ZW2(CAS9_STRP1)の1368アミノ酸(付番は配列番号2のアミノ酸位置に基づく)に基づく:
N末端-［102～1368］-［任意選択のリンカー］-［1～101］-C末端;
N末端-［1028～1368］-［任意選択のリンカー］-［1～1027］-C末端;
N末端-［1041～1368］-［任意選択のリンカー］-［1～1043］-C末端;
N末端-［1249～1368］-［任意選択のリンカー］-［1～1248］-C末端;若しくは
N末端-［1300～1368］-［任意選択のリンカー］-［1～1299］-C末端、又は
他のCas9タンパク質(他のCas9オルソログ、バリアント等を包含する)の対応する循環置換体。

なお他の態様において、循環置換体(circular permeant)Cas9は次の構造を有する(S.pyogenes Cas9(UniProtKB-Q99ZW2(CAS9_STRP1)の1368アミノ酸(付番は配列番号2のアミノ酸位置に基づく)に基づく:
N末端-［103～1368］-［任意選択のリンカー］-［1～102］-C末端;
N末端-［1029～1368］-［任意選択のリンカー］-［1～1028］-C末端;
N末端-［1042～1368］-［任意選択のリンカー］-［1～1041］-C末端;
N末端-［1250～1368］-［任意選択のリンカー］-［1～1249］-C末端;若しくは
N末端-［1301～1368］-［任意選択のリンカー］-［1～1300］-C末端、又は
他のCas9タンパク質(他のCas9オルソログ、バリアント等を包含する)の対応する循環置換体。

いくつかの態様では、循環置換体は、直接的に又はアミノ酸リンカー等のリンカーを用いることによってどちらかで、Cas9のC末端フラグメントをCas9のN末端フラグメントに連結することによって形成され得る。いくつかの態様では、C末端フラグメントは、Cas9のアミノ酸(例として、アミノ酸約1300-1368)のC末端95％以上、あるいはCas9(例として、配列番号54-63のいずれか1つ)のC末端90％、85％、80％、75％、70％、65％、60％、55％、50％、45％、40％、35％、30％、25％、20％、15％、10％、若しくは5％、又はより多くに対応してもよい。N末端部分は、Cas9のアミノ酸(例として、アミノ酸約1-1300)のN末端95％以上、あるいはCas9の(例として配列番号2の)N末端90％、85％、80％、75％、70％、65％、60％、55％、50％、45％、40％、35％、30％、25％、20％、15％、10％、若しくは5％、又はより多くに対応してもよい。

いくつかの態様では、循環置換体は、直接的に又はアミノ酸リンカー等のリンカーを用いることによってどちらかで、Cas9のC末端フラグメントをCas9のN末端フラグメントに連結することによって形成され得る。いくつかの態様では、N末端へと再配置されるC末端フラグメントは、Cas9のアミノ酸のC末端30％以下(例として、配列番号2のアミノ酸1012～1368)を包含するか又はそれらに対応する。いくつかの態様では、N末端へと再配置されるC末端フラグメントは、Cas9のアミノ酸(例として、配列番号2のCas9)のC末端30％、29％、28％、27％、26％、25％、24％、23％、22％、21％、20％、19％、18％、17％、16％、15％、14％、13％、12％、11％、10％、9％、8％、7％、6％、5％、4％、3％、2％、又は1％を包含するか又はそれらに対応する。いくつかの態様では、N末端へと再配置されるC末端フラグメントは、Cas9(例として、配列番号2のCas9)のC末端410残基以下を包含するか又はそれらに対応する。いくつかの態様では、N末端へと再配置されるC末端部分は、Cas9(例として、配列番号2のCas9)のC末端410、400、390、380、370、360、350、340、330、320、310、300、290、280、270、260、250、240、230、220、210、200、190、180、170、160、150、140、130、120、110、100、90、80、70、60、50、40、30、20、又は10残基を包含するか又はそれらに対応する。いくつかの態様において、N末端に再編成されたC末端部分は、Cas9のC末端357、341、328、120又は69残基(例として、配列番号2のCas9)を包含するか又はそれに対応する。

他の態様において、循環置換体Cas9バリアントは、次の方法に基づくCas9一次構造のトポロジー的再配置として定められてもよく、これは配列番号2のS.pyogenes Cas9に基づく:(a)Cas9一次構造の内部のアミノ酸残基に対応する循環置換体(CP)部位を選択し、これが元のタンパク質を2つの半分:N末端領域及びC末端領域へと切り分けること;(b)元のN末端領域に先立つ(precede)ように元のC末端領域(CP部位アミノ酸を含む)を動かすことによって、Cas9タンパク質配列を修飾し(例として、遺伝子工学技術による)、それによって、今やCP部位アミノ酸残基で始まるCas9タンパク質の新たなN末端を形成すること。CP部位は、例えばヘリカルIIドメイン、RuvCIIIドメイン、又はCTDドメインを包含するCas9タンパク質のいずれかのドメイン上に位置付られ得る。例えば、CP部位は、(配列番号2のS.pyogenes Cas9に対して相対的に)元のアミノ酸残基181、199、230、270、310、1010、1016、1023、1029、1041、1247、1249、又は1282に位置付けされてもよい。それゆえに、ひとたびN末端に位置替えされると、元のアミノ酸181、199、230、270、310、1010、1016、1023、1029、1041、1247、1249、又は1282は新たなN末端アミノ酸になるであろう。これらのCP-Cas9タンパク質の命名体系は、夫々Cas9-CP¹⁸¹、Cas9-CP¹⁹⁹、Cas9-CP²³⁰、Cas9-CP²⁷⁰、Cas9-CP³¹⁰、Cas9-CP¹⁰¹⁰、Cas9-CP¹⁰¹⁶、Cas9-CP¹⁰²³、Cas9-CP¹⁰²⁹、Cas9-CP¹⁰⁴¹、Cas9-CP¹²⁴⁷、Cas9-CP¹²⁴⁹、及びCas9-CP¹²⁸²と呼ばれてもよい。この記載は配列番号2からのCPバリアントを作ることに限定されることを意味されず、いずれかのCas9配列において、これらの位置に対応するCP部位において又は全く(entirely)他のCP部位においてどちらかでCPバリアントを作るために実装されてもよい。この記載は決して特定のCP部位を限定することを意味されない。実質的にいずれかのCP部位がCP-Cas9バリアントを形成するために用いられてもよい。

配列番号2のCas9に基づく例示のCP-Cas9アミノ酸配列が下で提供される。これにおいては、リンカー配列は下線付きによって指示され、任意選択のメチオニン(M)残基は太字で指示されている。本開示はリンカー配列を包含しないか又は異なるリンカー配列を包含するCP-Cas9配列を提供するということは了解されるはずである。CP-Cas9配列が配列番号2以外のCas9配列に基づいてもよいということは了解されるはずであり、本明細書において提供されるいずれかの例は限定することを意味されない。例示のCP-Cas9配列は次の通りである:

Cas9環状置換体は、本明細書中に記載される方法及び組成物において利用されるプライム編集構築物において有用であってもよい。Cas9のN末端へと再配置されてもよい配列番号2のCas9に基づくCas9の例示のC末端フラグメントが、下で提供される。Cas9のかかるC末端フラグメントは例示的であり、限定することを意味されないということは了解されるはずである。これらの例示のCP-Cas9フラグメントは次の配列を有する:

I.修飾されたPAM特異性を有するCas9バリアント
本開示の方法及び組成物において利用されるプライム編集因子はまた、修飾されたPAM特異性を有するCas9バリアントを含んでもよい。本開示のいくつかの側面は、その3'端に標準的なPAM(5'-NGG-3'(式中、NはA、C、G又はTである))を含まない標的配列に対して活性を示すCas9タンパク質を提供する。いくつかの態様において、Cas9タンパク質は、その3'端に5'-NGG-3'PAM配列を含む標的配列に対して活性を示す。いくつかの態様において、Cas9タンパク質は、その3'端に5'-NNG-3' PAM配列を含む標的配列に対して活性を示す。いくつかの態様において、Cas9タンパク質は、その3'端に5'-NNA-3' PAM配列を含む標的配列に対して活性を示す。いくつかの態様において、Cas9タンパク質は、その3'端に5'-NNC-3' PAM配列を含む標的配列に対して活性を示す。いくつかの態様において、Cas9タンパク質は、その3'端に5'-NNT-3' PAM配列を含む標的配列に対して活性を示す。いくつかの態様において、Cas9タンパク質は、その3'端に5'-NGT-3' PAM配列を含む標的配列に対して活性を示す。いくつかの態様において、Cas9タンパク質は、その3'端に5'-NGA-3' PAM配列を含む標的配列に対して活性を示す。いくつかの態様において、Cas9タンパク質は、その3'端に5'-NGC-3' PAM配列を含む標的配列に対して活性を示す。いくつかの態様において、Cas9タンパク質は、その3'端に5'-NAA-3' PAM配列を含む標的配列に対して活性を示す。いくつかの態様において、Cas9タンパク質は、その3'端に5'-NAC-3' PAM配列を含む標的配列に対して活性を示す。いくつかの態様において、Cas9タンパク質は、その3'端に5'-NAT-3' PAM配列を含む標的配列に対して活性を示す。更に他の態様では、Cas9タンパク質は、その3'端に5'-NAG-3' PAM配列を含む標的配列に対して活性を示す。

第1のアミノ酸残基(例としてA)から第2のアミノ酸残基(例としてT)への本明細書に記載のアミノ酸変異のいずれか(例として、A262T)は、第1のアミノ酸残基から(例として、保存された)第2のアミノ酸残基に類似であるアミノ酸残基への変異をもまた包含してもよいということは了解されるはずである。例えば、疎水性側鎖を有するアミノ酸(例として、アラニン、バリン、イソロイシン、ロイシン、メチオニン、フェニルアラニン、チロシン、又はトリプトファン)の変異は、異なる疎水性側鎖を有する第2のアミノ酸(例として、アラニン、バリン、イソロイシン、ロイシン、メチオニン、フェニルアラニン、チロシン、又はトリプトファン)への変異であってもよい。例えば、アラニンからトレオニンへの変異(例としてA262T変異)はまた、アラニンからサイズ及び化学的特性がトレオニンに類似であるアミノ酸、例えばセリンへの変異であってもよい。別の例として、正荷電側鎖を有するアミノ酸(例として、アルギニン、ヒスチジン、又はリジン)の変異は、異なる正荷電側鎖を有する第2のアミノ酸(例として、アルギニン、ヒスチジン、又はリジン)への変異であってもよい。別の例として、極性側鎖を有するアミノ酸(例として、セリン、トレオニン、アスパラギン、又はグルタミン)の変異は、異なる極性側鎖を有する第2のアミノ酸(例として、セリン、トレオニン、アスパラギン、又はグルタミン)への変異であってもよい。追加の類似のアミノ酸ペアは次を包含するが、これらに限定されない:フェニルアラニン及びチロシン;アスパラギン及びグルタミン;メチオニン及びシステイン;アスパラギン酸及びグルタミン酸;並びにアルギニン及びリジン。当業者は、かかる保存的アミノ酸置換が蓋然的にはタンパク質構造に対して軽度の効果を有し、機能を毀損することなしに良く忍容されることが蓋然的であるということを認識するであろう。いくつかの態様では、1つのアミノ酸からトレオニンへの本明細書で提供されるアミノ酸変異の任意のアミノは、セリンへのアミノ酸変異であってもよい。いくつかの態様では、1つのアミノ酸からアルギニンへの本明細書で提供されるアミノ酸変異の任意のアミノは、リジンへのアミノ酸変異であってもよい。いくつかの態様では、1つのアミノ酸からイソロイシンへの本明細書において提供されるアミノ酸変異の任意のアミノは、アラニン、バリン、メチオニン、又はロイシンへのアミノ酸変異であってもよい。いくつかの態様では、1つのアミノ酸からリジンへの本明細書で提供されるアミノ酸変異の任意のアミノは、アルギニンへのアミノ酸変異であってもよい。いくつかの態様では、1つのアミノ酸からアスパラギン酸への本明細書で提供されるアミノ酸変異の任意のアミノは、グルタミン酸又はアスパラギンへのアミノ酸変異であってもよい。いくつかの態様では、1つのアミノ酸からバリンへの本明細書において提供されるアミノ酸変異の任意のアミノは、アラニン、イソロイシン、メチオニン、又はロイシンへのアミノ酸変異であってもよい。いくつかの態様では、1つのアミノ酸からグリシンへの本明細書で提供されるアミノ酸変異の任意のアミノは、アラニンへのアミノ酸変異であってもよい。しかしながら、追加の保存されたアミノ酸残基は当業者によって認識されるであろうということは了解されるはずであり、他の保存されたアミノ酸残基へのアミノ酸変異のいずれかもまた本開示の範囲内である。

いくつかの態様では、Cas9タンパク質は、5'-NAA-3'PAM配列をその3'端に含む標的配列に対して活性を発揮する変異の組み合わせを含む。いくつかの態様では、変異の組み合わせは、表1の列記されているクローンのいずれか1つに存在する。いくつかの態様では、変異の組み合わせは、表1の列記されているクローンの保存的変異である。いくつかの態様では、Cas9タンパク質は、表1に列記されるCas9クローンのいずれか1つの変異の組み合わせを含む。

いくつかの態様では、Cas9タンパク質は、表1のバリアントのいずれか1つによって提供されるCas9タンパク質のアミノ酸配列と少なくとも80％同一であるアミノ酸配列を含む。いくつかの態様では、Cas9タンパク質は、表1のバリアントのいずれか1つによって提供されるCas9タンパク質のアミノ酸配列と少なくとも85％、少なくとも90％、少なくとも92％、少なくとも95％、少なくとも96％、少なくとも97％、少なくとも98％、少なくとも99％、又は少なくとも99.5％同一であるアミノ酸配列を含む。

いくつかの態様では、Cas9タンパク質は、配列番号2によって提供されるStreptococcus pyogenes Cas9と比較して、標準的なPAM(5'-NGG-3')をその3'端に含まない標的配列に対して増大した活性を発揮する。いくつかの態様では、Cas9タンパク質は、標準的なPAM配列(5'-NGG-3')に直接的に隣接しない3'端を有する標的配列に対して、同じ標的配列に対する配列番号2によって提供されるStreptococcus pyogenes Cas9の活性と比較して、少なくとも5倍増大した活性を発揮する。いくつかの態様では、Cas9タンパク質は、標準的なPAM配列(5'-NGG-3')に直接的に隣接しない標的配列に対して、同じ標的配列に対する配列番号2によって提供されるStreptococcus pyogenesの活性と比較して、少なくとも10倍、少なくとも50倍、少なくとも100倍、少なくとも500倍、少なくとも1,000倍、少なくとも5,000倍、少なくとも10,000倍、少なくとも50,000倍、少なくとも100,000倍、少なくとも500,000倍、又は少なくとも1,000,000倍増大した活性を発揮する。いくつかの態様では、標的配列の3'端はAAA、GAA、CAA、又はTAA配列に直接的に隣接する。いくつかの態様では、Cas9タンパク質は、5'-NAC-3'PAM配列をその3'端に含む標的配列に対して活性を発揮する変異の組み合わせを含む。いくつかの態様では、変異の組み合わせは、表2の列記されているクローンのいずれか1つに存在する。いくつかの態様では、変異の組み合わせは、表2の列記されているクローンの保存的変異である。いくつかの態様では、Cas9タンパク質は、表2の列記されているCas9クローンのいずれか1つの変異の組み合わせを含む。

いくつかの態様では、Cas9タンパク質は、表2のバリアントのいずれか1つによって提供されるCas9タンパク質のアミノ酸配列と少なくとも80％同一であるアミノ酸配列を含む。いくつかの態様では、Cas9タンパク質は、表2のバリアントのいずれか1つによって提供されるCas9タンパク質のアミノ酸配列と少なくとも85％、少なくとも90％、少なくとも92％、少なくとも95％、少なくとも96％、少なくとも97％、少なくとも98％、少なくとも99％、又は少なくとも99.5％同一であるアミノ酸配列を含む。

いくつかの態様では、Cas9タンパク質は、配列番号2によって提供されるStreptococcus pyogenes Cas9と比較して、標準的なPAM(5'-NGG-3')をその3'端に含まない標的配列に対して増大した活性を発揮する。いくつかの態様では、Cas9タンパク質は、標準的なPAM配列(5'-NGG-3')に直接的に隣接しない3'端を有する標的配列に対して、同じ標的配列に対する配列番号2によって提供されるStreptococcus pyogenes Cas9の活性と比較して、少なくとも5倍増大した活性を発揮する。いくつかの態様では、Cas9タンパク質は、標準的なPAM配列(5'-NGG-3')に直接的に隣接しない標的配列に対して、同じ標的配列に対する配列番号2によって提供されるStreptococcus pyogenesの活性と比較して、少なくとも10倍、少なくとも50倍、少なくとも100倍、少なくとも500倍、少なくとも1,000倍、少なくとも5,000倍、少なくとも10,000倍、少なくとも50,000倍、少なくとも100,000倍、少なくとも500,000倍、又は少なくとも1,000,000倍増大した活性を発揮する。いくつかの態様では、標的配列の3'端はAAC、GAC、CAC、又はTAC配列に直接的に隣接する。

いくつかの態様では、Cas9タンパク質は、5'-NAT-3'PAM配列をその3'端に含む標的配列に対して活性を発揮する変異の組み合わせを含む。いくつかの態様では、変異の組み合わせは表3の列記されているクローンのいずれか1つに存在する。いくつかの態様では、変異の組み合わせは、表3の列記されているクローンの保存的変異である。いくつかの態様では、Cas9タンパク質は、表3に列記されるCas9クローンのいずれか1つの変異の組み合わせを含む。

プライム編集因子に関して用いられ得る種々のnapDNAbpの上の記載は、決して限定することを意味されない。プライム編集因子は、公知であるか又は指向性進化若しくは別様の変異プロセスによって作られ得るか若しくは進化させられ得る標準的なSpCas9又はいずれかのオルソログCas9タンパク質又はいずれかのバリアントCas9タンパク質を含み得、Cas9のいずれかの天然に存在するバリアント、変異体、又は別様に操作されたバージョンを包含する。種々の態様において、Cas9又はCas9バリアント(variant)はニッカーゼ活性を有し、すなわち標的DNA配列の1つの(of)鎖のみを切断する。他の態様において、Cas9又はCas9バリアントは不活性なヌクレアーゼを有し、すなわち「不活性型」Cas9タンパク質である。用いられてもよい他のバリアントCas9タンパク質は、(例として、より容易な送達のために)標準的なSpCas9よりも小さい分子量を有するか又は修飾若しくは再配置された一次アミノ酸構造(例として循環置換体フォーマット)を有するものである。本明細書中に記載される方法及び組成物において利用されるプライム編集因子はまた、収束進化の結果であるCas12a/Cpf1及びCas12bタンパク質を包含するCas9同等物を含んでもよい。本明細書において用いられるnapDNAbp(例として、SpCas9、Cas9バリアント、又はCas9等価物)は、それらのPAM特異性を変改/増強する種々の修飾をもまた含有してもよい。最後に、本明細書は、少なくとも70％、少なくとも75％、少なくとも80％、少なくとも85％、少なくとも90％、少なくとも91％、少なくとも92％、少なくとも93％、少なくとも94％、少なくとも95％、少なくとも96％、少なくとも97％、少なくとも98％、少なくとも99％、又は少なくとも99.9％配列同一性を参照Cas9配列、例えば参照SpCas9標準的な配列又は参照Cas9等価物(例として、Cas12a/Cpf1)に対して有するいずれかのCas9、Cas9バリアント、又はCas9等価物を企図する。
具体的な態様では、拡張されたPAM能力を有するCas9バリアントはSpCas9(H840A)VRQR(配列番号64)であり、これは次のアミノ酸配列を有する(配列番号33のSpCas9(H840A)に対して相対的なV、R、Q、R置換が太字の下線で示されている。加えて、SpCas9(H840)のメチオニン残基はSpCas9(H840A)VRQRでは除去された):

別の具体的な態様では、拡張されたPAM能力を有するCas9バリアントはSpCas9(H840A)VRERであり、これは次のアミノ酸配列を有する(配列番号51のSpCas9(H840A)に対して相対的なV、R、E、R置換が太字の下線で示されている。加えて、SpCas9(H840)のメチオニン残基はSpCas9(H840A)VRERでは除去された):

いくつかの態様では、非標準的なPAM配列について機能するnapDNAbpはアルゴノートタンパク質である。かかる核酸プログラム可能DNA結合タンパク質の1つの例は、Natronobacterium gregoryiからのアルゴノートタンパク質(NgAgo)である。NgAgoはssDNAによってガイドされるエンドヌクレアーゼである。NgAgoは～24ヌクレオチドの5'リン酸化されたssDNA(gDNA)に結合してそれをその標的部位へとガイドし、gDNA部位においてDNA二本鎖切断を作製するであろう。Cas9とは対照的に、NgAgo-gDNAシステムはプロトスペーサ隣接モチーフ(PAM)を要求しない。ヌクレアーゼ不活性なNgAgo(dNgAgo)を用いることは、標的化され得る塩基を多大に拡張してもよい。NgAgoの特徴付け及び使用はGao et al.,Nat Biotechnol.,2016 Jul;34(7):768-73.PubMed PMID:27136078;Swarts et al.,Nature.507(7491)(2014):258-61;and Swarts et al.,Nucleic Acids Res.43(10)(2015):5120-9に記載されている。これらの夫々は参照によって本明細書に組み込まれる。

いくつかの態様では、napDNAbpはアルゴノートタンパク質の原核生物ホモログである。アルゴノートタンパク質の原核生物ホモログは知られており、例えばMakarova K.,et al.,「Prokaryotic homologs of Argonaute proteins are predicted to function as key components of a novel system of defense against mobile genetic elements」,Biol Direct.2009 Aug 25;4:29.doi:10.1186/1745-6150-4-29に記載されている。これの内容全体は参照によってここに組み込まれる。いくつかの態様では、napDNAbpはMarinitoga piezophila アルゴノート(MpAgo)タンパク質である。CRISPR関連Marinitoga piezophila アルゴノート(MpAgo)タンパク質は、5'-リン酸化されたガイドを用いて一本鎖標的配列を切断する。5'ガイドは全ての公知のアルゴノートによって用いられる。MpAgo-RNA複合体の結晶構造は、5'リン酸相互作用をブロックする残基を含むガイド鎖結合部位を示す。このデータは、5'ヒドロキシル化されたガイドに対する非標準的な特異性を有するアルゴノートサブクラスの進化を示唆する。例として、Kaya et al.,「A bacterial Argonaute with noncanonical guide RNA specificity」,Proc Natl Acad Sci U S A.2016 Apr 12;113(15):4057-62を参照。これの内容全体は参照によってここに組み込まれる)。他のアルゴノートタンパク質が用いられてもよく、本開示の範囲内であるということは了解されるはずである。

本開示のいくつかの側面は、異なるPAM特異性を有するCas9ドメインを提供する。典型的には、S.pyogenesからのCas9(spCas9)等のCas9タンパク質は、具体的な核酸領域に結合するためには標準的なNGG PAM配列を要求する。これはゲノム上の所望の塩基を編集する能力を限定してもよい。いくつかの態様では、本明細書において提供される塩基編集融合タンパク質は、精密な位置付けに置かれることを必要としてもよい。例えば、ここでは、標的塩基が4塩基領域(例として、「編集窓」)上に置かれ、これがPAMのおよそ15塩基上流にある。Komor,A.C.,et al.,「Programmable editing of a target base in genomic DNA without double-stranded DNA cleavage」Nature 533,420-424(2016)を参照。これの内容全体は参照によってここに組み込まれる。従って、いくつかの態様では、本明細書において提供される融合タンパク質のいずれかは、標準的な(例として、NGG)PAM配列を含有しないヌクレオチド配列に結合することができるCas9ドメインを含有してもよい。非標準的なPAM配列に結合するCas9ドメインは当該技術分野において記載されており、当業者には明らかであろう。例えば、非標準的なPAM配列に結合するCas9ドメインは、Kleinstiver,B.P.,et al.,「Engineered CRISPR-Cas9 nucleases with altered PAM specificities」Nature 523,481-485(2015);及びKleinstiver,B.P.,et al.,「Broadening the targeting range of Staphylococcus aureus CRISPR-Cas9 by modifying PAM recognition」Nature Biotechnology 33,1293-1298(2015)に記載されている;夫々の内容全体は参照によってここに組み込まれる。

例えば、次のアミノ酸配列を有する野生型Francisella novicida Cpf1(D917、E1006、及びD1255)(配列番号66)と少なくとも80％、少なくとも85％、少なくとも90％、少なくとも95％、又は少なくとも99％配列同一性を有するドメイン等の変改されたPAM特異性を有するnapDNAbpドメイン:

以下のアミノ酸配列を有する、野生型Geobacillus thermodenitrificans Cas9(配列番号20)と少なくとも80％、少なくとも85％、少なくとも90％、少なくとも95％、又は少なくとも99％の配列同一性を有するドメイン等のPAM特異性が変化した追加のnapDNAbpドメイン:

いくつかの態様では、核酸プログラム可能DNA結合タンパク質(napDNAbp)は、標準的な(NGG)PAM配列を要求しない核酸プログラム可能DNA結合タンパク質である。いくつかの態様では、napDNAbpはアルゴノートタンパク質である。かかる核酸プログラム可能DNA結合タンパク質の1つの例は、Natronobacterium gregoryiからのアルゴノートタンパク質(NgAgo)である。NgAgoはssDNAによってガイドされるエンドヌクレアーゼである。NgAgoは～24ヌクレオチドの5'リン酸化されたssDNA(gDNA)に結合してそれをその標的部位へとガイドし、gDNA部位においてDNA二本鎖切断を作製するであろう。Cas9とは対照的に、NgAgo-gDNAシステムはプロトスペーサ隣接モチーフ(PAM)を要求しない。ヌクレアーゼ不活性なNgAgo(dNgAgo)を用いることは、標的化され得る塩基を多大に拡張してもよい。NgAgoの特徴付け及び使用はGao et al.,Nat Biotechnol.,34(7):768-73(2016),PubMed PMID:27136078;Swarts et al.,Nature,507(7491):258-61(2014);及びSwarts et al.,Nucleic Acids Res.43(10)(2015):5120-9に記載されている。これらの夫々は参照によって本明細書に組み込まれる。Natronobacterium gregoryi Argonauteの配列は配列番号67によって提供される。

開示される融合タンパク質は、次のアミノ酸配列を有する野生型Natronobacterium gregoryi Argonaute(配列番号67)と少なくとも80％、少なくとも85％、少なくとも90％、少なくとも95％、又は少なくとも99％配列同一性を有するnapDNAbpドメインを含んでもよい:

加えて、いずれかの利用可能な方法が、バリアント又は変異体Cas9タンパク質を得るか又は構築するために利用されてもよい。本明細書において用いられる用語「変異」は、別の残基によるある配列、例として核酸若しくはアミノ酸配列上の残基の置換、又はある配列上の1以上の残基の欠失若しくは挿入を指す。変異は、典型的には、元の残基、次に配列上の残基の位置及び新たに置換された残基の同一性を同定することによって本明細書に記載される。本明細書において提供されるアミノ酸置換(変異)を作るための種々の方法が当該技術分野において周知であり、例えばGreen and Sambrook,Molecular Cloning:A Laboratory Manual(4th ed.,Cold Spring Harbor Laboratory Press,Cold Spring Harbor,N.Y.(2012))によって提供される。変異は、種々のカテゴリー、例えば1塩基多型、微小重複領域、インデル、及び逆位を包含し得、決して限定することを意味されない。変異は、タンパク質活性を縮減又は廃止する変異の正常の結果である「機能喪失」変異を包含し得る。ほとんどの機能喪失変異は劣性である。なぜなら、ヘテロ接合体では、第2の染色体コピーが完全に機能的なタンパク質をコードする遺伝子の未変異のバージョンを持ち、この存在が変異の効果を補償するからである。変異は、「機能獲得」変異をもまた包摂する。これは、正常な条件下ではさもなければ存在しない異常な活性をタンパク質又は細胞に付与するものである。多くの機能獲得変異はコード領域よりもむしろ制御配列にあり、よって、いくつもの帰結を有し得る。例えば、変異は、1以上の遺伝子が間違った組織において発現されることに至り得、これらの組織は、それらが正常では欠く機能を獲得する。それらの性質ゆえに、機能獲得変異は通常は優性である。

変異は部位特異的変異導入を用いて参照Cas9タンパク質上に導入され得る。当該技術分野で公知の部位特異的変異導入のより古い方法は、一本鎖DNA鋳型の単離を許すM13バクテリオファージベクター等のベクター上への変異させられるべき配列のサブクローニングに依拠する。これらの方法では、変異誘発プライマー(すなわち、変異させられるべき部位にアニールすることができるが、変異させられるべき部位に1以上のミスマッチのヌクレオチドを持つプライマー)を一本鎖鋳型にアニーリングさせ、次いで、変異誘発プライマーの3'端からスタートして鋳型の相補体を重合する。次いで、もたらされた二重鎖はホスト細菌に形質転換され、プラークが所望の変異についてスクリーニングされる。より最近では、部位特異的変異導入はPCR方法論を使用している。これらは一本鎖鋳型を要求しないという利点を有する。加えて、サブクローニングを要求しない方法が開発されている。PCRに基づく部位特異的変異導入が行われるときには、いくつかのイシューが考慮されなければならない。第1に、これらの方法では、ポリメラーゼによって導入される望まれない変異の拡張を防止するために、PCRサイクル数を縮減することが望ましい。第2に、反応中に残存する変異していない親の分子の数を縮減するために、セレクションが使用されなければならない。第3に、単一のPCRプライマーセットの使用を許すために、伸長された長さのPCR法が好ましい。そして第4に、いくつかの熱安定性ポリメラーゼの非鋳型依存性末端伸長活性ゆえに、多くの場合には、PCRによって生成された変異体産物の平滑末端ライゲーションに先行して、端を磨く工程を手続きに組み込むことが必要である。

変異は、指向性進化プロセス、例えばファージによって補助される連続的進化(PACE)又はファージによって補助される非連続的進化(PANCE)によってもまた導入されてもよい。本明細書において用いられる用語「ファージによって補助される連続的進化(PACE)」は、ファージをウイルスベクターとして使用する連続的進化を指す。PACEテクノロジーの一般概念は、例えば、2010年3月11日にWO2010/028347として公開された2009年9月8日出願の国際PCT出願PCT/US2009/056194;2012年6月28日にWO2012/088381として公開された2011年12月22日出願の国際PCT出願PCT/US2011/066747;2015年5月5日登録のU.S.出願U.S.特許No.9,023,594、2015年9月11日にWO2015/134121として公開された2015年1月20日出願の国際PCT出願PCT/US2015/012022、及び2016年10月20日にWO2016/168631として公開された2016年4月15日出願の国際PCT出願PCT/US2016/027795に記載されている。これらの夫々の内容全体は参照によって本明細書に組み込まれる。バリアントCas9はファージによって補助される非連続的進化(PANCE)によってもまた得られてもよい。本明細書において用いられるこれは、ファージをウイルスベクターとして使用する非連続的進化を指す。PANCEは急速なin vivoの指向性進化のための単純化された技術であり、新しいE.coliホスト細胞による進化させられるべき目当ての遺伝子を含有する進化する「セレクションファージ」(SP)の連続フラスコ植え継ぎを用い、それによって、ホストE.coli内の遺伝子が一定に保たれることを許しながら、SPに含有される遺伝子は連続的に進化する。連続フラスコ植え継ぎは微生物の実験室進化のための広くアクセス可能なアプローチとして長く用をなしており、より最近では、バクテリオファージ進化のための類縁のアプローチが開発されている。PANCEシステムはPACEシステムよりも低いストリンジェンシーを特色とする。

Cas9又はCas9等価物に関する上に記されている参照のいずれかは、既にそのように申し立てられていない場合には、それらの全体が参照によってここに組み込まれる。

他のプログラム可能ヌクレアーゼ
本明細書に記載の種々の態様において、プライム編集因子はCas9タンパク質等のnapDNAbpを含む。これらのタンパク質は、それらがガイドRNA(又は場合に応じてPEgRNA)と複合体化するようになることによって「プログラム可能」である。これは、gRNA(又はPEgRNA)のスペーサ部分に対して相補的である配列を所有し、且つ要求されるPAM配列をもまた所有するDNA上の標的部位へとCas9タンパク質をガイドする。しかしながら、ここで想定されるある態様において、napDNAbpは、異なるタイプのプログラム可能タンパク質、例えばジンクフィンガーヌクレアーゼ又は転写活性化因子様エフェクターヌクレアーゼ(TALEN)によって置換されてもよい。

適切なヌクレアーゼは、必ずしも核酸標的化分子(ガイドRNA等)によって「プログラム」される必要はなく、むしろ、特にヌクレアーゼ等のDNA結合ドメインの特異性を定義することによってプログラムされてもよいことが企図される。ちょうどnapDNAbp部分によるプライム編集のように、かかる代替的なプログラム可能ヌクレアーゼは、標的DNAの1つの鎖のみがカットされるようにして修飾されるということが好ましい。換言すると、プログラム可能ヌクレアーゼは好ましくはニッカーゼとして機能するべきである。ひとたびプログラム可能ヌクレアーゼが選択されると(例として、ZFN又はTALEN)、次いで、それがプライム編集様機序に従って作動することを許すように、追加の機能性がシステム上に操作されてもよい。例えば、プログラム可能ヌクレアーゼは(例として、化学的リンカーを介して)RNA又はDNA伸長アームをそれにカップリングすることによって修飾されてもよく、伸長アームはプライマー結合部位(PBS)及びDNA合成鋳型を含む。プログラム可能ヌクレアーゼは(例として、化学的又はアミノ酸リンカーを介して)ポリメラーゼにもまたカップリングされてもよい。これの性質は、伸長アームがDNA又はRNAであるかどうかに依存するであろう。RNA伸長アームのケースでは、ポリメラーゼはRNA依存性DNAポリメラーゼであり得る(例として逆転写酵素)。DNA伸長アームのケースでは、ポリメラーゼはDNA依存性DNAポリメラーゼであり得る(例として、Pol I、Pol II、若しくはPol IIIを包含する原核生物ポリメラーゼ、又はPol a、Pol b、Pol g、Pol d、Pol e、若しくはPol zを包含する真核生物ポリメラーゼ)。システムは、丸ごととしての反応を容易化するために、プログラム可能ヌクレアーゼへの融合体として追加又はトランスで追加される他の機能性をもまた包含してもよい(例として、(a)カットされた部位においてDNAをほどいて、プライマーとして利用可能な3'端を有するカットされた鎖を作るためのヘリカーゼ、(b)カットされた鎖上の内因性の鎖を除去することを助けて、合成された鎖による内因性の鎖の置き換えの方に反応を推進するためのFEN1、又は(c)非編集鎖の有利な細胞性修復によって合成修復の組み込みを推進することを助けてもよい、対向する鎖上の第2部位ニックを作り出すためのnCas9:gRNA複合体)。napDNAbpによるプライム編集と類縁の様式で、別様にプログラム可能ヌクレアーゼによるかかる複合体は、目当ての編集を持つDNAの新たに合成された置き換え鎖を合成し、次いで永久的にDNAの標的部位上に組み入れるために用いられ得る。

好適な代替的なプログラム可能ヌクレアーゼは当該技術分野で周知であり、これらは、DNAの標的部位に選択的に結合するようにプログラムされ得る代替的なプライム編集因子システムを構築するために、napDNAbp:gRNA複合体の代わりに用いられてもよい。且つ、これらは、ポリメラーゼとプライマー結合部位及びDNA合成鋳型を含むRNA又はDNA伸長アームとを特定のニック部位へと共局在させるために、上に記載されている様式で更に修飾され得る。例えば、転写活性化因子様エフェクターヌクレアーゼ(TALEN)が、プログラム可能ヌクレアーゼとして、本明細書に記載のプライム編集法及び組成物に用いられてもよい。TALENは、TALエフェクターDNA結合ドメインをDNA切断ドメインに融合することによって生成される人工の制限酵素である。これらの試薬は効率的な、プログラム可能、且つ特異的なDNA切断を可能化し、in situのゲノム編集のための強力なツールを表す。転写活性化因子様エフェクター(TALE)は、事実上いずれかのDNA配列に結合するように迅速に操作され得る。本明細書において用いられる用語TALENは幅広く、別のTALENからの補助なしに二本鎖DNAを切断し得るモノマーTALENを包含する。用語TALENは、同じ部位においてDNAを切断するために一緒に働くように操作されているTALENのペアの1つ又は両方のメンバーを指すためにもまた用いられる。一緒に働くTALENは左TALEN及び右TALENと呼ばれてもよい。これはDNAの掌性を参照している。米国第12/965,590号;米国第13/426,991号(米国特許第8,450,471号);米国第13/427,040号(米国特許第8,440,431号);米国第13/427,137号(米国特許第8,440,432号);及び米国第13/738,381号を見よ。これらの全てはそれらの全体が参照によって本明細書に組み込まれる。加えて、TALENはWO2015/027134、US 9,181,535、Boch et al.,「Breaking the Code of DNA Binding Specificity of TAL-Type III Effectors」,Science,vol.326,pp.1509-1512(2009),Bogdanove et al.,TAL Effectors:Customizable Proteins for DNA Targeting,Science,vol.333,pp.1843-1846(2011),Cade et al.,「Highly efficient generation of heritable zebrafish gene mutations using homo-and heterodimeric TALENs」,Nucleic Acids Research,vol.40,pp.8001-8010(2012),及びCermak et al.,「Efficient design and assembly of custom TALEN and other TAL effector-based constructs for DNA targeting」,Nucleic Acids Research,vol.39,No.17,e82(2011)に記載されている。これらの夫々は参照によって本明細書に組み込まれる。

ジンクフィンガーヌクレアーゼはまた、Cas9ニッカーゼ等のnapDNAbpの代わりに、本明細書に開示されるプライム編集方法及び組成物で使用するための代替的なプログラム可能ヌクレアーゼとして使用されてもよい。TALENSと同様に、ZFNタンパク質は、それらがニッカーゼとして機能するように、すなわち、本明細書に記載の方法及び組成物においてプライム編集因子で使用されるnapDNAbpと同様の方法で標的DNAの1本の鎖のみを切断するようにZFNを操作するように修飾されてもよい。ZFNタンパク質は、当該技術分野において、例えば、Carroll et al.,「Genome Engineering with Zinc-Finger Nucleases,」Genetics,Aug 2011,Vol.188:773-782;Durai et al.,「Zinc finger nucleases:custom-designed molecular scissors for genome engineering of plant and mammalian cells,」Nucleic Acids Res,2005,Vol.33:5978-90;及びGaj et al.,「ZFN,TALEN,and CRISPR/Cas-based methods for genome engineering,」Trends Biotechnol.2013,Vol.31:397-405(これらの各々はその全体が参照されることによって本明細書に組み込まれる)に広範囲に記載されている。

プライム編集因子:ポリメラーゼドメイン(例として、逆転写酵素)
本開示は、標的部位のプライム編集を行いながらDNAミスマッチ修復経路を阻害することによって、改善された編集効率及び/又は低減されたインデル形成を有するプライム編集のための組成物及び方法を提供する。したがって、本開示は、プライム編集によって核酸分子を編集するための方法であって、核酸分子をプライム編集因子、pegRNA、及びDNAミスマッチ修復経路の阻害剤と接触させ、それによって編集効率を高め、及び/又はインデル形成を低下させて、標的部位に核酸分子に対する1つ以上の修飾をインストールすることを伴う、方法を提供する。本開示は更に、napDNAbpをコードする核酸配列、ポリメラーゼ、及びDNAミスマッチ修復経路の阻害剤を含むプライム編集によってDNA標的部位を編集するためのポリヌクレオチドを提供し、ここでnapDNAbp及びポリメラーゼは、編集効率の向上及び/又はインデル形成の低下を伴ってDNA標的部位に1つ以上の修飾をインストールするpegRNAの存在下で可能である。したがって、本明細書に記載される方法及び組成物は、ポリメラーゼ(例として、逆転写酵素)を含んでもよいプライム編集因子を利用する。

様々な態様では、本明細書に開示される方法及び組成物で使用されるプライム編集因子は、napDNAbp又は他のプログラム可能ヌクレアーゼとの融合タンパク質として提供され得るか、又はトランスで提供され得るポリメラーゼ(例として、逆転写酵素等のDNA依存性DNAポリメラーゼ又はRNA依存性DNAポリメラーゼ)又はそのバリアントを包含する。

本明細書に開示される方法及び組成物を用いて、任意のポリメラーゼがプライム編集因子で使用されてもよい。ポリメラーゼは野生型ポリメラーゼ、機能的フラグメント、変異体、バリアント、又は短縮されたバリアント、及び同類であってもよい。ポリメラーゼは、真核、原核、古細菌、若しくはウイルス生物からの野生型ポリメラーゼを包含してもよく、及び/又はポリメラーゼは遺伝子工学、変異導入、指向性進化に基づくプロセスによって修飾されてもよい。ポリメラーゼはT7 DNAポリメラーゼ、T5 DNAポリメラーゼ、T4 DNAポリメラーゼ、KlenowフラグメントDNAポリメラーゼ、DNAポリメラーゼIII、及び同類を包含してもよい。ポリメラーゼはまた、熱安定性であってもよく、Taq、Tne、Tma、Pfu、Tfl、Tth、Stoffelフラグメント、VENT(登録商標)及びDEEPVENT(登録商標)DNAポリメラーゼ、KOD、Tgo、JDF3、並びにそれらの変異体、バリアント、及び誘導体を包含してもよい(米国特許第5,436,149号;米国特許第4,889,818号;米国特許第4,965,185号;米国特許第5,079,352号;米国特許第5,614,365号;米国特許第5,374,553号;米国特許第5,270,179号;米国特許第5,047,342号;米国特許第5,512,462号;WO 92/06188;WO 92/06200;WO 96/10640;Barnes,W.M.,Gene 112:29-35(1992);Lawyer,F.C.,et al.,PCR Meth.Appl.2:275-287(1993);Flaman,J.-M,et al.,Nuc.Acids Res.22(15):3259-3260(1994)(これらの各々は参照により本明細書に組み込まれる)を参照)。より長い核酸分子(例として、長さが約3-5Kbよりも長い核酸分子)の合成には、少なくとも2つのDNAポリメラーゼが使用され得る。ある態様において、ポリメラーゼの1つは3'エキソヌクレアーゼ活性を実質的に欠き得、他は3'エキソヌクレアーゼ活性を有してもよい。かかるペアリングは同じか又は異なるポリメラーゼを包含してもよい。3'エキソヌクレアーゼ活性を実質的に欠くDNAポリメラーゼの例は、Taq、Tne(exo-)、Tma(exo-)、Pfu(exo-)、Pwo(exo-)、exo-KOD、及びTth DNAポリメラーゼ、並びにそれらの変異体、バリアント、及び誘導体を包含するが、これらに限定されない。

好ましくは、本明細書に開示の方法及び組成物で利用されるプライム編集因子に使用可能なポリメラーゼは「鋳型依存性」ポリメラーゼである(なぜなら、ポリメラーゼは、プライム編集の間に合成中のDNA鎖の配列を規定するためにはDNA合成鋳型に依拠することを意図されるからである。本明細書において用いられる用語「鋳型DNA分子」は、相補的な核酸鎖がDNAポリメラーゼによって例えばPEgRNAのDNA合成鋳型のプライマー伸長反応によって次いで合成される核酸の鎖を指す。

本明細書において用いられる用語「鋳型依存的様式」は、プライマー分子の鋳型依存的伸長(例として、DNAポリメラーゼによるDNA合成)を伴うプロセスを指すことを意図される。用語「鋳型依存的様式」は、ポリヌクレオチドの新たに合成される鎖の配列が相補的な塩基対形成の周知のルールによって記述されるRNA又はDNAのポリヌクレオチド合成を指す(例えば、Watson,J.D.et al.,In:Molecular Biology of the Gene,4th Ed.,W.A.Benjamin,Inc.,Menlo Park,Calif.(1987)を参照)。用語「相補的」は、塩基対形成による2つのポリヌクレオチド鎖の領域間の又は2つのヌクレオチド間の配列相補性の幅広い概念を指す。アデニンヌクレオチドは、チミン又はウラシルであるヌクレオチドと特異的な水素結合を形成する(「塩基対形成する」)ことができるということが公知である。類似に、シトシンヌクレオチドは、グアニンヌクレオチドと塩基対形成することができるということが公知である。そのため、プライム編集のケースでは、DNA合成鋳型に対してプライム編集因子のポリメラーゼによって合成されるDNAの一本鎖は、DNA合成鋳型の配列に対して「相補的」であると言われるということが言われ得る。

A.例示のポリメラーゼ
様々な態様において、本明細書中に記載される方法及び組成物において利用されるプライム編集因子はポリメラーゼを含む。本開示は、いずれかの天然に存在する生物若しくはウイルスから得られるか、又は市販の若しくは非市販のソースから得られるいずれかの野生型ポリメラーゼを企図する。加えて、プライム編集因子に使用可能なポリメラーゼは、いずれかの天然に存在する変異体ポリメラーゼ、操作された変異体ポリメラーゼ、又は他のバリアントポリメラーゼを包含し得、機能を保持する短縮されたバリアントを包含する。本明細書において使用可能なポリメラーゼは、特定のアミノ酸置換、例えば具体的に本明細書に開示のものを含有するようにもまた操作されてもよい。特定の好ましい態様において、本開示の方法及び組成物において利用されるプライム編集因子において使用可能なポリメラーゼは、鋳型ベースのポリメラーゼであり、すなわち、それらは鋳型依存的様式でヌクレオチド配列を合成する。

ポリメラーゼは、ヌクレオチド鎖を合成する酵素であり、本明細書に記載の方法及び組成物で利用されるプライム編集因子システムに関連して使用されてもよい。ポリメラーゼは好ましくは「鋳型依存性」ポリメラーゼである(すなわち、鋳型鎖のヌクレオチド塩基の順序に基づいてヌクレオチド鎖を合成するポリメラーゼ)。ある種の構成では、ポリメラーゼは「鋳型非依存性」でもまたあり得る(すなわち、鋳型鎖の要件なしにヌクレオチド鎖を合成するポリメラーゼ)。ポリメラーゼは更に「DNAポリメラーゼ」又は「RNAポリメラーゼ」としてもまた類別されてもよい。種々の態様において、プライム編集因子システムはDNAポリメラーゼを含む。種々の態様において、DNAポリメラーゼは「DNA依存性DNAポリメラーゼ」であり得る(すなわち、それによると、鋳型分子はDNAの鎖である)。かかるケースでは、DNA鋳型分子はPEgRNAであり得、伸長アームはDNAの鎖を含む。かかるケースでは、PEgRNAはキメラ又はハイブリッドPEgRNAと呼ばれてもよく、これはRNA部分(すなわち、スペーサ及びgRNAコアを包含するガイドRNA構成要素)とDNA部分(すなわち伸長アーム)とを含む。種々の他の態様において、DNAポリメラーゼは「RNA依存性DNAポリメラーゼ」であり得る(すなわち、それによると、鋳型分子はRNAの鎖である)。かかるケースでは、PEgRNAはRNAであり、すなわちRNA伸長を包含する。用語「ポリメラーゼ」はまた、ヌクレオチドの重合を触媒する酵素を指してもよい(すなわちポリメラーゼ活性)。一般的に、酵素は、ポリヌクレオチド鋳型配列にアニーリングしたプライマー(例として、PEgRNAのプライマー結合部位にアニーリングしたプライマー配列等)の3'端において合成を開始し、鋳型鎖の5'端の方へ進むであろう。「DNAポリメラーゼ」はデオキシヌクレオチドの重合を触媒する。DNAポリメラーゼを参照して本明細書において用いられる用語DNAポリメラーゼは、「その機能的フラグメント」を包含する。「その機能的フラグメント」は、少なくとも1つのセットの条件下においてはポリヌクレオチドの重合を触媒する能力を保持する、ポリメラーゼのアミノ酸配列全体未満を包摂する野生型又は変異体DNAポリメラーゼのいずれかの部分を指す。かかる機能的フラグメントは別個の実態として存在し得てもよいか、又はそれは融合タンパク質等のより大きいポリペプチドの構成要素であってもよい。

いくつかの態様では、ポリメラーゼはバクテリオファージからであり得る。バクテリオファージDNAポリメラーゼは5'→3'のエキソヌクレアーゼ活性を一般的に欠いている。なぜなら、この活性は別個のポリペプチドによってコードされるからである。好適なDNAポリメラーゼの例はT4、T7、及びファイ29 DNAポリメラーゼである。市販で利用可能な酵素は:T4(多くのソース、例としてEpicentreから利用可能)及びT7(多くのソース、例として未修飾についてはEpicentre及び3'→5'のエキソT7「Sequenase」DNAポリメラーゼについてはUSBから利用可能)である。

他の態様、ポリメラーゼは古細菌ポリメラーゼである。古細菌で同定されているDNAポリメラーゼの2つの異なるクラスがある:1.ファミリーB/pol I型(Pyrococcus furiosus由来のPfuのホモログ)及び2.pol II型(P.furiosus DP1/DP2 2-サブユニットポリメラーゼのホモログ)。両クラスからのDNAポリメラーゼは、関連する5'→3'のエキソヌクレアーゼ活性を天然に欠くことと、3'→5'のエキソヌクレアーゼ(プルーフリーディング)活性を所有することとが示されている。好適なDNAポリメラーゼ(pol I又はpol II)は、所望のアッセイ温度に類似である最適な成長温度を有する古細菌に由来され得る。熱安定性古細菌DNAポリメラーゼはPyrococcus種(furiosus、sp.GB-D、woesii、abysii、horikoshii)、Thermococcus種(kodakaraensis KOD1、litoralis、sp.9 degrees North-7、sp.JDF-3、gorgonarius)、Pyrodictium occultum、及びArchaeoglobus fulgidusから単離される。

ポリメラーゼはまた、ユーバクテリウム種からであってもよいユーバクテリウムDNAポリメラーゼの3つのクラス、pol I、II、及びIIIがある。Pol I DNAポリメラーゼファミリーの酵素は5'→3'のエキソヌクレアーゼ活性を所有し、ある種のメンバーは3'→5'のエキソヌクレアーゼ活性をもまた発揮する。Pol II DNAポリメラーゼは5'→3'のエキソヌクレアーゼ活性を天然に欠くが、3'→5'のエキソヌクレアーゼ活性を発揮する。Pol III DNAポリメラーゼは細胞の主要な複製DNAポリメラーゼを表し、複数のサブユニットから成る。pol III触媒サブユニットは5'→3'のエキソヌクレアーゼ活性を欠くが、いくつかのケースでは、3'→5'のエキソヌクレアーゼ活性が同じポリペプチド上に位置付けされる。
種々の市販で利用可能なPol I DNAポリメラーゼがあり、これらのいくつかは5'→3'のエキソヌクレアーゼ活性を縮減又は廃止するように修飾されている。

好適な熱安定性pol I DNAポリメラーゼは、Thermus種及びThermotoga maritima、例えばThermus aquaticus(Taq)、Thermus thermophilus(Tth)、及びThermotoga maritima(Tma UlTma)を包含する種々の好熱ユーバクテリウムから単離され得る。上に列記されているものに関係する追加のユーバクテリウムはThermophilic Bacteria(Kristjansson,J.K.,ed.)CRC Press,Inc.,Boca Raton,Fla.,1992に記載されている。

本発明は、更に、米国特許第5,677,152号、第6,479,264号、及び第6,183,998号に開示されている方法に従って化学的に修飾されているキメラ又は非キメラDNAポリメラーゼを可能にする。これらの内容はそれらの全体が参照によってここに組み込まれる。上に列記されているものに関係する追加の古細菌DNAポリメラーゼは次の参照に記載されている:Archaea:A Laboratory Manual(Robb,F.T.and Place,A.R.,eds.),Cold Spring Harbor Laboratory Press,Cold Spring Harbor,N.Y.,1995及びThermophilic Bacteria(Kristjansson,J.K.,ed.)CRC Press,Inc.,Boca Raton,Fla.,1992.

B.例示の逆転写酵素
様々な態様では、本明細書に記載の方法及び組成物で利用されるプライム編集因子は、ポリメラーゼとして逆転写酵素を含む。本開示は、いずれかの天然に存在する生物若しくはウイルスから得られるか又は市販の若しくは非市販のソースから得られるいずれかの野生型逆転写酵素を企図する。加えて、本開示の方法及び組成物で利用されるプライム編集因子に使用可能な逆転写酵素は、いずれかの天然に存在する変異体RT、操作された変異体RT、又は他のバリアントRTを包含し得、機能を保持する短縮されたバリアントを包含する。RTは、特定のアミノ酸置換、例えば具体的に本明細書に開示のものを含有するようにもまた操作されてもよい。

逆転写酵素は多機能酵素であり、典型的には、RNA及びDNA依存性DNA重合活性、並びにRNA-DNAハイブリッド中のRNAの切断を触媒するRNaseH活性を包含する3つの酵素活性を有する。逆転写酵素のいくつかの変異体は、mRNAの意図されない損傷を防止するためにRNaseH部分を不能化している。mRNAを鋳型として用いて相補的なDNA(cDNA)を合成するこれらの酵素は、RNAウイルスにおいて最初に同定された。続いて逆転写酵素は直接的にウイルス粒子、細胞、又は組織から単離及び精製された(例として、Kacian et al.,1971,Biochim.Biophys.Acta 46:365-83;Yang et al.,1972,Biochem.Biophys.Res.Comm.47:505-11;Gerard et al.,1975,J.Virol.15:785-97;Liu et al.,1977,Arch.Virol.55 187-200;Kato et al.,1984,J.Virol.Methods 9:325-39;Luke et al.,1990,Biochem.29:1764-69及びLe Grice et al.,1991,J.Virol.65:7004-07(これらの各々は参照により組み込まれる)を参照)。より最近では、改善された特性、例えば熱安定性、忠実性、及び活性を求めて、変異体及び融合タンパク質が作成されている。当該技術分野で公知であるか又は当該技術分野で公知の方法を用いて作られ得る逆転写酵素の野生型、バリアント、及び/又は変異体形態のいずれかは、本明細書において企図される。

逆転写酵素(RT)遺伝子(又はそれに含有される遺伝情報)はいくつもの異なるソースから得られ得る。例えば、遺伝子は、レトロウイルスに感染している真核細胞から、又はレトロウイルスゲノム全体若しくはそれの部分どちらかを含有するいくつものプラスミドから得られてもよい。加えて、RT遺伝子を含有するメッセンジャーRNA様のRNAがレトロウイルスから得られ得る。RTのソースの例は、モロニーマウス白血病ウイルス(M-MLV又はMLVRT);ヒトT細胞白血病ウイルス1型(HTLV-1);ウシ白血病ウイルス(BLV);ラウス肉腫ウイルス(RSV);ヒト免疫不全ウイルス(HIV);Saccharomycesを包含する酵母、Neurospora、Drosophila;霊長類;及び齧歯類を包含するが、これらに限定されない。例えば、Weiss,et al.,米国特許第4,663,290号(1987);Gerard,G.R.,DNA:271-79(1986);Kotewicz,M.L.,et al.,Gene 35:249-58(1985);Tanese,N.,et al.,Proc.Natl.Acad.Sci.(USA):4944-48(1985);Roth,M.J.,at al.,J.Biol.Chem.260:9326-35(1985);Michel,F.,et al.,Nature 316:641-43(1985);Akins,R.A.,et al.,Cell 47:505-16(1986),EMBO J.4:1267-75(1985);及びFawcett,D.F.,Cell 47:1007-15(1986)(これらの各々はその全体が参照されることによって本明細書に組み込まれる)を参照。

野生型RT
プライム編集因子による使用のための例示の酵素は、M-MLV逆転写酵素及びRSV逆転写酵素を包含し得るが、これらに限定されない。逆転写酵素活性を有する酵素は市販で利用可能である。ある態様において、逆転写酵素は、プライム編集因子システムの他の構成要素に対してトランスで提供される。つまり、逆転写酵素は、個々の構成要素として、すなわちnapDNAbpとの融合タンパク質としてではなく、発現又は別様に提供される。

当業者は、野生型逆転写酵素が(モロニーマウス白血病ウイルス(M-MLV);ヒト免疫不全ウイルス(HIV)逆転写酵素、及びトリ白血病・肉腫ウイルス(ASLV)逆転写酵素を包含するが、これらに限定されず、これはラウス肉腫ウイルス(RSV)逆転写酵素、トリ骨髄芽球症ウイルス(AMV)逆転写酵素、トリ赤芽球症ウイルス(AEV)ヘルパーウイルスMCAV逆転写酵素、トリ骨髄球腫症ウイルスMC29ヘルパーウイルスMCAV逆転写酵素、トリ細網内皮症ウイルス(REV-T)ヘルパーウイルスREV-A逆転写酵素、トリ肉腫ウイルスUR2ヘルパーウイルスUR2AV逆転写酵素、トリ肉腫ウイルスY73ヘルパーウイルスYAV逆転写酵素、ラウス随伴ウイルス(RAV)逆転写酵素、及び骨髄芽球症ウイルス随伴ウイルス(MAV)逆転写酵素を包含するが、これらに限定されない)、本明細書に記載の対象の方法及び組成物に好適に用いられてもよいということを認識するであろう。

例示の野生型RT酵素は次の通りである:

バリアント及びエラーを起こしやすいRT
逆転写酵素は、相補的なDNA(cDNA)鎖をRNA鋳型から合成することにとって必須である。逆転写酵素は、異なる生化学的活性を発揮する別物のドメインから成る酵素である。酵素は次の通りRNA鋳型からのDNAの合成を触媒する:アニーリングしたプライマーの存在下において、逆転写酵素はRNA鋳型に結合し、重合反応を開始する。RNA依存性DNAポリメラーゼ活性が相補的なDNA(cDNA)鎖を合成し、dNTPを組み込む。RNase H活性がDNA:RNA複合体のRNA鋳型を分解する。それゆえに、逆転写酵素は、(a)RNA/DNAハイブリッドを認識及び結合する結合活性、(b)RNA依存性DNAポリメラーゼ活性、及び(c)RNase H活性を含む。加えて、逆転写酵素は、一般的に、それらの熱安定性、処理能力(dNTP組み込みの速度)、及び忠実性(又はエラー率)を包含する種々の属性を有すると見なされる。本明細書において企図される逆転写酵素バリアントは、これらの酵素活性(例として、RNA依存性DNAポリメラーゼ活性、RNase H活性、又はDNA/RNAハイブリッド結合活性)又は酵素特性(例として、熱安定性、処理能力、又は忠実性)のいずれか1以上にインパクトを及ぼすか又は変化させる、逆転写酵素のいずれかの変異を包含してもよい。かかるバリアントは、当該技術分野においてパブリックドメインにおいて利用可能、市販で利用可能であってもよいか、又は指向性進化プロセス(例として、PACE又はPANCE)を包含する変異導入の公知の方法を用いて作製されてもよい。

種々の態様において、逆転写酵素はバリアント逆転写酵素であってもよい。本明細書において用いられる「バリアント逆転写酵素」は、参照配列(例として、参照野生型配列)に対して相対的に1以上の変異(単数の変異、逆位、欠失、挿入、及び再構成を包含する)を含む、いずれかの天然に存在するか又は遺伝子操作されたバリアントを包含する。RTは、RNA依存性DNAポリメラーゼ活性、リボヌクレアーゼH活性、及びDNA依存性DNAポリメラーゼ活性を包含するいくつかの活性を有してもよい。集合的に、これらの活性は酵素が一本鎖RNAを二本鎖cDNAへと変換することを可能化する。レトロウイルス及びレトロトランスポゾンでは、このcDNAは次いでホストゲノム上に取り入れし得、これから新たなRNAのコピーがホスト細胞転写によって作製され得る。バリアントRTは、これらの活性の1以上にインパクトを及ぼす変異を含んでもよい(これはこれらの活性を縮減若しくは増大させるか、又はこれはこれらの活性をすっかり消去するかどちらかである)。加えて、バリアントRTは、RTを多かれ少なかれ安定に、凝集をよりしにくくし、精製及び/若しくは検出を容易化する1以上の変異、並びに/又は特性若しくは特徴の他の(other the)修飾を含んでもよい。

当業者は、他の逆転写酵素(モロニーマウス白血病ウイルス(M-MLV);ヒト免疫不全ウイルス(HIV)逆転写酵素、及びトリ白血病・肉腫ウイルス(ASLV)逆転写酵素を包含するが、これらに限定されず、これはラウス肉腫ウイルス(RSV)逆転写酵素、トリ骨髄芽球症ウイルス(AMV)逆転写酵素、トリ赤芽球症ウイルス(AEV)ヘルパーウイルスMCAV逆転写酵素、トリ骨髄球腫症ウイルスMC29ヘルパーウイルスMCAV逆転写酵素、トリ細網内皮症ウイルス(REV-T)ヘルパーウイルスREV-A逆転写酵素、トリ肉腫ウイルスUR2ヘルパーウイルスUR2AV逆転写酵素、トリ肉腫ウイルスY73ヘルパーウイルスYAV逆転写酵素、ラウス随伴ウイルス(RAV)逆転写酵素、及び骨髄芽球症関連ウイルス(MAV)逆転写酵素を包含するが、これらに限定されない)に由来するバリアント逆転写酵素が、本明細書に記載の対象の方法及び組成物に好適に用いられてもよいということを認識するであろう。

バリアントRTを調製する1つの方法は、遺伝子修飾によって(例として、野生型逆転写酵素のDNA配列を修飾することによって)である。DNA配列のランダムな及び標的化された変異を許すいくつもの方法が当該技術分野において知られている(例えば、Ausubel et.al.Short Protocols in Molecular Biology(1995)3.sup.rd Ed.John Wiley&Sons,Inc.を参照)。加えて、従来の及びPCRに基づく方法両方を包含する部位特異的変異導入のためのいくつもの市販で利用可能なキットがある。例は、QuikChange部位特異的変異導入キット(AGILENT(登録商標))、Q5(登録商標)部位特異的変異導入キット(NEW ENGLAND BIOLABS(登録商標))、及びGeneArt(商標)部位特異的変異導入システム(THERMOFISHER SCIENTIFIC(登録商標))を包含する。

加えて、変異体逆転写酵素が、挿入変異又は短縮(N末端の、内部の、又はC末端の挿入又は短縮)によって当業者に公知の方法論に従って生成されてもよい。本明細書において用いられる用語「変異」は、別の残基によるある配列、例として核酸若しくはアミノ酸配列上の残基の置換、又はある配列上の1以上の残基の欠失若しくは挿入を指す。変異は、典型的には、元の残基、次に配列上の残基の位置及び新たに置換された残基の同一性を同定することによって本明細書に記載される。本明細書において提供されるアミノ酸置換(変異)を作るための種々の方法が当該技術分野において周知であり、例えばGreen and Sambrook,Molecular Cloning:A Laboratory Manual(4th ed.,Cold Spring Harbor Laboratory Press,Cold Spring Harbor,N.Y.(2012))によって提供される。変異は、種々のカテゴリー、例えば1塩基多型、微小重複領域、インデル、及び逆位を包含し得、決して限定することを意味されない。変異は、タンパク質活性を縮減又は廃止する変異の正常の結果である「機能喪失」変異を包含し得る。ほとんどの機能喪失変異は劣性である。なぜなら、ヘテロ接合体では、第2の染色体コピーが完全に機能的なタンパク質をコードする遺伝子の未変異のバージョンを持ち、この存在が変異の効果を補償するからである。変異は、「機能獲得」変異をもまた包摂する。これは、正常な条件下ではさもなければ存在しない異常な活性をタンパク質又は細胞に付与するものである。多くの機能獲得変異はコード領域よりもむしろ制御配列にあり、よって、いくつもの帰結を有し得る。例えば、変異は、1以上の遺伝子が間違った組織において発現されることに至り得、これらの組織は、それらが正常では欠く機能を獲得する。それらの性質ゆえに、機能獲得変異は通常は優性である。

当該技術分野で公知の部位特異的変異導入のより古い方法は、一本鎖DNA鋳型の単離を許すM13バクテリオファージベクター等のベクター上への変異させられるべき配列のサブクローニングに依拠する。これらの方法では、変異誘発プライマー(すなわち、変異させられるべき部位にアニールすることができるが、変異させられるべき部位に1以上のミスマッチのヌクレオチドを持つプライマー)を一本鎖鋳型にアニーリングさせ、次いで、変異誘発プライマーの3'端からスタートして鋳型の相補体を重合する。次いで、もたらされた二重鎖はホスト細菌に形質転換され、プラークが所望の変異についてスクリーニングされる。

より最近では、部位特異的変異導入はPCR方法論を使用している。これらは一本鎖鋳型を要求しないという利点を有する。加えて、サブクローニングを要求しない方法が開発されている。PCRに基づく部位特異的変異導入が行われるときには、いくつかのイシューが考慮されなければならない。第1に、これらの方法では、ポリメラーゼによって導入される望まれない変異の拡張を防止するために、PCRサイクル数を縮減することが望ましい。第2に、反応中に残存する変異していない親の分子の数を縮減するために、セレクションが使用されなければならない。第3に、単一のPCRプライマーセットの使用を許すために、伸長された長さのPCR法が好ましい。そして第4に、いくつかの熱安定性ポリメラーゼの非鋳型依存性末端伸長活性ゆえに、多くの場合には、PCRによって生成された変異体産物の平滑末端ライゲーションに先行して、端を磨く工程を手続きに組み込むことが必要である。

ランダム変異導入の方法が当該技術分野に存在し、これらは1以上のランダムに所在する変異を持つ変異体のパネルをもたらすであろう。次いで、変異体のかかるパネルは、所望の特性、例えば野生型逆転写酵素に対して相対的に増大した安定性を発揮するものについてスクリーニングされてもよい。

ランダムな変異導入のための方法の例はいわゆる「エラーを起こしやすいPCR法」である。名称が含意する通り、方法は、DNAポリメラーゼが高忠実性組み込みを支持しない条件下において所与の配列を増幅する。エラーを起こしやすい組み込みを促す条件は異なるDNAポリメラーゼについて変わるが、当業者は所与の酵素についてかかる条件を決定してもよい。増幅の忠実性においての多くのDNAポリメラーゼの鍵の変数は、例えば緩衝液中の二価金属イオンの型及び濃度である。よって、マンガンイオンの使用及び/又はマグネシウム若しくはマンガンイオン濃度のバリエーションが、ポリメラーゼのエラー率に影響するように適用されてもよい。

種々の側面では、プライム編集因子のRTは「エラーを起こしやすい」逆転写酵素バリアントであってもよい。当該技術分野において公知及び/又は利用可能であるエラーを起こしやすい逆転写酵素が用いられてもよい。いずれかの具体的な逆転写酵素のエラー率は酵素の「忠実性」の特性であり、これはそのRNA鋳型に対してDNAの鋳型によって導かれる重合の正確度を表す。高忠実性を有するRTは低いエラー率を有する。反対に、低い忠実性を有するRTは高いエラー率を有する。M-MLVに基づく逆転写酵素の忠実性は、合成される15,000～27,000ヌクレオチドに1エラーの範囲のエラー率を有することが報告される。Boutabout et al.,「DNA synthesis fidelity by the reverse transcriptase of the yeast retrotransposon Ty1,」Nucleic Acids Res,2001,29:2217-2222を参照。これは参照によって組み込まれる。それゆえに、この適用の目的には、「エラーを起こしやすい」であると考慮されるか又は「エラーを起こしやすい忠実性」を有すると考慮される逆転写酵素は、合成される15,000ヌクレオチドに1つのエラー未満であるエラー率を有するものである。
エラーを起こしやすい逆転写酵素は、出発RT酵素(例として、野生型M-MLV RT)の変異導入によってもまた作成されてもよい。変異導入の方法は限定されず、指向性進化プロセス、例えばファージによって補助される連続的進化(PACE)又はファージによって補助される非連続的進化(PANCE)を包含してもよい。本明細書において用いられる用語「ファージによって補助される連続的進化(PACE)」は、ファージをウイルスベクターとして使用する連続的進化を指す。PACEテクノロジーの一般概念は、例えば、2010年3月11日にWO2010/028347として公開された2009年9月8日出願の国際PCT出願PCT/US2009/056194;2012年6月28日にWO2012/088381として公開された2011年12月22日出願の国際PCT出願PCT/US2011/066747;2015年5月5日登録のU.S.出願U.S.特許No.9,023,594、2015年9月11日にWO2015/134121として公開された2015年1月20日出願の国際PCT出願PCT/US2015/012022、及び2016年10月20日にWO2016/168631として公開された2016年4月15日出願の国際PCT出願PCT/US2016/027795に記載されている。これらの夫々の内容全体は参照によって本明細書に組み込まれる。

エラーを起こしやすい逆転写酵素は、「ファージによって補助される非連続的進化(PANCE)」によってもまた得られてもよく、これは本明細書で使用される場合、ファージをウイルスベクターとして使用する非連続進化を指す。PANCEは急速なin vivoの指向性進化のための単純化された技術であり、新しいE.coliホスト細胞による進化させられるべき目当ての遺伝子を含有する進化する「セレクションファージ」(SP)の連続フラスコ植え継ぎを用い、それによって、ホストE.coli内の遺伝子が一定に保たれることを許しながら、SPに含有される遺伝子は連続的に進化する。連続フラスコ植え継ぎは微生物の実験室進化のための広くアクセス可能なアプローチとして長く用をなしており、より最近では、バクテリオファージ進化のための類縁のアプローチが開発されている。PANCEシステムはPACEシステムよりも低いストリンジェンシーを特色とする。

他のエラーを起こしやすい逆転写酵素が文献に記載されている。これらの夫々は本明細書の方法及び組成物への使用を企図される。例えば、エラーを起こしやすい逆転写酵素は、Bebenek et al.,「Error-prone Polymerization by HIV-1 Reverse Transcriptase,」J Biol Chem,1993,Vol.268:10324-10334及びSebastian-Martin et al.,「Transcriptional inaccuracy threshold attenuates differences in RNA-dependent DNA synthesis fidelity between retroviral reverse transcriptases,」Scientific Reports,2018,Vol.8:627に記載されている。これらの夫々は参照によって組み込まれる。なお、更に、エラーを起こしやすい逆転写酵素を包含する逆転写酵素は市販のサプライヤーから得られ得、全てNEW ENGLAND BIOLABS(登録商標)からのProtoScript(登録商標)(II)逆転写酵素、AMV逆転写酵素、WarmStart(登録商標)逆転写酵素、及びM-MuLV逆転写酵素、又は全てTAKARA BIO USA,INC.(以前はCLONTECH)からのAMV逆転写酵素XL、SMARTScribe逆転写酵素、GPRウルトラピュアMMLV逆転写酵素を包含する。

本明細書の開示はRNaseHドメインに変異を有する逆転写酵素をもまた企図する。上で言及されている通り、逆転写酵素の本来的な特性の1つはRNase H活性であり、これはRNA:cDNAハイブリッドのRNA鋳型を重合と同時的に切断する。RNA鋳型が全長の逆転写の完了前に分解されてもよいため、RNase H活性は長いcDNAの合成にとっては望ましくなくあり得る。おそらくは酵素のポリメラーゼ活性とのその競合を原因として、RNase H活性は逆転写効率をもまた低下させてもよい。それゆえに、本開示は修飾されたRNaseH活性を含むいずれかの逆転写酵素バリアントを企図する。
本明細書の開示は、RNA依存性DNAポリメラーゼドメインに変異を有する逆転写酵素をもまた企図する。上で言及されている通り、逆転写酵素の本来的な特性の1つはRNA依存性DNAポリメラーゼ活性である。これは、RNA:cDNAハイブリッドの鋳型RNA鎖によってコードされる新生cDNA鎖に核酸塩基を組み込む。RNA依存性DNAポリメラーゼ活性は、酵素の処理能力を増大させるか又は減少させるかどちらかのために(すなわち、その組み込み速度の観点から)増大又は減少させられ得る。それゆえに、本開示は、酵素の処理能力が未修飾のバージョンに対して相対的に増大させられるか又は減少させられるかどちらかのようにして、修飾されたRNA依存性DNAポリメラーゼ活性を含むいずれかの逆転写酵素バリアントを企図する。

変改された熱安定性特徴を有する逆転写酵素バリアントもまた本明細書において企図される。逆転写酵素が高い温度に耐える能力はcDNA合成の重要な側面である。上昇した反応温度は、強い二次構造及び/又は高いGC含量を有するRNAを変性することを助け、逆転写酵素が配列を読み通すことを許す。結果として、より高い温度における逆転写は全長cDNA合成及びより高い収量を可能化し、これはプライム編集プロセスの結果としての3'フラップssDNAの改善された生成に至り得る。野生型M-MLV逆転写酵素は典型的には37～48℃の範囲に至適温度を有する;しかしながら、49℃、50℃、51℃、52℃、53℃、54℃、55℃、56℃、57℃、58℃、59℃、60℃、61℃、62℃、63℃、64℃、65℃、66℃、及びより高くを包含する48℃超のより高い温度において逆転写活性を許す変異が導入されてもよい。

エラーを起こしやすいRT、熱安定性RT、処理能力増大RTを包含する本明細書において企図されるバリアント逆転写酵素は、変異導入又は進化プロセスを包含する種々のルーチン戦略によって操作され得る。いくつかのケースでは、バリアントは単一の変異を導入することによって産生され得る。他のケースでは、バリアントは1より多くの変異を要求してもよい。1より多くの変異を含む変異体では、所与の変異の効果は、具体的な変異体によって持たれる他の変異からは単離して、部位特異的変異導入による野生型遺伝子への同定された変異の導入によって評価されてもよい。次いで、それゆえに産生された一重変異体のスクリーニングアッセイは、その変異単独の効果の決定を許すであろう。

本明細書において用いられるバリアントRT酵素は、本明細書において開示若しくは企図されるか又は当該技術分野で公知のいずれかの野生型RT又は変異体RT又はフラグメントRT又はRTの他のバリアントを包含するいずれかの参照RTタンパク質と少なくとも約70％同一、少なくとも約80％同一、少なくとも約90％同一、少なくとも約95％同一、少なくとも約96％同一、少なくとも約97％同一、少なくとも約98％同一、少なくとも約99％同一、少なくとも約99.5％同一、又は少なくとも約99.9％同一である他の「RTバリアント」をもまた包含してもよい。

いくつかの態様では、RTバリアントは、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、21、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、又は最高で100、又は最高で200、又は最高で300、又は最高で400、又は最高で500、又はより多くのアミノ酸変化を、参照RTと比較して有してもよい。いくつかの態様では、フラグメントが参照RTの対応するフラグメントと少なくとも約70％同一、少なくとも約80％同一、少なくとも約90％同一、少なくとも約95％同一、少なくとも約96％同一、少なくとも約97％同一、少なくとも約98％同一、少なくとも約99％同一、少なくとも約99.5％同一、又は少なくとも約99.9％同一であるようにして、RTバリアントは参照RTのフラグメントを含む。いくつかの態様では、フラグメントは、対応する野生型RT(M-MLV逆転写酵素)(例として、配列番号81)又は配列番号69-79の逆転写酵素のいずれかのアミノ酸長さの少なくとも30％、少なくとも35％、少なくとも40％、少なくとも45％、少なくとも50％、少なくとも55％、少なくとも60％、少なくとも65％、少なくとも70％、少なくとも75％、少なくとも80％、少なくとも85％、少なくとも90％、少なくとも95％同一、少なくとも96％、少なくとも97％、少なくとも98％、少なくとも99％、又は少なくとも99.5％である。

いくつかの態様では、本開示は、それらの機能性を保持し、且ついずれかの本明細書に開示のRTタンパク質のフラグメントであるRTフラグメントをもまた利用してもよい。いくつかの態様では、RTフラグメントは長さが少なくとも100アミノ酸である。いくつかの態様では、フラグメントは長さが少なくとも100、150、200、250、300、350、400、450、500、550、若しくは最高で600、又はより多くのアミノ酸である。

なお他の態様において、本開示は、N末端若しくはC末端又は両方がある種のアミノ酸数だけ短縮されているRTバリアントをもまた利用してもよく、これは、なお十分なポリメラーゼ機能を保持する短縮バリアントをもたらす。いくつかの態様では、RT短縮バリアントは、少なくとも1、少なくとも2、少なくとも3、少なくとも4、少なくとも5、少なくとも6、少なくとも7、少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも16、少なくとも17、少なくとも18、少なくとも19、少なくとも20、少なくとも21、少なくとも22、少なくとも23、少なくとも24、少なくとも25、少なくとも30、40、50、60、70、80、90、100、110、120、130、140、150、160、170、180、190、200、210、220、230、240、又は250アミノ酸の短縮を、タンパク質のN末端の端に有する。他の態様において、RT短縮バリアントは、少なくとも1、少なくとも2、少なくとも3、少なくとも4、少なくとも5、少なくとも6、少なくとも7、少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも16、少なくとも17、少なくとも18、少なくとも19、少なくとも20、少なくとも21、少なくとも22、少なくとも23、少なくとも24、少なくとも25、少なくとも30、40、50、60、70、80、90、100、110、120、130、140、150、160、170、180、190、200、210、220、230、240、又は250アミノ酸の短縮を、タンパク質のC末端の端に有する。なお他の態様において、RT短縮バリアントは同じか又は異なる長さである短縮をN末端及びC末端の端に有する。例えば、本明細書に開示の方法及び組成物で利用されるプライム編集因子は、M-MLV逆転写酵素の短縮されたバージョンを包含してもよい。この態様では、逆転写酵素は4つの変異を含有する(D200N、T306K、W313F、T330P;PE2に存在するL603W変異は短縮を原因としてもはや存在しないということに注意)。この短縮された編集因子をコードするDNA配列は、PE2よりも522bp小さく、よって、DNA配列の送達がそのサイズを原因として難しい適用(すなわち、アデノ随伴ウイルス及びレンチウイルス送達)にとってそれを可能性として有用にする。この態様はMMLV-RT(trunc)と呼ばれ、次のアミノ酸配列を有する:

種々の態様において、本明細書に開示の方法及び組成物で利用されるプライム編集因子は、本明細書に記載されるRTバリアントの1つ、又はいずれかの参照Cas9バリアントと少なくとも約70％同一、少なくとも約80％同一、少なくとも約90％同一、少なくとも約95％同一、少なくとも約96％同一、少なくとも約97％同一、少なくとも約98％同一、少なくとも約99％同一、少なくとも約99.5％同一、若しくは少なくとも約99.9％同一であるそのRTバリアントを含んでもよい。
なお他の態様において、本方法及び組成物は、Effefson et al.,「Synthetic evolutionary origin of a proofreading reverse transcriptase,」Science,June 24,2016,Vol.352:1590-1593に記載されている通り、逆転写酵素へと進化させられたDNAポリメラーゼを利用してもよい。これの内容は参照によって本明細書に組み込まれる。

ある種の他の態様において、逆転写酵素は、napDNAbpをもまた含む融合タンパク質の構成要素として提供される。換言すると、いくつかの態様では、逆転写酵素は融合タンパク質としてnapDNAbpに融合される。

種々の態様において、バリアント逆転写酵素は配列番号81によって表される野生型M-MLV逆転写酵素から操作され得る。

種々の態様において、本明細書に記載の方法及び組成物で利用されるプライム編集因子(RTが融合パートナーとして又はトランスでどちらかで提供される)は、次の変異の1つ以上を含むバリアントRTを包含し得る:配列番号81の野生型M-MLV RTにおける又は別の野生型RTポリペプチド配列上の対応するアミノ酸位置におけるP51L、S67K、E69K、L139P、T197A、D200N、H204R、F209N、E302K、E302R、T306K、F309N、W313F、T330P、L345G、L435G、N454K、D524G、E562Q、D583N、H594Q、L603W、E607K、又はD653N。

本開示の種々の態様に従ってnapDNAbpタンパク質に融合又は個々のタンパク質として提供され得るいくつかの例示の逆転写酵素が、下で提供される。例示の逆転写酵素は、少なくとも80％、少なくとも85％、少なくとも90％、少なくとも95％、又は少なくとも99％配列同一性を次の野生型酵素又は部分的な酵素に対して有するバリアントを包含する:

種々の他の態様において、本明細書に記載の方法及び組成物で利用されるプライム編集因子(RTが融合パートナーとして又はトランスでどちらかで提供される)は、次の変異の1つ以上を含むバリアントRTを包含し得る:配列番号81の野生型M-MLV RTにおける又は別の野生型RTポリペプチド配列上の対応するアミノ酸位置におけるP51X、S67X、E69X、L139X、T197X、D200X、H204X、F209X、E302X、T306X、F309X、W313X、T330X、L345X、L435X、N454X、D524X、E562X、D583X、H594X、L603X、E607X、又はD653Xであって、「X」はいずれかのアミノ酸であり得る。

種々の他の態様において、本明細書に記載の方法及び組成物で利用されるプライム編集因子(RTが融合パートナーとして又はトランスでどちらかで提供される)は、配列番号81の野生型M-MLV RTにおける又は別の野生型RTポリペプチド配列上の対応するアミノ酸位置におけるP51X変異を含むバリアントRTを包含し得、「X」はいずれかのアミノ酸であり得る。ある態様において、XはLである。

種々の他の態様において、本明細書に記載の方法及び組成物で利用されるプライム編集因子(RTが融合パートナーとして又はトランスでどちらかで提供される)は、配列番号81の野生型M-MLV RTにおける又は別の野生型RTポリペプチド配列上の対応するアミノ酸位置におけるS67X変異を含むバリアントRTを包含し得、「X」はいずれかのアミノ酸であり得る。ある態様において、XはKである。

種々の他の態様において、本明細書に記載の方法及び組成物で利用されるプライム編集因子(RTが融合パートナーとして又はトランスでどちらかで提供される)は、配列番号81の野生型M-MLV RTにおける又は別の野生型RTポリペプチド配列上の対応するアミノ酸位置におけるE69X変異を含むバリアントRTを包含し得、「X」はいずれかのアミノ酸であり得る。ある態様において、XはKである。

種々の他の態様において、本明細書に記載の方法及び組成物で利用されるプライム編集因子(RTが融合パートナーとして又はトランスでどちらかで提供される)は、配列番号81の野生型M-MLV RTにおける又は別の野生型RTポリペプチド配列上の対応するアミノ酸位置におけるL139X変異を含むバリアントRTを包含し得、「X」はいずれかのアミノ酸であり得る。ある態様において、XはPである。

種々の他の態様において、本明細書に記載の方法及び組成物で利用されるプライム編集因子(RTが融合パートナーとして又はトランスでどちらかで提供される)は、配列番号81の野生型M-MLV RTにおける又は別の野生型RTポリペプチド配列上の対応するアミノ酸位置におけるT197X変異を含むバリアントRTを包含し得、「X」はいずれかのアミノ酸であり得る。ある態様において、XはAである。

種々の他の態様において、本明細書に記載の方法及び組成物で利用されるプライム編集因子(RTが融合パートナーとして又はトランスでどちらかで提供される)は、配列番号81の野生型M-MLV RTにおける又は別の野生型RTポリペプチド配列上の対応するアミノ酸位置におけるD200X変異を含むバリアントRTを包含し得、「X」はいずれかのアミノ酸であり得る。ある態様において、XはNである。

種々の他の態様において、本明細書に記載の方法及び組成物で利用されるプライム編集因子(RTが融合パートナーとして又はトランスでどちらかで提供される)は、配列番号81の野生型M-MLV RTにおける又は別の野生型RTポリペプチド配列上の対応するアミノ酸位置におけるH204X変異を含むバリアントRTを包含し得、「X」はいずれかのアミノ酸であり得る。ある態様において、XはRである。

種々の他の態様において、本明細書に記載の方法及び組成物で利用されるプライム編集因子(RTが融合パートナーとして又はトランスでどちらかで提供される)は、配列番号81の野生型M-MLV RTにおける又は別の野生型RTポリペプチド配列上の対応するアミノ酸位置におけるF209X変異を含むバリアントRTを包含し得、「X」はいずれかのアミノ酸であり得る。ある態様において、XはNである。

種々の他の態様において、本明細書に記載の方法及び組成物で利用されるプライム編集因子(RTが融合パートナーとして又はトランスでどちらかで提供される)は、配列番号81の野生型M-MLV RTにおける又は別の野生型RTポリペプチド配列上の対応するアミノ酸位置におけるE302X変異を含むバリアントRTを包含し得、「X」はいずれかのアミノ酸であり得る。ある態様において、XはKである。

種々の他の態様において、本明細書に記載の方法及び組成物で利用されるプライム編集因子(RTが融合パートナーとして又はトランスでどちらかで提供される)は、配列番号81の野生型M-MLV RTにおける又は別の野生型RTポリペプチド配列上の対応するアミノ酸位置におけるE302X変異を含むバリアントRTを包含し得、「X」はいずれかのアミノ酸であり得る。ある態様において、XはRである。

種々の他の態様において、本明細書に記載の方法及び組成物で利用されるプライム編集因子(RTが融合パートナーとして又はトランスでどちらかで提供される)は、配列番号81の野生型M-MLV RTにおける又は別の野生型RTポリペプチド配列上の対応するアミノ酸位置におけるT306X変異を含むバリアントRTを包含し得、「X」はいずれかのアミノ酸であり得る。ある態様において、XはKである。

種々の他の態様において、本明細書に記載の方法及び組成物で利用されるプライム編集因子(RTが融合パートナーとして又はトランスでどちらかで提供される)は、配列番号81の野生型M-MLV RTにおける又は別の野生型RTポリペプチド配列上の対応するアミノ酸位置におけるF309X変異を含むバリアントRTを包含し得、「X」はいずれかのアミノ酸であり得る。ある態様において、XはNである。

種々の他の態様において、本明細書に記載の方法及び組成物で利用されるプライム編集因子(RTが融合パートナーとして又はトランスでどちらかで提供される)は、配列番号81の野生型M-MLV RTにおける又は別の野生型RTポリペプチド配列上の対応するアミノ酸位置におけるW313X変異を含むバリアントRTを包含し得、「X」はいずれかのアミノ酸であり得る。ある態様において、XはFである。

種々の他の態様において、本明細書に記載の方法及び組成物で利用されるプライム編集因子(RTが融合パートナーとして又はトランスでどちらかで提供される)は、配列番号81の野生型M-MLV RTにおける又は別の野生型RTポリペプチド配列上の対応するアミノ酸位置におけるT330X変異を含むバリアントRTを包含し得、「X」はいずれかのアミノ酸であり得る。ある態様において、XはPである。

種々の他の態様において、本明細書に記載の方法及び組成物で利用されるプライム編集因子(RTが融合パートナーとして又はトランスでどちらかで提供される)は、配列番号81の野生型M-MLV RTにおける又は別の野生型RTポリペプチド配列上の対応するアミノ酸位置におけるL345X変異を含むバリアントRTを包含し得、「X」はいずれかのアミノ酸であり得る。ある態様において、XはGである。

種々の他の態様において、本明細書に記載の方法及び組成物で利用されるプライム編集因子(RTが融合パートナーとして又はトランスでどちらかで提供される)は、配列番号81の野生型M-MLV RTにおける又は別の野生型RTポリペプチド配列上の対応するアミノ酸位置におけるL435X変異を含むバリアントRTを包含し得、「X」はいずれかのアミノ酸であり得る。ある態様において、XはGである。

種々の他の態様において、本明細書に記載の方法及び組成物で利用されるプライム編集因子(RTが融合パートナーとして又はトランスでどちらかで提供される)は、配列番号81の野生型M-MLV RTにおける又は別の野生型RTポリペプチド配列上の対応するアミノ酸位置におけるN454X変異を含むバリアントRTを包含し得、「X」はいずれかのアミノ酸であり得る。ある態様において、XはKである。

種々の他の態様において、本明細書に記載の方法及び組成物で利用されるプライム編集因子(RTが融合パートナーとして又はトランスでどちらかで提供される)は、配列番号81の野生型M-MLV RTにおける又は別の野生型RTポリペプチド配列上の対応するアミノ酸位置におけるD524X変異を含むバリアントRTを包含し得、「X」はいずれかのアミノ酸であり得る。ある態様において、XはGである。

種々の他の態様において、本明細書に記載の方法及び組成物で利用されるプライム編集因子(RTが融合パートナーとして又はトランスでどちらかで提供される)は、配列番号81の野生型M-MLV RTにおける又は別の野生型RTポリペプチド配列上の対応するアミノ酸位置におけるE562X変異を含むバリアントRTを包含し得、「X」はいずれかのアミノ酸であり得る。ある態様において、XはQである。

種々の他の態様において、本明細書に記載の方法及び組成物で利用されるプライム編集因子(RTが融合パートナーとして又はトランスでどちらかで提供される)は、配列番号81の野生型M-MLV RTにおける又は別の野生型RTポリペプチド配列上の対応するアミノ酸位置におけるD583X変異を含むバリアントRTを包含し得、「X」はいずれかのアミノ酸であり得る。ある態様において、XはNである。

種々の他の態様において、本明細書に記載の方法及び組成物で利用されるプライム編集因子(RTが融合パートナーとして又はトランスでどちらかで提供される)は、配列番号81の野生型M-MLV RTにおける又は別の野生型RTポリペプチド配列上の対応するアミノ酸位置におけるH594X変異を含むバリアントRTを包含し得、「X」はいずれかのアミノ酸であり得る。ある態様において、XはQである。

種々の他の態様において、本明細書に記載の方法及び組成物で利用されるプライム編集因子(RTが融合パートナーとして又はトランスでどちらかで提供される)は、配列番号81の野生型M-MLV RTにおける又は別の野生型RTポリペプチド配列上の対応するアミノ酸位置におけるL603X変異を含むバリアントRTを包含し得、「X」はいずれかのアミノ酸であり得る。ある態様において、XはWである。

種々の他の態様において、本明細書に記載の方法及び組成物で利用されるプライム編集因子(RTが融合パートナーとして又はトランスでどちらかで提供される)は、配列番号81の野生型M-MLV RTにおける又は別の野生型RTポリペプチド配列上の対応するアミノ酸位置におけるE607X変異を含むバリアントRTを包含し得、「X」はいずれかのアミノ酸であり得る。ある態様において、XはKである。

種々の他の態様において、本明細書に記載の方法及び組成物で利用されるプライム編集因子(RTが融合パートナーとして又はトランスでどちらかで提供される)は、配列番号81の野生型M-MLV RTにおける又は別の野生型RTポリペプチド配列上の対応するアミノ酸位置におけるD653X変異を含むバリアントRTを包含し得、「X」はいずれかのアミノ酸であり得る。ある態様において、XはNである。

本開示の種々の態様に従ってnapDNAbpタンパク質に融合又は個々のタンパク質として提供され得るいくつかの例示の逆転写酵素が、下で提供される。例示の逆転写酵素は、少なくとも80％、少なくとも85％、少なくとも90％、少なくとも95％、又は少なくとも99％配列同一性を、配列番号81～98によって表される野生型酵素又は部分的な酵素に対して有するバリアントを包含する。

本明細書に記載される方法及び組成物で利用されるプライム編集因子システムは、次の米国特許(これらの夫々はそれらの全体が参照によって組み込まれる):米国特許第10,202,658号;第10,189,831号;第10,150,955号;第9,932,567号;第9,783,791号;第9,580,698号;第9,534,201号;及び第9,458,484号のいずれかに記載又は開示されているいずれかの公に利用可能な逆転写酵素と、変異をインストールするための公知の方法又はタンパク質を進化させるための公知の方法を用いて作られ得るそのいずれかのバリアントとを企図する。次の参照は当該技術分野の逆転写酵素を記載する。それらの開示の夫々はそれらの全体が参照によって本明細書に組み込まれる。

逆転写酵素に関する上に記されている参照のいずれかは、既にそのように申し立てられていない場合には、それらの全体が参照によってここに組み込まれる。

プライム編集因子:融合タンパク質
napDNAbps及びポリメラーゼ(例として、逆転写酵素)は、融合タンパク質の形態で提供されてもよい。すなわち、本開示は、napDNAbpドメイン及びポリメラーゼ(例として、逆転写酵素)ドメインを含む融合タンパク質を含むプライム編集因子の使用を企図する。

本明細書に記載の方法及び組成物で利用されるプライム編集因子システムは、napDNAbp及びポリメラーゼ(例として、逆転写酵素等のDNA依存性DNAポリメラーゼ又はRNA依存性DNAポリメラーゼ)を含み、任意選択でリンカーによって連結された融合タンパク質を企図する。本出願は、単一の融合タンパク質に組み合わされる任意の適切なnapDNAbp及びポリメラーゼ(例として、逆転写酵素等のDNA依存性DNAポリメラーゼ又はRNA依存性DNAポリメラーゼ)を企図する。napDNAbps及びポリメラーゼ(例として、逆転写酵素等の、DNA依存性DNAポリメラーゼ又はRNA依存性DNAポリメラーゼ)の例はそれぞれ本明細書で定義される。ポリメラーゼは当技術分野で周知であり、アミノ酸配列は容易に入手可能であるため、本開示は、本明細書で同定された特定のポリメラーゼに限定されることを決して意味されない。

種々の態様において、融合タンパク質はいずれかの好適な構造的な構成を含んでもよい。例えば、融合タンパク質は、N末端→C末端方向に、napDNAbpをポリメラーゼ(例として、DNA依存性DNAポリメラーゼ又はRNA依存性DNAポリメラーゼ、例えば逆転写酵素)に融合されて含んでもよい。他の態様において、融合タンパク質は、N末端→C末端方向に、ポリメラーゼ(例として、逆転写酵素)をnapDNAbpに融合されて含んでもよい。融合したドメインは、任意選択で、リンカー、例としてアミノ酸配列によって連結されてもよい。他の態様において、融合タンパク質は構造NH₂-［napDNAbp］-［ポリメラーゼ］-COOH;又はNH₂-［ポリメラーゼ］-［napDNAbp］-COOHを含んでもよく、「］-［」の夫々のものは任意選択のリンカー配列の存在を指示する。ポリメラーゼが逆転写酵素である態様では、融合タンパク質は構造NH₂-［napDNAbp］-［RT］-COOH;又はNH₂-［RT］-［napDNAbp］-COOHを含んでもよく、「］-［」の夫々のものは任意選択のリンカー配列の存在を指示する。

種々の態様において、プライム編集因子融合タンパク質は次のアミノ酸配列(本明細書においては「PE1」と呼ばれる)を有してもよく、これは、H840A変異を含むCas9バリアント(すなわち、Cas9ニッカーゼ)及びM-MLV RT野生型と、N末端NLS配列(19アミノ酸)及びCas9ニッカーゼドメインのC末端をRTドメインのN末端に連結するアミノ酸リンカー(32アミノ酸)とを包含する。PE1融合タンパク質は次の構造を有する:［NLS］-［Cas9(H840A)］-［リンカー］-［MMLV_RT(wt)］。PE1及びその個々の構成要素のアミノ酸配列は次の通りである:

別の態様では、プライム編集因子融合タンパク質は次のアミノ酸配列(本明細書においては「PE2」と呼ばれる)を有してもよく、これは、H840A変異を含むCas9バリアント(すなわち、Cas9ニッカーゼ)並びに変異D200N、T330P、L603W、T306K、及びW313Fを含むM-MLV RTと、N末端NLS配列(19アミノ酸)並びにCas9ニッカーゼドメインのC末端をRTドメインのN末端に連結するアミノ酸リンカー(33アミノ酸)とを包含する。PE2融合タンパク質は次の構造を有する:［NLS］-［Cas9(H840A)］-［リンカー］-［MMLV_RT(D200N)(T330P)(L603W)(T306K)(W313F)］。PE2のアミノ酸配列は次の通りである:

更なる他の態様において、プライム編集因子融合タンパク質は、以下のアミノ酸配列を有していてもよい:

他の態様において、プライム編集因子融合タンパク質は、次の例示の配列等のSaCas9に又は変改されたPAM特異性を有するSpCas9ニッカーゼに基づき得る:

更に他の態様では、本明細書で企図される方法及び組成物で利用されるプライム編集因子融合タンパク質は、M-MLV逆転写酵素の切断型に融合したCas9ニッカーゼ(例として、Cas9(H840A))を包含してもよい。この態様では、逆転写酵素は4つの変異をもまた含有する(D200N、T306K、W313F、T330P;PE2に存在するL603W変異は短縮を原因としてもはや存在しないということに注意)。この短縮された編集因子をコードするDNA配列は、PE2よりも522bp小さく、よって、DNA配列の送達がそのサイズを原因として難しい適用(すなわち、アデノ随伴ウイルス及びレンチウイルス送達)にとってそれを可能性として有用にする。この態様はCas9(H840A)-MMLV-RT(trunc)又は「短いPE2(PE2-short)」又は「PE2-trunc」と呼ばれ、次のアミノ酸配列を有する:

種々の態様において、本明細書において企図される方法及び組成物で利用されるプライム編集因子融合タンパク質は、PE1、PE2、又は上で指示されているプライム編集因子融合体配列のいずれかと少なくとも約70％同一、少なくとも約80％同一、少なくとも約90％同一、少なくとも約95％同一、少なくとも約96％同一、少なくとも約97％同一、少なくとも約98％同一、少なくとも約99％同一、少なくとも約99.5％同一、又は少なくとも約99.9％同一であるアミノ酸配列を有する上で開示されている配列のいずれかのバリアントをもまた包含してもよい。

ある態様において、リンカーが、本発明のペプチド又はペプチドドメイン若しくは部分のいずれかを連結するために用いられてもよい(例として、逆転写酵素に連結又は融合されたnapDNAbp)。

プライム編集因子:修飾PE融合タンパク質(例として、PEmax)
一側面において、本開示は、修飾されたプライム編集因子タンパク質を提供する。一態様において、修飾されたプライム編集因子融合タンパク質は、PEmax(配列番号99)、又は配列番号99と少なくとも80％、少なくとも85％、少なくとも90％、少なくとも95％、少なくとも96％、少なくとも97％、少なくとも98％、少なくとも99％、若しくは少なくとも最大100％の配列同一性を有するアミノ酸配列である。PEmaxの配列は以下の通りである。
キー:
二部分SV40 NLS
SpCas9 R221K N394K H840A
リンカー＝(SGGSx2-二部分SV40 NLS-SGGSx2)(SGGSSGGS KRTADGSEFESPKKKRKV SGGSSGGS)(配列番号105)
Genscriptコドン最適化MMLV RT五変異体(D200N T306K W313F T330P L603W)
他のリンカー配列
c-Myc NLS

PEmaxタンパク質配列(配列番号99):
MKRTADGSEFESPKKKRKVDKKYSIGLDIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRKLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLKREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDAIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGDSGGSSGGSKRTADGSEFESPKKKRKVSGGSSGGSTLNIEDEYRLHETSKEPDVSLGSTWLSDFPQAWAETGGMGLAVRQAPLIIPLKATSTPVSIKQYPMSQEARLGIKPHIQRLLDQGILVPCQSPWNTPLLPVKKPGTNDYRPVQDLREVNKRVEDIHPTVPNPYNLLSGLPPSHQWYTVLDLKDAFFCLRLHPTSQPLFAFEWRDPEMGISGQLTWTRLPQGFKNSPTLFNEALHRDLADFRIQHPDLILLQYVDDLLLAATSELDCQQGTRALLQTLGNLGYRASAKKAQICQKQVKYLGYLLKEGQRWLTEARKETVMGQPTPKTPRQLREFLGKAGFCRLFIPGFAEMAAPLYPLTKPGTLFNWGPDQQKAYQEIKQALLTAPALGLPDLTKPFELFVDEKQGYAKGVLTQKLGPWRRPVAYLSKKLDPVAAGWPPCLRMVAAIAVLTKDAGKLTMGQPLVILAPHAVEALVKQPPDRWLSNARMTHYQALLLDTDRVQFGPVVALNPATLLPLPEEGLQHNCLDILAEAHGTRPDLTDQPLPDADHTWYTDGSSLLQEGQRKAGAAVTTETEVIWAKALPAGTSAQRAELIALTQALKMAEGKKLNVYTDSRYAFATAHIHGEIYRRRGWLTSEGKEIKNKDEILALLKALFLPKRLSIIHCPGHQKGHSAEARGNRMADQAARKAAITETPDTSTLLIENSSPSGGSKRTADGSEFESPKKKRKVGSGPAAKRVKLD

PEmax DNA配列(配列番号5660):
ATGAAACGGACAGCCGACGGAAGCGAGTTCGAGTCACCAAAGAAGAAGCGGAAAGTCGACAAGAAGTACAGCATCGGCCTGGACATCGGCACCAACTCTGTGGGCTGGGCCGTGATCACCGACGAGTACAAGGTGCCCAGCAAGAAATTCAAGGTGCTGGGCAACACCGACCGGCACAGCATCAAGAAGAACCTGATCGGAGCCCTGCTGTTCGACAGCGGCGAAACAGCCGAGGCCACCCGGCTGAAGAGAACCGCCAGAAGAAGATACACCAGACGGAAGAACCGGATCTGCTATCTGCAAGAGATCTTCAGCAACGAGATGGCCAAGGTGGACGACAGCTTCTTCCACAGACTGGAAGAGTCCTTCCTGGTGGAAGAGGATAAGAAGCACGAGCGGCACCCCATCTTCGGCAACATCGTGGACGAGGTGGCCTACCACGAGAAGTACCCCACCATCTACCACCTGAGAAAGAAACTGGTGGACAGCACCGACAAGGCCGACCTGCGGCTGATCTATCTGGCCCTGGCCCACATGATCAAGTTCCGGGGCCACTTCCTGATCGAGGGCGACCTGAACCCCGACAACAGCGACGTGGACAAGCTGTTCATCCAGCTGGTGCAGACCTACAACCAGCTGTTCGAGGAAAACCCCATCAACGCCAGCGGCGTGGACGCCAAGGCCATCCTGTCTGCCAGACTGAGCAAGAGCAGAAAGCTGGAAAATCTGATCGCCCAGCTGCCCGGCGAGAAGAAGAATGGCCTGTTCGGAAACCTGATTGCCCTGAGCCTGGGCCTGACCCCCAACTTCAAGAGCAACTTCGACCTGGCCGAGGATGCCAAACTGCAGCTGAGCAAGGACACCTACGACGACGACCTGGACAACCTGCTGGCCCAGATCGGCGACCAGTACGCCGACCTGTTTCTGGCCGCCAAGAACCTGTCCGACGCCATCCTGCTGAGCGACATCCTGAGAGTGAACACCGAGATCACCAAGGCCCCCCTGAGCGCCTCTATGATCAAGAGATACGACGAGCACCACCAGGACCTGACCCTGCTGAAAGCTCTCGTGCGGCAGCAGCTGCCTGAGAAGTACAAAGAGATTTTCTTCGACCAGAGCAAGAACGGCTACGCCGGCTACATTGACGGCGGAGCCAGCCAGGAAGAGTTCTACAAGTTCATCAAGCCCATCCTGGAAAAGATGGACGGCACCGAGGAACTGCTCGTGAAGCTGAAGAGAGAGGACCTGCTGCGGAAGCAGCGGACCTTCGACAACGGCAGCATCCCCCACCAGATCCACCTGGGAGAGCTGCACGCCATTCTGCGGCGGCAGGAAGATTTTTACCCATTCCTGAAGGACAACCGGGAAAAGATCGAGAAGATCCTGACCTTCCGCATCCCCTACTACGTGGGCCCTCTGGCCAGGGGAAACAGCAGATTCGCCTGGATGACCAGAAAGAGCGAGGAAACCATCACCCCCTGGAACTTCGAGGAAGTGGTGGACAAGGGCGCTTCCGCCCAGAGCTTCATCGAGCGGATGACCAACTTCGATAAGAACCTGCCCAACGAGAAGGTGCTGCCCAAGCACAGCCTGCTGTACGAGTACTTCACCGTGTATAACGAGCTGACCAAAGTGAAATACGTGACCGAGGGAATGAGAAAGCCCGCCTTCCTGAGCGGCGAGCAGAAAAAGGCCATCGTGGACCTGCTGTTCAAGACCAACCGGAAAGTGACCGTGAAGCAGCTGAAAGAGGACTACTTCAAGAAAATCGAGTGCTTCGACTCCGTGGAAATCTCCGGCGTGGAAGATCGGTTCAACGCCTCCCTGGGCACATACCACGATCTGCTGAAAATTATCAAGGACAAGGACTTCCTGGACAATGAGGAAAACGAGGACATTCTGGAAGATATCGTGCTGACCCTGACACTGTTTGAGGACAGAGAGATGATCGAGGAACGGCTGAAAACCTATGCCCACCTGTTCGACGACAAAGTGATGAAGCAGCTGAAGCGGCGGAGATACACCGGCTGGGGCAGGCTGAGCCGGAAGCTGATCAACGGCATCCGGGACAAGCAGTCCGGCAAGACAATCCTGGATTTCCTGAAGTCCGACGGCTTCGCCAACAGAAACTTCATGCAGCTGATCCACGACGACAGCCTGACCTTTAAAGAGGACATCCAGAAAGCCCAGGTGTCCGGCCAGGGCGATAGCCTGCACGAGCACATTGCCAATCTGGCCGGCAGCCCCGCCATTAAGAAGGGCATCCTGCAGACAGTGAAGGTGGTGGACGAGCTCGTGAAAGTGATGGGCCGGCACAAGCCCGAGAACATCGTGATCGAAATGGCCAGAGAGAACCAGACCACCCAGAAGGGACAGAAGAACAGCCGCGAGAGAATGAAGCGGATCGAAGAGGGCATCAAAGAGCTGGGCAGCCAGATCCTGAAAGAACACCCCGTGGAAAACACCCAGCTGCAGAACGAGAAGCTGTACCTGTACTACCTGCAGAATGGGCGGGATATGTACGTGGACCAGGAACTGGACATCAACCGGCTGTCCGACTACGATGTGGACGCTATCGTGCCTCAGAGCTTTCTGAAGGACGACTCCATCGACAACAAGGTGCTGACCAGAAGCGACAAGAACCGGGGCAAGAGCGACAACGTGCCCTCCGAAGAGGTCGTGAAGAAGATGAAGAACTACTGGCGGCAGCTGCTGAACGCCAAGCTGATTACCCAGAGAAAGTTCGACAATCTGACCAAGGCCGAGAGAGGCGGCCTGAGCGAACTGGATAAGGCCGGCTTCATCAAGAGACAGCTGGTGGAAACCCGGCAGATCACAAAGCACGTGGCACAGATCCTGGACTCCCGGATGAACACTAAGTACGACGAGAATGACAAGCTGATCCGGGAAGTGAAAGTGATCACCCTGAAGTCCAAGCTGGTGTCCGATTTCCGGAAGGATTTCCAGTTTTACAAAGTGCGCGAGATCAACAACTACCACCACGCCCACGACGCCTACCTGAACGCCGTCGTGGGAACCGCCCTGATCAAAAAGTACCCTAAGCTGGAAAGCGAGTTCGTGTACGGCGACTACAAGGTGTACGACGTGCGGAAGATGATCGCCAAGAGCGAGCAGGAAATCGGCAAGGCTACCGCCAAGTACTTCTTCTACAGCAACATCATGAACTTTTTCAAGACCGAGATTACCCTGGCCAACGGCGAGATCCGGAAGCGGCCTCTGATCGAGACAAACGGCGAAACCGGGGAGATCGTGTGGGATAAGGGCCGGGATTTTGCCACCGTGCGGAAAGTGCTGAGCATGCCCCAAGTGAATATCGTGAAAAAGACCGAGGTGCAGACAGGCGGCTTCAGCAAAGAGTCTATCCTGCCCAAGAGGAACAGCGATAAGCTGATCGCCAGAAAGAAGGACTGGGACCCTAAGAAGTACGGCGGCTTCGACAGCCCCACCGTGGCCTATTCTGTGCTGGTGGTGGCCAAAGTGGAAAAGGGCAAGTCCAAGAAACTGAAGAGTGTGAAAGAGCTGCTGGGGATCACCATCATGGAAAGAAGCAGCTTCGAGAAGAATCCCATCGACTTTCTGGAAGCCAAGGGCTACAAAGAAGTGAAAAAGGACCTGATCATCAAGCTGCCTAAGTACTCCCTGTTCGAGCTGGAAAACGGCCGGAAGAGAATGCTGGCCTCTGCCGGCGAACTGCAGAAGGGAAACGAACTGGCCCTGCCCTCCAAATATGTGAACTTCCTGTACCTGGCCAGCCACTATGAGAAGCTGAAGGGCTCCCCCGAGGATAATGAGCAGAAACAGCTGTTTGTGGAACAGCACAAGCACTACCTGGACGAGATCATCGAGCAGATCAGCGAGTTCTCCAAGAGAGTGATCCTGGCCGACGCTAATCTGGACAAAGTGCTGTCCGCCTACAACAAGCACCGGGATAAGCCCATCAGAGAGCAGGCCGAGAATATCATCCACCTGTTTACCCTGACCAATCTGGGAGCCCCTGCCGCCTTCAAGTACTTTGACACCACCATCGACCGGAAGAGGTACACCAGCACCAAAGAGGTGCTGGACGCCACCCTGATCCACCAGAGCATCACCGGCCTGTACGAGACACGGATCGACCTGTCTCAGCTGGGAGGTGACTCCGGCGGAAGCTCTGGTGGCAGCAAGCGGACCGCCGACGGCTCTGAATTCGAGAGCCCTAAGAAGAAAAGAAAGGTGAGCGGAGGCTCTAGCGGCGGAAGCACCCTGAACATTGAAGACGAGTATAGACTGCATGAAACAAGCAAGGAACCCGACGTGTCCCTGGGCTCCACCTGGCTGTCCGACTTTCCCCAGGCCTGGGCCGAGACAGGAGGAATGGGCCTGGCCGTGCGGCAGGCACCCCTGATCATCCCTCTGAAGGCCACCTCTACACCCGTGAGCATCAAGCAGTACCCTATGTCTCAGGAGGCCAGACTGGGCATCAAGCCTCACATCCAGAGGCTGCTGGACCAGGGCATCCTGGTGCCATGCCAGAGCCCCTGGAACACACCACTGCTGCCCGTGAAGAAGCCAGGCACCAATGACTATAGACCCGTGCAGGATCTGAGAGAGGTGAACAAGAGGGTGGAGGATATCCACCCCACCGTGCCCAACCCTTACAATCTGCTGTCCGGCCTGCCCCCTTCTCACCAGTGGTATACAGTGCTGGACCTGAAGGATGCCTTCTTTTGTCTGAGACTGCACCCTACCAGCCAGCCACTGTTCGCCTTTGAGTGGAGGGACCCTGAGATGGGCATCTCTGGCCAGCTGACCTGGACACGCCTGCCTCAGGGCTTCAAGAATAGCCCAACACTGTTTAACGAGGCCCTGCACCGCGACCTGGCAGATTTCCGGATCCAGCACCCAGATCTGATCCTGCTGCAGTACGTGGACGATCTGCTGCTGGCCGCCACCAGCGAGCTGGATTGCCAGCAGGGAACACGCGCCCTGCTGCAGACCCTGGGAAACCTGGGATATAGGGCATCCGCCAAGAAGGCCCAGATCTGTCAGAAGCAGGTGAAGTACCTGGGCTATCTGCTGAAGGAGGGCCAGAGATGGCTGACAGAGGCCAGGAAGGAGACAGTGATGGGCCAGCCAACACCCAAGACCCCAAGACAGCTGAGGGAGTTCCTGGGCAAAGCAGGATTTTGCAGGCTGTTCATCCCAGGATTCGCAGAGATGGCAGCACCTCTGTACCCACTGACCAAGCCGGGCACCCTGTTTAATTGGGGCCCTGACCAGCAGAAGGCCTATCAGGAGATCAAGCAGGCCCTGCTGACAGCACCAGCCCTGGGCCTGCCAGACCTGACCAAGCCTTTCGAGCTGTTTGTGGATGAGAAGCAGGGCTACGCCAAGGGCGTGCTGACCCAGAAGCTGGGACCATGGAGACGGCCCGTGGCCTATCTGTCCAAGAAGCTGGACCCAGTGGCAGCAGGATGGCCACCATGCCTGAGGATGGTGGCAGCAATCGCCGTGCTGACAAAGGATGCCGGCAAGCTGACCATGGGACAGCCACTGGTCATCCTGGCACCACACGCAGTGGAGGCCCTGGTGAAGCAGCCTCCAGATCGCTGGCTGTCTAACGCCCGGATGACACACTACCAGGCCCTGCTGCTGGACACCGATCGCGTGCAGTTTGGCCCTGTGGTGGCCCTGAATCCAGCCACCCTGCTGCCTCTGCCAGAGGAGGGCCTGCAGCACAACTGTCTGGACATCCTGGCAGAGGCACACGGAACAAGGCCAGACCTGACCGATCAGCCCCTGCCTGACGCCGATCACACATGGTATACCGATGGAAGCTCCCTGCTGCAGGAGGGCCAGAGGAAGGCAGGAGCAGCAGTGACCACAGAGACAGAAGTGATCTGGGCCAAGGCCCTGCCAGCAGGCACATCCGCCCAGCGGGCCGAGCTGATCGCCCTGACCCAGGCCCTGAAGATGGCCGAGGGCAAGAAGCTGAACGTGTACACAGACTCCAGATATGCCTTCGCCACCGCACACATCCACGGAGAGATCTACAGGCGCCGGGGCTGGCTGACCTCTGAGGGCAAGGAGATCAAGAACAAGGATGAGATCCTGGCCCTGCTGAAGGCCCTGTTTCTGCCCAAGCGGCTGAGCATCATCCACTGTCCTGGACACCAGAAGGGACACTCCGCCGAGGCAAGGGGCAATCGGATGGCCGACCAGGCCGCCAGAAAGGCTGCTATTACTGAAACTCCCGACACTTCCACTCTGCTGATTGAAAACTCCTCCCCTTCTGGCGGCTCAAAAAGAACCGCCGACGGCAGCGAATTCGAGTCTCCCAAGAAGAAGAGGAAAGTCGGCTCTGGCCCTGCCGCTAAGAGAGTGAAGCTGGAC

配列番号99のPEmax成分配列:
二部分SV40 NLS:
MKRTADGSEFESPKKKRKV(配列番号101)
SpCas9 R221K N394K H840A:
DKKYSIGLDIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRKLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLKREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDAIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD(配列番号104)
リンカー＝(SGGSx2-二部分SV40 NLS-SGGSx2):
SGGSSGGSKRTADGSEFESPKKKRKVSGGSSGGS(配列番号105)
Genscriptコドン最適化MMLV RT五変異体(D200N T306K W313F T330P L603W):
TLNIEDEYRLHETSKEPDVSLGSTWLSDFPQAWAETGGMGLAVRQAPLIIPLKATSTPVSIKQYPMSQEARLGIKPHIQRLLDQGILVPCQSPWNTPLLPVKKPGTNDYRPVQDLREVNKRVEDIHPTVPNPYNLLSGLPPSHQWYTVLDLKDAFFCLRLHPTSQPLFAFEWRDPEMGISGQLTWTRLPQGFKNSPTLFNEALHRDLADFRIQHPDLILLQYVDDLLLAATSELDCQQGTRALLQTLGNLGYRASAKKAQICQKQVKYLGYLLKEGQRWLTEARKETVMGQPTPKTPRQLREFLGKAGFCRLFIPGFAEMAAPLYPLTKPGTLFNWGPDQQKAYQEIKQALLTAPALGLPDLTKPFELFVDEKQGYAKGVLTQKLGPWRRPVAYLSKKLDPVAAGWPPCLRMVAAIAVLTKDAGKLTMGQPLVILAPHAVEALVKQPPDRWLSNARMTHYQALLLDTDRVQFGPVVALNPATLLPLPEEGLQHNCLDILAEAHGTRPDLTDQPLPDADHTWYTDGSSLLQEGQRKAGAAVTTETEVIWAKALPAGTSAQRAELIALTQALKMAEGKKLNVYTDSRYAFATAHIHGEIYRRRGWLTSEGKEIKNKDEILALLKALFLPKRLSIIHCPGHQKGHSAEARGNRMADQAARKAAITETPDTSTLLIENSSP(配列番号98)
他のリンカー配列:
SGGS(配列番号122)
二部分SV40 NLS:
KRTADGSEFESPKKKRKV(配列番号140)
他のリンカー配列:
GSG(配列番号122)
c-Myc NLS:
PAAKRVKLD(配列番号135)

修飾された融合タンパク質は、任意の適切な構造的構成を含んでもよい。例えば、融合タンパク質は、N末端→C末端方向に、napDNAbpをポリメラーゼ(例として、DNA依存性DNAポリメラーゼ又はRNA依存性DNAポリメラーゼ、例として逆転写酵素)に融合されて含んでもよい。他の態様において、融合タンパク質は、N末端→C末端方向に、ポリメラーゼ(例として、逆転写酵素)をnapDNAbpに融合されて含んでもよい。融合したドメインは、任意選択で、リンカー、例としてアミノ酸配列によって連結されてもよい。他の態様において、融合タンパク質は構造NH₂-［napDNAbp］-［ポリメラーゼ］-COOH;又はNH₂-［ポリメラーゼ］-［napDNAbp］-COOHを含んでもよく、「］-［」の夫々のものは任意選択のリンカー配列の存在を指示する。ポリメラーゼが逆転写酵素である態様では、融合タンパク質は構造NH₂-［napDNAbp］-［RT］-COOH;又はNH₂-［RT］-［napDNAbp］-COOHを含んでもよく、「］-［」の夫々のものは任意選択のリンカー配列の存在を指示する。

種々の態様において、本明細書において企図される方法及び組成物で利用されるプライム編集因子融合タンパク質は、PEmaxと少なくとも約70％同一、少なくとも約80％同一、少なくとも約90％同一、少なくとも約95％同一、少なくとも約96％同一、少なくとも約97％同一、少なくとも約98％同一、少なくとも約99％同一、少なくとも約99.5％同一、又は少なくとも約99.9％同一であるアミノ酸配列を有する上で開示されている配列のいずれかのバリアントをもまた包含してもよい。

本開示は、本明細書に記載のPEmax変異の1つ以上(すなわち、R221K、N394K、及び/又はH840A)を用いた当技術分野で公知の任意のCas9タンパク質の修飾、及び本明細書に記載のPEmaxアーキテクチャ特徴の1つ以上(例として、最適化されたMMLV RT五変異体、NLS、リンカー等)を用いた任意の修飾Cas9タンパク質の組み合わせを企図する。

いくつかの態様では、本明細書に記載のPEmaxタンパク質は、本明細書に開示の以下の他のCas9配列のいずれか、又は対応するアミノ酸位置で本明細書に記載の突然変異の1つ以上で更に修飾されてもよいそのバリアントを包含する。本明細書に記載のPEmax構築物に使用されるnapDNAbpは、Cas9等の任意の適切なホモログ及び/又はオルソログ又は天然に存在する酵素を包含してもよい。Cas9ホモログ及び/又はオルソログはS.pyogenes及びS.thermophilusを包含するがこれらに限定されない種々の種において記載されている。Cas部分はニッカーゼとして構成されてもよい(例として、変異導入されるか、組換え操作されるか、又は別様に天然から得られる)。すなわち、標的二本鎖DNAの一本鎖のみを切断することができる。追加の好適なCas9ヌクレアーゼ及び配列は、本開示に基づき当業者に明らかであろう。またかかるCas9ヌクレアーゼ及び配列は、Chylinski,Rhun,and Charpentier,「The tracrRNA and Cas9 families of type II CRISPR-Cas immunity systems」(2013)RNA Biology 10:5,726-737(この内容全体は参照により本明細書に組み込まれる)に開示された生物及び遺伝子座からのCas9配列を包含する。いくつかの態様では、Cas9ヌクレアーゼは不活性な(例として不活性化された)DNA切断ドメインを有する。つまり、Cas9はニッカーゼである。いくつかの態様では、Cas9タンパク質は、本明細書に提供されるCas9オルソログのいずれか1つによって提供されるCas9タンパク質のアミノ酸配列と少なくとも85％、少なくとも90％、少なくとも92％、少なくとも95％、少なくとも96％、少なくとも97％、少なくとも98％、少なくとも99％、又は少なくとも99.5％同一であるアミノ酸配列を含む。

プライム編集因子-MMR阻害剤融合タンパク質
本開示は、いくつかの態様では、MMR阻害剤(例として、MMRを阻害するMLH1ドミナントネガティブバリアント等のMMRタンパク質の抗体又はポリペプチド阻害剤)が、プライム編集因子融合タンパク質又はその成分の少なくとも1つに連結されてもよいことを企図する。

ある特定の態様において、本明細書中に記載される阻害剤ドメイン、例として、抗MLH1抗体又はMLH1ドミナントネガティブバリアントはまた、そのドメインをプライム編集因子ドメインに融合することによってシスで提供されてもよい。以下の構造のいずれかが企図され、式中、「］-［」は任意選択のリンカーを表す:

［napDNAbp］-［逆転写酵素］-［MLH1阻害剤］;

［逆転写酵素］-［napDNAbp］-［MLH1阻害剤］;

［MLH1阻害剤］-［逆転写酵素］-［napDNAbp］;

［MLH1阻害剤］-［napDNAbp］-［逆転写酵素］;

［napDNAbp］-［MLH1阻害剤］-［逆転写酵素］;又は

［逆転写酵素］-［MLH1阻害剤］-［napDNAbp］。

ある特定の態様において、阻害剤ドメインは、MLH1ドミナントネガティブバリアントである。以下の構造のいずれかが企図され、式中、「］-［」は任意選択のリンカーを表す:

［napDNAbp］-［逆転写酵素］-［MLH1ドミナントネガティブバリアント］;

［逆転写酵素］-［napDNAbp］-［MLH1ドミナントネガティブバリアント］;

［MLH1ドミナントネガティブバリアント］-［逆転写酵素］-［napDNAbp］;

［MLH1ドミナントネガティブバリアント］-［napDNAbp］-［逆転写酵素］;

［napDNAbp］-［MLH1ドミナントネガティブバリアント］-［逆転写酵素］;又は

［逆転写酵素］-［MLH1ドミナントネガティブバリアント］-［napDNAbp］。

特定の他の態様では、本明細書に記載の阻害剤ドメイン、例として抗MMRタンパク質抗体又はMMRタンパク質ドミナントネガティブバリアントはまた、ドメインをプライム編集因子ドメインに融合することによってシスで提供されてもよい。以下の構造のいずれかが企図され、式中、「］-［」は任意選択のリンカーを表す:

［napDNAbp］-［逆転写酵素］-［抗MMRタンパク質阻害剤］;

［逆転写酵素］-［napDNAbp］-［抗MMRタンパク質阻害剤］;

［抗MMRタンパク質阻害剤］-［逆転写酵素］-［napDNAbp］;

［抗MMRタンパク質阻害剤］-［napDNAbp］-［逆転写酵素］;

［napDNAbp］-［抗MMRタンパク質阻害剤］-［逆転写酵素］;又は

［逆転写酵素］-［抗MMRタンパク質阻害剤］-［napDNAbp］、ここで、MMRタンパク質は、MLH1、PMS2(又はMutLアルファ)、PMS1(又はMutLベータ)、MLH3(又はMutLガンマ)、MutSアルファ(MSH2-MSH6)、MutSベータ(MSH2-MSH3)、MSH2、MSH6、PCNA、RFC、EXO1、POLδ及びPCNAのいずれか1つである。

特定の態様では、阻害剤ドメインは、MLH1、PMS2(又はMutLアルファ)、PMS1(又はMutLベータ)、MLH3(又はMutLガンマ)、MutSアルファ(MSH2-MSH6)、MutSベータ(MSH2-MSH3)、MSH2、MSH6、PCNA、RFC、EXO1、POLδ及びPCNA等の任意のMMRタンパク質のドミナントネガティブバリアントである。以下の構造のいずれかが企図され、式中、「］-［」は任意選択のリンカーを表す:

［napDNAbp］-［逆転写酵素］-［任意のMMRタンパク質のドミナントネガティブバリアント］;

［逆転写酵素］-［napDNAbp］-［任意のMMRタンパク質のドミナントネガティブバリアント］;

［任意のMMRタンパク質のドミナントネガティブバリアント］-［逆転写酵素］-［napDNAbp］;

［任意のMMRタンパク質napDNAbpのドミナントネガティブバリアント］-［逆転写酵素］;

［napDNAbp］-［任意のMMRタンパク質のドミナントネガティブバリアント］-［逆転写酵素］;又は［逆転写酵素］-［任意のMMRタンパク質のドミナントネガティブバリアント］-［napDNAbp］。

更に、MMR阻害剤は、プライム編集因子のドメインの1つのみに融合されてもよく、他のプライム編集因子ドメインとは別個に投与されてもよい。例えば、MMR阻害剤はnapDNAbpドメインに融合されてもよく、それによってポリメラーゼドメインはトランスで別々に提供される。別の方法では、MMR阻害剤は、ポリメラーゼドメインに融合されてもよく、それによってnapDNAbpドメインはトランスで別々に提供される。

A.リンカー
上で定められている通り、本明細書において用いられる用語「リンカー」は、2つの分子又は部分、例として、ヌクレアーゼの結合ドメイン及び切断ドメインを連結する化学基又は分子を指す。いくつかの態様では、リンカーはRNAによってプログラム可能なヌクレアーゼのgRNA結合ドメイン及びポリメラーゼ(例として、逆転写酵素)の触媒ドメインを連結する。いくつかの態様では、リンカーはdCas9及び逆転写酵素を連結する。典型的には、リンカーは2つの基、分子、又は他の部分の間に配置されるか又はそれらによってフランキングされ、共有結合を介して夫々の1つに接続され、それゆえに2つを接続する。いくつかの態様では、リンカーはアミノ酸又は複数のアミノ酸(例として、ペプチド又はタンパク質)である。いくつかの態様では、リンカーは有機分子、基、ポリマー、又は化学的部分である。いくつかの態様では、リンカーは、長さが5-100アミノ酸、例えば長さが5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、30～35、35～40、40～45、45～50、50～60、60～70、70～80、80～90、90～100、100～150、又は150～200アミノ酸である。より長い又はより短いリンカーもまた企図される。

リンカーは共有結合ほども単純であってもよいか、又はそれは長さが多くの原子であるポリマー性リンカーであってもよい。ある態様において、リンカーはポリ(pol)ペプチドであるか又はアミノ酸に基づく。他の態様において、リンカーはペプチド様ではない。ある態様において、リンカーは共有結合である(例として、炭素-炭素結合、ジスルフィド結合、炭素-ヘテロ原子結合等)。ある態様において、リンカーはアミド連結部の炭素-窒素結合である。ある態様において、リンカーは、環状又は非環状の、置換又は無置換の、分枝又は非分枝の脂肪族又はヘテロ脂肪族リンカーである。ある態様において、リンカーはポリマー性である(例として、ポリエチレン、ポリエチレングリコール、ポリアミド、ポリエステル等)。ある態様において、リンカーはアミノアルカン酸のモノマー、二量体、又はポリマーを含む。ある態様において、リンカーはアミノアルカン酸を含む(例として、グリシン、エタン酸、アラニン、ベータアラニン、3-アミノプロパン酸、4-アミノ酪酸、5-ペンタン酸等)。ある態様において、リンカーはアミノヘキサン酸(Ahx)のモノマー、二量体、又はポリマーを含む。ある態様において、リンカーは炭素環部分(例として、シクロペンタン、シクロヘキサン)に基づく。他の態様において、リンカーはポリエチレングリコール部分(PEG)を含む。他の態様において、リンカーはアミノ酸を含む。ある態様において、リンカーはペプチドを含む。ある態様において、リンカーはアリール又はヘテロアリール部分を含む。ある態様において、リンカーはフェニル環に基づく。リンカーは、ペプチドからリンカーへの求核剤(例として、チオール、アミノ)の結合を促進するための官能化部分を包含してもよい。いずれかの求電子剤がリンカーの一部として用いられてもよい。例示の求電子剤は、活性化エステル、活性化アミド、マイケルアクセプター、ハロゲン化アルキル、ハロゲン化アリール、ハロゲン化アシル、及びイソチオシアネートを包含するが、これらに限定されない。

いくつかの他の態様では、リンカーは、アミノ酸配列(GGGGS)_n(配列番号118)、(G)_n(配列番号119)、(EAAAK)_n(配列番号120)、(GGS)_n(配列番号121)、(SGGS)_n(配列番号122)、(XP)_n(配列番号123)、又はそれらの任意の組み合わせを含み、nは独立して1～30の整数であり、Xは任意のアミノ酸である。いくつかの態様では、リンカーは、アミノ酸配列(GGS)n(配列番号121)を含み、ここで、nは1、3、又は7である。いくつかの態様では、リンカーは、XTENとも呼ばれるアミノ酸配列SGSETPGTSESATPES(配列番号124)を含む。いくつかの態様では、リンカーはアミノ酸配列SGGSSGGSSGSETPGTSESATPESSGGSSGGS(配列番号125)を含む。いくつかの態様では、リンカーはアミノ酸配列SGGSGGSGGS(配列番号126)を含む。いくつかの態様では、リンカーはアミノ酸配列SGGS(配列番号127)を含む。他の態様において、リンカーはアミノ酸配列SGGSSGGSSGSETPGTSESATPESAGSYPYDVPDYAGSAAPAAKKKKLDGSGSGGSSGGS(配列番号128、60AA)を含む。

上で定められている通り、本明細書において用いられる用語「リンカー」は、2つの分子又は部分、例として、ヌクレアーゼの結合ドメイン及び切断ドメインを連結する化学基又は分子を指す。いくつかの態様では、リンカーはRNAによってプログラム可能なヌクレアーゼのgRNA結合ドメイン及びリコンビナーゼの触媒ドメインを連結する。いくつかの態様では、リンカーはdCas9及び逆転写酵素を連結する。典型的には、リンカーは2つの基、分子、又は他の部分の間に配置されるか又はそれらによってフランキングされ、共有結合を介して夫々の1つに接続され、それゆえに2つを接続する。いくつかの態様では、リンカーはアミノ酸又は複数のアミノ酸(例として、ペプチド又はタンパク質)である。いくつかの態様では、リンカーは有機分子、基、ポリマー、又は化学的部分である。いくつかの態様では、リンカーは、長さが5-100アミノ酸、例えば長さが5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、30～35、35～40、40～45、45～50、50～60、60～70、70～80、80～90、90～100、100～150、又は150～200アミノ酸である。より長い又はより短いリンカーもまた企図される。

いくつかの他の態様では、リンカーは、アミノ酸配列(GGGGS)n(配列番号118)、(G)n(配列番号119)、(EAAAK)_n(配列番号120)、(GGS)_n(配列番号121)、(SGGS)n(配列番号122)、(XP)n(配列番号123)、又はそれらの任意の組み合わせを含み、nは独立して1～30の整数であり、Xは任意のアミノ酸である。いくつかの態様では、リンカーは、アミノ酸配列(GGS)n(配列番号121)を含み、ここで、nは1、3、又は7である。いくつかの態様では、リンカーは、XTENとも呼ばれるアミノ酸配列SGSETPGTSESATPES(配列番号124)を含む。いくつかの態様では、リンカーはアミノ酸配列SGGSSGGSSGSETPGTSESATPESSGGSSGGS(配列番号125)を含む。いくつかの態様では、リンカーはアミノ酸配列SGGSGGSGGS(配列番号126)を含む。いくつかの態様では、リンカーはアミノ酸配列SGGS(配列番号127)を含む。

特に、以下のリンカーが様々な態様において使用されて、プライム編集因子ドメインを互いに結合し得る:GGS(配列番号129);GGSGGS(配列番号130);GGSGGSGGS(配列番号131);SGGSSGGSSGSETPGTSESATPESSGGSSGGSS(配列番号102);SGSETPGTSESATPES(配列番号124)、XTENとも呼ばれる、SGGSSGGSSGSETPGTSESATPESAGSYPYDVPDYAGSAAPAAKKKKLDGSGSGGSSGG S(配列番号128)。

PE融合タンパク質はまた、napDNAbp(例として、Cas9ドメイン)及びポリメラーゼドメイン(例として、RTドメイン)以外の様々な他のドメインを含んでもよい。例えば、napDNAbpがCas9であり、ポリメラーゼがRTである場合、PE融合タンパク質は、Cas9ドメインをRTドメインと結合する1つ以上のリンカーを含んでもよい。リンカーはまた、核局在化配列(NLS)又はFEN1(又は他のフラップエンドヌクレアーゼ)等の他の機能的ドメインをPE融合タンパク質又はそのドメインに結合してもよい。

いくつかの態様では、PE融合タンパク質は、DNAミスマッチ修復経路の阻害剤(例として、本明細書に記載のMLH1dn)を含んでもよい。ある特定の態様において、PE融合タンパク質及びDNAミスマッチ修復経路の阻害剤は、リンカーを介して融合される。いくつかの態様では、リンカーは自己加水分解性リンカーである。適切な自己加水分解性リンカーは、2A自己切断性ペプチドを含むアミノ酸配列を包含するが、これらに限定されない。2A自己切断ペプチドは、タンパク質翻訳中にリボソームスキッピングを誘導することができ、その結果、リボソームが2つの遺伝子又は2つの遺伝子断片間にペプチド結合を形成することができない。本明細書中に記載される融合タンパク質においてリンカーとして使用されてもよい例示的な2A自己切断性ペプチドは、以下のアミノ酸配列を包含する。
T2A-EGRGSLLTCGDVEENPGP(配列番号233)
P2A-ATNFSLLKQAGDVEENPGP(配列番号234)
E2A-QCTNYALLKLAGDVESNPGP(配列番号235)
F2A-VKQTLNFDLLKLAGDVESNPGP(配列番号236)

特定の態様では、本明細書に記載のPE融合タンパク質は、配列番号234のアミノ酸配列を含むリンカーによってMLH1dnに融合される。

B.核局在配列(NLS)
様々な態様では、PE融合タンパク質は、細胞核へのタンパク質の移行を促進するのを助ける1つ以上の核局在化配列(NLS)を含んでもよい。そのような配列は当技術分野で周知であり、配列番号1、101、103、133～139によって表される例を包含し得る。

上のNLS例は限定しない。PE融合タンパク質はいずれかの公知のNLS配列を含んでもよく、Cokol et al.,「Finding nuclear localization signals,」EMBO Rep.,2000,1(5):411-415及びFreitas et al.,「Mechanisms and Signals for the Nuclear Import of Proteins,」Current Genomics,2009,10(8):550-7に記載されているもののいずれかを包含する。これらの夫々は参照によって本明細書に組み込まれる。

様々な態様において、本明細書中に開示される方法及び組成物において利用されるプライム編集因子及びプライム編集因子をコードする構築物は、1つ以上の、好ましくは少なくとも2つの核局在化シグナルを更に含む。ある態様において、プライム編集因子は少なくとも2つのNLSを含む。少なくとも2つのNLSによる態様では、NLSは同じNLSであり得るか、又はそれらは異なるNLSであり得る。加えて、NLSはプライム編集因子の残りの部分との融合タンパク質の一部として発現されてもよい。いくつかの態様では、NLSの1以上は双節型NLS(「bpNLS」)である。ある態様において、本開示の融合タンパク質は2つの双節型NLSを含む。いくつかの態様では、本開示の融合タンパク質は2つよりも多くの双節型NLSを含む。

NLS融合の位置付けはプライム編集因子のN末端、C末端、又は配列内であり得る(例としてコードされるnapDNAbp構成要素(例としてCas9)及びポリメラーゼドメイン(例として逆転写酵素ドメイン)の間に挿入される。

NLSは当該技術分野のいずれかの公知のNLS配列であってもよい。NLSはまた、核局在のためのいずれかの将来に発見されるNLSであってもよい。NLSはまた、いずれかの天然に存在するNLS又はいずれかの天然に存在しないNLS(例として、1以上の所望の変異を有するNLS)であってもよい。
用語「核局在化配列」又は「NLS」は、タンパク質の細胞核中への、例えば核輸送による、インポート(import)を促進するアミノ酸配列を指す。核局在化配列は当該技術分野において知られており、当業者に明らかであろう。例えば、NLS配列は、2001年5月31日にWO/2001/038547として公開された2000年11月23日出願のPlank et al.の国際PCT出願PCT/EP2000/011690に記載されている。これの内容は参照によって本明細書に組み込まれる。いくつかの態様では、NLSはアミノ酸配列PKKKRKV(配列番号132)、MDSLLMNRRKFLYQFKNVRWAKGRRETYLC(配列番号1)、KRTADGSEFESPKKKRKV(配列番号140)、又はKRTADGSEFEPKKKRKV(配列番号141)を含む。他の態様において、NLSはアミノ酸配列NLSKRPAAIKKAGQAKKKK(配列番号142)、PAAKRVKLD(配列番号135)、RQRRNELKRSF(配列番号143)、NQSSNFGPMKGGNFGGRSSGPYGGGGQYFAKPRNQGGY(配列番号144)を含む。

本開示の一側面において、プライム編集因子は、1以上の核局在シグナル(NLS)、好ましくは少なくとも2つのNLSによって修飾されてもよい。ある態様において、プライム編集因子は2以上のNLSによって修飾される。本開示は、本開示のときに当該技術分野で公知のいずれかの核局在シグナル又は本出願時の後の現況技術によって同定されるか若しくはさもなければ利用可能にされるいずれかの核局在シグナルの使用を企図する。代表的な核局在シグナルは、配列が発現される細胞の核にタンパク質を導くペプチド配列である。核局在シグナルは支配的には塩基性であり、タンパク質のアミノ酸配列のほとんどどこにでも配置され得、一般的には、4アミノ酸(Autieri&Agrawal,(1998)J.Biol.Chem.273:14731-37、参照によって本明細書に組み込まれる)～8アミノ酸の短い配列を含み、典型的にはリジン及びアルギニン残基がリッチである(Magin et al.,(2000)Virology 274:11-16、参照によって本明細書に組み込まれる)。核局在シグナルは多くの場合にはプロリン残基を含む。種々の核局在シグナルが同定されており、細胞質から細胞の核への生物学的分子の輸送を成し遂げるために用いられている。例として、Tinland et al.,(1992)Proc.Natl.Acad.Sci.U.S.A.89:7442-46;Moede et al.,(1999)FEBS Lett.461:229-34を参照。これは参照によって組み込まれる。移行は現行では核膜孔タンパク質を伴うと考えられる。

ほとんどのNLSは3つの一般的な群に分類され得る:(i)SV40ラージT抗原NLS(PKKKRKV(配列番号132))によって例示される一部分NLS;(ii)XenopusヌクレオプラスミンNLS(KRXXXXXXXXXXKKKK(配列番号145))によって例示される、可変の数のスペーサアミノ酸によって分離された2つの塩基性ドメインからなる二部分モチーフ;並びに(iii)非標準的な配列、例えばhnRNP A1タンパク質のM9、インフルエンザウイルス核タンパク質NLS、及び酵母Gal4タンパク質NLS(Dingwall and Laskey 1991)。
核局在シグナルはタンパク質のアミノ酸配列上の種々の点に出現する。NLSはタンパク質のN末端、C末端、及び中心領域から同定されている。それゆえに、本開示は、プライム編集因子のC末端、N末端、及び内部の領域において1以上のNLSによって修飾されてもよいプライム編集因子を提供する。核局在シグナルそれ自体と例えば強直的に又は立体的に干渉しないようにして、構成要素NLS残基として機能しないより長い配列の残基が選択されるべきである。よって、NLSを含む配列の組成に厳格な限定はないが、事実上、かかる配列は長さ及び組成が機能的に限定され得る。

本開示は、1以上のNLSを包含するようにプライム編集因子を修飾するためのいずれかの好適な手段を企図する。一側面において、プライム編集因子は、そのN末端又はそのC末端(又は両方)において1以上のNLSに翻訳的に融合されているプライム編集因子タンパク質を発現するように、すなわちプライム編集因子-NLS融合体構築物を形成するように、操作されてもよい。他の態様において、プライム編集因子をコードするヌクレオチド配列は、コードされるプライム編集因子の内部の領域に1以上のNLSをコードする読み枠を組み込むように遺伝子修飾されてもよい。加えて、NLSは、プライム編集因子とN末端に、C末端に、又は内部に、例としてそしてタンパク質の中心領域に取り付けられたNLSアミノ酸配列との間にコードされる種々のアミノ酸リンカー又はスペーサ領域を包含してもよい。それゆえに、本開示は、プライム編集因子及び1以上のNLSを含む融合タンパク質を発現するためのヌクレオチド構築物、ベクター、及びホスト細胞をもまた可能にする。

本明細書に記載の方法及び組成物で利用されるプライム編集因子は核局在シグナルをもまた含んでもよく、これらは、1つ以上のリンカー、例としてそしてポリマー性、アミノ酸、核酸、多糖、化学的、又は核酸リンカー要素を介してプライム編集因子に連結される。本開示の企図される範囲内のリンカーはいずれかの限定を有することを意図されず、いずれかの好適なタイプの分子(例として、ポリマー、アミノ酸、多糖、核酸、脂質、又はいずれかの合成化学的リンカードメイン)であり得、プライム編集因子及び1以上のNLSの間に結合(例として、共有結合的連結、水素結合)を形成することを成就するいずれかの好適な戦略によって、プライム編集因子に連結され得る。

C.フラップエンドヌクレアーゼ(例としてFEN1)
種々の態様において、PE融合タンパク質は1つ以上のフラップエンドヌクレアーゼ(例としてFEN1)を含んでもよく、これは5'一本鎖DNAフラップの除去を触媒する酵素を指す。これらは、細胞プロセス(DNA複製を包含する)の最中に形成された5'フラップの除去を処理する酵素である。本明細書に記載の方法及び組成物で利用されるプライム編集は、内因的に供給されるフラップエンドヌクレアーゼ又はトランスで提供されるものを利用して、プライム編集中に標的部位に形成された内因性DNAの5'フラップを除去してもよい。フラップエンドヌクレアーゼは当該技術分野において知られており、Patel et al.,「Flap endonucleases pass 5'-flaps through a flexible arch using a disorder-thread-order mechanism to confer specificity for free 5'-ends,」Nucleic Acids Research,2012,40(10):4507-4519及びTsutakawa et al.,「Human flap endonuclease structures,DNA double-base flipping,and a unified understanding of the FEN1 superfamily,」Cell,2011,145(2):198-211(これらの各々は参照により本明細書に組み込まれる)に記載のものから見出され得る。例示のフラップエンドヌクレアーゼは、以下のアミノ酸配列によって表され得るFEN1である:

フラップエンドヌクレアーゼは、いずれかのFEN1バリアント、変異体、又は他のフラップエンドヌクレアーゼオルソログ、ホモログ、若しくはバリアントをもまた包含してもよい。非限定的なFEN1バリアントの例は以下の通りである。

様々な態様では、本明細書で企図される方法及び組成物で利用されるプライム編集因子融合タンパク質は、上記の配列のいずれかと少なくとも約70％同一、少なくとも約80％同一、少なくとも約90％同一、少なくとも約95％同一、少なくとも約96％同一、少なくとも約97％同一、少なくとも約98％同一、少なくとも約99％同一、少なくとも約99.5％同一、又は少なくとも約99.9％同一であるアミノ酸配列を有する上記で開示された配列の任意のフラップエンドヌクレアーゼバリアントを包含してもよい。5'端一本鎖DNAフラップの除去を容易化するために本方法によって利用されてもよい他のエンドヌクレアーゼは、(1)trex2、(2)exo1エンドヌクレアーゼを包含するが、これらに限定されない(例として、Keijzers et al.,Biosci Rep.2015,35(3):e00206)。

Trex2
3'3プライム修復エキソヌクレアーゼ2(TREX2)-ヒト［受託番号NM_080701］
MSEAPRAETFVFLDLEATGLPSVEPEIAELSLFAVHRSSLENPEHDESGALVLPRVLDKLTLCMCPERPFTAKASEITGLSSEGLARCRKAGFDGAVVRTLQAFLSRQAGPICLVAHNGFDYDFPLLCAELRRLGARLPRDTVCLDTLPALRGLDRAHSHGTRARGRQGYSLGSLFHRYFRAEPSAAHSAEGDVHTLLLIFLHRAAELLAWADEQARGWAHIEPMYLPPDDPSLEA(配列番号152).

3'3プライム修復エキソヌクレアーゼ2(TREX2)-マウス［受託番号NM_011907］
MSEPPRAETFVFLDLEATGLPNMDPEIAEISLFAVHRSSLENPERDDSGSLVLPRVLDKLTLCMCPERPFTAKASEITGLSSESLMHCGKAGFNGAVVRTLQGFLSRQEGPICLVAHNGFDYDFPLLCTELQRLGAHLPQDTVCLDTLPALRGLDRAHSHGTRAQGRKSYSLASLFHRYFQAEPSAAHSAEGDVHTLLLIFLHRAPELLAWADEQARSWAHIEPMYVPPDGPSLEA(配列番号153).

3'3プライム修復エキソヌクレアーゼ2(TREX2)-ラット［受託番号NM_001107580］
MSEPLRAETFVFLDLEATGLPNMDPEIAEISLFAVHRSSLENPERDDSGSLVLPRVLDKLTLCMCPERPFTAKASEITGLSSEGLMNCRKAAFNDAVVRTLQGFLSRQEGPICLVAHNGFDYDFPLLCTELQRLGAHLPRDTVCLDTLPALRGLDRVHSHGTRAQGRKSYSLASLFHRYFQAEPSAAHSAEGDVNTLLLIFLHRAPELLAWADEQARSWAHIEPMYVPPDGPSLEA(配列番号154).

ExoI
ヒトエキソヌクレアーゼ1(EXO1)は、DNAミスマッチ修復(MMR)、マイクロ媒介末端結合(micro-mediated end-joining、相同組換え(HR)、及び複製を包含する、多くの種々のDNA代謝プロセスに関係する。ヒトEXO1は、真核生物ヌクレアーゼRad2/XPGのファミリーに属し、これはまたFEN1及びGEN1も包含する。Rad2/XPGファミリーは、ファージからヒトまでの種を通してヌクレアーゼドメインが保存されている。EXO1遺伝子産物は、5'エキソヌクレアーゼと5'フラップ活性との両方を呈する。加えて、EXO1は、固有の5'RNase H活性も含有する。ヒトEXO1は、二本鎖DNA(dsDNA)、ニック、ギャップ、シュードY構造のプロセシングに対し高親和性を有し、遺伝で受け継いだそのフラップ活性を使用してホリデイ接点を分解し得る。ヒトEXO1はMMRに関係し、MLH1及びMSH2と直接相互作用する保存された結合ドメインを含有する。EXO1核酸分解活性は、PCNA、MutSα(MSH2/MSH6複合体)、14-3-3、MRN、及び9-1-1複合体によって正に刺激される。

エキソヌクレアーゼ1(EXO1)受託番号NM_003686(Homo sapiensエキソヌクレアーゼ1(EXO1)、転写産物バリアント3)-アイソフォームA
MGIQGLLQFIKEASEPIHVRKYKGQVVAVDTYCWLHKGAIACAEKLAKGEPTDRYVGFCMKFVNMLLSHGIKPILVFDGCTLPSKKEVERSRRERRQANLLKGKQLLREGKVSEARECFTRSINITHAMAHKVIKAARSQGVDCLVAPYEADAQLAYLNKAGIVQAIITEDSDLLAFGCKKVILKMDQFGNGLEIDQARLGMCRQLGDVFTEEKFRYMCILSGCDYLSSLRGIGLAKACKVLRLANNPDIVKVIKKIGHYLKMNITVPEDYINGFIRANNTFLYQLVFDPIKRKLIPLNAYEDDVDPETLSYAGQYVDDSIALQIALGNKDINTFEQIDDYNPDTAMPAHSRSHSWDDKTCQKSANVSSIWHRNYSPRPESGTVSDAPQLKENPSTVGVERVISTKGLNLPRKSSIVKRPRSAELSEDDLLSQYSLSFTKKTKKNSSEGNKSLSFSEVFVPDLVNGPTNKKSVSTPPRTRNKFATFLQRKNEESGAVVVPGTRSRFFCSSDSTDCVSNKVSIQPLDETAVTDKENNLHESEYGDQEGKRLVDTDVARNSSDDIPNNHIPGDHIPDKATVFTDEESYSFESSKFTRTISPPTLGTLRSCFSWSGGLGDFSRTPSPSPSTALQQFRRKSDSPTSLPENNMSDVSQLKSEESSDDESHPLREEACSSQSQESGEFSLQSSNASKLSQCSSKDSDSEESDCNIKLLDSQSDQTSKLRLSHFSKKDTPLRNKVPGLYKSSSADSLSTTKIKPLGPARASGLSKKPASIQKRKHHNAENKPGLQIKLNELWKNFGFKKF(配列番号155).

エキソヌクレアーゼ1(EXO1)受託番号NM_006027(Homo sapiensエキソヌクレアーゼ1(EXO1)、転写産物バリアント3)-アイソフォームB
MGIQGLLQFIKEASEPIHVRKYKGQVVAVDTYCWLHKGAIACAEKLAKGEPTDRYVGFCMKFVNMLLSHGIKPILVFDGCTLPSKKEVERSRRERRQANLLKGKQLLREGKVSEARECFTRSINITHAMAHKVIKAARSQGVDCLVAPYEADAQLAYLNKAGIVQAIITEDSDLLAFGCKKVILKMDQFGNGLEIDQARLGMCRQLGDVFTEEKFRYMCILSGCDYLSSLRGIGLAKACKVLRLANNPDIVKVIKKIGHYLKMNITVPEDYINGFIRANNTFLYQLVFDPIKRKLIPLNAYEDDVDPETLSYAGQYVDDSIALQIALGNKDINTFEQIDDYNPDTAMPAHSRSHSWDDKTCQKSANVSSIWHRNYSPRPESGTVSDAPQLKENPSTVGVERVISTKGLNLPRKSSIVKRPRSAELSEDDLLSQYSLSFTKKTKKNSSEGNKSLSFSEVFVPDLVNGPTNKKSVSTPPRTRNKFATFLQRKNEESGAVVVPGTRSRFFCSSDSTDCVSNKVSIQPLDETAVTDKENNLHESEYGDQEGKRLVDTDVARNSSDDIPNNHIPGDHIPDKATVFTDEESYSFESSKFTRTISPPTLGTLRSCFSWSGGLGDFSRTPSPSPSTALQQFRRKSDSPTSLPENNMSDVSQLKSEESSDDESHPLREEACSSQSQESGEFSLQSSNASKLSQCSSKDSDSEESDCNIKLLDSQSDQTSKLRLSHFSKKDTPLRNKVPGLYKSSSADSLSTTKIKPLGPARASGLSKKPASIQKRKHHNAENKPGLQIKLNELWKNFGFKKDSEKLPPCKKPLSPVRDNIQLTPEAEEDIFNKPECGRVQRAIFQ(配列番号156).

エキソヌクレアーゼ1(EXO1)受託番号NM_001319224(Homo sapiensエキソヌクレアーゼ1(EXO1)、転写産物バリアント4)-アイソフォームC
MGIQGLLQFIKEASEPIHVRKYKGQVVAVDTYCWLHKGAIACAEKLAKGEPTDRYVGFCMKFVNMLLSHGIKPILVFDGCTLPSKKEVERSRRERRQANLLKGKQLLREGKVSEARECFTRSINITHAMAHKVIKAARSQGVDCLVAPYEADAQLAYLNKAGIVQAIITEDSDLLAFGCKKVILKMDQFGNGLEIDQARLGMCRQLGDVFTEEKFRYMCILSGCDYLSSLRGIGLAKACKVLRLANNPDIVKVIKKIGHYLKMNITVPEDYINGFIRANNTFLYQLVFDPIKRKLIPLNAYEDDVDPETLSYAGQYVDDSIALQIALGNKDINTFEQIDDYNPDTAMPAHSRSHSWDDKTCQKSANVSSIWHRNYSPRPESGTVSDAPQLKENPSTVGVERVISTKGLNLPRKSSIVKRPRSELSEDDLLSQYSLSFTKKTKKNSSEGNKSLSFSEVFVPDLVNGPTNKKSVSTPPRTRNKFATFLQRKNEESGAVVVPGTRSRFFCSSDSTDCVSNKVSIQPLDETAVTDKENNLHESEYGDQEGKRLVDTDVARNSSDDIPNNHIPGDHIPDKATVFTDEESYSFESSKFTRTISPPTLGTLRSCFSWSGGLGDFSRTPSPSPSTALQQFRRKSDSPTSLPENNMSDVSQLKSEESSDDESHPLREEACSSQSQESGEFSLQSSNASKLSQCSSKDSDSEESDCNIKLLDSQSDQTSKLRLSHFSKKDTPLRNKVPGLYKSSSADSLSTTKIKPLGPARASGLSKKPASIQKRKHHNAENKPGLQIKLNELWKNFGFKKDSEKLPPCKKPLSPVRDNIQLTPEAEEDIFNKPECGRVQRAIFQ(配列番号157).

D.インテイン及び分裂インテイン
いくつかの態様では(例として、AAV粒子を用いるin vivoのプライム編集因子の送達)、ポリペプチド(例として、デアミナーゼ又はnapDNAbp)又は融合タンパク質(例としてプライム編集因子)をN末端の半分及びC末端の半分へと分裂し、それらを別個に送達し、次いでそれらの共局在が完全なタンパク質(又は場合に応じて融合タンパク質)を細胞内で再形成することを許すことが有利であってもよいということは理解されるであろう。タンパク質又は融合タンパク質の別個の半分同士は、夫々が、タンパク質トランススプライシングの機序による完全なタンパク質又は融合タンパク質の再形成を容易化するための分裂インテインタグを含んでもよい。

分裂インテインによって触媒されるタンパク質トランススプライシングは、タンパク質ライゲーションのための全く酵素的な方法を提供する。分裂インテインは本質的には一続きのインテイン(例としてミニインテイン)であり、夫々Nインテイン及びCインテインという名称の2つのピースへと分裂されている。分裂インテインのNインテイン及びCインテインは、非共有結合的に会合して活性なインテインを形成し、一続きのインテインがするのと本質的に同じやり方でスプライシング反応を触媒し得る。分裂インテインは天然に見出され、実験室でもまた操作されている。本明細書において用いられる用語「分裂インテイン」は、1以上のペプチド結合切断がN末端及びC末端アミノ酸配列の間に存在するいずれかのインテインを指し、その結果、N末端及びC末端配列が別個の分子になり、これらは、トランススプライシング反応について機能的であるインテインへと非共有結合的に再会合又は再構成し得る。いずれかの触媒的に活性なインテイン又はそのフラグメントが、本発明の方法への使用のための分裂インテインを導出するために用いられてもよい。例えば、一側面において、分裂インテインは真核生物インテインに由来されてもよい。別の側面において、分裂インテインは細菌インテインに由来されてもよい。別の側面において、分裂インテインは古細菌インテインに由来されてもよい。好ましくは、そのように導出された分裂インテインは、トランススプライシング反応を触媒することにとって必須のアミノ酸配列のみを所有するであろう。

本明細書において用いられる「N末端分裂インテイン(In)」は、トランススプライシング反応について機能的であるN末端アミノ酸配列を含むいずれかのインテイン配列を指す。Inは、それゆえに、トランススプライシングが生起するときにスプライスアウトされる配列をもまた含む。Inは、天然に存在するインテイン配列のN末端部分の修飾である配列を含み得る。例えば、かかる追加の及び/又は変異した残基の包含がInをトランススプライシングにおいて非機能的にしない限り、Inは追加のアミノ酸残基及び/又は変異した残基を含み得る。好ましくは、追加の及び/又は変異した残基の包含は、Inのトランススプライシング活性を改善又は増強する。

本明細書において用いられる「C末端分裂インテイン(Ic)」は、トランススプライシング反応について機能的であるC末端アミノ酸配列を含むいずれかのインテイン配列を指す。一側面において、Icは一続きの4～7アミノ酸残基を含み、これらの少なくとも4アミノ酸はそれが由来されたインテイン最後のβ鎖からである。Icは、それゆえに、トランススプライシングが生起するときにスプライスアウトされる配列をもまた含む。Icは、天然に存在するインテイン配列のC末端部分の修飾である配列を含み得る。例えば、かかる追加の及び/又は変異した残基の包含がInをトランススプライシングにおいて非機能的にしない限り、Icは追加のアミノ酸残基及び/又は変異した残基を含み得る。好ましくは、追加の及び/又は変異した残基の包含は、Icのトランススプライシング活性を改善又は増強する。

本発明のいくつかの態様では、Ic又はInに連結されたペプチドは、とりわけ蛍光基、ビオチン、ポリエチレングリコール(PEG)、アミノ酸アナログ、非天然のアミノ酸、リン酸基、グリコシル基、放射性同位体標識、及び医薬分子を包含する追加の化学的部分を含み得る。他の態様において、Icに連結されたペプチドは、とりわけケトン、アルデヒド、Cys残基、及びLys残基を包含する1以上の化学反応性基を含み得る。「インテインスプライシングポリペプチド(ISP)」が存在するときには、分裂インテインのNインテイン及びCインテインは非共有結合的に会合して活性なインテインを形成し、スプライシング反応を触媒し得る。本明細書において用いられる「インテインスプライシングポリペプチド(ISP)」は、Ic、In、又は両方が分裂インテインから除去されるときに留まる分裂インテインのアミノ酸配列の部分を指す。ある態様において、InはISPを含む。別の態様では、IcはISPを含む。更に別の態様では、ISPはInにもIcにも共有結合的に連結されていない別個のペプチドである。

分裂インテインは、ミニインテインの構造上に見出される-12の保存されたベータ鎖間の構造化されていないループ又は介在アミノ酸配列中に1以上の分裂部位を操作することによって、一続きのインテインから作成されてもよい。分裂の作成が、タンパク質スプライシング活性が失われる十分な度合まではインテインの構造、特に構造化されたベータ鎖を遮断しないであろうという条件で、ベータ鎖間の領域内の分裂部位の位置のいくらかのフレキシビリティーが存在してもよい。

タンパク質トランススプライシングでは、1つの前駆体タンパク質はNインテインによって後続されるNエクステインパーツからなり、別の前駆体タンパク質はCエクステインパーツによって後続されるCインテインからなり、トランススプライシング反応(一緒にN及びCインテインによって触媒される)が2つのインテイン配列を切除、2つのエクステイン配列をペプチド結合によって連結する。酵素反応であるタンパク質トランススプライシングは、非常に低い(例としてマイクロモル)濃度のタンパク質で働き得、生理条件下において実行され得る。

例示の配列は次の通りである:

インテインは連続ドメインとして最も頻繁に見出されるが、いくつかは自然に分裂された形態で存在する。この場合、2つのフラグメントは別個のポリペプチドとして発現され、スプライシングが起こる前に会合しなければならない、いわゆるタンパク質トランススプライシングである。

例示的な分裂インテインは、2つのサブユニット、すなわちDnaE-N及びDnaE-Cを含むSsp DnaEインテインである。2つの異なるサブユニットは、DnaE-N及びDnaE-Cサブユニットを夫々コードする別々の遺伝子、すなわちdnaE-n及びdnaE-cによってコードされる。DnaEは、Synechocytis sp.PCC6803における天然に存在する分裂インテインであり、それぞれがDnaE-N又はDnaE-Cのいずれかとの融合物を含む2つの別個のタンパク質のトランススプライシングを指示することができる。

更なる天然に存在するか又は操作されたスプリットインテイン配列は、本明細書に記載の全インテイン配列又は当技術分野で利用可能なものから公知であるか、又は作製され得る。スプリットインテイン配列の例は、Stevens et al.,「A promiscuous split intein with expanded protein engineering applications,」PNAS,2017,Vol.114:8538-8543;Iwai et al.,「Highly efficient protein trans-splicing by a naturally split DnaE intein from Nostc punctiforme,FEBS Lett,580:1853-1858に見出され得、これらの各々は参照により本明細書に組み込まれる)。更なる分裂インテイン配列は、例えば、国際公開第2013/045632号、国際公開第2014/055782号、国際公開第2016/069774号、及び欧州特許第2877490号に見出され得、これらの各々の内容は参照により本明細書に組み込まれる。更に、トランスでのタンパク質スプライシングがin vivo及びin vitroで記載されており(Shingledecker,et al.,Gene 207:187(1998),Southworth,et al.,EMBO J.17:918(1998);Mills,et al.,Proc.Natl.Acad.Sci.USA,95:3543-3548(1998);Lew,et al.,J.Biol.Chem.,273:15887-15890(1998);Wu,et al.,Biochim.Biophys.Acta 35732:1(1998b),Yamazaki,et al.,J.Am.Chem.Soc.120:5591(1998),Evans,et al.,J.Biol.Chem.275:9091(2000);Otomo,et al.,Biochemistry 38:16040-16044(1999);Otomo,et al.,J.Biolmol.NMR 14:105-114(1999);Scott,et al.,Proc.Natl.Acad.Sci.USA 96:13638-13643(1999))、続いてライゲーションを受けて機能的産物を形成する2つの不活性断片に関するタンパク質を発現する機会を提供する。

RNA-タンパク質相互作用ドメイン
種々の態様において、2つの別個のタンパク質ドメイン(例として、Cas9ドメイン及びポリメラーゼドメイン)は、「RNA-タンパク質動員システム」、例えば「MS2タグ付け技術」を用いることによって、機能的な複合体(2つの別個のタンパク質ドメインを含む融合タンパク質の機能と同様)を形成するように互いに共局在させられてもよい。かかるシステムは、一般的には、1つのタンパク質ドメインを「RNA-タンパク質相互作用ドメイン」(「RNA-タンパク質動員ドメイン」としてもまた公知)によって、他をRNA-タンパク質相互作用ドメイン、例として特定のヘアピン構造を特異的に認識及び結合する「RNA結合タンパク質」によってタグ付けする。これらのタイプのシステムは、プライム編集因子のドメイン同士を共局在させるために及びUGIドメイン等の追加の機能性を多重フラッププライム編集因子に動員するために活用され得る。1つの例では、MS2タグ付け技術は、ファージのゲノム上に存在するステムループ又はヘアピン構造、すなわち「MS2ヘアピン」とのMS2バクテリオファージコートタンパク質(「MCP」又は「MS2cp」)の相互作用に基づく。MS2ヘアピンのケースでは、それはMS2バクテリオファージコートタンパク質(MCP)によって認識及び結合される。それゆえに、1つの例示的シナリオでは、デアミナーゼ-MS2融合体はCas9-MCP融合体を動員し得る。

RNA-タンパク質相互作用の他のモジュールドメインの総説は、当該技術分野において、例えば、Johansson et al.,「RNA recognition by the MS2 phage coat protein,」Sem Virol.,1997,Vol.8(3):176-185;Delebecque et al.,「Organization of intracellular reactions with rationally designed RNA assemblies,」Science,2011,Vol.333:470-474;Mali et al.,「Cas9 transcriptional activators for target specificity screening and paired nickases for cooperative genome engineering,」Nat.Biotechnol.,2013,Vol.31:833-838;及びZalatan et al.,「Engineering complex synthetic transcriptional programs with CRISPR RNA scaffolds,」Cell,2015,Vol.160:339-350(これら各々はその全体が参照されることによって本明細書に組み込まれる)において記載されている。他の系も、PCPタンパク質を特異的に動員するPP7ヘアピン、及びComタンパク質を特異的に動員する「com」ヘアピンを包含する。Zalatan et al.を参照。

MS2ヘアピン(すなわち、「MS2アプタマー」と呼ばれる)のヌクレオチド配列は以下:GCCAACATGAGGATCACCCATGTCTGCAGGGCC(配列番号166)である。
MCP又はMS2cpのアミノ酸配列は以下:GSASNFTQFVLVDNGGTGDVTVAPSNFANGVAEWISSNSRSQAYKVTCSVRQSSAQNRKYTIKVEVPKVATQTVGGEELPVAGWRSYLNMELTIPIFATNSDCELIVKAMQGLLKDGNPIPSAIAANSGIY(配列番号167)である。

E.UGIドメイン
他の態様では、本明細書に記載の方法及び組成物で利用されるプライム編集因子は、1つ以上のウラシルグリコシラーゼ阻害剤ドメインを含んでもよい。本明細書において用いられる用語「ウラシルグリコシラーゼ阻害剤(UGI)」又は「UGIドメイン」は、ウラシルDNAグリコシラーゼ塩基除去修復酵素を阻害することができるタンパク質を指す。いくつかの態様では、UGIドメインは、野生型UGI又は配列番号168で明示されるUGIを含む。いくつかの態様では、本明細書において提供されるUGIタンパク質は、UGIのフラグメント、及びUGI又はUGIフラグメントに対して相同的なタンパク質を包含する。例えば、いくつかの態様では、UGIドメインは、配列番号168で明示されるアミノ酸配列のフラグメントを含む。いくつかの態様では、UGIフラグメントは、配列番号168で明示されるアミノ酸配列の少なくとも60％、少なくとも65％、少なくとも70％、少なくとも75％、少なくとも80％、少なくとも85％、少なくとも90％、少なくとも95％、少なくとも96％、少なくとも97％、少なくとも98％、少なくとも99％、又は少なくとも99.5％を含むアミノ酸配列を含む。いくつかの態様では、UGIは、配列番号168で明示されるアミノ酸配列に対して相同的なアミノ酸配列、又は配列番号168で明示されるアミノ酸配列のフラグメントに対して相同的なアミノ酸配列を含む。いくつかの態様では、UGI若しくはUGIのフラグメント又はUGI若しくはUGIフラグメントのホモログを含むタンパク質は、「UGIバリアント」と呼ばれる。UGIバリアントはUGI又はそのフラグメントに対する相同性を共有する。例えば、UGIバリアントは、野生型UGI又は配列番号168で明示されるUGIと少なくとも70％同一、少なくとも75％同一、少なくとも80％同一、少なくとも85％同一、少なくとも90％同一、少なくとも95％同一、少なくとも96％同一、少なくとも97％同一、少なくとも98％同一、少なくとも99％同一、少なくとも99.5％同一、又は少なくとも99.9％同一である。いくつかの態様では、UGIバリアントは、フラグメントが野生型UGI又は配列番号168で明示されるUGIの対応するフラグメントと少なくとも70％同一、少なくとも80％同一、少なくとも90％同一、少なくとも95％同一、少なくとも96％同一、少なくとも97％同一、少なくとも98％同一、少なくとも99％同一、少なくとも99.5％同一、又は少なくとも99.9％であるようにして、UGIのフラグメントを含む。いくつかの態様では、UGIは次のアミノ酸配列を含む:
ウラシル-DNAグリコシラーゼ阻害剤:
＞sp｜P14739｜UNGI_BPPB2 MTNLSDIIEKETGKQLVIQESILMLPEEVEEVIGNKPESDILVHTAYDESTDENVMLLTSDAPEYKPWALVIQDSNGENKIKML(配列番号168).

本明細書に記載の方法及び組成物で利用されるプライム編集因子は1より多くのUGIドメインを含んでもよく、これらは本明細書に記載の1つ以上のリンカーによって分離されてもよい。

F.追加のPE要素
ある態様において、本明細書に記載の方法及び組成物で利用されるプライム編集因子は塩基修復の阻害剤を含んでもよい。用語「塩基修復の阻害剤」又は「IBR」は、核酸修復酵素、例えば塩基除去修復酵素の活性を阻害することができるタンパク質を指す。いくつかの態様では、IBRはOGG塩基除去修復の阻害剤である。いくつかの態様では、IBRは塩基除去修復の阻害剤(「iBER」)である。塩基除去修復の例示の阻害剤は、APE1、Endo III、Endo IV、Endo V、Endo VIII、Fpg、hOGG1、hNEIL1、T7 EndoI、T4PDG、UDG、hSMUG1、及びhAAGの阻害剤を包含する。いくつかの態様では、IBRはEndo V又はhAAGの阻害剤である。いくつかの態様では、IBRは、触媒的に不活性なグリコシラーゼ又は触媒的に不活性なジオキシゲナーゼ、又はオキシダーゼの低分子若しくはペプチド阻害剤、あるいはそれらのバリアントであってもよいiBERである。いくつかの態様では、IBRは、TDG阻害剤、MBD4阻害剤、又はAlkBH酵素の阻害剤であってもよいiBERである。いくつかの態様では、IBRは、触媒的に不活性なTDG又は触媒的に不活性なMBD4を含むiBERである。例示の触媒的に不活性なTDGは配列番号172(ヒトTDG)のN140A変異体である。

いくつかの例示のグリコシラーゼは下で提供される。これらのグリコシラーゼドメインのいずれかの触媒的に不活性化されたバリアントは、本開示で提供される方法及び組成物で利用されるプライム編集因子のnapDNAbp又はポリメラーゼドメインに融合されてもよいiBERである。

OGG(ヒト)
MPARALLPRRMGHRTLASTPALWASIPCPRSELRLDLVLPSGQSFRWREQSPAHWSGVLADQVWTLTQTEEQLHCTVYRGDKSQASRPTPDELEAVRKYFQLDVTLAQLYHHWGSVDSHFQEVAQKFQGVRLLRQDPIECLFSFICSSNNNIARITGMVERLCQAFGPRLIQLDDVTYHGFPSLQALAGPEVEAHLRKLGLGYRARYVSASARAILEEQGGLAWLQQLRESSYEEAHKALCILPGVGTKVADCICLMALDKPQAVPVDVHMWHIAQRDYSWHPTTSQAKGPSPQTNKELGNFFRSLWGPYAGWAQAVLFSADLRQSRHAQEPPAKRRKGSKGPEG(配列番号169)

MPG(ヒト)
MVTPALQMKKPKQFCRRMGQKKQRPARAGQPHSSSDAAQAPAEQPHSSSDAAQAPCPRERCLGPPTTPGPYRSIYFSSPKGHLTRLGLEFFDQPAVPLARAFLGQVLVRRLPNGTELRGRIVETEAYLGPEDEAAHSRGGRQTPRNRGMFMKPGTLYVYIIYGMYFCMNISSQGDGACVLLRALEPLEGLETMRQLRSTLRKGTASRVLKDRELCSGPSKLCQALAINKSFDQRDLAQDEAVWLERGPLEPSEPAVVAAARVGVGHAGEWARKPLRFYVRGSPWVSVVDRVAEQDTQA(配列番号170)

MBD4(ヒト)
MGTTGLESLSLGDRGAAPTVTSSERLVPDPPNDLRKEDVAMELERVGEDEEQMMIKRSSECNPLLQEPIASAQFGATAGTECRKSVPCGWERVVKQRLFGKTAGRFDVYFISPQGLKFRSKSSLANYLHKNGETSLKPEDFDFTVLSKRGIKSRYKDCSMAALTSHLQNQSNNSNWNLRTRSKCKKDVFMPPSSSSELQESRGLSNFTSTHLLLKEDEGVDDVNFRKVRKPKGKVTILKGIPIKKTKKGCRKSCSGFVQSDSKRESVCNKADAESEPVAQKSQLDRTVCISDAGACGETLSVTSEENSLVKKKERSLSSGSNFCSEQKTSGIINKFCSAKDSEHNEKYEDTFLESEEIGTKVEVVERKEHLHTDILKRGSEMDNNCSPTRKDFTGEKIFQEDTIPRTQIERRKTSLYFSSKYNKEALSPPRRKAFKKWTPPRSPFNLVQETLFHDPWKLLIATIFLNRTSGKMAIPVLWKFLEKYPSAEVARTADWRDVSELLKPLGLYDLRAKTIVKFSDEYLTKQWKYPIELHGIGKYGNDSYRIFCVNEWKQVHPEDHKLNKYHDWLWENHEKLSLS(配列番号171)
TDG(ヒト)
MEAENAGSYSLQQAQAFYTFPFQQLMAEAPNMAVVNEQQMPEEVPAPAPAQEPVQEAPKGRKRKPRTTEPKQPVEPKKPVESKKSGKSAKSKEKQEKITDTFKVKRKVDRFNGVSEAELLTKTLPDILTFNLDIVIIGINPGLMAAYKGHHYPGPGNHFWKCLFMSGLSEVQLNHMDDHTLPGKYGIGFTNMVERTTPGSKDLSSKEFREGGRILVQKLQKYQPRIAVFNGKCIYEIFSKEVFGVKVKNLEFGLQPHKIPDTETLCYVMPSSSARCAQFPRAQDKVHYYIKLKDLRDQLKGIERNMDVQEVQYTFDLQLAQEDAKKMAVKEEKYDPGYEAAYGGAYGENPCSSEPCGFSSNGLIESVELRGESAFSGIPNGQWMTQSFTDQIPSFSNHCGTQEQEEESHA(配列番号172)

いくつかの態様では、本明細書に記載の融合タンパク質は1以上の異種タンパク質ドメインを含んでもよい(例として、プライム編集因子構成要素に加えて、約又は約1、2、3、4、5、6、7、8、9、10以上の又はそれよりも多くのドメイン)。融合タンパク質は、いずれかの追加のタンパク質配列と、任意選択でいずれかの2つのドメイン間のリンカー配列とを含んでもよい。存在してもよい他の例示の特色は、局在配列、例えば細胞質局在配列、搬出配列、例えば核搬出配列、又は他の局在配列、及び融合タンパク質の可溶化、精製、又は検出に有用である配列タグである。

プライム編集因子又はその構成要素(例として、napDNAbpドメイン、ポリメラーゼドメイン、又はNLSドメイン)に融合されてもよいタンパク質ドメインの例は、限定なしに、エピトープタグ、及びレポーター遺伝子配列を包含する。エピトープタグの限定しない例はヒスチジン(His)タグ、V5タグ、FLAGタグ、インフルエンザヘマグルチニン(HA)タグ、Mycタグ、VSV-Gタグ、及びチオレドキシン(Trx)タグを包含する。レポーター遺伝子の例は、グルタチオン-5-トランスフェラーゼ(GST)、西洋ワサビペルオキシダーゼ(HRP)、クロラムフェニコールアセチルトランスフェラーゼ(CAT)、ベータガラクトシダーゼ、ベータグルクロニダーゼ、ルシフェラーゼ、緑色蛍光タンパク質(GFP)、HcRed、DsRed、シアン蛍光タンパク質(CFP)、黄色蛍光タンパク質(YFP)、及び青色蛍光タンパク質(BFP)を包含する自家蛍光タンパク質を包含するが、これらに限定されない。プライム編集因子は、DNA分子に結合又は他の細胞分子に結合するタンパク質又はタンパク質のフラグメントをコードする遺伝子配列に融合されてもよく、マルトース結合タンパク質(MBP)、Sタグ、Lex A DNA結合ドメイン(DBD)融合体、GAL4 DNA結合ドメイン融合体、及び単純ヘルペスウイルス(HSV)BP16タンパク質融合体を包含するがこれらに限定されない。プライム編集因子の一部を形成してもよい追加のドメインは2011年3月10日公開のUS特許公開No.2011/0059502に記載され、その全体が参照によって本明細書に組み込まれる。

本開示のある側面では、グルタチオン-5-トランスフェラーゼ(GST)、西洋ワサビペルオキシダーゼ(HRP)、クロラムフェニコールアセチルトランスフェラーゼ(CAT)ベータガラクトシダーゼ、ベータグルクロニダーゼ、ルシフェラーゼ、緑色蛍光タンパク質(GFP)、HcRed、DsRed、シアン蛍光タンパク質(CFP)、黄色蛍光タンパク質(YFP)、及び青色蛍光タンパク質(BFP)を包含する自家蛍光タンパク質を包含するがこれらに限定されないレポーター遺伝子が、遺伝子産物の発現の変改又は修飾を測定するためのマーカーとしての用をなす遺伝子産物をコードするように、細胞に導入されてもよい。本開示のある態様において、遺伝子産物はルシフェラーゼである。本開示の更なる態様では、遺伝子産物の発現は減少させられる。

本明細書において提供される好適なタンパク質タグは、ビオチンカルボキシラーゼキャリアタンパク質(BCCP)タグ、mycタグ、カルモジュリンタグ、FLAGタグ、ヘマグルチニン(HA)タグ、ヒスチジンタグ又はHisタグともまた呼ばれるポリヒスチジンタグ、マルトース結合タンパク質(MBP)タグ、nusタグ、グルタチオン-S-トランスフェラーゼ(GST)タグ、緑色蛍光タンパク質(GFP)タグ、チオレドキシンタグ、Sタグ、Softag(例として、Softag 1、Softag 3)、strepタグ、ビオチンリガーゼタグ、FlAsHタグ、V5タグ、及びSBPタグを包含するが、これらに限定されない。追加の好適な配列は当業者には明らかであろう。いくつかの態様では、融合タンパク質は1以上のHisタグを含む。

本開示のいくつかの態様では、PEシステムの発現される構成要素の滞留時間、量、及び/又は活性を調整することによって、プライム編集システムの活性は時間的に制御されてもよい。例えば、本明細書に記載のPEは、PEの細胞内半減期を改変することができるタンパク質ドメインと融合されてもよい。2以上のベクターを伴うある種の態様(例として、本明細書に記載の構成要素が2以上の別個のベクター上にコードされるベクターシステム)では、PEシステムの活性は、ベクターが送達されるタイミングをコントロールすることによって時間的に制御されてもよい。例えば、いくつかの態様では、鋳型をコードするベクターに先行して、ヌクレアーゼシステムをコードするベクターがPEを送達してもよい。他の態様において、PEシステムをコードするベクターに先行して、PEgRNAをコードするベクターはガイドを送達してもよい。いくつかの態様では、PEシステム及びPEgRNAをコードするベクターが同時に送達される。ある態様において、同時に送達されるベクターは、例としてPE、PEgRNA、及び/又は第2の鎖ガイドRNA構成要素を時間的に送達する。更なる態様では、ベクター上のコード配列から転写されるRNA(例として、例えばヌクレアーゼ転写物)は、更に、RNAの細胞内半減期を改変及び/又は翻訳コントロールを調節することができる少なくとも1つのエレメントを含んでもよい。いくつかの態様では、RNAの半減期は増大させられてもよい。いくつかの態様では、RNAの半減期は減少させられてもよい。いくつかの態様では、エレメントはRNAの安定性を増大させることができてもよい。いくつかの態様では、エレメントはRNAの安定性を減少させることができてもよい。いくつかの態様では、エレメントはRNAの3'UTR内にあってもよい。いくつかの態様では、エレメントはポリアデニル化シグナル(PA)を包含してもよい。いくつかの態様では、エレメントは、キャップ、例として上流のmRNA又はPEgRNA端を包含してもよい。いくつかの態様では、RNAはPAを含まなくてもよく、その結果、それは転写後に細胞内でより迅速な分解を受ける。いくつかの態様では、エレメントは少なくとも1つのAUリッチエレメント(ARE)を包含してもよい。組織型、細胞型、タイミング、細胞局在、及び環境に依存的である様式で、AREはARE結合タンパク質(ARE-BP)によって結合されてもよい。いくつかの態様では、不安定化エレメントがRNA崩壊を促進、RNA安定性に影響、又は翻訳を活性化してもよい。いくつかの態様では、AREは長さが50～150ヌクレオチドを含んでもよい。いくつかの態様では、AREは少なくとも1コピーの配列AUUUAを含んでもよい。いくつかの態様では、少なくとも1つのAREがRNAの3'UTRに追加されてもよい。いくつかの態様では、エレメントはウッドチャック肝炎ウイルス(WHP)であってもよい。

転写物からの発現を増強するための三次構造を作成する転写後制御エレメント(WPRE)。更なる態様では、エレメントは、転写物からの発現を増強することができる修飾及び/又は短縮されたWPRE配列であり、例えばZufferey et al.,J Virol,73(4):2886-92(1999)及びFlajolet et al.,J Virol,72(7):6175-80(1998)に記載されている通りである。いくつかの態様では、WPRE又は等価物はRNAの3'UTRに追加されてもよい。いくつかの態様では、エレメントは、高速で又は低速で崩壊する転写物どちらかに濃縮された他のRNA配列モチーフから選択されてもよい。
いくつかの態様では、PE又はPEgRNAをコードするベクターは、PEシステムによるベクター上に存在する標的配列の切断によって自己破壊されてもよい。切断はベクターからのPE又はPEgRNAの連続した転写を防止してもよい。転写は直線化されたベクター上において何らかの時間量にわたって生起してもよいが、細胞内分解を受ける発現された転写物又はタンパク質は、コードするベクターの発現からの連続した供給なしには、オフターゲット効果を生ずるためのより少ない時間を有するであろう。

PEgRNAs
本明細書中に記載される方法及び組成物において利用されるプライム編集システムは、任意の好適なPEgRNAの使用を意図する。

PEgRNAアーキテクチャ
いくつかの態様では、本明細書に開示される方法及び組成物で利用されるプライム編集システムで使用可能な伸長ガイドRNAによって、伝統的なガイドRNAは、約20ntのプロトスペーサ配列と、napDNAbpと結合するgRNAコア領域とを包含する。この態様において、ガイドRNAは、5'端にて伸長されたRNAセグメント、すなわち、5'伸長を包含する。この態様では、5'伸長は、逆転写鋳型配列、逆転写プライマー結合部位、及び任意選択の5～20ヌクレオチドリンカー配列を包含する。RTプライマー結合部位はニックの後に形成される遊離3'端とハイブリダイズし、Rループの非標的鎖に形成され、これによって5'-3'方向におけるDNA重合のために逆転写酵素をプライムする。

別の態様では、本明細書に開示される方法及び組成物で利用されるプライム編集システムで使用可能な伸長ガイドRNAによって、伝統的なガイドRNAは、約20ntのプロトスペーサ配列と、napDNAbpと結合するgRNAコアとを包含する。この態様において、ガイドRNAは、3'端にて伸長されたRNAセグメント、すなわち、3'伸長を包含する。この態様において、3'伸長は、逆転写鋳型配列及び逆転写プライマー結合部位を包含する。RTプライマー結合部位はニックの後に形成される遊離3'端とハイブリダイズし、Rループの非標的鎖に形成され、これによって5'-3'方向におけるDNA重合のために逆転写酵素をプライムする。

別の態様では、本明細書に開示される方法及び組成物で利用されるプライム編集システムで使用可能な伸長ガイドRNAによって、伝統的なガイドRNAは、約20ntのプロトスペーサ配列と、napDNAbpと結合するgRNAコアとを包含する。この態様において、ガイドRNAは、gRNAコア内の分子間のある位置にて伸長されたRNAセグメント、すなわち、分子内伸長を包含する。この態様において、分子内伸長は、逆転写鋳型配列及び逆転写プライマー結合部位を包含する。RTプライマー結合部位はニックの後に形成される遊離3'端とハイブリダイズし、Rループの非標的鎖に形成され、これによって5'-3'方向におけるDNA重合のために逆転写酵素をプライムする。

一態様において、分子内RNA伸長の位置は、ガイドRNAのプロトスペーサ配列中にはない。別の態様において、分子内RNA伸長の位置は、gRNAコア中にある。また別の態様において、分子内RNA伸長の位置は、プロトスペーサ配列内を除きガイドRNA分子内のどこにでも、又はプロトスペーサ配列を妨害しない位置にある。
一態様では、分子間RNA伸長は、プロトスペーサ配列の3'端の下流に挿入される。別の態様では、分子間RNA伸長は、プロトスペーサ配列の3'端の、少なくとも1ヌクレオチド、少なくとも2ヌクレオチド、少なくとも3ヌクレオチド、少なくとも4ヌクレオチド、少なくとも5ヌクレオチド、少なくとも6ヌクレオチド、少なくとも7ヌクレオチド、少なくとも8ヌクレオチド、少なくとも9ヌクレオチド、少なくとも10ヌクレオチド、少なくとも11ヌクレオチド、少なくとも12ヌクレオチド、少なくとも13ヌクレオチド、少なくとも14ヌクレオチド、少なくとも15ヌクレオチド、少なくとも16ヌクレオチド、少なくとも17ヌクレオチド、少なくとも18ヌクレオチド、少なくとも19ヌクレオチド、少なくとも20ヌクレオチド、少なくとも21ヌクレオチド、少なくとも22ヌクレオチド、少なくとも23ヌクレオチド、少なくとも24ヌクレオチド、少なくとも25ヌクレオチド下流に挿入される。

他の態様では、分子間RNA伸長は、gRNAに挿入され、Cas9タンパク質又はその等価物(すなわち、異なるnapDNAbp)と結合及び/又は相互作用する、tracrRNAに対応する又はtracrRNAを含むガイドRNAの部分を指す。好ましくは、分子間RNA伸長の挿入は、tracrRNA部分とnapDNAbpとの間の相互作用を破壊しないか、又は最小限に破壊する。

RNA伸長の長さ(少なくともRT鋳型及びプライマー結合部位を包含する、例として、図3を参照)は、任意の有用な長さであり得る。様々な態様において、RNA伸長は、少なくとも5ヌクレオチド、少なくとも6ヌクレオチド、少なくとも7ヌクレオチド、少なくとも8ヌクレオチド、少なくとも9ヌクレオチド、少なくとも10ヌクレオチド、少なくとも11ヌクレオチド、少なくとも12ヌクレオチド、少なくとも13ヌクレオチド、少なくとも14ヌクレオチド、少なくとも15ヌクレオチド、少なくとも16ヌクレオチド、少なくとも17ヌクレオチド、少なくとも18ヌクレオチド、少なくとも19ヌクレオチド、少なくとも20ヌクレオチド、少なくとも21ヌクレオチド、少なくとも22ヌクレオチド、少なくとも23ヌクレオチド、少なくとも24ヌクレオチド、少なくとも25ヌクレオチド、少なくとも30ヌクレオチド、少なくとも40ヌクレオチド、少なくとも50ヌクレオチド、少なくとも60ヌクレオチド、少なくとも70ヌクレオチド、少なくとも80ヌクレオチド、少なくとも90ヌクレオチド、少なくとも100ヌクレオチド、少なくとも200ヌクレオチド、少なくとも300ヌクレオチド、少なくとも400ヌクレオチド、又は少なくとも500ヌクレオチド長である。

RT鋳型配列はまた、任意の適切な長さであり得る。例えば、RT鋳型配列は、少なくとも3ヌクレオチド、少なくとも4ヌクレオチド、少なくとも5ヌクレオチド、少なくとも6ヌクレオチド、少なくとも7ヌクレオチド、少なくとも8ヌクレオチド、少なくとも9ヌクレオチド、少なくとも10ヌクレオチド、少なくとも11ヌクレオチド、少なくとも12ヌクレオチド、少なくとも13ヌクレオチド、少なくとも14ヌクレオチド、少なくとも15ヌクレオチド、少なくとも16ヌクレオチド、少なくとも17ヌクレオチド、少なくとも18ヌクレオチド、少なくとも19ヌクレオチド、少なくとも20ヌクレオチド、少なくとも30ヌクレオチド、少なくとも40ヌクレオチド、少なくとも50ヌクレオチド、少なくとも60ヌクレオチド、少なくとも70ヌクレオチド、少なくとも80ヌクレオチド、少なくとも90ヌクレオチド、少なくとも100ヌクレオチド、少なくとも200ヌクレオチド、少なくとも300ヌクレオチド、少なくとも400ヌクレオチド、または少なくとも500ヌクレオチド長であり得る。

更に他の態様において、逆転写プライマー結合部位配列は、少なくとも3ヌクレオチド、少なくとも4ヌクレオチド、少なくとも5ヌクレオチド、少なくとも6ヌクレオチド、少なくとも7ヌクレオチド、少なくとも8ヌクレオチド、少なくとも9ヌクレオチド、少なくとも10ヌクレオチド、少なくとも11ヌクレオチド、少なくとも12ヌクレオチド、少なくとも13ヌクレオチド、少なくとも14ヌクレオチド、少なくとも15ヌクレオチド、少なくとも16ヌクレオチド、少なくとも17ヌクレオチド、少なくとも18ヌクレオチド、少なくとも19ヌクレオチド、少なくとも20ヌクレオチド、少なくとも30ヌクレオチド、少なくとも40ヌクレオチド、少なくとも50ヌクレオチド、少なくとも60ヌクレオチド、少なくとも70ヌクレオチド、少なくとも80ヌクレオチド、少なくとも90ヌクレオチド、少なくとも100ヌクレオチド、少なくとも200ヌクレオチド、少なくとも300ヌクレオチド、少なくとも400ヌクレオチド、または少なくとも500ヌクレオチド長である。

他の態様では、任意選択のリンカー又はスペーサ配列は、少なくとも3ヌクレオチド、少なくとも4ヌクレオチド、少なくとも5ヌクレオチド、少なくとも6ヌクレオチド、少なくとも7ヌクレオチド、少なくとも8ヌクレオチド、少なくとも9ヌクレオチド、少なくとも10ヌクレオチド、少なくとも11ヌクレオチド、少なくとも12ヌクレオチド、少なくとも13ヌクレオチド、少なくとも14ヌクレオチド、少なくとも15ヌクレオチド、少なくとも16ヌクレオチド、少なくとも17ヌクレオチド、少なくとも18ヌクレオチド、少なくとも19ヌクレオチド、少なくとも20ヌクレオチド、少なくとも30ヌクレオチド、少なくとも40ヌクレオチド、少なくとも50ヌクレオチド、少なくとも60ヌクレオチド、少なくとも70ヌクレオチド、少なくとも80ヌクレオチド、少なくとも90ヌクレオチド、少なくとも100ヌクレオチド、少なくとも200ヌクレオチド、少なくとも300ヌクレオチド、少なくとも400ヌクレオチド、または少なくとも500ヌクレオチド長である。

RT鋳型配列は、ある態様において、単鎖DNA分子をコードするが、これは、非標的鎖と相同である(よって、標的鎖の対応する部位に相補的である)が1以上のヌクレオチド変化を包含する。少なくとも1ヌクレオチド変化は、1以上の単一塩基ヌクレオチド変化、1以上の欠失、及び1以上の挿入を包含していてもよい。

RT鋳型配列の合成された単鎖DNA産物は、非標的鎖と相同であって、1つ以上のヌクレオチド変化を含有する。RT鋳型配列の単鎖DNA産物は、平衡状態で、相補的な標的鎖配列とハイブリダイズし、これによって相同の内因性標的鎖配列に取って代わる。取って代わられた内因性の鎖は、いくつかの態様において、5'内因性DNAフラップ種として言及されてもよい。この5'内因性DNAフラップ種は、5'フラップエンドヌクレアーゼ(例として、FEN1)によって除去され得、単鎖DNA産物は、今や内因性標的鎖とハイブリダイズされており、ライゲートされて内因性配列と新しく合成された鎖との間にミスマッチを作成してもよい。ミスマッチは、細胞固有のDNA修復及び/又は複製プロセスによって分解されてもよい。

様々な態様において、RT鋳型配列のヌクレオチド配列は、5'フラップ種と取って代わられ、且つ編集されるべき部位と重複する、非標的鎖のヌクレオチド配列に対応する。

伸長ガイドRNAの様々な態様において、逆転写鋳型配列は、ニック部位に隣接する内因性DNA配列に相補的な単鎖DNAフラップをコードしていてもよく、ここで単鎖DNAフラップは、所望のヌクレオチド変化を含む。単鎖DNAフラップは、ニック部位にて内因性単鎖DNAに取って代わってもよい。ニック部位にて取って代わられた内因性単鎖DNAは、5'端を有し、内因性フラップを形成し得るが、これは細胞によって切除され得る。様々な態様において、5'端内因性フラップを除去することが、単鎖3'DNAフラップの、対応する相補的なDNA鎖とのハイブリダイゼーション、及び単鎖3'DNAフラップが持つ所望のヌクレオチド変化の標的DNA中への組み込み又は同化を促すため、5'端内因性フラップの切除は、産物形成を推進するのに役立ち得る。

伸長ガイドRNAの様々な態様において、単鎖DNAフラップの細胞修復は、所望のヌクレオチド変化のインストールをもたらし、これによって所望の産物を形成する。

なお他の態様において、所望のヌクレオチド変化は、ニック部位の約-5～＋5の間、又はニック部位の約-10～＋10の間、又はニック部位の約-20～＋20の間、又はニック部位の約-30～＋30の間、又はニック部位の約-40～＋40の間、又はニック部位の約-50～＋50の間、又はニック部位の約-60～＋60の間、又はニック部位の約-70～＋70の間、又はニック部位の約-80～＋80の間、又はニック部位の約-90～＋90の間、又はニック部位の約-100～＋100の間、又はニック部位の約-200～＋200の間である編集窓上に組み入れされる。

他の態様では、所望のヌクレオチド変化は、ニック部位から約＋1～＋2、又はニック部位から約＋1～＋3、＋1～＋4、＋1～＋5、＋1～＋6、＋1～＋7、＋1～＋8、＋1～＋9、＋1～＋10、＋1～＋11、＋1～＋12、＋1～＋13、＋1～＋14、＋1～＋15、＋1～＋16、＋1～＋17、＋1～＋18、＋1～＋19、＋1～＋20、＋1～＋21、＋1～＋22、＋1～＋23、＋1～＋24、＋1～＋25、＋1～＋26、＋1～＋27、＋1～＋28、＋1～＋29、＋1～＋30、＋1～＋31、＋1～＋32、＋1～＋33、＋1～＋34、＋1～＋35、＋1～＋36、＋1～＋37、＋1～＋38、＋1～＋39、＋1～＋40、＋1～＋41、＋1～＋42、＋1～＋43、＋1～＋44、＋1～＋45、＋1～＋46、＋1～＋47、＋1～＋48、＋1～＋49、＋1～＋50、＋1～＋51、＋1～＋52、＋1～＋53、＋1～＋54、＋1～＋55、＋1～＋56、＋1～＋57、＋1～＋58、＋1～＋59、＋1～＋60、＋1～＋61、＋1～＋62、＋1～＋63、＋1～＋64、＋1～＋65、＋1～＋66、＋1～＋67、＋1～＋68、＋1～＋69、＋1～＋70、＋1～＋71、＋1～＋72、＋1～＋73、＋1～＋74、＋1～＋75、＋1～＋76、＋1～＋77、＋1～＋78、＋1～＋79、＋1～＋80、＋1～＋81、＋1～＋82、＋1～＋83、＋1～＋84、＋1～＋85、＋1～＋86、＋1～＋87、＋1～＋88、＋1～＋89、＋1～＋90、＋1～＋90、＋1～＋91、＋1～＋92、＋1～＋93、＋1～＋94、＋1～＋95、＋1～＋96、＋1～＋97、＋1～＋98、＋1～＋99、＋1～＋100、＋1～＋101、＋1～＋102、＋1～＋103、＋1～＋104、＋1～＋105、＋1～＋106、＋1～＋107、＋1～＋108、＋1～＋109、＋1～＋110、＋1～＋111、＋1～＋112、＋1～＋113、＋1～＋114、＋1～＋115、＋1～＋116、＋1～＋117、＋1～＋118、＋1～＋119、＋1～＋120、＋1～＋121、＋1～＋122、＋1～＋123、＋1～＋124、又は＋1～＋125の編集ウインドウに組み入れされる。

更に他の態様では、所望のヌクレオチド変化は、ニック部位から約＋1～＋2、又はニック部位から約＋1～＋5、＋1～＋10、＋1～＋15、＋1～＋20、＋1～＋25、＋1～＋30、＋1～＋35、＋1～＋40、＋1～＋45、＋1～＋50、＋1～＋55、＋1～＋100、＋1～＋105、＋1～＋110、＋1～＋115、＋1～＋120、＋1～＋125、＋1～＋130、＋1～＋135、＋1～＋140、＋1～＋145、＋1～＋150、＋1～＋155、＋1～＋160、＋1～＋165、＋1～＋170、＋1～＋175、＋1～＋180、＋1～＋185、＋1～＋190、＋1～＋195、又は＋1～＋200の編集ウインドウに組み入れされる。

様々な側面において、伸長ガイドRNAは、ガイドRNAの修飾バージョンである。ガイドRNAは、天然に存在しても、コードする核酸から発現されても、又は化学的に合成されてもよい。着目するゲノムの標的部位の標的鎖と相互作用してハイブリダイズするプロトスペーサ配列を包含する、ガイドRNAを入手又はそうでなければ合成するための方法、及びガイドRNAの適切な配列を決定するための方法は、当該技術分野において周知である。

様々な態様において、ガイドRNA配列の具体的な設計側面は、PAM配列の場所、標的配列中のパーセントG/C含量、マイクロ相同領域の程度、2次構造等々等の他の因子の中でも、着目するゲノム標的部位のヌクレオチド配列(すなわち、編集されるべき所望の部位)と、本明細書に記載の方法及び組成物で利用されるプライム編集システムに存在するnapDNAbpの型(例として、Cas9タンパク質)とに依存するであろう。

一般に、ガイド配列は、標的ポリヌクレオチド配列との十分な相補性を有するいずれのポリヌクレオチド配列であって、標的配列とハイブリダイズし、および、napDNAbp(例として、Cas9、Cas9ホモログ、又はCas9バリアント)の標的配列への配列特異的結合を指示するものである。いくつかの態様において、ガイド配列とその対応する標的配列との間の相補性の程度は、好適な整列(alignment)アルゴリズムを使用して最適に整列されたとき、約50％、60％、75％、80％、85％、90％、95％、97.5％、99％以上、又はこれらより高い。最適な整列は、配列を整列させるためのいずれか好適なアルゴリズムの使用で決定されてもよく、アルゴリズムの非限定例は、Smith-Watermanアルゴリズム、Needleman-Wunschアルゴリズム、Burrows-Wheeler Transform(例として、Burrows Wheeler Aligner)、ClustalW、Clustal X、BLAT、Novoalign(Novocraft Technologies)、ELAND(Illumina,San Diego,Calif.)、SOAP(soap.genomics.org.cnにて利用可能)、及びMaq(maq.sourceforge.netにて利用可能)に基づくアルゴリズムを包含する。いくつかの態様において、ガイド配列は、長さが約5、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、35、40、45、50、75ヌクレオチド以上であるか、又はこれらより長い。

いくつかの態様において、ガイド配列は、長さが約75、50、45、40、35、30、25、20、15、12ヌクレオチド未満であるか、又はこれらより短い。ガイド配列の、プライム編集因子の標的配列への配列特異的結合を指示する能力は、いずれの好適なアッセイによっても査定されてもよい。例えば、プライム編集因子の構成要素(試験されるべきガイド配列を包含する)は、本明細書に開示のプライム編集因子の構成要素をコードするベクターでのトランスフェクション、これに続く、本明細書に記載の通りのSurveyorアッセイ等による標的配列内の優先的な切断の査定等によって、対応する標的配列を有する宿主細胞へ提供されてもよい。同様に、標的ポリヌクレオチド配列の切断は試験管中、標的配列、プライム編集因子の構成要素(試験されるべきガイド配列を包含する)、及び試験ガイド配列とは異なる制御ガイド配列を提供すること、並びに試験ガイド配列と及び制御ガイド配列との間の反応の、標的配列での結合又は切断率を比較することによって、評価されてもよい。他のアッセイもなし得、当業者に思い当たるものであろう。

ガイド配列は、いずれの標的配列をも標的にするのに選択されてもよい。いくつかの態様において、標的配列は、細胞のゲノム内の配列である。例示の標的配列は、標的ゲノム中にユニークな配列を包含する。例えば、S.pyogenes Cas9について、ゲノム中のユニークな標的配列は、形態MMMMMMMMNNNNNNNNNNNNXGG(配列番号173)のCas9標的部位を包含していてもよく、ここでNNNNNNNNNNNNXGG(配列番号174)(Nは、A、G、T、又はCである;及びXは、何でもあり得る)。ゲノム中のユニークな標的配列は、形態MMMMMMMMMNNNNNNNNNNNXGG(配列番号175)のS.pyogenes Cas9標的部位を包含していてもよく、ここでNNNNNNNNNNNXGG(配列番号176)(Nは、A、G、T、又はCである;及びXは、何でもあり得る)。S.thermophilus CRISPR1Cas9について、ゲノム中のユニークな標的配列は、形態MMMMMMMMNNNNNNNNNNNNXXAGAAW(配列番号177)のCas9標的部位を包含していてもよく、ここでNNNNNNNNNNNNXXAGAAW(配列番号178)(Nは、A、G、T、又はCである;Xは、何でもあり得る;及びWは、A又はTである)。ゲノム中のユニークな標的配列は、形態MMMMMMMMMNNNNNNNNNNNXXAGAAW(配列番号179)のS.thermophilus CRISPR1 Cas9標的部位を包含していてもよく、ここでNNNNNNNNNNNXXAGAAW(配列番号180)(Nは、A、G、T、又はCである;Xは、何でもあり得る;及びWは、A又はTである)。S.pyogenes Cas9について、ゲノム中のユニークな標的配列は、形態MMMMMMMMNNNNNNNNNNNNXGGXG(配列番号181)のCas9標的部位を包含していてもよく、ここでNNNNNNNNNNNNXGGXG(配列番号182)(Nは、A、G、T、又はCである;及びXは、何でもあり得る)。ゲノム中のユニークな標的配列は、形態MMMMMMMMMNNNNNNNNNNNXGGXG(配列番号183)のS.pyogenes Cas9標的部位を包含していてもよく、ここでNNNNNNNNNNNXGGXG(配列番号184)(Nは、A、G、T、又はC;及びXは、何でもあり得る)。これらの配列の各々において、「M」は、A、G、T、又はCであってもよく、配列をユニークなものとして同定する際に考慮される必要はない。

いくつかの態様において、ガイド配列は、ガイド配列内の2次構造の程度を低減するよう選択される。2次構造は、いずれの好適なポリヌクレオチド折り畳みアルゴリズムによっても決定されてもよい。いくつかのプログラムは、最小限のギブス(Gibbs)自由エネルギーを算出することに基づく。かかるアルゴリズムの1つの例は、Zuker及びStiegler(Nucleic Acids Res.9(1981),133-148)によって記載される通りの、mFoldである。別の例の折り畳みアルゴリズムは、重心構造予測アルゴリズムを使用する、ウィーン大学(University of Vienna)の理論化学研究所(Institute for Theoretical Chemistry)にて開発された、オンラインウェブサーバRNAfoldである(例として、A.R.Gruber et al.,2008,Cell 106(1):23-24;and PA Carr and GM Church,2009,Nature Biotechnology 27(12):1151-62を参照)。更なるアルゴリズムは、米国出願第61/836,080号;Broad参照BI-2013/004A)に見出されるものであってもよい(参照により本明細書に組み込まれる)。

一般的に、tracrメイト配列は:(1)対応するtracr配列を含有する細胞におけるtracrメイト配列によってフランキングされるガイド配列の切除;及び(2)標的配列における複合体の形成の1以上を促進するために、tracr配列との十分な相補性を有するいずれかの配列を包含し、複合体は、tracr配列にハイブリダイズしたtracrメイト配列を含む。一般的に、相補性の度合は、2つの配列の短い方の長さに沿って、tracrメイト配列及びtracr配列の最適な整列の参照によってである。最適な整列は、いずれの好適な整列アルゴリズムによっても決定されてもよく、更にtracr配列又はtracrメイト配列のいずれかの配列内に自己相補性等の2次構造を構成していてもよい。いくつかの態様において、tracr配列とtracrメイト配列との間の相補性の程度は、その2つのより短い長さに沿って最適に整列されたとき、約25％、30％、40％、50％、60％、70％、80％、90％、95％、97.5％、99％以上、又はこれらより高い。いくつかの態様において、tracr配列は、長さが約5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、25、30、40、50ヌクレオチド以上、又はこれらより長い。いくつかの態様において、tracr配列及びtracrメイト配列は、その2つの間のハイブリダイゼーションがヘアピン等の2次構造を有する転写産物を産生するように、単一転写産物内に含有される。ヘアピン構造における使用のための好ましいループ形成配列は、長さが4ヌクレオチドであり、最も好ましくは配列GAAAを有する。しかしながら、より長い又はより短いループ配列も、代替の配列になり得るよう(as may alternative sequences)使用されてもよい。配列は、好ましくは、ヌクレオチドトリプレット(例えば、AAA)、及び追加のヌクレオチド(例えばC又はG)を包含する。ループ形成配列の例は、CAAA及びAAAGを包含する。本発明の態様において、転写産物又は転写されたポリヌクレオチド配列は、少なくとも2つの、又はそれより多くのヘアピンを有する。好ましい一態様において、転写産物は、2、3、4又は5つのヘアピンを有する。本発明の更なる態様において、転写産物は、最大でも5つのヘアピンを有する。いくつかの態様において、単一の転写産物は更に、転写終止配列を包含する;好ましくは、これは、ポリT配列、例えば6つのTヌクレオチドを包含する。ガイド配列、tracr mate配列及びtracr配列を含む単一ポリヌクレオチドの更なる非限定的な例は、以下の通りであり(5'から3'に列挙)、式中、「N」はガイド配列の塩基を表し、小文字の第1のブロックはtracr mate配列を表し、小文字の第2のブロックはtracr配列を表し、最終ポリT配列は転写ターミネータを表す:
(1)NNNNNNNNGTTTTTGTACTCTCAAGATTTAGAAATAAATCTTGCAGAAGCTACAAAGATAAGGCTTCATGCCGAAATCAACACCCTGTCATTTTATGGCAGGGTGTTTTCGTTATTTAATTTTTT(配列番号185);
(2)NNNNNNNNNNNNNNNNNNGTTTTTGTACTCTCAGAAATGCAGAAGCTACAAAGATAAGGCTTCATGCCGAAATCAACACCCTGTCATTTTATGGCAGGGTGTTTTCGTTATTTAATTTTTT(配列番号186);
(3)NNNNNNNNNNNNNNNNNNNNGTTTTTGTACTCTCAGAAATGCAGAAGCTACAAAGATAAGGCTTCATGCCGAAATCAACACCCTGTCATTTTATGGCAGGGTGTTTTTT(配列番号187);
(4)NNNNNNNNNNNNNNNNNNNNGTTTTAGAGCTAGAAATAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGCACCGAGTCGGTGCTTTTTT(配列番号188);
(5)NNNNNNNNNNNNNNNNNNNNGTTTTAGAGCTAGAAATAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGTTTTTTT(配列番号189);及び
(6)NNNNNNNNNNNNNNNNNNNNGTTTTAGAGCTAGAAATAGCAAGTTAAAATAAGGCTAGTCCGTTATCATTTTTTTT(配列番号190)。

いくつかの態様において、配列(1)～(3)は、S.thermophilus CRISPR1からのCas9と組み合わせて使用される。いくつかの態様において、配列(4)～(6)は、S.pyogenesからのCas9と組み合わせて使用される。いくつかの態様において、tracr配列は、tracrメイト配列を含む転写産物とは別々の転写産物である。

Cas9ドメインと単鎖DNA結合タンパク質とを含む本明細書に開示の通りの融合タンパク質のいずれも、標的部位(例として、編集されるべき点突然変異を含む部位)に対して、標的にさせるために、典型的には、融合タンパク質をガイドRNA(例として、sgRNA)と一緒に共発現させることが必要であることは、当業者には明らかであろう。本明細書中、他のどこかでより詳細に説明される通り、ガイドRNAは、典型的には、Cas9結合を可能にさせるtracrRNAフレームワークと、配列特異性をCas9:核酸編集酵素/ドメイン融合タンパク質へ付与するガイド配列とを含む。

いくつかの態様において、ガイドRNAは、構造5'-［ガイド配列］-GUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUU-3'(配列番号191)を含み、ここでガイド配列は、標的配列に相補的な配列を含む。ガイド配列は、典型的には20ヌクレオチド長である。Cas9:核酸編集酵素/ドメイン融合タンパク質を特定のゲノム標的部位に対して標的にさせるための好適なガイドRNAの配列は、本開示に基づき当業者に明らかであろう。かかる好適なガイドRNA配列は、典型的には、編集されるべき標的ヌクレオチドから50ヌクレオチド以内上流又は下流の核酸配列に相補的なガイド配列を含む。提供される融合タンパク質に、特定の標的配列を標的にさせるのに好適ないくつかの例示のガイドRNA配列は、本明細書に提供される。追加のガイド配列は、当該技術分野において周知であり、本明細書に記載の方法及び組成物で利用されるプライム編集因子とともに使用され得る。

いくつかの態様では、PEgRNAは、5'から3'方向に並べられた3つの主要な構成要素、すなわち、スペーサ、gRNAコア、及び3'端の伸長アームを含む。伸長アームは、5'から3'方向の以下の構造要素、すなわち相同アーム、編集テンプレート、及びプライマー結合部位に更に分割されてもよい。更に、PEgRNAは、任意選択の3'端修飾領域(e1)及び任意選択の5'端修飾領域(e2)を含んでもよい。更に、PEgRNAは、PEgRNAの3'端に転写終結シグナルを含んでもよい(図示せず)。これらの構造要素は、本明細書で更に定義される。PEgRNAの構造の描写は、限定することを意味されるものではなく、要素の配置のバリエーションを受け入れる。例えば、任意選択の配列修飾因子(e1)及び(e2)は、3'端及び5'端に位置することに限定されず、示されている他の領域のいずれかの中又は間に配置され得る。

いくつかの態様では、PEgRNAは、本明細書で企図され、実施例2で定義された方法に従って設計されてもよい。PEgRNAは、5'から3'方向に並べられた3つの主要な構成要素、すなわち、スペーサ、gRNAコア、及び3'端の伸長アームを含む。伸長アームは、5'から3'方向の以下の構造要素、すなわち相同アーム、編集テンプレート、及びプライマー結合部位に更に分割されてもよい。更に、PEgRNAは、任意選択の3'端修飾領域(e1)及び任意選択の5'端修飾領域(e2)を含んでもよい。更に、PEgRNAは、PEgRNAの3'端上に転写終結シグナルを含んでもよい(図示せず)。これらの構造要素は、本明細書で更に定義される。PEgRNAの構造の描写は、限定することを意味されるものではなく、要素の配置のバリエーションを受け入れる。例えば、任意選択の配列修飾因子(e1)及び(e2)は、3'端及び5'端に位置することに限定されず、示されている他の領域のいずれかの中又は間に配置され得る。

PEgRNAの改善
PEgRNAはまた、PEgRNAの特性及び/又は特徴を修飾してもよく、それによってプライム編集の有効性を改善する追加の設計改善を包含してもよい。様々な態様において、これらの改善は、(1)面倒な配列要件なしにより長いPEgRNAの発現を可能にする、非ポリメラーゼIII(pol III)プロモータからの機能性PEgRNAの効率的な発現を可能にする設計;(2)有効性を改善し得るコア、Cas9結合PEgRNA足場に対する改善;(3)RTプロセス性を改善し、標的ゲノム遺伝子座でのより長い配列の挿入を可能にするためのPEgRNAへの修飾;(4)PEgRNAの安定性を改善し、RTプロセス性を増強し、PEgRNAのミスフォールディングを防止し、又はゲノム編集に重要な更なる因子を動員するRNAモチーフの、PEgRNAの5'又は3'端への付加を包含するがこれらに限定されない、多数の異なるカテゴリーの1つ以上に属してもよい。

一態様では、PEgRNAは、より大きな伸長アームを有するより長いPEgRNAの発現を改善するために、polIIIプロモータを用いて設計され得た。sgRNAは、典型的には、U6 snRNAプロモータから発現される。このプロモータは、pol IIIを動員して関連するRNAを発現させ、核内に保持される短いRNAの発現に有用である。しかし、pol IIIは高度にプロセッシブではなく、効率的なゲノム編集に必要なレベルで数百ヌクレオチド長よりも長いRNAを発現することができない。更に、pol IIIは、Uのストレッチで失速又は終結し得、PEgRNAを使用して挿入され得た配列多様性を潜在的に制限する。ポリメラーゼII(pCMV等)又はポリメラーゼI(U1 snRNAプロモータ等)を動員する他のプロモータは、より長いsgRNAを発現する能力について調べられている。しかしながら、これらのプロモータは、典型的には部分的に転写され、発現されたPEgRNA中のスペーサの余分な配列5'をもたらし、これにより、部位依存的にCas9:sgRNA活性が著しく低下することが示されている。更に、pol III転写されたPEgRNAは、6～7Uの連続で単純に終結し得るが、pol II又はpol Iから転写されたPEgRNAは、異なる終結シグナルを必要とするであろう。多くの場合、そのようなシグナルはまた、核からPEgRNAの望ましくない輸送をもたらすポリアデニル化をもたらす。同様に、pCMV等のpol IIプロモータから発現されるRNAは、典型的には5'キャップされ、その核外輸送ももたらす。

以前に、Rinn及び共同研究者らは、長鎖非コードRNA-(lncRNA)タグ付きsgRNAの産生のために様々な発現プラットフォームをスクリーニングした¹⁸³。これらのプラットフォームは、pCMVから発現され、ヒト由来のMALAT1 ncRNA由来のENEエレメント¹⁸⁴、KSHV由来のPAN ENEエレメント¹⁸⁵、又はU1 snRNA由来の3'ボックス¹⁸⁶で終結するRNAを包含する。注意すべきことに、MALAT1 ncRNA及びPAN ENEは、ポリAテールを保護する三重らせんを形成する^184,187。これらの構築物はまた、RNA安定性を高め得た。これらの発現系は、より長いPEgRNAの発現も可能にすることが企図される。

更に、PEgRNAの一部として転写されることになるpol IIプロモータの部分を切断するための一連の方法が設計されており、ハンマーヘッド¹⁸⁸、ピストル¹⁸⁹、ハチェット¹⁸⁹、ヘアピン¹⁹⁰、VS¹⁹¹、ツイスター¹⁹²、若しくはツイスターシスター¹⁹²リボザイム等の自己切断リボザイム、又は転写されたガイドを処理するための他の自己切断要素、又はCsy4¹⁹³によって認識され、ガイドの処理にもつながるヘアピンのいずれかを付加する。また、KSHV PAN RNA及びエレメントについて以前に実証されたように、複数のENEモチーフの組み込みがPEgRNA発現及び安定性の改善をもたらし得ると仮定される¹⁸⁵。環状イントロンRNA(ciRNA)の形態のPEgRNAを環状化することはまた、RNA発現及び安定性の増強並びに核局在化をもたらし得ることも予想される¹⁹⁴。様々な態様では、PEgRNAは、以下の配列によって例示されるように、様々な上記要素を包含してもよい。

非限定的実施例1-pCMV、Csy4ヘアピン、PEgRNA及びMALAT1 ENEからなるPEgRNA発現プラットフォーム
TAGTTATTAATAGTAATCAATTACGGGGTCATTAGTTCATAGCCCATATATGGAGTTCCGCGTTACATAACTTACGGTAAATGGCCCGCCTGGCTGACCGCCCAACGACCCCCGCCCATTGACGTCAATAATGACGTATGTTCCCATAGTAACGCCAATAGGGACTTTCCATTGACGTCAATGGGTGGAGTATTTACGGTAAACTGCCCACTTGGCAGTACATCAAGTGTATCATATGCCAAGTACGCCCCCTATTGACGTCAATGACGGTAAATGGCCCGCCTGGCATTATGCCCAGTACATGACCTTATGGGACTTTCCTACTTGGCAGTACATCTACGTATTAGTCATCGCTATTACCATGGTGATGCGGTTTTGGCAGTACATCAATGGGCGTGGATAGCGGTTTGACTCACGGGGATTTCCAAGTCTCCACCCCATTGACGTCAATGGGAGTTTGTTTTGGCACCAAAATCAACGGGACTTTCCAAAATGTCGTAACAACTCCGCCCCATTGACGCAAATGGGCGGTAGGCGTGTACGGTGGGAGGTCTATATAAGCAGAGCTGGTTTAGTGAACCGTCAGATCGTTCACTGCCGTATAGGCAGGGCCCAGACTGAGCACGTGAGTTTTAGAGCTAGAAATAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGGACCGAGTCGGTCCTCTGCCATCAAAGCGTGCTCAGTCTGTTTTAGGGTCATGAAGGTTTTTCTTTTCCTGAGAAAACAACACGTATTGTTTTCTCAGGTTTTGCTTTTTGGCCTTTTTCTAGCTTAAAAAAAAAAAAAGCAAAAGATGCTGGTGGTTGGCACTCCTGGTTTCCAGGACGGGGTTCAAATCCCTGCGGCGTCTTTGCTTTGACT(配列番号192)

非限定的実施例2-pCMV、Csy4ヘアピン、PEgRNA及びPAN ENEからなるPEgRNA発現プラットフォーム
TAGTTATTAATAGTAATCAATTACGGGGTCATTAGTTCATAGCCCATATATGGAGTTCCGCGTTACATAACTTACGGTAAATGGCCCGCCTGGCTGACCGCCCAACGACCCCCGCCCATTGACGTCAATAATGACGTATGTTCCCATAGTAACGCCAATAGGGACTTTCCATTGACGTCAATGGGTGGAGTATTTACGGTAAACTGCCCACTTGGCAGTACATCAAGTGTATCATATGCCAAGTACGCCCCCTATTGACGTCAATGACGGTAAATGGCCCGCCTGGCATTATGCCCAGTACATGACCTTATGGGACTTTCCTACTTGGCAGTACATCTACGTATTAGTCATCGCTATTACCATGGTGATGCGGTTTTGGCAGTACATCAATGGGCGTGGATAGCGGTTTGACTCACGGGGATTTCCAAGTCTCCACCCCATTGACGTCAATGGGAGTTTGTTTTGGCACCAAAATCAACGGGACTTTCCAAAATGTCGTAACAACTCCGCCCCATTGACGCAAATGGGCGGTAGGCGTGTACGGTGGGAGGTCTATATAAGCAGAGCTGGTTTAGTGAACCGTCAGATCGTTCACTGCCGTATAGGCAGGGCCCAGACTGAGCACGTGAGTTTTAGAGCTAGAAATAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGGACCGAGTCGGTCCTCTGCCATCAAAGCGTGCTCAGTCTGTTTTGTTTTGGCTGGGTTTTTCCTTGTTCGCACCGGACACCTCCAGTGACCAGACGGCAAGGTTTTTATCCCAGTGTATATTGGAAAAACATGTTATACTTTTGACAATTTAACGTGCCTAGAGCTCAAATTAAACTAATACCATAACGTAATGCAACTTACAACATAAATAAAGGTCAATGTTTAATCCATAAAAAAAAAAAAAAAAAAA(配列番号193)

非限定的実施例3-pCMV、Csy4ヘアピン、PEgRNA及び3xPAN ENEからなるPEgRNA発現プラットフォーム
TAGTTATTAATAGTAATCAATTACGGGGTCATTAGTTCATAGCCCATATATGGAGTTCCGCGTTACATAACTTACGGTAAATGGCCCGCCTGGCTGACCGCCCAACGACCCCCGCCCATTGACGTCAATAATGACGTATGTTCCCATAGTAACGCCAATAGGGACTTTCCATTGACGTCAATGGGTGGAGTATTTACGGTAAACTGCCCACTTGGCAGTACATCAAGTGTATCATATGCCAAGTACGCCCCCTATTGACGTCAATGACGGTAAATGGCCCGCCTGGCATTATGCCCAGTACATGACCTTATGGGACTTTCCTACTTGGCAGTACATCTACGTATTAGTCATCGCTATTACCATGGTGATGCGGTTTTGGCAGTACATCAATGGGCGTGGATAGCGGTTTGACTCACGGGGATTTCCAAGTCTCCACCCCATTGACGTCAATGGGAGTTTGTTTTGGCACCAAAATCAACGGGACTTTCCAAAATGTCGTAACAACTCCGCCCCATTGACGCAAATGGGCGGTAGGCGTGTACGGTGGGAGGTCTATATAAGCAGAGCTGGTTTAGTGAACCGTCAGATCGTTCACTGCCGTATAGGCAGGGCCCAGACTGAGCACGTGAGTTTTAGAGCTAGAAATAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGGACCGAGTCGGTCCTCTGCCATCAAAGCGTGCTCAGTCTGTTTTGTTTTGGCTGGGTTTTTCCTTGTTCGCACCGGACACCTCCAGTGACCAGACGGCAAGGTTTTTATCCCAGTGTATATTGGAAAAACATGTTATACTTTTGACAATTTAACGTGCCTAGAGCTCAAATTAAACTAATACCATAACGTAATGCAACTTACAACATAAATAAAGGTCAATGTTTAATCCATAAAAAAAAAAAAAAAAAAAACACACTGTTTTGGCTGGGTTTTTCCTTGTTCGCACCGGACACCTCCAGTGACCAGACGGCAAGGTTTTTATCCCAGTGTATATTGGAAAAACATGTTATACTTTTGACAATTTAACGTGCCTAGAGCTCAAATTAAACTAATACCATAACGTAATGCAACTTACAACATAAATAAAGGTCAATGTTTAATCCATAAAAAAAAAAAAAAAAAAATCTCTCTGTTTTGGCTGGGTTTTTCCTTGTTCGCACCGGACACCTCCAGTGACCAGACGGCAAGGTTTTTATCCCAGTGTATATTGGAAAAACATGTTATACTTTTGACAATTTAACGTGCCTAGAGCTCAAATTAAACTAATACCATAACGTAATGCAACTTACAACATAAATAAAGGTCAATGTTTAATCCATAAAAAAAAAAAAAAAAAAA(配列番号194)

非限定的実施例4-pCMV、Csy4ヘアピン、PEgRNA及び3' boxからなるPEgRNA発現プラットフォーム
TAGTTATTAATAGTAATCAATTACGGGGTCATTAGTTCATAGCCCATATATGGAGTTCCGCGTTACATAACTTACGGTAAATGGCCCGCCTGGCTGACCGCCCAACGACCCCCGCCCATTGACGTCAATAATGACGTATGTTCCCATAGTAACGCCAATAGGGACTTTCCATTGACGTCAATGGGTGGAGTATTTACGGTAAACTGCCCACTTGGCAGTACATCAAGTGTATCATATGCCAAGTACGCCCCCTATTGACGTCAATGACGGTAAATGGCCCGCCTGGCATTATGCCCAGTACATGACCTTATGGGACTTTCCTACTTGGCAGTACATCTACGTATTAGTCATCGCTATTACCATGGTGATGCGGTTTTGGCAGTACATCAATGGGCGTGGATAGCGGTTTGACTCACGGGGATTTCCAAGTCTCCACCCCATTGACGTCAATGGGAGTTTGTTTTGGCACCAAAATCAACGGGACTTTCCAAAATGTCGTAACAACTCCGCCCCATTGACGCAAATGGGCGGTAGGCGTGTACGGTGGGAGGTCTATATAAGCAGAGCTGGTTTAGTGAACCGTCAGATCGTTCACTGCCGTATAGGCAGGGCCCAGACTGAGCACGTGAGTTTTAGAGCTAGAAATAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGGACCGAGTCGGTCCTCTGCCATCAAAGCGTGCTCAGTCTGTTTGTTTCAAAAGTAGACTGTACGCTAAGGGTCATATCTTTTTTTGTTTGGTTTGTGTCTTGGTTGGCGTCTTAAA(配列番号195)

非限定的実施例5-pU1、Csy4ヘアピン、PEgRNA及び3' boxからなるPEgRNA発現プラットフォーム
CTAAGGACCAGCTTCTTTGGGAGAGAACAGACGCAGGGGCGGGAGGGAAAAAGGGAGAGGCAGACGTCACTTCCCCTTGGCGGCTCTGGCAGCAGATTGGTCGGTTGAGTGGCAGAAAGGCAGACGGGGACTGGGCAAGGCACTGTCGGTGACATCACGGACAGGGCGACTTCTATGTAGATGAGGCAGCGCAGAGGCTGCTGCTTCGCCACTTGCTGCTTCACCACGAAGGAGTTCCCGTGCCCTGGGAGCGGGTTCAGGACCGCTGATCGGAAGTGAGAATCCCAGCTGTGTGTCAGGGCTGGAAAGGGCTCGGGAGTGCGCGGGGCAAGTGACCGTGTGTGTAAAGAGTGAGGCGTATGAGGCTGTGTCGGGGCAGAGGCCCAAGATCTCAGTTCACTGCCGTATAGGCAGGGCCCAGACTGAGCACGTGAGTTTTAGAGCTAGAAATAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGGACCGAGTCGGTCCTCTGCCATCAAAGCGTGCTCAGTCTGTTTCAGCAAGTTCAGAGAAATCTGAACTTGCTGGATTTTTGGAGCAGGGAGATGGAATAGGAGCTTGCTCCGTCCACTCCACGCATCGACCTGGTATTGCAGTACCTCCAGGAACGGTGCACCCACTTTCTGGAGTTTCAAAAGTAGACTGTACGCTAAGGGTCATATCTTTTTTTGTTTGGTTTGTGTCTTGGTTGGCGTCTTAAA(配列番号196).

様々な他の態様では、足場又はコア配列に改善を導入することによって、PEgRNAが改善されてもよい。これは、既知の導入によって行われ得る。コアであるCas9結合PEgRNA足場は、PE活性を増強するために改善され得る可能性が高い。いくつかのそのようなアプローチが既に実証されている。例えば、足場(P1)の第1の対合要素は、GTTTT-AAAAC(配列番号68)対合要素を含有する。このようなTsの実行は、pol IIIの休止及びRNA転写物の早期終結をもたらすことが示されている。P1のこの部分におけるT-A対の1つのG-C対への合理的突然変異は、sgRNA活性を増強することが示されており、このアプローチがPEgRNAにも実行可能であることを示唆している¹⁹⁵。更に、P1の長さを増加させると、sgRNAフォールディングを増強し、活性を改善することも示されており¹⁹⁵、PEgRNA活性を改善するための別の手段を示唆している。コアの改良例としては、以下を包含し得る。
P1に対する6nt伸長を含有するPEgRNA
GGCCCAGACTGAGCACGTGAGTTTTAGAGCTAGCTCATGAAAATGAGCTAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGGACCGAGTCGGTCCTCTGCCATCAAAGCGTGCTCAGTCTGTTTTTTT(配列番号197)
P1内にT-AからG-Cへの変異を含有するPEgRNA
GGCCCAGACTGAGCACGTGAGTTTGAGAGCTAGAAATAGCAAGTTTAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGGACCGAGTCGGTCCTCTGCCATCAAAGCGTGCTCAGTCTGTTTTTTT(配列番号198)

様々な他の態様において、PEgRNAは、編集鋳型領域に修飾を導入することによって改善されてもよい。PEgRNAによって鋳型される挿入のサイズが増加するにつれて、それはエンドヌクレアーゼによって分解され、自発的加水分解を受け、又はRTによって逆転写され得ないか若しくはPEgRNA足場の折り畳み及びその後のCas9-RT結合を破壊する二次構造に折り畳まれる可能性がより高い。したがって、遺伝子全体の挿入等の大きな挿入に影響を及ぼすために、PEgRNAの鋳型の修飾が必要である可能性がある。そうするためのいくつかの戦略は、RNAを分解又は加水分解に対してより耐性にするか、又は阻害性二次構造を採用する可能性を低くする、合成又は半合成PEgRNA内への修飾ヌクレオチドの組み込みを包含する¹⁹⁶。そのような修飾は、Gリッチ配列中のRNA二次構造を減少させる8-アザ-7-デアザグアノシン;分解を低減し、ある種のRNA二次構造を増強するロックド核酸(LNA);RNA安定性を高める2'-O-メチル、2'-フルオロ又は2'-O-メトキシエトキシ修飾を包含し得た。このような修飾はまた、安定性及び活性を高めるために、PEgRNAの他の場所に包含され得た。代替的又は追加的に、PEgRNAの鋳型は、それが所望のタンパク質産物をコードし、RTによって展開されることができる単純な二次構造を採用する可能性も高くなるように設計され得る。そのような単純な構造は熱力学的シンクとして作用し、逆転写を妨げるより複雑な構造が生じる可能性を低くする。最後に、鋳型を2つの別個のPEgRNAに分裂し得た。そのような設計では、PEが使用されて転写を開始し、Cas9に融合したRNA結合タンパク質又はMS2アプタマー等のPEgRNA自体のRNA認識エレメントを介して別個の鋳型RNAを標的部位に動員する。RTは、この別個の鋳型RNAに直接結合するか、又は第2の鋳型に交換する前に元のPEgRNA上で逆転写を開始し得た。そのようなアプローチは、長い鋳型の添加時のPEgRNAのミスフォールディングを防止すること、及び、おそらくPEに基づく長い挿入を阻害し得る長い挿入が起こるためにゲノムからのCas9の解離を必要としないことの両方によって、長い挿入を可能にし得た。

更に他の態様では、PEgRNAは、PEgRNAの5'及び3'端に、又は更にはその間の位置(例として、gRNAコア領域、又はスペーサ)に更なるRNAモチーフを導入することによって改善されてもよい。KSHV由来のPAN ENE及びMALAT1由来のENE等のいくつかのこのようなモチーフは、非pol IIIプロモータ由来のより長いPEgRNAの発現を終結させる可能な手段として上に論じられた。これらの要素は、ポリAテールを包み込むRNA三重らせんを形成し、その結果、それらは核内に保持される^184,187。しかしながら、末端ヌクレオチドを閉塞するPEgRNAの3'端に複雑な構造を形成することによって、これらの構造は、おそらく、PEgRNAのエキソヌクレアーゼ媒介性分解の防止にも役立つだろう。

非pol IIIプロモータからの終結を可能にすることなく、3'端に挿入された他の構造要素もRNA安定性を高め得た。そのようなモチーフは、3'端を閉塞するヘアピン若しくはRNA四重鎖¹⁹⁷、又は3'端に2'-3'-環状リン酸の形成をもたらし、またPEgRNAをエキソヌクレアーゼによって分解されにくくする可能性があるHDV等の自己切断リボザイムを包含し得た。¹⁹⁸不完全なスプライシングを介して環状化するように(ciRNAを形成するように)PEgRNAを誘導することはまた、PEgRNAの安定性を高め、PEgRNAが核内に保持されるようにすることもできる¹⁹⁴。
更なるRNAモチーフはまた、RTプロセス性を改善するか、又はDNA-RNA二重鎖へのRT結合を増強することによってPEgRNA活性を増強し得た。RTによって結合された天然配列をその同族レトロウイルスゲノムに追加すると、RT活性を増強し得た¹⁹⁹。これには、天然プライマー結合部位(PBS)、ポリプリントラクト(PPT)、又はレトロウイルスゲノム二量体化及び転写の開始を伴うキスループを包含し得た¹⁹⁹。

PEgRNAの5'及び3'端に、キスループ又はGNRAテトラループ/テトラループ受容体ペア²⁰⁰等の二量体化モチーフを付加することも、PEgRNAの効果的な環状化をもたらし、安定性を改善し得た。更に、これらのモチーフの付加は、PEgRNAスペーサ及びプライマー結合部位の物理的分離を可能にし得、PE活性を妨害し得るスペーサの閉塞を防止することが想定される。スペーサ領域又はプライマー結合部位に沿って小さな足がかりヘアピンを形成する、PEgRNAに対する短い5'伸長又は3'伸長もまた、PEgRNAの長さに沿った、例としてスペーサとプライマー結合部位との間の起こり得る相互作用に沿った、相補内領域のアニーリングに対して有利に競合し得た。最後に、また、キスループが使用されて、他の鋳型RNAをゲノム部位に動員し、一方のRNAから他方のRNAへのRT活性の交換を可能にし得た。示されるように、伸長アーム(すなわち、e1及びe2)の末端部分を包含する、PEgRNAの任意の領域に操作されてもよい多数の二次RNA構造。
例示的な改善は、それだけに限らないが、以下を包含する。

PEgRNA-HDV融合
GGCCCAGACTGAGCACGTGAGTTTTAGAGCTAGAAATAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGGACCGAGTCGGTCCTCTGCCATCAAAGCGTGCTCAGTCTGGGCCGGCATGGTCCCAGCCTCCTCGCTGGCGCCGGCTGGGCAACATGCTTCGGCATGGCGAATGGGACTTTTTTT(配列番号199)

PEgRNA-MMLVキスループ
GGTGGGAGACGTCCCACCGGCCCAGACTGAGCACGTGAGTTTTAGAGCTAGAAATAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGGACCGAGTCGGTCCTCTGCCATCAAAGCTTCGACCGTGCTCAGTCTGGTGGGAGACGTCCCACCTTTTTTT(配列番号200)

PEgRNA-VSリボザイムのキスループ
GAGCAGCATGGCGTCGCTGCTCACGGCCCAGACTGAGCACGTGAGTTTTAGAGCTAGAAATAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGGACCGAGTCGGTCCTCTGCCATCAAAGCTTCGACCGTGCTCAGTCTCCATCAGTTGACACCCTGAGGTTTTTTT(配列番号201)

PEgRNA-GNRAテトラループ/テトラループ受容体
GCAGACCTAAGTGGUGACATATGGTCTGGGCCCAGACTGAGCACGTGAGTTTTAGAGCTAUACGTAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTUACGAAGTGGGACCGAGTCGGTCCTCTGCCATCAAAGCTTCGACCGTGCTCAGTCTGCATGCGATTAGAAATAATCGCATGTTTTTTT(配列番号202)

二次RNA-HDV融合を切り替えるPEgRNA鋳型
TCTGCCATCAAAGCTGCGACCGTGCTCAGTCTGGTGGGAGACGTCCCACCGGCCGGCATGGTCCCAGCCTCCTCGCTGGCGCCGGCTGGGCAACATGCTTCGGCATGGCGAATGGGACTTTTTTT(配列番号203)

SpCas9及びプライム編集因子(PE)が改善された方法と類似の様式で、指向性進化によってPEgRNA足場が更に改善され得た。指向性進化は、Cas9又は進化したCas9バリアントによるPEgRNA認識を増強し得た。更に、異なるPEgRNA足場配列が異なるゲノム遺伝子座で最適であり、問題の部位でPE活性を増強するか、オフターゲット活性を減少させるか、又はその両方である可能性が高い。最後に、他のRNAモチーフが付加されたPEgRNA足場の進化は、未進化の融合RNAと比較して、融合PEgRNAの活性をほぼ確実に改善するであろう。例えば、c-ジ-GMP-Iアプタマー及びハンマーヘッド型リボザイムから構成されるアロステリックリボザイムの進化は、劇的に改善された活性をもたらし²⁰²、進化がハンマーヘッド-PEgRNA融合の活性も改善することを示唆した。加えて、Cas9は現在、sgRNAの5'伸長を一般に許容しないが、指向性進化は、この不耐性を緩和し、更なるRNAモチーフが利用されることを可能にする可能性のある突然変異を生成する可能性が高い。本開示は、本明細書に開示される方法及び組成物で利用されるプライム編集システムの有効性を更に改善するための任意のそのような方法を企図する。

様々な態様において、Tの連続系列は転写されるべきPEgRNAの能力を制限することもあるため、伸長アームからのTsの連続配列の出現を制限することが有利であってもよい。例えば、少なくとも連続した3つのT、少なくとも連続した4つのT、少なくとも連続した5つのT、少なくとも連続した6つのT、少なくとも連続した7つのT、少なくとも連続した8つのT、少なくとも連続した9つのT、少なくとも連続した10のT、少なくとも連続した11のT、少なくとも連続した12のT、少なくとも連続した13のT、少なくとも連続した14のT、又は少なくとも連続した15のTのストリングは、PEgRNAを設計するときに回避されるべきであり、又は最終設計配列から少なくとも除去されるべきである。一態様では、連続するA:T核酸塩基対が豊富な標的部位を回避しながら、連続するTの望ましくないストリングがPEgRNA伸長アームに包含されることを回避し得る。

MMRを回避するためのPEgRNA
本開示はまた、プライム編集に使用するための新規なpegRNAを提供する。上述のように、標的部位配列に対して3つ以上の連続するヌクレオチドのミスマッチを含むDNA合成鋳型を有するpegRNAを使用したプライム編集は、MMR経路による修正を回避し得、プライム編集を使用した単一ヌクレオチドのミスマッチの導入と比較して、プライム編集効率の増加及び/又はインデル形成の頻度の減少をもたらす。したがって、本開示は、標的部位配列と比較して3つ以上の連続したヌクレオチドのミスマッチを含有しない対応する対照pegRNAと比較して、プライム編集効率が増加し、及び/又はインデル頻度が減少した、標的核酸に修飾を導入するのに有用なpegRNAを提供する。

本開示によって提供されるpegRNAは、プライム編集効率を改善し、及び/又はインデル形成を減少させながら、プライム編集によって核酸分子を編集するのに有用である。理論に束縛されることを望むものではないが、本開示において提供されるpegRNAは、プライム編集によってヌクレオチド変化(複数可)によって導入される標的部位でのミスマッチの細胞MMR修正の影響を回避又は低減してもよい。いくつかの態様では、本開示によって提供されるpegRNAの伸長アームは、核酸分子上の標的部位に対して3つ以上の連続するヌクレオチドのミスマッチを含む。いくつかの態様では、pegRNAのDNA合成鋳型は、核酸分子上の標的部位に対して3つ以上の連続するヌクレオチドのミスマッチを含む。いくつかの態様において、3つ又はそれを超える連続するヌクレオチドのミスマッチのうちの少なくとも1つは、サイレント変異を導入する。いくつかの態様では、連続するヌクレオチドのミスマッチの少なくとも1つは、標的核酸分子から発現されるタンパク質のアミノ酸配列の変化をもたらすが、残りのヌクレオチドのミスマッチの少なくとも1つはサイレント変異である。サイレント変異は、標的核酸分子のコード領域又は標的核酸分子の非コード領域に導入されてもよい。サイレント変異がコード領域に導入されると、それらは未編集核酸分子と同じアミノ酸をコードする1つ以上の代替コドンを核酸分子に導入してもよい。サイレント変異が非コード領域に導入される場合、サイレント変異は、核酸分子上の標的部位のスプライシング、遺伝子調節、RNA寿命、又は他の生物学的特性に影響を及ぼさない核酸分子の領域に存在してもよい。

細胞MMR経路による修正の影響を回避又は低減する利点を達成するために、3つ以上の任意の数の連続するヌクレオチドのミスマッチが本明細書に記載のpegRNAの伸長アームに組み込まれ得る。いくつかの態様では、pegRNA上の伸長アームのDNA合成鋳型は、核酸分子上の標的部位と比較して、3つ以上、4つ以上、5つ以上、6つ以上、7つ以上、8つ以上、9つ以上、又は10個以上の連続するヌクレオチドミスマッチを含む。

MMR経路による修正の回避の利点を達成し、それによって編集効率を高め、及び/又は意図しないインデルを減少させるために、3つ以上の任意の数の連続するヌクレオチドのミスマッチが、本明細書に記載のpegRNAの伸長アームに組み込まれ得る。いくつかの態様では、pegRNA上の伸長アームのDNA合成鋳型は、プライム編集によって編集された核酸分子上の標的部位の内因性配列に対して3つの連続したヌクレオチドのミスマッチを含む。いくつかの態様では、pegRNA上の伸長アームのDNA合成鋳型は、プライム編集によって編集された核酸分子上の標的部位の内因性配列に対して3～5の連続したヌクレオチドのミスマッチを含む。いくつかの態様では、pegRNA上の伸長アームのDNA合成鋳型は、プライム編集によって編集された核酸分子上の標的部位の内因性配列に対して6～10の連続したヌクレオチドのミスマッチを含む。いくつかの態様では、pegRNA上の伸長アームのDNA合成鋳型は、プライム編集によって編集された核酸分子上の標的部位の内因性配列に対して11～20の連続したヌクレオチドのミスマッチを含む。いくつかの態様では、pegRNA上の伸長アームのDNA合成鋳型は、プライム編集によって編集された核酸分子上の標的部位の内因性配列に対して20～25の連続したヌクレオチドのミスマッチを含む。いくつかの態様では、pegRNA上の伸長アームのDNA合成鋳型は、プライム編集によって編集された核酸分子上の標的部位の内因性配列と比較して、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、又は25個の連続したヌクレオチドミスマッチを含む。いくつかの態様では、pegRNA上の伸長アームのDNA合成鋳型は、プライム編集によって編集された核酸分子上の標的部位の内因性配列と比較して、3つ以上、4つ以上、5つ以上、6つ以上、7つ以上、8つ以上、9つ以上、又は10個以上の連続するヌクレオチドミスマッチを含む。

キット
本開示の組成物は、キット中へ集められ得る。いくつかの態様では、キットは、本明細書に記載のMLH1ドミナントネガティブバリアント等であるが限定されない、プライム編集因子及びMMR阻害剤の発現のための核酸ベクターを含む。他の態様において、キットは更に、適切なガイドヌクレオチド配列(例として、PEgRNA及び第2部位gRNA)、又はかかるガイドヌクレオチド配列(Cas9タンパク質又はプライム編集因子に所望の標的配列を標的にさせる)の発現のための核酸ベクターを含む。

本明細書に記載のキットは、本明細書に記載の方法を実施するための構成要素及び任意選択で使用のための指示を収納する1以上の容器を包含していてもよい。本明細書に記載のキットのいずれも、アッセイ方法を実施するのに必要とされる構成要素を更に含んでいてもよい。キットの各構成要素は、適用可能であれば、液体形態(例として、溶液中)で、又は固体形態(例として、乾燥粉末)で提供されてもよい。あるケースにおいて、構成要素のいくつかは、例えば、好適な溶媒又は他の種(例えば、水)(これらはキットとともに提供されても又はされなくてもよい)の添加によって、再構成可能又は別様に(例として、活性形態へ)処理可能であってもよい。

いくつかの態様において、キットは任意選択で、提供される構成要素の使用のための指示及び/又は促進(promotion)を包含していてもよい。本明細書に使用されるとき、「指示」は、指示及び/又は促進の構成要素を定義し得るものであって、典型的には、本開示のパッケージング上に又はこれに関連して書面の指示を伴い得る。説明書はまた、説明書がキットに関連付けられるべきであることをユーザが明確に認識するように任意の方法で提供される任意の口頭又は電子の説明書、例えば、視聴覚(例として、ビデオテープ、DVD等)、インターネット、及び/又はウェブベースの通信等を包含し得る。書面による説明書は、医薬品又は生物学的製剤の製造、使用又は販売を規制する政府機関によって規定された形態であってもよく、これはまた、動物投与のための製造、使用又は販売の機関による承認を反映し得る。本明細書に使用されるとき、「促進された」は、本開示に関連する、教育方法、病院の及び他の臨床の指示、科学研究、薬物の発見又は開発、学術研究、医薬産業活動(医薬販売を包含する)、並びにいずれの広告活動又は他の宣伝活動(いずれの形態の書面の、口述の、及び電子的な連絡を包含する)を包含する、営業行為の全ての方法を包含する。加えて、キットは、本明細書に記載の通りの特定の用途に応じて、他の構成要素も包含していてもよい。

キットは、1以上の容器中に、本明細書に記載のいずれの構成要素の1以上を含有していてもよい。構成要素は、滅菌的に調製され、シリンジ中にパッケージされ、及び冷凍保存されて出荷されてもよい。代替的に、これは、バイアル又は保管のための他の容器に収納されてもよい。第2容器は、滅菌的に調製された他の構成要素も有していてもよい。代替的に、キットは、予め混合されて、バイアル、管、又は他の容器中で出荷される活性剤を包含していてもよい。

キットは、パウチ、1以上の管、容器、箱、又は袋内に緩くパックされた付属物とともに、ブリスターパウチ(blister pouch)、収縮包装パウチ、真空シール可能なパウチ、シール可能な熱成形トレイ、又は同様のパウチ若しくはトレイの形態等の様々な形態を有してもよい。キットは、付属物が加えられた後に滅菌されてもよく、これによって容器中の個々の付属物が別様に開封され得る。キットは、放射線滅菌、加熱滅菌、又は当該技術分野において知られている他の滅菌方法等の、いずれの適切な滅菌技法も使用して滅菌され得る。キットはまた、特定の用途に応じて、他の成分、例えば、容器、細胞培地、塩、緩衝液、試薬、注射器、針、消毒剤を適用又は除去するためのガーゼ等の布地、使い捨て手袋、投与前の薬剤の支持体等を包含してもよい。本開示のいくつかの側面は、本明細書に記載の方法及び組成物で利用されるプライム編集システムの様々な構成要素(例として、napDNAbp、逆転写酵素、ポリメラーゼ、融合タンパク質(例として、napDNAbp及び逆転写酵素(又はより広義には、ポリメラーゼ)を包含する)、伸長ガイドRNA、並びに融合タンパク質及び伸長ガイドRNA、並びに第2鎖ニッキング成分(例として、第2鎖ニッキングgRNA)及び編集された生成物形成に向けてプライム編集プロセスを推進するのを助けるための5'内因性DNAフラップ除去エンドヌクレアーゼ等の補助要素を含む複合体を含むがこれらに限定されない)をコードするヌクレオチド配列を含む核酸構築物を含むキットを提供する。いくつかの態様において、ヌクレオチド配列(単数又は複数)は、プライム編集システム構成要素の発現を推進する異種プロモータ(又は単一のプロモータより多く)を含む。

本開示の他の側面は、本明細書に記載の方法及び組成物で利用されるプライム編集システムの様々な構成要素(例として、標的DNA配列を修飾することが可能なプライム編集システムの構成要素をコードするヌクレオチド配列を含む)をコードする1つ以上の核酸構築物を含むキットを提供する。いくつかの態様において、ヌクレオチド配列は、プライム編集システム構成要素の発現を推進する異種プロモータを含む。

本開示のいくつかの側面は、(a)逆転写酵素に融合したnapDNAbp(例として、Cas9ドメイン)をコードするヌクレオチド配列と、(b)(a)の配列の発現を推進する異種プロモータとを含む核酸構築物を含むキットを提供する。

細胞
本明細書に記載の組成物のいずれも含有していてもよい細胞は、原核細胞及び真核細胞を包含する。本明細書に記載の方法は、Cas9タンパク質又はプライム編集因子及びMMR阻害剤(例として、MLH1ドミナントネガティブバリアント)を真核細胞(例として、ヒト細胞等の哺乳動物細胞)に送達するために使用される。いくつかの態様において、細胞は、in vitroにある(例として、培養された細胞。いくつかの態様において、細胞は、in vivoにある(例として、ヒト対象等の対象中にある)。いくつかの態様において、細胞は、ex vivoにある(例として、対象から単離され、同じ対象へ戻すか又は異なる対象へ投与されてもよい)。
本開示の哺乳動物の細胞は、ヒト細胞、霊長目の動物細胞(例として、ベロ細胞)、ラット細胞(例として、GH3細胞、OC23細胞)、又はマウス細胞(例として、MC3T3細胞)を包含する。様々なヒト細胞株には、限定せずに、ヒト胚性腎臓(HEK)細胞、HeLa細胞、国立がん研究所の60のがん細胞株(NCI60)からのがん細胞、DU145(前立腺がん)細胞、Lncap(前立腺がん)細胞、MCF-7(乳がん)細胞、MDA-MB-438(乳がん)細胞、PC3(前立腺がん)細胞、T47D(乳がん)細胞、THP-1(急性骨髄性白血病)細胞、U87(膠芽腫)細胞、SHSY5Yヒト神経芽細胞腫細胞(骨髄腫からクローン化)、及びSaos-2(骨がん)細胞が包含される。いくつかの態様において、rAAVベクターは、ヒト胚性腎臓(HEK)細胞(例として、HEK293又はHEK293T細胞)中へ送達される。いくつかの態様において、rAAVベクターは、例えば、多能性幹細胞(例として、ヒト人工(induced)多能性幹細胞(hiPSC)を包含するヒト多能性幹細胞)等の、幹細胞(例として、ヒト幹細胞)中へ送達される。幹細胞は培養中、無期限に分裂して、特化された細胞を生じさせる能力をもつ細胞を指す。多能性幹細胞は、分化して生物の全ての組織になることが可能であるが、完全な生物の発生を単独では支えることが可能でないある種の幹細胞を指す。ヒト人工多能性幹細胞は、胚性幹細胞を定義する特性を維持するのに重要な遺伝子及び因子の発現が強いられることによって胚性幹細胞様状態へ再プログラムされる体細胞(例として、成熟した(mature)細胞又は成熟(adult)細胞)を指す(例として、Takahashi and Yamanaka,Cell 126(4):663-76,2006を参照(参照により本明細書に組み込まれる))。ヒト人工多能性幹細胞は、幹細胞マーカーを発現しており、全3種の胚葉(外胚葉、内胚葉、中胚葉)の細胞特徴を生成するのが可能である。

本開示に従って使用されてもよい追加の細胞株の非限定例は、293-T、293-T、3T3、4T1、721、9L、A-549、A172、A20、A253、A2780、A2780ADR、A2780cis、A431、ALC、B16、B35、BCP-1、BEAS-2B、bEnd.3、BHK-21、BR 293、BxPC3、C2C12、C3H-10T1/2、C6、C6/36、Cal-27、CGR8、CHO、CML T1、CMT、COR-L23、COR-L23/5010、COR-L23/CPR、COR-L23/R23、COS-7、COV-434、CT26、D17、DH82、DU145、DuCaP、E14Tg2a、EL4、EM2、EM3、EMT6/AR1、EMT6/AR10.0、FM3、H1299、H69、HB54、HB55、HCA2、Hepa1c1c7、High Five細胞、HL-60、HMEC、HT-29、HUVEC、J558L細胞、Jurkat、JY細胞、K562細胞、KCL22、KG1、Ku812、KYO1、LNCap、Ma-Mel 1、2、3..48、MC-38、MCF-10A、MCF-7、MDA-MB-231、MDA-MB-435、MDA-MB-468、MDCK II、MG63、MONO-MAC 6、MOR/0.2R、MRC5、MTD-1A、MyEnd、NALM-1、NCI-H69/CPR、NCI-H69/LX10、NCI-H69/LX20、NCI-H69/LX4、NIH-3T3、NW-145、OPCN/OPCT Peer、PNT-1A/PNT2、PTK2、Raji、RBL細胞、RenCa、RIN-5F、RMA/RMAS、S2、Saos-2細胞、Sf21、Sf9、SiHa、SKBR3、SKOV-3、T-47D、T2、T84、THP1、U373、U87、U937、VCaP、WM39、WT-49、X63、YAC-1、及びYAR細胞を包含する。

本開示のいくつかの側面は、本明細書に開示される構築物のいずれも含む細胞を提供する。いくつかの態様において、宿主細胞は、本明細書に記載の1以上のベクターで一過的又は非一過的にトランスフェクトされている。いくつかの態様では、細胞はex vivoでトランスフェクトされる。いくつかの態様では、細胞はin vivoでトランスフェクトされる。いくつかの態様において、トランスフェクトされる細胞は、対象から採られる。いくつかの態様において、細胞は、細胞株等の、対象から採られた細胞に由来される。組織培養のための多種多様の細胞株が当該技術分野において知られている。細胞株の例は、これらに限定されないが、C8161、CCRF-CEM、MOLT、mIMCD-3、NHDF、HeLa-S3、Huh1、Huh4、Huh7、HUVEC、HASMC、HEKn、HEKa、MiaPaCell、Panc1、PC-3、TF1、CTLL-2、C1R、Rat6、CV1、RPTE、A10、T24、J82、A375、ARH-77、Calu1、SW480、SW620、SKOV3、SK-UT、CaCo2、P388D1、SEM-K2、WEHI-231、HB56、TIB55、Jurkat、J45.01、LRMB、Bcl-1、BC-3、IC21、DLD2、Raw264.7、NRK、NRK-52E、MRC5、MEF、Hep G2、HeLa B、HeLa T4、COS、COS-1、COS-6、COS-M6A、BS-C-1サル腎臓上皮、BALB/3T3マウス胚線維芽細胞、3T3 Swiss、3T3-L1、132-d5ヒト胎児線維芽細胞;10.1マウス線維芽細胞、293-T、3T3、721、9L、A2780、A2780ADR、A2780cis、A 172、A20、A253、A431、A-549、ALC、B16、B35、BCP-1細胞、BEAS-2B、bEnd.3、BHK-21、BR 293.BxPC3。C3H-10T1/2、C6/36、Cal-27、CHO、CHO-7、CHO-IR、CHO-K1、CHO-K2、CHO-T、CHO Dhfr-/-、COR-L23、COR-L23/CPR、COR-L23/5010、COR-L23/R23、COS-7、COV-434、CML T1、CMT、CT26、D17、DH82、DU145、DuCaP、EL4、EM2、EM3、EMT6/AR1、EMT6/AR10.0、FM3、H1299、H69、HB54、HB55、HCA2、HEK-293、HeLa、Hepa1c1c7、HL-60、HMEC、HT-29、Jurkat、JY細胞、K562細胞、Ku812、KCL22、KG1、KYO1、LNCap、Ma-Mel 1-48、MC-38、MCF-7、MCF-10A、MDA-MB-231、MDA-MB-468、MDA-MB-435、MDCK II、MDCK 11、MOR/0.2R、MONO-MAC 6、MTD-1A、MyEnd、NCI-H69/CPR、NCI-H69/LX10、NCI-H69/LX20、NCI-H69/LX4、NIH-3T3、NALM-1、NW-145、OPCN/OPCT細胞株、Peer、PNT-1A/PNT 2、RenCa、RIN-5F、RMA/RMAS、Saos-2細胞、Sf-9、SkBr3、T2、T-47D、T84、THP1細胞株、U373、U87、U937、VCaP、Vero細胞、WM39、WT-49、X63、YAC-1、YAR、及びそれらのトランスジェニック種を包含する。

細胞株は、当業者に知られている様々な供給源から利用可能である(例として、American Type Culture Collection(ATCC)(Manassus,Va.)を参照)。いくつかの態様において、本明細書に記載の1以上のベクターでトランスフェクトされた細胞は、1以上のベクター由来配列を含む新しい細胞株を確立するのに使用される。いくつかの態様において、本明細書に記載の通りのCRISPR系の構成要素で(1以上のベクターの一過的なトランスフェクション、又はRNAでのトランスフェクション等によって)一過的にトランスフェクトされて、CRISPR複合体の活性を通して修飾された細胞は、修飾は含有するが他の外来配列のいずれも欠く細胞を含む新しい細胞株を確立するのに使用される。いくつかの態様において、本明細書に記載の1以上のベクターで一過的若しくは非一過的にトランスフェクトされた細胞、又はかかる細胞に由来する細胞株は、1以上の試験化合物を査定するのに使用される。

ベクター
本開示のいくつかの側面は、本明細書に記載のプライム編集因子及びMLH1ドミナントネガティブ変異体を細胞に送達するための組換えウイルスベクター(例として、アデノ随伴ウイルスベクター、アデノウイルスベクター、又は単純ヘルペスウイルスベクター)の使用に関する。分裂-PEアプローチのケースにおいて、全長Cas9タンパク質又はプライム編集因子が様々なウイルスベクター(例として、rAAV(～4.9kb))のパッケージング限界を超えることから、PE融合タンパク質のN末端部分及びPE融合のC末端部分は、別々の組換えウイルスベクター(例として、アデノ随伴ウイルスベクター、アデノウイルスベクター、又は単純ヘルペスウイルスベクター)によって同じ細胞中へ送達される。

いくつかの態様では、本明細書で使用されるベクターは、PE融合タンパク質、又はその成分のいずれか(例として、napDNAbp、リンカー、又はポリメラーゼ)、又はMLH1ドミナントネガティブ変異体をコードしてもよい。加えて、本明細書に使用されるベクターは、PEgRNA、及び/又は第2鎖へニックを入れるための付属(accessory)gRNAをコードしていてもよい。ベクターは、細胞中の1以上のコード配列の発現を推進するのが可能であってもよい。いくつかの態様において、細胞は、例として細菌性細胞等の、原核細胞であってもよい。いくつかの態様において、細胞は、例として、酵母、植物、昆虫、又は哺乳動物の細胞等の、真核細胞であってもよい。いくつかの態様において、真核細胞は、哺乳動物の細胞であってもよい。いくつかの態様において、真核細胞は、齧歯類の動物の細胞であってもよい。いくつかの態様において、真核細胞は、ヒトの細胞であってもよい。種々のタイプの細胞中の発現を推進する好適なプロモータは当該技術分野において知られている。いくつかの態様において、プロモータは、野生型であってもよい。他の態様において、プロモータは、より効率的又はより効果的な発現のために修飾されていてもよい。もう1つの他の態様において、プロモータは、トランケートされていてもよいが、依然としてその機能を保持する。例えば、プロモータは、正常なサイズ、又はベクターのウイルス中への正しいパッケージングに好適な低減されたサイズを有していてもよい。

いくつかの態様において、プライム編集因子ベクターに使用されてもよいプロモータは、構成的、誘導的、又は組織特異的であってもよい。いくつかの態様において、プロモータは、構成的プロモータであってもよい。非限定的な例示の構成的プロモータは、サイトメガロウイルス前初期プロモータ(CMV)、サルウイルス(SV40)プロモータ、アデノウイルス主要後期(MLP)プロモータ、ラウス肉腫ウイルス(RSV)プロモータ、マウス乳腺腫瘍ウイルス(MMTV)プロモータ、ホスホグリセリン酸キナーゼ(PGK)プロモータ、伸長(elongation)因子-アルファ(EFla)プロモータ、ユビキチンプロモータ、アクチンプロモータ、チューブリンプロモータ、免疫グロブリンプロモータ、それらの機能的フラグメント、又は上記のいずれの組み合わせを包含する。いくつかの態様において、プロモータは、CMVプロモータであってもよい。いくつかの態様において、プロモータは、トランケートされたCMVプロモータであってもよい。他の態様において、プロモータは、EFlaプロモータであってもよい。いくつかの態様において、プロモータは、誘導性プロモータであってもよい。非限定的な例示の誘導性プロモータは、熱ショック、光、化学物質、ペプチド、金属、ステロイド、抗生物質、又はアルコールによって誘導可能なものを包含する。いくつかの態様において、誘導性プロモータは、基底(非誘導)発現レベルが低いもの、例として、Tet-On(登録商標)プロモータ(Clontech)等であってもよい。いくつかの態様において、プロモータは、組織特異的プロモータであってもよい。いくつかの態様において、組織特異的プロモータは、専ら又は主として、肝臓組織に発現される。非限定的な例示の組織特異的プロモータは、B29プロモータ、CD14プロモータ、CD43プロモータ、CD45プロモータ、CD68プロモータ、デスミンプロモータ、エラスターゼ-1プロモータ、エンドグリンプロモータ、フィブロネクチンプロモータ、Flt-1プロモータ、GFAPプロモータ、GPIIbプロモータ、ICAM-2プロモータ、INF-βプロモータ、Mbプロモータ、Nphslプロモータ、OG-2プロモータ、SP-Bプロモータ、SYN1プロモータ、及びWASPプロモータを包含する。

いくつかの態様では、プライム編集因子及びMLH1ドミナントネガティブ変異体ベクター(例として、プライム編集因子融合タンパク質及び/又はPEgRNA、及び/又は補助的な第2鎖ニッキングgRNAをコードする任意のベクターを包含する)は、標的細胞に送達された後にのみ発現を開始する誘導性プロモータを含んでもよい。非限定的な例示の誘導性プロモータは、熱ショック、光、化学物質、ペプチド、金属、ステロイド、抗生物質、又はアルコールによって誘導可能なものを包含する。いくつかの態様において、誘導性プロモータは、基底(非誘導)発現レベルが低いもの、例として、Tet-On(登録商標)プロモータ(Clontech)等であってもよい。

更なる態様では、プライム編集因子ベクター(例として、プライム編集因子融合タンパク質及び/又はPEgRNA、及び/又は補助的な第2鎖ニッキングgRNAをコードする任意のベクターを包含する)及びMLH1ドミナントネガティブ変異体ベクター(例として、本明細書に記載のMLH1ドミナントネガティブ変異体をコードする任意のベクター)は、特定の組織に送達された後にのみ発現を開始する組織特異的プロモータを含んでもよい。非限定的な例示の組織特異的プロモータは、B29プロモータ、CD14プロモータ、CD43プロモータ、CD45プロモータ、CD68プロモータ、デスミンプロモータ、エラスターゼ-1プロモータ、エンドグリンプロモータ、フィブロネクチンプロモータ、Flt-1プロモータ、GFAPプロモータ、GPIIbプロモータ、ICAM-2プロモータ、INF-βプロモータ、Mbプロモータ、Nphslプロモータ、OG-2プロモータ、SP-Bプロモータ、SYN1プロモータ、及びWASPプロモータを包含する。

いくつかの態様において、PEgRNA(又はプライム編集に関係して使用されるいずれのガイドRNA)をコードするヌクレオチド配列は、少なくとも1の転写又は翻訳制御配列へ作動可能に連結されていてもよい。いくつかの態様において、ガイドRNAをコードするヌクレオチド配列は、少なくとも1のプロモータへ作動可能に連結されていてもよい。いくつかの態様において、プロモータは、RNAポリメラーゼIII(Pol III)によって認識されてもよい。Pol IIIプロモータの非限定例は、U6、HI、及びtRNAプロモータを包含する。いくつかの態様において、ガイドRNAをコードするヌクレオチド配列は、マウス又はヒトU6プロモータへ作動可能に連結されていてもよい。他の態様において、ガイドRNAをコードするヌクレオチド配列は、マウス又はヒトHIプロモータへ作動可能に連結されていてもよい。いくつかの態様において、ガイドRNAをコードするヌクレオチド配列は、マウス又はヒトtRNAプロモータへ作動可能に連結されていてもよい。1より多くのガイドRNAを用いる態様において、発現を推進するのに使用されるプロモータは、同じであっても、又は異なっていてもよい。いくつかの態様において、ガイドRNAのcrRNAをコードするヌクレオチド、及びガイドRNAのtracr RNAをコードするヌクレオチドは、同じベクター上に提供されていてもよい。いくつかの態様において、crRNAをコードするヌクレオチド、及びtracr RNAをコードするヌクレオチドは、同じプロモータによって推進されてもよい。いくつかの態様において、crRNA及びtracr RNAは、転写されて単一の転写産物になってもよい。例えば、crRNA及びtracr RNAは、単一の転写産物からプロセシングされて二本鎖分子(double-molecule)ガイドRNAを形成してもよい。代替的に、crRNA及びtracr RNAは、転写されて単一分子ガイドRNAになってもよい。

いくつかの態様において、ガイドRNAをコードするヌクレオチド配列は、PE融合タンパク質をコードするヌクレオチド配列を含む同じベクター上に位置付けされていてもよい。いくつかの態様において、ガイドRNAの発現及びPE融合タンパク質の発現は、それらの対応するプロモータによって推進されてもよい。いくつかの態様において、ガイドRNAの発現は、PE融合タンパク質の発現を推進する同じプロモータによって推進されてもよい。いくつかの態様において、ガイドRNA及びPE融合タンパク質の転写産物は、単一の転写産物内に含有されていてもよい。例えば、ガイドRNAは、Cas9タンパク質転写産物の非翻訳領域(UTR)内にあってもよい。いくつかの態様では、ガイドRNAは、PE融合タンパク質転写物の5'UTR内にあってもよい。他の態様では、ガイドRNAは、PE融合タンパク質転写物の3'UTR内にあってもよい。いくつかの態様において、PE融合タンパク質転写産物の細胞内半減期は、ガイドRNAをその3'UTR内に含有することによって低減されてもよく、これによってその3'UTRの長さを短縮し得る。追加の態様において、ガイドRNAは、PE融合タンパク質転写産物のイントロン内にあってもよい。いくつかの態様において、好適なスプライシング部位は、ガイドRNAが転写産物から正しくスプライシングされるように、ガイドRNAが位置付けられるイントロンに付加されてもよい。いくつかの態様において、同じベクター上の極めて近いところにあるCas9タンパク質及びガイドRNAの発現は、CRISPR複合体のより効率的な形成を容易にさせてもよい。

ベクター系は、1つのベクター、若しくは2つのベクター、若しくは3つのベクター、若しくは4つのベクター、若しくは5つのベクター、又はそれ以上を含んでいてもよい。いくつかの態様では、ベクター系は、PE融合タンパク質、PEgRNA、及びMLH1ドミナントネガティブ変異体の両方をコードする単一のベクターを含んでもよい。他の態様では、ベクター系は2つのベクターを含んでもよく、一方のベクターはPE融合タンパク質及びPEgRNAをコードし、他方のベクターはMLH1ドミナントネガティブ変異体をコードする。

薬学的に許容し得る担体として働き得る材料のいくつかの例は以下を包含する:(1)ラクトース、グルコース、及びスクロース等の、糖;(2)コーンスターチ及びジャガイモデンプン等の、デンプン;(3)ナトリウムカルボキシメチルセルロース、メチルセルロース、エチルセルロース、微結晶性セルロース、及び酢酸セルロース等の、セルロース及びその誘導体;(4)粉末状トラガカント;(5)麦芽;(6)ゼラチン;(7)ステアリン酸マグネシウム、ラウリル硫酸ナトリウム、及びタルク等の、平滑剤;(8)カカオバター及び坐薬蝋等の、賦形剤;(9)落花生油、綿実油、紅花油、ゴマ油、オリーブ油、トウモロコシ油、及び大豆油等の、油;(10)プロピレングリコール等の、グリコール;(11)グリセリン、ソルビトール、マンニトール、及びポリエチレングリコール(PEG)等の、ポリオール;(12)オレイン酸エチル及びラウリン酸エチル等の、エステル;(13)寒天;(14)水酸化マグネシウム及び水酸化アルミニウム等の、緩衝剤;(15)アルギン酸;(16)パイロジェンフリー水;(17)等浸透圧の生理食塩水;(18)リンガー溶液;(19)エチルアルコール;(20)pH緩衝溶液;(21)ポリエステル、ポリカーボネート、及び/又はポリ酸無水物;(22)ポリペプチド及びアミノ酸等の、増量剤;(23)血清アルブミン、HDL、及びLDL等の、血清構成要素;(22)エタノール等の、C2～C12アルコール;並びに(23)医薬製剤に採用される、相溶性のある他の非毒性物質。湿潤剤、着色剤、離型剤、コーティング剤、甘味剤、香味剤、芳香剤、保存料、及び抗酸化剤もまた、製剤中に存在し得る。「賦形剤」、「担体」、「薬学的に許容し得る担体」又は同種のもの等の用語は本明細書中、互換的に使用される。

送達方法
いくつかの側面では、本発明は、本明細書に記載の1つ以上のベクター等の1つ以上のポリヌクレオチド、その1つ以上の転写物、並びに/あるいはそれから転写された1つ以上のタンパク質を、宿主細胞に送達することを含む方法を提供する。いくつかの側面では、本発明は、更に、かかる方法によって産生される細胞、及びかかる細胞を含むか又は次いで産生される生物(例えば動物、植物、又は真菌)を提供する。いくつかの態様では、ガイド配列並びにDNAミスマッチ修復経路の阻害剤と組み合わせて(及び任意選択で複合体化して)本明細書に記載されるようなプライム編集因子が細胞に送達される。本明細書中に記載される任意の送達方法において、DNAミスマッチ修復経路の阻害剤もまた、プライム編集因子と共に送達され得る。いくつかの態様では、阻害剤は、本明細書に更に記載のMLH1dnである。いくつかの態様において、阻害剤は、プライム編集因子と同じベクター上にコードされる。特定の態様において、阻害剤は、プライム編集因子に融合される。いくつかの態様において、阻害剤は、第2のベクター上にコードされ、第2のベクターは、プライム編集因子をコードするベクターと共に送達される。いくつかの態様では、プライム編集因子融合タンパク質及びDNAミスマッチ修復経路の阻害剤は、タンパク質として直接細胞に送達される。特定の態様において、プライム編集因子は、DNAミスマッチ修復経路の阻害剤に融合され、融合タンパク質は、細胞内に直接送達される。

例示的な送達戦略は、ベクターベースの戦略、PEリボ核タンパク質複合体送達、及びmRNA法によるPEの送達を包含する。いくつかの態様において、提供される送達方法は、ヌクレオフェクション、マイクロ注射、微粒子銃(biolistics)、ビロソーム、リポソーム、イムノリポソーム、ポリカチオン又は脂質:核酸抱合体、裸のDNA、人工ビリオン、及びDNAの取込みを増強する剤を包含する。

例示の核酸送達方法は、リポフェクション、ヌクレオフェクション、エレクトロポレーション、安定したゲノム組み込み(例として、piggybac)、マイクロ注射、微粒子銃(biolistics)、ビロソーム、リポソーム、イムノリポソーム、ポリカチオン又は脂質:核酸抱合体、裸のDNA、人工ビリオン、及びDNAの取込みを増強する剤を包含する。リポフェクションは、例として、米国特許第5,049,386号、第4,946,787号;及び第4,897,355号)に記載されており、リポフェクション試薬は商業的に販売されている(例として、Transfectam(商標)、Lipofectin(商標)、及びSF細胞株4D-Nucleofector X Kit(商標)(Lonza))。ポリヌクレオチドの効率的な受容体認識リポフェクションにとって好適であるカチオン性及び中性脂質は、FeignerのWO91/17424;WO91/16024のものを包含する。送達は、細胞(例として、in vitro投与若しくはex vivo投与)、又は標的組織(例として、in vivo投与)に対するものであってもよい。送達は、RNP複合体の使用を通して達成されてもよい。

イムノ脂質複合体等の標的化リポソームを包含する脂質:核酸複合体の調製は当業者に周知である(例として、Crystal,Science 270:404-410(1995);Blaese et al.,Cancer Gene Ther.2:291-297(1995);Behr et al.,Bioconjugate Chem.5:382-389(1994);Remy et al.,Bioconjugate Chem.5:647-654(1994);Gao et al.,Gene Therapy 2:710-722(1995);Ahmad et al.,Cancer Res.52:4817-4820(1992);米国特許第4,186,183号、第4,217,344号、第4,235,871号、第4,261,975号、第4,485,054号、第4,501,728号、第4,774,085号、第4,837,028号、及び第4,946,787を参照)。

他の態様において、本明細書に提供される送達方法及びベクターは、RNP複合体である。融合タンパク質のRNP送達は、塩基編集のDNA特異性を著しく増大させる。融合タンパク質のRNP送達は、オン-及びオフ-ターゲットDNA編集の分断(decoupling)へ繋がる。RNP送達は、プラスミド送達に匹敵するオン-ターゲット編集を維持しながら、非反復部位にてオフターゲット編集を小さくし(ablates)、高度に反復したVEGFA部位2でさえもオフ-ターゲットDNA編集を大いに低減させる。Rees,H.A.et al.,Improving the DNA specificity and applicability of base editing through protein engineering and protein delivery,Nat.Commun.8,15790(2017)、2016年12月27日に発行された米国特許第9,526,784号、及び2017年8月22日に発行された米国特許第9,737,604号を参照(これらの各々は参照により本明細書に組み込まれる)。

細胞への核酸の送達のための追加の方法は当業者に公知である。例えば、US 2003/0087817を参照(参照により本明細書に組み込まれる)。

他の本開示の側面は、プライム編集因子構築物を細胞中へ送達して、完全且つ機能的なプライム編集因子を細胞内に形成する方法を提供する。例えば、いくつかの態様において、細胞は、本明細書に記載の組成物(例として、分裂Cas9若しくは分裂プライム編集因子をコードするヌクレオチド配列、又はかかるヌクレオチド配列を含む核酸ベクターを含有するAAV粒子を含む組成物)と接触させられる。いくつかの態様において、接触させることは、かかるヌクレオチド配列の細胞中への送達をもたらすが、ここでCas9タンパク質又はプライム編集因子のN末端部分、及びCas9タンパク質又はプライム編集因子のC末端部分は、細胞中で発現され結び合わされて、完全なCas9タンパク質又は完全なプライム編集因子を形成する。

本明細書に提供されるいずれのrAAV粒子、核酸分子、又は組成物も、安定的又は一過的のいずれかのいずれか好適なやり方で、細胞中へ導入されてもよいことは了解されるはずである。いくつかの態様において、開示されたタンパク質は、細胞中へトランスフェクトされてもよい。いくつかの態様において、細胞は、核酸分子で形質導入又はトランスフェクトされてもよい。例えば、細胞は、分裂タンパク質をコードする核酸分子、若しくは1つ以上の核酸分子をコードするウイルスのゲノムを含有するrAAV粒子で、形質導入されても(例として、分裂タンパク質をコードするウイルスで)、又はトランスフェクトされてもよい(例として、分裂タンパク質をコードするプラスミドで)。かかる形質導入は、安定的な形質導入又は一過的な形質導入であってもよい。いくつかの態様において、分裂タンパク質を発現するか又は分裂タンパク質を含有する細胞は、例えば、分裂Cas9(例として、nCas9)タンパク質の送達において、1以上のガイドRNA配列で形質導入又はトランスフェクトされてもよい。いくつかの態様において、分裂タンパク質を発現するプラスミドは、エレクトロポレーション、一過的な(例として、リポフェクション)及び安定したゲノム組み込み(例として、piggybac)、及びウイルスの形質導入又は当業者に知られている他の方法を通して、細胞中へ導入されてもよい。

実施例
実施例1:編集結果の細胞決定因子の同定及び操作による強化されたプライム編集システム
序論
プログラム可能な様式でゲノムを操作する能力は、生物学を明らかにし、遺伝性疾患の臨床治療における有望性を示した。生細胞に正確にインストールされることができる配列変化の幅を拡大するという目標に向けて、二本鎖DNA切断又はドナーDNA鋳型を必要とせずに、全てのタイプの標的DNA塩基対置換、小さな挿入、小さな欠失、及びそれらの組み合わせを可能にする遺伝子編集アプローチであるプライム編集が開発された(Anzalone et al.,2020;Anzalone et al.,2019)。プライム編集は、ハエ(Bosch et al.,2021)、イネ及びコムギ(Lin et al.,2020)、ゼブラフィッシュ(Petri et al.,2021)、マウス胚(Liu et al.,2020)、出生後マウス(Liu et al.,2021)、ヒト幹細胞(Surun et al.,2020)及び患者由来オルガノイド(Schene et al.,2020)における遺伝子変化を導入するために広く適用されている。その汎用性にもかかわらず、プライム編集効率は、異なる編集クラス、標的遺伝子座、及び細胞タイプにわたって大きく異なり得る(Anzalone et al.,2019)。プライム編集の有用性を最大化するために、プライム編集結果の細胞決定因子が同定され、得られた洞察が使用されて、効率及び結果純度が改善されたプライム編集システムを開発した。

PE2プライム編集システムは、2つの成分:Cas9ニッカーゼ(PE2タンパク質)に融合された操作された逆転写酵素(RT)と、標的DNAに相補的なスペーサ配列及び所望の編集をコードする3'伸長の両方を含有するプライム編集ガイドRNA(pegRNA)とを含む(Anzalone et al.,2020;Anzalone et al.,2019)(図40A)。これらの成分は一緒になって、標的DNA遺伝子座の一方の鎖に結合し、反対の鎖にニックを入れるPE2-pegRNA複合体を形成する。このニックは、pegRNA伸長中のプライマー結合部位(PBS)にハイブリダイズし得るDNA 3'端を露出させる。次いで、pegRNA伸長内のRT鋳型の逆転写は、編集された配列を含有する3'DNAフラップを生成し、最終的にその配列のゲノムへのインストールをもたらす。

PE3システムは、追加のシングルガイドRNA(sgRNA)を使用してpegRNA標的から離して未編集鎖をニックすることでPE2とは異なり、未編集鎖の置換を刺激することによって編集効率を高める(Anzalone et al.,2019)(図40A)。

現在のモデルによれば、新たに合成された3'フラップは、フラップ相互変換(図40A)によってゲノムDNAの隣接鎖を置換する。次いで、置換された5'フラップの切除は、編集された配列のゲノムへのライゲーションを可能にする。PE3系における編集されていない鎖のニッキングは、ヘテロ二本鎖分解中に編集されていない鎖の細胞置換を誘導し、したがって、編集された配列の相補鎖へのコピーを促進すると考えられる。

本発明者らは、プライム編集におけるDNA修復機構の役割及びそれらのプロセスの操作による改良されたプライム編集システムの開発を研究した。本明細書に提示されるように、プールされたCRISPR干渉(CRISPRi)に基づくスクリーニングを使用して、置換プライム編集結果に対するDNA修復及び関連プロセスを伴う476個の遺伝子の効果を体系的にプローブした。プライム編集効率を強く抑制し、インデル形成を促進する特異的DNAミスマッチ修復(MMR)遺伝子が同定された。MMRがプライム編集中に形成されたヘテロ二本鎖DNAを復帰させるモデルと一致して、MMR活性に対する脆弱性がより低く、したがって3つ以上の連続塩基のG・CからC・Gトランスバージョン及び置換を包含する、より効率的に生成されるプライム編集のクラスが同定された。これらの知見を組み込み、ドミナントネガティブMMRタンパク質(MLH1dn)の一過性発現による改善された編集結果を有する新規なプライム編集システムが開発された。人工多能性幹細胞及び初代T細胞を包含するMMR機能正常細胞型では、これらのPE4(PE2＋MLH1dn)及びPE5(PE3＋MLH1dn)系は、PE2及びPE3よりもそれぞれ平均7.7倍及び2.0倍編集効率を高め、編集:インデル比(結果純度)を3.4倍増加させる。MLH1dnの一過性共発現は、MMR習熟度の臨床的に使用されるバイオマーカーであるマイクロサテライトリピート長に対する検出された変化をもたらさなかった(Umar et al.,2004)。コドン使用頻度、核局在化シグナル、Cas9ドメイン変異、並びにリンカーの組成及び長さを変えることによって、PE4、PE5、及び最近開発された操作されたpegRNA(epegRNA)からの改良との相乗効果において編集効率を更に増加させる最適化されたプライム編集因子アーキテクチャ(PEmax-図54Bを参照)を操作した(Nelson et al.,2021)。最後に、意図された編集の近くに追加のサイレント変異を戦略的にインストールすることにより、MMR認識を弱めることによってプライム編集効率を改善し得ることが示された。これらの知見は、プライム編集の理解を深めるとともに、7つの哺乳動物細胞型における19の遺伝子座での169の異なる編集にわたって実質的に改善された効率及び結果純度を有するプライム編集システムを確立する。

結果
プライム編集結果のためのプールされたCRISPRiスクリーニングの設計
Repair-seqと呼ばれる新しい遺伝子スクリーニングアプローチが使用されて、元の配列、所望の編集、及びインデル頻度を包含するプライム編集効率及び結果を研究した。Repair-seqは、プールされたスクリーニングにおいて、CRISPRi sgRNAの同一性を編集部位に結び付けることによって、ゲノム編集実験の結果に対する多くの機能喪失摂動の影響を測定する(Hussmann et al.,2021)(図40B)。簡潔には、sgRNAのライブラリーが、CRISPRiエフェクタータンパク質(dCas9-KRAB)を発現する細胞にレンチウイルス形質導入されて、ほとんどの感染細胞がただ1つのsgRNAを受け取るようにし、1細胞当たり1つの遺伝子のノックダウンを引き起こす。ゲノム編集のための標的配列も、同じレンチウイルスカセット中のライブラリーsgRNAと共に送達される。この標的部位でゲノム編集が行われた後、ペアエンドシーケンシングにより、各編集結果の頻度を各リンクされたCRISPRi摂動と共に測定されることが可能になる。

Repair-seqをプライム編集に適合させるために、典型的にはStreptococcus pyogenes Cas9(SpCas9)にも依存するプライム編集及びCRISPRiが最初に直交された。PE2中のSpCas9ニッカーゼドメインをStaphylococcus aureus Cas9(SaCas9)N580Aニッカーゼで置き換えることによって、SaPE2プライム編集因子バリアントが構築された(Ran et al.,2015)。SaPE2及び直交S.aureus pegRNAs(Sa-pegRNAs)を使用して、プライム編集活性が検証された(図47A)。

次に、複合SaPE2編集部位を追加することによって、SaPE2でスクリーニングするためのレンチウイルスRepair-seqベクターが設計された。この部位は、HEK293T細胞において効率的に編集されることが同定された単一の標的プロトスペーサ(図47A)と、標的の下流(＋50ニック)又は上流(-50ニック)で50bpの相補鎖(編集されていない鎖)ニックを可能にした二本の隣接プロトスペーサとから構成された(図40B、図47B)。この設計は、3つのアプローチ:PE2、＋50ニックを有するPE3(PE3＋50)、又は-50ニックを有するPE3(PE3-50)におけるSaPE2によるプライム編集をサポートした(図47C)。

スクリーニングを可能にするために、検証されたHeLa CRISPRi細胞株(Gilbert et al.,2013)においてこの部位を編集するために、Sa-pegRNAが最適化された。編集部位でのG・CからC・GトランスバージョンをプログラムするSaPE2、Sa-pegRNA、及びSa-sgRNAプラスミドでこれらの細胞をトランスフェクトすると、最大5.2％の編集及び0.17％のインデル(PE2)、12％の編集及び5.8％のインデル(PE3＋50)、並びに2.6％の編集及び19％のインデル(PE3-50)が得られた(図47D)。PE3-50由来のインデルの高い割合は、5'オーバーハングと比較して、二重ニックによって残された3'オーバーハングが挿入の頻度をより高くするという過去の報告と一致している(Bothmer et al.,2017)。首尾よくトランスフェクトされた細胞を濃縮するためにブラストサイジン選択マーカーを有するSaPE2構築物を使用して、意図される編集頻度が、PE2では9.4％、PE3＋50では15％、PE3-50では3.5％に増加された(図47E)。合わせて、これらの取り組みは、CRISPRi摂動から編集の増加又は減少を検出するのによく適した効率範囲のプライム編集結果のベースラインを用いたスクリーニングアッセイを確立した。

プライム編集結果に影響を及ぼすDNA修復成分の同定
この最適化されたアッセイを用いて、プライム編集結果のRepair-seqスクリーニングが、K562細胞及びHeLa細胞中のPE2及びPE3＋50、並びにHeLa細胞中のPE3-50を用いて行われた。DNA修復及び関連プロセスにおける役割について濃縮された476個の遺伝子を標的とする1,513個のsgRNAのライブラリーが(図48F)、60個の非標的化対照sgRNAと共にレンチウイルススクリーニングベクターにクローニングされた(Hussmann et al.,2021)(表5)。このライブラリーがヒトK562細胞株及びHeLa CRISPRi細胞株に形質導入され(Gilbert et al.,2014;Gilbert et al.,2013)、5日後、事前に検証された編集部位でG・CからC・GトランスバージョンをプログラムするSaPE2、Sa-pegRNA及びSa-sgRNAプラスミドで細胞がトランスフェクトされた。トランスフェクションの3日後にゲノムDNAが細胞から抽出され、CRISPRi sgRNA、編集部位及び相補的ニック部位を含有する453 bp領域がPCRによって増幅され、ペアエンドシーケンシングが実施されて、各遺伝子摂動に対する編集結果の分布を測定した(図40B、図47B)。得られたデータを解釈するために、遺伝子標的化CRISPRi sgRNAを含有する細胞からの編集結果の頻度が、非標的化sgRNA対照を含有する細胞からの対応する頻度と比較された。遺伝子ノックダウン時の結果の頻度の減少は、遺伝子の活性が結果の形成を促進することを示唆し、一方、頻度の増加は、遺伝子の活性が結果を抑制することを示唆する。

意図するG・CからC・G編集の頻度に対する遺伝子ノックダウンの効果が調査された。非標的CRISPRi sgRNAを有する細胞では、シーケンシングリードの4.3～4.9％(K562)及び8.5～8.7％(HeLa)が、PE2編集後の意図した編集を正確に含有していた(図40C～図40D)。これらのレベルは、PE3＋50については14-16％(K562)及び14-16％(HeLa)に増加したが、PE3-50については2.1-2.2％(HeLa)に減少した。スクリーニングされた全てのプライム編集条件にわたって、MSH2、MSH6、MLH1及びPMS2、MutSα-MutLα MMR複合体の成分のCRISPRi標的化は(Iyer et al.,2006;Kunkel and Erie,2005;Li,2008)、PE2については最大5.8倍、PE3＋50については2.5倍、及びPE3-50については2.0倍の編集効率の実質的な増加をもたらした(図40E-図40G及び図47G-図47J、表6)。MMRにおける役割を有するエキソヌクレアーゼであるEXO1のノックダウン(Genschel et al.,2002)もまた、K562細胞におけるPE2について最大2.3倍まで意図された編集効率を増加させた。対照的に、ニッケルシーリングDNAリガーゼであるLIG1(Pascal et al.,2004)及び5'フラップエンドヌクレアーゼであるFEN1(Liu et al.,2004)のノックダウンは、意図した編集の頻度を減少させ、これは、プライム編集中のニックライゲーション及び5'フラップ切除における以前に提案された役割と一致していた(Anzalone et al.,2019)。まとめると、これらのデータは、MMR活性がプライム編集によって点変異のインストールに拮抗することを示唆している。

意図された編集に加えて、Repair-seqスクリーニングはまた、編集副産物の形成に対する遺伝的摂動の影響を測定する。これらの副産物は、欠失(図41A)、タンデム重複(図41B)、及びpegRNAからの意図しない配列を含有する2つのクラスの結果の4つの主要なカテゴリーに分類された(図41C～図41D)。PE2からの総意図しない編集のベースライン頻度は低いが(K562中0.31％、HeLa中0.60％;図41E)、PE3-50(HeLa中58％;図48A)及びPE3＋50(K562中8.2％、HeLa中9.5％;図41F)からのより頻繁で多様な意図しない副産物が観察された。これらのカテゴリーのベースライン頻度及び遺伝的調節因子は、PE2、PE3＋50及びPE3-50スクリーニングにわたって変化し、異なるプライム編集構成がどのように処理されるかの豊富な観察結果を提供した(図48A～図48I)。これらの観察結果のうちの2つは、プライム編集中のMMR活性の役割についてのモデルを示した。

第1に、1つの意図しない結果カテゴリーは、意図したG・CからC・Gへの編集、並びに追加の塩基置換及び標的部位近くの1ヌクレオチド(nt)挿入を含有していた(図41C)。これらの更なる突然変異の配列は、pegRNA足場の3'端の9-ntと完全に一致し、pegRNA足場への逆転写及び得られた3'DNAフラップの部分相同ゲノム配列への組み込みと一致した。ゲノム標的との配列相同性を回避するためにpegRNA足場を再コード化すると、これらの追加の突然変異の頻度が大幅に減少し(図49A～図49B)、このタイプの編集副産物を排除するための一般化可能なアプローチを示唆した。注意すべきことに、MMR遺伝子のノックダウンは、PE2 K562スクリーニングにおいてこの編集副産物の頻度を0.08％から2.0％に増加させることが観察された(図41E、図48D)。したがって、MMRは、この結果の形成を意図された編集よりも大きく抑制し、別個のプライム編集中間体は、それらがMMRによって処理される程度が異なり得ることを実証する。

第2に、MMRノックダウンは、PE3＋50からのほとんどのカテゴリーの意図しない転帰の頻度を減少させ(図41F-図41H及び図48H)、いくつかのMMR活性を一過性に阻害することがプライム編集の効率及び転帰純度の両方を増加させてもよいことを示唆した。ニック間の配列の縦列重複はPE3-50では一般的であったが(図48A)、これらの重複の結果はPE3＋50ではより少なく(K562における0.37％の非標的化リード、HeLaにおける2.3％)、MMRノックダウンによって最大3.7倍(K562)及び1.5倍(HeLa)低下された(図41F、図48H)。意図しないPE3＋50結果の最も豊富なクラスは、意図したフラップアニール位置でゲノム配列を再結合しない逆転写3'DNAフラップからの配列を含有していた(K562における5.1％の非標的化リード、HeLaにおける3.8％;図41D)。両方の細胞型において、意図しないフラップ再接合の結果の頻度は、フォーク状リモデリングヘリカーゼであるHLTFのノックダウン時に増加したが(Poole and Cortez,2017)、MMR遺伝子のノックダウンによって最大1.7倍低下された(図41H)。最後に、MMRノックダウンは、PE3＋50からの欠失を最大3.7倍(K562)及び1.6倍(HeLa;図41G)実質的に減少させた。K562細胞におけるMMRノックダウンもまた、欠失配列の観察された境界を定性的にシフトさせた。両方のPE3配置について、2つのSaPE2誘導ニック間のゲノム配列が最も頻繁に欠失したが、この領域の外側に広がる欠失も観察された(図41I、上部)。MMRノックダウンは、これらのより長い欠失の頻度を、PE3＋50によるプログラムされたニック間の欠失よりも劇的に減少させ(図41I、下及び図41J)、MMR活性がプライム編集中により長い欠失の形成を引き起こしてもよいことを示唆した。

プライム編集中間体のミスマッチ修復モデル
これらのRepair-seqスクリーニングにおける意図的及び意図しない編集結果の両方に対するMMRノックダウンの効果は、プライム編集中のMMRの役割についての作業モデルをもたらした。真核生物では、MMRは、近くのニックを含有するDNA鎖を選択的に置換することによって、一塩基ミスマッチ又は小さな挿入-欠失ループ(IDL)を含有するDNAヘテロ二重鎖を分解する(Iyer et al.,2006;Kunkel and Erie,2005;Li,2008)。MMRを開始するために、ヘテロ二重鎖は、最初に、塩基のミスマッチ及び1～2-ntのIDLを認識するMutSα(MSH2-MSH6)によって(Warren et al.,2007)、又は2～13-ntのIDLを認識するMutSβ(MSH2-MSH3)によって結合される(Gupta et al.,2012)(図42C)。次に、MSH2は、MutLαヘテロ二量体(PMS2-MLH1)を動員し、ヘテロ二本鎖の周囲のニッケル含有鎖のみを切り裂く(Fang and Modrich,1993;Kadyrov et al.,2006;Pluciennik et al.,2010;Thomas et al.,1991)。これらの切開から、EXO1はヘテロ二本鎖の5'から3'への切除を媒介し(Genschel et al.,2002)、ポリメラーゼδは切除されたDNA鎖を再合成し、リガーゼI(LIG 1)は新生鎖を密封して修復を完了する(Iyer et al.,2006;Kunkel and Erie,2005;Zhang et al.,2005)。

理論に束縛されることを望むものではないが、MMRは、特定のプライム編集中間体、すなわち、逆転写された3'DNAフラップと隣接ゲノムDNAとのハイブリダイゼーションによって形成されたDNAヘテロ二本鎖と係合してもよい(図42A)。MutSα-MutLαがこの構造内のヘテロ二本鎖を認識する場合、フラップ平衡後であるがライゲーション前に存在する3'ニックは、編集された鎖の選択的切除及びその後の修復を刺激して、元の編集されていない配列を再生し得た。あるいは、MMRはまた、編集された3'フラップのゲノム標的へのアニーリングを拒否することによって、生産的なフラップ相互変換を防止してもよい(Sugawara et al.,2004)。いずれの場合も、プライム編集中のMMRの阻害は、ヘテロ二本鎖修復を遅延させるか、又はニックライゲーションの可能性を増加させ得た。更に、ニックのライゲーションが成功すると、編集された生成物の除去に向けてヘテロ二本鎖の分割をバイアスするMMRの能力を除去する。このモデルは、MutSα-MutLα遺伝子(図40C～図40D)のノックダウンからのPE2編集効率の実質的な増加(1.6～5.8倍)によって裏付けられており、これは、3'-ニックを入れられたヘテロ二本鎖中間体がしばしばMMRによってニックのライゲーション前の元の配列に修復されることを強く示唆している(図42A)。したがって、これらの中間体のMMR復帰を妨げることにより、プライム編集効率を高め得る。

このモデルはまた、PE3編集システムにおける相補鎖ニックからの利益を説明する。ヘテロ二本鎖中間体の編集されていない鎖をニッキングすると、編集されていない鎖をより頻繁に置き換えるようにMMRに指示することができる追加の鎖識別信号を導入し、それにより、より高いプライム編集効率及びMMR抑制の減衰効果をもたらす(図42B)。このモデルと一致して、MutSα-MutLα成分のノックダウンは、意図されたG・C・G編集をPE2については最大5.8倍増加させたが、PE3＋50については最大2.6倍しか増加させなかった(図40G)。MMR活性はまた、編集されていない鎖の切除を指示することによって成功したプライム編集を促進してもよいが、編集された鎖がライゲーションされ、編集されていない鎖がニックを入れられたプライム編集中間体についてのみである。しかし、MMRノックダウンは、K562細胞及びHeLa細胞においてPE3＋50編集を実質的に増強し(図40F)、この中間体は稀であり、MMRは典型的にはニック結紮前にヘテロ二本鎖を修復することを示唆する。

MMRの機序はまた、MutSα-MutLα遺伝子ノックダウンがPE3＋50由来のインデル副産物をどのように減少させるかを説明してもよい(図41F)。プライム編集ヘテロ二本鎖中間体の修復中、特に両方のDNA鎖が既にpegRNA及びsgRNAプログラムニックを含有する場合、MutLαは標的遺伝子座を無差別にニッキングすることによってDSBを誘導してもよい(図49D)。これらの追加のプログラムされていないニックからの切除後に形成されたDSBは、プライム編集された遺伝子座におけるインデルの境界を広げ得た。この仮説と一致して、MutSα-MutLα成分のノックダウンは、pegRNAニックとsgRNAニックとの間の配列外のPE3＋50欠失の結果を不釣り合いに低下させた(図41I)。まとめると、Repair-seqスクリーニングからのこれらの知見はしたがって、MMR活性が意図されたプライム編集結果を強く抑制し、代わりにインデル副産物を促進するモデルを支持する。

MMR阻害は内因性遺伝子座におけるプライム編集を改善する
プライム編集に対するMMRの効果が、内因性ゲノム遺伝子座及び更なる細胞型において標準的なSpCas9ベースのプライム編集因子を用いて試験された。HEK293T細胞が、MSH2、MSH6、MLH1又はPMS2を標的化するsiRNAで処理され、細胞が3日間培養されて、siRNA媒介ノックダウンを可能にし(図49E)、次いで、PE2をコードするプラスミド及び3つの内因性ゲノム遺伝子座における点変異をプログラムするpegRNAがトランスフェクトされた(EMX1、RUNX1及びHEK293T細胞部位3(以下、HEK3と称する))。これらの遺伝子座にわたって、mRNAノックダウンは平均PE2編集を7.7％から25％に強く増加させ、インデル頻度を0.39％から0.28％に減少させたが(図42C)、平均PE3編集効率をより低い程度に改善した(25％から37％)ことが観察された。これらの結果は、相補鎖ニッキングが未編集鎖のMMRを導くことによってプライム編集効率を改善することを述べている、本明細書に提示されるモデルと一致する。したがって、PE3編集効率に対するMMRの影響は、3'フラップ中間体を元に戻すこと(プライム編集を妨げる)及び編集されていない鎖の置換を媒介すること(プライム編集を促進する)に対するその反対の効果によって調整される。更に、MMR遺伝子のノックダウンは、PE3インデルの頻度を平均5.5％から3.2％に減少させ、PE3結果純度の2.9倍の増加をもたらした(図42C)。これらの知見は、MMR成分の阻害がヒト細胞の内因性ゲノム部位におけるプライム編集結果を改善し得ることを実証している。

プライム編集が、MMR欠損ΔMSH2又はΔMLH1半数体HAP1細胞において測定された。PE2プライム編集効率は、野生型対照細胞(HEK3で0.44％、EMX1で0.07％;図42D)よりもMMR欠損HAP1細胞(HEK3で17％、EMX1で5.0％)においてはるかに高かった。更に、本明細書で述べられる仮説と一致して、これらの遺伝子座での未編集鎖のニッキングは、MMR欠損HAP1細胞における編集効率に影響を及ぼさなかった(図42D)。まとめると、これらの結果は、この効果が編集されていない鎖を置き換える際のMMRの役割によってPE3系において部分的に釣り合っているにもかかわらず、編集されたDNA鎖の切除を促進することによってMMRがプライム編集を妨げるモデルを更に支持する。

操作されたドミナントネガティブMMRタンパク質は、プライム編集効率及び精度を高める
MMR標的化siRNAによる細胞前処理がプライム編集効率を高め得ることを奨励して、プライム編集因子及びMMR阻害剤の同時共送達のための戦略が調査された。前処理なしのPE2及びMLH1 siRNAの同時トランスフェクションは、3日後に編集効率を実質的に増加させなかった(図49F)。ドミナントネガティブMMRタンパク質バリアントは、代わりに、プライム編集を増強するために、PE2と一過性に同時発現され得るか、又はPE2との融合タンパク質として同時発現され得ると仮定された。HEK293T細胞が、ヒトMSH2、MSH6、PMS2及びMLH1のPE2、pegRNA及びATPase欠損変異体(Iaccarino et al.,1998;Raschle et al.,2002;Tomer et al.,2002)、又はPMS2及びMLH1のエンドヌクレアーゼ欠損変異体(Gueneau et al.,2013;Kadyrov et al.,2006)(図43A)をコードするプラスミドで同時トランスフェクトされた。これらの変異体のうち、ATPase障害MLH1 E34A及びエンドヌクレアーゼ障害MLH1 Δ756は、HEK3、EMX1及びRUNX1遺伝子座における3つの一塩基置換編集について、PE2編集効率を1.6～3.1倍増加させた。

次に、プライム編集効率の向上を最大化するために、更なるドミナントネガティブMLH1バリアントが操作され、試験された。MLH1 N末端ドメイン(NTD)は、MMR中のMSH2へのMutLα(PMS2-MLH1)動員を媒介し(Plotz et al.,2003)、MutLα機能に不可欠なATPaseを含有する(Kadyrov et al.,2006)(図43B)。対照的に、MLH1 C末端ドメイン(CTD)はPMS2と二量体化し、MMRに不可欠なMutLαエンドヌクレアーゼ活性に寄与する(Gueneau et al.,2013)(図43B)。MLH1 Δ756ドミナントネガティブバリアントはこのエンドヌクレアーゼを破壊するが、これらの残基のより大きな欠失(MLH1 Δ754-756)は、試験した3つの部位でプライム編集効率を更に上昇させることが見出された(図43C、図50A)。しかし、ATPase突然変異とエンドヌクレアーゼ突然変異との組み合わせ(MLH1 E34A Δ754-756)は、プライム編集を更に改善しなかった(図43C)。10回のプライム編集にわたってこれらのドミナントネガティブMLH1バリアントを比較すると、MLH1 Δ754-756が平均して最大程度までPE2編集効率を高めたことが観察された(3.2倍;図50D)。したがって、MLH1 Δ754-756はMLH1dnと命名された。MLH1dnは、HEK293T細胞内で用量依存的にプライム編集を改善した(図50B)。MLH1dnは、MMR欠損HCT116細胞において編集を増加させなかった(Parsons et al.,1993)(図50C)。ヒト及びマウスMLH1dnの両方がまた、ヒトHEK293T細胞における3つの部位及びマウスN2A細胞における4つの部位にわたって置換プライム編集効率を改善した(図50D～図50E)。

次に、プライム編集中にMMRも阻害し得るより短いMLH1切断が同定された。それ自体、MLH1 NTD(残基1～335)は、PE2編集を1.5～1.8倍ほど穏やかに増強したが、E34A ATPase変異を導入すると、3つの試験した遺伝子座のうち2つでこの改善が弱まった(図43C、図50A)。核局在化シグナル(NLS)をMLH1 NTDに付加することにより、PE2編集が1.9～2.5倍、全長MLH1dnと同程度に増強された。対照的に、MLH1 CTD(残基501～756)並びにそのエンドヌクレアーゼ変異体及びNLS付加バリアントは、PE2編集を実質的に増強しなかった(図43C、図50A)。これらのデータは、ドミナントネガティブMLH1バリアントが、触媒的に損なわれたMutLα複合体をPMS2と形成することによって、又はMSH2の結合を飽和させることによってMMRを阻害し得、これは、MMR中のMutLαの生産的動員を防止するであろうことを示唆する。両方を行い得る全長MLH1dnは両方の機序によってMMRを阻害し得たが、NLS付加MLH1 NTD(以下、MLH1^NTD-NLSと呼ぶ)は、PMS2と二量体化するのに必要なCTDを欠くので、MSH2結合によってMMRを阻害すると予想される(Guerrette et al.,1999)。MLH1^NTD-NLSは、MLH1dnとほぼ同程度にPE2編集効率を改善し(図43C、図50A)、MSH2隔離がMMRを阻害するための有効な機構であることを示唆している。

MLH1dn又はMLH1^NTD-NLSも(32aa(SGGS)x2-XTEN16-(SGGS)x2リンカーを介して)PE2タンパク質に直接融合されたが、PE2単独と比較してより高い編集効率を示さなかった(図50A)。しかし、自己切断性P2Aリンカー(PE2-P2A-MLH1dn)を用いてMLH1dnをPE2に付加すると(Kim et al.,2011)、3つの部位でのプライム編集効率が2.0～2.7倍向上した(図50A)。HEK293T細胞における3つの遺伝子座にわたって試験された55の総ドミナントネガティブMMRタンパク質バリアントの中で、トランスで発現されたPE2及びMLH1dnは、PE2編集効率の最大平均増強(3.2倍)を提供した。PE2編集の強い平均改善は、MLH1^NTD-NLSをトランスで発現させたPE2(2.7倍)及びPE2-P2A-MLH1dn(2.4倍)からも観察された(図43C)。これら3つのバリアントはまた、PE3編集効率を平均で1.2倍増加させたが、望ましくないインデル産物を1.4～4.0倍減少させた(図43E)。MLH1dnによるPE2編集をPE4系とし、MLH1dnによるPE3編集をPE5系とした(図43F)。MLH1^NTD-NLSはまた、MLH1dn(753aa)と比較して、より小さなタンパク質(355aa)でプライム編集効率の向上をもたらし得る。単一の構築物が必要とされる場合、PE2-P2A-MLH1dnの使用が推奨される。

PE4及びPE5系の一般性が、HEK293T細胞における異なるゲノム遺伝子座にわたる7つの更なる一塩基置換編集で評価された。平均して、PE4は、最小インデルでPE2よりも2.0倍編集効率を改善した(平均＜0.4％;図43G)。PE5は、PE3よりも編集を1.2倍改善し、編集:インデル純度を3.0倍増強した(図43G)。MLH1dnがPE3bの効率を高め得たかどうか、編集された配列に特異的な相補鎖ニックを使用して、インデル形成を促進する両鎖上の一致したニックを最小限に抑えるプライム編集戦略(Anzalone et al.,2019)も試験された。MLH1dnを共発現させたPE3b(以下、PE5bと呼ぶ)は、FANCF遺伝子座での編集を、インデル頻度が低いPE3bよりも1.7倍増加させた(＜0.6％;図50H)。更に、インデルを最小化しなければならない場合、又は相補鎖ニックが非生産的な編集結果をもたらす遺伝子座において、PE4はPE2と比較して実質的に改善されたプライム編集性能を提供することが示された(図50H)。MLH1dnからのプライム編集増強対完全MLH1ノックアウトもクローンHeLa細胞株において比較された。試験した4つの部位で、MLH1ノックアウトは、MLH1dn共発現よりも大きな程度までPE2及びPE3編集を増強し(PE4及びPE5;図50F)、この経路の更なる調節による更なるプライム編集増強の機会を示唆した。まとめると、これらのデータは、ヒト細胞における様々な内因性ゲノム遺伝子座でのプライム編集効率及び結果純度を実質的に高めるPE4及びPE5系を確立する。

PE4及びPE5によって強化されたプライム編集の種類の特徴付け
次に、MLH1dnが広範囲の異なる編集タイプにわたってプライム編集を改善する程度が研究された。7つのゲノム遺伝子座にわたって12個全ての可能な一塩基置換を一緒に導入する84個のpegRNAを使用して、HEK293T細胞においてPE4がPE2と比較された。これらの編集のうち、MLH1dnは、PE2と比較してプライム編集効率を2.0倍改善し、平均インデル頻度を0.40％から0.31％に減少させた(図44A～図44B、図51A～図51B)。

MLH1dnは、A・TからG・C、T・AからG・C、及びC・GからA・Tプライム編集の効率をより低い程度まで、PE2よりも1.7倍増加させた。注意すべきことに、3'フラップハイブリダイゼーション後にC・Cミスマッチを形成するG・CからC・Gへの置換は、MLH1dnで最も改善されず(1.2倍)、C・CミスマッチがMMRによって効率的に修復されないことを立証する以前の研究と一致した(Lahue et al.,1989;Su et al.,1988;Thomas et al.,1991)。この発見は、G・CからC・G編集がMMRをより効果的に回避し、したがってより高い基礎編集効率をもたらしてもよいことを示唆する。この可能性と一致して、PE2を用いたG・CからC・G編集は、7つの内因性遺伝子座にわたるPAM変更プライム編集の中で、G・CからA・T(18％)又はG・CからT・A(20％)編集よりも実質的に効率的であった(27％)(図51C)。

G・CからC・G置換がMMRに対してそれほど感受性でないことを更に確認するために、MLH1dn共発現によって影響されないRNF2遺伝子座でのG・CからC・Gプライム編集の効率に対するMMRノックダウン又はノックアウトの効果が試験された(図51A)。HEK293T細胞におけるMMR成分のsiRNAノックダウン(図51D)及びHAP1細胞におけるMSH2又はMLH1のノックアウト(図51E)は、このG・CからC・G編集の効率を変化させなかった。G・CからA・T、G・CからC・G及びG・CからT・A編集もまた、HeLa CRISPRi細胞における事前に検証されたスクリーニング部位でSaPE2と比較された(図40B)。PE2及びPE3＋50は、G・CからA・T又はG・CからT・A編集よりも効率的にG・CからC・G編集をインストールし、C・Cミスマッチでのより弱いMMR活性と一致した(図51F)。更に、MSH2のCRISPRiノックダウンは、G・CからA・T及びG・CからT・A編集効率(PE2については16倍及びPE3＋50については4.3倍)をG・CからC・G編集(PE2については4.0倍及びPE3＋50については1.9倍)よりも大幅に改善した。これらのデータは、G・C-C・Gプライム編集がMMRによる修復の影響を受けにくく、その結果、より高い効率でインストールされることを強く支持する。

PE5及びPE3も、上記の実験で使用した同じ84個のpegRNAのセットと比較された。PE5は、PE3と比較して平均1.2倍の編集の増加をもたらした(図44A、図51A、図51G)。MLH1dnは、望ましくないインデル生成物の頻度を平均2.2倍実質的に減少させ、2.8倍高い編集:インデル純度をもたらした(図44A)。まとめると、7つのゲノム遺伝子座における84個の異なる一塩基置換のこの分析は、PE4及びPE5系が、プライム編集中間体の逆効果のMMRを損なうことによってプライム編集効率及び結果純度を改善するモデルを強く支持する。

MLH1dnが小さな挿入及び欠失のプライム編集も改善し得たかどうかを決定するために、次に、1及び3bpの挿入及び欠失が、HEK293T細胞においてPE4及びPE5と共にインストールされた。3つの遺伝子座における12個のpegRNAにわたって、PE4は、インデル頻度の増加を伴わずにPE2よりも2.2倍だけ平均編集効率を増加させ、一方、PE5は、PE3よりも1.2倍だけ編集効率を増加させ、編集:インデル純度を2.9倍だけ増加させることが観察された(図44C及び図51I)。より大きな配列変化に対するMLH1dnの影響を評価するために、HEK3及びFANCF遺伝子座での1、3、6、10、15及び20bpの挿入及び欠失を一緒にプログラムする組み合わせた33個のpegRNAを用いてPE2及びPE4が試験された。MLH1dnからのプライム編集効率の向上は、挿入及び欠失の長さが増加するにつれて徐々に低下し(図44D及び図51H)、その結果、15bp及び20bpの挿入及び欠失は、PE2よりも平均で1.1倍しか効率的にPE4によって編集されなかった。これらの観察結果は、MMRがIDL≦13-ntの長さを修復するという以前の報告と一致する(Acharya et al.,1996;Genschel et al.,1998;Umar et al.,1994)。これらの結果は、PE4及びPE5戦略が小さな(＜15bp)標的化挿入及び欠失を増強し得ることを一緒に実証している。

更なるサイレント変異をインストールすると、MMRを回避することによってプライム編集効率を増加し得る
他のクラスのプライム編集がMMRをバイパスし得たかどうかも調査された。点突然変異、短い挿入及び短い欠失に加えて、プライム編集はまた、複数の隣接又は連続する塩基置換をインストールし得る(Anzalone et al.,2019)。MutSα及びMutSβヘテロ二量体はそれぞれ、特異的なヘテロ二本鎖DNA構造(Gupta et al.,2012;Warren et al.,2007)を認識し、隣接するミスマッチのDNAバブルがこれらのMMR成分からの認識を弱め得たことを示唆している。この可能性を評価するために、PE2及びPE4が、HEK293T細胞における5つのゲノム遺伝子座で1～5個の連続した塩基置換を生成する35の異なる編集で試験された。2つの隣接する塩基を変異させる7回の編集にわたって、PE4は、PE2よりも2.3倍高い編集効率をもたらし、同じ標的ヌクレオチドでの単一塩基置換の2.4倍の増強に匹敵した(図44E、図52A)。対照的に、より長い3～5塩基連続置換の編集頻度は、PE2と比較してPE4で1.2～1.5倍しか改善されなかった。これらのより大きな編集に対するMMRの影響の減少は、1～2bpの連続した置換(14回の編集で4.8％)と比較して、3～5bpの連続した置換(21回の編集で13％)のより高い平均PE2編集効率に反映された(図44F、図52A)。MLH1dn(PE4)を用いてMMRを阻害すると、これらの3～5bp及び1～2bpの連続置換の平均編集頻度がそれぞれ16％及び10％に上昇し、これらの編集タイプの差が小さくなった。

意図された編集の近くに更なるサイレント変異をインストールすると、MLH1阻害がなくても、得られたヘテロ二本鎖の修復を弱めることによって、プライム編集効率を同様に増加し得た(図51G)。PE2が、コード変異のみをプログラムするpegRNA、又はコード編集に近い(最も少ないのは5bp未満離れた)追加のサイレント変異をプログラムするpegRNAのいずれかを用いて、6つの遺伝子標的で試験された。6つの部位のうちの4つにおいて、更なるサイレント変異を作製することにより、所望のコード化変化の効率が、各部位における最良のpegRNAについて平均して1.8倍増加した(図44H及び図52B)。MLH1dn(PE4)を用いてMMRを阻害すると、最良のサイレントpegRNAでは、コード変異のみを作製するpegRNA(1.7倍)よりも少ない程度(平均で1.2倍)で編集効率を改善し、これらの追加のサイレント変異がMMRを回避することによって編集を増強することを示唆している。この機構と一致して、サイレントpegRNAが編集を改善しない2つの部位において、試験したサイレント変異は、編集効率に対するMMR阻害の効果を実質的に弱めないことが観察された(図52B)。まとめると、これらの知見は、MMRが3つ以上の連続したミスマッチ塩基を含有するヘテロ二重鎖をあまり効率的に修復しないことを裏付けており、驚くべきことに、所望の編集の近くに更なるサイレント変異又は良性変異を戦略的にインストールすることにより、MMR活性を操作しないPE2又はPE3ベースの系を使用した場合であっても、プライム編集中間体のMMR反転を回避することによってプライム編集効率を増加し得ることを明らかにしている。

PE4及びPE5は、完全に活性なMMRを有する細胞型においてプライム編集を強く改善する
HEK293T細胞は、MLH1プロモータの高メチル化のために部分的にMMR欠損であり(Trojan et al.,2002)、これは、上記の知見に照らして、他の哺乳動物細胞型と比較してHEK293T細胞において観察されるより高いプライム編集効率を説明してもよい(Anzalone et al.,2019)。MLH1dnがまた、完全に活性なMMRを有する細胞においてプライム編集をより大きく改善するかどうかを評価するために、7つの遺伝子座を一緒に標的とする30個のpegRNAを使用して、HEK293T細胞及びMMR能力のあるHeLa細胞においてプライム編集が比較された。HeLa細胞におけるより高いMMR活性と一致して(Holmes et al.,1990;Thomas et al.,1991)、相補鎖ニッキング(PE3対PE2)は、HEK293T細胞におけるよりもHeLa細胞におけるプライム編集効率におけるはるかに大きい改善(平均で22倍)をもたらした(3.5倍;図44I～図44J及び図52C)。同様に、PE4は、最小インデル頻度(HeLa細胞で平均0.67％)を維持しながら、同じ30回の編集にわたって、部分的MMR欠損HEK293T細胞(2.0倍)よりもMMR機能正常HeLa細胞(6.7倍)で、PE2よりも平均編集効率をはるかに大きく高めた。同様に、PE5は、HeLa細胞ではPE3よりも平均編集効率を1.9倍改善したが、HEK293T細胞では1.1倍しか改善しなかった。MLH1dnはまた、編集:インデル比をHeLa細胞で平均2.8倍及びHEK293T細胞で3.2倍増加させた(図44I)。

PE4及びPE5も、MMR機能正常K562及びU2OS細胞株において評価された(Matheson and Hall,2003;Peng et al.,2014)。K562細胞の6つの部位及びU2OS細胞の4つの部位にわたって、PE4及びPE5は、平均プライム編集効率をそれぞれPE2及びPE3よりも6.0倍及び1.7倍上昇させ(図44I～図44J)、この場合も、MMR障害HEK293T細胞で観察されたよりもはるかに大きな利益を提供した。これらの細胞におけるPE5はまた、PE3よりも2.6倍だけ編集:インデル純度を改善した。興味深いことに、PE4は、HEK293T細胞においてDNMT1でのG・CからC・G編集頻度をPE2よりも1.4倍増加させただけであったが(図51A)、HeLa、K562及びU2OS細胞ではより大きな改善が観察され(平均2.7倍;図44J)、PE4及びPE5は、MMR活性をより効果的に回避する編集のクラスであっても、MMR能力の高い細胞型においてプライム編集を増強し得ることを示唆した。まとめると、HEK293T細胞、HeLa細胞、K562細胞及びU2OS細胞における7つの内因性部位にわたる70回の編集間のこの比較は、MLH1dnがプライム編集効率を実質的に改善するが、特にMMR欠損ではない細胞型においては改善することを示している。

プライム編集結果の純度に対するMLH1dnの効果
MLH1dnが内因性ゲノム標的における意図しないプライム編集結果をどのように減少させるかを次に詳細に特徴付けた。プライム編集をもたらす工程をインデル副産物をもたらす工程から切り離すために、プライム編集因子が、標的遺伝子座に対して完全な相補性を有する3'DNAフラップを鋳型とし、標的遺伝子座において配列変化をもたらさない非編集pegRNA(図45A)で試験された。HEK293T細胞における4つの部位にわたって、これらの非編集性のpegRNAは、PE3による平均4.4％インデル及びPE5による4.3％インデルを生じた(図45B～図45C、図53A)。対照的に、これらの部位で単一ヌクレオチド変異をプログラムする4つのpegRNAは、平均してPE3を含む8.5％インデル及びPE5を含む4.8％インデルを生成した。これらのデータは、MLH1dnによるMMR阻害がヘテロ二本鎖の非存在下でインデル頻度を変化させないことを示す。MLH1dnは、PE2-dRT、不活性化逆転写酵素を含有するPE2、又はSpCas9 H840Aニッカーゼ(nCas9;図53A)と同時トランスフェクトしたpegRNA及びニッキングsgRNAからのインデルの頻度を変化させないことも観察され、このことは、MMRが、逆転写された3'フラップを欠く二重にニックが入った中間体の修復に影響を及ぼさないことを示唆している。これらの結果はともに、プライム編集ヘテロ二重鎖中間体のMMR結合が、PE5で緩和され得るインデル生成物を刺激することを強く示唆している。

次に、MMR活性がプライム編集インデル副産物のサイズを拡大するという証拠が、HEK293T細胞における7つの内因性遺伝子座で調べられた。PE3及びPE5からの意図しない標的配列欠失の分布が、一塩基置換をコードする84個のpegRNAと比較された。Repair-seqスクリーニングからの知見(図41I)と一致して、PE5系におけるMLH1dnは、pegRNA-及びsgRNA-でプログラムされたニックの外側の欠失を、これらのニック間の欠失よりも大幅に減少させた(図45D～図45E、図53B)。比較すると、MLH1dnは、ミスマッチを作り出さない非編集pegRNAからのプライム編集欠失結果の分布に影響を及ぼさなかった(図53C)。まとめると、この分析は、MutLαによるプログラムされていない切開及びその後の標的遺伝子座での切除が、プライム編集中間体のMMR中により大きなインデル副産物を生成するモデルを支持する。

最後に、MLH1dnが、Repair-seqスクリーニングで以前に同定された2つの意図しない結果カテゴリーである、pegRNA足場配列の取込み及び意図しないフラップ再結合にどのように影響するかが調査された(図41C～図41D)。上記のHEK293T細胞で試験した84個のpegRNAにわたって、PE5は、PE3と比較してこれらの組み合わせ結果の平均頻度を1.6倍減少させた(平均1.8％から1.0％、図45F、図53D)。PE2及びPE3＋50スクリーニングからのデータ(図41E～図41F)と一致して、これらの結果は、相補鎖ニックの非存在下ではるかに稀であり(PE2では0.27％、PE4では0.28％の頻度;図53D)、これらが典型的には二重にニックが入った中間体を介して形成することを示唆した。したがって、PE5は広範に、PE3と比較して、意図しない欠失のサイズを狭め、pegRNA足場配列の取込み及び意図しないフラップの再結合の頻度を減少させる。

オフターゲットゲノムDNA変化に対するMLH1dnの効果
次に、MMR成分操作がオフターゲット編集に影響を及ぼし得るかどうかが評価された。PE2及びPE4が、HEK3、EMX1、FANCF及びHEK 4遺伝子座を標的とする8つのpegRNAを用いてHEK293T細胞において試験された。得られたゲノム変化が、各標的遺伝子座についてCIRCLE-seqによって同定された上位4つのCas9オフターゲット部位で測定された(Tsai et al.,2017)。オフターゲットプライム編集の平均頻度はML1dnの有無にかかわらず非常に低いままであったが(PE2による0.094％、PE4による0.12％)、オンターゲット編集の平均効率はPE2の9.7％からPE4の20％に増加した。(図45G、図53E)。これらのデータは、プライム編集の高いDNA特異性に注目する以前の報告と一致しており(Anzalone et al.,2019;Jin et al.,2021;Kim et al.,2020)、MLH1dnがオフターゲットプライム編集を実質的に増加させないことを示唆している。

次に、MLH1dnによるMMRの一過性阻害が、プライム編集活性とは無関係にゲノム変異を誘導し得たかどうかが求められた。ヒトでは、MMR欠乏症は結腸直腸がんの危険因子であり、ゲノム内の反復マイクロサテライト配列の長さを変化させる突然変異として最も頻繁に現れる(Fishel et al.,1993;Leach et al.,1993;Parsons et al.,1993)。マイクロサテライト複製からのエラーはほぼ排他的にMMRによって修復されるので(Strand et al.,1993;Tran et al.,1997)、マイクロサテライト不安定性はMMR活性の尺度として臨床的に使用される(Bacher et al.,2004;Umar et al.,2004)。

マイクロサテライト不安定性は、MMR阻害に反応性であることが以前に示され、MMR欠損症の臨床バイオマーカーとして使用された17のモノヌクレオチド域のハイスループットシーケンシングによって評価された(Hempelmann et al.,2015)。これらのマイクロサテライト遺伝子座は、HAP1細胞、HeLa細胞及びMMR欠損HCT116細胞において分析された。HCT116細胞は、平均してHAP1又はHeLa細胞(18.4-nt;図45H、図53F)よりも実質的に短いマイクロサテライト長(13.9-nt)を示した。このアッセイが同じ細胞型におけるより短い持続期間のMMR欠損も検出し得るかどうかを評価するために、マイクロサテライト不安定性が、MSH2のノックアウト後2ヶ月間(約60回の細胞分裂)にわたって成長させられる野生型HAP1細胞及びモノクローナルHAP1細胞において比較された。これらのMMRノックアウト細胞は、マイクロサテライト長の0.24-ntの平均減少を示し(図45H、図53F)、最近のMMR障害でさえもマイクロサテライト長の侵食の蓄積によって検出され得ることを実証した。

PE4及びPE5系で使用される一過性MLH1dn発現の効果を評価するために、次に、PE2又はPE4をコードするプラスミドによるトランスフェクションの3日後に、MMR機能正常HeLa細胞においてマイクロサテライト不安定性が測定された。MLH1dnは、オンターゲット遺伝子座でプライム編集効率を1.3％(PE2)から7.6％(PE4)に改善したが(図51G)、平均マイクロサテライト長は、PE4処理細胞と比較して、PE2処理細胞では区別できなかった(＜0.01ntの差;図45H、図53F)。これらのデータは、一過性MLH1dn発現が、MMR欠損症の臨床診断に使用される17個のマイクロサテライトで検出可能な不安定性を刺激することなくプライム編集を増強し得ることを示している。マイクロサテライト反復は平均して残りのゲノムよりも最大10⁵倍MMR阻害を受けやすいので(Strand et al.,1993;Tran et al.,1997)、これらの知見は、以下に記載されるMLH1dn mRNA共送達を包含する一過性MLH1dn発現を使用するPE4及びPE5編集システムが、実質的なオフターゲット突然変異負荷なしにオンターゲット編集を増強し得ることを示唆している。

最適化されたアーキテクチャ及び操作されたpegRNAとの相乗を有するPEmaxシステム
プライム編集を更に改善するために、RTコドン使用頻度、SpCas9ドメイン内の突然変異、nCas9とRTとの間のペプチドリンカーの長さ及び組成、並びにNLS配列の位置、組成及び数を変えることによって、PE2タンパク質が最適化された(図56A～図56B)。試験された21のこのようなバリアントの中で、編集効率の最大の向上が、ヒトコドン最適化RT、二部分SV40 NLSを含有する34aaリンカー(Wu et al.,2009)、更なるC末端c-Myc NLS(Dang and Lee,1988)、及びCas9ヌクレアーゼ活性を改善することが以前に示されたSpCas9におけるR221K N394K突然変異(Spencer and Zhang,2017)を使用するプライム編集因子アーキテクチャから観察された(図46A、図56A)。この最適化されたプライム編集因子アーキテクチャはPEmaxと命名された(本明細書に開示される配列番号99;図54Aの概略図も参照)。HeLa細胞において試験された7つの標的部位において、この最適化されたプライム編集因子アーキテクチャ(以下、PEmaxと呼ぶ)は、更なるNLS配列を包含するPE2＊(Liu et al.,2021)及び高移動度ペプチドを含有するCMP-PE-V1(Park et al.,2021)を包含する他の改良されたプライム編集因子バリアントよりも優れている(図56B～図56D)。高移動度ペプチドのPEmaxへの挿入(CMP-PEmax)は、プライム編集を更に改善しなかった(図56C～図56D)。

異なる遺伝子座を標的とする7つの置換編集にわたって、PE2系を用いたPEmaxアーキテクチャ(PE2max)を使用すると、意図した編集の平均頻度が、元のPE2アーキテクチャよりもHeLa細胞で2.3倍及びHEK293T細胞で1.2倍増加した(図52B)。同様に、PEmaxアーキテクチャを使用したPE3(PE3max)は、平均編集効率をPE3よりもHeLa細胞で2.8倍及びHEK293T細胞で1.2倍増加させた(図53B及び図56C)。PE3maxはまた、PEmaxアーキテクチャ内のCas9 R221K及びN394K変異からのニッカーゼ活性の増強を反映してもよい、両方の細胞型において平均編集:インデル純度を1.2倍わずかに減少させた(Spencer and Zhang,2017)。

また、PE4max(PEmaxアーキテクチャを使用したPE4)は、PE4よりも平均編集頻度をHeLa細胞で1.9倍、HEK293T細胞で1.1倍向上させることが観察された(図56E)。最後に、PE5max(PEmaxアーキテクチャを使用するPE5)も同様に、平均編集効率をPE5よりもHeLa細胞で2.2倍及びHEK293T細胞で1.2倍増加させた。

プライム編集のための別個の改善において、プライム編集効力を増大させる付加的な3'RNA構造モチーフを含有する操作されたpegRNA(epegRNA)が最近開発された(Nelson et al.,2021)(図46C)。最適化されたPE4max及びPE5max系がepegRNAと相乗作用し得るかどうかを評価するために、PE4max及びPE5maxが、HeLa及びHEK293T細胞においてepegRNAと組み合わせて試験された。異なる遺伝子座を標的とする7つの置換編集にわたって、epegRNAは、正常なpegRNAよりもPE4max編集効率をHeLa細胞で平均2.5倍及びHEK293T細胞で1.5倍改善した(図46B)。同様に、epegRNAは、編集:インデル純度に影響を及ぼすことなく、正常なpegRNAよりもPE5max編集をHeLa細胞では1.4倍及びHEK293T細胞では1.1倍増強した。

上述のプライム編集システム(MLH1dn、PEmax、及びepegRNA)に対する全ての強化を組み合わせることは、プライム編集性能を劇的に改善した。epegRNAによるPE4maxは、正常なpegRNAを有するPE2と比較して、MMR機能正常HeLa細胞では平均72倍、MMR欠損HEK293T細胞では3.5倍編集効率を高めた(図46B)。epegRNAを用いたPE5maxはまた、HeLa細胞では平均12倍、HEK293T細胞では1.6倍、pegRNAを用いたPE3よりも編集効率を改善し、結果純度は、HeLa細胞では平均4.6倍、HEK293T細胞では3.3倍増加した。まとめると、これらの結果は、PE4/PE5、PEmax及びepegRNAアプローチを組み合わせることにより、プライム編集効率及び結果純度を大きく高め得ることを実証している。

PE4及びPE5による疾患関連遺伝子座及び細胞型のプライム編集
これらの改善された編集システムの適用性を確立するために、PE4max及びPE5maxが適用されて、野生型HeLa及びHEK293T細胞における治療的に関連する遺伝子座を編集した。第1に、サイレントなG・CからA・TトランスバージョンがHBBの6番目のコドンで行われ、これは鎌状赤血球症患者において突然変異されている(Ingram,1956)。第2に、G127V対立遺伝子(G・CからT・Aトランスバージョン)が、プリオン病に対する耐性を付与するPRNPにインストールされた(Asante et al.,2015;Mead et al.,2009)。第3に、重度の神経発達状態であるCDKL5欠損症の原因変異を含有することが知られているCDKL5部位にサイレントC・GからT・A変異が導入された(Olson et al.,2019)。第4に、ヒト細胞におけるHIV感染を阻害するCXCR4 P191A対立遺伝子(G・CからC・G編集)がインストールされた(Liu et al.,2018)。第5に、養子T細胞移入療法のための直交性IL-2受容体応答性を可能にするIL2RB H134D Y135F(非隣接T・AからA・T及びG・CからC・G編集)バリアントが生成された(Sockolosky et al.,2018)。最後に、HBG1及びHBG2胎児ヘモグロビン遺伝子プロモータ内のBCL11Aリプレッサー結合部位が、GATA1転写活性化因子モチーフ(隣接していないG・CからA・T及びC・GからA・T編集)に記録され、これは原則として、異常ヘモグロビン症の治療のために胎児ヘモグロビン発現を誘導し得た(Amato et al.,2014)。配列が以下の表4に示される。

これらの6つの疾患関連編集にわたって、PE4maxは、平均プライム編集効率をPE2よりもHeLa細胞で29倍及びHEK293T細胞で2.1倍増加させることが観察された(図46D)。注意すべきことに、PE4max編集効率(HeLa細胞では0.19％インデルで8.6％編集、HEK293T細胞では0.26％インデルで20％編集)は、PE3(HeLa細胞では1.5％インデルで4.5％編集、HEK293T細胞では5.4％インデルで24％編集)のものと同様又はそれを超えたが、インデルははるかに少なかった。更に、PE5maxは、疾患に関連する対立遺伝子変換をPE3よりもHeLa細胞で平均6.1倍及びHEK293T細胞で1.5倍改善し、編集:インデル純度をHeLa細胞で6.4倍及びHEK293T細胞で3.5倍向上させた(図46D)。まとめると、これらの結果は、PE4max及びPE5maxが、一般的に使用される細胞株においてヒト疾患に関連する遺伝子標的でPE2及びPE3と比較して実質的に高いプライム編集性能を支持することを実証している。

次に、PE4及びPE5編集システムが、遺伝性疾患の細胞モデル及び初代ヒト細胞において評価された。第1に、この対立遺伝子についてヘテロ接合性の患者に由来するヒト人工多能性幹細胞(iPSC)における病原性CDKL5 c.1412delA変異が修正された(Chen et al.,2021)。これらのiPSCのPE3構成要素(in vitro転写されたPE2 mRNA及び合成pegRNA並びにニッキングsgRNA)とのエレクトロポレーションにより、編集可能な病原性対立遺伝子の17％の修正及び20％の総インデル産物が得られた(図46E、図56F)。PE5編集のためのMLH1dn mRNAによるこれらの構成要素の同時エレクトロポレーションは、修正効率を34％に上昇させ、インデルの頻度を6.1％に低下させた。インデルを更に最小化するために、PE4及びPE5b戦略も使用された。相補鎖ニッキングなしでは、MLH1dnは対立遺伝子修正を4.0％(PE2)から10％(PE4)に改善し、インデルはほとんどなかった(＜0.34％)ことが観察された(図46E、図56F)。同様に、PE3bは4.8％インデルで変異対立遺伝子の13％の編集をもたらしたが、PE5bは3.8％インデルで編集を27％に上昇させた。試験したPE4、PE5及びPE5b系にわたって、MLH1dnは、患者由来iPSCにおいて効率が2.2倍及び転帰純度が3.6倍の病原性CDKL5 c.1412delA変異の修正を増強する。

第2に、初代T細胞が、PE2 mRNA、MLH1dn mRNA、並びに合成pegRNA及びニッキングsgRNAで健康なヒトドナーから電気穿孔されて、保護的PRNP G127V変異、FANCFでのG・CからT・Aトランスバージョン、又はRNF2でのTの1bp挿入を導入した。これらの3つの部位において、PE5は、12％インデルで平均41％の編集効率を達成し、PE3での22％の編集効率及び26％インデルから実質的に改善したことが見出された(図46F、図56G)。PE4及びPE5がまた適用されて、HIV感染を防ぐ保護的CXCR4 P191A対立遺伝子(Liu et al.,2018)、及び直交するIL-2 T細胞刺激を可能にするIL2RB H134D Y135Fバリアント(Sockolosky et al.,2018)をインストールした。これらの編集のために、PE4は、PE2よりも対立遺伝子変換の頻度を平均3.6倍増加させ、インデル副産物はほとんどなかった(図46F、図56G)。更に、PE5は、PE3による17％インデルを伴う44％の編集と比較して、11％インデルを伴う平均52％の編集をもたらし、編集:インデル比の2.0倍の改善をもたらした。まとめると、ヒトiPSC及び初代T細胞における6つの部位にわたるこれらの結果は、PE4及びPE5を、遺伝子疾患の研究及び潜在的な処置に関連する細胞型において実質的により大きな編集効率及び結果純度を可能にする増強されたプライム編集システムとして確立する。

考察
プールされたCRISPRiスクリーニングを使用して、MMR活性が置換プライム編集の効率及び結果純度を強く抑制することが発見された。CRISPRiスクリーニングからの結果及び洞察並びにヌクレオチド置換による編集の抑制におけるMMRの役割に基づいて、PE4及びPE5系が開発された。特に、PE4及びPE5系は、MLH1dnを共発現させて、MMRを一過性に阻害し、プライム編集効力を増強し、実質的なオフターゲットゲノム変化を誘導することなくインデルを減少させる。プライム編集因子タンパク質の最適化により、PE4及びPE5系並びにepegRNA(Nelson et al.,2021-参照により本明細書に組み込まれる)と相乗作用してプライム編集性能を更に高め得るPEmaxアーキテクチャが得られた。合わせて、これらの知見によって支持されるプライム編集のDNA修復のためのモデル、プライム編集のボトルネックを回避するために開発されたPE4及びPE5戦略、並びに本明細書に記載される改善されたPEmaxプライム編集因子アーキテクチャは、ゲノムの精密操作のためのプライム編集の有用性を実質的に前進させる。

この研究は、プライム編集が、対応するプライム編集中間体がMMRを回避する能力に起因してより高い効率で、3つ以上の連続塩基のG・CからC・Gトランスバージョン及び置換を包含する特定のタイプの編集をインストールし得ることを明らかにした。編集タイプに加えて、他の特性もまた、標的部位の配列コンテキスト等のMMRに対するプライム編集の感度に影響を及ぼし得た。編集された遺伝子座の状態はまた、MMRが、複製中に初期複製ユークロマチン(Supek and Lehner,2015)並びにラギング鎖DNA(Lujan et al.,2014)をより効率的に修復するので、重要であってもよい。

プライム編集因子とのMLH1dnの同時送達が編集効率及び精度を高めることが実証されているが、MMRによって修復されるプライム編集中間体の種類への洞察と相まってプライム編集結果を決定する際のMMRの役割に関する本明細書に提示される研究は、MLH1dnの発現がなくても、MMRを回避するプライム編集実験を設計することを研究者らに可能にする。例えば、本明細書中に提示されるデータは、更なる近傍のサイレント変異を戦略的にインストールすることにより、PE2系又はPE3系であっても、プライム編集中間体のMMR逆転を回避することによってプライム編集結果を向上させ得ることを示す。MMR阻害のための他のモダリティもまた、プライム編集のために有益であることが判明してもよい。MMRを選択的に標的とする小分子は報告されていないが、化学的阻害剤は、MLH1dn送達によって制限される用途に有用であり、MMR阻害の時間的制御を可能にし得た。長期間にわたってプライム編集因子発現を維持してもよいウイルス送達等の使用のために、RNA干渉は一過性MMRノックダウンのための別の戦略を提供する。

PE4及びPE5系は、患者由来iPSC及び初代T細胞を包含する試験した7つの哺乳動物細胞型においてプライム編集を強力に増強する。PE4は、MMR機能正常細胞型においてPE2よりも平均7.7倍編集効率を高め、相補鎖ニッキングからDSBを生成することなくかなりのレベルの遺伝子編集を独自に可能にする。PEmaxアーキテクチャ及びepegRNAと組み合わせたこの改善は、少しのインデル副産物を維持しながら、PE3の編集頻度を超え得る。したがって、epegRNAを有するPE4maxは、インデル形成を許容し得ないか、又はニッキングsgRNAの送達によって制限される遺伝子編集用途に特に有用であろう。対照的に、PE5は、ほとんどの細胞標的を包含する活性MMRを有する細胞において、PE3よりも編集効率を平均2.0倍上昇させ、編集結果純度を約3倍上昇させる。

実験モデル及び被験体の詳細
不死化細胞株の培養条件
HEK293T細胞、HeLa dCas9-BFP-KRAB細胞、HeLa細胞、HCT116細胞及びN2A細胞が、10％ウシ胎児血清(FBS)(Thermo Fisher Scientific)を添加したダルベッコ修飾イーグル培地(DMEM)＋GlutaMAX(Thermo Fisher Scientific)中で培養された。HeLa dCas9-BFP-KRAB細胞が、10％FBS、100U mL-1ペニシリン及び100μg mL-1ストレプトマイシン(Thermo Fisher Scientific)を補充したDMEM＋GlutaMAX中で培養された。K562 dCas9-BFP-KRAB及びK562細胞が、10％FBS及び1％ペニシリン-ストレプトマイシン-グルタミン100×(Thermo Fisher Scientific)を補充したRoswell Park Memorial Institute(RPMI)1640培地(Thermo Fisher Scientific)中で培養された。全てのHAP1細胞型が、10％FBSを補充したIscoveの修飾ダルベッコ培地(IMDM)及びGlutaMAX(Thermo Fisher Scientific)中で培養された。U2OS細胞が、10％FBS、100 U mL^-1ペニシリン及び100μg mL^-1ストレプトマイシン(Thermo Fisher Scientific)を補充したMcCoyの5A培地(Gibco)中で培養された。HeLa dCas9-BFP-KRAB及びK562 dCas9-BFP-KRAB細胞株が、ショートタンデムリピートマーカー試験によって検証された。全ての細胞型が2～3日毎に継代され、80％未満の細胞密集度が維持され、5％CO₂で37℃で培養され、マイコプラズマについて陰性と試験された。

初代ヒトT細胞の単離
末梢血単核細胞(PBMC)が、Lymphoprep密度勾配培地(STEMCELL Technologies)及びSepMateチューブ(STEMCELL Technologies)を使用する密度遠心分離によって健康なドナー(Memorial Blood Centers in St.Paul,Minnesota)のバフィーコートから単離された。T細胞が、EasySep Human T Cell Isolation Kit(STEMCELL Technologies)を使用してPBMCから単離された。

ヒト患者由来人工多能性幹細胞の培養条件
全てのiPSC培養作業は、施設内ガイドラインに従って、施設承認(IRB＃:P00016119)の下で、Human Neuron Core at Boston Children's Hospitalのスタッフによって実施された。クローンiPS細胞株MAN 0855-01＃A(Coriell Institute＃OR00007)が、X染色体上のヘテロ接合性CDKL5 c.1412delA p.D471fs変異を有する女性CDKL 5欠損症患者から増殖された(Chen et al.,2021)。MAN0855-01＃Aは、cDNAのサンガーシーケンシングによって変異体CDKL5転写物を発現することが以前に検証された。DMEM/F12(Thermo Fisher Scientific)で1:50に希釈され、製造業者のプロトコルに従ってコーティングしたGeltrex(Thermo Fisher Scientific)上のStemFlex培地(Thermo Fisher Scientific)で、MAN0855-01＃A iPS細胞株が培養された。定期的な維持のために、iPS細胞コロニーが、Gentle Cell Dissociation Reagent(STEMCELL Technologies)を用いて80％の集密度で5～7日毎にクランプ継代された。

方法の詳細
一般的な方法及び分子クローニング
プライム編集因子及び他のタンパク質の哺乳動物発現のためのレンチウイルス移入プラスミド及びプラスミドが、ウラシル切除(USER)アセンブリを使用してクローニングされた(Cavaleiro et al.,2015)。簡潔には、ウラシル耐性Phusion U Green Multiplex PCR Master Mix(Thermo Fisher Scientific)を使用して、デオキシウラシル含有プライマー(Integrated DNA Technologies)でDNA断片が増幅された。溶融温度42～60℃の接合部を使用して製造業者のプロトコルに従ってUSER酵素(New England BioLabs)及びDpnI(New England BioLabs)で、デオキシウラシルが組み込まれたDNA断片がアセンブルされ、続いて細胞に形質転換された。全てのプライム編集因子構築物が、CMVプロモータからの構成的発現下でpCMV-PE2ベクター骨格(Anzalone et al.,2019)(Addgene＃132775)にクローニングされた。全てのプライム編集因子構築物はまた、MMLV RT内に以下の変異:D200N、T306K、W313F、T330P、及びL603Wを含有していた。全てのDNA修復タンパク質及びRFP発現構築物が、EF1αプロモータからの構成的発現下でベクターにクローニングされた。ヒトMSH2、MSH6、PMS2及びMLH1配列が、プラスミドpFB1_hMSH2(Addgene＃129423)、pFB1_hMSH6(Addgene＃129424)、pFB1_PMS2(Addgene＃129425)、及びpFB1_MLH1(Addgene＃129426)からサブクローニングされた(Geng et al.,2011)。ヒトCDKN1A配列がプラスミドFlag p21 WT(Addgene＃16240)からサブクローニングされた(Zhou et al.,2001)。ヒト細胞及びマウス細胞発現のためのコドン最適化MLH1配列が、GenSmart Codon Optimization(Genscript)を用いて設計され、gBlock遺伝子断片(Integrated DNA Technologies)として注文された。

pegRNA又はsgRNAの哺乳動物発現のためのプラスミドが、以前に記載されたように(Anzalone et al.,2019)、Golden Gateアセンブリ(Engler et al.,2008)を使用してクローニングされた。簡潔には、製造者のプロトコルに従ってBsaI-HFv2(New England BioLabs)で、ヒトU6プロモータ発現のためのガイドRNAベクター骨格が一晩消化され、QIAquick Gel Extraction Kit(QIAGEN)を使用して1％アガロースゲルでの電気泳動によって、線状化生成物が精製された。スペーサ配列、ガイドRNA足場及び3'伸長のためのオリゴヌクレオチド(Integrated DNA Technologies)がアニーリングされ、製造業者のプロトコルに従ってT4 DNAリガーゼ(New England BioLabs)を用いて線状化U6足場DNAとアセンブルされ、細胞に形質転換された。ガイドRNA足場オリゴヌクレオチドが5'リン酸化修飾と共に購入された。pegRNA及びepegRNAをコードするいくつかのプラスミドは、Twist Bioscienceによって合成された。この研究で使用したpegRNA及びニッキングsgRNAのリストが表7に提供される。

特に明記しない限り、集合したプラスミドはOne Shot Mach1細胞(Thermo Fisher Scientific)に形質転換され、50μg ml^-1カルベニシリン(Gold Biotechnology)を含むルリア-ベルターニ(LB)又は2×YT寒天上で増殖された。プラスミド配列がサンガーシーケンシング(Quintara Biosciences)によって完全に検証され、検証されたプラスミドを含有する細菌が、100μg ml^-1カルベニシリン(Gold Biotechnology)を含む2×YT培地で増殖された。QIAGEN Plasmid Plus Midi Kit又はQIAGEN Plasmid Plus Maxi Kitを使用して、エンドトキシン除去及び緩衝液P1中の2倍の推奨量のRNase Aとともに、プラスミドDNAが単離された。エンドトキシンを除去したPureYield Plasmid Miniprep System(Promega Corporation)を用いて、一部のpegRNA及びsgRNAプラスミドDNAが単離された。PureYield Plasmid Miniprep Systemを使用して精製したプラスミドDNAは、HEK293T及びHeLa細胞トランスフェクションにのみ使用された。全てのプラスミドがヌクレアーゼフリー水(QIAGEN)に溶出し、NanoDrop One UV-Vis分光光度計(Thermo Fisher Scientific)を使用して定量された。

細胞株を作製するためのレンチウイルス生産
安定な細胞株を作製するためにレンチウイルスをパッケージングするために、10％FBSを補充したDMEM中の6ウェルプレート(Corning)に7.5×10⁵細胞/ウェルでHEK293T細胞が播種された。播種の16時間後に60％コンフルエンシーで、細胞は製造業者のプロトコルに従って12μLのリポフェクタミン2000(Thermo Fisher Scientific)及び1.33μgのレンチウイルス移入プラスミド、0.67μgのpMD2.G(Addgene＃12259)、及び1μgのpsPAX2(Addgene＃12260)でトランスフェクトされた。トランスフェクションの6時間後、10％FBSを補充したDMEMと、培地が交換された。トランスフェクションの48時間後、ウイルス上清が3000 gで15分間遠心分離されて細胞片を除去し、0.45μmのPVDFフィルター(Corning)で濾過され、-80℃で保存された。

組み込まれたHBBコーディング領域を有するHEK293Tラインの設計及び構築
EF1αプロモータ(pEF1α)からの発現下でヒトHBBコード領域(CDS)及びPuroR-T2A-BFPマーカーを含有するように、レンチウイルス移入プラスミドが設計及びクローニングされた。このカセットを担持するレンチウイルスが、上記のようにHEK293T細胞から産生された。HBB CDSを安定に組み込むために、10％FBS及び10μg mL^-1ポリブレン(Sigma-Aldrich)を補充したDMEMを含む6ウェルプレート(Corning)中で、6×10⁵個のHEK293T細胞がレンチウイルスに感染された。CytoFLEX S Flow Cytometer(Beckman Coulter)を使用してBFP蛍光が毎日監視されて、0.1のMOI及び単一コピー組み込みを確実にした。2日間の感染後、HEK293T細胞が2μg μL^-1ピューロマイシン(Thermo Fisher Scientific)中で3日間選択され、BFP蛍光を測定することによって安定な形質導入が確認された。得られた細胞株が使用されて、SaPE2との組み込みHBB部位でのプライム編集のためにpegRNAを最適化した。編集を測定するために、組み込まれたHBB CDS遺伝子座の214bpアンプリコンがPCR増幅された。これらのプライマーを用いたゲノムHBB遺伝子座の増幅は、異なるサイズの1064bpアンプリコンを生じる。

CRISPRi sgRNA及びプライム編集標的を有するHeLa株の設計及び構築
ユニバーサルプライム編集部位を含有し、CRISPRi標的化のための対照S.pyogenes sgRNAを発現するように、プライム編集Repair-seqスクリーニングのためのレンチウイルス移入プラスミド骨格(pPC1000)が設計及びクローニングされた。プライム編集部位は、Saccharomyces cerevisiaeゲノムに由来する2つの相補鎖Sa-sgRNAプロトスペーサに隣接する、Sa-pegRNAに対するHBB標的プロトスペーサからなっていた。SaPE2-sgRNA複合体が、SaPE2-pegRNAによって形成されたニックの50bp上流及び50bp下流にニックを入れるように、これらのプロトスペーサが配置された。sgRNA及び編集部位が同じ453bpアンプリコン中でPCRによって増幅され得るように、マウスU6プロモータからの発現下でEGFP標的化対照化S.pyogenes sgRNAの配列に隣接して、この234bp編集部位が配置された。pPC1000はまた、pEF1α-PuroR-T2A-BFP選択マーカーを含有していた。

pPC1000カセットをコードするレンチウイルスは、上記のようにHEK293T細胞から産生された。安定した組み込みのために、10％FBS及び10μg mL^-1ポリブレン(Sigma-Aldrich)を補充したDMEMを含む6ウェルプレート(Corning)において、2.5×10⁵個のHeLa dCas9-BFP-KRAB細胞が、pPC1000レンチウイルスに感染された。CytoFLEX S Flow Cytometer(Beckman Coulter)によりBFP蛍光が監視されて、0.1のMOI及び単一コピー組み込みを確実にした。2日間の感染後、細胞が、2μg μL^-1ピューロマイシン(Thermo Fisher Scientific)中で3日間選択され、BFP蛍光を測定することによって安定した形質導入が確認された。組み込まれたpPC1000配列を有する得られたHeLa dCas9-BFP-KRAB細胞株が使用されて、Repair-seqスクリーニングのためのプライム編集条件、Sa-pegRNA及びSa-sgRNAがパイロット試験された。

HEK293T、HeLa、HCT116及びN2A細胞のトランスフェクション
特に明記しない限り、10％FBSを補充したDMEM＋GlutaMAX中、96ウェルプレート(Corning)に1.6～1.8×10⁴細胞/ウェルでHEK293T細胞が播種された。播種後16～24時間の間に、製造業者のプロトコルに従って、細胞は、60～80％の集密度で、0.5μLのリポフェクタミン2000(Thermo Fisher Scientific)及び200ngのプライム編集因子プラスミド、66ngのpegRNAプラスミド、22ngのsgRNAプラスミド(必要な場合)、並びにRFP又はMMRタンパク質発現のための100ng(必要な場合)でトランスフェクトされた。

アレイ実験のために、10％FBSを補充したDMEM＋GlutaMAX中8×10³細胞/ウェルで96ウェルプレート(Corning)にHeLa dCas9-BFP-KRAB及びHeLa細胞が播種された。播種後16～24時間の間に、細胞は製造業者のプロトコルに従って、60～80％の集密度で、0.3μLのTransIT-HeLa試薬(Mirus Bio)、並びにP2A-BlastR選択マーカーを有する56.25ngのプライム編集因子プラスミド、18.75ngのpegRNAプラスミド、6.25sgRNAプラスミド(必要な場合)、及び28.1ngのヒトコドン最適化MLH1dnプラスミド(必要な場合)でトランスフェクトされた。トランスフェクションの24時間後、10ng μL^-1ブラストサイジン(Thermo Fisher Scientific)が各ウェルに添加されて、プライム編集因子を発現する細胞を選択した。

10％FBSを補充したDMEM＋GlutaMAX中1.6×10⁴細胞/ウェルで96ウェルプレート(Corning)にHCT116細胞が播種された。播種後16～20時間の間に、製造業者のプロトコルに従って、0.5μLのリポフェクタミン3000＋0.8μLのP3000試薬(Thermo Fisher Scientific)、並びにP2A-BlastR選択マーカーを有する200ngのプライム編集因子プラスミド、66ngのpegRNAプラスミド、22ngのsgRNAプラスミド(必要な場合)、及び100ngのMLH1dnプラスミド(必要な場合)を、60～80％のコンフルエンシーで細胞がトランスフェクされた。トランスフェクションの翌日、培地は、10％FBS及び10ng μL^-1ブラストサイジン(Thermo Fisher Scientific)を補充した新鮮なDMEM＋GlutaMAXと交換されて、プライム編集因子を発現する細胞を選択した。

N2A細胞は、10％FBSを補充したDMEM＋GlutaMAX中1.6×10⁴細胞/ウェルで96ウェルプレート(Corning)に播種された。播種後16～20時間の間に、製造業者のプロトコルに従って、60～80％の集密度で、0.5μLのLipofectamine 2000(Thermo Fisher Scientific)及び175ngのプライム編集因子プラスミド、50ngのpegRNAプラスミド、20ngのsgRNAプラスミド(必要な場合)、並びに必要な場合にヒトコドン最適化hMLH1dn又はマウスコドン最適化mMLH1dnをコードする87.5ngのプラスミドで細胞がトランスフェクトされた。ゲノムDNAはトランスフェクションの72時間後に抽出された。

HAP1、K562、及びU2OS細胞のエレクトロポレーション
4×10⁵細胞(プログラムDZ-113)、300ngのPE2-P2A-BSD、100ngのpegRNAプラスミド及び33ngのsgRNAプラスミド(必要な場合)を用いて、SE Cell Line 4 D-Nucleofector X Kit S(Lonza)を製造者のプロトコルに従って使用して、HAP1細胞がヌクレオフェクトされた。ヌクレオフェクション後、細胞は、10％FBSを補充したIMDM＋GlutaMAXを含む48ウェルプレート(Corning)で培養された。ヌクレオフェクションの翌日、培地は、10％FBS及び10ng μL^-1ブラストサイジン(Thermo Fisher Scientific)を補充した新鮮なIMDM＋GlutaMAXと交換されて、プライム編集因子を発現する細胞を選択した。

SF Cell Line 4D-Nucleofector X Kit S(Lonza)を製造者のプロトコルに従って使用して、5×10⁵細胞(プログラムFF-120)、800ngのプライム編集因子プラスミド、200ngのpegRNAプラスミド、83ngのsgRNAプラスミド(必要な場合)及び400ngのMLH1dnプラスミド(必要な場合)で、K562細胞がヌクレオフェクトされた。ヌクレオフェクション後、細胞は、10％FBS及び292μg mL^-1L-グルタミン(Thermo Fisher Scientific)を補充したRPMI 1640培地を含む6ウェルプレート(Corning)で培養された。

2×10⁵細胞(プログラムDN-100)、1600ngのPE2又はPE2-P2A-MLH1dnプラスミド、400ngのpegRNAプラスミド、及び166ngのsgRNAプラスミド(必要な場合)を用いて、SE Cell Line 4 D-Nucleofector X Kit S(Lonza)を製造者のプロトコルに従って使用してU2OS細胞がヌクレオフェクトされた。ヌクレオフェクション後、10％FBSを補充したMcCoyの5A培地を含む12ウェル又は24ウェルプレート(Corning)で細胞が培養された。

ゲノムDNA抽出
特に明記しない限り、HEK293T細胞、HeLa dCas9-BFP-KRAB細胞、HeLa細胞、HCT116細胞、N2A細胞、HAP1細胞、K562細胞及びU2OS細胞が、トランスフェクション又はヌクレオフェクション後72時間培養された後、ゲノムDNAが単離された。細胞は、PBS(Thermo Fisher Scientific)で1回洗浄され、gDNA溶解緩衝液(10mM Tris-HCl、pH8.0;0.05％SDS;800単位μL^-1プロテイナーゼK(New England BioLabs))を用いて37℃で1.5～2時間溶解され、続いて80℃で30分間酵素不活性化された。

ゲノムDNA試料のハイスループットアンプリコンシーケンシング
遺伝子編集を評価するために、2ラウンドのPCRによってゲノムDNA試料から遺伝子座が増幅され、ディープシークエンシングされた。簡潔には、最初のPCR工程(PCR1)は、Illuminaのフォワードアダプター及びリバースアダプターを含有するプライマー(Integrated DNA Technologies)を使用して、目的のゲノム配列を増幅した。各20μLのPCR1反応は、CFX96 Touch Real-Time PCR Detection System(Bio-Rad Laboratories)上で、500 nMの各プライマー、0.8～1.0μLのゲノムDNA、1×SYBR Green(Thermo Fisher Scientific)、及び10μLのQ5 High-Fidelity 2×Master Mix(New England BioLabs)を用いて、以下の熱サイクリング条件:98℃で2分間、29～31サイクルの［98℃で10秒、61℃で20秒、72℃で30秒］、続いて72℃で2分間行われた。過剰増幅を避けるために、SYBR Green蛍光でPCR1反応が監視された。PCR1反応に使用されるプライマーのリストが表8に提供される。

その後のPCR工程(PCR2)は、PCR1 DNA断片の両端に固有のi7及びi5 Illuminaバーコードの組み合わせを付加して、試料の逆多重化を可能にした。各12.5μLのPCR2反応を、500nMの各バーコードプライマー、0.5μLのPCR1産物、及び6.25μLのPhusion U Green Multiplex PCR Master Mix(Thermo Fisher Scientific)を用いて、以下の熱サイクリング条件で行った:98℃で2分間、9サイクルの［98℃で15秒、61℃で20秒、72℃で30秒］、続いて72℃で2分間。PCR2産物が、共通アンプリコンによってプールされ、1％アガロースゲル上での電気泳動によって分離され、QIAquick Gel Extraction Kit(QIAGEN)を使用して精製され、ヌクレアーゼフリー水に溶出された。DNAアンプリコンライブラリーが、Qubit 3.0 Fluorometer(Thermo Fisher Scientific)を用いて定量され、次いで、MiSeq Reagent Kit v2又はMiSeq Reagent Micro Kit v2(Illumina)を用いて、280回～300回のシングルリードサイクルで配列決定された。この研究で生成されたFASTQ配列決定ファイルのリストが表7に提供される。

アンプリコン配列決定データの定量
図42A～図54Bからの全ての配列されたプライム編集実験が以下のように分析された。配列決定リードは、MiSeq Reporter(Illumina)を使用して逆多重化された。アンプリコン配列は、パラメータ「-q30」及び「-discard_indel_reads TRUE」を使用して標準モードでCRISPResso2(Clement et al.,2019)により参照配列にアラインメントされた。各アンプリコンについて、CRISPResso2定量ウィンドウは、pegRNA-及びsgRNA-指向性Cas9切断部位の間の全配列、並びに両方の切断部位を超えて更に≧10-ntを包含するように配置された。各アンプリコンについて、ニッキングsgRNAが使用されるかどうかにかかわらず、PE2、PE3、PE4、及びPE5条件に対して同じ定量ウィンドウが使用された。全てのプライム編集効率は、(インデルを含有しない意図された編集を有するリードの数)/(アンプリコンに整列するリードの数)のパーセンテージを表す。単一塩基置換プライム編集頻度は、(参照アラインメントされた破棄されないリードにおける意図された塩基置換の頻度)×(参照アラインメントされた破棄されないリードの数)/(参照アラインメントされたリードの数)として定量された。他の全てのプライム編集(挿入、欠失、連続置換、編集の組み合わせ)については、CRISPResso2をHDRモードで、上記の全ての同じパラメータで実行され、意図した編集結果を予想される対立遺伝子(-e)として使用した。これらの編集の頻度を、(HDR整列リードの数)/(参照整列リードの数)として定量された。全てのインデル頻度を、(インデル含有リードの数)/(参照アラインメントされたリードの数)として定量された。

CRISPRiライブラリーのクローニング及びレンチウイルス産生
CRISPRi sgRNAのオリゴヌクレオチドライブラリー、oBA697は、遺伝子当たり3つのsgRNAで477個のDNA修復遺伝子を標的とする60個の非標的化対照sgRNA及び1,513個のsgRNAを含有するように設計された(Hussmann et al.,2021)。sgRNAライブラリー中の標的遺伝子及び配列のリストは表5に提供される。oBA697オリゴヌクレオチドライブラリーは、Phusion High-Fidelity DNA Polymerase(New England BioLabs)を使用してPCRによって増幅され、NucleoSpin Gel及びPCR Clean-upキット(Macherey-Nagel)で精製された。増幅されたCRISPRiライブラリーインサート及び事前に検証されたプライム編集部位を含有するpPC1000レンチウイルススクリーンベクターはBstXI及びBlpI制限エンドヌクレアーゼ(Thermo Fisher Scientific)で消化され、T4リガーゼ(New England BioLabs)で連結され、次いで、Stellar細胞(Takara Bio)に形質転換された。プールしたプラスミドライブラリーはMegaX DH10Bエレクトロコンピテント細胞(Thermo Fisher Scientific)で増幅された。プールされたライブラリー配列は、MiSeq Reagent Kit v2(Illumina)での配列決定によって更に検証された。

pPC1000ライブラリーを有するレンチウイルスを産生するために、HEK293T細胞は、10％FBSを補充したDMEMを含む15cmディッシュに播種された。播種の1日後、HIV-1 gag/pol、rev、tat及びVSV-Gエンベロープタンパク質の発現のために、15μgのpPC1000プラスミドライブラリー及び5μgのパッケージングプラスミドを含む60μLのTransIT-LT1試薬(Mirus Bio)を使用して細胞がトランスフェクトされた。トランスフェクションの24時間後、40μLのViralBoost試薬(ALSTEM)が各15cmディッシュに添加された。トランスフェクションの48時間後、ウイルス上清が回収され、0.45μm PVDFフィルター(Corning)で濾過され、-80℃で保存された。

HeLa細胞におけるRepair-seqスクリーニング
PE2、PE3＋50、PE3-50 Repair-seqスクリーニングが、組み込まれたdCas9-BFP-KRAB(Addgene＃46911)を有するHeLa細胞において生物学的複製で行われた(Gilbert et al.,2013)。CRISPRiライブラリーを含有するレンチウイルスが、上記のようにHEK293T細胞から産生された。10％FBS、100U mL^-1ペニシリン、100μg mL^-1ストレプトマイシン(Thermo Fisher Scientific)及び8μg mL^-1ポリブレン(Sigma-Aldrich)を補充したDMEM中0.1 MOIでレンチウイルスライブラリーで、dCas9-KRABを発現するHeLa CRISPRi細胞が形質導入された。感染の2日後、HeLa CRISPRi細胞が1μg mL^-1ピューロマイシン(Thermo Fisher Scientific)で処理されて、ライブラリーメンバーが組み込まれたHeLa CRISPRi細胞を選択した。感染の3日後、更に2μg mL^-1ピューロマイシンが細胞に添加された。レンチウイルス形質導入及び選択工程を通して、細胞がBD LSRIIフローサイトメーターでBFP蛍光について分析されて、0.1のMOIを確保し、選択を完了した。3日間の選択後、培地は10％FBSを補充したDMEMに交換され、HeLa CRISPRi細胞は、製造業者のプロトコルに従って140μLのTransIT-HeLa試薬(Mirus Bio)を使用して、30μgのSaPE2-P2A-BSDプラスミド、事前に検証された編集部位に＋6 G・CからC・Gへの編集をインストールするための10μgのSa-pegRNAプラスミド、及び＋50又は-50の相補鎖ニッキングのための3.3μgのSa-sgRNAプラスミド(必要な場合)で、150mm培養皿(Corning)において50％のコンフルエンシーでトランスフェクトされた。未編集のHeLa対照条件では、上記のように30μgのSaPE2-P2A-BSDプラスミドのみで細胞がトランスフェクトされた。トランスフェクションの24時間後、細胞は10μg mL^-1ブラストサイジン(Thermo Fisher Scientific)で処理されて、SaPE2タンパク質の発現を選択した。トランスフェクションの72時間後、HeLa CRISPRi細胞はPBS(Thermo Fisher Scientific)で洗浄され、トリプシン及びDMEMを用いて再懸濁され、1000gで10分間ペレット化された。最後に、細胞はPBSでもう一度洗浄され、1000gで10分間ペレット化され、次いで、-80℃で保存された。

K562細胞におけるRepair-seqスクリーニング
PE2及びPE3＋50 Repair-seqスクリーニングが、dCas9-BFP-KRAB(Addgene＃46911)が組み込まれたK562細胞において生物学的二連で行われた(Gilbert et al.,2014)。CRISPRiライブラリーを含有するレンチウイルスが、上記のようにHEK293T細胞から産生された。dCas9-KRABを発現するK562 CRISPRi細胞が、10％FBS、100U mL^-1ペニシリン、100μg mL^-1ストレプトマイシン、292μg mL^-1L-グルタミン及び8μg mL^-1ポリブレン(Sigma-Aldrich)を補充したRPMI中0.2 MOIで、室温で2時間、1000gで遠心分離することによってレンチウイルスライブラリーで形質導入された。感染の2日後、K562 CRISPRi細胞が、3μg mL^-1ピューロマイシン(Thermo Fisher Scientific)で処理されて、ライブラリーメンバーが組み込まれた細胞を選択した。感染後、K562 CRISPRi細胞の密度が約5×10⁵mL^-1に維持され、培養物は、感染の3日後及び5日後に、10％FBS、100U mL^-1ペニシリン、100μg mL^-1ストレプトマイシン、292μg mL^-1L-グルタミン及び3μg mL^-1ピューロマイシンを補充した新鮮RPMIで置き換えられた。培地交換中、細胞はペレット化され、DPBSで洗浄され、新鮮な培地に再懸濁されて死細胞を除去した。細胞喪失を回避するために50mLのカノニカルチューブにおいて、全ての遠心分離が150 gで5分間行われた。感染の6日後、死細胞及び抗生物質を除去するために、培養物は、10％FBS及び292μg mL^-1L-グルタミン(Thermo Fisher Scientific)を補充した新鮮RPMIで2回交換された。レンチウイルス形質導入及び選択工程を通して、細胞は、Attune NxTフローサイトメーターでBFP蛍光について分析されて、0.2のMOIが確保され、選択が完了された。感染の7日後、SE Cell Line 4D-Nucleofector X kit L(Lonza)を使用して、1×10⁷個の細胞(program FF-120)、7.5μgのSaPE2プラスミド、事前に検証された編集部位に＋6 G・CからC・Gへの編集をインストールするための2.5μgのSa-pegRNAプラスミド、及び＋50相補鎖ニッキングのための3.3μgのSa-sgRNAプラスミド(PE3＋50条件の場合)で、細胞がクレオフェクトされた。未編集のK562対照条件では、細胞は上記のようにDNAプラスミドなしで擬似電気穿孔された。ヌクレオフェクション後、10％FBS及び292μg mL^-1L-グルタミンを添加したRPMIに5×10⁵mL^-1の密度で細胞が播種された。ヌクレオフェクションの48時間後、細胞が凝集するのを防ぐために培養物は上下に5回ピペッティングされた。ヌクレオフェクションの84時間後、細胞は1000gで10分間ペレット化され、DPBSで洗浄され、1000gで10分間ペレット化され、次いで-80℃で保存された。

Repair-seqライブラリーのハイスループット配列決定
編集されたHeLa CRISPRi及びK562 CRISPRi細胞からのゲノムDNAが、NucleoSpin Blood XL Maxiキット(Machery-Nagel)を使用して抽出された。各Repair-seq条件についてゲノムDNAを抽出した生細胞の数が表9に列挙される。

ゲノムDNAが最初のPCR(PCR1)の鋳型として使用されて、目的の領域を増幅した。各試料について、以下のサーモサイクラー条件:98℃で30秒間、22サイクルの［98℃で10秒間、65℃で75秒間］、続いて65℃で5分間、BioRad C1000サーマルサイクラーで、pPC1000 sgRNA及び編集部位を増幅するための1μLの100μMの各プライマー(表8)、鋳型としての10μgのゲノムDNA、50μLのNEBNext Ultra II Q5 Master Mix(New England BioLabs)、及び分子生物学グレードの水(Corning)を用いて100μLのPCR1反応が行われた。これらの増幅反応は、TBEゲル電気泳動及び臭化エチジウム染色によって検証された。増幅産物は、SPRIselect(Beckman Coulter)を使用して精製された後、次の一連のPCR増幅(PCR2)を行った。精製したPCR1アンプリコンは、Agilent 2100 Bioanalyzerで高感度DNAチップ(Agilent Technologies)を用いて定量された。PCR2は、i7及びi5 Illuminaバーコードを付加することによって試料のインデックス付けを可能にした。各50μLのインデックス付けPCR2反応について:10ngのPCR 1アンプリコンは、25μLのKAPA HiFi HotStart ReadyMix(Roche Molecular Systems)、3μLの10μMの各バーコードプライマーと共に、以下のサーモサイクラー条件:95℃で3分間、［98℃で20秒間、65℃で15秒間、72℃で15秒間］を8サイクル、続いて72℃で1分間と共に鋳型として使用された。反応は、TBEゲル電気泳動及び臭化エチジウム染色によって検証された。4つのPCR2産物からのPCR2産物は、SPRIselectを用いて精製され、プールする前にAgilent 2100 Bioanalyzerで定量された。2つの8-ntインデックスリード、R1リードについては44サイクル、R2リードについては263サイクルによるNovaSeq 6000 S1 Reagent Kit v1.5(Illumina)を用いて、Repair-seqライブラリーが配列決定された。各スクリーニング条件及び複製について取得されたシーケンシングリードの数が表9に列挙される。

Repair-seqスクリーンデータの処理
Repair-seqスクリーンデータが、(Hussmann et al.,2021)に記載される分析アプローチの修飾版を使用して処理され、この実施例で使用される異なるライブラリー調製戦略(増幅前のUMIのライゲーションなしのゲノムDNAの方向増幅)及びプライム編集データで経験的に観察された定性的に異なるカテゴリーの修復結果に対応するように修正がなされた。

簡潔には、スクリーニングのバッチの配列決定データは、スポット当たり4つのリード:2つの8-ntのインデックスリード、CRISPRi sgRNAの44-ntのR1リード、及び修復結果の263-ntのR2リードからなる。スクリーンのバッチからのリードは、インデックスリードに基づいて個々のスクリーンに分離される。各スクリーニング内で、R1配列を予想されるCRISPRi sgRNAの表と比較することによって、個々のCRISPRi sgRNAを受け取る細胞からの結果を表すセットにリードが分離され、観察された配列と予想される配列との間の最大1つのミスマッチを可能にする。UMIを用いない直接増幅は、各修復結果の複数のリードのコンセンサスエラー修正を可能にしないので、分析は、PCR又は配列決定によって導入される結果配列におけるエラーの存在を考慮して、そのようなエラーを真の編集結果として解釈することを回避しなければならない。最初のトリアージとして、30以上の品質スコアを有するベースコールの60％未満のリードが破棄された。

この品質フィルターを通過した修復結果配列決定リードをカテゴリー化するために、結果は、最初にスクリーンベクター、pegRNA配列、ヒトゲノム(hg19)及びbosタウラスゲノム(bosTau7)に局所的にアラインメントされて、結果配列の部分とこれらの参照配列のいずれかとの間の包括的な一組のアラインメントを同定した。次いで、同定された局所アラインメントのセットは、貪欲なアプローチを使用して最小数のアラインメントを使用して可能な限り多くのリードを説明する倹約アラインメントのセットにプルーニングされた。次いで、その結果をカテゴリーに割り当てるためにそれらの構成を調べる決定木を介して、倹約整列が解析される。

結果は、プログラムされたニックの5-nt内に入らない1-ntの欠失を除いて、プログラムされたSNV又は任意のインデルを含有しないスクリーンベクターに対する単一のアラインメントからなる場合、未編集として分類され、配列決定又はPCRエラーの可能性があると考えられ、無視された。結果が、まとめてリード全体をカバーするが、スクリーンベクターのセグメントを省いた、スクリーンベクターに対する2つのアラインメントからなる場合、結果は欠失として分類された。結果が、リード上の任意の2つの連続したアラインメントによってカバーされるスクリーンベクターの部分が重複するように、リード全体を集合的にカバーするスクリーンベクターに対する2つ以上のアラインメントからなる場合、結果は、タンデム重複として分類された。pegRNAのプライマー結合部位(PBS)がスクリーンベクターアラインメントにおけるPBSと同じリードの部分にアラインメントされたが、pegRNAの逆転写鋳型(RTT)がスクリーンベクターアラインメントにおけるRTTと同じリードの部分にアラインメントされなかったように、一組の節約アラインメントがpegRNAへのアラインメントを包含する場合、結果は、意図しない位置でのpegRNA配列の結合として分類された。いくつかのそのような場合において、産生された配列はまた、PAM又はプロトスペーサを破壊しない最初の欠失又は重複からなる多段階編集事象と理論的に一致し、その後、得られた修飾された標的配列のpegRNA依存的編集が続くことに留意されたい。PBS及びRTTの両方が、リード全体をカバーするスクリーンベクターに対する単一のアラインメントでPBS及びRTTと同じリード部分にアラインメントされるように、且つ、pegRNAアラインメントが、スクリーンベクターアラインメントよりも結果に対して少ない編集を含有するように、一組の倹約アラインメントが、pegRNAに対するアラインメントを包含する場合、結果は、ほぼ一致した足場配列からの更なる編集のインストールとして分類された。

結果頻度のCRISPRi誘発性変化の定量化
全てのCRISPRi sgRNAの全ての転帰のカテゴリー化に続いて、各sgRNAの各カテゴリーのカウントは、下流分析のためにマトリックスに収集され、非標的化sgRNAを受けた細胞からの全ての転帰にわたる各カテゴリーの総頻度が計算されて、乱されていないベースライン頻度を確立する。全てのCRISPRi sgRNAが高レベルのノックダウンを達成するわけではないので、結果のカテゴリーに対するCRISPRi sgRNAの遺伝子レベルの効果の計算は、遺伝子を標的とする全てのsgRNAが高い活性を有するわけではないとしても、遺伝子を不利にすることなく、遺伝子当たり複数のsgRNAによって支持される表現型に高い信頼性を割り当てることの間のバランスをとらなければならない。これを行うために、所与のスクリーン・複製(図40E～図40G、図41E～図41H、図47A～図47I)における結果カテゴリー頻度の遺伝子レベル変化は、まず、全ての非標的化sgRNAにわたる組み合わせ頻度に対する全ての標的化sgRNAのカテゴリー頻度のlog2倍変化を計算することによって計算される。次いで、各遺伝子について、遺伝子レベルのlog2倍数変化は、最も極端な絶対値を有する遺伝子を標的とする2つのsgRNAについてのこれらの値の平均と見なされる。極値を選択するこのプロセスによって真正シグナルの非存在下で生成される値の範囲の定性的推定値を提供するために、60個の非標的化sgRNAが3つの擬似遺伝子の20セットにランダムに分配され、同じプロセスがこれらの擬似遺伝子に適用された。

欠失境界の定量
欠失頻度の位置特異的プロファイルの計算及びプログラムされたニックのはるか外側の配列を除去した欠失の相対的割合におけるシグナル対ノイズを最大化するために、各遺伝子を標的とする全てのsgRNAからの結果が一緒にグループ化された。そのような結果の各グループでは、スクリーンベクトル内の全ての位置のカウントの整列が0に初期化された。欠失として分類された各リードについて、欠失された最初の位置から欠失された最後の位置までの間隔は、カウントの整列において1だけ増分された。次いで、最終的なカウントの整列が結果の総数で除算された。ミクロ相同性に隣接する欠失は、欠失境界の2つ以上の縮重対と一致する配列結果をもたらす。これらの欠失について、スクリーンベクトルの座標系において最小値を有する対が任意に選択された。プライマー二量体又は他の非特異的増幅産物が長い欠失として誤って同定されるのを防ぐために、欠失領域がいずれかのアンプリコンプライマーの周りの10-ntのウィンドウと重複する見かけの欠失が、欠失境界統計の計算から除外された。

記録されたSa-pegRNA足場の設計
実行されたRepair-seqスクリーンでは、ほぼ一致した足場シーケンスから追加の編集がインストールされる意図しない編集結果が観察された。この結果は、意図された＋6 G・CからC・Gトランスバージョンに加えて、＋17 T・AからC・G及び＋19 C・G挿入を含有する。これらの意図しない編集は、Sa-pegRNA足場配列の逆転写から生成された伸長された3'DNAフラップのゲノムへの組み込みと一致する。この伸長した3'フラップは、最後に編集されたヌクレオチドの後のゲノム標的配列と5-ntの相同性(5'-GCCAA-3')を共有するので、この相同性を破壊すると、Sa-pegRNA足場の逆転写からこれらの意図しない編集を組み込む頻度を減少させ得ると仮定された。したがって、同じ塩基対形成相互作用を維持しながら、Sa-pegRNA足場内の2つの塩基対を変化させる記録されたSa-pegRNAが設計された。この記録されたSa-pegRNAによって鋳型化された伸長した3'フラップは、ゲノム標的配列との相同性を低下させている。記録されたSa-pegRNAのスペーサ、PBS及びRT鋳型配列は、Repair-seqスクリーニングで使用されるSa-pegRNAのものと同一である。この記録されたSa-pegRNAによるプライム編集は、Repair-seqスクリーニングで使用された元のSa-pegRNAと比較して、同様の頻度の意図した編集を媒介するが、意図しない足場配列の組み込みを実質的に減少させることが観察された。

HEK293T siRNAトランスフェクション
図42Cの実験のために、HEK293T細胞は、10％FBSを補充したDMEM＋GlutaMAX中の6ウェルプレート(Corning)に7.5×10⁵細胞/ウェルで播種された。播種の16時間後に60％コンフルエンシーで、9μLのリポフェクタミンRNAiMAX(Thermo Fisher Scientific)及び90pmolのON-TARGETplus SMARTpool siRNA(Horizon Discovery)を用いて細胞がトランスフェクトされた。トランスフェクションの1日後、培地は、10％FBSを補充した新鮮なDMEM＋GlutaMAXで置き換えられた。トランスフェクションの2日後、細胞はPBSで1回洗浄され、TrypLE(Thermo Fisher Scientific)及び10％FBSを補充したDMEM＋GlutaMAXを用いて再懸濁された。次いで、HEK293T細胞は、96ウェルプレート(Corning)に2.5×10⁴細胞/ウェルで播種された。播種後16～24時間の間に、製造業者のプロトコルに従って、細胞は60～80％の集密度で、0.5μLのリポフェクタミン2000(Thermo Fisher Scientific)、200ngのプライム編集因子プラスミド、66ngのpegRNAプラスミド、22ngのsgRNAプラスミド(必要な場合)、及び最初のトランスフェクションで使用した同じON-TARGETplus SMARTpool siRNA 5pmolを用いてトランスフェクトされた。対照条件では、両方のトランスフェクションにおいて細胞は非標的siRNAで処理された。図49Fの実験では、PE成分及びsiRNAによる2回目のトランスフェクションのみが行われた。2回目のトランスフェクション後、ゲノムDNA抽出前に細胞は72時間培養された。リアルタイム定量PCR
RNAiノックダウン(図49E)を測定するために、RNAは、2回目のsiRNAトランスフェクションの72時間後にHEK293T細胞から単離され、1:50 DNaseIを含有する溶解溶液を使用して10～15分間細胞溶解してゲノムDNAを完全に消化するSYBR Green Fast Advanced CellsからCT Kit(Thermo Fisher Scientific)を使用してcDNAに変換された。他の全ての工程は、製造業者のプロトコルに従って実施された。各20μLのqPCR反応は、500 nMの各プライマー、2μLのcDNA、1×SYBR Green(Thermo Fisher Scientific)、及び10μLのQ5 High-Fidelity 2×Master Mix(New England BioLabs)を用いて、CFX 96 Touch Real-Time PCR Detection System(Bio-Rad Laboratories)で、以下の熱サイクリング条件:98℃で2分間、及び40サイクルの［98℃で15秒、65℃で20秒、72℃で30秒］を用いて、技術的及び生物学的に三連で行われた。β-アクチン(ACTB)は、各qPCR反応におけるcDNAの量を正規化するハウスキーピング遺伝子として機能した。遺伝子ノックダウンからの相対的RNA存在量は、2^-ΔΔCT法による非標的siRNA対照と比較して計算された。qPCR反応に使用されるプライマーのリストは表8に提供される。

HEK293T細胞におけるプラスミドトランスフェクション用量滴定
図50Bの実験のために、HEK293T細胞は、10％FBSを補充したDMEM＋GlutaMAX中1.6-1.8×10⁴細胞/ウェルで96ウェルプレート(Corning)に播種された。播種後16～24時間の間に、製造業者のプロトコルに従って、細胞は60～80％の集密度で0.5μLのリポフェクタミン2000(Thermo Fisher Scientific)及び66ngのpegRNAプラスミド、0～200ngのPE2プラスミド、及びMLH1dn又はRFPプラスミドについて0～100ngでトランスフェクトされた。pUC19フィラープラスミドは、PE2、MLH1dn及びRFPプラスミドと異なる量で組み合わされて、トランスフェクトされた全プラスミドの一定量(366ng)を維持した。総編集因子及びトランスタンパク質の量を一緒に変化させる滴定では、PE2プラスミドは、MLH1dn及びRFPと共に2:1の質量比で使用された。ゲノムDNAはトランスフェクションの72時間後に細胞から単離された。

MLH1ノックアウトHeLa細胞クローンの作製
1つのクローン野生型HeLa細胞株及び2つのクローンΔMLH1 HeLa株が使用されて、MLH1dn発現からのプライム編集増強とMLH1ノックアウトを比較した(図50F)。クローン株を生成するために、HeLa細胞は、10％FBSを補充したDMEM＋GlutaMAX中、6ウェルプレート(Corning)に2.5×10⁵細胞/ウェルで播種された。播種の18時間後に60％コンフルエンシーで、細胞は、2μgのpLX_331-Cas9(ブラストサイジンマーカーを有するSpCas9、Addgene＃96924)及び500ngのsgRNAプラスミド(スペーサ、5'-GACAGTGGTGAACCGCATCG-3'(配列番号367))を用いて製造者のプロトコルに従って7.5μLのTransIT-HeLa試薬(Mirus Bio)を用いてトランスフェクトされた。クローン野生型HeLa細胞を対照として作製するために、sgRNAプラスミドの代わりに500ngのpUC19プラスミドがトランスフェクトされた。トランスフェクションの24時間後、10ng μL^-1ブラストサイジン(Thermo Fisher Scientific)が各ウェルに添加されて、Cas9でトランスフェクトした細胞を選択した。

トランスフェクションの3日後、細胞は、10％FBSを補充した馴化DMEM＋GlutaMAXを含む96ウェルプレートに1細胞/ウェルで播種された。単一クローンが成長され、18日間増殖された。ΔMLH1細胞が二対立遺伝子MLH1フレームシフト変異を含有し、対照細胞が野生型遺伝子型を含有することを検証するために、クローンゲノムDNA由来のMLH1遺伝子座が、上記のようにMiSeq(Illumina)上で配列決定された。HeLaクローン中のMLH1のFASTQ配列決定ファイルは表3に列挙される。HeLa ΔMLH1クローン1はMLH1 c.55_56insA及びc.41_58delinsTAACTTCC対立遺伝子を含有する。HeLa ΔMLH1クローン2は、MLH1 c.55_56insA及びc.20_66del対立遺伝子を含有する。これらのクローンHeLa株を用いた全てのプライム編集実験が、HeLa細胞について上記のように行われた。

連続置換及び更なるサイレント変異のプライム編集
1～5個の連続する塩基(合計35個の編集)を置換する7セットのプライム編集が、HEK293T細胞における5つの遺伝子座にわたって試験された。連続置換の各セット内で、5回の編集は全て、pegRNAプロトスペーサのシード領域内の少なくとも1つの塩基(＋1～3ヌクレオチド)、pegRNAプロトスペーサのPAM配列内の少なくとも1つの塩基(＋5 G又は＋6 G)を変更したか、又はシード領域又はPAM配列内の塩基を全く変更しなかった。シード領域又はPAMシーケンスを変更するプライム編集がより効率的に行われるので、これらの連続的な置換編集の設計は、編集効率に対するこれらの交絡効果を制御し、それによって各セット内の編集効率の比較を可能にする。

HEK293T細胞における6つの遺伝子標的にわたって、更なるサイレント変異を伴う又は伴わないコード変化をプログラムする6セットのプライム編集(合計27の編集)が試験された。6つのコード編集の各々は、pegRNAプロトスペーサのPAMヌクレオチドの1つ(＋5 G又は＋6 G)でトランスバージョンを行う。この設計は、(上で説明したように)編集効率に対する混同効果を制御し、各セット内の編集効率の比較を可能にする。サイレント突然変異は、意図されたコード化編集のMMR認識の干渉を最大化するために、意図されたコード化編集に近い(典型的には、意図されたコード化編集から5bp以内)ように設計された。インデルを含まず、追加のサイレント変異を含む又は含まない意図したコード編集を含有するリードの頻度は、上記のようにCRISPResso2を使用して定量された。

Cas9オフターゲット部位におけるプライム編集因子活性の分析
既知のCas9オフターゲット部位におけるプライム編集活性は、上記のようにPE2、pegRNA及びMLH1dn(必要な場合)をコードするプラスミドによるトランスフェクションの3日後にHEK293T細胞由来のゲノムDNAを配列決定することによって決定された。CIRCLE-seq(Tsai et al.,2017)によって以前に検出されたHEK3、EMX1、FANCF及びHEK4スペーサのそれぞれに対する上位4つのオフターゲット部位(合計16部位)が、上記のようにゲノムDNA試料からディープシークエンシングされた。オフターゲット編集を分析するために、パラメータ「-q 30」及び「-w 10」を有する標準モードでCRISPResso2(Clement et al.,2019)を使用して、リードが参照オフターゲットアンプリコンにアラインメントされた。オフターゲットリードは、全ての潜在的な逆転写産物を捕捉するために可能な限り寛容に呼ばれた。各オフターゲット参照アンプリコンについて、Cas9ニック部位(プライマー編集可能標的)のヌクレオチド配列3'は、pegRNA逆転写によってコードされる3'DNAフラップ配列と比較された。5'端から数えて、プライム編集可能な標的配列から逸脱する3'DNAフラップの最小配列は、オフターゲットマーカー配列と命名された。Cas9ニック部位のまさに3'のこのオフターゲットマーカー配列を含有する全ての参照アラインメントされたリード(インデル含有リードを包含する)はオフターゲットリードと呼ばれた。したがって、オフターゲット編集効率は、(オフターゲットリードの数)/(参照アラインメントされたリードの数)のパーセンテージとして定量された。いくつかのアンプリコンについて、関連する編集位置でのミスマッチ率はアンプリコン中の他の位置での率と同等であり、コンテキスト特異的配列決定エラーが明らかなオフターゲットプライム編集に寄与してもよく、したがってこの保存的アプローチがオフターゲット部位でのpegRNA媒介編集の真の率を過大評価してもよいことを示唆した。

ゲノムDNAにおけるマイクロサテライト不安定性の配列決定
マイクロサテライト不安定性は、必要に応じて、HCT116細胞、モノクローナル野生型HAP1細胞、MSH2ノックアウト後2ヶ月間(約60細胞分裂)増殖させたモノクローナルHAP1細胞、PE2-P2A-BSDをコードするプラスミドによるトランスフェクションの3日後のHeLa細胞、pegRNA、及びMLH1dnからのゲノムDNAにおいて評価された。HeLa細胞トランスフェクションは、上記のように行われた。MMR活性に対して非常に感受性であり、腫瘍におけるMMR欠損を診断するために広く使用されている17回のモノヌクレオチドリピート(Bacher et al.,2004;Hempelmann et al.,2015;Umar et al.,2004)は、ゲノムDNA試料からディープシークエンシングされた。第1のPCR反応(PCR1)は、Illuminaフォワードアダプター及びリバースアダプターを含有するプライマー(Integrated DNA Technologies)を使用して、目的のマイクロサテライト配列を増幅した。各20μLのPCR1反応は、CFX 96 Touch Real-Time PCR Detection System(Bio-Rad Laboratories)上で、250 nMの各プライマー、0.8μLのゲノムDNA、1×SYBR Green(Thermo Fisher Scientific)、及び10μLのQ5 High-Fidelity 2×Master Mix(New England BioLabs)を用いて、以下の熱サイクリング条件:98℃で3分間、30サイクルの［98℃で15秒、62℃で30秒、72℃で30秒］、続いて72℃で3分間行われた。同じゲノムDNA試料から増幅された17個全てのPCR1産物がプールされ、0.8×AMPure XPビーズ(Beckman Coulter)で精製され、ヌクレアーゼフリー水で溶出された。PCR1反応に使用されるプライマーのリストが表8に提供される。その後のPCR工程(PCR2)は、PCR1 DNAアンプリコンの両端に固有のi7及びi5 Illuminaバーコードの組み合わせを付加して、試料の逆多重化を可能にした。各20μLのPCR2反応は、CFX 96 Touch Real-time PCR Detection Systemで、500 nMの各バーコードプライマー、25ngのプールされたPCR1産物、1×SYBR Green、及び10μLのQ5 High-Fidelity 2×Master Mixを用いて、以下の熱サイクリング条件:98℃で2分間、8サイクルの［98℃で15秒、61℃で20秒、及び72℃で30秒］、続いて72℃で2分間行われた。全てのPCR2産物はプールされ、0.8×AMPure XPビーズで精製され、ヌクレアーゼフリー水で溶出された。DNAアンプリコンライブラリーは、Qubit 3.0 Fluorometer(Thermo Fisher Scientific)を用いて定量され、次いで、MiSeq Reagent Kit v2(Illumina)を用いて300回のシングルリードサイクルで配列決定された。これらの実験で生成されたFASTQ配列決定ファイルのリストは表7に提供される。

マイクロサテライト不安定性の定量化
分析された17個のマイクロサテライトは全て長いホモポリマーからなる。ホモポリマーで観察される高速の配列決定エラーに対してロバストな方法でこれらのマイクロサテライトの観察された長さを定量するために、各配列決定リードはホモポリマーに隣接すると予想される配列について検索され、次いでホモポリマーの最終長さは、これらの隣接配列間の距離と見なされた。具体的には、各遺伝子座について、アンプリコン内の最長ホモポリマーが同定され、両側の予想される参照配列の20-ntが記録された。配列決定リードは、各リードの最初の20-ntに基づいてそれらの起源遺伝子座に逆多重化された。各遺伝子座に対するリード内で、各シーケンシングリードについて、2つの隣接配列のハミング距離2内の配列の最初の出現が記録された。両方の隣接配列がそれぞれの50-nt以内の予想される相対配向に位置される場合、それらの間の距離が記録された。

iPSC及びT細胞実験で使用されるプライム編集因子及びMLH1dn mRNAのin vitro転写
以前に記載されたように(Nelson et al.,2021)、プラスミドはクローン化されて、不活性化T7プロモータ、続いて5'非翻訳領域(UTR)、コザック配列、PE2又はMLH1dnのコード配列、及び3'UTRをコードした。T7プロモータの不活性化は、mRNA生成中の環状プラスミドテンプレートからの潜在的な転写を妨げる。これらの成分は一緒に、T7プロモータ不活性化を修正し、119-ntのポリ(A)尾部を3'UTRに付加するプライマーを使用して、Phusion U Green Multiplex Master Mix(Thermo Fisher Scientific)でPCR増幅された。得られたPCR産物は、QIAquick PCR Purification Kit(Thermo Fisher Scientific)で精製され、その後のin vitro転写のための鋳型として機能された。CleanCap AG(TriLink Biotechnologies)による共転写キャッピング及びN¹-メチルプソイドウリジン-5'-三リン酸(TriLink Biotechnologies)によるUTPの完全置換を伴うHiScribe T7 High-Yield RNA Synthesis Kit(New England BioLabs)を使用して、PE2及びMLH1dn mRNAが、これらの鋳型から転写された。転写されたmRNAは、2.5M塩化リチウム(Thermo Fisher Scientific)中に沈殿され、70％エタノール中で2回洗浄され、次いで、ヌクレアーゼフリー水に溶解された。得られたPE2及びMLH1dn mRNAは、NanoDrop One UV-Vis分光光度計(Thermo Fisher Scientific)で定量され、-80℃で保存された。

ヒト患者由来人工多能性幹細胞のエレクトロポレーション
エレクトロポレーションの前に、24ウェル培養プレート(Thermo Fisher Scientific)が、ウェル当たりDPBS(Thermo Fisher Scientific)中1:40に希釈した250μLのrhLaminin-521(Thermo Fisher Scientific)でコーティングされ、5％CO₂インキュベーター中37℃で2時間インキュベートされた。エレクトロポレーションのために、70～80％の集密度のiPS細胞コロニーがDPBSで一回洗浄され、5％CO₂インキュベーターにおいて37℃で10分間、予熱したAccutase(Innovative Cell Technologies)で解離された。次に、iPS細胞が穏やかに研和され、滅菌15mLコニカルチューブに移され、次いで等量のDMEM/F12(Thermo Fisher Scientific)と合わされて、解離酵素活性をクエンチした。細胞は300gで3分間ペレット化され、10μMのY-27632(Cayman Chemical)を補充したStemFlex培地(Thermo Fisher Scientific)に再懸濁された。細胞数及び生存率は、Countess II FL Automated Cell Counter(Thermo Fisher Scientific)を使用して決定された。NEON Transfection System 10μLキット(Thermo Fisher Scientific)を用いたエレクトロポレーションのために、2×10⁵個のiPS細胞が300 gで3分間ペレット化され、9μLのNEON緩衝液Rに再懸濁された。細胞溶液は、NEON緩衝液R中の1μgのPE2 mRNA、90 pmolの合成pegRNA(Integrated DNA Technologies)、必要に応じて60pmolの合成sgRNA(Synthego)、及び0～2μgのMLH1dn mRNAの3μL混合物と合わされた。合成pegRNA及びsgRNAは、TEバッファー(10mM Tris-HCl、pH8.0;0.1mM EDTA)に溶解された。模擬対照エレクトロポレーションが、RNAを全く添加しない3μLのNEON緩衝液Rを用いて行われた。エレクトロポレーションの直前に、rhLaminin-521が吸引され、24ウェル当たり10μMのY-27632を補充した250μLの予め温めたStemFlex培地で直ちに置き換えられた。次に、NEON Transfection System(Thermo Fisher Scientific)を使用して、以下のパラメータ:1400V、20ms、1パルスで10μLの組み合わされた細胞及びRNAの混合物がエレクトロポレーションされた。細胞は、ウェル当たり10μMのY-27632を補充した250μLのStemFlex培地を含むrhLaminin-521被覆24ウェルプレートに直ちに播種された。培地は、5μMのY-27632を補充した500μLのStemFlex培地で翌日に交換された。エレクトロポレーションの72時間後、培地は、ウェル当たり500μLのStemFlex培地に交換された。エレクトロポレーションの96時間後に、iPS細胞をDPBSで1回洗浄し、gDNA溶解緩衝液(10mM Tris-HCl、pH8.0;0.05％SDS;800単位μL^-1プロテイナーゼK(New England BioLabs))で37℃で2時間溶解し、続いて80℃で30分間酵素不活性化することによってゲノムDNAが抽出された。全てのiPSCエレクトロポレーションは、技術的な二連及び生物学的な三連で行われた。編集されたCDKL5遺伝子座のアンプリコンシーケンシング後、意図された編集及びインデルの頻度は、上記のように、HDRモードでCRISPResso2を用いて定量された。患者由来のiPSCはc.1412delA対立遺伝子についてヘテロ接合性であったので、意図された編集を有する編集可能な対立遺伝子の頻度は、以下のように定量化された:(編集頻度-モックコントロールにおける編集頻度)/(100-モックコントロールにおける編集頻度)。インデルを有する編集可能な対立遺伝子の頻度は、上記のように定量された:(インデル含有リードの総数)/(アンプリコン整列リードの数)。意図された編集又はインデルを有する編集可能な対立遺伝子の得られた頻度は、技術的複製間で平均され、生物学的三連からの値が示される。

初代ヒトT細胞のエレクトロポレーション
エレクトロポレーションの前に、T細胞は、Dynabeads Human T-Expander CD3/CD28(Thermo Fisher Scientific)で2日間活性化され、T細胞培地(5％ ABヒト血清(Valley Biomedical)、1×GlutaMAX(Thermo Fisher Scientific)、12 mM N-アセチル-システイン(Sigma Aldrich)、50U mL^-1ペニシリン及び50μg mL^-1ストレプトマイシン(Thermo Fisher Scientific)、300IU mL^-1IL-2(Peprotech)並びに5ng mL^-1組換えヒトIL-7(Peprotech)及びIL-15(Peprotech)を添加したX-VIVO 15無血清造血細胞培地(Lonza))中37℃及び5％CO₂で培養された。エレクトロポレーションの5～7時間前にCD3/CD28ビーズが細胞から除去された。NEON Transfection System 10μLキット(Thermo Fisher Scientific)を使用するエレクトロポレーションのために、試料当たり3.0～3.5×10⁵個の細胞が300 gで5分間の遠心分離によってペレット化され、11μLのNEON緩衝液Tに再懸濁された。細胞溶液は、1μgのPE2 mRNA、90 pmolの合成pegRNA(Integrated DNA Technologies)、60 pmolの合成sgRNA(Synthego)、及び0～2μgのMLH1dn mRNAの混合物に添加された。合成pegRNA及びsgRNAは、TEバッファー(10mM Tris-HCl、pH8.0;0.1mM EDTA)に溶解された。模擬対照エレクトロポレーションが、RNAを全く添加しない3μLのNEON緩衝液Tを用いて行われた。NEON Transfection System(Thermo Fisher Scientific)でのエレクトロポレーションは、以下のパラメータ:1,400V、10ms、3パルスを用いて10μLのNEONチップを使用して行われた。細胞は、24ウェルプレート中の600μLの新鮮T細胞培地に播種された。エレクトロポレーションの2日後、Countess II Automated Cell Counter(Thermo Fisher Scientific)を用いて細胞数及び生存率が決定され、1 mLの新鮮なT細胞培地が細胞に添加された。エレクトロポレーションの4日後、細胞は、300 gで5分間の遠心分離によってペレット化され、PureLink Genomic DNA Mini Kit(Thermo Fisher Scientific)を使用して、ヌクレアーゼフリー水での溶出を伴う「哺乳動物細胞溶解物」プロトコルに従ってゲノムDNAが単離された。

定量及び統計分析
各実験の独立した生物学的複製及び技術的複製の数は、図面の簡単な説明又は方法の詳細の節に記載されている。図44Gでは、ノンパラメトリックマンホイットニーU検定が使用されて、HEK293T細胞のプライム編集データをHeLa、K562、及びU2OS細胞のプライム編集データと比較した。
この実施例は、以下に提供される表5～7を参照する。

実施例2:PEmaxの発現
プライム編集を更に改善するために、逆転写酵素(RT)コドン使用頻度、nCas9と逆転写酵素との間のペプチドリンカーの長さ及び組成、NLS配列の位置、組成及び数、並びにSpCas9ドメイン内の突然変異を変化させることによって、PE2タンパク質が最適化された(図55A及び図55B)。試験した20のこのようなバリアントの中で、編集効率の最大の向上は、Genscriptヒトコドン最適化RT、二部分SV40 NLS(Wu et al.,2009)を含有する34aaリンカー、追加のC末端c-Myc NLS(Dang and Lee,1988)、並びにCas9ヌクレアーゼ活性を改善することが以前に示されたSpCas9中のR221K及びN394K突然変異(Spencer and Zhang,2017)を使用するプライム編集因子アーキテクチャで観察された(図54A及び図55A)。この最適化されたプライム編集因子アーキテクチャは、PEmaxと命名された。異なる遺伝子座を標的とする7つの置換編集にわたって、PE2系を用いたPEmaxアーキテクチャ(PE2max)を使用すると、意図した編集の平均頻度が、元のPE2アーキテクチャよりもHeLa細胞で2.3倍及びHEK293T細胞で1.2倍増加した(図55B)。同様に、PEmaxアーキテクチャを使用したPE3(PE3max)は、製品純度を実質的に変化させることなく、平均編集効率をPE3よりもHeLa細胞で3.2倍及びHEK293T細胞で1.2倍増加させた(図54A及び図55A)。

参考文献

均等物及び範囲
クレームにおいて、「a」、「an」、及び「the」等の冠詞は、1又は1より多いことを意味してもよいが、それと反する指示がないか、又はそれとは別に、文脈から明らかでない場合に限る。ある群の1以上のメンバー間に「又は」を包含する態様又は記載は、その群のメンバーのうち、1つ、1つより多いか、又は、全てが、所定の産物又はプロセスに存在するか、それに採用されるか、又はそれとは別に、それに関係があるか、を満たすと考えられるが、それと反する指示がないか、又はそれとは別に、文脈から明らかでない場合に限る。本発明は、その群のうち、正確に1つのメンバーが、所定の産物又はプロセスに存在するか、それに採用されるか、又はそれとは別に、それに関係がある態様を包含する。本発明は、その群のメンバーのうち、1つより多いか又は全てが、所定の産物又はプロセスに存在するか、それに採用されるか、又はそれとは別に、それに関係がある態様を包含する。

更には、本開示は、列挙されたクレームの1以上からの1以上の限定、要素、節、及び記述用語(descriptive terms)が、別のクレーム中へ導入される、全ての変動、組み合わせ、及び順列を包括する。例えば、別のクレームに従属するいずれのクレームも、同じ基本クレームに従属するいずれか他のクレーム中に見出される1以上の限定を包含するように修飾され得る。要素が、例として、マーカッシュ群形式において列挙されたものとして提示されている場合、要素の各下位群もまた開示されており、いずれの要素(単数又は複数)も群から除去され得る。一般に、本発明、又は本発明の側面が、特定の要素及び/又は特長を含むとして見なされる場合、本発明のある側面又は本発明のある態様は、かかる要素及び/又は特長からなるか、又は実質的に次いでなると理解されるべきである。簡潔さを目的として、それらの態様は、本明細書中、in haec verbaで具体的に表明されていない。用語「含むこと(comprising)」及び「含有すること(containing)」が、オープンであることを意図し、追加の要素又は工程の包含を容認することにもまた留意されたい。範囲が与えられるとき、エンドポイントも包含される。更には、別段の指示がないか、又はそれとは別に、文脈及び当業者の理解から明らかでない場合に限り、範囲として表現された値は、いずれか具体的な値、又は本発明の異なる態様において述べられた範囲内の部分範囲を、文脈が明確に別段の指図をしない限り範囲の下限の単位の10倍まで、想定し得る。

本出願は、種々の発行済み特許、公開特許出願、雑誌記事、及び他の公刊物を参照し、これらの全ては参照によって本明細書に組み込まれる。組み込まれる参照のいずれかと本明細書との間に矛盾がある場合、本明細書がコントロールする(control)ものとする。加えて、先行技術に属する本発明のいずれか特定の態様は、クレームのいずれかの1以上からはっきりと除外されてもよい。かかる態様は当業者に知られていると思われるので、それらは、除外が本明細書においてはっきりと表明されていない場合であっても、除外されてもよい。本発明のいずれか特定の態様は、先行技術の存在に関するか否かにかかわらず、いずれかのクレームから、いずれかの理由で除外され得る。

当業者は、本明細書に記載の具体的な態様の多くの均等物を認識するか、又はせいぜいルーチンな実験法を使用して確かめる能力があるであろう。本明細書に記載の本態様の範囲は、上の記載に限定されることを意図されず、むしろ添付のクレームに表明されている通りである。当業者は、以下の態様において定義される通り、本発明の精神又は範囲から逸脱せずに、この記載への種々の変化及び修飾がなされてもよいことを了解するであろう。

Claims

プライム編集によって核酸分子を編集するための方法であって、核酸分子を、プライム編集因子、pegRNA、及びDNAミスマッチ修復経路の阻害剤と接触させ、それによって標的部位に核酸分子に対する1つ以上の修飾をインストールすることを含む、
前記方法。
二本鎖標的DNA配列を編集するための方法であって、二本鎖標的DNAを、(i)プライム編集因子、(ii)プライム編集ガイドRNA(pegRNA)、及び(iii)DNAミスマッチ修復経路の阻害剤と接触させることを含み、
プライム編集因子は、核酸プログラム可能DNA結合タンパク質(napDNAbp)及びDNAポリメラーゼを含み、
pegRNAは、スペーサ配列と、gRNAコアと、DNA合成鋳型及びプライマー結合部位(PBS)を含む伸長アームとを含み、
スペーサ配列は、二本鎖標的DNA配列の標的鎖と相補性の領域を含み、
gRNAコアは、napDNAbpと会合し、
DNA合成鋳型は、二本鎖標的DNA配列の非標的鎖と相補性の領域、及び、標的鎖二本鎖標的DNA配列と比較して1つ以上のヌクレオチド編集を含み、
プライマー結合部位は、二本鎖標的DNA配列の非標的鎖と相補性の領域を含み、
接触させることは、1つ以上のヌクレオチド編集を二本鎖標的DNAにインストールし、それによって二本鎖標的DNAを編集する、
前記方法。
PBSが、標的DNA配列の非標的鎖のニック部位の上流の領域と相補性の領域を含み、ニック部位がnapDNAbpの特徴である、請求項2に記載の方法。
方法が、核酸分子を第2鎖ニッキングgRNAと接触させることを更に含む、請求項1に記載の方法。
プライム編集効率が、DNAミスマッチ修復経路の阻害剤の非存在下でのプライム編集因子及びpegRNAによるプライム編集効率と比較して、DNAミスマッチ修復経路の阻害剤の存在下において、少なくとも1.5倍、少なくとも2.0倍、少なくとも2.5倍、少なくとも3.0倍、少なくとも3.5倍、少なくとも4.0倍、少なくとも4.5倍、少なくとも5.0倍、少なくとも5.5倍、少なくとも6.0倍、少なくとも6.5倍、少なくとも7.0倍、少なくとも7.5倍、少なくとも8.0倍、少なくとも8.5倍、少なくとも9.0倍、少なくとも9.5倍、少なくとも10.0倍、少なくとも11倍、少なくとも12倍、少なくとも13倍、少なくとも14倍、少なくとも15倍、少なくとも16倍、少なくとも17倍、少なくとも18倍、少なくとも19倍、少なくとも20倍、少なくとも21倍、少なくとも22倍、少なくとも23倍、少なくとも24倍、少なくとも25倍、少なくとも26倍、少なくとも27倍、少なくとも28倍、少なくとも29倍、少なくとも30倍、少なくとも31倍、少なくとも32倍、少なくとも33倍、少なくとも34倍、少なくとも35倍、少なくとも36倍、少なくとも37倍、少なくとも38倍、少なくとも39倍、少なくとも40倍、少なくとも41倍、少なくとも42倍、少なくとも43倍、少なくとも44倍、少なくとも45倍、少なくとも46倍、少なくとも47倍、少なくとも48倍、少なくとも49倍、少なくとも50倍、少なくとも51倍、少なくとも52倍、少なくとも53倍、少なくとも54倍、少なくとも55倍、少なくとも56倍、少なくとも57倍、少なくとも58倍、少なくとも59倍、少なくとも60倍、少なくとも61倍、少なくとも62倍、少なくとも63倍、少なくとも64倍、少なくとも65倍、少なくとも66倍、少なくとも67倍、少なくとも68倍、少なくとも69倍、少なくとも70倍、少なくとも71倍、少なくとも72倍、少なくとも73倍、少なくとも74倍、又は少なくとも75倍増加される、請求項1に記載の方法。
インデル形成の頻度が、DNAミスマッチ修復経路の阻害剤の非存在下でのプライム編集因子及びpegRNAによるインデル形成の頻度と比較して、DNAミスマッチ修復経路の阻害剤の存在下において、少なくとも1.5倍、少なくとも2.0倍、少なくとも2.5倍、少なくとも3.0倍、少なくとも3.5倍、少なくとも4.0倍、少なくとも4.5倍、少なくとも5.0倍、少なくとも5.5倍、少なくとも6.0倍、少なくとも6.5倍、少なくとも7.0倍、少なくとも7.5倍、少なくとも8.0倍、少なくとも8.5倍、少なくとも9.0倍、少なくとも9.5倍、少なくとも10.0倍、少なくとも11倍、少なくとも12倍、少なくとも13倍、少なくとも14倍、少なくとも15倍、少なくとも16倍、少なくとも17倍、少なくとも18倍、少なくとも19倍、少なくとも20倍、少なくとも21倍、少なくとも22倍、少なくとも23倍、少なくとも24倍、少なくとも25倍、少なくとも26倍、少なくとも27倍、少なくとも28倍、少なくとも29倍、少なくとも30倍、少なくとも31倍、少なくとも32倍、少なくとも33倍、少なくとも34倍、少なくとも35倍、少なくとも36倍、少なくとも37倍、少なくとも38倍、少なくとも39倍、少なくとも40倍、少なくとも41倍、少なくとも42倍、少なくとも43倍、少なくとも44倍、少なくとも45倍、少なくとも46倍、少なくとも47倍、少なくとも48倍、少なくとも49倍、少なくとも50倍、少なくとも51倍、少なくとも52倍、少なくとも53倍、少なくとも54倍、少なくとも55倍、少なくとも56倍、少なくとも57倍、少なくとも58倍、少なくとも59倍、少なくとも60倍、少なくとも61倍、少なくとも62倍、少なくとも63倍、少なくとも64倍、少なくとも65倍、少なくとも66倍、少なくとも67倍、少なくとも68倍、少なくとも69倍、少なくとも70倍、少なくとも71倍、少なくとも72倍、少なくとも73倍、少なくとも74倍、又は少なくとも75倍減少される、請求項1に記載の方法。
編集結果の純度が、DNAミスマッチ修復経路の阻害剤の非存在下でのプライム編集因子及びpegRNAによる編集結果の純度と比較して、DNAミスマッチ修復経路の阻害剤の存在下において、少なくとも1.5倍、少なくとも2.0倍、少なくとも2.5倍、少なくとも3.0倍、少なくとも3.5倍、少なくとも4.0倍、少なくとも4.5倍、少なくとも5.0倍、少なくとも5.5倍、少なくとも6.0倍、少なくとも6.5倍、少なくとも7.0倍、少なくとも7.5倍、少なくとも8.0倍、少なくとも8.5倍、少なくとも9.0倍、少なくとも9.5倍、少なくとも10.0倍、少なくとも11倍、少なくとも12倍、少なくとも13倍、少なくとも14倍、少なくとも15倍、少なくとも16倍、少なくとも17倍、少なくとも18倍、少なくとも19倍、少なくとも20倍、少なくとも21倍、少なくとも22倍、少なくとも23倍、少なくとも24倍、少なくとも25倍、少なくとも26倍、少なくとも27倍、少なくとも28倍、少なくとも29倍、少なくとも30倍、少なくとも31倍、少なくとも32倍、少なくとも33倍、少なくとも34倍、少なくとも35倍、少なくとも36倍、少なくとも37倍、少なくとも38倍、少なくとも39倍、少なくとも40倍、少なくとも41倍、少なくとも42倍、少なくとも43倍、少なくとも44倍、少なくとも45倍、少なくとも46倍、少なくとも47倍、少なくとも48倍、少なくとも49倍、少なくとも50倍、少なくとも51倍、少なくとも52倍、少なくとも53倍、少なくとも54倍、少なくとも55倍、少なくとも56倍、少なくとも57倍、少なくとも58倍、少なくとも59倍、少なくとも60倍、少なくとも61倍、少なくとも62倍、少なくとも63倍、少なくとも64倍、少なくとも65倍、少なくとも66倍、少なくとも67倍、少なくとも68倍、少なくとも69倍、少なくとも70倍、少なくとも71倍、少なくとも72倍、少なくとも73倍、少なくとも74倍、又は少なくとも75倍増加され、編集結果の純度は、意図された編集/意図されていないインデルの比によって測定される、請求項1に記載の方法。
DNAミスマッチ修復経路の阻害剤が、DNAミスマッチ修復経路の1つ以上のタンパク質(MMRタンパク質)の発現又は機能を阻害する、請求項1に記載の方法。
1つ以上のMMRタンパク質が、MLH1、PMS2(又はMutLアルファ)、PMS1(又はMutLベータ)、MLH3(又はMutLガンマ)、MutSアルファ(MSH2-MSH6)、MutSベータ(MSH2-MSH3)、MSH2、MSH6、PCNA、RFC、EXO1、POLδ及びPCNAからなる群から選択される、請求項8に記載の方法。
1つ以上のMMRタンパク質がMLH1である、請求項8に記載の方法。
MLH1が、配列番号204のアミノ酸配列、又は配列番号204と少なくとも70％、少なくとも75％、少なくとも80％、少なくとも85％、少なくとも90％、少なくとも95％、少なくとも96％、少なくとも97％、少なくとも98％、少なくとも99％、又は最大100％(100％を包含する)の配列同一性を有するアミノ酸配列を含む、請求項10に記載の方法。
阻害剤が、DNAミスマッチ修復経路の1つ以上のタンパク質の活性を阻害する抗体である、請求項8に記載の方法。
阻害剤が、DNAミスマッチ修復経路の1つ以上のタンパク質の活性を阻害する小分子である、請求項8に記載の方法。
阻害剤が、DNAミスマッチ修復経路の1つ以上のタンパク質の活性を阻害する低分子干渉RNA(siRNA)又は低分子非コードマイクロRNAである、請求項8に記載の方法。
阻害剤が、野生型MMRタンパク質の活性を阻害するMMRタンパク質のドミナントネガティブバリアントである、請求項8に記載の方法。
阻害剤が、MLH1の活性を阻害するMLH1のドミナントネガティブバリアントである、請求項8に記載の方法。
MLH1のドミナントネガティブバリアントが、配列番号204に示される野生型MLH1タンパク質と比較してATPaseドメインに1つ以上のアミノ酸置換、挿入及び/又は欠失を含み、1つ以上のアミノ酸変化が、MLH1のドミナントネガティブバリアントのATPase活性を損なうか又は消失させる、請求項16に記載の方法。
MLH1のドミナントネガティブバリアントが、配列番号204に示される野生型MLH1タンパク質と比較してエンドヌクレアーゼドメインに1つ以上のアミノ酸置換、挿入及び/又は欠失を含み、1つ以上のアミノ酸変化が、MLH1のドミナントネガティブバリアントのエンドヌクレアーゼ活性を損なうか又は消失させる、請求項16に記載の方法。
MLH1のドミナントネガティブバリアントが、配列番号204に示される野生型MLH1タンパク質と比較してC末端で切断されている、請求項16に記載の方法。
MLH1のドミナントネガティブバリアントが、配列番号204に示される野生型MLH1タンパク質と比較してN末端で切断されている、請求項16に記載の方法。
MLH1のドミナントネガティブバリアントが、N末端に核局在化シグナル(NLS)及び/又はC末端にNLSを更に含む、請求項16～20のいずれか一項に記載の方法。
ドミナントネガティブバリアントが、(a)MLH1 E34A(配列番号222)、(b)MLH1 Δ756(配列番号208)、(c)MLH1 Δ754-756(配列番号209)、(d)MLH1 E34A Δ754-756(配列番号210)、(e)MLH1 1-335(配列番号211)、(f)MLH1 1-335 E34A(配列番号212)、(g)MLH1 1-335 NLS^SV40(配列番号213)、(h)MLH1 501-756(配列番号215)、(i)MLH1 501-753(配列番号216)、(j)MLH1 461-753(配列番号218)、又は(k)NLS^SV40MLH1 501-753(配列番号223)、あるいは配列番号208～213、215、216、218、222又は223のいずれかと少なくとも70％、少なくとも75％、少なくとも80％、少なくとも85％、少なくとも90％、少なくとも95％、少なくとも96％、少なくとも97％、少なくとも98％、少なくとも99％、又は最大100％(100％を包含する)の配列同一性を有するアミノ酸配列を含むポリペプチドである、請求項16に記載の方法。
ドミナントネガティブバリアント(a)が、E34Aアミノ酸置換;(b)アミノ酸756の欠失;(c)アミノ酸754～756の欠失;(d)E34Aアミノ酸置換及びアミノ酸754～756の欠失;(e)アミノ酸336～756の欠失;(f)E34Aアミノ酸置換及びアミノ酸336～756の欠失;(g)アミノ酸1～500の欠失;(h)アミノ酸1～500の欠失及びアミノ酸754～756の欠失;又は(i)アミノ酸1～460の欠失及びアミノ酸754～756の欠失、を含み、任意選択で、ドミナントネガティブバリアントは、C末端及び/又はN末端に配列KRTADGSEFESPKKKRKVを含むNLSを更に含む、請求項16に記載の方法。
阻害剤が、PMS2の活性を阻害するPMS2のドミナントネガティブバリアントであり、任意選択で、ドミナントネガティブバリアントは、野生型PMS2タンパク質と比較して1つ以上のアミノ酸の置換、挿入及び/又は欠失を含み、任意選択で、ドミナントネガティブバリアントは、野生型PMS2タンパク質と比較して、(a)E705K置換、(b)アミノ酸2～607の欠失、(c)アミノ酸2～635の欠失、(d)アミノ酸1～635の欠失、(e)E41A置換、及び/又は(f)アミノ酸134後の欠失を含む、請求項8に記載の方法。
阻害剤が、MSH6の活性を阻害するMSH6のドミナントネガティブバリアントであり、任意選択で、ドミナントネガティブバリアントは、野生型MSH6タンパク質と比較して1つ以上のアミノ酸の置換、挿入及び/又は欠失を含み、任意選択で、ドミナントネガティブバリアントは、野生型MSH6タンパク質と比較して(a)K1140R置換及び/又は(b)アミノ酸2～361の欠失を含む、請求項8に記載の方法。
阻害剤がCDKN1Aを含む、請求項8に記載の方法。
プライム編集因子がnapDNAbp及びポリメラーゼを含む、請求項1に記載の方法。
napDNAbpが、ヌクレアーゼ活性Cas9ドメイン、ヌクレアーゼ不活性Cas9ドメイン、又はCas9ニッカーゼドメイン若しくはそのバリアントである、請求項27に記載の方法。
napDNAbpが、HNHドメイン中に1つ以上のアミノ酸置換を含むCas9ニッカーゼであり、任意選択で、1つ以上のアミノ酸置換は、H840X、N854X、及び/又はN863Xを含み、Xが元のアミノ酸を除く任意のアミノ酸であり、任意選択で、1つ以上のアミノ酸置換は、H840A、N854A、及び/又はN863Aを含む、請求項27に記載の方法。
napDNAbpが、Cas9、Cas12e、Cas12d、Cas12a、Cas12b1、Cas13a、Cas12c、Cas12b2、Cas13a、Cas12c、Cas12d、Cas12e、Cas12h、Cas12i、Cas12g、Cas12f(Cas14)、Cas12f1、Cas12j(CasΦ)、及びアルゴノートからなる群から選択され、且つ任意選択でニッカーゼ活性を有する、請求項27に記載の方法。
napDNAbpが、配列番号2、4～67、若しくは104のいずれか1つのアミノ酸配列、又は配列番号2、4～67、若しくは104のいずれか1つと少なくとも80％、85％、90％、95％、若しくは99％の配列同一性を有するアミノ酸配列を含む、請求項27に記載の方法。
napDNAbpが、配列番号2若しくは配列番号37(すなわち、PE1及びPE2のnapDNAbp)のアミノ酸配列、又は配列番号2若しくは配列番号37と少なくとも80％、85％、90％、95％、若しくは99％の配列同一性を有するアミノ酸配列を含む、請求項27に記載の方法。
ポリメラーゼがDNA依存性DNAポリメラーゼ又はRNA依存性DNAポリメラーゼである、請求項27に記載の方法。
ポリメラーゼが逆転写酵素である、請求項27に記載の方法。
逆転写酵素がレトロウイルス逆転写酵素であり、任意選択で、逆転写酵素は、モロニーマウス白血病ウイルス逆転写酵素(MMLV-RT)であり、任意選択で、MMLV-RTは、野生型MMLV-RTと比較してD200N、T306K、W313F、T330P及びL603Wから選択される1つ以上のアミノ酸置換を含む、請求項34に記載の方法。
逆転写酵素が、配列番号69～98のいずれか1つのアミノ酸配列、又は配列番号69～98のいずれか1つと少なくとも80％、85％、90％、95％、若しくは99％の配列同一性を有するアミノ酸配列を含み、任意選択で、逆転写酵素は、配列番号105のアミノ酸配列を含む、請求項34に記載の方法。
napDNAbp及びプライム編集因子のポリメラーゼが結合されて融合タンパク質が形成され、任意選択で、napDNAbp及びポリメラーゼは、リンカーによって接続される、請求項27に記載の方法。
リンカーが、配列番号102若しくは118～131のいずれか1つのアミノ酸配列、又は配列番号102若しくは118～131のいずれか1つと少なくとも80％、85％、90％、95％若しくは99％の配列同一性を有するアミノ酸配列を含む、請求項37に記載の方法。
リンカーが、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、38、38、39、40、41、42、43、44、45、46、47、48、49又は50アミノ酸長である、請求項37に記載の方法。
融合タンパク質が、配列番号99若しくは配列番号107のアミノ酸配列、又は配列番号99若しくは配列番号107のいずれか一つと少なくとも80％、85％、90％、95％、若しくは99％の配列同一性を有するアミノ酸配列を含む、請求項37に記載の方法。
プライム編集因子、pegRNA、及びDNAミスマッチ修復経路の阻害剤が、1つ以上のDNAベクター上にコードされる、請求項1に記載の方法。
1つ以上のDNAベクターがAAV又はレンチウイルスDNAベクターを含む、請求項41に記載の方法。
AAVベクターが血清型1、2、3、4、5、6、7、8、9又は10である、請求項42に記載の方法。
プライム編集因子とDNAミスマッチ修復経路の阻害剤とが共有結合されていない、請求項27～36のいずれか一項に記載の方法。
融合タンパク質としてのnapDNAbp、ポリメラーゼ、又はプライム編集因子が、第2のリンカーによってDNAミスマッチ修復経路の阻害剤に更に結合される、請求項27～36のいずれか一項に記載の方法。
第2のリンカーが自己加水分解性リンカーを含み、任意選択で、第2のリンカーは、T2Aリンカー又はP2Aリンカーである、請求項45に記載の方法。
第2のリンカーが、配列番号102、118～131、若しくは233～236のいずれか1つのアミノ酸配列、又は配列番号102、118～131、若しくは233～236のいずれか1つと少なくとも80％、85％、90％、95％、若しくは99％の配列同一性を有するアミノ酸配列を含む、請求項45に記載の方法。
第2のリンカーが、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49又は50アミノ酸長である、請求項45に記載の方法。
標的部位にインストールされた核酸分子に対する1つ以上の修飾が、1つ以上のトランジション、1つ以上のトランスバージョン、1つ以上の挿入、1つ以上の欠失、1つ以上の逆位、又はそれらの任意の組み合わせを含み、且つ任意選択で15bp未満である、請求項1に記載の方法。
1つ以上のトランジションが、(a)TからC;(b)AからG;(c)CからT;及び(d)GからAからなる群から選択される、請求項49に記載の方法。
1つ以上のトランスバージョンが、(a)TからA;(b)TからG;(c)CからG;(d)CからA;(e)AからT;(f)AからC;(g)GからC;及び(h)GからTからなる群から選択される、請求項49に記載の方法。
1つ以上の修飾が、(1)G:C塩基対をT:A塩基対に、(2)G:C塩基対をA:T塩基対に、(3)G:C塩基対をC:G塩基対に、(4)T:A塩基対をG:C塩基対に、(5)T:A塩基対をA:T塩基対に、(6)T:A塩基対をC:G塩基対に、(7)C:G塩基対をG:C塩基対に、(8)C:G塩基対をT:A塩基対に、(9)C:G塩基対をA:T塩基対に、(10)A:T塩基対をT:A塩基対に、(11)A:T塩基対をG:C塩基対に、又は(12)A:T塩基対をC:G塩基対に変更することを含む、請求項1に記載の方法。
1つ以上の修飾が、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24又は25ヌクレオチドの挿入又は欠失を含み、任意選択で、1つ以上の編集が、1～15ヌクレオチドの挿入又は欠失を含む、請求項1に記載の方法。
1つ以上の修飾が、疾患関連遺伝子における疾患に関連する突然変異に対する修正を含む、請求項1に記載の方法。
疾患関連遺伝子が、以下からなる群:心疾患;高血圧;アルツハイマー病;関節炎;糖尿病;癌;及び肥満から選択される多遺伝子性障害に関連される、請求項54に記載の方法。
疾患関連遺伝子が、アデノシンデアミナーゼ(ADA)欠損症;α1アンチトリプシン欠損症;嚢胞性線維症;デュシェンヌ型筋ジストロフィ;ガラクトース血症;ヘモクロマトーシス;ハンチントン病;メープルシロップ尿症;マルファン症候群;神経線維腫症1型;先天性爪甲厚膜;フェニルケトン尿症;重度の複合免疫不全;鎌状赤血球症;スミス・レムリ・オピッツ症候群;トリヌクレオチド反復障害;プリオン病;及びテイ・サックス病からなる群から選択される一遺伝子性障害に関連される、請求項54に記載の方法。
gRNAコアが、標的部位の配列に対して最小の配列相同性を含み、任意選択で、gRNAコアは、1つ以上のヌクレオチド編集の位置の上流又は下流の5、10、15、20、25、30、35、40、45、又は50ヌクレオチドに隣接する二本鎖標的DNAの配列に対して1％、5％、10％、15％、20％、25％、又は30％以下の配列相同性を含む、請求項1～56のいずれか一項に記載の方法。
プライム編集因子、pegRNA、及びDNAミスマッチ修復経路の阻害剤を含む、プライム編集によって核酸分子を編集するための組成物であって、組成物は、標的部位で核酸分子に1つ以上の修飾をインストールすることを可能とする、前記組成物。
組成物が、第2鎖ニッキングgRNAを更に含む、請求項58に記載の組成物。
プライム編集効率が、DNAミスマッチ修復経路の阻害剤の非存在下でのプライム編集因子及びpegRNAによるプライム編集効率と比較して、DNAミスマッチ修復経路の阻害剤の存在下において、少なくとも1.5倍、少なくとも2.0倍、少なくとも2.5倍、少なくとも3.0倍、少なくとも3.5倍、少なくとも4.0倍、少なくとも4.5倍、少なくとも5.0倍、少なくとも5.5倍、少なくとも6.0倍、少なくとも6.5倍、少なくとも7.0倍、少なくとも7.5倍、少なくとも8.0倍、少なくとも8.5倍、少なくとも9.0倍、少なくとも9.5倍、少なくとも10.0倍、少なくとも11倍、少なくとも12倍、少なくとも13倍、少なくとも14倍、少なくとも15倍、少なくとも16倍、少なくとも17倍、少なくとも18倍、少なくとも19倍、少なくとも20倍、少なくとも21倍、少なくとも22倍、少なくとも23倍、少なくとも24倍、少なくとも25倍、少なくとも26倍、少なくとも27倍、少なくとも28倍、少なくとも29倍、少なくとも30倍、少なくとも31倍、少なくとも32倍、少なくとも33倍、少なくとも34倍、少なくとも35倍、少なくとも36倍、少なくとも37倍、少なくとも38倍、少なくとも39倍、少なくとも40倍、少なくとも41倍、少なくとも42倍、少なくとも43倍、少なくとも44倍、少なくとも45倍、少なくとも46倍、少なくとも47倍、少なくとも48倍、少なくとも49倍、少なくとも50倍、少なくとも51倍、少なくとも52倍、少なくとも53倍、少なくとも54倍、少なくとも55倍、少なくとも56倍、少なくとも57倍、少なくとも58倍、少なくとも59倍、少なくとも60倍、少なくとも61倍、少なくとも62倍、少なくとも63倍、少なくとも64倍、少なくとも65倍、少なくとも66倍、少なくとも67倍、少なくとも68倍、少なくとも69倍、少なくとも70倍、少なくとも71倍、少なくとも72倍、少なくとも73倍、少なくとも74倍、又は少なくとも75倍増加される、請求項58に記載の組成物。
インデル形成の頻度が、DNAミスマッチ修復経路の阻害剤の非存在下でのプライム編集因子及びpegRNAによるインデル形成の頻度と比較して、DNAミスマッチ修復経路の阻害剤の存在下において、少なくとも1.5倍、少なくとも2.0倍、少なくとも2.5倍、少なくとも3.0倍、少なくとも3.5倍、少なくとも4.0倍、少なくとも4.5倍、少なくとも5.0倍、少なくとも5.5倍、少なくとも6.0倍、少なくとも6.5倍、少なくとも7.0倍、少なくとも7.5倍、少なくとも8.0倍、少なくとも8.5倍、少なくとも9.0倍、少なくとも9.5倍、少なくとも10.0倍、少なくとも11倍、少なくとも12倍、少なくとも13倍、少なくとも14倍、少なくとも15倍、少なくとも16倍、少なくとも17倍、少なくとも18倍、少なくとも19倍、少なくとも20倍、少なくとも21倍、少なくとも22倍、少なくとも23倍、少なくとも24倍、少なくとも25倍、少なくとも26倍、少なくとも27倍、少なくとも28倍、少なくとも29倍、少なくとも30倍、少なくとも31倍、少なくとも32倍、少なくとも33倍、少なくとも34倍、少なくとも35倍、少なくとも36倍、少なくとも37倍、少なくとも38倍、少なくとも39倍、少なくとも40倍、少なくとも41倍、少なくとも42倍、少なくとも43倍、少なくとも44倍、少なくとも45倍、少なくとも46倍、少なくとも47倍、少なくとも48倍、少なくとも49倍、少なくとも50倍、少なくとも51倍、少なくとも52倍、少なくとも53倍、少なくとも54倍、少なくとも55倍、少なくとも56倍、少なくとも57倍、少なくとも58倍、少なくとも59倍、少なくとも60倍、少なくとも61倍、少なくとも62倍、少なくとも63倍、少なくとも64倍、少なくとも65倍、少なくとも66倍、少なくとも67倍、少なくとも68倍、少なくとも69倍、少なくとも70倍、少なくとも71倍、少なくとも72倍、少なくとも73倍、少なくとも74倍、又は少なくとも75倍減少される、請求項58に記載の組成物。
編集結果の純度が、DNAミスマッチ修復経路の阻害剤の非存在下でのプライム編集因子及びpegRNAによる編集結果の純度と比較して、DNAミスマッチ修復経路の阻害剤の存在下において、少なくとも1.5倍、少なくとも2.0倍、少なくとも2.5倍、少なくとも3.0倍、少なくとも3.5倍、少なくとも4.0倍、少なくとも4.5倍、少なくとも5.0倍、少なくとも5.5倍、少なくとも6.0倍、少なくとも6.5倍、少なくとも7.0倍、少なくとも7.5倍、少なくとも8.0倍、少なくとも8.5倍、少なくとも9.0倍、少なくとも9.5倍、少なくとも10.0倍、少なくとも11倍、少なくとも12倍、少なくとも13倍、少なくとも14倍、少なくとも15倍、少なくとも16倍、少なくとも17倍、少なくとも18倍、少なくとも19倍、少なくとも20倍、少なくとも21倍、少なくとも22倍、少なくとも23倍、少なくとも24倍、少なくとも25倍、少なくとも26倍、少なくとも27倍、少なくとも28倍、少なくとも29倍、少なくとも30倍、少なくとも31倍、少なくとも32倍、少なくとも33倍、少なくとも34倍、少なくとも35倍、少なくとも36倍、少なくとも37倍、少なくとも38倍、少なくとも39倍、少なくとも40倍、少なくとも41倍、少なくとも42倍、少なくとも43倍、少なくとも44倍、少なくとも45倍、少なくとも46倍、少なくとも47倍、少なくとも48倍、少なくとも49倍、少なくとも50倍、少なくとも51倍、少なくとも52倍、少なくとも53倍、少なくとも54倍、少なくとも55倍、少なくとも56倍、少なくとも57倍、少なくとも58倍、少なくとも59倍、少なくとも60倍、少なくとも61倍、少なくとも62倍、少なくとも63倍、少なくとも64倍、少なくとも65倍、少なくとも66倍、少なくとも67倍、少なくとも68倍、少なくとも69倍、少なくとも70倍、少なくとも71倍、少なくとも72倍、少なくとも73倍、少なくとも74倍、又は少なくとも75倍増加され、編集結果の純度は、意図された編集/意図されていないインデルの比によって測定される、請求項58に記載の組成物。
DNAミスマッチ修復経路の阻害剤が、DNAミスマッチ修復経路の1つ以上のタンパク質(MMRタンパク質)の発現を阻害する、請求項58に記載の組成物。
1つ以上のMMRタンパク質が、MLH1、PMS2(又はMutLアルファ)、PMS1(又はMutLベータ)、MLH3(又はMutLガンマ)、MutSアルファ(MSH2-MSH6)、MutSベータ(MSH2-MSH3)、MSH2、MSH6、PCNA、RFC、EXO1、POLδ及びPCNAからなる群から選択される、請求項63に記載の組成物。
1つ以上のMMRタンパク質がMLH1である、請求項63に記載の組成物。
MLH1が、配列番号204のアミノ酸配列、又は配列番号204と少なくとも70％、少なくとも75％、少なくとも80％、少なくとも85％、少なくとも90％、少なくとも95％、少なくとも96％、少なくとも97％、少なくとも98％、少なくとも99％、又は最大100％(100％を包含する)の配列同一性を有するアミノ酸配列を含む、請求項65に記載の組成物。
阻害剤が、DNAミスマッチ修復経路の1つ以上のタンパク質の活性を阻害する抗体である、請求項63に記載の組成物。
阻害剤が、DNAミスマッチ修復経路の1つ以上のタンパク質の活性を阻害する小分子である、請求項63に記載の組成物。
阻害剤が、DNAミスマッチ修復経路の1つ以上のタンパク質の活性を阻害する低分子干渉RNA(siRNA)又は低分子非コードマイクロRNAである、請求項63に記載の組成物。
阻害剤が、野生型MMRタンパク質の活性を阻害するMMRタンパク質のドミナントネガティブバリアントである、請求項63に記載の組成物。
阻害剤が、MLH1の活性を阻害するMLH1のドミナントネガティブバリアントである、請求項63に記載の組成物。
MLH1のドミナントネガティブバリアントが、配列番号204に示される野生型MLH1タンパク質と比較してATPaseドメインに1つ以上のアミノ酸置換、挿入及び/又は欠失を含み、1つ以上のアミノ酸変化が、MLH1のドミナントネガティブバリアントのATPase活性を損なうか又は消失させる、請求項71に記載の組成物。
MLH1のドミナントネガティブバリアントが、配列番号204に示される野生型MLH1タンパク質と比較してエンドヌクレアーゼドメインに1つ以上のアミノ酸置換、挿入及び/又は欠失を含み、1つ以上のアミノ酸変化が、MLH1のドミナントネガティブバリアントのエンドヌクレアーゼ活性を損なうか又は消失させる、請求項71に記載の組成物。
MLH1のドミナントネガティブバリアントが、配列番号204に示される野生型MLH1タンパク質と比較してC末端で切断されている、請求項71に記載の組成物。
MLH1のドミナントネガティブバリアントが、配列番号204に示される野生型MLH1タンパク質と比較してN末端で切断されている、請求項71に記載の組成物。
MLH1のドミナントネガティブバリアントが、N末端に核局在化シグナル(NLS)及び/又はC末端にNLSを更に含む、請求項71～75のいずれか一項に記載の組成物。
ドミナントネガティブバリアントが、(a)MLH1 E34A(配列番号222)、(b)MLH1 Δ756(配列番号208)、(c)MLH1 Δ754-756(配列番号209)、(d)MLH1 E34A Δ754-756(配列番号210)、(e)MLH1 1-335(配列番号211)、(f)MLH1 1-335 E34A(配列番号212)、(g)MLH1 1-335 NLS^SV40(配列番号213)、(h)MLH1 501-756(配列番号215)、(i)MLH1 501-753(配列番号216)、(j)MLH1 461-753(配列番号218)、又は(k)NLS^SV40MLH1 501-753(配列番号223)、あるいは配列番号208～213、215、216、218、222又は223のいずれかと少なくとも70％、少なくとも75％、少なくとも80％、少なくとも85％、少なくとも90％、少なくとも95％、少なくとも96％、少なくとも97％、少なくとも98％、少なくとも99％、又は最大100％(100％を包含する)の配列同一性を有するアミノ酸配列を含むポリペプチドである、請求項71に記載の組成物。
ドミナントネガティブバリアントが、(a)E34Aアミノ酸置換;(b)アミノ酸756の欠失;(c)アミノ酸754～756の欠失;(d)E34Aアミノ酸置換及びアミノ酸754～756の欠失;(e)アミノ酸336～756の欠失;(f)E34Aアミノ酸置換及びアミノ酸336～756の欠失;(g)アミノ酸1～500の欠失;(h)アミノ酸1～500の欠失及びアミノ酸754～756の欠失;又は(i)アミノ酸1～460の欠失及びアミノ酸754～756の欠失、を含み、任意選択で、ドミナントネガティブバリアントは、C末端及び/又はN末端に配列KRTADGSEFESPKKKRKVを含むNLSを更に含む、請求項71に記載の組成物。
阻害剤が、PMS2の活性を阻害するPMS2のドミナントネガティブバリアントであり、任意選択で、ドミナントネガティブバリアントは、野生型PMS2タンパク質と比較して1つ以上のアミノ酸の置換、挿入及び/又は欠失を含み、任意選択で、ドミナントネガティブバリアントは、野生型PMS2タンパク質と比較して、(a)E705K置換、(b)アミノ酸2～607の欠失、(c)アミノ酸2～635の欠失、(d)アミノ酸1～635の欠失、(e)E41A置換、及び/又は(f)アミノ酸134後の欠失を含む、請求項73に記載の組成物。
阻害剤が、MSH6の活性を阻害するMSH6のドミナントネガティブバリアントであり、任意選択で、ドミナントネガティブバリアントは、野生型MSH6タンパク質と比較して1つ以上のアミノ酸の置換、挿入及び/又は欠失を含み、任意選択で、ドミナントネガティブバリアントは、野生型MSH6タンパク質と比較して(a)K1140R置換及び/又は(b)アミノ酸2～361の欠失を含む、請求項73に記載の組成物。
阻害剤がCDKN1Aを含む、請求項73記載の組成物。
プライム編集因子がnapDNAbp及びポリメラーゼを含む、請求項58に記載の組成物。
napDNAbpが、ヌクレアーゼ活性Cas9ドメイン、ヌクレアーゼ不活性Cas9ドメイン、又はCas9ニッカーゼドメイン若しくはそのバリアントである、請求項82に記載の組成物。
napDNAbpが、HNHドメイン中に1つ以上のアミノ酸置換を含むCas9ニッカーゼであり、任意選択で、1つ以上のアミノ酸置換は、H840X、N854X、及び/又はN863Xを含み、Xは、元のアミノ酸を除く任意のアミノ酸であり、任意選択で、1つ以上のアミノ酸置換は、H840A、N854A、及び/又はN863Aを含む、請求項82に記載の組成物。
napDNAbpが、Cas9、Cas12e、Cas12d、Cas12a、Cas12b1、Cas13a、Cas12c、アルゴノートCas12b2、Cas13a、Cas12c、Cas12d、Cas12e、Cas12h、Cas12i、Cas12g、Cas12f(Cas14)、Cas12f1、Cas12j(CasΦ)、及びアルゴノートからなる群から選択され、且つ任意選択でニッカーゼ活性を有する、請求項84に記載の組成物。
napDNAbpが、配列番号2、4～67のいずれか1つのアミノ酸配列、又は配列番号2、4～67、若しくは104のいずれか1つと少なくとも80％、85％、90％、95％、若しくは99％の配列同一性を有するPEmax又はアミノ酸配列を含む、請求項84に記載の組成物。
napDNAbpが、配列番号2若しくは配列番号37(すなわち、PE1及びPE2のnapDNAbp)のアミノ酸配列、又は配列番号2若しくは配列番号37と少なくとも80％、85％、90％、95％、若しくは99％の配列同一性を有するアミノ酸配列を含む、請求項84に記載の組成物。
ポリメラーゼがDNA依存性DNAポリメラーゼ又はRNA依存性DNAポリメラーゼである、請求項84に記載の組成物。
ポリメラーゼが逆転写酵素である、請求項84に記載の組成物。
逆転写酵素がレトロウイルス逆転写酵素であり、任意選択で、逆転写酵素は、モロニーマウス白血病ウイルス逆転写酵素(MMLV-RT)であり、任意選択で、MMLV-RTは、野生型MMLV-RTと比較してD200N、T306K、W313F、T330P及びL603Wから選択される1つ以上のアミノ酸置換を含む、請求項89に記載の組成物。
逆転写酵素が、配列番号69～98のいずれか1つのアミノ酸配列、又は配列番号69～98のいずれか1つと少なくとも80％、85％、90％、95％、若しくは99％の配列同一性を有するアミノ酸配列を含み、任意選択で、逆転写酵素は、配列番号105のアミノ酸配列を含む、請求項89に記載の組成物。
napDNAbp及びプライム編集因子のポリメラーゼが結合されて融合タンパク質が形成され、任意選択で、napDNAbp及びポリメラーゼは、リンカーによって接続される、請求84に記載の組成物。
リンカーが、配列番号102、118～131のいずれか1つのアミノ酸配列、又は配列番号102、118～131のいずれか1つと少なくとも80％、85％、90％、95％若しくは99％の配列同一性を有するアミノ酸配列を含む、請求項92に記載の組成物。
リンカーが、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49又は50アミノ酸長である、請求項92に記載の組成物。
融合タンパク質が、配列番号99若しくは配列番号107のアミノ酸配列、又は配列番号99若しくは配列番号107のいずれか一つと少なくとも80％、85％、90％、95％、若しくは99％の配列同一性を有するアミノ酸配列を含む、請求項92に記載の組成物。
プライム編集因子、pegRNA、及びDNAミスマッチ修復経路の阻害剤が、1つ以上のDNAベクター上にコードされる、請求項58に記載の組成物。
1つ以上のDNAベクターがAAV又はレンチウイルスDNAベクターを含む、請求項96に記載の組成物。
AAVベクターが血清型1、2、3、4、5、6、7、8、9又は10である、請求項97に記載の組成物。
プライム編集因子とDNAミスマッチ修復経路の阻害剤とが共有結合されていない、請求項84～91のいずれか一項に記載の組成物。
融合タンパク質としてのプライム編集因子が、第2のリンカーによってDNAミスマッチ修復経路の阻害剤に更に結合されている、請求項84～91のいずれか一項に記載の組成物。
第2のリンカーが自己加水分解性リンカーを含み、任意選択で、第2のリンカーは、T2Aリンカー又はP2Aリンカーである、請求項100に記載の組成物。
第2のリンカーが、配列番号102、118～131、若しくは233～236のいずれか1つのアミノ酸配列、又は配列番号102、118～131、233～236のいずれか1つと少なくとも80％、85％、90％、95％、若しくは99％の配列同一性を有するアミノ酸配列を含む、請求項100に記載の組成物。
第2のリンカーが、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49又は50アミノ酸長である、請求項100に記載の組成物。
標的部位にインストールされた核酸分子に対する1つ以上の修飾が、1つ以上のトランジション、1つ以上のトランスバージョン、1つ以上の挿入、1つ以上の欠失、1つ以上の逆位、又はそれらの任意の組み合わせを含み、且つ任意選択で15bp未満である、請求項58に記載の組成物。
1つ以上のトランジションが、(a)TからC;(b)AからG;(c)CからT;及び(d)GからAからなる群から選択される、請求項104に記載の組成物。
1つ以上のトランスバージョンが、(a)TからA;(b)TからG;(c)CからG;(d)CからA;(e)AからT;(f)AからC;(g)GからC;及び(h)GからTからなる群から選択される、請求項104に記載の組成物。
1つ以上の修飾が、(1)G:C塩基対をT:A塩基対に、(2)G:C塩基対をA:T塩基対に、(3)G:C塩基対をC:G塩基対に、(4)T:A塩基対をG:C塩基対に、(5)T:A塩基対をA:T塩基対に、(6)T:A塩基対をC:G塩基対に、(7)C:G塩基対をG:C塩基対に、(8)C:G塩基対をT:A塩基対に、(9)C:G塩基対をA:T塩基対に、(10)A:T塩基対をT:A塩基対に、(11)A:T塩基対をG:C塩基対に、又は(12)A:T塩基対をC:G塩基対に変更することを含む、請求項58に記載の組成物。
1つ以上の修飾が、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24又は25ヌクレオチドの挿入又は欠失を含み、任意選択で、1つ以上の編集が、1～15ヌクレオチドの挿入又は欠失を含む、請求項58に記載の組成物。
1つ以上の修飾が、疾患関連遺伝子における疾患に関連する突然変異に対する修正を含む、請求項58に記載の組成物。
疾患関連遺伝子が、以下からなる群:心疾患;高血圧;アルツハイマー病;関節炎;糖尿病;癌;及び肥満から選択される多遺伝子性障害に関連される、請求項109に記載の組成物。
疾患関連遺伝子が、アデノシンデアミナーゼ(ADA)欠損症;α1アンチトリプシン欠損症;嚢胞性線維症;デュシェンヌ型筋ジストロフィ;ガラクトース血症;ヘモクロマトーシス;ハンチントン病;メープルシロップ尿症;マルファン症候群;神経線維腫症1型;先天性爪甲厚膜;フェニルケトン尿症;重度の複合免疫不全;鎌状赤血球症;スミス・レムリ・オピッツ症候群;トリヌクレオチド反復障害;プリオン病;及びテイ・サックス病からなる群から選択される一遺伝子性障害に関連される、請求項109に記載の組成物。
gRNAコアが、標的部位の配列に対して最小の配列相同性を含み、任意選択で、gRNAコアは、1つ以上のヌクレオチド編集の位置の上流又は下流の5、10、15、20、25、30、35、40、45、又は50ヌクレオチドに隣接する二本鎖標的DNAの配列に対して1％、5％、10％、15％、20％、25％、又は30％以下の配列相同性を含む、請求項58～111のいずれか一項に記載の組成物。
napDNAbpをコードする核酸配列と、ポリメラーゼと、DNAミスマッチ修復経路の阻害剤とを含む、プライム編集によってDNA標的部位を編集するためのポリヌクレオチドであって、napDNAbp及びポリメラーゼは、DNA標的部位に1つ以上の修飾をインストールするpegRNAの存在下で能力を持つ、前記ポリヌクレオチド。
ポリヌクレオチドは、第2鎖ニッキングgRNAをコードする核酸配列を更に含む、請求項113に記載のポリヌクレオチド。
プライム編集効率が、DNAミスマッチ修復経路の阻害剤の存在下で、少なくとも1.5倍、少なくとも2.0倍、少なくとも2.5倍、少なくとも3.0倍、少なくとも3.5倍、少なくとも4.0倍、少なくとも4.5倍、少なくとも5.0倍、少なくとも5.5倍、少なくとも6.0倍、少なくとも6.5倍、少なくとも7.0倍、少なくとも7.5倍、少なくとも8.0倍、少なくとも8.5倍、少なくとも9.0倍、少なくとも9.5倍、少なくとも10.0倍、少なくとも11倍、少なくとも12倍、少なくとも13倍、少なくとも14倍、少なくとも15倍、少なくとも16倍、少なくとも17倍、少なくとも18倍、少なくとも19倍、少なくとも20倍、少なくとも21倍、少なくとも22倍、少なくとも23倍、少なくとも24倍、少なくとも25倍、少なくとも26倍、少なくとも27倍、少なくとも28倍、少なくとも29倍、少なくとも30倍、少なくとも31倍、少なくとも32倍、少なくとも33倍、少なくとも34倍、少なくとも35倍、少なくとも36倍、少なくとも37倍、少なくとも38倍、少なくとも39倍、少なくとも40倍、少なくとも41倍、少なくとも42倍、少なくとも43倍、少なくとも44倍、少なくとも45倍、少なくとも46倍、少なくとも47倍、少なくとも48倍、少なくとも49倍、少なくとも50倍、少なくとも51倍、少なくとも52倍、少なくとも53倍、少なくとも54倍、少なくとも55倍、少なくとも56倍、少なくとも57倍、少なくとも58倍、少なくとも59倍、少なくとも60倍、少なくとも61倍、少なくとも62倍、少なくとも63倍、少なくとも64倍、少なくとも65倍、少なくとも66倍、少なくとも67倍、少なくとも68倍、少なくとも69倍、少なくとも70倍、少なくとも71倍、少なくとも72倍、少なくとも73倍、少なくとも74倍、又は少なくとも75倍増加される、請求項113に記載のポリヌクレオチド。
インデル形成の頻度が、DNAミスマッチ修復経路の阻害剤の存在下で、少なくとも1.5倍、少なくとも2.0倍、少なくとも2.5倍、少なくとも3.0倍、少なくとも3.5倍、少なくとも4.0倍、少なくとも4.5倍、少なくとも5.0倍、少なくとも5.5倍、少なくとも6.0倍、少なくとも6.5倍、少なくとも7.0倍、少なくとも7.5倍、少なくとも8.0倍、少なくとも8.5倍、少なくとも9.0倍、少なくとも9.5倍、少なくとも10.0倍、少なくとも11倍、少なくとも12倍、少なくとも13倍、少なくとも14倍、少なくとも15倍、少なくとも16倍、少なくとも17倍、少なくとも18倍、少なくとも19倍、少なくとも20倍、少なくとも21倍、少なくとも22倍、少なくとも23倍、少なくとも24倍、少なくとも25倍、少なくとも26倍、少なくとも27倍、少なくとも28倍、少なくとも29倍、少なくとも30倍、少なくとも31倍、少なくとも32倍、少なくとも33倍、少なくとも34倍、少なくとも35倍、少なくとも36倍、少なくとも37倍、少なくとも38倍、少なくとも39倍、少なくとも40倍、少なくとも41倍、少なくとも42倍、少なくとも43倍、少なくとも44倍、少なくとも45倍、少なくとも46倍、少なくとも47倍、少なくとも48倍、少なくとも49倍、少なくとも50倍、少なくとも51倍、少なくとも52倍、少なくとも53倍、少なくとも54倍、少なくとも55倍、少なくとも56倍、少なくとも57倍、少なくとも58倍、少なくとも59倍、少なくとも60倍、少なくとも61倍、少なくとも62倍、少なくとも63倍、少なくとも64倍、少なくとも65倍、少なくとも66倍、少なくとも67倍、少なくとも68倍、少なくとも69倍、少なくとも70倍、少なくとも71倍、少なくとも72倍、少なくとも73倍、少なくとも74倍、又は少なくとも75倍減少される、請求項113に記載のポリヌクレオチド。
DNAミスマッチ修復経路の阻害剤が、DNAミスマッチ修復経路の1つ以上のタンパク質を阻害する、請求項113に記載のポリヌクレオチド。
1つ以上のタンパク質が、MLH1、PMS2(又はMutLアルファ)、PMS1(又はMutLベータ)、MLH3(又はMutLガンマ)、MutSアルファ(MSH2-MSH6)、MutSベータ(MSH2-MSH3)、MSH2、MSH6、PCNA、RFC、EXO1、POLδ及びPCNAからなる群から選択される、請求項117に記載のポリヌクレオチド。
1つ以上のタンパク質がMLH1である、請求項117に記載のポリヌクレオチド。
MLH1が、配列番号204のアミノ酸配列、又は配列番号204と少なくとも70％、少なくとも75％、少なくとも80％、少なくとも85％、少なくとも90％、少なくとも95％、少なくとも96％、少なくとも97％、少なくとも98％、少なくとも99％、又は最大100％(100％を包含する)の配列同一性を有するアミノ酸配列を含む、請求項119に記載のポリヌクレオチド。
阻害剤が、DNAミスマッチ修復経路の1つ以上のタンパク質の活性を阻害する抗体である、請求項113に記載のポリヌクレオチド。
阻害剤が、DNAミスマッチ修復経路の1つ以上のタンパク質の活性を阻害する低分子干渉RNA(siRNA)又は低分子非コードマイクロRNAである、請求項113に記載のポリヌクレオチド。
阻害剤が、野生型MMRタンパク質の活性を阻害するMMRタンパク質のドミナントネガティブバリアントである、請求項113に記載のポリヌクレオチド。
阻害剤が、MLH1を阻害するMLH1のドミナントネガティブバリアントである、請求項113に記載のポリヌクレオチド。
ドミナントネガティブバリアントが、(a)MLH1 E34A(配列番号222)、(b)MLH1 Δ756(配列番号208)、(c)MLH1 Δ754-756(配列番号209)、(d)MLH1 E34A Δ754-756(配列番号210)、(e)MLH1 1-335(配列番号211)、(f)MLH1 1-335 E34A(配列番号212)、(g)MLH1 1-335 NLS^SV40(配列番号213)、(h)MLH1 501-756(配列番号215)、(i)MLH1 501-753(配列番号216)、(j)MLH1 461-753(配列番号218)、又は(k)NLS^SV40MLH1 501-753(配列番号223)、あるいは配列番号208～213、215、216、218、222又は223のいずれかと少なくとも70％、少なくとも75％、少なくとも80％、少なくとも85％、少なくとも90％、少なくとも95％、少なくとも96％、少なくとも97％、少なくとも98％、少なくとも99％、又は最大100％(100％を包含する)の配列同一性を有するアミノ酸配列を含むポリペプチドである、請求項124に記載のポリヌクレオチド。
napDNAbpが、ヌクレアーゼ活性Cas9ドメイン、ヌクレアーゼ不活性Cas9ドメイン、又はCas9ニッカーゼドメイン若しくはそのバリアントである、請求項113に記載のポリヌクレオチド。
napDNAbpが、Cas9、Cas12e、Cas12d、Cas12a、Cas12b1、Cas13a、Cas12c、アルゴノートCas12b2、Cas13a、Cas12c、Cas12d、Cas12e、Cas12h、Cas12i、Cas12g、Cas12f(Cas14)、Cas12f1、Cas12j(CasΦ)、及びアルゴノートからなる群から選択され、且つ任意選択でニッカーゼ活性を有する、請求項113に記載のポリヌクレオチド。
napDNAbpが、配列番号2、4～67、若しくは104のいずれか1つのアミノ酸配列、又は配列番号2、4～67、若しくは104のいずれか1つと少なくとも80％、85％、90％、95％、若しくは99％の配列同一性を有するアミノ酸配列を含む、請求項113に記載のポリヌクレオチド。
napDNAbpが、配列番号2(すなわち、PE1及びPE2のnapDNAbp)のアミノ酸配列、又は配列番号2と少なくとも80％、85％、90％、95％、若しくは99％の配列同一性を有するアミノ酸配列を含む、請求項113に記載のポリヌクレオチド。
ポリメラーゼがDNA依存性DNAポリメラーゼ又はRNA依存性DNAポリメラーゼである、請求項113に記載のポリヌクレオチド。
ポリメラーゼが逆転写酵素である、請求項113に記載のポリヌクレオチド。
逆転写酵素が、配列番号69～98のいずれか1つのアミノ酸配列、又は配列番号69～98のいずれか1つと少なくとも80％、85％、90％、95％、若しくは99％の配列同一性を有するアミノ酸配列を含む、請求項131に記載のポリヌクレオチド。
napDNAbp及びプライム編集因子のポリメラーゼが、リンカーによって連結されて融合タンパク質を形成する、請求項113に記載のポリヌクレオチド。
リンカーが、配列番号102若しくは118～131のいずれか1つのアミノ酸配列、又は配列番号102若しくは118～131のいずれか1つと少なくとも80％、85％、90％、95％若しくは99％の配列同一性を有するアミノ酸配列を含む、請求項133に記載のポリヌクレオチド。
リンカーが、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49又は50アミノ酸長である、請求項133に記載のポリヌクレオチド。
ポリヌクレオチドがDNAベクターである、請求項113に記載のポリヌクレオチド。
DNAベクターがAAV又はレンチウイルスDNAベクターである、請求項136に記載のポリヌクレオチド。
AAVベクターが血清型1、2、3、4、5、6、7、8、9又は10である、請求項137に記載のポリヌクレオチド。
融合タンパク質としてのプライム編集因子が、第2のリンカーによってDNAミスマッチ修復経路の阻害剤に更に結合されている、請求項133に記載のポリヌクレオチド。
第2のリンカーが自己加水分解性リンカーを含む、請求項139に記載のポリヌクレオチド。
第2のリンカーが、配列番号102、118～131、若しくは233～236のいずれか1つのアミノ酸配列、又は配列番号102、118～131、若しくは233～236のいずれか1つと少なくとも80％、85％、90％、95％、若しくは99％の配列同一性を有するアミノ酸配列を含む、請求項139に記載のポリヌクレオチド。
第2のリンカーが、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49又は50アミノ酸長である、請求項139に記載のポリヌクレオチド。
標的部位にインストールされた核酸分子に対する1つ以上の修飾が、1つ以上のトランジション、1つ以上のトランスバージョン、1つ以上の挿入、1つ以上の欠失、又は1つ以上の逆位を含む、請求項113に記載のポリヌクレオチド。
1つ以上のトランジションが、(a)TからC;(b)AからG;(c)CからT;及び(d)GからAからなる群から選択される、請求項143に記載のポリヌクレオチド。
1つ以上のトランスバージョンが、(a)TからA;(b)TからG;(c)CからG;(d)CからA;(e)AからT;(f)AからC;(g)GからC;及び(h)GからTからなる群から選択される、請求項143に記載のポリヌクレオチド。
1つ以上の修飾が、(1)G:C塩基対をT:A塩基対に、(2)G:C塩基対をA:T塩基対に、(3)G:C塩基対をC:G塩基対に、(4)T:A塩基対をG:C塩基対に、(5)T:A塩基対をA:T塩基対に、(6)T:A塩基対をC:G塩基対に、(7)C:G塩基対をG:C塩基対に、(8)C:G塩基対をT:A塩基対に、(9)C:G塩基対をA:T塩基対に、(10)A:T塩基対をT:A塩基対に、(11)A:T塩基対をG:C塩基対に、又は(12)A:T塩基対をC:G塩基対に変更することを含む、請求項113に記載のポリヌクレオチド。
1つ以上の修飾が、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24又は25ヌクレオチドの挿入又は欠失を含む、請求項113に記載のポリヌクレオチド。
1つ以上の修飾が、疾患関連遺伝子に対する修正を含む、請求項113に記載のポリヌクレオチド。
疾患関連遺伝子が、以下からなる群:心疾患;高血圧;アルツハイマー病;関節炎;糖尿病;癌;及び肥満から選択される多遺伝子性障害に関連される、請求項148に記載のポリヌクレオチド。
疾患関連遺伝子が、アデノシンデアミナーゼ(ADA)欠損症;α1アンチトリプシン欠損症;嚢胞性線維症;デュシェンヌ型筋ジストロフィ;ガラクトース血症;ヘモクロマトーシス;ハンチントン病;メープルシロップ尿症;マルファン症候群;神経線維腫症1型;先天性爪甲厚膜;フェニルケトン尿症;重度の複合免疫不全;鎌状赤血球症;スミス・レムリ・オピッツ症候群;トリヌクレオチド反復障害;プリオン病;及びテイ・サックス病からなる群から選択される一遺伝子性障害に関連される、請求項148に記載のポリヌクレオチド。
請求項113～150のいずれか一項に記載のポリヌクレオチドを含む細胞であって、任意選択で、哺乳動物細胞、非ヒト霊長類細胞又はヒト細胞である、前記細胞。
請求項41～80のいずれか一項に記載の組成物、又は請求項113～151のいずれか一項に記載のポリヌクレオチド、又は請求項151に記載の細胞、及び医薬賦形剤を含む、医薬組成物。
請求項58～112のいずれか一項に記載の組成物又は請求項113～150のいずれか一項に記載のポリヌクレオチドと、医薬賦形剤と、プライム編集によってDNA標的部位を編集するための説明書と、を含むキット。
核酸プログラム可能DNA結合タンパク質(napDNAbp)をコードする第1の核酸配列、ポリメラーゼをコードする第2の核酸配列、及びDNAミスマッチ修復経路の阻害剤をコードする第3の核酸配列を含む、組成物。
組成物が、プライム編集ガイドRNA(pegRNA)又はpegRNAをコードする核酸配列を更に含み、pegRNAは、スペーサ配列、gRNAコア、並びにDNA合成鋳型及びプライマー結合部位(PBS)を含む伸長アームを含み、スペーサ配列は、二本鎖標的DNA配列の標的鎖と相補性の領域を含み、gRNAコアは、napDNAbpと会合し、DNA合成鋳型は、二本鎖標的DNA配列の非標的鎖と相補性の領域、及び、標的鎖二本鎖標的DNA配列と比較して1つ以上のヌクレオチド編集を含み、且つプライマー結合部位は、二本鎖標的DNA配列の非標的鎖と相補性の領域を含む、請求項154に記載の組成物。
第1及び第2の核酸配列が単一ポリヌクレオチド上にある、請求項154に記載の組成物。
第1、第2及び第3の核酸配列が単一ポリヌクレオチド上にある、請求項154に記載の組成物。
第1及び第2の核酸配列が、napDNAbp-DNAポリメラーゼ融合タンパク質をコードするように連結されている、請求項157に記載の組成物。
第1及び第2の核酸配列が、napDNAbp-DNAポリメラーゼ融合タンパク質をコードするように連結され、第3の核酸配列が、リンカー核酸配列を介して第1又は第2の核酸配列に連結され、任意選択で、リンカー核酸配列は、ペプチドリンカーをコードし、任意選択で、ペプチドリンカーは、自己加水分解性リンカーであり、任意選択で、自己加水分解性リンカーは、T2Aリンカー又はP2Aリンカーであり、任意選択で、自己加水分解性リンカーは、配列番号102、118～131又は233～236のいずれか1つのアミノ酸配列、又は配列番号102、118～131又は233～236のいずれか1つと少なくとも80％、85％、90％、95％又は99％の配列同一性を有するアミノ酸配列を含む、請求項158に記載の組成物。
単一ポリヌクレオチドがDNAベクターの一部である、請求項156又は157に記載の組成物。
単一ポリヌクレオチドがmRNA配列の一部である、請求項156又は157に記載の組成物。
DNAベクターがAAV又はレンチウイルスDNAベクターであり、任意選択で、DNAベクターは、プロモータを更に含む、請求項160に記載の組成物。
mRNA配列がプロモータを更に含む、請求項161に記載の組成物。
プライム編集によって核酸分子を編集するための方法であって、核酸分子をプライム編集因子及びプライム編集ガイドRNA(pegRNA)と接触させることを含み、プライム編集因子は、核酸プログラム可能DNA結合タンパク質及びDNAポリメラーゼを含み、pegRNAは、スペーサ配列、gRNAコア、並びにDNA合成鋳型及びプライマー結合部位(PBS)を含む伸長アームを含み、DNA合成鋳型は、核酸分子上の標的部位の内因性配列に対する3つ以上の連続するヌクレオチドミスマッチを含み、3つ以上の連続するヌクレオチドミスマッチは、(i)突然変異(例として、疾患関連変異)を修正するx個の連続するヌクレオチドの挿入、欠失又は置換、及び(ii)x個の連続するヌクレオチドに直接隣接するy個の連続するヌクレオチドの挿入、欠失又は置換を含み、y個の連続するヌクレオチドの挿入、欠失又は置換は、サイレント突然変異であり、(x＋y)は3以上の整数であり、yは1以上の整数であり、サイレント変異(複数可)を含めることは、効率を高め、意図しないインデル頻度を低下させ、及び/又はプライム編集による編集結果の純度を改善する、前記方法。
3つ以上の連続するヌクレオチドのミスマッチのうちの少なくとも一つが、核酸分子から発現されるタンパク質のアミノ酸配列の変化をもたらし、残りの3つ以上の連続するヌクレオチドのミスマッチのうちの少なくとも一つがサイレント変異である、請求項164に記載の方法。
サイレント変異が、標的核酸分子のコード領域内にある、請求項165に記載の方法。
サイレント変異が、編集されていない核酸分子と同じアミノ酸をコードする1つ以上の代替コドンを核酸分子に導入する、請求項166に記載の方法。
サイレント変異が、標的核酸分子の非コード領域内にある、請求項165に記載の方法。
サイレント変異が、核酸分子上の標的部位のスプライシング、遺伝子調節、RNA寿命、又は他の生物学的特性に影響を及ぼさない、請求項168に記載の方法。
pegRNAのDNA合成鋳型が、核酸分子上の標的部位の内因性配列と比較して、4つ以上、5つ以上、6つ以上、7つ以上、8つ以上、9つ以上、又は10個以上の連続するヌクレオチドミスマッチを含む、請求項164～169のいずれか一項に記載の方法。
3つ以上の連続するヌクレオチドのミスマッチが、DNAミスマッチ修復経路による補正を回避する、請求項164～170のいずれか一項に記載の方法。
プライム編集効率が、核酸分子上の標的部位の内因性配列に対してただ1つの連続するヌクレオチドミスマッチを含むDNA合成鋳型を含むpegRNAを使用する方法と比較して、少なくとも1.5倍、少なくとも2.0倍、少なくとも2.5倍、少なくとも3.0倍、少なくとも3.5倍、少なくとも4.0倍、少なくとも4.5倍、少なくとも5.0倍、少なくとも5.5倍、少なくとも6.0倍、少なくとも6.5倍、少なくとも7.0倍、少なくとも7.5倍、少なくとも8.0倍、少なくとも8.5倍、少なくとも9.0倍、少なくとも9.5倍、少なくとも10.0倍、少なくとも11倍、少なくとも12倍、少なくとも13倍、少なくとも14倍、少なくとも15倍、少なくとも16倍、少なくとも17倍、少なくとも18倍、少なくとも19倍、少なくとも20倍、少なくとも21倍、少なくとも22倍、少なくとも23倍、少なくとも24倍、少なくとも25倍、少なくとも26倍、少なくとも27倍、少なくとも28倍、少なくとも29倍、少なくとも30倍、少なくとも31倍、少なくとも32倍、少なくとも33倍、少なくとも34倍、少なくとも35倍、少なくとも36倍、少なくとも37倍、少なくとも38倍、少なくとも39倍、少なくとも40倍、少なくとも41倍、少なくとも42倍、少なくとも43倍、少なくとも44倍、少なくとも45倍、少なくとも46倍、少なくとも47倍、少なくとも48倍、少なくとも49倍、少なくとも50倍、少なくとも51倍、少なくとも52倍、少なくとも53倍、少なくとも54倍、少なくとも55倍、少なくとも56倍、少なくとも57倍、少なくとも58倍、少なくとも59倍、少なくとも60倍、少なくとも61倍、少なくとも62倍、少なくとも63倍、少なくとも64倍、少なくとも65倍、少なくとも66倍、少なくとも67倍、少なくとも68倍、少なくとも69倍、少なくとも70倍、少なくとも71倍、少なくとも72倍、少なくとも73倍、少なくとも74倍、又は少なくとも75倍増加される、請求項164～171のいずれか一項に記載の方法。
インデル形成の頻度が、核酸分子上の標的部位の内因性配列に対してただ1つの連続するヌクレオチドミスマッチを含むDNA合成鋳型を含むpegRNAを使用する方法と比較して、少なくとも1.5倍、少なくとも2.0倍、少なくとも2.5倍、少なくとも3.0倍、少なくとも3.5倍、少なくとも4.0倍、少なくとも4.5倍、少なくとも5.0倍、少なくとも5.5倍、少なくとも6.0倍、少なくとも6.5倍、少なくとも7.0倍、少なくとも7.5倍、少なくとも8.0倍、少なくとも8.5倍、少なくとも9.0倍、少なくとも9.5倍、少なくとも10.0倍、少なくとも11倍、少なくとも12倍、少なくとも13倍、少なくとも14倍、少なくとも15倍、少なくとも16倍、少なくとも17倍、少なくとも18倍、少なくとも19倍、少なくとも20倍、少なくとも21倍、少なくとも22倍、少なくとも23倍、少なくとも24倍、少なくとも25倍、少なくとも26倍、少なくとも27倍、少なくとも28倍、少なくとも29倍、少なくとも30倍、少なくとも31倍、少なくとも32倍、少なくとも33倍、少なくとも34倍、少なくとも35倍、少なくとも36倍、少なくとも37倍、少なくとも38倍、少なくとも39倍、少なくとも40倍、少なくとも41倍、少なくとも42倍、少なくとも43倍、少なくとも44倍、少なくとも45倍、少なくとも46倍、少なくとも47倍、少なくとも48倍、少なくとも49倍、少なくとも50倍、少なくとも51倍、少なくとも52倍、少なくとも53倍、少なくとも54倍、少なくとも55倍、少なくとも56倍、少なくとも57倍、少なくとも58倍、少なくとも59倍、少なくとも60倍、少なくとも61倍、少なくとも62倍、少なくとも63倍、少なくとも64倍、少なくとも65倍、少なくとも66倍、少なくとも67倍、少なくとも68倍、少なくとも69倍、少なくとも70倍、少なくとも71倍、少なくとも72倍、少なくとも73倍、少なくとも74倍、又は少なくとも75倍減少される、請求項164～171のいずれか一項に記載の方法。
プライム編集によって核酸分子を編集するための方法であって、核酸分子をプライム編集因子及びpegRNAと接触させることを含み、pegRNAの伸長アームが、核酸分子上の標的部位の内因性配列に対して10個以上のヌクレオチドの挿入又は欠失を含むDNA合成テンプレートを含む、前記方法。
DNA合成鋳型が、核酸分子上の標的部位の内因性配列に対して、11個以上のヌクレオチド、12個以上のヌクレオチド、13個以上のヌクレオチド、14個以上のヌクレオチド、15個以上のヌクレオチド、16個以上のヌクレオチド、17個以上のヌクレオチド、18個以上のヌクレオチド、19個以上のヌクレオチド、20個以上のヌクレオチド、21個以上のヌクレオチド、22個以上のヌクレオチド、23個以上のヌクレオチド、24個以上のヌクレオチド、又は25個以上のヌクレオチドの挿入又は欠失を含む、請求項174に記載の方法。
DNA合成鋳型が、核酸分子上の標的部位の内因性配列に対して15個以上のヌクレオチドの挿入又は欠失を含む、請求項175に記載の方法。
核酸分子上の標的部位の内因性配列に対して10以上のヌクレオチドの挿入又は欠失が、DNAミスマッチ修復経路による補正を回避する、請求項174～176のいずれか一項に記載の方法。
プライム編集効率が、核酸分子上の標的部位の内因性配列と比較して10ヌクレオチド未満の挿入又は欠失を含むDNA合成鋳型を含むpegRNAを使用する方法と比較して、少なくとも1.5倍、少なくとも2.0倍、少なくとも2.5倍、少なくとも3.0倍、少なくとも3.5倍、少なくとも4.0倍、少なくとも4.5倍、少なくとも5.0倍、少なくとも5.5倍、少なくとも6.0倍、少なくとも6.5倍、少なくとも7.0倍、少なくとも7.5倍、少なくとも8.0倍、少なくとも8.5倍、少なくとも9.0倍、少なくとも9.5倍、又は少なくとも10.0倍増加される、請求項174～176のいずれか一項に記載の方法。
インデル形成の頻度が、核酸分子上の標的部位の内因性配列に対して10ヌクレオチド未満の挿入又は欠失を含むDNA合成鋳型を含むpegRNAを使用する方法と比較して、少なくとも1.5倍、少なくとも2.0倍、少なくとも2.5倍、少なくとも3.0倍、少なくとも3.5倍、少なくとも4.0倍、少なくとも4.5倍、少なくとも5.0倍、少なくとも5.5倍、少なくとも6.0倍、少なくとも6.5倍、少なくとも7.0倍、少なくとも7.5倍、少なくとも8.0倍、少なくとも8.5倍、少なくとも9.0倍、少なくとも9.5倍、少なくとも10.0倍、少なくとも11倍、少なくとも12倍、少なくとも13倍、少なくとも14倍、少なくとも15倍、少なくとも16倍、少なくとも17倍、少なくとも18倍、少なくとも19倍、少なくとも20倍、少なくとも21倍、少なくとも22倍、少なくとも23倍、少なくとも24倍、少なくとも25倍、少なくとも26倍、少なくとも27倍、少なくとも28倍、少なくとも29倍、少なくとも30倍、少なくとも31倍、少なくとも32倍、少なくとも33倍、少なくとも34倍、少なくとも35倍、少なくとも36倍、少なくとも37倍、少なくとも38倍、少なくとも39倍、少なくとも40倍、少なくとも41倍、少なくとも42倍、少なくとも43倍、少なくとも44倍、少なくとも45倍、少なくとも46倍、少なくとも47倍、少なくとも48倍、少なくとも49倍、少なくとも50倍、少なくとも51倍、少なくとも52倍、少なくとも53倍、少なくとも54倍、少なくとも55倍、少なくとも56倍、少なくとも57倍、少なくとも58倍、少なくとも59倍、少なくとも60倍、少なくとも61倍、少なくとも62倍、少なくとも63倍、少なくとも64倍、少なくとも65倍、少なくとも66倍、少なくとも67倍、少なくとも68倍、少なくとも69倍、少なくとも70倍、少なくとも71倍、少なくとも72倍、少なくとも73倍、少なくとも74倍、又は少なくとも75倍減少される、請求項174～176のいずれか一項に記載の方法。
プライム編集によって核酸分子を編集するためのプライム編集ガイドRNA(pegRNA)であって、pegRNAは、スペーサ配列と、gRNAコアと、DNA合成鋳型及びプライマー結合部位(PBS)を含む伸長アームとを含み、DNA合成鋳型は、核酸分子上の標的部位の内因性配列に対する3つ以上の連続するヌクレオチドミスマッチを含み、3つ以上の連続するヌクレオチドミスマッチは、(i)突然変異(例として、疾患関連変異)を補正するx個のヌクレオチドの挿入、欠失、又は置換と、(ii)x個のヌクレオチドに直接隣接するy個のヌクレオチドの挿入、欠失、又は置換とを含み、y個のヌクレオチドの挿入、欠失、又は置換は、サイレント突然変異であり、(x＋y) は、3以上の整数であり、yは、1以上の整数であり、サイレント突然変異(複数可)を含めることは、効率を増加させ、意図しないインデル頻度を低下させ、及び/又はプライム編集による編集結果の純度を改善する、前記プライム編集ガイドRNA(pegRNA)。
3つ以上の連続するヌクレオチドのミスマッチのうちの少なくとも一つが、核酸分子から発現されるタンパク質のアミノ酸配列の変化をもたらし、残りの3つ以上の連続するヌクレオチドのミスマッチのうちの少なくとも一つがサイレント変異である、請求項180に記載のpegRNA。
サイレント変異が、標的核酸分子のコード領域内にある、請求項181に記載のpegRNA。
サイレント変異が、編集されていない核酸分子と同じアミノ酸をコードする1つ以上の代替コドンを核酸分子に導入する、請求項182に記載のpegRNA。
サイレント変異が、標的核酸分子の非コード領域内にある、請求項181に記載のpegRNA。
サイレント変異が、スプライシング、遺伝子調節、RNA寿命、又は核酸分子上の標的部位の他の生物学的特性に影響を及ぼさない核酸分子の領域内にある、請求項183に記載のpegRNA。
pegRNAの伸長アームが、核酸分子上の標的部位の内因性配列と比較して、4つ以上、5つ以上、6つ以上、7つ以上、8つ以上、9つ以上、又は10個以上の連続するヌクレオチドミスマッチを含む、請求項180～185のいずれか一項に記載のpegRNA。
3つ以上の連続するヌクレオチドのミスマッチが、DNAミスマッチ修復経路を回避する、請求項180～186のいずれか一項に記載のpegRNA。
プライム編集におけるpegRNAの使用が、核酸分子上の標的部位の内因性配列に対してただ1つの連続するヌクレオチドミスマッチを含むDNA合成鋳型を含むpegRNAに対して、プライム編集効率の少なくとも、少なくとも1.5倍、少なくとも2.0倍、少なくとも2.5倍、少なくとも3.0倍、少なくとも3.5倍、少なくとも4.0倍、少なくとも4.5倍、少なくとも5.0倍、少なくとも5.5倍、少なくとも6.0倍、少なくとも6.5倍、少なくとも7.0倍、少なくとも7.5倍、少なくとも8.0倍、少なくとも8.5倍、少なくとも9.0倍、少なくとも9.5倍、少なくとも10.0倍、少なくとも11倍、少なくとも12倍、少なくとも13倍、少なくとも14倍、少なくとも15倍、少なくとも16倍、少なくとも17倍、少なくとも18倍、少なくとも19倍、少なくとも20倍、少なくとも21倍、少なくとも22倍、少なくとも23倍、少なくとも24倍、少なくとも25倍、少なくとも26倍、少なくとも27倍、少なくとも28倍、少なくとも29倍、少なくとも30倍、少なくとも31倍、少なくとも32倍、少なくとも33倍、少なくとも34倍、少なくとも35倍、少なくとも36倍、少なくとも37倍、少なくとも38倍、少なくとも39倍、少なくとも40倍、少なくとも41倍、少なくとも42倍、少なくとも43倍、少なくとも44倍、少なくとも45倍、少なくとも46倍、少なくとも47倍、少なくとも48倍、少なくとも49倍、少なくとも50倍、少なくとも51倍、少なくとも52倍、少なくとも53倍、少なくとも54倍、少なくとも55倍、少なくとも56倍、少なくとも57倍、少なくとも58倍、少なくとも59倍、少なくとも60倍、少なくとも61倍、少なくとも62倍、少なくとも63倍、少なくとも64倍、少なくとも65倍、少なくとも66倍、少なくとも67倍、少なくとも68倍、少なくとも69倍、少なくとも70倍、少なくとも71倍、少なくとも72倍、少なくとも73倍、少なくとも74倍、又は少なくとも75倍増加をもたらす、請求項180～186のいずれか一項に記載のpegRNA。
プライム編集におけるpegRNAの使用が、核酸分子上の標的部位の内因性配列と比較して、ただ1つの連続するヌクレオチドミスマッチを含むDNA合成鋳型を含むpegRNAと比較して、インデル形成の頻度を少なくとも1.5倍、少なくとも2.0倍、少なくとも2.5倍、少なくとも3.0倍、少なくとも3.5倍、少なくとも4.0倍、少なくとも4.5倍、少なくとも5.0倍、少なくとも5.5倍、少なくとも6.0倍、少なくとも6.5倍、少なくとも7.0倍、少なくとも7.5倍、少なくとも8.0倍、少なくとも8.5倍、少なくとも9.0倍、少なくとも9.5倍、又は少なくとも10.0倍減少させる、請求項180～186のいずれか一項に記載のpegRNA。
請求項180～189のいずれか一項に記載のpegRNA及びプライム編集因子を含むプライム編集因子システムであって、プライム編集因子は、napDNAbp及びポリメラーゼを含む、前記プライム編集因子システム。
DNAミスマッチ修復経路の阻害剤を更に含む、請求項190に記載のプライム編集因子システム。
(i)核酸プログラム可能DNA結合タンパク質(napDNAbp)及び(ii)DNAポリメラーゼを含む融合タンパク質を含む、プライム編集因子であって、napDNAbpは、配列番号2に示される野生型Cas9と比較して、R221Kアミノ酸置換、N39Kアミノ酸置換、及びHNHドメインヌクレアーゼ活性を不活性化するアミノ酸置換又はその対応するアミノ酸置換を含むCas9ニッカーゼ(nCas9)である、前記プライム編集因子。
nCas9が、配列番号2に示される野生型Cas9と比較して、R221K、N39K及びH840Aアミノ酸置換を含む、請求項192に記載のプライム編集因子。
nCas9及びDNAポリメラーゼがリンカーによって連結されており、任意選択で、リンカーは、配列番号X5の配列を含み、任意選択で、プライム編集因子がN末端にSV40 NLSを更に含み、任意選択で、プライム編集因子がC末端にSV40 NLS及び/又はc-Myc NLSを更に含む、請求項193に記載のプライム編集因子。
配列番号99のアミノ酸配列、又は配列番号99と少なくとも80％、少なくとも85％、少なくとも90％、少なくとも95％、少なくとも96％、少なくとも97％、少なくとも98％、少なくとも99％、又は少なくとも100％の配列同一性を有するアミノ酸配列を含む、請求項192に記載のプライム編集因子。
請求項192～195のいずれか一項に記載のプライム編集因子及びDNAミスマッチ修復経路の阻害剤を含む、プライム編集因子システム。
請求項192～195のいずれか一項に記載のプライム編集因子及びプライム編集ガイドRNA(pegRNA)を含む、プライム編集因子システム。
請求項192～195のいずれか一項に記載のプライム編集因子をコードするポリヌクレオチド。
ポリヌクレオチドがDNAである、請求項198に記載のポリヌクレオチド。
ポリヌクレオチドがmRNAである、請求項198に記載のポリヌクレオチド。
任意選択で、融合タンパク質の発現がプロモータの制御下にあり、任意選択で、プロモータは、U6プロモータである、請求項198に記載のポリヌクレオチドを含むベクター。
(a)(i)核酸プログラム可能DNA結合タンパク質(napDNAbp)及び(ii)DNAポリメラーゼを含むプライム編集因子、並びに(b)DNAミスマッチ修復経路の阻害剤を含む、部位特異的ゲノム修飾のためのプライム編集因子システム。
DNAミスマッチ修復経路の阻害剤が、DNAミスマッチ修復経路の1つ以上のタンパク質を阻害する、請求項202に記載のプライム編集因子システム。
1つ以上のタンパク質が、MLH1、PMS2(又はMutLアルファ)、PMS1(又はMutLベータ)、MLH3(又はMutLガンマ)、MutSアルファ(MSH2-MSH6)、MutSベータ(MSH2-MSH3)、MSH2、MSH6、PCNA、RFC、EXO1、POLδ及びPCNAからなる群から選択される、請求項203に記載のプライム編集因子システム。
1つ以上のタンパク質がMLH1である、請求項203に記載のプライム編集因子システム。
MLH1が、配列番号204のアミノ酸配列、又は配列番号204と少なくとも70％、少なくとも75％、少なくとも80％、少なくとも85％、少なくとも90％、少なくとも95％、少なくとも96％、少なくとも97％、少なくとも98％、少なくとも99％又は最大100％(100％を包含する)の配列同一性を有するアミノ酸配列を含む、請求項205に記載のプライム編集因子システム。
阻害剤が、DNAミスマッチ修復経路の1つ以上のタンパク質の活性を阻害する抗体である、請求項202に記載のプライム編集因子システム。
阻害剤が、DNAミスマッチ修復経路の1つ以上のタンパク質の活性を阻害する小分子である、請求項202に記載のプライム編集因子システム。
阻害剤が、DNAミスマッチ修復経路の1つ以上のタンパク質の活性を阻害する低分子干渉RNA(siRNA)又は低分子非コードマイクロRNAである、請求項202に記載のプライム編集因子システム。
阻害剤が、野生型MMRタンパク質の活性を阻害するMMRタンパク質のドミナントネガティブバリアントである、請求項202に記載のプライム編集因子システム。
阻害剤が、MLH1を阻害するMLH1のドミナントネガティブバリアントである、請求項202に記載のプライム編集因子システム。
ドミナントネガティブバリアントが、(a)MLH1 E34A(配列番号222)、(b)MLH1 Δ756(配列番号208)、(c)MLH1 Δ754-756(配列番号209)、(d)MLH1 E34A Δ754-756(配列番号210)、(e)MLH1 1-335(配列番号211)、(f)MLH1 1-335 E34A(配列番号212)、(g)MLH1 1-335 NLS^SV40(配列番号213)、(h)MLH1 501-756(配列番号215)、(i)MLH1 501-753(配列番号216)、(j)MLH1 461-753(配列番号218)、又は(k)NLS^SV40MLH1 501-753(配列番号223)、あるいは配列番号208～213、215、216、218、222又は223のいずれかと少なくとも70％、少なくとも75％、少なくとも80％、少なくとも85％、少なくとも90％、少なくとも95％、少なくとも96％、少なくとも97％、少なくとも98％、少なくとも99％、又は最大100％(100％を包含する)の配列同一性を有するアミノ酸配列を含むポリペプチドである、請求項202に記載のプライム編集因子システム。
napDNAbpが、ヌクレアーゼ活性Cas9ドメイン、ヌクレアーゼ不活性Cas9ドメイン、又はCas9ニッカーゼドメイン若しくはそのバリアントである、請求項202に記載のプライム編集因子システム。
napDNAbpが、Cas9、Cas12e、Cas12d、Cas12a、Cas12b1、Cas13a、Cas12c、アルゴノートCas12b2、Cas13a、Cas12c、Cas12d、Cas12e、Cas12h、Cas12i、Cas12g、Cas12f(Cas14)、Cas12f1、Cas12j(CasΦ)、及びアルゴノートからなる群から選択され、且つ任意選択でニッカーゼ活性を有する、請求項202に記載のプライム編集因子システム。
napDNAbpが、配列番号2、4～67、104のいずれか1つのアミノ酸配列、又は配列番号2、4～67、104のいずれか1つと少なくとも80％、85％、90％、95％、若しくは99％の配列同一性を有するアミノ酸配列を含む、請求項202に記載のプライム編集因子システム。
napDNAbpが、配列番号2(すなわち、PE1及びPE2のnapDNAbp)のアミノ酸配列、又は配列番号2と少なくとも80％、85％、90％、95％、若しくは99％の配列同一性を有するアミノ酸配列を含む、請求項202に記載のプライム編集因子システム。
ポリメラーゼがDNA依存性DNAポリメラーゼ又はRNA依存性DNAポリメラーゼである、請求項202に記載のプライム編集因子システム。
ポリメラーゼが逆転写酵素である、請求項202に記載のプライム編集因子システム。
逆転写酵素が、配列番号69～98のいずれか1つのアミノ酸配列、又は配列番号69～98のいずれか1つと少なくとも80％、85％、90％、95％、若しくは99％の配列同一性を有するアミノ酸配列を含む、請求項218に記載のプライム編集因子システム。
napDNAbpとプライム編集因子のポリメラーゼとがリンカーによって連結されて融合タンパク質を形成し、任意選択で、阻害剤が第2のリンカーによってnapDNAbp又はポリメラーゼのいずれかに連結されている、請求項202に記載のプライム編集因子システム。
リンカー及び/又は第2のリンカーが、配列番号102若しくは118～131のいずれか1つのアミノ酸配列、又は配列番号102若しくは118～131のいずれか1つと少なくとも80％、85％、90％、95％若しくは99％の配列同一性を有するアミノ酸配列を含む、請求項220に記載のプライム編集因子システム。
リンカー及び/又は第2のリンカーが、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、38、38、39、40、41、42、43、44、45、46、47、48、49又は50アミノ酸長である、請求項220に記載のプライム編集因子システム。
プライム編集因子が、配列番号100のPE1、又は配列番号100と少なくとも80％、少なくとも85％、少なくとも90％、少なくとも95％、少なくとも99％、若しくは最大100％の配列同一性を有するアミノ酸配列である、請求項202に記載のプライム編集因子システム。
プライム編集因子が、配列番号107のPE2、又は配列番号107と少なくとも80％、少なくとも85％、少なくとも90％、少なくとも95％、少なくとも99％、若しくは最大100％の配列同一性を有するアミノ酸配列である、請求項202に記載のプライム編集因子システム。
プライム編集因子が、配列番号100のPE1、又は配列番号100と少なくとも80％、少なくとも85％、少なくとも90％、少なくとも95％、少なくとも99％、若しくは最大100％の配列同一性を有するアミノ酸配列であり、且つ阻害剤が、MLH1を阻害するMLH1のドミナントネガティブバリアントである、請求項202に記載のプライム編集因子システム。
MLH1のドミナントネガティブバリアントが、(a)MLH1 E34A(配列番号222)、(b)MLH1 Δ756(配列番号208)、(c)MLH1 Δ754-756(配列番号209)、(d)MLH1 E34A Δ754-756(配列番号210)、(e)MLH1 1-335(配列番号211)、(f)MLH1 1-335 E34A(配列番号212)、(g)MLH1 1-335 NLS^SV40(配列番号213)、(h)MLH1 501-756(配列番号215)、(i)MLH1 501-753(配列番号216)、(j)MLH1 461-753(配列番号218)、又は(k)NLS^SV40MLH1 501-753(配列番号223)、あるいは配列番号208～213、215、216、218、222又は223のいずれかと少なくとも70％、少なくとも75％、少なくとも80％、少なくとも85％、少なくとも90％、少なくとも95％、少なくとも96％、少なくとも97％、少なくとも98％、少なくとも99％、又は最大100％(100％を包含する)の配列同一性を有するアミノ酸配列を含むポリペプチドである、請求項225に記載のプライム編集因子システム。
プライム編集因子が、配列番号107のPE2、又は配列番号107と少なくとも80％、少なくとも85％、少なくとも90％、少なくとも95％、少なくとも99％、又は最大100％(100％を包含する)の配列同一性を有するアミノ酸配列であり、且つ阻害剤が、MLH1を阻害するMLH1のドミナントネガティブバリアントである、請求項145に記載のプライム編集因子システム。
プライム編集因子が、配列番号107のPE2、又は配列番号107と少なくとも80％、少なくとも85％、少なくとも90％、少なくとも95％、少なくとも99％、若しくは最大100％の配列同一性を有するアミノ酸配列であり、且つ阻害剤が、MLH1を阻害するMLH1のドミナントネガティブバリアントである、請求項202に記載のプライム編集因子システム。
MLH1のドミナントネガティブバリアントが、(a)MLH1 E34A(配列番号222)、(b)MLH1 Δ756(配列番号208)、(c)MLH1 Δ754-756(配列番号209)、(d)MLH1 E34A Δ754-756(配列番号210)、(e)MLH1 1-335(配列番号211)、(f)MLH1 1-335 E34A(配列番号212)、(g)MLH1 1-335 NLS^SV40(配列番号213)、(h)MLH1 501-756(配列番号215)、(i)MLH1 501-753(配列番号216)、(j)MLH1 461-753(配列番号218)、又は(k)NLS^SV40MLH1 501-753(配列番号223)、あるいは配列番号208～213、215、216、218、222又は223のいずれかと少なくとも70％、少なくとも75％、少なくとも80％、少なくとも85％、少なくとも90％、少なくとも95％、少なくとも96％、少なくとも97％、少なくとも98％、少なくとも99％、又は最大100％(100％を包含する)の配列同一性を有するアミノ酸配列を含むポリペプチドである、請求項227に記載のプライム編集因子システム。
プライム編集因子が、配列番号107のPE2、又は配列番号107と少なくとも80％、少なくとも85％、少なくとも90％、少なくとも95％、少なくとも99％、若しくは最大100％の配列同一性を有するアミノ酸配列であり、且つ阻害剤が、MLH1を阻害するMLH1のドミナントネガティブバリアントである、請求項202に記載のプライム編集因子システム。
DNAポリメラーゼが逆転写酵素である、請求項202に記載のプライム編集因子システム。
逆転写酵素がレトロウイルス逆転写酵素である、請求項230に記載のプライム編集因子システム。
逆転写酵素がRNase活性を欠く、請求項230に記載のプライム編集因子システム。
逆転写酵素がモロニーマウス白血病ウイルス逆転写酵素(MMLV-RT)である、請求項230に記載のプライム編集因子システム。
MMLV-RTが、配列番号89及び701～716からなる群から選択される配列と少なくとも85％の同一性を有するアミノ酸配列を含む、請求項233に記載のプライム編集因子システム。
napDNAbpがCRISPR関連(Cas)ヌクレアーゼである、請求項202に記載のプライム編集因子システム。
napDNAbpがCas9ヌクレアーゼドメインを含む、請求項235に記載のプライム編集因子システム。
Cas9ヌクレアーゼドメインが、配列番号18に示される野生型Streptococcus pyogenes Cas9と比較してH840X置換又は対応する置換を含むニッカーゼであり、Xがヒスチジン以外の任意のアミノ酸である、請求項236に記載のプライム編集因子システム。
プライム編集因子のnapDNAbpと複合体を形成し、且つ標的DNA配列に結合するようにnapDNAbpをプログラミングすることができるpegRNAを更に含む、請求項202～237のいずれか一項に記載のプライム編集因子システム。
請求項202～238のいずれか一項に記載のプライム編集因子システム又はその構成要素をコードする核酸分子。
DNAミスマッチ修復経路を回避するのに十分な条件下で、二本鎖標的DNA配列に少なくとも15bp長のヌクレオチド編集を正確にインストールする方法であって、二本鎖標的DNA配列を、核酸プログラム可能DNA結合タンパク質(napDNAbp)、DNAポリメラーゼ、及びプライム編集ガイドRNA(PEgRNA)を含むプライム編集因子と接触させることを含み、PEgRNAは、二本鎖標的DNA配列の第1の鎖にハイブリダイズするスペーサ、二本鎖標的DNA配列の第2の鎖にハイブリダイズする伸長アーム、ヌクレオチド編集を含むDNA合成テンプレート、及びnapDNAbpと相互作用するgRNAコアを含み、且つPEgRNAは、二本鎖標的DNA配列にヌクレオチド編集をインストールするようにプライム編集因子に指示する、前記方法。
ヌクレオチド編集が少なくとも15bp長の欠失である、請求項240に記載の方法。
ヌクレオチド編集が少なくとも15bp長の挿入である、請求項240に記載の方法。
ヌクレオチド編集が、少なくとも16bp、17bp、18bp、19bp、20bp、21bp、22bp、23bp、24bp、又は25bpの長さである、請求項240に記載の方法。
プライム編集によって核酸分子を編集するための方法であって、核酸分子をプライム編集因子及びpegRNAと接触させ、それによって標的部位に核酸分子に対する1つ以上の修飾をインストールすることを含み、核酸分子は、DNAミスマッチ修復(MMR)経路を伴う1つ以上の遺伝子のノックアウトを含む細胞内にある、前記方法。
方法が、核酸分子を第2鎖ニッキングgRNAと接触させることを更に含む、請求項244に記載の方法。
プライム編集効率が、MMRを伴う1つ以上の遺伝子のノックアウトを含まない細胞において行われる方法と比較して、少なくとも1.5倍、少なくとも2.0倍、少なくとも2.5倍、少なくとも3.0倍、少なくとも3.5倍、少なくとも4.0倍、少なくとも4.5倍、少なくとも5.0倍、少なくとも5.5倍、少なくとも6.0倍、少なくとも6.5倍、少なくとも7.0倍、少なくとも7.5倍、少なくとも8.0倍、少なくとも8.5倍、少なくとも9.0倍、少なくとも9.5倍、少なくとも10.0倍、少なくとも11倍、少なくとも12倍、少なくとも13倍、少なくとも14倍、少なくとも15倍、少なくとも16倍、少なくとも17倍、少なくとも18倍、少なくとも19倍、少なくとも20倍、少なくとも21倍、少なくとも22倍、少なくとも23倍、少なくとも24倍、少なくとも25倍、少なくとも26倍、少なくとも27倍、少なくとも28倍、少なくとも29倍、少なくとも30倍、少なくとも31倍、少なくとも32倍、少なくとも33倍、少なくとも34倍、少なくとも35倍、少なくとも36倍、少なくとも37倍、少なくとも38倍、少なくとも39倍、少なくとも40倍、少なくとも41倍、少なくとも42倍、少なくとも43倍、少なくとも44倍、少なくとも45倍、少なくとも46倍、少なくとも47倍、少なくとも48倍、少なくとも49倍、少なくとも50倍、少なくとも51倍、少なくとも52倍、少なくとも53倍、少なくとも54倍、少なくとも55倍、少なくとも56倍、少なくとも57倍、少なくとも58倍、少なくとも59倍、少なくとも60倍、少なくとも61倍、少なくとも62倍、少なくとも63倍、少なくとも64倍、少なくとも65倍、少なくとも66倍、少なくとも67倍、少なくとも68倍、少なくとも69倍、少なくとも70倍、少なくとも71倍、少なくとも72倍、少なくとも73倍、少なくとも74倍、又は少なくとも75倍増加される、請求項244に記載の方法。
インデル形成の頻度が、MMRを伴う1つ以上の遺伝子のノックアウトを含まない細胞において行われる方法と比較して、少なくとも1.5倍、少なくとも2.0倍、少なくとも2.5倍、少なくとも3.0倍、少なくとも3.5倍、少なくとも4.0倍、少なくとも4.5倍、少なくとも5.0倍、少なくとも5.5倍、少なくとも6.0倍、少なくとも6.5倍、少なくとも7.0倍、少なくとも7.5倍、少なくとも8.0倍、少なくとも8.5倍、少なくとも9.0倍、少なくとも9.5倍、少なくとも10.0倍、少なくとも11倍、少なくとも12倍、少なくとも13倍、少なくとも14倍、少なくとも15倍、少なくとも16倍、少なくとも17倍、少なくとも18倍、少なくとも19倍、少なくとも20倍、少なくとも21倍、少なくとも22倍、少なくとも23倍、少なくとも24倍、少なくとも25倍、少なくとも26倍、少なくとも27倍、少なくとも28倍、少なくとも29倍、少なくとも30倍、少なくとも31倍、少なくとも32倍、少なくとも33倍、少なくとも34倍、少なくとも35倍、少なくとも36倍、少なくとも37倍、少なくとも38倍、少なくとも39倍、少なくとも40倍、少なくとも41倍、少なくとも42倍、少なくとも43倍、少なくとも44倍、少なくとも45倍、少なくとも46倍、少なくとも47倍、少なくとも48倍、少なくとも49倍、少なくとも50倍、少なくとも51倍、少なくとも52倍、少なくとも53倍、少なくとも54倍、少なくとも55倍、少なくとも56倍、少なくとも57倍、少なくとも58倍、少なくとも59倍、少なくとも60倍、少なくとも61倍、少なくとも62倍、少なくとも63倍、少なくとも64倍、少なくとも65倍、少なくとも66倍、少なくとも67倍、少なくとも68倍、少なくとも69倍、少なくとも70倍、少なくとも71倍、少なくとも72倍、少なくとも73倍、少なくとも74倍、又は少なくとも75倍減少される、請求項244に記載の方法。
MMRを伴う1つ以上の遺伝子が、タンパク質MLH1、PMS2(又はMutLアルファ)、PMS1(又はMutLベータ)、MLH3(又はMutLガンマ)、MutSアルファ(MSH2-MSH6)、MutSベータ(MSH2-MSH3)、MSH2、MSH6、PCNA、RFC、EXO1、POLδ及びPCNAをコードする遺伝子からなる群から選択される、請求項244に記載の方法。
1つ以上の遺伝子が、MLH1をコードする遺伝子である、請求項248に記載の方法。
MLH1が、配列番号204のアミノ酸配列、又は配列番号204と少なくとも70％、少なくとも75％、少なくとも80％、少なくとも85％、少なくとも90％、少なくとも95％、少なくとも96％、少なくとも97％、少なくとも98％、少なくとも99％、又は最大100％(100％を包含する)の配列同一性を有するアミノ酸配列を含む、請求項249に記載の方法。
プライム編集因子がnapDNAbp及びポリメラーゼを含む、請求項244に記載の方法。
napDNAbpが、ヌクレアーゼ活性Cas9ドメイン、ヌクレアーゼ不活性Cas9ドメイン、又はCas9ニッカーゼドメイン若しくはそのバリアントである、請求項251に記載の方法。
napDNAbpが、Cas9、Cas12e、Cas12d、Cas12a、Cas12b1、Cas13a、Cas12c、Cas12b2、Cas13a、Cas12c、Cas12d、Cas12e、Cas12h、Cas12i、Cas12g、Cas12f(Cas14)、Cas12f1、Cas12j(CasΦ)、及びアルゴノートからなる群から選択され、且つ任意選択でニッカーゼ活性を有する、請求項251に記載の方法。
napDNAbpが、配列番号2、4～67、若しくは99(PEmax)のいずれか1つのアミノ酸配列、又は配列番号2、4～67、若しくは99(PEmax)のいずれか1つと少なくとも80％、85％、90％、95％、若しくは99％の配列同一性を有するアミノ酸配列を含む、請求項251に記載の方法。
napDNAbpが、配列番号2(すなわち、PE1及びPE2のnapDNAbp)のアミノ酸配列、又は配列番号2と少なくとも80％、85％、90％、95％、若しくは99％の配列同一性を有するアミノ酸配列を含む、請求項251に記載の方法。
ポリメラーゼがDNA依存性DNAポリメラーゼ又はRNA依存性DNAポリメラーゼである、請求項251に記載の方法。
ポリメラーゼが逆転写酵素である、請求項251に記載の方法。
逆転写酵素が、配列番号69～98のいずれか1つのアミノ酸配列、又は配列番号69～98のいずれか1つと少なくとも80％、85％、90％、95％、若しくは99％の配列同一性を有するアミノ酸配列を含む、請求項257に記載の方法。
napDNAbp及びプライム編集因子のポリメラーゼが、リンカーによって連結されて融合タンパク質を形成する、請求項251に記載の方法。
リンカーが、配列番号102若しくは118～131のいずれか1つのアミノ酸配列、又は配列番号102若しくは118～131のいずれか1つと少なくとも80％、85％、90％、95％若しくは99％の配列同一性を有するアミノ酸配列を含む、請求項259に記載の方法。
リンカーが、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、38、38、39、40、41、42、43、44、45、46、47、48、49又は50アミノ酸長である、請求項259に記載の方法。
標的部位にインストールされた核酸分子に対する1つ以上の修飾が、1つ以上のトランジション、1つ以上のトランスバージョン、1つ以上の挿入、1つ以上の欠失、又は1つ以上の逆位を含み、且つ任意選択で15bp未満である、請求項244に記載の方法。
1つ以上のトランジションが、(a)TからC;(b)AからG;(c)CからT;及び(d)GからAからなる群から選択される、請求項262に記載の方法。
1つ以上のトランスバージョンが、(a)TからA;(b)TからG;(c)CからG;(d)CからA;(e)AからT;(f)AからC;(g)GからC;及び(h)GからTからなる群から選択される、請求項262に記載の方法。
1つ以上の修飾が、(1)G:C塩基対をT:A塩基対に、(2)G:C塩基対をA:T塩基対に、(3)G:C塩基対をC:G塩基対に、(4)T:A塩基対をG:C塩基対に、(5)T:A塩基対をA:T塩基対に、(6)T:A塩基対をC:G塩基対に、(7)C:G塩基対をG:C塩基対に、(8)C:G塩基対をT:A塩基対に、(9)C:G塩基対をA:T塩基対に、(10)A:T塩基対をT:A塩基対に、(11)A:T塩基対をG:C塩基対に、又は(12)A:T塩基対をC:G塩基対に変更することを含む、請求項244に記載の方法。
1つ以上の修飾が、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24又は25ヌクレオチドの挿入又は欠失を含む、請求項244に記載の方法。
1つ以上の修飾が、疾患関連遺伝子に対する修正を含む、請求項244に記載の方法。
疾患関連遺伝子が、以下からなる群:心疾患;高血圧;アルツハイマー病;関節炎;糖尿病;癌;及び肥満から選択される多遺伝子性障害に関連される、請求項267に記載の方法。
核酸分子をプライム編集因子、pegRNA、及びp53の阻害剤と接触させ、それによって標的部位に核酸分子に対する1つ以上の修飾をインストールすることを含む、プライム編集によって核酸分子を編集するための方法。
方法が、核酸分子を第2鎖ニッキングgRNAと接触させることを更に含む、請求項269に記載の方法。
プライム編集効率が、p53阻害剤の存在下で、少なくとも1.5倍、少なくとも2.0倍、少なくとも2.5倍、少なくとも3.0倍、少なくとも3.5倍、少なくとも4.0倍、少なくとも4.5倍、少なくとも5.0倍、少なくとも5.5倍、少なくとも6.0倍、少なくとも6.5倍、少なくとも7.0倍、少なくとも7.5倍、少なくとも8.0倍、少なくとも8.5倍、少なくとも9.0倍、少なくとも9.5倍、少なくとも10.0倍、少なくとも11倍、少なくとも12倍、少なくとも13倍、少なくとも14倍、少なくとも15倍、少なくとも16倍、少なくとも17倍、少なくとも18倍、少なくとも19倍、少なくとも20倍、少なくとも21倍、少なくとも22倍、少なくとも23倍、少なくとも24倍、少なくとも25倍、少なくとも26倍、少なくとも27倍、少なくとも28倍、少なくとも29倍、少なくとも30倍、少なくとも31倍、少なくとも32倍、少なくとも33倍、少なくとも34倍、少なくとも35倍、少なくとも36倍、少なくとも37倍、少なくとも38倍、少なくとも39倍、少なくとも40倍、少なくとも41倍、少なくとも42倍、少なくとも43倍、少なくとも44倍、少なくとも45倍、少なくとも46倍、少なくとも47倍、少なくとも48倍、少なくとも49倍、少なくとも50倍、少なくとも51倍、少なくとも52倍、少なくとも53倍、少なくとも54倍、少なくとも55倍、少なくとも56倍、少なくとも57倍、少なくとも58倍、少なくとも59倍、少なくとも60倍、少なくとも61倍、少なくとも62倍、少なくとも63倍、少なくとも64倍、少なくとも65倍、少なくとも66倍、少なくとも67倍、少なくとも68倍、少なくとも69倍、少なくとも70倍、少なくとも71倍、少なくとも72倍、少なくとも73倍、少なくとも74倍、又は少なくとも75倍増加される、請求項269に記載の方法。
インデル形成の頻度が、p53阻害剤の存在下で、少なくとも1.5倍、少なくとも2.0倍、少なくとも2.5倍、少なくとも3.0倍、少なくとも3.5倍、少なくとも4.0倍、少なくとも4.5倍、少なくとも5.0倍、少なくとも5.5倍、少なくとも6.0倍、少なくとも6.5倍、少なくとも7.0倍、少なくとも7.5倍、少なくとも8.0倍、少なくとも8.5倍、少なくとも9.0倍、少なくとも9.5倍、少なくとも10.0倍、少なくとも11倍、少なくとも12倍、少なくとも13倍、少なくとも14倍、少なくとも15倍、少なくとも16倍、少なくとも17倍、少なくとも18倍、少なくとも19倍、少なくとも20倍、少なくとも21倍、少なくとも22倍、少なくとも23倍、少なくとも24倍、少なくとも25倍、少なくとも26倍、少なくとも27倍、少なくとも28倍、少なくとも29倍、少なくとも30倍、少なくとも31倍、少なくとも32倍、少なくとも33倍、少なくとも34倍、少なくとも35倍、少なくとも36倍、少なくとも37倍、少なくとも38倍、少なくとも39倍、少なくとも40倍、少なくとも41倍、少なくとも42倍、少なくとも43倍、少なくとも44倍、少なくとも45倍、少なくとも46倍、少なくとも47倍、少なくとも48倍、少なくとも49倍、少なくとも50倍、少なくとも51倍、少なくとも52倍、少なくとも53倍、少なくとも54倍、少なくとも55倍、少なくとも56倍、少なくとも57倍、少なくとも58倍、少なくとも59倍、少なくとも60倍、少なくとも61倍、少なくとも62倍、少なくとも63倍、少なくとも64倍、少なくとも65倍、少なくとも66倍、少なくとも67倍、少なくとも68倍、少なくとも69倍、少なくとも70倍、少なくとも71倍、少なくとも72倍、少なくとも73倍、少なくとも74倍、又は少なくとも75倍減少される、請求項269に記載の方法。
p53の阻害剤がタンパク質である、請求項269に記載の方法。
タンパク質がi53である、請求項273に記載の方法。
p53の阻害剤がp53の活性を阻害する抗体である、請求項269に記載の方法。
p53の阻害剤がp53の活性を阻害する小分子である、請求項269に記載の方法。
p53の阻害剤は、p53の活性を阻害する低分子干渉RNA(siRNA)又は低分子非コードマイクロRNAである、請求項269に記載の方法。
プライム編集因子がnapDNAbp及びポリメラーゼを含む、請求項269に記載の方法。
napDNAbpが、ヌクレアーゼ活性Cas9ドメイン、ヌクレアーゼ不活性Cas9ドメイン、又はCas9ニッカーゼドメイン若しくはそのバリアントである、請求項278に記載の方法。
napDNAbpが、Cas9、Cas12e、Cas12d、Cas12a、Cas12b1、Cas13a、Cas12c、Cas12b2、Cas13a、Cas12c、Cas12d、Cas12e、Cas12h、Cas12i、Cas12g、Cas12f(Cas14)、Cas12f1、Cas12j(CasΦ)、及びアルゴノートからなる群から選択され、且つ任意選択でニッカーゼ活性を有する、請求項278に記載の方法。
napDNAbpが、配列番号2、4～67、若しくは104のいずれか1つのアミノ酸配列、又は配列番号2、4～67、若しくは104のいずれか1つと少なくとも80％、85％、90％、95％、若しくは99％の配列同一性を有するアミノ酸配列を含む、請求項278に記載の方法。
napDNAbpが、配列番号2若しくは配列番号37(すなわち、PE1及びPE2のnapDNAbp)のアミノ酸配列、又は配列番号2若しくは配列番号37と少なくとも80％、85％、90％、95％、若しくは99％の配列同一性を有するアミノ酸配列を含む、請求項278に記載の方法。
ポリメラーゼがDNA依存性DNAポリメラーゼ又はRNA依存性DNAポリメラーゼである、請求項278に記載の方法。
ポリメラーゼが逆転写酵素である、請求項278に記載の方法。
逆転写酵素が、配列番号69～98のいずれか1つのアミノ酸配列、又は配列番号69～98のいずれか1つと少なくとも80％、85％、90％、95％、若しくは99％の配列同一性を有するアミノ酸配列を含む、請求項284に記載の方法。
napDNAbp及びプライム編集因子のポリメラーゼが、リンカーによって連結されて融合タンパク質を形成する、請求項278に記載の方法。
リンカーが、配列番号102若しくは118～131のいずれか1つのアミノ酸配列、又は配列番号102若しくは118～131のいずれか1つと少なくとも80％、85％、90％、95％若しくは99％の配列同一性を有するアミノ酸配列を含む、請求項286に記載の方法。
リンカーが、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、38、38、39、40、41、42、43、44、45、46、47、48、49又は50アミノ酸長である、請求項286に記載の方法。
プライム編集因子、pegRNA及びp53の阻害剤が、一つ以上のDNAベクター上にコードされている、請求項269に記載の方法。
1つ以上のDNAベクターがAAV又はレンチウイルスDNAベクターを含む、請求項289に記載の方法。
AAVベクターが血清型1、2、3、4、5、6、7、8、9又は10である、請求項290に記載の方法。
融合タンパク質としてのプライム編集因子が、第2リンカーによってp53の阻害剤に更に結合される、請求項286に記載の方法。
第2のリンカーが自己加水分解性リンカーを含む、請求項292に記載の方法。
第2のリンカーが、配列番号102、118～131、若しくは233～236のいずれか1つのアミノ酸配列、又は配列番号102、118～131、若しくは233～236のいずれか1つと少なくとも80％、85％、90％、95％、若しくは99％の配列同一性を有するアミノ酸配列を含む、請求項292に記載の方法。
第2のリンカーが、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49又は50アミノ酸長である、請求項292に記載の方法。
標的部位にインストールされた核酸分子に対する1つ以上の修飾が、1つ以上のトランジション、1つ以上のトランスバージョン、1つ以上の挿入、1つ以上の欠失、又は1つ以上の逆位を含み、且つ、任意選択で、1つ以上の修飾は、15bp未満である、請求項269に記載の方法。
1つ以上のトランジションが、(a)TからC;(b)AからG;(c)CからT;及び(d)GからAからなる群から選択される、請求項296に記載の方法。
1つ以上のトランスバージョンが、(a)TからA;(b)TからG;(c)CからG;(d)CからA;(e)AからT;(f)AからC;(g)GからC;及び(h)GからTからなる群から選択される、請求項296に記載の方法。
1つ以上の修飾が、(1)G:C塩基対をT:A塩基対に、(2)G:C塩基対をA:T塩基対に、(3)G:C塩基対をC:G塩基対に、(4)T:A塩基対をG:C塩基対に、(5)T:A塩基対をA:T塩基対に、(6)T:A塩基対をC:G塩基対に、(7)C:G塩基対をG:C塩基対に、(8)C:G塩基対をT:A塩基対に、(9)C:G塩基対をA:T塩基対に、(10)A:T塩基対をT:A塩基対に、(11)A:T塩基対をG:C塩基対に、又は(12)A:T塩基対をC:G塩基対に変更することを含む、請求項269に記載の方法。
1つ以上の修飾が、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24又は25ヌクレオチドの挿入又は欠失を含む、請求項269に記載の方法。
1つ以上の修飾が、疾患関連遺伝子に対する修正を含む、請求項269に記載の方法。
疾患関連遺伝子が、以下からなる群:心疾患;高血圧;アルツハイマー病;関節炎;糖尿病;癌;及び肥満から選択される多遺伝子性障害に関連される、請求項301に記載の方法。
疾患関連遺伝子が、アデノシンデアミナーゼ(ADA)欠損症;α1アンチトリプシン欠損症;嚢胞性線維症;デュシェンヌ型筋ジストロフィ;ガラクトース血症;ヘモクロマトーシス;ハンチントン病;メープルシロップ尿症;マルファン症候群;神経線維腫症1型;先天性爪甲厚膜;フェニルケトン尿症;重度の複合免疫不全;鎌状赤血球症;スミス・レムリ・オピッツ症候群;トリヌクレオチド反復障害;プリオン病;及びテイ・サックス病からなる群から選択される一遺伝子性障害に関連される、請求項301に記載の方法。
核酸分子が細胞内にある、請求項1～303のいずれか一項に記載の方法。
細胞が、哺乳動物細胞、非ヒト霊長類細胞又はヒト細胞である、請求項304に記載の方法。
細胞がex vivoである、請求項304に記載の方法。
細胞が被験体内にあり、任意選択で、被験体は、ヒトである、請求項304に記載の方法。
疾患の処置を必要とする被験体において疾患を処置するための方法であって、方法は、(i)プライム編集因子、(ii)pegRNA、及び(iii)DNAミスマッチ修復経路の阻害剤を被験体に投与することを含み、プライム編集因子は、核酸プログラム可能DNA結合タンパク質(napDNAbp)及びDNAポリメラーゼを含み、
pegRNAは、スペーサ配列と、gRNAコアと、DNA合成鋳型及びプライマー結合部位(PBS)を含む伸長アームとを含み、
スペーサ配列は、対象における二本鎖標的DNA配列の標的鎖と相補性の領域を含み、
gRNAコアは、napDNAbpと会合し、
DNA合成鋳型は、二本鎖標的DNA配列の非標的鎖と相補性の領域、及び、標的鎖二本鎖標的DNA配列と比較して1つ以上のヌクレオチド編集を含み、
プライマー結合部位は、二本鎖標的DNA配列の非標的鎖と相補性の領域を含み、
プライム編集因子及びpegRNAは、二本鎖標的DNAに1つ以上のヌクレオチド編集をインストールし、1つ以上のヌクレオチド編集のインストールは、疾患に関連する二本鎖標的DNAの1つ以上の突然変異を修正し、それによって対象の疾患を処置する、
前記方法。
疾患の処置を必要とする被験体において疾患を処置するための方法であって、方法は、(i)プライム編集因子及び(ii)プライム編集因子が核酸プログラム可能DNA結合タンパク質(napDNAbp)及びDNAポリメラーゼを含むpegRNAを被験体に投与することを含み、
pegRNAは、スペーサ配列と、gRNAコアと、DNA合成鋳型及びプライマー結合部位(PBS)を含む伸長アームとを含み、
スペーサ配列は、対象における二本鎖標的DNA配列の標的鎖と相補性の領域を含み、
gRNAコアは、napDNAbpと会合し、
DNA合成鋳型は、二本鎖標的DNA配列の非標的鎖に対して相補性の領域を含み、二本鎖標的DNA配列の内因性配列と比較して3つ以上の連続するヌクレオチドのミスマッチを含み、3つ以上の連続するヌクレオチドのミスマッチは、(i)突然変異(例として、疾患関連変異)を補正するx個のヌクレオチドの挿入、欠失、若しくは置換、及び(ii)x個のヌクレオチドに直接隣接するy個のヌクレオチドの挿入、欠失、若しくは置換を含み、yヌクレオチドの挿入、欠失、若しくは置換は、サイレント突然変異であり、(x＋y)は、3以上の整数であり、yは、1以上の整数であり、サイレント突然変異(複数可)を含めることは、効率を増加させ、意図しないインデルの頻度を低下させ、及び/又はプライム編集による編集結果純度を改善し、
プライマー結合部位は、二本鎖標的DNA配列の非標的鎖と相補性の領域を含み、
プライム編集因子及びpegRNAは、二本鎖標的DNA中のx個のヌクレオチドの挿入、欠失、又は置換をインストールし、x個のヌクレオチドの挿入、欠失、又は置換は、疾患に関連する二本鎖標的DNA中の1つ以上の突然変異を修正し、それによって対象の疾患を処置する、
前記方法。
被験体がヒトである、請求項308又は309に記載の方法。
核酸プログラム可能DNA結合タンパク質(napDNAbp)ドメインとRNA依存性DNAポリメラーゼ活性を含むドメインとを含む融合タンパク質であって、配列番号99のアミノ酸配列、又は配列番号99と少なくとも80％、少なくとも85％、少なくとも90％、少なくとも95％、少なくとも96％、少なくとも97％、少なくとも98％、少なくとも99％、若しくは少なくとも100％の配列同一性を有するアミノ酸配列を含む、前記融合タンパク質。
核酸プログラム可能DNA結合タンパク質(napDNAbp)ドメインと、RNA依存性DNAポリメラーゼ活性を含むドメインとを含む融合タンパク質であって、napDNAbpは、配列番号104のアミノ酸配列、又は配列番号104と少なくとも80％、少なくとも85％、少なくとも90％、少なくとも95％、少なくとも96％、少なくとも97％、少なくとも98％、少なくとも99％、若しくは少なくとも100％の配列同一性を有するアミノ酸配列を含む、前記融合タンパク質。
核酸プログラム可能DNA結合タンパク質(napDNAbp)ドメインと、RNA依存性DNAポリメラーゼ活性を含むドメインとを含む融合タンパク質であって、RNA依存性DNAポリメラーゼ活性を含むドメインは、配列番号98のアミノ酸配列、又は、配列番号98と少なくとも80％、少なくとも85％、少なくとも90％、少なくとも95％、少なくとも96％、少なくとも97％、少なくとも98％、少なくとも99％、若しくは少なくとも100％の配列同一性を有する、前記融合タンパク質。
napDNAbpと、RNA依存性DNAポリメラーゼ活性を含むドメインとを結合するリンカーを更に含む、請求項311～313のいずれか一項に記載の融合タンパク質。
リンカーが配列番号105を含む、請求項314に記載の融合タンパク質。
napDNAbpがCas9ニッカーゼである、請求項311に記載の融合タンパク質。
Cas9ニッカーゼが、H840A置換と、配列番号37と比較してR221又はN394に少なくとも1つの置換とを含む、請求項316に記載の融合タンパク質。
PEgRNAが、プライム編集のために融合タンパク質を標的DNA配列に向ける、請求項311～317のいずれか一項に記載の融合タンパク質とPEgRNAを含む複合体。
PEgRNAが、ガイドRNAと、ガイドRNAの3'端又は5'端に核酸伸長アームとを含む、請求項318に記載の複合体。
PEgRNAが、napDNAbpに結合することおよびnapDNAbpを標的DNA配列に向けることを可能とする、請求項319に記載の複合体。
請求項311～317のいずれか一項に記載の融合タンパク質をコードするポリヌクレオチド。
融合タンパク質の発現がプロモータの制御下にある、請求項321に記載のポリヌクレオチドを含むベクター。
プロモータがU6プロモータである、請求項322に記載のベクター。
請求項311～317のいずれか一項に記載の融合タンパク質と、融合タンパク質のnapDNAbpに結合したPEgRNAと、を含む細胞。
請求項318～320のいずれか一項に記載の複合体を含む細胞。
(i)請求項311～317のいずれか一項に記載の融合タンパク質、請求項318～320のいずれか一項に記載の複合体、請求項321に記載のポリヌクレオチド、又は請求項322～323のいずれか一項に記載のベクター、及び(ii)薬学的に許容される賦形剤を含む医薬組成物。
プライム編集によって核酸分子を編集するための方法であって、核酸分子を請求項311～317のいずれか一項に記載の修飾されたプライム編集因子及びpegRNAと接触させ、それによって標的部位に核酸分子に対する1つ以上の修飾をインストールすることを含む、前記方法。
方法が、核酸分子を第2鎖ニッキングgRNAと接触させることを更に含む、請求項327に記載の方法。
プライム編集効率が、PE2によるプライム編集と比較して、少なくとも1.5倍、少なくとも2.0倍、少なくとも2.5倍、少なくとも3.0倍、少なくとも3.5倍、少なくとも4.0倍、少なくとも4.5倍、少なくとも5.0倍、少なくとも5.5倍、少なくとも6.0倍、少なくとも6.5倍、少なくとも7.0倍、少なくとも7.5倍、少なくとも8.0倍、少なくとも8.5倍、少なくとも9.0倍、少なくとも9.5倍、又は少なくとも10.0倍増加される、請求項327に記載の方法。