JPWO2020191243A5 - - Google Patents

Download PDF

Info

Publication number
JPWO2020191243A5
JPWO2020191243A5 JP2021556876A JP2021556876A JPWO2020191243A5 JP WO2020191243 A5 JPWO2020191243 A5 JP WO2020191243A5 JP 2021556876 A JP2021556876 A JP 2021556876A JP 2021556876 A JP2021556876 A JP 2021556876A JP WO2020191243 A5 JPWO2020191243 A5 JP WO2020191243A5
Authority
JP
Japan
Prior art keywords
dna
strand
sequence
prime
pegrna
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2021556876A
Other languages
Japanese (ja)
Other versions
JP2022527740A (en
Publication date
Application filed filed Critical
Priority claimed from PCT/US2020/023725 external-priority patent/WO2020191243A1/en
Publication of JP2022527740A publication Critical patent/JP2022527740A/en
Publication of JPWO2020191243A5 publication Critical patent/JPWO2020191243A5/ja
Pending legal-status Critical Current

Links

Images

Description

政府の支援
本発明は、国立衛生研究所によって授与された助成金第U01AI142756号、第RM1HG009490号、第R01EB022376号、および第R35GM118062号の下、政府の支援によりなされた。政府は本発明において一定の権利を有する。
GOVERNMENT SUPPORT This invention was made with Government support under Grants U01AI142756, RM1HG009490, R01EB022376, and R35GM118062 awarded by the National Institutes of Health. The Government has certain rights in this invention.

関連出願および参照による組み込み
この米国仮出願は、以下の出願、つまり、2019年3月19日出願の米国仮出願第62/820,813号(代理人整理番号B1195.70074US00)、2019年6月7日出願の米国仮出願第62/858,958号(代理人整理番号B1195.70074US01)、2019年8月21日出願の米国仮出願第62/889,996号(代理人整理番号B1195.70074US02)、2019年8月21日出願の米国仮出願第62/922,654号(代理人整理番号B1195.70083US00)、2019年10月10日出願の米国仮出願第62/913,553号(代理人整理番号B1195.70074US03)、2019年10月10日出願の米国仮出願第62/973,558号(代理人整理番号B1195.70083US01)、2019年11月5日出願の米国仮出願第62/931,195号(代理人整理番号B1195.70074US04)、2019年12月5日出願の米国仮出願第62/944,231号(代理人整理番号B1195.70074US05)、2019年12月5日出願の米国仮出願第62/974,537号(代理人整理番号B1195.70083US02)、2020年3月17日出願の米国仮出願第62/991,069号(代理人整理番号B1195.70074US06)、および2020年3月17日出願の米国仮出願(これを出願する時点で連番は入手不可能)(代理人整理番号B1195.70083US03)を指し、参照により組み込む。
RELATED APPLICATIONS AND INCORPORATION BY REFERENCE This U.S. provisional application is a continuation of the following applications: U.S. Provisional Application No. 62/820,813, filed March 19, 2019 (Attorney Docket No. B1195.70074US00), U.S. Provisional Application No. 62/858,958, filed June 7, 2019 (Attorney Docket No. B1195.70074US01), U.S. Provisional Application No. 62/858,958, filed August 21, 2019 (Attorney Docket No. B1195.70074US02), No. 889,996 (Attorney Docket No. B1195.70074US02), U.S. Provisional Application No. 62/922,654 filed on August 21, 2019 (Attorney Docket No. B1195.70083US00), U.S. Provisional Application No. 62/913,553 filed on October 10, 2019 (Attorney Docket No. B1195.70074US03), U.S. Provisional Application No. 62/922,654 filed on August 21, 2019 (Attorney Docket No. B1195.70083US00), U.S. Provisional Application No. 62/913,553 filed on October 10, 2019 (Attorney Docket No. B1195.70074US04), U.S. Provisional Application No. 62/922,654 filed on August 21, 2019 (Attorney Docket No. B1195.70083US00), /973,558 (Attorney Docket No. B1195.70083US01), U.S. Provisional Application No. 62/931,195, filed November 5, 2019 (Attorney Docket No. B1195.70074US04), U.S. Provisional Application No. 62/944,231, filed December 5, 2019 (Attorney Docket No. B1195.70074US05), U.S. Provisional Application No. 62/ No. 974,537 (Attorney Docket No. B1195.70083US02), U.S. Provisional Application No. 62/991,069, filed March 17, 2020 (Attorney Docket No. B1195.70074US06), and U.S. Provisional Application No. 62/991,069, filed March 17, 2020 (serial number not available at the time of filing this application) (Attorney Docket No. B1195.70083US03), which are incorporated by reference.

本発明の背景
病原性のある単一ヌクレオチド突然変異は、ある推計によれば遺伝的要素が存在するヒト疾患のおよそ50%に寄与する7。残念ながら、これら遺伝性障害をもつ患者にとっての処置の選択肢は、数十年に及ぶ遺伝子治療探索に関わらず、依然として極度に限定的である8。おそらく、この治療上の課題への最も簡素な解決策は患者ゲノム中の単一ヌクレオチド突然変異の直接的な修正であって、これは疾患の根本的原因に対処し、かつ永続する恩恵を提供するかもしれない。かかるストラテジーはこれまでに考えられないことであったが、CRISRP/Cas系9の到来によってもたらされたゲノム編集性能における近年の改善は今や、この治療的アプローチを射程圏内に入れる。標的DNA配列に相補的な~20ヌクレオチドを含有するガイドRNA(gRNA)配列の簡単なデザインによって、想定されるほぼ全てのゲノム部位は、CRISPR関連(Cas)ヌクレアーゼによって特異的にアクセスされ得る1,2。今日まで、数種の単量体細菌性Casヌクレアーゼ系が同定されており、ゲノム編集用途に適応された10。このCasヌクレアーゼの天然の多様性は、増え続ける改変バリアントの一群と併せて11~14、新しいゲノム編集技術を開発するための肥沃な土壌を用意する。
Background of the Invention Pathogenic single-nucleotide mutations contribute, by some estimates, to approximately 50% of human diseases with a genetic component. 7 Unfortunately, treatment options for patients with these genetic disorders remain extremely limited, despite decades of gene therapy exploration. 8 Perhaps the simplest solution to this therapeutic challenge is the direct correction of single-nucleotide mutations in the patient genome, which may address the underlying cause of the disease and provide lasting benefits. While such a strategy was previously unthinkable, recent improvements in genome editing capabilities brought about by the advent of the CRISRP/Cas system 9 now put this therapeutic approach within reach. By simple design of guide RNA (gRNA) sequences containing ∼20 nucleotides complementary to the target DNA sequence, almost any envisioned genomic site can be specifically accessed by CRISPR-associated (Cas) nucleases. 1,2 To date, several monomeric bacterial Cas nuclease systems have been identified and adapted for genome editing applications. 10 This natural diversity of Cas nucleases, together with a growing collection of engineered variants11-14 , provides fertile ground for the development of new genome editing technologies.

CRISPRでの遺伝子破壊は今や成熟した技法であるとはいえ、ヒトゲノム中の単一塩基対の高精度編集は依然として大きな課題である3。相同組み換え修復(Homology directed repair)(HDR)は長い間、ヒト細胞および他の生物において、所望の編集をコードするドナーDNA修復鋳型を使用しDNA配列を二本鎖切断(double strand break)(DSB)の部位にて挿入、修正、または交換(exchange)するために使用されてきた15。しかしながら、既存のHDRは、ほとんどのヒト細胞型において、具体的に非分裂細胞において、極めて低い効率を有し、両立しない非相同末端結合(non-homologous end joining)(NHEJ)は、主として挿入-欠失(インデル(indel))副産物に繋がる16。他の問題点はDSBの生成に関するが、これは標的遺伝子座にて大きな染色体再配置および欠失を生じさせ得るか17、または成長停止(growth arrest)およびアポトーシスに繋がるp53軸を活性化する18,19 Although gene disruption with CRISPR is now a mature technique, high-precision editing of single base pairs in the human genome remains a major challenge. Homology directed repair (HDR) has long been used in human cells and other organisms to insert, correct, or exchange DNA sequences at sites of double strand breaks (DSBs) using donor DNA repair templates encoding the desired edits. 15 However, existing HDR has extremely low efficiency in most human cell types, particularly in non-dividing cells, and incompatible non-homologous end joining (NHEJ) leads primarily to insertion-deletion (indel) by-products. 16 Other issues concern the generation of DSBs, which can generate large chromosomal rearrangements and deletions at the target locus, 17 or activate the p53 axis leading to growth arrest and apoptosis. 18,19

数種のアプローチがHDRのこれら欠点に対処するために探索されてきた。例えば、単鎖DNA破壊(ニック)のオリゴヌクレオチドドナーでの修復は、インデル形成を低減することが示されたが、所望の修復産物の収率は依然として低い20。他のストラテジーは、小分子および生物学的試薬を使用して修復をNHEJよりHDRへ向かうよう偏らせることを試みている21~23。しかしながら、これらの方法の有効性は細胞型に依存し得、正常な細胞状態の撹乱は、望ましくなくかつ予測不可能な効果へ繋がり得る。 Several approaches have been explored to address these shortcomings of HDR. For example, repair of single-stranded DNA breaks (nicks) with oligonucleotide donors has been shown to reduce indel formation, but the yield of the desired repair product remains low. 20 Other strategies attempt to bias repair toward HDR over NHEJ using small molecules and biological reagents. 21-23 However, the efficacy of these methods may be cell type dependent, and perturbation of normal cellular conditions may lead to undesirable and unpredictable effects.

近年、Devid Liu教授らが率いる本発明者らは、DSBを創出することもHDRに頼ることもなく標的ヌクレオチドを編集する技術として塩基編集を開発した4~6,24~27。Cas融合デアミナーゼによるDNA塩基の直接修飾は、極めて高効率の短い標的窓(short target window)(~5~7塩基)におけるC・G→T・AまたはA・T→G・C塩基対変換を可能にさせる。結果として、塩基編集因子(base editors)は科学界によって迅速に採用された。しかしながら、以下の因子は、高精度ゲノム編集のためのそれらの一般性を限定する:(1)標的窓上の非標的CまたはA塩基の「バイスタンダー(bystander)編集」が観察され;(2)標的ヌクレオチド産物混合物が観察され;(3)標的塩基はPAM配列の15±2ヌクレオチド上流に位置付けられなければならず;(5)小さい挿入および欠失変異の修復は可能ではない。 Recently, we, led by Professor David Liu, have developed base editing as a technique to edit targeted nucleotides without creating DSBs or relying on HDR . 4 - 6, 24 - 27 Direct modification of DNA bases by Cas-fused deaminases allows highly efficient C·G → T·A or A·T → G·C base pair conversions in short target windows (~5-7 bases). As a result, base editors have been rapidly adopted by the scientific community. However, the following factors limit their generality for high-precision genome editing: (1) "bystander editing" of non-targeted C or A bases in the target window is observed; (2) a mixture of targeted nucleotide products is observed; (3) the targeted base must be located 15 ± 2 nucleotides upstream of the PAM sequence; and (5) repair of small insertion and deletion mutations is not possible.

したがって、所望されるいずれの単一ヌクレオチドの変化も柔軟に導入することが可能であるか、および/または塩基対の挿入または欠失(例として、少なくとも1、2、3、4、5、6、8、9、10、11、12、13、14、15、16、17、18、19、20、30、40、50、60、70、80、90、100、もしくはそれより多くの塩基対の挿入または欠失)を組み入れ得るか、および/または標的部位にてヌクレオチド配列を高い特異性および効率で変更もしくは修飾し得る、プログラム型編集因子の開発は、CRISPRに基づくゲノム編集技術の範囲(scope)および治療可能性を実質的に拡大するであろう。 Thus, the development of programmable editing elements that can flexibly introduce any desired single nucleotide change and/or incorporate base pair insertions or deletions (e.g., insertions or deletions of at least 1, 2, 3, 4, 5, 6, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 30, 40, 50, 60, 70, 80, 90, 100, or more base pair insertions or deletions) and/or alter or modify nucleotide sequences at target sites with high specificity and efficiency would substantially expand the scope and therapeutic potential of CRISPR-based genome editing technologies.

本発明の概要
本発明は、「プライム編集」と呼ばれるゲノム編集のための全く新しいプラットホームを記載する。プライム編集は、ポリメラーゼ(すなわち、融合タンパク質の形態であるか、または別様にnapDNAbpとはtransで提供される)と共働する核酸プログラム型DNA結合タンパク質(「napDNAbp」)を使用して、新しい遺伝情報を特定DNA部位中へ直接書き込む多目的かつ正確なゲノム編集方法であるが、プライム編集系は、ガイドRNA上へ(例として、ガイドRNAの5'末もしくは3'末にて、または内部にて)改変される伸長(extension)(DNAまたはRNAのいずれか)を経由する置き換えDNA鎖の形態での所望の編集の合成のための標的部位と鋳型との両方を特定するプライム編集(PE)ガイドRNA(「PEgRNA」)でプログラムされる。所望の編集(例として、単一核酸塩基の置換)を含有する置き換え鎖は、編集されるべき標的部位(それが所望の編集を包含するのは例外として)の内生鎖と同じ配列を共有する。DNA修復および/または複製機構を通して、標的部位の内生鎖は、所望の編集を含有する新しく合成された置き換え鎖によって置き換えられる。いくつかのケースにおいて、本明細書に記載のとおりのプライム編集因子は、編集されるべき所望の標的部位を探査し位置付けるのみならず、同時に、内生DNA鎖の対応する標的部位の代わりに組み入れられる所望の編集を含有する置き換え鎖をコードするところ、プライム編集は「探査-と-置き換え(search-and-replace)」ゲノム編集技術であると考えられることもある。
Overview of the Invention The present invention describes an entirely new platform for genome editing, called "prime editing". Prime editing is a versatile and precise genome editing method that uses a nucleic acid programmable DNA binding protein ("napDNAbp") in cooperation with a polymerase (i.e., in the form of a fusion protein or otherwise provided in trans with napDNAbp) to write new genetic information directly into a specific DNA site, whereas the prime editing system is programmed with a prime editing (PE) guide RNA ("PEgRNA") that specifies both the target site and a template for the synthesis of the desired edit in the form of a replacement DNA strand via an extension (either DNA or RNA) that is engineered onto the guide RNA (e.g., at the 5' or 3' end of the guide RNA, or internally). The replacement strand, which contains the desired edit (e.g., a single nucleobase substitution), shares the same sequence as the endogenous strand of the target site to be edited (with the exception that it encompasses the desired edit). Through DNA repair and/or replication mechanisms, the endogenous strand of the target site is replaced by the newly synthesized replacement strand, which contains the desired edit. In some cases, prime editing may be considered a "search-and-replace" genome editing technique, where prime editing elements as described herein not only search for and locate the desired target site to be edited, but also simultaneously encode a replacement strand containing the desired edit that is incorporated in place of the corresponding target site in the endogenous DNA strand.

本開示のプライム編集因子は、標的にプライムされた(target-primed)逆転写(TPRT)または「プライム編集」の機序が、効率および遺伝子の融通性(genetic flexibility)が高い高精度CRISPR/Casベースのゲノム編集を(例として、図1A~1Fの様々な態様において描かれているとおり)行うために活用または採用され得るという発見に、一部関する。TPRTは天然には、哺乳動物の非LTRレトロトランスポゾンおよび細菌のグループIIイントロンなどの可動DNA因子(mobile DNA elements)によって使用される28,29。本発明者らは本明細書中、特定のDNA配列をガイドRNAで標的にし、標的部位にて単鎖ニックを生成し、およびニック入りDNAを、ガイドRNAで取り入れられた改変逆転写酵素鋳型の逆転写のためのプライマーとして使用する、Casタンパク質-逆転写酵素の融合体または関連する系を使用している。しかしながら、この概念は逆転写酵素をDNAポリメラーゼの構成要素として使用するプライム編集因子から始まったものの、本明細書に記載のプライム編集因子は逆転写酵素に限定されず、事実上はDNAポリメラーゼの使用を包含していてもよい。実際に本出願は全体を通し「逆転写酵素」をもつプライム編集因子に言及することもあるが、逆転写酵素は、プライム編集で働き得る唯一のタイプのDNAポリメラーゼであることが本明細書に説明されている。よって、本明細書のどこで「逆転写酵素」に言及しようとも、当業者は、いずれの好適なDNAポリメラーゼも逆転写酵素の代わりに使用されてもよいことを解するはずである。よって、一側面において、プライム編集因子は、標的DNA中の相補的なプロトスペーサーとアニールするスペーサー配列を含有する特化されたガイドRNA(すなわち、PEgRNA)とDNA配列を結び付けることによってDNA配列を標的にするようプログラムされているCas9(または等価なnapDNAbp)を含んでいてもよい。特化されたガイドRNAはまた、対応する内生DNA鎖を標的部位にて置き換えるために使用される所望の遺伝子変更を含有するDNAの置き換え鎖をコードする伸長という形態で、新しい遺伝情報も含有する。情報をPEgRNAから標的DNAへ伝達するため、プライム編集の機序は、3'ヒドロキシル基を晒すDNAの一方の鎖中の標的部位にニックを入れることを伴う。晒される3'ヒドロキシル基は次いで、PEgRNA上の、編集をコードする伸長の、標的部位中への直接的なDNA重合をプライムするのに使用され得る。様々な態様において、伸長-これは編集を含有する置き換え鎖の重合のための鋳型を提供する-は、RNAまたはDNAから形成され得る。RNA伸長のケースにおいて、プライム編集因子のポリメラーゼは、RNA依存性DNAポリメラーゼ(逆転写酵素など)であり得る。DNA伸長のケースにおいて、プライム編集因子のポリメラーゼは、DNA依存性DNAポリメラーゼであってもよい。 The prime editors of the present disclosure relate in part to the discovery that the mechanism of target-primed reverse transcription (TPRT) or "prime editing" can be exploited or employed to perform high-precision CRISPR/Cas-based genome editing with high efficiency and genetic flexibility (e.g., as depicted in various embodiments in Figures 1A-1F). TPRT is naturally used by mobile DNA elements such as mammalian non-LTR retrotransposons and bacterial group II introns28,29 . Herein, we use Cas protein-reverse transcriptase fusions or related systems that target specific DNA sequences with a guide RNA, generate a single-stranded nick at the target site, and use the nicked DNA as a primer for reverse transcription of a modified reverse transcriptase template incorporated by the guide RNA. However, although the concept originates from prime editors that use reverse transcriptase as a component of the DNA polymerase, the prime editors described herein are not limited to reverse transcriptases and may encompass the use of any DNA polymerase in nature. Indeed, although the application may refer to a prime editor with a "reverse transcriptase" throughout, it is explained herein that reverse transcriptase is the only type of DNA polymerase that can function in prime editing. Thus, wherever "reverse transcriptase" is referred to herein, one skilled in the art will understand that any suitable DNA polymerase may be used in place of reverse transcriptase. Thus, in one aspect, a prime editor may comprise a Cas9 (or equivalent napDNAbp) that is programmed to target a DNA sequence by linking the DNA sequence to a specialized guide RNA (i.e., a PEgRNA) that contains a spacer sequence that anneals to a complementary protospacer in the target DNA. The specialized guide RNA also contains new genetic information in the form of a stretch that codes for a replacement strand of DNA that contains the desired genetic alteration that is used to replace the corresponding endogenous DNA strand at the target site. To transfer information from the PEgRNA to the target DNA, the mechanism of prime editing involves nicking the target site in one strand of DNA exposing a 3' hydroxyl group. The exposed 3' hydroxyl group can then be used to prime DNA polymerization of an extension on the PEgRNA that encodes the edit directly into the target site. In various embodiments, the extension - which provides a template for polymerization of the displaced strand containing the edit - can be made from RNA or DNA. In the case of RNA extension, the polymerase of the primed editor can be an RNA-dependent DNA polymerase (such as reverse transcriptase). In the case of DNA extension, the polymerase of the primed editor can be a DNA-dependent DNA polymerase.

本明細書に開示のプライム編集因子によって形成された、新しく合成された鎖(すなわち、所望の編集を含有する置き換えDNA鎖)は、所望のヌクレオチド変化(例として、単一ヌクレオチドの変化、欠失、もしくは挿入、またはそれらの組み合わせ)を包含することを除けば、ゲノムの標的配列と相同である(すなわち、これと同じ配列を有する)であろう。新しく合成された(または置き換え)DNAの鎖はまた、単鎖DNAフラップと称されることもあるが、これはハイブリダイゼーションを相補的な相同の内生DNA鎖と競合し、これによって対応する内生鎖に取って代わる。ある態様において、系は、エラーを起こしやすい(error-prone)逆転写酵素(例として、Cas9ドメインとの融合タンパク質として提供されるか、またはCas9ドメインとはtransで提供される)の使用と組み合わせられ得る。エラーを起こしやすい逆転写酵素は、単鎖DNAフラップ合成の最中に変更を導入し得る。よって、ある態様において、エラーを起こしやすい逆転写酵素は、ヌクレオチド変化を標的DNAへ導入するために利用され得る。系とともに使用される、エラーを起こしやすい逆転写酵素に応じて、変化はランダムまたは非ランダムであり得る。 The newly synthesized strand (i.e., the replacement DNA strand containing the desired edit) formed by the primed editing factors disclosed herein will be homologous to (i.e., have the same sequence as) the target sequence of the genome, except that it contains the desired nucleotide change (e.g., a single nucleotide change, deletion, or insertion, or a combination thereof). The newly synthesized (or replacement) strand of DNA, sometimes also referred to as a single-stranded DNA flap, competes with the complementary homologous endogenous DNA strand for hybridization, thereby displacing the corresponding endogenous strand. In some embodiments, the system can be combined with the use of an error-prone reverse transcriptase (e.g., provided as a fusion protein with a Cas9 domain or provided in trans with a Cas9 domain). The error-prone reverse transcriptase can introduce modifications during the synthesis of the single-stranded DNA flap. Thus, in some embodiments, an error-prone reverse transcriptase can be utilized to introduce nucleotide changes into the target DNA. Depending on the error-prone reverse transcriptase used with the system, the changes can be random or non-random.

ハイブリダイズされた中間体(内生DNA鎖とハイブリダイズされた逆転写酵素によって合成された単鎖DNAフラップを含む)の分解は、その結果得られる内生DNAの、取って代わられたフラップの(例として、5'末DNAフラップエンドヌクレアーゼ、FEN1での)除去、合成された単鎖DNAフラップの標的DNAへのライゲーション、ならびに細胞のDNA修復および/または複製プロセスの結果としての所望のヌクレオチド変化の同化を包含し得る。鋳型化(templated)DNA合成が、単一ヌクレオチドという高精度を、挿入および欠失を包含する、いずれのヌクレオチドの修飾にも付与することから、このアプローチの幅は極めて広く、基礎科学および治療法における無数の用途に使用され得ることが予見できる。 Degradation of the hybridized intermediate (including the single-stranded DNA flap synthesized by the reverse transcriptase hybridized to the endogenous DNA strand) may involve the resulting removal of the displaced flap from the endogenous DNA (e.g., with 5'-end DNA flap endonuclease, FEN1), ligation of the synthesized single-stranded DNA flap to the target DNA, and assimilation of the desired nucleotide change as a result of the cellular DNA repair and/or replication processes. Because templated DNA synthesis confers high precision of single nucleotides for any nucleotide modification, including insertions and deletions, the breadth of this approach is extremely broad and it is foreseeable that it could be used for a myriad of applications in basic science and therapy.

一側面において、本明細書は、核酸プログラム型DNA結合タンパク質(napDNAbp)と逆転写酵素とを含む融合タンパク質を提供する。種々の態様において、融合タンパク質は、伸長されたガイドRNAの存在下においてプライム標的にプライムされた逆転写によるゲノム編集を実行することができる。 In one aspect, the present specification provides a fusion protein comprising a nucleic acid programmable DNA binding protein (napDNAbp) and a reverse transcriptase. In various embodiments, the fusion protein is capable of performing genome editing by primed reverse transcription to a prime target in the presence of an extended guide RNA.

ある態様において、napDNAbpはニッカーゼ活性を有する。napDNAbpは、Cas9タンパク質またはその機能的等価物、例えばヌクレアーゼ活性Cas9、ヌクレアーゼ不活性型Cas9(dCas9)、またはCas9ニッカーゼ(nCas9)でもまたあり得る。 In some embodiments, the napDNAbp has nickase activity. The napDNAbp can also be a Cas9 protein or a functional equivalent thereof, such as a nuclease-active Cas9, a nuclease-inactive Cas9 (dCas9), or a Cas9 nickase (nCas9).

ある態様において、napDNAbpは:Cas9、Cas12e、Cas12d、Cas12a、Cas12b1、Cas13a、Cas12c、およびアルゴノートからなる群から選択され、任意にニッカーゼ活性を有する。 In some embodiments, the napDNAbp is selected from the group consisting of: Cas9, Cas12e, Cas12d, Cas12a, Cas12b1, Cas13a, Cas12c, and Argonaute, and optionally has nickase activity.

他の態様において、融合タンパク質は、伸長されたガイドRNAと複合体化したときに標的DNA配列に結合することができる。 In other embodiments, the fusion protein is capable of binding to a target DNA sequence when complexed with an extended guide RNA.

なお他の態様において、標的DNA配列は標的鎖および相補的な非標的鎖を含む。 In yet other embodiments, the target DNA sequence includes a target strand and a complementary non-target strand.

他の態様において、伸長されたガイドRNAに対する複合体化した融合タンパク質の結合はRループを形成する。Rループは(i)伸長されたガイドRNAと標的鎖とを含むRNA-DNAハイブリッドおよび(ii)相補的な非標的鎖を含み得る。 In other embodiments, binding of the complexed fusion protein to the extended guide RNA forms an R-loop. The R-loop may comprise (i) an RNA-DNA hybrid comprising the extended guide RNA and a target strand, and (ii) a complementary non-target strand.

なお他の態様において、相補的な非標的鎖はニッキングされて、遊離の3'端を有する逆転写酵素プライム配列を形成する。 In yet other embodiments, the complementary non-target strand is nicked to form a reverse transcriptase prime sequence with a free 3' end.

種々の態様において、伸長されたガイドRNAは、(a)ガイドRNAと、(b)ガイドRNAの5'もしくは3'端またはガイドRNAの分子内の位置付けにおけるRNA伸長とを含む。RNA伸長は、(i)所望のヌクレオチド変化を含む逆転写鋳型配列と、(ii)逆転写プライマー結合部位と、(iii)任意にリンカー配列とを含み得る。種々の態様において、逆転写鋳型配列は、ニック部位に隣接する内生DNA配列に対して相補的である一本鎖DNAフラップをコードし得、一本鎖DNAフラップは所望のヌクレオチド変化を含む。 In various embodiments, the extended guide RNA comprises (a) a guide RNA and (b) an RNA extension at the 5' or 3' end of the guide RNA or at an intramolecular location of the guide RNA. The RNA extension may comprise (i) a reverse transcription template sequence containing the desired nucleotide change, (ii) a reverse transcription primer binding site, and (iii) optionally a linker sequence. In various embodiments, the reverse transcription template sequence may encode a single-stranded DNA flap that is complementary to an endogenous DNA sequence adjacent to the nick site, the single-stranded DNA flap containing the desired nucleotide change.

様々な態様において、RNA伸長は、長さが少なくとも5ヌクレオチド、少なくとも6ヌクレオチド、少なくとも7ヌクレオチド、少なくとも8ヌクレオチド、少なくとも9ヌクレオチド、少なくとも10ヌクレオチド、少なくとも11ヌクレオチド、少なくとも12ヌクレオチド、少なくとも13ヌクレオチド、少なくとも14ヌクレオチド、少なくとも15ヌクレオチド、少なくとも16ヌクレオチド、少なくとも17ヌクレオチド、少なくとも18ヌクレオチド、少なくとも19ヌクレオチド、少なくとも20ヌクレオチド、少なくとも21ヌクレオチド、少なくとも22ヌクレオチド、少なくとも23ヌクレオチド、少なくとも24ヌクレオチド、または少なくとも25ヌクレオチドである。 In various embodiments, the RNA extension is at least 5 nucleotides, at least 6 nucleotides, at least 7 nucleotides, at least 8 nucleotides, at least 9 nucleotides, at least 10 nucleotides, at least 11 nucleotides, at least 12 nucleotides, at least 13 nucleotides, at least 14 nucleotides, at least 15 nucleotides, at least 16 nucleotides, at least 17 nucleotides, at least 18 nucleotides, at least 19 nucleotides, at least 20 nucleotides, at least 21 nucleotides, at least 22 nucleotides, at least 23 nucleotides, at least 24 nucleotides, or at least 25 nucleotides in length.

なお他の態様において、一本鎖DNAフラップは、ニック部位に隣接する内生DNA配列にハイブリダイズし、それによって所望のヌクレオチド変化を組み入れ得る。なお他の態様において、一本鎖DNAフラップは、遊離の5'端を有しかつニック部位に隣接する内生DNA配列に取って代わる。ある態様において、5'端を有する取って代わられた内生DNAは細胞によって切除される。 In still other embodiments, the single-stranded DNA flap hybridizes to the endogenous DNA sequence adjacent to the nick site, thereby incorporating the desired nucleotide change. In still other embodiments, the single-stranded DNA flap has a free 5' end and replaces the endogenous DNA sequence adjacent to the nick site. In some embodiments, the replaced endogenous DNA with the 5' end is excised by the cell.

種々の態様において、一本鎖DNAフラップの細胞性修復は所望のヌクレオチド変化の組み入れをもたらし、それによって所望の産物を形成する。 In various embodiments, cellular repair of the single-stranded DNA flap results in incorporation of the desired nucleotide change, thereby forming the desired product.

種々の他の態様において、所望のヌクレオチド変化は、PAM配列の約-4~+10の間にある編集窓上に組み入れされる。 In various other embodiments, the desired nucleotide change is incorporated into an editing window between about -4 and +10 of the PAM sequence.

なお他の態様において、所望のヌクレオチド変化は、ニック部位の約-5~+5の間、またはニック部位の約-10~+10の間、またはニック部位の約-20~+20の間、またはニック部位の約-30~+30の間、またはニック部位の約-40~+40の間、またはニック部位の約-50~+50の間、またはニック部位の約-60~+60の間、またはニック部位の約-70~+70の間、またはニック部位の約-80~+80の間、またはニック部位の約-90~+90の間、またはニック部位の約-100~+100の間、またはニック部位の約-200~+200の間である編集窓上に組み入れされる。 In still other embodiments, the desired nucleotide change is incorporated over an editing window that is between about -5 and +5 at the nick site, or between about -10 and +10 at the nick site, or between about -20 and +20 at the nick site, or between about -30 and +30 at the nick site, or between about -40 and +40 at the nick site, or between about -50 and +50 at the nick site, or between about -60 and +60 at the nick site, or between about -70 and +70 at the nick site, or between about -80 and +80 at the nick site, or between about -90 and +90 at the nick site, or between about -100 and +100 at the nick site, or between about -200 and +200 at the nick site.

種々の態様において、napDNAbpは配列番号18のアミノ酸配列を含む。種々の他の態様において、napDNAbpは、配列番号26~39、42~61、75~76、126、130、137、141、147、153、157、445、460、467、および482~487(Cas9);(SpCas9);配列番号77~86(CP-Cas9);配列番号18~25および87~88(SpCas9);および配列番号62~72(Cas12)のいずれか1つのアミノ酸配列と少なくとも80%、85%、90%、95%、98%、または99%同一であるアミノ酸配列を含む。 In various embodiments, the napDNAbp comprises the amino acid sequence of SEQ ID NO: 18. In various other embodiments, the napDNAbp comprises an amino acid sequence that is at least 80%, 85%, 90%, 95%, 98%, or 99% identical to the amino acid sequence of any one of SEQ ID NOs: 26-39, 42-61, 75-76, 126, 130, 137, 141, 147, 153, 157, 445, 460, 467, and 482-487 (Cas9); (SpCas9); SEQ ID NOs: 77-86 (CP-Cas9); SEQ ID NOs: 18-25 and 87-88 (SpCas9); and SEQ ID NOs: 62-72 (Cas12).

他の態様において、開示される融合タンパク質および/または組成物の逆転写酵素は、配列番号89~100、105~122、128~129、132、139、143、149、154、159、235、454、471、516、662、700~716、739~742、および766のアミノ酸配列のいずれか1つを含み得る。なお他の態様において、逆転写酵素は、配列番号89~100、105~122、128~129、132、139、143、149、154、159、235、454、471、516、662、700~716、739~742、および766のいずれか1つのアミノ酸配列と少なくとも80%、85%、90%、95%、98%、または99%同一であるアミノ酸配列を含み得る。これらの配列は例えばレトロウイルスもしくはレトロトランスポゾンからの天然に存在する逆転写酵素配列であり得るか、または配列は組み換えであり得る。 In other embodiments, the reverse transcriptase of the disclosed fusion proteins and/or compositions can include any one of the amino acid sequences of SEQ ID NOs: 89-100, 105-122, 128-129, 132, 139, 143, 149, 154, 159, 235, 454, 471, 516, 662, 700-716, 739-742, and 766. In yet other embodiments, the reverse transcriptase can include an amino acid sequence that is at least 80%, 85%, 90%, 95%, 98%, or 99% identical to any one of the amino acid sequences of SEQ ID NOs: 89-100, 105-122, 128-129, 132, 139, 143, 149, 154, 159, 235, 454, 471, 516, 662, 700-716, 739-742, and 766. These sequences can be naturally occurring reverse transcriptase sequences, for example from retroviruses or retrotransposons, or the sequences can be recombinant.

種々の他の態様において、本明細書に開示の融合タンパク質は種々の構造的構成を含み得る。例えば、融合タンパク質は構造NH2-[napDNAbp]-[逆転写酵素]-COOH;またはNH2-[逆転写酵素]-[napDNAbp]-COOHを含み得、「]-[」の夫々のものは任意のリンカー配列の存在を指示する。 In various other embodiments, the fusion proteins disclosed herein may comprise various structural configurations. For example, the fusion protein may comprise the structure NH2- [napDNAbp]-[reverse transcriptase]-COOH; or NH2- [reverse transcriptase]-[napDNAbp]-COOH, each of which indicates the presence of an optional linker sequence.

種々の態様において、リンカー配列は、配列番号127、165~176、446、453、および767~769のアミノ酸配列、または配列番号127、165~176、446、453、および767~769のリンカーアミノ酸配列のいずれか1つと少なくとも80%、85%、もしくは90%、もしくは95%、もしくは99%同一であるアミノ酸配列を含む。 In various embodiments, the linker sequence comprises an amino acid sequence of SEQ ID NOs: 127, 165-176, 446, 453, and 767-769, or an amino acid sequence that is at least 80%, 85%, or 90%, or 95%, or 99% identical to any one of the linker amino acid sequences of SEQ ID NOs: 127, 165-176, 446, 453, and 767-769.

種々の態様において、標的DNA上に組み込まれる所望のヌクレオチド変化は、1ヌクレオチド変化(例えば、トランジションまたはトランスバージョン)、1つ以上のヌクレオチドの挿入、または1つ以上のヌクレオチドの欠失であり得る。 In various embodiments, the desired nucleotide change incorporated into the target DNA can be a single nucleotide change (e.g., a transition or transversion), an insertion of one or more nucleotides, or a deletion of one or more nucleotides.

ある種のケースでは、挿入は、長さが少なくとも1、少なくとも2、少なくとも3、少なくとも4、少なくとも5、少なくとも6、少なくとも7、少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも16、少なくとも17、少なくとも18、少なくとも19、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90、少なくとも100、少なくとも200、少なくとも300、少なくとも400、または少なくとも500ヌクレオチドである。 In certain cases, the insertion is at least 1, at least 2, at least 3, at least 4, at least 5, at least 6, at least 7, at least 8, at least 9, at least 10, at least 11, at least 12, at least 13, at least 14, at least 15, at least 16, at least 17, at least 18, at least 19, at least 20, at least 30, at least 40, at least 50, at least 60, at least 70, at least 80, at least 90, at least 100, at least 200, at least 300, at least 400, or at least 500 nucleotides in length.

ある種の他のケースでは、欠失は、長さが少なくとも1、少なくとも2、少なくとも3、少なくとも4、少なくとも5、少なくとも6、少なくとも7、少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも16、少なくとも17、少なくとも18、少なくとも19、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90、少なくとも100、少なくとも200、少なくとも300、少なくとも400、または少なくとも500ヌクレオチドである。 In certain other cases, the deletion is at least 1, at least 2, at least 3, at least 4, at least 5, at least 6, at least 7, at least 8, at least 9, at least 10, at least 11, at least 12, at least 13, at least 14, at least 15, at least 16, at least 17, at least 18, at least 19, at least 20, at least 30, at least 40, at least 50, at least 60, at least 70, at least 80, at least 90, at least 100, at least 200, at least 300, at least 400, or at least 500 nucleotides in length.

別の側面において、本開示はガイドRNAと少なくとも1つのRNA伸長とを含む伸長されたガイドRNAを提供する。RNA伸長はガイドRNAの3'端に位置取り得る。他の態様において、RNA伸長はガイドRNAの5'に位置取り得る。なお他の態様において、RNA伸長はガイドRNA上の分子内位置に位置取り得る。しかしながら、好ましくは、伸長された部分の分子内の位置取りはプロトスペーサーの機能を遮断しない。 In another aspect, the disclosure provides an extended guide RNA comprising a guide RNA and at least one RNA extension. The RNA extension may be located at the 3' end of the guide RNA. In other embodiments, the RNA extension may be located at the 5' end of the guide RNA. In yet other embodiments, the RNA extension may be located at an intramolecular location on the guide RNA. However, preferably, the intramolecular positioning of the extended portion does not block the function of the protospacer.

様々な態様において、プライム編集因子ガイドRNA(PEgRNA)は、napDNAbpへ結合すること、およびnapDNAbpを標的DNA配列へ向かわせることが可能である。標的DNA配列は、標的鎖および相補的な非標的鎖を含み得るが、ここでガイドRNAは、標的鎖とハイブリダイズすることでRNA-DNAハイブリッドおよびRループを形成する。 In various embodiments, a prime editor guide RNA (PEgRNA) is capable of binding to the napDNAbp and directing the napDNAbp to a target DNA sequence. The target DNA sequence may include a target strand and a complementary non-target strand, where the guide RNA hybridizes to the target strand to form an RNA-DNA hybrid and an R-loop.

プライム編集因子ガイドRNAの様々な態様において、少なくとも1のRNA伸長は、DNA合成鋳型を含む。様々な他の態様において、RNA伸長は、逆転写プライマー結合部位をさらに含む。更なる他の態様において、RNA伸長は、RNA伸長をガイドRNAへ結び合わせるリンカーまたはスペーサーを含む。 In various embodiments of the prime editor guide RNA, at least one RNA extension comprises a DNA synthesis template. In various other embodiments, the RNA extension further comprises a reverse transcription primer binding site. In still other embodiments, the RNA extension comprises a linker or spacer that links the RNA extension to the guide RNA.

様々な態様において、RNA伸長は、長さが少なくとも5ヌクレオチド、少なくとも6ヌクレオチド、少なくとも7ヌクレオチド、少なくとも8ヌクレオチド、少なくとも9ヌクレオチド、少なくとも10ヌクレオチド、少なくとも11ヌクレオチド、少なくとも12ヌクレオチド、少なくとも13ヌクレオチド、少なくとも14ヌクレオチド、少なくとも15ヌクレオチド、少なくとも16ヌクレオチド、少なくとも17ヌクレオチド、少なくとも18ヌクレオチド、少なくとも19ヌクレオチド、少なくとも20ヌクレオチド、少なくとも21ヌクレオチド、少なくとも22ヌクレオチド、少なくとも23ヌクレオチド、少なくとも24ヌクレオチド、少なくとも25ヌクレオチド、少なくとも30ヌクレオチド、少なくとも40ヌクレオチド、少なくとも50ヌクレオチド、少なくとも60ヌクレオチド、少なくとも70ヌクレオチド、少なくとも80ヌクレオチド、少なくとも90ヌクレオチド、少なくとも100ヌクレオチド、少なくとも150ヌクレオチド、少なくとも200ヌクレオチド、少なくとも300ヌクレオチド、少なくとも400ヌクレオチド、または少なくとも500ヌクレオチドであり得る。 In various embodiments, the RNA extension can be at least 5 nucleotides, at least 6 nucleotides, at least 7 nucleotides, at least 8 nucleotides, at least 9 nucleotides, at least 10 nucleotides, at least 11 nucleotides, at least 12 nucleotides, at least 13 nucleotides, at least 14 nucleotides, at least 15 nucleotides, at least 16 nucleotides, at least 17 nucleotides, at least 18 nucleotides, at least 19 nucleotides, at least 20 nucleotides, at least 21 nucleotides, at least 22 nucleotides, at least 23 nucleotides, at least 24 nucleotides, at least 25 nucleotides, at least 30 nucleotides, at least 40 nucleotides, at least 50 nucleotides, at least 60 nucleotides, at least 70 nucleotides, at least 80 nucleotides, at least 90 nucleotides, at least 100 nucleotides, at least 150 nucleotides, at least 200 nucleotides, at least 300 nucleotides, at least 400 nucleotides, or at least 500 nucleotides in length.

他の態様において、DNA合成鋳型(すなわち、図27につき、編集鋳型)は、長さが少なくとも3ヌクレオチド、少なくとも4ヌクレオチド、少なくとも5ヌクレオチド、少なくとも6ヌクレオチド、少なくとも7ヌクレオチド、少なくとも8ヌクレオチド、少なくとも9ヌクレオチド、少なくとも10ヌクレオチド、少なくとも11ヌクレオチド、少なくとも12ヌクレオチド、少なくとも13ヌクレオチド、少なくとも14ヌクレオチド、少なくとも15ヌクレオチド、少なくとも16ヌクレオチド、少なくとも17ヌクレオチド、少なくとも18ヌクレオチド、少なくとも19ヌクレオチド、少なくとも20ヌクレオチド、少なくとも30ヌクレオチド、少なくとも40ヌクレオチド、少なくとも50ヌクレオチド、少なくとも60ヌクレオチド、少なくとも70ヌクレオチド、少なくとも80ヌクレオチド、少なくとも90ヌクレオチド、少なくとも100ヌクレオチド、少なくとも200ヌクレオチド、少なくとも300ヌクレオチド、少なくとも400ヌクレオチド、または少なくとも500ヌクレオチドである。 In other embodiments, the DNA synthesis template (i.e., with respect to FIG. 27, the editing template) is at least 3 nucleotides, at least 4 nucleotides, at least 5 nucleotides, at least 6 nucleotides, at least 7 nucleotides, at least 8 nucleotides, at least 9 nucleotides, at least 10 nucleotides, at least 11 nucleotides, at least 12 nucleotides, at least 13 nucleotides, at least 14 nucleotides, at least 15 nucleotides, at least 16 nucleotides, at least 17 nucleotides, at least 18 nucleotides, at least 19 nucleotides, at least 20 nucleotides, at least 30 nucleotides, at least 40 nucleotides, at least 50 nucleotides, at least 60 nucleotides, at least 70 nucleotides, at least 80 nucleotides, at least 90 nucleotides, at least 100 nucleotides, at least 200 nucleotides, at least 300 nucleotides, at least 400 nucleotides, or at least 500 nucleotides in length.

更なる他の態様において、逆転写プライマー結合部位配列(すなわち、図27につき、プライマー結合部位)は、長さが少なくとも3ヌクレオチド、少なくとも4ヌクレオチド、少なくとも5ヌクレオチド、少なくとも6ヌクレオチド、少なくとも7ヌクレオチド、少なくとも8ヌクレオチド、少なくとも9ヌクレオチド、少なくとも10ヌクレオチド、少なくとも11ヌクレオチド、少なくとも12ヌクレオチド、少なくとも13ヌクレオチド、少なくとも14ヌクレオチド、少なくとも15ヌクレオチド、少なくとも16ヌクレオチド、少なくとも17ヌクレオチド、少なくとも18ヌクレオチド、少なくとも19ヌクレオチド、少なくとも20ヌクレオチド、少なくとも30ヌクレオチド、少なくとも40ヌクレオチド、少なくとも50ヌクレオチド、少なくとも60ヌクレオチド、少なくとも70ヌクレオチド、少なくとも80ヌクレオチド、少なくとも90ヌクレオチド、少なくとも100ヌクレオチド、少なくとも200ヌクレオチド、少なくとも300ヌクレオチド、少なくとも400ヌクレオチド、または少なくとも500ヌクレオチドである。 In still other embodiments, the reverse transcription primer binding site sequence (i.e., with respect to FIG. 27, the primer binding site) is at least 3 nucleotides, at least 4 nucleotides, at least 5 nucleotides, at least 6 nucleotides, at least 7 nucleotides, at least 8 nucleotides, at least 9 nucleotides, at least 10 nucleotides, at least 11 nucleotides, at least 12 nucleotides, at least 13 nucleotides, at least 14 nucleotides, at least 15 nucleotides, at least 16 nucleotides, at least 17 nucleotides, at least 18 nucleotides, at least 19 nucleotides, at least 20 nucleotides, at least 30 nucleotides, at least 40 nucleotides, at least 50 nucleotides, at least 60 nucleotides, at least 70 nucleotides, at least 80 nucleotides, at least 90 nucleotides, at least 100 nucleotides, at least 200 nucleotides, at least 300 nucleotides, at least 400 nucleotides, or at least 500 nucleotides in length.

他の態様において、任意のリンカーまたはスペーサーは、長さが少なくとも3ヌクレオチド、少なくとも4ヌクレオチド、少なくとも5ヌクレオチド、少なくとも6ヌクレオチド、少なくとも7ヌクレオチド、少なくとも8ヌクレオチド、少なくとも9ヌクレオチド、少なくとも10ヌクレオチド、少なくとも11ヌクレオチド、少なくとも12ヌクレオチド、少なくとも13ヌクレオチド、少なくとも14ヌクレオチド、少なくとも15ヌクレオチド、少なくとも16ヌクレオチド、少なくとも17ヌクレオチド、少なくとも18ヌクレオチド、少なくとも19ヌクレオチド、少なくとも20ヌクレオチド、少なくとも30ヌクレオチド、少なくとも40ヌクレオチド、少なくとも50ヌクレオチド、少なくとも60ヌクレオチド、少なくとも70ヌクレオチド、少なくとも80ヌクレオチド、少なくとも90ヌクレオチド、少なくとも100ヌクレオチド、少なくとも200ヌクレオチド、少なくとも300ヌクレオチド、少なくとも400ヌクレオチド、または少なくとも500ヌクレオチドである。 In other embodiments, any linker or spacer is at least 3 nucleotides, at least 4 nucleotides, at least 5 nucleotides, at least 6 nucleotides, at least 7 nucleotides, at least 8 nucleotides, at least 9 nucleotides, at least 10 nucleotides, at least 11 nucleotides, at least 12 nucleotides, at least 13 nucleotides, at least 14 nucleotides, at least 15 nucleotides, at least 16 nucleotides, at least 17 nucleotides, at least 18 nucleotides, at least 19 nucleotides, at least 20 nucleotides, at least 30 nucleotides, at least 40 nucleotides, at least 50 nucleotides, at least 60 nucleotides, at least 70 nucleotides, at least 80 nucleotides, at least 90 nucleotides, at least 100 nucleotides, at least 200 nucleotides, at least 300 nucleotides, at least 400 nucleotides, or at least 500 nucleotides in length.

伸長されたガイドRNAの種々の態様では、逆転写鋳型配列は、ニック部位に隣接する内生DNA配列に対して相補的である一本鎖DNAフラップをコードし得、一本鎖DNAフラップは所望のヌクレオチド変化を含む。一本鎖DNAフラップは内生一本鎖DNAをニック部位において取って代わられ得る。ニック部位における取って代わられた内生一本鎖DNAは5'端を有し得、内生フラップを形成し得、これは細胞によって切除され得る。種々の態様において、5'端の内生フラップの切除は産物形成を駆動し得る。なぜなら、5'端の内生フラップを除去することは、対応する相補的なDNA鎖に対する一本鎖3'DNAフラップのハイブリダイゼーションと、標的DNAへの一本鎖3'DNAフラップによって持たれる所望のヌクレオチド変化の組み込みまたは同化とを促すからである。 In various embodiments of the extended guide RNA, the reverse transcription template sequence can encode a single-stranded DNA flap that is complementary to the endogenous DNA sequence adjacent to the nick site, the single-stranded DNA flap containing the desired nucleotide change. The single-stranded DNA flap can displace the endogenous single-stranded DNA at the nick site. The displaced endogenous single-stranded DNA at the nick site can have a 5' end and form an endogenous flap that can be excised by the cell. In various embodiments, excision of the 5' end endogenous flap can drive product formation because removal of the 5' end endogenous flap promotes hybridization of the single-stranded 3' DNA flap to the corresponding complementary DNA strand and incorporation or assimilation of the desired nucleotide change carried by the single-stranded 3' DNA flap into the target DNA.

伸長されたガイドRNAの種々の態様では、一本鎖DNAフラップの細胞性修復は所望のヌクレオチド変化の組み入れをもたらし、それによって所望の産物を形成する。 In various embodiments of the extended guide RNA, cellular repair of the single-stranded DNA flap results in incorporation of the desired nucleotide change, thereby forming the desired product.

ある態様において、PEgRNAは、配列番号101~104、131、181~183、222~234、237~244、277、324~330、332、334、336、338、340、342、344、346、348、350、352、354、356、358、360、362、364、366、368、394、429~442、499~505、641~649、678~692、735~736、738、757~761、776~777、2997~3103、3113~3121、3305~3455、3479~3493、3522~3540、3549~3556、3628~3698、3755~3810、3874、3890~3901、3905~3911、3913~3929、および3972~3989のヌクレオチド配列、または配列番号101~104、181~183、223~234、237~244、277、324~330、332、334、336、338、340、342、344、346、348、350、352、354、356、358、360、362、364、366、368、394、429~442、499~505、641~649、678~692、735~736、757~761、776~777、2997~3103、3113~3121、3305~3455、3479~3493、3522~3540、3549~3556、3628~3698、3755~3810、3874、3890~3901、3905~3911、3913~3929、および3972~3989のいずれか1つと少なくとも85%、もしくは少なくとも90%、もしくは少なくとも95%、もしくは少なくとも98%、もしくは少なくとも99%の配列同一性を有するヌクレオチド配列を含む。 In some embodiments, the PEG RNA is selected from the group consisting of SEQ ID NOs : 101-104, 131, 181-183, 222-234, 237-244, 277, 324-330, 332, 334, 336, 338, 340, 342, 344, 346, 348, 350, 352, 354, 356, 358, 360, 362, 364, 366, 368, 394, 429-442, 499-505, 641-649, 678-692, 735-73 6, 738, 757-761, 776-777, 2997-3103, 3113-3121, 3305-3455, 3479-3493, 3522-3540, 3549-3556, 3628-3698, 3755-3810, 3874, 3890-3901, 3905-3911, 3913-3929, and 3972-3989, or the nucleotide sequences of SEQ ID NOs : 101-104, 181-183, 223-23 4, 237-244, 277, 324-330, 332, 334, 336, 338, 340, 342, 344, 346, 348, 350, 352, 354, 356, 358, 360, 362, 364, 366, 368, 394, 429-442, 499-505, 641-649, 678-692, 735-736, 757-761, 776-777, 2997-3103, 3113-3121, 3305-3455 , 3479-3493, 3522-3540, 3549-3556, 3628-3698, 3755-3810, 3874, 3890-3901, 3905-3911, 3913-3929, and 3972-3989 .

本発明のもう1つの側面において、本明細書は、本明細書に記載の融合タンパク質および上に記載のいずれかの伸長されたガイドRNAを含む複合体を提供する。 In another aspect of the present invention, the present invention provides a complex comprising a fusion protein described herein and any of the extended guide RNAs described above.

本発明の更なる他の側面において、本明細書は、napDNAbpおよび伸長されたガイドRNAを含む複合体を提供する。napDNAbpは、Cas9ニッカーゼであり得るか、あるいは配列番号42~57(Cas9ニッカーゼ)および65(AsCas12aニッカーゼ)のアミノ酸配列、または配列番号42~57(Cas9ニッカーゼ)および65(AsCas12aニッカーゼ)のいずれか1つのアミノ酸配列と少なくとも80%、85%、90%、95%、98%、もしくは99%同一のアミノ酸配列であり得る。 In yet another aspect of the present invention, the present disclosure provides a complex comprising napDNAbp and an extended guide RNA. napDNAbp can be a Cas9 nickase or can be an amino acid sequence at least 80%, 85%, 90%, 95%, 98%, or 99% identical to the amino acid sequence of any one of SEQ ID NOs: 42-57 (Cas9 nickase) and 65 (AsCas12a nickase).

複合体を伴う様々な態様において、伸長されたガイドRNAは、napDNAbpを標的DNA配列へ向かわせることが可能である。様々な態様において、逆転写酵素はtransで提供されてもよい、すなわち、複合体自体とは異なる供給源から提供されてもよい。例えば、逆転写酵素は、逆転写酵素を個別にコードする別々のベクターを導入することによって、複合体を有する同じ細胞へ提供され得る。 In various embodiments involving the complex, the extended guide RNA can direct the napDNAbp to the target DNA sequence. In various embodiments, the reverse transcriptase can be provided in trans, i.e., from a source different from the complex itself. For example, the reverse transcriptase can be provided to the same cell that has the complex by introducing a separate vector that individually encodes the reverse transcriptase.

さらに別の側面において、本明細書はポリヌクレオチドを提供する。ある態様において、ポリヌクレオチドは本明細書に開示の融合タンパク質のいずれかをコードし得る。ある種の他の態様において、ポリヌクレオチドは本明細書に開示のnapDNAbpのいずれかをコードし得る。なおさらなる態様では、ポリヌクレオチドは本明細書に開示の逆転写酵素のいずれかをコードし得る。さらに他の態様において、ポリヌクレオチドは、本明細書に開示の伸長されたガイドRNAのいずれか、逆転写鋳型配列のいずれか、または逆転写プライマー部位のいずれか、または任意のリンカー配列のいずれかをコードし得る。 In yet another aspect, the present specification provides a polynucleotide. In certain embodiments, the polynucleotide may encode any of the fusion proteins disclosed herein. In certain other embodiments, the polynucleotide may encode any of the napDNAbps disclosed herein. In still further embodiments, the polynucleotide may encode any of the reverse transcriptases disclosed herein. In still other embodiments, the polynucleotide may encode any of the extended guide RNAs, any of the reverse transcription template sequences, any of the reverse transcription primer sites, or any of the optional linker sequences disclosed herein.

なお他の側面では、本明細書は、本明細書に記載のポリヌクレオチドを含むベクターを提供する。それゆえに、ある態様において、ベクターは、napDNAbpと逆転写酵素とを含む融合タンパク質をコードするポリヌクレオチドを含む。他の態様において、ベクターは、napDNAbpと逆転写酵素とを別個にコードするポリヌクレオチドを含む。なお他の態様において、ベクターは、伸長されたガイドRNAをコードするポリヌクレオチドを含み得る。種々の態様において、ベクターは、napDNAbpと逆転写酵素と伸長されたガイドRNAとをコードする1つ以上のポリヌクレオチドを同じかまたは別個のベクター上に含み得る。 In yet another aspect, the present specification provides a vector comprising a polynucleotide described herein. Thus, in some embodiments, the vector comprises a polynucleotide encoding a fusion protein comprising napDNAbp and reverse transcriptase. In other embodiments, the vector comprises polynucleotides separately encoding napDNAbp and reverse transcriptase. In still other embodiments, the vector may comprise a polynucleotide encoding an extended guide RNA. In various embodiments, the vector may comprise one or more polynucleotides encoding napDNAbp, reverse transcriptase, and extended guide RNA on the same or separate vectors.

なお他の側面では、本明細書は、本明細書に記載の融合タンパク質と伸長されたガイドRNAとを含む細胞を提供する。細胞は融合タンパク質とnapDNAbpと逆転写酵素と伸長されたガイドRNAとを含むベクターによって形質転換され得る。これらの遺伝子要素は同じベクター上にまたは異なるベクター上に含まれ得る。 In yet another aspect, the present specification provides a cell comprising a fusion protein and an extended guide RNA described herein. The cell can be transformed with a vector comprising the fusion protein, napDNAbp, reverse transcriptase, and the extended guide RNA. These genetic elements can be included on the same vector or on different vectors.

もう1つの側面において、本明細書は、医薬組成物を提供する。ある態様において、医薬組成物は、napDNAbp、融合タンパク質、逆転写酵素、および伸長されたガイドRNAのうち1以上を含む。ある態様において、本明細書に記載の融合タンパク質および薬学的に許容し得る賦形剤。他の態様において、医薬組成物は、本明細書に記載のいずれの伸長ガイドRNAおよび薬学的に許容し得る賦形剤を含む。更なる他の態様において、医薬組成物は、本明細書に記載のいずれの伸長ガイドRNAを、本明細書に記載のいずれの融合タンパク質および薬学的に許容し得る賦形剤と組み合わせて含む。もう1つの他の態様において、医薬組成物は、napDNAbp、融合タンパク質、逆転写酵素、および伸長されたガイドRNAのうち1以上をコードするいずれのポリヌクレオチド配列も含む。更なる他の態様において、本明細書に開示の様々な構成要素は、1以上の医薬組成物中へ分離されていてもよい。例えば、第1医薬組成物は、融合タンパク質またはnapDNAbpを含んでいてもよく、第2医薬組成物は、逆転写酵素を含んでいてもよく、および第3医薬組成物は、伸長されたガイドRNAを含んでいてもよい。 In another aspect, the present disclosure provides pharmaceutical compositions. In some embodiments, the pharmaceutical composition comprises one or more of napDNAbp, a fusion protein, a reverse transcriptase, and an extended guide RNA. In some embodiments, the fusion protein described herein and a pharma- ceutically acceptable excipient. In other embodiments, the pharmaceutical composition comprises any extended guide RNA described herein and a pharma- ceutically acceptable excipient. In yet other embodiments, the pharmaceutical composition comprises any extended guide RNA described herein in combination with any fusion protein described herein and a pharma- ceutically acceptable excipient. In another other embodiment, the pharmaceutical composition comprises any polynucleotide sequence encoding one or more of napDNAbp, a fusion protein, a reverse transcriptase, and an extended guide RNA. In yet other embodiments, the various components disclosed herein may be separated into one or more pharmaceutical compositions. For example, a first pharmaceutical composition may comprise a fusion protein or napDNAbp, a second pharmaceutical composition may comprise a reverse transcriptase, and a third pharmaceutical composition may comprise an extended guide RNA.

またさらなる側面において、本開示は、キットを提供する。一態様において、キットは、融合タンパク質、napDNAbp、逆転写酵素、および伸長されたガイドRNAを包含する1以上の構成要素をコードする1以上のポリヌクレオチドを含む。キットはまた、本明細書に開示のいずれの融合タンパク質、napDNAbp、または逆転写酵素を包含する、ベクター、細胞、およびポリペプチドの単離された調製物も含んでいてよい。 In yet a further aspect, the disclosure provides kits. In one embodiment, the kit includes one or more polynucleotides encoding one or more components including a fusion protein, napDNAbp, reverse transcriptase, and an extended guide RNA. The kit may also include isolated preparations of vectors, cells, and polypeptides including any of the fusion proteins, napDNAbp, or reverse transcriptases disclosed herein.

もう1つの側面において、本開示は、開示された組成物(compositions of matter)を使用する方法を提供する。 In another aspect, the disclosure provides methods of using the disclosed compositions of matter.

1つの態様では、方法は、所望のヌクレオチド変化を二本鎖DNA配列上に組み入れるための方法に関する。方法は、第1に、二本鎖DNA配列を融合タンパク質と伸長されたガイドRNAとを含む複合体と接触させることを含み、融合タンパク質はnapDNAbpおよび逆転写酵素を含み、伸長されたガイドRNAは、所望のヌクレオチド変化を含む逆転写鋳型配列を含む。次に、方法には、非標的鎖上で二本鎖DNA配列へニックを入れることが関わり、それによって3'端を有する遊離の一本鎖DNAを生成する。それから、方法には、遊離の一本鎖DNAの3'端を逆転写鋳型配列にハイブリダイズさせることが関わり、それによって逆転写酵素ドメインをプライムする。それから、方法には、DNAの鎖を3'端から重合することが関わり、それによって所望のヌクレオチド変化を含む一本鎖DNAフラップを生成する。それから、方法には、カットされた部位に隣接する内生DNA鎖を一本鎖DNAフラップによって置き換えることが関わり、それによって所望のヌクレオチド変化を二本鎖DNA配列上に組み入れる。 In one embodiment, the method relates to a method for incorporating a desired nucleotide change into a double-stranded DNA sequence. The method first involves contacting the double-stranded DNA sequence with a complex comprising a fusion protein and an extended guide RNA, the fusion protein comprising napDNAbp and a reverse transcriptase, and the extended guide RNA comprising a reverse transcription template sequence comprising the desired nucleotide change. The method then involves nicking the double-stranded DNA sequence on the non-target strand, thereby generating a free single-stranded DNA having a 3' end. The method then involves hybridizing the 3' end of the free single-stranded DNA to the reverse transcription template sequence, thereby priming the reverse transcriptase domain. The method then involves polymerizing a strand of DNA from the 3' end, thereby generating a single-stranded DNA flap comprising the desired nucleotide change. The method then involves replacing the endogenous DNA strand adjacent to the cut site with the single-stranded DNA flap, thereby incorporating the desired nucleotide change into the double-stranded DNA sequence.

他の態様において、本開示は、標的遺伝子座にてDNA分子のヌクレオチド配列中に1以上の変化を導入するための方法を提供するが、DNA分子を、核酸プログラム型DNA結合タンパク質(napDNAbp)とnapDNAbpに標的遺伝子座を標的にさせるガイドRNAとに接触させることを含み、ここでガイドRNAは、少なくとも1の所望のヌクレオチド変化を含む逆転写酵素(RT)鋳型配列を含む。次に、方法は、標的遺伝子座にてDNA鎖中に、晒された3'末を形成すること、次いで、晒された3'末をRT鋳型配列とハイブリダイズさせることで逆転写をプライムすることを伴う。次に、RT鋳型配列に基づき少なくとも1の所望のヌクレオチド変化を含む単鎖DNAフラップは、逆転写酵素によって合成または重合される。最後に、少なくとも1の所望のヌクレオチド変化は、対応する内生DNA中へ組み込まれ、これによって標的遺伝子座にてDNA分子のヌクレオチド配列中に1以上の変化が導入される。 In another aspect, the disclosure provides a method for introducing one or more changes in a nucleotide sequence of a DNA molecule at a target locus, comprising contacting the DNA molecule with a nucleic acid programmable DNA binding protein (napDNAbp) and a guide RNA that targets the napDNAbp to the target locus, where the guide RNA comprises a reverse transcriptase (RT) template sequence that comprises at least one desired nucleotide change. The method then involves forming an exposed 3' end in the DNA strand at the target locus, and then priming reverse transcription by hybridizing the exposed 3' end with the RT template sequence. A single-stranded DNA flap that comprises at least one desired nucleotide change based on the RT template sequence is then synthesized or polymerized by reverse transcriptase. Finally, the at least one desired nucleotide change is incorporated into the corresponding endogenous DNA, thereby introducing one or more changes in the nucleotide sequence of the DNA molecule at the target locus.

更なる他の態様において、本開示は、標的にプライムされた逆転写によって、標的遺伝子座にてDNA分子のヌクレオチド配列中に1以上の変化を導入するための方法を提供するが、方法は、以下:(a)標的遺伝子座にてDNA分子を、i)核酸プログラム型DNA結合タンパク質(napDNAbp)と逆転写酵素とを含む融合タンパク質、および(ii)所望のヌクレオチド変化を含むRT鋳型を含むガイドRNAに接触させること;(b)RT鋳型の標的にプライムされた逆転写に、所望のヌクレオチド変化を含む単鎖DNAを生成させること;(c)DNA修復および/または複製プロセスを通して標的遺伝子座にてDNA分子中への所望のヌクレオチド変化を組み込むこと、を含む。 In yet another aspect, the disclosure provides a method for introducing one or more changes in a nucleotide sequence of a DNA molecule at a target locus by target-primed reverse transcription, the method comprising: (a) contacting a DNA molecule at the target locus with i) a fusion protein comprising a nucleic acid programmable DNA binding protein (napDNAbp) and a reverse transcriptase, and (ii) a guide RNA comprising an RT template comprising a desired nucleotide change; (b) allowing target-primed reverse transcription of the RT template to generate a single-stranded DNA comprising the desired nucleotide change; and (c) incorporating the desired nucleotide change into the DNA molecule at the target locus through DNA repair and/or replication processes.

ある態様において、内生DNA鎖を置き換えるステップは以下を含む:(i)単鎖DNAフラップを切断部位に隣接する内生DNA鎖とハイブリダイズさせることで、配列ミスマッチを創出すること;(ii)内生DNA鎖を切除すること;および(iii)ミスマッチを修復することで、DNAの両鎖中に所望のヌクレオチド変化を含む所望の産物を形成すること。 In one embodiment, the step of replacing the endogenous DNA strand includes: (i) hybridizing a single-stranded DNA flap to the endogenous DNA strand adjacent to the cleavage site, thereby creating a sequence mismatch; (ii) excising the endogenous DNA strand; and (iii) repairing the mismatch to form a desired product containing the desired nucleotide change in both strands of DNA.

種々の態様において、所望のヌクレオチド変化は1ヌクレオチド置換(例えば、トランジションまたはトランスバージョン変化)、欠失、または挿入であり得る。例えば、所望のヌクレオチド変化は、(1)GからTの置換、(2)GからAの置換、(3)GからCの置換、(4)TからGの置換、(5)TからAの置換、(6)TからCの置換、(7)CからGの置換、(8)CからTの置換、(9)CからAの置換、(10)AからTの置換、(11)AからGの置換、または(12)AからCの置換であり得る。 In various embodiments, the desired nucleotide change can be a single nucleotide substitution (e.g., a transition or transversion change), a deletion, or an insertion. For example, the desired nucleotide change can be (1) a G to T substitution, (2) a G to A substitution, (3) a G to C substitution, (4) a T to G substitution, (5) a T to A substitution, (6) a T to C substitution, (7) a C to G substitution, (8) a C to T substitution, (9) a C to A substitution, (10) an A to T substitution, (11) an A to G substitution, or (12) an A to C substitution.

他の態様において、所望のヌクレオチド変化は、(1)G:C塩基対をT:A塩基対に、(2)G:C塩基対をA:T塩基対に、(3)G:C塩基対をC:G塩基対に、(4)T:A塩基対をG:C塩基対に、(5)T:A塩基対をA:T塩基対に、(6)T:A塩基対をC:G塩基対に、(7)C:G塩基対をG:C塩基対に、(8)C:G塩基対をT:A塩基対に、(9)C:G塩基対をA:T塩基対に、(10)A:T塩基対をT:A塩基対に、(11)A:T塩基対をG:C塩基対に、または(12)A:T塩基対をC:G塩基対に変換し得る。 In other embodiments, the desired nucleotide change may be: (1) a G:C base pair to a T:A base pair; (2) a G:C base pair to an A:T base pair; (3) a G:C base pair to a C:G base pair; (4) a T:A base pair to a G:C base pair; (5) a T:A base pair to an A:T base pair; (6) a T:A base pair to a C:G base pair; (7) a C:G base pair to a G:C base pair; (8) a C:G base pair to a T:A base pair; (9) a C:G base pair to an A:T base pair; (10) an A:T base pair to a T:A base pair; (11) an A:T base pair to a G:C base pair; or (12) an A:T base pair to a C:G base pair.

なお他の態様において、方法は、挿入である所望のヌクレオチド変化を導入する。ある種のケースでは、挿入は長さが少なくとも1、少なくとも2、少なくとも3、少なくとも4、少なくとも5、少なくとも6、少なくとも7、少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも16、少なくとも17、少なくとも18、少なくとも19、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90、少なくとも100、少なくとも200、少なくとも300、少なくとも400、または少なくとも500ヌクレオチドである。 In yet other embodiments, the method introduces a desired nucleotide change that is an insertion. In certain cases, the insertion is at least 1, at least 2, at least 3, at least 4, at least 5, at least 6, at least 7, at least 8, at least 9, at least 10, at least 11, at least 12, at least 13, at least 14, at least 15, at least 16, at least 17, at least 18, at least 19, at least 20, at least 30, at least 40, at least 50, at least 60, at least 70, at least 80, at least 90, at least 100, at least 200, at least 300, at least 400, or at least 500 nucleotides in length.

他の態様において、方法は、欠失である所望のヌクレオチド変化を導入する。ある種の他のケースでは、欠失は長さが少なくとも1、少なくとも2、少なくとも3、少なくとも4、少なくとも5、少なくとも6、少なくとも7、少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも16、少なくとも17、少なくとも18、少なくとも19、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90、少なくとも100、少なくとも200、少なくとも300、少なくとも400、または少なくとも500ヌクレオチドである。 In other embodiments, the method introduces a desired nucleotide change that is a deletion. In certain other cases, the deletion is at least 1, at least 2, at least 3, at least 4, at least 5, at least 6, at least 7, at least 8, at least 9, at least 10, at least 11, at least 12, at least 13, at least 14, at least 15, at least 16, at least 17, at least 18, at least 19, at least 20, at least 30, at least 40, at least 50, at least 60, at least 70, at least 80, at least 90, at least 100, at least 200, at least 300, at least 400, or at least 500 nucleotides in length.

種々の態様において、所望のヌクレオチド変化は疾患関連遺伝子を修正する。疾患関連遺伝子は:アデノシンデアミナーゼ(ADA)欠損症;アルファ-1アンチトリプシン欠損症;嚢胞性線維症;デュシェンヌ型筋ジストロフィー;ガラクトース血症;ヘモクロマトーシス;ハンチントン病;メープルシロップ尿症;マルファン症候群;1型神経線維腫症;先天性爪肥厚症;フェニルケトン尿症;重症複合免疫不全;鎌状赤血球症;スミス・レムリ・オピッツ症候群;およびテイ・サックス病からなる群から選択される単一遺伝子障害に関連し得る。他の態様において、疾患関連遺伝子は:心臓病;高血圧;アルツハイマー病;関節炎;糖尿病;がん;および肥満からなる群から選択される多遺伝子性障害に関連し得る。 In various embodiments, the desired nucleotide change modifies a disease-associated gene. The disease-associated gene may be associated with a monogenic disorder selected from the group consisting of: adenosine deaminase (ADA) deficiency; alpha-1 antitrypsin deficiency; cystic fibrosis; Duchenne muscular dystrophy; galactosemia; hemochromatosis; Huntington's disease; maple syrup urine disease; Marfan syndrome; neurofibromatosis type 1; pachyonychia congenita; phenylketonuria; severe combined immunodeficiency; sickle cell disease; Smith-Lemli-Opitz syndrome; and Tay-Sachs disease. In other embodiments, the disease-associated gene may be associated with a polygenic disorder selected from the group consisting of: heart disease; high blood pressure; Alzheimer's disease; arthritis; diabetes; cancer; and obesity.

本明細書に開示の方法は、ヌクレアーゼ不活性型(dead)Cas9(dCas9)、Cas9ニッカーゼ(nCas9)、またはヌクレアーゼ活性Cas9であるnapDNAbpを有する融合タンパク質を伴っていてもよい。他の態様において、napDNAbpおよび逆転写酵素は、単一の融合タンパク質としてはコードされていないが、むしろ別々の構築物中に提供され得る。よって、いくつかの態様において、逆転写酵素は(融合タンパク質としてよりむしろ)、napDNAbpに対しtransで提供され得る。 The methods disclosed herein may involve a fusion protein having a napDNAbp that is a nuclease-dead Cas9 (dCas9), a Cas9 nickase (nCas9), or a nuclease-active Cas9. In other embodiments, the napDNAbp and reverse transcriptase are not encoded as a single fusion protein, but rather may be provided in separate constructs. Thus, in some embodiments, the reverse transcriptase may be provided in trans to the napDNAbp (rather than as a fusion protein).

方法を伴う様々な態様において、napDNAbpは、配列番号26~61、75~76、126、130、137、141、147、153、157、445、460、467および482~487(Cas9);(SpCas9);配列番号77~86(CP-Cas9);配列番号18~25および87~88(SpCas9);ならびに配列番号62~72(Cas12)のアミノ酸配列を含んでいてもよい。napDNAbpはまた、配列番号26~61、75~76、126、130、137、141、147、153、157、445、460、467および482~487(Cas9);(SpCas9);配列番号77~86(CP-Cas9);配列番号18~25および87~88(SpCas9);ならびに配列番号62~72(Cas12)のいずれ1つのアミノ酸配列と少なくとも80%、85%、90%、95%、98%、または99%同一のアミノ酸配列も含んでいてもよい。 In various embodiments involving the methods, the napDNAbp may include the amino acid sequences of SEQ ID NOs: 26-61, 75-76, 126, 130, 137, 141, 147, 153, 157, 445, 460, 467 and 482-487 (Cas9); (SpCas9); SEQ ID NOs: 77-86 (CP-Cas9); SEQ ID NOs: 18-25 and 87-88 (SpCas9); and SEQ ID NOs: 62-72 (Cas12). The napDNAbp may also contain an amino acid sequence that is at least 80%, 85%, 90%, 95%, 98%, or 99% identical to any one of the amino acid sequences of SEQ ID NOs: 26-61, 75-76, 126, 130, 137, 141, 147, 153, 157, 445, 460, 467, and 482-487 (Cas9); (SpCas9); SEQ ID NOs: 77-86 (CP-Cas9); SEQ ID NOs: 18-25 and 87-88 (SpCas9); and SEQ ID NOs: 62-72 (Cas12).

方法を伴う様々な態様において、逆転写酵素は、配列番号89~100、105~122、128~129、132、139、143、149、154、159、235、454、471、516、662、700~716、739~742および766のアミノ酸配列のいずれか1つを含んでいてもよい。逆転写酵素はまた、配列番号89~100、105~122、128~129、132、139、143、149、154、159、235、454、471、516、662、700~716、739~742および766のいずれか1つのアミノ酸配列と少なくとも80%、85%、90%、95%、98%、または99%同一のアミノ酸配列も含んでいてよい。 In various embodiments involving the methods, the reverse transcriptase may comprise any one of the amino acid sequences of SEQ ID NOs: 89-100, 105-122, 128-129, 132, 139, 143, 149, 154, 159, 235, 454, 471, 516, 662, 700-716, 739-742, and 766. The reverse transcriptase may also comprise an amino acid sequence that is at least 80%, 85%, 90%, 95%, 98%, or 99% identical to any one of the amino acid sequences of SEQ ID NOs: 89-100, 105-122, 128-129, 132, 139, 143, 149, 154, 159, 235, 454, 471, 516, 662, 700-716, 739-742, and 766.

方法は、配列番号101~104、131、181~183、222~234、237~244、277、324~330、332、334、336、338、340、342、344、346、348、350、352、354、356、358、360、362、364、366、368、394、429442、499~505、641649、678692、735~736、738、757~761、776~777、29973103、31133121、33053455、34793493、35223540、35493556、36283698、3755~3810、3874、3890~3901、3905~3911、3913~3929、および3972~3989のヌクレオチド配列、またはこれらと少なくとも80%、もしくは少なくとも85%、もしくは少なくとも90%、もしくは少なくとも95%、もしくは少なくとも99%の配列同一性を有するヌクレオチド配列を含むPEgRNAの使用を伴っていてもよい。方法は、RNA伸長を3'末にて含む伸長されたガイドRNAの使用を含んでいてもよく、RNA伸長は逆転写酵素鋳型配列を含む。 The method includes the steps of SEQ ID NOs: 101-104, 131, 181-183, 222-234, 237-244, 277, 324-330 , 332, 334, 336, 338, 340, 342, 344, 346, 348, 350, 352, 354, 356, 358, 360, 362, 364, 366, 368, 394, 429-442, 499-505 , 641-649 , 678-692 , 735-736, 738, 757-761, 776-777 , 2997-3103 , 3113-3121, 3305-3455 , 3479- The method may involve the use of a PEgRNA comprising the nucleotide sequence of 3493 , 3522 to 3540 , 3549 to 3556, 3628 to 3698, 3755 to 3810, 3874, 3890 to 3901, 3905 to 3911, 3913 to 3929 , and 3972 to 3989 , or a nucleotide sequence having at least 80%, or at least 85%, or at least 90%, or at least 95%, or at least 99% sequence identity thereto. The method may involve the use of an extended guide RNA comprising an RNA extension at its 3' end, the RNA extension comprising a reverse transcriptase template sequence.

方法は、5'端にRNA伸長を含む伸長されたガイドRNAの使用を含み得、RNA伸長は逆転写鋳型配列を含む。 The method may include the use of an extended guide RNA that includes an RNA extension at its 5' end, the RNA extension including a reverse transcription template sequence.

方法は、ガイドRNAの分子内の位置付けにRNA伸長を含む伸長されたガイドRNAの使用を含み得、RNA伸長は逆転写鋳型配列を含む。 The method may include the use of an extended guide RNA that includes an RNA extension at the intramolecular positioning of the guide RNA, the RNA extension including a reverse transcription template sequence.

方法は、長さが少なくとも1、少なくとも2、少なくとも3、少なくとも4、少なくとも5、少なくとも6、少なくとも7、少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも16、少なくとも17、少なくとも18、少なくとも19、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90、少なくとも100、少なくとも200、少なくとも300、少なくとも400、または少なくとも500ヌクレオチドである1以上のRNA伸長を有する伸長されたガイドRNAの使用を含んでもよい。 The method may include the use of an extended guide RNA having one or more RNA extensions that are at least 1, at least 2, at least 3, at least 4, at least 5, at least 6, at least 7, at least 8, at least 9, at least 10, at least 11, at least 12, at least 13, at least 14, at least 15, at least 16, at least 17, at least 18, at least 19, at least 20, at least 30, at least 40, at least 50, at least 60, at least 70, at least 80, at least 90, at least 100, at least 200, at least 300, at least 400, or at least 500 nucleotides in length.

上記の概念、および下に考察される追加の概念は、いずれの好適な組み合わせでも並べられ得ることが解されるはずである(ただし、本開示はこの点において限定されない)。さらに、本開示の他の利点および新規特色は、添付の図と併せて考慮すれば、以下の様々な非限定的態様の詳細な記載から明らかであろう。 It should be understood that the above concepts, and additional concepts discussed below, may be arranged in any suitable combination (although the disclosure is not limited in this respect). Additionally, other advantages and novel features of the present disclosure will become apparent from the following detailed description of various non-limiting embodiments when considered in conjunction with the accompanying figures.

図面の簡単な記載
以下の図面は本明細書の一部を形成するものであって、これらの図面の1以上を、本明細書に提示される特定の態様の詳細な記載と組み合わせて参照することによってより良好に理解され得る、ある本開示の側面をさらに実証するために包含される。
BRIEF DESCRIPTION OF THE DRAWINGS The following drawings form part of the specification and are included to further demonstrate certain aspects of the disclosure that may be better understood by reference to one or more of these drawings in combination with the detailed description of specific embodiments presented herein.

図1Aは、伸長されたガイドRNA分子と複合したCas9タンパク質と融合した逆転写酵素を含む融合タンパク質を使用して、単一ヌクレオチドの変化、および/または挿入、および/または欠失をDNA分子(例として、ゲノム)中へ導入するための例示のプロセスの概略図を提供する。この態様において、ガイドRNAは、3'末にて伸長されていることで、逆転写酵素鋳型配列を包含する。概略図は、Cas9ニッカーゼと融合してガイドRNA(gRNA)と複合した逆転写酵素(RT)が、どのようにDNA標的部位に結合し、標的ヌクレオチドに隣接するPAM含有DNA鎖にニックを入れるのかを示す。RT酵素は、ニック入りDNAを、所望の編集をコードする新しいDNA鎖の合成のための鋳型として使用されるgRNAからのDNA合成のためのプライマーとして使用する。示される編集プロセスは、標的にプライムされた逆転写編集(TRT編集)、即ち「プライム編集」と称されてもよい。FIG. 1A provides a schematic of an exemplary process for introducing single nucleotide changes and/or insertions and/or deletions into a DNA molecule (e.g., a genome) using a fusion protein comprising a reverse transcriptase fused to a Cas9 protein complexed with an extended guide RNA molecule. In this embodiment, the guide RNA is extended at the 3' end to include a reverse transcriptase template sequence. The schematic shows how a reverse transcriptase (RT) fused to a Cas9 nickase and complexed with a guide RNA (gRNA) binds to a DNA target site and nicks the PAM-containing DNA strand adjacent to the target nucleotide. The RT enzyme uses the nicked DNA as a primer for DNA synthesis from the gRNA, which is used as a template for synthesis of a new DNA strand encoding the desired edit. The editing process shown may be referred to as target-primed reverse transcription editing (TRT editing), or "primed editing."

図1Bは、プライム編集因子複合体がより一般的に[napDNAbp]-[P]:PEgRNAまたは[P]-[napDNAbp]:PEgRNAとして表されているということを例外として、図1Aと同じ図表を提供している。式中、「P」はいずれかのポリメラーゼ(例えば逆転写酵素)を言い、「napDNAbp」は核酸プログラム型DNA結合タンパク質(例えばSpCas9)を言い、「PEgRNA」はプライム編集ガイドRNAを言い、「]-[」は任意のリンカーを言う。他所、例えば図3A-3Gに記載されているとおり、PEgRNAはプライマー結合部位とDNA合成鋳型とを含む5'伸長アームを含む。示されてはいないが、PEgRNAの伸長アーム(すなわち、これはプライマー結合部位およびDNA合成鋳型を含む)はDNAまたはRNAであり得るということが企図される。この構成で企図される具体的なポリメラーゼはDNA合成鋳型の性質に依存するであろう。例えば、DNA合成鋳型がRNAである場合には、ポリメラーゼはRNA依存性DNAポリメラーゼ(例えば、逆転写酵素)であり得る。DNA合成鋳型がDNAである場合には、ポリメラーゼはDNA依存性DNAポリメラーゼであり得る。FIG. 1B provides the same diagram as FIG. 1A, except that the prime editor complex is more commonly represented as [napDNAbp]-[P]:PEgRNA or [P]-[napDNAbp]:PEgRNA. In the formula, "P" refers to any polymerase (e.g., reverse transcriptase), "napDNAbp" refers to a nucleic acid programmable DNA binding protein (e.g., SpCas9), "PEgRNA" refers to the prime editing guide RNA, and "]-[" refers to an optional linker. As described elsewhere, e.g., in FIG. 3A-3G, the PEgRNA includes a 5' extension arm that includes a primer binding site and a DNA synthesis template. Although not shown, it is contemplated that the extension arm of the PEgRNA (i.e., which includes the primer binding site and the DNA synthesis template) can be DNA or RNA. The specific polymerase contemplated in this configuration will depend on the nature of the DNA synthesis template. For example, if the DNA synthesis template is RNA, the polymerase can be an RNA-dependent DNA polymerase (e.g., reverse transcriptase). When the DNA synthesis template is DNA, the polymerase can be a DNA-dependent DNA polymerase.

図1Cは、1ヌクレオチド変化および/または挿入および/または欠失をDNA分子(例えばゲノム)上に導入するための例示的プロセスの模式図を提供し、伸長されたガイドRNA分子との複合体としてCas9タンパク質に融合された逆転写酵素を含む融合タンパク質を用いる。この態様では、ガイドRNAは、逆転写酵素鋳型配列を包含するように5'端が伸長されている。模式図は、Cas9ニッカーゼに融合された逆転写酵素(RT)が、ガイドRNA(gRNA)との複合体として、どのようにしてDNA標的部位に結合し、標的ヌクレオチドに隣接するPAM含有DNA鎖へニックを入れるかを示している。RT酵素は、所望の編集をコードする新たなDNA鎖の合成のための鋳型として用いられるgRNAからのDNA合成のプライマーとして、ニッキングされたDNAを用いる。示されている編集プロセスは、プライム標的にプライムされた逆転写編集(TRT編集)または同等に「プライム編集」と言われ得る。FIG. 1C provides a schematic of an exemplary process for introducing single nucleotide changes and/or insertions and/or deletions onto a DNA molecule (e.g., genome), using a fusion protein comprising a reverse transcriptase fused to a Cas9 protein in complex with an extended guide RNA molecule. In this embodiment, the guide RNA is extended at the 5' end to encompass a reverse transcriptase template sequence. The schematic shows how a reverse transcriptase (RT) fused to a Cas9 nickase, in complex with a guide RNA (gRNA), binds to a DNA target site and nicks the PAM-containing DNA strand adjacent to the target nucleotide. The RT enzyme uses the nicked DNA as a primer for DNA synthesis from the gRNA, which is used as a template for synthesis of a new DNA strand encoding the desired edit. The editing process shown can be referred to as primed target-primed reverse transcription editing (TRT editing) or equivalently "primed editing".

図1Dは、プライム編集因子複合体がより一般に、[napDNAbp]-[P]:PEgRNAまたは[P]-[napDNAbp]:PEgRNAPEgRNAとして表されることを除いて、図1Cと同じ描写を提供するが、ここで「P」は、いずれのポリメラーゼ(例として、逆転写酵素)を指し、「napDNAbp」は、核酸プログラム型DNA結合タンパク質(例として、SpCas9)を指し、および「PEgRNA」は、プライム編集ガイドRNAを指し、および「]-[」は、任意のリンカーを指す。他のどこか、例として図3A~3Gに記載のとおり、PEgRNAは、プライマー結合部位およびDNA合成鋳型を含む3'伸長アームを含む。示されてはいないが、PEgRNAの伸長アーム(すなわち、プライマー結合部位およびDNA合成鋳型を含む)はDNAまたはRNAであり得ることが企図される。この立体配置において企図される具体的なポリメラーゼは、DNA合成鋳型の性質に依存するであろう。実例として、DNA合成鋳型がRNAであると、ポリメラーゼはRNA依存性DNAポリメラーゼ(例として、逆転写酵素)になり得る。DNA合成鋳型がDNAであると、ポリメラーゼはDNA依存性DNAポリメラーゼになり得る。様々な態様において、PEgRNAは、DNAベースのDNA合成鋳型を組み込むように改変または合成され得る。FIG. 1D provides the same depiction as FIG. 1C, except that the prime editor complex is more generally represented as [napDNAbp]-[P]:PEgRNA or [P]-[napDNAbp]:PEgRNAPEgRNA, where "P" refers to any polymerase (e.g., reverse transcriptase), "napDNAbp" refers to a nucleic acid programmable DNA binding protein (e.g., SpCas9), and "PEgRNA" refers to the prime editing guide RNA, and "]-[" refers to the optional linker. As depicted elsewhere, e.g., in FIGS. 3A-3G, the PEgRNA includes a 3' extension arm that includes a primer binding site and a DNA synthesis template. Although not shown, it is contemplated that the extension arm of the PEgRNA (i.e., including the primer binding site and the DNA synthesis template) can be DNA or RNA. The specific polymerase contemplated in this configuration will depend on the nature of the DNA synthesis template. For example, if the DNA synthesis template is RNA, the polymerase can be an RNA-dependent DNA polymerase (e.g., reverse transcriptase). If the DNA synthesis template is DNA, the polymerase can be a DNA-dependent DNA polymerase. In various embodiments, the PEgRNA can be modified or synthesized to incorporate a DNA-based DNA synthesis template.

図1Eは、合成された単DNAの鎖(所望のヌクレオチド変化を含む)が、所望のヌクレオチド変化がDNA中へ組み込まれるように、どのように分解されるのかという例示のプロセスを描く概略図である。示されるとおり、編集済鎖(または「変異誘発鎖」)の次の合成、内生鎖との平衡、内生鎖のフラップ切断、およびライゲーションは、内生DNA修復および/または複製プロセスの作用を通して、ミスマッチDNA二重鎖の分解後のDNA編集の組み込みに繋がる。IE is a schematic diagram depicting an exemplary process of how a synthesized single strand of DNA (containing a desired nucleotide change) is degraded such that the desired nucleotide change is incorporated into the DNA. As shown, subsequent synthesis of an edited strand (or "mutagenized strand"), equilibration with the endogenous strand, flap cleavage of the endogenous strand, and ligation leads to the incorporation of the DNA edit following degradation of the mismatched DNA duplex through the action of endogenous DNA repair and/or replication processes.

図1Fは、「反対鎖(opposite strand)へのニック入れ」が図1Eの分解方法の中へ組み込まれることで、所望の産物・対・復元産物の形成を推進するのに役立ち得ることを示す概略図である。反対鎖のニック入れにおいて、第2のCas9/gRNA複合体は、最初にニックが入った鎖の反対鎖上に第2ニックを導入するのに使用される。これは、未編集鎖(すなわち、第2ニック部位を含有する鎖)を優先的に置き換えるために、内生細胞のDNA修復および/または複製プロセスを誘導する。Figure IF is a schematic diagram showing that "opposite strand nicking" can be incorporated into the degradation method of Figure IE to help drive the formation of the desired product versus the restored product. In opposite strand nicking, a second Cas9/gRNA complex is used to introduce a second nick on the strand opposite the first nicked strand. This induces the endogenous cell's DNA repair and/or replication processes to preferentially replace the unedited strand (i.e., the strand containing the second nick site).

図1Gは、伸長されたガイドRNAと複合体化された核酸プログラム型DNA結合タンパク質(napDNAbp)を使用して、標的遺伝子座のDNA分子(例として、ゲノム)中へ単一ヌクレオチドの変化、および/または挿入、および/または欠失を導入するための例示のプロセスの別の概略図を提供する。このプロセスはプライム編集という態様として称されることもある。伸長されたガイドRNAは、ガイドRNAの3'末もしくは5'末にて、またはガイドRNA中の分子内のある場所にて伸長を含む。ステップ(a)において、napDNAbp/gRNA複合体はDNA分子に接触し、gRNAは標的遺伝子座へ結合するようにnapDNAbpをガイドする。ステップ(b)において、標的遺伝子座のDNA(Rループ鎖、またはPAM含有鎖、または非標的DNA鎖、またはプロトスペーサー鎖)の鎖の一方へニックが導入され(例として、ヌクレアーゼまたは化学剤によって)、これによって標的遺伝子座の鎖の一方に利用可能な3'末が創出される。ある態様において、ニックは、Rループ鎖に対応するDNAの鎖、すなわち、ガイドRNA配列とはハイブリダイズされない鎖に創出される。ステップ(c)において、3'末DNA鎖は、逆転写をプライムするためにガイドRNAの伸長された部分と相互作用する。いくつかの態様において、3'末DNA鎖は、ガイドRNAの伸長された部分上の特定のRTプライム配列とハイブリダイズする。ステップ(d)において、逆転写酵素が導入されて、プライムされた部位の3'末からガイドRNAの3'末へDNAの単鎖を合成する。これは、所望のヌクレオチド変化(例として、単一の塩基変化、挿入、欠失、またはそれらの組み合わせ)を含む単鎖DNAフラップを形成する。ステップ(e)において、napDNAbpおよびガイドRNAは放出される。ステップ(f)および(g)は、所望のヌクレオチド変化が標的遺伝子座中へ組み込まれるように、単鎖DNAフラップの分解に関する。このプロセスは、一旦3'単鎖DNAフラップが侵入して他の鎖上の相補的な配列とハイブリダイズすると、形成された対応の5'内生DNAフラップを除去することによって、所望の産物形成が推進され得る。プロセスはまた、図1Fに例示されるとおり、第2鎖へニックが入れられた産物の形成へも推進され得る。このプロセスは、以下の遺伝子変化:トランスバージョン、トランジション、欠失、および挿入のうち少なくとも1またはそれ以上を導入してもよい。FIG. 1G provides another schematic diagram of an exemplary process for introducing single nucleotide changes and/or insertions and/or deletions into a DNA molecule (e.g., a genome) at a target locus using a nucleic acid programmable DNA binding protein (napDNAbp) complexed with an extended guide RNA. This process is sometimes referred to as an embodiment of prime editing. The extended guide RNA includes an extension at the 3' or 5' end of the guide RNA, or at some intramolecular location in the guide RNA. In step (a), the napDNAbp/gRNA complex contacts the DNA molecule, and the gRNA guides the napDNAbp to bind to the target locus. In step (b), a nick is introduced (e.g., by a nuclease or chemical agent) into one of the strands of the DNA (the R-loop strand, or the PAM-containing strand, or the non-target DNA strand, or the protospacer strand) of the target locus, thereby creating an available 3' end on one of the strands of the target locus. In one embodiment, the nick is created in the strand of DNA corresponding to the R-loop strand, i.e., the strand that is not hybridized with the guide RNA sequence. In step (c), the 3'-end DNA strand interacts with the extended portion of the guide RNA to prime reverse transcription. In some embodiments, the 3'-end DNA strand hybridizes with a specific RT prime sequence on the extended portion of the guide RNA. In step (d), a reverse transcriptase is introduced to synthesize a single strand of DNA from the 3'-end of the primed site to the 3'-end of the guide RNA. This forms a single-stranded DNA flap containing the desired nucleotide change (e.g., a single base change, an insertion, a deletion, or a combination thereof). In step (e), the napDNAbp and the guide RNA are released. Steps (f) and (g) involve the degradation of the single-stranded DNA flap so that the desired nucleotide change is incorporated into the target locus. This process can drive the desired product formation by removing the corresponding 5' endogenous DNA flap that is formed once the 3' single-stranded DNA flap invades and hybridizes with a complementary sequence on the other strand. The process can also drive the formation of a product nicked to the second strand, as illustrated in FIG. 1F. This process may introduce at least one or more of the following genetic alterations: transversions, transitions, deletions, and insertions.

図1Hは、本明細書に記載の、プライム編集プロセスに起こり得る遺伝子変化の型を描く概略図である。プライム編集によって達成され得るヌクレオチド変化の型は、欠失(短いおよび長い欠失を包含する)、単一のヌクレオチド変化(トランジションおよびトランスバージョンを包含する)、ならびに挿入(短いおよび長いものを包含する)を包含する。Figure 1H is a schematic diagram depicting the types of genetic changes that can occur in the prime editing process described herein. The types of nucleotide changes that can be achieved by prime editing include deletions (including short and long deletions), single nucleotide changes (including transitions and transversions), and insertions (including short and long).

図1Iは、PE3b(PE3b=PE2プライム編集因子融合タンパク質+PEgRNA+第2鎖へニックを入れるガイドRNA)によって例示される、一時的な(temporal)第2鎖へのニック入れを描く概略図である。一時的な第2鎖へのニック入れは、所望の編集済産物の形成を容易にするための、第2鎖へのニック入れのバリアントである。「一時的な」という用語は、未編集鎖への第2鎖ニックが、所望の編集が編集済鎖に組み入れられた後にしか生じないという事実を指す。これは、二本鎖DNA切断へ繋がる両鎖上の同時のニックを回避する。FIG. 1I is a schematic depicting temporal second strand nicking, exemplified by PE3b (PE3b=PE2 prime editor fusion protein+PEgRNA+guide RNA that nicks the second strand). Temporal second strand nicking is a variant of second strand nicking to facilitate the formation of the desired edited product. The term "temporary" refers to the fact that the second strand nicking to the unedited strand occurs only after the desired edit has been incorporated into the edited strand. This avoids simultaneous nicking on both strands leading to double-stranded DNA breaks.

図1J~1Kは、napDNAbp(例として、SpCas9ニッカーゼ)を、ジンクフィンガーヌクレアーゼ(ZFN)または転写活性化因子様エフェクターヌクレアーゼ(TALEN)などのいずれのプログラム型ヌクレアーゼドメインにも置き換える、本明細書に企図されるプライム編集のバリエーションを描く。そのため、好適なヌクレアーゼは核酸標的分子(ガイドRNAなど)によって必ずしも「プログラムされる(programmed)」必要はないが、むしろ、とりわけヌクレアーゼなどのDNA結合ドメインの特異性を定義することによってプログラムされてもよいことが企図される。ちょうどnapDNAbp部分とのプライム編集と同じように、代替プログラム型ヌクレアーゼは、標的DNAの一方の鎖のみが切られるように修飾されることが好ましい。換言すれば、プログラム型ヌクレアーゼは、好ましくは、ニッカーゼとして機能するはずである。一旦プログラム型ヌクレアーゼが選択されると(例として、ZFNまたはTALEN)、追加の機能は改変されて、それがプライム編集様機序に従って作動することができる系になってもよい。例えば、プログラム型ヌクレアーゼは、これとRNAまたはDNAの伸長アームとを(例として、化学的リンカーを介して)カップリングすることによって修飾されてもよく、ここで伸長アームは、プライマー結合部位(PBS)およびDNA合成鋳型を含む。プログラム型ヌクレアーゼはまた、ポリメラーゼとも(例として、化学的リンカーまたはアミノ酸リンカーを介して)カップリングされてもよいが、前記ポリメラーゼの性質は、伸長アームがDNAまたはRNAであるかに依存するであろう。RNA伸長アームのケースにおいて、ポリメラーゼはRNA依存性DNAポリメラーゼ(例として、逆転写酵素)であり得る。DNA伸長アームのケースにおいて、ポリメラーゼは、DNA依存性DNAポリメラーゼ(例として、Pol I、Pol II、もしくはPol IIIを包含する原核生物のポリメラーゼ、またはPol a、Pol b、Pol g、Pol d、Pol e、もしくはPol zを包含する真核生物のポリメラーゼ)であり得る。系はまた、プログラム型ヌクレアーゼとの融合体として加えられるか、または反応全体を容易にするためにtransで加えられた他の機能も包含していてもよい(例として、(a)DNAを切断部位にて巻き戻すことで、プライマーとして利用可能な3'末をもつ切断鎖を作製する、ヘリカーゼ、(b)切断鎖上の内生鎖を除去することで、内生鎖の合成された鎖との置き換えへの反応を推進するのに役立つ、フラップエンドヌクレアーゼ(例として、FEN1)、または(c)反対鎖上に第2部位ニックを創出する、nCas9:gRNA複合体(これは非編集鎖の好ましい細胞修復を通した合成修復の取り入れを推進するのに役立つこともある))。napDNAbpで編集をプライムする類似したやり方において、別様なプログラム型ヌクレアーゼとのかかる複合体は、合成し、次いで、着目した編集を持つ新しく合成されたDNAの置き換え鎖をDNAの標的部位中へ永続的に組み入れるのに使用され得る。1J -1K depict variations of prime editing contemplated herein in which napDNAbp (e.g., SpCas9 nickase) is replaced with any programmed nuclease domain, such as a zinc finger nuclease (ZFN) or transcription activator-like effector nuclease (TALEN). Thus, it is contemplated that a suitable nuclease does not necessarily have to be "programmed" by a nucleic acid target molecule (e.g., a guide RNA), but rather may be programmed by defining the specificity of the DNA binding domain, such as the nuclease, among others. Just as with prime editing with napDNAbp moieties, alternative programmed nucleases are preferably modified to cleave only one strand of the target DNA. In other words, the programmed nuclease should preferably function as a nickase. Once a programmed nuclease is selected (e.g., a ZFN or TALEN), additional functionality may be engineered to result in a system that can operate according to a prime editing-like mechanism. For example, the programmable nuclease may be modified by coupling it to an RNA or DNA extension arm (e.g., via a chemical linker), where the extension arm includes a primer binding site (PBS) and a DNA synthesis template. The programmable nuclease may also be coupled to a polymerase (e.g., via a chemical or amino acid linker), but the nature of the polymerase will depend on whether the extension arm is DNA or RNA. In the case of an RNA extension arm, the polymerase may be an RNA-dependent DNA polymerase (e.g., reverse transcriptase). In the case of a DNA extension arm, the polymerase may be a DNA-dependent DNA polymerase (e.g., a prokaryotic polymerase including Pol I, Pol II, or Pol III, or a eukaryotic polymerase including Pol a, Pol b, Pol g, Pol d, Pol e, or Pol z). The system may also include other functions added as fusions with programmable nucleases or in trans to facilitate the overall reaction (e.g., (a) a helicase that unwinds the DNA at the cut site, creating a cut strand with a 3' end that can be used as a primer; (b) a flap endonuclease (e.g., FEN1) that removes the endogenous strand on the cut strand, helping to drive the reaction towards replacing the endogenous strand with the synthesized strand; or (c) an nCas9:gRNA complex that creates a second site nick on the opposite strand, which may also help drive incorporation of the synthetic repair over the preferred cellular repair of the non-edited strand). In a similar manner to priming editing with napDNAbp, such complexes with other programmable nucleases can be used to synthesize and then permanently incorporate a newly synthesized replacement strand of DNA bearing the edit of interest into a target site of DNA.

図1は、一態様において、プライム編集によって編集されてもよい標的DNAの解剖学的な特色(anatomical features)を描く。標的DNAは「非標的鎖」および「標的鎖」を含む。標的鎖は、PAM部位(このケースにおいては、標準的なSpCas9ベースのプライム編集因子によって認識されるNGG)を認識するプライム編集因子複合体のPEgRNAのスペーサーとアニールされるようになる鎖である。標的鎖はまた、「非PAM鎖」または「非編集鎖」とも称されることがある。これに反して、非標的鎖(すなわち、プロトスペーサーおよびNGGのPAM配列を含有する鎖)は、「PAM鎖」または「編集鎖」と称されることもある。様々な態様において、PE複合体(例として、SpCas9ベースのPEでの)のニック部位は、PAM鎖上のプロトスペーサー中にあるであろう。ニックの場所は、PEを形成する具体的なCas9の特徴であろう。例えば、SpCas9ベースのPEであると、ニック部位は、塩基3(PAM配列の位置1と比べて「-3」位置)と4(PAM配列の位置1と比べて「-4」位置)との間のホスホジエステル結合中にある。プロトスペーサー中のニック部位は、以下の図に見られるとおりPEgRNAの伸長アームのプライマー結合部位と複合体化する遊離の3'ヒドロキシル基を形成し、PEgRNAの伸長アームのDNA合成鋳型をコードするDNAの単鎖の重合を始める基質を提供する。この重合反応は5'→3'方向に、PE融合タンパク質のポリメラーゼ(例として、逆転写酵素)によって触媒される。重合は、gRNAコアに達する前に(例として、PEの重合活性を終止するよう機能する重合終止シグナルまたは2次構造の包含によって)終止し、ニック入りのPAM鎖の元の3'ヒドロキシル基から伸長される単鎖DNAフラップを産生する。DNA合成鋳型は、PAM鎖上のニック部位のすぐ後に続く内生DNAの5'末の単鎖と相同な単鎖DNAをコードしており、所望のヌクレオチド変化(例として、単一塩基の置換、挿入、欠失、逆位)を組み入れる。所望の編集の位置は、PAM鎖上のニック部位の下流に続くいずれの位置にもあり得、位置+1、+2、+3、+4(PAM部位の開始)、+5(PAM部位の位置2)、+6(PAM部位の位置3)、+7、+8、+9、+10、+11、+12、+13、+14、+15、+16、+17、+18、+19、+20、+21、+22、+23、+24、+25、+26、+27、+28、+29、+30、+31、+32、+33、+34、+35、+36、+37、+38、+39、+40、+41、+42、+43、+44、+45、+46、+47、+48、+49、+50、+51、+52、+53、+54、+55、+56、+57、+58、+59、+60、+61、+62、+63、+64、+65、+66、+67、+68、+69、+70、+71、+72、+73、+74、+75、+76、+77、+78、+79、+80、+81、+82、+83、+84、+85、+86、+87、+88、+89、+90、+91、+92、+93、+94、+95、+96、+97、+98、+99、+100、+101、+102、+103、+104、+105、+106、+107、+108、+109、+110、+111、+112、+113、+114、+115、+116、+117、+118、+119、+120、+ 121、+122、+123、+124、+125、+126、+127、+128、+129、+130、+131、+132、+133、+134、+135、+136、+137、+138、+139、+140、+141、+142、+143、+144、+145、+146、+147、+148、+149、もしくは+150、またはこれ以上(ニック部位の下流位置に対して)を包含し得る。一旦3'末単鎖DNA(着目する編集を含有する)が内生5'末単鎖DNAを置き換えると、DNA修復および複製プロセスは、PAM鎖上の編集部位の永続的な組み入れを、次いで編集部位に存在する非PAM鎖上のミスマッチの修正をもたらすであろう。このように、編集は、標的DNA部位上のDNAの両鎖へ広がるであろう。「編集済鎖」および「非編集済」鎖への言及が単に、PE機序に関与するDNAの鎖を正確に記述する(delineate)ことを意図するに過ぎないことは解されるであろう。「編集済鎖」は、ニック部位のすぐ下流での5'末の単鎖DNAの、所望の編集を含有する合成された3'末の単鎖DNAとの置き換えによって初めて編集されるようになる鎖である。「非編集済」鎖は編集済鎖との対の鎖であるが、これ自身もまた、修復および/または複製を通して、編集済鎖に相補的になるよう編集(とりわけ、着目する編集)がなされるようになる。FIG . 1L depicts anatomical features of a target DNA that may be edited by prime editing in one embodiment. The target DNA includes a "non-target strand" and a "target strand." The target strand is the strand that becomes annealed with the spacer of the PEgRNA of the prime editor complex that recognizes the PAM site (in this case, NGG, which is recognized by standard SpCas9-based prime editors). The target strand may also be referred to as the "non-PAM strand" or "non-edited strand." In contrast, the non-target strand (i.e., the strand containing the protospacer and the PAM sequence of NGG) may also be referred to as the "PAM strand" or "edited strand." In various embodiments, the nick site of the PE complex (e.g., in SpCas9-based PE) will be in the protospacer on the PAM strand. The location of the nick will be a feature of the specific Cas9 forming the PE. For example, with SpCas9-based PE, the nick site is in the phosphodiester bond between bases 3 (position "-3" relative to position 1 of the PAM sequence) and 4 (position "-4" relative to position 1 of the PAM sequence). The nick site in the protospacer forms a free 3' hydroxyl group that complexes with the primer binding site of the extension arm of the PEgRNA as seen in the diagram below, providing a substrate to initiate polymerization of a single strand of DNA encoding the DNA synthesis template of the extension arm of the PEgRNA. This polymerization reaction is catalyzed by the polymerase (e.g., reverse transcriptase) of the PE fusion protein in the 5'→3' direction. Polymerization terminates (e.g., by inclusion of a polymerization termination signal or secondary structure that functions to terminate the polymerization activity of PE) before reaching the gRNA core, producing a single-stranded DNA flap that is extended from the original 3' hydroxyl group of the nicked PAM strand. The DNA synthesis template encodes a single strand of DNA that is homologous to the 5'-terminal single strand of the endogenous DNA immediately following the nick site on the PAM strand and incorporates the desired nucleotide change (e.g., single base substitution, insertion, deletion, inversion). The desired edit position can be at any position following downstream of the nick site on the PAM strand, and can be at positions +1, +2, +3, +4 (start of the PAM site), +5 (position 2 of the PAM site), +6 (position 3 of the PAM site), +7, +8, +9, +10, +11, +12, +13, +14, +15, +16, +17, +18, +19, +20, +21, +22, +23, +24, +25, +26, +27, +28, +29, +30, +31, +32, +33, +34, +35, +36, +37, +38, +39, +40, +41, +42, +43, +44, +45, +46, +47, +48, +49, +50, +51, +52, +53, +54, +55, +56, +57, +58, +59, +60, +61, +62, +63, +64, +65, +66, +67, +68, +69, +70, +71, +72, +73, +74, +75, +76, +77, +78, +79, +80, +81, +82, +83, +84, +85, +86, +87, +88, +89, +90, +91, +92, +93, +94, +95, +96, +97, +98, +99, +100, + 20, +21, +22, +23, +24, +25, +26, +27, +28, +29, +30, +31, +32, +33, +34, +35, +36, +37, +38, +39, +40, +41, +42, +43, +44, +45, +46, +47, +48, +49, +50, +51, +52, +53, +54, +55 , +56, +57, +58, +59, +60, +61, +62, +63, +64, +65, +66, +67, +68, +69, +70, +71, +72, +73, +74, +75, +76, +77, +78, +79, +80, +81, +82, +83, +84, +85, +86, +87, +88, +89, +90, +91, +92, +93, +94, +95, +96, +97, +98, +99, +100, +101, +102, +103, +104, +105, +106, +107, +108, +109, +110, +111, +112, +113, +114, +115, +116, +117, +118, +119, +120, + The 3'-terminal single-stranded DNA (containing the edit of interest) may include 121, +122, +123, +124, +125, +126, +127, +128, +129, +130, +131, +132, +133, +134, +135, +136, +137, +138, +139, +140, +141, +142, +143, +144, +145, +146, +147, +148, +149, or +150 or more (relative to the downstream position of the nick site). Once the 3'-terminal single-stranded DNA (containing the edit of interest) replaces the endogenous 5'-terminal single-stranded DNA, DNA repair and replication processes will result in the permanent incorporation of the edit site on the PAM strand and then correction of the mismatch on the non-PAM strand present at the edit site. Thus, the edit will spread to both strands of DNA on the target DNA site. It will be understood that references to the "edited strand" and the "non-edited" strand are intended merely to delineate the strands of DNA involved in the PE mechanism. The "edited strand" is the strand that first becomes edited by replacement of the 5' single stranded DNA immediately downstream of the nick site with a synthesized 3' single stranded DNA containing the desired edit. The "non-edited" strand is the counterpart strand to the edited strand, but it also becomes edited (particularly the edit of interest) through repair and/or replication to become complementary to the edited strand.

図1は、標的DNA、プライム編集因子複合体、およびPEgRNAと標的DNAとの間の相互作用の解剖学的な特色を示すプライム編集の機序を描く。第1に、ポリメラーゼ(例として、逆転写酵素)およびnapDNAbp(例として、SpCas9ニッカーゼ、例として、HNHヌクレアーゼドメイン中の不活性化突然変異(例として、H840A)またはRuvCヌクレアーゼドメイン中の活性化突然変異(D10A)を有するSpCas9)を有する融合タンパク質を含むプライム編集因子は、PEgRNAおよび編集されるべき標的DNAを有するDNAと複合体化されている。PEgRNAは、スペーサー、gRNAコア(またgRNA骨格もしくはgRNA主鎖としても知られている)(これはnapDNAbpへ結合する)、および伸長アームを含む。伸長アームは、3'末、5'末に、またはPEgRNA分子内のどこかにあり得る。示されるとおり、伸長アームは、PEgRNAの3'末にある。伸長アームは、3'→5'方向において、PAM鎖上のニック部位のすぐ後に続く5'末の単鎖DNAと相同である、プライマー結合部位およびDNA合成鋳型(着目する編集と相同領域(すなわち、相同アーム)との両方を含む)を含む。示されるとおり、一旦ニックが導入され、これによってニック部位のすぐ上流に遊離の3'ヒドロキシル基が産生されると、PAM鎖上のニック部位のすぐ上流の領域は、「プライマー結合部位」と称される伸長アームの3'末にて相補的な配列とアニールし、利用可能な3'ヒドロキシル末をもつ短い二本鎖の領域を創出するが、これによってプライム編集因子複合体のポリメラーゼのための基質が形成される。次いで、ポリメラーゼ(例として、逆転写酵素)は、DNAの鎖として、3'ヒドロキシル末から伸長アームの末まで重合する。単鎖DNAの配列はDNA合成鋳型によってコードされており、これは、新しいDNAを合成するポリメラーゼによって「読まれる」伸長アームの一部(すなわち、プライマー結合部位を排除する)である。この重合は、最初のニック部位の元の3'ヒドロキシル末の配列まで有効に伸長する。DNA合成鋳型は、所望の編集のみならず、PAM鎖上のニック部位のすぐ下流の内生DNAの単鎖に相同の領域もまた含むDNAの単鎖をコードする。次に、コードされる3'末のDNAの単鎖(すなわち、3'単鎖DNAフラップ)は、PAM鎖上のニック部位のすぐ下流の、対応する相同の内生5'末のDNAの単鎖に取って代わり、5'末の単鎖DNAフラップを有するDNA中間体を形成するが、これは細胞によって(例として、フラップエンドヌクレアーゼによって)除去される。内生5'末の単鎖DNAフラップの相補体とアニールする3'末の単鎖DNAフラップは、5'DNAフラップが除去された後、内生鎖とライゲーションされる。3'末の単鎖DNAフラップ中の所望の編集は、たった今アニールされてライゲーションされたが、相補鎖とのミスマッチを形成し、DNA修復および/または一連の複製を経て、これによって両鎖上に所望の編集が永続的に組み入れられる。FIG . 1M depicts the mechanism of prime editing showing the anatomical features of the target DNA, the prime editor complex, and the interaction between the PEgRNA and the target DNA. First, a prime editor comprising a fusion protein having a polymerase (e.g., reverse transcriptase) and a napDNAbp (e.g., SpCas9 nickase, e.g., SpCas9 with an inactivating mutation in the HNH nuclease domain (e.g., H840A) or an activating mutation in the RuvC nuclease domain (D10A)) is complexed with a PEgRNA and a DNA comprising the target DNA to be edited. The PEgRNA comprises a spacer, a gRNA core (also known as a gRNA backbone or gRNA backbone) (which binds to the napDNAbp), and an extension arm. The extension arm can be at the 3' end, the 5' end, or anywhere within the PEgRNA molecule. As shown, the extension arm is at the 3' end of the PEgRNA. The extension arm contains a primer binding site and a DNA synthesis template (containing both the edit of interest and a homologous region (i.e., the homology arm)) that is homologous in the 3'→5' direction to the single-stranded DNA at the 5' end immediately following the nick site on the PAM strand. As shown, once a nick is introduced, thereby generating a free 3' hydroxyl group immediately upstream of the nick site, the region immediately upstream of the nick site on the PAM strand anneals to a complementary sequence at the 3' end of the extension arm, referred to as the "primer binding site," creating a short double-stranded region with an available 3' hydroxyl end, which forms a substrate for the polymerase of the primed editor complex. A polymerase (e.g., reverse transcriptase) then polymerizes a strand of DNA from the 3' hydroxyl end to the end of the extension arm. The sequence of the single-stranded DNA is encoded by the DNA synthesis template, which is the portion of the extension arm that is "read" by the polymerase to synthesize new DNA (i.e., excluding the primer binding site). This polymerization effectively extends to the original 3' hydroxyl-terminal sequence at the site of the initial nick. The DNA synthesis template encodes a single strand of DNA that contains not only the desired edit, but also a region of homology to the single strand of endogenous DNA immediately downstream of the nick site on the PAM strand. The encoded 3' single strand of DNA (i.e., the 3' single-stranded DNA flap) then replaces the corresponding homologous endogenous 5' single strand of DNA immediately downstream of the nick site on the PAM strand, forming a DNA intermediate with a 5' single-stranded DNA flap that is removed by the cell (e.g., by a flap endonuclease). The 3' single-stranded DNA flap that anneals to the complement of the endogenous 5' single-stranded DNA flap is ligated to the endogenous strand after the 5' DNA flap is removed. The desired edit in the 3'-terminal single-stranded DNA flap, which has just been annealed and ligated, forms a mismatch with the complementary strand and undergoes DNA repair and/or rounds of replication, thereby permanently incorporating the desired edit on both strands.

図2は、本明細書に記載のプライム編集因子に用いられ得る3つのCas複合体(SpCas9、SaCas9、およびLbCas12a)と、それらのPAM、gRNA、およびDNA切断特色とを示している。図はSpCas9、SaCas9、およびLbCas12aが関わる複合体のデザインを示している。Figure 2 shows three Cas complexes (SpCas9, SaCas9, and LbCas12a) that can be used with the prime editors described herein, along with their PAM, gRNA, and DNA cleavage features. The diagram shows the design of the complexes involving SpCas9, SaCas9, and LbCas12a.

図3A~3Fは、操作された5'プライム編集因子gRNA(図3A)、3'プライム編集因子gRNA(図3B)、および分子内の伸長(図3C)のデザインを示している。伸長されたガイドRNA(または伸長されたgRNA)は本願においてはPEgRNAまたは「プライム編集ガイドRNA」ともまた言われ得る。図3Dおよび図3Eは夫々3'および5'プライム編集因子gRNA(PEgRNA)の追加の態様を提供する。図3Fは標的DNA配列との3'端プライム編集因子ガイドRNAの間の相互作用を例解している。図3A~3Cの態様は、3'、5'、および分子内のバージョンの伸長された部分における逆転写鋳型配列(すなわち、または指示されているとおりより幅広くDNA合成鋳型と言われる。なぜなら、RTはプライム編集因子という文脈において用いられ得るポリメラーゼの唯一の型であるからである)、プライマー結合部位、および任意のリンカー配列の例示の配置、ならびにスペーサーおよびコア領域の一般的な配置を図示する。開示されるプライム編集プロセスは、伸長されたガイドRNAのこれらの構成に限定されない。図3Dの態様は、本願において企図される例示のPEgRNAの構造を提供する。PEgRNAは、5'から3'の方向で順序付けられた3つの主な構成要素構成要素、つまり:スペーサー、gRNAコア、および3'端の伸長アームを含む。伸長アームは、さらに、5'から3'方向に次の構造要素、つまり:プライマー結合部位(A)、編集鋳型(B)、および相同アーム(C)に分けられ得る。加えて、PEgRNAは任意の3'端修飾領域(e1)および任意の5'端修飾領域(e2)を含み得る。なお、さらに、PEgRNAは転写終結シグナルをPEgRNAの3'端に含み得る(図示されていない)。これらの構造要素はさらに本願において定められる。PEgRNAの構造の図示は限定することを意味されず、要素の配置のバリエーションを包摂する。例えば、任意の配列修飾(e1)および(e2)は、示されている他の領域のいずれかの内にまたは間に位置取り得る。3'および5'端に位置付けられることに限定されない。PEgRNAは、ある態様において、ヘアピン、ステムループ、トウループ、RNA結合タンパク質動員ドメイン(例えば、MS2cpタンパク質を動員および結合するMS2アプタマー)などだがこれらに限定されない二次RNA構造を含み得る。例えば、かかる二次構造は、スペーサー、gRNAコア、または伸長アーム内に、特にe1および/またはe2修飾領域内に位置し得る。二次RNA構造に加えて、PEgRNAは(例えばe1および/またはe2修飾領域内に)化学的リンカーまたはポリ(N)リンカーもしくはテールを含み得る。ここで、「N」はいずれかの核酸塩基であり得る。いくつかの態様では(例えば、図72(c)に示されているとおり)、化学的リンカーはsgRNA骨格またはコアの逆転写を防止するように機能し得る。加えて、ある種の態様では(例えば図72(c)を見よ)、伸長アーム(3)はRNAまたはDNAから構成され得、および/または1つ以上の核酸塩基アナログを包含し得る(例えば、これは温度レジリエンスなどの機能性を追加し得る)。なお、さらに、伸長アーム(3)の向きは、天然の5'から3'の方向であり得るか、または対向する向きで3'から5'の方向に(総体的なPEgRNA分子の向きに対して相対的に)合成され得る。当業者は、伸長アームの核酸材料の性質(すなわちDNAまたはRNA)に依存して、プライム編集への使用のための適当なDNAポリメラーゼを選択する能力があるであろうということもまた注意される。これは、所望の編集を包含する所望の鋳型によってコードされる3'一本鎖DNAフラップを合成するために、napDNAbpとの融合体として、または別個の部分としてトランスで提供されて、どちらかで実装され得る。例えば、伸長アームがRNAである場合には、DNAポリメラーゼは、逆転写酵素またはいずれかの他の好適なRNA依存性DNAポリメラーゼであり得る。しかしながら、伸長アームがDNAである場合には、DNAポリメラーゼはDNA依存性DNAポリメラーゼであり得る。種々の態様において、DNAポリメラーゼの提供はトランスであり得、例えばRNA-タンパク質動員ドメイン(例えば、PEgRNA上に組み入れされたMS2ヘアピン(例えば、e1もしくはe2領域にまたは他所に)およびDNAポリメラーゼに融合されたMS2cpタンパク質。それによってDNAポリメラーゼをPEgRNAに共局在させる)の使用による。プライマー結合部位は、一般的には、所望の編集を包含するもたらされる3'一本鎖DNAフラップをコードするためのDNAポリメラーゼ(例えば、逆転写酵素)によって用いられる鋳型の一部を形成しないということもまた注意される。それゆえに、「DNA合成鋳型」という指定は、編集とプライム編集DNA合成の3’一本鎖DNA鎖産物によって置き換えられる5’の内生一本鎖DNAフラップに対する相同領域とを含有する所望の3'一本鎖DNAフラップをコードするための、DNAポリメラーゼによって鋳型として用いられる伸長アーム(3)の領域または部分を言う。いくつかの態様では、DNA合成鋳型は「編集鋳型」および「相同アーム」または1つ以上の相同アームを例えば編集鋳型の前および後に包含する。編集鋳型は1ヌクレオチド置換ほども小さくあり得るか、またはそれはDNAの挿入もしくは逆位であり得る。加えて、編集鋳型は欠失をもまた包含し得、これは所望の欠失を含有する相同アームをコードすることによって操作され得る。他の態様において、DNA合成鋳型はe2領域またはその部分をもまた包含し得る。例えば、e2領域がDNAポリメラーゼ活性の終結を引き起こす二次構造を含む場合には、e2領域のいずれかの部分が実際にDNA上にコードされる前に、DNAポリメラーゼ機能が終結するであろうということが可能である。e2領域のいくつかまたはさらには全てがDNA上にコードされるであろうということもまた可能である。e2のどれくらい多くが実際に鋳型として用いられるのかは、その構成とその構成がDNAポリメラーゼ機能を分断するかどうかとに依存するであろう。Figures 3A-3F show the design of engineered 5' prime editor gRNA (Figure 3A), 3' prime editor gRNA (Figure 3B), and intramolecular extension (Figure 3C). The extended guide RNA (or extended gRNA) may also be referred to herein as PEgRNA or "prime editing guide RNA". Figures 3D and 3E provide additional embodiments of 3' and 5' prime editor gRNA (PEgRNA), respectively. Figure 3F illustrates the interaction between the 3' prime editor guide RNA with the target DNA sequence. The embodiments of Figures 3A-3C illustrate example placements of reverse transcription template sequences (i.e., or more broadly referred to as DNA synthesis templates as indicated, since RT is the only type of polymerase that can be used in the context of a prime editor), primer binding sites, and optional linker sequences, as well as the general placement of spacers and core regions in the extended portions of the 3', 5', and intramolecular versions. The disclosed prime editing process is not limited to these configurations of the extended guide RNA. The embodiment of FIG. 3D provides an exemplary PEgRNA structure contemplated in the present application. The PEgRNA includes three main component components ordered in the 5' to 3' direction: a spacer, a gRNA core, and an extension arm at the 3' end. The extension arm can be further divided into the following structural elements in the 5' to 3' direction: a primer binding site (A), an editing template (B), and a homology arm (C). In addition, the PEgRNA can include an optional 3' end modification region (e1) and an optional 5' end modification region (e2). Furthermore, the PEgRNA can include a transcription termination signal at the 3' end of the PEgRNA (not shown). These structural elements are further defined in the present application. The illustration of the structure of the PEgRNA is not meant to be limiting and encompasses variations in the placement of the elements. For example, the optional sequence modifications (e1) and (e2) can be located within or between any of the other regions shown. It is not limited to being located at the 3' and 5' ends. In some embodiments, the PEgRNA may include secondary RNA structures such as, but not limited to, hairpins, stem loops, toe loops, RNA-binding protein recruitment domains (e.g., MS2 aptamers that recruit and bind MS2cp proteins). For example, such secondary structures may be located within the spacer, gRNA core, or extension arms, particularly within the e1 and/or e2 modified regions. In addition to the secondary RNA structures, the PEgRNA may include (e.g., within the e1 and/or e2 modified regions) a chemical linker or poly(N) linker or tail, where "N" can be any nucleobase. In some embodiments (e.g., as shown in Figure 72(c)), the chemical linker may function to prevent reverse transcription of the sgRNA backbone or core. Additionally, in certain embodiments (see, e.g., Figure 72(c)), the extension arm (3) may be composed of RNA or DNA and/or may include one or more nucleobase analogs (e.g., which may add functionality such as temperature resilience). It is further noted that the orientation of the extension arm (3) may be in the natural 5' to 3' direction or may be synthesized in the opposite direction, 3' to 5' (relative to the orientation of the overall PEgRNA molecule). It is also noted that the skilled artisan will be able to select the appropriate DNA polymerase for use in prime editing depending on the nature of the nucleic acid material of the extension arm (i.e. DNA or RNA). This can be implemented either as a fusion with napDNAbp or provided in trans as a separate part to synthesize a 3' single-stranded DNA flap encoded by the desired template that encompasses the desired edit. For example, if the extension arm is RNA, the DNA polymerase can be a reverse transcriptase or any other suitable RNA-dependent DNA polymerase. However, if the extension arm is DNA, the DNA polymerase can be a DNA-dependent DNA polymerase. In various embodiments, provision of the DNA polymerase can be in trans, such as by use of an RNA-protein recruitment domain (e.g., an MS2 hairpin incorporated onto the PEgRNA (e.g., in the e1 or e2 region or elsewhere) and an MS2cp protein fused to the DNA polymerase, thereby co-localizing the DNA polymerase to the PEgRNA). It is also noted that the primer binding site generally does not form part of the template used by the DNA polymerase (e.g., reverse transcriptase) to encode the resulting 3' single-stranded DNA flap that contains the desired edit. Thus, the designation "DNA synthesis template" refers to the region or portion of the extension arm (3) that is used as a template by the DNA polymerase to encode the desired 3' single-stranded DNA flap that contains the edit and a region of homology to the 5' endogenous single-stranded DNA flap that is replaced by the 3' single-stranded DNA product of the primed edited DNA synthesis. In some embodiments, the DNA synthesis template includes an "editing template" and a "homologous arm" or one or more homologous arms, for example, before and after the editing template. The editing template can be as small as a single nucleotide substitution, or it can be an insertion or inversion of DNA. In addition, the editing template can also include deletions, which can be engineered by encoding a homology arm containing the desired deletion. In other embodiments, the DNA synthesis template can also include the e2 region or a portion thereof. For example, if the e2 region contains a secondary structure that causes termination of DNA polymerase activity, it is possible that DNA polymerase function will terminate before any part of the e2 region is actually coded on the DNA. It is also possible that some or even all of the e2 region will be coded on the DNA. How much of e2 is actually used as a template will depend on its configuration and whether it disrupts DNA polymerase function.

図3Eの態様は本願において企図される別のPEgRNAの構造を提供する。PEgRNAは、5'から3'の方向で順序付けられた3つの主な構成要素構成要素、つまり:スペーサー、gRNAコア、および3'端の伸長アームを含む。伸長アームは、さらに、5'から3'の方向で次の構造要素、つまり:プライマー結合部位(A)、編集鋳型(B)、および相同アーム(C)に分けられ得る。加えて、PEgRNAは任意の3'端修飾領域(e1)および任意の5'端修飾領域(e2)を含み得る。なお、さらに、PEgRNAはPEgRNAの3'端に転写終結シグナルを含み得る(図示されていない)。これらの構造要素はさらに本願において定められる。PEgRNAの構造の図示は限定することを意味されず、要素の配置のバリエーションを包摂する。例えば、任意の配列修飾(e1)および(e2)は示されている他の領域のいずれかの内にまたは間に位置取り得る。3'および5'端に位置付けられることに限定されない。PEgRNAは、ある態様において、ヘアピン、ステムループ、トウループ、RNA結合タンパク質動員ドメイン(例えば、MS2cpタンパク質を動員および結合するMS2アプタマー)などだがこれらに限定されない二次RNA構造を含み得る。これらの二次構造はPEgRNA分子上のどこかに位置取り得る。例えば、かかる二次構造は、スペーサー、gRNAコア、または伸長アーム内に、特にe1および/またはe2修飾領域内に位置し得る。二次RNA構造に加えて、PEgRNAは(例えば、e1および/またはe2修飾領域内に)化学的リンカーまたはポリ(N)リンカーもしくはテールを含み得る。ここで、「N」はいずれかの核酸塩基であり得る。いくつかの態様では(例えば、図72(c)に示されているとおり)、化学的リンカーはsgRNA骨格またはコアの逆転写を防止するように機能し得る。加えて、ある種の態様では(例えば、図72(c)を見よ)、伸長アーム(3)はRNAもしくはDNAからなり得、および/または1つ以上の核酸塩基アナログを包含し得る(例えば、これは温度レジリエンスなどの機能性を追加し得る)。なお、さらに、伸長アーム(3)の向きは天然の5'から3'の方向であり得るか、または対向する向きで3'から5'の方向に(総体的なPEgRNA分子の向きに対して相対的に)合成され得る。当業者は、伸長アームの核酸材料の性質(すなわちDNAまたはRNA)に依存して、プライム編集への使用のための適当なDNAポリメラーゼを選択する能力があるであろうということもまた注意される。これは、所望の編集を包含する所望の鋳型によってコードされる3'一本鎖DNAフラップを合成するために、napDNAbpとの融合体として、または別個の部分としてトランスで提供されて、どちらかで実装され得る。例えば、伸長アームがRNAである場合には、DNAポリメラーゼは、逆転写酵素またはいずれかの他の好適なRNA依存性DNAポリメラーゼであり得る。しかしながら、伸長アームがDNAである場合には、DNAポリメラーゼはDNA依存性DNAポリメラーゼであり得る。種々の態様において、DNAポリメラーゼの提供はトランスであり得、例えばRNA-タンパク質動員ドメイン(例えば、PEgRNA上に組み入れされたMS2ヘアピン(例えば、e1もしくはe2領域にまたは他所に)およびDNAポリメラーゼに融合されたMS2cpタンパク質。それによってDNAポリメラーゼをPEgRNAに共局在させる)の使用による。プライマー結合部位は、一般的には、所望の編集を包含するもたらされる3'一本鎖DNAフラップをコードするためのDNAポリメラーゼ(例えば、逆転写酵素)によって用いられる鋳型の一部を形成しないということもまた注意される。それゆえに、「DNA合成鋳型」という指定は、編集とプライム編集DNA合成の3’一本鎖DNA鎖産物によって置き換えられる5’の内生一本鎖DNAフラップに対する相同領域とを含有する所望の3'一本鎖DNAフラップをコードするための、DNAポリメラーゼによって鋳型として用いられる伸長アーム(3)の領域または部分を言う。いくつかの態様では、DNA合成鋳型は「編集鋳型」および「相同アーム」または1つ以上の相同アームを例えば編集鋳型の前および後に包含する。編集鋳型は1ヌクレオチド置換ほども小さくあり得るか、またはそれはDNAの挿入もしくは逆位であり得る。加えて、編集鋳型は欠失をもまた包含し得、これは所望の欠失を含有する相同アームをコードすることによって操作され得る。他の態様において、DNA合成鋳型はe2領域またはその部分をもまた包含し得る。例えば、e2領域がDNAポリメラーゼ活性の終結を引き起こす二次構造を含む場合には、e2領域のいずれかの部分が実際にDNA上にコードされる前に、DNAポリメラーゼ機能が終結するであろうということが可能である。e2領域のいくつかまたはさらには全てがDNA上にコードされるであろうということもまた可能である。e2のどれくらい多くが実際に鋳型として用いられるのかは、その構成とその構成がDNAポリメラーゼ機能を分断するかどうかとに依存するであろう。The embodiment of FIG. 3E provides another PEgRNA structure contemplated in the present application. The PEgRNA comprises three main component elements ordered in the 5' to 3' direction: a spacer, a gRNA core, and an extension arm at the 3' end. The extension arm can be further divided into the following structural elements in the 5' to 3' direction: a primer binding site (A), an editing template (B), and a homology arm (C). In addition, the PEgRNA can comprise an optional 3' end modification region (e1) and an optional 5' end modification region (e2). Furthermore, the PEgRNA can comprise a transcription termination signal at the 3' end of the PEgRNA (not shown). These structural elements are further defined in the present application. The illustration of the structure of the PEgRNA is not meant to be limiting and encompasses variations in the placement of the elements. For example, the optional sequence modifications (e1) and (e2) can be located within or between any of the other regions shown. It is not limited to being located at the 3' and 5' ends. In some embodiments, the PEgRNA may include secondary RNA structures, such as, but not limited to, hairpins, stem loops, toe loops, RNA-binding protein recruitment domains (e.g., the MS2 aptamer, which recruits and binds the MS2cp protein). These secondary structures may be located anywhere on the PEgRNA molecule. For example, such secondary structures may be located within the spacer, gRNA core, or extension arms, particularly within the e1 and/or e2 modified regions. In addition to the secondary RNA structures, the PEgRNA may include a chemical linker or poly(N) linker or tail (e.g., within the e1 and/or e2 modified regions), where "N" can be any nucleobase. In some embodiments (e.g., as shown in Figure 72(c)), the chemical linker may function to prevent reverse transcription of the sgRNA backbone or core. Additionally, in certain embodiments (see, e.g., Figure 72(c)), the extension arm (3) may be comprised of RNA or DNA, and/or may include one or more nucleobase analogs (e.g., which may add functionality such as temperature resilience). It is further noted that the orientation of the extension arm (3) may be in the natural 5' to 3' direction, or may be synthesized in the opposite direction, 3' to 5' (relative to the orientation of the overall PEgRNA molecule). It is also noted that the skilled artisan will be able to select the appropriate DNA polymerase for use in prime editing, depending on the nature of the nucleic acid material of the extension arm (i.e. DNA or RNA). This can be implemented either as a fusion with napDNAbp, or provided in trans as a separate part, to synthesize a 3' single-stranded DNA flap encoded by the desired template that encompasses the desired edit. For example, if the extension arm is RNA, the DNA polymerase can be a reverse transcriptase or any other suitable RNA-dependent DNA polymerase. However, if the extension arm is DNA, the DNA polymerase can be a DNA-dependent DNA polymerase. In various embodiments, provision of the DNA polymerase can be in trans, such as by use of an RNA-protein recruitment domain (e.g., an MS2 hairpin incorporated onto the PEgRNA (e.g., in the e1 or e2 region or elsewhere) and an MS2cp protein fused to the DNA polymerase, thereby co-localizing the DNA polymerase to the PEgRNA). It is also noted that the primer binding site generally does not form part of the template used by the DNA polymerase (e.g., reverse transcriptase) to encode the resulting 3' single-stranded DNA flap that contains the desired edit. Thus, the designation "DNA synthesis template" refers to the region or portion of the extension arm (3) that is used as a template by the DNA polymerase to encode the desired 3' single-stranded DNA flap that contains the edit and a region of homology to the 5' endogenous single-stranded DNA flap that is replaced by the 3' single-stranded DNA product of the primed edited DNA synthesis. In some embodiments, the DNA synthesis template includes an "editing template" and a "homologous arm" or one or more homologous arms, for example, before and after the editing template. The editing template can be as small as a single nucleotide substitution, or it can be an insertion or inversion of DNA. In addition, the editing template can also include deletions, which can be engineered by encoding a homology arm containing the desired deletion. In other embodiments, the DNA synthesis template can also include the e2 region or a portion thereof. For example, if the e2 region contains a secondary structure that causes termination of DNA polymerase activity, it is possible that DNA polymerase function will terminate before any part of the e2 region is actually coded on the DNA. It is also possible that some or even all of the e2 region will be coded on the DNA. How much of e2 is actually used as a template will depend on its configuration and whether it disrupts DNA polymerase function.

図3Fの模式図は、二本鎖DNAの標的部位との典型的なPEgRNAの相互作用と、目当ての遺伝子変化を含有する3'一本鎖DNAフラップの付随的生成とを図示する。二本鎖DNAは3'から5'の向きの上側鎖(すなわち、標的鎖)と5'から3'方向の下方の鎖(すなわち、PAM鎖または非標的鎖)とによって示されている。上側の鎖は「プロトスペーサー」の相補体およびPAM配列の相補体を含み、「標的鎖」と言われる。なぜなら、それは、PEgRNAのスペーサーによる標的であるかつそれにアニールする鎖であるからである。それはPAM配列(例えばNGG)およびプロトスペーサーを含有するので、相補的な下方の鎖は、「非標的鎖」または「PAM鎖」または「プロトスペーサー鎖」と言われる。示されてはいないが、図示されているPEgRNAはプライム編集因子融合タンパク質のCas9または同等のドメインと複合体化するであろう。模式図に示されているとおり、PEgRNAのスペーサーは標的鎖上のプロトスペーサーの相補領域にアニールする。この相互作用はスペーサーRNAとプロトスペーサーDNAの相補体との間のDNA/RNAハイブリッドを形成し、プロトスペーサー上のRループの形成を誘導する。本願の他所において教示されるとおり、Cas9タンパク質(示されていない)は、それから、示されているとおり非標的鎖上にニックを誘導する。これは、それから、ニック部位の直ちに上流において3'ssDNAフラップ領域の形成に至り、これは、*z*に従ってプライマー結合部位においてPEgRNAの3'端と相互作用する。ssDNAフラップの3'端(すなわち、逆転写酵素プライマー配列)はPEgRNA上のプライマー結合部位(A)にアニーリングし、それによって逆転写酵素をプライムする。次に、逆転写酵素(例えば、トランスで提供されるか、またはCas9構築物に取り付けられた融合タンパク質としてシスで提供される)は、それから、DNA合成鋳型(編集鋳型(B)および相同アーム(C)を包含する)によってコードされるDNAの一本鎖を重合する。重合は伸長アームの5'端の方へ連続する。ssDNAの重合した鎖はssDNA 3'端フラップを形成し、これは他所に記載するとおり(例えば、図1Gに示されているとおり)内生DNAに侵入し、対応する内生鎖を押し除け(これは内生DNAの5'端のDNAフラップとして除去される)、所望のヌクレオチド編集(1ヌクレオチド塩基対変化、欠失、挿入(遺伝子丸ごとを包含する)を天然に存在するDNA修復/複製ラウンドによって組み入れる。The schematic in FIG. 3F illustrates a typical PEgRNA interaction with a target site in double-stranded DNA and the concomitant generation of a 3′ single-stranded DNA flap containing the desired genetic alteration. The double-stranded DNA is shown with an upper strand in a 3′ to 5′ orientation (i.e., the target strand) and a lower strand in a 5′ to 3′ orientation (i.e., the PAM strand or non-target strand). The upper strand contains the complement of the “protospacer” and the complement of the PAM sequence and is referred to as the “target strand” because it is the strand that is targeted by and anneals to the spacer of the PEgRNA. The complementary lower strand is referred to as the “non-target strand” or “PAM strand” or “protospacer strand” because it contains the PAM sequence (e.g., NGG) and the protospacer. Although not shown, the depicted PEgRNA would be complexed with Cas9 or an equivalent domain of a prime editor fusion protein. As shown in the schematic, the spacer of the PEgRNA anneals to the complementary region of the protospacer on the target strand. This interaction forms a DNA/RNA hybrid between the spacer RNA and the complement of the protospacer DNA, inducing the formation of an R-loop on the protospacer. As taught elsewhere in this application, the Cas9 protein (not shown) then induces a nick on the non-target strand as shown. This then leads to the formation of a 3' ssDNA flap region immediately upstream of the nick site, which interacts with the 3' end of the PEgRNA at the primer binding site according to *z*. The 3' end of the ssDNA flap (i.e., the reverse transcriptase primer sequence) anneals to the primer binding site (A) on the PEgRNA, thereby priming the reverse transcriptase. Next, the reverse transcriptase (e.g., provided in trans or provided in cis as a fusion protein attached to the Cas9 construct) then polymerizes a single strand of DNA encoded by the DNA synthesis template (comprising the editing template (B) and the homology arm (C)). Polymerization continues toward the 5' end of the extension arm. The polymerized strand of ssDNA forms a ssDNA 3' end flap that invades the endogenous DNA as described elsewhere (e.g., as shown in FIG. 1G), displacing the corresponding endogenous strand (which is removed as a DNA flap at the 5' end of the endogenous DNA) and incorporating the desired nucleotide edit (single nucleotide base pair change, deletion, insertion (including entire genes) by a naturally occurring round of DNA repair/replication.

図3Gは、本願において企図されるプライム編集のさらに別の態様を図示する。特に、上側の模式図はプライム編集因子(PE)の1つの態様を図示する。これはnapDNAbp(例えば、SpCas9)およびポリメラーゼ(例えば、逆転写酵素)の融合タンパク質を含み、これらはリンカーによって連結されている。PEは、PEgRNAのgRNAコアに結合することによってPEgRNAとの複合体を形成する。示されている態様では、PEgRNAは3'伸長アームを備え、これは、3'端に始まって、プライマー結合部位(PBS)、次にDNA合成鋳型を含む。下側の模式図は、「トランスプライム編集因子(tPE)」と言われるプライム編集因子のバリアントを図示する。この態様では、DNA合成鋳型およびPBSはPEgRNAからデカップリングされ、トランスプライム編集因子RNA鋳型(「tPERT」)と言われる別個の分子によって提示される。これはRNA-タンパク質動員ドメイン(例えば、MS2ヘアピン)を含む。PEそれ自体は、rPERT動員タンパク質(「RP」)への融合体を含むようにさらに改変される。これはRNA-タンパク質動員ドメインを特異的に認識および結合するタンパク質である。RNA-タンパク質動員ドメインがMS2ヘアピンである例では、対応するrPERT動員タンパク質はMS2タグ付けシステムのMS2cpであり得る。MS2タグ付けシステムは、ファージのゲノム上に存在するステムループまたはヘアピン構造、すなわち「MS2ヘアピン」または「MS2アプタマー」とのMS2バクテリオファージコートタンパク質(「MCP」または「MS2cp」)の天然の相互作用に基づく。トランスプライム編集のケースでは、RP-PE:gRNA複合体は、PE:gRNA複合体と共局在するように適当なRNA-タンパク質動員ドメインを有するtPERTを「動員」し、それによって、図3Hに図示されている例に示されているとおりプライム編集への使用のためのPBSおよびDNA合成鋳型をトランスで提供する。FIG. 3G illustrates yet another embodiment of the prime editing contemplated in the present application. In particular, the upper schematic illustrates one embodiment of a prime editor (PE), which includes a fusion protein of napDNAbp (e.g., SpCas9) and a polymerase (e.g., reverse transcriptase), which are linked by a linker. PE forms a complex with the PEgRNA by binding to the gRNA core of the PEgRNA. In the embodiment shown, the PEgRNA is equipped with a 3' extension arm, which, starting at the 3' end, includes a primer binding site (PBS) and then a DNA synthesis template. The lower schematic illustrates a variant of the prime editor, referred to as "trans-prime editor (tPE)". In this embodiment, the DNA synthesis template and the PBS are decoupled from the PEgRNA and presented by a separate molecule, referred to as the trans-prime editor RNA template ("tPERT"). It includes an RNA-protein recruitment domain (e.g., an MS2 hairpin). PE itself is further modified to include a fusion to the rPERT recruitment protein ("RP"). This is a protein that specifically recognizes and binds the RNA-protein recruitment domain. In an example where the RNA-protein recruitment domain is an MS2 hairpin, the corresponding rPERT recruitment protein can be MS2cp of the MS2 tagging system. The MS2 tagging system is based on the natural interaction of the MS2 bacteriophage coat protein ("MCP" or "MS2cp") with a stem-loop or hairpin structure present on the genome of the phage, i.e., the "MS2 hairpin" or "MS2 aptamer". In the case of trans prime editing, the RP-PE:gRNA complex "recruits" tPERT with the appropriate RNA-protein recruitment domain to co-localize with the PE:gRNA complex, thereby providing PBS and DNA synthesis template in trans for use in prime editing as shown in the example illustrated in Figure 3H.

図3Hはトランスプライム編集のプロセスを図示する。この態様では、トランスプライム編集因子は、MS2cpタンパク質(すなわち、MS2アプタマーを認識および結合する型の動員タンパク質)に融合されているかつsgRNA(すなわち、PEgRNAと対比して標準ガイドRNA)と複合体化されている「PE2」プライム編集因子(すなわち、Cas9(H840A)およびバリアントMMLV RTの融合体)を含む。トランスプライム編集因子は標的DNAに結合し、非標的鎖へニックを入れる。MS2cpタンパク質はtPERT分子上のRNA-タンパク質動員ドメインとの特異的相互作用によってトランスでtPERTを動員する。tPERTはトランスプライム編集因子と共局在するようになり、それによって、逆転写酵素ポリメラーゼによる使用のためのPBSおよびDNA合成鋳型機能をトランスで提供して、3'端を有するかつDNA合成鋳型によってコードされる所望の遺伝子情報を含有する一本鎖DNAフラップを合成する。FIG. 3H illustrates the process of trans-prime editing. In this embodiment, the trans-prime editor comprises a "PE2" prime editor (i.e., a fusion of Cas9(H840A) and variant MMLV RT) that is fused to an MS2cp protein (i.e., a type of recruitment protein that recognizes and binds the MS2 aptamer) and complexed with an sgRNA (i.e., a standard guide RNA as opposed to a PEgRNA). The trans-prime editor binds to the target DNA and nicks the non-target strand. The MS2cp protein recruits tPERT in trans by specific interaction with the RNA-protein recruitment domain on the tPERT molecule. tPERT becomes co-localized with the trans-prime editor, thereby providing the PBS and DNA synthesis template functions in trans for use by the reverse transcriptase polymerase to synthesize a single-stranded DNA flap with a 3' end and containing the desired genetic information encoded by the DNA synthesis template.

図4A~4Eは、in vitroでのTPRTアッセイ(すなわち、プライム編集アッセイ)を実証する。図4Aは、蛍光標識DNA基質、RT酵素によるgRNA鋳型の伸長、PAGEの概略図である。Figures 4A-4E demonstrate the TPRT assay (i.e., prime editing assay) in vitro. Figure 4A is a schematic of the fluorescently labeled DNA substrate, extension of the gRNA template by the RT enzyme, and PAGE. 図4Bは、予めニックが入った(pre-nicked)基質、dCas9、および異なる合成鋳型長の5'伸長gRNAでのTPRT(すなわち、プライム編集)を示す。図4Cは、Cas9不在下の、予めニックが入ったDNA基質とのRT反応を示す。Figure 4B shows TPRT (i.e., prime editing) with pre-nicked substrates, dCas9, and 5'-extended gRNAs of different synthetic template lengths. Figure 4C shows the RT reaction with pre-nicked DNA substrates in the absence of Cas9. 図4Dは、Cas9(H840A)および5'伸長gRNAとの、全長dsDNA基質に対するTPRT(すなわち、プライム編集)を示す。図4Eは、予めニックが入った全長dsDNA基質との3'伸長gRNA鋳型を示す。すべての反応にはM-MLV RTが存在する。Figure 4D shows TPRT (i.e., prime editing) on a full-length dsDNA substrate with Cas9(H840A) and a 5'-extended gRNA. Figure 4E shows a 3'-extended gRNA template with a pre-nicked full-length dsDNA substrate. M-MLV RT is present in all reactions.

図5は、合成鋳型長を変動させた5'伸長gRNAを使用する、in vitroでの検証結果(validations)を示す。蛍光標識(Cy5)DNA標的を基質として使用し、この実験一式において予めニックを入れた。これらの実験において使用されたCas9は触媒不活性型Cas9(dCas9)であり、使用されたRTは、モロニーマウス白血病ウイルス(M-MLV)に由来する商用RTであるSuperscript IIIである。dCas9:gRNA複合体を、精製された構成要素から形成した。次いで、蛍光標識DNA基質をdNTPsおよびRT酵素とともに加えた。37℃での1時間のインキュベーション後、反応産物を変性尿素ポリアクリルアミドゲル電気泳動(PAGE)によって分析した。ゲル画像は、元のDNA鎖~逆転写鋳型長と一致する長さの伸長を示す。Figure 5 shows in vitro validations using 5' extended gRNAs with varying synthetic template length. Fluorescently labeled (Cy5) DNA targets were used as substrates and were pre-nicked in this set of experiments. The Cas9 used in these experiments was catalytically inactive Cas9 (dCas9) and the RT used was Superscript III, a commercial RT derived from Moloney Murine Leukemia Virus (M-MLV). dCas9:gRNA complexes were formed from purified components. Fluorescently labeled DNA substrates were then added along with dNTPs and RT enzyme. After 1 hour of incubation at 37°C, reaction products were analyzed by denaturing urea polyacrylamide gel electrophoresis (PAGE). The gel images show an extension of length consistent with the original DNA strand to the reverse transcription template length.

図6は、合成鋳型長を変動させた5'伸長gRNAを使用する、in vitroでの検証結果を示すが、これは図5に示されるものと酷似している。しかしながら、DNA基質は、この実験一式においてニックは予め入っていない。これらの実験に使用されたCas9はCas9ニッカーゼ(SpyCas9 H840A突然変異体)であり、使用されたRTは、モロニーマウス白血病ウイルス(M-MLV)に由来する商用RTであるSuperscript IIIである。反応産物を変性尿素ポリアクリルアミドゲル電気泳動(PAGE)によって分析した。ゲルに示されるとおり、ニッカーゼは、標準gRNAが使用されたとき、DNA鎖を効率的に切断する(gRNA_0、レーン3)。Figure 6 shows in vitro validation results using 5'-extended gRNAs with varying synthetic template lengths, very similar to those shown in Figure 5. However, the DNA substrate was not pre-nicked in this set of experiments. The Cas9 used in these experiments was Cas9 nickase (SpyCas9 H840A mutant) and the RT used was Superscript III, a commercial RT derived from Moloney Murine Leukemia Virus (M-MLV). The reaction products were analyzed by denaturing urea polyacrylamide gel electrophoresis (PAGE). As shown in the gel, the nickase efficiently cleaves the DNA strand when a standard gRNA is used (gRNA_0, lane 3).

図7は、3'伸長がDNA合成を裏付け有意にCas9ニッカーゼ活性を生じさせないことを実証する。予めニックが入った基質(黒色矢印)は、dCas9またはCas9ニッカーゼのいずれかが使用されたとき、ほぼ定量的にRT産物へ変換される(レーン4および5)。50%超のRT産物への変換(赤色矢印)が全長基質で観察される(レーン3)。Cas9ニッカーゼ(SpyCas9 H840A突然変異体)、触媒不活性型Cas9(dCas9)、およびSuperscript III(モロニーマウス白血病ウイルス(M-MLV)に由来する商用RT)を使用する。Figure 7 demonstrates that 3' extension supports DNA synthesis and does not result in significant Cas9 nickase activity. Pre-nicked substrates (black arrows) are nearly quantitatively converted to RT products when either dCas9 or Cas9 nickase are used (lanes 4 and 5). More than 50% conversion to RT products (red arrows) is observed for the full-length substrate (lane 3). Cas9 nickase (SpyCas9 H840A mutant), catalytically inactive Cas9 (dCas9), and Superscript III, a commercial RT derived from Moloney Murine Leukemia Virus (M-MLV), are used.

図8は、RT反応が優先してgRNAにcisで生じる(同じ複合体中で結合される)かを決定するために使用された二色(dual color)実験を実証する。2つ別々の実験を5'伸長gRNAおよび3'伸長gRNAについて行った。産物をPAGEによって分析した。産物比率は(Cy3cis/Cy3trans)/(Cy5trans/Cy5cis)として算出した。Figure 8 demonstrates a dual color experiment that was used to determine if the RT reaction occurs preferentially in cis to the gRNA (bound in the same complex). Two separate experiments were performed for the 5'- and 3'-extended gRNAs. Products were analyzed by PAGE. Product ratios were calculated as (Cy3cis/Cy3trans)/(Cy5trans/Cy5cis).

図9A~9Dは、フラップモデル基質を実証する。図9Aは、フラップ特異的(-directed)変異誘発のための二重FPレポーターを示す。図9Bは、HEK細胞中の停止コドン修復を示す。Figures 9A-9D demonstrate the flap model substrate. Figure 9A shows a dual FP reporter for flap-directed mutagenesis. Figure 9B shows stop codon repair in HEK cells. 図9Cは、フラップ修復後に配列決定された(sequenced)酵母クローンを示す。図9Dは、ヒト細胞中の異なるフラップ特色の試験を示す。Figure 9C shows yeast clones that were sequenced after flap repair, and Figure 9D shows the examination of different flap traits in human cells.

図10は、プラスミド基質上のプライム編集を実証する。二重蛍光レポータープラスミドを酵母(S.cerevisiae)発現のために構築した。酵母中のこの構築物の発現は、GFPのみを産生する。in vitroでのプライム編集反応は点突然変異を誘導し、親プラスミド、またはin vitroでCas9(H840A)によってニックが入れられたプラスミドを酵母中へ形質転換する。コロニーは蛍光画像化によって可視化される。酵母二重FPプラスミド形質転換体が示されている。親プラスミドまたはin vitroでCas9(H840A)にニックが入ったプラスミドを形質展開することは、緑色GFP発現コロニーのみをもたらす。5'伸長gRNAまたは3'伸長gRNAでのプライム編集反応は、緑色および黄色の混合コロニーを産生する。後者はGFPとmCherryとの両方を発現する。より多くの黄色コロニーは3'伸長gRNAで観察される。停止コドンを含有しない陽性対照も示されていない。FIG. 10 demonstrates prime editing on a plasmid substrate. A dual fluorescent reporter plasmid was constructed for yeast (S. cerevisiae) expression. Expression of this construct in yeast produces only GFP. Prime editing reactions in vitro induce point mutations and transform the parental plasmid or a plasmid nicked in vitro with Cas9(H840A) into yeast. Colonies are visualized by fluorescent imaging. Yeast dual FP plasmid transformants are shown. Transforming the parental plasmid or a plasmid nicked in vitro with Cas9(H840A) results in only green GFP-expressing colonies. Prime editing reactions with 5'- or 3'-extended gRNA produce mixed green and yellow colonies. The latter express both GFP and mCherry. More yellow colonies are observed with the 3'-extended gRNA. A positive control containing no stop codon is also not shown.

図11は、図10の実験と同様のプラスミド基質上のプライム編集を示すが、停止コドン中に点突然変異を組み入れる代わりに、プライム編集は、フレームシフト突然変異を修復して下流のmCherryの合成を可能にさせる単一ヌクレオチドの挿入(左)または欠失(右)を組み入れる。両実験ともに3'伸長gRNAsを使用した。Figure 11 shows prime editing on a plasmid substrate similar to the experiment in Figure 10, but instead of incorporating a point mutation in the stop codon, the prime edit incorporates a single nucleotide insertion (left) or deletion (right) that repairs the frameshift mutation and allows synthesis of mCherry downstream. Both experiments used 3' extended gRNAs.

図12は、サンガー(Sanger)配列決定によって特徴付けられる、プラスミド基質上のプライム編集の編集産物を示す。TRT形質転換からのコロニーを個々に選択し、サンガー配列決定によって分析した。正確な編集が選択コロニーを配列決定することによって観察された。緑色コロニーは元のDNA配列をもつプラスミドを含有していたのに対し、黄色コロニーはプライム編集gRNAによってデザインされた正確な突然変異を含有していた。他の点突然変異またはインデルは一切観察されなかった。Figure 12 shows the editing products of prime editing on the plasmid substrate characterized by Sanger sequencing. Colonies from the TRT transformation were individually selected and analyzed by Sanger sequencing. Correct editing was observed by sequencing the selected colonies. The green colonies contained the plasmid with the original DNA sequence, whereas the yellow colonies contained the correct mutations designed by the prime editing gRNA. No other point mutations or indels were observed.

図13は、新しいプライム編集技術の潜在的な範囲を示し、デアミナーゼ媒介塩基編集技術との比較を示す。Figure 13 illustrates the potential scope of the new prime editing technology and provides a comparison with deaminase-mediated base editing technology.

図14は、ヒト細胞における編集の概略図を示す。FIG. 14 shows a schematic of editing in human cells.

図15は、gRNA中のプライマー結合部位の伸長を実証する。FIG. 15 demonstrates the extension of the primer binding site in the gRNA.

図16は、隣接標的化(adjacent targeting)のためにトランケートされたgRNAを示す。FIG. 16 shows gRNAs truncated for adjacent targeting.

図17A~17Cは、ヒト胚腎臓(HEK)細胞における構成要素のトランスフェクション後の標的ヌクレオチドでの%T→A変換を表示するグラフである。図17Aは、野生型MLV逆転写酵素のCas9(H840A)ニッカーゼ(32アミノ酸リンカー)へのN末融合を使用した結果を提示するデータを示す。図17Bは、RT酵素のC末融合を別にすれば図17Aと同様である。図17Cは、図17Aと同様であるが、MLV RTとCas9との間のリンカーが32アミノ酸の代わりに60アミノ酸長である。Figures 17A-17C are graphs displaying % T→A conversion at the target nucleotide following transfection of the constructs in human embryonic kidney (HEK) cells. Figure 17A shows data presenting the results using an N-terminal fusion of wild-type MLV reverse transcriptase to Cas9 (H840A) nickase (32 amino acid linker). Figure 17B is similar to Figure 17A except for the C-terminal fusion of the RT enzyme. Figure 17C is similar to Figure 17A except that the linker between the MLV RT and Cas9 is 60 amino acids long instead of 32 amino acids.

図18は、ハイスループットアンプリコン配列決定によるHEK3部位での高純度T→A編集を示す。配列決定分析の出力は、編集済細胞の最も豊富な遺伝子型を表示する。Figure 18 shows high purity T→A editing at the HEK3 site by high throughput amplicon sequencing. The sequencing analysis output displays the most abundant genotypes in edited cells.

図19は、インデル比率(青色バー)と並んで標的ヌクレオチドでの編集効率(オレンジ色バー)を示す。WTは野生型MLV RT酵素を指す。突然変異酵素(M1~M4)は、右へ列挙された突然変異を含有する。編集比率をゲノムDNAアンプリコンのハイスループット配列決定によって定量化した。Figure 19 shows the editing efficiency (orange bars) at the targeted nucleotide alongside the indel ratio (blue bars). WT refers to the wild-type MLV RT enzyme. Mutant enzymes (M1-M4) contain the mutations listed to the right. Editing ratios were quantified by high-throughput sequencing of genomic DNA amplicons.

図20は、単鎖ニックが標的ヌクレオチドに近接する相補的なDNA鎖中に導入されたときの標的ヌクレオチドの編集効率を示す。標的ヌクレオチドから様々な間隔にてニックを入れるのを試験した(三角形)。標的塩基対(青色バー)での編集効率が、インデル形成比率と並んで示される(オレンジ色バー)。「なし」の例は、相補鎖へニックを入れるガイドRNAを含有しない。編集比率をゲノムDNAアンプリコンのハイスループット配列決定によって定量化した。Figure 20 shows the editing efficiency of a target nucleotide when a single-stranded nick is introduced into the complementary DNA strand adjacent to the target nucleotide. Nicking at various distances from the target nucleotide was tested (triangles). Editing efficiency at the target base pair (blue bar) is shown alongside the indel formation rate (orange bar). The "none" example does not contain a guide RNA that nicks the complementary strand. Editing rates were quantified by high-throughput sequencing of genomic DNA amplicons.

図21は、所望のT→Aトランスバージョン突然変異および他の主なゲノム編集副産物の全般的な非存在を示す、処理されたハイスループット配列決定データを実証する。FIG. 21 demonstrates processed high-throughput sequencing data showing the desired T→A transversion mutations and the general absence of other major genome editing by-products.

図22は、伸長されたガイドRNAと複合体化された核酸プログラム型DNA結合タンパク質(napDNAbp)を使用し、エラーを起こしやすい逆転写酵素で、標的変異誘発(targeted mutagenesis)を標的遺伝子座上に行う(すなわち、エラーを起こしやすいRTでプライム編集する)ための例示のプロセスの概略図を提供する。このプロセスは、標的変異誘発のためのプライム編集の態様と称されることもある。伸長されたガイドRNAは、ガイドRNAの3'末もしくは5'末での、またはガイドRNA中の分子内のある場所での伸長を含む。ステップ(a)において、napDNAbp/gRNA複合体はDNA分子に接触し、gRNAがnapDNAbpを、変異誘発されるべき標的遺伝子座へ結合するようにガイドする。ステップ(b)において、標的遺伝子座のDNAの鎖の一方にニックが導入され(例として、ヌクレアーゼまたは化学剤によって)、これによって標的遺伝子座の鎖の一方に利用可能な3'末が創出される。ある態様において、ニックは、Rループ鎖に対応するDNAの鎖、すなわち、ガイドRNA配列とはハイブリダイズされない鎖中に創出される。ステップ(c)において、3'末DNA鎖は、逆転写をプライムするために、ガイドRNAの伸長部分と相互作用する。ある態様において、3'末のDNA鎖は、ガイドRNAの伸長部分上の特定のRTプライム配列とハイブリダイズする。ステップ(d)において、エラーを起こしやすい逆転写酵素が導入されるが、これは変異誘発されたDNAの単鎖を、プライムされた部位の3'末からガイドRNAの3'末へ合成する。例示の突然変異は星印「*」で示される。これは、所望の変異誘発領域を含む単鎖DNAフラップを形成する。ステップ(e)において、napDNAbpおよびガイドRNAは放出される。ステップ(f)および(g)は、所望の変異誘発領域が標的遺伝子座中へ組み込まれるように、単鎖DNAフラップ(変異誘発領域を含む)の分解に関する。このプロセスは、一旦3'単鎖DNAフラップが侵入して他の鎖上の相補的な配列とハイブリダイズすると、形成された対応の5'内生DNAフラップを除去することによって、所望の産物形成へ推進され得る。プロセスはまた、図1Fに例示されるとおり、第2鎖にニックが入れられた産物の形成へも推進され得る。内生DNA修復および/または複製プロセスに続き、変異誘発領域は、DNA遺伝子座のDNAの両鎖中へ組み込まれるようになる。FIG. 22 provides a schematic diagram of an exemplary process for performing targeted mutagenesis on a target locus with an error-prone reverse transcriptase (i.e., prime editing with error-prone RT) using a nucleic acid programmable DNA binding protein (napDNAbp) complexed with an extended guide RNA. This process may also be referred to as an embodiment of prime editing for targeted mutagenesis. The extended guide RNA includes an extension at the 3' or 5' end of the guide RNA, or at an intramolecular location in the guide RNA. In step (a), the napDNAbp/gRNA complex contacts a DNA molecule, and the gRNA guides the napDNAbp to bind to the target locus to be mutagenized. In step (b), a nick is introduced (e.g., by a nuclease or chemical agent) into one of the strands of the DNA at the target locus, thereby creating an available 3' end on one of the strands of the target locus. In one embodiment, the nick is created in the strand of DNA that corresponds to the R-loop strand, i.e., the strand that is not hybridized to the guide RNA sequence. In step (c), the 3'-end DNA strand interacts with the extension of the guide RNA to prime reverse transcription. In some embodiments, the 3'-end DNA strand hybridizes with a specific RT prime sequence on the extension of the guide RNA. In step (d), an error-prone reverse transcriptase is introduced, which synthesizes a single strand of mutagenized DNA from the 3'-end of the primed site to the 3'-end of the guide RNA. Exemplary mutations are indicated with an asterisk "*". This forms a single-stranded DNA flap containing the desired mutagenized region. In step (e), the napDNAbp and the guide RNA are released. Steps (f) and (g) involve the degradation of the single-stranded DNA flap (containing the mutagenized region) so that the desired mutagenized region is integrated into the target locus. This process can be driven to the desired product formation by removing the corresponding 5' endogenous DNA flap that is formed once the 3'-single-stranded DNA flap has invaded and hybridized with a complementary sequence on the other strand. The process can also be driven to the formation of a second strand nicked product, as illustrated in Figure IF. Following endogenous DNA repair and/or replication processes, the mutagenized region becomes incorporated into both strands of DNA at the DNA locus.

図23は、トリヌクレオチド反復(repeat)配列を縮小するためのgRNAデザインおよびTPRTゲノム編集(すなわち、プライム編集)でのトリヌクレオチド反復の縮小の概略図である。トリヌクレオチド反復拡大は、ハンチントン病、脆弱X症候群、およびフリートライヒ運動失調症を包含する、数多のヒト疾患に関連する。最も一般的なトリヌクレオチド反復はCAGトリプレットを含有するが、GAAトリプレット(フリートライヒ運動失調症)およびCGGトリプレット(脆弱X症候群)もまた生じる。拡大する素因を遺伝するか、または既に拡大された親のアレルを獲得すること(acquiring)は、疾患に罹る(acquiring)可能性を増大させる。トリヌクレオチド反復の病原性の拡大は仮説上、プライム編集を使用して修正され得る。反復領域上流の領域は、RNAにガイドされる(-guided)ヌクレアーゼによってニックが入れられ、次いで、健常な数の反復(これは具体的な遺伝子および疾患に依存する)を含有する新しいDNA鎖の合成をプライムするのに使用され得る。反復配列の後に、反復の他端に隣接する配列の同一性にマッチする、一続きの短い相同(short stretch of homology)が加えられる(赤色鎖)。新しく合成された鎖の侵入、これに続く内生DNAの、新しく合成されたフラップとの置き換えが、縮小された反復アレルへ繋がる。Figure 23 is a schematic diagram of gRNA design for reducing trinucleotide repeat sequences and the reduction of trinucleotide repeats with TPRT genome editing (i.e., prime editing). Trinucleotide repeat expansion is associated with a number of human diseases, including Huntington's disease, fragile X syndrome, and Friedreich's ataxia. The most common trinucleotide repeat contains a CAG triplet, but GAA triplets (Friedreich's ataxia) and CGG triplets (Fragile X syndrome) also occur. Inheriting a predisposition to expansion or acquiring an already expanded parental allele increases the likelihood of acquiring disease. Pathogenic expansion of trinucleotide repeats can hypothetically be corrected using prime editing. The region upstream of the repeat region can be nicked by an RNA-guided nuclease and then used to prime the synthesis of a new DNA strand containing a healthy number of repeats (this depends on the specific gene and disease). The repeat is followed by a short stretch of homology (red strand) that matches the identity of the sequence adjacent to the other end of the repeat. Invasion of the newly synthesized strand and subsequent replacement of the endogenous DNA with the newly synthesized flap leads to a shortened repeat allele.

図24は、プライム編集での正確な10ヌクレオチド欠失を示す概略図である。HEK3遺伝子座が標的にするガイドRNAを、ニック部位の後に10ヌクレオチド欠失をコードする逆転写鋳型でデザインした。トランスフェクトされたHEK細胞における編集効率を、アンプリコン配列決定を使用して査定した。Figure 24 is a schematic diagram showing the precise 10-nucleotide deletion in prime editing. Guide RNAs targeting the HEK3 locus were designed with a reverse transcription template that encodes a 10-nucleotide deletion after the nick site. Editing efficiency in transfected HEK cells was assessed using amplicon sequencing.

図25は、内生ゲノム遺伝子座にて遺伝子をペプチドタグ付けする(peptide tagging)ためのgRNAデザインおよびTPRTゲノム編集(すなわち、プライム編集)でのペプチドタグ付けを示す概略図である。FlAsHおよびReAsHのタグ付け系は、2つの部分:(1)フルオロフォア-二ヒ素(biarsenical)プローブ、および(2)テトラシステインモチーフを含有する、遺伝子学的にコードされたペプチドを含み、配列FLNCCPGCCMEP(配列番号1)によって例示される。細胞内で発現されたとき、テトラシステインモチーフ含有タンパク質は、フルオロフォア-ヒ素プローブで蛍光標識され得る(参考文献:J.Am.Chem.Soc.,2002,124(21),pp6063-6076を参照。DOI:10.1021/ja017687n)。「ソルタグ付け(sortagging)」系は、標識ペプチドプローブを、好適なペプチド基質を含有するタンパク質へ共有結合的に抱合させる細菌ソルターゼ酵素を採用する(参考文献:Nat.Chem.Biol.2007 Nov;3(11):707-8を参照。DOI:10.1038/nchembio.2007.31)。FLAGタグ(DYKDDDDK(配列番号2))、V5タグ(GKPIPNPLLGLDST(配列番号3))、GCN4タグ(EELLSKNYHLENEVARLKK(配列番号4))、HAタグ(YPYDVPDYA(配列番号5))、およびMycタグ(EQKLISEEDL(配列番号6))は一般的に、免疫アッセイのためのエピトープタグとして採用される。パイクランプ(pi-clamp)は、ペンタフルオロ-芳香族基質で標識され得るペプチド配列(FCPF(配列番号622))をコードする(参考文献:Nat.Chem.2016 Feb;8(2):120-8。doi:10.1038/nchem.2413)。Figure 25 is a schematic diagram showing gRNA design for peptide tagging genes at endogenous genomic loci and peptide tagging in TPRT genome editing (i.e., prime editing). The FlAsH and ReAsH tagging systems include two parts: (1) a fluorophore-biarsenical probe, and (2) a genetically encoded peptide containing a tetracysteine motif, exemplified by the sequence FLNCCPGCCMEP (SEQ ID NO: 1). When expressed in cells, tetracysteine motif-containing proteins can be fluorescently labeled with the fluorophore-arsenical probe (see reference: J.Am.Chem.Soc., 2002,124(21),pp6063-6076. DOI:10.1021/ja017687n). The "sortagging" system employs bacterial sortase enzymes to covalently conjugate labeled peptide probes to proteins containing suitable peptide substrates (see reference: Nat. Chem. Biol. 2007 Nov;3(11):707-8. DOI:10.1038/nchembio.2007.31). The FLAG tag (DYKDDDDK (SEQ ID NO:2)), V5 tag (GKPIPNPLLGLDST (SEQ ID NO:3)), GCN4 tag (EELLSKNYHLENEVARLKK (SEQ ID NO:4)), HA tag (YPYDVPDYA (SEQ ID NO:5)), and Myc tag (EQKLISEEDL (SEQ ID NO:6)) are commonly employed as epitope tags for immunoassays. The pi-clamp encodes a peptide sequence (FCPF (SEQ ID NO: 622) ) that can be labeled with a pentafluoro-aromatic substrate (Reference: Nat. Chem. 2016 Feb;8(2):120-8. doi:10.1038/nchem.2413).

図26Aは、ゲノムDNA中へのHis6タグおよびFLAGタグの正確な組み入れを示す。HEK3遺伝子座を標的にするガイドRNAを、18nt Hisタグ挿入または24nt FLAGタグ挿入のいずれかをコードする逆転写鋳型でデザインした。トランスフェクトされたHEK細胞における編集効率を、アンプリコン配列決定を使用して査定した。FLAGタグの全長24nt配列はフレームから見切れている点に留意する(配列決定によって全長の正確な挿入が確認された)。Figure 26A shows the precise incorporation of His 6 and FLAG tags into genomic DNA. Guide RNAs targeting the HEK3 locus were designed with reverse transcription templates encoding either an 18nt His tag insertion or a 24nt FLAG tag insertion. Editing efficiency in transfected HEK cells was assessed using amplicon sequencing. Note that the full 24nt sequence of the FLAG tag is cut off from the frame (sequencing confirmed the full length and precise insertion). 図26Bは、(a)タンパク質を可溶化または不溶化させること、(b)タンパク質の細胞内局在化を変化させるかまたはこれを追跡すること、(c)タンパク質の半減期を延長すること、(d)タンパク質精製を容易にさせること、および(e)タンパク質の検出を容易にさせることを包含する、タンパク質/ペプチドのタグ付けを伴う様々な用途をまとめる概略図を示す。FIG. 26B shows a schematic summarizing various applications involving protein/peptide tagging, including (a) solubilizing or insolubilizing proteins, (b) altering or tracking the subcellular localization of proteins, (c) extending protein half-life, (d) facilitating protein purification, and (e) facilitating protein detection.

図27は、プリオン病を防止またはその進行を停止させる防護性変異をPRNPに組み入れることによるプライム編集の概観を示す。PEgRNA配列は左において配列番号4082(すなわち、sgRNA骨格の5')、右において配列番号4083(すなわち、sgRNA骨格の3')に対応する。Figure 27 shows an overview of prime editing by incorporating protective mutations into PRNP that prevent or halt the progression of prion disease. The PEGRNA sequence corresponds to SEQ ID NO: 4082 on the left (i.e., 5' of the sgRNA backbone) and SEQ ID NO: 4083 on the right (i.e., 3' of the sgRNA backbone).

図28Aは、RNAモチーフをコードする配列のPEに基づく挿入の模式図である。FIG. 28A is a schematic diagram of PE-based insertion of a sequence encoding an RNA motif. 図28Bは、潜在的に挿入され得るいくつかの例のモチーフの列挙(網羅的ではない)、およびそれらの機能である。FIG. 28B is a non-exhaustive list of some example motifs that could potentially be inserted, and their functions.

図29Aはプライム編集因子の図示である。図29BはPEによって導かれるゲノム、プラスミド、またはウイルスDNAへの可能な改変を示す。図29Cは、PEgRNAのライブラリによる規定されたタンパク質(このケースではGFP)上へのペプチドループのライブラリの挿入のための例のスキームを示す。図29Dは、異なるPEgRNAを用いるタンパク質のコドンの可能なプログラム可能な欠失またはNもしくはC末端短縮の例を示す。欠失はフレームシフト変異の最小限の生成でもって生起することが予測されるであろう。Figure 29A is a diagram of a primed editor. Figure 29B shows possible PE-directed modifications to genomic, plasmid, or viral DNA. Figure 29C shows an example scheme for the insertion of a library of peptide loops onto a defined protein (in this case GFP) by a library of PEgRNAs. Figure 29D shows an example of possible programmable deletion of codons or N- or C-terminal truncation of a protein using different PEgRNAs. Deletions would be expected to occur with minimal generation of frameshift mutations.

図30は、PACEなどの連続的進化系におけるコドンの反復的挿入のための可能なスキームを示す。FIG. 30 shows a possible scheme for the recursive insertion of codons in a continuous evolution system such as PACE.

図31は操作されたgRNAの説明である。gRNAコア、標的遺伝子の配列にマッチする~20ntスペーサー、免疫原性のエピトープヌクレオチド配列を有する逆転写鋳型、および標的遺伝子の配列にマッチするプライマー結合部位を示す。Figure 31 is a representation of an engineered gRNA, showing the gRNA core, a ∼20 nt spacer that matches the sequence of the target gene, a reverse transcription template with an immunogenic epitope nucleotide sequence, and a primer binding site that matches the sequence of the target gene.

図32は、公知の免疫原性エピトープを内生または外生のゲノムDNA上に挿入するための手段としてプライム編集を用いることの模式図であり、対応するタンパク質の改変をもたらす。FIG. 32 is a schematic diagram of using prime editing as a means to insert known immunogenic epitopes onto endogenous or exogenous genomic DNA, resulting in the modification of the corresponding protein.

図33は、プライマー結合配列挿入のためのPEgRNAデザインと、オフターゲット編集を決定するためのプライム編集を用いるゲノムDNA上へのプライマー結合挿入とを示す模式図である。この態様では、プライム編集が生細胞、組織、または動物モデル内において行われる。第1のステップとして、適当なPEgRNAがデザインされる。上側の模式図は、この側面に用いられ得る例示のPEgRNAを示す。PEgRNA上のスペーサー(「プロトスペーサー」と標識されている)はゲノム標的の鎖の1つに対して相補的である。PE:PEgRNA複合体(すなわちPE複合体)は一本鎖3'端フラップをニック部位に組み入れし、これは、コードされるプライマー結合配列と、カットされた部位のちょうど下流の領域に対して相補的である相同領域(PEgRNAの相同アームによってコードされる)とを含有する(赤色による)。フラップ侵入およびDNA修復/複製プロセスによって、合成された鎖はDNA上に組み込まれるようになり、それによってプライマー結合部位を組み入れる。このプロセスは、所望のゲノム標的においてのみならず、オフターゲットの様式でPEgRNAと相互作用し得る他のゲノム部位においてもまた生起し得る(すなわち、意図されるゲノム部位ではない他のゲノム部位に対するスペーサー領域の相補性を原因として、PEgRNAはPE複合体を他のオフターゲット部位へとガイドする)。それゆえに、プライマー結合配列は、所望のゲノム標的においてのみならず、ゲノム上の他所のオフターゲットゲノム部位において組み入れられ得る。意図されるゲノム標的部位およびオフターゲットゲノム部位両方のこれらのプライマー結合部位の挿入を検出するためには、ゲノムDNA(PE後)が単離、フラグメント化、およびアダプターヌクレオチドにライゲーションされ得る(赤色で示されている)。次に、アダプターおよび挿入されたプライマー結合配列にアニールするPCRオリゴヌクレオチドによって、PCRが実行されて、プライマー結合部位がPEによって挿入されたオンターゲットおよびオフターゲットゲノムDNA領域を増幅し得る。それから、高スループット配列決定および配列アラインメントが行われて、オンターゲット部位またはオフターゲット部位どちらかにおけるPEによって挿入されたプライマー結合配列の挿入点を同定し得る。Figure 33 is a schematic diagram showing PEgRNA design for primer binding sequence insertion and primer binding insertion onto genomic DNA with prime editing to determine off-target editing. In this embodiment, prime editing is performed in living cells, tissues, or animal models. As a first step, a suitable PEgRNA is designed. The upper schematic shows an exemplary PEgRNA that can be used in this aspect. The spacer on the PEgRNA (labeled "protospacer") is complementary to one of the strands of the genomic target. The PE:PEgRNA complex (i.e., the PE complex) incorporates a single-stranded 3'-end flap at the nick site, which contains the encoded primer binding sequence and a homologous region (encoded by the homologous arm of the PEgRNA) that is complementary to the region just downstream of the cut site (by red). By flap invasion and DNA repair/replication processes, the synthesized strand becomes incorporated onto the DNA, thereby incorporating a primer binding site. This process can occur not only at the desired genomic target, but also at other genomic sites that may interact with the PEgRNA in an off-target manner (i.e., due to the complementarity of the spacer region to other genomic sites that are not the intended genomic site, the PEgRNA guides the PE complex to other off-target sites). Therefore, primer binding sequences can be incorporated not only at the desired genomic target, but also at other off-target genomic sites on the genome. To detect the insertion of these primer binding sites at both the intended genomic target site and the off-target genomic site, the genomic DNA (after PE) can be isolated, fragmented, and ligated to adapter nucleotides (shown in red). Then, PCR can be performed with PCR oligonucleotides that anneal to the adapter and the inserted primer binding sequence to amplify the on-target and off-target genomic DNA regions where the primer binding sites were inserted by PE. High-throughput sequencing and sequence alignment can then be performed to identify the insertion point of the primer binding sequence inserted by PE at either the on-target site or the off-target site.

図34は、PEによる遺伝子の精密な挿入を示す模式図である。FIG. 34 is a schematic diagram showing precise insertion of genes by PE.

図35Aは、天然のインスリンシグナル経路を示す模式図である。図35Bは、FK1012によってコントロールされるFKBP12タグ付けされたインスリン受容体活性化を示す模式図である。Figure 35A is a schematic showing the native insulin signaling pathway and Figure 35B is a schematic showing FKBP12-tagged insulin receptor activation controlled by FK1012.

図36は、低分子モノマーを示す。参照:バンプFK506ミミック(2)107Figure 36 shows a small molecule monomer. Reference: Bump FK506 mimic (2) 107 .

図37A~37Bは、低分子二量体を示す。参照:FK1012 495,96;FK1012 5108;FK1012 6107;AP1903 7107;シクロスポリンA二量体898;FK506-シクロスポリンA二量体(FkCsA)9100Figures 37A-37B show small molecule dimers. References: FK1012 4 95,96 ; FK1012 5 108 ; FK1012 6 107 ; AP1903 7 107 ; Cyclosporin A dimer 8 98 ; FK506-Cyclosporin A dimer (FkCsA) 9 100 .

図38A~38Fは、プライム編集、ならびにin vitroおよび酵母細胞における実現可能性研究の概観を提供する。図38Aは、ClinVar(2019年7月アクセス)の75,122の公知の病原性のヒト遺伝子バリアントを示し、型によって分類されている。図38Bは、プライム編集複合体が、操作された逆転写酵素ドメインに融合されたRNAによってガイドされるDNAニッキングドメイン、例えばCas9ニッカーゼを含有するかつプライム編集ガイドRNA(PEgRNA)と複合体化したプライム編集因子(PE)タンパク質からなるということを示す。PE:PEgRNA複合体は標的DNA部位に結合し、標的部位のプロトスペーサー隣接モチーフ(PAM)の前および後の広い範囲のDNA位置における大きい種々の精密なDNA編集を可能化する。図38Cは、DNA標的結合によって、PE:PEgRNA複合体がPAM含有DNA鎖へニックを入れるということを示す。もたらされる遊離の3'端はPEgRNAのプライマー結合部位にハイブリダイズする。逆転写酵素ドメインはPEgRNAのRT鋳型を用いるプライマー伸長を触媒し、所望の編集を含有する新たに合成されたDNA鎖(3'フラップ)をもたらす。編集された3'フラップと元々のDNAを含有する編集されない5'フラップとの間の平衡化、次に細胞性の5'フラップ切断およびライゲーション、ならびにヘテロ二重鎖DNAを分解するためのDNA修復または複製が、安定に編集されたDNAをもたらす。図38Dは、5'Cy5標識されたPAM鎖を含有する予めニックが入ったdsDNA基質、dCas9、および市販のM-MLV RTバリアント(RT、Superscript III)による、in vitroの5'伸長されたPEgRNAプライマー伸長アッセイを示す。dCas9が様々な長さのRT鋳型を含有するPEgRNAと複合体化させられ、それから、指示されている構成要素と併せてDNA基質に追加された。反応は37℃で1時間に渡ってインキュベートされ、それから変性尿素PAGEによって分析され、Cy5蛍光について視覚化された。図38Eは、dCas9またはCas9 H840Aニッカーゼと予め複合体化した3'伸長されたPEgRNAおよび予めニックが入ったまたはニッキングされていない5'Cy5標識dsDNA基質を用いて、図38Dのとおり行われたプライマー伸長を示す。図38Fは、PEgRNA、Cas9ニッカーゼ、およびRTによってin vitroで編集されたGFP-mCherry融合レポータープラスミドによって形質転換された酵母コロニーを示す。GFPおよびmCherryの間にナンセンスまたはフレームシフト変異を含有するプラスミドが、トランスバージョン変異、1bp挿入、または1bp欠失によってmCherry翻訳を復元する5'伸長または3'伸長されたPEgRNAによって編集された。GFPおよびmCherry二重陽性の細胞は(黄色)首尾良い編集を反映する。Figures 38A-38F provide an overview of prime editing and feasibility studies in vitro and in yeast cells. Figure 38A shows 75,122 known pathogenic human genetic variants in ClinVar (accessed July 2019), categorized by type. Figure 38B shows that the prime editing complex consists of a prime editor (PE) protein containing an RNA-guided DNA nicking domain, e.g., Cas9 nickase, fused to an engineered reverse transcriptase domain and complexed with a prime editing guide RNA (PEgRNA). The PE:PEgRNA complex binds to the target DNA site, enabling a large variety of precise DNA editing at a wide range of DNA positions before and after the protospacer adjacent motif (PAM) of the target site. Figure 38C shows that upon DNA target binding, the PE:PEgRNA complex nicks the PAM-containing DNA strand. The resulting free 3' end hybridizes to the primer binding site of the PEgRNA. The reverse transcriptase domain catalyzes primer extension with the RT template of the PEgRNA, resulting in a newly synthesized DNA strand (3' flap) containing the desired edit. Equilibration between the edited 3' flap and the unedited 5' flap containing the original DNA, followed by cellular 5' flap cleavage and ligation, and DNA repair or replication to resolve the heteroduplex DNA, results in a stably edited DNA. Figure 38D shows an in vitro 5' extended PEgRNA primer extension assay with pre-nicked dsDNA substrates containing a 5' Cy5-labeled PAM strand, dCas9, and a commercially available M-MLV RT variant (RT, Superscript III). dCas9 was complexed with PEgRNA containing RT templates of various lengths and then added to the DNA substrate along with the indicated components. The reactions were incubated at 37°C for 1 hour and then analyzed by denaturing urea PAGE and visualized for Cy5 fluorescence. Figure 38E shows primer extension performed as in Figure 38D using 3'-extended PEgRNA precomplexed with dCas9 or Cas9 H840A nickase and 5' Cy5-labeled dsDNA substrates pre-nicked or unnicked. Figure 38F shows yeast colonies transformed with GFP-mCherry fusion reporter plasmids edited in vitro by PEgRNA, Cas9 nickase, and RT. Plasmids containing nonsense or frameshift mutations between GFP and mCherry were edited with 5'- or 3'-extended PEgRNA that restored mCherry translation by transversion mutation, 1 bp insertion, or 1 bp deletion. GFP and mCherry double positive cells (yellow) reflect successful editing.

図39A~39DはPE1およびPE2によるヒト細胞のゲノムDNAのプライム編集を示す。図39Aは、PEgRNAが、スペーサー配列、sgRNA骨格、ならびにプライマー結合部位(緑色)および編集される塩基(単数または複数)(赤色)を含有する逆転写(RT)鋳型(紫色)を含有する3'伸長を含有するということを示す。プライマー結合部位はニッキングの部位の直ちに上流のPAM含有DNA鎖にハイブリダイズする。コードされる編集を例外として、RT鋳型はニックの下流のDNA配列に対して相同的である。図39Bは、野生型M-MLV逆転写酵素に融合されたCas9 H840Aニッカーゼ(PE1)と様々なプライマー結合部位長さのPEgRNAとを用いるHEK293T細胞のHEK3部位におけるT・AからA・Tのトランスバージョン編集の組み入れを示す。図39Cは、PE2への操作された五重変異体M-MLV逆転写酵素(D200N,L603W,T306K,W313F,T330P)の使用が、HEK293T細胞の5つのゲノム部位におけるプライム編集トランスバージョン効率とHEK3における小さい挿入および小さい欠失編集とを実質的に改善するということを示す。図39Dは、HEK293T細胞の5つのゲノム部位における様々なRT鋳型長さによるPE2編集効率の比較である。値およびエラーバーは3つの独立した生物学的レプリケートの平均およびs.d.を反映する。Figures 39A-39D show primed editing of genomic DNA in human cells with PE1 and PE2. Figure 39A shows that the PEgRNA contains a spacer sequence, sgRNA backbone, and a 3' extension containing a primer binding site (green) and a reverse transcription (RT) template (purple) containing the base(s) to be edited (red). The primer binding site hybridizes to the PAM-containing DNA strand immediately upstream of the site of nicking. With the exception of the encoded edit, the RT template is homologous to the DNA sequence downstream of the nick. Figure 39B shows incorporation of a T.A to A.T transversion edit at the HEK3 site in HEK293T cells using Cas9 H840A nickase (PE1) fused to wild-type M-MLV reverse transcriptase and PEgRNA of various primer binding site lengths. Figure 39C shows that the use of engineered quintuple mutant M-MLV reverse transcriptase (D200N, L603W, T306K, W313F, T330P) in PE2 substantially improves prime editing transversion efficiency at five genomic sites in HEK293T cells and small insertion and small deletion editing in HEK3. Figure 39D is a comparison of PE2 editing efficiency with various RT template lengths at five genomic sites in HEK293T cells. Values and error bars reflect the mean and s.d. of three independent biological replicates.

図40A~40Cは、PE3およびPE3bシステムが非編集鎖へニックを入れてプライム編集効率を増大させるということを示す。図40AはPE3によるプライム編集の概観である。編集された鎖の当初の合成後に、DNA修復が、編集を含有する新たに合成された鎖(3'フラップ切除)または元々のゲノムDNA鎖(5'フラップ切除)どちらかを除去するであろう。5'フラップ切除は、1つの編集された鎖および1つの非編集鎖を含有するDNAヘテロ二重鎖を後に残す。ミスマッチ修復機構またはDNA複製がヘテロ二重鎖を分解して、編集されたまたは非編集の産物どちらかを与え得る。非編集鎖へニックを入れることは、その鎖の修復を好み、所望の編集を含有する安定な二重鎖DNAの選好的生成をもたらす。図40Bは、PE3によって媒介されるプライム編集効率およびインデル形成に対する相補鎖ニッキングの効果を示す。「なし」は相補鎖にニッキングしないPE2対照を言う。図40Cは、PE2(相補鎖ニックなし)、PE3(一般的な相補鎖ニック)、およびPE3b(編集特異的な相補鎖ニック)による編集効率の比較である。全ての編集収量は、ソーティングなしの全ての処置された細胞のうち、意図される編集を含有するかつインデルを含有しない配列決定総読取のパーセンテージを反映する。値およびエラーバーは3つの独立した生物学的レプリケートの平均およびs.d.を反映する。Figures 40A-40C show that the PE3 and PE3b systems increase prime editing efficiency by nicking the non-edited strand. Figure 40A is an overview of prime editing with PE3. After the initial synthesis of the edited strand, DNA repair will remove either the newly synthesized strand containing the edit (3' flap excision) or the original genomic DNA strand (5' flap excision). 5' flap excision leaves behind a DNA heteroduplex containing one edited strand and one non-edited strand. Mismatch repair mechanisms or DNA replication can degrade the heteroduplex to give either an edited or non-edited product. Nicking the non-edited strand favors repair of that strand, resulting in preferential generation of stable duplex DNA containing the desired edit. Figure 40B shows the effect of complementary strand nicking on prime editing efficiency and indel formation mediated by PE3. "None" refers to the PE2 control, which does not nick the complementary strand. Figure 40C is a comparison of editing efficiency by PE2 (no complementary nick), PE3 (general complementary nick), and PE3b (editing-specific complementary nick). All editing yields reflect the percentage of total sequencing reads that contain the intended edit and no indels among all treated cells without sorting. Values and error bars reflect the mean and s.d. of three independent biological replicates.

図41A~41Kは、HEK293T細胞の7つの内生ヒトゲノム座位におけるPE3による標的化された挿入、欠失、および全ての12の型の点変異を示す。図41Aは、10nt RT鋳型を用いるHEK3部位の位置+1から+8(PEgRNAによって誘導されるニックの位置付けを位置+1および-1の間としてカウントする)の全ての12の型の1ヌクレオチドトランジションおよびトランスバージョン編集を示すグラフである。図41Bは、34nt RT鋳型を用いるHEK3部位におけるロングレンジPE3トランスバージョン編集を示すグラフである。図41C-41Hは、プライム編集窓上の種々の位置における全ての12の型のトランジションおよびトランスバージョン編集を、(図41C)RNF2、(図41D)FANCF、(図41E)EMX1、(図41F)RUNX1、(図41G)VEGFA、および(図41H)DNMT1について示すグラフである。図41Iは、7つの内生ゲノム座位におけるPE3による標的化された1および3bp挿入ならびに1および3bp欠失を示すグラフである。図41Jは、HEK3標的部位における5から80bpの標的化された精密な欠失を示すグラフである。図41Kは、挿入および欠失、挿入および点変異、欠失および点変異、ならびに二重点変異の組み合わせ編集を、3つの内生ゲノム座位において示すグラフである。全ての編集収量は、ソーティングなしの全ての処置された細胞のうち、意図される編集を含有するかつインデルを含有しない配列決定総読取のパーセンテージを反映する。値およびエラーバーは3つの独立した生物学的レプリケートの平均およびs.d.を反映する。Figures 41A-41K show PE3 targeted insertions, deletions, and all 12 types of point mutations at seven endogenous human genomic loci in HEK293T cells. Figure 41A is a graph showing all 12 types of single nucleotide transition and transversion editing at positions +1 to +8 (counting the positioning of the nicks induced by PEgRNA as between positions +1 and -1) of the HEK3 site using a 10 nt RT template. Figure 41B is a graph showing long-range PE3 transversion editing at the HEK3 site using a 34 nt RT template. Figures 41C-41H are graphs showing all 12 types of transition and transversion editing at various positions on the prime editing window for (Figure 41C) RNF2, (Figure 41D) FANCF, (Figure 41E) EMX1, (Figure 41F) RUNX1, (Figure 41G) VEGFA, and (Figure 41H) DNMT1. Figure 41I is a graph showing targeted 1 and 3 bp insertions and 1 and 3 bp deletions by PE3 at seven endogenous genomic loci. Figure 41J is a graph showing targeted precision deletions of 5 to 80 bp at HEK3 target sites. Figure 41K is a graph showing combination editing of insertions and deletions, insertions and point mutations, deletions and point mutations, and double point mutations at three endogenous genomic loci. All editing yields reflect the percentage of total sequencing reads that contain the intended edit and no indels among all treated cells without sorting. Values and error bars reflect the mean and s.d. of three independent biological replicates.

図42A~42Hは、公知のCas9オフターゲット部位におけるCas9ならびにPE3によるプライム編集および塩基編集ならびにオフターゲット編集の比較を示す。図42Aは、HEK293T細胞の内生HEK3、FANCF、およびEMX1部位において、PE2、PE3、BE2max、およびBE4maxについて、同じ標的ヌクレオチドにおけるトータルのC・GからT・Aの編集効率を示す。図42Bは図42Aの処置からのインデル度数を示す。図42Cは、精密なC・GからT・Aの編集(バイスタンダー編集またはインデルなし)の編集効率をPE2、PE3、BE2max、およびBE4maxについてHEK3、FANCF、およびEMX1において示す。EMX1では、3つの標的ヌクレオチドにおけるC・GからT・Aの変換の全ての可能な組み合わせの精密なPE組み合わせ編集もまた示されている。図42Dは、トータルのA・TからG・C編集効率をPE2、PE3、ABEdmax、およびABEmaxについてHEK3およびFANCFにおいて示す。図42Eは、バイスタンダー編集またはインデルなしの精密なA・TからG・C編集効率をHEK3およびFANCFについて示す。図42Fは図42Dの処置からのインデル度数を示す。図42Gは、HEK293T細胞における平均トリプリケート編集効率(インデルを有するパーセンテージ配列決定読取)を、Cas9ヌクレアーゼについて、4つのオンターゲットおよび16の公知のオフターゲット部位において示す。検分された16のオフターゲット部位は、4つのオンターゲット部位の夫々について上位4つの先に報告されたオフターゲット部位118,159であった。各オンターゲット部位について、Cas9はsgRNAとまたは同じプロトスペーサーを認識する4つのPEgRNAの夫々とペアリングされた。図42Hは、平均トリプリケートオンターゲットおよびオフターゲット編集効率ならびにインデル効率(下の括弧内)を、HEK293T細胞において、(図42G)の各PEgRNAとペアリングされたPE2またはPE3について示す。オンターゲット編集収量は、ソーティングなしの全ての処置された細胞のうち、意図される編集を含有するかつインデルを含有しない配列決定総読取のパーセンテージを反映する。オフターゲット編集収量はプライム編集と整合するオフターゲット座位改変を反映する。値およびエラーバーは3つの独立した生物学的レプリケートの平均およびs.d.を反映する。Figures 42A-42H show a comparison of prime and base editing and off-target editing by Cas9 and PE3 at known Cas9 off-target sites. Figure 42A shows the total C.G to T.A editing efficiency at the same target nucleotide for PE2, PE3, BE2max, and BE4max at endogenous HEK3, FANCF, and EMX1 sites in HEK293T cells. Figure 42B shows the indel frequency from the treatments in Figure 42A. Figure 42C shows the editing efficiency of precise C.G to T.A editing (without bystander editing or indels) for PE2, PE3, BE2max, and BE4max in HEK3, FANCF, and EMX1. In EMX1, precise PE combinatorial editing of all possible combinations of C.G to T.A conversions at the three target nucleotides is also shown. Figure 42D shows the total A.T to G.C editing efficiency for PE2, PE3, ABEdmax, and ABEmax in HEK3 and FANCF. Figure 42E shows the precise A.T to G.C editing efficiency without bystander editing or indels for HEK3 and FANCF. Figure 42F shows the indel frequency from the treatments in Figure 42D. Figure 42G shows the average triplicate editing efficiency (percentage sequencing reads with indels) in HEK293T cells for Cas9 nuclease at four on-target and 16 known off-target sites. The 16 off-target sites observed were the top four previously reported off-target sites 118,159 for each of the four on-target sites. For each on-target site, Cas9 was paired with an sgRNA or each of the four PEgRNAs that recognize the same protospacer. Figure 42H shows the average triplicate on-target and off-target editing efficiency and indel efficiency (below in brackets) for PE2 or PE3 paired with each PEgRNA in (Figure 42G) in HEK293T cells. On-target editing yield reflects the percentage of total sequencing reads that contain intended editing and no indels among all treated cells without sorting. Off-target editing yield reflects off-target locus modifications that are consistent with prime editing. Values and error bars reflect the mean and sd of three independent biological replicates.

図43A~43Iは、種々のヒト細胞株および初代マウス皮質ニューロンにおけるプライム編集、病原性のトランスバージョン、挿入、または欠失変異の組み入れおよび修正、ならびにプライム編集およびHDRの比較を示す。図43Aは、HEK293T細胞のHBBにおける病原性のE6V変異の組み入れ(T・AからA・Tのトランスバージョンによる)および修正(A・TからT・Aのトランスバージョンによる)を示すグラフである。野生型HBBへのまたはPEgRNA PAMを遮断するサイレントな変異を含有するHBBどちらかへの修正が示されている。図43Bは、HEK293T細胞における病原性のHEXA 1278+TATCアレルの組み入れ(4bp挿入による)および修正(4bp欠失による)を示すグラフである。野生型HEXAまたはPEgRNA PAMを遮断するサイレントな変異を含有するHEXAどちらかへの修正が示されている。図43Cは、G・CからT・AのトランスバージョンによるHEK293T細胞におけるPRNPの防護性のG127Vバリアントの組み入れを示すグラフである。図43Dは、K562(白血病骨髄細胞)、U2OS(骨肉腫細胞)、およびHeLa(子宮頸がん細胞)を包含する他のヒト細胞株におけるプライム編集を示すグラフである。図43Eは、マウス初代皮質ニューロンのDNMT1におけるG・CからT・Aのトランスバージョン変異の組み入れを示すグラフであり、二元的な分裂インテインPE3レンチウイルスシステムを用いている。これにおいては、N末端の半分は、NインテインにかつP2A自己切断ペプチドを介してGFP-KASHに融合されたCas9(1-573)であり、C末端の半分は、PE2の残りに融合されたCインテインである。PE2の半分同士は、成熟ニューロンに高度に特異的であるヒトシナプシンプロモーターから発現される。ソーティングされた値はGFP陽性の核からの編集またはインデルを反映し、未ソーティングの値は全ての核からである。図43Fは、HEK293T細胞の内生ゲノム座位におけるPE3およびCas9によって媒介されるHDR編集効率の比較である。図43Gは、K562、U2OS、およびHeLa細胞の内生ゲノム座位におけるPE3およびCas9によって媒介されるHDR編集効率の比較である。図43Hは、HEK293T、K562、U2OS、およびHeLa細胞におけるPE3およびCas9によって媒介されるHDRインデル副産物生成の比較である。図43Iは、PE3によるHEK293T細胞におけるHis6タグ(18bp)、FLAGエピトープタグ(24bp)、または伸長されたLoxP部位(44bp)の標的化された挿入を示す。全ての編集収量は、全ての処置された細胞のうち、意図される編集を含有するかつインデルを含有しない配列決定総読取のパーセンテージを反映する。値およびエラーバーは3つの独立した生物学的レプリケートの平均およびs.d.を反映する。Figures 43A-43I show a comparison of prime editing, incorporation and correction of pathogenic transversion, insertion, or deletion mutations, and prime editing and HDR in various human cell lines and primary mouse cortical neurons. Figure 43A is a graph showing incorporation (by a T.A to A.T transversion) and correction (by an A.T to T.A transversion) of a pathogenic E6V mutation in HBB of HEK293T cells. Correction is shown either to wild-type HBB or to HBB containing a silent mutation that blocks the PEgRNA PAM. Figure 43B is a graph showing incorporation (by a 4 bp insertion) and correction (by a 4 bp deletion) of a pathogenic HEXA 1278+TATC allele in HEK293T cells. Correction is shown to either wild-type HEXA or to HEXA containing a silent mutation that blocks the PEgRNA PAM. Figure 43C is a graph showing the incorporation of the protective G127V variant of PRNP in HEK293T cells by G-C to T-A transversion. Figure 43D is a graph showing prime editing in other human cell lines including K562 (leukemia bone marrow cells), U2OS (osteosarcoma cells), and HeLa (cervical cancer cells). Figure 43E is a graph showing the incorporation of a G-C to T-A transversion mutation in DNMT1 in mouse primary cortical neurons using a dual split-intein PE3 lentiviral system, in which the N-terminal half is Cas9(1-573) fused to the N intein and to GFP-KASH via the P2A self-cleaving peptide, and the C-terminal half is the C intein fused to the remainder of PE2. The PE2 halves are expressed from the human synapsin promoter, which is highly specific to mature neurons. Sorted values reflect editing or indels from GFP-positive nuclei, and unsorted values are from all nuclei. Figure 43F is a comparison of HDR editing efficiency mediated by PE3 and Cas9 at endogenous genomic loci in HEK293T cells. Figure 43G is a comparison of HDR editing efficiency mediated by PE3 and Cas9 at endogenous genomic loci in K562, U2OS, and HeLa cells. Figure 43H is a comparison of HDR indel by-product generation mediated by PE3 and Cas9 in HEK293T, K562, U2OS, and HeLa cells. Figure 43I shows targeted insertion of His6 tag (18bp), FLAG epitope tag (24bp), or extended LoxP site (44bp) in HEK293T cells by PE3. All editing yields reflect the percentage of total sequencing reads that contain the intended edit and no indels among all treated cells. Values and error bars reflect the mean and s.d. of three independent biological replicates.

図44A~44Gは、蛍光標識されたDNA基質によるin vitroのプライム編集検証研究を示す。図44Aは、dCas9、5'伸長されたPEgRNA、および5'-Cy5標識DNA基質による電気泳動移動度シフトアッセイを示す。PEgRNA 1から5は、スペーサーおよびPBSの間の15ntリンカー配列(PEgRNA 1ではリンカーA、PEgRNA 2から5ではリンカーB)、5nt PBS配列、ならびに7nt(PEgRNA 1および2)、8nt(PEgRNA 3)、15nt(PEgRNA 4)、および22nt(PEgRNA 5)のRT鋳型を含有する。PEgRNAは、図44Eおよび44Fに用いられるものである;完全な配列は表2A~2Cに列記される。図44Bは、5'伸長されたおよび3'伸長されたPEgRNAを用いるCas9 H840Aのin vitroニッキングアッセイを示す。図44Cは、5'伸長されたおよび3'伸長されたPEgRNAを用いるHEK3におけるHEK293T細胞のCas9によって媒介されるインデル形成を示す。図44Dはプライム編集in vitro生化学アッセイの概観を示す。5'-Cy5標識された予めニックが入ったおよびニッキングされていないdsDNA基質が試験された。sgRNA、5'伸長されたPEgRNA、または3'伸長されたPEgRNAがdCas9またはCas9 H840Aニッカーゼと予め複合体化され、それから、dsDNA基質、M-MLV RT、およびdNTPと組み合わせられた。変性尿素PAGEによる分離およびCy5蛍光による視覚化に先行して、反応が37℃で1時間に渡って進むことを許された。図44Eは、5'伸長されたPEgRNA、予めニックが入ったDNA基質、およびdCas9を用いるプライマー伸長反応が、RT産物への有意な変換に至るということを示す。図44Fは、ニッキングされていないDNA基質およびCas9 H840Aニッカーゼと図44Bのとおり5'伸長されたPEgRNAを用いるプライマー伸長反応を示す。産物収量は予めニックが入った基質と比較して多大に縮減される。図44Gは、3'-PEgRNAを用いるin vitroプライマー伸長反応が単一の明らかな産物を生成するということを変性尿素PAGEによって示す。RT産物バンドが切り出され、ゲルから溶出され、それから、dGTPまたはdATPどちらかを用いるターミナルトランスフェラーゼ(TdT)によるホモポリマーテーリングに付された。テーリングされた産物はポリTまたはポリCプライマーによって伸長され、もたらされたDNAが配列決定された。Sangerトレースは、gRNA骨格に由来する3ヌクレオチドが逆転写された(最後の3'ヌクレオチドとしてDNA産物に追加された)ということを指示する。哺乳類細胞プライム編集実験では、PEgRNA骨格挿入はin vitroよりもかなり稀であるということに注意せよ(図56A~56D)。可能性としては、テザリングされた逆転写酵素がCas9に結合したガイドRNA骨格にアクセスすることの不能、および/またはPEgRNA骨格配列を含有する3'フラップのミスマッチの3'端の細胞性の切除を原因とする。Figures 44A-44G show in vitro prime editing validation studies with fluorescently labeled DNA substrates. Figure 44A shows electrophoretic mobility shift assays with dCas9, 5' extended PEgRNAs, and 5'-Cy5 labeled DNA substrates. PEgRNAs 1 to 5 contain a 15 nt linker sequence between the spacer and PBS (Linker A for PEgRNA 1, Linker B for PEgRNAs 2 to 5), a 5 nt PBS sequence, and 7 nt (PEgRNAs 1 and 2), 8 nt (PEgRNA 3), 15 nt (PEgRNA 4), and 22 nt (PEgRNA 5) RT templates. PEgRNAs are those used in Figures 44E and 44F; complete sequences are listed in Tables 2A-2C. Figure 44B shows in vitro nicking assays of Cas9 H840A with 5' extended and 3' extended PEgRNAs. Figure 44C shows Cas9-mediated indel formation in HEK293T cells in HEK3 with 5'- and 3'-extended PEgRNA. Figure 44D shows an overview of the prime editing in vitro biochemical assay. 5'-Cy5-labeled pre-nicked and unnicked dsDNA substrates were tested. sgRNA, 5'-extended PEgRNA, or 3'-extended PEgRNA were pre-complexed with dCas9 or Cas9 H840A nickase and then combined with dsDNA substrate, M-MLV RT, and dNTPs. Reactions were allowed to proceed for 1 hour at 37°C prior to separation by denaturing urea PAGE and visualization by Cy5 fluorescence. Figure 44E shows that primer extension reactions with 5'-extended PEgRNA, pre-nicked DNA substrate, and dCas9 lead to significant conversion to RT product. Figure 44F shows a primer extension reaction using unnicked DNA substrate and Cas9 H840A nickase with 5'-extended PEgRNA as in Figure 44B. Product yield is greatly reduced compared to pre-nicked substrate. Figure 44G shows that in vitro primer extension reaction using 3'-PEgRNA produces a single clear product by denaturing urea PAGE. The RT product band was excised, eluted from the gel, and then subjected to homopolymeric tailing with terminal transferase (TdT) using either dGTP or dATP. The tailed product was extended with a poly-T or poly-C primer, and the resulting DNA was sequenced. Sanger traces indicate that three nucleotides from the gRNA backbone were reverse transcribed (added to the DNA product as the last 3' nucleotides). Note that in mammalian cell prime editing experiments, PEgRNA backbone insertion is much rarer than in vitro (Figures 56A-56D). This is possibly due to the inability of the tethered reverse transcriptase to access the Cas9-bound guide RNA backbone and/or cellular excision of the mismatched 3' end of the 3' flap containing the PEgRNA backbone sequence.

図45A~45Gはin vitroプライム編集反応からの3'DNAフラップの酵母における細胞性修復を示す。図45Aは、二元的蛍光タンパク質レポータープラスミドが、インフレームの停止コドン、+1フレームシフト、または-1フレームシフトをコードする標的部位によって分離されたGFPおよびmCherryオープンリーディングフレームを含有するということを示す。プライム編集反応がCas9 H840Aニッカーゼ、PEgRNA、dNTP、およびM-MLV逆転写酵素によってin vitroで実行され、それから酵母に形質転換された。編集されないプラスミドを含有するコロニーはGFPを生ずるが、mCherryを生じない。編集されたプラスミドを含有する酵母コロニーはGFPおよびmCherry両方を融合タンパク質として生ずる。図45Bは、停止コドンをGFPおよびmCherryの間に含有する(編集されない負の対照。上側)または停止コドンもしくはフレームシフトをGFPおよびmCherryの間に含有しない(予め編集された正の対照。下側)レポータープラスミドによって形質転換された酵母コロニーのGFPおよびmCherry蛍光の重ね合わせを示す。図45C-45Fは、in vitroプライム編集反応産物によって形質転換された酵母コロニーからのmCherryおよびGFP蛍光の視覚化を示す。図45Cは、図45Dに示されているとおり、3'伸長されたPEgRNAまたは5'伸長されたPEgRNAを用いるT・AからA・Tのトランスバージョンによる停止コドン修正を示す。図45Eは、3'伸長されたPEgRNAを用いる1bp欠失の+1フレームシフト修正を示す。図45Fは、3'伸長されたPEgRNAを用いる1bp挿入による-1フレームシフト修正を示す。図45Gは、図45BのGFPのみコロニーならびに図45CのGFPおよびmCherry二重陽性コロニーから単離されたプラスミドからのSanger DNA配列決定トレースを示す。Figures 45A-45G show cellular repair in yeast of a 3' DNA flap from an in vitro prime editing reaction. Figure 45A shows that a dual fluorescent protein reporter plasmid contains GFP and mCherry open reading frames separated by target sites encoding an in-frame stop codon, a +1 frameshift, or a -1 frameshift. Prime editing reactions were performed in vitro with Cas9 H840A nickase, PEgRNA, dNTPs, and M-MLV reverse transcriptase and then transformed into yeast. Colonies containing unedited plasmids produce GFP but not mCherry. Yeast colonies containing edited plasmids produce both GFP and mCherry as fusion proteins. Figure 45B shows an overlay of GFP and mCherry fluorescence of yeast colonies transformed with reporter plasmids that contain a stop codon between GFP and mCherry (unedited negative control, top) or no stop codon or frameshift between GFP and mCherry (pre-edited positive control, bottom). Figures 45C-45F show visualization of mCherry and GFP fluorescence from yeast colonies transformed with in vitro primed editing reaction products. Figure 45C shows stop codon correction by T.A to A.T transversion using 3'-extended PEgRNA or 5'-extended PEgRNA as shown in Figure 45D. Figure 45E shows +1 frameshift correction of a 1 bp deletion using 3'-extended PEgRNA. Figure 45F shows -1 frameshift correction by a 1 bp insertion using 3'-extended PEgRNA. Figure 45G shows Sanger DNA sequencing traces from plasmids isolated from the GFP-only colony in Figure 45B and the GFP and mCherry double positive colony in Figure 45C.

図46A~46FはPE1による正しい編集対インデル生成を示す。図46AはHEK3の+1位置におけるPE1によるT・AからA・Tのトランスバージョン編集効率およびインデル生成を示し、10nt RT鋳型と8-17ntの範囲であるPBS配列とを含有するPEgRNAを用いる。図46Bは、EMX1の+5位置におけるPE1によるG・CからT・Aのトランスバージョン編集効率およびインデル生成を示し、13nt RT鋳型と9-17ntの範囲であるPBS配列とを含有するPEgRNAを用いる。図46Cは、FANCFの+5位置におけるPE1によるG・CからT・Aのトランスバージョン編集効率およびインデル生成を示し、17nt RT鋳型と8-17ntの範囲であるPBS配列とを含有するPEgRNAを用いる。図46Dは、RNF2の+1位置におけるPE1によるC・GからA・Tのトランスバージョン編集効率およびインデル生成を示し、11nt RT鋳型と9-17ntの範囲であるPBS配列とを含有するPEgRNAを用いる。図46EはHEK4の+2位置におけるPE1によるG・CからT・Aのトランスバージョン編集効率およびインデル生成を示し、13nt RT鋳型と7-15ntの範囲であるPBS配列とを含有するPEgRNAを用いる。図46FはHEK3部位におけるPE1によって媒介される+1T欠失、+1A挿入、および+1CTT挿入を示し、13nt PBSおよび10nt RT鋳型を用いる。PEgRNAの配列は図39Cに用いられるものである(表3A-3Rを見よ)。値およびエラーバーは3つの独立した生物学的レプリケートの平均およびs.d.を反映する。Figures 46A-46F show correct editing versus indel generation by PE1. Figure 46A shows transversion editing efficiency and indel generation of T.A to A.T by PE1 at the +1 position of HEK3 using a 10 nt RT template and a PBS sequence ranging from 8-17 nt, and a PEgRNA containing the same. Figure 46B shows transversion editing efficiency and indel generation of G.C to T.A by PE1 at the +5 position of EMX1 using a 13 nt RT template and a PBS sequence ranging from 9-17 nt, and a PEgRNA containing the same. Figure 46C shows transversion editing efficiency and indel generation of G.C to T.A by PE1 at the +5 position of FANCF using a 17 nt RT template and a PBS sequence ranging from 8-17 nt, and a PEgRNA containing the same. Figure 46D shows the transversion editing efficiency and indel generation of C.G to A.T by PE1 at the +1 position of RNF2, using a PEgRNA containing an 11 nt RT template and a PBS sequence ranging from 9-17 nt. Figure 46E shows the transversion editing efficiency and indel generation of G.C to T.A by PE1 at the +2 position of HEK4, using a PEgRNA containing a 13 nt RT template and a PBS sequence ranging from 7-15 nt. Figure 46F shows the +1T deletion, +1A insertion, and +1CTT insertion mediated by PE1 at the HEK3 site, using a 13 nt PBS and 10 nt RT template. The sequences of the PEgRNAs are those used in Figure 39C (see Tables 3A-3R). Values and error bars reflect the mean and s.d. of three independent biological replicates.

図47A~47Sはプライム編集のためのM-MLV RTバリアントの評価を示す。図47Aは、この図に用いられるプライム編集因子バリアントの略語を示す。図47BはHEK3座位におけるPE1による標的化された挿入および欠失編集を示す。図47C~47Hは、図47Cに示されているとおりHEK3における+2G・CからC・Gのトランスバージョン編集、図47Dに示されているとおりHEK3における24bp FLAG挿入、図47Eに示されているとおりRNF2における+1C・GからA・Tのトランスバージョン編集、図47Fに示されているとおりEMX1における+1G・CからC・Gのトランスバージョン編集、図47Gに示されているとおりHBBにおける+2T・AからA・Tのトランスバージョン編集、および図47Hに示されているとおりFANCFにおける+1G・CからC・Gのトランスバージョン編集を組み入れるそれらの能力について、M-MLV RTバリアントを含有する18のプライム編集因子構築物の比較を示す。図47I~47Nは、独立した実験の第2ラウンドにおいて図47C-47Hに示されている編集を組み入れるそれらの能力について、M-MLVバリアントを含有する4つのプライム編集因子構築物の比較を示す。図47O~47Sは、様々なPBS長さによる5つのゲノム座位におけるPE2編集効率を示す。図47OはHEK3における+1T・AからA・Tのバリエーションを示す。図47PはEMX1における+5G・CからT・Aのバリエーションを示す。図47QはFANCFにおける+5G・CからT・Aのバリエーションを示す。図47RはRNF2における+1C・GからA・Tのバリエーションを示す。図47SはHEK4における+2G・CからT・Aバリエーションを示す。値およびエラーバーは3つの独立した生物学的レプリケートの平均およびs.d.を反映する。Figures 47A-47S show evaluation of M-MLV RT variants for prime editing. Figure 47A shows the abbreviations of the prime editor variants used in this figure. Figure 47B shows targeted insertion and deletion editing by PE1 at the HEK3 locus. Figures 47C-47H show a comparison of 18 prime editor constructs containing M-MLV RT variants for their ability to incorporate a +2G.C to C.G transversion edit in HEK3 as shown in Figure 47C, a 24bp FLAG insertion in HEK3 as shown in Figure 47D, a +1C.G to A.T transversion edit in RNF2 as shown in Figure 47E, a +1G.C to C.G transversion edit in EMX1 as shown in Figure 47F, a +2T.A to A.T transversion edit in HBB as shown in Figure 47G, and a +1G.C to C.G transversion edit in FANCF as shown in Figure 47H. Figures 47I-47N show a comparison of four prime editor constructs containing M-MLV variants for their ability to incorporate the edits shown in Figures 47C-47H in a second round of independent experiments. Figures 47O-47S show PE2 editing efficiency at five genomic loci with varying PBS lengths. Figure 47O shows +1T·A to A·T variation in HEK3. Figure 47P shows +5G·C to T·A variation in EMX1. Figure 47Q shows +5G·C to T·A variation in FANCF. Figure 47R shows +1C·G to A·T variation in RNF2. Figure 47S shows +2G·C to T·A variation in HEK4. Values and error bars reflect the mean and s.d. of three independent biological replicates.

図48A~48CはPEgRNA PBSおよびRT鋳型配列のデザイン特色を示す。図48Aは、RT鋳型長さの関数としてHEK293T細胞のVEGFAにおけるPE2によって媒介される+5G・CからT・Aのトランスバージョン編集効率(青色線)を示す。インデル(灰色線)が比較のためにプロットされている。グラフの下の配列は、PEgRNAによる合成のための鋳型とする編集のための最後のヌクレオチドを示す。Gヌクレオチド(PEgRNA上のCを鋳型とする)が強調されている;プライム編集効率を最大化するために、Cで終わるRT鋳型はPEgRNAのデザインの間に回避されるべきである。図48Bは、図48AのとおりDNMT1の+5G・CからT・Aのトランスバージョン編集およびインデルを示す。図48Cは、図48AのとおりRUNX1の+5G・CからT・Aのトランスバージョン編集およびインデルを示す。値およびエラーバーは3つの独立した生物学的レプリケートの平均およびs.d.を反映する。Figures 48A-48C show design features of PEgRNA PBS and RT template sequences. Figure 48A shows PE2-mediated +5G·C to T·A transversion editing efficiency in VEGFA of HEK293T cells as a function of RT template length (blue line). Indels (gray line) are plotted for comparison. The sequence below the graph shows the last nucleotide for editing that serves as a template for synthesis by PEgRNA. The G nucleotide (templated by a C on PEgRNA) is highlighted; to maximize prime editing efficiency, RT templates that end with a C should be avoided during PEgRNA design. Figure 48B shows DNMT1 +5G·C to T·A transversion editing and indels as in Figure 48A. Figure 48C shows RUNX1 +5G·C to T·A transversion editing and indels as in Figure 48A. Values and error bars reflect the mean and s.d. of three independent biological replicates.

図49A~49Bは、細胞生存性に対するPE2、PE2 R110S K103L、Cas9 H840Aニッカーゼ、およびdCas9の効果を示す。HEK293T細胞が、HEK3標的化PEgRNAプラスミドと一緒にPE2、PE2 R110S K103L、Cas9 H840Aニッカーゼ、またはdCas9をコードするプラスミドによってトランスフェクションされた。細胞生存性が、24時間毎に、トランスフェクション後に3日に渡ってCellTiter-Glo2.0アッセイ(Promega)を用いて測定された。図49Aは、トランスフェクション後の1、2、または3日にルミネセンスによって測定された生存性を示す。値およびエラーバーは、夫々が技術的トリプリケートで行われた3つの独立した生物学的レプリケートの平均およびs.e.m.を反映する。図49Bは、+5GからAの編集をコードするHEK3標的化PEgRNAプラスミドと一緒に、PE2、PE2 R110S K103L、Cas9 H840Aニッカーゼ、またはdCas9について、パーセントの編集およびインデルを示す。編集効率が、トランスフェクション後の第3日に、図49Aの生存性をアッセイするために用いられたものと並べて、処置された細胞から測定された。値およびエラーバーは3つの独立した生物学的レプリケートの平均およびs.d.を反映する。Figures 49A-49B show the effect of PE2, PE2 R110S K103L, Cas9 H840A nickase, and dCas9 on cell viability. HEK293T cells were transfected with plasmids encoding PE2, PE2 R110S K103L, Cas9 H840A nickase, or dCas9 together with a HEK3-targeting PEgRNA plasmid. Cell viability was measured using the CellTiter-Glo2.0 assay (Promega) every 24 hours for 3 days post-transfection. Figure 49A shows viability measured by luminescence 1, 2, or 3 days post-transfection. Values and error bars reflect the mean and s.e.m. of three independent biological replicates, each performed in technical triplicate. Figure 49B shows percent editing and indels for PE2, PE2 R110S K103L, Cas9 H840A nickase, or dCas9 with HEK3-targeted PEgRNA plasmids encoding +5G to A edits. Editing efficiency was measured from treated cells at day 3 post-transfection alongside those used to assay viability in Figure 49A. Values and error bars reflect the mean and s.d. of three independent biological replicates.

図50A~50Bは、種々のPEgRNAによるPE3によって媒介されるHBB E6V修正およびHEXA 1278+TATC修正を示す。図50Aは、PE3によるHEK293T細胞のHBB E6Vアレルの修正のための14のPEgRNAのスクリーンを示す。評価された全てのPEgRNAは、いずれかのサイレントなPAM変異の導入なしに、HBB E6Vアレルを再び野生型HBBに変換する。図50Bは、PE3またはPE3bによるHEK293T細胞のHEXA 1278+TATCアレルの修正のための41のPEgRNAのスクリーンを示す。HEXAと標識されたPEgRNAは、PAMを遮断しかつサイレントな変異を残すシフトした4bp欠失によって病原性のアレルを修正する。HEXAと標識されたPEgRNAは病原性のアレルを再び野生型へと修正する。「b」で終わるエントリーは編集特異的なニッキングsgRNAをPEgRNAとの組み合わせで用いる(PE3bシステム)。値およびエラーバーは3つの独立した生物学的レプリケートの平均およびs.d.を反映する。Figures 50A-50B show PE3-mediated HBB E6V correction and HEXA 1278+TATC correction by various PEgRNAs. Figure 50A shows a screen of 14 PEgRNAs for correction of the HBB E6V allele in HEK293T cells with PE3. All PEgRNAs evaluated convert the HBB E6V allele back to wild-type HBB without the introduction of any silent PAM mutations. Figure 50B shows a screen of 41 PEgRNAs for correction of the HEXA 1278+TATC allele in HEK293T cells with PE3 or PE3b. PEgRNAs labeled with HEXA correct the pathogenic allele with a shifted 4bp deletion that blocks the PAM and leaves a silent mutation. PEgRNAs labeled with HEXA correct the pathogenic allele back to wild-type. Entries ending in "b" use an editing-specific nicking sgRNA in combination with the PEgRNA (PE3b system). Values and error bars reflect the mean and s.d. of three independent biological replicates.

図51A~51Gは、ヒト細胞株におけるPE3活性とPE3およびCas9によって開始されるHDRの比較とを示す。図51Aに示されているとおりHEK293T細胞、図51Bに示されているとおりK562細胞、図51Cに示されているとおりU2OS細胞、および図51Dに示されているとおりHeLa細胞において、PE3およびCas9によって開始されるHDRについて、正しい編集(インデルなし)およびインデル度数を生成する効率。各ひとくくりされた編集の比較は、PE3およびCas9によって開始されるHDRによって同一の編集を組み入れる。非標的化対照はPE3および非標的座位を標的化するPEgRNAである。図51Eは、野生型Cas9 HDR実験と比較した非標的化PEgRNA+PE3およびdCas9+sgRNAによる対照実験を示す。見かけ上のHDR効率を偽性的に上昇させる普通のコンタミナントのssDNAドナーHDR鋳型が図51A~51DのHDR測定に寄与しないということを確認している。図51F~51Gは、PE3またはCas9によって開始されるHDRによる編集後にK562細胞から単離されたゲノムDNAサンプルからの例のHEK3部位アレル表を示す。アレルがIllumina MiSeqによって配列決定され、CRISPResso2によって分析された178。この領域からの参照HEK3配列は上側にある。アレル表が、非標的化PEgRNAの負の対照、PE3を用いるHEK3における+1CTT挿入、およびCas9によって開始されるHDRを用いるHEK3における+1CTT挿入について示されている。アレル度数および対応するIllumina配列決定読取カウントが各アレルについて示されている。度数≧0.20%で観察された全てのアレルが示されている。値およびエラーバーは3つの独立した生物学的レプリケートの平均およびs.d.を反映する。Figures 51A- 51G show a comparison of PE3 activity in human cell lines and HDR initiated by PE3 and Cas9. Efficiency of generating correct edits (no indels) and indel frequency for HDR initiated by PE3 and Cas9 in HEK293T cells as shown in Figure 51A, K562 cells as shown in Figure 51B, U2OS cells as shown in Figure 51C, and HeLa cells as shown in Figure 51D. Comparison of each bundled edit incorporates identical edits by HDR initiated by PE3 and Cas9. Non-targeting controls are PE3 and PEgRNA targeting a non-targeted locus. Figure 51E shows a control experiment with non-targeting PEgRNA+PE3 and dCas9+sgRNA compared to a wild-type Cas9 HDR experiment. It is confirmed that the common contaminant ssDNA donor HDR template, which spuriously increases the apparent HDR efficiency, does not contribute to the HDR measurements in Figures 51A-51D. Figures 51F -51G show example HEK3 site allele tables from genomic DNA samples isolated from K562 cells after editing with PE3 or Cas9-initiated HDR. Alleles were sequenced by Illumina MiSeq and analyzed by CRISPResso2 . The reference HEK3 sequence from this region is at the top. Allele tables are shown for a negative control of non-targeting PEgRNA, a +1CTT insertion in HEK3 with PE3, and a +1CTT insertion in HEK3 with Cas9-initiated HDR. Allele frequencies and corresponding Illumina sequencing read counts are shown for each allele. All alleles observed with a frequency ≥ 0.20% are shown. Values and error bars reflect the mean and sd of three independent biological replicates.

図52A~52Dは、ClinVarデータベース上の病原性の挿入、重複、欠失、およびインデルの長さの分布を示す。ClinVarバリアントサマリーが2019年7月15日にNCBIからダウンロードされた。報告された挿入、欠失、および重複の長さが、参照および代替対立遺伝子、バリアントスタートおよびストップ位置、またはバリアント名称の適当な識別情報を用いて計算された。上の情報のいずれかを報告しなかったバリアントは分析から排除された。報告されたインデル(参照ゲノムに対して相対的に挿入および欠失両方を包含する単一のバリアント)の長さは、参照および代替対立遺伝子の間の最も良好なペアワイズアラインメントにおけるミスマッチまたはギャップの数を決定することによって計算された。Figures 52A-52D show the distribution of pathogenic insertion, duplication, deletion, and indel lengths on the ClinVar database. The ClinVar variant summary was downloaded from NCBI on July 15, 2019. The lengths of reported insertions, deletions, and duplications were calculated using appropriate identifying information for the reference and alternative alleles, variant start and stop positions, or variant name. Variants that did not report any of the above information were excluded from the analysis. The lengths of reported indels (single variants encompassing both insertions and deletions relative to the reference genome) were calculated by determining the number of mismatches or gaps in the best pairwise alignment between the reference and alternative alleles.

図53A~53Eは、GFP陽性の細胞ソーティングについてFACSゲーティング例を示す。下は元々のバッチ分析ファイルの例であり、HEXA 1278+TATCおよびHBB E6V HEK293T細胞株を生成するために用いられたソーティング戦略を概説する。イメージデータはCell Sorterソフトウェアv.3.0.5を用いてSony LE-MA900サイトメーターによって生成された。グラフィック1は、GFPを発現しない細胞のゲーティングプロットを示す。グラフィック2は、HBB E6V HEK293T細胞株を単離するために用いられたP2A-GFP発現細胞の例のソーティングを示す。HEK293T細胞は、当初にはFSC-A/BSC-A(ゲートA)を用いて集団でゲーティングされ、それからFSC-A/FSC-H(ゲートB)を用いてシングレットについてソーティングされた。生細胞はDAPI陰性細胞(ゲートC)をゲーティングすることによってソーティングされた。負の対照の細胞のものよりも上であるGFP蛍光レベルを有する細胞は、フルオロクロームとしてEGFPを用いてソーティングされた(ゲートD)。図53AはHEK293T細胞(GFP陰性)を示す。図53Bは、PE2-P2A-GFPを発現する細胞についてのFACSゲーティングの代表的なプロットを示す。図53Cは、HEXA 1278+TATCホモ接合体HEK293T細胞の遺伝子型を示す。図53D~53EはHBB E6Vホモ接合体HEK293T細胞株のアレル表を示す。Figures 53A- 53E show example FACS gating for GFP positive cell sorting. Below are examples of the original batch analysis files outlining the sorting strategy used to generate the HEXA 1278+TATC and HBB E6V HEK293T cell lines. Image data was generated by a Sony LE-MA900 cytometer using Cell Sorter software v.3.0.5. Graphic 1 shows a gating plot of cells not expressing GFP. Graphic 2 shows an example sorting of P2A-GFP expressing cells used to isolate the HBB E6V HEK293T cell line. HEK293T cells were initially gated on populations using FSC-A/BSC-A (gate A) and then sorted for singlets using FSC-A/FSC-H (gate B). Live cells were sorted by gating on DAPI negative cells (gate C). Cells with GFP fluorescence levels above that of negative control cells were sorted using EGFP as the fluorochrome (gate D). Figure 53A shows HEK293T cells (GFP negative). Figure 53B shows a representative plot of FACS gating for cells expressing PE2-P2A-GFP. Figure 53C shows the genotype of HEXA 1278+TATC homozygous HEK293T cells. Figures 53D -53E show the allele table of the HBB E6V homozygous HEK293T cell line.

図54はPEgRNAクローニング手続きをまとめる模式図である。Figure 54 is a schematic summarizing the PEG RNA cloning procedure.

図55A~55GはPEgRNAデザインの模式図である。図55Aは、ドメインが標識された(左)およびゲノム部位においてnCas9に結合された(右)PEgRNAの単純なダイアグラムを示す。図55Bは、活性を増大させることが予期されるPEgRNAの種々の型の修飾を示す。図55Cは、プロモーター選択肢ならびに5'、3'プロセシングおよび終結によってより長いRNAの転写を増大させるためのPEgRNAの修飾を示す。図55DはP1システムの長大化を示す。これは骨格修飾の例である。図55Eは、鋳型領域上におけるまたはPEgRNA上の他所における合成的修飾の組み込みが活性を増大させ得るということを示す。図55Fは、鋳型上の最小限の二次構造のデザインされた組み込みが、より長いより阻害性の二次構造の形成を防止し得るということを示す。図55Gは、PEgRNAの3'端においてRNAエレメントによってアンカー固定された第2の鋳型配列を有する分裂PEgRNAを示す(左)。PEgRNAの5'または3'端におけるエレメントの組み込みはRT結合を増強し得る。Figures 55A-55G are schematics of PEgRNA design. Figure 55A shows a simple diagram of PEgRNA with domains labeled (left) and bound to nCas9 at a genomic site (right). Figure 55B shows different types of modifications of PEgRNA expected to increase activity. Figure 55C shows modifications of PEgRNA to increase transcription of longer RNAs through promoter options and 5', 3' processing and termination. Figure 55D shows lengthening of the P1 system. This is an example of backbone modification. Figure 55E shows that incorporation of synthetic modifications on the template region or elsewhere on the PEgRNA can increase activity. Figure 55F shows that designed incorporation of minimal secondary structure on the template can prevent the formation of longer, more inhibitory secondary structures. Figure 55G shows a split-PEgRNA with a second template sequence anchored by an RNA element at the 3' end of the PEgRNA (left). Incorporation of elements at the 5' or 3' end of the PEgRNA can enhance RT binding.

図56A~56Dは標的座位へのPEgRNA骨格配列の組み込みを示す。HTSデータが図60A~60Bに記載されているとおりPEgRNA骨格配列挿入について分析された。図56AはEMX1座位の分析を示す。RT鋳型に隣接する挿入上に1つ以上のPEgRNA骨格配列ヌクレオチドを含有する配列決定総読取の%(左);規定された長さのPEgRNA骨格配列挿入を含有する配列決定総読取のパーセンテージ(中央);および最高でX軸上に規定された長さを包含するPEgRNA挿入の累積のトータルパーセンテージが示されている。図56Bは図56Aと同じことをFANCFについて示す。図56Cは図56Aと同じことをHEK3について示す。図56Dは図56Aと同じことをRNF2について示す。値およびエラーバーは3つの独立した生物学的レプリケートの平均およびs.d.を反映する。Figures 56A-56D show the integration of PEgRNA backbone sequences into the target locus. HTS data was analyzed for PEgRNA backbone sequence insertions as described in Figures 60A-60B. Figure 56A shows the analysis of the EMX1 locus. Shown are the % of total sequencing reads that contain one or more PEgRNA backbone sequence nucleotides on the insertion adjacent to the RT template (left); the percentage of total sequencing reads that contain a PEgRNA backbone sequence insertion of a defined length (center); and the cumulative total percentage of PEgRNA insertions up to encompassing a defined length on the x-axis. Figure 56B shows the same as Figure 56A for FANCF. Figure 56C shows the same as Figure 56A for HEK3. Figure 56D shows the same as Figure 56A for RNF2. Values and error bars reflect the mean and s.d. of three independent biological replicates.

図57A~57Iは、トランスクリプトームワイドなRNA存在量に対するPE2、PE2-dRT、およびCas9 H840Aニッカーゼの効果を示す。PE2、PE2-dRT、またはCas9 H840AニッカーゼとPRNP標的化またはHEXA標的化PEgRNAとを発現するHEK293T細胞から単離された、リボソームRNAを枯渇させられた細胞RNAの分析。14,410遺伝子および14,368遺伝子に対応するRNAが夫々PRNPおよびHEXAサンプルにおいて検出された。図57A~57Fは、-log10 FDR調整されたp値対log2転写物存在量の~倍の変化を各(Aeach)RNAについて呈示するボルケーノプロットを示す。(図57A)PRNP標的化PEgRNAによるPE2対PE2-dRT、(図57B)PRNP標的化PEgRNAによるPE2対Cas9 H840A、(図57C)PRNP標的化PEgRNAによるPE2-dRT対Cas9 H840A、(図57D)HEXA標的化PEgRNAによるPE2対PE2-dRT、(図57E)HEXA標的化PEgRNAによるPE2対Cas9 H840A、(図57F)HEXA標的化PEgRNAによるPE2-dRT対Cas9 H840Aを比較している。赤色のドットは、統計的に有意である相対存在量の≧2倍の変化を示す遺伝子を指示する(FDR調整されたp<0.05)。図57G-57Iは、上方制御および下方制御される転写物(≧2倍変化)のベン図であり、PRNPおよびHEXAサンプルを(図57G)PE2対PE2-dRT、(図57H)PE2対Cas9 H840A、および(図57I)PE2-dRT対Cas9 H840Aについて比較している。Figures 57A-57I show the effect of PE2, PE2-dRT, and Cas9 H840A nickase on transcriptome-wide RNA abundance. Analysis of ribosomal RNA-depleted cellular RNA isolated from HEK293T cells expressing PE2, PE2-dRT, or Cas9 H840A nickase and PRNP- or HEXA-targeted PEgRNA. RNA corresponding to 14,410 and 14,368 genes were detected in PRNP and HEXA samples, respectively. Figures 57A-57F show volcano plots displaying -log10 FDR-adjusted p-values versus log2 fold change in transcript abundance for each (Aeach) RNA. (Figure 57A) PE2 vs. PE2-dRT with PRNP-targeted PEgRNA, (Figure 57B) PE2 vs. Cas9 H840A with PRNP-targeted PEgRNA, (Figure 57C) PE2-dRT vs. Cas9 H840A with PRNP-targeted PEgRNA, (Figure 57D) PE2 vs. PE2-dRT with HEXA-targeted PEgRNA, (Figure 57E) PE2 vs. Cas9 H840A with HEXA-targeted PEgRNA, (Figure 57F) PE2-dRT vs. Cas9 H840A with HEXA-targeted PEgRNA. Red dots indicate genes that show a ≧2-fold change in relative abundance that is statistically significant (FDR adjusted p<0.05). Figures 57G-57I are Venn diagrams of up- and down-regulated transcripts (≧2-fold change) comparing PRNP and HEXA samples for (Figure 57G) PE2 vs. PE2-dRT, (Figure 57H) PE2 vs. Cas9 H840A, and (Figure 57I) PE2-dRT vs. Cas9 H840A.

図58A~58Bはニューロン核ソーティングのための代表的なFACSゲーティングを示す。核が、DyeCycle Rubyシグナル、FSC/SSC比、SSC幅/SSC高さ比、およびGFP/DyeCycle比に基づいて逐次的にゲーティングされた。Figures 58A-58B show representative FACS gating for neuronal nuclei sorting. Nuclei were sequentially gated based on DyeCycle Ruby signal, FSC/SSC ratio, SSC width/SSC height ratio, and GFP/DyeCycle ratio.

図59A~59Gは、3'伸長されたPEgRNAをゴールデンゲートアセンブリによって哺乳類U6発現ベクター上にクローニングするためのプロトコールを示す。図59Aはクローニングの概観を示す。図59Bは「ステップ1:pU6-PEgRNA-GG-ベクタープラスミドを消化(構成要素1)」を示す。図59Cは「ステップ2および3:オリゴヌクレオチドパーツを順序付けおよびアニーリング(構成要素2、3、および4)」を示す。図59Dは「ステップ2.b.ii.:sgRNA骨格リン酸化(オリゴヌクレオチドがリン酸化されて購入された場合には不必要)」を示す。図59Eは「ステップ4:PEgRNAアセンブリ」を示す。図59Fは「ステップ5および6:アセンブリされたプラスミドの形質転換」を示す。図59GはPEgRNAクローニングプロトコールをまとめるダイアグラムを示す。Figures 59A- 59G show the protocol for cloning 3' extended PEgRNA onto a mammalian U6 expression vector by Golden Gate assembly. Figure 59A shows an overview of the cloning. Figure 59B shows "Step 1: Digest pU6-PEgRNA-GG-vector plasmid (component 1)". Figure 59C shows "Steps 2 and 3: Order and anneal oligonucleotide parts (components 2, 3, and 4)". Figure 59D shows "Step 2.b.ii.: sgRNA backbone phosphorylation (not required if oligonucleotides are purchased phosphorylated)". Figure 59E shows "Step 4: PEgRNA assembly". Figure 59F shows "Steps 5 and 6: Transformation of assembled plasmid". Figure 59G shows a diagram summarizing the PEgRNA cloning protocol.

図60A~60Bは、PEgRNA骨格取り入れを定量するためのPythonスクリプトを示す。標的ゲノム座位におけるPEgRNA挿入を特徴付けおよび定量するために、カスタムのpythonスクリプトが生成された。スクリプトは、参照配列(ガイドRNA骨格配列)から取られた増大していく長さのテキストストリングをfastqファイル内の配列決定読取と反復的にマッチさせ、検索クエリにマッチする配列決定読取の数をカウントする。各順次のテキストストリングは、ガイドRNA骨格配列の追加のヌクレオチドに対応する。厳密な長さ取り入れおよび最高で規定された長さの累積の取り入れが、この様式で計算された。sgRNAの短いスライスのアラインメントおよび正確なカウントを保証するために、参照配列のスタートにおいては、逆転写酵素によって合成される新たなDNA鎖の3'端の5から6塩基が包含される。Figures 60A-60B show a Python script for quantifying PEgRNA backbone incorporation. A custom python script was generated to characterize and quantify PEgRNA insertions at the target genomic locus. The script iteratively matches text strings of increasing length taken from the reference sequence (guide RNA backbone sequence) with the sequencing reads in the fastq file and counts the number of sequencing reads that match the search query. Each successive text string corresponds to an additional nucleotide of the guide RNA backbone sequence. The exact length incorporation and cumulative incorporation up to a specified length were calculated in this manner. To ensure alignment and accurate counting of short slices of sgRNA, the start of the reference sequence encompasses 5 to 6 bases at the 3' end of the new DNA strand synthesized by reverse transcriptase.

図61は、SaCas9(N580A)-MMLV RT HEK3 +6C>Aについて、規定された編集を有する配列決定総読取のパーセントを示すグラフである。正しい編集およびインデルの値が示されている。Figure 61 is a graph showing the percentage of total sequencing reads with the defined edits for SaCas9(N580A)-MMLV RT HEK3 +6C>A. Values for correct edits and indels are shown.

図62A~62Bは、プライム編集による精密な位置付けにおける所望の編集の効率的な組み入れにとってのプロトスペーサーの重要性を示す。図62Aは、種々のHEK3座位について、標的T・A塩基対がA・Tに変換された配列決定総読取のパーセントを示すグラフである。図62Bはそれを示す配列分析である。Figures 62A-62B show the importance of protospacers for efficient incorporation of desired edits at precise positioning by prime editing. Figure 62A is a graph showing the percent of total sequencing reads in which the targeted T-A base pair was converted to A-T for various HEK3 loci. Figure 62B shows the sequence analysis.

図63はPAM編集のSpCas9 PAMバリアントを示すグラフである(N=3)。標的化されたPAM編集を有する配列決定総読取のパーセントが、NGA>NTAであるSpCas9(H840A)-VRQR-MMLV RTについて、およびNGCG>NTCGであるSpCas9(H840A)-VRER-MMLV RTについて示されている。用いられたPEgRNAプライマー結合部位(PBS)長さ、RT鋳型(RT)長さ、およびPEシステムが列記される。Figure 63 is a graph showing SpCas9 PAM variants of PAM editing (N=3). The percentage of total sequencing reads with targeted PAM editing is shown for SpCas9(H840A)-VRQR-MMLV RT where NGA>NTA, and for SpCas9(H840A)-VRER-MMLV RT where NGCG>NTCG. The PEgRNA primer binding site (PBS) length, RT template (RT) length, and PE system used are listed.

図64A~64Fは、PEを用いるゲノム上への種々の部位特異的リコンビナーゼ(SSR)標的の導入を示す模式図である。図64Aは、プライム編集因子によるリコンビナーゼ標的配列の挿入の一般的な模式図を提供する。図64Bは、どのようにしてPEによって挿入される単一のSSR標的がDNAドナー鋳型のゲノム取り入れのための部位として用いられ得るかを示す。図64Cは、どのようにしてSSR標的部位のタンデム挿入がゲノムの部分を欠失させるために用いられ得るかを示す。図64Dは、どのようにしてSSR標的部位のタンデム挿入がゲノムの部分を逆位させるために用いられ得るかを示す。図64Eは、どのようにして2つの遠位の染色体領域における2つのSSR標的部位の挿入が染色体転座をもたらし得るかを示す。図64Fは、どのようにしてゲノム上の2つの異なるSSR標的部位の挿入がDNAドナー鋳型からのカセットを交換するために用いられ得るかを示す。さらなる詳細は例17を見よ。Figures 64A-64F are schematic diagrams showing the introduction of various site-specific recombinase (SSR) targets onto a genome using PE. Figure 64A provides a general schematic diagram of the insertion of a recombinase target sequence by a primed editor. Figure 64B shows how a single SSR target inserted by PE can be used as a site for genomic incorporation of a DNA donor template. Figure 64C shows how tandem insertion of SSR target sites can be used to delete a portion of a genome. Figure 64D shows how tandem insertion of SSR target sites can be used to invert a portion of a genome. Figure 64E shows how insertion of two SSR target sites at two distal chromosomal regions can result in a chromosomal translocation. Figure 64F shows how insertion of two different SSR target sites on a genome can be used to exchange a cassette from a DNA donor template. See Example 17 for further details.

図65は、1)ヒト細胞ゲノム上のSSR標的部位のPEによって媒介される合成および2)GFP発現マーカーを含むDNAドナー鋳型を取り入れするためのそのSSR標的部位の使用を示す。ひとたび首尾良く取り入れられると、GFPは細胞が蛍光発光することを引き起こす。さらなる詳細は例17を見よ。Figure 65 shows 1) PE-mediated synthesis of an SSR target site on the genome of a human cell and 2) use of that SSR target site to incorporate a DNA donor template containing a GFP expression marker. Once successfully incorporated, the GFP causes the cell to fluoresce. See Example 17 for further details.

図66は、2つのPEの半分のタンパク質として提供されているプライム編集因子の1つの態様を図示する。これらは、プライム編集因子の半分のタンパク質の夫々の終わりまたは始まりに位置付けられた分裂インテインの半分同士の自己スプライシング作用によって、丸ごとのプライム編集因子を再生する。Figure 66 illustrates one embodiment of a prime editor provided as two PE half proteins that regenerate the entire prime editor by the self-splicing action of the split intein halves located at the end or beginning of each of the prime editor half proteins.

図67は、N末端およびC末端エクステイン配列の間におけるポリペプチド配列からのインテイン除去およびペプチド結合の再形成の機序を図示する。(a)は、夫々がインテイン配列の半分を含有する2つの半分のタンパク質の一般的な機序を図示する。これらは、細胞内で接触するときに、完全に機能的なインテインをもたらす。これは、それから、自己スプライシングおよび切除を経過する。切除のプロセスはN末端のタンパク質の半分(または「Nエクステイン」)およびC末端のタンパク質の半分(または「Cエクステイン」)の間におけるペプチド結合の形成をもたらして、NエクステインおよびCエクステイン部分を含む丸ごとの単一ポリペプチドを形成する。種々の態様において、Nエクステインは分裂されたプライム編集因子融合タンパク質のN末端の半分に対応し得、Cエクステインは分裂されたプライム編集因子のC末端の半分に対応し得る。(b)は、インテイン切除とNエクステインの半分(赤色をした半分)およびCエクステインの半分(青色をした半分)を連結するペプチド結合の再形成との化学的機序を示す。それにはトランスで提供される2つの別個の構成要素のスプライシング作用が関わるので、分裂インテイン(すなわち、分裂インテイン構成でのNインテインおよびCインテイン)の切除は「トランススプライシング」ともまた言われ得る。FIG. 67 illustrates the mechanism of intein removal from a polypeptide sequence and reformation of a peptide bond between the N- and C-terminal extein sequences. (a) illustrates the general mechanism of two half proteins, each containing half of an intein sequence. When they come into contact in a cell, they result in a fully functional intein. This then undergoes self-splicing and excision. The excision process results in the formation of a peptide bond between the N-terminal protein half (or "N-extein") and the C-terminal protein half (or "C-extein") to form a whole single polypeptide containing the N-extein and C-extein portions. In various embodiments, the N-extein can correspond to the N-terminal half of a split prime editor fusion protein, and the C-extein can correspond to the C-terminal half of a split prime editor. (b) illustrates the chemical mechanism of intein excision and reformation of the peptide bond linking the N-extein half (half in red) and the C-extein half (half in blue). The excision of a split intein (i.e., the N intein and C intein in a split-intein configuration) can also be referred to as "trans-splicing" since it involves the splicing action of two separate components provided in trans.

図68Aは、HEK293T細胞にコトランスフェクションされるときに、リンカーにおけるSpPE(配列番号762)の分裂インテインの半分同士両方の送達が3つの試験座位において活性を維持するということを実証する。Figure 68A demonstrates that delivery of both split-intein halves of SpPE (SEQ ID NO: 762) in a linker maintains activity at the three test loci when co-transfected into HEK293T cells.

図68Bは、HEK293T細胞にコトランスフェクションされるときに、SaPE2(例えば、配列番号443および配列番号450)の分裂インテインの半分同士両方の送達が全長SaPE2(配列番号134)の活性を再現するということを実証する Figure 68B demonstrates that delivery of both split-intein halves of SaPE2 (e.g., sequence number 443 and sequence number 450) recapitulates the activity of full-length SaPE2 (sequence number 134) when cotransfected into HEK293T cells .

用符で指示されている残基はSaCas 9のアミノ酸741-743(C末端エクステインの最初の残基)の配列であり、これらはインテイントランススプライシング反応にとって重要である。「SMP」はネイティブな残基である。我々はこれらを「CFN」コンセンサススプライシング配列へもまた変異させた。プライム編集パーセンテージによって測定されるとおり、コンセンサス配列は最も高い再構成を生むことが示されている。 The residues indicated in quotation marks are the sequence of amino acids 741-743 of SaCa s 9 (the first residues of the C-terminal extein), which are important for the intein trans-splicing reaction. "SMP" are the native residues. We also mutated these to the "CFN" consensus splicing sequence. The consensus sequence has been shown to yield the highest rearrangements, as measured by prime editing percentage.

図68Cは、種々の開示されるPEリボヌクレオタンパク質複合体(高濃度のPE2、高濃度のPE3、および低濃度のPE3)がこの様式で送達され得るということを示すデータを提供する。Figure 68C provides data showing that a variety of the disclosed PE ribonucleoprotein complexes (high concentration PE2, high concentration PE3, and low concentration PE3) can be delivered in this manner.

図69は、PANCEにおけるPE有効性を決定するためのバクテリオファージプラークアッセイを示す。プラーク(暗色の円)は首尾良くE.coliに感染する能力があるファージを指示する。L-ラムノースの濃度を増大させることは、PEの増大した発現およびプラーク形成の増大をもたらす。プラークの配列決定は、PEによって組み入れされるゲノム編集の存在を明らかにした。Figure 69 shows a bacteriophage plaque assay to determine PE efficacy in PANCE. Plaques (dark circles) indicate phages capable of successfully infecting E. coli. Increasing the concentration of L-rhamnose results in increased expression of PE and increased plaque formation. Plaque sequencing revealed the presence of genome edits incorporated by PE.

図70A~70Iは、プライム編集のためのPEgRNAおよびニッキングsgRNAをデザインするためのステップバイステップの説明書の例解として、編集された標的配列の例を提供する。図70A:ステップ1.標的配列および編集を定める。所望の編集(点変異、挿入、欠失、またはそれらの組み合わせ)の位置付けを中心にした標的DNA領域(~200bp)の配列をリトリーブする。図70B:ステップ2.標的PAMを位置付ける。編集位置付けに対して近位のPAMを同定する。両鎖上のPAMを探すように気をつける。編集位置に近接するPAMが好ましいが、編集位置から≧30ntにニックを置くプロトスペーサーおよびPAMを用いて編集を組み入れることが可能である。図70C:ステップ3.ニック部位を位置付ける。考慮されようとする各PAMについて、対応するニック部位を同定する。Sp Cas9 H840Aニッカーゼでは、切断はPAM含有鎖上においてNGG PAMの5'の第3および第4の塩基の間で生起する。全ての編集されるヌクレオチドはニック部位の3'に存在しなければならない。そのため、適当なPAMがPAM含有鎖上の標的編集の5'にニックを置かなければならない。下で示されている例では、2つの可能なPAMがある。単純のために、残りのステップはPAM 1のみを用いるPEgRNAのデザインを実証する。図70D:ステップ4.スペーサー配列をデザインする。Sp Cas9のプロトスペーサーは、PAM含有鎖上のNGG PAMの5'の20ヌクレオチドに対応する。効率的なPol III転写開始はGが第1の転写されるヌクレオチドであることを要求する。プロトスペーサーの第1のヌクレオチドがGである場合には、PEgRNAのスペーサー配列は単純にプロトスペーサー配列である。プロトスペーサーの第1のヌクレオチドがGではない場合には、PEgRNAのスペーサー配列は、G、次にプロトスペーサー配列である。図70E:ステップ5.プライマー結合部位(PBS)をデザインする。出発アレル配列を用いて、PAM含有鎖上のDNAプライマーを同定する。DNAプライマーの3'端はニック部位のちょうど上流のヌクレオチドである(すなわち、Sp Cas9ではNGG PAMの5'の第4の塩基)。PE2およびPE3への使用のための一般的なデザイン原理としては、DNAプライマーに対する相補性の12から13ヌクレオチドを含有するPEgRNAプライマー結合部位(PBS)が、~40-60%のGC含量を含有する配列に用いられ得る。低いGC含量を有する配列では、より長い(14から15nt)PBSが試験されるべきである。より高いGC含量を有する配列では、より短い(8から11nt)PBSが試験されるべきである。GC含量にかかわらず、最適なPBS配列は経験的に決定されるはずである。長さpのPBS配列をデザインするためには、出発アレル配列を用いて、PAM含有鎖上のニック部位の5'の最初のpヌクレオチドの逆相補体を取る。図70F:ステップ6.RT鋳型をデザインする。RT鋳型は、デザインされた編集と編集に隣接する配列に対する相同性とをコードする。最適なRT鋳型長さは標的部位に基づいて変わる。ショートレンジ編集(位置+1から+6)では、短い(9から12nt)、中程度の(13から16nt)、および長い(17から20nt)RT鋳型を試験することが推奨される。ロングレンジ編集(位置+7以降)では、十分な3'DNAフラップ相同性を許すために、編集の位置を越えて少なくとも5nt(好ましくは10nt以上)伸長するRT鋳型を用いることが推奨される。ロングレンジ編集では、機能的なデザインを同定するためには、いくつかのRT鋳型がスクリーニングされるべきである。より大きい挿入および欠失(≧5nt)では、RT鋳型上へのより多大な3'相同性(~20nt以上)の組み込みが推奨される。RT鋳型が、逆転写されるDNA産物上の最後のヌクレオチドとしてG(PEgRNAのRT鋳型ではCに対応する)の合成をコードするときには、編集効率は典型的には損なわれる。多くのRT鋳型が効率的なプライム編集を支持するので、RT鋳型をデザインするときには、最後の合成されるヌクレオチドとしてのGの回避が推奨される。長さrのRT鋳型配列をデザインするためには、所望のアレル配列を用い、元々はPAMを含有した鎖上のニック部位の3'の最初のrヌクレオチドの逆相補体を取る。SNP編集と比較して、同じ長さのRT鋳型を用いる挿入または欠失編集は同一の相同性を含有しないであろうということに注意。図70G:ステップ7.完全なPEgRNA配列をアセンブリする。PEgRNA構成要素を次の順序でコンカテネーションする(5'から3'):スペーサー、骨格、RT鋳型、およびPBS。図70H:ステップ8.PE3のためのニッキングsgRNAをデザインする。編集の上流および下流の非編集鎖上のPAMを同定する。最適なニッキング位置は高度に座位依存性であり、経験的に決定されるはずである。一般的に、PEgRNAによって誘導されるニックの向かいの位置の40から90ヌクレオチド5'に置かれたニックは、より高い編集収量およびより少数のインデルに至る。ニッキングsgRNAは、出発アレル上の20ntプロトスペーサーにマッチするスペーサー配列を有する。プロトスペーサーがGで始まらない場合には5'Gの追加を有する。図70I:ステップ9.PE3bニッキングsgRNAをデザインする。PAMが相補鎖上に存在し、かつその対応するプロトスペーサーが編集のために標的化される配列とオーバーラップする場合には、この編集はPE3bシステムの候補であり得る。PE3bシステムでは、ニッキングsgRNAのスペーサー配列は出発アレルではなく所望の編集されるアレルの配列にマッチする。編集されるヌクレオチド(単数または複数)がニッキングsgRNAプロトスペーサーのシード領域(PAMに隣接する~10nt)内に収まるときには、PE3bシステムは効率的に作動する。これは、編集された鎖の組み入れ後まで相補鎖のニッキングを防止し、標的DNAに結合することについてのPEgRNAおよびsgRNAの間の競合を防止する。PE3bは、両方の鎖上の同時のニックの生成をもまた回避し、それゆえに、高い編集効率を維持しながらインデル形成を有意に縮減する。PE3b sgRNAは、所望のアレルの20ntプロトスペーサーにマッチするスペーサー配列を有するはずである。必要とされる場合には5'Gの追加を有する。Figures 70A-70I provide examples of edited target sequences as an illustration of step-by-step instructions for designing PEgRNAs and nicking sgRNAs for prime editing. Figure 70A: Step 1. Define target sequence and edit. Retrieve the sequence of the target DNA region (~200 bp) centered on the location of the desired edit (point mutation, insertion, deletion, or combination thereof). Figure 70B: Step 2. Locate the target PAM. Identify the PAM proximal to the edit location. Take care to look for PAMs on both strands. Although a PAM proximal to the edit location is preferred, it is possible to incorporate an edit using a protospacer and PAM that places the nick ≥ 30 nt from the edit location. Figure 70C: Step 3. Locate the nick site. For each PAM to be considered, identify the corresponding nick site. For Sp Cas9 H840A nickase, cleavage occurs on the PAM-containing strand between the third and fourth bases 5' of the NGG PAM. All edited nucleotides must be 3' to the nick site. Therefore, an appropriate PAM must nick 5' to the target edit on the PAM-containing strand. In the example shown below, there are two possible PAMs. For simplicity, the remaining steps demonstrate the design of a PEgRNA using only PAM 1. Figure 70D: Step 4. Design the spacer sequence. The protospacer of SpCas9 corresponds to the 20 nucleotides 5' of the NGG PAM on the PAM-containing strand. Efficient Pol III transcription initiation requires that G be the first transcribed nucleotide. If the first nucleotide of the protospacer is G, then the spacer sequence of the PEgRNA is simply the protospacer sequence. If the first nucleotide of the protospacer is not G, then the spacer sequence of the PEgRNA is G, then the protospacer sequence. Figure 70E: Step 5. Design the primer binding site (PBS). Using the starting allele sequence, identify a DNA primer on the PAM-containing strand. The 3' end of the DNA primer is the nucleotide just upstream of the nick site (i.e., the fourth base 5' of the NGG PAM for SpCas9). As a general design principle for use with PE2 and PE3, a PEgRNA primer binding site (PBS) containing 12 to 13 nucleotides of complementarity to the DNA primer can be used for sequences containing 40-60% GC content. For sequences with low GC content, longer (14 to 15 nt) PBSs should be tested. For sequences with higher GC content, shorter (8 to 11 nt) PBSs should be tested. Regardless of GC content, optimal PBS sequences should be determined empirically. To design a PBS sequence of length p, use the starting allele sequence to take the reverse complement of the first p nucleotides 5' of the nick site on the PAM-containing strand. Figure 70F: Step 6. Design the RT template. The RT template encodes the designed edit and homology to sequences flanking the edit. Optimal RT template length will vary based on the target site. For short-range editing (positions +1 to +6), it is recommended to test short (9 to 12 nt), medium (13 to 16 nt), and long (17 to 20 nt) RT templates. For long-range editing (positions +7 and beyond), it is recommended to use an RT template that extends at least 5 nt (preferably 10 nt or more) beyond the position of editing to allow sufficient 3' DNA flap homology. For long-range editing, several RT templates should be screened to identify functional designs. For larger insertions and deletions (≥ 5 nt), incorporation of more 3' homology (~20 nt or more) on the RT template is recommended. Editing efficiency is typically compromised when the RT template codes for the synthesis of G (corresponding to C in the RT template for PEgRNA) as the last nucleotide on the reverse transcribed DNA product. Because many RT templates support efficient prime editing, avoidance of G as the last synthesized nucleotide is recommended when designing the RT template. To design an RT template sequence of length r, use the desired allele sequence and take the reverse complement of the first r nucleotides 3' of the nick site on the strand that originally contained the PAM. Note that, compared to SNP editing, an insertion or deletion edit using an RT template of the same length will not contain identical homology. Figure 70G: Step 7. Assemble the complete PEgRNA sequence. Concatenate the PEgRNA components in the following order (5' to 3'): spacer, backbone, RT template, and PBS. Figure 70H: Step 8. Design a nicking sgRNA for PE3. Identify PAMs on the non-edited strand upstream and downstream of the edit. The optimal nicking position is highly locus-dependent and should be determined empirically. In general, a nick placed 40 to 90 nucleotides 5' opposite the PEgRNA-induced nick leads to higher editing yields and fewer indels. The nicking sgRNA has a spacer sequence that matches the 20 nt protospacer on the starting allele. If the protospacer does not begin with a G, then have a 5' G added. Figure 70I: Step 9. Design a PE3b nicking sgRNA. If a PAM is present on the complementary strand and its corresponding protospacer overlaps with the sequence targeted for editing, then this edit may be a candidate for the PE3b system. In the PE3b system, the spacer sequence of the nicking sgRNA matches the sequence of the desired edited allele, not the starting allele. The PE3b system works efficiently when the nucleotide(s) to be edited fall within the seed region (~10 nt adjacent to the PAM) of the nicking sgRNA protospacer. This prevents nicking of the complementary strand until after incorporation of the edited strand, preventing competition between the PEgRNA and the sgRNA for binding to the target DNA. PE3b also avoids the generation of nicks on both strands simultaneously, thus significantly reducing indel formation while maintaining high editing efficiency. The PE3b sgRNA should have a spacer sequence that matches the 20 nt protospacer of the desired allele, with the addition of a 5' G if needed.

図71AはSpCas9 PEgRNA分子(上側)のヌクレオチド配列を示す。これは3'端において「UUU」で終結し、トウループエレメントを含有しない。図の下方の部分は同じSpCas9 PEgRNA分子を図示するが、「UUU」3'端の直ちに前に挿入された配列5'-「GAAANNNNN」-3'を有するトウループエレメントを含有するようにさらに改変される。「N」はいずれかの核酸塩基であり得る。Figure 71A shows the nucleotide sequence of the SpCas9 PEgRNA molecule (top), which terminates at the 3' end with "UUU" and does not contain a toe loop element. The lower portion of the figure illustrates the same SpCas9 PEgRNA molecule, but further modified to contain a toe loop element with the sequence 5'-"GAAANNNNN"-3' inserted immediately prior to the "UUU" 3' end. "N" can be any nucleobase.

図71Bは例18の結果を示す。これは、HEK細胞またはEMX細胞におけるプライム編集の効率がトウループエレメントを含有するPEgRNAを用いて増大させられるが、インデル形成のパーセントは大きくは変化なしであるということを実証する。Figure 71B shows the results of Example 18, demonstrating that the efficiency of prime editing in HEK or EMX cells is increased using a PEgRNA containing a toe loop element, while the percentage of indel formation remains largely unchanged.

図72A~72Cはプライム編集に用いられ得る代替的なPEgRNA構成を図示する。図72Aはプライム編集のPE2:PEgRNA態様を図示する。この態様には、PEgRNAと複合体化したPE2(Cas9および逆転写酵素を含む融合タンパク質)が関わる(図1A-1Iおよび/または図3A-3Eにもまた記載されているとおり)。この態様では、逆転写の鋳型がsgRNAの3’伸長アーム上に組み込まれてPEgRNAを作り、DNAポリメラーゼ酵素はCas9に直接的に融合された逆転写酵素(RT)である。図72BはMS2cp-PE2:sgRNA+tPERT態様を図示する。この態様は、PE2融合体(Cas9+逆転写酵素)を含み、これがさらにMS2バクテリオファージコートタンパク質(MS2cp)に融合されてMS2cp-PE2融合タンパク質を形成する。プライム編集を達成するためには、MS2cp-PE2融合タンパク質はsgRNAと複合体化させられ、これは複合体をDNA上の特異的な標的部位へと標的化する。それから、態様には、トランスプライム編集RNA鋳型(「tPERT」)の導入が関わり、これは、プライマー結合部位(PBS)およびDNA合成鋳型を別個の分子、すなわちtPERTによって提供することによって、PEgRNAの代わりに作動する。これはMS2アプタマー(ステムループ)をもまた備える。MS2cpタンパク質は分子のMS2アプタマーに結合することによってtPERTを動員する。図72Cは、核酸分子の化学合成のための公知の方法によって達成され得るPEgRNAの代替的なデザインを図示する。例えば、プライム編集への使用のためのハイブリッドRNA/DNA PEgRNA分子を合成するために、化学合成が用いられ得、ハイブリッドPEgRNAの伸長アームはRNAの代わりにDNAである。かかる態様では、プライム編集によって形成される所望の遺伝子変化を含む3'DNAフラップを合成するために、DNA依存性DNAポリメラーゼが逆転写酵素の代わりに用いられ得る。別の態様では、伸長アームは、化学的リンカーを包含するように合成され得、これは、DNAポリメラーゼ(例えば逆転写酵素)がsgRNA骨格またはバックボーンを鋳型として用いることを防止する。なお別の態様では、伸長アームは、PEgRNA分子の総体的な向きに対して相対的に逆の向きを有するDNA合成鋳型を含み得る。例えば、sgRNA骨格の3'端に取り付けられた伸長を有するかつ5'から3'の向きのPEgRNAについて示されるとおりでは、DNA合成鋳型は、対向する方向、すなわち3'から5'の方向を向く。この態様は、gRNAの3’端に位置取った伸長アームを有するPEgRNA態様にとって有利であり得る。伸長アームの向きを逆にすることによって、ひとたびそれが伸長アームの新たな向きの5’に達すると、ポリメラーゼ(例えば逆転写酵素)によるDNA合成は終結し、それゆえに、鋳型としてgRNAコアを用いるリスクがないであろう。Figures 72A-72C illustrate alternative PEgRNA configurations that can be used for prime editing. Figure 72A illustrates the PE2:PEgRNA embodiment of prime editing. This embodiment involves PE2 (a fusion protein comprising Cas9 and reverse transcriptase) complexed with PEgRNA (as also depicted in Figures 1A-1I and/or Figures 3A-3E). In this embodiment, a reverse transcription template is incorporated onto the 3' extension arm of the sgRNA to make the PEgRNA, and the DNA polymerase enzyme is reverse transcriptase (RT) fused directly to Cas9. Figure 72B illustrates the MS2cp-PE2:sgRNA+tPERT embodiment. This embodiment includes a PE2 fusion (Cas9+reverse transcriptase), which is further fused to the MS2 bacteriophage coat protein (MS2cp) to form the MS2cp-PE2 fusion protein. To achieve prime editing, the MS2cp-PE2 fusion protein is complexed with sgRNA, which targets the complex to a specific target site on DNA. Then, embodiments involve the introduction of a trans-prime editing RNA template ("tPERT"), which acts in place of the PEgRNA by providing a primer binding site (PBS) and a DNA synthesis template by a separate molecule, i.e., tPERT. It also comprises an MS2 aptamer (stem loop). The MS2cp protein recruits tPERT by binding to the MS2 aptamer of the molecule. Figure 72C illustrates alternative designs of PEgRNA that can be achieved by known methods for chemical synthesis of nucleic acid molecules. For example, chemical synthesis can be used to synthesize a hybrid RNA/DNA PEgRNA molecule for use in prime editing, where the extension arm of the hybrid PEgRNA is DNA instead of RNA. In such embodiments, a DNA-dependent DNA polymerase can be used in place of reverse transcriptase to synthesize a 3' DNA flap containing the desired genetic change formed by prime editing. In another embodiment, the extension arm can be synthesized to include a chemical linker, which prevents the DNA polymerase (e.g., reverse transcriptase) from using the sgRNA backbone or backbone as a template. In yet another embodiment, the extension arm can include a DNA synthesis template that has a reverse orientation relative to the overall orientation of the PEgRNA molecule. For example, as shown for a PEgRNA with an extension attached to the 3' end of the sgRNA backbone and in a 5' to 3' orientation, the DNA synthesis template faces the opposite direction, i.e., 3' to 5'. This embodiment can be advantageous for PEgRNA embodiments with an extension arm positioned at the 3' end of the gRNA. By reversing the orientation of the extension arm, DNA synthesis by the polymerase (e.g., reverse transcriptase) will terminate once it reaches the 5' of the new orientation of the extension arm, and therefore there will be no risk of using the gRNA core as a template.

図73はtPERTおよびMS2動員システム(MS2タグ付け技術としてもまた公知)によるプライム編集を実証する。プライム編集因子タンパク質(PE2)を標的座位へと標的化するsgRNAが、プライマー結合部位(13ntまたは17nt PBS)、His6タグ挿入および相同アームをコードするRT鋳型、ならびにMS2アプタマー(tPERT分子の5'または3'端に位置付けられる)を含有するtPERTとの組み合わせで発現される。プライム編集因子タンパク質(PE2)、またはPE2のN末端へのMS2cpの融合体どちらかが用いられた。先に開発されたPE3システムのとおり、相補鎖ニッキングsgRNAありまたはなしで、編集が実行された(夫々標識「PE2+ニック」または「PE2」としてx軸上に指定されている)。これは「第2鎖ニッキング」ともまた言われ、本願において定められる。Figure 73 demonstrates prime editing by tPERT and the MS2 recruitment system (also known as MS2 tagging technology). An sgRNA targeting the prime editor protein (PE2) to the target locus is expressed in combination with tPERT containing a primer binding site (13nt or 17nt PBS), a RT template encoding a His6 tag insert and homology arms, and an MS2 aptamer (located at the 5' or 3' end of the tPERT molecule). Either the prime editor protein (PE2) or a fusion of MS2cp to the N-terminus of PE2 was used. As with the previously developed PE3 system, editing was performed with or without a complementary strand nicking sgRNA (designated on the x-axis as labeled "PE2+nick" or "PE2", respectively). This is also referred to as "second strand nicking" and is defined herein.

図74は、トランスでの逆転写酵素のMS2アプタマー発現とMS2アプタマーシステムによるその動員とを実証する。PEgRNAのPEgRNAは2つのsgRNA骨格ヘアピンのどちらか1つに挿入されたMS2 RNAアプタマーを含有する。野生型M-MLV逆転写酵素はMS2コートタンパク質(MCP)へのN末端またはC末端融合体として発現される。編集はHEK293T細胞のHEK3部位においてである。Figure 74 demonstrates the MS2 aptamer expression of reverse transcriptase in trans and its recruitment by the MS2 aptamer system. The PEgRNA contains the MS2 RNA aptamer inserted into either one of the two sgRNA backbone hairpins. Wild-type M-MLV reverse transcriptase is expressed as an N- or C-terminal fusion to the MS2 coat protein (MCP). Editing is at the HEK3 site in HEK293T cells.

図75は、PE2、PE2-trunc、PE3、およびPE3-truncの効率(すなわち「規定された編集またはインデルを有する配列決定総読取の%」)を種々の細胞株の異なる標的部位について比較する棒グラフを提供する。データは、短縮されたRTバリアントを含むプライム編集因子が短縮されていないRTタンパク質を含むプライム編集因子と約同じくらい効率的であったということを示す。Figure 75 provides a bar graph comparing the efficiency (i.e., "% of total sequencing reads with a defined edit or indel") of PE2, PE2-trunc, PE3, and PE3-trunc for different target sites in various cell lines. The data show that prime editors containing truncated RT variants were about as efficient as prime editors containing the untruncated RT protein.

図76は例20のインテイン分裂プライム編集因子の編集効率を実証する。HEK239T細胞が、全長PE2またはインテイン分裂PE2、PEgRNA、およびニッキングガイドRNAをコードするプラスミドによってトランスフェクションされた。コンセンサス配列(C末端エクステインのほとんどのアミノ末端残基)が指示されている。2つの部位におけるパーセント編集が示されている:HEK3 +1CTT挿入およびPRNP +6GからT。レプリケートn=3つの独立したトランスフェクション。例20を見よ。Figure 76 demonstrates the editing efficiency of the intein split prime editor of Example 20. HEK239T cells were transfected with plasmids encoding full length PE2 or intein split PE2, PEgRNA, and a nicking guide RNA. The consensus sequence (most amino terminal residue of the C-terminal extein) is indicated. Percent editing at two sites is shown: HEK3 +1 CTT insertion and PRNP +6 G to T. Replicate n=3 independent transfections. See Example 20.

図77は例20のインテイン分裂プライム編集因子の編集効率を実証する。編集は、ICV注射によるP0マウスへのSpPE3半分当たり5E10vgおよび小量1E10の核局在GFP:KASHの送達によって、バルクの皮質およびGFP+亜集団の標的化されたディープ配列決定によって評価された。編集因子およびGFPがEFSプロモーターを有するAAV9にパッケージングされた。マウスが注射の3週間後に収穫され、GFP+核がフローサイトメトリーによって単離された。個々のデータポイントは、分析された条件当たり1-2マウスで示されている。例20を見よ。Figure 77 demonstrates the editing efficiency of the intein split-primed editing factor of Example 20. Editing was assessed by delivery of 5E10vg and a small amount of 1E10 nuclear-localized GFP:KASH per half SpPE3 to P0 mice by ICV injection, and by targeted deep sequencing of bulk cortical and GFP+ subpopulations. Editing factors and GFP were packaged into AAV9 with an EFS promoter. Mice were harvested 3 weeks after injection and GFP+ nuclei were isolated by flow cytometry. Individual data points are shown for 1-2 mice per condition analyzed. See Example 20.

図78は例20のインテイン分裂プライム編集因子の編集効率を実証する。具体的には、図は例20に用いるAV分裂SpPE3構築物を図示する。SpPE3-NおよびSpPE3-Cを別個に発現するAAV粒子による共形質導入はPE3活性を再現する。N末端ゲノムはニッキングsgRNAを発現するU6-sgRNAカセットを含有し、C末端ゲノムはPEgRNAを発現するU6-PEgRNAカセットを含有するということに注意せよ。例20を見よ。Figure 78 demonstrates the editing efficiency of the intein split prime editor of Example 20. Specifically, the figure illustrates the AV split SpPE3 construct used in Example 20. Co-transduction with AAV particles expressing SpPE3-N and SpPE3-C separately recapitulates PE3 activity. Note that the N-terminal genome contains a U6-sgRNA cassette expressing a nicking sgRNA, and the C-terminal genome contains a U6-PEgRNA cassette expressing a PEgRNA. See Example 20.

図79は、例21で論じられるある種の最適化されたリンカーの編集効率を示す。特に、データは、リンカーが指示されている配列によって置き換えられた種々のバージョンと比較して、現行のリンカーを有するPE2構築物の編集効率(PE2と記される。白色のボックス)を、HEK3、EMX1、FANCF、RNF2座位において、トランジション、トランスバージョン、挿入、および欠失編集の代表的なPEgRNAについて示す。置き換えリンカーは「1×SGGS」(配列番号174)、「2×SGGS」(配列番号446)、「3×SGGS」(配列番号3889)、「1×XTEN」(配列番号171)、「リンカーなし」、「1×Gly」、「1×Pro」、「1×EAAAK」(配列番号3968)、「2×EAAAK」(配列番号3969)、および「3×EAAAK」(配列番号3970)と言われる。編集効率はPE2の「対照」編集効率に対して相対的に棒グラフフォーマットで測定される。PE2のリンカーはSGGSSGGSSGSETPGTSESATPESSGGSSGGSS(配列番号127)である。全ての編集はPE3システムという文脈でされた。すなわち、これはPE2編集構築物プラス最適な二次sgRNAニッキングガイドの追加を言う。例21を見よ。Figure 79 shows the editing efficiency of certain optimized linkers discussed in Example 21. In particular, the data shows the editing efficiency of the PE2 construct with the current linker (labeled PE2, white box) compared to various versions in which the linker was replaced by the indicated sequence for representative PEgRNAs for transition, transversion, insertion, and deletion edits at the HEK3, EMX1, FANCF, and RNF2 loci. The replacement linkers are referred to as "1xSGGS" (SEQ ID NO:174) , "2xSGGS" (SEQ ID NO:446) , "3xSGGS" (SEQ ID NO:3889) , "1xXTEN" (SEQ ID NO:171) , "No Linker", "1xGly", "1xPro", "1xEAAAK" (SEQ ID NO:3968) , "2xEAAAK" (SEQ ID NO:3969) , and "3xEAAAK" (SEQ ID NO:3970) . Editing efficiency is measured in a bar graph format relative to the "control" editing efficiency of PE2. The linker for PE2 is SGGSSGGSSGSETPGTSESATPESSGGSSGGSS (SEQ ID NO: 127). All edits were made in the context of the PE3 system. That is, this refers to the addition of the PE2 editing construct plus an optimal secondary sgRNA nicking guide. See Example 21.

PE2に対して相対的に平均の~倍の効力を取ることは、示されているグラフを生み、1×XTEN(配列番号171)リンカー配列の使用が編集効率を平均で1.14倍改善するということを指示する(n=15)。例21を見よ。Taking the average fold potency relative to PE2 produces the graph shown, indicating that use of the 1×XTEN (SEQ ID NO: 171) linker sequence improves editing efficiency by an average of 1.14-fold (n=15). See Example 21.

図81は、例22に記載されているとおり、異なるプロモーターからのPEgRNAの転写レベルを図示する。FIG. 81 illustrates the transcription levels of PEgRNA from different promoters, as described in Example 22.

例22に図示されているとおり、未改変のPEgRNAに対して相対的な編集効率に対するPEgRNA構造上の異なる型の修飾のインパクト。As illustrated in Example 22, the impact of different types of modifications on the PEgRNA structure on the editing efficiency relative to unmodified PEgRNA.

図83は、HEK3遺伝子の編集を標的化したPE実験を図示する。ニック部位に対して相対的に位置+1における10nt挿入の挿入を特異的に標的化し、PE3を用いた。例22を見よ。Figure 83 illustrates a PE experiment that targeted editing of a HEK3 gene. The insertion of a 10 nt insertion at position +1 relative to the nick site was specifically targeted and PE3 was used. See Example 22.

図84Aは、スペーサー、gRNAコア、および伸長アーム(RT鋳型+プライマー結合部位)を有する例示のPEgRNAを図示する。これは、UCUリンカーを介してカップリングされたtRNA分子によってPEgRNAの3'端を修飾されている。tRNAは種々の転写後修飾を包含する。しかしながら、前記修飾は要求されない。Figure 84A illustrates an exemplary PEgRNA with a spacer, gRNA core, and extension arm (RT template + primer binding site). It is modified at the 3' end of the PEgRNA with a tRNA molecule coupled via a UCU linker. The tRNA includes various post-transcriptional modifications. However, the modifications are not required.

図84Bは、PEgRNA構造を改変するために用いられ得るtRNAの構造を図示する。例22を見よ。P1は長さが可変であり得る。P1は、PEgRNA-tRNA融合体のRNAsePプロセシングを防止することを助けるように伸長され得る。Figure 84B illustrates the structure of a tRNA that can be used to modify the PEgRNA structure. See Example 22. P1 can be variable in length. P1 can be elongated to help prevent RNAse P processing of the PEgRNA-tRNA fusion.

図85はFANCF遺伝子の編集を標的化したPE実験を図示する。ニック部位に対して相対的に位置+5におけるGからTの変換を特異的に標的化し、PE3構築物を用いた。例22を見よ。Figure 85 illustrates a PE experiment that targeted editing of the FANCF gene. The G to T conversion at position +5 relative to the nick site was specifically targeted and used the PE3 construct. See Example 22.

図86はHEK3遺伝子の編集を標的化したPE実験を図示する。ニック部位に対して相対的に位置+1における71nt FLAGタグ挿入の挿入を特異的に標的化し、PE3構築物を用いた。例22を見よ。Figure 86 illustrates a PE experiment that targeted editing of the HEK3 gene. The insertion of a 71 nt FLAG tag insertion at position +1 relative to the nick site was specifically targeted using the PE3 construct. See Example 22.

pegRNAが1412Adelを組み入れるN2A細胞のスクリーニングからの結果と、プライマー結合部位(PBS)長さおよび逆転写酵素(RT)鋳型長さの詳細(インデルありおよびなしで示されている)。例23を見よ。Results from screening of N2A cells where pegRNA incorporates 1412Adel, with details of primer binding site (PBS) length and reverse transcriptase (RT) template length shown with and without indels. See Example 23.

pegRNAが1412Adelを組み入れるN2A細胞のスクリーニングからの結果と、プライマー結合部位(PBS)長さおよび逆転写酵素(RT)鋳型長さの詳細(インデルありおよびなしで示されている)。例23を見よ。Results from screening of N2A cells where pegRNA incorporates 1412Adel, with details of primer binding site (PBS) length and reverse transcriptase (RT) template length shown with and without indels. See Example 23.

図89は、健康なHSCのβ-グロビン遺伝子の近位(proxy)座位におけるおよびHEK3における編集の結果を図示する。編集因子対pegRNAおよびニッキングgRNAの濃度を変えている。例23を見よ。Figure 89 illustrates the results of editing at the proxy locus of the β-globin gene in healthy HSCs and in HEK3. Varying concentrations of editing factors versus pegRNA and nicking gRNA. See Example 23.

定義
別様に定められない限り、本願において用いられる全ての技術的および科学的用語は、本発明が属する分野の業者によって普通に理解される意味を有する。次の参照は、本発明に用いられる用語の多くの一般的な定義を当業者に提供する:Singleton et al.,Dictionary of Microbiology and Molecular Biology(2nd ed.1994);The Cambridge Dictionary of Science and Technology(Walker ed.,1988);The Glossary of Genetics,5th Ed.,R.Rieger et al.(eds.),Springer Verlag(1991);およびHale & Marham,The Harper Collins Dictionary of Biology(1991)。別様に規定されない限り、本願において用いられる次の用語はそれらに帰せられる意味を有する。
Definitions : Unless otherwise specified, all technical and scientific terms used in this application have the meanings commonly understood by those skilled in the art to which this invention belongs. The following references provide those skilled in the art with general definitions of many of the terms used in this invention: Singleton et al., Dictionary of Microbiology and Molecular Biology (2nd ed. 1994); The Cambridge Dictionary of Science and Technology (Walker ed., 1988); The Glossary of Genetics, 5th Ed., R. Rieger et al. (eds.), Springer Verlag (1991); and Hale & Marham, The Harper Collins Dictionary of Biology (1991). Unless otherwise specified, the following terms used in this application have the meanings ascribed to them.

アンチセンス鎖
遺伝学において、二本鎖のDNA内のセグメントの「アンチセンス」鎖は、鋳型鎖であって、3'→5'配向に伸びる(runs)と考えられる。これに反して、「センス」鎖は、5'から3'へ伸びる二本鎖のDNA内のセグメントであって、3'から5'へ伸びるDNAのアンチセンス鎖または鋳型鎖に相補的である。タンパク質をコードするDNAセグメントのケースにおいて、センス鎖は、転写の最中にその鋳型としてアンチセンス鎖を取り結局(典型的には、常にではない)翻訳を経てタンパク質になるmRNAと同じ配列を有するDNAの鎖である。よって、アンチセンス鎖は、後にタンパク質へ翻訳されるRNAを担い、一方センス鎖は、mRNAとほぼ同一の組成(makeup)を保有する。dsDNAの各セグメントについて、一方がどの方向から読まれるかに応じて、おそらく(センスおよびアンチセンスは視点に相対するから)センスおよびアンチセンスが2組存在するであろう点に留意する。遺伝子産物またはmRNAは結局、dsDNAの一方のセグメントのどちらかの鎖がセンスまたはアンチセンスと称されることを示す。
Antisense strand In genetics, the "antisense" strand of a segment of double-stranded DNA is considered to be the template strand and runs in a 3'→5' orientation. In contrast, the "sense" strand is the segment of double-stranded DNA that runs 5' to 3' and is complementary to the antisense or template strand of the 3' to 5' DNA. In the case of a DNA segment that codes for a protein, the sense strand is the strand of DNA that has the same sequence as the mRNA that takes the antisense strand as its template during transcription and ends up (typically, but not always) being translated into a protein. Thus, the antisense strand carries the RNA that is then translated into a protein, while the sense strand possesses nearly identical makeup to the mRNA. Note that for each segment of dsDNA, there will likely be two sets of sense and antisense (since sense and antisense are relative viewpoints), depending on which direction one is read from. The gene product or mRNA ultimately refers to either strand of a segment of dsDNA, which is referred to as sense or antisense.

二重特異性リガンド
本願において用いられる用語「二重特異性リガンド」または「二重特異性部分」は、2つの異なるリガンド結合ドメインに結合するリガンドを言う。ある態様において、リガンドは低分子化合物またはペプチドまたはポリペプチドである。他の態様において、リガンド結合ドメインは「二量体化ドメイン」であり、これがペプチドタグとしてタンパク質上に組み入れられ得る。種々の態様では、同じかまたは異なる二量体化ドメインを夫々が含む2つのタンパク質が、二重特異性リガンドに対する各二量体化ドメインの結合によって二量体化するように誘導され得る。本願において用いられる「二重特異性リガンド」は同等に「二量体化の化学的誘導因子」または「CID」と言われ得る。
Dual-specific ligands The term "dual-specific ligand" or "dual-specific moiety" as used herein refers to a ligand that binds to two different ligand-binding domains. In some embodiments, the ligand is a small molecule compound or a peptide or polypeptide. In other embodiments, the ligand-binding domain is a "dimerization domain" that can be incorporated onto a protein as a peptide tag. In various embodiments, two proteins, each containing the same or different dimerization domains, can be induced to dimerize by binding of each dimerization domain to a dual-specific ligand. A "dual-specific ligand" as used herein can be equivalently referred to as a "chemical inducer of dimerization" or "CID".

Cas9
用語「Cas9」または「Cas9ヌクレアーゼ」は、Cas9ドメインまたはそのフラグメントを含む、RNAにガイドされるヌクレアーゼ(例として、Cas9の活性もしくは不活性なDNA切断ドメインおよび/またはCas9のgRNA結合ドメインを含むタンパク質)を指す。「Cas9ドメイン」は、本明細書に使用されるとき、Cas9の活性もしくは不活性な切断ドメインおよび/またはCas9のgRNA結合ドメインを含むタンパク質フラグメントである。「Cas9タンパク質」は、全長Cas9タンパク質である。Cas9ヌクレアーゼはまた、ときにcasn1ヌクレアーゼまたはCRISPR(クラスター化して規則的な配置の短い回文配列反復(Clustered Regularly Interspaced Short Palindromic Repeat))関連ヌクレアーゼとしても言及される。CRISPRは、可動遺伝因子(ウイルス、転移因子、および接合性プラスミド)に対して保護を提供する適応免疫系である。CRISPRクラスターは、スペーサー、先行する可動因子に相補的な配列、および標的化侵入核酸を含有する。CRISPRクラスターは転写され、プロセスを受けて(processed)CRISPR RNA(crRNA)になる。II型CRISPR系において、pre-crRNAの修正プロセシングは、transでコードされた低分子(small)RNA(tracrRNA)、内生リボヌクレアーゼ3(rnc)、およびCas9ドメインを要する。tracrRNAは、pre-crRNAの、リボヌクレアーゼ3に補助された(-aided)プロセシングのためのガイドとして働く。続いて、Cas9/crRNA/tracrRNAは、スペーサーに相補的な線状または環状のdsDNA標的をエンドヌクレアーゼ的に切断する。crRNAに相補的ではない標的鎖は、最初にエンドヌクレアーゼ的に切られ、次いで3'-5'エキソヌクレアーゼ的に切り取られる。本来、DNAの結合および切断は、典型的には、タンパク質および両RNAを要する。しかしながら、単一ガイドRNA(「sgRNA」、または単に「gNRA」)は、crRNAとtracrRNAとの両方の側面を単一RNA種中へ組み込むために、改変され得る。例として、Jinek M.,Chylinski K.,Fonfara I.,Hauer M.,Doudna J.A.,Charpentier E.Science 337:816-821(2012)を参照(この内容全体は参照により本明細書に組み込まれる)。Cas9は、CRISPR反復配列(PAMまたはプロトスペーサー隣接モチーフ)中の短いモチーフを認識することで、自己・対・非自己を区別するのに役立つ。Cas9ヌクレアーゼ配列および構造は当業者に周知である(例として、"Complete genome sequence of an M1 strain of Streptococcus pyogenes."Ferretti et al.,J.J.,McShan W.M.,Ajdic D.J.,Savic D.J.,Savic G.,Lyon K.,Primeaux C.,Sezate S.,Suvorov A.N.,Kenton S.,Lai H.S.,Lin S.P.,Qian Y.,Jia H.G.,Najar F.Z.,Ren Q.,Zhu H.,Song L.,White J.,Yuan X.,Clifton S.W.,Roe B.A.,McLaughlin R.E.,Proc.Natl.Acad.Sci.U.S.A.98:4658-4663(2001);"CRISPR RNA maturation by trans-encoded small RNA and host factor RNase III."Deltcheva E.,Chylinski K.,Sharma C.M.,Gonzales K.,Chao Y.,Pirzada Z.A.,Eckert M.R.,Vogel J.,Charpentier E.,Nature 471:602-607(2011);および"A programmable dual-RNA-guided DNA endonuclease in adaptive bacterial immunity."Jinek M.,Chylinski K.,Fonfara I.,Hauer M.,Doudna J.A.,Charpentier E.Science 337:816-821(2012)を参照(これら各々の内容全体は参照により本明細書に組み込まれる))。Cas9オルソログは、これらに限定されないが、S.pyogenesおよびS.thermophilusを包含する様々な種において記載されている。追加の好適なCas9ヌクレアーゼおよび配列は、本開示に基づき当業者に明らかであろう。またかかるCas9ヌクレアーゼおよび配列は、Chylinski, Rhun, and Charpentier,"The tracrRNA and Cas9 families of type II CRISPR-Cas immunity systems"(2013)RNA Biology 10:5,726-737(この内容全体は参照により本明細書に組み込まれる)に開示された生物および遺伝子座からのCas9配列を包含する。いくつかの態様において、Cas9ヌクレアーゼは、DNA切断ドメインを部分的に損なうかまたは不活性化させる1以上の突然変異を含む。
Cas9
The term "Cas9" or "Cas9 nuclease" refers to an RNA-guided nuclease that includes a Cas9 domain or a fragment thereof (e.g., a protein that includes an active or inactive DNA cleavage domain of Cas9 and/or a gRNA binding domain of Cas9). A "Cas9 domain" as used herein is a protein fragment that includes an active or inactive cleavage domain of Cas9 and/or a gRNA binding domain of Cas9. A "Cas9 protein" is a full - length Cas9 protein. Cas9 nuclease is also sometimes referred to as casn1 nuclease or CRISPR (Clustered Regularly Interspaced Short Palindromic Repeat) -associated nuclease. CRISPR is an adaptive immune system that provides protection against mobile genetic elements (viruses, transposable elements, and conjugative plasmids). CRISPR clusters contain a spacer, a sequence complementary to the preceding mobile element, and a targeting invading nucleic acid. CRISPR clusters are transcribed and processed into CRISPR RNA (crRNA). In type II CRISPR systems, corrective processing of pre-crRNA requires a trans-encoded small RNA (tracrRNA), an endogenous ribonuclease 3 (rnc), and a Cas9 domain. The tracrRNA acts as a guide for ribonuclease 3-aided processing of the pre-crRNA. Cas9/crRNA/tracrRNA then endonucleolytically cleaves linear or circular dsDNA targets that are complementary to the spacer. Target strands that are not complementary to the crRNA are first endonucleolytically cleaved and then 3'-5' exonucleolytically excised. In nature, DNA binding and cleavage typically require both proteins and RNAs. However, single guide RNAs ("sgRNAs", or simply "gNRAs") can be modified to incorporate aspects of both crRNA and tracrRNA into a single RNA species. See, for example, Jinek M., Chylinski K., Fonfara I., Hauer M., Doudna JA, Charpentier E. Science 337:816-821 (2012), the entire contents of which are incorporated herein by reference. Cas9 recognizes short motifs in the CRISPR repeats (PAM or protospacer adjacent motifs) to help distinguish self versus non-self. The Cas9 nuclease sequence and structure are well known to those skilled in the art (see, for example, "Complete genome sequence of an M1 strain of Streptococcus pyogenes." Ferretti et al., JJ, McShan WM, Ajdic DJ, Savic DJ, Savic G., Lyon K., Primeaux C., Sezate S., Suvorov AN, Kenton S., Lai HS, Lin SP, Qian Y., Jia HG, Najar FZ, Ren Q., Zhu H., Song L., White J., Yuan X., Clifton SW, Roe BA, McLaughlin RE, Proc. Natl. Acad. Sci. USA 98:4658-4663 (2001); "CRISPR RNA maturation by trans-encoded small RNA and host factor RNase III." Deltcheva E., Chylinski K., Sharma CM, Gonzales See Jinek M., Chao Y., Pirzada ZA, Eckert MR, Vogel J., Charpentier E., Nature 471:602-607 (2011); and "A programmable dual-RNA-guided DNA endonuclease in adaptive bacterial immunity." Jinek M., Chylinski K., Fonfara I., Hauer M., Doudna JA, Charpentier E. Science 337:816-821 (2012), the entire contents of each of which are incorporated herein by reference. Cas9 orthologs have been described in a variety of species, including, but not limited to, S. pyogenes and S. thermophilus. Additional suitable Cas9 nucleases and sequences will be apparent to one of skill in the art based on the present disclosure. Such Cas9 nucleases and sequences also include Cas9 sequences from the organisms and loci disclosed in Chylinski, Rhun, and Charpentier, "The tracrRNA and Cas9 families of type II CRISPR-Cas immunity systems" (2013) RNA Biology 10:5,726-737, the entire contents of which are incorporated herein by reference. In some embodiments, the Cas9 nuclease comprises one or more mutations that partially impair or inactivate the DNA cleavage domain.

ヌクレアーゼが不活性化されたCas9ドメインは、互換的に「dCas9」タンパク質(ヌクレアーゼが「不活性型」のCas9を表す)と称されてもよい。不活性なDNA切断ドメインを有するCas9ドメイン(またはそのフラグメント)を生成するための方法は知られている(例として、Jinek et al.,Science.337:816-821(2012);Qi et al.,"Repurposing CRISPR as an RNA-Guided Platform for Sequence-Specific Control of Gene Expression"(2013)Cell.28;152(5):1173-83を参照(これら各々の内容全体は参照により本明細書に組み込まれる))。例えば、Cas9のDNA切断ドメインは、2つのサブドメイン、HNHヌクレアーゼサブドメインおよびRuvC1サブドメインを包含することが知られている。HNHサブドメインはgRNAに相補的な鎖を切断するのに対し、RuvC1サブドメインは非相補鎖を切断する。これらのサブドメイン内の突然変異は、Cas9のヌクレアーゼ活性をサイレンシングさせ(silence)得る。例えば、突然変異D10AおよびH840Aは、S.pyogenes Cas9のヌクレアーゼ活性を完全に不活性化する(Jinek et al.,Science.337:816-821(2012);Qi et al.,Cell.28;152(5):1173-83(2013))。いくつかの態様において、Cas9のフラグメントを含むタンパク質が提供される。例えば、いくつかの態様において、タンパク質は、2つのCas9ドメイン:(1)Cas9のgRNA結合ドメイン;または(2)Cas9のDNA切断ドメインのうち一方を含む。いくつかの態様において、Cas9を含むタンパク質またはそのフラグメントは、「Cas9バリアント」と称される。Cas9バリアントは、Cas9またはそのフラグメントとの相同性を共有する。例えば、Cas9バリアントは、野生型Cas9(例として、配列番号18のSpCas9)と、少なくとも約70%同一、少なくとも約80%同一、少なくとも約90%同一、少なくとも約95%同一、少なくとも約96%同一、少なくとも約97%同一、少なくとも約98%同一、少なくとも約99%同一、少なくとも約99.5%同一、少なくとも約99.8%同一、または少なくとも約99.9%同一である。いくつかの態様において、Cas9バリアントは、野生型Cas9(例として、配列番号18のSpCas9)と比較して、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、21、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、またはそれ以上のアミノ酸変化を有していてもよい。いくつかの態様において、Cas9バリアントは、そのフラグメントが、野生型Cas9(例として、配列番号18のSpCas9)の対応するフラグメントと、少なくとも約70%同一、少なくとも約80%同一、少なくとも約90%同一、少なくとも約95%同一、少なくとも約96%同一、少なくとも約97%同一、少なくとも約98%同一、少なくとも約99%同一、少なくとも約99.5%同一、または少なくとも約99.9%同一となるように、配列番号X Cas9のフラグメント(例として、gRNA結合ドメインまたはDNA切断ドメイン)を含む。いくつかの態様において、フラグメントは、対応する野生型Cas9(例として、配列番号18のSpCas9)のアミノ酸の長さの、少なくとも30%、少なくとも35%、少なくとも40%、少なくとも45%、少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%同一の、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも99.5%である。 A nuclease-inactivated Cas9 domain may be interchangeably referred to as a "dCas9" protein (representing a nuclease-inactivated Cas9). Methods for generating a Cas9 domain (or a fragment thereof) with an inactive DNA cleavage domain are known (see, e.g., Jinek et al., Science. 337:816-821 (2012); Qi et al., "Repurposing CRISPR as an RNA-Guided Platform for Sequence-Specific Control of Gene Expression" (2013) Cell. 28; 152(5):1173-83, the entire contents of each of which are incorporated herein by reference). For example, the DNA cleavage domain of Cas9 is known to include two subdomains, the HNH nuclease subdomain and the RuvC1 subdomain. The HNH subdomain cleaves the strand complementary to the gRNA, whereas the RuvC1 subdomain cleaves the non-complementary strand. Mutations within these subdomains can silence the nuclease activity of Cas9. For example, mutations D10A and H840A completely inactivate the nuclease activity of S.pyogenes Cas9 (Jinek et al., Science. 337:816-821 (2012); Qi et al., Cell. 28; 152(5):1173-83 (2013)). In some embodiments, proteins comprising fragments of Cas9 are provided. For example, in some embodiments, the proteins comprise one of two Cas9 domains: (1) the gRNA binding domain of Cas9; or (2) the DNA cleavage domain of Cas9. In some embodiments, proteins comprising Cas9 or fragments thereof are referred to as "Cas9 variants". Cas9 variants share homology with Cas9 or fragments thereof. For example, a Cas9 variant is at least about 70% identical, at least about 80% identical, at least about 90% identical, at least about 95% identical, at least about 96% identical, at least about 97% identical, at least about 98% identical, at least about 99% identical, at least about 99.5% identical, at least about 99.8% identical, or at least about 99.9% identical to a wild-type Cas9 (e.g., SpCas9 of SEQ ID NO: 18). In some embodiments, the Cas9 variant may have 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 21, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50 or more amino acid changes compared to a wild-type Cas9 (e.g., SpCas9 of SEQ ID NO: 18). In some embodiments, the Cas9 variant comprises a fragment of SEQ ID NO:X Cas9 (e.g., a gRNA binding domain or a DNA cleavage domain), such that the fragment is at least about 70% identical, at least about 80% identical, at least about 90% identical, at least about 95% identical, at least about 96% identical, at least about 97% identical, at least about 98% identical, at least about 99% identical, at least about 99.5% identical, or at least about 99.9% identical to a corresponding fragment of a wild-type Cas9 (e.g., SpCas9 of SEQ ID NO:18). In some embodiments, the fragment is at least 30%, at least 35%, at least 40%, at least 45%, at least 50%, at least 55%, at least 60%, at least 65%, at least 70%, at least 75%, at least 80%, at least 85%, at least 90%, at least 95% identical, at least 96%, at least 97%, at least 98%, at least 99%, or at least 99.5% of the amino acid length of a corresponding wild-type Cas9 (e.g., SpCas9 of SEQ ID NO:18).

cDNA
用語「cDNA」は、RNA鋳型からコピーされたDNAの鎖を指す。cDNAは、RNA鋳型に相補的である。
cDNA
The term "cDNA" refers to a strand of DNA copied from an RNA template. The cDNA is complementary to the RNA template.

循環置換体
本明細書に使用されるとき、用語「循環置換体(circular permutant)」は、タンパク質のアミノ酸配列中に現れるアミノ酸の順序の変化を伴うタンパク質の構造上の立体配置における変化である循環置換(circular permutation)を含むタンパク質またはポリペプチド(例として、Cas9)を指す。換言すれば、循環置換体は、野生型対応物と比較してN末端およびC末端が変更されたタンパク質であり、例として、野生型タンパク質のC末端半分が新しいN末端半分になっている。循環置換(またはCP)は本質的に、そのN末端およびC末端が接続され、しばしばペプチドリンカーをもつ、タンパク質1次配列の形態上の再配置であるが、同時にその配列を異なる位置にて分裂させることで、隣接していた新しいN末端およびC末端が創出される。その結果は、接続が異なるが、しばしば同じか全体的には同様の3次元の(3D)形状を有し得るタンパク質構造であって、おそらく、改善または変更された特徴(タンパク分解への低減された感受性、改善された触媒活性、変更された基質結合もしくはリガンド結合、および/または改善された熱安定性を包含する)を包含する。循環置換タンパク質は天然に存在し得る(例として、コンカナバリンAおよびレクチン)。加えて、循環置換は、翻訳後修飾の結果として生じ得るか、または組換え技法を使用して改変されてもよい。
Circular permutants As used herein, the term "circular permutant" refers to a protein or polypeptide (e.g., Cas9) that contains a circular permutation, which is a change in the structural conformation of a protein with a change in the order of amino acids that appear in the amino acid sequence of the protein. In other words, a circular permutant is a protein with an altered N-terminus and C-terminus compared to its wild-type counterpart, e.g., the C-terminal half of the wild-type protein becomes a new N-terminal half. Circular permutation (or CP) is essentially a topological rearrangement of a protein primary sequence with its N-terminus and C-terminus connected, often with a peptide linker, while simultaneously splitting the sequence at a different position to create new adjacent N-terminus and C-terminus. The result is a protein structure that may have different connections but often the same or overall similar three-dimensional (3D) shape, possibly including improved or altered characteristics, including reduced susceptibility to proteolysis, improved catalytic activity, altered substrate or ligand binding, and/or improved thermostability. Circularly permuted proteins can occur naturally (e.g., concanavalin A and lectins). In addition, circular permutations can occur as a result of post-translational modifications or can be engineered using recombinant techniques.

循環置換されたCas9
用語「循環置換されたCas9」は、循環置換体として生じたものであり、これによってそのN末端およびC末端が局所的に再配置された、いずれのCas9タンパク質またはそのバリアントも指す。循環置換されたかかるCas9タンパク質(「CP-Cas9」)、またはそれらのバリアントは、ガイドRNA(gRNA)と複合体化されたときのDNAへの結合能を保持している。Oakes et al.,"Protein Engineering of Cas9 for enhanced function,"Methods Enzymol,2014,546:491-511およびOakes et al.,"CRISPR-Cas9 Circular Permutants as Programmable Scaffolds for Genome Modification,"Cell,January10,2019,176:254-267を参照(これらの各々は参照により本明細書に組み込まれる)。本開示は、これまでに知られているいずれのCP-Cas9も企図するか、または新しいCP-Cas9を、その結果得られた循環置換タンパク質がガイドRNA(gRNA)と複合体化されたときのDNAへの結合能を保持している限り、使用する。例示のCP-Cas9タンパク質は、配列番号77~86である。
Circularly permuted Cas9
The term "circularly permuted Cas9" refers to any Cas9 protein or variant thereof that has been generated as a circular permutation, thereby locally rearranging its N-terminus and C-terminus. Such circularly permuted Cas9 protein ("CP-Cas9"), or variants thereof, retains the ability to bind to DNA when complexed with guide RNA (gRNA). See Oakes et al., "Protein Engineering of Cas9 for enhanced function," Methods Enzymol, 2014, 546:491-511 and Oakes et al., "CRISPR-Cas9 Circular Permutants as Programmable Scaffolds for Genome Modification," Cell, January 10, 2019, 176:254-267, each of which is incorporated herein by reference. The present disclosure contemplates any previously known or new CP-Cas9 to be used, so long as the resulting circularly permuted protein retains the ability to bind DNA when complexed with a guide RNA (gRNA). Exemplary CP-Cas9 proteins are SEQ ID NOs:77-86.

CRISPR
CRISPRは、原核生物に侵入したウイルスによる先行する感染のスニペットを表す細菌および古細菌におけるDNA配列(すなわちCRISPRクラスター)のファミリーである。DNAのスニペットは、類似のウイルスによる爾後の攻撃からのDNAを検出および破壊するために原核細胞によって用いられ、CRISPR関連タンパク質(Cas9およびそのホモログを包含する)およびCRISPR関連RNAのアレイと併せて、有効に原核生物免疫防御システムを成す。天然では、CRISPRクラスターはCRISPR RNA(crRNA)へと転写およびプロセシングされる。ある種の型のCRISPRシステム(例えば、II型CRISPRシステム)では、プレcrRNAの正しいプロセシングは、トランスにコードされる低分子RNA(tracrRNA)、内生リボヌクレアーゼ3(rnc)、およびCas9タンパク質を要求する。tracrRNAはプレcrRNAのリボヌクレアーゼ3によって支援されるプロセシングのためのガイドとしての用をなす。爾後に、Cas9/crRNA/tracrRNAはRNAに対して相補的な直線状または環状dsDNA標的をエンド的に切断する。具体的には、crRNAに対して相補的でない標的鎖が第1にエンド的にカットされ、それから3'-5'エキソ的にトリミングされる。天然では、DNA結合および切断は典型的にはタンパク質および両方のRNAを要求する。しかしながら、シングルガイドRNA(「sgRNA」または単純に「gNRA」)が、crRNAおよびtracrRNA両方の側面を単一のRNA種のガイドRNAに組み込むようにして操作され得る。例えば、Jinek M., Chylinski K., Fonfara I., Hauer M., Doudna J.A., Charpentier E. Science 337:816-821(2012)を見よ。これの内容全体は参照によってここに組み込まれる。Cas9はCRISPR反復配列上の短いモチーフ(PAMまたはプロトスペーサー隣接モチーフ)を認識して、自己対非自己を見分けることを助ける。CRISPR生物学ならびにCas9ヌクレアーゼ配列および構造は当業者には周知である(例えば、"Complete genome sequence of an M1 strain of Streptococcus pyogenes."Ferretti et al.,J.J.,McShan W.M.,Ajdic D.J.,Savic D.J.,Savic G.,Lyon K.,Primeaux C.,Sezate S.,Suvorov A.N.,Kenton S.,Lai H.S.,Lin S.P.,Qian Y.,Jia H.G.,Najar F.Z.,Ren Q.,Zhu H.,Song L.,White J.,Yuan X.,Clifton S.W.,Roe B.A.,McLaughlin R.E.,Proc.Natl.Acad.Sci.U.S.A.98:4658-4663(2001);"CRISPR RNA maturation by trans-encoded small RNA and host factor RNase III."Deltcheva E.,Chylinski K.,Sharma C.M.,Gonzales K.,Chao Y.,Pirzada Z.A.,Eckert M.R.,Vogel J.,Charpentier E.,Nature 471:602-607(2011);および"A programmable dual-RNA-guided DNA endonuclease in adaptive bacterial immunity."Jinek M.,Chylinski K.,Fonfara I.,Hauer M.,Doudna J.A.,Charpentier E.Science 337:816-821(2012)を見よ。これらの夫々の内容全体は参照によって本願に組み込まれる)。Cas9オーソログはS. pyogenesおよびS. thermophilusを包含するがこれらに限定されない種々の種において記載されている。追加の好適なCas9ヌクレアーゼおよび配列は本開示に基づいて当業者には明らかであろう。かかるCas9ヌクレアーゼおよび配列は、Chylinski,Rhun,and Charpentier,"The tracrRNA and Cas9 families of type II CRISPR-Cas immunity systems"(2013)RNA Biology 10:5,726-737に開示されている生物および座位からのCas9配列を包含する;これの内容全体は参照によって本願に組み込まれる。
CRISPR
CRISPR is a family of DNA sequences (i.e., CRISPR clusters) in bacteria and archaea that represent snippets of prior infection by viruses that have invaded prokaryotes. The snippets of DNA are used by prokaryotic cells to detect and destroy DNA from subsequent attacks by similar viruses, and together with an array of CRISPR-associated proteins (including Cas9 and its homologs) and CRISPR-associated RNAs, effectively constitute a prokaryotic immune defense system. In nature, CRISPR clusters are transcribed and processed into CRISPR RNA (crRNA). In certain types of CRISPR systems (e.g., type II CRISPR systems), correct processing of the pre-crRNA requires a trans-encoded small RNA (tracrRNA), an endogenous ribonuclease 3 (rnc), and a Cas9 protein. The tracrRNA serves as a guide for ribonuclease 3-assisted processing of the pre-crRNA. Cas9/crRNA/tracrRNA then cleaves linear or circular dsDNA targets that are complementary to the RNA endolytically. Specifically, the target strand that is not complementary to the crRNA is first endolytically cut and then 3'-5' exolytically trimmed. In nature, DNA binding and cleavage typically requires a protein and both RNAs. However, single guide RNAs ("sgRNAs" or simply "gNRAs") can be engineered to incorporate aspects of both crRNA and tracrRNA into the guide RNA of a single RNA species. See, for example, Jinek M., Chylinski K., Fonfara I., Hauer M., Doudna JA, Charpentier E. Science 337:816-821 (2012), the entire contents of which are incorporated herein by reference. Cas9 recognizes short motifs (PAM or protospacer adjacent motifs) on CRISPR repeats to help distinguish self versus non-self. CRISPR biology and Cas9 nuclease sequences and structures are well known to those of skill in the art (see, e.g., "Complete genome sequence of an M1 strain of Streptococcus pyogenes." Ferretti et al., JJ, McShan WM, Ajdic DJ, Savic DJ, Savic G., Lyon K., Primeaux C., Sezate S., Suvorov AN, Kenton S., Lai HS, Lin SP, Qian Y., Jia HG, Najar FZ, Ren Q., Zhu H., Song L., White J., Yuan X., Clifton SW, Roe BA, McLaughlin RE, Proc. Natl. Acad. Sci. USA 98:4658-4663 (2001); "CRISPR RNA maturation by trans-encoded small RNA and host factor RNase III." Deltcheva E., Chylinski K., Sharma See CM, Gonzales K., Chao Y., Pirzada ZA, Eckert MR, Vogel J., Charpentier E., Nature 471:602-607 (2011); and "A programmable dual-RNA-guided DNA endonuclease in adaptive bacterial immunity." Jinek M., Chylinski K., Fonfara I., Hauer M., Doudna JA, Charpentier E. Science 337:816-821 (2012), the entire contents of each of which are incorporated herein by reference. Cas9 orthologs have been described in a variety of species, including, but not limited to, S. pyogenes and S. thermophilus. Additional suitable Cas9 nucleases and sequences will be apparent to one of skill in the art based on the present disclosure. Such Cas9 nucleases and sequences include Cas9 sequences from organisms and loci disclosed in Chylinski, Rhun, and Charpentier, "The tracrRNA and Cas9 families of type II CRISPR-Cas immunity systems" (2013) RNA Biology 10:5, 726-737, the entire contents of which are incorporated herein by reference.

ある種の型のCRISPRシステム(例えば、II型CRISPRシステム)では、プレcrRNAの正しいプロセシングは、トランスにコードされる低分子RNA(tracrRNA)、内生リボヌクレアーゼ3(rnc)、およびCas9タンパク質を要求する。tracrRNAは、プレcrRNAのリボヌクレアーゼ3によって支援されるプロセシングのためのガイドとしての用をなす。爾後に、Cas9/crRNA/tracrRNAはRNAに対して相補的な直線状または環状核酸標的をエンド的に切断する。具体的には、crRNAに対して相補的でない標的鎖が第1にエンド的にカットされ、それから3'-5'エキソ的にトリミングされる。天然では、DNA結合および切断は典型的にはタンパク質および両方のRNAを要求する。しかしながら、シングルガイドRNA(「sgRNA」または単純に「gRNA」)が、crRNAおよびtracrRNA両方の態様を単一のRNA種のガイドRNAに組み込むようにして操作され得る。 In certain types of CRISPR systems (e.g., type II CRISPR systems), correct processing of the pre-crRNA requires a trans-encoded small RNA (tracrRNA), an endogenous ribonuclease 3 (rnc), and a Cas9 protein. The tracrRNA serves as a guide for ribonuclease 3-assisted processing of the pre-crRNA. Cas9/crRNA/tracrRNA then endolytically cleaves linear or circular nucleic acid targets that are complementary to the RNA. Specifically, the target strand that is not complementary to the crRNA is first endolytically cut and then 3'-5' exolytically trimmed. In nature, DNA binding and cleavage typically requires a protein and both RNAs. However, single guide RNAs ("sgRNAs" or simply "gRNAs") can be engineered to incorporate aspects of both the crRNA and tracrRNA into the guide RNA of a single RNA species.

一般的に、「CRISPRシステム」は、集合的に、CRISPR関連(「Cas」)遺伝子の発現に関わるかまたはそれの活性を導く転写物および他のエレメントを言い、Cas遺伝子、tracr(トランス活性化CRISPR)配列(例えばtracrRNAまたは活性な部分的なtracrRNA)、tracr mate配列(内生CRISPRシステムという文脈において、「ダイレクト反復」およびtracrRNAによってプロセシングされる部分的なダイレクト反復を包摂する)、ガイド配列(内生CRISPRシステムという文脈において「スペーサー」ともまた言われる)、またはCRISPR座位からの他の配列および転写物をコードする配列を包含する。システムのtracrRNAはガイドRNA上に存在するtracr mate配列に対して(完全にまたは部分的に)相補的である。 In general, a "CRISPR system" collectively refers to the transcripts and other elements involved in the expression of or directing the activity of CRISPR-associated ("Cas") genes, and includes sequences encoding Cas genes, tracr (transactivating CRISPR) sequences (e.g., tracrRNA or an active partial tracrRNA), tracr mate sequences (which, in the context of an endogenous CRISPR system, encompass "direct repeats" and partial direct repeats processed by tracrRNA), guide sequences (also referred to as "spacers" in the context of an endogenous CRISPR system), or other sequences and transcripts from the CRISPR locus. The tracrRNA of the system is complementary (fully or partially) to the tracr mate sequence present on the guide RNA.

DNA合成鋳型
本明細書に使用されるとき、用語「DNA合成鋳型」は、プライム編集因子のポリメラーゼによって鋳型鎖(所望の編集を含有しており、次いでプライム編集の機序を通して、対応する内生DNAの鎖を標的部位にて置き換える、3'単鎖DNAフラップをコードする)として利用される、PEgRNAの伸長アームの領域または部分を指す。様々な態様において、DNA合成鋳型は、図3A(5'伸長アームを含むPEgRNAの文脈(context)において)、図3B(3'伸長アームを含むPEgRNAの文脈において)、図3C(内部伸長アームの文脈において)、図3D(3'伸長アームの文脈において)、および図3E(5'伸長アームの文脈において)に示される。伸長アームは、DNA合成鋳型を包含しており、DNAまたはRNAから構成されていてもよい。RNAのケースにおいて、プライム編集因子のポリメラーゼは、RNA依存性DNAポリメラーゼ(例として、逆転写酵素)であり得る。DNAのケースにおいて、プライム編集因子のポリメラーゼは、DNA依存性DNAポリメラーゼであり得る。様々な(例として、図3D~3Eに描かれるとおりの)態様において、DNA合成鋳型(4)は、「編集鋳型」および「相同アーム」、ならびに任意の5'末修飾領域e2の全部または一部を含んでいてもよい。つまり、e2領域の性質に応じて(例として、これが、ヘアピン、トウループ、またはステム/ループの2次構造を包含するかどうかに関わらず)、ポリメラーゼは、e2領域を何もコードしていなくても、またはその一部もしくは全部をコードしていてもよい。別の言い方をすれば、3'伸長アームのケースにおいて、DNA合成鋳型(3)は、ポリメラーゼ(例として、逆転写酵素)によるDNAの単鎖の合成のための鋳型として動作してもよい、プライマー結合部位(PBS)の5'末からgRNAコアの3'末までに及ぶ伸長アーム(3)の部分を包含し得る。5'伸長アームのケースにおいて、DNA合成鋳型(3)は、PEgRNA分子の5'末から編集鋳型の3'末までに及ぶ伸長アーム(3)の部分を包含し得る。好ましくは、DNA合成鋳型は、3'伸長アームまたは5'伸長アームのいずれかを有するPEgRNAsのプライマー結合部位(PBS)を排除する。本明細書に記載のある態様(例として、図71A)は、編集鋳型および相同アーム、すなわち、DNA合成の最中に鋳型として実際に使用されるPEgRNA伸長アームの配列を包含する「RT鋳型」を指す。用語「RT鋳型」は、用語「DNA合成鋳型」と等価である。
DNA synthesis template As used herein, the term "DNA synthesis template" refers to the region or portion of the extension arm of the PEgRNA that is utilized by the polymerase of the prime editor as the template strand (containing the desired edit and encoding the 3' single-stranded DNA flap that then replaces the corresponding strand of endogenous DNA at the target site through the mechanism of prime editing). In various embodiments, the DNA synthesis template is shown in Figure 3A (in the context of a PEgRNA containing a 5' extension arm), Figure 3B (in the context of a PEgRNA containing a 3' extension arm), Figure 3C (in the context of an internal extension arm), Figure 3D (in the context of a 3' extension arm), and Figure 3E (in the context of a 5' extension arm). The extension arm encompasses the DNA synthesis template and may be composed of DNA or RNA. In the case of RNA, the polymerase of the prime editor may be an RNA-dependent DNA polymerase (e.g., reverse transcriptase). In the case of DNA, the polymerase of the prime editor may be a DNA-dependent DNA polymerase. In various embodiments (e.g., as depicted in Figures 3D-3E), the DNA synthesis template (4) may comprise the "editing template" and the "homology arm", as well as all or part of the optional 5'-end modification region e2. That is, depending on the nature of the e2 region (e.g., whether it comprises a hairpin, a toe-loop, or a stem/loop secondary structure), the polymerase may encode none, or a part or all of the e2 region. In other words, in the case of a 3' extension arm, the DNA synthesis template (3) may comprise a portion of the extension arm (3) that extends from the 5' end of the primer binding site (PBS) to the 3' end of the gRNA core, which may act as a template for the synthesis of a single strand of DNA by a polymerase (e.g., reverse transcriptase). In the case of a 5' extension arm, the DNA synthesis template (3) may comprise a portion of the extension arm (3) that extends from the 5' end of the PEgRNA molecule to the 3' end of the editing template. Preferably, the DNA synthesis template excludes the primer binding site (PBS) of the PEgRNAs with either the 3' extension arm or the 5' extension arm. Certain embodiments described herein (for example, FIG. 71A) refer to an "RT template" that includes the editing template and the homology arm, i.e., the sequence of the PEgRNA extension arm that is actually used as a template during DNA synthesis. The term "RT template" is equivalent to the term "DNA synthesis template."

トランスプライム編集のケースでは(例えば、図3Gおよび図3H)、プライマー結合部位(PBS)およびDNA合成鋳型は、トランスプライム編集因子RNA鋳型(tPERT)と言われる別個の分子へと操作され得る。 In the case of trans-prime editing (e.g., Figures 3G and 3H), the primer binding site (PBS) and the DNA synthesis template can be engineered into separate molecules called trans-prime editor RNA template (tPERT).

二量体化ドメイン
用語「二量体化ドメイン」は、二重特異性リガンドの結合ドメインに結合するリガンド結合ドメインを言う。「第1の」二量体化ドメインは二重特異性リガンドの第1の結合部分に結合し、「第2の」二量体化ドメインは同じ二重特異性リガンドの第2の結合部分に結合する。第1の二量体化ドメインが(例えば、本願において論じられるとおりPEを介して)第1のタンパク質に融合され、第2の二量体化ドメインが(例えば、本願において論じられるとおりPEを介して)第2のタンパク質に融合されるときには、第1および第2のタンパク質は二重特異性リガンドの存在下において二量体化し、二重特異性リガンドは、第1の二量体化ドメインに結合する少なくとも1つの部分と第2の二量体化ドメインに結合する少なくとも別の部分とを有する。
Dimerization domain The term "dimerization domain" refers to a ligand binding domain that binds to a binding domain of a dual-specific ligand. A "first" dimerization domain binds to a first binding moiety of a dual-specific ligand, and a "second" dimerization domain binds to a second binding moiety of the same dual-specific ligand. When a first dimerization domain is fused (e.g., via PE as discussed herein) to a first protein and a second dimerization domain is fused (e.g., via PE as discussed herein) to a second protein, the first and second proteins dimerize in the presence of the dual-specific ligand, and the dual-specific ligand has at least one moiety that binds to the first dimerization domain and at least another moiety that binds to the second dimerization domain.

下流
本明細書に使用されるとき、用語「上流」および「下流」は、5'→3'方向に配向された核酸分子(単鎖または二本鎖であるかに関わらず)中に位置付けられた少なくとも2つの要素の線状の位置を定義する相対的な用語である。とりわけ、第1要素が第2要素に対して5'のどこかに位置付けられている場合、第1要素は、核酸分子中、第2要素の上流にある。例えば、SNPがニック部位の5'側にある場合、SNPは、Cas9に誘導されたニック部位の上流にある。逆に言うと、第1要素が第2要素に対して3'のどこかに位置付けられている場合、第1要素は、核酸分子中、第2要素の下流にある。例えば、SNPがニック部位の3'側にある場合、SNPは、Cas9に誘導されたニック部位の下流にある。核酸分子は、DNA(二本鎖もしくは単鎖)、RNA(二本鎖もしくは単鎖)、またはDNAとRNAとのハイブリッドであり得る。二本鎖分子のどちらの鎖を考慮するのか選択する必要がある場合を除き、上流および下流という用語が核酸分子の単鎖にのみ言及するところ、分析は単鎖核酸分子および二本鎖分子について同じである。しばしば、少なくとも2つの要素の相対的な位置を決定するのに使用され得る二本鎖のDNAの鎖は、「センス」鎖または「コード」鎖である。遺伝学において、「センス」鎖は、5'から3'へ伸びる二本鎖DNA内セグメントであって、3'から5'へ伸びるDNAのアンチセンス鎖または鋳型鎖に相補的である。よって、例として、SNP核酸塩基がセンス鎖またはコード鎖上のプロモーターの3'側にある場合、SNP核酸塩基はゲノムDNA(二本鎖である)中のプロモーター配列の「下流」にある。
Downstream As used herein, the terms "upstream" and "downstream" are relative terms that define the linear location of at least two elements located in a nucleic acid molecule (whether single-stranded or double-stranded) oriented in a 5'→3' direction. In particular, if a first element is located anywhere 5' to the second element, the first element is upstream of the second element in the nucleic acid molecule. For example, if the SNP is 5' to the nick site, the SNP is upstream of the Cas9-induced nick site. Conversely, if a first element is located anywhere 3' to the second element, the first element is downstream of the second element in the nucleic acid molecule. For example, if the SNP is 3' to the nick site, the SNP is downstream of the Cas9-induced nick site. The nucleic acid molecule can be DNA (double-stranded or single-stranded), RNA (double-stranded or single-stranded), or a hybrid of DNA and RNA. The analysis is the same for single-stranded nucleic acid molecules and double-stranded molecules, except when it is necessary to select which strand of a double-stranded molecule is considered, where the terms upstream and downstream refer only to a single strand of a nucleic acid molecule. Often, the strand of a double-stranded DNA that can be used to determine the relative positions of at least two elements is the "sense" strand or "coding" strand. In genetics, a "sense" strand is a segment within a double-stranded DNA that extends from 5' to 3' and is complementary to the antisense or template strand of the DNA that extends from 3' to 5'. Thus, as an example, if a SNP nucleobase is 3' to the promoter on the sense or coding strand, the SNP nucleobase is "downstream" of the promoter sequence in genomic DNA (which is double-stranded).

編集鋳型
用語「編集鋳型」は、ポリメラーゼ、例えばDNA依存性DNAポリメラーゼ、RNA依存性DNAポリメラーゼ(例えば逆転写酵素)によって合成される一本鎖3'DNAフラップ上に所望の編集をコードする伸長アームの部分を言う。本明細書に記載のある態様(例として、図71A)は、編集鋳型と相同アームとの両方一緒、すなわち、DNA合成の最中に鋳型として実際に使用されるPEgRNA伸長アームの配列を指す「RT鋳型」を指す。用語「RT編集鋳型」はまた、用語「DNA合成鋳型」とも等価であるが、ここでRT編集鋳型は、逆転写酵素であるポリメラーゼを有するプライム編集因子の使用を反映し、DNA合成鋳型は、いずれのポリメラーゼも有するプライム編集因子の使用をより広く反映する。
Editing template The term "editing template" refers to the portion of the extension arm that encodes the desired edit on the single-stranded 3' DNA flap that is synthesized by a polymerase, e.g., a DNA-dependent DNA polymerase, an RNA-dependent DNA polymerase (e.g., reverse transcriptase). Certain embodiments described herein (e.g., FIG. 71A) refer to an "RT template" which refers to both the editing template and the homologous arm together, i.e., the sequence of the PEgRNA extension arm that is actually used as a template during DNA synthesis. The term "RT editing template" is also equivalent to the term "DNA synthesis template," where RT editing template reflects the use of a primed editor with a polymerase that is a reverse transcriptase, and DNA synthesis template more broadly reflects the use of a primed editor with any polymerase.

有効量
本願において用いられる用語「有効量」は、所望の生物学的応答を誘起するために十分である生物活性薬剤の量を言う。例えば、いくつかの態様では、プライム編集因子(PE)の有効量は、標的部位ヌクレオチド配列、例えばゲノムを編集するために十分である編集因子の量を言い得る。いくつかの態様では、本願において提供されるプライム編集因子(PE)の、例えばニッカーゼCas9ドメインおよび逆転写酵素を含む融合タンパク質の有効量は、融合タンパク質によって特異的に結合および編集される標的部位の編集を誘導するために十分である融合タンパク質の量を言い得る。当業者には了解されるであろうとおり、薬剤、例えば融合タンパク質、ヌクレアーゼ、ハイブリッドタンパク質、タンパク質二量体、タンパク質(またはタンパク質二量体)およびポリヌクレオチドの複合体、またはポリヌクレオチドの有効量は、例えば、所望の生物学的反応、例えば編集されるべき特定のアレル、ゲノム、または標的部位、標的化されようとする細胞または組織、および用いられようとする薬剤のような種々の因子に依存して変わり得る。
Effective amount The term "effective amount" as used herein refers to an amount of a bioactive agent that is sufficient to induce a desired biological response. For example, in some embodiments, an effective amount of a prime editor (PE) can refer to an amount of the editor that is sufficient to edit a target site nucleotide sequence, such as a genome. In some embodiments, an effective amount of a prime editor (PE) provided herein, such as a fusion protein comprising a nickase Cas9 domain and a reverse transcriptase, can refer to an amount of the fusion protein that is sufficient to induce editing of a target site that is specifically bound and edited by the fusion protein. As will be understood by those skilled in the art, the effective amount of an agent, such as a fusion protein, a nuclease, a hybrid protein, a protein dimer, a complex of a protein (or a protein dimer) and a polynucleotide, or a polynucleotide, can vary depending on various factors, such as, for example, the desired biological response, such as the specific allele, genome, or target site to be edited, the cell or tissue to be targeted, and the agent to be used.

エラーを起こしやすい逆転写酵素
本明細書に使用されるとき、用語「エラーを起こしやすい」逆転写酵素(またはより広くは、いずれのポリメラーゼ)は、天然に存在するか、または野生型M-MLV逆転写酵素の誤差率未満の誤差率を有する別の逆転写酵素(例として、野生型M-MLV逆転写酵素)に由来する逆転写酵素(またはより広くは、いずれのポリメラーゼ)を指す。野生型M-MLV逆転写酵素の誤差率は、1誤差の範囲が15,000(より高い)~27,000(より低い)にあると報告されている。15,000中の1の誤差率は6.7×10-5の誤差率に相当する。27,000中の1の誤差率は3.7×10-5の誤差率に相当する。Boutabout et al.(2001)"DNA synthesis fidelity by the reverse transcriptase of the yeast retrotransposon Ty1,"Nucleic Acids Res 29(11):2217-2222を参照(これは参照により本明細書に組み込まれる)。よって、本出願の目的において、用語「エラーを起こしやすい」は、15,000核酸塩基の組み込み中1より大きい誤差(6.7×10-5またはこれより高い)、例として、14,000核酸塩基中1誤差(7.14×10-5もしくはこれより高い)、13,000核酸塩基またはこれより少ない中で1誤差(7.7×10-5もしくはこれより高い)、12,000核酸塩基またはこれより少ない中で1誤差(7.7×10-5もしくはこれより高い)、11,000核酸塩基またはこれより少ない中で1誤差(9.1×10-5もしくはこれより高い)、10,000核酸塩基またはこれより少ない中で1誤差(1×10-4または0.0001もしくはこれより高い)、9,000核酸塩基またはこれより少ない中で1誤差(0.00011もしくはこれより高い)、8,000核酸塩基またはこれより少ない中で1誤差(0.00013もしくはこれより高い)、7,000核酸塩基またはこれより少ない中で1誤差(0.00014もしくはこれより高い)、6,000核酸塩基またはこれより少ない中で1誤差(0.00016もしくはこれより高い)、5,000核酸塩基またはこれより少ない中で1誤差(0.0002もしくはこれより高い)、4,000核酸塩基またはこれより少ない中で1誤差(0.00025もしくはこれより高い)、3,000核酸塩基またはこれより少ない中で1誤差(0.00033もしくはこれより高い)、2,000核酸塩基またはこれより少ない中で1誤差(0.00050もしくはこれより高い)、あるいは1,000核酸塩基またはこれより少ない中で1誤差(0.001もしくはこれより高い)、あるいは500核酸塩基またはこれより少ない中で1誤差(0.002もしくはこれより高い)、あるいは250核酸塩基またはこれより少ない中で1誤差(0.004もしくはこれより高い)である誤差率を有する、それらRTを指す。
Error-prone reverse transcriptases As used herein, the term "error-prone" reverse transcriptase (or, more broadly, any polymerase) refers to a reverse transcriptase (or, more broadly, any polymerase) that is naturally occurring or derived from another reverse transcriptase (e.g., wild-type M-MLV reverse transcriptase) that has an error rate less than that of wild-type M-MLV reverse transcriptase. The error rate of wild-type M-MLV reverse transcriptase has been reported to range from 15,000 (higher) to 27,000 (lower) for 1 error. An error rate of 1 in 15,000 corresponds to an error rate of 6.7×10 −5 . An error rate of 1 in 27,000 corresponds to an error rate of 3.7×10 −5 . See Boutabout et al. (2001) "DNA synthesis fidelity by the reverse transcriptase of the yeast retrotransposon Ty1," Nucleic Acids Res 29(11):2217-2222, which is incorporated herein by reference. Thus, for purposes of this application, the term "error-prone" refers to a sequence that is more than 1 error in the incorporation of 15,000 nucleobases (6.7×10 -5 or higher), for example 1 error in 14,000 nucleobases (7.14×10 -5 or higher), 1 error in 13,000 nucleobases or less (7.7×10 -5 or higher), 1 error in 12,000 nucleobases or less (7.7×10 -5 or higher), 1 error in 11,000 nucleobases or less (9.1×10 -5 or higher), 1 error in 10,000 nucleobases or less (1×10 -4 or 0.0001 or higher), 1 error in 9,000 nucleobases or less (0.00011 or higher), 1 error in 8,000 nucleobases or less (0.00013 or higher), 1 error in 7,000 nucleobases or less (0.00014 or higher), 1 error in 6,000 nucleobases or less (0.00016 or higher), 1 error in 5,000 nucleobases or less (0.0002 or higher), 1 error in 4,000 nucleobases or less "RTs" refer to those RTs that have an error rate that is 1 error (0.00025 or higher), 1 error in 3,000 nucleobases or less (0.00033 or higher), 1 error in 2,000 nucleobases or less (0.00050 or higher), or 1 error in 1,000 nucleobases or less (0.001 or higher), or 1 error in 500 nucleobases or less (0.002 or higher), or 1 error in 250 nucleobases or less (0.004 or higher).

エクステイン
本願において用いられる用語「エクステイン」は、インテインによってフランキングされ、タンパク質スプライシングのプロセスの間に別のエクステインにライゲーションされて成熟したスプライシングされたタンパク質を形成するポリペプチド配列を言う。典型的には、インテインは2つのエクステイン配列によってフランキングされ、これらはインテインがそれ自体の切除を触媒するときに一緒にライゲーションされる。エクステインは、従って、mRNA上に見出されるエキソンに対するタンパク質アナログである。例えば、インテインを含むポリペプチドは構造エクステイン(N)-インテイン-エクステイン(C)であり得る。インテインの切除および2つのエクステインのスプライシング後に、もたらされる構造はエクステイン(N)-エクステイン(C)および遊離のインテインである。種々の構成では、エクステインは、夫々が分裂インテインに融合された別個のタンパク質(例えば、Cas9またはPE融合タンパク質の半分)であり得、分裂インテインの切除はエクステイン配列のスプライシングを一緒に引き起こす。
Extein The term "extein" as used herein refers to a polypeptide sequence that is flanked by an intein and ligated to another extein during the process of protein splicing to form a mature spliced protein. Typically, an intein is flanked by two extein sequences, which are ligated together when the intein catalyzes its own excision. An extein is thus a protein analog to an exon found on an mRNA. For example, a polypeptide containing an intein can have the structure extein(N)-intein-extein(C). After excision of the intein and splicing of the two exteins, the resulting structure is extein(N)-extein(C) and a free intein. In various configurations, the exteins can be separate proteins (e.g., half of a Cas9 or PE fusion protein), each fused to a split intein, and excision of the split intein causes the extein sequences to be spliced together.

伸長アーム
用語「伸長アーム」は、数種の機能(逆転写酵素のためのプライマー結合部位および編集鋳型を包含する)を提供するPEgRNAのヌクレオチド配列構成要素を指す。いくつかの態様、例として、図3Dにおいて、伸長アームは、ガイドRNAの3'末にて位置付けられる。他の態様、例として、図3Eにおいて、伸長アームは、ガイドRNAの5’末にて位置付けられる。いくつかの態様において、伸長アームはまた、相同アームも包含する。様々な態様において、伸長アームは、5'→3'方向に以下の構成要素:相同アーム、編集鋳型、およびプライマー結合部位を含む。逆転写酵素の重合活性が5'→3'方向であるから、相同アーム、編集鋳型、およびプライマー結合部位の好ましい配置は、逆転写酵素が、アニールされたプライマー配列によって一旦プライムされると、編集鋳型を相補的な鋳型鎖として使用して単鎖DNAを重合する(polymerases)ように、5'→3'方向にある。伸長アームの長さなどのさらなる詳細は、本明細書に記載の他のどこかに記載されている。
The term "extension arm" refers to a nucleotide sequence component of the PEgRNA that serves several functions, including a primer binding site and an editing template for reverse transcriptase. In some embodiments, for example in FIG. 3D, the extension arm is located at the 3' end of the guide RNA. In other embodiments, for example in FIG. 3E, the extension arm is located at the 5' end of the guide RNA. In some embodiments, the extension arm also includes a homology arm. In various embodiments, the extension arm includes the following components in the 5'→3' direction: a homology arm, an editing template, and a primer binding site. Since the polymerization activity of reverse transcriptase is in the 5'→3' direction, the preferred arrangement of the homology arm, editing template, and primer binding site is in the 5'→3' direction such that the reverse transcriptase, once primed by the annealed primer sequence, polymerases the single-stranded DNA using the editing template as the complementary template strand. Further details, such as the length of the extension arm, are described elsewhere herein.

伸長アームはまた、図3G(最上列)に実例として示されるとおり、一般に2つの領域:プライマー結合部位(PBS)およびDNA合成鋳型を含むものとしても記載されていてもよい。プライマー結合部位は、プライム編集因子複合体によってニックが入れられるようになり、これによってニックが入った内生鎖上に3'末が晒されたとき、標的部位の内生DNA鎖から形成されるプライマー配列へ結合する。本明細書に説明されるとおり、プライマー配列の、PEgRNAの伸長アーム上のプライマー結合部位への結合は、晒された3'末(すなわち、プライマー配列の3')をもつ二重鎖領域を創出し、これは次いで、晒された3'末からDNA合成鋳型の長さに沿ってDNAの単鎖を重合し始めるポリメラーゼのための基質を提供する。単鎖DNA産物の配列は、DNA合成鋳型の相補体である。重合は、重合が終止するまでDNA合成鋳型(または伸長アーム)の5'へ続く。よって、DNA合成鋳型は、プライム編集因子複合体のポリメラーゼによって単鎖DNA産物(すなわち、所望の遺伝子編集情報を含有する3'単鎖DNAフラップ)中へコードされる伸長アームの部分を表し、前記単鎖DNA産物は、PEに誘導されたニック部位のすぐ下流にある標的部位の対応する内生DNA鎖に置き換える。理論に拘泥されないが、DNA合成鋳型の重合は、終止という事象まで、伸長アームの5'末へ続く。重合は、これらに限定されないが、(a)PEgRNAの5'末端に達すること(例として、5'伸長アームのケースにおいて、DNAポリメラーゼが単に鋳型を使い果たす)、(b)とおり抜けられないRNA2次構造(例として、ヘアピンもしくはステム/ループ)に達すること、あるいは(c)複製終止シグナル、例として、ポリメラーゼを遮断もしくは阻害する特定のヌクレオチド配列、またはスーパーコイル状のDNAもしくはRNAなどの核酸形態上のシグナルに達すること、を包含する様々な形で終止することもある。 The extension arm may also be described as generally comprising two regions: a primer binding site (PBS) and a DNA synthesis template, as illustratively shown in FIG. 3G (top row). The primer binding site binds to a primer sequence formed from the endogenous DNA strand of the target site when it becomes nicked by the prime editor complex, thereby exposing its 3' end on the nicked endogenous strand. As described herein, binding of the primer sequence to the primer binding site on the extension arm of the PEgRNA creates a duplex region with an exposed 3' end (i.e., 3' of the primer sequence), which then provides a substrate for a polymerase that begins polymerizing a single strand of DNA from the exposed 3' end along the length of the DNA synthesis template. The sequence of the single-stranded DNA product is the complement of the DNA synthesis template. Polymerization continues 5' of the DNA synthesis template (or extension arm) until polymerization terminates. Thus, the DNA synthesis template represents the portion of the extension arm that is encoded by the polymerase of the primed editor complex into a single-stranded DNA product (i.e., a 3' single-stranded DNA flap containing the desired gene editing information), which replaces the corresponding endogenous DNA strand at the target site immediately downstream of the PE-induced nick site. Without being bound by theory, polymerization of the DNA synthesis template continues to the 5' end of the extension arm until an event known as termination. Polymerization may terminate in a variety of ways, including, but not limited to, (a) reaching the 5' end of the PEgRNA (e.g., in the case of a 5' extension arm, the DNA polymerase simply runs out of template), (b) reaching an RNA secondary structure that cannot be traversed (e.g., a hairpin or stem/loop), or (c) reaching a replication termination signal, e.g., a specific nucleotide sequence that blocks or inhibits the polymerase, or a signal on a nucleic acid form such as supercoiled DNA or RNA.

フラップエンドヌクレアーゼ(例として、FEN1)
本明細書に使用されるとき、用語「フラップエンドヌクレアーゼ」は、5'単鎖DNAフラップの除去を触媒する酵素を指す。これらは、細胞プロセス(DNA複製を包含する)の最中に形成された5'フラップの除去を処理する、天然に存在する酵素である。本明細書に記載のプライム編集方法は、内生で供給されるフラップエンドヌクレアーゼ、またはプライム編集の最中に標的部位にて形成される内生DNAの5'フラップを除去するのにtransで提供されるものを利用してもよい。フラップエンドヌクレアーゼは、当該技術分野において知られており、Patel et al.,"Flap endonucleases pass 5'-flaps through a flexible arch using a disorder-thread-order mechanism to confer specificity for free 5'-ends,"Nucleic Acids Research,2012,40(10):4507-4519およびTsutakawa et al.,Human flap endonuclease structures,DNA double-base flipping, and a unified understanding of the FEN1 superfamily,"Cell,2011,145(2):198-211、およびBalakrishnan et al.,"Flap Endonuclease 1,"Annu Rev Biochem,2013,Vol 82:119-138(これらの各々は参照により本明細書に組み込まれる)の記載から見出され得る。例示のフラップエンドヌクレアーゼは、以下のアミノ酸配列によって表され得るFEN1である:

Figure 2020191243000001
Flap endonucleases (e.g., FEN1)
As used herein, the term "flap endonucleases" refers to enzymes that catalyze the removal of 5' single-stranded DNA flaps. These are naturally occurring enzymes that process the removal of 5' flaps formed during cellular processes, including DNA replication. The prime editing methods described herein may utilize endogenously supplied flap endonucleases or those provided in trans to remove 5' flaps of endogenous DNA formed at the target site during prime editing. Flap endonucleases are known in the art and can be found in Patel et al., "Flap endonucleases pass 5'-flaps through a flexible arch using a disorder-thread-order mechanism to confer specificity for free 5'-ends," Nucleic Acids Research, 2012, 40(10):4507-4519 and Tsutakawa et al., Human flap endonuclease structures, DNA double-base flipping, and a unified understanding of the FEN1 superfamily," Cell, 2011, 145(2):198-211, and Balakrishnan et al., "Flap Endonuclease 1," Annu Rev Biochem, 2013, Vol 82:119-138, each of which is incorporated herein by reference. An exemplary flap endonuclease is FEN1, which can be represented by the following amino acid sequence:
Figure 2020191243000001

機能的等価物
用語「機能的等価物」は、機能は等価であるが構造は第1生体分子と必ずしも等価ではない第2生体分子を指す。例えば、「Cas9等価物」は、Cas9と同じかまたは実質的に同じ機能を有するが、必ずしも同じアミノ酸配列は有さないタンパク質を指す。本開示の文脈において、本明細書は通してずっと「タンパク質X、またはその機能的等価物」を指す。これに関連して、タンパク質Xの「機能的等価物」は、タンパク質Xの等価機能を担持する、いずれのホモログ、パラログ、フラグメント、天然に存在するバージョン、改変バージョン、突然変異バージョン、または合成バージョンを受け入れる。
Functional equivalent The term "functional equivalent" refers to a second biomolecule that is functionally equivalent but not necessarily structurally equivalent to a first biomolecule. For example, a "Cas9 equivalent" refers to a protein that has the same or substantially the same function as Cas9, but does not necessarily have the same amino acid sequence. In the context of this disclosure, the specification refers throughout to "protein X, or a functional equivalent thereof." In this context, a "functional equivalent" of protein X embraces any homolog, paralog, fragment, naturally occurring version, modified version, mutated version, or synthetic version that bears the equivalent function of protein X.

融合タンパク質
用語「融合タンパク質」は、本明細書に使用されるとき、少なくとも2つの異なるタンパク質からタンパク質ドメインを含むハイブリッドポリペプチドを指す。あるタンパク質は、融合タンパク質のアミノ末端(N末端)部分にて、またはカルボキシ末端(C末端)タンパク質にて位置付けられ、よって「アミノ末端の融合タンパク質」または「カルボキシ末端の融合タンパク質」の夫々を形成してもよい。タンパク質は、異なるドメイン、例えば、核酸結合ドメイン(例として、タンパク質を標的部位への結合へ向かわせる、Cas9のgRNA結合ドメイン)と、核酸編集タンパク質の核酸切断ドメインまたは触媒ドメインとを含んでいてもよい。別の例は、逆転写酵素と融合したCas9またはその等価物を包含する。本明細書に提供されるタンパク質のいずれも、当該技術分野において知られているいずれの方法によって産生されてもよい。例えば、本明細書に提供されるタンパク質は、ペプチドリンカーを含む融合タンパク質にとくに適した、組換えタンパク質の発現および精製を介して産生されてもよい。組換えタンパク質の発現および精製のための方法は周知であり、Green and Sambrook, Molecular Cloning:A Laboratory Manual(4th ed.,Cold Spring Harbor Laboratory Press,Cold Spring Harbor,N.Y.(2012)(これらの内容全体は参照により本明細書に組み込まれる))によって記載されるものを包含する。
Fusion Protein The term "fusion protein" as used herein refers to a hybrid polypeptide that contains protein domains from at least two different proteins. A protein may be located at the amino-terminal (N-terminal) portion of the fusion protein or at the carboxy-terminal (C-terminal) portion of the protein, thus forming an "amino-terminal fusion protein" or a "carboxy-terminal fusion protein", respectively. A protein may contain different domains, such as a nucleic acid binding domain (e.g., the gRNA binding domain of Cas9, which directs the protein to bind to a target site) and a nucleic acid cleavage domain or catalytic domain of a nucleic acid editing protein. Another example includes Cas9 fused with reverse transcriptase or its equivalent. Any of the proteins provided herein may be produced by any method known in the art. For example, the proteins provided herein may be produced via recombinant protein expression and purification, which is particularly suitable for fusion proteins that include peptide linkers. Methods for expression and purification of recombinant proteins are well known and include those described by Green and Sambrook, Molecular Cloning: A Laboratory Manual (4th ed., Cold Spring Harbor Laboratory Press, Cold Spring Harbor, NY (2012) (the contents of which are incorporated herein by reference in their entirety).

着目した遺伝子(Gene of interest)(GOI)
用語「着目した遺伝子」または「GOI」は、着目した生体分子(例として、タンパク質またはRNA分子)をコードする遺伝子を指す。着目したタンパク質は、いずれの細胞内タンパク質、膜タンパク質、または細胞外タンパク質、例として、核内タンパク質、転写因子、核膜輸送体、細胞内オルガネラ関連タンパク質、膜受容体、触媒タンパク質、および酵素、治療用タンパク質、膜タンパク質、膜輸送タンパク質、シグナル伝達タンパク質、または免疫学的タンパク質(例として、IgGまたは他の抗体タンパク質)、等々を包含し得る。着目した遺伝子はまた、これらに限定されないが、メッセンジャーRNA(mRNA)、トランスファーRNA(tRNA)、リボソームRNA(rRNA)、低分子核内RNA(snRNA)、アンチセンスRNA、ガイドRNA、マイクロRNA(miRNA)、低分子干渉RNA(siRNA)、および無細胞RNA(cfRNA)を包含するRNA分子もコードしていてもよい。
Gene of interest (GOI)
The term "gene of interest" or "GOI" refers to a gene that codes for a biomolecule of interest (e.g., a protein or an RNA molecule). The protein of interest may include any intracellular, membrane, or extracellular protein, e.g., nuclear proteins, transcription factors, nuclear membrane transporters, intracellular organelle-associated proteins, membrane receptors, catalytic proteins, and enzymes, therapeutic proteins, membrane proteins, membrane transport proteins, signal transduction proteins, or immunological proteins (e.g., IgG or other antibody proteins), and the like. The gene of interest may also code for an RNA molecule, including, but not limited to, messenger RNA (mRNA), transfer RNA (tRNA), ribosomal RNA (rRNA), small nuclear RNA (snRNA), antisense RNA, guide RNA, microRNA (miRNA), small interfering RNA (siRNA), and cell-free RNA (cfRNA).

ガイドRNA(「gRNA」)
本明細書に使用されるとき、用語「ガイドRNA」は、大部分が一般的にCRISPR-Cas9のCasタンパク質に関連する具体的な型のガイド核酸であって、Cas9に結び付いて、Cas9タンパク質をDNA分子中の特定の配列(ガイドRNAのプロトスペース配列との相補性を包含する)へ向かわせる。しかしながら、この用語はまた、天然に存在するかもしくは天然には存在しない(例として、改変または組換え)かに関わらず、Cas9等価物、ホモログ、オルソログ、またはパラログに結び付き、またCas9等価物を特定の標的ヌクレオチド配列へ局在化するよう別にプログラムする、等価なガイド核酸分子も受け入れる。Cas9等価物は、Cpf1(V型CRISPR-Cas系)、C2c1(V型CRISPR-Cas系)、C2c2(VI型CRISPR-Cas系)およびC2c3(V型CRISPR-Cas系)を包含する、いずれの型のCRISPR系(例として、II型、V型、VI型)からの他のnapDNAbpも包含していてもよい。さらなるCas等価物は、Makarova et al.,"C2c2 is a single-component programmable RNA-guided RNA-targeting CRISPR effector,"Science 2016;353(6299)(この内容は参照により本明細書に組み込まれる)に記載されている。ガイドRNAの例示の配列および構造は本明細書に提供されている。加えて、適切なガイドRNA配列をデザインするための方法も、本明細書に提供されている。本明細書に使用されるとき、「ガイドRNA」はまた、本明細書に開示のプライム編集方法および組成物のために発明された「プライム編集ガイドRNA」(または「PEgRNA」)と呼ばれる修飾形態のガイドRNAと対比させるために「既存のガイドRNA」とも称されてもよい。
Guide RNA ("gRNA")
As used herein, the term "guide RNA" refers to a specific type of guide nucleic acid, most commonly associated with the Cas protein of CRISPR-Cas9, that binds to Cas9 and directs the Cas9 protein to a specific sequence in a DNA molecule (including the complementarity of the guide RNA to the protospace sequence). However, the term also embraces equivalent guide nucleic acid molecules that bind to Cas9 equivalents, homologs, orthologs, or paralogs, whether naturally occurring or not (e.g., modified or recombinant), and that otherwise program the Cas9 equivalent to localize to a specific target nucleotide sequence. Cas9 equivalents may also include other napDNAbp from any type of CRISPR system (e.g., type II, type V, type VI), including Cpf1 (type V CRISPR-Cas system), C2c1 (type V CRISPR-Cas system), C2c2 (type VI CRISPR-Cas system), and C2c3 (type V CRISPR-Cas system). Further Cas equivalents are described in Makarova et al., "C2c2 is a single-component programmable RNA-guided RNA-targeting CRISPR effector," Science 2016;353(6299), the contents of which are incorporated herein by reference. Exemplary sequences and structures of guide RNAs are provided herein. In addition, methods for designing suitable guide RNA sequences are also provided herein. As used herein, "guide RNA" may also be referred to as "existing guide RNA" to contrast with the modified form of guide RNA called "prime editing guide RNA" (or "PEgRNA") invented for the prime editing methods and compositions disclosed herein.

ガイドRNAまたはPEgRNAは、これらに限定されないが、以下を包含する様々な構造要素を含んでいてもよい: Guide RNAs or PEgRNAs may contain a variety of structural elements, including, but not limited to:

スペーサー配列-標的DNA中のプロトスペーサーへ結合するガイドRNAまたはPEgRNA(長さが約20ntを有する)中の配列。 Spacer sequence - A sequence in the guide RNA or PEgRNA (approximately 20 nt in length) that binds to the protospacer in the target DNA.

gRNAコア(またはgRNA骨格もしくは主鎖配列)-は、Cas9結合を担うgRNA内の配列を指し、これは、Cas9を標的DNAへガイドするのに使用されるスペーサー/標的化配列を包含していない。 gRNA core (or gRNA backbone or backbone sequence) - refers to the sequence within the gRNA responsible for Cas9 binding, this does not include the spacer/targeting sequence used to guide Cas9 to the target DNA.

伸長アーム-PEgRNAの3'端または5'端の一本鎖伸長。これは、プライマー結合部位とポリメラーゼ(例えば逆転写酵素)によって目当ての遺伝子変化を含有する一本鎖DNAフラップをコードするDNA合成鋳型配列とを含む。これが、それから、対応する内生鎖を置き換えることによって内生DNA上に取り入れし、それによって所望の遺伝子変化を組み入れる。 Extension arm - a single-stranded extension at the 3' or 5' end of the PEGRNA. It contains a primer binding site and a DNA synthesis template sequence that encodes a single-stranded DNA flap containing the desired genetic change by a polymerase (e.g., reverse transcriptase). This is then incorporated onto the endogenous DNA by displacing the corresponding endogenous strand, thereby incorporating the desired genetic change.

転写ターミネーター-ガイドRNAまたはPEgRNAは分子の3'に転写終結配列を含み得る。 Transcription terminator - The guide RNA or PEgRNA may contain a transcription termination sequence at the 3' end of the molecule.

相同アーム
用語「相同アーム」は、結果として得られる、逆転写酵素にコードされた単鎖DNAフラップ(内生鎖を置き換えることによって標的DNA部位中へ取り入れられる)の部分をコードする伸長アームの部分(単数または複数)を指す。相同アームによってコードされる単鎖DNAフラップの部分は、標的DNA配列の非編集済鎖に相補的であって、内生鎖に取って代わることおよびその場所において単鎖DNAフラップとアニールすることを容易にし、これによって編集が組み入れられる。この構成要素は他のどこかでさらに定義される。定義上、それは本明細書に記載のプライム編集因子のポリメラーゼによってコードされるので、相同アームはDNA合成鋳型の一部である。
Homologous arm The term "homologous arm" refers to the portion or portions of the extension arm that code for the resulting portion of the reverse transcriptase-encoded single-stranded DNA flap that is incorporated into the target DNA site by displacing the endogenous strand. The portion of the single-stranded DNA flap that is encoded by the homologous arm is complementary to the non-edited strand of the target DNA sequence, facilitating it to displace the endogenous strand and anneal with the single-stranded DNA flap in its place, thereby incorporating the edit. This component is further defined elsewhere. By definition, the homologous arm is part of the DNA synthesis template, since it is encoded by the polymerase of the prime editor described herein.

宿主細胞
用語「宿主細胞」は、本明細書に使用されるとき、本明細書に記載のベクター、例として、Cas9もしくはCas9等価物と逆転写酵素とを含む融合タンパク質をコードする核酸分子を含むベクターの宿主となり(host)複製してこれを発現し得る細胞を指す。
Host Cell The term "host cell," as used herein, refers to a cell that can host, replicate and express the vectors described herein, including vectors containing a nucleic acid molecule encoding a fusion protein comprising Cas9 or a Cas9 equivalent and reverse transcriptase.

インテイン
本願において用いられる用語「インテイン」は、生命の全てのドメインからの生物に見出される自己プロセシングポリペプチドドメインを言う。インテイン(介在タンパク質)は、タンパク質スプライシングとして公知の固有の自己プロセシングイベントを実行する。これにおいては、それは、2つのペプチド結合の切断によってより大きい前駆体ポリペプチドからそれ自体を切除、プロセスにおいて、新たなペプチド結合の形成によってフランキングするエクステイン(外部タンパク質)配列同士をライゲーションする。インテイン遺伝子は他のタンパク質コード遺伝子とインフレームで埋め込まれて見出されるので、この再構成は翻訳後に(または共翻訳的に)生起する。さらにその上、インテインによって媒介されるタンパク質スプライシングは自発的である;それは、外部の因子またはエネルギー源ではなくインテインドメインのフォールディングのみを要求する。このプロセスは、「分裂インテイン」によるトランスタンパク質スプライシングの天然のプロセスと対比して、シスタンパク質スプライシングとしてもまた公知である。インテインは自己スプライシングRNAイントロンのタンパク質等価物であり(Perler et al.,Nucleic Acids Res.22:1125-1127(1994)を見よ)、これらは前駆体タンパク質からのそれら自体の切除を触媒し、エクステインとして公知のフランキングするタンパク質配列の付随的融合を有する(Perler et al.,Curr.Opin.Chem.Biol.1:292-299(1997);Perler,F.B.Cell 92(1):1-4(1998);Xu et al.,EMBO J.15(19):5146-5153(1996)において総説されている)。
Intein The term "intein" as used herein refers to a self-processing polypeptide domain found in organisms from all domains of life. An intein (intercalating protein) performs a unique self-processing event known as protein splicing, in which it excises itself from a larger precursor polypeptide by cleavage of two peptide bonds, and in the process ligates flanking extein (external protein) sequences by forming new peptide bonds. Since intein genes are found embedded in-frame with other protein-coding genes, this rearrangement occurs post-translationally (or co-translationally). Furthermore, intein-mediated protein splicing is spontaneous; it requires only the folding of the intein domain, not external factors or energy sources. This process is also known as cis protein splicing, in contrast to the natural process of trans protein splicing by "split inteins". Inteins are the protein equivalents of self-splicing RNA introns (see Perler et al., Nucleic Acids Res. 22:1125-1127 (1994)), which catalyze their own excision from precursor proteins and have the concomitant fusion of flanking protein sequences known as exteins (reviewed in Perler et al., Curr. Opin. Chem. Biol. 1:292-299 (1997); Perler, FB Cell 92(1):1-4 (1998); Xu et al., EMBO J. 15(19):5146-5153 (1996)).

本願において用いられる用語「タンパク質スプライシング」は、前駆体タンパク質の内側領域(インテイン)が切り出され、タンパク質のフランキング領域(エクステイン)同士がライゲーションされて、成熟したタンパク質を形成するプロセスを言う。この天然のプロセスは、原核生物および真核生物両方からの数々のタンパク質で観察されている(Perler,F.B.,Xu,M.Q.,Paulus,H.Current Opinion in Chemical Biology 1997,1,292-299;Perler,F.B.Nucleic Acids Research 1999,27,346-347)。インテイン単位は、タンパク質スプライシングを触媒するために必要とされる必要な構成要素を含有し、多くの場合には、インテイン可動性に関与するエンドヌクレアーゼドメインを含有する(Perler,F.B.,Davis,E.O.,Dean,G.E.,Gimble,F.S.,Jack,W.E.,Neff,N.,Noren,C.J.,Thomer,J.,Belfort,M.Nucleic Acids Research 1994,22,1127-1127)。しかしながら、もたらされるタンパク質は連結されており、別個のタンパク質としては発現されない。タンパク質スプライシングは、別個のポリペプチド上で発現される分裂インテインによって、トランスでもまた行われ得る。これらは自発的に組み合わさって単一のインテインを形成し、これがそれからタンパク質スプライシングプロセスを経過して別個のタンパク質に連結する。 As used herein, the term "protein splicing" refers to the process by which internal regions (inteins) of a precursor protein are excised and flanking regions (exteins) of the protein are ligated to form the mature protein. This natural process has been observed in numerous proteins from both prokaryotes and eukaryotes (Perler, F.B., Xu, M.Q., Paulus, H. Current Opinion in Chemical Biology 1997, 1, 292-299; Perler, F.B. Nucleic Acids Research 1999, 27, 346-347). Intein units contain the necessary components required to catalyze protein splicing and often contain an endonuclease domain responsible for intein mobility (Perler, F.B., Davis, E.O., Dean, G.E., Gimble, F.S., Jack, W.E., Neff, N., Noren, C.J., Thomer, J., Belfort, M. Nucleic Acids Research 1994,22,1127-1127). However, the resulting proteins are linked and are not expressed as separate proteins. Protein splicing can also be performed in trans by split inteins expressed on separate polypeptides. These spontaneously combine to form a single intein, which then goes through the protein splicing process to link separate proteins.

タンパク質スプライシングの機序の解明は、インテインに基づく数多の用途へ繋がっている(Comb,et al.,米国特許第5,496,714号; Comb,et al.,米国特許第5,834,247号;Camarero and Muir,J.Amer.Chem.Soc.,121:5597-5598(1999);Chong,et al.,Gene,192:271-281(1997),Chong,et al.,Nucleic Acids Res.,26:5109-5115(1998);Chong,et al.,J.Biol.Chem.,273:10567-10577(1998);Cotton,et al.J.Am.Chem.Soc.,121:1100-1101(1999);Evans,et al.,J.Biol.Chem.,274:18359-18363(1999);Evans,et al.,J.Biol.Chem.,274:3923-3926(1999);Evans,et al.,Protein Sci.,7:2256-2264(1998);Evans,et al.,J.Biol.Chem.,275:9091-9094(2000);Iwai and Pluckthun,FEBS Lett.459:166-172(1999);Mathys,et al.,Gene,231:1-13(1999);Mills,et al.,Proc.Natl.Acad.Sci.USA 95:3543-3548(1998);Muir,et al.,Proc.Natl.Acad.Sci.USA 95:6705-6710(1998);Otomo,et al.,Biochemistry 38:16040-16044(1999);Otomo,et al.,J.Biolmol.NMR 14:105-114(1999);Scott,et al.,Proc.Natl.Acad.Sci.USA 96:13638-13643(1999);Severinov and Muir,J.Biol.Chem.,273:16205-16209(1998);Shingledecker,et al.,Gene,207:187-195(1998);Southworth,et al.,EMBO J.17:918-926(1998);Southworth,et al.,Biotechniques,27:110-120(1999);Wood,et al.,Nat.Biotechnol.,17:889-892(1999);Wu,et al.,Proc.Natl.Acad.Sci.USA 95:9226-9231(1998a);Wu,et al.,Biochim Biophys Acta 1387:422-432(1998b);Xu,et al.,Proc.Natl.Acad.Sci.USA 96:388-393(1999);Yamazaki,et al.,J.Am.Chem.Soc.,120:5591-5592(1998))。各参照文献は参照により本明細書に組み込まれる。 Elucidation of the mechanism of protein splicing has led to a number of intein-based applications (Comb, et al., U.S. Patent No. 5,496,714; Comb, et al., U.S. Patent No. 5,834,247; Camarero and Muir, J. Amer. Chem. Soc., 121:5597-5598 (1999); Chong, et al., Gene, 192:271-281 (1997); Chong, et al., Nucleic Acids Res., 26:5109-5115 (1998); Chong, et al., J. Biol. Chem., 273:10567-10577 (1998); Cotton, et al. J. Am. Chem. Soc., 121:1100-1101 (1999); Evans, et al., J. Biol. Chem., 274:18359-18363(1999); Evans, et al., J. Biol. Chem., 274:3923-3926(1999); Evans, et al., Protein Sci., 7:2256-2264(1998); Evans, et al., J. Biol. Chem., 275:9091-9094(2000); Iwai and Pluckthun, FEBS Lett. 459:166-172(1999); Mathys, et al., Gene, 231:1-13(1999); Mills, et al., Proc. Natl. Acad. Sci. USA 95:3543-3548(1998); Muir, et al., Proc. Natl. Acad. Sci. USA 95:6705-6710(1998); Otomo, et al., Biochemistry 38:16040-16044(1999); Otomo, et al., J. Biomol. NMR 14:105-114(1999); Scott, et al., Proc. Natl. Acad. Sci. USA 96:13638-13643(1999); Severinov and Muir, J. Biol. Chem., 273:16205-16209(1998); Shingledecker, et al., Gene, 207:187-195(1998); Southworth, et al., EMBO J. 17:918-926(1998); Southworth, et al., Biotechniques, 27:110-120 (1999); Wood, et al., Nat. Biotechnol., 17:889-892 (1999); Wu, et al., Proc. Natl. Acad. Sci. USA 95:9226-9231 (1998a); Wu, et al., Biochim Biophys Acta 1387:422-432 (1998b); Xu, et al., Proc. Natl. Acad. Sci. USA 96:388-393 (1999); Yamazaki, et al., J. Am. Chem. Soc., 120:5591-5592 (1998)). Each reference is incorporated herein by reference.

リガンド依存性インテイン
本願において用いられる用語「リガンド依存性インテイン」は、リガンド結合ドメインを含むインテインを言う。典型的には、リガンド結合ドメインはインテインのアミノ酸配列上に挿入され、構造インテイン(N)-リガンド結合ドメイン-インテイン(C)をもたらす。典型的には、リガンド依存性インテインは、適当なリガンドの不在下においてはタンパク質スプライシング活性を発揮しないかまたは最小限のみ発揮し、リガンドの存在下においてはタンパク質スプライシング活性の顕著な増大を発揮する。いくつかの態様では、リガンド依存性インテインはリガンドの不在下においては観察可能なスプライシング活性を発揮しないが、リガンドの存在下においてはスプライシング活性を発揮する。いくつかの態様では、リガンド依存性インテインはリガンドの不在下においては観察可能なタンパク質スプライシング活性を、適当なリガンド存在下においては、リガンドの不在下において観察される活性よりも少なくとも5倍、少なくとも10倍、少なくとも50倍、少なくとも100倍、少なくとも150倍、少なくとも200倍、少なくとも250倍、少なくとも500倍、少なくとも1000倍、少なくとも1500倍、少なくとも2000倍、少なくとも2500倍、少なくとも5000倍、少なくとも10000倍、少なくとも20000倍、少なくとも25000倍、少なくとも50000倍、少なくとも100000倍、少なくとも500000倍、または少なくとも1000000倍多大であるタンパク質スプライシング活性を発揮する。いくつかの態様では、活性の増大は少なくとも1桁、少なくとも2桁、少なくとも3桁、少なくとも4桁、または少なくとも5桁に渡って用量依存的であり、リガンドの濃度を調整することによってインテイン活性の微調整を許す。好適なリガンド依存性インテインは当該技術分野において知られており、下で提供されるものおよび公開米国特許出願第U.S.2014/0065711A1号;Mootz et al.,"Protein splicng triggered by a small molecule."J.Am.Chem.Soc.2002;124,9044-9045;Mootz et al.,"Conditional protein splicng: a new tool to control protein structure and function in vitro and in vivo."J.Am.Chem.Soc.2003;125,10561-10569;Buskirk et al.,Proc.Natl.Acad.Sci.USA. 2004;101,10505-10510);Skretas & Wood,"Regulation of protein activity with small-molecule-controlled inteins."Protein Sci.2005;14,523-532;Schwartz,et al.,"Post-translational enzyme activation in an animal via optimized conditional protein splicing."Nat.Chem.Biol.2007;3,50-54;Peck et al.,Chem.Biol.2011;18(5),619-630に記載されているものを包含する;夫々の内容全体は参照によってここに組み込まれる。例示の配列は次のとおりである:

Figure 2020191243000002

Figure 2020191243000003
Ligand-dependent intein The term "ligand-dependent intein" as used herein refers to an intein that includes a ligand-binding domain. Typically, the ligand-binding domain is inserted onto the amino acid sequence of the intein, resulting in the structure intein(N)-ligand-binding domain-intein(C). Typically, the ligand-dependent intein exerts no or only minimal protein splicing activity in the absence of a suitable ligand, and exerts a significant increase in protein splicing activity in the presence of a ligand. In some embodiments, the ligand-dependent intein exerts no observable splicing activity in the absence of a ligand, but exerts splicing activity in the presence of a ligand. In some embodiments, the ligand-dependent intein exerts observable protein splicing activity in the absence of ligand and in the presence of a suitable ligand, a protein splicing activity that is at least 5-fold, at least 10-fold, at least 50-fold, at least 100-fold, at least 150-fold, at least 200-fold, at least 250-fold, at least 500-fold, at least 1000-fold, at least 1500-fold, at least 2000-fold, at least 2500-fold, at least 5000-fold, at least 10000-fold, at least 20000-fold, at least 25000-fold, at least 50000-fold, at least 100000-fold, at least 500000-fold, or at least 1000000-fold greater than the activity observed in the absence of ligand. In some embodiments, the increase in activity is dose-dependent over at least one order of magnitude, at least two orders of magnitude, at least three orders of magnitude, at least four orders of magnitude, or at least five orders of magnitude, allowing fine-tuning of intein activity by adjusting the concentration of the ligand. Suitable ligand-dependent inteins are known in the art and include those provided below and in published U.S. Patent Application No. US2014/0065711A1; Mootz et al., "Protein splicing triggered by a small molecule." J. Am. Chem. Soc. 2002; 124, 9044-9045; Mootz et al., "Conditional protein splicing: a new tool to control protein structure and function in vitro and in vivo." J. Am. Chem. Soc. 2003; 125, 10561-10569; Buskirk et al., Proc. Natl. Acad. Sci. USA. 2004; 101, 10505-10510); Skretas & Wood, "Regulation of protein activity with small-molecule-controlled inteins." Protein Sci. 2005; 14, 523-532; Schwartz, et al., "Post-translational enzyme activation in an animal via optimized conditional protein splicing." Nat. Chem. Biol. 2007;3,50-54; Peck et al., Chem. Biol. 2011;18(5),619-630, the entire contents of each of which are incorporated herein by reference. Exemplary sequences are as follows:
Figure 2020191243000002

Figure 2020191243000003

リンカー
本願において用いられる用語「リンカー」は、2つの他の分子または部分を連結するある分子を言う。リンカーは、2つの融合タンパク質を連結するリンカーのケースではアミノ酸配列であり得る。例えば、Cas9はアミノ酸リンカー配列によって逆転写酵素に融合され得る。リンカーは、2つのヌクレオチド配列を一緒に連結するケースではヌクレオチド配列でもまたあり得る。例えば、本ケースでは、従来のガイドRNAは、スペーサーまたはリンカーヌクレオチド配列を介して、RT鋳型配列とRTプライマー結合部位とを含み得るプライム編集ガイドRNAのRNA伸長に連結される。他の態様において、リンカーは有機分子、基、ポリマー、または化学的部分である。いくつかの態様では、リンカーは、長さが5-100アミノ酸、例えば長さが5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、30~35、35~40、40~45、45~50、50~60、60~70、70~80、80~90、90~100、100~150、または150~200アミノ酸である。より長いまたはより短いリンカーもまた企図される。
Linker The term "linker" as used herein refers to a molecule that connects two other molecules or moieties. A linker can be an amino acid sequence in the case of a linker that connects two fusion proteins. For example, Cas9 can be fused to reverse transcriptase by an amino acid linker sequence. A linker can also be a nucleotide sequence in the case of linking two nucleotide sequences together. For example, in this case, a conventional guide RNA is linked to the RNA extension of a primed editing guide RNA, which can include a RT template sequence and a RT primer binding site, via a spacer or linker nucleotide sequence. In other embodiments, the linker is an organic molecule, a group, a polymer, or a chemical moiety. In some embodiments, the linker is 5-100 amino acids in length, e.g., 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 30-35, 35-40, 40-45, 45-50, 50-60, 60-70, 70-80, 80-90, 90-100, 100-150, or 150-200 amino acids in length. Longer or shorter linkers are also contemplated.

単離された
「単離された」は、自然状態から変更または除去されることを意味する。例えば、生きている動物中に天然に存在する核20酸またはペプチドは「単離され」ていないが、共存材料のその自然状態から部分的または完全に分離された同じ核酸またはペプチドは、「単離され」ている。単離された核酸またはタンパク質は、実質的に精製された形態で存在し得るか、または非ネイティブ(non-native)的環境(例えば、宿主細胞など)で存在し得る。
Isolated "Isolated" means altered or removed from its natural state. For example, a nucleic acid or peptide that is naturally present in a living animal is not "isolated," but the same nucleic acid or peptide that is partially or completely separated from its natural state of coexisting materials is "isolated." An isolated nucleic acid or protein may exist in a substantially purified form or may exist in a non-native environment (such as, for example, a host cell).

いくつかの態様において、着目する遺伝子は、単離された核酸によってコードされる。本明細書に使用されるとき、用語「単離された」は、その元のまたはネイティブ(native)の環境(例として、天然に存在する場合は自然環境)から除去されている、本明細書に提供されるとおりの材料の特徴を指す。したがって、生きている動物中に存在する、天然に存在するポリヌクレオチドまたはタンパク質もしくはポリペプチドは単離されていないが、ヒトの介入によって自然系中の共存材料のいくつかまたはすべてから分離されている同じポリヌクレオチドまたはポリペプチドは、単離されている。人工材料または改変材料、例えば、本明細書に記載の発現コンストラクトおよびベクターなどの、天然には存在しない核酸構築物はまた、結果的に、単離されたとも称される。材料は、単離されるために精製される必要はない。結果的に、材料はベクターの一部および/または組成物の一部であってもよく、かかるベクターまたは組成物が、材料が自然界から見出される環境の一部にない点で、依然単離されている。 In some embodiments, the gene of interest is encoded by an isolated nucleic acid. As used herein, the term "isolated" refers to the character of a material as provided herein that has been removed from its original or native environment (e.g., the natural environment if it occurs in nature). Thus, a naturally occurring polynucleotide or protein or polypeptide present in a living animal is not isolated, but the same polynucleotide or polypeptide that has been separated from some or all of the coexisting materials in a natural system by human intervention is isolated. Artificial or modified materials, such as non-naturally occurring nucleic acid constructs, such as the expression constructs and vectors described herein, are also subsequently referred to as isolated. A material does not have to be purified to be isolated. Consequently, a material may be part of a vector and/or part of a composition, and such a vector or composition is still isolated in that it is not part of the environment in which the material is found in nature.

MS2タグ付け技術
種々の態様では(例えば、図72~73および例19の態様に図示されているとおり)、用語「MS2タグ付け技術」は、RNA-タンパク質相互作用ドメイン、例えば特定のヘアピン構造を特異的に認識および結合するRNA結合タンパク質とペアリングされた「RNA-タンパク質相互作用ドメイン」(「RNA-タンパク質動員ドメインまたはタンパク質」としてもまた公知)の組み合わせを言う。これらの型のシステムは、標的部位に結合されているプライム編集因子複合体に種々の機能性を動員するように活用され得る。MS2タグ付け技術は、ファージのゲノム上に存在するステムループまたはヘアピン構造、すなわち「MS2ヘアピン」とのMS2バクテリオファージコートタンパク質(「MCP」または「MS2cp」)の天然の相互作用に基づく。プライム編集のケースでは、MS2タグ付け技術は、プライム編集に関わる所望のRNA分子(例えば、PEgRNAまたはtPERT)上にMS2ヘアピンを導入することを含む。これは、それから、その構造を認識および結合するRNA結合タンパク質にとっての特異的な相互作用可能な結合標的を構成する。MS2ヘアピンのケースでは、それはMS2バクテリオファージコートタンパク質(MCP)によって認識および結合される。そして、MCPが別のタンパク質(例えば、逆転写酵素または他のDNAポリメラーゼ)に融合される場合には、MS2ヘアピンが、プライム編集複合体によって占有される標的部位にその他のタンパク質をトランスで「動員」するために用いられ得る。
MS2 tagging technology In various embodiments (e.g., as illustrated in the embodiments of Figures 72-73 and Example 19), the term "MS2 tagging technology" refers to the combination of an "RNA-protein interaction domain" (also known as an "RNA-protein recruitment domain or protein") paired with an RNA-protein interaction domain, e.g., an RNA binding protein that specifically recognizes and binds to a particular hairpin structure. These types of systems can be exploited to recruit various functionalities to a prime editor complex that is bound to a target site. MS2 tagging technology is based on the natural interaction of MS2 bacteriophage coat protein ("MCP" or "MS2cp") with a stem-loop or hairpin structure, i.e., an "MS2 hairpin," present on the genome of a phage. In the case of prime editing, MS2 tagging technology involves introducing an MS2 hairpin onto the desired RNA molecule (e.g., PEgRNA or tPERT) involved in prime editing. This then constitutes a specific, interactive binding target for an RNA binding protein that recognizes and binds to that structure. In the case of the MS2 hairpin, it is recognized and bound by the MS2 bacteriophage coat protein (MCP), and if the MCP is fused to another protein (e.g., reverse transcriptase or another DNA polymerase), the MS2 hairpin can be used to "recruit" other proteins in trans to the target site occupied by the prime editing complex.

本明細書に記載のプライム編集因子は、側面として、目当ての特定の機能をプライム編集因子複合体に動員または「共局在」させるためにいずれかの公知のRNA-タンパク質相互作用ドメインを組み込み得る。RNA-タンパク質相互作用の他のモジュールドメインの総説は、当該技術分野において、例えば、Johansson et al.,"RNA recognition by the MS2 phage coat protein,"Sem Virol.,1997,Vol.8(3):176-185;Delebecque et al.,"Organization of intracellular reactions with rationally designed RNA assemblies,"Science,2011,Vol.333:470-474;Mali et al.,"Cas9 transcriptional activators for target specificity screening and paired nickases for cooperative genome engineering,"Nat. Biotechnol.,2013,Vol.31:833-838;およびZalatan et al.,"Engineering complex synthetic transcriptional programs with CRISPR RNA scaffolds,"Cell,2015,Vol.160:339-350(これら各々はその全体が参照されることによって本明細書に組み込まれる)において記載されている。他の系も、PCPタンパク質を特異的に動員するPP7ヘアピン、およびComタンパク質を特異的に動員する「com」ヘアピンを包含する。Zalatan et al.を参照。 The prime editors described herein may, as an aspect, incorporate any known RNA-protein interaction domain to recruit or "colocalize" a particular function of interest to the prime editor complex. Reviews of other modular domains of RNA-protein interactions are described in the art, for example, in Johansson et al., "RNA recognition by the MS2 phage coat protein," Sem Virol., 1997, Vol. 8(3):176-185; Delebecque et al., "Organization of intracellular reactions with rationally designed RNA assemblies," Science, 2011, Vol. 333:470-474; Mali et al., "Cas9 transcriptional activators for target specificity screening and paired nickases for cooperative genome engineering," Nat. Biotechnol., 2013, Vol. 31:833-838; and Zalatan et al., "Engineering complex synthetic transcriptional programs with CRISPR RNA scaffolds," Cell, 2015, Vol. 160:339-350, each of which is incorporated herein by reference in its entirety. Other systems include the PP7 hairpin, which specifically recruits the PCP protein, and the "com" hairpin, which specifically recruits the Com protein. See Zalatan et al.

MS2ヘアピン(即ち、「MS2アプタマー」と称される)のヌクレオチド配列は以下:GCCAACATGAGGATCACCCATGTCTGCAGGGCC(配列番号763)である。 The nucleotide sequence of the MS2 hairpin (i.e., referred to as the "MS2 aptamer") is: GCCAACATGAGGATCACCCATGTCTGCAGGGCC (SEQ ID NO: 763).

MCPまたはMS2cpのアミノ酸配列は以下:GSASNFTQFVLVDNGGTGDVTVAPSNFANGVAEWISSNSRSQAYKVTCSVRQSSAQNRKYTIKVEVPKVATQTVGGEELPVAGWRSYLNMELTIPIFATNSDCELIVKAMQGLLKDGNPIPSAIAANSGIY(配列番号764)である。 The amino acid sequence of MCP or MS2cp is: GSASNFTQFVLVDNGGTGDVTVAPSNFANGVAEWISSNSRSQAYKVTCSVRQSSAQNRKYTIKVEVPKVATQTVGGEELPVAGWRSYLNMELTIPIFATNSDCELIVKAMQGLLKDGNPIPSAIAANSGIY (SEQ ID NO: 764).

MS2ヘアピン(または「MS2アプタマー」)は、ある型の「RNAエフェクター動員ドメイン」(または同等に「RNA結合タンパク質動員ドメイン」もしくは単純に「動員ドメイン」)ともまた言われ得る。なぜなら、それは、PEgRNAまたはtPERT上に組み入れされる物理的構造(例えばヘアピン)であり、これはそのように改変されたPEgRNAまたはrPERTに他のエフェクター機能(例えば、種々の機能を有するRNA結合タンパク質、例えばDNAポリメラーゼ、または他のDNA修飾酵素)を有効に動員し、それゆえにプライム編集機構にエフェクター機能をトランスで共局在させるからである。この適用は、いずれかの具体的なRNAエフェクター動員ドメインに限定されることを決して意図されず、MS2ヘアピンを包含するいずれかの利用可能なかかるドメインを包含し得る。例19および図72(b)は、標的DNA部位に結合したプライム編集因子複合体(MS2cp-PE2:sgRNA複合体)とtPERT分子のDNA合成ドメインとの共局在が成就することを引き起こすための、DNA合成ドメイン(すなわちtPERT分子)に連結されたMS2アプタマーとPE2に融合されたMS2cpタンパク質を含むプライム編集因子との使用を図示する。 The MS2 hairpin (or "MS2 aptamer") may also be referred to as a type of "RNA effector recruitment domain" (or equivalently, "RNA binding protein recruitment domain" or simply "recruitment domain") because it is a physical structure (e.g., a hairpin) that is incorporated onto the PEgRNA or tPERT that effectively recruits other effector functions (e.g., RNA binding proteins with various functions, such as DNA polymerases, or other DNA-modifying enzymes) to the so modified PEgRNA or rPERT, thus colocalizing the effector functions in trans to the prime editing machinery. This application is in no way intended to be limited to any particular RNA effector recruitment domain, but may include any available such domain, including the MS2 hairpin. Example 19 and FIG. 72(b) illustrate the use of a prime editor that includes an MS2 aptamer linked to a DNA synthesis domain (i.e., a tPERT molecule) and an MS2cp protein fused to PE2 to induce colocalization of a prime editor complex (MS2cp-PE2:sgRNA complex) bound to a target DNA site with the DNA synthesis domain of the tPERT molecule.

napDNAbp
本明細書に使用されるとき、用語「核酸プログラム型DNA結合タンパク質」または「napDNAbp」(そのCas9が一例である)は、DNA分子中の特定の配列を標的にし結合するためにRNA:DNAハイブリダイゼーションを使用するタンパク質を指す。各napDNAbpは、ガイド核酸またはこの一部(例として、ガイドRNAのプロトスペーサー)に相補的なDNA鎖(すなわち、標的鎖)を含むDNA配列へnapDNAbpを局在化する、少なくとも1のガイド核酸(例として、ガイドRNA)に結び付けられている。換言すれば、ガイド核酸は、相補的な配列へ局在化し結合するようnapDNAbp(例として、Cas9または等価物)を「プログラム」する。
napDNAbp
As used herein, the term "nucleic acid programmed DNA binding protein" or "napDNAbp" (of which Cas9 is an example) refers to a protein that uses RNA:DNA hybridization to target and bind to a specific sequence in a DNA molecule. Each napDNAbp is linked to at least one guide nucleic acid (e.g., a guide RNA) that localizes the napDNAbp to a DNA sequence that includes a DNA strand (i.e., a target strand) that is complementary to the guide nucleic acid or a portion thereof (e.g., a protospacer of the guide RNA). In other words, the guide nucleic acid "programs" the napDNAbp (e.g., Cas9 or equivalent) to localize and bind to the complementary sequence.

理論に拘泥されないが、napDNAbp-ガイドRNA複合体の結合機序は、一般に、napDNAbpが二本鎖DNA標的の巻き戻しを誘導するRループを形成する(これによってnapDNAbpによって結合された領域中の鎖が分離される)ステップを包含する。ガイドRNAプロトスペーサーは次いで「標的鎖」とハイブリダイズする。これは、標的鎖に相補的な「非標的鎖」に取って代わり、このことによってRループの単鎖領域が形成される。いくつかの態様において、napDNAbpは1以上のヌクレアーゼ活性を包含しており、次いでDNAを切ることで、様々な型の病変がなくなる。例えば、napDNAbpは、非標的鎖を第1の場所にて切るか、および/または標的鎖を第2の場所にて切る、ヌクレアーゼ活性を含んでいてもよい。ヌクレアーゼ活性に応じて標的DNAが切られることで、両鎖とも切られた「二本鎖切断」が形成され得る。他の態様において、標的DNAは単一の部位でしか切られ得ない、すなわち、DNAは一方の鎖上に「ニックが入れられる(nicked)」。種々のヌクレアーゼ活性をもつ例示のnapDNAbpは、「Cas9ニッカーゼ」(「nCas9」)、およびヌクレアーゼ活性を一切有さない不活性化Cas9(「不活性型Cas9」または「dCas9」)を包含する。これらのおよび他のnapDNAbpへの例示の配列は、本明細書に提供されている。 Without being bound by theory, the binding mechanism of the napDNAbp-guide RNA complex generally involves the formation of an R-loop in which the napDNAbp induces unwinding of the double-stranded DNA target (thereby separating the strands in the region bound by the napDNAbp). The guide RNA protospacer then hybridizes to the "target strand". This displaces the "non-target strand" that is complementary to the target strand, thereby forming a single-stranded region of the R-loop. In some embodiments, the napDNAbp contains one or more nuclease activities, which then cleave the DNA to eliminate various types of lesions. For example, the napDNAbp may contain a nuclease activity that cleaves the non-target strand at a first location and/or the target strand at a second location. In response to the nuclease activity, the target DNA may be cleaved to form a "double-stranded break" in which both strands are cleaved. In other embodiments, the target DNA may only be cleaved at a single site, i.e., the DNA is "nicked" on one strand. Exemplary napDNAbps with various nuclease activities include "Cas9 nickase" ("nCas9"), and inactivated Cas9 that does not have any nuclease activity ("inactivated Cas9" or "dCas9"). Exemplary sequences for these and other napDNAbps are provided herein.

ニッカーゼ
用語「ニッカーゼ」は、不活性化された2つのヌクレアーゼドメインのうち1つをもつCas9を指す。この酵素は、標的DNAの一方の鎖のみを切断することが可能である。
The term "nickase" refers to Cas9 with one of its two nuclease domains inactivated, allowing the enzyme to cleave only one strand of the target DNA.

核局在化配列(NLS)
用語「核局在化配列」または「NLS」は、タンパク質の細胞核中への、例えば核輸送による、輸入(import)を促進するアミノ酸配列を指す。核局在化配列は当該技術分野において知られており、当業者に明らかであろう。例えば、NLS配列は、2000年11月23日に出願され、2001年5月31日にWO/2001/038547として公開された、Plankらの国際PCT出願PCT/EP2000/011690に記載されている(この内容は、例示の核局在化配列のその開示について参照により本明細書に組み込まれる)。いくつかの態様において、NLSは、アミノ酸配列PKKKRKV(配列番号16)またはMDSLLMNRRKFLYQFKNVRWAKGRRETYLC(配列番号17)を含む。
Nuclear localization sequence (NLS)
The term "nuclear localization sequence" or "NLS" refers to an amino acid sequence that facilitates the import of a protein into the cell nucleus, for example, by nuclear transport. Nuclear localization sequences are known in the art and will be apparent to those skilled in the art. For example, NLS sequences are described in International PCT Application PCT/EP2000/011690 to Plank et al., filed November 23, 2000, and published May 31, 2001 as WO/2001/038547, the contents of which are incorporated herein by reference for their disclosure of exemplary nuclear localization sequences. In some embodiments, the NLS comprises the amino acid sequence PKKKRKV (SEQ ID NO: 16) or MDSLLMNRRKFLYQFKNVRWAKGRRETYLC (SEQ ID NO: 17).

核酸分子
用語「核酸」は、本明細書に使用されるとき、ヌクレオチドのポリマーを指す。ポリマーは、天然のヌクレオシド(すなわち、アデノシン、チミジン、グアノシン、シチジン、ウリジン、デオキシアデノシン、デオキシチミジン、デオキシグアノシン、およびデオキシシチジン)、ヌクレオシド類似体(例として、2-アミノアデノシン、2-チオチミジン、イノシン、ピロロ-ピリミジン、3-メチルアデノシン、5-メチルシチジン、C5ブロモウリジン、C5フルオロウリジン、C5ヨードウリジン、C5プロピニルウリジン、C5プロピニルシチジン、C5メチルシチジン、7デアザアデノシン、7デアザグアノシン、8オキソアデノシン、8オキソグアノシン、O(6)メチルグアニン、4-アセチルシチジン、5-(カルボキシヒドロキシメチル)ウリジン、ジヒドロウリジン、メチルシュードウリジン、1-メチルアデノシン、1-メチルグアノシン、N6-メチルアデノシン、および2-チオシチジン)、化学修飾された塩基、生物学的に修飾された塩基(例として、メチル化された塩基)、インターカレートされた(intercalated)塩基、修飾された糖(例として、2'-フルオロリボース、リボース、2'-デオキシリボース、2'-O-メチルシチジン、アラビノース、およびヘキソース)、または修飾されたホスファート基(例として、ホスホロチオアートおよび5'-Nホスホラミダイト連結)を包含していてもよい。
Nucleic Acid Molecules The term "nucleic acid" as used herein refers to a polymer of nucleotides. The polymer may be any of a variety of nucleotides, including natural nucleosides (i.e., adenosine, thymidine, guanosine, cytidine, uridine, deoxyadenosine, deoxythymidine, deoxyguanosine, and deoxycytidine), nucleoside analogs (e.g., 2-aminoadenosine, 2-thiothymidine, inosine, pyrrolo-pyrimidine, 3-methyladenosine, 5-methylcytidine, C5 bromouridine, C5 fluorouridine, C5 iodouridine, C5 propynyluridine, C5 propynylcytidine, C5 methylcytidine, 7 deazaadenosine, 7 deazaguanosine, 8 oxoadenosine, 8 oxoguanosine, O(6) methylguanine, 4-acetylcytidine, 5-acetylcytidine, 6-acetylcytidine, 7-acetylcytidine, 8 ... , 5-(carboxyhydroxymethyl)uridine, dihydrouridine, methylpseudouridine, 1-methyladenosine, 1-methylguanosine, N6-methyladenosine, and 2-thiocytidine), chemically modified bases, biologically modified bases (e.g., methylated bases), intercalated bases, modified sugars (e.g., 2'-fluororibose, ribose, 2'-deoxyribose, 2'-O-methylcytidine, arabinose, and hexose), or modified phosphate groups (e.g., phosphorothioate and 5'-N phosphoramidite linkages).

PEgRNA
本明細書に使用されるとき、用語「プライム編集ガイドRNA」または「PEgRNA」または「伸長されたガイドRNA」は、本明細書に記載のプライム編集方法および組成物を実践するための1以上の追加の配列を包含するよう修飾されたガイドRNAの特化された形態を指す。本明細書に記載のとおり、プライム編集ガイドRNAは、核酸配列の1以上の「伸長された領域」を含む。伸長された領域は、これらに限定されないが、単鎖のRNAまたはDNAを含んでいてもよい。さらに、伸長された領域は、既存のガイドRNAの3'末にて生じていてもよい。他の配置において、伸長された領域は、既存のガイドRNAの5’末にて生じていてもよい。また他の配置において、伸長された領域は、既存のガイドRNAの末端の分子内のある領域にて(例えば、napDNAbpへ結び付きおよび/または結合するgRNAコア領域中)生じていてもよい。伸長された領域は、単鎖DNAを(プライム編集因子のポリメラーゼによって)コードする「DNA合成鋳型」を含むが、前記分子は次に(a)編集されるべき内生標的DNAと相同であるようデザインされており、および(b)内生標的DNA中へ誘導または取り入れられるべき少なくとも1の所望のヌクレオチド変化(例として、トランジション、トランスバージョン、欠失、もしくは挿入)を含んでいる。伸長された領域はまた、他の機能的配列要素(これらに限定されないが、「プライマー結合部位」および「スペーサーもしくはリンカー」配列など)、または他の構造的要素(これらに限定されないが、アプタマー、ステムループ、ヘアピン、トウループ(例として、3'トウループ)、もしくはRNA-タンパク質動員ドメイン(例として、MS2ヘアピン))も含んでいてもよい。本明細書に使用されるとき「プライマー結合部位」は、Rループのニック入りDNAから生成された3'末を有する単鎖DNA配列とハイブリダイズする配列を含む。
PEgRNA
As used herein, the term "prime edited guide RNA" or "PEgRNA" or "extended guide RNA" refers to a specialized form of guide RNA that has been modified to include one or more additional sequences to practice the prime editing methods and compositions described herein. As described herein, a prime edited guide RNA includes one or more "extended regions" of a nucleic acid sequence. The extended region may include, but is not limited to, a single strand of RNA or DNA. Additionally, the extended region may occur at the 3' end of an existing guide RNA. In other configurations, the extended region may occur at the 5' end of an existing guide RNA. In yet other configurations, the extended region may occur at a region within the molecule at the end of an existing guide RNA (e.g., in the gRNA core region that binds and/or binds to the napDNAbp). The extended region comprises a "DNA synthesis template" that encodes a single-stranded DNA (by the polymerase of the prime editor), which molecule is then (a) designed to be homologous to the endogenous target DNA to be edited, and (b) contains at least one desired nucleotide change (e.g., a transition, transversion, deletion, or insertion) to be introduced or incorporated into the endogenous target DNA. The extended region may also contain other functional sequence elements (such as, but not limited to, a "primer binding site" and a "spacer or linker" sequence), or other structural elements (such as, but not limited to, an aptamer, a stem loop, a hairpin, a toe loop (e.g., a 3' toe loop), or an RNA-protein recruitment domain (e.g., an MS2 hairpin)). As used herein, a "primer binding site" comprises a sequence that hybridizes to a single-stranded DNA sequence with a 3' end generated from the R-loop nicked DNA.

ある態様において、PEgRNAは、5'伸長アーム、スペーサー、およびgRNAコアを有するPEgRNAを示す図3Aによって表されている。5'伸長は、5'→3'方向に逆転写酵素鋳型、プライマー結合部位、およびリンカーをさらに含む。示されているとおり、逆転写酵素鋳型はより幅広く「DNA合成鋳型」ともまた言われ得、ここで、本明細書に記載のプライム編集因子のポリメラーゼはRTではなく別の型のポリメラーゼである。 In one embodiment, the PEgRNA is represented by FIG. 3A, which shows a PEgRNA with a 5' extension arm, a spacer, and a gRNA core. The 5' extension further comprises a reverse transcriptase template in the 5'→3' direction, a primer binding site, and a linker. As shown, the reverse transcriptase template may also be more broadly referred to as a "DNA synthesis template," where the polymerase of the prime editor described herein is not RT but another type of polymerase.

ある他の態様において、PEgRNAは、3'伸長アーム、スペーサー、およびgRNAコアを有するPEgRNAを示す図3Bによって表されている。3'伸長は、5'→3'方向に逆転写酵素鋳型、プライマー結合部位をさらに含む。示されているとおり、逆転写酵素鋳型はより幅広く「DNA合成鋳型」ともまた言われ得、ここで、本明細書に記載のプライム編集因子のポリメラーゼはRTではなく別の型のポリメラーゼである。 In certain other embodiments, the PEgRNA is represented by FIG. 3B, which shows a PEgRNA with a 3' extension arm, a spacer, and a gRNA core. The 3' extension further comprises a reverse transcriptase template in the 5'→3' direction, a primer binding site. As shown, the reverse transcriptase template may also be more broadly referred to as a "DNA synthesis template," where the polymerase of the prime editor described herein is not RT but another type of polymerase.

更なる他の態様において、PEgRNAは、5'→3'方向にスペーサー(1)、gRNAコア(2)、および伸長アーム(3)を有するPEgRNAを示す図3Dによって表されている。伸長アーム(3)は、PEgRNAの3'末にある。伸長アーム(3)は、5'→3'方向に「プライマー結合部位」(A)、「編集鋳型」(B)、および「相同アーム」(C)をさらに含む。伸長アーム(3)はまた、3'末および5'末にて、同じ配列であってもまたは異なる配列であってもよい任意の修飾領域も含んでいてもよい。加えて、PEgRNAの3'末は、転写ターミネータ配列を含んでいてもよい。PEgRNAのこれらの配列要素はさらに、本明細書に記載、定義される。 In yet another embodiment, the PEgRNA is represented by FIG. 3D, which shows a PEgRNA having a spacer (1), a gRNA core (2), and an extender arm (3) in the 5' to 3' direction. The extender arm (3) is at the 3' end of the PEgRNA. The extender arm (3) further comprises a "primer binding site" (A), an "editing template" (B), and a "homology arm" (C) in the 5' to 3' direction. The extender arm (3) may also comprise optional modification regions at the 3' and 5' ends, which may be the same or different sequences. Additionally, the 3' end of the PEgRNA may comprise a transcription terminator sequence. These sequence elements of the PEgRNA are further described and defined herein.

なお他の態様において、PEgRNAは図3Eによって表され、これは5'から3'方向に伸長アーム(3)、スペーサー(1)、およびgRNAコア(2)を有するPEgRNAを示す。伸長アーム(3)はPEgRNAの5'端にある。伸長アーム(3)はさらに3'から5'方向に「プライマー結合部位」(A)、「編集鋳型」(B)、および「相同アーム」(C)を含む。伸長アーム(3)は任意の修飾領域をもまた3'および5'端に含み得、これらは同じ配列または異なる配列であり得る。PEgRNAの3'末は、転写ターミネータ配列を含んでいてもよい。PEgRNAのこれらの配列要素はさらに、本明細書に記載、定義される。 In yet other embodiments, the PEgRNA is represented by FIG. 3E, which shows a PEgRNA having, in a 5' to 3' direction, an extension arm (3), a spacer (1), and a gRNA core (2). The extension arm (3) is at the 5' end of the PEgRNA. The extension arm (3) further comprises, in a 3' to 5' direction, a "primer binding site" (A), an "editing template" (B), and a "homology arm" (C). The extension arm (3) may also comprise optional modification regions at the 3' and 5' ends, which may be the same or different sequences. The 3' end of the PEgRNA may comprise a transcription terminator sequence. These sequence elements of the PEgRNA are further described and defined herein.

PE1
本願において用いられる「PE1」は、次の構造を有するCas9(H840A)と野生型MMLV RTとを含む融合タンパク質を含むPE複合体を言う:[NLS]-[Cas9(H840A)]-[リンカー]-[MMLV_RT(wt)]+所望のPEgRNA。PE融合体は配列番号123のアミノ酸配列を有し、これは次のとおり示される;

Figure 2020191243000004

Figure 2020191243000005
PE1
As used herein, "PE1" refers to a PE complex that includes a fusion protein comprising Cas9(H840A) and wild-type MMLV RT having the following structure: [NLS]-[Cas9(H840A)]-[Linker]-[MMLV_RT(wt)]+desired PE gRNA. The PE fusion has the amino acid sequence of SEQ ID NO: 123, which is shown as follows:
Figure 2020191243000004

Figure 2020191243000005

PE2
本願において用いられる「PE2」は、次の構造を有するCas9(H840A)とバリアントMMLV RTとを含む融合タンパク質を含むPE複合体を言う:[NLS]-[Cas9(H840A)]-[リンカー]-[MMLV_RT(D200N)(T330P)(L603W)(T306K)(W313F)]+所望のPEgRNA。PE融合体は配列番号134のアミノ酸配列を有し、これは次のとおり示される:

Figure 2020191243000006

Figure 2020191243000007
PE2
As used herein, "PE2" refers to a PE complex that includes a fusion protein comprising Cas9(H840A) and a variant MMLV RT having the following structure: [NLS]-[Cas9(H840A)]-[Linker]-[MMLV_RT(D200N)(T330P)(L603W)(T306K)(W313F)]+desired PE gRNA. The PE fusion has the amino acid sequence of SEQ ID NO: 134, which is set forth as follows:
Figure 2020191243000006

Figure 2020191243000007

PE3
本願において用いられる「PE3」は、PE2、プラスPE2と複合体化する第2鎖ニッキングガイドRNAを言い、編集される鎖の選好的置き換えを誘導するために非編集DNA鎖上にニックを導入する。
PE3b
PE3
As used herein, "PE3" refers to PE2 plus a second strand nicking guide RNA that complexes with PE2 to introduce a nick on the non-edited DNA strand to induce preferential displacement of the edited strand.
PE3b

本願において用いられる「PE3b」はPE3を言うが、第2鎖ニッキングガイドRNAは、所望の編集の組み入れ後までは第2鎖ニックが導入されないようにして時間的コントロールのためにデザインされる。これは、元々のアレルではなく編集された鎖のみにマッチするスペーサー配列を有するgRNAをデザインすることによって達成される。以降ではPE3bと言われるこの戦略を用いると、プロトスペーサーと編集されないアレルとの間のミスマッチは、PAM鎖上の編集イベントが生起する後までは、sgRNAによるニッキングを好まないはずである。 As used herein, "PE3b" refers to PE3, where a second strand nicking guide RNA is designed for temporal control such that a second strand nick is not introduced until after incorporation of the desired edit. This is accomplished by designing a gRNA with a spacer sequence that matches only the edited strand and not the original allele. Using this strategy, hereafter referred to as PE3b, mismatches between the protospacer and the non-edited allele should not favor nicking by the sgRNA until after the editing event on the PAM strand has occurred.

短いPE(PE-short)
本願において用いられる「短いPE」は、C末端短縮逆転写酵素に融合されているPE構築物を言い、次のアミノ酸配列を有する:

Figure 2020191243000008

Figure 2020191243000009
PE-short
As used herein, " short PE " refers to a PE construct that is fused to a C-terminal truncated reverse transcriptase and has the following amino acid sequence:
Figure 2020191243000008

Figure 2020191243000009

ペプチドタグ
用語「ペプチドタグ」は、遺伝子学的にタンパク質配列と融合してタンパク質上へ1以上の機能を付与するペプチドアミノ酸配列を指し、これによって可視化、精製、可溶化、分離等々などの様々な目的でのタンパク質の操作が容易になる。ペプチドタグは、目的または機能によって分類される様々な型のタグを包含し得、これは、「親和性タグ」(タンパク質精製を容易にするための)、「可溶化タグ」(タンパク質の正しい折り畳みを補助するための)、「クロマトグラフィータグ」(タンパク質のクロマトグラフ特性を変更するための)、「エピトープタグ」(高親和性抗体へ結合するための)、「蛍光タグ」(細胞中またはin vitroでのタンパク質の可視化を容易にするための)を包含していてもよい。
Peptide Tags The term "peptide tag" refers to a peptide amino acid sequence that is genetically fused to a protein sequence to confer one or more functions onto the protein, thereby facilitating manipulation of the protein for various purposes such as visualization, purification, solubilization, separation, etc. Peptide tags can include various types of tags classified by purpose or function, which may include "affinity tags" (to facilitate protein purification), "solubilization tags" (to aid in correct folding of the protein), "chromatography tags" (to alter the chromatographic properties of the protein), "epitope tags" (to bind to high affinity antibodies), "fluorescent tags" (to facilitate visualization of the protein in cells or in vitro).

ポリメラーゼ
本願において用いられる用語「ポリメラーゼ」は、本明細書に記載のプライム編集因子システムに関して用いられ得るヌクレオチド鎖を合成する酵素を言う。ポリメラーゼは「鋳型依存性」ポリメラーゼであり得る(すなわち、鋳型鎖のヌクレオチド塩基の順序に基づいてヌクレオチド鎖を合成するポリメラーゼ)。ポリメラーゼは「鋳型非依存性」ポリメラーゼでもまたあり得る(すなわち、鋳型鎖の要件なしにヌクレオチド鎖を合成するポリメラーゼ)。ポリメラーゼはさらに「DNAポリメラーゼ」または「RNAポリメラーゼ」としてもまた類別され得る。種々の態様において、プライム編集因子システムはDNAポリメラーゼを含む。種々の態様において、DNAポリメラーゼは「DNA依存性DNAポリメラーゼ」であり得る(すなわち、それによると、鋳型分子はDNAの鎖である)。かかるケースでは、DNA鋳型分子はPEgRNAであり得、伸長アームはDNAの鎖を含む。かかるケースでは、PEgRNAはキメラまたはハイブリッドPEgRNAと言われ得、これはRNA部分(すなわち、スペーサーおよびgRNAコアを包含するガイドRNA構成要素)とDNA部分(すなわち伸長アーム)とを含む。種々の他の態様において、DNAポリメラーゼは「RNA依存性DNAポリメラーゼ」であり得る(すなわち、それによると、鋳型分子はRNAの鎖である)。かかるケースでは、PEgRNAはRNAであり、すなわちRNA伸長を包含する。用語「ポリメラーゼ」は、ヌクレオチドの重合を触媒する酵素をもまた言い得る(すなわちポリメラーゼ活性)。一般的に、酵素は、ポリヌクレオチド鋳型配列にアニーリングしたプライマー(例えば、例えばPEgRNAのプライマー結合部位にアニーリングしたプライマー配列)の3'端において合成を開始し、鋳型鎖の5'端の方へ進むであろう。「DNAポリメラーゼ」はデオキシヌクレオチドの重合を触媒する。DNAポリメラーゼを参照して本願において用いられる用語DNAポリメラーゼは、「その機能的フラグメント」を包含する。「その機能的フラグメント」は、少なくとも1つのセットの条件下においてはポリヌクレオチドの重合を触媒する能力を保持する、ポリメラーゼのアミノ酸配列全体未満を包摂する野生型または変異体DNAポリメラーゼのいずれかの部分を言う。かかる機能的フラグメントは別個の実態として存在し得るか、またはそれは融合タンパク質などのより大きいポリペプチドの構成成分であり得る。
Polymerase The term "polymerase" as used herein refers to an enzyme that synthesizes a nucleotide strand that can be used in conjunction with the prime editor system described herein. The polymerase can be a "template-dependent" polymerase (i.e., a polymerase that synthesizes a nucleotide strand based on the order of nucleotide bases of a template strand). The polymerase can also be a "template-independent" polymerase (i.e., a polymerase that synthesizes a nucleotide strand without the requirement of a template strand). The polymerase can also be further categorized as a "DNA polymerase" or an "RNA polymerase". In various embodiments, the prime editor system comprises a DNA polymerase. In various embodiments, the DNA polymerase can be a "DNA-dependent DNA polymerase" (i.e., whereby the template molecule is a strand of DNA). In such a case, the DNA template molecule can be a PEgRNA and the extension arm comprises a strand of DNA. In such cases, the PEgRNA may be referred to as a chimeric or hybrid PEgRNA, which includes an RNA portion (i.e., a guide RNA component including a spacer and a gRNA core) and a DNA portion (i.e., an extension arm). In various other embodiments, the DNA polymerase may be an "RNA-dependent DNA polymerase" (i.e., according to which the template molecule is a strand of RNA). In such cases, the PEgRNA is RNA, i.e., includes RNA extension. The term "polymerase" may also refer to an enzyme that catalyzes the polymerization of nucleotides (i.e., polymerase activity). Generally, the enzyme will initiate synthesis at the 3' end of a primer annealed to a polynucleotide template sequence (e.g., a primer sequence annealed to a primer binding site of the PEgRNA) and proceed toward the 5' end of the template strand. A "DNA polymerase" catalyzes the polymerization of deoxynucleotides. The term DNA polymerase as used herein with reference to a DNA polymerase includes "functional fragments thereof." A "functional fragment thereof" refers to any portion of a wild-type or mutant DNA polymerase encompassing less than the entire amino acid sequence of the polymerase, which retains the ability to catalyze the polymerization of polynucleotides under at least one set of conditions. Such a functional fragment can exist as a separate entity, or it can be a component of a larger polypeptide, such as a fusion protein.

プライム編集
本願において用いられる用語「プライム編集」は、遺伝子編集のための新規のアプローチを言い、napDNAbp、ポリメラーゼ(例えば逆転写酵素)、およびそれから標的DNA配列上に組み込まれる所望の新たな遺伝情報をコードする(または遺伝情報を欠失する)ためのDNA合成鋳型を包含する特殊化したガイドRNAを用いる。プライム編集のある種の態様は他の図の中でも図1A-1Hおよび図72(a)-72(c)の態様に記載される。
Prime Editing As used herein, the term "prime editing" refers to a novel approach for gene editing, which uses napDNAbp, a polymerase (e.g., reverse transcriptase), and a specialized guide RNA that contains a DNA synthesis template to encode the desired new genetic information (or delete genetic information) that is then integrated onto the target DNA sequence. Certain embodiments of prime editing are described in the embodiments of Figures 1A-1H and Figures 72(a)-72(c), among others.

プライム編集は、規定されたDNA部位に新たな遺伝情報を直接的に書き込む汎用的なかつ精密なゲノム編集法であるゲノム編集のための全く新たなプラットフォームを表し、ポリメラーゼ(すなわち、融合タンパク質の形態で、またはさもなければnapDNAbpとトランスで提供されて)と共同で働く核酸プログラム型DNA結合タンパク質(「napDNAbp」)を用いる。プライム編集システムはプライム編集(PE)ガイドRNA(「PEgRNA」)によってプログラムされ、これは、標的部位を規定すると共に、ガイドRNA上に(例えば、ガイドRNAの5'もしくは3'端にまたは内部の部分に)操作された伸長(DNAまたはRNAどちらか)によって置き換えDNA鎖の形態での所望の編集の合成の鋳型となる。所望の編集(例えば、1核酸塩基置換)を含有する置き換え鎖は、編集されるべき標的部位の(ニック部位の直ちに下流の)内生鎖と同じ配列を共有する(またはそれに対して相同的である)(それが所望の編集を包含するということを例外とする)。DNA修復および/または複製機構によって、ニック部位の下流の内生鎖は、所望の編集を含有する新たに合成された置き換え鎖によって置き換えられる。いくつかのケースでは、プライム編集は「検索置換」ゲノム編集テクノロジーと考えられ得る。なぜなら、本明細書に記載のプライム編集因子は、編集されるべき所望の標的部位を検索し位置付けるのみならず、同時に、対応する標的部位の内生DNA鎖の代わりに組み入れされる所望の編集を含有する置き換え鎖をコードするからである。本開示のプライム編集因子は、部分的には、プライム標的にプライムされた逆転写(TPRT)または「プライム編集」の機序が、高い効率および遺伝子フレキシビリティーを有する精密なCRISPR/Casに基づくゲノム編集を行うために活用または適合され得るという発見に関する(例えば、図1A-1Fの種々の態様に図示されているとおり)。天然には、TPRTは、可動DNAエレメント、例えば哺乳類非LTRレトロトランスポゾンおよび細菌グループIIイントロンによって用いられる28,29。本発明者は、本願において、Casタンパク質-逆転写酵素融合体または関係するシステムを用いて、ガイドRNAによって特定のDNA配列を標的化し、標的部位に一本鎖ニックを生成し、ガイドRNAに取り入れされた操作された逆転写酵素鋳型の逆転写のためのプライマーとして、ニッキングされたDNAを用いた。しかしながら、概念はDNAポリメラーゼ構成要素として逆転写酵素を用いるプライム編集因子から始まるが、本明細書に記載のプライム編集因子は逆転写酵素に限定されず、実質的にいずれかのDNAポリメラーゼの使用を包含し得る。実に、本願は、至る所で、「逆転写酵素」を有するプライム編集因子を言い得るが、逆転写酵素は、プライム編集で働き得るDNAポリメラーゼの1つの型であるのみであるということがここで明示される。それゆえに、本明細書が「逆転写酵素」に言及するところではいつも、当業者は、いずれかの好適なDNAポリメラーゼが逆転写酵素の代わりに用いられ得るということを了解するべきである。それゆえに、一側面において、プライム編集因子はCas9(または同等のnapDNAbp)を含み得、これは、標的DNA上の相補的なプロトスペーサーにアニールするスペーサー配列を含有する特殊化したガイドRNA(すなわちPEgRNA)とそれを会合させることによって、DNA配列を標的化するようにプログラムされる。特殊化したガイドRNAは、所望の遺伝子変改を含有するDNAの置き換え鎖をコードする伸長の形態の新たな遺伝情報をもまた含有し、これは、標的部位における対応する内生DNA鎖を置き換えるために用いられる。PEgRNAからの情報を標的DNAに移入するために、プライム編集の機序には、DNAの1つの鎖上の標的部位へニックを入れて3'ヒドロキシル基を暴露することが関わる。それから、暴露された3'ヒドロキシル基は、直接的に標的部位へのPEgRNA上の編集をコードする伸長のDNA重合をプライムするために用いられ得る。種々の態様において、編集を含有する置き換え鎖の重合のための鋳型を提供する伸長は、RNAまたはDNAから形成され得る。RNA伸長のケースでは、プライム編集因子のポリメラーゼはRNA依存性DNAポリメラーゼ(例えば逆転写酵素)であり得る。DNA伸長のケースでは、プライム編集因子のポリメラーゼはDNA依存性DNAポリメラーゼであり得る。本明細書に開示のプライム編集因子によって形成される新たに合成された鎖(すなわち、所望の編集を含有する置き換えDNA鎖)は、所望のヌクレオチド変化(例えば、1ヌクレオチド変化、欠失、もしくは挿入、またはそれらの組み合わせ)の包含を例外として、ゲノム標的配列に対して相同的である(すなわち、それと同じ配列を有する)であろう。DNAの新たに合成された(または置き換え)鎖は一本鎖DNAフラップともまた言われ得る。これは相補的な相同的な内生DNA鎖とのハイブリダイゼーションについて競合し、それによって対応する内生鎖に取って代わるであろう。ある態様において、システムは、エラーを起こしやすい逆転写酵素酵素の使用と組み合わせられ得る(例えば、Cas9ドメインとの融合タンパク質として提供されるか、またはCas9ドメインに対してトランスで提供される)。エラーを起こしやすい逆転写酵素酵素は一本鎖DNAフラップの合成の間に変改を導入し得る。それゆえに、ある態様において、エラーを起こしやすい逆転写酵素は、標的DNAへのヌクレオチド変化を導入するために利用され得る。システムに用いられるエラーを起こしやすい逆転写酵素に依存して、変化はランダムまたは非ランダムであり得る。ハイブリダイズした中間体(内生DNA鎖にハイブリダイズした逆転写酵素によって合成される一本鎖DNAフラップを含む)の分解は、内生DNAのもたらされる取って代わられたフラップの除去(例えば、5'端DNAフラップエンドヌクレアーゼFEN1による)、標的DNAに対する合成された一本鎖DNAフラップのライゲーション、ならびに細胞性のDNA修復および/または複製プロセスの結果としての所望のヌクレオチド変化の同化を包含し得る。鋳型によるDNA合成は挿入および欠失を包含するいずれかのヌクレオチドの改変について1ヌクレオチド精度をオファーするので、このアプローチの範囲は非常に幅広く、予見可能には、基礎研究および治療学において無数の適用に用いられ得る。 Prime editing represents an entirely new platform for genome editing, a versatile and precise genome editing method that writes new genetic information directly at defined DNA sites, using a nucleic acid programmable DNA binding protein ("napDNAbp") that works in conjunction with a polymerase (i.e., in the form of a fusion protein or otherwise provided in trans with napDNAbp). The prime editing system is programmed by a prime editing (PE) guide RNA ("PEgRNA"), which defines a target site and serves as a template for the synthesis of the desired edit in the form of a replaced DNA strand by an extension (either DNA or RNA) engineered onto the guide RNA (e.g., at the 5' or 3' end of the guide RNA or at an internal portion). The replacement strand, which contains the desired edit (e.g., a single nucleobase substitution), shares the same sequence as (or is homologous to) the endogenous strand (immediately downstream of the nick site) of the target site to be edited (except that it encompasses the desired edit). By DNA repair and/or replication mechanisms, the endogenous strand downstream of the nick site is replaced by the newly synthesized replacement strand containing the desired edit. In some cases, prime editing can be considered a "search and replace" genome editing technology, because the prime editors described herein not only search and locate the desired target site to be edited, but also simultaneously encode a replacement strand containing the desired edit that is incorporated in place of the endogenous DNA strand at the corresponding target site. The prime editors of the present disclosure relate, in part, to the discovery that the mechanism of prime target primed reverse transcription (TPRT) or "prime editing" can be exploited or adapted to perform precise CRISPR/Cas-based genome editing with high efficiency and genetic flexibility (e.g., as illustrated in various embodiments of Figures 1A-1F). In nature, TPRT is used by mobile DNA elements, such as mammalian non-LTR retrotransposons and bacterial group II introns28,29 . In this application, the inventors have used Cas protein-reverse transcriptase fusions or related systems to target specific DNA sequences with guide RNA, generate single-stranded nicks at the target site, and use the nicked DNA as a primer for reverse transcription of the engineered reverse transcriptase template incorporated into the guide RNA. However, although the concept begins with a prime editor using reverse transcriptase as a DNA polymerase component, the prime editor described herein is not limited to reverse transcriptase and can encompass the use of virtually any DNA polymerase. Indeed, throughout the present application, the prime editor may refer to a prime editor having a "reverse transcriptase", but it is hereby expressly stated that reverse transcriptase is only one type of DNA polymerase that can work in prime editing. Thus, wherever the present application refers to "reverse transcriptase", those skilled in the art should understand that any suitable DNA polymerase can be used in place of reverse transcriptase. Thus, in one aspect, the prime editor may comprise Cas9 (or equivalent napDNAbp), which is programmed to target a DNA sequence by associating it with a specialized guide RNA (i.e., PEgRNA) that contains a spacer sequence that anneals to a complementary protospacer on the target DNA. The specialized guide RNA also contains new genetic information in the form of an extension that codes for a replacement strand of DNA containing the desired genetic alteration, which is used to replace the corresponding endogenous DNA strand at the target site. To transfer information from the PEgRNA to the target DNA, the mechanism of prime editing involves nicking the target site on one strand of DNA to expose a 3' hydroxyl group. The exposed 3' hydroxyl group can then be used to prime DNA polymerization of the extension that codes for the edit on the PEgRNA directly to the target site. In various embodiments, the extension that provides the template for polymerization of the replacement strand containing the edit can be formed from RNA or DNA. In the case of RNA extension, the polymerase of the prime editor can be an RNA-dependent DNA polymerase (e.g., reverse transcriptase). In the case of DNA extension, the polymerase of the prime editor can be a DNA-dependent DNA polymerase. The newly synthesized strand (i.e., the replacement DNA strand containing the desired edit) formed by the prime editors disclosed herein will be homologous to (i.e., have the same sequence as) the genomic target sequence, except for the inclusion of the desired nucleotide change (e.g., a single nucleotide change, a deletion, or an insertion, or a combination thereof). The newly synthesized (or replacement) strand of DNA may also be referred to as a single-stranded DNA flap. It will compete for hybridization with the complementary homologous endogenous DNA strand, thereby displacing the corresponding endogenous strand. In some embodiments, the system may be combined with the use of an error-prone reverse transcriptase enzyme (e.g., provided as a fusion protein with a Cas9 domain or provided in trans to a Cas9 domain). The error-prone reverse transcriptase enzyme may introduce alterations during the synthesis of the single-stranded DNA flap. Thus, in some embodiments, an error-prone reverse transcriptase may be utilized to introduce nucleotide changes into the target DNA. Depending on the error-prone reverse transcriptase used in the system, the changes may be random or non-random. Degradation of the hybridized intermediate (including the single-stranded DNA flap synthesized by the reverse transcriptase hybridized to the endogenous DNA strand) may involve removal of the resulting displaced flap of the endogenous DNA (e.g., by the 5'-end DNA flap endonuclease FEN1), ligation of the synthesized single-stranded DNA flap to the target DNA, and assimilation of the desired nucleotide change as a result of cellular DNA repair and/or replication processes. Because templated DNA synthesis offers single-nucleotide precision for any nucleotide modification, including insertions and deletions, the scope of this approach is very broad and can foreseeably be used for a myriad of applications in basic research and therapeutics.

種々の態様において、プライム編集は、プライム編集ガイドRNA(PEgRNA)と複合体化した核酸プログラム型DNA結合タンパク質(napDNAbp)と標的DNA分子(これについて、ヌクレオチド配列の変化が導入されることが望まれる)を接触させることによって作動する。図1Gを参照すると、プライム編集ガイドRNA(PEgRNA)は、ガイドRNAの3'もしくは5'端にまたはガイドRNAの分子内の位置付けに伸長を含み、所望のヌクレオチド変化(例えば、1ヌクレオチド変化、挿入、または欠失)をコードする。ステップ(a)では、napDNAbp/伸長されたgRNA複合体がDNA分子に接触し、伸長されたgRNAが、標的座位に結合するようにnapDNAbpをガイドする。ステップ(b)では、標的座位のDNAの鎖の1つにニックが導入され(例えば、ヌクレアーゼまたは化学的薬剤による)、それによって利用可能な3'端を標的座位の鎖の1つに生出する。ある態様において、ニックは、Rループ鎖に対応するDNAの鎖、すなわちガイドRNA配列にハイブリダイズされない鎖、すなわち「非標的鎖」上に生出される。しかしながら、ニックは鎖のどちらかに導入され得る。つまり、ニックはRループ「標的鎖」(すなわち、伸長されたgRNAのプロトスペーサーにハイブリダイズされる鎖)または「非標的鎖」(すなわち、標的鎖に対して相補的であるRループの一本鎖部分を形成する鎖)に導入され得る。ステップ(c)では、DNA鎖の3'端(ニックによって形成される)は、逆転写をプライムするためにガイドRNAの伸長された部分と相互作用する(すなわち、「プライム標的にプライムされたRT」)。ある態様において、3'端DNA鎖は、ガイドRNAの伸長された部分の特異的なRTプライム配列、すなわちPEgRNA上の「逆転写酵素プライム配列」または「プライマー結合部位」にハイブリダイズする。ステップ(d)では、逆転写酵素(または他の好適なDNAポリメラーゼ)が導入される。これは、プライムされた部位の3'端からプライム編集ガイドRNAの5'端の方へDNAの一本鎖を合成する。DNAポリメラーゼ(例えば逆転写酵素)はnapDNAbpに融合され得るか、または代替的にはnapDNAbpに対してトランスで提供され得る。これは、ニック部位のまたはそれに隣接する内生DNAに対してさもなければ相同的である所望のヌクレオチド変化(例えば、1塩基変化、挿入、もしくは欠失、またはそれらの組み合わせ)を含む一本鎖DNAフラップを形成する。ステップ(e)では、napDNAbpおよびガイドRNAがリリースされる。ステップ(f)および(g)は一本鎖DNAフラップの分解に関し、その結果、所望のヌクレオチド変化が標的座位に組み込まれるようになる。このプロセスは、ひとたび3'一本鎖DNAフラップが内生DNA配列に侵入およびハイブリダイズすると形成する対応する5'内生DNAフラップを除去することによって、所望の産物形成の方へ駆動され得る。理論によって拘束されることなしに、細胞の内生DNA修復および複製プロセスは、ミスマッチのDNAを分解して、ヌクレオチド変化(単数または複数)を組み込んで、所望の変改された産物を形成する。プロセスは、図1Fに例示されているとおり「第2鎖ニッキング」によってもまた産物形成の方へ駆動され得る。このプロセスは次の遺伝子変化の少なくとも1つ以上を導入し得る:トランスバージョン、トランジション、欠失、および挿入。 In various embodiments, prime editing operates by contacting a target DNA molecule (in which a nucleotide sequence change is desired to be introduced) with a nucleic acid programmable DNA binding protein (napDNAbp) complexed with a prime editing guide RNA (PEgRNA). With reference to FIG. 1G, the prime editing guide RNA (PEgRNA) includes an extension at the 3' or 5' end of the guide RNA or at an intramolecular positioning of the guide RNA to encode the desired nucleotide change (e.g., a single nucleotide change, an insertion, or a deletion). In step (a), the napDNAbp/extended gRNA complex contacts the DNA molecule, and the extended gRNA guides the napDNAbp to bind to the target locus. In step (b), a nick is introduced (e.g., by a nuclease or chemical agent) into one of the strands of DNA at the target locus, thereby creating an available 3' end on one of the strands at the target locus. In some embodiments, the nick is created on the strand of DNA that corresponds to the R-loop strand, i.e., the strand that is not hybridized to the guide RNA sequence, i.e., the "non-target strand." However, the nick can be introduced in either strand. That is, the nick can be introduced in the R-loop "target strand" (i.e., the strand hybridized to the protospacer of the extended gRNA) or the "non-target strand" (i.e., the strand that forms the single-stranded portion of the R-loop that is complementary to the target strand). In step (c), the 3' end of the DNA strand (formed by the nick) interacts with the extended portion of the guide RNA to prime reverse transcription (i.e., "RT primed to prime target"). In some embodiments, the 3' end DNA strand hybridizes to a specific RT prime sequence of the extended portion of the guide RNA, i.e., the "reverse transcriptase prime sequence" or "primer binding site" on the PEgRNA. In step (d), a reverse transcriptase (or other suitable DNA polymerase) is introduced. It synthesizes a single strand of DNA from the 3' end of the primed site toward the 5' end of the primed edited guide RNA. The DNA polymerase (e.g., reverse transcriptase) can be fused to the napDNAbp or alternatively provided in trans to the napDNAbp. This forms a single-stranded DNA flap containing the desired nucleotide change (e.g., a single base change, an insertion, or a deletion, or a combination thereof) that is otherwise homologous to the endogenous DNA at or adjacent to the nick site. In step (e), the napDNAbp and guide RNA are released. Steps (f) and (g) involve degradation of the single-stranded DNA flap, so that the desired nucleotide change becomes incorporated at the target locus. This process can be driven toward the desired product formation by removing the corresponding 5' endogenous DNA flap that forms once the 3' single-stranded DNA flap invades and hybridizes to the endogenous DNA sequence. Without being bound by theory, the cell's endogenous DNA repair and replication processes degrade the mismatched DNA and incorporate the nucleotide change(s) to form the desired altered product. The process can also be driven toward product formation by "second strand nicking" as illustrated in FIG. 1F. This process can introduce at least one or more of the following genetic changes: transversions, transitions, deletions, and insertions.

用語「プライム編集因子(PE)システム」または「プライム編集因子(PE)」または「PEシステム」または「PE編集システム」は、本明細書に記載の(describe)プライム標的にプライムされた逆転写(TPRT)を用いるゲノム編集の方法に関わる組成物を言い、napDNAbp、逆転写酵素、融合タンパク質(例えば、napDNAbpおよび逆転写酵素を含む)、プライム編集ガイドRNA、ならびに融合タンパク質およびプライム編集ガイドRNAを含む複合体、ならびに補助的な要素、例えば、プライム編集プロセスを編集された産物形成の方へ駆動することを助けるための第2鎖ニッキング構成要素(例えば、第2鎖sgRNA)および5'内生DNAフラップ除去エンドヌクレアーゼ(例えばFEN1)を包含するが、これらに限定されない。 The term "prime editing element (PE) system" or "prime editing element (PE)" or "PE system" or "PE editing system" refers to a composition involved in the method of genome editing using primed target-primed reverse transcription (TPRT) as described herein, including, but not limited to, napDNAbp, reverse transcriptase, a fusion protein (e.g., comprising napDNAbp and reverse transcriptase), a prime editing guide RNA, and a complex comprising a fusion protein and a prime editing guide RNA, as well as auxiliary elements, such as a second strand nicking component (e.g., second strand sgRNA) and a 5' endogenous DNA flap removal endonuclease (e.g., FEN1) to help drive the prime editing process toward the formation of an edited product.

ここまで記載された態様では、PEgRNAは、ガイドRNA(これは、それ自体が、スペーサー配列およびgRNAコアまたは骨格を含む)とプライマー結合部位およびDNA合成鋳型を含む5'または3'伸長アームとを含む単一分子を構成するが(例えば図3Dを見よ)、PEgRNAは2つの個々の分子の形態をもまた取り得、ガイドRNAと、トランスプライム編集因子RNA鋳型(tPERT)とからなる。これは、本質的に、伸長アーム(特に、プライマー結合部位およびDNA合成ドメインを包含する)およびRNA-タンパク質動員ドメイン(例えば、MS2アプタマーまたはヘアピン)を同じ分子上に収容する。これは、tPERT動員タンパク質(例えば、MS2アプタマーに結合するMS2cpタンパク質)を含む改変されたプライム編集因子複合体へと共局在または動員されるようになる。プライム編集に用いられ得るtPERTの例としては図3Gおよび図3Hを見よ。 In the embodiments described thus far, the PEgRNA constitutes a single molecule comprising the guide RNA (which itself comprises a spacer sequence and the gRNA core or backbone) and a 5' or 3' extension arm comprising a primer binding site and a DNA synthesis template (see, for example, FIG. 3D), but the PEgRNA can also take the form of two individual molecules, consisting of a guide RNA and a trans-prime editor RNA template (tPERT), which essentially houses an extension arm (including, inter alia, a primer binding site and a DNA synthesis domain) and an RNA-protein recruitment domain (e.g., an MS2 aptamer or hairpin) on the same molecule, which becomes co-localized or recruited to a modified prime editor complex that includes a tPERT recruitment protein (e.g., an MS2cp protein that binds to the MS2 aptamer). See FIG. 3G and FIG. 3H for an example of a tPERT that can be used for prime editing.

プライム編集因子
用語「プライム編集因子」は、napDNAbp(例として、Cas9ニッカーゼ)および逆転写酵素を含む本明細書に記載の融合構築物を指し、PEgRNA(または「伸長されたガイドRNA」)の存在下で標的ヌクレオチド配列上にプライム編集を遂行することが可能である。用語「プライム編集因子」は、融合タンパク質、またはPEgRNAと複合体化された融合タンパク質、および/または第2鎖へニックを入れるsgRNAとさらに複合体化された融合タンパク質を指してもよい。いくつかの態様において、プライム編集因子はまた、本明細書に記載のとおりの非編集済鎖の第2部位へのニック入れステップへ向かうことが可能な、融合タンパク質(napDNAbpと融合した逆転写酵素)、PEgRNA、および定例の(regular)ガイドRNAを含む複合体も指してもよい。他の態様において、「プライマー編集因子」の逆転写酵素構成要素は、transで提供されてもよい。
Prime Editor The term "prime editor" refers to a fusion construct described herein that includes napDNAbp (e.g., Cas9 nickase) and reverse transcriptase, capable of performing a prime edit on a target nucleotide sequence in the presence of PEgRNA (or "extended guide RNA"). The term "prime editor" may refer to a fusion protein, or a fusion protein complexed with PEgRNA, and/or a fusion protein further complexed with sgRNA that nicks the second strand. In some embodiments, prime editor may also refer to a complex that includes a fusion protein (reverse transcriptase fused to napDNAbp), PEgRNA, and regular guide RNA that can direct the nicking step to the second site of the non-edited strand as described herein. In other embodiments, the reverse transcriptase component of the "primer editor" may be provided in trans.

プライマー結合部位
用語「プライマー結合部位」または「PBS」は、伸長アームの構成要素としてPEgRNA上に位置付けられ(典型的には伸長アームの3'末にある)ヌクレオチド配列であって、プライム編集因子による標的配列のCas9ニック入れ後に形成されるプライマー配列へ結合するのに役立つヌクレオチド配列を指す。他のどこかで詳述されるとおり、プライム編集因子のCas9ニッカーゼ構成要素が標的DNA配列の鎖の一方にニックを入れたとき、3'末のssDNAフラップが形成され、これはPEgRNA上のプライマー結合部位とアニールして逆転写をプライムするプライマー配列として働く。図27および28は、3'および5'伸長アーム上夫々に位置付けられるプライマー結合部位の態様を示す。
Primer Binding Site The term "primer binding site" or "PBS" refers to a nucleotide sequence located on the PEgRNA as a component of the extension arm (typically at the 3' end of the extension arm) that serves to bind to a primer sequence formed after Cas9 nicking of the target sequence by the prime editor. As detailed elsewhere, when the Cas9 nickase component of the prime editor nicks one of the strands of the target DNA sequence, a 3'-terminal ssDNA flap is formed that anneals to the primer binding site on the PEgRNA and serves as a primer sequence to prime reverse transcription. Figures 27 and 28 show embodiments of primer binding sites located on the 3' and 5' extension arms, respectively.

プロモーター
用語「プロモーター」は当該技術分野において認識されており、細胞性の転写機構によって認識され、下流遺伝子の転写を開始する能力がある配列を有する核酸分子を言う。プロモーターは、プロモーターが所与の細胞性という文脈において常に活性であるということを意味する恒常的に活性、またはプロモーターが特定の条件の存在下においてのみ活性であるということを意味する条件付きで活性であり得る。例えば、条件付きプロモーターは、プロモーター上の制御エレメントと会合したタンパク質を基本的な転写機構に接続する特定のタンパク質の存在下においてのみ、または阻害分子の不在下においてのみ活性であり得る。条件付きで活性なプロモーターのサブクラスは、活性のために低分子「誘導因子」の存在を要求する誘導性プロモーターである。誘導性プロモーターの例は、アラビノース誘導性プロモーター、Tet-onプロモーター、およびタモキシフェン誘導性プロモーターを包含するが、これらに限定されない。種々の恒常的、条件付き、および誘導性プロモーターが当業者に周知であり、当業者は本発明を実行することに有用な種々のかかるプロモーターを確かめる能力があるであろう。これはこの点について限定されない。
The term " promoter " is recognized in the art and refers to a nucleic acid molecule having a sequence capable of being recognized by the cellular transcriptional machinery and initiating transcription of a downstream gene. A promoter can be constitutively active, meaning that the promoter is always active in a given cellular context, or conditionally active, meaning that the promoter is only active in the presence of a particular condition. For example, a conditional promoter can be active only in the presence of a particular protein that connects a protein associated with a control element on the promoter to the basic transcriptional machinery, or in the absence of an inhibitory molecule. A subclass of conditionally active promoters are inducible promoters, which require the presence of a small molecule "inducer" for activity. Examples of inducible promoters include, but are not limited to, arabinose-inducible promoters, Tet-on promoters, and tamoxifen-inducible promoters. A variety of constitutive, conditional, and inducible promoters are well known to those of skill in the art, and the skilled artisan will be able to ascertain a variety of such promoters useful in carrying out the present invention. It is not limited in this respect.

プロトスペーサー
本願において用いられる用語「プロトスペーサー」はPAM(プロトスペーサー隣接モチーフ)配列に隣接するDNA上の配列(~20bp)を言う。プロトスペーサーはガイドRNAのスペーサー配列と同じ配列を共有する。ガイドRNAは標的DNA上のプロトスペーサー配列の相補体(具体的には、それの1つの鎖、すなわち標的DNA配列の「非標的鎖」に対する「標的鎖」)にアニールする。Cas9が機能するためには、それは特定のプロトスペーサー隣接モチーフ(PAM)をもまた要求し、これはCas9遺伝子の細菌種に依存して変わる。S.pyogenesに由来する最も普通に用いられるCas9ヌクレアーゼは、ゲノムDNA上の標的配列の直接的に下流に見出される非標的鎖上のNGGというPAM配列を認識する。当業者は、現況技術の文献が、場合によっては、それを「スペーサー」と言うよりもむしろ、ガイドRNAそれ自体の上の~20nt標的特異的ガイド配列として「プロトスペーサー」を言うということを了解するであろう。それゆえに、いくつかのケースでは、本願において用いられる用語「プロトスペーサー」は用語「スペーサー」と交換可能に用いられ得る。「プロトスペーサー」または「スペーサー」どちらかの出現の周囲の記載という文脈は、用語がgRNAまたはDNA標的を参照しているかどうかについて読み手に情報提供することを助けるであろう。
Protospacer: The term "protospacer" as used herein refers to a sequence (~20bp) on DNA adjacent to a PAM (protospacer adjacent motif) sequence. The protospacer shares the same sequence as the spacer sequence of the guide RNA. The guide RNA anneals to the complement of the protospacer sequence on the target DNA (specifically, to one strand of it, the "target strand" versus the "non-target strand" of the target DNA sequence). For Cas9 to function, it also requires a specific protospacer adjacent motif (PAM), which varies depending on the bacterial species of the Cas9 gene. The most commonly used Cas9 nuclease from S. pyogenes recognizes the PAM sequence NGG on the non-target strand found directly downstream of the target sequence on genomic DNA. Those skilled in the art will appreciate that the state of the art literature sometimes refers to the "protospacer" as the ~20nt target-specific guide sequence on the guide RNA itself, rather than referring to it as a "spacer". Therefore, in some cases, the term "protospacer" as used herein may be used interchangeably with the term "spacer." The context of the description surrounding the appearance of either "protospacer" or "spacer" will help inform the reader as to whether the term refers to a gRNA or DNA target.

プロトスペーサー隣接モチーフ(PAM)
本願において用いられる用語「プロトスペーサー隣接配列」または「PAM」は、Cas9ヌクレアーゼの重要な標的化構成要素であるおよそ2-6塩基対のDNA配列を言う。典型的には、PAM配列はどちらかの鎖上にあり、Cas9によってカットされる部位の5'から3'方向においては下流である。標準的なPAM配列(すなわち、Streptococcus pyogenesのCas9ヌクレアーゼまたはSpCas9に関連するPAM配列)は5'-NGG-3'であり、「N」は2つのグアニン(「G」)核酸塩基によって後続されるいずれかの核酸塩基である。異なるPAM配列が異なる生物からの異なるCas9ヌクレアーゼまたは同等タンパク質と関連し得る。加えて、いずれかの所与のCas9ヌクレアーゼ、例えばSpCas9は、ヌクレアーゼが代替的なPAM配列を認識するようにしてヌクレアーゼのPAM特異性を変改するように改変され得る。
Protospacer adjacent motif (PAM)
The term "protospacer adjacent sequence" or "PAM" as used herein refers to a DNA sequence of approximately 2-6 base pairs that is the key targeting component of the Cas9 nuclease. Typically, the PAM sequence is on either strand, downstream in the 5' to 3' direction of the site cut by Cas9. The standard PAM sequence (i.e., the PAM sequence associated with Streptococcus pyogenes Cas9 nuclease or SpCas9) is 5'-NGG-3', where "N" is any nucleobase followed by two guanine ("G") nucleobases. Different PAM sequences may be associated with different Cas9 nucleases or equivalent proteins from different organisms. In addition, any given Cas9 nuclease, e.g., SpCas9, may be modified to alter the PAM specificity of the nuclease such that the nuclease recognizes alternative PAM sequences.

例えば、配列番号18の(is)標準的なSpCas9アミノ酸配列を参照して、PAM配列は1つ以上の変異を導入することによって改変され得る。(a)PAM特異性をNGANまたはNGNGへと変改するD1135V、R1335Q、およびT1337R「VQRバリアント」、(b)PAM特異性をNGAGへと変改するD1135E、R1335Q、およびT1337R「EQRバリアント」、ならびに(c)PAM特異性をNGCGへと変改するD1135V、G1218R、R1335E、およびT1337R「VRERバリアント」を包含する。加えて、標準的なSpCas9のD1135EバリアントはなおNGGを認識するが、それは野生型SpCas9タンパク質と比較して選択的である。 For example, with reference to the standard SpCas9 amino acid sequence of SEQ ID NO: 18, the PAM sequence can be modified by introducing one or more mutations, including (a) the D1135V, R1335Q, and T1337R "VQR variants" that change the PAM specificity to NGAN or NGNG, (b) the D1135E, R1335Q, and T1337R "EQR variants" that change the PAM specificity to NGAG, and (c) the D1135V, G1218R, R1335E, and T1337R "VRER variants" that change the PAM specificity to NGCG. In addition, the D1135E variant of standard SpCas9 still recognizes NGG, but more selectively than the wild-type SpCas9 protein.

異なる細菌種からのCas9酵素(すなわち、Cas9オーソログ)は様々なPAM特異性を有し得るということもまた了解されるであろう。例えば、Staphylococcus aureusからのCas9(SaCas9)はNGRRTまたはNGRRNを認識する。加えて、Neisseria meningitisからのCas9(NmCas)はNNNNGATTを認識する。別の例では、Streptococcus thermophilisからのCas9(StCas9)はNNAGAAWを認識する。なお別の例では、Treponema denticolaからのCas9(TdCas)はNAAAACを認識する。これらは例であり、限定することを意味されない。さらに、非SpCas9が種々のPAM配列に結合するということは了解されるであろう。これは、好適なSpCas9 PAM配列が所望の標的のカットされる部位に存在しないときにそれらを有用にする。さらにその上、非SpCas9は、それらをSpCas9よりも有用にする他の特徴を有し得る。例えば、Staphylococcus aureusからのCas9(SaCas9)はSpCas9よりも約1キロベース小さい。そのため、それはアデノ随伴ウイルス(AAV)にパッケージングされ得る。Shah et al.,"Protospacer recognition motifs:mixed identities and functional diversity,"RNA Biology,10(5):891-899のさらなる参照がなされ得る(これは参照によって本願に組み込まれる)。
リコンビナーゼ
It will also be understood that Cas9 enzymes from different bacterial species (i.e., Cas9 orthologues) may have different PAM specificities. For example, Cas9 from Staphylococcus aureus (SaCas9) recognizes NGRRT or NGRRN. In addition, Cas9 from Neisseria meningitis (NmCas) recognizes NNNNGATT. In another example, Cas9 from Streptococcus thermophilis (StCas9) recognizes NNAGAAW. In yet another example, Cas9 from Treponema denticola (TdCas) recognizes NAAAAC. These are examples and are not meant to be limiting. Furthermore, it will be understood that non-SpCas9 bind to various PAM sequences. This makes them useful when a suitable SpCas9 PAM sequence is not present at the site of the desired target to be cut. Furthermore, non-SpCas9 may have other characteristics that make them more useful than SpCas9. For example, Cas9 from Staphylococcus aureus (SaCas9) is about 1 kilobase smaller than SpCas9. Therefore, it can be packaged into an adeno-associated virus (AAV). Further reference may be made to Shah et al., "Protospacer recognition motifs: mixed identities and functional diversity," RNA Biology, 10(5):891-899, which is incorporated herein by reference.
Recombinase

本願において用いられる用語「リコンビナーゼ」は、リコンビナーゼ認識配列間のDNAの組み換えを媒介する部位特異的な酵素を言い、これはリコンビナーゼ認識配列間のDNAフラグメントの切除、取り入れ、逆位、または交換(例えば転座)をもたらす。リコンビナーゼは2つの別物のファミリーに分類され得る:セリンリコンビナーゼ(例えばリゾルバーゼおよびインベルターゼ)およびチロシンリコンビナーゼ(例えばインテグラーゼ)である。セリンリコンビナーゼの例は、限定なしに、Hin、Gin、Tn3、β-six、CinH、ParA、γδ、Bxb1、φC31、TP901、TG1、φBT1、R4、φRV1、φFC1、MR11、A118、U153、およびgp29を包含する。チロシンリコンビナーゼの例は、限定なしに、Cre、FLP、R、Lambda、HK101、HK022、およびpSAM2を包含する。セリンおよびチロシンリコンビナーゼの名称は、リコンビナーゼがDNAを攻撃するために用い、鎖交換の間にDNAに共有結合的に連結されるようになる保存された求核性アミノ酸残基から派生する。リコンビナーゼは、遺伝子ノックアウト/ノックインの生出および遺伝子治療適用を包含する数々の適用を有する。例として、Brown et al.,"Serine recombinases as tools for genome engineering."Methods.2011;53(4):372-9;Hirano et al.,"Site-specific recombinases as tools for heterologous gene integration."Appl.Microbiol.Biotechnol.2011;92(2):227-39;Chavez and Calos,"Therapeutic applications of the ΦC31 integrase system."Curr.Gene Ther.2011;11(5):375-81;Turan and Bode,"Site-specific recombinases:from tag-and-target- to tag-and-exchange-based genomic modifications."FASEB J.2011;25(12):4088-107;Venken and Bellen,"Genome-wide manipulations of Drosophila melanogaster with transposons, Flp recombinase, and ΦC31 integrase."Methods Mol.Biol.2012;859:203-28;Murphy,"Phage recombinases and their applications."Adv.Virus Res.2012;83:367-414;Zhang et al.,"Conditional gene manipulation: Cre-ating a new biological era."J.Zhejiang Univ.Sci.B.2012;13(7):511-24;Karpenshif and Bernstein,"From yeast to mammals:recent advances in genetic control of homologous recombination."DNA Repair(Amst).2012;1;11(10):781-8(各々の全内容は、それら全体が参照されることによって本明細書に組み込まれる)を参照。本願において提供されるリコンビナーゼは、本発明の態様に用いられ得るリコンビナーゼの専らの例であることを意味されない。本発明の方法および組成物は、新たな直交的なリコンビナーゼについてデータベースをマイニングすることまたは定められたDNA特異性を有する合成リコンビナーゼをデザインすることによって拡張され得る(例として、Groth et al.,"Phage integrases:biology and applications."J.Mol.Biol.2004;335,667-678;Gordley et al.,"Synthesis of programmable integrases."Proc.Natl.Acad.Sci.U S A.2009;106,5053-5058(各々の全内容は、それらの全体が参照されることによって本明細書に組み込まれる)を参照)。本明細書に記載の方法および組成物に有用であるリコンビナーゼの他の例は当業者には知られており、発見または生成されるいずれかの新たなリコンビナーゼは、本発明の異なる態様に用いられる能力があることが予想される。いくつかの態様では、リコンビナーゼの触媒ドメインは、ヌクレアーゼを不活性化されたRNAによってプログラム可能なヌクレアーゼ(例えば、dCas9またはそのフラグメント)に融合され、その結果、リコンビナーゼドメインは核酸結合ドメインを含まないかまたは標的核酸に結合する能力がない(例えば、リコンビナーゼドメインはそれが特異的なDNA結合活性を有さないようにして操作される)。DNA結合活性を欠くリコンビナーゼおよび改変するための方法は知られており、Klippel et al.,"Isolation and characterisation of unusual gin mutants."EMBO J.1988;7:3983-3989:Burke et al.,"Activating mutations of Tn3 resolvase marking interfaces important in recombination catalysis and its regulation.Mol Microbiol.2004;51:937-948;Olorunniji et al.,"Synapsis and catalysis by activated Tn3 resolvase mutants."Nucleic Acids Res. 2008;36:7181-7191;Rowland et al.,"Regulatory mutations in Sin recombinase support a structure-based model of the synaptosome."Mol Microbiol.2009;74:282-298;Akopian et al.,"Chimeric recombinases with designed DNA sequence recognition."Proc Natl Acad Sci USA.2003;100:8688-8691;Gordley et al.,"Evolution of programmable zinc finger-recombinases with activity in human cells.J Mol Biol.2007;367:802-813;Gordley et al.,"Synthesis of programmable integrases."Proc Natl Acad Sci USA.2009;106:5053-5058;Arnold et al.,"Mutants of Tn3 resolvase which do not require accessory binding sites for recombination activity."EMBO J.1999;18:1407-1414;Gaj et al.,"Structure-guided reprogramming of serine recombinase DNA sequence specificity."Proc Natl Acad Sci USA.2011;108(2):498-503;およびProudfoot et al.,"Zinc finger recombinases with adaptable DNA sequence specificity."PLoS One.2011;6(4):e19537(各々の全内容は、それらの全体が参照されることによって本明細書に組み込まれる)によって記載されるものを包含する。例えば、リゾルバーゼ-インベルターゼ群のセリンリコンビナーゼ、例えばTn3およびγδリゾルバーゼならびにHinおよびGinインベルターゼは、自律的な触媒およびDNA結合ドメインを有する分子構造を有する(例として、Grindley et al.,"Mechanism of site-specific recombination."Ann Rev Biochem.2006;75:567-605(その全内容は参照により組み込まれる)を参照)。それゆえに、例えばいずれかの補助的な因子(例えばDNA結合活性)を要求しない「活性化された」リコンビナーゼ変異体の単離後に、これらのリコンビナーゼの触媒ドメインは、本明細書に記載のとおりヌクレアーゼを不活性化されたRNAによってプログラム可能なヌクレアーゼ(例えば、dCas9またはそのフラグメント)と組み換えられることに対して従順である(例として、Klippel et al.,"Isolation and characterisation of unusual gin mutants."EMBO J.1988;7:3983-3989:Burke et al.,"Activating mutations of Tn3 resolvase marking interfaces important in recombination catalysis and its regulation. Mol Microbiol.2004;51:937-948;Olorunniji et al.,"Synapsis and catalysis by activated Tn3 resolvase mutants."Nucleic Acids Res.2008;36:7181-7191;Rowland et al.,"Regulatory mutations in Sin recombinase support a structure-based model of the synaptosome."Mol Microbiol.2009;74:282-298;Akopian et al.,"Chimeric recombinases with designed DNA sequence recognition."Proc Natl Acad Sci USA.2003;100:8688-8691を参照)。加えて、N末端触媒ドメインおよびC末端DNA結合ドメインを有する多くの他の天然のセリンリコンビナーゼが知られており(例えば、ファイC31インテグラーゼ、TnpXトランスポゼース、IS607トランスポゼース)、それらの触媒ドメインは、本明細書に記載のとおりプログラム可能な部位特異的なリコンビナーゼを操作するために選出され得る(例として、Smith et al.,"Diversity in the serine recombinases."Mol Microbiol.2002;44:299-307(その全内容は参照により組み込まれる)を参照)。類似に、チロシンリコンビナーゼ(例えば、Cre、λインテグラーゼ)のコア触媒ドメインは知られており、本明細書に記載のとおりプログラム可能な部位特異的リコンビナーゼを操作するために類似に選出され得る(例として、Guo et al.,"Structure of Cre recombinase complexed with DNA in a site-specific recombination synapse."Nature.1997;389:40-46;Hartung et al.,"Cre mutants with altered DNA binding properties."J Biol Chem 1998;273:22884-22891;Shaikh et al.,"Chimeras of the Flp and Cre recombinases:Tests of the mode of cleavage by Flp and Cre.J Mol Biol.2000;302:27-48;Rongrong et al.,"Effect of deletion mutation on the recombination activity of Cre recombinase."Acta Biochim Pol.2005;52:541-544;Kilbride et al.,"Determinants of product topology in a hybrid Cre-Tn3 resolvase site-specific recombination system."J Mol Biol.2006;355:185-195;Warren et al.,"A chimeric cre recombinase with regulated directionality."Proc Natl Acad Sci USA.2008 105:18278-18283;Van Duyne,"Teaching Cre to follow directions."Proc Natl Acad Sci USA.2009 Jan 6;106(1):4-5;Numrych et al.,"A comparison of the effects of single-base and triple-base changes in the integrase arm-type binding sites on the site-specific recombination of bacteriophage λ."Nucleic Acids Res.1990;18:3953-3959;Tirumalai et al.,"The recognition of core-type DNA sites by λ integrase."J Mol Biol.1998;279:513-527;Aihara et al.,"A conformational switch controls the DNA cleavage activity of λ integrase."Mol Cell.2003;12:187-198;Biswas et al.,"A structural basis for allosteric control of DNA recombination by λ integrase."Nature.2005;435:1059-1066;およびWarren et al.,"Mutations in the amino-terminal domain of λ-integrase have differential effects on integrative and excisive recombination."Mol Microbiol.2005;55:1104-1112(各々の全内容は参照により組み込まれる)を参照)。 The term "recombinase" as used herein refers to a site-specific enzyme that mediates the recombination of DNA between recombinase recognition sequences, resulting in the excision, incorporation, inversion, or exchange (e.g., translocation) of DNA fragments between the recombinase recognition sequences. Recombinases can be classified into two distinct families: serine recombinases (e.g., resolvases and invertases) and tyrosine recombinases (e.g., integrases). Examples of serine recombinases include, without limitation, Hin, Gin, Tn3, β-six, CinH, ParA, γδ, Bxb1, φC31, TP901, TG1, φBT1, R4, φRV1, φFC1, MR11, A118, U153, and gp29. Examples of tyrosine recombinases include, without limitation, Cre, FLP, R, Lambda, HK101, HK022, and pSAM2. The names of serine and tyrosine recombinases are derived from the conserved nucleophilic amino acid residues that the recombinase uses to attack DNA and become covalently linked to the DNA during strand exchange. Recombinases have numerous applications, including the generation of gene knockouts/knockins and gene therapy applications. For example, see Brown et al., "Serine recombinases as tools for genome engineering." Methods. 2011;53(4):372-9; Hirano et al., "Site-specific recombinases as tools for heterologous gene integration." Appl. Microbiol. Biotechnol. 2011;92(2):227-39; Chavez and Calos, "Therapeutic applications of the ΦC31 integrase system." Curr. Gene Ther. 2011;11(5):375-81; Turan and Bode, "Site-specific recombinases: from tag-and-target- to tag-and-exchange-based genomic modifications." FASEB J. 2011;25(12):4088-107; Venken and Bellen, "Genome-wide manipulations of Drosophila melanogaster with transposons, Flp recombinase, and See, e.g., ΦC31 integrase." Methods Mol. Biol. 2012;859:203-28; Murphy, "Phage recombinases and their applications." Adv. Virus Res. 2012;83:367-414; Zhang et al., "Conditional gene manipulation: Creating a new biological era." J. Zhejiang Univ. Sci. B. 2012;13(7):511-24; Karpenshif and Bernstein, "From yeast to mammals: recent advances in genetic control of homologous recombination." DNA Repair (Amst). 2012;1;11(10):781-8 (the entire contents of each are incorporated herein by reference in their entirety). The recombinases provided herein are not meant to be the sole examples of recombinases that may be used in embodiments of the present invention. The methods and compositions of the invention can be expanded by mining databases for new orthogonal recombinases or designing synthetic recombinases with defined DNA specificity (see, e.g., Groth et al., "Phage integrases: biology and applications." J. Mol. Biol. 2004; 335, 667-678; Gordley et al., "Synthesis of programmable integrases." Proc. Natl. Acad. Sci. U.S.A. 2009; 106, 5053-5058, the entire contents of each of which are incorporated herein by reference in their entirety). Other examples of recombinases that are useful in the methods and compositions described herein will be known to those of skill in the art, and it is anticipated that any new recombinases discovered or generated will be capable of being used in different embodiments of the invention. In some embodiments, the catalytic domain of a recombinase is fused to an RNA-programmable nuclease (e.g., dCas9 or a fragment thereof) that inactivates the nuclease, such that the recombinase domain does not contain a nucleic acid binding domain or is incapable of binding to a target nucleic acid (e.g., the recombinase domain is engineered such that it has no specific DNA binding activity). Recombinases lacking DNA binding activity and methods for their modification are known, see Klippel et al., "Isolation and characterisation of unusual gin mutants." EMBO J. 1988;7:3983-3989; Burke et al., "Activating mutations of Tn3 resolvase marking interfaces important in recombination catalysis and its regulation. Mol Microbiol. 2004;51:937-948; Olorunniji et al., "Synapsis and catalysis by activated Tn3 resolvase mutants." Nucleic Acids Res. 2008;36:7181-7191; Rowland et al., "Regulatory mutations in Sin recombinase support a structure-based model of the synaptosome." Mol Microbiol. 2009;74:282-298; Akopian et al., "Chimeric recombinases with designed DNA sequence recognition." Proc Natl Acad Sci USA.2003;100:8688-8691;Gordley et al.,"Evolution of programmable zinc finger-recombinases with activity in human cells.J Mol Biol.2007;367:802-813;Gordley et al.,"Synthesis of programmable integrases."Proc Natl Acad Sci USA.2009;106:5053-5058;Arnold et al.,"Mutants of Tn3 resolvase which do not require accessory binding sites for recombination activity."EMBO J.1999;18:1407-1414;Gaj et al.,"Structure-guided reprogramming of serine recombinase DNA sequence specificity."Proc Natl Acad Sci USA.2011;108(2):498-503;and Proudfoot et al.,"Zinc finger recombinases with adaptable DNA sequence specificity." PLoS One. 2011;6(4):e19537, the entire contents of each of which are incorporated herein by reference in their entirety. For example, serine recombinases of the resolvase-invertase family, such as Tn3 and γδ resolvases and Hin and Gin invertases, have molecular structures with autonomous catalytic and DNA-binding domains (see, e.g., Grindley et al., "Mechanism of site-specific recombination." Ann Rev Biochem. 2006;75:567-605, the entire contents of which are incorporated by reference). Thus, for example, after isolation of "activated" recombinase mutants that do not require any auxiliary factors (e.g., DNA binding activity), the catalytic domains of these recombinases are amenable to recombination with RNA-programmable nucleases (e.g., dCas9 or fragments thereof) that inactivate the nuclease as described herein (see, e.g., Klippel et al., "Isolation and characterization of unusual gin mutants." EMBO J. 1988;7:3983-3989; Burke et al., "Activating mutations of Tn3 resolvase marking interfaces important in recombination catalysis and its regulation. Mol Microbiol. 2004;51:937-948; Olorunniji et al., "Synapsis and catalysis by activated Tn3 resolvase mutants." Nucleic Acids Res. 2008;36:7181-7191; Rowland et al., "Regulatory mutations in Sin recombinase support a structure-based model of the synaptosome." Mol Microbiol. 2009;74:282-298; Akopian et al., "Chimeric recombinases with designed DNA sequence recognition." Proc Natl Acad Sci USA. 2003;100:8688-8691). In addition, many other naturally occurring serine recombinases with N-terminal catalytic domains and C-terminal DNA binding domains are known (e.g., phiC31 integrase, TnpX transposase, IS607 transposase), whose catalytic domains can be selected to engineer programmable site-specific recombinases as described herein (see, e.g., Smith et al., "Diversity in the serine recombinases." Mol Microbiol. 2002;44:299-307, the entire contents of which are incorporated by reference). Similarly, the core catalytic domains of tyrosine recombinases (e.g., Cre, lambda integrase) are known and can be similarly selected to engineer programmable site-specific recombinases as described herein (see, e.g., Guo et al., "Structure of Cre recombinase complexed with DNA in a site-specific recombination synapse." Nature. 1997;389:40-46; Hartung et al., "Cre mutants with altered DNA binding properties." J Biol Chem 1998;273:22884-22891; Shaikh et al., "Chimeras of the Flp and Cre recombinases: Tests of the mode of cleavage by Flp and Cre. J Mol Biol. 2000;302:27-48; Rongrong et al., "Effect of deletion mutation on the recombination activity of Cre recombinase." Acta Biochim 1999;302:27-48). Pol.2005;52:541-544;Kilbride et al.,"Determinants of product topology in a hybrid Cre-Tn3 resolvase site-specific recombination system."J Mol Biol.2006;355:185-195;Warren et al.,"A chimeric cre recombinase with regulated directionality."Proc Natl Acad Sci USA.2008 105:18278-18283;Van Duyne,"Teaching Cre to follow directions."Proc Natl Acad Sci USA.2009 Jan 6;106(1):4-5;Numrych et al.,"A comparison of the effects of single-base and triple-base changes in the integrase arm-type binding sites on the site-specific recombination of bacteriophage λ."Nucleic Acids Res.1990;18:3953-3959; Tirumalai et al., "The recognition of core-type DNA sites by λ integrase." J Mol Biol.1998;279:513-527; Aihara et al., "A conformational switch controls the DNA cleavage activity of λ integrase." Mol Cell.2003;12:187-198; Biswas et al., "A structural basis for allosteric control of DNA recombination by λ integrase." Nature.2005;435:1059-1066; and Warren et al., "Mutations in the amino-terminal domain of λ-integrase have differential effects on integrative and excisive recombination." Mol Microbiol.2005;55:1104-1112 (the entire contents of each are incorporated by reference).

リコンビナーゼ認識配列
本願において用いられる用語「リコンビナーゼ認識配列」または同等に「RRS」または「リコンビナーゼ標的配列」は、リコンビナーゼによって認識され、RRSを有する別のDNA分子との鎖交換を経過するヌクレオチド配列標的を言う。これはリコンビナーゼ認識配列間のDNAフラグメントの切除、取り入れ、逆位、または交換をもたらす。
Recombinase Recognition Sequence As used herein, the term "recombinase recognition sequence" or, equivalently, "RRS" or "recombinase target sequence" refers to a nucleotide sequence target that is recognized by a recombinase and undergoes strand exchange with another DNA molecule that has an RRS, resulting in excision, incorporation, inversion, or exchange of a DNA fragment between the recombinase recognition sequences.

組み換えるまたは組み換え
用語「組み換える」または「組み換え」は、核酸改変(例えばゲノム改変)という文脈において、2つ以上の核酸分子または単一の核酸分子の2つ以上の領域がリコンビナーゼタンパク質(例えば、本願において提供される本発明のリコンビナーゼ融合タンパク質)の作用によって改変されるプロセスを言うために用いられる。組み換えは、例えば1つ以上の核酸分子上または間において、核酸のとりわけ挿入、逆位、切除、または転座をもたらし得る。リコンビナーゼ認識配列
The terms " recombining " or "recombination" are used in the context of nucleic acid modification (e.g., genome modification) to refer to a process in which two or more nucleic acid molecules or two or more regions of a single nucleic acid molecule are modified by the action of a recombinase protein (e.g., the inventive recombinase fusion proteins provided herein). Recombination can result in, among other things, an insertion, inversion, excision, or translocation of nucleic acid on or between one or more nucleic acid molecules. Recombinase recognition sequences

逆転写酵素
用語「逆転写酵素」はRNA依存性DNAポリメラーゼとして特徴付けられるポリメラーゼのあるクラスを記述する。全ての公知の逆転写酵素はRNA鋳型からDNA転写物を合成するためにはプライマーを要求する。歴史的には、逆転写酵素は主としてmRNAをcDNAに転写するために用いられている。これはそれからさらなる操作のためにベクター上にクローニングされ得る。トリ骨髄芽球症(myoblastosis)ウイルス(AMV)逆転写酵素は最初の広く用いられるRNA依存性DNAポリメラーゼであった(Verma, Biochim. Biophys. Acta 473:1(1977))。酵素は、5'-3'RNA指令型DNAポリメラーゼ活性、5'-3'DNA指令型DNAポリメラーゼ活性、およびRNase H活性を有する。RNase HはRNA-DNAハイブリッドのRNA鎖に特異的なプロセッシブな5'および3'リボヌクレアーゼである(Perbal, A Practical Guide to Molecular Cloning, New York: Wiley & Sons(1984))。公知のウイルス逆転写酵素はプルーフリーディングにとって必要な3'-5'エキソヌクレアーゼ活性を欠くので、転写のエラーは逆転写酵素によって修正され得ない(Saunders and Saunders, Microbial Genetics Applied to Biotechnology, London: Croom Helm(1987))。AMV逆転写酵素の活性およびその関連するRNase H活性の詳細な研究は、Berger et al., Biochemistry 22:2365-2372(1983)によって提示されている。分子生物学に鋭意用いられる別の逆転写酵素はモロニーマウス白血病ウイルス(M-MLV)を起源とする逆転写酵素である。例えば、Gerard, G. R., DNA 5:271-279(1986)およびKotewicz, M. L., et al., Gene 35:249-258(1985)を見よ。RNase H活性を実質的に欠くM-MLV逆転写酵素もまた記載されている。例えばU.S.Pat.No.5,244,797を見よ。本発明はいずれかのかかる逆転写酵素またはそれらのバリアントもしくは変異体の使用を企図する。
Reverse TranscriptaseThe term "reverse transcriptase" describes a class of polymerases characterized as RNA-dependent DNA polymerases. All known reverse transcriptases require a primer to synthesize a DNA transcript from an RNA template. Historically, reverse transcriptases have been used primarily to transcribe mRNA into cDNA, which can then be cloned onto a vector for further manipulation. Avian myoblastosis virus (AMV) reverse transcriptase was the first widely used RNA-dependent DNA polymerase (Verma, Biochim. Biophys. Acta 473:1 (1977)). The enzyme possesses 5'-3' RNA-directed DNA polymerase activity, 5'-3' DNA-directed DNA polymerase activity, and RNase H activity. RNase H is a processive 5' and 3' ribonuclease specific for the RNA strand of an RNA-DNA hybrid (Perbal, A Practical Guide to Molecular Cloning, New York: Wiley & Sons (1984)). Known viral reverse transcriptases lack the 3'-5' exonuclease activity necessary for proofreading, so transcription errors cannot be corrected by the reverse transcriptase (Saunders and Saunders, Microbial Genetics Applied to Biotechnology, London: Croom Helm (1987)). A detailed study of the activity of AMV reverse transcriptase and its associated RNase H activity is presented by Berger et al., Biochemistry 22:2365-2372 (1983). Another reverse transcriptase that is extensively used in molecular biology is the reverse transcriptase originating from Moloney murine leukemia virus (M-MLV). See, for example, Gerard, GR, DNA 5:271-279 (1986) and Kotewicz, ML, et al., Gene 35:249-258 (1985). M-MLV reverse transcriptase, which is substantially devoid of RNase H activity, has also been described. See, for example, US Pat. No. 5,244, 797. The present invention contemplates the use of any such reverse transcriptase or variants or mutants thereof.

加えて、本発明は、エラーを起こしやすい、すなわちエラーを起こしやすい逆転写酵素と言われ得る逆転写酵素、または重合の間にヌクレオチドの高忠実性組み込みを支持しない逆転写酵素の使用を企図する。ガイドRNAと取り入れされたRT鋳型に基づく一本鎖DNAフラップの合成の間に、エラーを起こしやすい逆転写酵素は、RT鋳型配列とミスマッチである1つ以上のヌクレオチドを導入し得、それによって、一本鎖DNAフラップの誤りがちな重合によってヌクレオチド配列に変化を導入する。それから、一本鎖DNAフラップの合成の間に導入されるこれらのエラーは、対応する内生標的鎖に対するハイブリダイゼーション、取って代わられた内生鎖の除去、ライゲーション、ならびにそれから内生DNA修復および/または配列決定プロセスのもう1つのラウンドによって、二本鎖分子上に取り入れられるようになる。 In addition, the present invention contemplates the use of reverse transcriptases that are error-prone, i.e. may be referred to as error-prone reverse transcriptases, or reverse transcriptases that do not support high fidelity incorporation of nucleotides during polymerization. During synthesis of the single-stranded DNA flap based on the guide RNA and the incorporated RT template, the error-prone reverse transcriptase may introduce one or more nucleotides that are mismatched with the RT template sequence, thereby introducing changes in the nucleotide sequence by error-prone polymerization of the single-stranded DNA flap. These errors introduced during synthesis of the single-stranded DNA flap then become incorporated onto the double-stranded molecule by hybridization to the corresponding endogenous target strand, removal of the displaced endogenous strand, ligation, and then another round of endogenous DNA repair and/or sequencing processes.

逆転写
本願において用いられる用語「逆転写」は、酵素がRNAを鋳型として用いてDNA鎖(つまり、相補的なDNAまたはcDNA)を合成する能力を指示する。いくつかの態様では、逆転写は「エラーを起こしやすい逆転写」であり得る。これは、それらのDNA重合活性がエラーを起こしやすい、ある種の逆転写酵素の特性を言う。
Reverse Transcription The term "reverse transcription" as used herein refers to the ability of an enzyme to synthesize a DNA strand (i.e., complementary DNA or cDNA) using RNA as a template. In some embodiments, the reverse transcription can be "error-prone reverse transcription." This refers to the property of certain reverse transcriptase enzymes that their DNA polymerization activity is error-prone.

PACE
本願において用いられる用語「ファージによって補助される連続的進化(PACE)」は、ウイルスベクターとしてファージを使用する連続的進化を言う。PACE技術の一般概念は、例えば、2009年9月8日出願の国際PCT出願PCT/US2009/056194、2010年3月11日にWO 2010/028347として公開;2011年12月22日出願の国際PCT出願PCT/US2011/066747、2012年6月28日にWO 2012/088381として公開;米国出願、2015年5月5日に発行された米国特許第9,023,594号;2015年1月20日出願の国際PCT出願PCT/US2015/012022、2015年9月11日にWO 2015/134121として公開;および2016年4月15日出願の国際PCT出願PCT/US2016/027795、2016年10月20日にWO 2016/168631として公開(これら全体の各内容は参照により本明細書に組み込まれる)に記載されている。
PACE
The term "phage-assisted continuous evolution (PACE)" as used herein refers to continuous evolution using phages as viral vectors. The general concept of PACE technology is described, for example, in International PCT Application PCT/US2009/056194, filed September 8, 2009, published March 11, 2010 as WO 2010/028347; International PCT Application PCT/US2011/066747, filed December 22, 2011, published June 28, 2012 as WO 2012/088381; U.S. Patent Application, U.S. Patent No. 9,023,594, issued May 5, 2015; International PCT Application PCT/US2015/012022, filed January 20, 2015, published September 11, 2015 as WO 2012/088381; and in International PCT application PCT/US2016/027795, filed April 15, 2016, published as WO 2016/168631, the entire contents of each of which are incorporated herein by reference.

ファージ
本願において用語「バクテリオファージ」と交換可能に用いられる用語「ファージ」は、細菌細胞に感染するウイルスを言う。典型的には、ファージは遺伝物質を内包する外側タンパク質カプシドからなる。遺伝物質は直線状または環状形態どちらかのssRNA、dsRNA、ssDNA、またはdsDNAであり得る。ファージおよびファージベクターは当業者には周知であり、本願において提供されるPACE法を実行するために有用であるファージの限定しない例は、λ(溶原体)、T2、T4、T7、T12、R17、M13、MS2、G4、P1、P2、P4、ファイX174、N4、Φ6、およびΦ29である。ある態様において、本発明に利用されるファージはM13である。追加の好適なファージおよびホスト細胞は当業者には明らかであろう。本発明はこの側面において限定されない。追加の好適なファージおよびホスト細胞の例示の記載は、Elizabeth Kutter and Alexander Sulakvelidze:Bacteriophages: Biology and Applications.CRC Press;1st edition(December 2004),ISBN:0849313368;Martha R.J.Clokie and Andrew M.Kropinski:Bacteriophages:Methods and Protocols,Volume 1:Isolation,Characterization,and Interactions(Methods in Molecular Biology)Humana Press;1st edition(December,2008),ISBN:1588296822;Martha R.J.Clokie and Andrew M.Kropinski:Bacteriophages:Methods and Protocols,Volume 2:Molecular and Applied Aspects(Methods in Molecular Biology)Humana Press;1st edition(December 2008),ISBN:1603275649を見よ;これらの全ては、好適なファージおよびホスト細胞、ならびにかかるファージの単離、培養、および操作のための方法およびプロトコールの開示について、それらの全体が参照によって本願に組み込まれる)。
Phage The term "phage", which is used interchangeably with the term "bacteriophage" in this application, refers to a virus that infects bacterial cells. Typically, a phage consists of an outer protein capsid that encapsulates genetic material. The genetic material can be ssRNA, dsRNA, ssDNA, or dsDNA in either linear or circular form. Phages and phage vectors are well known to those of skill in the art, and non-limiting examples of phages that are useful for carrying out the PACE method provided herein are λ (lysogen), T2, T4, T7, T12, R17, M13, MS2, G4, P1, P2, P4, phiX174, N4, Φ6, and Φ29. In one embodiment, the phage utilized in the present invention is M13. Additional suitable phages and host cells will be apparent to those of skill in the art. The present invention is not limited in this aspect. Exemplary descriptions of additional suitable phages and host cells can be found in Elizabeth Kutter and Alexander Sulakvelidze: Bacteriophages: Biology and Applications. CRC Press; 1st edition (December 2004), ISBN: 0849313368; Martha RJ Clokie and Andrew M. Kropinski: Bacteriophages: Methods and Protocols, Volume 1: Isolation, Characterization, and Interactions (Methods in Molecular Biology) Humana Press; 1st edition (December, 2008), ISBN: 1588296822; Martha RJ Clokie and Andrew M. Kropinski: Bacteriophages: Methods and Protocols, Volume 2: Molecular and Applied Aspects (Methods in Molecular Biology) Humana Press; 1st edition (December, 2008), ISBN: 1603275649; all of which are incorporated by reference in their entireties for their disclosure of suitable phages and host cells, as well as methods and protocols for the isolation, culture, and manipulation of such phages.

タンパク質、ペプチド、およびポリペプチド
用語「タンパク質」、「ペプチド」、および「ポリペプチド」は本明細書中、互換的に使用され、ペプチド(アミド)結合によって一緒に連結されたアミノ酸残基の重合体を指す。用語は、いずれのサイズ、構造、もしくは機能の、タンパク質、ペプチド、またはポリペプチドを指す。典型的には、タンパク質、ペプチド、またはポリペプチドは、少なくとも3アミノ酸長であろう。タンパク質、ペプチド、またはポリペプチドは、個々のタンパク質またはタンパク質の一群を指してもよい。タンパク質、ペプチド、またはポリペプチド中のアミノ酸の1以上は、例えば、炭水化物基、ヒドロキシル基、ホスファート基、ファルネシル基、イソファルネシル基、脂肪酸基、抱合のためのリンカー、官能基化、または他の修飾等々などの化学的実体(chemical entity)の付加によって修飾されていてもよい。タンパク質、ペプチド、またはポリペプチドはまた、単一分子であってもよく、または多分子複合体であってもよい。タンパク質、ペプチド、またはポリペプチドは、天然に存在するタンパク質またはペプチドのただのフラグメントであってもよい。タンパク質、ペプチド、またはポリペプチドは、天然に存在するもの、組換え体、または合成物、またはいずれのそれらの組み合わせであってもよい。本明細書に提供されるタンパク質のいずれも、当該技術分野において知られているいずれの方法によって産生されてもよい。例えば、本明細書に提供されるタンパク質は、ペプチドリンカーを含む融合タンパク質にとくに適した、組換えタンパク質の発現および精製を介して産生されてもよい。組換えタンパク質の発現および精製のための方法は周知であり、Green and Sambrook,Molecular Cloning:A Laboratory Manual(4th ed.,Cold Spring Harbor Laboratory Press,Cold Spring Harbor,N.Y.(2012)(これらの内容全体は参照により本明細書に組み込まれる))によって記載されるものを包含する。
Proteins, Peptides, and Polypeptides The terms "protein,""peptide," and "polypeptide" are used interchangeably herein and refer to a polymer of amino acid residues linked together by peptide (amide) bonds. The terms refer to proteins, peptides, or polypeptides of any size, structure, or function. Typically, a protein, peptide, or polypeptide will be at least three amino acids long. A protein, peptide, or polypeptide may refer to an individual protein or a group of proteins. One or more of the amino acids in a protein, peptide, or polypeptide may be modified by addition of a chemical entity, such as, for example, a carbohydrate group, a hydroxyl group, a phosphate group, a farnesyl group, an isofarnesyl group, a fatty acid group, a linker for conjugation, functionalization, or other modification, and the like. A protein, peptide, or polypeptide may also be a single molecule or a multi-molecular complex. A protein, peptide, or polypeptide may be just a fragment of a naturally occurring protein or peptide. A protein, peptide, or polypeptide may be naturally occurring, recombinant, or synthetic, or any combination thereof. Any of the proteins provided herein may be produced by any method known in the art. For example, the proteins provided herein may be produced through recombinant protein expression and purification, which is particularly suitable for fusion proteins that contain peptide linkers. Methods for recombinant protein expression and purification are well known and include those described by Green and Sambrook, Molecular Cloning: A Laboratory Manual (4th ed., Cold Spring Harbor Laboratory Press, Cold Spring Harbor, NY (2012) (the entire contents of which are incorporated herein by reference).

タンパク質スプライシング
本願において用いられる用語「タンパク質スプライシング」は、インテイン(または場合に応じて分裂インテイン)の配列がアミノ酸配列内から切り出され、アミノ酸配列の残りのフラグメントのエクステインがアミド結合によってライゲーションされて連続的なアミノ酸配列を形成するプロセスを言う。用語「トランス」タンパク質スプライシングは、インテインが分裂インテインであり、それらが異なるタンパク質上に位置付けられる特定のケースを言う。
Protein splicing The term "protein splicing" as used herein refers to a process in which the sequence of an intein (or split intein, as the case may be) is excised from within an amino acid sequence and the exteins of the remaining fragment of the amino acid sequence are ligated by amide bonds to form a continuous amino acid sequence. The term "trans" protein splicing refers to the specific case in which the inteins are split inteins and are located on different proteins.

第2鎖ニッキング
プライム編集の結果として形成されるヘテロ二重鎖DNA(すなわち、1つの編集されたおよび1つの非編集の鎖を含有する)の分解は、長期的な編集アウトカムを決定する。言葉にすると、プライム編集のゴールは、相補的な内生鎖上に編集された鎖を永久的に取り入れすることによって、PEの中間体として形成されるヘテロ二重鎖DNA(内生非編集鎖と対形成した編集された鎖)を分解することである。DNA分子上への編集された鎖の永久的な取り入れに有利にヘテロ二重鎖DNAの分解を駆動することを助けるために、「第2鎖ニッキング」のアプローチが本願において用いられ得る。本願において用いられる「第2鎖ニッキング」の概念は、第1のニック(すなわち、ガイドRNAの伸長された部分上の逆転写酵素のプライムへの使用のための遊離の3'端を提供する当初のニック部位)の下流の位置付けにおける、好ましくは編集されない鎖上の第2のニックの導入を言う。ある態様において、第1のニックおよび第2のニックは対向する鎖上にある。他の態様において、第1のニックおよび第2のニックは対向する鎖上にある。さらに別の態様では、第1のニックは非標的鎖(すなわち、Rループの一本鎖部分を形成する鎖)上にあり、第2のニックは標的鎖上にある。なお他の態様において、第1のニックは編集される鎖上にあり、第2のニックは編集されない鎖上にある。第2のニックは、第1のニックの少なくとも5ヌクレオチド下流に、あるいは第1のニックの少なくとも6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、40、50、60、70、80、90、100、110、120、130、140、もしくは150ヌクレオチド、またはより多く下流に位置取り得る。第2のニックは、ある態様において、編集されない鎖上において、PEgRNAによって誘導されるニックの部位から約5-150ヌクレオチドの間、または約5-140の間、もしくは約5-130の間、もしくは約5-120の間、もしくは約5-110の間、もしくは約5-100の間、もしくは約5-90の間、もしくは約5-80の間、もしくは約5-70の間、もしくは約5-60の間、もしくは約5-50の間、もしくは約5-40の間、もしくは約5-30の間、もしくは約5-20の間、もしくは約5-10の間離れて導入され得る。1つの態様では、第2のニックは、PEgRNAによって誘導されるニックから14-116ヌクレオチドの間離れて導入される。理論によって拘束されることなしに、第2のニックは細胞の内生DNA修復および複製プロセスを編集されない鎖の置き換えまたは編集の方へ誘導し、それによって、両方の鎖上に編集された配列を永久的に組み入れし、PEの結果として形成されるヘテロ二重鎖を分解する。いくつかの態様では、編集される鎖は非標的鎖であり、編集されない鎖は標的鎖である。他の態様において、編集される鎖は標的鎖であり、編集されない鎖は非標的鎖である。
The degradation of the heteroduplex DNA (i.e., containing one edited and one non-edited strand) formed as a result of second strand nicking prime editing determines the long-term editing outcome. In words, the goal of prime editing is to degrade the heteroduplex DNA (the edited strand paired with the endogenous non-edited strand) formed as a PE intermediate by permanently incorporating the edited strand on the complementary endogenous strand. To help drive the degradation of the heteroduplex DNA in favor of the permanent incorporation of the edited strand on the DNA molecule, the approach of "second strand nicking" can be used in the present application. The concept of "second strand nicking" used in the present application refers to the introduction of a second nick, preferably on the non-edited strand, in a position downstream of the first nick (i.e., the original nick site that provides a free 3' end for use in priming reverse transcriptase on the extended portion of the guide RNA). In some embodiments, the first nick and the second nick are on opposite strands. In other embodiments, the first nick and the second nick are on opposite strands. In yet another embodiment, the first nick is on the non-target strand (i.e., the strand that forms the single-stranded portion of the R-loop) and the second nick is on the target strand. In yet other embodiments, the first nick is on the edited strand and the second nick is on the non-edited strand. The second nick can be located at least 5 nucleotides downstream of the first nick, or at least 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 40, 50, 60, 70, 80, 90, 100, 110, 120, 130, 140, or 150 nucleotides or more downstream of the first nick. The second nick can be introduced, in some embodiments, on the non-edited strand between about 5-150 nucleotides, or between about 5-140, or between about 5-130, or between about 5-120, or between about 5-110, or between about 5-100, or between about 5-90, or between about 5-80, or between about 5-70, or between about 5-60, or between about 5-50, or between about 5-40, or between about 5-30, or between about 5-20, or between about 5-10 nucleotides away from the site of the PEgRNA-induced nick. In one embodiment, the second nick is introduced between 14-116 nucleotides away from the PEgRNA-induced nick. Without being bound by theory, the second nick directs the cell's endogenous DNA repair and replication processes towards replacing or editing the non-edited strand, thereby permanently incorporating the edited sequence on both strands and dissolving the heteroduplex formed as a result of PE. In some embodiments, the edited strand is a non-target strand and the non-edited strand is a target strand, hi other embodiments, the edited strand is a target strand and the non-edited strand is a non-target strand.

センス鎖
遺伝学において、「センス」鎖は、5'から3'へ伸びる二本鎖のDNA内のセグメントであって、3'から5'へ伸びるDNAのアンチセンス鎖または鋳型鎖に相補的である。タンパク質をコードするDNAセグメントのケースにおいて、センス鎖は、転写の最中にその鋳型としてアンチセンス鎖を取り結局(典型的には、常にではない)翻訳を経てタンパク質になるmRNAと同じ配列を有するDNAの鎖である。よって、アンチセンス鎖は、後にタンパク質へ翻訳されるRNAを担い、一方センス鎖は、mRNAとほぼ同一の組成(makeup)を保有する。dsDNAの各セグメントについて、一方がどの方向から読まれるかに応じて、おそらく(センスおよびアンチセンスは視点に相対するから)センスおよびアンチセンスが2組存在するであろう点に留意する。遺伝子産物またはmRNAは結局、dsDNAの一方のセグメントのどちらかの鎖がセンスまたはアンチセンスと称されることを示す。
Sense strand In genetics, the "sense" strand is a segment in a double-stranded DNA that runs 5' to 3' and is complementary to the antisense or template strand of the 3' to 5' DNA. In the case of a DNA segment that codes for a protein, the sense strand is the strand of DNA that has the same sequence as the mRNA that takes the antisense strand as its template during transcription and ends up (typically, but not always) being translated into a protein. Thus, the antisense strand carries the RNA that is then translated into a protein, while the sense strand has nearly the same makeup as the mRNA. Note that for each segment of dsDNA, there will likely be two pairs, a sense and an antisense (because sense and antisense are relative perspectives), depending on which direction one is read from. The gene product or mRNA ultimately refers to either strand of a segment of dsDNA, which is referred to as sense or antisense.

PEgRNAの文脈において、第1ステップは、5'→3'方向に配向される単鎖相補DNA(すなわち、組み込まれることになる3'ssDNAフラップ)の合成であるが、前記合成鎖はPEgRNA伸長アームの鋳型から外れる。3'ssDNAフラップがセンス鎖と見なされるべきかまたはアンチセンス鎖と見なされるべきかについては、DNAの両鎖が転写のための鋳型として働き得る(が同時ではない)ことが十分に許容されているところ、転写の方向に依存する。よって、いくつかの態様において、3'ssDNAフラップ(全体的に5'→3'方向に伸びる)は、コード鎖であることから、センス鎖として働くであろう。他の態様において、3'ssDNAフラップ(全体的に5'→3'方向に伸びる)はアンチセンス鎖として働き、よって転写の鋳型であろう。 In the context of PEgRNA, the first step is the synthesis of a single stranded complementary DNA (i.e., the 3'ssDNA flap to be incorporated) oriented in the 5'→3' direction, but the synthesized strand is off-templated by the PEgRNA extension arm. Whether the 3'ssDNA flap should be considered the sense strand or the antisense strand depends on the direction of transcription, where it is fully accepted that both strands of DNA can serve as templates for transcription (but not simultaneously). Thus, in some embodiments, the 3'ssDNA flap (extending generally in the 5'→3' direction) will serve as the sense strand, since it is the coding strand. In other embodiments, the 3'ssDNA flap (extending generally in the 5'→3' direction) will serve as the antisense strand and thus be a template for transcription.

スペーサー配列
本明細書に使用されるとき、ガイドRNAまたはPEgRNAと関係のある用語「スペーサー配列」は、標的DNA配列中のプロトスペーサー配列に相補的なヌクレオチド配列を含有する、約20ヌクレオチドのガイドRNAまたはPEgRNAの部分を指す。スペーサー配列はプロトスペーサー配列とアニールすることで、標的部位にてssRNA/ssDNAハイブリッド構造が、およびプロトスペーサー配列に相補的な内生DNA鎖の対応するRループssDNA構造が形成される。
Spacer Sequence As used herein, the term "spacer sequence" in relation to a guide RNA or PEgRNA refers to a portion of the guide RNA or PEgRNA of about 20 nucleotides that contains a nucleotide sequence complementary to a protospacer sequence in the target DNA sequence. The spacer sequence anneals to the protospacer sequence to form a ssRNA/ssDNA hybrid structure at the target site and a corresponding R-loop ssDNA structure in the endogenous DNA strand complementary to the protospacer sequence.

対象
用語「対象」は、本明細書に使用されるとき、個々の生物、例えば、個々の哺乳動物を指す。いくつかの態様において、対象は、ヒトである。いくつかの態様において、対象は、非ヒト哺乳動物である。いくつかの態様において、対象は、霊長目の非ヒト動物である。いくつかの態様において、対象は、齧歯類の動物である。いくつかの態様において、対象は、ヒツジ、ヤギ、畜牛、ネコ、またはイヌである。いくつかの態様において、対象は、脊椎動物、両生類、爬虫類、魚類、昆虫、飛ぶ昆虫(fly)、または線虫である。いくつかの態様において、対象は、研究動物である。いくつかの態様において、対象は、遺伝子学的に改変されており、例として、遺伝子学的に改変された非ヒト対象である。対象は、いずれの性であってもよく、いずれの発生段階にあってもよい。
The term "subject" as used herein refers to an individual organism, e.g., an individual mammal. In some embodiments, the subject is a human. In some embodiments, the subject is a non-human mammal. In some embodiments, the subject is a non-human animal of the order Primates. In some embodiments, the subject is a rodent. In some embodiments, the subject is a sheep, goat, cattle, cat, or dog. In some embodiments, the subject is a vertebrate, amphibian, reptile, fish, insect, fly, or nematode. In some embodiments, the subject is a research animal. In some embodiments, the subject is genetically modified, e.g., a genetically modified non-human subject. The subject may be of either sex and at any stage of development.

分裂インテイン
インテインは最も頻繁には一続きのドメインとして見出されるが、いくつかは天然に分裂された形態で存在する。このケースでは、2つのフラグメントは別個のポリペプチドとして発現され、スプライシングが生起する、いわゆるタンパク質トランススプライシング前に会合しなければならない。
Split inteinsInteins are most frequently found as a continuous domain, but some naturally exist in a split form. In this case, the two fragments are expressed as separate polypeptides and must associate before splicing can occur, a process known as protein trans-splicing.

例示の分裂インテインはSsp DnaEインテインであり、これは2つのサブユニット、つまりDnaE-NおよびDnaE-Cを含む。2つの異なるサブユニットは別個の遺伝子、つまりdnaE-nおよびdnaE-cによってコードされ、これらは夫々DnaE-NおよびDnaE-Cサブユニットをコードする。DnaEはSynechocytis sp. PCC6803の天然に存在する分裂インテインであり、夫々がDnaE-NまたはDnaE-Cどちらかとの融合体を含む2つの別個のタンパク質のトランススプライシングを導くことができる。 An exemplary split intein is the Ssp DnaE intein, which contains two subunits, DnaE-N and DnaE-C. The two distinct subunits are encoded by separate genes, dnaE-n and dnaE-c, which encode the DnaE-N and DnaE-C subunits, respectively. DnaE is a naturally occurring split intein in Synechocytis sp. PCC6803 that can direct the trans-splicing of two separate proteins, each of which contains a fusion with either DnaE-N or DnaE-C.

追加の天然に存在するまたは操作された分裂インテイン配列は公知であるか、または本明細書に記載の丸ごとのインテイン配列もしくは当該技術分野で利用可能なものから作られ得る。分裂インテイン配列の例は、Stevens et al.,"A promiscuous split intein with expanded protein engineering applications,"PNAS,2017,Vol.114:8538-8543;Iwai et al.,"Highly efficient protein trans-splicing by a naturally split DnaE intein from Nostc punctiforme,FEBS Lett,580:1853-1858に見出され得る。これらの夫々は参照によって本願に組み込まれる。追加の分裂インテイン配列は例えばWO2013/045632、WO2014/055782、WO2016/069774、およびEP2877490に見出され得る。これらの夫々の内容は参照によって本願に組み込まれる。 Additional naturally occurring or engineered split intein sequences are known or may be made from the whole intein sequences described herein or available in the art. Examples of split intein sequences can be found in Stevens et al., "A promiscuous split intein with expanded protein engineering applications," PNAS, 2017, Vol. 114: 8538-8543; Iwai et al., "Highly efficient protein trans-splicing by a naturally split DnaE intein from Nostc punctiforme, FEBS Lett, 580: 1853-1858, each of which is incorporated herein by reference. Additional split intein sequences can be found, for example, in WO2013/045632, WO2014/055782, WO2016/069774, and EP2877490, the contents of each of which are incorporated herein by reference.

加えて、トランスのタンパク質スプライシングがインビボおよびin vitroで記載されており(Shingledecker,et al.,[0076]Gene 207:187(1998)、Southworth,et al.,EMBO J.17:918(1998);Mills,et al.,Proc.Natl.Acad.Sci.USA,95:3543-3548(1998);Lew,et al.,J.Biol.Chem.,273:15887-15890(1998);Wu,et al.,Biochim.Biophys.Acta 35732:1(1998b),Yamazaki,et al.,J.Am.Chem.Soc.120:5591(1998),Evans,et al.,J.Biol.Chem.275:9091(2000);Otomo,et al.,Biochemistry 38:16040-16044(1999);Otomo,et al.,J.Biolmol.NMR 14:105-114(1999);Scott,et al.,Proc.Natl.Acad.Sci.USA 96:13638-13643(1999))、爾後にライゲーションを経過して機能的な産物を形成する2つの不活性なフラグメントとして、あるタンパク質を発現する機会を提供する。例えば、2つの別個に発現された半分からの完全なPE融合タンパク質の形成について、図66および67に示されているとおりである。 In addition, protein splicing in trans has been described in vivo and in vitro (Shingledecker, et al., Gene 207:187 (1998); Southworth, et al., EMBO J. 17:918 (1998); Mills, et al., Proc. Natl. Acad. Sci. USA, 95:3543-3548 (1998); Lew, et al., J. Biol. Chem., 273:15887-15890 (1998); Wu, et al., Biochim. Biophys. Acta 35732:1 (1998b); Yamazaki, et al., J. Am. Chem. Soc. 120:5591 (1998); Evans, et al. al., J. Biol. Chem. 275:9091 (2000); Otomo, et al., Biochemistry 38:16040-16044 (1999); Otomo, et al., J. Biomol. NMR 14:105-114 (1999); Scott, et al., Proc. Natl. Acad. Sci. USA 96:13638-13643 (1999)), providing the opportunity to express a protein as two inactive fragments that subsequently undergo ligation to form a functional product, as shown, for example, in Figures 66 and 67 for the formation of a complete PE fusion protein from two separately expressed halves.

標的部位
用語「標的部位」は、本明細書に開示のプライム編集因子(PE)によって編集される核酸分子上の配列を言う。さらに、標的部位は、プライム編集因子(PE)およびgRNAの複合体が結合する核酸分子上の配列を言う。
The term "target site " refers to a sequence on a nucleic acid molecule that is edited by a prime editor (PE) as disclosed herein. Additionally, a target site refers to a sequence on a nucleic acid molecule to which a complex of a prime editor (PE) and a gRNA binds.

tPERT
「transプライム編集因子「RNA型(tPERT)」に係る定義を参照。
tPERT
See definition for "trans prime editing factor "RNA type (tPERT)."

一時的な第2鎖へのニック入れ
本明細書に使用されるとき、用語「一時的な第2鎖へのニック入れ」は、未編集鎖中の第2ニックの組み入れが、所望の編集が編集済鎖に組み入れられた後でしか生じない、第2鎖へのニック入れのバリアントを指す。これによって、二本鎖DNA切断へ繋がり得る両鎖上の同時ニックが回避される。第2鎖にニックを入れるガイドRNAは、第2鎖ニックが所望の編集の組み入れ後まで導入されないように、一時的制御のためにデザインされている。これは、編集済鎖のみにマッチするが元のアレルにはマッチしないスペーサー配列をもつgRNAをデザインすることによって達成される。このストラテジーを使用すると、プロトスペーサーと未編集アレルとの間のミスマッチによって、PAM鎖上の編集事象が起きた後まで、sgRNAによるニック入れが疎まれるはずである。
As used herein, the term " transient second strand nicking" refers to a variant of second strand nicking in which the incorporation of a second nick in the unedited strand occurs only after the desired edit has been incorporated into the edited strand. This avoids simultaneous nicking on both strands, which can lead to double-stranded DNA breaks. The second strand nicking guide RNA is designed for temporal control so that the second strand nick is not introduced until after the desired edit has been incorporated. This is achieved by designing a gRNA with a spacer sequence that matches only the edited strand but not the original allele. Using this strategy, the mismatch between the protospacer and the unedited allele should prevent nicking by the sgRNA until after the editing event on the PAM strand has occurred.

Transプライム編集
本明細書に使用されるとき、用語「transプライム編集」は、分裂PEgRNAを利用するプライム編集の修飾形態を指すが、すなわち、ここでPEgRNAは、2つ別々の分子:sgRNAおよびtransプライム編集RNA鋳型(tPERT)に分離される。sgRNAが、所望のゲノムの標的部位へ、プライム編集因子を標的化させる(またはより一般に、プライム編集因子のnapDNAbp構成要素を標的化させる)よう働く一方で、一旦tPERTが、プライム編集因子上およびtPERT上に位置付けられた結合ドメインの相互作用によって、プライム編集因子へtransに動員されると、tPERTはポリメラーゼ(例として、逆転写酵素)によって使用されて新しいDNA配列を標的遺伝子座中へ書き込む。一態様において、結合ドメインは、tPERT上に位置付けられたMS2アプタマーおよびプライム編集因子と融合したMS2cpタンパク質などの、RNA-タンパク質動員部分を包含し得る。transプライム編集の利点は、DNA合成鋳型をガイドRNAから分離させることによって、潜在的により長い長さの鋳型を使用できる点である。
Trans Prime Editing As used herein, the term "trans prime editing" refers to a modified form of prime editing that utilizes a split PEgRNA, i.e., where the PEgRNA is separated into two separate molecules: sgRNA and trans prime editing RNA template (tPERT). The sgRNA serves to target the prime editor (or more generally, the napDNAbp component of the prime editor) to the desired genomic target site, while once tPERT is recruited in trans to the prime editor by the interaction of the binding domains located on the prime editor and on tPERT, tPERT is used by the polymerase (e.g., reverse transcriptase) to write new DNA sequences into the target locus. In one embodiment, the binding domain can include an RNA-protein recruitment moiety, such as the MS2 aptamer located on tPERT and the MS2cp protein fused to the prime editor. The advantage of trans prime editing is that by separating the DNA synthesis template from the guide RNA, a template of potentially longer length can be used.

transプライム編集の態様は図3Gおよび3Hに示される。図3Gは左に、transプライム編集因子複合体の組成物(「RP-PE:gRNA複合体」)を示すが、これは、ポリメラーゼ(例として、逆転写酵素)およびrPERT動員タンパク質(例として、MS2sc)の各々と融合したnapDNAbpを含み、ガイドRNAと複合体化されている。図3Gはさらに、DNA合成鋳型およびプライマー結合配列を包含するPEgRNAの伸長アーム特色を含む、別々のtPERT分子を示す。tPERT分子はまた、RNA-タンパク質動員ドメイン(これは、このケースにおいて、ステムループ構造であり、例えば、MS2アプタマーであり得る)も包含する。図3Hに記載のプロセスに描かれるとおり、RP-PE:gRNA複合体は、標的DNA配列へ結合してニックを入れる。次いで、動員タンパク質(RP)は、tPERTを動員して、DNA標的部位へ結合したプライム編集因子複合体へ共局在化させ、それによってプライマー結合部位が、ニックが入った鎖上のプライマー配列へ結合できるようになり、続いて、ポリメラーゼ(例として、RT)が、DNA合成鋳型に対し、tPERTの5'に至るまでDNAの単鎖を合成できるようになる。 An embodiment of trans-prime editing is shown in Figures 3G and 3H. Figure 3G shows on the left the composition of a trans-prime editor complex ("RP-PE:gRNA complex"), which includes napDNAbp fused to each of a polymerase (e.g., reverse transcriptase) and a rPERT recruitment protein (e.g., MS2sc), complexed with a guide RNA. Figure 3G further shows a separate tPERT molecule, which includes a DNA synthesis template and an extension arm feature of PEgRNA that includes a primer binding sequence. The tPERT molecule also includes an RNA-protein recruitment domain (which in this case is a stem-loop structure, which can be, for example, an MS2 aptamer). As depicted in the process described in Figure 3H, the RP-PE:gRNA complex binds to and nicks the target DNA sequence. The recruitment protein (RP) then recruits tPERT and colocalizes it to the prime editor complex bound to the DNA target site, allowing the primer binding site to bind to the primer sequence on the nicked strand, and subsequently allowing a polymerase (e.g., RT) to synthesize a single strand of DNA onto the DNA synthesis template, up to 5' of tPERT.

tPERTは、RNA-タンパク質動員ドメインの5'末上にPBSおよびDNA合成鋳型を含むように、図3Gおよび図3Hに示されているが、他の立体配置のtPERTも、RNA-タンパク質動員ドメインの3'末上に位置付けられるPBSおよびDNA合成鋳型をもつようデザインされてもよい。しかしながら、5'伸長をもつtPERTは、DNAの単鎖の合成がtPERTの5'末にて自然と終始するであろうという利点を有し、よって、プライム編集のDNA合成段階の最中に、RNA-タンパク質動員ドメインのいずれの部分も鋳型として使用するリスクがない。 Although tPERT is shown in Figures 3G and 3H as containing a PBS and a DNA synthesis template on the 5' end of the RNA-protein recruitment domain, other configurations of tPERT may also be designed with the PBS and DNA synthesis template located on the 3' end of the RNA-protein recruitment domain. However, tPERT with a 5' extension has the advantage that synthesis of a single strand of DNA will naturally terminate at the 5' end of tPERT, and thus there is no risk of using any part of the RNA-protein recruitment domain as a template during the DNA synthesis step of prime editing.

Transプライム編集因子RNA鋳型(tPERT)
本明細書に使用されるとき、「transプライム編集因子RNA鋳型(tPERT)」は、transプライム編集に使用される構成要素を指す、プライム編集の修飾バージョンは、PEgRNAを2つの別個の分子:ガイドRNAおよびtPERT分子に分離することによって作動する。tPERT分子は、標的DNA部位にてプライム編集因子複合体と共局在化させて、プライマー結合部位およびDNA合成鋳型をプライム編集因子へtransで連れていくようプログラムされている。例えば、(1)RP-PE:gRNA複合体および(2)プライマー結合部位とRNA-タンパク質動員ドメインへ結び合わされたDNA合成鋳型とを包含するtPERTを含む2構成要素系を示すtransプライム編集因子(tPE)の態様については、図3Gを参照。ここでRP-PE:gRNA複合体のRP(動員タンパク質)構成要素は、tPERTを、編集されるべき標的部位へ動員させ、それによってPBSおよびDNA合成鋳型がプライム編集因子にtransで結び付けられる。別の言い方をすれば、tPERTは、PEgRNAの伸長アーム(の全部または一部)を含有するよう改変されており、これは、プライマー結合部位およびDNA合成鋳型を包含する。
Trans primed editor RNA template (tPERT)
As used herein, "trans prime editor RNA template (tPERT)" refers to the components used in trans prime editing, a modified version of prime editing works by separating PEgRNA into two separate molecules: guide RNA and tPERT molecules. The tPERT molecule is programmed to colocalize with the prime editor complex at the target DNA site and bring the primer binding site and DNA synthesis template to the prime editor in trans. For example, see FIG. 3G for an embodiment of trans prime editor (tPE) showing a two-component system including (1) RP-PE:gRNA complex and (2) tPERT containing a primer binding site and a DNA synthesis template linked to an RNA-protein recruitment domain. Here, the RP (recruitment protein) component of the RP-PE:gRNA complex recruits tPERT to the target site to be edited, thereby linking the PBS and DNA synthesis template to the prime editor in trans. In other words, tPERT is modified to contain (all or part of) the extension arm of a PEgRNA, which encompasses a primer binding site and a DNA synthesis template.

トランジション
本明細書に使用されるとき、「トランジション」は、プリン核酸塩基(A⇔G)の相互変換(interchange)またはピリミジン核酸塩基(C⇔T)の相互変換を指す。このクラスの相互変換は、同様の形状の核酸塩基を伴う。本明細書に開示の組成物および方法は、標的DNA分子において1以上のトランジションを誘導することが可能である。本明細書に開示の組成物および方法はまた、同じ標的DNA分子においてトランジションとトランスバージョンとの両方を誘導することも可能である。これらの変化は、A⇔G、G⇔A、C⇔T、またはT⇔Cを伴う。ワトソン・クリック対の核酸塩基をもつ二本鎖DNAの文脈において、トランスバージョンは、以下の塩基対交換:A:T⇔G:C、G:G⇔A:T、C:G⇔T:A、またはT:A⇔C:Gを指す。本明細書に開示の組成物および方法は、標的DNA分子において1以上のトランジションを誘導することが可能である。本明細書に開示の組成物および方法はまた、同じ標的DNA分子においてトランジションとトランスバージョンとの両方、ならびに欠失および挿入を包含する他のヌクレオチド変化を誘導することも可能である。
Transitions As used herein, "transition" refers to the interconversion of purine nucleobases (A⇔G) or pyrimidine nucleobases (C⇔T). This class of interconversion involves nucleobases of similar shape. The compositions and methods disclosed herein are capable of inducing one or more transitions in a target DNA molecule. The compositions and methods disclosed herein are also capable of inducing both transitions and transversions in the same target DNA molecule. These changes involve A⇔G, G⇔A, C⇔T, or T⇔C. In the context of double-stranded DNA with Watson-Crick paired nucleobases, transversion refers to the following base pair exchanges: A:T⇔G:C, G:G⇔A:T, C:G⇔T:A, or T:A⇔C:G. The compositions and methods disclosed herein are capable of inducing one or more transitions in a target DNA molecule. The compositions and methods disclosed herein are also capable of inducing both transitions and transversions, as well as other nucleotide changes, including deletions and insertions, in the same target DNA molecule.

トランスバージョン
本明細書に使用されるとき、「トランスバージョン」は、プリン核酸塩基のピリミジン核酸塩基への相互変換、またはその逆を指し、よって、形状が似ていない核酸塩基の相互変換を伴う。これらの変化は、T⇔A、T⇔G、C⇔G、C⇔A、A⇔T、A⇔C、G⇔C、およびG⇔Tを伴う。Watson-Crick対の核酸塩基をもつ二本鎖DNAの文脈において、トランスバージョンは、以下の塩基対交換:T:A⇔A:T、T:A⇔G:C、C:G⇔G:C、C:G⇔A:T、A:T⇔T:A、A:T⇔C:G、G:C⇔C:G、およびG:C⇔T:Aを指す。本明細書に開示の組成物および方法は、標的DNA分子において1以上のトランスバージョンを誘導することが可能である。本明細書に開示の組成物および方法はまた、同じ標的DNA分子においてトランジションとトランスバージョンとの両方、ならびに欠失および挿入を包含する他のヌクレオチド変化を誘導することも可能である。
Transversions As used herein, "transversion" refers to the interconversion of purine nucleobases to pyrimidine nucleobases, or vice versa, thus involving the interconversion of dissimilar nucleobases. These changes involve T⇔A, T⇔G, C⇔G, C⇔A, A⇔T, A⇔C, G⇔C, and G⇔T. In the context of double-stranded DNA with Watson-Crick paired nucleobases, transversions refer to the following base pair exchanges: T:A⇔A:T, T:A⇔G:C, C:G⇔G:C, C:G⇔A:T, A:T⇔T:A, A:T⇔C:G, G:C⇔C:G, and G:C⇔T:A. The compositions and methods disclosed herein are capable of inducing one or more transversions in a target DNA molecule. The compositions and methods disclosed herein are also capable of inducing both transitions and transversions, as well as other nucleotide changes, including deletions and insertions, in the same target DNA molecule.

処置
用語「処置」、「処置する」、および「処置すること」は、本明細書に記載のとおりの疾患もしくは障害、または1以上のその症状の発病を、食い止め、緩和し、遅延させるか、あるいはその進行を阻害することを目的とした臨床的介入を指す。本明細書に使用されるとき、用語「処置」、「処置する」、および「処置すること」は、本明細書に記載のとおりの疾患もしくは障害、または1以上のその症状の発病を、食い止め、緩和し、遅延させるか、あるいはその進行を阻害することを目的とした臨床的介入を指す。いくつかの態様において、処置は、1以上の症状が発症した後、および/または疾患と診断された後、施されてもよい。他の態様において、処置は、症状がない中、例として、症状の発病を予防もしくは遅延させるか、または疾患の発病もしくは進行を阻害するために、施されてもよい。例えば、処置は、症状の発現に先立ち(例として、症状の経歴に照らして、および/または遺伝因子もしくは他の感受性因子に照らして)、感受性のある個体へ施されてもよい。処置はまた、症状が消散した後も、例えば、それらの再発を予防または遅延するため、続けられてもよい。
Treatment The terms "treatment", "treat" and "treating" refer to a clinical intervention aimed at halting, alleviating, delaying the onset of, or inhibiting the progression of, a disease or disorder as described herein, or one or more symptoms thereof. As used herein, the terms "treatment", "treat" and "treating" refer to a clinical intervention aimed at halting, alleviating, delaying the onset of, or inhibiting the progression of, a disease or disorder as described herein, or one or more symptoms thereof. In some embodiments, treatment may be administered after one or more symptoms have developed and/or after a disease has been diagnosed. In other embodiments, treatment may be administered in the absence of symptoms, e.g., to prevent or delay the onset of symptoms or inhibit the onset or progression of a disease. For example, treatment may be administered to a susceptible individual prior to the onset of symptoms (e.g., in light of a history of symptoms and/or in light of genetic or other susceptibility factors). Treatment may also be continued after symptoms have resolved, e.g., to prevent or delay their recurrence.

トリヌクレオチド反復(repeat)障害
本明細書に使用されるとき、「トリヌクレオチド反復障害」(または代替的に、「拡大反復障害」もしくは「反復拡大障害」)は、ある種の突然変異(あるトリヌクレオチド反復が、ある遺伝子またはイントロンにある)である「トリヌクレオチド反復拡大」によって引き起こされる、一連の遺伝性障害を指す。トリヌクレオチド反復はかつて、ゲノム中のありふれた反復(iterations)であると考えられていたが、1990年代にこれらの障害に分類された。これらDNAの一見した「良性の」伸展(stretches)はときに、拡大して疾患を引き起こし得る。数種の決定的な特色が、トリヌクレオチド反復拡大によって引き起こされた障害に共通する。第1に、突然変異反復は、体細胞と生殖細胞系列との両方に不安定さを示し、より頻繁にはこれらは代々の遺伝(successive transmissions)で縮小するよりむしろ拡大する。第2に、低年齢の発病およびこれに続く世代における表現型の増大した重症度(予想)は一般に、より大きな反復の長さと相関する。最後に、疾患アレルの親の起源はしばしば、父系の遺伝がこれら障害の多くにとって拡大のより大きなリスクを抱えるという予想に影響を及ぼし得る。
Trinucleotide Repeat Disorders As used herein, "trinucleotide repeat disorders" (or alternatively, "expansion repeat disorders" or "repeat expansion disorders") refer to a set of inherited disorders caused by certain mutations (a trinucleotide repeat in a gene or intron) called "trinucleotide repeat expansions." Trinucleotide repeats were once thought to be common iterations in the genome, but were classified into these disorders in the 1990s. These seemingly "benign" stretches of DNA can sometimes expand and cause disease. Several defining features are common to disorders caused by trinucleotide repeat expansions. First, the mutated repeats show instability in both somatic and germline cells, and more frequently they expand rather than contract with successful transmissions. Second, an early age of onset and increased severity (prognosis) of the phenotype in subsequent generations generally correlate with larger repeat length. Finally, the parental origin of a disease allele can often affect the expectation that paternal inheritance poses a greater risk of spread for many of these disorders.

トリプレット拡大は、DNA複製最中のずれ(slippage)によって引き起こされるものと考えられる。これらの領域におけるDNA配列の反復性に起因して、「ループアウト」構造は、合成されている親鎖と娘鎖との間の相補的な塩基対合を維持しながら、DNA複製最中に形成されることもある。ループアウト構造が娘鎖上の配列から形成された場合、これは反復数の増大をもたらすであろう。しかしながら、ループアウト構造が親鎖上に形成された場合、反復数の減少が生じる。これらの反復の拡大は低減より一般的であるようである。一般に拡大がより大きくなればなるほど、これらは、より疾患を引き起こしやすくなるか、またはより疾患の重症度を増大しやすくなる。この特性は、トリヌクレオチド反復障害に見られる予想の特徴をもたらす。予想は、これら反復の拡大に起因する罹患した家族の代々の世代を通して、発病の年齢が低くなる傾向、および症状の重症度が増す傾向を説明する。 Triplet expansions are thought to be caused by slippage during DNA replication. Due to the repetitive nature of the DNA sequences in these regions, "loop-out" structures can also form during DNA replication, maintaining complementary base pairing between the parent and daughter strands being synthesized. If the loop-out structure is formed from a sequence on the daughter strand, this will result in an increase in the number of repeats. However, if the loop-out structure is formed on the parent strand, a decrease in the number of repeats occurs. These repeat expansions appear to be more common than reductions. In general, the larger the expansions, the more likely they are to cause disease or increase disease severity. This characteristic results in the predictive features seen in trinucleotide repeat disorders. Prediction explains the tendency for an earlier age of onset and an increased severity of symptoms through successive generations of affected families due to these repeat expansions.

ヌクレオチド反復障害は、トリプレット反復が非コード領域において生じる障害(すなわち、非コードトリヌクレオチド反復障害)またはコード領域において生じる障害を包含していてもよい。 Nucleotide repeat disorders may include disorders in which the triplet repeat occurs in a non-coding region (i.e., a non-coding trinucleotide repeat disorder) or in a coding region.

本明細書に記載のプライム編集因子(PE)系は、数ある中でも、脆弱X症候群(FRAXA)、脆弱性XE MR(FRAXE)、フリードライヒ運動失調症(FRDA)、筋強直症ジストロフィー(DM)、8型脊髄小脳失調症(SCA8)、および12型脊髄小脳失調症(SCA12)を包含していてもよい、ヌクレオチド反復障害を処置するのに使用されてもよい。 The Prime Editor (PE) system described herein may be used to treat nucleotide repeat disorders, which may include Fragile X Syndrome (FRAXA), Fragile XE MR (FRAXE), Friedreich's Ataxia (FRDA), Myotonic Dystrophy (DM), Spinocerebellar Ataxia Type 8 (SCA8), and Spinocerebellar Ataxia Type 12 (SCA12), among others.

上流
本明細書に使用されるとき、用語「上流」および「下流」は、5'→3'方向に配向された核酸分子(単鎖または二本鎖であるかに関わらず)中に位置付けられた少なくとも2つの要素の線状の位置を定義する相対的な用語である。とりわけ、第1要素が第2要素に対して5'のどこかに位置付けられている場合、第1要素は、核酸分子中、第2要素の上流にある。例えば、SNPがニック部位の5'側にある場合、SNPは、Cas9に誘導されたニック部位の上流にある。逆に言うと、第1要素が第2要素に対して3'のどこかに位置付けられている場合、第1要素は、核酸分子中、第2要素の下流にある。例えば、SNPがニック部位の3'側にある場合、SNPは、Cas9に誘導されたニック部位の下流にある。核酸分子は、DNA(二本鎖もしくは単鎖)、RNA(二本鎖もしくは単鎖)、またはDNAとRNAとのハイブリッドであり得る。二本鎖分子のどちらの鎖を考慮するのか選択する必要がある場合を除き、上流および下流という用語が核酸分子の単鎖にのみ言及するところ、分析は単鎖核酸分子および二本鎖分子について同じであるしばしば、少なくとも2つの要素の相対的な位置を決定するのに使用され得る二本鎖のDNAの鎖は、「センス」鎖または「コード」鎖である。遺伝学において、「センス」鎖は、5'から3'へ伸びる二本鎖DNA内セグメントであって、3'から5'へ伸びるDNAのアンチセンス鎖または鋳型鎖に相補的である。よって、例として、SNP核酸塩基がセンス鎖またはコード鎖上のプロモーターの3'側にある場合、SNP核酸塩基はゲノムDNA(二本鎖である)中のプロモーター配列の「下流」にある。
As used herein, the terms " upstream " and "downstream" are relative terms that define the linear location of at least two elements located in a nucleic acid molecule (whether single-stranded or double-stranded) oriented in a 5'→3' direction. In particular, if a first element is located anywhere 5' to the second element, the first element is upstream of the second element in the nucleic acid molecule. For example, if the SNP is located 5' to the nick site, the SNP is upstream of the nick site induced by Cas9. Conversely, if a first element is located anywhere 3' to the second element, the first element is downstream of the second element in the nucleic acid molecule. For example, if the SNP is located 3' to the nick site, the SNP is downstream of the nick site induced by Cas9. The nucleic acid molecule can be DNA (double-stranded or single-stranded), RNA (double-stranded or single-stranded), or a hybrid of DNA and RNA. Unless it is necessary to select which strand of a double-stranded molecule is considered, the terms upstream and downstream refer only to a single strand of a nucleic acid molecule, and the analysis is the same for single-stranded nucleic acid molecules and double-stranded molecules. Often, the strand of a double-stranded DNA that can be used to determine the relative positions of at least two elements is the "sense" strand or the "coding" strand. In genetics, a "sense" strand is a segment within a double-stranded DNA that extends from 5' to 3' and is complementary to the antisense or template strand of the DNA that extends from 3' to 5'. Thus, by way of example, if a SNP nucleobase is 3' to the promoter on the sense or coding strand, the SNP nucleobase is "downstream" of the promoter sequence in genomic DNA (which is double-stranded).

バリアント
本明細書に使用されるとき、用語「バリアント」は、天然に存在するものから逸脱したパターンを有する属性(qualities)を呈するものを意味するとして解釈されるはずであり、例として、バリアントCas9は、野生型Cas9アミノ酸配列と比較してアミノ酸残基中に1以上の変化を含むCas9である。用語「バリアント」は、参照配列と少なくとも75%、または少なくとも80%、または少なくとも85%、または少なくとも90%、または少なくとも95%、または少なくとも99%のパーセント同一性を有し、参照配列と同じかまたは実質的に同じ機能活性(単数もしくは複数)を有する、相同のタンパク質を包括する(encompasses)。用語はまた、参照配列の突然変異体、トランケーション体(truncations)、またはドメインであって、参照配列と同じかまたは実質的に同じ機能活性(単数もしくは複数)を呈示するものも包括する。
Variant As used herein, the term "variant" should be interpreted as meaning a property that exhibits a pattern of qualities that deviate from those that occur in nature, and for example, a variant Cas9 is a Cas9 that contains one or more changes in amino acid residues compared to the wild-type Cas9 amino acid sequence. The term "variant" encompasses homologous proteins that have at least 75%, or at least 80%, or at least 85%, or at least 90%, or at least 95%, or at least 99% percent identity with the reference sequence and have the same or substantially the same functional activity(ies) as the reference sequence. The term also encompasses mutants, truncations, or domains of the reference sequence that exhibit the same or substantially the same functional activity(ies) as the reference sequence.

ベクター
用語「ベクター」は、本明細書に使用されるとき、着目する遺伝子をコードするよう修飾され得る核酸であって、宿主細胞中へ入って宿主細胞内で突然変異または複製する(次いでベクターの複製形態を別の宿主細胞中へ移す)ことができる核酸を指す。例示の好適なベクターは、レトロウイルスベクターまたはバクテリオファージおよび繊維状ファージ、および接合性プラスミドなどの、ウイルスベクターを包含する。追加の好適なベクターは、本開示に基づき当業者に明らかであろう。
Vector The term "vector" as used herein refers to a nucleic acid that can be modified to encode a gene of interest and that can enter a host cell and mutate or replicate within the host cell (and then transfer the replicative form of the vector into another host cell). Exemplary suitable vectors include viral vectors, such as retroviral vectors or bacteriophages and filamentous phages, and conjugative plasmids. Additional suitable vectors will be apparent to one of skill in the art based on the present disclosure.

野生型
本明細書に使用されるとき、用語「野生型」は、当業者によって理解される専門用語であって、突然変異体もしくはバリアントの形態とは区別されるような、天然に存在するとおりの生物、株、遺伝子、または特徴の典型的な形態を意味する。
Wild-type As used herein, the term "wild-type" is a term of art understood by those of skill in the art and means the typical form of an organism, strain, gene, or characteristic as occurring in nature, as distinguished from mutant or variant forms.

5'内生DNAフラップ
本願において用いられる用語「内生5'DNAフラップ」は、標的DNA上のPEによって誘導されるニック部位の直ちに下流に所在するDNAの鎖を言う。PEによる標的DNA鎖のニッキングは、ニック部位の上流側の3'ヒドロキシル基およびニック部位の下流側の5'ヒドロキシル基を暴露する。3'ヒドロキシル基で終わる内生鎖は、プライム編集因子のDNAポリメラーゼをプライムするために用いられる(例えば、DNAポリメラーゼは逆転写酵素である)。ニック部位の下流側のかつ暴露された5'ヒドロキシル基で始まる内生鎖は、「5'内生DNAフラップ」と言われ、究極的には除去され、PEgRNAの伸長によってコードされる新たに合成された置き換え鎖(すなわち、「3'置き換えDNAフラップ」)によって置き換えられる。
5' Endogenous DNA Flap As used herein, the term "endogenous 5' DNA flap" refers to the strand of DNA immediately downstream of the PE-induced nick site on the target DNA. Nicking of the target DNA strand by PE exposes a 3' hydroxyl group upstream of the nick site and a 5' hydroxyl group downstream of the nick site. The endogenous strand terminating in the 3' hydroxyl group is used to prime the DNA polymerase of the prime editor (e.g., the DNA polymerase is a reverse transcriptase). The endogenous strand downstream of the nick site and beginning with the exposed 5' hydroxyl group is referred to as the "5' endogenous DNA flap" and is ultimately removed and replaced by the newly synthesized replacement strand (i.e., the "3' replacement DNA flap") encoded by the extension of the PE gRNA.

5'内生DNAフラップ除去
本明細書に使用されるとき、用語「5'内生DNAフラップ除去」または「5'フラップ除去」は、RTによって合成された単鎖DNAフラップが競合的に侵入して内生DNAとハイブリダイズしたときに形成される5'内生DNAフラップの除去を指し、そのプロセスにおいて内生鎖に取って代わる。取って代わられたこの内生鎖を除去することは、所望のヌクレオチド変化を含む所望の産物を形成する反応を推進し得る。細胞自身のDNA修復酵素は、5'内生フラップの除去または切除を触媒してもよい(例として、EXO1またはFEN1などの、フラップエンドヌクレアーゼ)。また、宿主細胞も、該5'内生フラップの除去を触媒する1以上の酵素を発現するよう形質転換されていてもよく、これによって産物を形成するプロセスが推進される(例として、フラップエンドヌクレアーゼ)。フラップエンドヌクレアーゼは当該技術分野において知られており、Patel et al.,"Flap endonucleases pass 5'-flaps through a flexible arch using a disorder-thread-order mechanism to confer specificity for free 5'-ends,"Nucleic Acids Research,2012,40(10):4507-4519およびTsutakawa et al.,"Human flap endonuclease structures,DNA double-base flipping,and a unified understanding of the FEN1 superfamily,"Cell,2011,145(2):198-211(これらの各々は参照により本明細書に組み込まれる)に記載のものから見出され得る。
5' endogenous DNA flap removal As used herein, the term "5' endogenous DNA flap removal" or "5' flap removal" refers to the removal of a 5' endogenous DNA flap formed when a single-stranded DNA flap synthesized by RT competitively invades and hybridizes with endogenous DNA, displacing the endogenous strand in the process. Removing this displaced endogenous strand can drive the reaction to form the desired product containing the desired nucleotide change. The cell's own DNA repair enzymes may catalyze the removal or excision of the 5' endogenous flap (e.g., flap endonucleases such as EXO1 or FEN1). The host cell may also be transformed to express one or more enzymes that catalyze the removal of the 5' endogenous flap, thereby driving the process to form the product (e.g., flap endonucleases). Flap endonucleases are known in the art and can be found in Patel et al., "Flap endonucleases pass 5'-flaps through a flexible arch using a disorder-thread-order mechanism to confer specificity for free 5'-ends," Nucleic Acids Research, 2012, 40(10):4507-4519 and Tsutakawa et al., "Human flap endonuclease structures, DNA double-base flipping, and a unified understanding of the FEN1 superfamily," Cell, 2011, 145(2):198-211, each of which is incorporated herein by reference.

3'置き換えDNAフラップ
本明細書に使用されるとき、用語「3'置き換えDNAフラップ」、または単に「置き換えDNAフラップ」は、プライム編集因子によって合成され、プライム編集因子PEgRNAの伸長アームによってコードされるDNAの鎖を指す。より具体的には、3'置き換えDNAフラップは、PEgRNAのポリメラーゼ鋳型によってコードされる。3'置き換えDNAフラップは、編集済配列(例として、単一ヌクレオチドの変化)も含有することを除くと、5'内生DNAフラップと同じ配列を含む。3'置き換えDNAフラップは標的DNAとアニールして、5'内生DNAフラップ(これは、例えば、FEN1もしくはEXO1などの5'フラップエンドヌクレアーゼによって、切除され得る)に取って代わるかまたはこれを置き換え、次いで、3'置き換えDNAフラップの3'末を、内生DNAの晒された(5'内生DNAフラップの切除後に晒される)5'ヒドロキシル末と結び合わせるようにライゲートされ、これによってホスホジエステル結合が再形成されて3'置き換えDNAフラップが組み入れられ、1編集済鎖と1未編集鎖とを含有するヘテロ二重鎖DNAが形成される。DNA修復プロセスはヘテロ二重鎖を分解し、編集済鎖の情報を相補鎖へコピーすることによってDNA中へ編集が永続的に組み入れられる。この分解プロセスは、完了まで(to completion)、未編集鎖へニックを入れることによって、すなわち、本明細書に記載のとおりの「第2鎖へのニック入れ」を経由して、さらに推進され得る。
3' Replacement DNA Flap As used herein, the term "3' replacement DNA flap", or simply "replacement DNA flap", refers to a strand of DNA synthesized by a prime editor and encoded by the extension arm of a prime editor PEgRNA. More specifically, the 3' replacement DNA flap is encoded by the polymerase template of the PEgRNA. The 3' replacement DNA flap contains the same sequence as the 5' endogenous DNA flap, except that it also contains an edited sequence (e.g., a single nucleotide change). The 3' replacement DNA flap anneals to the target DNA to replace or displace the 5' endogenous DNA flap (which can be excised, for example, by a 5' flap endonuclease such as FEN1 or EXO1), and then ligates the 3' end of the 3' replacement DNA flap to join the exposed 5' hydroxyl end of the endogenous DNA (exposed after excision of the 5' endogenous DNA flap), reforming a phosphodiester bond to incorporate the 3' replacement DNA flap and form a heteroduplex DNA containing one edited strand and one unedited strand. The DNA repair process degrades the heteroduplex and permanently incorporates the edit into the DNA by copying the information of the edited strand to the complementary strand. This degradation process can be further driven to completion by nicking the unedited strand, i.e., via "nicking the second strand" as described herein.

ある態様の詳細な記載
ゲノム編集のための、クラスター化して規則的な配置の短い回文配列反復(CRISPR)系の採用は、生命科学に革命をもたらした1~3。CRISPRを使用する遺伝子の断絶は今やルーチンとなっているが、単一ヌクレオチドの編集の正確な組み入れは、疾患が原因の多数の突然変異を研究または修正するのに必要であるにも関わらず、大きな課題のままである。相同組み換え修復(HDR)は、かかる編集を達成させることは可能ではあるが、低い効率(しばしば<5%)、ドナーDNA修復鋳型のための要件、および二本鎖DNA破壊(DSB)形成の有害効果に悩まされている。近年、David Liu教授らの実験室が塩基編集を開発したが、これによってDSBのない効率的な単一ヌクレオチドの編集が達成される。塩基編集因子(BE)は、CRISPR系を塩基修飾デアミナーゼ酵素と組み合わせて、標的C・GまたはA・T塩基対を夫々A・TまたはG・Cへ変換する4~6。既に幅広く研究者らによって世界的に使用されているが、現BEは12塩基対の起こり得る変換のうちたった4つしかできず、小さい挿入または欠失を修正することはできない。その上、塩基編集の標的範囲は、標的塩基に隣接する非標的CまたはA塩基の編集(「バイスタンダー(bystander)編集」)によって、およびPAM配列が標的塩基から15±2bpに存在するという要件によって限定されている。したがって、これらの欠点を克服することは、ゲノム編集の基礎研究および治療用途を大幅に広げるであろう。
DETAILED DESCRIPTION OF CERTAIN EMBODIMENTS The adoption of the clustered regularly interspaced short palindromic repeats (CRISPR) system for genome editing has revolutionized life sciences1-3 . Although gene disruption using CRISPR is now routine, precise incorporation of single nucleotide edits remains a major challenge, despite being necessary to study or correct a large number of disease-causing mutations. Homologous directed repair (HDR) can achieve such edits, but suffers from low efficiency (often <5%), the requirement for a donor DNA repair template, and the deleterious effects of double-stranded DNA break (DSB) formation. Recently, the laboratory of Professor David Liu and others developed base editing, which achieves efficient single nucleotide editing without DSBs. Base editors (BEs) combine the CRISPR system with base-modifying deaminase enzymes to convert targeted C·G or A·T base pairs to A·T or G·C , respectively4-6 . Although already widely used by researchers worldwide, current BE can only modify 4 of 12 possible base pair changes and cannot correct small insertions or deletions. Moreover, the target scope of base editing is limited by the editing of non-targeted C or A bases adjacent to the target base ("bystander editing") and by the requirement that the PAM sequence be present 15±2bp from the target base. Therefore, overcoming these shortcomings would greatly expand the basic research and therapeutic applications of genome editing.

本開示は、塩基編集の利益の多く-つまり、二本鎖破壊の回避およびドナーDNA修復鋳型-を、その大きな欠点を克服しつつ与える、新しい高精度編集アプローチを提案する。本明細書に記載の提案アプローチは、標的にプライムされた逆転写(TPRT)を使用する標的ゲノムの部位での編集済DNA鎖の直接的な組み入れを達成する。本明細書に考察されるデザインにおいて、CRISPRガイドRNA(gRNA)は、所望のヌクレオチド変化を含む単鎖DNAをコードする逆転写酵素(RT)鋳型配列を持つよう改変されるであろう。CRISPRヌクレアーゼ(Cas9)によってニックが入れられた標的部位DNAは、修飾gRNA上の鋳型配列の逆転写のためのプライマーとして働き、いずれの所望のヌクレオチド編集の直接的な組み込みを可能にするであろう。 This disclosure proposes a new high-precision editing approach that provides many of the benefits of base editing - namely, avoidance of double-strand breaks and donor DNA repair template - while overcoming its major drawbacks. The proposed approach described herein achieves direct incorporation of an edited DNA strand at a site in the target genome using target-primed reverse transcription (TPRT). In the designs discussed herein, a CRISPR guide RNA (gRNA) will be modified to carry a reverse transcriptase (RT) template sequence that encodes a single-stranded DNA containing the desired nucleotide change. The target site DNA nicked by the CRISPR nuclease (Cas9) will act as a primer for reverse transcription of the template sequence on the modified gRNA, allowing for direct incorporation of any desired nucleotide edits.

結果的に、本発明は、標的にプライムされた逆転写(TPRT)または「プライム編集」の機序が、効率および遺伝子の融通性(genetic flexibility)が高い高精度CRISPR/Casベースのゲノム編集を(例として、図1A~1Fの様々な態様において描かれているとおり)行うために活用または採用され得るという発見に、一部関する。本発明者らは本明細書中、特定のDNA配列を修飾ガイドRNA(「伸長されたガイドRNA」)で標的にし、標的部位にて単鎖ニックを生成し、および伸長されたgRNA中へ取り入れられた改変逆転写酵素鋳型のためのプライマーとして、ニック入りDNAを使用する、Cas9タンパク質-逆転写酵素融合体を使用することを提案している。新しく合成された鎖は、所望のヌクレオチド変化(例として、単一ヌクレオチドの変化、欠失、もしくは挿入、またはそれらの組み合わせ)を包含することを除けば、ゲノムの標的配列と相同であろう。新しく合成されたDNAの鎖はまた、単鎖DNAフラップと称されることもあるが、これはハイブリダイゼーションを相補的な相同の内生DNA鎖と競合し、これによって対応する内生鎖に取って代わる。ハイブリダイズされたこの中間体の分解は、その結果得られる内生DNAの、取って代わられたフラップの(例として、5'末DNAフラップエンドヌクレアーゼ、FEN1での)除去、合成された単鎖DNAフラップの標的DNAへのライゲーション、ならびに細胞のDNA修復および/または複製プロセスの結果としての所望のヌクレオチド変化の同化を包含し得る。鋳型化(templated)DNA合成が単一ヌクレオチドという高精度を付与することから、このアプローチの幅は極めて広く、基礎科学および治療法における無数の用途に使用され得ることが予見できる。 As a result, the present invention relates in part to the discovery that the mechanism of target-primed reverse transcription (TPRT) or "prime editing" can be exploited or employed to perform high-precision CRISPR/Cas-based genome editing with high efficiency and genetic flexibility (e.g., as depicted in various embodiments in Figures 1A-1F). The inventors herein propose to use a Cas9 protein-reverse transcriptase fusion to target a specific DNA sequence with a modified guide RNA (an "extended guide RNA"), generate a single-stranded nick at the target site, and use the nicked DNA as a primer for a modified reverse transcriptase template incorporated into the extended gRNA. The newly synthesized strand will be homologous to the genomic target sequence except that it contains the desired nucleotide change (e.g., a single nucleotide change, deletion, or insertion, or a combination thereof). The newly synthesized strand of DNA, sometimes referred to as a single-stranded DNA flap, competes for hybridization with the complementary homologous endogenous DNA strand, thereby displacing the corresponding endogenous strand. Degradation of this hybridized intermediate may involve the resulting removal of the displaced flap from the endogenous DNA (e.g., with 5'-end DNA flap endonuclease, FEN1), ligation of the synthesized single-stranded DNA flap to the target DNA, and assimilation of the desired nucleotide change as a result of the cellular DNA repair and/or replication processes. Because templated DNA synthesis confers high precision of single nucleotides, the breadth of this approach is extremely broad, and it is foreseeable that it could be used for myriad applications in basic science and therapy.

[1]napDNAbp
本明細書に記載のプライム編集因子およびトランスプライム編集因子は、核酸プログラム型DNA結合タンパク質(napDNAbp)を含み得る。
[1] napDNAbp
The prime and trans-prime editors described herein can include nucleic acid programmable DNA binding proteins (napDNAbp).

一側面において、napDNAbpは少なくとも1つのガイド核酸(例えば、ガイドRNAまたはPEgRNA)と会合または複合体化させられ得る。これが、ガイド核酸またはその部分(例えば、DNA標的のプロトスペーサーにアニールするガイドRNAのスペーサー)に対して相補的であるDNA鎖(すなわち標的鎖)を含むDNA配列に、napDNAbpを局在させる。換言すると、ガイド核酸は、DNA上のプロトスペーサーの相補配列に局在および結合するようにnapDNAbp(例えば、Cas9または等価物)を「プログラム」する。 In one aspect, the napDNAbp can be associated or complexed with at least one guide nucleic acid (e.g., guide RNA or PEgRNA). This localizes the napDNAbp to a DNA sequence that includes a DNA strand (i.e., a target strand) that is complementary to the guide nucleic acid or a portion thereof (e.g., the spacer of the guide RNA that anneals to the protospacer of the DNA target). In other words, the guide nucleic acid "programs" the napDNAbp (e.g., Cas9 or equivalent) to localize and bind to the complementary sequence of the protospacer on the DNA.

いずれかの好適なnapDNAbpが本明細書に記載のプライム編集因子に用いられ得る。種々の態様において、napDNAbpはいずれかのクラス2 CRISPR-Casシステムであり得、いずれかのII型、V型、またはVI型CRISPR-Cas酵素を包含する。ゲノム編集のためのツールとしてのCRISPR-Casの急速な発達から、Cas9およびCas9オーソログなどのCRISPR-Cas酵素を記載および/または同定するために用いられる命名体系の一定した発達があった。本願は、古いおよび/または新たであり得る命名体系によってCRISPR-Cas酵素を参照する。当業者は、それが古い(すなわち「レガシー」)または新たな命名体系であるかどうかにかかわらず、用いられる命名体系に基づいて、本願において参照されている特定のCRISPR-Cas酵素を同定する能力があるであろう。CRISPR-Cas命名体系はMakarova et al., "Classification and Nomenclature of CRISPR-Cas Systems: Where from Here?," The CRISPR Journal, Vol. 1. No. 5, 2018に鋭意に記載されている。これの内容全体は参照によって本願に組み込まれる。本願のいずれかの所与の場合に用いられる具体的なCRISPR-Cas命名体系は決して限定せず、当業者はどのCRISPR-Cas酵素が参照されているのかを同定する能力があるであろう。 Any suitable napDNAbp may be used in the prime editing elements described herein. In various embodiments, the napDNAbp may be any Class 2 CRISPR-Cas system, including any type II, type V, or type VI CRISPR-Cas enzyme. Since the rapid development of CRISPR-Cas as a tool for genome editing, there has been a constant development of nomenclature systems used to describe and/or identify CRISPR-Cas enzymes, such as Cas9 and Cas9 orthologues. This application refers to CRISPR-Cas enzymes by nomenclature systems, which may be old and/or new. Those skilled in the art will be able to identify the particular CRISPR-Cas enzymes referenced in this application based on the nomenclature system used, whether it is an old (i.e., "legacy") or new nomenclature system. The CRISPR-Cas nomenclature system is extensively described in Makarova et al., "Classification and Nomenclature of CRISPR-Cas Systems: Where from Here?," The CRISPR Journal, Vol. 1. No. 5, 2018. The entire contents of which are incorporated herein by reference. The specific CRISPR-Cas nomenclature system used in any given instance of this application is in no way limiting, and one of skill in the art would be able to identify which CRISPR-Cas enzyme is being referenced.

例えば、次のII型、V型、およびVI型クラス2 CRISPR-Cas酵素は、次の当該技術分野で認識される古い(すなわちレガシー)および新たな名称を有する。これらの酵素および/またはそれらのバリアントの夫々は、本明細書に記載のプライム編集因子に用いられ得る:

Figure 2020191243000010
For example, the following Type II, Type V, and Type VI Class 2 CRISPR-Cas enzymes have the following art-recognized old (i.e., legacy) and new names: Each of these enzymes and/or their variants may be used in the prime editors described herein:
Figure 2020191243000010

理論によって拘束されることなしに、本願において企図されるある種のnapDNAbpの作用機序は、Rループを形成するステップを包含する。これによって、napDNAbpは二本鎖DNA標的のほどけを誘導し、それによってnapDNAbpによって結合された領域の鎖を分離する。それから、ガイドRNAスペーサーがプロトスペーサー配列において「標的鎖」にハイブリダイズする。これは標的鎖に対して相補的である「非標的鎖」を押し除け、これはRループの一本鎖領域を形成する。いくつかの態様では、napDNAbpは1つ以上のヌクレアーゼ活性を包含し、これはそれからDNAをカットし、種々の型の傷跡を残す。例えば、napDNAbpは、第1の位置付けにおける非標的鎖をカットおよび/または第2の位置付けにおける標的鎖をカットするヌクレアーゼ活性を含み得る。ヌクレアーゼ活性に依存して、標的DNAは「二本鎖切断」を形成するようにカットされ得、これによって両方の鎖がカットされる。他の態様において、標的DNAは単一の部位でのみカットされ得る。すなわち、DNAは1つの鎖を「ニッキング」される。異なるヌクレアーゼ活性を有する例示のnapDNAbpは、「Cas9ニッカーゼ」(「nCas9」)およびヌクレアーゼ活性を有さない失活Cas9(「不活性型Cas9」または「dCas9」)を包含する。 Without being bound by theory, certain napDNAbp mechanisms of action contemplated herein include forming an R-loop, whereby the napDNAbp induces unwinding of the double-stranded DNA target, thereby separating the strands of the region bound by the napDNAbp. The guide RNA spacer then hybridizes to the "target strand" at the protospacer sequence. This displaces the "non-target strand," which is complementary to the target strand, forming the single-stranded region of the R-loop. In some embodiments, the napDNAbp includes one or more nuclease activities, which then cut the DNA, leaving various types of scars. For example, the napDNAbp can include a nuclease activity that cuts the non-target strand in a first position and/or cuts the target strand in a second position. Depending on the nuclease activity, the target DNA can be cut to form a "double-stranded break," whereby both strands are cut. In other embodiments, the target DNA can be cut only at a single site, i.e., the DNA is "nicked" one strand. Exemplary napDNAbps with different nuclease activities include "Cas9 nickase" ("nCas9") and inactivated Cas9 with no nuclease activity ("inactivated Cas9" or "dCas9").

本開示のプライム編集因子に関して用いられ得る種々のnapDNAbpの下の記載は、決して限定することを意味されない。プライム編集因子は、公知であるかまたは指向性進化もしくは別様の変異プロセスによって作られ得るかもしくは進化させられ得る標準的なSpCas9またはいずれかのオーソログCas9タンパク質またはいずれかのバリアントCas9タンパク質を含み得、Cas9のいずれかの天然に存在するバリアント、変異体、または別様に操作されたバージョンを包含する。種々の態様において、Cas9またはCas9バリアントはニッカーゼ活性を有し、すなわち標的DNA配列の1つの(of)鎖のみを切断する。他の態様において、Cas9またはCas9バリアントは不活性なヌクレアーゼを有し、すなわち「不活性型」Cas9タンパク質である。用いられ得る他のバリアントCas9タンパク質は、(例えば、より容易な送達のために)標準的なSpCas9よりも小さい分子量を有するかまたは改変もしくは再配置された一次アミノ酸構造(例えば循環置換体フォーマット)を有するものである。 The description below of various napDNAbps that may be used with respect to the prime editors of the present disclosure is not meant to be limiting in any way. Prime editors may include standard SpCas9 or any orthologous Cas9 protein or any variant Cas9 protein, which may be known or may be created or evolved by directed evolution or otherwise mutational processes, including any naturally occurring variant, mutant, or otherwise engineered version of Cas9. In various embodiments, the Cas9 or Cas9 variant has nickase activity, i.e., cleaves only one of the strands of the target DNA sequence. In other embodiments, the Cas9 or Cas9 variant has an inactive nuclease, i.e., is an "inactive" Cas9 protein. Other variant Cas9 proteins that may be used are those that have a smaller molecular weight than standard SpCas9 (e.g., for easier delivery) or have a modified or rearranged primary amino acid structure (e.g., a circular permutation format).

本明細書に記載のプライム編集因子はCas9等価物をもまた含み得、収斂進化の結果であるCas12a(Cpf1)およびCas12b1タンパク質を包含する。本願において用いられるnapDNAbp(例えば、SpCas9、Cas9バリアント、またはCas9等価物)は、それらのPAM特異性を変改/増強する種々の改変をもまた含有し得る。最後に、本願は、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも99.9%配列同一性を参照Cas9配列、例えば参照SpCas9標準的な配列または参照Cas9等価物(例えばCas12a(Cpf1))に対して有するいずれかのCas9、Cas9バリアント、またはCas9等価物を企図する。 The prime editors described herein may also include Cas9 equivalents, including Cas12a (Cpf1) and Cas12b1 proteins, which are the result of convergent evolution. The napDNAbps (e.g., SpCas9, Cas9 variants, or Cas9 equivalents) used herein may also contain various modifications that alter/enhance their PAM specificity. Finally, the present application contemplates any Cas9, Cas9 variant, or Cas9 equivalent having at least 70%, at least 75%, at least 80%, at least 85%, at least 90%, at least 91%, at least 92%, at least 93%, at least 94%, at least 95%, at least 96%, at least 97%, at least 98%, at least 99%, or at least 99.9% sequence identity to a reference Cas9 sequence, such as a reference SpCas9 standard sequence or a reference Cas9 equivalent (e.g., Cas12a (Cpf1)).

napDNAbpはCRISPR(クラスター化規則的間隔短回文反復)関連ヌクレアーゼであり得る。上で概説されているとおり、CRISPRは、可動遺伝因子(ウイルス、転移因子、および接合伝達性プラスミド)からの防護を提供する適応免疫系である。CRISPRクラスターは、スペーサー、祖先可動エレメントに対して相補的な配列、および標的侵入核酸を含有する。CRISPRクラスターはCRISPR RNA(crRNA)へと転写およびプロセシングされる。II型CRISPRシステムでは、プレcrRNAの正しいプロセシングは、トランスにコードされる低分子RNA(tracrRNA)、内生リボヌクレアーゼ3(rnc)、およびCas9タンパク質を要求する。tracrRNAは、プレcrRNAのリボヌクレアーゼ3によって支援されるプロセシングのためのガイドとしての用をなす。爾後に、Cas9/crRNA/tracrRNAは、スペーサーに対して相補的な直線状または環状dsDNA標的をエンド的に切断する。crRNAに対して相補的でない標的鎖は第1にエンド的にカットされ、それから3'-5'エキソ的にトリミングされる。天然では、DNA結合および切断は典型的にはタンパク質および両方のRNAを要求する。しかしながら、シングルガイドRNA(「sgRNA」または単純に「gRNA」)が、crRNAおよびtracrRNA両方の側面を単一のRNA種上に組み込むようにして操作され得る。例として、Jinek M. et al., Science 337:816-821(2012)を参照(この内容全体は参照により本明細書に組み込まれる)。 napDNAbp may be a CRISPR (clustered regularly interspaced short palindromic repeats)-associated nuclease. As outlined above, CRISPR is an adaptive immune system that provides protection from mobile genetic elements (viruses, transposable elements, and conjugative plasmids). CRISPR clusters contain a spacer, a sequence complementary to an ancestral mobile element, and a target invading nucleic acid. CRISPR clusters are transcribed and processed into CRISPR RNA (crRNA). In type II CRISPR systems, correct processing of the pre-crRNA requires a trans-encoded small RNA (tracrRNA), endogenous ribonuclease 3 (rnc), and Cas9 protein. The tracrRNA serves as a guide for ribonuclease 3-assisted processing of the pre-crRNA. Cas9/crRNA/tracrRNA then endolytically cleaves linear or circular dsDNA targets complementary to the spacer. The target strand that is not complementary to the crRNA is first endolytically cut and then 3'-5' exolytically trimmed. In nature, DNA binding and cleavage typically requires a protein and both RNAs. However, single guide RNAs ("sgRNAs" or simply "gRNAs") can be engineered to incorporate aspects of both crRNA and tracrRNA onto a single RNA species. See, for example, Jinek M. et al., Science 337:816-821 (2012), the entire contents of which are incorporated herein by reference.

いくつかの態様では、napDNAbpは、例えば標的配列上においておよび/または標的配列の相補体上において、標的配列の位置付けにおける1つまたは両方の鎖の切断を導く。いくつかの態様では、napDNAbpは、標的配列の最初のまたは最後のヌクレオチドから約1、2、3、4、5、6、7、8、9、10、15、20、25、50、100、200、500、またはより多くの塩基対以内において、1つまたは両方の鎖の切断を導く。いくつかの態様では、ベクターは、変異したnapDNAbpが標的配列を含有する標的ポリヌクレオチドの1つまたは両方の鎖を切断する能力を欠くようにして対応する野生型酵素に対して変異しているnapDNAbpをコードする。例えば、S.pyogenesからのCas9のRuvC I触媒ドメイン上のアスパラギン酸からアラニンの置換(D10A)は、両方の鎖を切断するヌクレアーゼからニッカーゼ(一本鎖を切断する)へとCas9を変換する。Cas9をニッカーゼにする変異の他の例は、限定なしに、標準的なSpCas9配列をまたは他のCas9バリアントもしくはCas9等価物の同等のアミノ酸位置を参照して、H840A、N854A、およびN863Aを包含する。 In some embodiments, the napDNAbp directs cleavage of one or both strands at the location of the target sequence, e.g., on the target sequence and/or on the complement of the target sequence. In some embodiments, the napDNAbp directs cleavage of one or both strands within about 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 15, 20, 25, 50, 100, 200, 500, or more base pairs from the first or last nucleotide of the target sequence. In some embodiments, the vector encodes a napDNAbp that is mutated relative to the corresponding wild-type enzyme such that the mutated napDNAbp lacks the ability to cleave one or both strands of a target polynucleotide containing the target sequence. For example, an aspartate to alanine substitution (D10A) on the RuvC I catalytic domain of Cas9 from S. pyogenes converts Cas9 from a nuclease that cleaves both strands to a nickase (that cleaves a single strand). Other examples of mutations that render Cas9 a nickase include, without limitation, H840A, N854A, and N863A, with reference to the equivalent amino acid positions in the standard SpCas9 sequence or other Cas9 variants or Cas9 equivalents.

本願において用いられる用語「Casタンパク質」は、天然から得られる全長Casタンパク質、天然に存在するCasタンパク質とは異なる配列を有する組み換えCasタンパク質、または本開示の方法に必要とされる全てもしくは有意な量の不可欠の基本機能、すなわち(i)標的DNAに対するCasタンパク質の核酸プログラム型結合の所有および(ii)1つの鎖上で標的DNA配列へニックを入れる能力をそれでもなお保持するCasタンパク質のいずれかのフラグメントを言う。本願において企図されるCasタンパク質は、CRISPR Cas9タンパク質、およびCas9等価物、バリアント(例えば、Cas9ニッカーゼ(nCas9)またはヌクレアーゼ不活性型Cas9(dCas9))ホモログ、オーソログ、またはパラログを、天然に存在するかまたは天然に存在しないか(例えば、操作されたかまたは組み換えか)にかかわらず包摂し、いずれかのクラス2 CRISPRシステム(例えばII、V、VI型)からのCas9等価物を包含し得、Cas12a(Cpf1)、Cas12e(CasX)、Cas12b1(C2c1)、Cas12b2、Cas12c(C2c3)、C2c4、C2c8、C2c5、C2c10、C2c9 Cas13a(C2c2)、Cas13d、Cas13c(C2c7)、Cas13b(C2c6)、およびCas13bを包含する。さらなるCas等価物はMakarova et al.,"C2c2 is a single-component programmable RNA-guided RNA-targeting CRISPR effector,"Science 2016;353(6299)およびMakarova et al.,"Classification and Nomenclature of CRISPR-Cas Systems:Where from Here?,"The CRISPR Journal,Vol.1.No.5,2018に記載されている。これらの内容は参照によって本願に組み込まれる。 The term "Cas protein" as used herein refers to a full-length Cas protein obtained from nature, a recombinant Cas protein having a sequence that differs from a naturally occurring Cas protein, or any fragment of a Cas protein that still retains all or a significant amount of the essential basic functions required for the methods of the disclosure, namely, (i) possession of nucleic acid-programmed binding of the Cas protein to target DNA and (ii) the ability to nick the target DNA sequence on one strand. The Cas proteins contemplated herein include CRISPR Cas9 proteins, and Cas9 equivalents, variants (e.g., Cas9 nickase (nCas9) or nuclease-inactive Cas9 (dCas9)), homologs, orthologs, or paralogs, whether naturally occurring or non-naturally occurring (e.g., engineered or recombinant), and can include Cas9 equivalents from any Class 2 CRISPR system (e.g., Types II, V, VI), including Cas12a (Cpf1), Cas12e (CasX), Cas12b1 (C2c1), Cas12b2, Cas12c (C2c3), C2c4, C2c8, C2c5, C2c10, C2c9 Cas13a (C2c2), Cas13d, Cas13c (C2c7), Cas13b (C2c6), and Cas13b. Further Cas equivalents are described in Makarova et al., "C2c2 is a single-component programmable RNA-guided RNA-targeting CRISPR effector," Science 2016;353(6299) and Makarova et al., "Classification and Nomenclature of CRISPR-Cas Systems: Where from Here?," The CRISPR Journal, Vol. 1. No. 5, 2018, the contents of which are incorporated herein by reference.

用語「Cas9」または「Cas9ヌクレアーゼ」または「Cas9部分」または「Cas9ドメイン」は、いずれかの生物からのいずれかの天然に存在するCas9、いずれかの天然に存在するCas9等価物またはその機能的フラグメント、いずれかの生物からのいずれかのCas9ホモログ、オーソログ、またはパラログ、および天然に存在するかまたは操作されたCas9のいずれかの変異体またはバリアントを包摂する。用語Cas9は特に限定することを意味されず、「Cas9または等価物」と言われ得る。例示のCas9タンパク質はさらに本願に記載および/または当該技術分野において記載されており、参照によって本願に組み込まれる。本開示は、本発明のプライム編集因子(PE)に使用される具体的なCas9について限定されない。 The term "Cas9" or "Cas9 nuclease" or "Cas9 portion" or "Cas9 domain" encompasses any naturally occurring Cas9 from any organism, any naturally occurring Cas9 equivalent or functional fragment thereof, any Cas9 homolog, ortholog, or paralog from any organism, and any mutant or variant of naturally occurring or engineered Cas9. The term Cas9 is not meant to be particularly limiting and may be referred to as "Cas9 or equivalent." Exemplary Cas9 proteins are further described herein and/or in the art and are incorporated herein by reference. This disclosure is not limited with respect to the specific Cas9 used in the prime editor (PE) of the present invention.

本願に記されるCas9ヌクレアーゼ配列および構造は当業者には周知である(例として、"Complete genome sequence of an M1 strain of Streptococcus pyogenes."Ferretti et al.,J.J.,McShan W.M.,Ajdic D.J.,Savic D.J.,Savic G.,Lyon K.,Primeaux C.,Sezate S.,Suvorov A.N.,Kenton S.,Lai H.S.,Lin S.P.,Qian Y.,Jia H.G.,Najar F.Z.,Ren Q.,Zhu H.,Song L.,White J.,Yuan X.,Clifton S.W.,Roe B.A.,McLaughlin R.E.,Proc.Natl.Acad.Sci.U.S.A.98:4658-4663(2001);"CRISPR RNA maturation by trans-encoded small RNA and host factor RNase III."Deltcheva E.,Chylinski K.,Sharma C.M.,Gonzales K.,Chao Y.,Pirzada Z.A.,Eckert M.R.,Vogel J.,Charpentier E.,Nature 471:602-607(2011);および"A programmable dual-RNA-guided DNA endonuclease in adaptive bacterial immunity."Jinek M.,Chylinski K.,Fonfara I.,Hauer M.,Doudna J.A.,Charpentier E.Science 337:816-821(2012)(これら各々の内容全体は参照により本明細書に組み込まれる)を参照)。 The Cas9 nuclease sequence and structure described in this application are well known to those skilled in the art (see, for example, "Complete genome sequence of an M1 strain of Streptococcus pyogenes" Ferretti et al., J.J., McShan W.M., Ajdic D.J., Savic D.J., Savic G., Lyon K., Primeaux C., Sezate S., Suvorov A.N., Kenton S., Lai H.S., Lin S.P., Qian Y., Jia H.G., Najar F.Z., Ren Q., Zhu H., Song L., White J., Yuan X., Clifton S.W., Roe B.A., McLaughlin R.E., Proc. Natl. Acad. Sci. U.S.A. 98:4658-4663 (2001); "CRISPR RNA maturation by trans-encoded small RNA and host factor RNase III." Deltcheva E., Chylinski K., Sharma C.M., Gonzales K., Chao Y., Pirzada Z.A., Eckert M.R., Vogel J., Charpentier E., Nature 471:602-607(2011); and "A programmable dual-RNA-guided DNA endonuclease in adaptive bacterial immunity." Jinek M., Chylinski K., Fonfara I., Hauer M., Doudna J.A., Charpentier E. Science 337:816-821(2012) (the entire contents of each of which are incorporated herein by reference).

Cas9およびCas9等価物の例が次のとおり提供される;しかしながら、これらの特定の例は限定することを意味されない。本開示のプライマー編集因子は、いずれかの好適なCas9またはCas9等価物を包含するいずれかの好適なnapDNAbpを用い得る。 Examples of Cas9 and Cas9 equivalents are provided below; however, these specific examples are not meant to be limiting. Primer editors of the present disclosure may use any suitable napDNAbp, including any suitable Cas9 or Cas9 equivalent.

A.標準的な野生型SpCas9
1つの態様では、本明細書に記載のプライマー編集因子構築物は、S.pyogenesからの「標準的なSpCas9」ヌクレアーゼを含み得る。これはゲノム工学のツールとして広く用いられており、クラス2 CRISPR-Casシステムの酵素のII型サブグループとして類別される。このCas9タンパク質は、2つの別物のヌクレアーゼドメインを含有する大きいマルチドメインタンパク質である。1つのまたは両方のヌクレアーゼ活性を廃止するための点変異がCas9上に導入され得、夫々ニッカーゼCas9(nCas9)または不活性型Cas9(dCas9)をもたらす。これは、sgRNAによってプログラムされる様式でDNAに結合するその能力をなお保持する。原理的には、別のタンパク質またはドメインに融合されるときに、Cas9またはそのバリアント(例えばnCas9)は、単純に適当なsgRNAとの共発現によって、そのタンパク質を実質的にいずれかのDNA配列へと標的化し得る。本願において用いられる標準的なSpCas9タンパク質は、次のアミノ酸配列を有するStreptococcus pyogenesからの野生型タンパク質を言う:

Figure 2020191243000011

Figure 2020191243000012

Figure 2020191243000013
A. Standard wild-type SpCas9
In one embodiment, the primer editor constructs described herein may include the "standard SpCas9" nuclease from S. pyogenes. It is widely used as a tool in genome engineering and is classified as a type II subgroup of enzymes in class 2 CRISPR-Cas systems. The Cas9 protein is a large multi-domain protein that contains two separate nuclease domains. Point mutations to abolish one or both nuclease activities can be introduced onto Cas9, resulting in a nickase Cas9 (nCas9) or an inactive Cas9 (dCas9), respectively. This still retains its ability to bind DNA in a manner programmed by sgRNA. In principle, when fused to another protein or domain, Cas9 or a variant thereof (e.g., nCas9) can target the protein to virtually any DNA sequence simply by co-expression with an appropriate sgRNA. Standard SpCas9 protein as used herein refers to the wild-type protein from Streptococcus pyogenes, which has the following amino acid sequence:
Figure 2020191243000011

Figure 2020191243000012

Figure 2020191243000013

本明細書に記載のプライム編集因子は、標準的なSpCas9、または上で提供されている野生型Cas9配列との少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、または少なくとも99%配列同一性を有するそのいずれかのバリアントを包含し得る。これらのバリアントは、1つ以上の変異を含有するSpCas9バリアントを包含し得、SwissProtアクセッションNo.Q99ZW2(配列番号18)エントリーで報告されているいずれかの公知の変異を包含する。これらは:

Figure 2020191243000014

を包含する。 The prime editors described herein may include standard SpCas9 or any variant thereof having at least 80%, at least 85%, at least 90%, at least 95%, or at least 99% sequence identity with the wild-type Cas9 sequence provided above. These variants may include SpCas9 variants containing one or more mutations, including any of the known mutations reported in SwissProt Accession No. Q99ZW2 (SEQ ID NO: 18) entry. These include:
Figure 2020191243000014

Includes:

本開示に用いられ得る他の野生型SpCas9配列は:

Figure 2020191243000015

Figure 2020191243000016

Figure 2020191243000017

Figure 2020191243000018

Figure 2020191243000019

Figure 2020191243000020

Figure 2020191243000021

Figure 2020191243000022

を包含する。 Other wild-type SpCas9 sequences that can be used in the present disclosure include:
Figure 2020191243000015

Figure 2020191243000016

Figure 2020191243000017

Figure 2020191243000018

Figure 2020191243000019

Figure 2020191243000020

Figure 2020191243000021

Figure 2020191243000022

Includes:

本明細書に記載のプライム編集因子は、上のSpCas9配列のいずれか、または少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、または少なくとも99%配列同一性をそれに対して有するそのいずれかのバリアントを包含し得る。 The prime editors described herein can include any of the above SpCas9 sequences, or any variants thereof having at least 80%, at least 85%, at least 90%, at least 95%, or at least 99% sequence identity thereto.

B.野生型Cas9オーソログ
他の態様において、Cas9タンパク質は、S.pyogenesからの標準的なCas9とは異なる別の細菌種からの野生型Cas9オーソログであり得る。例えば、次のCas9オーソログが本明細書に記載されるプライム編集因子構築物に関して用いられ得る。加えて、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、または少なくとも99%配列同一性を下のオーソログのいずれかに対して有するいずれかのバリアントCas9オーソログもまた本プライム編集因子に用いられ得る。

Figure 2020191243000023

Figure 2020191243000024

Figure 2020191243000025

Figure 2020191243000026

Figure 2020191243000027

Figure 2020191243000028

Figure 2020191243000029
B. Wild-type Cas9 orthologues In other embodiments, the Cas9 protein can be a wild-type Cas9 orthologue from another bacterial species that is different from the standard Cas9 from S. pyogenes. For example, the following Cas9 orthologues can be used in conjunction with the prime editor constructs described herein. In addition, any variant Cas9 orthologue having at least 80%, at least 85%, at least 90%, at least 95%, or at least 99% sequence identity to any of the orthologues below can also be used in the present prime editors.
Figure 2020191243000023

Figure 2020191243000024

Figure 2020191243000025

Figure 2020191243000026

Figure 2020191243000027

Figure 2020191243000028

Figure 2020191243000029

本明細書に記載のプライム編集因子は、上のCas9オーソログ配列のいずれか、または少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、または少なくとも99%配列同一性をそれに対して有するそのいずれかのバリアントを包含し得る。 The prime editors described herein may include any of the above Cas9 orthologous sequences, or any variants thereof having at least 80%, at least 85%, at least 90%, at least 95%, or at least 99% sequence identity thereto.

napDNAbpは、Cas9などの天然に存在する酵素の(or)いずれかの好適なホモログおよび/またはオーソログを包含し得る。Cas9ホモログおよび/またはオーソログはS.pyogenesおよびS.thermophilusを包含するがこれらに限定されない種々の種において記載されている。好ましくは、Cas部分はニッカーゼとして構成される(例えば、変異導入されるか、組み換え操作されるか、または別様に天然から得られる)。すなわち、標的の一本鎖のみを切断することができる。追加の(doubpdditional)好適なCas9ヌクレアーゼおよび配列は本開示に基づいて当業者には明らかであろう。かかるCas9ヌクレアーゼおよび配列は、Chylinski,Rhun,and Charpentier,"The tracrRNA and Cas9 families of type II CRISPR-Cas immunity systems"(2013)RNA Biology 10:5,726-737に開示されている生物および座位からのCas9配列を包含する;これの内容全体は参照によって本願に組み込まれる。いくつかの態様では、Cas9ヌクレアーゼは不活性な(例えば不活性化された)DNA切断ドメインを有する。つまり、Cas9はニッカーゼである。いくつかの態様では、Cas9タンパク質は、表3のバリアントのいずれか1つによって提供されるCas9タンパク質のアミノ酸配列と少なくとも80%同一であるアミノ酸配列を含む。いくつかの態様では、Cas9タンパク質は、上の表のCas9オーソログのいずれか1つによって提供されるCas9タンパク質のアミノ酸配列と少なくとも85%、少なくとも90%、少なくとも92%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも99.5%同一であるアミノ酸配列を含む。 napDNAbp may include any suitable homologs and/or orthologs of naturally occurring enzymes such as Cas9. Cas9 homologs and/or orthologs have been described in various species, including but not limited to S. pyogenes and S. thermophilus. Preferably, the Cas moiety is configured (e.g., mutated, engineered, or otherwise derived from nature) as a nickase, i.e., capable of cleaving only one strand of the target. Additional suitable Cas9 nucleases and sequences will be apparent to those of skill in the art based on this disclosure. Such Cas9 nucleases and sequences include Cas9 sequences from organisms and loci disclosed in Chylinski, Rhun, and Charpentier, "The tracrRNA and Cas9 families of type II CRISPR-Cas immunity systems" (2013) RNA Biology 10:5,726-737; the entire contents of which are incorporated herein by reference. In some embodiments, the Cas9 nuclease has an inactive (e.g., inactivated) DNA cleavage domain. That is, Cas9 is a nickase. In some embodiments, the Cas9 protein comprises an amino acid sequence that is at least 80% identical to the amino acid sequence of a Cas9 protein provided by any one of the variants in Table 3. In some embodiments, the Cas9 protein comprises an amino acid sequence that is at least 85%, at least 90%, at least 92%, at least 95%, at least 96%, at least 97%, at least 98%, at least 99%, or at least 99.5% identical to the amino acid sequence of a Cas9 protein provided by any one of the Cas9 orthologues in the table above.

C.不活性型Cas9バリアント
ある態様において、本明細書に記載のプライム編集因子は、不活性型Cas9、例えば不活性型SpCas9を包含し得る。これは、Cas9の両方のヌクレアーゼドメイン、つまりRuvCドメイン(これは、非プロトスペーサーDNA鎖を切断する)およびHNHドメイン(これはプロトスペーサーDNA鎖を切断する)を不活性化する1つ以上の変異を原因として、ヌクレアーゼ活性を有さない。ヌクレアーゼ不活性化は、コードされるタンパク質、または少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、もしくは少なくとも99%配列同一性をそれに対して有するそのいずれかのバリアントのアミノ酸配列に1つ以上の置換および/または欠失をもたらす1つ以上の変異を原因とし得る。
C. Inactive Cas9 variants
In some embodiments, the prime editor described herein may include an inactive Cas9, such as an inactive SpCas9, which does not have nuclease activity due to one or more mutations that inactivate both nuclease domains of Cas9, namely the RuvC domain (which cleaves the non-protospacer DNA strand) and the HNH domain (which cleaves the protospacer DNA strand). The nuclease inactivation may be due to one or more mutations that result in one or more substitutions and/or deletions in the amino acid sequence of the encoded protein or any variant thereof that has at least 80%, at least 85%, at least 90%, at least 95%, or at least 99% sequence identity thereto.

本願において用いられる用語「dCas9」は、ヌクレアーゼ不活性(inactive)Cas9もしくはヌクレアーゼ不活性型(dead)Cas9またはその機能的フラグメントを言い、いずれかの生物からのいずれかの天然に存在するdCas9、いずれかの天然に存在するdCas9等価物またはその機能的フラグメント、いずれかの生物からのいずれかのdCas9ホモログ、オーソログ、またはパラログ、および天然に存在するかまたは操作されたdCas9のいずれかの変異体またはバリアントを包摂する。用語dCas9は特に限定することを意味されず、「dCas9または等価物」と言われ得る。例示のdCas9タンパク質とdCas9タンパク質を作るための方法とは、さらに本願に記載および/または当該技術分野において記載されており、参照によって本願に組み込まれる。 The term "dCas9" as used herein refers to nuclease inactive or dead Cas9 or a functional fragment thereof, and includes any naturally occurring dCas9 from any organism, any naturally occurring dCas9 equivalent or a functional fragment thereof, any dCas9 homolog, ortholog, or paralog from any organism, and any mutant or variant of naturally occurring or engineered dCas9. The term dCas9 is not meant to be particularly limiting and may be referred to as "dCas9 or equivalent." Exemplary dCas9 proteins and methods for making dCas9 proteins are further described herein and/or in the art and are incorporated herein by reference.

他の態様において、dCas9は、部分的にまたは丸ごとで、Cas9ヌクレアーゼ活性を不活性化する1つ以上の変異を有するCas9アミノ酸配列に対応するかまたはそれを含む。他の態様において、D10AおよびH840A以外の変異を有するCas9バリアントが提供され、これらは内生Cas9ヌクレアーゼ活性の完全なまたは部分的な不活性化物をもたらし得る(例えば、夫々nCas9またはdCas9)。かかる変異は、例として、D10およびH820における他のアミノ酸置換、またはCas9のヌクレアーゼドメイン上の他の置換(例えば、HNHヌクレアーゼサブドメインおよび/またはRuvC1サブドメイン上の置換)を、Streptococcus pyogenesからのCas9(NCBI参照配列:NC_017053.1)などの野生型配列を参照して包含する。いくつかの態様では、Cas9のバリアントまたはホモログ(例えば、Streptococcus pyogenesからのCas9(NCBI参照配列:NC_017053.1(配列番号20))のバリアント)が提供され、これらは、NCBI参照配列:NC_017053.1と少なくとも約70%同一、少なくとも約80%同一、少なくとも約90%同一、少なくとも約95%同一、少なくとも約98%同一、少なくとも約99%同一、少なくとも約99.5%同一、または少なくとも約99.9%同一である。いくつかの態様では、dCas9のバリアント(例えば、NCBI参照配列:NC_017053.1(配列番号20)のバリアント)が提供され、NC_017053.1(配列番号20)よりも約5アミノ酸、約10アミノ酸、約15アミノ酸、約20アミノ酸、約25アミノ酸、約30アミノ酸、約40アミノ酸、約50アミノ酸、約75アミノ酸、約100アミノ酸、またはより多くだけ短いかまたは長いアミノ酸配列を有する。 In other embodiments, dCas9 corresponds to or includes a Cas9 amino acid sequence having one or more mutations that partially or completely inactivate Cas9 nuclease activity. In other embodiments, Cas9 variants having mutations other than D10A and H840A are provided that may result in complete or partial inactivation of endogenous Cas9 nuclease activity (e.g., nCas9 or dCas9, respectively). Such mutations include, by way of example, other amino acid substitutions at D10 and H820, or other substitutions on the nuclease domains of Cas9 (e.g., substitutions on the HNH nuclease subdomain and/or RuvC1 subdomain), with reference to a wild-type sequence such as Cas9 from Streptococcus pyogenes (NCBI Reference Sequence: NC_017053.1). In some embodiments, variants or homologs of Cas9 (e.g., variants of Cas9 from Streptococcus pyogenes (NCBI Reference Sequence: NC_017053.1 (SEQ ID NO: 20)) are provided that are at least about 70% identical, at least about 80% identical, at least about 90% identical, at least about 95% identical, at least about 98% identical, at least about 99% identical, at least about 99.5% identical, or at least about 99.9% identical to NCBI Reference Sequence: NC_017053.1. In some embodiments, variants of dCas9 (e.g., variants of NCBI reference sequence: NC_017053.1 (SEQ ID NO:20)) are provided that have an amino acid sequence that is shorter or longer than NC_017053.1 (SEQ ID NO:20) by about 5 amino acids, about 10 amino acids, about 15 amino acids, about 20 amino acids, about 25 amino acids, about 30 amino acids, about 40 amino acids, about 50 amino acids, about 75 amino acids, about 100 amino acids, or more.

1つの態様では、不活性型Cas9はQ99ZW2の標準的なSpCas9配列に基づき得、D10XおよびH810X置換(下線付きかつ太字)を含む次の配列を有し得、Xはいずれかのアミノ酸であり得、またはバリアントは少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、もしくは少なくとも99%配列同一性をそれに対して有する配列番号40のバリアントであり得る。 In one embodiment, the inactive Cas9 can be based on the standard SpCas9 sequence of Q99ZW2 and can have the following sequence, including D10X and H810X substitutions (underlined and bold), where X can be any amino acid, or the variant can be a variant of SEQ ID NO:40 having at least 80%, at least 85%, at least 90%, at least 95%, or at least 99% sequence identity thereto.

1つの態様では、不活性型Cas9はQ99ZW2の標準的なSpCas9配列に基づき得、D10AおよびH810A置換(下線付きかつ太字)を含む次の配列を有し得、または少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、もしくは少なくとも99%配列同一性をそれに対して有する配列番号41のバリアントであり得る。

Figure 2020191243000030

Figure 2020191243000031
In one embodiment, the inactive Cas9 can be based on the standard SpCas9 sequence of Q99ZW2 and can have the following sequence including the D10A and H810A substitutions (underlined and bolded), or can be a variant of SEQ ID NO: 41 having at least 80%, at least 85%, at least 90%, at least 95%, or at least 99% sequence identity thereto.
Figure 2020191243000030

Figure 2020191243000031

D.Cas9ニッカーゼバリアント
1つの態様において、本明細書に記載のプライム編集因子はCas9ニッカーゼを含む。用語「Cas9ニッカーゼ」または「nCas9」は、二本鎖DNA分子標的上に一本鎖切断を導入することができるCas9のバリアントを言う。いくつかの態様では、Cas9ニッカーゼは単一の機能するヌクレアーゼドメインのみを含む。野生型Cas9(例えば標準的なSpCas9)は、2つの別個のヌクレアーゼドメイン、つまりRuvCドメイン(これは非プロトスペーサーDNA鎖を切断する)およびHNHドメイン(これはプロトスペーサーDNA鎖を切断する)を含む。1つの態様では、Cas9ニッカーゼはRuvCヌクレアーゼ活性を不活性化するRuvCドメインの変異を含む。例えば、アスパラギン酸(D)10、ヒスチジン(H)983、アスパラギン酸(D)986、またはグルタミン酸(E)762の変異は、RuvCヌクレアーゼドメインの機能喪失変異および機能的なCas9ニッカーゼの生出として報告されている(例えば、Nishimasu et al., "Crystal structure of Cas9 in complex with guide RNA and target DNA,"Cell 156(5),935-949。これは参照によって本願に組み込まれる)。それゆえに、RuvCドメインのニッカーゼ変異はD10X、H983X、D986X、またはE762Xを包含し得、Xは野生型アミノ酸以外のいずれかのアミノ酸である。ある態様において、ニッカーゼはD10A、もしくは(of)H983A、もしくはD986A、もしくはE762A、またはそれらの組み合わせであり得る。
D. Cas9 nickase variants
In one embodiment, the prime editor described herein comprises Cas9 nickase. The term "Cas9 nickase" or "nCas9" refers to a variant of Cas9 that can introduce single-stranded breaks on double-stranded DNA molecular targets. In some embodiments, Cas9 nickase comprises only a single functional nuclease domain. Wild-type Cas9 (e.g., standard SpCas9) comprises two separate nuclease domains, the RuvC domain (which cleaves non-protospacer DNA strands) and the HNH domain (which cleaves protospacer DNA strands). In one embodiment, Cas9 nickase comprises a mutation in the RuvC domain that inactivates RuvC nuclease activity. For example, mutations of aspartic acid (D)10, histidine (H)983, aspartic acid (D)986, or glutamic acid (E)762 have been reported as loss-of-function mutations in the RuvC nuclease domain and generate functional Cas9 nickases (see, e.g., Nishimasu et al., "Crystal structure of Cas9 in complex with guide RNA and target DNA," Cell 156(5), 935-949, which is incorporated herein by reference). Thus, nickase mutations in the RuvC domain can include D10X, H983X, D986X, or E762X, where X is any amino acid other than the wild-type amino acid. In some embodiments, the nickase can be D10A, or of H983A, or D986A, or E762A, or a combination thereof.

種々の態様において、Cas9ニッカーゼはRuvCヌクレアーゼドメインに変異を有し得(can having)、次のアミノ酸配列の1つ、または少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、もしくは少なくとも99%配列同一性をそれに対して有するアミノ酸配列を有するそのバリアントを有し得る。

Figure 2020191243000032

Figure 2020191243000033

Figure 2020191243000034

Figure 2020191243000035

Figure 2020191243000036

Figure 2020191243000037
In various embodiments, the Cas9 nickase can having a mutation in the RuvC nuclease domain and can have one of the following amino acid sequences, or a variant thereof having an amino acid sequence having at least 80%, at least 85%, at least 90%, at least 95%, or at least 99% sequence identity thereto.
Figure 2020191243000032

Figure 2020191243000033

Figure 2020191243000034

Figure 2020191243000035

Figure 2020191243000036

Figure 2020191243000037

別の態様では、Cas9ニッカーゼはHNHヌクレアーゼ活性を不活性化するHNHドメインの変異を含む。例えば、ヒスチジン(H)840またはアスパラギン(R)863の変異は、HNHヌクレアーゼドメインの機能喪失変異および機能的なCas9ニッカーゼの生出として報告されている(例えば、Nishimasu et al.,"Crystal structure of Cas9 in complex with guide RNA and target DNA,"Cell 156(5),935-949。これは参照によって本願に組み込まれる)。それゆえに、HNHドメインのニッカーゼ変異はH840XおよびR863Xを包含し得、Xは野生型アミノ酸以外のいずれかのアミノ酸である。ある態様において、ニッカーゼはH840AもしくはR863Aまたはそれらの組み合わせであり得る。 In another embodiment, the Cas9 nickase comprises a mutation in the HNH domain that inactivates HNH nuclease activity. For example, mutation of histidine (H)840 or asparagine (R)863 has been reported as a loss-of-function mutation in the HNH nuclease domain and produces a functional Cas9 nickase (see, e.g., Nishimasu et al., "Crystal structure of Cas9 in complex with guide RNA and target DNA," Cell 156(5), 935-949, which is incorporated herein by reference). Thus, the nickase mutation in the HNH domain can include H840X and R863X, where X is any amino acid other than the wild-type amino acid. In one embodiment, the nickase can be H840A or R863A, or a combination thereof.

種々の態様において、Cas9ニッカーゼはHNHヌクレアーゼドメインの変異を有し得、次のアミノ酸配列の1つ、または少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、または少なくとも99%配列同一性をそれに対して有するアミノ酸配列を有するそのバリアントを有し得る。

Figure 2020191243000038

Figure 2020191243000039

Figure 2020191243000040
In various embodiments, the Cas9 nickase may have a mutation in the HNH nuclease domain and may have one of the following amino acid sequences, or a variant thereof having an amino acid sequence having at least 80%, at least 85%, at least 90%, at least 95%, or at least 99% sequence identity thereto.
Figure 2020191243000038

Figure 2020191243000039

Figure 2020191243000040

いくつかの態様では、N末端メチオニンが、Cas9ニッカーゼから、または本願において開示もしくは企図されるいずれかのCas9バリアント、オーソログ、もしくは等価物から除去される。例えば、メチオニンマイナスCas9ニッカーゼは、次の配列、または少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、もしくは少なくとも99%配列同一性をそれらに対して有するアミノ酸配列を有するそれらのバリアントを包含する。

Figure 2020191243000041

Figure 2020191243000042

Figure 2020191243000043
In some embodiments, the N-terminal methionine is removed from the Cas9 nickase or from any Cas9 variant, orthologue, or equivalent disclosed or contemplated herein. For example, methionine-minus Cas9 nickases include the following sequences, or variants thereof having amino acid sequences having at least 80%, at least 85%, at least 90%, at least 95%, or at least 99% sequence identity thereto:
Figure 2020191243000041

Figure 2020191243000042

Figure 2020191243000043

E.他のCas9バリアント
不活性型Cas9およびCas9ニッカーゼバリアントの他に、本願において用いられるCas9タンパク質は、本明細書に開示のかまたは当該技術分野において公知のいずれかの野生型Cas9または変異体Cas9(例えば、不活性型Cas9またはCas9ニッカーゼ)、またはフラグメントCas9、または循環置換体Cas9、またはCas9の他のバリアントを包含するいずれかの参照Cas9タンパク質と少なくとも約70%同一、少なくとも約80%同一、少なくとも約90%同一、少なくとも約95%同一、少なくとも約96%同一、少なくとも約97%同一、少なくとも約98%同一、少なくとも約99%同一、少なくとも約99.5%同一、または少なくとも約99.9%同一である他の「Cas9バリアント」をもまた包含し得る。いくつかの態様では、Cas9バリアントは、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、21、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、またはより多くのアミノ酸変化を、参照Cas9と比較して有し得る。いくつかの態様では、Cas9バリアントは参照Cas9のフラグメント(例えば、gRNA結合ドメインまたはDNA切断ドメイン)を含み、その結果、フラグメントは、野生型Cas9の対応するフラグメントと少なくとも約70%同一、少なくとも約80%同一、少なくとも約90%同一、少なくとも約95%同一、少なくとも約96%同一、少なくとも約97%同一、少なくとも約98%同一、少なくとも約99%同一、少なくとも約99.5%同一、または少なくとも約99.9%同一である。いくつかの態様では、フラグメントは(is is)、対応する野生型Cas9(例えば配列番号18)のアミノ酸長さの少なくとも30%、少なくとも35%、少なくとも40%、少なくとも45%、少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%同一、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも99.5%である。
E. Other Cas9 variants
In addition to inactive Cas9 and Cas9 nickase variants, the Cas9 proteins used herein can also include other "Cas9 variants" that are at least about 70% identical, at least about 80% identical, at least about 90% identical, at least about 95% identical, at least about 96% identical, at least about 97% identical, at least about 98% identical, at least about 99% identical, at least about 99.5% identical, or at least about 99.9% identical to any reference Cas9 protein, including any wild-type or mutant Cas9 (e.g., inactive Cas9 or Cas9 nickase) disclosed herein or known in the art, or a fragment Cas9, or a circularly permuted Cas9, or other variant of Cas9. In some embodiments, a Cas9 variant may have 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 21, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, or more amino acid changes compared to a reference Cas9. In some embodiments, the Cas9 variant comprises a fragment of a reference Cas9 (e.g., a gRNA binding domain or a DNA cleavage domain), such that the fragment is at least about 70% identical, at least about 80% identical, at least about 90% identical, at least about 95% identical, at least about 96% identical, at least about 97% identical, at least about 98% identical, at least about 99% identical, at least about 99.5% identical, or at least about 99.9% identical to the corresponding fragment of wild-type Cas9. In some embodiments, the fragment is at least 30%, at least 35%, at least 40%, at least 45%, at least 50%, at least 55%, at least 60%, at least 65%, at least 70%, at least 75%, at least 80%, at least 85%, at least 90%, at least 95% identical, at least 96%, at least 97%, at least 98%, at least 99%, or at least 99.5% of the amino acid length of the corresponding wild-type Cas9 (e.g., SEQ ID NO: 18).

いくつかの態様では、本開示は、本明細書に開示のいずれかのCas9タンパク質のフラグメントであるそれらの機能性を保持するCas9フラグメントをもまた利用し得る。いくつかの態様では、Cas9フラグメントは長さが少なくとも100アミノ酸である。いくつかの態様では、フラグメントは長さが少なくとも100、150、200、250、300、350、400、450、500、550、600、650、700、750、800、850、900、950、1000、1050、1100、1150、1200、1250、または少なくとも1300アミノ酸である。 In some embodiments, the disclosure may also utilize Cas9 fragments that are fragments of any of the Cas9 proteins disclosed herein that retain their functionality. In some embodiments, the Cas9 fragments are at least 100 amino acids in length. In some embodiments, the fragments are at least 100, 150, 200, 250, 300, 350, 400, 450, 500, 550, 600, 650, 700, 750, 800, 850, 900, 950, 1000, 1050, 1100, 1150, 1200, 1250, or at least 1300 amino acids in length.

種々の態様において、本明細書に開示のプライム編集因子は、次のとおり記載されるCas9バリアントの1つ、またはいずれかの参照Cas9バリアントと少なくとも約70%同一、少なくとも約80%同一、少なくとも約90%同一、少なくとも約95%同一、少なくとも約96%同一、少なくとも約97%同一、少なくとも約98%同一、少なくとも約99%同一、少なくとも約99.5%同一、もしくは少なくとも約99.9%同一であるそのCas9バリアントを含み得る。 In various embodiments, the prime editing element disclosed herein may include one of the Cas9 variants described as follows, or a Cas9 variant thereof that is at least about 70% identical, at least about 80% identical, at least about 90% identical, at least about 95% identical, at least about 96% identical, at least about 97% identical, at least about 98% identical, at least about 99% identical, at least about 99.5% identical, or at least about 99.9% identical to any reference Cas9 variant.

F.小さいサイズのCas9バリアント
いくつかの態様では、本願において企図されるプライム編集因子は、標準的なSpCas9配列よりも小さい分子量であるCas9タンパク質を包含する。いくつかの態様では、より小さいサイズのCas9バリアントは、例えば発現ベクター、ナノ粒子、または送達の他の手段による細胞への送達を容易化し得る。ある態様において、より小さいサイズのCas9バリアントは、クラス2 CRISPR-CasシステムのII型酵素として類別される酵素を包含し得る。いくつかの態様では、より小さいサイズのCas9バリアントは、クラス2 CRISPR-CasシステムのV型酵素として類別される酵素を包含し得る。他の態様において、より小さいサイズのCas9バリアントは、クラス2 CRISPR-CasシステムのVI型酵素として類別される酵素を包含し得る。
F. Smaller Cas9 variants
In some embodiments, the prime editor contemplated in the present application comprises a Cas9 protein that is smaller in molecular weight than the standard SpCas9 sequence. In some embodiments, the smaller size of the Cas9 variant can facilitate delivery to cells, for example, by expression vectors, nanoparticles, or other means of delivery. In some embodiments, the smaller size of the Cas9 variant can comprise an enzyme that is classified as a type II enzyme of class 2 CRISPR-Cas system. In some embodiments, the smaller size of the Cas9 variant can comprise an enzyme that is classified as a type V enzyme of class 2 CRISPR-Cas system. In other embodiments, the smaller size of the Cas9 variant can comprise an enzyme that is classified as a type VI enzyme of class 2 CRISPR-Cas system.

標準的なSpCas9タンパク質は長さが1368アミノ酸であり、158キロダルトンの予測される分子量を有する。本願において用いられる用語「小さいサイズのCas9バリアント」は、少なくとも1300アミノ酸未満、または少なくとも1290アミノ酸未満、または1280アミノ酸未満、または1270アミノ酸未満、または1260アミノ酸未満、または1250アミノ酸未満、または1240アミノ酸未満、または1230アミノ酸未満、または1220アミノ酸未満、または1210アミノ酸未満、または1200アミノ酸未満、または1190アミノ酸未満、または1180アミノ酸未満、または1170アミノ酸未満、または1160アミノ酸未満、または1150アミノ酸未満、または1140アミノ酸未満、または1130アミノ酸未満、または1120アミノ酸未満、または1110アミノ酸未満、または1100アミノ酸未満、または1050アミノ酸未満、または1000アミノ酸未満、または950アミノ酸未満、または900アミノ酸未満、または850アミノ酸未満、または800アミノ酸未満、または750アミノ酸未満、または700アミノ酸未満、または650アミノ酸未満、または600アミノ酸未満、または550アミノ酸未満、または500アミノ酸未満だが、少なくとも約400アミノ酸よりも大きく、かつCas9タンパク質の要求される機能を保持している天然に存在する、操作された、または別様のいずれかのCas9バリアントを言う。Cas9バリアントは、クラス2 CRISPR-CasシステムのII型、V型、またはVI型酵素として類別されるものを包含し得る。 The standard SpCas9 protein is 1368 amino acids in length and has a predicted molecular weight of 158 kilodaltons. As used herein, the term "small size Cas9 variant" refers to a Cas9 variant that is at least 1300 amino acids long, or at least 1290 amino acids long, or at least 1280 amino acids long, or at least 1270 amino acids long, or at least 1260 amino acids long, or at least 1250 amino acids long, or at least 1240 amino acids long, or at least 1230 amino acids long, or at least 1220 amino acids long, or at least 1210 amino acids long, or at least 1200 amino acids long, or at least 1190 amino acids long, or at least 1180 amino acids long, or at least 1170 amino acids long, or at least 1160 amino acids long, or at least 1150 amino acids long, or at least 1140 amino acids long, or at least 1130 amino acids long. or less than 1120 amino acids, or less than 1110 amino acids, or less than 1100 amino acids, or less than 1050 amino acids, or less than 1000 amino acids, or less than 950 amino acids, or less than 900 amino acids, or less than 850 amino acids, or less than 800 amino acids, or less than 750 amino acids, or less than 700 amino acids, or less than 650 amino acids, or less than 600 amino acids, or less than 550 amino acids, or less than 500 amino acids, but greater than at least about 400 amino acids and retaining the required function of the Cas9 protein, either naturally occurring, engineered, or otherwise. Cas9 variants may include those categorized as Type II, Type V, or Type VI enzymes of Class 2 CRISPR-Cas systems.

種々の態様において、本明細書に開示のプライム編集因子は、次のとおり記載される小さいサイズのCas9バリアントの1つ、またはいずれかの参照の小さいサイズのCas9タンパク質と少なくとも約70%同一、少なくとも約80%同一、少なくとも約90%同一、少なくとも約95%同一、少なくとも約96%同一、少なくとも約97%同一、少なくとも約98%同一、少なくとも約99%同一、少なくとも約99.5%同一、もしくは少なくとも約99.9%同一である(having)そのCas9バリアントを含み得る。

Figure 2020191243000044

Figure 2020191243000045

Figure 2020191243000046

Figure 2020191243000047
In various embodiments, a prime editor disclosed herein can comprise one of the small size Cas9 variants described as follows, or a Cas9 variant thereof having at least about 70% identical, at least about 80% identical, at least about 90% identical, at least about 95% identical, at least about 96% identical, at least about 97% identical, at least about 98% identical, at least about 99% identical, at least about 99.5% identical, or at least about 99.9% identical to any reference small size Cas9 protein.
Figure 2020191243000044

Figure 2020191243000045

Figure 2020191243000046

Figure 2020191243000047

G.Cas9等価物
いくつかの態様では、本明細書に記載のプライム編集因子はいずれかのCas9等価物を包含し得る。本願において用いられる用語「Cas9等価物」は、幅広い用語であり、これは、そのアミノ酸一次配列および/またはその三次元構造が異なり得るおよび/または進化的立場からは無関係であり得るにもかかわらず、本プライム編集因子においてCas9と同じ機能を供するいずれかのnapDNAbpタンパク質を包摂する。それゆえに、Cas9等価物は進化的に関係する本願に記載または包摂されるいずれかのCas9オーソログ、ホモログ、変異体、またはバリアントを包含するが、Cas9等価物は、Cas9と同じかまたは類似の機能を有するように収斂進化プロセスによって進化してあり得るが、アミノ酸配列および/または三次元構造についていずれかの類似性を必ずしも有さないタンパク質をもまた包摂する。Cas9等価物が収斂進化によって発生したタンパク質に基づき得るにもかかわらず、ここで記載されるプライム編集因子は、Cas9と同じかまたは類似の機能を提供するであろういずれかのCas9等価物を包摂する。例えば、Cas9がCRISPR-CasシステムのII型酵素を言う場合には、Cas9等価物はCRISPR-CasシステムのV型またはVI型酵素を言い得る。
G. Cas9 equivalents
In some embodiments, the prime editors described herein may include any Cas9 equivalent. The term "Cas9 equivalent" as used herein is a broad term, which includes any napDNAbp protein that provides the same function as Cas9 in the prime editor, even though its primary amino acid sequence and/or its three-dimensional structure may differ and/or may be unrelated from an evolutionary standpoint. Thus, Cas9 equivalents include any Cas9 orthologues, homologues, mutants, or variants described or included in this application that are evolutionarily related, but Cas9 equivalents also include proteins that may have evolved by convergent evolutionary processes to have the same or similar function as Cas9, but do not necessarily have any similarity in amino acid sequence and/or three-dimensional structure. Although Cas9 equivalents may be based on proteins that have developed by convergent evolution, the prime editors described herein include any Cas9 equivalent that would provide the same or similar function as Cas9. For example, where Cas9 refers to a Type II enzyme of a CRISPR-Cas system, a Cas9 equivalent could refer to a Type V or Type VI enzyme of a CRISPR-Cas system.

例えば、Cas12e(CasX)は、報告によるとCas9と同じ機能を有するが、収斂進化によって進化したCas9等価物である。それゆえに、Liu et al.,"CasX enzymes comprises a distinct family of RNA-guided genome editors,"Nature,2019,Vol.566:218-223に記載されているCas12e(CasX)タンパク質は、本明細書に記載のプライム編集因子に用いられることを企図される。加えて、Cas12e(CasX)のいずれかのバリアントまたは改変が想像され、本開示の範囲内である。 For example, Cas12e (CasX) is a Cas9 equivalent that reportedly has the same function as Cas9 but evolved by convergent evolution. Thus, the Cas12e (CasX) protein described in Liu et al., "CasX enzymes comprises a distinct family of RNA-guided genome editors," Nature, 2019, Vol. 566:218-223, is contemplated for use in the prime editors described herein. Additionally, any variants or modifications of Cas12e (CasX) are envisioned and are within the scope of the present disclosure.

Cas9は広い種々の種において進化した細菌酵素である。しかしながら、本願において企図されるCas9等価物は古細菌からもまた得られ得る。これらは細菌とは異なる単細胞原核微生物のドメインおよび界を構成する。 Cas9 is a bacterial enzyme that has evolved in a wide variety of species. However, Cas9 equivalents contemplated in this application may also be obtained from Archaea, which constitute a distinct domain and kingdom of unicellular prokaryotic microorganisms from Bacteria.

いくつかの態様では、Cas9等価物はCas12e(CasX)またはCas12d(CasY)を言い得る。これらは例えばBurstein et al.,"New CRISPR-Cas systems from uncultivated microbes."Cell Res.2017 Feb 21.doi:10.1038/cr.2017.21に記載されている。これの内容全体は参照によってここに組み込まれる。ゲノム分解能メタゲノミクスを用いて、生命の古細菌ドメインにおける最初に報告されたCas9を包含するいくつものCRISPR-Casシステムが同定された。この分岐したCas9タンパク質は、わずかにしか研究されていないナノ古細菌から活性なCRISPR-Casシステムの一部として見出された。細菌では、2つの先には未知のシステムCRISPR-Cas12eおよびCRISPR-Cas12dが発見された。これらはこれまでに発見された最もコンパクトなシステムのうちである。いくつかの態様では、Cas9はCas12eまたはCas12eのバリアントを言う。いくつかの態様では、Cas9はCas12dまたはCas12dのバリアントを言う。他のRNAによってガイドされるDNA結合タンパク質が核酸プログラム型DNA結合タンパク質(napDNAbp)として用いられ得、本開示の範囲内であるということは了解されるはずである。Liu et al.,"CasX enzymes comprises a distinct family of RNA-guided genome editors,"Nature,2019,Vol.566:218-223をもまた見よ。これらのCas9等価物のいずれかが企図される。 In some embodiments, Cas9 equivalents may refer to Cas12e (CasX) or Cas12d (CasY), as described, for example, in Burstein et al., "New CRISPR-Cas systems from uncultivated microbes." Cell Res. 2017 Feb 21. doi:10.1038/cr.2017.21, the entire contents of which are incorporated herein by reference. Using genome-resolution metagenomics, a number of CRISPR-Cas systems have been identified, including the first reported Cas9 in the archaeal domain of life. This divergent Cas9 protein was found as part of an active CRISPR-Cas system from the little-studied nanoarchaea. In bacteria, two previously unknown systems, CRISPR-Cas12e and CRISPR-Cas12d, have been discovered, which are among the most compact systems discovered to date. In some embodiments, Cas9 refers to Cas12e or a variant of Cas12e. In some embodiments, Cas9 refers to Cas12d or a variant of Cas12d. It should be understood that other RNA-guided DNA binding proteins can be used as nucleic acid programmable DNA binding proteins (napDNAbp) and are within the scope of the present disclosure. See also Liu et al., "CasX enzymes comprises a distinct family of RNA-guided genome editors," Nature, 2019, Vol. 566:218-223. Any of these Cas9 equivalents are contemplated.

いくつかの態様では、Cas9等価物は、天然に存在するCas12e(CasX)またはCas12d(CasY)タンパク質と少なくとも85%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも99.5%同一であるアミノ酸配列を含む。いくつかの態様では、napDNAbpは天然に存在するCas12e(CasX)またはCas12d(CasY)タンパク質である。いくつかの態様では、napDNAbpは、本願において提供される野生型Cas部分またはいずれかのCas部分と少なくとも85%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも99.5%同一であるアミノ酸配列を含む。 In some embodiments, the Cas9 equivalent comprises an amino acid sequence that is at least 85%, at least 90%, at least 91%, at least 92%, at least 93%, at least 94%, at least 95%, at least 96%, at least 97%, at least 98%, at least 99%, or at least 99.5% identical to a naturally occurring Cas12e (CasX) or Cas12d (CasY) protein. In some embodiments, the napDNAbp is a naturally occurring Cas12e (CasX) or Cas12d (CasY) protein. In some embodiments, the napDNAbp comprises an amino acid sequence that is at least 85%, at least 90%, at least 91%, at least 92%, at least 93%, at least 94%, at least 95%, at least 96%, at least 97%, at least 98%, at least 99%, or at least 99.5% identical to a wild-type Cas portion or any Cas portion provided herein.

種々の態様において、核酸プログラム型DNA結合タンパク質は、限定なしに、Cas9(例えば、dCas9およびnCas9)、Cas12e(CasX)、Cas12d(CasY)、Cas12a(Cpf1)、Cas12b1(C2c1)、Cas13a(C2c2)、Cas12c(C2c3)、アルゴノート、およびCas12b1を包含する。Cas9とは異なるPAM特異性を有する核酸プログラム型DNA結合タンパク質の1つの例は、PrevotellaおよびFrancisellaからのクラスター化規則的間隔短回文反復1である(すなわちCas12a(Cpf1))。Cas9と類似に、Cas12a(Cpf1)もまたクラス2 CRISPRエフェクターであるが、それはII型サブグループよりもむしろ酵素のV型サブグループである。Cas12a(Cpf1)はCas9とは別物の特色を有するロバストなDNA干渉を媒介するということが示されている。Cas12a(Cpf1)は、tracrRNAを欠く単一のRNAによってガイドされるエンドヌクレアーゼであり、それは、Tリッチなプロトスペーサー隣接モチーフ(TTN、TTTN、またはYTN)を利用する。その上、Cpf1は互い違いのDNA二本鎖切断によってDNAを切断する。16のCpf1ファミリータンパク質のうち、AcidaminococcusおよびLachnospiraceaeからの2つの酵素はヒト細胞における効率的なゲノム編集活性を有することが示される。Cpf1タンパク質は当該技術分野で知られており、先に記載されている。例えばYamano et al.,"Crystal structure of Cpf1 in complex with guide RNA and target DNA."Cell(165)2016,p.949-962;これの内容全体は参照によってここに組み込まれる。 In various embodiments, nucleic acid programmable DNA binding proteins include, without limitation, Cas9 (e.g., dCas9 and nCas9), Cas12e (CasX), Cas12d (CasY), Cas12a (Cpf1), Cas12b1 (C2c1), Cas13a (C2c2), Cas12c (C2c3), Argonaute, and Cas12b1. One example of a nucleic acid programmable DNA binding protein with a PAM specificity different from Cas9 is clustered regularly interspaced short palindromic repeats 1 from Prevotella and Francisella (i.e., Cas12a (Cpf1)). Similar to Cas9, Cas12a (Cpf1) is also a class 2 CRISPR effector, but it is a type V subgroup of enzymes rather than a type II subgroup. Cas12a (Cpf1) has been shown to mediate robust DNA interference with characteristics that set it apart from Cas9. Cas12a (Cpf1) is a single RNA-guided endonuclease lacking tracrRNA, which utilizes T-rich protospacer adjacent motifs (TTN, TTTN, or YTN). Moreover, Cpf1 cleaves DNA by staggered DNA double-strand breaks. Of the 16 Cpf1 family proteins, two enzymes from Acidaminococcus and Lachnospiraceae are shown to have efficient genome editing activity in human cells. Cpf1 proteins are known in the art and have been described previously. See, e.g., Yamano et al., "Crystal structure of Cpf1 in complex with guide RNA and target DNA." Cell (165) 2016, p. 949-962; the entire contents of which are incorporated herein by reference.

なお他の態様において、Casタンパク質はいずれかのCRISPR関連タンパク質を包含し得、Cas12a、Cas12b1、Cas1、Cas1B、Cas2、Cas3、Cas4、Cas5、Cas6、Cas7、Cas8、Cas9(Csn1およびCsx12としてもまた公知)、Cas10、Csy1、Csy2、Csy3、Cse1、Cse2、Csc1、Csc2、Csa5、Csn2、Csm2、Csm3、Csm4、Csm5、Csm6、Cmr1、Cmr3、Cmr4、Cmr5、Cmr6、Csb1、Csb2、Csb3、Csx17、Csx14、Csx10、Csx16、CsaX、Csx3、Csx1、Csx15、Csf1、Csf2、Csf3、Csf4、それらのホモログ、またはそれらの改変されたバージョンを包含するが、これらに限定されず、好ましくはニッカーゼ変異を含む(例えば、配列番号18の野生型Cas9ポリペプチドのD10A変異に対応する変異)。 In still other embodiments, the Cas protein can include any CRISPR-associated protein, including, but not limited to, Cas12a, Cas12b1, Cas1, Cas1B, Cas2, Cas3, Cas4, Cas5, Cas6, Cas7, Cas8, Cas9 (also known as Csn1 and Csx12), Cas10, Csy1, Csy2, Csy3, Cse1, Cse2, Csc1, Csc2, Csa5, Csn2, Csm2, Csm3, Csm4, Csm5, Csm 6, Cmr1, Cmr3, Cmr4, Cmr5, Cmr6, Csb1, Csb2, Csb3, Csx17, Csx14, Csx10, Csx16, CsaX, Csx3, Csx1, Csx15, Csf1, Csf2, Csf3, Csf4, homologs thereof, or modified versions thereof, preferably including a nickase mutation (e.g., a mutation corresponding to the D10A mutation of the wild-type Cas9 polypeptide of SEQ ID NO: 18).

種々の他の態様において、napDNAbpは次のタンパク質のいずれかであり得る:Cas9、Cas12a(Cpf1)、Cas12e(CasX)、Cas12d(CasY)、Cas12b1(C2c1)、Cas13a(C2c2)、Cas12c(C2c3)、GeoCas9、CjCas9、Cas12g、Cas12h、Cas12i、Cas13b、Cas13c、Cas13d、Cas14、Csn2、xCas9、SpCas9-NG、循環置換Cas9、もしくはアルゴノート(Ago)ドメイン、またはそのバリアント。 In various other embodiments, the napDNAbp can be any of the following proteins: Cas9, Cas12a (Cpf1), Cas12e (CasX), Cas12d (CasY), Cas12b1 (C2c1), Cas13a (C2c2), Cas12c (C2c3), GeoCas9, CjCas9, Cas12g, Cas12h, Cas12i, Cas13b, Cas13c, Cas13d, Cas14, Csn2, xCas9, SpCas9-NG, circularly permuted Cas9, or an Argonaute (Ago) domain, or a variant thereof.

例示のCas9等価物タンパク質配列は次を包含し得る:

Figure 2020191243000048

Figure 2020191243000049

Figure 2020191243000050

Figure 2020191243000051

Figure 2020191243000052

Figure 2020191243000053
Exemplary Cas9 equivalent protein sequences can include:
Figure 2020191243000048

Figure 2020191243000049

Figure 2020191243000050

Figure 2020191243000051

Figure 2020191243000052

Figure 2020191243000053

本明細書に記載のプライム編集因子は、ガイドヌクレオチド配列によってプログラム可能なDNA結合タンパク質ドメインとして用いられ得るCas12a(Cpf1)(dCpf1)バリアントをもまた含み得る。Cas12a(Cpf1)タンパク質は、Cas9のRuvCドメインに類似であるRuvC様エンドヌクレアーゼドメインを有するが、HNHエンドヌクレアーゼドメインは有さず、Cas12a(Cpf1)のN末端はCas9のアルファヘリックス系の認識ローブを有さない。Zetsche et al.,Cell,163,759-771,2015(これは参照によって本願に組み込まれる)においては、Cas12a(Cpf1)のRuvC様ドメインは両方のDNA鎖を切断することを担い、RuvC様ドメインの不活性化がCas12a(Cpf1)ヌクレアーゼ活性を不活性化するということが示された。 The prime editors described herein may also include Cas12a(Cpf1)(dCpf1) variants that may be used as DNA-binding protein domains programmable by guide nucleotide sequences. The Cas12a(Cpf1) protein has a RuvC-like endonuclease domain that is similar to the RuvC domain of Cas9, but does not have the HNH endonuclease domain, and the N-terminus of Cas12a(Cpf1) does not have the alpha-helical recognition lobe of Cas9. In Zetsche et al., Cell, 163, 759-771, 2015 (which is incorporated herein by reference), it was shown that the RuvC-like domain of Cas12a(Cpf1) is responsible for cleaving both DNA strands, and inactivation of the RuvC-like domain inactivates Cas12a(Cpf1) nuclease activity.

いくつかの態様では、napDNAbpは微生物CRISPR-Casシステムの単一のエフェクターである。微生物CRISPR-Casシステムの単一のエフェクターは、限定なしに、Cas9、Cas12a(Cpf1)、Cas12b1(C2c1)、Cas13a(C2c2)、およびCas12c(C2c3)を包含する。典型的には、微生物CRISPR-Casシステムはクラス1およびクラス2システムに分けられる。クラス1システムはマルチサブユニットエフェクター複合体を有するが、クラス2システムは単一のタンパク質エフェクターを有する。例えば、Cas9およびCas12a(Cpf1)はクラス2エフェクターである。Cas9およびCas12a(Cpf1)に加えて、3つの別物のクラス2 CRISPR-Casシステム(Cas12b1、Cas13a、およびCas12c)がShmakov et al.,"Discovery and Functional Characterization of Diverse Class 2 CRISPR Cas Systems",Mol.Cell,2015 Nov 5;60(3):385-397によって記載されている。これの内容全体は参照によってここに組み込まれる。 In some embodiments, napDNAbp is a single effector of a microbial CRISPR-Cas system. Single effectors of microbial CRISPR-Cas systems include, without limitation, Cas9, Cas12a (Cpf1), Cas12b1 (C2c1), Cas13a (C2c2), and Cas12c (C2c3). Typically, microbial CRISPR-Cas systems are divided into class 1 and class 2 systems. Class 1 systems have multi-subunit effector complexes, while class 2 systems have a single protein effector. For example, Cas9 and Cas12a (Cpf1) are class 2 effectors. In addition to Cas9 and Cas12a (Cpf1), three distinct class 2 CRISPR-Cas systems (Cas12b1, Cas13a, and Cas12c) have been described by Shmakov et al., "Discovery and Functional Characterization of Diverse Class 2 CRISPR Cas Systems", Mol. Cell, 2015 Nov 5;60(3):385-397, the entire contents of which are incorporated herein by reference.

システムの2つCas12b1およびCas12cのエフェクターは、Cas12aに関係するRuvC様エンドヌクレアーゼドメインを含有する。第3のシステムのCas13aは、2つの予測される(predicated)HEPN RNaseドメインを有するエフェクターを含有する。Cas12b1によるCRISPR RNAの生産とは違って、成熟CRISPR RNAの生産はtracrRNA非依存的である。Cas12b1はDNA切断についてはCRISPR RNAおよびtracrRNA両方に依存する。細菌Cas13aは、そのRNAによって活性化される一本鎖RNA分解活性とは別物のCRISPR RNA成熟のための固有のRNase活性を所有することが示されている。これらのRNase機能は、互いとは、およびCas12aのCRISPR RNAプロセシング挙動とは異なる。例えば、East-Seletsky,et al.,"Two distinct RNase activities of CRISPR-Cas13a enable guide-RNA processing and RNA detection",Nature,2016 Oct 13;538(7624):270-273を見よ。これの内容全体は参照によってここに組み込まれる。Leptotrichia shahiiのCas13aのin vitroの生化学分析は、Cas13aが単一のCRISPR RNAによってガイドされ、相補的なプロトスペーサーを持つssRNA標的を切断するようにプログラムされ得るということを示している。2つの保存されたHEPNドメイン上の触媒残基が切断を媒介する。触媒残基の変異は触媒的に不活性なRNA結合タンパク質を生成する。例えば、Abudayyeh et al.,"C2c2 is a single-component programmable RNA-guided RNA-targeting CRISPR effector",Science,2016 Aug 5;353(6299)を見よ。これの内容全体は参照によってここに組み込まれる。 Effectors of two of the systems, Cas12b1 and Cas12c, contain a RuvC-like endonuclease domain related to Cas12a. The third system, Cas13a, contains an effector with two predicated HEPN RNase domains. Unlike CRISPR RNA production by Cas12b1, production of mature CRISPR RNA is tracrRNA-independent. Cas12b1 depends on both CRISPR RNA and tracrRNA for DNA cleavage. Bacterial Cas13a has been shown to possess an intrinsic RNase activity for CRISPR RNA maturation that is separate from its RNA-activated single-stranded RNA degradation activity. These RNase functions are distinct from each other and from the CRISPR RNA processing behavior of Cas12a. See, e.g., East-Seletsky, et al., "Two distinct RNase activities of CRISPR-Cas13a enable guide-RNA processing and RNA detection", Nature, 2016 Oct 13;538(7624):270-273, the entire contents of which are incorporated herein by reference. In vitro biochemical analysis of Leptotrichia shahii Cas13a shows that Cas13a can be guided by a single CRISPR RNA and programmed to cleave ssRNA targets with complementary protospacers. Two conserved catalytic residues on the HEPN domain mediate cleavage. Mutation of the catalytic residues generates a catalytically inactive RNA-binding protein. See, e.g., Abudayyeh et al., "C2c2 is a single-component programmable RNA-guided RNA-targeting CRISPR effector", Science, 2016 Aug 5;353(6299), the entire contents of which are incorporated herein by reference.

Alicyclobaccillus acidoterrastris Cas12b1(AacC2c1)の結晶構造がキメラ単分子ガイドRNA(sgRNA)との複合体として報告されている。例えば、Liu et al.,"C2c1-sgRNA Complex Structure Reveals RNA-Guided DNA Cleavage Mechanism",Mol.Cell,2017 Jan 19;65(2):310-322を見よ。これの内容全体は参照によってここに組み込まれる。結晶構造は三者複合体として標的DNAに結合したAlicyclobacillus acidoterrestris C2c1としてもまた報告されている。例えば、Yang et al.,"PAM-dependent Target DNA Recognition and Cleavage by C2C1 CRISPR-Cas endonuclease",Cell,2016 Dec 15;167(7):1814-1828を見よ。これの内容全体は参照によってここに組み込まれる。AacC2c1の触媒的に有能な立体配座は、独立して単一のRuvC触媒ポケット内に位置取った標的および非標的DNA鎖両方によって、キャプチャされている。C2c1によって媒介される切断は、標的DNAの互い違いの7ヌクレオチド切断をもたらす。C2c1三者複合体と先に同定されたCas9およびCpf1カウンターパートとの間の構造比較は、CRISPR-Cas9システムによって用いられる機序の多様性を実証する。 The crystal structure of Alicyclobacillus acidoterrastris Cas12b1 (AacC2c1) has been reported in complex with a chimeric single guide RNA (sgRNA). See, e.g., Liu et al., "C2c1-sgRNA Complex Structure Reveals RNA-Guided DNA Cleavage Mechanism", Mol. Cell, 2017 Jan 19; 65(2): 310-322, the entire contents of which are incorporated herein by reference. A crystal structure has also been reported for Alicyclobacillus acidoterrestris C2c1 bound to target DNA as a ternary complex. See, e.g., Yang et al., "PAM-dependent Target DNA Recognition and Cleavage by C2C1 CRISPR-Cas endonuclease", Cell, 2016 Dec 15; 167(7): 1814-1828, the entire contents of which are incorporated herein by reference. The catalytically competent conformation of AacC2c1 is captured by both the target and non-target DNA strands, which are independently positioned within a single RuvC catalytic pocket. C2c1-mediated cleavage results in staggered seven-nucleotide cuts of the target DNA. Structural comparison between the C2c1 ternary complex and previously identified Cas9 and Cpf1 counterparts demonstrates the diversity of mechanisms employed by the CRISPR-Cas9 system.

いくつかの態様では、napDNAbpはC2c1、C2c2、またはC2c3タンパク質であり得る。いくつかの態様では、napDNAbpはC2c1タンパク質である。いくつかの態様では、napDNAbpはCas13aタンパク質である。いくつかの態様では、napDNAbpはCas12cタンパク質である。いくつかの態様では、napDNAbpは、天然に存在するCas12b1(C2c1)、Cas13a(C2c2)、またはCas12c(C2c3)タンパク質と少なくとも85%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも99.5%同一であるアミノ酸配列を含む。いくつかの態様では、napDNAbpは天然に存在するCas12b1(C2c1)、Cas13a(C2c2)、またはCas12c(C2c3)タンパク質である。 In some embodiments, the napDNAbp can be a C2c1, C2c2, or C2c3 protein. In some embodiments, the napDNAbp is a C2c1 protein. In some embodiments, the napDNAbp is a Cas13a protein. In some embodiments, the napDNAbp is a Cas12c protein. In some embodiments, the napDNAbp comprises an amino acid sequence that is at least 85%, at least 90%, at least 91%, at least 92%, at least 93%, at least 94%, at least 95%, at least 96%, at least 97%, at least 98%, at least 99%, or at least 99.5% identical to a naturally occurring Cas12b1 (C2c1), Cas13a (C2c2), or Cas12c (C2c3) protein. In some embodiments, the napDNAbp is a naturally occurring Cas12b1 (C2c1), Cas13a (C2c2), or Cas12c (C2c3) protein.

H.Cas9循環置換体
種々の態様において、本明細書に開示のプライム編集因子はCas9の循環置換体を含み得る。
H. Cas9 circular permutation
In various embodiments, the prime editing elements disclosed herein can comprise a circular permutation of Cas9.

用語「循環置換Cas9」またはCas9の「循環置換体」または「CP-Cas9」は、循環置換体バリアントとして生起するかまたは操作されるように改変されているいずれかのCas9タンパク質またはそのバリアントを言う。これは、Cas9タンパク質(例えば、野生型Cas9タンパク質)のN末端およびC末端が局所的に再配置されているということを意味する。かかる循環置換Cas9タンパク質またはそれらのバリアントは、ガイドRNA(gRNA)と複合体化したときにDNAに結合する能力を保持する。Oakes et al.,"Protein Engineering of Cas9 for enhanced function,"Methods Enzymol,2014,546:491-511およびOakes et al.,"CRISPR-Cas9 Circular Permutants as Programmable Scaffolds for Genome Modification,"Cell,January 10,2019,176:254-267を見よ。夫々は参照によって本願に組み込まれる。もたらされる循環置換タンパク質がガイドRNA(gRNA)と複合体化したときにDNAに結合する能力を保持する限り、本開示は、いずれかの先に公知のCP-Cas9を企図するか、または新たなCP-Cas9を用いる。 The term "circularly permuted Cas9" or "circular permutants" of Cas9 or "CP-Cas9" refers to any Cas9 protein or variant thereof that has been modified to arise or be engineered as a circularly permuted variant. This means that the N-terminus and C-terminus of the Cas9 protein (e.g., wild-type Cas9 protein) are locally rearranged. Such circularly permuted Cas9 proteins or variants thereof retain the ability to bind DNA when complexed with a guide RNA (gRNA). See Oakes et al., "Protein Engineering of Cas9 for enhanced function," Methods Enzymol, 2014, 546:491-511 and Oakes et al., "CRISPR-Cas9 Circular Permutants as Programmable Scaffolds for Genome Modification," Cell, January 10, 2019, 176:254-267, each of which is incorporated herein by reference. The present disclosure contemplates any previously known CP-Cas9 or employs a new CP-Cas9, so long as the resulting circularly permuted protein retains the ability to bind DNA when complexed with a guide RNA (gRNA).

いずれかのバリアント、オーソログ、もしくは天然に存在するCas9を包含する本明細書に記載のCas9タンパク質のいずれか、またはその等価物が、循環置換体バリアントとして再構成され得る。 Any of the Cas9 proteins described herein, including any variant, ortholog, or naturally occurring Cas9, or equivalents thereof, can be reconstituted as a circularly permuted variant.

種々の態様において、Cas9の循環置換体は次の構造を有し得る:N末端-[元々のC末端]-[任意のリンカー]-[元々のN末端]-C末端。 In various embodiments, the circular permutation of Cas9 can have the following structure: N-terminus-[original C-terminus]-[optional linker]-[original N-terminus]-C-terminus.

例として、本開示は標準的なS.pyogenes Cas9の次の循環置換体を企図する(UniProtKB-Q99ZW2(CAS9_STRP1)の1368アミノ酸(付番は配列番号18のアミノ酸位置に基づく)):
N末端-[1268~1368]-[任意のリンカー]-[1~1267]-C末端;
N末端-[1168~1368]-[任意のリンカー]-[1~1167]-C末端;
N末端-[1068~1368]-[任意のリンカー]-[1~1067]-C末端;
N末端-[968~1368]-[任意のリンカー]-[1~967]-C末端;
N末端-[868~1368]-[任意のリンカー]-[1~867]-C末端;
N末端-[768~1368]-[任意のリンカー]-[1~767]-C末端;
N末端-[668~1368]-[任意のリンカー]-[1~667]-C末端;
N末端-[568~1368]-[任意のリンカー]-[1~567]-C末端;
N末端-[468~1368]-[任意のリンカー]-[1~467]-C末端;
N末端-[368~1368]-[任意のリンカー]-[1~367]-C末端;
N末端-[268~1368]-[任意のリンカー]-[1~267]-C末端;
N末端-[168~1368]-[任意のリンカー]-[1~167]-C末端;
N末端-[68~1368]-[任意のリンカー]-[1~67]-C末端;もしくは
N末端-[10~1368]-[任意のリンカー]-[1~9]-C末端、または
他のCas9タンパク質(他のCas9オーソログ、バリアントなどを包含する)の対応する循環置換体。
By way of example, the present disclosure contemplates the following circular permutation of the standard S. pyogenes Cas9 (1368 amino acids of UniProtKB-Q99ZW2 (CAS9_STRP1) (numbering is based on amino acid positions in SEQ ID NO: 18)):
N-terminus-[1268-1368]-[optional linker]-[1-1267]-C-terminus;
N-terminus-[1168-1368]-[optional linker]-[1-1167]-C-terminus;
N-terminus-[1068-1368]-[optional linker]-[1-1067]-C-terminus;
N-terminus-[968-1368]-[optional linker]-[1-967]-C-terminus;
N-terminus-[868-1368]-[optional linker]-[1-867]-C-terminus;
N-terminus-[768-1368]-[optional linker]-[1-767]-C-terminus;
N-terminus-[668-1368]-[optional linker]-[1-667]-C-terminus;
N-terminus-[568-1368]-[optional linker]-[1-567]-C-terminus;
N-terminus-[468-1368]-[optional linker]-[1-467]-C-terminus;
N-terminus-[368-1368]-[optional linker]-[1-367]-C-terminus;
N-terminus-[268-1368]-[optional linker]-[1-267]-C-terminus;
N-terminus-[168-1368]-[optional linker]-[1-167]-C-terminus;
N-terminus-[68-1368]-[optional linker]-[1-67]-C-terminus; or
N-terminus-[10-1368]-[optional linker]-[1-9]-C-terminus, or the corresponding circular permutation of other Cas9 proteins (including other Cas9 orthologs, variants, etc.).

具体的な態様では、循環置換体(circular permuant)Cas9は次の構造を有する(S.pyogenes Cas9(UniProtKB-Q99ZW2(CAS9_STRP1)の1368アミノ酸(付番は配列番号18のアミノ酸位置に基づく)に基づく:
N末端-[102~1368]-[任意のリンカー]-[1~101]-C末端;
N末端-[1028~1368]-[任意のリンカー]-[1~1027]-C末端;
N末端-[1041~1368]-[任意のリンカー]-[1~1043]-C末端;
N末端-[1249~1368]-[任意のリンカー]-[1~1248]-C末端;もしくは
N末端-[1300~1368]-[任意のリンカー]-[1~1299]-C末端、または
他のCas9タンパク質(他のCas9オーソログ、バリアントなどを包含する)の対応する循環置換体。
In a specific embodiment, the circular permuant Cas9 has the following structure (based on the 1368 amino acids of S. pyogenes Cas9 (UniProtKB-Q99ZW2 (CAS9_STRP1) (numbering is based on amino acid positions in SEQ ID NO: 18):
N-terminus-[102-1368]-[optional linker]-[1-101]-C-terminus;
N-terminus-[1028-1368]-[optional linker]-[1-1027]-C-terminus;
N-terminus-[1041-1368]-[optional linker]-[1-1043]-C-terminus;
N-terminus-[1249-1368]-[optional linker]-[1-1248]-C-terminus; or
N-terminus-[1300-1368]-[optional linker]-[1-1299]-C-terminus, or the corresponding circular permutation of other Cas9 proteins (including other Cas9 orthologs, variants, etc.).

なお他の態様において、循環置換体(circular permuant)Cas9は次の構造を有する(S.pyogenes Cas9(UniProtKB-Q99ZW2(CAS9_STRP1)の1368アミノ酸(付番は配列番号18のアミノ酸位置に基づく)に基づく:
N末端-[103~1368]-[任意のリンカー]-[1~102]-C末端;
N末端-[1029~1368]-[任意のリンカー]-[1~1028]-C末端;
N末端-[1042~1368]-[任意のリンカー]-[1~1041]-C末端;
N末端-[1250~1368]-[任意のリンカー]-[1~1249]-C末端;もしくは
N末端-[1301~1368]-[任意のリンカー]-[1~1300]-C末端、または
他のCas9タンパク質(他のCas9オーソログ、バリアントなどを包含する)の対応する循環置換体。
In yet other embodiments, the circular permuant Cas9 has the following structure (based on the 1368 amino acids of S. pyogenes Cas9 (UniProtKB-Q99ZW2 (CAS9_STRP1) (numbering is based on amino acid positions in SEQ ID NO: 18):
N-terminus-[103-1368]-[optional linker]-[1-102]-C-terminus;
N-terminus-[1029-1368]-[optional linker]-[1-1028]-C-terminus;
N-terminus-[1042-1368]-[optional linker]-[1-1041]-C-terminus;
N-terminus-[1250-1368]-[optional linker]-[1-1249]-C-terminus; or
N-terminus-[1301-1368]-[optional linker]-[1-1300]-C-terminus, or the corresponding circular permutation of other Cas9 proteins (including other Cas9 orthologs, variants, etc.).

いくつかの態様では、循環置換体は、直接的にまたはアミノ酸リンカーなどのリンカーを用いることによってどちらかで、Cas9のC末端フラグメントをCas9のN末端フラグメントに連結することによって形成され得る。いくつかの態様では、C末端フラグメントは、Cas9のアミノ酸(例えば、アミノ酸約1300-1368)のC末端95%以上、あるいはCas9(例えば、配列番号77-86のいずれか1つ)のC末端90%、85%、80%、75%、70%、65%、60%、55%、50%、45%、40%、35%、30%、25%、20%、15%、10%、もしくは5%、またはより多くに対応し得る。N末端部分は、Cas9のアミノ酸(例えば、アミノ酸約1-1300)のN末端95%以上、あるいはCas9の(例えば配列番号18の)N末端90%、85%、80%、75%、70%、65%、60%、55%、50%、45%、40%、35%、30%、25%、20%、15%、10%、もしくは5%、またはより多くに対応し得る。 In some embodiments, a circular permutation can be formed by linking a C-terminal fragment of Cas9 to an N-terminal fragment of Cas9, either directly or by using a linker, such as an amino acid linker. In some embodiments, the C-terminal fragment can correspond to the C-terminal 95% or more of the amino acids of Cas9 (e.g., about amino acids 1300-1368), or the C-terminal 90%, 85%, 80%, 75%, 70%, 65%, 60%, 55%, 50%, 45%, 40%, 35%, 30%, 25%, 20%, 15%, 10%, or 5% or more of Cas9 (e.g., any one of SEQ ID NOs:77-86). The N-terminal portion can correspond to the N-terminal 95% or more of the amino acids of Cas9 (e.g., about amino acids 1-1300), or the N-terminal 90%, 85%, 80%, 75%, 70%, 65%, 60%, 55%, 50%, 45%, 40%, 35%, 30%, 25%, 20%, 15%, 10%, or 5% or more of Cas9 (e.g., of SEQ ID NO:18).

いくつかの態様では、循環置換体は、直接的にまたはアミノ酸リンカーなどのリンカーを用いることによってどちらかで、Cas9のC末端フラグメントをCas9のN末端フラグメントに連結することによって形成され得る。いくつかの態様では、N末端へと再配置されるC末端フラグメントは、Cas9のアミノ酸のC末端30%以下(例えば、配列番号18のアミノ酸1012~1368)を包含するかまたはそれらに対応する。いくつかの態様では、N末端へと再配置されるC末端フラグメントは、Cas9のアミノ酸(例えば、配列番号18のCas9)のC末端30%、29%、28%、27%、26%、25%、24%、23%、22%、21%、20%、19%、18%、17%、16%、15%、14%、13%、12%、11%、10%、9%、8%、7%、6%、5%、4%、3%、2%、または1%を包含するかまたはそれらに対応する。いくつかの態様では、N末端へと再配置されるC末端フラグメントは、Cas9(例えば、配列番号18のCas9)のC末端410残基以下を包含するかまたはそれらに対応する。いくつかの態様では、N末端へと再配置されるC末端部分は、Cas9(例えば、配列番号18のCas9)のC末端410、400、390、380、370、360、350、340、330、320、310、300、290、280、270、260、250、240、230、220、210、200、190、180、170、160、150、140、130、120、110、100、90、80、70、60、50、40、30、20、または10残基を包含するかまたはそれらに対応する。いくつかの態様では、N末端へと再配置されるC末端フラグメントは、Cas9(例えば、配列番号18のCas9)のC末端357、341、328、120、または69残基を包含するかまたはそれらに対応する。 In some embodiments, a circular permutation can be formed by linking a C-terminal fragment of Cas9 to an N-terminal fragment of Cas9, either directly or by using a linker, such as an amino acid linker. In some embodiments, the C-terminal fragment relocated to the N-terminus includes or corresponds to the C-terminal 30% or less of the amino acids of Cas9 (e.g., amino acids 1012-1368 of SEQ ID NO: 18). In some embodiments, the C-terminal fragment relocated to the N-terminus includes or corresponds to the C-terminal 30%, 29%, 28%, 27%, 26%, 25%, 24%, 23%, 22%, 21%, 20%, 19%, 18%, 17%, 16%, 15%, 14%, 13%, 12%, 11%, 10%, 9%, 8%, 7%, 6%, 5%, 4%, 3%, 2%, or 1% of the amino acids of Cas9 (e.g., Cas9 of SEQ ID NO: 18). In some embodiments, the C-terminal fragment relocated to the N-terminus includes or corresponds to the C-terminal 410 or less residues of Cas9 (e.g., Cas9 of SEQ ID NO: 18). In some embodiments, the C-terminal portion relocated to the N-terminus includes or corresponds to the C-terminal 410, 400, 390, 380, 370, 360, 350, 340, 330, 320, 310, 300, 290, 280, 270, 260, 250, 240, 230, 220, 210, 200, 190, 180, 170, 160, 150, 140, 130, 120, 110, 100, 90, 80, 70, 60, 50, 40, 30, 20, or 10 residues of Cas9 (e.g., Cas9 of SEQ ID NO: 18). In some embodiments, the C-terminal fragment that is relocated to the N-terminus includes or corresponds to the C-terminal 357, 341, 328, 120, or 69 residues of Cas9 (e.g., Cas9 of SEQ ID NO: 18).

他の態様において、循環置換体Cas9バリアントは、次の方法に基づくCas9一次構造のトポロジー的再配置として定められ得、これは配列番号18のS.pyogenes Cas9に基づく:(a)Cas9一次構造の内部のアミノ酸残基に対応する循環置換体(CP)部位を選択し、これが元々のタンパク質を2つの半分:N末端領域およびC末端領域へと切り分けること;(b)元々のN末端領域に先立つ(preceed)ように元々のC末端領域(CP部位アミノ酸を含む)を動かすことによって、Cas9タンパク質配列を改変し(例えば、遺伝子工学技術による)、それによって、今やCP部位アミノ酸残基で始まるCas9タンパク質の新たなN末端を形成すること。CP部位は、例えばヘリカルIIドメイン、RuvCIIIドメイン、またはCTDドメインを包含するCas9タンパク質のいずれかのドメイン上に位置付られ得る。例えば、CP部位は、(配列番号18のS.pyogenes Cas9に対して相対的に)元々のアミノ酸残基181、199、230、270、310、1010、1016、1023、1029、1041、1247、1249、または1282に位置付けられ得る。それゆえに、ひとたびN末端に位置替えされると、元々のアミノ酸181、199、230、270、310、1010、1016、1023、1029、1041、1247、1249、または1282は新たなN末端アミノ酸になるであろう。これらのCP-Cas9タンパク質の命名体系は、夫々Cas9-CP181、Cas9-CP199、Cas9-CP230、Cas9-CP270、Cas9-CP310、Cas9-CP1010、Cas9-CP1016、Cas9-CP1023、Cas9-CP1029、Cas9-CP1041、Cas9-CP1247、Cas9-CP1249、およびCas9-CP1282と言われ得る。この記載は配列番号18からのCPバリアントを作ることに限定されることを意味されず、いずれかのCas9配列において、これらの位置に対応するCP部位においてまたは全く(entireley)他のCP部位においてどちらかでCPバリアントを作るために実装され得る。この記載は決して特定のCP部位を限定することを意味されない。実質的にいずれかのCP部位がCP-Cas9バリアントを形成するために用いられ得る。 In other embodiments, a circularly permuted Cas9 variant can be defined as a topological rearrangement of the Cas9 primary structure based on S. pyogenes Cas9 of SEQ ID NO: 18: (a) selecting a circularly permuted (CP) site corresponding to an amino acid residue within the Cas9 primary structure, which splits the original protein into two halves: an N-terminal region and a C-terminal region; (b) modifying the Cas9 protein sequence (e.g., by genetic engineering techniques) by moving the original C-terminal region (containing the CP site amino acid) to precede the original N-terminal region, thereby forming a new N-terminus of the Cas9 protein that now begins with the CP site amino acid residue. The CP site can be located on any domain of the Cas9 protein, including, for example, the helical II domain, the RuvCIII domain, or the CTD domain. For example, the CP site may be located (relative to the S. pyogenes Cas9 of SEQ ID NO: 18) at the original amino acid residues 181, 199, 230, 270, 310, 1010, 1016, 1023, 1029, 1041, 1247, 1249, or 1282. Thus, once relocated to the N-terminus, the original amino acids 181, 199, 230, 270, 310, 1010, 1016, 1023, 1029, 1041, 1247, 1249, or 1282 will become the new N-terminal amino acids. The nomenclature of these CP-Cas9 proteins can be referred to as Cas9-CP 181 , Cas9-CP 199 , Cas9-CP 230 , Cas9-CP 270 , Cas9-CP 310 , Cas9-CP 1010 , Cas9-CP 1016 , Cas9-CP 1023 , Cas9-CP 1029 , Cas9-CP 1041 , Cas9-CP 1247 , Cas9-CP 1249 , and Cas9-CP 1282 , respectively. This description is not meant to be limited to making CP variants from SEQ ID NO: 18, and can be implemented to make CP variants either at the CP sites corresponding to these positions or entirely at other CP sites in any Cas9 sequence. This description is in no way meant to be limited to a particular CP site. Virtually any CP site can be used to form a CP-Cas9 variant.

配列番号18のCas9に基づく例示のCP-Cas9アミノ酸配列が下で提供される。これにおいては、リンカー配列は下線付きによって指示され、任意のメチオニン(M)残基は太字で指示されている。本開示はリンカー配列を包含しないかまたは異なるリンカー配列を包含するCP-Cas9配列を提供するということは了解されるはずである。CP-Cas9配列が配列番号18以外のCas9配列に基づき得るということは了解されるはずであり、本願において提供されるいずれかの例は限定することを意味されない。例示のCP-Cas9配列は次のとおりである:

Figure 2020191243000054

Figure 2020191243000055

Figure 2020191243000056

Figure 2020191243000057
An exemplary CP-Cas9 amino acid sequence based on the Cas9 of SEQ ID NO: 18 is provided below, in which the linker sequence is indicated by underlining and the optional methionine (M) residue is indicated in bold. It should be understood that the present disclosure provides CP-Cas9 sequences that do not include linker sequences or that include different linker sequences. It should be understood that CP-Cas9 sequences can be based on Cas9 sequences other than SEQ ID NO: 18, and any examples provided in this application are not meant to be limiting. An exemplary CP-Cas9 sequence is as follows:
Figure 2020191243000054

Figure 2020191243000055

Figure 2020191243000056

Figure 2020191243000057

本明細書に記載のプライム編集構築物に有用であり得るCas9循環置換体。Cas9のN末端へと再配置され得る配列番号18のCas9に基づくCas9の例示のC末端フラグメントが、下で提供される。Cas9のかかるC末端フラグメントは例示的であり、限定することを意味されないということは了解されるはずである。これらの例示のCP-Cas9フラグメントは次の配列を有する:

Figure 2020191243000058
Cas9 circular permutations that may be useful in the prime editing constructs described herein. Exemplary C-terminal fragments of Cas9 based on Cas9 of SEQ ID NO: 18 that can be relocated to the N-terminus of Cas9 are provided below. It should be understood that such C-terminal fragments of Cas9 are exemplary and are not meant to be limiting. These exemplary CP-Cas9 fragments have the following sequences:
Figure 2020191243000058

I.改変されたPAM特異性を有するCas9バリアント
本開示のプライム編集因子は、改変されたPAM特異性を有するCas9バリアントをもまた含み得る。本開示のいくつかの側面は、標準的なPAM(5'-NGG-3'。ここで、NはA、C、G、またはTである)をその3'端に含まない標的配列に対して活性を発揮するCas9タンパク質を提供する。いくつかの態様では、Cas9タンパク質は、5'-NGG-3'PAM配列をその3'端に含む標的配列に対して活性を発揮する。いくつかの態様では、Cas9タンパク質は、5'-NNG-3'PAM配列をその3'端に含む標的配列に対して活性を発揮する。いくつかの態様では、Cas9タンパク質は、5'-NNA-3'PAM配列をその3'端に含む標的配列に対して活性を発揮する。いくつかの態様では、Cas9タンパク質は、5'-NNC-3'PAM配列をその3'端に含む標的配列に対して活性を発揮する。いくつかの態様では、Cas9タンパク質は、5'-NNT-3'PAM配列をその3'端に含む標的配列に対して活性を発揮する。いくつかの態様では、Cas9タンパク質は、5'-NGT-3'PAM配列をその3'端に含む標的配列に対して活性を発揮する。いくつかの態様では、Cas9タンパク質は、5'-NGA-3'PAM配列をその3'端に含む標的配列に対して活性を発揮する。いくつかの態様では、Cas9タンパク質は、5'-NGC-3'PAM配列をその3'端に含む標的配列に対して活性を発揮する。いくつかの態様では、Cas9タンパク質は、5'-NAA-3'PAM配列をその3'端に含む標的配列に対して活性を発揮する。いくつかの態様では、Cas9タンパク質は、5'-NAC-3'PAM配列をその3'端に含む標的配列に対して活性を発揮する。いくつかの態様では、Cas9タンパク質は、5'-NAT-3'PAM配列をその3'端に含む標的配列に対して活性を発揮する。なお他の態様において、Cas9タンパク質は、5'-NAG-3'PAM配列をその3'端に含む標的配列に対して活性を発揮する。
I. Cas9 variants with altered PAM specificity
Prime editors of the disclosure may also include Cas9 variants with altered PAM specificity. Some aspects of the disclosure provide Cas9 proteins that are active against target sequences that do not include a standard PAM (5'-NGG-3', where N is A, C, G, or T) at their 3' end. In some embodiments, the Cas9 protein is active against target sequences that include a 5'-NGG-3'PAM sequence at their 3' end. In some embodiments, the Cas9 protein is active against target sequences that include a 5'-NNG-3'PAM sequence at their 3' end. In some embodiments, the Cas9 protein is active against target sequences that include a 5'-NNA-3'PAM sequence at their 3' end. In some embodiments, the Cas9 protein is active against target sequences that include a 5'-NNC-3'PAM sequence at their 3' end. In some embodiments, the Cas9 protein is active against a target sequence that comprises a 5'-NNT-3'PAM sequence at its 3' end. In some embodiments, the Cas9 protein is active against a target sequence that comprises a 5'-NGT-3'PAM sequence at its 3' end. In some embodiments, the Cas9 protein is active against a target sequence that comprises a 5'-NGA-3'PAM sequence at its 3' end. In some embodiments, the Cas9 protein is active against a target sequence that comprises a 5'-NGC-3'PAM sequence at its 3' end. In some embodiments, the Cas9 protein is active against a target sequence that comprises a 5'-NAA-3'PAM sequence at its 3' end. In some embodiments, the Cas9 protein is active against a target sequence that comprises a 5'-NAC-3'PAM sequence at its 3' end. In some embodiments, the Cas9 protein is active against a target sequence that comprises a 5'-NAT-3'PAM sequence at its 3' end. In yet other embodiments, the Cas9 protein is active against a target sequence that contains a 5'-NAG-3'PAM sequence at its 3' end.

第1のアミノ酸残基(例えばA)から第2のアミノ酸残基(例えばT)への本明細書に記載のアミノ酸変異のいずれか(例えば、A262T)は、第1のアミノ酸残基から(例えば、保存された)第2のアミノ酸残基に類似であるアミノ酸残基への変異をもまた包含し得るということは了解されるはずである。例えば、疎水性側鎖を有するアミノ酸(例えば、アラニン、バリン、イソロイシン、ロイシン、メチオニン、フェニルアラニン、チロシン、またはトリプトファン)の変異は、異なる疎水性側鎖を有する第2のアミノ酸(例えば、アラニン、バリン、イソロイシン、ロイシン、メチオニン、フェニルアラニン、チロシン、またはトリプトファン)への変異であり得る。例えば、アラニンからトレオニンへの変異(例えばA262T変異)は、アラニンからサイズおよび化学的特性がトレオニンに類似であるアミノ酸、例えばセリンへの変異でもまたあり得る。別の例として、正荷電側鎖を有するアミノ酸(例えば、アルギニン、ヒスチジン、またはリジン)の変異は、異なる正荷電側鎖を有する第2のアミノ酸(例えば、アルギニン、ヒスチジン、またはリジン)への変異であり得る。別の例として、極性側鎖を有するアミノ酸(例えば、セリン、トレオニン、アスパラギン、またはグルタミン)の変異は、異なる極性側鎖を有する第2のアミノ酸(例えば、セリン、トレオニン、アスパラギン、またはグルタミン)への変異であり得る。追加の類似のアミノ酸ペアは次を包含するが、これらに限定されない:フェニルアラニンおよびチロシン;アスパラギンおよびグルタミン;メチオニンおよびシステイン;アスパラギン酸およびグルタミン酸;ならびにアルギニンおよびリジン。当業者は、かかる保存的アミノ酸置換が蓋然的にはタンパク質構造に対して軽度の効果を有し、機能を毀損することなしに良く忍容されることが蓋然的であるということを認識するであろう。いくつかの態様では、1つのアミノ酸からトレオニンへの本願において提供されるアミノ酸変異のいずれかのアミノは、セリンへのアミノ酸変異であり得る。いくつかの態様では、1つのアミノ酸からアルギニンへの本願において提供されるアミノ酸変異のいずれかのアミノは、リジンへのアミノ酸変異であり得る。いくつかの態様では、1つのアミノ酸からイソロイシンへの本願において提供されるアミノ酸変異のいずれかのアミノはアラニン、バリン、メチオニン、またはロイシンへのアミノ酸変異であり得る。いくつかの態様では、1つのアミノ酸からリジンへの本願において提供されるアミノ酸変異のいずれかのアミノはアルギニンへのアミノ酸変異であり得る。いくつかの態様では、1つのアミノ酸からアスパラギン酸への本願において提供されるアミノ酸変異のいずれかのアミノはグルタミン酸またはアスパラギンへのアミノ酸変異であり得る。いくつかの態様では、1つのアミノ酸からバリンへの本願において提供されるアミノ酸変異のいずれかのアミノはアラニン、イソロイシン、メチオニン、またはロイシンへのアミノ酸変異であり得る。いくつかの態様では、1つのアミノ酸からグリシンへの本願において提供されるアミノ酸変異のいずれかのアミノはアラニンへのアミノ酸変異であり得る。しかしながら、追加の保存されたアミノ酸残基は当業者によって認識されるであろうということは了解されるはずであり、他の保存されたアミノ酸残基へのアミノ酸変異のいずれかもまた本開示の範囲内である。 It should be understood that any of the amino acid mutations described herein from a first amino acid residue (e.g., A) to a second amino acid residue (e.g., T) (e.g., A262T) can also include a mutation from the first amino acid residue to an amino acid residue that is similar to the (e.g., conserved) second amino acid residue. For example, a mutation of an amino acid having a hydrophobic side chain (e.g., alanine, valine, isoleucine, leucine, methionine, phenylalanine, tyrosine, or tryptophan) can be a mutation to a second amino acid having a different hydrophobic side chain (e.g., alanine, valine, isoleucine, leucine, methionine, phenylalanine, tyrosine, or tryptophan). For example, a mutation from alanine to threonine (e.g., A262T mutation) can also be a mutation from alanine to an amino acid similar in size and chemical properties to threonine, such as serine. As another example, a mutation of an amino acid with a positively charged side chain (e.g., arginine, histidine, or lysine) can be a mutation to a second amino acid with a different positively charged side chain (e.g., arginine, histidine, or lysine). As another example, a mutation of an amino acid with a polar side chain (e.g., serine, threonine, asparagine, or glutamine) can be a mutation to a second amino acid with a different polar side chain (e.g., serine, threonine, asparagine, or glutamine). Additional similar amino acid pairs include, but are not limited to: phenylalanine and tyrosine; asparagine and glutamine; methionine and cysteine; aspartic acid and glutamic acid; and arginine and lysine. Those skilled in the art will recognize that such conservative amino acid substitutions will likely have minor effects on protein structure and will likely be well tolerated without impairing function. In some embodiments, any amino acid of the amino acid mutations provided herein from one amino acid to threonine can be an amino acid mutation to serine. In some embodiments, any amino acid of the amino acid mutations provided herein from one amino acid to arginine can be an amino acid mutation to lysine. In some embodiments, any amino acid of the amino acid mutations provided herein from one amino acid to isoleucine can be an amino acid mutation to alanine, valine, methionine, or leucine. In some embodiments, any amino acid of the amino acid mutations provided herein from one amino acid to lysine can be an amino acid mutation to arginine. In some embodiments, any amino acid of the amino acid mutations provided herein from one amino acid to aspartic acid can be an amino acid mutation to glutamic acid or asparagine. In some embodiments, any amino acid of the amino acid mutations provided herein from one amino acid to valine can be an amino acid mutation to alanine, isoleucine, methionine, or leucine. In some embodiments, any amino acid of the amino acid mutations provided herein from one amino acid to glycine can be an amino acid mutation to alanine. However, it should be understood that additional conserved amino acid residues would be recognized by one of skill in the art, and any amino acid mutations to other conserved amino acid residues are also within the scope of this disclosure.

いくつかの態様では、Cas9タンパク質は、5'-NAA-3'PAM配列をその3'端に含む標的配列に対して活性を発揮する変異の組み合わせを含む。いくつかの態様では、変異の組み合わせは、表1の列記されているクローンのいずれか1つに存在する。いくつかの態様では、変異の組み合わせは、表1の列記されているクローンの保存的変異である。いくつかの態様では、Cas9タンパク質は、表1に列記されるCas9クローンのいずれか1つの変異の組み合わせを含む。 In some embodiments, the Cas9 protein comprises a combination of mutations that exerts activity against a target sequence that includes a 5'-NAA-3'PAM sequence at its 3' end. In some embodiments, the combination of mutations is present in any one of the clones listed in Table 1. In some embodiments, the combination of mutations is a conservative mutation of the clones listed in Table 1. In some embodiments, the Cas9 protein comprises a combination of mutations of any one of the Cas9 clones listed in Table 1.

表1:NAA PAMクローン

Figure 2020191243000059

Figure 2020191243000060
Table 1: NAA PAM clones
Figure 2020191243000059

Figure 2020191243000060

いくつかの態様では、Cas9タンパク質は、表1のバリアントのいずれか1つによって提供されるCas9タンパク質のアミノ酸配列と少なくとも80%同一であるアミノ酸配列を含む。いくつかの態様では、Cas9タンパク質は、表1のバリアントのいずれか1つによって提供されるCas9タンパク質のアミノ酸配列と少なくとも85%、少なくとも90%、少なくとも92%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも99.5%同一であるアミノ酸配列を含む。 In some embodiments, the Cas9 protein comprises an amino acid sequence that is at least 80% identical to the amino acid sequence of a Cas9 protein provided by any one of the variants in Table 1. In some embodiments, the Cas9 protein comprises an amino acid sequence that is at least 85%, at least 90%, at least 92%, at least 95%, at least 96%, at least 97%, at least 98%, at least 99%, or at least 99.5% identical to the amino acid sequence of a Cas9 protein provided by any one of the variants in Table 1.

いくつかの態様では、Cas9タンパク質は、配列番号18によって提供されるStreptococcus pyogenes Cas9と比較して、標準的なPAM(5'-NGG-3')をその3'端に含まない標的配列に対して増大した活性を発揮する。いくつかの態様では、Cas9タンパク質は、標準的なPAM配列(5'-NGG-3')に直接的に隣接しない3'端を有する標的配列に対して、同じ標的配列に対する配列番号18によって提供されるStreptococcus pyogenes Cas9の活性と比較して、少なくとも5倍増大した活性を発揮する。いくつかの態様では、Cas9タンパク質は、標準的なPAM配列(5'-NGG-3')に直接的に隣接しない標的配列に対して、同じ標的配列に対する配列番号18によって提供されるStreptococcus pyogenesの活性と比較して、少なくとも10倍、少なくとも50倍、少なくとも100倍、少なくとも500倍、少なくとも1,000倍、少なくとも5,000倍、少なくとも10,000倍、少なくとも50,000倍、少なくとも100,000倍、少なくとも500,000倍、または少なくとも1,000,000倍増大した活性を発揮する。いくつかの態様では、標的配列の3'端はAAA、GAA、CAA、またはTAA配列に直接的に隣接する。いくつかの態様では、Cas9タンパク質は、5'-NAC-3'PAM配列をその3'端に含む標的配列に対して活性を発揮する変異の組み合わせを含む。いくつかの態様では、変異の組み合わせは、表2の列記されているクローンのいずれか1つに存在する。いくつかの態様では、変異の組み合わせは、表2の列記されているクローンの保存的変異である。いくつかの態様では、Cas9タンパク質は、表2の列記されているCas9クローンのいずれか1つの変異の組み合わせを含む。 In some embodiments, the Cas9 protein exhibits increased activity against a target sequence that does not include a canonical PAM (5'-NGG-3') at its 3' end, as compared to the Streptococcus pyogenes Cas9 provided by SEQ ID NO: 18. In some embodiments, the Cas9 protein exhibits at least a 5-fold increased activity against a target sequence having a 3' end that is not immediately adjacent to a canonical PAM sequence (5'-NGG-3'), as compared to the activity of the Streptococcus pyogenes Cas9 provided by SEQ ID NO: 18 against the same target sequence. In some embodiments, the Cas9 protein exerts at least 10-fold, at least 50-fold, at least 100-fold, at least 500-fold, at least 1,000-fold, at least 5,000-fold, at least 10,000-fold, at least 50,000-fold, at least 100,000-fold, at least 500,000-fold, or at least 1,000,000-fold increased activity against a target sequence that is not immediately adjacent to a standard PAM sequence (5'-NGG-3') compared to the activity of Streptococcus pyogenes provided by SEQ ID NO: 18 against the same target sequence. In some embodiments, the 3' end of the target sequence is immediately adjacent to an AAA, GAA, CAA, or TAA sequence. In some embodiments, the Cas9 protein comprises a combination of mutations that exerts activity against a target sequence that includes a 5'-NAC-3' PAM sequence at its 3' end. In some embodiments, the combination of mutations is present in any one of the clones listed in Table 2. In some embodiments, the combination of mutations is a conservative mutation of the clones listed in Table 2. In some embodiments, the Cas9 protein comprises a combination of mutations of any one of the Cas9 clones listed in Table 2.

表2:NAC PAMクローン

Figure 2020191243000061

Figure 2020191243000062
Table 2: NAC PAM clones
Figure 2020191243000061

Figure 2020191243000062

いくつかの態様では、Cas9タンパク質は、表2のバリアントのいずれか1つによって提供されるCas9タンパク質のアミノ酸配列と少なくとも80%同一であるアミノ酸配列を含む。いくつかの態様では、Cas9タンパク質は、表2のバリアントのいずれか1つによって提供されるCas9タンパク質のアミノ酸配列と少なくとも85%、少なくとも90%、少なくとも92%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも99.5%同一であるアミノ酸配列を含む。 In some embodiments, the Cas9 protein comprises an amino acid sequence that is at least 80% identical to the amino acid sequence of a Cas9 protein provided by any one of the variants in Table 2. In some embodiments, the Cas9 protein comprises an amino acid sequence that is at least 85%, at least 90%, at least 92%, at least 95%, at least 96%, at least 97%, at least 98%, at least 99%, or at least 99.5% identical to the amino acid sequence of a Cas9 protein provided by any one of the variants in Table 2.

いくつかの態様では、Cas9タンパク質は、配列番号18によって提供されるStreptococcus pyogenes Cas9と比較して、標準的なPAM(5'-NGG-3')をその3'端に含まない標的配列に対して増大した活性を発揮する。いくつかの態様では、Cas9タンパク質は、標準的なPAM配列(5'-NGG-3')に直接的に隣接しない3'端を有する標的配列に対して、同じ標的配列に対する配列番号18によって提供されるStreptococcus pyogenes Cas9の活性と比較して少なくとも5倍増大した活性を発揮する。いくつかの態様では、Cas9タンパク質は、標準的なPAM配列(5'-NGG-3')に直接的に隣接しない標的配列に対して、同じ標的配列に対する配列番号18によって提供されるStreptococcus pyogenesの活性と比較して少なくとも10倍、少なくとも50倍、少なくとも100倍、少なくとも500倍、少なくとも1,000倍、少なくとも5,000倍、少なくとも10,000倍、少なくとも50,000倍、少なくとも100,000倍、少なくとも500,000倍、または少なくとも1,000,000倍増大した活性を発揮する。いくつかの態様では、標的配列の3'端はAAC、GAC、CAC、またはTAC配列に直接的に隣接する。 In some embodiments, the Cas9 protein exhibits increased activity against a target sequence that does not include a canonical PAM (5'-NGG-3') at its 3' end, as compared to the Streptococcus pyogenes Cas9 provided by SEQ ID NO: 18. In some embodiments, the Cas9 protein exhibits at least 5-fold increased activity against a target sequence having a 3' end that is not immediately adjacent to a canonical PAM sequence (5'-NGG-3'), as compared to the activity of the Streptococcus pyogenes Cas9 provided by SEQ ID NO: 18 against the same target sequence. In some embodiments, the Cas9 protein exerts at least 10-fold, at least 50-fold, at least 100-fold, at least 500-fold, at least 1,000-fold, at least 5,000-fold, at least 10,000-fold, at least 50,000-fold, at least 100,000-fold, at least 500,000-fold, or at least 1,000,000-fold increased activity against a target sequence that is not immediately adjacent to a standard PAM sequence (5'-NGG-3') compared to the activity of Streptococcus pyogenes against the same target sequence provided by SEQ ID NO: 18. In some embodiments, the 3' end of the target sequence is immediately adjacent to an AAC, GAC, CAC, or TAC sequence.

いくつかの態様では、Cas9タンパク質は、5'-NAT-3'PAM配列をその3'端に含む標的配列に対して活性を発揮する変異の組み合わせを含む。いくつかの態様では、変異の組み合わせは表3の列記されているクローンのいずれか1つに存在する。いくつかの態様では、変異の組み合わせは、表3の列記されているクローンの保存的変異である。いくつかの態様では、Cas9タンパク質は、表3に列記されるCas9クローンのいずれか1つの変異の組み合わせを含む。 In some embodiments, the Cas9 protein comprises a combination of mutations that exerts activity against a target sequence that includes a 5'-NAT-3'PAM sequence at its 3' end. In some embodiments, the combination of mutations is present in any one of the clones listed in Table 3. In some embodiments, the combination of mutations is a conservative mutation of a clone listed in Table 3. In some embodiments, the Cas9 protein comprises a combination of mutations of any one of the Cas9 clones listed in Table 3.

表3:NAT PAMクローン

Figure 2020191243000063

Figure 2020191243000064
Table 3: NAT PAM clones
Figure 2020191243000063

Figure 2020191243000064

本開示のプライム編集因子に関して用いられ得る種々のnapDNAbpの上の記載は、決して限定することを意味されない。プライム編集因子は、公知であるか、または指向性進化的なもしくは別様の変異プロセスによって作られ得るかもしくは進化させられ得る標準的なSpCas9、またはいずれかのオーソログCas9タンパク質、またはいずれかのバリアントCas9タンパク質を含み得、Cas9のいずれかの天然に存在するバリアント、変異体、または別様に操作されたバージョンを包含する。種々の態様において、Cas9またはCas9バリアント(varant)はニッカーゼ活性を有し、すなわち標的DNA配列の1つの(of)鎖のみを切断する。他の態様において、Cas9またはCas9バリアントは不活性なヌクレアーゼを有し、すなわち「不活性型」Cas9タンパク質である。用いられ得る他のバリアントCas9タンパク質は、標準的なSpCas9よりも小さい分子量を有するか(例えば、より容易な送達のため)または改変もしくは再配置された一次アミノ酸構造(例えば、循環置換体フォーマット)を有するものである。本明細書に記載のプライム編集因子は、収斂進化の結果であるCas12a/Cpf1およびCas12bタンパク質を包含するCas9等価物をもまた含み得る。本願において用いられるnapDNAbp(例えば、SpCas9、Cas9バリアント、またはCas9等価物)は、それらのPAM特異性(specifity)を変改/増強する種々の改変をもまた含有し得る。最後に、本願は、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも99.9%配列同一性を参照Cas9配列、例えば参照SpCas9標準的な配列または参照Cas9等価物(例えば、Cas12a/Cpf1)に対して有するいずれかのCas9、Cas9バリアント、またはCas9等価物を企図する。 The above description of various napDNAbp that may be used in connection with the prime editors of the present disclosure is not meant to be limiting in any way. Prime editors may include standard SpCas9, or any orthologous Cas9 protein, or any variant Cas9 protein, which may be known or created or evolved by directed evolutionary or otherwise mutational processes, including any naturally occurring variant, mutant, or otherwise engineered version of Cas9. In various embodiments, the Cas9 or Cas9 variant has nickase activity, i.e., cleaves only one of the strands of the target DNA sequence. In other embodiments, the Cas9 or Cas9 variant has an inactive nuclease, i.e., is an "inactive" Cas9 protein. Other variant Cas9 proteins that may be used are those that have a smaller molecular weight than standard SpCas9 (e.g., for easier delivery) or have a modified or rearranged primary amino acid structure (e.g., circular permutation format). The prime editors described herein may also include Cas9 equivalents, including Cas12a/Cpf1 and Cas12b proteins that are the result of convergent evolution. The napDNAbps (e.g., SpCas9, Cas9 variants, or Cas9 equivalents) used herein may also contain various modifications that alter/enhance their PAM specificity. Finally, the present application contemplates any Cas9, Cas9 variant, or Cas9 equivalent having at least 70%, at least 75%, at least 80%, at least 85%, at least 90%, at least 91%, at least 92%, at least 93%, at least 94%, at least 95%, at least 96%, at least 97%, at least 98%, at least 99%, or at least 99.9% sequence identity to a reference Cas9 sequence, such as a reference SpCas9 standard sequence or a reference Cas9 equivalent (e.g., Cas12a/Cpf1).

具体的な態様では、拡張されたPAM能力を有するCas9バリアントはSpCas9(H840A)VRQR(配列番号87)であり、これは次のアミノ酸配列を有する(配列番号51のSpCas9(H840A)に対して相対的なV、R、Q、R置換が太字の下線で示されている(show)。加えて、SpCas9(H840)のメチオニン残基はSpCas9(H840A)VRQRでは除去された):

Figure 2020191243000065

Figure 2020191243000066
In a specific embodiment, the Cas9 variant with extended PAM capabilities is SpCas9(H840A)VRQR (SEQ ID NO:87), which has the following amino acid sequence (V, R, Q, R substitutions relative to SpCas9(H840A) of SEQ ID NO:51 are shown in bold and underlined. In addition, the methionine residue of SpCas9(H840) was removed in SpCas9(H840A)VRQR):
Figure 2020191243000065

Figure 2020191243000066

別の具体的な態様では、拡張されたPAM能力を有するCas9バリアントはSpCas9(H840A) VRERであり、これは次のアミノ酸配列を有する(配列番号51のSpCas9(H840A)に対して相対的なV、R、E、R置換が太字の下線で示されている。加えて、SpCas9(H840)のメチオニン残基はSpCas9(H840A)VRERでは除去された):

Figure 2020191243000067

Figure 2020191243000068
In another specific embodiment, the Cas9 variant with extended PAM capabilities is SpCas9(H840A)VRER, which has the following amino acid sequence (V, R, E, R substitutions relative to SpCas9(H840A) of SEQ ID NO:51 are shown in bold and underlined. In addition, the methionine residue of SpCas9(H840) has been removed in SpCas9(H840A)VRER):
Figure 2020191243000067

Figure 2020191243000068

いくつかの態様では、非標準的なPAM配列について機能するnapDNAbpはアルゴノートタンパク質である。かかる核酸プログラム型DNA結合タンパク質の1つの例は、Natronobacterium gregoryiからのアルゴノートタンパク質(NgAgo)である。NgAgoはssDNAによってガイドされるエンドヌクレアーゼである。NgAgoは~24ヌクレオチドの5'リン酸化されたssDNA(gDNA)に結合してそれをその標的部位へとガイドし、gDNA部位においてDNA二本鎖切断を作るであろう。Cas9とは対照的に、NgAgo-gDNAシステムはプロトスペーサー隣接モチーフ(PAM)を要求しない。ヌクレアーゼ不活性なNgAgo(dNgAgo)を用いることは、標的化され得る塩基を多大に拡張し得る。NgAgoの特徴付けおよび使用はGao et al.,Nat Biotechnol.,2016 Jul;34(7):768-73.PubMed PMID: 27136078;Swarts et al.,Nature.507(7491)(2014):258-61;およびSwarts et al.,Nucleic Acids Res.43(10)(2015):5120-9に記載されている。これらの夫々は参照によって本願に組み込まれる。 In some embodiments, the napDNAbp that functions for non-canonical PAM sequences is an Argonaute protein. One example of such a nucleic acid-programmed DNA-binding protein is the Argonaute protein (NgAgo) from Natronobacterium gregoryi. NgAgo is an endonuclease guided by ssDNA. NgAgo will bind and guide ∼24 nucleotide 5' phosphorylated ssDNA (gDNA) to its target site and create a DNA double-strand break at the gDNA site. In contrast to Cas9, the NgAgo-gDNA system does not require a protospacer adjacent motif (PAM). Using a nuclease-inactive NgAgo (dNgAgo) can greatly expand the bases that can be targeted. The characterization and use of NgAgo is described in Gao et al., Nat Biotechnol., 2016 Jul;34(7):768-73. PubMed PMID: 27136078; Swarts et al., Nature.507(7491)(2014):258-61; and Swarts et al., Nucleic Acids Res.43(10)(2015):5120-9, each of which is incorporated herein by reference.

いくつかの態様では、napDNAbpはアルゴノートタンパク質の原核生物ホモログである。アルゴノートタンパク質の原核生物ホモログは知られており、例えばMakarova K.,et al.,"Prokaryotic homologs of Argonaute proteins are predicted to function as key components of a novel system of defense against mobile genetic elements",Biol Direct.2009 Aug 25;4:29.doi:10.1186/1745-6150-4-29に記載されている。これの内容全体は参照によってここに組み込まれる。いくつかの態様では、napDNAbpはMarinitoga piezophila Argunaute(MpAgo)タンパク質である。CRISPR関連Marinitoga piezophila Argunaute(MpAgo)タンパク質は、5'-リン酸化されたガイドを用いて一本鎖標的配列を切断する。5'ガイドは全ての公知のアルゴノートによって用いられる。MpAgo-RNA複合体の結晶構造は、5'リン酸相互作用をブロックする残基を含むガイド鎖結合部位を示す。このデータは、5'ヒドロキシル化されたガイドに対する非標準的な特異性を有するアルゴノートサブクラスの進化を示唆する。例えば、Kaya et al.,"A bacterial Argonaute with noncanonical guide RNA specificity",Proc Natl Acad Sci U S A.2016 Apr 12;113(15):4057-62を見よ。これの内容全体は参照によってここに組み込まれる)。他のargonauteタンパク質が用いられ得、本開示の範囲内であるということは了解されるはずである。 In some embodiments, napDNAbp is a prokaryotic homolog of an Argonaute protein. Prokaryotic homologs of Argonaute proteins are known and are described, for example, in Makarova K., et al., "Prokaryotic homologs of Argonaute proteins are predicted to function as key components of a novel system of defense against mobile genetic elements", Biol Direct. 2009 Aug 25; 4: 29. doi: 10.1186/1745-6150-4-29, the entire contents of which are incorporated herein by reference. In some embodiments, napDNAbp is a Marinintoga piezophila Argunaute (MpAgo) protein. CRISPR-associated Marinintoga piezophila Argunaute (MpAgo) protein cleaves single-stranded target sequences using a 5'-phosphorylated guide. The 5' guide is used by all known Argonautes. The crystal structure of the MpAgo-RNA complex shows a guide strand binding site that includes residues that block the 5' phosphate interaction. This data suggests the evolution of an Argonaute subclass with noncanonical specificity for 5' hydroxylated guides. See, e.g., Kaya et al., "A bacterial Argonaute with noncanonical guide RNA specificity", Proc Natl Acad Sci U S A. 2016 Apr 12;113(15):4057-62, the entire contents of which are incorporated herein by reference. It should be understood that other argonaute proteins may be used and are within the scope of this disclosure.

本開示のいくつかの側面は、異なるPAM特異性を有するCas9ドメインを提供する。典型的には、S.pyogenesからのCas9(spCas9)などのCas9タンパク質は、具体的な核酸領域に結合するためには標準的なNGG PAM配列を要求する。これはゲノム上の所望の塩基を編集する能力を限定し得る。いくつかの態様では、本願において提供される塩基編集融合タンパク質は、精密な位置付けに置かれることを必要とし得る。例えば、ここでは、標的塩基が4塩基領域(例えば、「編集窓」)上に置かれ、これがPAMのおよそ15塩基上流にある。Komor,A.C.,et al.,"Programmable editing of a target base in genomic DNA without double-stranded DNA cleavage"Nature 533,420-424(2016)を見よ。これの内容全体は参照によってここに組み込まれる。従って、いくつかの態様では、本願において提供される融合タンパク質のいずれかは、標準的な(例えば、NGG)PAM配列を含有しないヌクレオチド配列に結合することができるCas9ドメインを含有し得る。非標準的なPAM配列に結合するCas9ドメインは当該技術分野において記載されており、当業者には明らかであろう。例えば、非標準的なPAM配列に結合するCas9ドメインは、Kleinstiver,B.P.,et al.,"Engineered CRISPR-Cas9 nucleases with altered PAM specificities"Nature 523,481-485(2015);およびKleinstiver,B.P.,et al.,"Broadening the targeting range of Staphylococcus aureus CRISPR-Cas9 by modifying PAM recognition" Nature Biotechnology 33,1293-1298(2015)に記載されている;夫々の内容全体は参照によってここに組み込まれる。 Some aspects of the present disclosure provide Cas9 domains with different PAM specificities. Typically, Cas9 proteins, such as Cas9 from S. pyogenes (spCas9), require a standard NGG PAM sequence to bind to a specific nucleic acid region. This may limit the ability to edit a desired base on a genome. In some embodiments, the base editing fusion proteins provided herein may need to be precisely positioned. For example, here, the target base is placed on a 4-base region (e.g., an "editing window") that is approximately 15 bases upstream of the PAM. See Komor, A.C., et al., "Programmable editing of a target base in genomic DNA without double-stranded DNA cleavage," Nature 533, 420-424 (2016), the entire contents of which are incorporated herein by reference. Thus, in some embodiments, any of the fusion proteins provided herein may contain a Cas9 domain that can bind to a nucleotide sequence that does not contain a standard (e.g., NGG) PAM sequence. Cas9 domains that bind to non-canonical PAM sequences have been described in the art and will be apparent to one of skill in the art. For example, Cas9 domains that bind to non-canonical PAM sequences are described in Kleinstiver, B.P., et al., "Engineered CRISPR-Cas9 nucleases with altered PAM specificities" Nature 523, 481-485 (2015); and Kleinstiver, B.P., et al., "Broadening the targeting range of Staphylococcus aureus CRISPR-Cas9 by modifying PAM recognition" Nature Biotechnology 33, 1293-1298 (2015); the entire contents of each are incorporated herein by reference.

例えば、変改されたPAM特異性を有するnapDNAbpドメイン、例えば、次のアミノ酸配列を有する野生型Francisella novicida Cpf1(D917、E1006、およびD1255)(配列番号74)と少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、または少なくとも99%配列同一性を有するドメイン:

Figure 2020191243000069

Figure 2020191243000070
For example, napDNAbp domains with altered PAM specificity, e.g., domains having at least 80%, at least 85%, at least 90%, at least 95%, or at least 99% sequence identity to wild-type Francisella novicida Cpf1 (D917, E1006, and D1255) (SEQ ID NO: 74) having the following amino acid sequence:
Figure 2020191243000069

Figure 2020191243000070

変改されたPAM特異性を有する追加のnapDNAbpドメイン、例えば、次のアミノ酸配列を有する野生型Geobacillus thermodenitrificans Cas9(配列番号75)と少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、または少なくとも99%配列同一性を有するドメイン:

Figure 2020191243000071
Additional napDNAbp domains with altered PAM specificity, for example, domains with at least 80%, at least 85%, at least 90%, at least 95%, or at least 99% sequence identity to the wild-type Geobacillus thermodenitrificans Cas9 (SEQ ID NO: 75) having the following amino acid sequence:
Figure 2020191243000071

いくつかの態様では、核酸プログラム型DNA結合タンパク質(napDNAbp)は、標準的な(NGG)PAM配列を要求しない核酸プログラム型DNA結合タンパク質である。いくつかの態様では、napDNAbpはargonauteタンパク質である。かかる核酸プログラム型DNA結合タンパク質の1つの例はNatronobacterium gregoryiからのアルゴノートタンパク質(NgAgo)である。NgAgoはssDNAによってガイドされるエンドヌクレアーゼである。NgAgoは~24ヌクレオチドの5'リン酸化されたssDNA(gDNA)に結合してそれをその標的部位へとガイドし、gDNA部位においてDNA二本鎖切断を作るであろう。Cas9とは対照的に、NgAgo-gDNAシステムはプロトスペーサー隣接モチーフ(PAM)を要求しない。ヌクレアーゼ不活性なNgAgo(dNgAgo)を用いることは、標的化され得る塩基を多大に拡張し得る。NgAgoの特徴付けおよび使用はGao et al.,Nat Biotechnol.,34(7):768-73(2016),PubMed PMID:27136078;Swarts et al.,Nature,507(7491):258-61(2014);およびSwarts et al.,Nucleic Acids Res.43(10)(2015):5120-9に記載されている。これらの夫々は参照によって本願に組み込まれる。Natronobacterium gregoryi Argonauteの配列は配列番号76によって提供される。 In some embodiments, the nucleic acid programmed DNA binding protein (napDNAbp) is a nucleic acid programmed DNA binding protein that does not require a canonical (NGG) PAM sequence. In some embodiments, the napDNAbp is an argonaute protein. One example of such a nucleic acid programmed DNA binding protein is the Argonaute protein (NgAgo) from Natronobacterium gregoryi. NgAgo is an endonuclease guided by ssDNA. NgAgo will bind and guide ∼24 nucleotide 5' phosphorylated ssDNA (gDNA) to its target site and create a DNA double strand break at the gDNA site. In contrast to Cas9, the NgAgo-gDNA system does not require a protospacer adjacent motif (PAM). Using a nuclease-inactive NgAgo (dNgAgo) can greatly expand the bases that can be targeted. The characterization and use of NgAgo is described in Gao et al., Nat Biotechnol., 34(7):768-73 (2016), PubMed PMID:27136078; Swarts et al., Nature, 507(7491):258-61 (2014); and Swarts et al., Nucleic Acids Res. 43(10)(2015):5120-9, each of which is incorporated herein by reference. The sequence of Natronobacterium gregoryi Argonaute is provided by SEQ ID NO:76.

開示される融合タンパク質は、次のアミノ酸配列を有する野生型Natronobacterium gregoryi Argonaute(配列番号76)と少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、または少なくとも99%配列同一性を有するnapDNAbpドメインを含み得る:

Figure 2020191243000072
The disclosed fusion proteins can include a napDNAbp domain having at least 80%, at least 85%, at least 90%, at least 95%, or at least 99% sequence identity to the wild-type Natronobacterium gregoryi Argonaute (SEQ ID NO:76), which has the following amino acid sequence:
Figure 2020191243000072

加えて、いずれかの利用可能な方法が、バリアントまたは変異体Cas9タンパク質を得るかまたは構築するために利用され得る。本願において用いられる用語「変異」は、別の残基によるある配列、例えば核酸もしくはアミノ酸配列上の残基の置換、またはある配列上の1つ以上の残基の欠失もしくは挿入を言う。変異は、典型的には、元々の残基、次に配列上の残基の位置および新たに置換された残基のアイデンティティーを同定することによって本明細書に記載の。本願において提供されるアミノ酸置換(変異)を作るための種々の方法が当該技術分野において周知であり、例えばGreen and Sambrook,Molecular Cloning:A Laboratory Manual(4th ed.,Cold Spring Harbor Laboratory Press,Cold Spring Harbor,N.Y.(2012))によって提供される。変異は、種々のカテゴリー、例えば1塩基多型、微小重複領域、インデル、および逆位を包含し得、決して限定することを意味されない。変異は、タンパク質活性を縮減または廃止する変異の正常の結果である「機能喪失」変異を包含し得る。ほとんどの機能喪失変異は劣性である。なぜなら、ヘテロ接合体では、第2の染色体コピーが完全に機能的なタンパク質をコードする遺伝子の未変異のバージョンを持ち、この存在が変異の効果を補償するからである。変異は、「機能獲得」変異をもまた包摂する。これは、正常な条件下ではさもなければ存在しない異常な活性をタンパク質または細胞に付与するものである。多くの機能獲得変異はコード領域よりもむしろ制御配列にあり、よって、いくつもの帰結を有し得る。例えば、変異は、1つ以上の遺伝子が間違った組織において発現されることに至り得、これらの組織は、それらが正常では欠く機能を獲得する。それらの性質ゆえに、機能獲得変異は通常は優性である。 In addition, any available method may be utilized to obtain or construct variant or mutant Cas9 proteins. The term "mutation" as used herein refers to the substitution of a residue on a sequence, e.g., a nucleic acid or amino acid sequence, with another residue, or the deletion or insertion of one or more residues on a sequence. Mutations are typically described herein by identifying the original residue, then the position of the residue on the sequence, and the identity of the newly substituted residue. Various methods for making amino acid substitutions (mutations) provided herein are well known in the art, and are provided, for example, by Green and Sambrook, Molecular Cloning: A Laboratory Manual (4th ed., Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y. (2012)). Mutations may encompass a variety of categories, e.g., single nucleotide polymorphisms, microduplication regions, indels, and inversions, and are in no way meant to be limiting. Mutations may encompass "loss-of-function" mutations, which are the normal consequence of a mutation that reduces or abolishes protein activity. Most loss-of-function mutations are recessive. Because in heterozygotes, the second chromosomal copy carries a fully functional, unmutated version of the gene that codes for the protein, the presence of which compensates for the effect of the mutation. Mutations also encompass "gain-of-function" mutations, which confer an abnormal activity to a protein or cell that is not otherwise present under normal conditions. Many gain-of-function mutations are in regulatory sequences rather than coding regions and therefore can have a number of consequences. For example, a mutation can lead to one or more genes being expressed in the wrong tissues, and these tissues gain a function that they normally lack. By their nature, gain-of-function mutations are usually dominant.

変異は部位特異的変異導入を用いて参照Cas9タンパク質上に導入され得る。当該技術分野で公知の部位特異的変異導入のより古い方法は、一本鎖DNA鋳型の単離を許すM13バクテリオファージベクターなどのベクター上への変異させられるべき配列のサブクローニングに依拠する。これらの方法では、変異誘発プライマー(すなわち、変異させられるべき部位にアニールすることができるが、変異させられるべき部位に1つ以上のミスマッチのヌクレオチドを持つプライマー)を一本鎖鋳型にアニーリングさせ、それから、変異誘発プライマーの3'端からスタートして鋳型の相補体を重合する。それから、もたらされた二重鎖はホスト細菌に形質転換され、プラークが所望の変異についてスクリーニングされる。より最近では、部位特異的変異導入はPCR方法論を使用している。これらは一本鎖鋳型を要求しないという利点を有する。加えて、サブクローニングを要求しない方法が開発されている。PCRに基づく部位特異的変異導入が行われるときには、いくつかのイシューが考慮されなければならない。第1に、これらの方法では、ポリメラーゼによって導入される望まれない変異の拡張を防止するために、PCRサイクル数を縮減することが望ましい。第2に、反応中に残存する変異していない親の分子の数を縮減するために、セレクションが使用されなければならない。第3に、単一のPCRプライマーセットの使用を許すために、伸長された長さのPCR法が好ましい。そして第4に、いくつかの熱安定性ポリメラーゼの非鋳型依存性末端伸長活性ゆえに、多くの場合には、PCRによって生成された変異体産物の平滑末端ライゲーションに先行して、端を磨くステップを手続きに組み込むことが必要である。 Mutations can be introduced into the reference Cas9 protein using site-directed mutagenesis. Older methods of site-directed mutagenesis known in the art rely on subcloning of the sequence to be mutated onto a vector, such as the M13 bacteriophage vector, that allows the isolation of a single-stranded DNA template. In these methods, a mutagenic primer (i.e., a primer that can anneal to the site to be mutated but has one or more mismatched nucleotides at the site to be mutated) is annealed to the single-stranded template, and then the complement of the template is polymerized starting from the 3' end of the mutagenic primer. The resulting duplex is then transformed into a host bacterium and plaques are screened for the desired mutation. More recently, site-directed mutagenesis has used PCR methodologies. These have the advantage of not requiring a single-stranded template. In addition, methods have been developed that do not require subcloning. When PCR-based site-directed mutagenesis is performed, several issues must be considered. First, in these methods, it is desirable to reduce the number of PCR cycles to prevent the extension of unwanted mutations introduced by the polymerase. Second, selection must be used to reduce the number of unmutated parental molecules remaining in the reaction. Third, extended-length PCR methods are preferred to allow the use of a single PCR primer set. And fourth, due to the non-template-dependent end-extension activity of some thermostable polymerases, it is often necessary to incorporate an end-polishing step into the procedure prior to blunt-end ligation of the mutant products generated by PCR.

変異は、指向性進化プロセス、例えばファージによって補助される連続的進化(PACE)またはファージによって補助される非連続的進化(PANCE)によってもまた導入され得る。本願において用いられる用語「ファージによって補助される連続的進化(PACE)」は、ファージをウイルスベクターとして使用する連続的進化を言う。PACEテクノロジーの一般概念は、例えば、2010年3月11日にWO2010/028347として公開された2009年9月8日出願の国際PCT出願PCT/US2009/056194;2012年6月28日にWO2012/088381として公開された2011年12月22日出願の国際PCT出願PCT/US2011/066747;2015年5月5日登録のU.S.出願U.S.特許No.9,023,594、2015年9月11日にWO2015/134121として公開された2015年1月20日出願の国際PCT出願PCT/US2015/012022、および2016年10月20日にWO2016/168631として公開された2016年4月15日出願の国際PCT出願PCT/US2016/027795に記載されている。これらの夫々の内容全体は参照によって本願に組み込まれる。バリアントCas9はファージによって補助される非連続的進化(PANCE)によってもまた得られ得る。本願において用いられるこれは、ファージをウイルスベクターとして使用する非連続的進化を言う。PANCEは急速なインビボの指向性進化のための単純化された技術であり、新しいE.coliホスト細胞による進化させられるべき目当ての遺伝子を含有する進化する「セレクションファージ」(SP)の連続フラスコ植え継ぎを用い、それによって、ホストE.coli内の遺伝子が一定に保たれることを許しながら、SPに含有される遺伝子は連続的に進化する。連続フラスコ植え継ぎは微生物の実験室進化のための広くアクセス可能なアプローチとして長く用をなしており、より最近では、バクテリオファージ進化のための類縁のアプローチが開発されている。PANCEシステムはPACEシステムよりも低いストリンジェンシーを特色とする。 Mutations can also be introduced by directed evolution processes, such as phage-assisted continuous evolution (PACE) or phage-assisted discontinuous evolution (PANCE). The term "phage-assisted continuous evolution (PACE)" as used herein refers to continuous evolution using phages as viral vectors. The general concept of PACE technology is described, for example, in International PCT application PCT/US2009/056194, filed September 8, 2009, published as WO2010/028347 on March 11, 2010; International PCT application PCT/US2011/066747, filed December 22, 2011, published as WO2012/088381 on June 28, 2012; and International PCT application PCT/US2011/066747, filed December 22, 2011, published as WO2012/088381 on May 5, 2015, in the U.S. US Patent No. 9,023,594, International PCT Application PCT/US2015/012022, filed January 20, 2015, published as WO2015/134121 on September 11, 2015, and International PCT Application PCT/US2016/027795, filed April 15, 2016, published as WO2016/168631 on October 20, 2016, the entire contents of each of which are incorporated herein by reference. Variant Cas9 can also be obtained by phage-assisted non-linear evolution (PANCE). As used herein, this refers to non-linear evolution using phage as a viral vector. PANCE is a simplified technique for rapid in vivo directed evolution that uses serial flask transfer of evolving "selection phage" (SP) containing the gene of interest to be evolved with new E. coli host cells, whereby the gene contained in the SP is continuously evolved while allowing the gene in the host E. coli to be held constant. Serial flask transfer has long served as a widely accessible approach for the laboratory evolution of microorganisms, and more recently, a related approach has been developed for bacteriophage evolution. The PANCE system features lower stringency than the PACE system.

Cas9またはCas9等価物に関する上に記されている参照のいずれかは、すでにそのように申し立てられていない場合には、それらの全体が参照によってここに組み込まれる。 Any of the references set forth above regarding Cas9 or Cas9 equivalents are hereby incorporated by reference in their entirety unless already so claimed.

J.分裂されたPE送達のための割られたnapDNAbpドメイン
種々の態様において、本明細書に記載のプライム編集因子は2つ以上のフラグメントとして細胞に送達され得、これらは、細胞内において、再構成されたプライム編集因子へとアセンブリされるようになる(受動的アセンブリによるか、または分裂インテイン配列を用いることなどの能動的アセンブリによる)。いくつかのケースでは、自己アセンブリは受動的であり得、これによって、2つ以上のプライム編集因子フラグメントは細胞内で共有結合的にまたは非共有結合的に会合してプライム編集因子を再構成する。他のケースでは、自己アセンブリはフラグメントの夫々に組み入れされた二量体化ドメインによって触媒され得る。二量体化ドメインの例は本明細書に記載の。なお他のケースでは、自己アセンブリは、プライム編集因子フラグメントの夫々に組み入れされた分裂インテイン配列によって触媒され得る。
J. Split napDNAbp domain for split PE delivery
In various embodiments, the prime editors described herein can be delivered to cells as two or more fragments that become assembled into a reconstituted prime editor within the cell (either by passive assembly or by active assembly, such as by using a split intein sequence). In some cases, the self-assembly can be passive, whereby two or more prime editor fragments covalently or non-covalently associate within the cell to reconstitute the prime editor. In other cases, the self-assembly can be catalyzed by a dimerization domain incorporated into each of the fragments. Examples of dimerization domains are described herein. In yet other cases, the self-assembly can be catalyzed by a split intein sequence incorporated into each of the prime editor fragments.

分裂されたPE送達は、異なる送達アプローチの種々のサイズ制約に対処するために有利であり得る。例えば、送達アプローチは、ウイルスに基づく送達方法、メッセンジャーRNAに基づく送達方法、またはRNPに基づく送達(リボヌクレオタンパク質に基づく送達)を包含し得る。そして、送達のこれらの方法の夫々は、プライム編集因子をより小さいピースへと割ることによって、より効率的および/または有効であり得る。ひとたび細胞内においては、より小さいピースは機能的なプライム編集因子へとアセンブリし得る。分裂の手段に依存して、割られたプライム編集因子フラグメントは非共有結合的様式または共有結合的様式で再アセンブリされてプライム編集因子を再形成し得る。1つの態様では、プライム編集因子は1つ以上の分裂部位において2つ以上のフラグメントへと分裂され得る。フラグメントは(分裂される以外は)未改変であり得る。ひとたびフラグメントが細胞に送達されると(例えば、リボヌクレオタンパク質複合体の直接的送達によるか、または核酸送達、例えばmRNA送達もしくはウイルスベクターに基づく送達による)、フラグメントは共有結合的にまたは非共有結合的に再会合してプライム編集因子を再構成し得る。別の態様では、プライム編集因子は1つ以上の分裂部位において2つ以上のフラグメントへと分裂され得る。フラグメントの夫々は二量体化ドメインを含むように改変され得、これによって、形成された各フラグメントは二量体化ドメインにカップリングされる。ひとたび細胞内に送達または発現されると、異なるフラグメントの二量体化ドメイン同士は会合し、互いに結合し、異なるプライム編集因子フラグメントを一緒に持って来て、機能的なプライム編集因子を再形成する。さらに別の態様では、プライム編集因子フラグメントは分裂インテインを含むように改変され得る。ひとたび細胞内に送達または発現されると、異なるフラグメントの分裂インテインドメイン同士は会合し、互いに結合し、それからトランススプライシングを経過する。これが、フラグメントの夫々からの分裂インテインドメインの切除と、フラグメント間のペプチド結合の付随的形成とをもたらし、それによってプライム編集因子を復元する。 Split PE delivery can be advantageous to address the various size constraints of different delivery approaches. For example, delivery approaches can include viral-based delivery methods, messenger RNA-based delivery methods, or RNP-based delivery (ribonucleoprotein-based delivery). And each of these methods of delivery can be more efficient and/or effective by splitting the prime editor into smaller pieces. Once inside the cell, the smaller pieces can assemble into a functional prime editor. Depending on the means of splitting, the split prime editor fragments can reassemble in a non-covalent or covalent manner to reform the prime editor. In one embodiment, the prime editor can be split into two or more fragments at one or more split sites. The fragments can be unmodified (other than being split). Once the fragments are delivered to the cell (e.g., by direct delivery of the ribonucleoprotein complex or by nucleic acid delivery, e.g., mRNA delivery or viral vector-based delivery), the fragments can covalently or non-covalently reassemble to reconstitute the prime editor. In another embodiment, the prime editor can be split into two or more fragments at one or more split sites. Each of the fragments can be modified to include a dimerization domain, whereby each formed fragment is coupled to the dimerization domain. Once delivered or expressed in a cell, the dimerization domains of the different fragments associate and bind to each other, bringing the different prime editor fragments together to reform a functional prime editor. In yet another embodiment, the prime editor fragment can be modified to include a split intein. Once delivered or expressed in a cell, the split intein domains of the different fragments associate and bind to each other and then undergo trans-splicing. This results in the excision of the split intein domain from each of the fragments and the concomitant formation of peptide bonds between the fragments, thereby restoring the prime editor.

1つの態様では、プライム編集因子は分裂インテインアプローチを用いて送達され得る。 In one embodiment, the primed editing factor can be delivered using a split-intein approach.

分裂部位の位置付けは、プライム編集因子上の残基のいずれか1つ以上のペアの間に、ならびにnapDNAbpドメイン、ポリメラーゼドメイン(例えば、RTドメイン)、napDNAbpドメインおよびポリメラーゼドメインを連結するリンカードメイン内を包含するその中のいずれかのドメイン上に、位置取り得る。 The location of the division site may be between any one or more pairs of residues on the prime editor, as well as on any domain therein, including within the napDNAbp domain, the polymerase domain (e.g., the RT domain), and the linker domain connecting the napDNAbp domain and the polymerase domain.

図66に図示される1つの態様では、プライム編集因子(PE)はnapDNAbp上の分裂部位において割られる。 In one embodiment, illustrated in Figure 66, the prime editor (PE) is cleaved at the cleavage site on the napDNAbp.

ある態様において、napDNAbpは次のとおり配列番号18の標準的なSpCas9ポリペプチドである:

Figure 2020191243000073
In one embodiment, the napDNAbp is a standard SpCas9 polypeptide of SEQ ID NO: 18, as follows:
Figure 2020191243000073

ある態様において、SpCas9は、配列番号18の標準的なSpCas9の残基1および2、もしくは2および3、もしくは3および4、もしくは4および5、もしくは5および6、もしくは6および7、もしくは7および8、もしくは8および9、もしくは9および10の間に位置付けられた分裂部位において、または残基1~10、10~20、20~30、30~40、40~50、50~60、60~70、70~80、80~90、90~100、100~200、200~300、300~400、400~500、500~600、600~700、700~800、800~900、1000~1100、1100~1200、1200~1300、もしくは1300~1368の間のどこかに位置付けられた残基のいずれかの2つのペアの間において、2つのフラグメントへと分裂される。 In some embodiments, SpCas9 is located at a division site located between residues 1 and 2, or 2 and 3, or 3 and 4, or 4 and 5, or 5 and 6, or 6 and 7, or 7 and 8, or 8 and 9, or 9 and 10 of the standard SpCas9 of SEQ ID NO:18, or between residues 1-10, 10-20, 20-30, 30-40, 40-50, 50-60, 6 It is split into two fragments between any two pairs of residues located anywhere between 0-70, 70-80, 80-90, 90-100, 100-200, 200-300, 300-400, 400-500, 500-600, 600-700, 700-800, 800-900, 1000-1100, 1100-1200, 1200-1300, or 1300-1368.

ある態様において、napDNAbpは、配列番号18の標準的なSpCas9の位置1~10、10~20、20~30、30~40、40~50、50~60、60~70、70~80、80~90、90~100、100~200、200~300、300~400、400~500、500~600、600~700、700~800、800~900、1000~1100、1100~1200、1200~1300、または1300~1368の間のどこかに位置付けられた残基のいずれか2つのペアに対応する残基のペアに位置付けられる分裂部位において、2つのフラグメントへと分裂される。 In some embodiments, the napDNAbp is split into two fragments at a split site located at a pair of residues corresponding to any two pairs of residues located anywhere between positions 1-10, 10-20, 20-30, 30-40, 40-50, 50-60, 60-70, 70-80, 80-90, 90-100, 100-200, 200-300, 300-400, 400-500, 500-600, 600-700, 700-800, 800-900, 1000-1100, 1100-1200, 1200-1300, or 1300-1368 of the standard SpCas9 of SEQ ID NO:18.

ある態様において、SpCas9は、配列番号18の標準的なSpCas9の残基1および2、もしくは2および3、もしくは3および4、もしくは4および5、もしくは5および6、もしくは6および7、もしくは7および8、もしくは8および9、もしくは9および10の間に位置付けられた分裂部位において、または残基1~10、10~20、20~30、30~40、40~50、50~60、60~70、70~80、80~90、90~100、100~200、200~300、300~400、400~500、500~600、600~700、700~800、800~900、1000~1100、1100~1200、1200~1300、もしくは1300~1368の間のどこかに位置付けられた残基のいずれか2つのペアの間において、2つのフラグメントへと分裂される。ある態様において、分裂部位は、1つ以上のポリペプチド結合部位(すなわち、「分裂部位または分裂インテイン分裂部位」)に位置付けられ、分裂インテインに融合され、それから、別個にコードされる融合タンパク質として細胞に送達される。ひとたび分裂インテイン融合タンパク質同士(すなわち、タンパク質の半分同士)が細胞内で発現されると、タンパク質はトランススプライシングを経過して、連結された分裂インテイン配列の付随的除去によって完全なまたは丸ごとのPEを形成する。 In some embodiments, SpCas9 is expressed at a division site located between residues 1 and 2, or 2 and 3, or 3 and 4, or 4 and 5, or 5 and 6, or 6 and 7, or 7 and 8, or 8 and 9, or 9 and 10 of the standard SpCas9 of SEQ ID NO:18, or between residues 1-10, 10-20, 20-30, 30-40, 40-50, 50-60, The fragment is split into two fragments between any two pairs of residues located anywhere between 60-70, 70-80, 80-90, 90-100, 100-200, 200-300, 300-400, 400-500, 500-600, 600-700, 700-800, 800-900, 1000-1100, 1100-1200, 1200-1300, or 1300- 1368. In some embodiments, the split site is located at one or more polypeptide binding sites (i.e., the "split site or split-intein split site") and fused to the split intein, which is then delivered to the cell as a separately encoded fusion protein. Once the split-intein fusion proteins (i.e., the protein halves) are expressed in a cell, the proteins undergo trans-splicing to form the complete or whole PE with the concomitant removal of the linked split-intein sequence.

例えば、図66に示されているとおり、N末端エクステインは第1の分裂インテイン(例えば、Nインテイン)に融合され得、C末端エクステインは第2の分裂インテイン(例えば、Cインテイン)に融合され得る。細胞内におけるNインテインおよびCインテインの自己会合、次にそれらの自己切除と丸ごとのプライム編集因子(PE)のN末端エクステインおよびC末端エクステイン部分の間のペプチド結合の付随的形成とによって、N末端エクステインはC末端エクステインに融合されるようになって、napDNAbpドメインおよびポリメラーゼドメイン(例えば、RTドメイン)を含む丸ごとのプライム編集因子融合タンパク質を再形成する。 For example, as shown in FIG. 66, the N-terminal extein can be fused to a first split intein (e.g., N intein) and the C-terminal extein can be fused to a second split intein (e.g., C intein). Upon self-association of the N and C inteins in the cell, followed by their self-excision and concomitant formation of a peptide bond between the N-terminal and C-terminal extein portions of the whole prime editor (PE), the N-terminal extein becomes fused to the C-terminal extein to reform the whole prime editor fusion protein including the napDNAbp domain and the polymerase domain (e.g., RT domain).

分裂インテインを用いる分裂されたPE送達戦略を利するためには、プライム編集因子は、1つ以上の分裂部位において割られて、プライム編集因子の少なくとも2つの別個の半分を生出することを必要とする。これらの夫々は、各半分が分裂インテイン配列に融合される場合には、細胞内で再連結され得る。 To take advantage of a split PE delivery strategy using split inteins, the prime editor needs to be split at one or more split sites to generate at least two separate halves of the prime editor, each of which can be rejoined within the cell when each half is fused to a split intein sequence.

ある態様において、プライム編集因子は単一の分裂部位において分裂される。ある種の他の態様において、プライム編集因子は2つの分裂部位、もしくは3つの分裂部位、もしくは4つの分裂部位、またはより多くにおいて分裂される。 In some embodiments, the prime editing factor is split at a single division site. In certain other embodiments, the prime editing factor is split at two division sites, or three division sites, or four division sites, or more.

好ましい態様では、プライム編集因子は単一の分裂部位において分裂されて、プライム編集因子の2つの別個の半分を生出する。これらの夫々は分裂インテイン配列に融合され得る。 In a preferred embodiment, the prime editor is split at a single split site to generate two separate halves of the prime editor, each of which can be fused to a split intein sequence.

例示の分裂インテインはSsp DnaEインテインであり、これは2つのサブユニットつまりDnaE-NおよびDnaE-Cを含む。2つの異なるサブユニットは別個の遺伝子つまりdnaE-nおよびdnaE-cによってコードされ、これらは夫々DnaE-NおよびDnaE-Cサブユニットをコードする。DnaEはSynechocytis sp. PCC6803の天然に存在する分裂インテインであり、夫々がDnaE-NまたはDnaE-Cどちらかとの融合体を含む2つの別個のタンパク質のトランススプライシングを導くことができる。 An exemplary split intein is the Ssp DnaE intein, which contains two subunits, DnaE-N and DnaE-C. The two distinct subunits are encoded by separate genes, dnaE-n and dnaE-c, which encode the DnaE-N and DnaE-C subunits, respectively. DnaE is a naturally occurring split intein in Synechocytis sp. PCC6803 that can direct the trans-splicing of two separate proteins, each of which contains a fusion with either DnaE-N or DnaE-C.

追加の天然に存在するかまたは操作された分裂インテイン配列は当該技術分野で公知であるか、または本明細書に記載の丸ごとのインテイン配列もしくは当該技術分野で利用可能なものから作られ得る。分裂インテイン配列の例はStevens et al.,"A promiscuous split intein with expanded protein engineering applications,"PNAS,2017,Vol.114:8538-8543;Iwai et al.,"Highly efficient protein trans-splicing by a naturally split DnaE intein from Nostc punctiforme,FEBS Lett,580:1853-1858に見出され得る。これらの夫々は参照によって本願に組み込まれる。追加の分裂インテイン配列は例えばWO2013/045632、WO2014/055782、WO2016/069774、およびEP2877490に見出され得る。これらの夫々の内容は参照によって本願に組み込まれる。 Additional naturally occurring or engineered split intein sequences are known in the art or can be made from whole intein sequences described herein or available in the art. Examples of split intein sequences can be found in Stevens et al., "A promiscuous split intein with expanded protein engineering applications," PNAS, 2017, Vol. 114: 8538-8543; Iwai et al., "Highly efficient protein trans-splicing by a naturally split DnaE intein from Nostc punctiforme, FEBS Lett, 580: 1853-1858, each of which is incorporated herein by reference. Additional split intein sequences can be found, for example, in WO2013/045632, WO2014/055782, WO2016/069774, and EP2877490, the contents of each of which are incorporated herein by reference.

加えて、トランスのタンパク質スプライシングがインビボおよびin vitroで記載されており(Shingledecker,et al.,[0076]Gene 207:187(1998),Southworth,et al.,EMBO J.17:918(1998);Mills, et al.,Proc.Natl.Acad.Sci.USA,95:3543-3548(1998);Lew,et al.,J.Biol.Chem.,273:15887-15890(1998);Wu,et al.,Biochim.Biophys.Acta 35732:1(1998b),Yamazaki,et al.,J.Am.Chem.Soc.120:5591(1998),Evans,et al.,J.Biol.Chem.275:9091(2000);Otomo,et al.,Biochemistry 38:16040-16044(1999);Otomo,et al.,J.Biolmol.NMR 14:105-114(1999);Scott,et al.,Proc.Natl.Acad.Sci.USA 96:13638-13643(1999))、2つの不活性なフラグメントとして(as to)タンパク質を発現するための機会を提供し、これらは爾後にライゲーションを経過して機能的な産物を形成する。例えば、2つの別個に発現された半分からの完全なPE融合タンパク質の形成について、図66および67に示されているとおりである。 In addition, protein splicing in trans has been described in vivo and in vitro (Shingledecker, et al., Gene 207:187 (1998); Southworth, et al., EMBO J. 17:918 (1998); Mills, et al., Proc. Natl. Acad. Sci. USA, 95:3543-3548 (1998); Lew, et al., J. Biol. Chem., 273:15887-15890 (1998); Wu, et al., Biochim. Biophys. Acta 35732:1 (1998b); Yamazaki, et al., J. Am. Chem. Soc. 120:5591 (1998); Evans, et al. al., J. Biol. Chem. 275:9091 (2000); Otomo, et al., Biochemistry 38:16040-16044 (1999); Otomo, et al., J. Biomol. NMR 14:105-114 (1999); Scott, et al., Proc. Natl. Acad. Sci. USA 96:13638-13643 (1999)), providing the opportunity to express a protein as two inactive fragments which then undergo ligation to form a functional product, as shown, for example, in Figures 66 and 67 for the formation of a complete PE fusion protein from two separately expressed halves.

本明細書に記載の種々の態様では、連続的進化法(例えばPACE)が塩基編集因子の第1の部分を進化させるために用いられ得る。第1の部分は、単一の構成要素またはドメイン、例えばCas9ドメイン、デアミナーゼドメイン、またはUGIドメインを包含し得る。それから、進化した部分および残りの未進化の部分両方を分裂インテインポリペプチドドメインと共に別個に発現することによって、別個に進化した構成要素またはドメインは、細胞内において塩基編集因子の残りの部分に融合され得る。第1の部分は、より幅広く、本明細書に記載の連続的進化方法を用いて進化させられることを望まれる塩基編集因子のいずれかの第1のアミノ酸部分を包含し得る。第2の部分は、この態様では、本願の方法を用いて進化させられない塩基編集因子の残りのアミノ酸部分を言うであろう。塩基編集因子の進化した第1の部分および第2の部分は、夫々が分裂インテインポリペプチドドメインと共に細胞によって発現され得る。細胞の天然のタンパク質スプライシング機序は、進化した第1の部分および未進化の第2の部分を再アセンブリして、単一の融合タンパク質の進化した塩基編集因子を形成するであろう。進化した第1の部分は、単一の融合タンパク質のNまたはC末端パーツどちらかを含み得る。類縁の様式で、第2の直交的なトランススプライシングインテインペアの使用は、進化した第1の部分が単一の融合タンパク質の内部のパーツを含むことを許し得る。 In various embodiments described herein, continuous evolution methods (e.g., PACE) can be used to evolve a first portion of a base editor. The first portion can include a single component or domain, such as a Cas9 domain, a deaminase domain, or a UGI domain. The separately evolved component or domain can then be fused to the remaining portion of the base editor in the cell by separately expressing both the evolved portion and the remaining unevolved portion together with the split-intein polypeptide domain. The first portion can more broadly include any first amino acid portion of the base editor that is desired to be evolved using the continuous evolution methods described herein. The second portion, in this embodiment, would refer to the remaining amino acid portion of the base editor that is not evolved using the methods of the present application. The evolved first and second portions of the base editor can each be expressed by the cell together with the split-intein polypeptide domain. The cell's natural protein splicing machinery will reassemble the evolved first portion and the unevolved second portion to form a single fusion protein evolved base editor. The evolved first portion can include either the N- or C-terminal parts of a single fusion protein. In an analogous manner, the use of a second orthogonal trans-splicing intein pair can allow the evolved first portion to include internal parts of a single fusion protein.

それゆえに、細胞内における進化したおよび未進化の構成要素を含む完全な塩基編集因子の形成を容易化するために、本明細書に記載の塩基編集因子の進化したおよび未進化の構成要素のいずれかは、分裂インテインタグと共に発現され得る。 Thus, to facilitate the formation of a complete base editor containing evolved and unevolved components in a cell, any of the evolved and unevolved components of the base editors described herein can be expressed with a split intein tag.

タンパク質スプライシングプロセスの機序は多大に詳細に研究されており(Chong,et al.,J.Biol.Chem.1996,271,22159-22168;Xu,M-Q & Perler,F.B.EMBO Journal,1996,15,5146-5153)、保存されたアミノ酸がインテインおよびエクステインスプライシング点に見出されている(Xu,et al.,EMBO Journal,1994,13 5517-522)。本明細書に記載の構築物は、第1の遺伝子(例えば、塩基編集因子の進化した部分)の5'末端に融合されたインテイン配列を含有する。好適なインテイン配列は、タンパク質スプライシングエレメントを含有することが公知のタンパク質のいずれかから選択され得る。全ての公知のインテインを含有するデータベースはワールドワイドウェブ上に見出され得る(Perler,F.B.Nucleic Acids Research,1999,27,346-347)。インテイン配列は3'端において第2の遺伝子の5'端に融合される。ある種のオルガネラへのこの遺伝子の標的化のためには、ペプチドシグナルが遺伝子のコード配列に融合され得る。第2の遺伝子の後に、インテイン遺伝子配列は、同じ細胞における複数のタンパク質の発現のために所望の回数だけ繰り返され得る。マルチインテイン含有構築物では、異なるソースからのインテイン要素を用いることが有用であり得る。発現されるべき最後の遺伝子の配列の後には、転写終結配列が挿入されなければならない。1つの態様では、それがインテインからのエクステインの切除を触媒すると共にエクステインのライゲーションを防止し得るようにして、改変されたインテインスプライシング単位がデザインされる。Pyrococcus種GB-D DNAポリメラーゼ上のC末端エクステインジャンクションの変異導入は、変改されたスプライシングエレメントを生ずることが見出された。これは、エクステインおよびインテインの切断を誘導するが、エクステインの爾後のライゲーションを防止する(Xu,M-Q & Perler,F.B.EMBO Journal,1996,15,5146-5153)。セリン538からアラニンまたはグリシンどちらかへの変異は、切断を誘導したが、ライゲーションを防止した。インテインへのC末端エクステインジャンクションにおけるアミノ酸の保存を原因として、他のインテインスプライシング単位における同等残基の変異もまたエクステインライゲーションを防止するはずである。エンドヌクレアーゼドメインを含有しない好ましいインテインは、Mycobacterium xenopi GyrAタンパク質である(Telenti,et al.J.Bacteriol.1997,179,6378-6382)。他は天然に見出されているか、またはインテインを含有するエンドヌクレアーゼからエンドヌクレアーゼドメインを除去することによって人工的に生出されている(Chong,et al.J.Biol.Chem.1997,272,15587-15590)。好ましい態様では、インテインは、それがスプライシング機能を果たすために必要とされる最小限の数のアミノ酸からなるようにして選択され、例えばMycobacterium xenopi GyrAタンパク質からのインテインである(Telenti,A.,et al.,J.Bacteriol.1997,179,6378-6382)。代替的な態様では、エンドヌクレアーゼ活性なしのインテインが選択され、例えばMycobacterium xenopi GyrAタンパク質からのインテイン、またはエンドヌクレアーゼドメインを除去するように改変されたSaccharaomyces cerevisiae VMAインテインである(Chong,1997)。インテインスプライシング単位のさらなる改変は、切断反応の反応速度が変改されることを許し得、スプライシング単位の遺伝子配列を単純に改変することによって、タンパク質用量がコントロールされることを許す。 The mechanism of protein splicing process has been studied in great detail (Chong, et al., J. Biol. Chem. 1996, 271, 22159-22168; Xu, M-Q & Perler, F.B. EMBO Journal, 1996, 15, 5146-5153), and conserved amino acids have been found at intein and extein splicing points (Xu, et al., EMBO Journal, 1994, 13 5517-522). The constructs described herein contain an intein sequence fused to the 5' end of a first gene (e.g., an evolved portion of a base editor). A suitable intein sequence can be selected from any of the proteins known to contain protein splicing elements. A database containing all known inteins can be found on the World Wide Web (Perler, F.B. Nucleic Acids Research, 1999, 27, 346-347). The intein sequence is fused at its 3' end to the 5' end of a second gene. For targeting of this gene to certain organelles, a peptide signal can be fused to the coding sequence of the gene. After the second gene, the intein gene sequence can be repeated as many times as desired for expression of multiple proteins in the same cell. In a multi-intein-containing construct, it can be useful to use intein elements from different sources. After the sequence of the last gene to be expressed, a transcription termination sequence must be inserted. In one embodiment, a modified intein splicing unit is designed such that it can catalyze the excision of the extein from the intein and prevent the ligation of the extein. Mutagenesis of the C-terminal extein junction on Pyrococcus species GB-D DNA polymerase was found to result in an altered splicing element. This induces cleavage of the extein and intein but prevents subsequent ligation of the extein (Xu, M-Q & Perler, F.B. EMBO Journal, 1996, 15, 5146-5153). Mutation of serine 538 to either alanine or glycine induced cleavage but prevented ligation. Due to conservation of amino acids at the C-terminal extein junction to the intein, mutation of equivalent residues in other intein splicing units should also prevent extein ligation. A preferred intein that does not contain an endonuclease domain is the Mycobacterium xenopi GyrA protein (Telenti, et al. J. Bacteriol. 1997, 179, 6378-6382). Others are found in nature or have been artificially generated by removing the endonuclease domain from an intein-containing endonuclease (Chong, et al. J. Biol. Chem. 1997, 272, 15587-15590). In a preferred embodiment, the intein is selected such that it consists of the minimal number of amino acids required to perform the splicing function, such as the intein from Mycobacterium xenopi GyrA protein (Telenti, A., et al., J. Bacteriol. 1997, 179, 6378-6382). In an alternative embodiment, an intein without endonuclease activity is selected, such as the intein from Mycobacterium xenopi GyrA protein, or the Saccharomyces cerevisiae VMA intein modified to remove the endonuclease domain (Chong, 1997). Further modification of the intein splicing unit may allow the kinetics of the cleavage reaction to be altered, allowing protein dosage to be controlled by simply modifying the genetic sequence of the splicing unit.

インテインは2つの別個に転写および翻訳される遺伝子によってコードされる2つのフラグメントとしてもまた存在し得る。これらのいわゆる分裂インテインは自己会合し、タンパク質スプライシング活性をトランスで触媒する。分裂インテインは多様なシアノバクテリアおよび古細菌において同定されているが(Caspi et al,Mol Microbiol.50:1569-1577(2003);Choi J.et al,J Mol Biol.556:1093-1106(2006.);Dassa B.et al,Biochemistry.46:322-330(2007.);Liu X. and Yang J.,J Biol Chem.275:26315-26318(2003);Wu H.et al. Inteins can also exist as two fragments encoded by two separately transcribed and translated genes. These so-called split inteins self-associate and catalyze protein splicing activity in trans. Split inteins have been identified in a variety of cyanobacteria and archaea (Caspi et al, Mol Microbiol. 50: 1569-1577 (2003); Choi J. et al, J Mol Biol. 556: 1093-1106 (2006.); Dassa B. et al, Biochemistry. 46: 322-330 (2007.); Liu X. and Yang J., J Biol Chem. 275: 26315-26318 (2003); Wu H. et al.

Proc Natl Acad Sci USA.£5:9226-9231(1998.);およびZettler J.et al,FEBS Letters.553:909-914(2009))、真核生物ではここまで見出されていない。最近、環境メタゲノムデータのバイオインフォマティクス分析は、新規のゲノム配置を有する26の異なる座位を明らかにした。各座位においては、保存された酵素コード領域が分裂インテインによって分断され、自立したエンドヌクレアーゼ遺伝子が、インテインサブドメインをコードするセクション間に挿入されている。それらのうち、5つの座位が完全にアセンブリされた:DNAヘリカーゼ(gp41-1、gp41-8);イノシン-5'-一リン酸デヒドロゲナーゼ(IMPDH-1);およびリボヌクレオチドレダクターゼ触媒サブユニット(NrdA-2およびNrdJ-1)である。このばらばらになった遺伝子編成は主にファージに存在するように見える(Dassa et al,Nucleic Acids Research.57:2560-2573(2009))。 Proc Natl Acad Sci USA.£5:9226-9231(1998.); and Zettler J.et al,FEBS Letters.553:909-914(2009)), which have not been found so far in eukaryotes. Recently, bioinformatics analysis of environmental metagenomic data revealed 26 distinct loci with novel genomic arrangements. In each locus, a conserved enzyme coding region is interrupted by a split intein and an autonomous endonuclease gene is inserted between sections encoding intein subdomains. Of those, five loci have been fully assembled: DNA helicase (gp41-1, gp41-8); inosine-5'-monophosphate dehydrogenase (IMPDH-1); and ribonucleotide reductase catalytic subunits (NrdA-2 and NrdJ-1). This fragmented genetic organization appears to be present primarily in phages (Dassa et al., Nucleic Acids Research. 57:2560-2573 (2009)).

分裂インテインNpu DnaEは、タンパク質トランススプライシング反応について報告された最も高い速度を有するとして特徴付けられた。加えて、Npu DnaEタンパク質スプライシング反応は、異なるエクステイン配列、6から37℃の温度、および最高で6Mの尿素の存在についてロバストかつ高収量と考慮される(Zettler J.et al,FEBS Letters.553:909-914(2009);Iwai I.et al,FEBS Letters 550:1853-1858(2006))。予想されたとおり、これらのインテインのNドメインにおけるCysl Ala変異が導入されたときには、当初のNからSのアシルシフト、よってタンパク質スプライシングがブロックされた。残念ながら、C末端切断反応もまたほとんど完全に阻害された。N末端の切れやすいペプチド結合におけるアシルシフトに対するC末端スプライスジャンクションにおけるアスパラギン環化の依存性は、天然に分裂されたDnaEインテインアレルに普通の固有の特性であるように見える(Zettler J.et al.FEBS Letters.555:909-914(2009))。 The split intein Npu DnaE was characterized as having the highest rate reported for a protein trans-splicing reaction. In addition, the Npu DnaE protein splicing reaction is considered robust and high-yielding for different extein sequences, temperatures from 6 to 37°C, and the presence of up to 6M urea (Zettler J. et al, FEBS Letters. 553:909-914 (2009); Iwai I. et al, FEBS Letters 550:1853-1858 (2006)). As expected, when a Cysl Ala mutation in the N domain of these inteins was introduced, the initial N to S acyl shift and thus protein splicing was blocked. Unfortunately, the C-terminal cleavage reaction was also almost completely inhibited. The dependence of asparagine cyclization at the C-terminal splice junction on acyl shift at the N-terminal scissile peptide bond appears to be a common, intrinsic property of naturally split DnaE intein alleles (Zettler J. et al. FEBS Letters. 555:909-914 (2009)).

タンパク質スプライシングの機序は、典型的には4つのステップを有する[29-30]:1)インテインN末端におけるN-SまたはN-Oアシルシフト。これは上流のペプチド結合を切断し、Nエクステインとインテインの第1のアミノ酸(CysまたはSer)の側鎖との間にエステル結合を形成する;2)NエクステインをインテインC末端へと位置替えするトランスエステル化。新たなエステル結合を形成し、NエクステインをCエクステインの第1のアミノ酸(Cys、Ser、またはThr)の側鎖に連結する;3)インテインおよびCエクステインの間のペプチド結合を切断するAsn環化;ならびに4)NエクステインおよびCエクステインの間においてペプチド結合によってエステル結合を置き換えるS-NまたはO-Nアシルシフト。 The mechanism of protein splicing typically involves four steps [29-30]: 1) an N-S or N-O acyl shift at the intein N-terminus, which cleaves the upstream peptide bond and forms an ester bond between the N-extein and the side chain of the first amino acid (Cys or Ser) of the intein; 2) transesterification, which repositions the N-extein to the intein C-terminus, which forms a new ester bond and links the N-extein to the side chain of the first amino acid (Cys, Ser, or Thr) of the C-extein; 3) Asn cyclization, which cleaves the peptide bond between the intein and the C-extein; and 4) an S-N or O-N acyl shift, which replaces the ester bond by a peptide bond between the N-extein and the C-extein.

分裂インテインによって触媒されるタンパク質トランススプライシングは、タンパク質ライゲーションのための全く酵素的な方法を提供する[31]。分裂インテインは本質的には一続きのインテイン(例えばミニインテイン)であり、夫々NインテインおよびCインテインという名称の2つのピースへと分裂されている。分裂インテインのNインテインおよびCインテインは、非共有結合的に会合して活性なインテインを形成し、一続きのインテインがするのと本質的に同じやり方でスプライシング反応を触媒し得る。分裂インテインは天然に見出され、実験室でもまた操作されている[31-35]。本願において用いられる用語「分裂インテイン」は、1つ以上のペプチド結合切断がN末端およびC末端アミノ酸配列の間に存在するいずれかのインテインを言い、その結果、N末端およびC末端配列が別個の分子になり、これらは、トランススプライシング反応について機能的であるインテインへと非共有結合的に再会合または再構成し得る。いずれかの触媒的に活性なインテインまたはそのフラグメントが、本発明の方法への使用のための分裂インテインを導出するために用いられ得る。例えば、一側面において、分裂インテインは真核生物インテインに由来し得る。別の側面において、分裂インテインは細菌インテインに由来し得る。別の側面において、分裂インテインは古細菌インテインに由来し得る。好ましくは、そのように導出された分裂インテインは、トランススプライシング反応を触媒することにとって必須のアミノ酸配列のみを所有するであろう。 Protein trans-splicing catalyzed by split inteins provides a purely enzymatic method for protein ligation [31]. Split inteins are essentially a contiguous intein (e.g., a mini-intein) that has been split into two pieces, named N-intein and C-intein, respectively. The N-intein and C-intein of a split intein can non-covalently associate to form an active intein and catalyze a splicing reaction in essentially the same way that a contiguous intein does. Split inteins are found in nature and have also been engineered in the laboratory [31-35]. The term "split intein" as used herein refers to any intein in which one or more peptide bond cleavages exist between the N- and C-terminal amino acid sequences, such that the N- and C-terminal sequences are separate molecules that can non-covalently reassociate or reconstitute into an intein that is functional for a trans-splicing reaction. Any catalytically active intein or fragment thereof can be used to derive a split intein for use in the methods of the invention. For example, in one aspect, the split intein can be derived from a eukaryotic intein. In another aspect, the split intein can be derived from a bacterial intein. In another aspect, the split intein can be derived from an archaeal intein. Preferably, the split intein so derived will possess only the amino acid sequences essential for catalyzing the trans-splicing reaction.

本願において用いられる「N末端分裂インテイン(In)」は、トランススプライシング反応について機能的であるN末端アミノ酸配列を含むいずれかのインテイン配列を言う。Inは、それゆえに、トランススプライシングが生起するときにスプライスアウトされる配列をもまた含む。Inは、天然に存在するインテイン配列のN末端部分の改変である配列を含み得る。例えば、かかる追加のおよび/または変異した残基の包含がInをトランススプライシングにおいて非機能的にしない限り、Inは追加のアミノ酸残基および/または変異した残基を含み得る。好ましくは、追加のおよび/または変異した残基の包含は、Inのトランススプライシング活性を改善または増強する。 As used herein, "N-terminal split intein (In)" refers to any intein sequence that includes an N-terminal amino acid sequence that is functional for a trans-splicing reaction. In therefore also includes sequences that are spliced out when trans-splicing occurs. In can include sequences that are modifications of the N-terminal portion of a naturally occurring intein sequence. For example, In can include additional amino acid residues and/or mutated residues, so long as the inclusion of such additional and/or mutated residues does not render In non-functional in trans-splicing. Preferably, the inclusion of additional and/or mutated residues improves or enhances the trans-splicing activity of In.

本願において用いられる「C末端分裂インテイン(Ic)」は、トランススプライシング反応について機能的であるC末端アミノ酸配列を含むいずれかのインテイン配列を言う。一側面において、Icは一続きの4から7アミノ酸残基を含み、これらの少なくとも4アミノ酸はそれが由来したインテイン最後のβ鎖からである。Icは、それゆえに、トランススプライシングが生起するときにスプライスアウトされる配列をもまた含む。Icは、天然に存在するインテイン配列のC末端部分の改変である配列を含み得る。例えば、かかる追加のおよび/または変異した残基の包含がInをトランススプライシングにおいて非機能的にしない限り、Icは追加のアミノ酸残基および/または変異した残基を含み得る。好ましくは、追加のおよび/または変異した残基の包含は、Icのトランススプライシング活性を改善または増強する。 As used herein, "C-terminal split intein (Ic)" refers to any intein sequence that includes a C-terminal amino acid sequence that is functional for a trans-splicing reaction. In one aspect, Ic includes a stretch of 4 to 7 amino acid residues, at least 4 of which are from the last β-strand of the intein from which it is derived. Ic therefore also includes a sequence that is spliced out when trans-splicing occurs. Ic can include a sequence that is a modification of the C-terminal portion of a naturally occurring intein sequence. For example, Ic can include additional amino acid residues and/or mutated residues, so long as the inclusion of such additional and/or mutated residues does not render In non-functional in trans-splicing. Preferably, the inclusion of additional and/or mutated residues improves or enhances the trans-splicing activity of Ic.

本発明のいくつかの態様では、IcまたはInに連結されたペプチドは、とりわけ蛍光基、ビオチン、ポリエチレングリコール(PEG)、アミノ酸アナログ、非天然のアミノ酸、リン酸基、グリコシル基、放射性同位体標識、および医薬分子を包含する追加の化学的部分を含み得る。他の態様において、Icに連結されたペプチドは、とりわけケトン、アルデヒド、Cys残基、およびLys残基を包含する1つ以上の化学反応性基を含み得る。「インテインスプライシングポリペプチド(ISP)」が存在するときには、分裂インテインのNインテインおよびCインテインは非共有結合的に会合して活性なインテインを形成し、スプライシング反応を触媒し得る。本願において用いられる「インテインスプライシングポリペプチド(ISP)」は、Ic、In、または両方が分裂インテインから除去されるときに留まる分裂インテインのアミノ酸配列の部分を言う。ある態様において、InはISPを含む。別の態様では、IcはISPを含む。さらに別の態様では、ISPはInにもIcにも共有結合的に連結されていない別個のペプチドである。 In some embodiments of the invention, the peptide linked to Ic or In may contain additional chemical moieties including, among others, fluorescent groups, biotin, polyethylene glycol (PEG), amino acid analogs, unnatural amino acids, phosphate groups, glycosyl groups, radioisotope labels, and pharmaceutical molecules. In other embodiments, the peptide linked to Ic may contain one or more chemically reactive groups including, among others, ketones, aldehydes, Cys residues, and Lys residues. When an "intein splicing polypeptide (ISP)" is present, the N intein and C intein of the split intein may non-covalently associate to form an active intein and catalyze the splicing reaction. As used herein, "intein splicing polypeptide (ISP)" refers to the portion of the amino acid sequence of the split intein that remains when Ic, In, or both are removed from the split intein. In some embodiments, In includes an ISP. In other embodiments, Ic includes an ISP. In yet other embodiments, the ISP is a separate peptide that is not covalently linked to either In or Ic.

分裂インテインは、ミニインテインの構造上に見出される-12の保存されたベータ鎖間の構造化されていないループまたは介在アミノ酸配列中に1つ以上の分裂部位を操作することによって、一続きのインテインから生出され得る[25-28]。分裂の生出が、タンパク質スプライシング活性が失われる十分な度合まではインテインの構造、特に構造化されたベータ鎖を遮断しないであろうという条件で、ベータ鎖間の領域内の分裂部位の位置のいくらかのフレキシビリティーが存在し得る。 Split inteins can be generated from consecutive inteins by engineering one or more split sites into the unstructured loop or intervening amino acid sequence between the -12 conserved beta strands found on the mini-intein structure [25-28]. There can be some flexibility in the location of the split site within the region between the beta strands, provided that the creation of the split would not interrupt the intein structure, particularly the structured beta strands, to a sufficient degree that protein splicing activity is lost.

タンパク質トランススプライシングでは、1つの前駆体タンパク質はNインテインによって後続されるNエクステインパーツからなり、別の前駆体タンパク質はCエクステインパーツによって後続されるCインテインからなり、トランススプライシング反応(一緒にNおよびCインテインによって触媒される)が2つのインテイン配列を切除、2つのエクステイン配列をペプチド結合によって連結する。酵素反応であるタンパク質トランススプライシングは、非常に低い(例えばマイクロモル)濃度のタンパク質で働き得、生理条件下において実行され得る。 In protein trans-splicing, one precursor protein consists of an N extein part followed by an N intein, another precursor protein consists of a C intein followed by a C extein part, and a trans-splicing reaction (catalyzed together by the N and C inteins) excises the two intein sequences and links the two extein sequences by a peptide bond. Protein trans-splicing, an enzymatic reaction, can work at very low (e.g., micromolar) concentrations of protein and can be carried out under physiological conditions.

[2]他のプログラム可能なヌクレアーゼ
本明細書に記載の種々の態様において、プライム編集因子はCas9タンパク質などのnapDNAbpを含む。これらのタンパク質は、それらがガイドRNA(または場合に応じてPEgRNA)と複合体化するようになることによって「プログラム可能」である。これは、gRNA(またはPEgRNA)のスペーサー部分に対して相補的である配列を所有し、かつ要求されるPAM配列をもまた所有するDNA上の標的部位へとCas9タンパク質をガイドする。しかしながら、ここで想定されるある態様において、napDNAbpは、異なる型のプログラム可能なタンパク質、例えばジンクフィンガーヌクレアーゼまたは転写活性化因子様エフェクターヌクレアーゼ(TALEN)によって置換され得る。
[2] Other programmable nucleases In various embodiments described herein, the prime editor comprises a napDNAbp, such as the Cas9 protein. These proteins are "programmable" by becoming complexed with a guide RNA (or a PEgRNA, as the case may be). This guides the Cas9 protein to a target site on DNA that possesses a sequence that is complementary to the spacer portion of the gRNA (or PEgRNA) and also possesses the required PAM sequence. However, in certain embodiments contemplated herein, the napDNAbp can be replaced by a different type of programmable protein, such as a zinc finger nuclease or a transcription activator-like effector nuclease (TALEN).

図1Jは、napDNAbp(例えばSpCas9ニッカーゼ)をいずれかのプログラム可能なヌクレアーゼドメイン、例えばジンクフィンガーヌクレアーゼ(ZFN)または転写活性化因子様エフェクターヌクレアーゼ(TALEN)によって置き換える本願において企図されるプライム編集のかかるバリエーションを図示する。そのため、好適なヌクレアーゼは必ずしも核酸標的化分子(例えばガイドRNA)によって「プログラム」されることを必要とせず、むしろ、DNA結合ドメイン、例えば特にヌクレアーゼの特異性を定めることによってプログラムされ得るということが企図される。ちょうどnapDNAbp部分によるプライム編集のように、かかる代替的なプログラム可能なヌクレアーゼは、標的DNAの1つの鎖のみがカットされるようにして改変されるということが好ましい。換言すると、プログラム可能なヌクレアーゼは好ましくはニッカーゼとして機能するべきである。ひとたびプログラム可能なヌクレアーゼが選択されると(例えば、ZFNまたはTALEN)、それから、それがプライム編集様機序に従って作動することを許すように、追加の機能性がシステム上に操作され得る。例えば、プログラム可能なヌクレアーゼは(例えば、化学的リンカーを介して)RNAまたはDNA伸長アームをそれにカップリングすることによって改変され得、伸長アームはプライマー結合部位(PBS)およびDNA合成鋳型を含む。プログラム可能なヌクレアーゼは(例えば、化学的またはアミノ酸リンカーを介して)ポリメラーゼにもまたカップリングされ得る。これの性質は、伸長アームがDNAまたはRNAであるかどうかに依存するであろう。RNA伸長アームのケースでは、ポリメラーゼはRNA依存性DNAポリメラーゼであり得る(例えば逆転写酵素)。DNA伸長アームのケースでは、ポリメラーゼはDNA依存性DNAポリメラーゼであり得る(例えば、Pol I、Pol II、もしくはPol IIIを包含する原核生物ポリメラーゼ、またはPol a、Pol b、Pol g、Pol d、Pol e、もしくはPol zを包含する真核生物ポリメラーゼ)。システムは、丸ごととしての反応を容易化するために、プログラム可能なヌクレアーゼへの融合体として追加またはトランスで追加される他の機能性をもまた包含し得る(例えば、(a)カットされた部位においてDNAをほどいて、プライマーとして利用可能な3’端を有するカットされた鎖を作るためのヘリカーゼ、(b)カットされた鎖上の内生鎖を除去することを助けて、合成された鎖による内生鎖の置き換えの方に反応を駆動するためのFEN1、または(c)非編集鎖の有利な細胞性修復によって合成修復の取り入れを駆動することを助け得る、対向する鎖上の第2部位ニックを生出するためのnCas9:gRNA複合体)。napDNAbpによるプライム編集と類縁の様式で、別様にプログラム可能なヌクレアーゼによるかかる複合体は、目当ての編集を持つDNAの新たに合成された置き換え鎖を合成し、それから永久的にDNAの標的部位上に組み入れるために用いられ得る。 Figure 1J illustrates such a variation of prime editing contemplated herein, replacing napDNAbp (e.g., SpCas9 nickase) with any programmable nuclease domain, such as a zinc finger nuclease (ZFN) or a transcription activator-like effector nuclease (TALEN). Therefore, it is contemplated that a suitable nuclease does not necessarily need to be "programmed" with a nucleic acid targeting molecule (e.g., a guide RNA), but rather can be programmed by a DNA binding domain, such as by defining the specificity of the nuclease in particular. Just like prime editing with napDNAbp moieties, such alternative programmable nucleases are preferably engineered such that only one strand of the target DNA is cut. In other words, the programmable nuclease should preferably function as a nickase. Once a programmable nuclease is selected (e.g., ZFN or TALEN), additional functionality can then be engineered onto the system to allow it to operate according to a prime editing-like mechanism. For example, a programmable nuclease can be modified by coupling an RNA or DNA extension arm to it (e.g., via a chemical linker), the extension arm including a primer binding site (PBS) and a DNA synthesis template. A programmable nuclease can also be coupled to a polymerase (e.g., via a chemical or amino acid linker). The nature of this will depend on whether the extension arm is DNA or RNA. In the case of an RNA extension arm, the polymerase can be an RNA-dependent DNA polymerase (e.g., reverse transcriptase). In the case of a DNA extension arm, the polymerase can be a DNA-dependent DNA polymerase (e.g., a prokaryotic polymerase including Pol I, Pol II, or Pol III, or a eukaryotic polymerase including Pol a, Pol b, Pol g, Pol d, Pol e, or Pol z). The system may also include other functionalities added as fusions to the programmable nuclease or added in trans to facilitate the reaction as a whole (e.g., (a) a helicase to unwind DNA at the cut site to create a cut strand with a 3' end that can be used as a primer, (b) FEN1 to help remove the endogenous strand on the cut strand and drive the reaction toward replacement of the endogenous strand with the synthesized strand, or (c) an nCas9:gRNA complex to generate a second site nick on the opposing strand that may help drive incorporation of synthetic repair with favorable cellular repair of the non-edited strand). In a manner analogous to napDNAbp primed editing, such complexes with alternative programmable nucleases may be used to synthesize a newly synthesized replacement strand of DNA with the desired edit and then permanently incorporate it onto the target site of DNA.

好適な代替的なプログラム可能なヌクレアーゼは当該技術分野で周知であり、これらは、DNAの標的部位に選択的に結合するようにプログラムされ得る代替的なプライム編集因子システムを構築するために、napDNAbp:gRNA複合体の代わりに用いられ得る。かつ、これらは、ポリメラーゼとプライマー結合部位およびDNA合成鋳型を含むRNAまたはDNA伸長アームとを特定のニック部位へと共局在させるために、上に記載されている様式でさらに改変され得る。例えば、図1Jによって表されるとおり、転写活性化因子様エフェクターヌクレアーゼ(TALEN)が、プログラム可能なヌクレアーゼとして、本明細書に記載のプライム編集法および組成物に用いられ得る。TALENは、TALエフェクターDNA結合ドメインをDNA切断ドメインに融合することによって生成される人工の制限酵素である。これらの試薬は効率的な、プログラム可能な、かつ特異的なDNA切断を可能化し、in situのゲノム編集のための強力なツールを表す。転写活性化因子様エフェクター(TALE)は、事実上いずれかのDNA配列に結合するように迅速に操作され得る。本願において用いられる用語TALENは幅広く、別のTALENからの補助なしに二本鎖DNAを切断し得るモノマーTALENを包含する。用語TALENは、同じ部位においてDNAを切断するために一緒に働くように操作されているTALENのペアの1つまたは両方のメンバーを言うためにもまた用いられる。一緒に働くTALENは左TALENおよび右TALENと言われ得る。これはDNAの掌性を参照している。U.S.Ser.No.12/965,590;U.S.Ser.No.13/426,991(U.S.Pat.No.8,450,471);U.S.Ser.No.13/427,040(U.S.Pat.No.8,440,431);U.S.Ser.No.13/427,137(U.S.Pat.No.8,440,432);およびU.S.Ser.No.13/738,381を見よ。これらの全てはそれらの全体が参照によって本願に組み込まれる。加えて、TALENはWO2015/027134、US 9,181,535、Boch et al.,"Breaking the Code of DNA Binding Specificity of TAL-Type III Effectors",Science,vol.326,pp.1509-1512(2009),Bogdanove et al.,TAL Effectors:Customizable Proteins for DNA Targeting,Science,vol.333,pp.1843-1846(2011),Cade et al.,"Highly efficient generation of heritable zebrafish gene mutations using homo- and heterodimeric TALENs",Nucleic Acids Research,vol.40,pp.8001-8010(2012),およびCermak et al.,"Efficient design and assembly of custom TALEN and other TAL effector-based constructs for DNA targeting",Nucleic Acids Research,vol.39,No.17,e82(2011)に記載されている。これらの夫々は参照によって本願に組み込まれる。 Suitable alternative programmable nucleases are well known in the art and can be used in place of the napDNAbp:gRNA complex to construct alternative prime editor systems that can be programmed to selectively bind to target sites in DNA. And, they can be further modified in the manner described above to co-localize the polymerase with the RNA or DNA extension arm containing the primer binding site and the DNA synthesis template to a specific nick site. For example, as represented by FIG. 1J, transcription activator-like effector nucleases (TALENs) can be used in the prime editing methods and compositions described herein as programmable nucleases. TALENs are artificial restriction enzymes generated by fusing a TAL effector DNA binding domain to a DNA cleavage domain. These reagents allow efficient, programmable, and specific DNA cleavage and represent a powerful tool for in situ genome editing. Transcription activator-like effectors (TALEs) can be rapidly engineered to bind to virtually any DNA sequence. The term TALEN as used in this application is broad and includes monomeric TALENs that can cleave double-stranded DNA without assistance from another TALEN. The term TALEN is also used to refer to one or both members of a pair of TALENs that are engineered to work together to cleave DNA at the same site. TALENs that work together can be referred to as left TALENs and right TALENs. This refers to the handedness of DNA. See U.S. Ser. No. 12/965,590; U.S. Ser. No. 13/426,991 (U.S. Pat. No. 8,450,471); U.S. Ser. No. 13/427,040 (U.S. Pat. No. 8,440,431); U.S. Ser. No. 13/427,137 (U.S. Pat. No. 8,440,432); and U.S. Ser. No. 13/738,381, all of which are incorporated herein by reference in their entirety. In addition, TALENs have been described in WO2015/027134, US 9,181,535, Boch et al., "Breaking the Code of DNA Binding Specificity of TAL-Type III Effectors", Science, vol. 326, pp. 1509-1512 (2009), Bogdanove et al., TAL Effectors: Customizable Proteins for DNA Targeting, Science, vol. 333, pp. 1843-1846 (2011), Cade et al., "Highly efficient generation of heritable zebrafish gene mutations using homo- and heterodimeric TALENs", Nucleic Acids Research, vol. 40, pp. 8001-8010 (2012), and Cermak et al., "Efficient design and assembly of custom TALEN and other TAL effector-based constructs for DNA targeting", Nucleic Acids Research, vol. Research, vol. 39, No. 17, e82 (2011), each of which is incorporated herein by reference.

図1Jに表されているとおり、ジンクフィンガーヌクレアーゼもまた、プライム編集への使用のための代替的なプログラム可能なヌクレアーゼとして、Cas9ニッカーゼなどのnapDNAbpの代わりに用いられ得る。TALENのように、ZFNタンパク質は、それらがニッカーゼとして機能するようにして改変され得る。すなわち、本明細書に記載のプライム編集因子に用いられるnapDNAbpと類似の様式で、それが標的DNAの1つの鎖のみを切断するようにして、ZFNを操作する。ZFNタンパク質は、当該技術分野において、例えば、Carroll et al.,"Genome Engineering with Zinc-Finger Nucleases,"Genetics,Aug 2011,Vol.188:773-782;Durai et al.,"Zinc finger nucleases: custom-designed molecular scissors for genome engineering of plant and mammalian cells,"Nucleic Acids Res,2005,Vol.33:5978-90;およびGaj et al.,"ZFN, TALEN, and CRISPR/Cas-based methods for genome engineering,"Trends Biotechnol.2013,Vol.31:397-405(これらの各々はその全体が参照されることによって本明細書に組み込まれる)に広範囲に記載されている。 As depicted in Figure 1J, zinc finger nucleases can also be used in place of napDNAbp, such as Cas9 nickases, as alternative programmable nucleases for use in prime editing. Like TALENs, ZFN proteins can be modified such that they function as nickases, i.e., engineering the ZFN such that it cuts only one strand of the target DNA in a manner similar to the napDNAbp used in the prime editors described herein. ZFN proteins have been described extensively in the art, for example, in Carroll et al., "Genome Engineering with Zinc-Finger Nucleases," Genetics, Aug 2011, Vol. 188:773-782; Durai et al., "Zinc finger nucleases: custom-designed molecular scissors for genome engineering of plant and mammalian cells," Nucleic Acids Res, 2005, Vol. 33:5978-90; and Gaj et al., "ZFN, TALEN, and CRISPR/Cas-based methods for genome engineering," Trends Biotechnol. 2013, Vol. 31:397-405 (each of which is incorporated herein by reference in its entirety).

[3]ポリメラーゼ(例えば逆転写酵素)
種々の態様において、本明細書に開示のプライム編集因子(PE)システムはポリメラーゼ(例えば、DNA依存性DNAポリメラーゼまたはRNA依存性DNAポリメラーゼ、例えば逆転写酵素)またはそのバリアントを包含し、これは、napDNAbpもしくは他のプログラム可能なヌクレアーゼとの融合タンパク質として提供またはトランスで提供され得る。
[3] Polymerase (e.g., reverse transcriptase)
In various embodiments, the prime editor (PE) system disclosed herein includes a polymerase (e.g., a DNA-dependent DNA polymerase or an RNA-dependent DNA polymerase, such as a reverse transcriptase), or a variant thereof, which can be provided as a fusion protein or in trans with napDNAbp or other programmable nuclease.

いずれかのポリメラーゼが、本明細書に開示のプライム編集因子に用いられ得る。ポリメラーゼは野生型ポリメラーゼ、機能的フラグメント、変異体、バリアント、または短縮されたバリアント、および同類であり得る。ポリメラーゼは、真核、原核、古細菌、もしくはウイルス生物からの野生型ポリメラーゼを包含し得、および/またはポリメラーゼは遺伝子工学、変異導入、指向性進化に基づくプロセスによって改変され得る。ポリメラーゼはT7 DNAポリメラーゼ、T5 DNAポリメラーゼ、T4 DNAポリメラーゼ、KlenowフラグメントDNAポリメラーゼ、DNAポリメラーゼIII、および同類を包含し得る。ポリメラーゼは熱安定性でもまたあり得、Taq、Tne、Tma、Pfu、Tfl、Tth、Stoffelフラグメント、VENT(登録商標)およびDEEPVENT(登録商標)DNAポリメラーゼ、KOD、Tgo、JDF3、ならびにそれらの変異体、バリアント、および誘導体を包含し得る(米国特許第5,436,149号;米国特許第4,889,818号;米国特許第4,965,185号;米国特許第5,079,352号;米国特許第5,614,365号;米国特許第5,374,553号;米国特許第5,270,179号;米国特許第5,047,342号;米国特許第5,512,462号;WO 92/06188;WO 92/06200;WO 96/10640;Barnes,W.M.,Gene 112:29-35(1992);Lawyer,F.C.,et al.,PCR Meth. Appl.2:275-287(1993);Flaman,J.-M,et al.,Nuc.Acids Res.22(15):3259-3260(1994)(これらの各々は参照により本明細書に組み込まれる)を参照)。より長い核酸分子(例えば、長さが約3-5Kbよりも長い核酸分子)の合成には、少なくとも2つのDNAポリメラーゼが使用され得る。ある態様において、ポリメラーゼの1つは3'エキソヌクレアーゼ活性を実質的に欠き得、他は3'エキソヌクレアーゼ活性を有し得る。かかるペアリングは同じかまたは異なるポリメラーゼを包含し得る。3'エキソヌクレアーゼ活性を実質的に欠くDNAポリメラーゼの例は、Taq、Tne(exo-)、Tma(exo-)、Pfu(exo-)、Pwo(exo-)、exo-KOD、およびTth DNAポリメラーゼ、ならびにそれらの変異体、バリアント、および誘導体を包含するが、これらに限定されない。 Any polymerase may be used in the prime editors disclosed herein. The polymerase may be a wild-type polymerase, a functional fragment, a mutant, a variant, or a truncated variant, and the like. The polymerase may include a wild-type polymerase from a eukaryotic, prokaryotic, archaeal, or viral organism, and/or the polymerase may be modified by processes based on genetic engineering, mutagenesis, directed evolution, and the like. The polymerase may include T7 DNA polymerase, T5 DNA polymerase, T4 DNA polymerase, Klenow fragment DNA polymerase, DNA polymerase III, and the like. The polymerase can also be thermostable and can include Taq, Tne, Tma, Pfu, Tfl, Tth, Stoffel fragment, VENT® and DEEPVENT® DNA polymerase, KOD, Tgo, JDF3, and mutants, variants, and derivatives thereof (U.S. Pat. No. 5,436,149; U.S. Pat. No. 4,889,818; U.S. Pat. No. 4,965,185; U.S. Pat. No. 5,079,352; U.S. Pat. No. 5,614,365; U.S. Pat. No. 5,374,553; U.S. Pat. No. 5,270,179; U.S. Pat. No. 5,047,342; U.S. Pat. No. 5,512,462; WO 92/06188; WO 92/06200; WO 96/10640; Barnes, W. M., Gene 112:29-35(1992); Lawyer, F.C., et al., PCR Meth. Appl.2:275-287(1993); Flaman, J.-M, et al., Nuc. Acids Res.22(15):3259-3260(1994), each of which is incorporated herein by reference. For the synthesis of longer nucleic acid molecules (e.g., nucleic acid molecules longer than about 3-5 Kb in length), at least two DNA polymerases may be used. In certain embodiments, one of the polymerases may substantially lack 3' exonuclease activity, and the other may have 3' exonuclease activity. Such pairings may involve the same or different polymerases. Examples of DNA polymerases that substantially lack 3' exonuclease activity include, but are not limited to, Taq, Tne(exo-), Tma(exo-), Pfu(exo-), Pwo(exo-), exo-KOD, and Tth DNA polymerases, and mutants, variants, and derivatives thereof.

好ましくは、本明細書に開示のプライム編集因子に使用可能なポリメラーゼは「鋳型依存性」ポリメラーゼである(なぜなら、ポリメラーゼは、プライム編集の間に合成中のDNA鎖の配列を規定するためにはDNA合成鋳型に依拠することを意図されるからである。本願において用いられる用語「鋳型DNA分子」は、相補的な核酸鎖がDNAポリメラーゼによって例えばPEgRNAのDNA合成鋳型のプライマー伸長反応によってそれから合成される核酸の鎖を言う。 Preferably, the polymerases that can be used in the prime editing elements disclosed herein are "template-dependent" polymerases (because the polymerase is intended to rely on a DNA synthesis template to define the sequence of the DNA strand being synthesized during prime editing. As used herein, the term "template DNA molecule" refers to a strand of nucleic acid from which a complementary nucleic acid strand is synthesized by a DNA polymerase, e.g., by a primer extension reaction of a DNA synthesis template of PEGRNA.

本願において用いられる用語「鋳型依存的様式」は、プライマー分子の鋳型依存的伸長(例えば、DNAポリメラーゼによるDNA合成)が関わるプロセスを言うことを意図される。用語「鋳型依存的様式」は、ポリヌクレオチドの新たに合成される鎖の配列が相補的な塩基対形成の周知のルールによって記述されるRNAまたはDNAのポリヌクレオチド合成を言う(例えば、Watson,J.D.et al.,In:Molecular Biology of the Gene,4th Ed.,W.A.Benjamin,Inc.,Menlo Park,Calif.(1987)を見よ)。用語「相補的」は、塩基対形成による2つのポリヌクレオチド鎖の領域間のまたは2つのヌクレオチド間の配列相補性の幅広い概念を言う。アデニンヌクレオチドは、チミンまたはウラシルであるヌクレオチドと特異的な水素結合を形成する(「塩基対形成する」)ことができるということが公知である。類似に、シトシンヌクレオチドは、グアニンヌクレオチドと塩基対形成することができるということが公知である。そのため、プライム編集のケースでは、DNA合成鋳型に対してプライム編集因子のポリメラーゼによって合成されるDNAの一本鎖は、DNA合成鋳型の配列に対して「相補的」であると言われるということが言われ得る。 The term "template-dependent manner" as used herein is intended to refer to a process involving template-dependent extension of a primer molecule (e.g., DNA synthesis by a DNA polymerase). The term "template-dependent manner" refers to RNA or DNA polynucleotide synthesis in which the sequence of the newly synthesized strand of polynucleotide is dictated by well-known rules of complementary base pairing (see, e.g., Watson, J.D. et al., In: Molecular Biology of the Gene, 4th Ed., W.A. Benjamin, Inc., Menlo Park, Calif. (1987)). The term "complementary" refers to the broad concept of sequence complementarity between regions of two polynucleotide strands or between two nucleotides by base pairing. It is known that adenine nucleotides can form specific hydrogen bonds ("base pair") with nucleotides that are thymine or uracil. Similarly, it is known that cytosine nucleotides can base pair with guanine nucleotides. Therefore, in the case of prime editing, it can be said that the single strand of DNA synthesized by the polymerase of the prime editor on the DNA synthesis template is said to be "complementary" to the sequence of the DNA synthesis template.

A.例示のポリメラーゼ
種々の態様において、本明細書に記載のプライム編集因子はポリメラーゼを含む。本開示は、いずれかの天然に存在する生物もしくはウイルスから得られるか、または市販のもしくは非市販のソースから得られるいずれかの野生型ポリメラーゼを企図する。加えて、本開示のプライム編集因子に使用可能なポリメラーゼは、いずれかの天然に存在する変異体ポリメラーゼ、操作された変異体ポリメラーゼ、または他のバリアントポリメラーゼを包含し得、機能を保持する短縮されたバリアントを包含する。本願において使用可能なポリメラーゼは、特定のアミノ酸置換、例えば具体的に本明細書に開示のものを含有するようにもまた操作され得る。ある種の好ましい態様では、本開示のプライム編集因子に使用可能なポリメラーゼは、鋳型に基づくポリメラーゼである。すなわち、それらは鋳型依存的な様式でヌクレオチド配列を合成する。
A. Exemplary Polymerases
In various embodiments, the prime editors described herein comprise polymerases. The present disclosure contemplates any wild-type polymerase obtained from any naturally occurring organism or virus, or from commercially available or non-commercial sources. In addition, the polymerases usable in the prime editors of the present disclosure may include any naturally occurring mutant polymerases, engineered mutant polymerases, or other variant polymerases, including truncated variants that retain function. The polymerases usable in the present application may also be engineered to contain specific amino acid substitutions, such as those specifically disclosed herein. In certain preferred embodiments, the polymerases usable in the prime editors of the present disclosure are template-based polymerases. That is, they synthesize nucleotide sequences in a template-dependent manner.

ポリメラーゼは、本明細書に記載のプライム編集因子システムに関して用いられ得る、ヌクレオチド鎖を合成する酵素である。ポリメラーゼは好ましくは「鋳型依存性」ポリメラーゼである(すなわち、鋳型鎖のヌクレオチド塩基の順序に基づいてヌクレオチド鎖を合成するポリメラーゼ)。ある種の構成では、ポリメラーゼは「鋳型非依存性」でもまたあり得る(すなわち、鋳型鎖の要件なしにヌクレオチド鎖を合成するポリメラーゼ)。ポリメラーゼはさらに「DNAポリメラーゼ」または「RNAポリメラーゼ」としてもまた類別され得る。種々の態様において、プライム編集因子システムはDNAポリメラーゼを含む。種々の態様において、DNAポリメラーゼは「DNA依存性DNAポリメラーゼ」であり得る(すなわち、これによると、鋳型分子はDNAの鎖である)。かかるケースでは、DNA鋳型分子はPEgRNAであり得、伸長アームはDNAの鎖を含む。かかるケースでは、PEgRNAはキメラまたはハイブリッドPEgRNAともまた言われ得、これがRNA部分(すなわち、スペーサーおよびgRNAコアを包含するガイドRNA構成要素)およびDNA部分(すなわち、伸長アーム)を含む。種々の他の態様において、DNAポリメラーゼは「RNA依存性DNAポリメラーゼ」であり得る(すなわち、これによると、鋳型分子はRNAの鎖である)。かかるケースでは、PEgRNAはRNAであり、すなわちRNA伸長を包含する。用語「ポリメラーゼ」は、ヌクレオチドの重合を触媒する酵素をもまた言い得る(すなわち、ポリメラーゼ活性)。一般的に、酵素は、ポリヌクレオチド鋳型配列にアニーリングしたプライマー(例えば、例えば、PEgRNAのプライマー結合部位にアニーリングしたプライマー配列)の3'端において合成を開始し、鋳型鎖の5'端の方へ進むであろう。「DNAポリメラーゼ」はデオキシヌクレオチドの重合を触媒する。DNAポリメラーゼを参照して本願において用いられる用語DNAポリメラーゼは、「その機能的フラグメント」を包含する。「その機能的フラグメント」は、少なくとも1つのセットの条件下においてポリヌクレオチドの重合を触媒する能力を保持する、ポリメラーゼのアミノ酸配列全体未満を包摂する野生型または変異体DNAポリメラーゼのいずれかの部分を言う。かかる機能的フラグメントは別個の実体として存在し得るか、またはそれは融合タンパク質などのより大きいポリペプチドの構成成分であり得る。 A polymerase is an enzyme that synthesizes a nucleotide strand that can be used in conjunction with the prime editor system described herein. The polymerase is preferably a "template-dependent" polymerase (i.e., a polymerase that synthesizes a nucleotide strand based on the order of nucleotide bases of a template strand). In certain configurations, the polymerase can also be "template-independent" (i.e., a polymerase that synthesizes a nucleotide strand without the requirement of a template strand). The polymerase can also be further categorized as a "DNA polymerase" or an "RNA polymerase". In various embodiments, the prime editor system includes a DNA polymerase. In various embodiments, the DNA polymerase can be a "DNA-dependent DNA polymerase" (i.e., according to which the template molecule is a strand of DNA). In such cases, the DNA template molecule can be a PEgRNA, and the extension arm comprises a strand of DNA. In such cases, the PEgRNA can also be referred to as a chimeric or hybrid PEgRNA, which includes an RNA portion (i.e., a guide RNA component that includes a spacer and a gRNA core) and a DNA portion (i.e., an extension arm). In various other embodiments, the DNA polymerase can be an "RNA-dependent DNA polymerase" (i.e., according to which the template molecule is a strand of RNA). In such cases, the PEgRNA is RNA, i.e., RNA elongation is involved. The term "polymerase" can also refer to an enzyme that catalyzes the polymerization of nucleotides (i.e., polymerase activity). Generally, the enzyme will initiate synthesis at the 3' end of a primer annealed to a polynucleotide template sequence (e.g., a primer sequence annealed to the primer binding site of the PEgRNA) and proceed toward the 5' end of the template strand. A "DNA polymerase" catalyzes the polymerization of deoxynucleotides. The term DNA polymerase as used herein with reference to a DNA polymerase includes "functional fragments thereof." A "functional fragment thereof" refers to any portion of a wild-type or mutant DNA polymerase encompassing less than the entire amino acid sequence of the polymerase that retains the ability to catalyze the polymerization of a polynucleotide under at least one set of conditions. Such a functional fragment may exist as a separate entity, or it may be a component of a larger polypeptide, such as a fusion protein.

いくつかの態様では、ポリメラーゼはバクテリオファージからであり得る。バクテリオファージDNAポリメラーゼは5'から3'のエキソヌクレアーゼ活性を一般的に欠いている。なぜなら、この活性は別個のポリペプチドによってコードされるからである。好適なDNAポリメラーゼの例はT4、T7、およびファイ29 DNAポリメラーゼである。市販で利用可能な酵素は:T4(多くのソース、例えばEpicentreから利用可能)およびT7(多くのソース、例えば未改変についてはEpicentreおよび3'から5'のエキソT7「Sequenase」DNAポリメラーゼについてはUSBから利用可能)である。 In some embodiments, the polymerase can be from a bacteriophage. Bacteriophage DNA polymerases generally lack 5' to 3' exonuclease activity because this activity is encoded by a separate polypeptide. Examples of suitable DNA polymerases are T4, T7, and Phi29 DNA polymerases. Commercially available enzymes are: T4 (available from many sources, e.g., Epicentre) and T7 (available from many sources, e.g., Epicentre for unmodified and USB for the 3' to 5' exo T7 "Sequenase" DNA polymerase).

他の態様、ポリメラーゼは古細菌ポリメラーゼである。古細菌において同定されているDNAポリメラーゼの2つの異なるクラスがある:1.ファミリーB/pol I型(Pyrococcus furiosusからのPfuのホモログ)および2.pol II型(P.furiosus DP1/DP2 2サブユニットポリメラーゼのホモログ)である。両方のクラスからのDNAポリメラーゼは、関連する5'から3'のエキソヌクレアーゼ活性を天然に欠くことと、3'から5'のエキソヌクレアーゼ(プルーフリーディング)活性を所有することとが示されている。好適なDNAポリメラーゼ(pol Iまたはpol II)は、所望のアッセイ温度に類似である最適な成長温度を有する古細菌に由来し得る。 In another embodiment, the polymerase is an archaeal polymerase. There are two distinct classes of DNA polymerases that have been identified in archaea: 1. Family B/pol type I (homolog of Pfu from Pyrococcus furiosus) and 2. pol type II (homolog of P. furiosus DP1/DP2 two-subunit polymerase). DNA polymerases from both classes have been shown to naturally lack associated 5' to 3' exonuclease activity and to possess 3' to 5' exonuclease (proofreading) activity. A suitable DNA polymerase (pol I or pol II) may be derived from an archaea that has an optimal growth temperature that is similar to the desired assay temperature.

熱安定性古細菌DNAポリメラーゼはPyrococcus種(furiosus、sp. GB-D、woesii、abysii、horikoshii)、Thermococcus種(kodakaraensis KOD1、litoralis、sp.9 degrees North-7、sp. JDF-3、gorgonarius)、Pyrodictium occultum、およびArchaeoglobus fulgidusから単離される。 Thermostable archaeal DNA polymerases have been isolated from Pyrococcus species (furiosus, sp. GB-D, woesii, abysii, horikoshii), Thermococcus species (kodakaraensis KOD1, litoralis, sp. 9 degrees North-7, sp. JDF-3, gorgonarius), Pyrodictium occultum, and Archaeoglobus fulgidus.

ポリメラーゼはユーバクテリウム種からでもまたあり得る。ユーバクテリウムDNAポリメラーゼの3つのクラス、pol I、II、およびIIIがある。Pol I DNAポリメラーゼファミリーの酵素は5'から3'のエキソヌクレアーゼ活性を所有し、ある種のメンバーは3'から5'のエキソヌクレアーゼ活性をもまた発揮する。Pol II DNAポリメラーゼは5'から3'のエキソヌクレアーゼ活性を天然に欠くが、3'から5'のエキソヌクレアーゼ活性は発揮する。Pol III DNAポリメラーゼは細胞の主要な複製DNAポリメラーゼを表し、複数のサブユニットから成る。pol III触媒サブユニットは5'から3'のエキソヌクレアーゼ活性を欠くが、いくつかのケースでは、3'から5'のエキソヌクレアーゼ活性が同じポリペプチド上に位置付けられる。 The polymerase can also be from a Eubacterium species. There are three classes of Eubacterial DNA polymerases, pol I, II, and III. Enzymes of the Pol I DNA polymerase family possess 5' to 3' exonuclease activity, and certain members also exhibit 3' to 5' exonuclease activity. Pol II DNA polymerases naturally lack 5' to 3' exonuclease activity, but do exhibit 3' to 5' exonuclease activity. Pol III DNA polymerase represents the major replicative DNA polymerase of the cell and is composed of multiple subunits. The pol III catalytic subunit lacks 5' to 3' exonuclease activity, but in some cases, the 3' to 5' exonuclease activity is located on the same polypeptide.

種々の市販で利用可能なPol I DNAポリメラーゼがあり、これらのいくつかは5'から3'のエキソヌクレアーゼ活性を縮減または廃止するように改変されている。 There are a variety of commercially available Pol I DNA polymerases, some of which have been modified to reduce or abolish 5' to 3' exonuclease activity.

好適な熱安定性pol I DNAポリメラーゼは、Thermus種およびThermotoga maritima、例えばThermus aquaticus(Taq)、Thermus thermophilus(Tth)、およびThermotoga maritima(Tma UlTma)を包含する種々の好熱ユーバクテリウムから単離され得る。 Suitable thermostable pol I DNA polymerases can be isolated from various thermophilic eubacteria, including Thermus species and Thermotoga maritima, such as Thermus aquaticus (Taq), Thermus thermophilus (Tth), and Thermotoga maritima (Tma UlTma).

上に列記されているものに関係する追加のユーバクテリウムはThermophilic Bacteria(Kristjansson, J. K., ed.) CRC Press, Inc., Boca Raton, Fla., 1992に記載されている。 Additional eubacteria related to those listed above are described in Thermophilic Bacteria (Kristjansson, J. K., ed.) CRC Press, Inc., Boca Raton, Fla., 1992.

本発明は、さらに、米国特許第5,677,152号、第6,479,264号、および第6,183,998号に開示されている方法に従って化学的に改変されているキメラまたは非キメラDNAポリメラーゼを可能にする。これらの内容はそれらの全体が参照によってここに組み込まれる。 The present invention further provides for chimeric or non-chimeric DNA polymerases that have been chemically modified according to the methods disclosed in U.S. Patent Nos. 5,677,152, 6,479,264, and 6,183,998, the contents of which are incorporated herein by reference in their entireties.

上に列記されているものに関係する追加の古細菌DNAポリメラーゼは次の参照に記載されている:Archaea:A Laboratory Manual(Robb,F.T. and Place,A.R.,eds.),Cold Spring Harbor Laboratory Press,Cold Spring Harbor,N.Y.,1995およびThermophilic Bacteria(Kristjansson,J.K.,ed.)CRC Press,Inc.,Boca Raton,Fla.,1992。 Additional archaeal DNA polymerases related to those listed above are described in the following references: Archaea: A Laboratory Manual (Robb, F.T. and Place, A.R., eds.), Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y., 1995, and Thermophilic Bacteria (Kristjansson, J.K., ed.) CRC Press, Inc., Boca Raton, Fla., 1992.

B.例示の逆転写酵素
種々の態様において、本明細書に記載のプライム編集因子はポリメラーゼとして逆転写酵素を含む。本開示は、いずれかの天然に存在する生物もしくはウイルスから得られるかまたは市販のもしくは非市販のソースから得られるいずれかの野生型逆転写酵素を企図する。加えて、本開示のプライム編集因子に使用可能な逆転写酵素は、いずれかの天然に存在する変異体RT、操作された変異体RT、または他のバリアントRTを包含し得、機能を保持する短縮されたバリアントを包含する。RTは、特定のアミノ酸置換、例えば具体的に本明細書に開示のものを含有するようにもまた操作され得る。
B. Exemplary Reverse Transcriptases
In various embodiments, the prime editors described herein comprise reverse transcriptase as a polymerase. The present disclosure contemplates any wild-type reverse transcriptase obtained from any naturally occurring organism or virus, or from commercially available or non-commercial sources. In addition, the reverse transcriptase usable in the prime editors of the present disclosure can include any naturally occurring mutant RT, engineered mutant RT, or other variant RT, including truncated variants that retain function. RT can also be engineered to contain specific amino acid substitutions, such as those specifically disclosed herein.

逆転写酵素は多機能酵素であり、典型的には、RNAおよびDNA依存性DNA重合活性、ならびにRNA-DNAハイブリッド中のRNAの切断を触媒するRNaseH活性を包含する3つの酵素活性を有する。逆転写酵素のいくつかの変異体は、mRNAの意図されない損傷を防止するためにRNaseH部分を不能化している。mRNAを鋳型として用いて相補的なDNA(cDNA)を合成するこれらの酵素は、RNAウイルスにおいて最初に同定された。爾後に、逆転写酵素は直接的にウイルス粒子、細胞、または組織から単離および精製された(例として、Kacian et al.,1971,Biochim. Biophys.Acta 46:365-83;Yang et al.,1972,Biochem.Biophys.Res.Comm.47:505-11;Gerard et al.,1975,J.Virol.15:785-97;Liu et al.,1977,Arch.Virol.55 187-200;Kato et al.,1984,J.Virol.Methods 9:325-39;Luke et al.,1990,Biochem.29:1764-69およびLe Grice et al.,1991,J.Virol.65:7004-07(これらの各々は参照により組み込まれる)を参照)。より最近では、改善された特性、例えば熱安定性、忠実性、および活性を求めて、変異体および融合タンパク質が生出されている。当該技術分野で公知であるかまたは当該技術分野で公知の方法を用いて作られ得る逆転写酵素の野生型、バリアント、および/または変異体形態のいずれかは、本願において企図される。 Reverse transcriptase is a multifunctional enzyme that typically possesses three enzymatic activities, including RNA- and DNA-dependent DNA polymerization activity, and an RNase H activity that catalyzes the cleavage of RNA in RNA-DNA hybrids. Some mutants of reverse transcriptase have disabled the RNase H portion to prevent unintended damage to mRNA. These enzymes, which synthesize complementary DNA (cDNA) using mRNA as a template, were first identified in RNA viruses. Subsequently, reverse transcriptase was isolated and purified directly from virus particles, cells, or tissues (see, e.g., Kacian et al., 1971, Biochim. Biophys. Acta 46:365-83; Yang et al., 1972, Biochem. Biophys. Res. Comm. 47:505-11; Gerard et al., 1975, J. Virol. 15:785-97; Liu et al., 1977, Arch. Virol. 55 187-200; Kato et al., 1984, J. Virol. Methods 9:325-39; Luke et al., 1990, Biochem. 29:1764-69, and Le Grice et al., 1991, J. Virol. 65:7004-07, each of which is incorporated by reference). More recently, mutants and fusion proteins have been created for improved properties, such as thermostability, fidelity, and activity. Any wild-type, variant, and/or mutant form of reverse transcriptase known in the art or that can be made using methods known in the art are contemplated herein.

逆転写酵素(RT)遺伝子(またはそれに含有される遺伝情報)はいくつもの異なるソースから得られ得る。例えば、遺伝子は、レトロウイルスに感染している真核細胞から、またはレトロウイルスゲノム全体もしくはそれの部分どちらかを含有するいくつものプラスミドから得られ得る。加えて、RT遺伝子を含有するメッセンジャーRNA様のRNAがレトロウイルスから得られ得る。RTのソースの例は、モロニーマウス白血病ウイルス(M-MLVまたはMLVRT);ヒトT細胞白血病ウイルス1型(HTLV-1);ウシ白血病ウイルス(BLV);ラウス肉腫ウイルス(RSV);ヒト免疫不全ウイルス(HIV);Saccharomycesを包含する酵母、Neurospora、Drosophila;霊長類;および齧歯類を包含するが、これらに限定されない。例えば、Weiss,et al.,米国特許第4,663,290号(1987);Gerard,G.R.,DNA:271-79(1986);Kotewicz,M.L.,et al.,Gene 35:249-58(1985);Tanese,N.,et al.,Proc.Natl.Acad.Sci.(USA):4944-48(1985);Roth,M.J.,at al.,J.Biol.Chem.260:9326-35(1985);Michel,F.,et al.,Nature 316:641-43(1985);Akins,R.A.,et al.,Cell 47:505-16(1986),EMBO J.4:1267-75(1985);およびFawcett,D.F.,Cell 47:1007-15(1986)(これらの各々はその全体が参照されることによって本明細書に組み込まれる)を参照。 The reverse transcriptase (RT) gene (or the genetic information contained therein) can be obtained from a number of different sources. For example, the gene can be obtained from a eukaryotic cell infected with a retrovirus, or from a number of plasmids containing either the entire retroviral genome or portions thereof. In addition, messenger RNA-like RNA containing the RT gene can be obtained from a retrovirus. Examples of sources of RT include, but are not limited to, Moloney murine leukemia virus (M-MLV or MLVRT); human T-cell leukemia virus type 1 (HTLV-1); bovine leukemia virus (BLV); Rous sarcoma virus (RSV); human immunodeficiency virus (HIV); yeast, including Saccharomyces, Neurospora, Drosophila; primates; and rodents. See, e.g., Weiss, et al., U.S. Pat. No. 4,663,290 (1987); Gerard, G. R., DNA: 271-79 (1986); Kotewicz, M. L., et al., Gene 35: 249-58 (1985); Tanese, N., et al., Proc. Natl. Acad. Sci. (USA): 4944-48 (1985); Roth, M. J., at al., J. Biol. Chem. 260: 9326-35 (1985); Michel, F., et al., Nature 316: 641-43 (1985); Akins, R. A., et al., Cell 47: 505-16 (1986), EMBO J. 4: 1267-75 (1985); and Fawcett, D. F., Cell 47:1007-15 (1986), each of which is incorporated herein by reference in its entirety.

野生型RT
本明細書に開示のプライム編集因子による使用のための例示の酵素は、M-MLV逆転写酵素およびRSV逆転写酵素を包含し得るが、これらに限定されない。逆転写酵素活性を有する酵素は市販で利用可能である。ある態様において、逆転写酵素は、プライム編集因子(PE)システムの他の構成要素に対してトランスで提供される。つまり、逆転写酵素は、個々の構成要素として、すなわちnapDNAbpとの融合タンパク質としてではなく、発現または別様に提供される。
Wild-type RT
Exemplary enzymes for use with the prime editor disclosed herein may include, but are not limited to, M-MLV reverse transcriptase and RSV reverse transcriptase. Enzymes with reverse transcriptase activity are commercially available. In some embodiments, reverse transcriptase is provided in trans with other components of the prime editor (PE) system. That is, reverse transcriptase is expressed or otherwise provided as an individual component, i.e., not as a fusion protein with napDNAbp.

当業者は、野生型逆転写酵素が(モロニーマウス白血病ウイルス(M-MLV);ヒト免疫不全ウイルス(HIV)逆転写酵素、およびトリ白血病・肉腫ウイルス(ASLV)逆転写酵素を包含するが、これらに限定されず、これはラウス肉腫ウイルス(RSV)逆転写酵素、トリ骨髄芽球症ウイルス(AMV)逆転写酵素、トリ赤芽球症ウイルス(AEV)ヘルパーウイルスMCAV逆転写酵素、トリ骨髄球腫症ウイルスMC29ヘルパーウイルスMCAV逆転写酵素、トリ細網内皮症ウイルス(REV-T)ヘルパーウイルスREV-A逆転写酵素、トリ肉腫ウイルスUR2ヘルパーウイルスUR2AV逆転写酵素、トリ肉腫ウイルスY73ヘルパーウイルスYAV逆転写酵素、ラウス随伴ウイルス(RAV)逆転写酵素、および骨髄芽球症ウイルス随伴ウイルス(MAV)逆転写酵素を包含するが、これらに限定されない)、本明細書に記載の対象の方法および組成物に好適に用いられ得るということを認識するであろう。 Those skilled in the art will recognize that wild-type reverse transcriptases (including, but not limited to, Moloney murine leukemia virus (M-MLV); human immunodeficiency virus (HIV) reverse transcriptase, and avian leukosis and sarcoma virus (ASLV) reverse transcriptase, including, but not limited to, Rous sarcoma virus (RSV) reverse transcriptase, avian myeloblastosis virus (AMV) reverse transcriptase, avian erythroblastosis virus (AEV) helper virus MCAV reverse transcriptase, avian myelocytomatosis virus MC29 helper virus MCAV reverse transcriptase, avian reticuloendotheliosis virus (REV-T) helper virus REV-A reverse transcriptase, avian sarcoma virus UR2 helper virus UR2AV reverse transcriptase, avian sarcoma virus Y73 helper virus YAV reverse transcriptase, Rous associated virus (RAV) reverse transcriptase, and myeloblastosis virus associated virus (MAV) reverse transcriptase) may be suitably used in the subject methods and compositions described herein.

例示の野生型RT酵素は次のとおりである:

Figure 2020191243000074

Figure 2020191243000075

Figure 2020191243000076

Figure 2020191243000077
An exemplary wild-type RT enzyme is:
Figure 2020191243000074

Figure 2020191243000075

Figure 2020191243000076

Figure 2020191243000077

バリアントおよびエラーを起こしやすいRT
逆転写酵素は、相補的なDNA(cDNA)鎖をRNA鋳型から合成することにとって必須である。逆転写酵素は、異なる生化学的活性を発揮する別物のドメインから成る酵素である。酵素は次のとおりRNA鋳型からのDNAの合成を触媒する:アニーリングしたプライマーの存在下において、逆転写酵素はRNA鋳型に結合し、重合反応を開始する。RNA依存性DNAポリメラーゼ活性が相補的なDNA(cDNA)鎖を合成し、dNTPを組み込む。RNase H活性がDNA:RNA複合体のRNA鋳型を分解する。それゆえに、逆転写酵素は、(a)RNA/DNAハイブリッドを認識および結合する結合活性、(b)RNA依存性DNAポリメラーゼ活性、および(c)RNase H活性を含む。加えて、逆転写酵素は、一般的に、それらの熱安定性、処理能力(dNTP組み込みの速度)、および忠実性(またはエラー率)を包含する種々の属性を有すると見なされる。本願において企図される逆転写酵素バリアントは、これらの酵素活性(例えば、RNA依存性DNAポリメラーゼ活性、RNase H活性、またはDNA/RNAハイブリッド結合活性)または酵素特性(例えば、熱安定性、処理能力、または忠実性)のいずれか1つ以上にインパクトを及ぼすかまたは変化させる、逆転写酵素のいずれかの変異を包含し得る。かかるバリアントは、当該技術分野においてパブリックドメインにおいて利用可能、市販で利用可能であり得るか、または指向性進化プロセス(例えば、PACEまたはPANCE)を包含する変異導入の公知の方法を用いて作られ得る。
Variant and error-prone RT
Reverse transcriptase is essential for the synthesis of a complementary DNA (cDNA) strand from an RNA template. Reverse transcriptase is an enzyme composed of distinct domains that exert different biochemical activities. The enzyme catalyzes the synthesis of DNA from an RNA template as follows: in the presence of an annealed primer, reverse transcriptase binds to the RNA template and initiates the polymerization reaction. The RNA-dependent DNA polymerase activity synthesizes a complementary DNA (cDNA) strand and incorporates dNTPs. The RNase H activity degrades the RNA template in the DNA:RNA complex. Hence, reverse transcriptase contains (a) a binding activity that recognizes and binds RNA/DNA hybrids, (b) an RNA-dependent DNA polymerase activity, and (c) an RNase H activity. In addition, reverse transcriptases are generally considered to have various attributes, including their thermostability, processivity (rate of dNTP incorporation), and fidelity (or error rate). Reverse transcriptase variants contemplated in this application can include any mutation in the reverse transcriptase that impacts or alters any one or more of these enzymatic activities (e.g., RNA-dependent DNA polymerase activity, RNase H activity, or DNA/RNA hybrid binding activity) or enzymatic properties (e.g., thermostability, processivity, or fidelity). Such variants can be available in the public domain, commercially available, or can be made using known methods of mutagenesis, including directed evolution processes (e.g., PACE or PANCE).

種々の態様において、逆転写酵素はバリアント逆転写酵素であり得る。本願において用いられる「バリアント逆転写酵素」は、参照配列(例えば、参照野生型配列)に対して相対的に1つ以上の変異(単数の変異、逆位、欠失、挿入、および再構成を包含する)を含む、いずれかの天然に存在するかまたは遺伝子操作されたバリアントを包含する。RTは、RNA依存性DNAポリメラーゼ活性、リボヌクレアーゼH活性、およびDNA依存性DNAポリメラーゼ活性を包含するいくつかの活性を天然に有する。集合的に、これらの活性は酵素が一本鎖RNAを二本鎖cDNAへと変換することを可能化する。レトロウイルスおよびレトロトランスポゾンでは、このcDNAはそれからホストゲノム上に取り入れし得、これから新たなRNAのコピーがホスト細胞転写によって作られ得る。バリアントRTは、これらの活性の1つ以上にインパクトを及ぼす変異を含み得る(これはこれらの活性を縮減もしくは増大させるか、またはこれはこれらの活性をすっかり消去するかどちらかである)。加えて、バリアントRTは、RTを多かれ少なかれ安定に、凝集をよりしにくくし、精製および/もしくは検出を容易化する1つ以上の変異、ならびに/または特性もしくは特徴の他の(other the)改変を含み得る。 In various embodiments, the reverse transcriptase may be a variant reverse transcriptase. As used herein, "variant reverse transcriptase" includes any naturally occurring or engineered variant that contains one or more mutations (including single mutations, inversions, deletions, insertions, and rearrangements) relative to a reference sequence (e.g., a reference wild-type sequence). RT naturally possesses several activities, including RNA-dependent DNA polymerase activity, RNase H activity, and DNA-dependent DNA polymerase activity. Collectively, these activities enable the enzyme to convert single-stranded RNA into double-stranded cDNA. In retroviruses and retrotransposons, this cDNA can then be incorporated onto the host genome, from which new copies of the RNA can be made by host cell transcription. A variant RT may contain mutations that impact one or more of these activities (either reducing or increasing these activities, or eliminating these activities altogether). In addition, a variant RT may contain one or more mutations that render the RT more or less stable, less prone to aggregation, easier to purify and/or detect, and/or other the modifications of properties or characteristics.

当業者は、他の逆転写酵素(モロニーマウス白血病ウイルス(M-MLV);ヒト免疫不全ウイルス(HIV)逆転写酵素、およびトリ白血病・肉腫ウイルス(ASLV)逆転写酵素を包含するが、これらに限定されず、これはラウス肉腫ウイルス(RSV)逆転写酵素、トリ骨髄芽球症ウイルス(AMV)逆転写酵素、トリ赤芽球症ウイルス(AEV)ヘルパーウイルスMCAV逆転写酵素、トリ骨髄球腫症ウイルスMC29ヘルパーウイルスMCAV逆転写酵素、トリ細網内皮症ウイルス(REV-T)ヘルパーウイルスREV-A逆転写酵素、トリ肉腫ウイルスUR2ヘルパーウイルスUR2AV逆転写酵素、トリ肉腫ウイルスY73ヘルパーウイルスYAV逆転写酵素、ラウス随伴ウイルス(RAV)逆転写酵素、および骨髄芽球症関連ウイルス(MAV)逆転写酵素を包含するが、これらに限定されない)に由来するバリアント逆転写酵素が、本明細書に記載の対象の方法および組成物に好適に用いられ得るということを認識するであろう。 Those skilled in the art will recognize that variant reverse transcriptases derived from other reverse transcriptases (including, but not limited to, Moloney murine leukemia virus (M-MLV); human immunodeficiency virus (HIV) reverse transcriptase, and avian leukosis and sarcoma virus (ASLV) reverse transcriptase, including, but not limited to, Rous sarcoma virus (RSV) reverse transcriptase, avian myeloblastosis virus (AMV) reverse transcriptase, avian erythroblastosis virus (AEV) helper virus MCAV reverse transcriptase, avian myelocytomatosis virus MC29 helper virus MCAV reverse transcriptase, avian reticuloendotheliosis virus (REV-T) helper virus REV-A reverse transcriptase, avian sarcoma virus UR2 helper virus UR2AV reverse transcriptase, avian sarcoma virus Y73 helper virus YAV reverse transcriptase, Rous associated virus (RAV) reverse transcriptase, and myeloblastosis associated virus (MAV) reverse transcriptase) may be suitable for use in the subject methods and compositions described herein.

バリアントRTを調製する1つの方法は、遺伝子改変によって(例えば、野生型逆転写酵素のDNA配列を改変することによって)である。DNA配列のランダムなおよび標的化された変異を許すいくつもの方法が当該技術分野において公知である(例えば、Ausubel et.al.Short Protocols in Molecular Biology(1995)3.sup.rd Ed.John Wiley & Sons,Inc.を見よ)。加えて、従来のおよびPCRに基づく方法両方を包含する部位特異的変異導入のためのいくつもの市販で利用可能なキットがある。例は、QuikChange部位特異的変異導入キット(AGILENT(登録商標))、Q5(登録商標)部位特異的変異導入キット(NEW ENGLAND BIOLABS(登録商標))、およびGeneArt(商標)部位特異的変異導入システム(THERMOFISHER SCIENTIFIC(登録商標))を包含する。 One way to prepare variant RTs is by genetic modification (e.g., by modifying the DNA sequence of a wild-type reverse transcriptase). Several methods are known in the art that allow random and targeted mutation of DNA sequences (see, e.g., Ausubel et.al. Short Protocols in Molecular Biology (1995) 3.sup.rd Ed. John Wiley & Sons, Inc.). In addition, there are several commercially available kits for site-directed mutagenesis, including both conventional and PCR-based methods. Examples include the QuikChange Site-Directed Mutagenesis Kit (AGILENT®), the Q5® Site-Directed Mutagenesis Kit (NEW ENGLAND BIOLABS®), and the GeneArt™ Site-Directed Mutagenesis System (THERMOFISHER SCIENTIFIC®).

加えて、変異体逆転写酵素が、挿入変異または短縮(N末端の、内部の、またはC末端の挿入または短縮)によって当業者に公知の方法論に従って生成され得る。本願において用いられる用語「変異」は、別の残基によるある配列、例えば核酸もしくはアミノ酸配列上の残基の置換、またはある配列上の1つ以上の残基の欠失もしくは挿入を言う。変異は、典型的には、元々の残基、次に配列上の残基の位置および新たに置換された残基のアイデンティティーを同定することによって本明細書に記載の。本願において提供されるアミノ酸置換(変異)を作るための種々の方法が当該技術分野において周知であり、例えばGreen and Sambrook,Molecular Cloning:A Laboratory Manual(4th ed.,Cold Spring Harbor Laboratory Press,Cold Spring Harbor,N.Y.(2012))によって提供される。変異は種々のカテゴリー、例えば1塩基多型、微小重複領域、インデル、および逆位を包含し得、決して限定することを意味されない。変異は、タンパク質活性を縮減または廃止する変異の正常の結果である「機能喪失」変異を包含し得る。ほとんどの機能喪失変異は劣性である。なぜなら、ヘテロ接合体では、第2の染色体コピーが完全に機能的なタンパク質をコードする遺伝子の未変異のバージョンを持ち、この存在が変異の効果を補償するからである。変異は、「機能獲得」変異をもまた包摂する。これは、正常な条件下ではさもなければ存在しない異常な活性をタンパク質または細胞に付与するものである。多くの機能獲得変異はコード領域よりもむしろ制御配列にあり、よって、いくつもの帰結を有し得る。例えば、変異は、1つ以上の遺伝子が間違った組織において発現されることに至り得、これらの組織は、それらが正常では欠く機能を獲得する。それらの性質ゆえに、機能獲得変異は通常は優性である。 In addition, mutant reverse transcriptases can be generated by insertion mutations or truncations (N-terminal, internal, or C-terminal insertions or truncations) according to methodologies known to those of skill in the art. The term "mutation" as used herein refers to the substitution of a residue on a sequence, e.g., a nucleic acid or amino acid sequence, with another residue, or the deletion or insertion of one or more residues on a sequence. Mutations are typically described herein by identifying the original residue, then the position of the residue on the sequence, and the identity of the newly substituted residue. Various methods for making amino acid substitutions (mutations) provided herein are well known in the art, for example, by Green and Sambrook, Molecular Cloning: A Laboratory Manual (4th ed., Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y. (2012)). Mutations can include various categories, such as single nucleotide polymorphisms, microduplication regions, indels, and inversions, and are not meant to be limiting in any way. Mutations can include "loss-of-function" mutations, which are the normal consequence of a mutation that reduces or abolishes protein activity. Most loss-of-function mutations are recessive. Because in heterozygotes, the second chromosomal copy carries a fully functional, unmutated version of the gene that codes for the protein, the presence of which compensates for the effect of the mutation. Mutations also encompass "gain-of-function" mutations, which confer an abnormal activity to a protein or cell that is not otherwise present under normal conditions. Many gain-of-function mutations are in regulatory sequences rather than coding regions and therefore can have a number of consequences. For example, a mutation can lead to one or more genes being expressed in the wrong tissues, and these tissues gain a function that they normally lack. By their nature, gain-of-function mutations are usually dominant.

当該技術分野で公知の部位特異的変異導入のより古い方法は、一本鎖DNA鋳型の単離を許すM13バクテリオファージベクターなどのベクター上への変異させられるべき配列のサブクローニングに依拠する。これらの方法では、変異誘発プライマー(すなわち、変異させられるべき部位にアニールすることができるが、変異させられるべき部位に1つ以上のミスマッチのヌクレオチドを持つプライマー)を一本鎖鋳型にアニーリングさせ、それから、変異誘発プライマーの3'端からスタートして鋳型の相補体を重合する。それから、もたらされた二重鎖はホスト細菌に形質転換され、プラークが所望の変異についてスクリーニングされる。 Older methods of site-directed mutagenesis known in the art rely on subcloning the sequence to be mutated onto a vector, such as an M13 bacteriophage vector, that allows the isolation of a single-stranded DNA template. In these methods, a mutagenic primer (i.e., a primer that can anneal to the site to be mutated but that has one or more mismatched nucleotides at the site to be mutated) is annealed to the single-stranded template, and then the complement of the template is polymerized starting from the 3' end of the mutagenic primer. The resulting duplex is then transformed into a host bacterium, and plaques are screened for the desired mutation.

より最近では、部位特異的変異導入がPCR方法論を使用している。これらは一本鎖鋳型を要求しないという利点を有する。加えて、サブクローニングを要求しない方法が開発されている。PCRに基づく部位特異的変異導入が行われるときには、いくつかのイシューが考慮されなければならない。第1に、これらの方法では、ポリメラーゼによって導入される望まれない変異の拡張を防止するために、PCRサイクル数を縮減することが望ましい。第2に、反応中に残存する変異していない親の分子の数を縮減するために、セレクションが使用されなければならない。第3に、単一のPCRプライマーセットの使用を許すために、伸長された長さのPCR法が好ましい。そして第4に、いくつかの熱安定性ポリメラーゼの非鋳型依存的な末端伸長活性ゆえに、多くの場合には、PCRによって生成された変異体産物の平滑末端ライゲーションに先行して、端を磨くステップを手続きに組み込むことが必要である。 More recently, site-directed mutagenesis has used PCR methodologies. These have the advantage of not requiring a single-stranded template. In addition, methods have been developed that do not require subcloning. Several issues must be considered when PCR-based site-directed mutagenesis is performed. First, in these methods, it is desirable to reduce the number of PCR cycles to prevent the extension of unwanted mutations introduced by the polymerase. Second, selection must be used to reduce the number of unmutated parent molecules remaining in the reaction. Third, extended-length PCR methods are preferred to allow the use of a single PCR primer set. And fourth, due to the non-template-dependent end-extension activity of some thermostable polymerases, it is often necessary to incorporate an end-polishing step into the procedure prior to blunt-end ligation of the mutant products generated by PCR.

ランダム変異導入の方法が当該技術分野に存在し、これらは1つ以上のランダムに所在する変異を持つ変異体のパネルをもたらすであろう。それから、変異体のかかるパネルは、所望の特性、例えば野生型逆転写酵素に対して相対的に増大した安定性を発揮するものについてスクリーニングされ得る。 Methods for random mutagenesis exist in the art and will result in a panel of mutants with one or more randomly placed mutations. Such a panel of mutants can then be screened for those that exhibit a desired property, such as increased stability relative to wild-type reverse transcriptase.

ランダムな変異導入のための方法の例はいわゆる「エラーを起こしやすいPCR法」である。名称が含意するとおり、方法は、DNAポリメラーゼが高忠実性組み込みを支持しない条件下において所与の配列を増幅する。エラーを起こしやすい組み込みを促す条件は異なるDNAポリメラーゼについて変わるが、当業者は所与の酵素についてかかる条件を決定し得る。増幅の忠実性においての多くのDNAポリメラーゼの鍵の変数は、例えば緩衝液中の二価金属イオンの型および濃度である。よって、マンガンイオンの使用および/またはマグネシウムもしくはマンガンイオン濃度のバリエーションが、ポリメラーゼのエラー率に影響するように適用され得る。 An example of a method for random mutagenesis is the so-called "error-prone PCR." As the name implies, the method amplifies a given sequence under conditions where the DNA polymerase does not support high-fidelity incorporation. Conditions that promote error-prone incorporation vary for different DNA polymerases, but one of skill in the art can determine such conditions for a given enzyme. A key variable for many DNA polymerases in the fidelity of amplification is, for example, the type and concentration of divalent metal ions in the buffer. Thus, the use of manganese ions and/or variations in magnesium or manganese ion concentration can be applied to affect the error rate of the polymerase.

種々の側面では、プライム編集因子のRTは「エラーを起こしやすい」逆転写酵素バリアントであり得る。当該技術分野において公知および/または利用可能であるエラーを起こしやすい逆転写酵素が用いられ得る。逆転写酵素は天然にはいずれかのプルーフリーディング機能を有さず;それゆえに、逆転写酵素のエラー率はプルーフリーディング活性を含むDNAポリメラーゼよりも一般的に高いということは了解されるであろう。いずれかの具体的な逆転写酵素のエラー率は酵素の「忠実性」の特性であり、これはそのRNA鋳型に対してDNAの鋳型によって導かれる重合の正確度を表す。高忠実性を有するRTは低いエラー率を有する。反対に、低い忠実性を有するRTは高いエラー率を有する。M-MLVに基づく逆転写酵素の忠実性は、合成される15,000から27,000ヌクレオチドに1エラーの範囲のエラー率を有することが報告される。Boutabout et al.,"DNA synthesis fidelity by the reverse transcriptase of the yeast retrotransposon Ty1,"Nucleic Acids Res,2001,29:2217-2222を見よ。これは参照によって組み込まれる。それゆえに、この適用の目的には、「エラーを起こしやすい」であると考慮されるかまたは「エラーを起こしやすい忠実性」を有すると考慮される逆転写酵素は、合成される15,000ヌクレオチドに1つのエラー未満であるエラー率を有するものである。 In various aspects, the prime editor RT can be an "error-prone" reverse transcriptase variant. Any error-prone reverse transcriptase known and/or available in the art can be used. It will be understood that reverse transcriptases do not naturally possess any proofreading function; therefore, the error rate of reverse transcriptases is generally higher than DNA polymerases that contain proofreading activity. The error rate of any particular reverse transcriptase is a property of the "fidelity" of the enzyme, which represents the accuracy of DNA template-directed polymerization relative to its RNA template. RTs with high fidelity have low error rates. Conversely, RTs with low fidelity have high error rates. The fidelity of M-MLV-based reverse transcriptases is reported to have error rates ranging from 1 error per 15,000 to 27,000 nucleotides synthesized. See Boutabout et al., "DNA synthesis fidelity by the reverse transcriptase of the yeast retrotransposon Ty1," Nucleic Acids Res, 2001, 29:2217-2222. This is incorporated by reference. Therefore, for purposes of this application, a reverse transcriptase that is considered to be "error-prone" or has "error-prone fidelity" is one that has an error rate that is less than 1 error per 15,000 nucleotides synthesized.

エラーを起こしやすい逆転写酵素は、出発RT酵素(例えば、野生型M-MLV RT)の変異導入によってもまた生出され得る。変異導入の方法は限定されず、指向性進化プロセス、例えばファージによって補助される連続的進化(PACE)またはファージによって補助される非連続的進化(PANCE)を包含し得る。本願において用いられる用語「ファージによって補助される連続的進化(PACE)」は、ファージをウイルスベクターとして使用する連続的進化を言う。PACEテクノロジーの一般概念は、例えば、2010年3月11日にWO2010/028347として公開された2009年9月8日出願の国際PCT出願PCT/US2009/056194;2012年6月28日にWO2012/088381として公開された2011年12月22日出願の国際PCT出願PCT/US2011/066747;2015年5月5日登録のU.S.出願U.S.特許No.9,023,594、2015年9月11日にWO2015/134121として公開された2015年1月20日出願の国際PCT出願PCT/US2015/012022、および2016年10月20日にWO2016/168631として公開された2016年4月15日出願の国際PCT出願PCT/US2016/027795に記載されている。これらの夫々の内容全体は参照によって本願に組み込まれる。 Error-prone reverse transcriptases can also be generated by mutagenesis of the starting RT enzyme (e.g., wild-type M-MLV RT). The method of mutagenesis is not limited and can include directed evolution processes, such as phage-assisted continuous evolution (PACE) or phage-assisted discontinuous evolution (PANCE). The term "phage-assisted continuous evolution (PACE)" as used herein refers to continuous evolution using phages as viral vectors. The general concept of PACE technology is described, for example, in International PCT application PCT/US2009/056194, filed September 8, 2009, published as WO2010/028347 on March 11, 2010; International PCT application PCT/US2011/066747, filed December 22, 2011, published as WO2012/088381 on June 28, 2012; and U.S. application PCT/US2011/066747, filed December 22, 2011, published as WO2012/088381 on May 5, 2015. No. 9,023,594, International PCT Application No. PCT/US2015/012022, filed January 20, 2015, published as WO2015/134121 on September 11, 2015, and International PCT Application No. PCT/US2016/027795, filed April 15, 2016, published as WO2016/168631 on October 20, 2016, the entire contents of each of which are incorporated herein by reference.

エラーを起こしやすい逆転写酵素は、「ファージによって補助される非連続的進化(PANCE)」によってもまた得られ得る。本願において用いられるこれは、ファージをウイルスベクターとして使用する非連続的進化を言う。PANCEは急速なインビボの指向性進化のための単純化された技術であり、新しいE.coliホスト細胞による進化させられるべき目当ての遺伝子を含有する進化する「セレクションファージ」(SP)の連続フラスコ植え継ぎを用い、それによって、ホストE.coli内の遺伝子が一定に保たれることを許しながら、SPに含有される遺伝子は連続的に進化する。連続フラスコ植え継ぎは微生物の実験室進化のための広くアクセス可能なアプローチとして長く用をなしており、より最近では、バクテリオファージ進化のための類縁のアプローチが開発されている。PANCEシステムはPACEシステムよりも低いストリンジェンシーを特色とする。 Error-prone reverse transcriptases can also be obtained by "phage-assisted discontinuous evolution (PANCE)". As used herein, this refers to discontinuous evolution using phages as viral vectors. PANCE is a simplified technique for rapid in vivo directed evolution, using serial flask transfer of evolving "selection phages" (SPs) containing the genes of interest to be evolved with new E. coli host cells, whereby the genes contained in the SPs are serially evolved while allowing the genes in the host E. coli to be held constant. Serial flask transfer has long served as a widely accessible approach for laboratory evolution of microorganisms, and more recently, a related approach for bacteriophage evolution has been developed. The PANCE system features lower stringency than the PACE system.

他のエラーを起こしやすい逆転写酵素が文献に記載されている。これらの夫々は本願の方法および組成物への使用を企図される。例えば、エラーを起こしやすい逆転写酵素は、Bebenek et al.,"Error-prone Polymerization by HIV-1 Reverse Transcriptase,"J Biol Chem,1993,Vol.268:10324-10334およびSebastian-Martin et al.,"Transcriptional inaccuracy threshold attenuates differences in RNA-dependent DNA synthesis fidelity between retroviral reverse transcriptases,"Scientific Reports,2018,Vol.8:627に記載されている。これらの夫々は参照によって組み込まれる。なお、さらに、エラーを起こしやすい逆転写酵素を包含する逆転写酵素は市販のサプライヤーから得られ得、全てNEW ENGLAND BIOLABS(登録商標)からのProtoScript(登録商標)(II)逆転写酵素、AMV逆転写酵素、WarmStart(登録商標)逆転写酵素、およびM-MuLV逆転写酵素、または全てTAKARA BIO USA,INC.(以前はCLONTECH)からのAMV逆転写酵素XL、SMARTScribe逆転写酵素、GPRウルトラピュアMMLV逆転写酵素を包含する。 Other error-prone reverse transcriptases have been described in the literature. Each of these is contemplated for use in the methods and compositions of the present application. For example, error-prone reverse transcriptases are described in Bebenek et al., "Error-prone Polymerization by HIV-1 Reverse Transcriptase," J Biol Chem, 1993, Vol. 268:10324-10334, and Sebastian-Martin et al., "Transcriptional inaccuracy threshold attenuates differences in RNA-dependent DNA synthesis fidelity between retroviral reverse transcriptases," Scientific Reports, 2018, Vol. 8:627, each of which is incorporated by reference. Additionally, reverse transcriptases, including error-prone reverse transcriptases, can be obtained from commercial suppliers, including ProtoScript® (II) Reverse Transcriptase, AMV Reverse Transcriptase, WarmStart® Reverse Transcriptase, and M-MuLV Reverse Transcriptase, all from NEW ENGLAND BIOLABS®, or AMV Reverse Transcriptase XL, SMARTScribe Reverse Transcriptase, GPR Ultra Pure MMLV Reverse Transcriptase, all from TAKARA BIO USA, INC. (formerly CLONTECH).

本願の開示はRNaseHドメインに変異を有する逆転写酵素をもまた企図する。上で言及されているとおり、逆転写酵素の本来的な特性の1つはRNase H活性であり、これはRNA:cDNAハイブリッドのRNA鋳型を重合と同時的に切断する。RNA鋳型が全長の逆転写の完了前に分解され得るので、RNase H活性は長いcDNAの合成にとっては望ましくなくあり得る。おそらくは酵素のポリメラーゼ活性とのその競合を原因として、RNase H活性は逆転写効率をもまた低下させ得る。それゆえに、本開示は改変されたRNaseH活性を含むいずれかの逆転写酵素バリアントを企図する。 The present disclosure also contemplates reverse transcriptases having mutations in the RNase H domain. As mentioned above, one of the intrinsic properties of reverse transcriptase is RNase H activity, which cleaves the RNA template of an RNA:cDNA hybrid concomitantly with polymerization. RNase H activity may be undesirable for the synthesis of long cDNAs, since the RNA template may be degraded prior to the completion of full-length reverse transcription. RNase H activity may also reduce reverse transcription efficiency, possibly due to its competition with the polymerase activity of the enzyme. Therefore, the present disclosure contemplates any reverse transcriptase variant that contains an altered RNase H activity.

本願の開示は、RNA依存性DNAポリメラーゼドメインに変異を有する逆転写酵素をもまた企図する。上で言及されているとおり、逆転写酵素の本来的な特性の1つはRNA依存性DNAポリメラーゼ活性である。これは、RNA:cDNAハイブリッドの鋳型RNA鎖によってコードされる新生cDNA鎖に核酸塩基を組み込む。RNA依存性DNAポリメラーゼ活性は、酵素の処理能力を増大させるかまたは減少させるかどちらかのために(すなわち、その組み込み速度の観点から)増大または減少させられ得る。それゆえに、本開示は、酵素の処理能力が(of)未改変のバージョンに対して相対的に増大させられるかまたは減少させられるかどちらかのようにして、改変されたRNA依存性DNAポリメラーゼ活性を含むいずれかの逆転写酵素バリアントを企図する。 The present disclosure also contemplates reverse transcriptases having mutations in the RNA-dependent DNA polymerase domain. As mentioned above, one of the intrinsic properties of reverse transcriptase is RNA-dependent DNA polymerase activity, which incorporates nucleobases into the nascent cDNA strand encoded by the template RNA strand of an RNA:cDNA hybrid. The RNA-dependent DNA polymerase activity can be increased or decreased to either increase or decrease the processivity of the enzyme (i.e., in terms of its incorporation rate). Thus, the present disclosure contemplates any reverse transcriptase variant that contains modified RNA-dependent DNA polymerase activity such that the processivity of the enzyme is either increased or decreased relative to the unmodified version.

変改された熱安定性特徴を有する逆転写酵素バリアントもまた本願において企図される。逆転写酵素が高い温度に耐える能力はcDNA合成の重要な側面である。上昇した反応温度は、強い二次構造および/または高いGC含量を有するRNAを変性することを助け、逆転写酵素が配列を読み通すことを許す。結果として、より高い温度における逆転写は全長cDNA合成およびより高い収量を可能化し、これはプライム編集プロセスの結果としての3'フラップssDNAの改善された生成に至り得る。野生型M-MLV逆転写酵素は典型的には37-48℃の範囲に至適温度を有する;しかしながら、49℃、50℃、51℃、52℃、53℃、54℃、55℃、56℃、57℃、58℃、59℃、60℃、61℃、62℃、63℃、64℃、65℃、66℃、およびより高くを包含する48℃超のより高い温度において逆転写活性を許す変異が導入され得る。 Reverse transcriptase variants with altered thermostability characteristics are also contemplated herein. The ability of reverse transcriptase to tolerate high temperatures is an important aspect of cDNA synthesis. The increased reaction temperature helps to denature RNA with strong secondary structures and/or high GC content, allowing reverse transcriptase to read through the sequence. As a result, reverse transcription at higher temperatures allows full-length cDNA synthesis and higher yields, which may lead to improved generation of 3' flap ssDNA as a result of the prime editing process. Wild-type M-MLV reverse transcriptase typically has an optimum temperature in the range of 37-48°C; however, mutations can be introduced that allow reverse transcription activity at higher temperatures above 48°C, including 49°C, 50°C, 51°C, 52°C, 53°C, 54°C, 55°C, 56°C, 57°C, 58°C, 59°C, 60°C, 61°C, 62°C, 63°C, 64°C, 65°C, 66°C, and higher.

エラーを起こしやすいRT、熱安定性RT、処理能力増大RTを包含する本願において企図されるバリアント逆転写酵素は、変異導入または進化プロセスを包含する種々のルーチン戦略によって操作され得る。いくつかのケースでは、バリアントは単一の変異を導入することによって生じ得る。他のケースでは、バリアントは1つよりも多くの変異を要求し得る。1つよりも多くの変異を含む変異体では、所与の変異の効果は、具体的な変異体によって持たれる他の変異からは単離して、部位特異的変異導入による野生型遺伝子への同定された変異の導入によって評価され得る。それから、それゆえに生じた一重変異体のスクリーニングアッセイは、その変異単独の効果の決定を許すであろう。 The variant reverse transcriptases contemplated herein, including error-prone RT, thermostable RT, and processivity-enhanced RT, can be engineered by a variety of routine strategies, including mutagenesis or evolutionary processes. In some cases, variants can arise by introducing a single mutation. In other cases, variants may require more than one mutation. For variants containing more than one mutation, the effect of a given mutation can be assessed by introducing the identified mutation into the wild-type gene by site-directed mutagenesis in isolation from other mutations carried by the specific mutant. Screening assays of the single mutants thus generated would then allow the determination of the effect of that mutation alone.

本願において用いられるバリアントRT酵素は、本願において開示もしくは企図されるかまたは当該技術分野で公知のいずれかの野生型RTまたは変異体RTまたはフラグメントRTまたはRTの他のバリアントを包含するいずれかの参照RTタンパク質と少なくとも約70%同一、少なくとも約80%同一、少なくとも約90%同一、少なくとも約95%同一、少なくとも約96%同一、少なくとも約97%同一、少なくとも約98%同一、少なくとも約99%同一、少なくとも約99.5%同一、または少なくとも約99.9%同一である他の「RTバリアント」をもまた包含し得る。 The variant RT enzymes used in this application may also include other "RT variants" that are at least about 70% identical, at least about 80% identical, at least about 90% identical, at least about 95% identical, at least about 96% identical, at least about 97% identical, at least about 98% identical, at least about 99% identical, at least about 99.5% identical, or at least about 99.9% identical to any reference RT protein, including any wild-type RT or mutant RT or fragment RT or other variant of RT disclosed or contemplated in this application or known in the art.

いくつかの態様では、RTバリアントは、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、21、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、または最高で100、または最高で200、または最高で300、または最高で400、または最高で500、またはより多くのアミノ酸変化を、参照RTと比較して有し得る。いくつかの態様では、フラグメントが参照RTの対応するフラグメントと少なくとも約70%同一、少なくとも約80%同一、少なくとも約90%同一、少なくとも約95%同一、少なくとも約96%同一、少なくとも約97%同一、少なくとも約98%同一、少なくとも約99%同一、少なくとも約99.5%同一、または少なくとも約99.9%同一であるようにして、RTバリアントは参照RTのフラグメントを含む。いくつかの態様では、フラグメントは、対応する野生型RT(M-MLV逆転写酵素)(例えば、配列番号89)または配列番号90-100の逆転写酵素のいずれかのアミノ酸長さの少なくとも30%、少なくとも35%、少なくとも40%、少なくとも45%、少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%同一、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも99.5%である。 In some embodiments, an RT variant may have 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 21, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, or up to 100, or up to 200, or up to 300, or up to 400, or up to 500, or more amino acid changes compared to a reference RT. In some embodiments, the RT variant comprises a fragment of a reference RT such that the fragment is at least about 70% identical, at least about 80% identical, at least about 90% identical, at least about 95% identical, at least about 96% identical, at least about 97% identical, at least about 98% identical, at least about 99% identical, at least about 99.5% identical, or at least about 99.9% identical to the corresponding fragment of the reference RT. In some embodiments, the fragment is at least 30%, at least 35%, at least 40%, at least 45%, at least 50%, at least 55%, at least 60%, at least 65%, at least 70%, at least 75%, at least 80%, at least 85%, at least 90%, at least 95% identical, at least 96%, at least 97%, at least 98%, at least 99%, or at least 99.5% of the amino acid length of the corresponding wild-type RT (M-MLV reverse transcriptase) (e.g., SEQ ID NO: 89) or any of the reverse transcriptases of SEQ ID NOs: 90-100.

いくつかの態様では、本開示は、それらの機能性を保持し、かついずれかの本明細書に開示のRTタンパク質のフラグメントであるRTフラグメントをもまた利用し得る。いくつかの態様では、RTフラグメントは長さが少なくとも100アミノ酸である。いくつかの態様では、フラグメントは長さが少なくとも100、150、200、250、300、350、400、450、500、550、もしくは最高で600、またはより多くのアミノ酸である。 In some embodiments, the present disclosure may also utilize RT fragments that retain their functionality and are fragments of any of the RT proteins disclosed herein. In some embodiments, the RT fragments are at least 100 amino acids in length. In some embodiments, the fragments are at least 100, 150, 200, 250, 300, 350, 400, 450, 500, 550, or up to 600 or more amino acids in length.

なお他の態様において、本開示は、N末端もしくはC末端または両方がある種のアミノ酸数だけ短縮されているRTバリアントをもまた利用し得、これは、なお十分なポリメラーゼ機能を保持する短縮バリアントをもたらす。いくつかの態様では、RT短縮バリアントは、少なくとも1、少なくとも2、少なくとも3、少なくとも4、少なくとも5、少なくとも6、少なくとも7、少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも16、少なくとも17、少なくとも18、少なくとも19、少なくとも20、少なくとも21、少なくとも22、少なくとも23、少なくとも24、少なくとも25、少なくとも30、40、50、60、70、80、90、100、110、120、130、140、150、160、170、180、190、200、210、220、230、240、または250アミノ酸の短縮を、タンパク質のN末端の端に有する。他の態様において、RT短縮バリアントは、少なくとも1、少なくとも2、少なくとも3、少なくとも4、少なくとも5、少なくとも6、少なくとも7、少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも16、少なくとも17、少なくとも18、少なくとも19、少なくとも20、少なくとも21、少なくとも22、少なくとも23、少なくとも24、少なくとも25、少なくとも30、40、50、60、70、80、90、100、110、120、130、140、150、160、170、180、190、200、210、220、230、240、または250アミノ酸の短縮を、タンパク質のC末端の端に有する。なお他の態様において、RT短縮バリアントは同じかまたは異なる長さである短縮をN末端およびC末端の端に有する。 In still other embodiments, the disclosure may also utilize RT variants in which the N-terminus or C-terminus or both are truncated by a certain number of amino acids, resulting in truncated variants that still retain full polymerase function. In some embodiments, the RT truncated variants have a truncation of at least 1, at least 2, at least 3, at least 4, at least 5, at least 6, at least 7, at least 8, at least 9, at least 10, at least 11, at least 12, at least 13, at least 14, at least 15, at least 16, at least 17, at least 18, at least 19, at least 20, at least 21, at least 22, at least 23, at least 24, at least 25, at least 30, 40, 50, 60, 70, 80, 90, 100, 110, 120, 130, 140, 150, 160, 170, 180, 190, 200, 210, 220, 230, 240, or 250 amino acids at the N-terminal end of the protein. In other embodiments, the RT truncation variants have a truncation of at least 1, at least 2, at least 3, at least 4, at least 5, at least 6, at least 7, at least 8, at least 9, at least 10, at least 11, at least 12, at least 13, at least 14, at least 15, at least 16, at least 17, at least 18, at least 19, at least 20, at least 21, at least 22, at least 23, at least 24, at least 25, at least 30, 40, 50, 60, 70, 80, 90, 100, 110, 120, 130, 140, 150, 160, 170, 180, 190, 200, 210, 220, 230, 240, or 250 amino acids at the C-terminal end of the protein. In yet other embodiments, the RT truncation variants have truncations of the same or different lengths at the N- and C-terminal ends.

例えば、本明細書に開示のプライム編集因子は、M-MLV逆転写酵素の短縮されたバージョンを包含し得る。この態様では、逆転写酵素は4つの変異を含有する(D200N、T306K、W313F、T330P;PE2に存在するL603W変異は短縮を原因としてもはや存在しないということに注意)。この短縮された編集因子をコードするDNA配列は、PE2よりも522bp小さく、よって、DNA配列の送達がそのサイズを原因として難しい適用(すなわち、アデノ随伴ウイルスおよびレンチウイルス送達)にとってそれを可能性として有用にする。この態様はMMLV-RT(trunc)と言われ、次のアミノ酸配列を有する:

Figure 2020191243000078
For example, the prime editor disclosed herein may include a truncated version of M-MLV reverse transcriptase. In this embodiment, the reverse transcriptase contains four mutations (D200N, T306K, W313F, T330P; note that the L603W mutation present in PE2 is no longer present due to the truncation). The DNA sequence encoding this truncated editor is 522 bp smaller than PE2, thus making it potentially useful for applications where delivery of DNA sequences is difficult due to their size (i.e., adeno-associated virus and lentivirus delivery). This embodiment is referred to as MMLV-RT(trunc) and has the following amino acid sequence:
Figure 2020191243000078

種々の態様において、本明細書に開示のプライム編集因子は、本明細書に記載のRTバリアントの1つ、またはいずれかの参照Cas9バリアントと少なくとも約70%同一、少なくとも約80%同一、少なくとも約90%同一、少なくとも約95%同一、少なくとも約96%同一、少なくとも約97%同一、少なくとも約98%同一、少なくとも約99%同一、少なくとも約99.5%同一、または少なくとも約99.9%同一であるそのRTバリアントを含み得る。 In various embodiments, the prime editing factor disclosed herein can include one of the RT variants described herein, or an RT variant thereof that is at least about 70% identical, at least about 80% identical, at least about 90% identical, at least about 95% identical, at least about 96% identical, at least about 97% identical, at least about 98% identical, at least about 99% identical, at least about 99.5% identical, or at least about 99.9% identical to any reference Cas9 variant.

なお他の態様において、本方法および組成物は、Effefson et al.,"Synthetic evolutionary origin of a proofreading reverse transcriptase,"Science,June 24,2016,Vol.352:1590-1593に記載されているとおり、逆転写酵素へと進化させられたDNAポリメラーゼを利用し得る。これの内容は参照によって本願に組み込まれる。 In still other embodiments, the methods and compositions may utilize DNA polymerases that have been evolved into reverse transcriptases, as described in Effefson et al., "Synthetic evolutionary origin of a proofreading reverse transcriptase," Science, June 24, 2016, Vol. 352:1590-1593, the contents of which are incorporated herein by reference.

ある種の他の態様において、逆転写酵素は、napDNAbpをもまた含む融合タンパク質の構成要素として提供される。換言すると、いくつかの態様では、逆転写酵素は融合タンパク質としてnapDNAbpに融合される。 In certain other embodiments, the reverse transcriptase is provided as a component of a fusion protein that also includes napDNAbp. In other words, in some embodiments, the reverse transcriptase is fused to napDNAbp as a fusion protein.

種々の態様において、バリアント逆転写酵素は配列番号89によって表される野生型M-MLV逆転写酵素から操作され得る。 In various embodiments, the variant reverse transcriptase can be engineered from the wild-type M-MLV reverse transcriptase represented by SEQ ID NO:89.

種々の態様において、本明細書に記載のプライム編集因子(RTが融合パートナーとしてまたはトランスでどちらかで提供される)は、次の変異の1つ以上を含むバリアントRTを包含し得る:配列番号89の野生型M-MLV RTにおけるまたは別の野生型RTポリペプチド配列上の対応するアミノ酸位置におけるP51L、S67K、E69K、L139P、T197A、D200N、H204R、F209N、E302K、E302R、T306K、F309N、W313F、T330P、L345G、L435G、N454K、D524G、E562Q、D583N、H594Q、L603W、E607K、またはD653N。 In various embodiments, the primed editing elements described herein (wherein the RT is provided either as a fusion partner or in trans) can include variant RTs that contain one or more of the following mutations: P51L, S67K, E69K, L139P, T197A, D200N, H204R, F209N, E302K, E302R, T306K, F309N, W313F, T330P, L345G, L435G, N454K, D524G, E562Q, D583N, H594Q, L603W, E607K, or D653N at the corresponding amino acid positions in the wild-type M-MLV RT of SEQ ID NO:89 or on another wild-type RT polypeptide sequence.

本開示の種々の態様に従ってnapDNAbpタンパク質に融合または個々のタンパク質として提供され得るいくつかの例示の逆転写酵素が、下で提供される。例示の逆転写酵素は、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、または少なくとも99%配列同一性を次の野生型酵素または部分的な酵素に対して有するバリアントを包含する:

Figure 2020191243000079

Figure 2020191243000080

Figure 2020191243000081

Figure 2020191243000082

Figure 2020191243000083

Figure 2020191243000084
Provided below are several exemplary reverse transcriptases that may be provided as fusions to napDNAbp proteins or as individual proteins according to various embodiments of the disclosure. Exemplary reverse transcriptases include variants having at least 80%, at least 85%, at least 90%, at least 95%, or at least 99% sequence identity to the following wild-type or partial enzymes:
Figure 2020191243000079

Figure 2020191243000080

Figure 2020191243000081

Figure 2020191243000082

Figure 2020191243000083

Figure 2020191243000084

種々の他の態様において、本明細書に記載のプライム編集因子(RTが融合パートナーとしてまたはトランスでどちらかで提供される)は、次の変異の1つ以上を含むバリアントRTを包含し得る:配列番号89の野生型M-MLV RTにおけるまたは別の野生型RTポリペプチド配列上の対応するアミノ酸位置におけるP51X、S67X、E69X、L139X、T197X、D200X、H204X、F209X、E302X、T306X、F309X、W313X、T330X、L345X、L435X、N454X、D524X、E562X、D583X、H594X、L603X、E607X、またはD653Xであって、「X」はいずれかのアミノ酸であり得る。 In various other embodiments, the primed editing factors described herein (wherein the RT is provided either as a fusion partner or in trans) can include variant RTs that contain one or more of the following mutations: P51X, S67X, E69X, L139X, T197X, D200X, H204X, F209X, E302X, T306X, F309X, W313X, T330X, L345X, L435X, N454X, D524X, E562X, D583X, H594X, L603X, E607X, or D653X at the corresponding amino acid positions in the wild-type M-MLV RT of SEQ ID NO:89 or on another wild-type RT polypeptide sequence, where "X" can be any amino acid.

種々の他の態様において、本明細書に記載のプライム編集因子(RTが融合パートナーとしてまたはトランスでどちらかで提供される)は、配列番号89の野生型M-MLV RTにおけるまたは別の野生型RTポリペプチド配列上の対応するアミノ酸位置におけるP51X変異を含むバリアントRTを包含し得、「X」はいずれかのアミノ酸であり得る。ある態様において、XはLである。 In various other embodiments, a primed editing factor described herein (wherein RT is provided either as a fusion partner or in trans) can include a variant RT that includes a P51X mutation at the corresponding amino acid position in the wild-type M-MLV RT of SEQ ID NO:89 or on another wild-type RT polypeptide sequence, where "X" can be any amino acid. In some embodiments, X is L.

種々の他の態様において、本明細書に記載のプライム編集因子(RTが融合パートナーとしてまたはトランスでどちらかで提供される)は、配列番号89の野生型M-MLV RTにおけるまたは別の野生型RTポリペプチド配列上の対応するアミノ酸位置におけるS67X変異を含むバリアントRTを包含し得、「X」はいずれかのアミノ酸であり得る。ある態様において、XはKである。 In various other embodiments, a primed editing factor described herein (wherein RT is provided either as a fusion partner or in trans) can include a variant RT that includes an S67X mutation at the corresponding amino acid position in the wild-type M-MLV RT of SEQ ID NO:89 or on another wild-type RT polypeptide sequence, where "X" can be any amino acid. In some embodiments, X is K.

種々の他の態様において、本明細書に記載のプライム編集因子(RTが融合パートナーとしてまたはトランスでどちらかで提供される)は、配列番号89の野生型M-MLV RTにおけるまたは別の野生型RTポリペプチド配列上の対応するアミノ酸位置におけるE69X変異を含むバリアントRTを包含し得、「X」はいずれかのアミノ酸であり得る。ある態様において、XはKである。 In various other embodiments, a primed editing factor described herein (wherein RT is provided either as a fusion partner or in trans) can include a variant RT that includes an E69X mutation at the corresponding amino acid position in the wild-type M-MLV RT of SEQ ID NO:89 or on another wild-type RT polypeptide sequence, where "X" can be any amino acid. In some embodiments, X is K.

種々の他の態様において、本明細書に記載のプライム編集因子(RTが融合パートナーとしてまたはトランスでどちらかで提供される)は、配列番号89の野生型M-MLV RTにおけるまたは別の野生型RTポリペプチド配列上の対応するアミノ酸位置におけるL139X変異を含むバリアントRTを包含し得、「X」はいずれかのアミノ酸であり得る。ある態様において、XはPである。 In various other embodiments, a primed editing factor described herein (wherein RT is provided either as a fusion partner or in trans) can include a variant RT that includes an L139X mutation at the corresponding amino acid position in the wild-type M-MLV RT of SEQ ID NO:89 or on another wild-type RT polypeptide sequence, where "X" can be any amino acid. In some embodiments, X is P.

種々の他の態様において、本明細書に記載のプライム編集因子(RTが融合パートナーとしてまたはトランスでどちらかで提供される)は、配列番号89の野生型M-MLV RTにおけるまたは別の野生型RTポリペプチド配列上の対応するアミノ酸位置におけるT197X変異を含むバリアントRTを包含し得、「X」はいずれかのアミノ酸であり得る。ある態様において、XはAである。 In various other embodiments, a primed editing factor described herein (wherein RT is provided either as a fusion partner or in trans) can include a variant RT that includes a T197X mutation at the corresponding amino acid position in the wild-type M-MLV RT of SEQ ID NO:89 or on another wild-type RT polypeptide sequence, where "X" can be any amino acid. In some embodiments, X is A.

種々の他の態様において、本明細書に記載のプライム編集因子(RTが融合パートナーとしてまたはトランスでどちらかで提供される)は、配列番号89の野生型M-MLV RTにおけるまたは別の野生型RTポリペプチド配列上の対応するアミノ酸位置におけるD200X変異を含むバリアントRTを包含し得、「X」はいずれかのアミノ酸であり得る。ある態様において、XはNである。 In various other embodiments, a primed editing factor described herein (wherein RT is provided either as a fusion partner or in trans) can include a variant RT that includes a D200X mutation at the corresponding amino acid position in the wild-type M-MLV RT of SEQ ID NO:89 or on another wild-type RT polypeptide sequence, where "X" can be any amino acid. In some embodiments, X is N.

種々の他の態様において、本明細書に記載のプライム編集因子(RTが融合パートナーとしてまたはトランスでどちらかで提供される)は、配列番号89の野生型M-MLV RTにおけるまたは別の野生型RTポリペプチド配列上の対応するアミノ酸位置におけるH204X変異を含むバリアントRTを包含し得、「X」はいずれかのアミノ酸であり得る。ある態様において、XはRである。 In various other embodiments, a primed editing factor described herein (wherein RT is provided either as a fusion partner or in trans) can include a variant RT that includes an H204X mutation at the corresponding amino acid position in the wild-type M-MLV RT of SEQ ID NO:89 or on another wild-type RT polypeptide sequence, where "X" can be any amino acid. In some embodiments, X is R.

種々の他の態様において、本明細書に記載のプライム編集因子(RTが融合パートナーとしてまたはトランスでどちらかで提供される)は、配列番号89の野生型M-MLV RTにおけるまたは別の野生型RTポリペプチド配列上の対応するアミノ酸位置におけるF209X変異を含むバリアントRTを包含し得、「X」はいずれかのアミノ酸であり得る。ある態様において、XはNである。 In various other embodiments, a primed editing factor described herein (wherein RT is provided either as a fusion partner or in trans) can include a variant RT that includes an F209X mutation at the corresponding amino acid position in the wild-type M-MLV RT of SEQ ID NO:89 or on another wild-type RT polypeptide sequence, where "X" can be any amino acid. In some embodiments, X is N.

種々の他の態様において、本明細書に記載のプライム編集因子(RTが融合パートナーとしてまたはトランスでどちらかで提供される)は、配列番号89の野生型M-MLV RTにおけるまたは別の野生型RTポリペプチド配列上の対応するアミノ酸位置におけるE302X変異を含むバリアントRTを包含し得、「X」はいずれかのアミノ酸であり得る。ある態様において、XはKである。 In various other embodiments, a primed editing factor described herein (wherein RT is provided either as a fusion partner or in trans) can include a variant RT that includes an E302X mutation at the corresponding amino acid position in the wild-type M-MLV RT of SEQ ID NO:89 or on another wild-type RT polypeptide sequence, where "X" can be any amino acid. In some embodiments, X is K.

種々の他の態様において、本明細書に記載のプライム編集因子(RTが融合パートナーとしてまたはトランスでどちらかで提供される)は、配列番号89の野生型M-MLV RTにおけるまたは別の野生型RTポリペプチド配列上の対応するアミノ酸位置におけるE302X変異を含むバリアントRTを包含し得、「X」はいずれかのアミノ酸であり得る。ある態様において、XはRである。 In various other embodiments, a primed editing factor described herein (wherein RT is provided either as a fusion partner or in trans) can include a variant RT that includes an E302X mutation at the corresponding amino acid position in the wild-type M-MLV RT of SEQ ID NO:89 or on another wild-type RT polypeptide sequence, where "X" can be any amino acid. In some embodiments, X is R.

種々の他の態様において、本明細書に記載のプライム編集因子(RTが融合パートナーとしてまたはトランスでどちらかで提供される)は、配列番号89の野生型M-MLV RTにおけるまたは別の野生型RTポリペプチド配列上の対応するアミノ酸位置におけるT306X変異を含むバリアントRTを包含し得、「X」はいずれかのアミノ酸であり得る。ある態様において、XはKである。 In various other embodiments, a primed editing factor described herein (wherein RT is provided either as a fusion partner or in trans) can include a variant RT that includes a T306X mutation at the corresponding amino acid position in the wild-type M-MLV RT of SEQ ID NO:89 or on another wild-type RT polypeptide sequence, where "X" can be any amino acid. In some embodiments, X is K.

種々の他の態様において、本明細書に記載のプライム編集因子(RTが融合パートナーとしてまたはトランスでどちらかで提供される)は、配列番号89の野生型M-MLV RTにおけるまたは別の野生型RTポリペプチド配列上の対応するアミノ酸位置におけるF309X変異を含むバリアントRTを包含し得、「X」はいずれかのアミノ酸であり得る。ある態様において、XはNである。 In various other embodiments, a primed editing factor described herein (wherein RT is provided either as a fusion partner or in trans) can include a variant RT that includes an F309X mutation at the corresponding amino acid position in the wild-type M-MLV RT of SEQ ID NO:89 or on another wild-type RT polypeptide sequence, where "X" can be any amino acid. In some embodiments, X is N.

種々の他の態様において、本明細書に記載のプライム編集因子(RTが融合パートナーとしてまたはトランスでどちらかで提供される)は、配列番号89の野生型M-MLV RTにおけるまたは別の野生型RTポリペプチド配列上の対応するアミノ酸位置におけるW313X変異を含むバリアントRTを包含し得、「X」はいずれかのアミノ酸であり得る。ある態様において、XはFである。 In various other embodiments, a primed editing factor described herein (wherein RT is provided either as a fusion partner or in trans) can include a variant RT that includes a W313X mutation at the corresponding amino acid position in the wild-type M-MLV RT of SEQ ID NO:89 or on another wild-type RT polypeptide sequence, where "X" can be any amino acid. In some embodiments, X is F.

種々の他の態様において、本明細書に記載のプライム編集因子(RTが融合パートナーとしてまたはトランスでどちらかで提供される)は、配列番号89の野生型M-MLV RTにおけるまたは別の野生型RTポリペプチド配列上の対応するアミノ酸位置におけるT330X変異を含むバリアントRTを包含し得、「X」はいずれかのアミノ酸であり得る。ある態様において、XはPである。 In various other embodiments, a primed editing factor described herein (wherein RT is provided either as a fusion partner or in trans) can include a variant RT that includes a T330X mutation at the corresponding amino acid position in the wild-type M-MLV RT of SEQ ID NO:89 or on another wild-type RT polypeptide sequence, where "X" can be any amino acid. In some embodiments, X is P.

種々の他の態様において、本明細書に記載のプライム編集因子(RTが融合パートナーとしてまたはトランスでどちらかで提供される)は、配列番号89の野生型M-MLV RTにおけるまたは別の野生型RTポリペプチド配列上の対応するアミノ酸位置におけるL345X変異を含むバリアントRTを包含し得、「X」はいずれかのアミノ酸であり得る。ある態様において、XはGである。 In various other embodiments, a primed editing factor described herein (wherein RT is provided either as a fusion partner or in trans) can include a variant RT that includes an L345X mutation at the corresponding amino acid position in the wild-type M-MLV RT of SEQ ID NO:89 or on another wild-type RT polypeptide sequence, where "X" can be any amino acid. In some embodiments, X is G.

種々の他の態様において、本明細書に記載のプライム編集因子(RTが融合パートナーとしてまたはトランスでどちらかで提供される)は、配列番号89の野生型M-MLV RTにおけるまたは別の野生型RTポリペプチド配列上の対応するアミノ酸位置におけるL435X変異を含むバリアントRTを包含し得、「X」はいずれかのアミノ酸であり得る。ある態様において、XはGである。 In various other embodiments, a primed editing factor described herein (wherein RT is provided either as a fusion partner or in trans) can include a variant RT that includes an L435X mutation at the corresponding amino acid position in the wild-type M-MLV RT of SEQ ID NO:89 or on another wild-type RT polypeptide sequence, where "X" can be any amino acid. In some embodiments, X is G.

種々の他の態様において、本明細書に記載のプライム編集因子(RTが融合パートナーとしてまたはトランスでどちらかで提供される)は、配列番号89の野生型M-MLV RTにおけるまたは別の野生型RTポリペプチド配列上の対応するアミノ酸位置におけるN454X変異を含むバリアントRTを包含し得、「X」はいずれかのアミノ酸であり得る。ある態様において、XはKである。 In various other embodiments, a primed editing factor described herein (wherein RT is provided either as a fusion partner or in trans) can include a variant RT that includes an N454X mutation at the corresponding amino acid position in the wild-type M-MLV RT of SEQ ID NO:89 or on another wild-type RT polypeptide sequence, where "X" can be any amino acid. In some embodiments, X is K.

種々の他の態様において、本明細書に記載のプライム編集因子(RTが融合パートナーとしてまたはトランスでどちらかで提供される)は、配列番号89の野生型M-MLV RTにおけるまたは別の野生型RTポリペプチド配列上の対応するアミノ酸位置におけるD524X変異を含むバリアントRTを包含し得、「X」はいずれかのアミノ酸であり得る。ある態様において、XはGである。 In various other embodiments, a primed editing factor described herein (wherein RT is provided either as a fusion partner or in trans) can include a variant RT that includes a D524X mutation at the corresponding amino acid position in the wild-type M-MLV RT of SEQ ID NO:89 or on another wild-type RT polypeptide sequence, where "X" can be any amino acid. In some embodiments, X is G.

種々の他の態様において、本明細書に記載のプライム編集因子(RTが融合パートナーとしてまたはトランスでどちらかで提供される)は、配列番号89の野生型M-MLV RTにおけるまたは別の野生型RTポリペプチド配列上の対応するアミノ酸位置におけるE562X変異を含むバリアントRTを包含し得、「X」はいずれかのアミノ酸であり得る。ある態様において、XはQである。 In various other embodiments, a primed editing factor described herein (wherein RT is provided either as a fusion partner or in trans) can include a variant RT that includes an E562X mutation at the corresponding amino acid position in the wild-type M-MLV RT of SEQ ID NO:89 or on another wild-type RT polypeptide sequence, where "X" can be any amino acid. In some embodiments, X is Q.

種々の他の態様において、本明細書に記載のプライム編集因子(RTが融合パートナーとしてまたはトランスでどちらかで提供される)は、配列番号89の野生型M-MLV RTにおけるまたは別の野生型RTポリペプチド配列上の対応するアミノ酸位置におけるD583X変異を含むバリアントRTを包含し得、「X」はいずれかのアミノ酸であり得る。ある態様において、XはNである。 In various other embodiments, a primed editing factor described herein (wherein RT is provided either as a fusion partner or in trans) can include a variant RT that includes a D583X mutation at the corresponding amino acid position in the wild-type M-MLV RT of SEQ ID NO:89 or on another wild-type RT polypeptide sequence, where "X" can be any amino acid. In some embodiments, X is N.

種々の他の態様において、本明細書に記載のプライム編集因子(RTが融合パートナーとしてまたはトランスでどちらかで提供される)は、配列番号89の野生型M-MLV RTにおけるまたは別の野生型RTポリペプチド配列上の対応するアミノ酸位置におけるH594X変異を含むバリアントRTを包含し得、「X」はいずれかのアミノ酸であり得る。ある態様において、XはQである。 In various other embodiments, a primed editing factor described herein (wherein RT is provided either as a fusion partner or in trans) can include a variant RT that includes an H594X mutation at the corresponding amino acid position in the wild-type M-MLV RT of SEQ ID NO:89 or on another wild-type RT polypeptide sequence, where "X" can be any amino acid. In some embodiments, X is Q.

種々の他の態様において、本明細書に記載のプライム編集因子(RTが融合パートナーとしてまたはトランスでどちらかで提供される)は、配列番号89の野生型M-MLV RTにおけるまたは別の野生型RTポリペプチド配列上の対応するアミノ酸位置におけるL603X変異を含むバリアントRTを包含し得、「X」はいずれかのアミノ酸であり得る。ある態様において、XはWである。 In various other embodiments, a primed editing factor described herein (wherein RT is provided either as a fusion partner or in trans) can include a variant RT that includes an L603X mutation at the corresponding amino acid position in the wild-type M-MLV RT of SEQ ID NO:89 or on another wild-type RT polypeptide sequence, where "X" can be any amino acid. In some embodiments, X is W.

種々の他の態様において、本明細書に記載のプライム編集因子(RTが融合パートナーとしてまたはトランスでどちらかで提供される)は、配列番号89の野生型M-MLV RTにおけるまたは別の野生型RTポリペプチド配列上の対応するアミノ酸位置におけるE607X変異を含むバリアントRTを包含し得、「X」はいずれかのアミノ酸であり得る。ある態様において、XはKである。 In various other embodiments, a primed editing factor described herein (wherein RT is provided either as a fusion partner or in trans) can include a variant RT that includes an E607X mutation at the corresponding amino acid position in the wild-type M-MLV RT of SEQ ID NO:89 or on another wild-type RT polypeptide sequence, where "X" can be any amino acid. In some embodiments, X is K.

種々の他の態様において、本明細書に記載のプライム編集因子(RTが融合パートナーとしてまたはトランスでどちらかで提供される)は、配列番号89の野生型M-MLV RTにおけるまたは別の野生型RTポリペプチド配列上の対応するアミノ酸位置におけるD653X変異を含むバリアントRTを包含し得、「X」はいずれかのアミノ酸であり得る。ある態様において、XはNである。 In various other embodiments, a primed editing factor described herein (wherein RT is provided either as a fusion partner or in trans) can include a variant RT that includes a D653X mutation at the corresponding amino acid position in the wild-type M-MLV RT of SEQ ID NO:89 or on another wild-type RT polypeptide sequence, where "X" can be any amino acid. In some embodiments, X is N.

本開示の種々の態様に従ってnapDNAbpタンパク質に融合または個々のタンパク質として提供され得るいくつかの例示の逆転写酵素が、下で提供される。例示の逆転写酵素は、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、または少なくとも99%配列同一性を次の野生型酵素または部分的な酵素に対して有するバリアントを包含する:

Figure 2020191243000085

Figure 2020191243000086

Figure 2020191243000087

Figure 2020191243000088

Figure 2020191243000089
Provided below are several exemplary reverse transcriptases that may be provided as fusions to napDNAbp proteins or as individual proteins according to various embodiments of the disclosure. Exemplary reverse transcriptases include variants having at least 80%, at least 85%, at least 90%, at least 95%, or at least 99% sequence identity to the following wild-type or partial enzymes:
Figure 2020191243000085

Figure 2020191243000086

Figure 2020191243000087

Figure 2020191243000088

Figure 2020191243000089

ここに記載されるプライム編集因子(PE)システムは、次の米国特許(これらの夫々はそれらの全体が参照によって組み込まれる):米国特許第10,202,658号;第10,189,831号;第10,150,955号;第9,932,567号;第9,783,791号;第9,580,698号;第9,534,201号;および第9,458,484号のいずれかに記載または開示されているいずれかの公に利用可能な逆転写酵素と、変異を組み入れるための公知の方法またはタンパク質を進化させるための公知の方法を用いて作られ得るそのいずれかのバリアントとを企図する。次の参照は当該技術分野の逆転写酵素を記載する。それらの開示の夫々はそれらの全体が参照によって本願に組み込まれる。 The Prime Editor (PE) system described herein contemplates any publicly available reverse transcriptases described or disclosed in any of the following U.S. patents, each of which is incorporated by reference in its entirety: U.S. Patent Nos. 10,202,658; 10,189,831; 10,150,955; 9,932,567; 9,783,791; 9,580,698; 9,534,201; and 9,458,484, and any variants thereof that may be made using known methods for incorporating mutations or evolving proteins. The following references describe reverse transcriptases in the art. Each of those disclosures is incorporated by reference in its entirety.

Herzig,E.,Voronin,N.,Kucherenko,N.&Hizi,A.A Novel Leu92 Mutant of HIV-1 Reverse Transcriptase with a Selective Deficiency in Strand Transfer Causes a Loss of Viral Replication.J.Virol.89,8119-8129(2015). Herzig, E., Voronin, N., Kucherenko, N. & Hizi, A. A Novel Leu92 Mutant of HIV-1 Reverse Transcriptase with a Selective Deficiency in Strand Transfer Causes a Loss of Viral Replication. J. Virol. 89, 8119-8129 (2015).

Mohr,G.et al.A Reverse Transcriptase-Cas1 Fusion Protein Contains a Cas6 Domain Required for Both CRISPR RNA Biogenesis and RNA Spacer Acquisition.Mol.Cell 72,700-714.e8(2018). Mohr, G. et al. A Reverse Transcriptase-Cas1 Fusion Protein Contains a Cas6 Domain Required for Both CRISPR RNA Biogenesis and RNA Spacer Acquisition. Mol. Cell 72, 700-714. e8 (2018).

Zhao,C.,Liu,F.&Pyle,A.M.An ultraprocessive, accurate reverse transcriptase encoded by a metazoan group II intron.RNA 24,183-195(2018). Zhao, C., Liu, F. & Pyle, A. M. An ultraprocessive, accurate reverse transcriptase encoded by a metazoan group II intron. RNA 24, 183-195 (2018).

Zimmerly,S.&Wu,L.An Unexplored Diversity of Reverse Transcriptases in Bacteria.Microbiol Spectr 3,MDNA3-0058-2014(2015). Zimmerly, S. & Wu, L. An Unexplored Diversity of Reverse Transcriptases in Bacteria. Microbiol Spectr 3, MDNA3-0058-2014 (2015).

Ostertag,E.M.&Kazazian Jr,H.H.Biology of Mammalian L1 Retrotransposons. Annual Review of Genetics 35,501-538(2001). Ostertag, E.M. & Kazazian Jr, H.H. Biology of Mammalian L1 Retrotransposons. Annual Review of Genetics 35, 501-538 (2001).

Perach,M.&Hizi,A.Catalytic Features of the Recombinant Reverse Transcriptase of Bovine Leukemia Virus Expressed in Bacteria.Virology 259,176-189(1999). Perach, M. & Hizi, A. Catalytic Features of the Recombinant Reverse Transcriptase of Bovine Leukemia Virus Expressed in Bacteria. Virology 259, 176-189 (1999).

Lim,D.et al.Crystal structure of the moloney murine leukemia virus RNase H domain.J.Virol.80,8379-8389(2006). Lim, D. et al. Crystal structure of the moloney murine leukemia virus RNase H domain. J. Virol. 80, 8379-8389 (2006).

Zhao,C.&Pyle,A.M.Crystal structures of a group II intron maturase reveal a missing link in spliceosome evolution.Nature Structural&Molecular Biology 23,558-565(2016). Zhao, C. & Pyle, A. M. Crystal structures of a group II intron maturase reveal a missing link in spliceosome evolution. Nature Structural & Molecular Biology 23, 558-565 (2016).

Griffiths,D.J.Endogenous retroviruses in the human genome sequence.Genome Biol.2,REVIEWS1017(2001). Griffiths, D. J. Endogenous retroviruses in the human genome sequence. Genome Biol. 2, REVIEWS 1017 (2001).

Baranauskas,A.et al.Generation and characterization of new highly thermostable and processive M-MuLV reverse transcriptase variants.Protein Eng Des Sel 25,657-668(2012). Baranauskas, A. et al.Generation and characterization of new highly thermostable and processive M-MuLV reverse transcriptase variants.Protein Eng Des Sel 25, 657-668(2012).

Zimmerly,S.,Guo,H.,Perlman,P.S.&Lambowltz,A.M.Group II intron mobility occurs by target DNA-primed reverse transcription.Cell 82,545-554(1995). Zimmerly, S., Guo, H., Perlman, P. S. & Lambowltz, A. M. Group II intron mobility occurs by targeted DNA-primed reverse transcription. Cell 82, 545-554 (1995).

Feng,Q.,Moran,J.V.,Kazazian,H.H.&Boeke,J.D.Human L1 retrotransposon encodes a conserved endonuclease required for retrotransposition.Cell 87,905-916(1996). Feng, Q., Moran, J. V., Kazazian, H. H. & Boeke, J. D. Human L1 retrotransposon encodes a conserved endonuclease required for retrotransposition. Cell 87, 905-916 (1996).

Berkhout,B.,Jebbink,M.&Zsiros,J.Identification of an Active Reverse Transcriptase Enzyme Encoded by a Human Endogenous HERV-K Retrovirus.Journal of Virology 73,2365-2375(1999). Berkhout, B., Jebbink, M. & Zsiros, J. Identification of an Active Reverse Transcriptase Enzyme Encoded by a Human Endogenous HERV-K Retrovirus. Journal of Virology 73, 2365-2375 (1999).

Kotewicz,M.L.,Sampson,C.M.,D’Alessio,J.M.&Gerard,G.F.Isolation of cloned Moloney murine leukemia virus reverse transcriptase lacking ribonuclease H activity.Nucleic Acids Res 16,265-277(1988). Kotewicz, M.L., Sampson, C.M., D'Alessio, J.M. & Gerard, G.F. Isolation of cloned Moloney murine leukemia virus reverse transcriptase lacking ribonuclease H activity. Nucleic Acids Res 16, 265-277 (1988).

Arezi,B.&Hogrefe,H.Novel mutations in Moloney Murine Leukemia Virus reverse transcriptase increase thermostability through tighter binding to template-primer.Nucleic Acids Res 37,473-481(2009). Arezi, B. & Hogrefe, H. Novel mutations in Moloney Murine Leukemia Virus reverse transcriptase increase thermostability through tighter binding to template-primer. Nucleic Acids Res 37, 473-481 (2009).

Blain,S.W.&Goff,S.P.Nuclease activities of Moloney murine leukemia virus reverse transcriptase.Mutants with altered substrate specificities.J.Biol.Chem.268,23585-23592(1993). Blain, S.W. & Goff, S.P. Nuclease activities of Moloney murine leukemia virus reverse transcriptase. Mutants with altered substrate specificities. J.Biol.Chem.268,23585-23592(1993).

Xiong,Y.&Eickbush,T.H.Origin and evolution of retroelements based upon their reverse transcriptase sequences.EMBO J 9,3353-3362(1990). Xiong, Y. & Eickbush, T. H. Origin and evolution of retroelements based upon their reverse transcriptase sequences. EMBO J 9, 3353-3362 (1990).

Herschhorn,A.&Hizi,A.Retroviral reverse transcriptases.Cell.Mol.Life Sci.67,2717-2747(2010). Herschhorn, A. & Hizi, A. Retroviral reverse transcriptases. Cell. Mol. Life Sci. 67, 2717-2747 (2010).

Taube,R.,Loya,S.,Avidan,O.,Perach,M.&Hizi,A.Reverse transcriptase of mouse mammary tumour virus:expression in bacteria,purification and biochemical characterization.Biochem.J.329(Pt 3),579-587(1998). Taube, R., Loya, S., Avidan, O., Perach, M. & Hizi, A. Reverse transcriptase of mouse mammary tumour virus: expression in bacteria, purification and biochemical characterization. Biochem. J. 329 (Pt 3), 579-587 (1998).

Liu,M.et al.Reverse Transcriptase-Mediated Tropism Switching in Bordetella Bacteriophage.Science 295,2091-2094(2002). Liu, M. et al. Reverse Transcriptase-Mediated Tropism Switching in Bordetella Bacteriophage. Science 295, 2091-2094 (2002).

Luan,D.D.,Korman,M.H.,Jakubczak,J.L.&Eickbush,T.H.Reverse transcription of R2Bm RNA is primed by a nick at the chromosomal target site:a mechanism for non-LTR retrotransposition.Cell 72,595-605(1993). Luan, D.D., Korman, M.H., Jakubczak, J.L. & Eickbush, T.H. Reverse transcription of R2Bm RNA is primed by a nick at the chromosomal target site: a mechanism for non-LTR retrotransposition. Cell 72, 595-605 (1993).

Nottingham,R.M.et al.RNA-seq of human reference RNA samples using a thermostable group II intron reverse transcriptase.RNA 22,597-613(2016). Nottingham, R.M. et al. RNA-seq of human reference RNA samples using a thermostable group II intron reverse transcriptase. RNA 22, 597-613 (2016).

Telesnitsky,A.&Goff,S.P.RNase H domain mutations affect the interaction between Moloney murine leukemia virus reverse transcriptase and its primer-template.Proc.Natl.Acad.Sci.U.S.A.90,1276-1280(1993). Telesnitsky, A. & Goff, S. P. RNase H domain mutations affect the interaction between Moloney murine leukemia virus reverse transcriptase and its primer-template. Proc. Natl. Acad. Sci. U.S.A. 90, 1276-1280 (1993).

Halvas,E.K.,Svarovskaia,E.S.&Pathak,V.K.Role of Murine Leukemia Virus Reverse Transcriptase Deoxyribonucleoside Triphosphate-Binding Site in Retroviral Replication and In Vivo Fidelity.Journal of Virology 74,10349-10358(2000). Halvas, E.K., Svarovskaia, E.S. & Pathak, V.K. Role of Murine Leukemia Virus Reverse Transcriptase Deoxyribonucleoside Triphosphate-Binding Site in Retroviral Replication and In Vivo Fidelity. Journal of Virology 74, 10349-10358 (2000).

Nowak,E.et al.Structural analysis of monomeric retroviral reverse transcriptase in complex with an RNA/DNA hybrid.Nucleic Acids Res 41,3874-3887(2013). Nowak, E. et al.Structural analysis of monomeric retroviral reverse transcriptase in complex with an RNA/DNA hybrid.Nucleic Acids Res 41, 3874-3887(2013).

Stamos,J.L.,Lentzsch,A.M.&Lambowitz,A.M.Structure of a Thermostable Group II Intron Reverse Transcriptase with Template-Primer and Its Functional and Evolutionary Implications.Molecular Cell 68,926-939.e4(2017). Stamos, J.L., Lentzsch, A.M. & Lambowitz, A.M. Structure of a Thermostable Group II Intron Reverse Transcriptase with Template-Primer and Its Functional and Evolutionary Implications. Molecular Cell 68, 926-939. e4 (2017).

Das,D.&Georgiadis,M.M.The Crystal Structure of the Monomeric Reverse Transcriptase from Moloney Murine Leukemia Virus.Structure 12,819-829(2004). Das, D. & Georgiadis, M. M. The Crystal Structure of the Monomeric Reverse Transcriptase from Moloney Murine Leukemia Virus. Structure 12, 819-829 (2004).

Avidan,O.,Meer,M.E.,Oz,I&Hizi,A.The processivity and fidelity of DNA synthesis exhibited by the reverse transcriptase of bovine leukemia virus.European Journal of Biochemistry 269,859-86(2002). Avidan, O., Meer, M. E., Oz, I & Hizi, A. The processivity and fidelity of DNA synthesis exhibited by the reverse transcriptase of bovine leukemia virus. European Journal of Biochemistry 269, 859-86 (2002).

Gerard,G.F.et al.The role of template-primer in protection of reverse transcriptase from thermal inactivation.Nucleic Acids Res 30,3118-3129(2002). Gerard, G.F. et al. The role of template-primer in protection of reverse transcriptase from thermal inactivation. Nucleic Acids Res 30, 3118-3129 (2002).

Monot,C.et al.The Specificity and Flexibility of L1 Reverse Transcription Priming at Imperfect T-Tracts.PLOS Genetics 9,e1003499(2013). Monot, C. et al. The Specificity and Flexibility of L1 Reverse Transcription Priming at Imperfect T-Tracts. PLOS Genetics 9, e1003499 (2013).

Mohr,S.et al.Thermostable group II intron reverse transcriptase fusion proteins and their use in cDNA synthesis and next-generation RNA sequencing.RNA 19,958-970(2013). Mohr, S. et al. Thermostable group II intron reverse transcriptase fusion proteins and their use in cDNA synthesis and next-generation RNA sequencing. RNA 19, 958-970 (2013).

逆転写酵素に関する上に記されている参照のいずれかは、すでにそのように申し立てられていない場合には、それらの全体が参照によってここに組み込まれる。 Any of the references set forth above regarding reverse transcriptase are hereby incorporated by reference in their entirety unless already so claimed.

[4]PE融合タンパク質
本明細書に記載のプライム編集因子(PE)システムは、任意にリンカーによって連結されるnapDNAbpおよびポリメラーゼ(例えば、DNA依存性DNAポリメラーゼまたはRNA依存性DNAポリメラーゼ、例えば逆転写酵素)を含む融合タンパク質を企図する。本願は、いずれかの好適なnapDNAbpおよびポリメラーゼ(例えば、DNA依存性DNAポリメラーゼまたはRNA依存性DNAポリメラーゼ、例えば逆転写酵素)が単一の融合タンパク質として組み合わせられることを企図する。napDNAbpおよびポリメラーゼ(例えば、DNA依存性DNAポリメラーゼまたはRNA依存性DNAポリメラーゼ、例えば逆転写酵素)の例は、夫々が本願において定められる。ポリメラーゼは当該技術分野において周知であり、アミノ酸配列は難なく利用可能であるので、本開示は本願において同定される特定のポリメラーゼに限定されることを決して意味されない。
[4] PE Fusion Protein The prime editor (PE) system described herein contemplates a fusion protein comprising napDNAbp and a polymerase (e.g., a DNA-dependent DNA polymerase or an RNA-dependent DNA polymerase, such as a reverse transcriptase), optionally linked by a linker. The present application contemplates that any suitable napDNAbp and polymerase (e.g., a DNA-dependent DNA polymerase or an RNA-dependent DNA polymerase, such as a reverse transcriptase) are combined into a single fusion protein. Examples of napDNAbp and polymerases (e.g., a DNA-dependent DNA polymerase or an RNA-dependent DNA polymerase, such as a reverse transcriptase), respectively, are defined herein. The present disclosure is in no way meant to be limited to the specific polymerases identified herein, as polymerases are well known in the art and amino acid sequences are readily available.

種々の態様において、融合タンパク質はいずれかの好適な構造的な構成を含み得る。例えば、融合タンパク質は、N末端からC末端方向に、napDNAbpをポリメラーゼ(例えば、DNA依存性DNAポリメラーゼまたはRNA依存性DNAポリメラーゼ、例えば逆転写酵素)に融合されて含み得る。他の態様において、融合タンパク質は、N末端からC末端方向に、ポリメラーゼ(例えば、逆転写酵素)をnapDNAbpに融合されて含み得る。融合したドメインは、任意に、リンカー、例えばアミノ酸配列によって連結され得る。他の態様において、融合タンパク質は構造NH2-[napDNAbp]-[ポリメラーゼ]-COOH;またはNH2-[ポリメラーゼ]-[napDNAbp]-COOHを含み得、「]-[」の夫々のものは任意のリンカー配列の存在を指示する。ポリメラーゼが逆転写酵素である態様では、融合タンパク質は構造NH2-[napDNAbp]-[RT]-COOH;またはNH2-[RT]-[napDNAbp]-COOHを含み得、「]-[」の夫々のものは任意のリンカー配列の存在を指示する。 In various embodiments, the fusion protein may comprise any suitable structural configuration. For example, the fusion protein may comprise, from the N-terminus to the C-terminus, a napDNAbp fused to a polymerase (e.g., a DNA-dependent DNA polymerase or an RNA-dependent DNA polymerase, e.g., a reverse transcriptase). In other embodiments, the fusion protein may comprise, from the N-terminus to the C-terminus, a polymerase (e.g., a reverse transcriptase) fused to the napDNAbp. The fused domains may optionally be linked by a linker, e.g., an amino acid sequence. In other embodiments, the fusion protein may comprise the structure NH2- [napDNAbp]-[polymerase]-COOH; or NH2- [polymerase]-[napDNAbp]-COOH, where each "]-[" indicates the presence of an optional linker sequence. In embodiments where the polymerase is a reverse transcriptase, the fusion protein may comprise the structure NH2- [napDNAbp]-[RT]-COOH; or NH2- [RT]-[napDNAbp]-COOH, with each of the "]-[" indicating the presence of an optional linker sequence.

例示の融合タンパク質が図14に図示されている。これはリンカー配列を介してニッカーゼCas9(「Cas9(H840A)」)に融合されたMLV逆転写酵素(「MLV-RT」)を含む融合タンパク質を示す。この例は、本明細書に記載のプライム編集因子(PE)システムに利用され得る融合タンパク質の範囲を限定することを意図されない。 An exemplary fusion protein is illustrated in Figure 14, which shows a fusion protein comprising MLV reverse transcriptase ("MLV-RT") fused via a linker sequence to nickase Cas9 ("Cas9(H840A)"). This example is not intended to limit the scope of fusion proteins that may be utilized in the prime editor (PE) systems described herein.

種々の態様において、プライム編集因子融合タンパク質は次のアミノ酸配列(本願においては「PE1」と言われる)を有し得、これは、H840A変異を含むCas9バリアント(すなわち、Cas9ニッカーゼ)およびM-MLV RT野生型と、N末端NLS配列(19アミノ酸)およびCas9ニッカーゼドメインのC末端をRTドメインのN末端に連結するアミノ酸リンカー(32アミノ酸)とを包含する。PE1融合タンパク質は次の構造を有する:[NLS]-[Cas9(H840A)]-[リンカー]-[MMLV_RT(wt)]。PE1およびその個々の構成要素のアミノ酸配列は次のとおりである:

Figure 2020191243000090

Figure 2020191243000091

Figure 2020191243000092
In various embodiments, the prime editor fusion protein may have the following amino acid sequence (referred to herein as "PE1"), which includes a Cas9 variant (i.e., Cas9 nickase) containing the H840A mutation and M-MLV RT wild type, with an N-terminal NLS sequence (19 amino acids) and an amino acid linker (32 amino acids) connecting the C-terminus of the Cas9 nickase domain to the N-terminus of the RT domain. The PE1 fusion protein has the following structure: [NLS]-[Cas9(H840A)]-[linker]-[MMLV_RT(wt)]. The amino acid sequences of PE1 and its individual components are as follows:
Figure 2020191243000090

Figure 2020191243000091

Figure 2020191243000092

別の態様では、プライム編集因子融合タンパク質は次のアミノ酸配列(本願においては「PE2」と言われる)を有し得、これは、H840A変異を含むCas9バリアント(すなわち、Cas9ニッカーゼ)ならびに変異D200N、T330P、L603W、T306K、およびW313Fを含むM-MLV RTと、N末端NLS配列(19アミノ酸)ならびにCas9ニッカーゼドメインのC末端をRTドメインのN末端に連結するアミノ酸リンカー(33アミノ酸)とを包含する。PE2融合タンパク質は次の構造を有する:[NLS]-[Cas9(H840A)]-[リンカー]-[MMLV_RT(D200N)(T330P)(L603W)(T306K)(W313F)]。PE2のアミノ酸配列は次のとおりである:

Figure 2020191243000093

Figure 2020191243000094

Figure 2020191243000095
In another embodiment, the prime editor fusion protein can have the following amino acid sequence (referred to herein as "PE2"), which includes a Cas9 variant (i.e., Cas9 nickase) containing the H840A mutation and M-MLV RT containing the mutations D200N, T330P, L603W, T306K, and W313F, and an N-terminal NLS sequence (19 amino acids) and an amino acid linker (33 amino acids) that connects the C-terminus of the Cas9 nickase domain to the N-terminus of the RT domain. The PE2 fusion protein has the following structure: [NLS]-[Cas9(H840A)]-[Linker]-[MMLV_RT(D200N)(T330P)(L603W)(T306K)(W313F)]. The amino acid sequence of PE2 is as follows:
Figure 2020191243000093

Figure 2020191243000094

Figure 2020191243000095

更なる他の態様において、プライム編集因子融合タンパク質は、以下のアミノ酸配列を有していてもよい:

Figure 2020191243000096

Figure 2020191243000097

Figure 2020191243000098

Figure 2020191243000099
In yet other embodiments, a prime editor fusion protein may have the following amino acid sequence:
Figure 2020191243000096

Figure 2020191243000097

Figure 2020191243000098

Figure 2020191243000099

他の態様において、プライム編集因子融合タンパク質は、次の例示の配列などのSaCas9にまたは変改されたPAM特異性を有するSpCas9ニッカーゼに基づき得る:

Figure 2020191243000100

Figure 2020191243000101

Figure 2020191243000102

Figure 2020191243000103
In other embodiments, a prime editor fusion protein can be based on SaCas9 or SpCas9 nickase with altered PAM specificity, such as the following exemplary sequences:
Figure 2020191243000100

Figure 2020191243000101

Figure 2020191243000102

Figure 2020191243000103

さらに他の態様において、本願において企図されるプライム編集因子融合タンパク質は、M-MLV逆転写酵素の短縮されたバージョンに融合されたCas9ニッカーゼ(例えば、Cas9(H840A))を包含し得る。この態様では、逆転写酵素は4つの変異をもまた含有する(D200N、T306K、W313F、T330P;PE2に存在するL603W変異は短縮を原因としてもはや存在しないということに注意)。この短縮された編集因子をコードするDNA配列はPE2よりも522bp小さく、よって、DNA配列の送達がそのサイズを原因として難しい適用(すなわち、アデノ随伴ウイルスおよびレンチウイルス送達)にとってそれを可能性として有用にする。この態様はCas9(H840A)-MMLV-RT(trunc)または「短いPE2(PE2-short)」または「PE2-trunc」と言われ、次のアミノ酸配列を有する:

Figure 2020191243000104

Figure 2020191243000105
In yet other embodiments, a prime editor fusion protein contemplated herein may include a Cas9 nickase (e.g., Cas9(H840A)) fused to a truncated version of M-MLV reverse transcriptase. In this embodiment, the reverse transcriptase also contains four mutations (D200N, T306K, W313F, T330P; note that the L603W mutation present in PE2 is no longer present due to truncation). The DNA sequence encoding this truncated editor is 522 bp smaller than PE2, thus making it potentially useful for applications where delivery of DNA sequences is difficult due to their size (i.e., adeno-associated virus and lentivirus delivery). This embodiment is referred to as Cas9(H840A)-MMLV-RT(trunc) or "short PE2" or "PE2-trunc" and has the following amino acid sequence:
Figure 2020191243000104

Figure 2020191243000105

図75を見よ。これは、PE2、PE2-trunc、PE3、およびPE3-truncの効率(すなわち、「規定された編集またはインデルを有する配列決定総読取の%」)を種々の細胞株において異なる標的部位について比較する棒グラフを提供する。データは、短縮されたRTバリアントを含むプライム編集因子が、短縮されていないRTタンパク質を含むプライム編集因子と約同じくらい効率的であったということを示す。 See Figure 75, which provides a bar graph comparing the efficiency (i.e., "% of total sequencing reads with defined edits or indels") of PE2, PE2-trunc, PE3, and PE3-trunc for different target sites in various cell lines. The data show that prime editors containing truncated RT variants were about as efficient as prime editors containing the untruncated RT protein.

種々の態様において、本願において企図されるプライム編集因子融合タンパク質は、PE1、PE2、または上で指示されているプライム編集因子融合体配列のいずれかと少なくとも約70%同一、少なくとも約80%同一、少なくとも約90%同一、少なくとも約95%同一、少なくとも約96%同一、少なくとも約97%同一、少なくとも約98%同一、少なくとも約99%同一、少なくとも約99.5%同一、または少なくとも約99.9%同一であるアミノ酸配列を有する上で開示されている配列のいずれかのバリアントをもまた包含し得る。 In various embodiments, the prime editor fusion proteins contemplated herein may also include variants of any of the sequences disclosed above having an amino acid sequence that is at least about 70% identical, at least about 80% identical, at least about 90% identical, at least about 95% identical, at least about 96% identical, at least about 97% identical, at least about 98% identical, at least about 99% identical, at least about 99.5% identical, or at least about 99.9% identical to PE1, PE2, or any of the prime editor fusion sequences indicated above.

ある態様において、リンカーが、本発明のペプチドまたはペプチドドメインもしくは部分のいずれかを連結するために用いられ得る(例えば、逆転写酵素に連結または融合されたnapDNAbp)。 In some embodiments, a linker may be used to link any of the peptides or peptide domains or portions of the invention (e.g., napDNAbp linked or fused to reverse transcriptase).

[5]リンカーおよび他のドメイン
PE融合タンパク質は、napDNAbp(例えば、Cas9ドメイン)およびポリメラーゼドメイン(例えば、RTドメイン)以外に種々の他のドメインを含み得る。例えば、napDNAbpがCas9でありかつポリメラーゼがRTであるケースでは、PE融合タンパク質は、Cas9ドメインをRTドメインと連結する1つ以上のリンカーを含み得る。リンカーは、他の機能ドメイン、例えば核局在配列(NLS)またはFEN1(または他のフラップエンドヌクレアーゼ)をもまたPE融合タンパク質またはそのドメインに連結し得る。
[5] Linker and other domains
The PE fusion protein may contain various other domains in addition to the napDNAbp (e.g., Cas9 domain) and the polymerase domain (e.g., RT domain). For example, in the case where the napDNAbp is Cas9 and the polymerase is RT, the PE fusion protein may contain one or more linkers linking the Cas9 domain to the RT domain. The linkers may also link other functional domains, such as a nuclear localization sequence (NLS) or FEN1 (or other flap endonucleases), to the PE fusion protein or domains thereof.

加えて、トランスプライム編集が関わる態様では、リンカーが、tPERT動員タンパク質をプライム編集因子に例えばtPERt動員タンパク質およびnapDNAbpの間において連結するために用いられ得る。例えば、ポリメラーゼドメインおよび動員タンパク質ドメインをnapDNAbpに別個に融合するためのリンカーを包含するトランスプライム編集因子(tPE)の例示の模式図については、図3Gを見よ。 Additionally, in embodiments involving trans-prime editing, a linker can be used to link the tPERT recruitment protein to the prime editor, e.g., between the tPERt recruitment protein and the napDNAbp. See, e.g., FIG. 3G for an exemplary schematic of a trans-prime editor (tPE) that includes linkers for separately fusing the polymerase domain and recruitment protein domain to the napDNAbp.

A.リンカー
上で定められているとおり、本願において用いられる用語「リンカー」は、2つの分子または部分、例えばヌクレアーゼの結合ドメインおよび切断ドメインを連結する化学基または分子を言う。いくつかの態様では、リンカーはRNAによってプログラム可能なヌクレアーゼのgRNA結合ドメインおよびポリメラーゼ(例えば、逆転写酵素)の触媒ドメインを連結する。いくつかの態様では、リンカーはdCas9および逆転写酵素を連結する。典型的には、リンカーは2つの基、分子、または他の部分の間に位置取るかまたはそれらによってフランキングされ、共有結合を介して夫々の1つに接続され、それゆえに2つを接続する。いくつかの態様では、リンカーはアミノ酸または複数のアミノ酸(例えば、ペプチドまたはタンパク質)である。いくつかの態様では、リンカーは有機分子、基、ポリマー、または化学的部分である。いくつかの態様では、リンカーは長さが5-100アミノ酸、例えば、長さが5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、30-35、35-40、40-45、45-50、50-60、60-70、70-80、80-90、90-100、100-150、または150-200アミノ酸である。より長いかまたはより短いリンカーもまた企図される。
A. Linker
As defined above, the term "linker" as used herein refers to a chemical group or molecule that connects two molecules or moieties, such as the binding domain and cleavage domain of a nuclease. In some embodiments, the linker connects the gRNA binding domain of an RNA-programmable nuclease and the catalytic domain of a polymerase (e.g., reverse transcriptase). In some embodiments, the linker connects dCas9 and reverse transcriptase. Typically, the linker is located between or flanked by two groups, molecules, or other moieties, and is connected to each one via a covalent bond, thus connecting the two. In some embodiments, the linker is an amino acid or a plurality of amino acids (e.g., a peptide or protein). In some embodiments, the linker is an organic molecule, group, polymer, or chemical moiety. In some embodiments, the linker is 5-100 amino acids in length, e.g., 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 30-35, 35-40, 40-45, 45-50, 50-60, 60-70, 70-80, 80-90, 90-100, 100-150, or 150-200 amino acids in length. Longer or shorter linkers are also contemplated.

リンカーは共有結合ほども単純であり得るか、またはそれは長さが多くの原子であるポリマー性リンカーであり得る。ある態様において、リンカーはポリ(pol)ペプチドであるかまたはアミノ酸に基づく。他の態様において、リンカーはペプチド様ではない。ある態様において、リンカーは共有結合である(例えば、炭素-炭素結合、ジスルフィド結合、炭素-ヘテロ原子結合など)。ある態様において、リンカーはアミド連結部の炭素-窒素結合である。ある態様において、リンカーは、環状または非環状の、置換または無置換の、分枝または非分枝の脂肪族またはヘテロ脂肪族リンカーである。ある態様において、リンカーはポリマー性である(例えば、ポリエチレン、ポリエチレングリコール、ポリアミド、ポリエステルなど)。ある態様において、リンカーはアミノアルカン酸のモノマー、二量体、またはポリマーを含む。ある態様において、リンカーはアミノアルカン酸を含む(例えば、グリシン、エタン酸、アラニン、ベータアラニン、3-アミノプロパン酸、4-アミノ酪酸、5-ペンタン酸など)。ある態様において、リンカーはアミノヘキサン酸(Ahx)のモノマー、二量体、またはポリマーを含む。ある態様において、リンカーは炭素環部分(例えば、シクロペンタン、シクロヘキサン)に基づく。他の態様において、リンカーはポリエチレングリコール部分(PEG)を含む。他の態様において、リンカーはアミノ酸を含む。ある態様において、リンカーはペプチドを含む。ある態様において、リンカーはアリールまたはヘテロアリール部分を含む。ある態様において、リンカーはフェニル環に基づく。リンカーは、ペプチドからリンカーへの求核剤の取り付けを容易化するための官能化された部分を包含し得る(例えば、チオール、アミノ)。いずれかの求電子剤がリンカーの一部として用いられ得る。例示の求電子剤は、活性化エステル、活性化アミド、マイケルアクセプター、ハロゲン化アルキル、ハロゲン化アリール、ハロゲン化アシル、およびイソチオシアネートを包含するが、これらに限定されない。 The linker can be as simple as a covalent bond, or it can be a polymeric linker that is many atoms in length. In some embodiments, the linker is a poly(pol) peptide or based on amino acids. In other embodiments, the linker is not peptide-like. In some embodiments, the linker is a covalent bond (e.g., carbon-carbon bond, disulfide bond, carbon-heteroatom bond, etc.). In some embodiments, the linker is a carbon-nitrogen bond of an amide linkage. In some embodiments, the linker is a cyclic or acyclic, substituted or unsubstituted, branched or unbranched, aliphatic or heteroaliphatic linker. In some embodiments, the linker is polymeric (e.g., polyethylene, polyethylene glycol, polyamide, polyester, etc.). In some embodiments, the linker comprises a monomer, dimer, or polymer of an aminoalkanoic acid. In some embodiments, the linker comprises an aminoalkanoic acid (e.g., glycine, ethanoic acid, alanine, beta-alanine, 3-aminopropanoic acid, 4-aminobutyric acid, 5-pentanoic acid, etc.). In some embodiments, the linker comprises a monomer, dimer, or polymer of aminohexanoic acid (Ahx). In some embodiments, the linker is based on a carbocyclic moiety (e.g., cyclopentane, cyclohexane). In other embodiments, the linker comprises a polyethylene glycol moiety (PEG). In other embodiments, the linker comprises an amino acid. In some embodiments, the linker comprises a peptide. In some embodiments, the linker comprises an aryl or heteroaryl moiety. In some embodiments, the linker is based on a phenyl ring. The linker may include a functionalized moiety to facilitate attachment of a nucleophile from the peptide to the linker (e.g., thiol, amino). Any electrophile may be used as part of the linker. Exemplary electrophiles include, but are not limited to, activated esters, activated amides, Michael acceptors, alkyl halides, aryl halides, acyl halides, and isothiocyanates.

いくつかの他の態様において、リンカーはアミノ酸配列(GGGGS)n(配列番号165)、(G)n(配列番号166)、(EAAAK)n(配列番号167)、(GGS)n(配列番号168)、(SGGS)n(配列番号169)、(XP)n(配列番号170)、またはそれらのいずれかの組み合わせを含み、nは独立して1および30の間の整数であり、Xはいずれかのアミノ酸である。いくつかの態様では、リンカーはアミノ酸配列(GGS)N(配列番号176)を含み、nは1、3、または7である。いくつかの態様では、リンカーはアミノ酸配列SGSETPGTSESATPES(配列番号171)を含む。いくつかの態様では、リンカーはアミノ酸配列SGGSSGGSSGSETPGTSESATPESSGGSSGGS(配列番号172)を含む。いくつかの態様では、リンカーはアミノ酸配列SGGSGGSGGS(配列番号173)を含む。いくつかの態様では、リンカーはアミノ酸配列SGGS(配列番号174)を含む。他の態様において、リンカーはアミノ酸配列SGGSSGGSSGSETPGTSESATPESAGSYPYDVPDYAGSAAPAAKKKKLDGSGSGGSSGGS(配列番号175、60AA)を含む。 In some other embodiments, the linker comprises the amino acid sequence (GGGGS) n (SEQ ID NO:165), (G) n (SEQ ID NO:166), (EAAAK) n (SEQ ID NO:167), (GGS) n (SEQ ID NO:168), (SGGS) n (SEQ ID NO:169), (XP) n (SEQ ID NO:170), or any combination thereof, where n is independently an integer between 1 and 30, and X is any amino acid. In some embodiments, the linker comprises the amino acid sequence (GGS)N (SEQ ID NO:176), where n is 1, 3, or 7. In some embodiments, the linker comprises the amino acid sequence SGSETPGTSESATPES (SEQ ID NO:171). In some embodiments, the linker comprises the amino acid sequence SGGSSGGSSGSETPGTSESATPESSGGSSGGS (SEQ ID NO:172). In some embodiments, the linker comprises the amino acid sequence SGGSGGSGGS (SEQ ID NO:173). In some embodiments, the linker comprises the amino acid sequence SGGS (SEQ ID NO:174). In other embodiments, the linker comprises the amino acid sequence SGGSSGGSSGSETPGTSESATPESAGSYPYDVPDYAGSAAPAAKKKKLDGSGSGGSSGGS (SEQ ID NO: 175, 60AA).

ある態様において、リンカーは本発明のペプチドまたはペプチドドメインもしくは部分のいずれかを連結するために用いられ得る(例えば、逆転写酵素に連結または融合されるnapDNAbp)。 In some embodiments, linkers can be used to link any of the peptides or peptide domains or portions of the invention (e.g., napDNAbp linked or fused to reverse transcriptase).

上で定められているとおり、本願において用いられる用語「リンカー」は、2つの分子または部分、例えばヌクレアーゼの結合ドメインおよび切断ドメインを連結する化学基または分子を言う。いくつかの態様では、リンカーはRNAによってプログラム可能なヌクレアーゼのgRNA結合ドメインおよびリコンビナーゼの触媒ドメインを連結する。いくつかの態様では、リンカーはdCas9および逆転写酵素を連結する。典型的には、リンカーは2つの基、分子、または他の部分の間に位置取るかまたはそれらによってフランキングされ、共有結合を介して夫々の1つに接続され、それゆえに2つを接続する。いくつかの態様では、リンカーはアミノ酸または複数のアミノ酸(例えば、ペプチドまたはタンパク質)である。いくつかの態様では、リンカーは有機分子、基、ポリマー、または化学的部分である。いくつかの態様では、リンカーは長さが5~100アミノ酸、例えば、長さが5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、30~35、35~40、40~45、45~50、50~60、60~70、70~80、80~90、90~100、100~150、または150~200アミノ酸である。より長いかまたはより短いリンカーもまた企図される。 As defined above, the term "linker" as used herein refers to a chemical group or molecule that links two molecules or moieties, such as the binding domain and cleavage domain of a nuclease. In some embodiments, the linker links the gRNA binding domain of an RNA-programmable nuclease and the catalytic domain of a recombinase. In some embodiments, the linker links dCas9 and reverse transcriptase. Typically, the linker is located between or flanked by two groups, molecules, or other moieties and is connected to each one via a covalent bond, thus connecting the two. In some embodiments, the linker is an amino acid or multiple amino acids (e.g., a peptide or protein). In some embodiments, the linker is an organic molecule, group, polymer, or chemical moiety. In some embodiments, the linker is 5-100 amino acids in length, e.g., 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 30-35, 35-40, 40-45, 45-50, 50-60, 60-70, 70-80, 80-90, 90-100, 100-150, or 150-200 amino acids in length. Longer or shorter linkers are also contemplated.

リンカーは共有結合ほども単純であり得るか、またはそれは長さが多くの原子であるポリマー性リンカーであり得る。ある態様において、リンカーはポリペプチドであるかまたはアミノ酸に基づく。他の態様において、リンカーはペプチド様ではない。ある態様において、リンカーは共有結合である(例えば、炭素-炭素結合、ジスルフィド結合、炭素-ヘテロ原子結合など)。ある態様において、リンカーはアミド連結部の炭素-窒素結合である。ある態様において、リンカーは、環状または非環状の、置換または無置換の、分枝または非分枝の脂肪族またはヘテロ脂肪族リンカーである。ある態様において、リンカーはポリマー性である(例えば、ポリエチレン、ポリエチレングリコール、ポリアミド、ポリエステルなど)。ある態様において、リンカーはアミノアルカン酸のモノマー、二量体、またはポリマーを含む。ある態様において、リンカーはアミノアルカン酸を含む(例えば、グリシン、エタン酸、アラニン、ベータアラニン、3-アミノプロパン酸、4-アミノ酪酸、5-ペンタン酸など)。ある態様において、リンカーはアミノヘキサン酸(Ahx)のモノマー、二量体、またはポリマーを含む。ある態様において、リンカーは炭素環部分(例えば、シクロペンタン、シクロヘキサン)に基づく。他の態様において、リンカーはポリエチレングリコール部分(PEG)を含む。他の態様において、リンカーはアミノ酸を含む。ある態様において、リンカーはペプチドを含む。ある態様において、リンカーはアリールまたはヘテロアリール部分を含む。ある態様において、リンカーはフェニル環に基づく。リンカーは、ペプチドからリンカーへの求核剤の取り付けを容易化するための官能化された部分を包含し得る(例えば、チオール、アミノ)。いずれかの求電子剤がリンカーの一部として用いられ得る。例示の求電子剤は、活性化エステル、活性化アミド、マイケルアクセプター、ハロゲン化アルキル、ハロゲン化アリール、ハロゲン化アシル、およびイソチオシアネートを包含するが、これらに限定されない。 The linker can be as simple as a covalent bond, or it can be a polymeric linker that is many atoms in length. In some embodiments, the linker is a polypeptide or based on amino acids. In other embodiments, the linker is not peptide-like. In some embodiments, the linker is a covalent bond (e.g., carbon-carbon bond, disulfide bond, carbon-heteroatom bond, etc.). In some embodiments, the linker is a carbon-nitrogen bond of an amide linkage. In some embodiments, the linker is a cyclic or acyclic, substituted or unsubstituted, branched or unbranched aliphatic or heteroaliphatic linker. In some embodiments, the linker is polymeric (e.g., polyethylene, polyethylene glycol, polyamide, polyester, etc.). In some embodiments, the linker comprises a monomer, dimer, or polymer of an aminoalkanoic acid. In some embodiments, the linker comprises an aminoalkanoic acid (e.g., glycine, ethanoic acid, alanine, beta-alanine, 3-aminopropanoic acid, 4-aminobutyric acid, 5-pentanoic acid, etc.). In some embodiments, the linker comprises a monomer, dimer, or polymer of aminohexanoic acid (Ahx). In some embodiments, the linker is based on a carbocyclic moiety (e.g., cyclopentane, cyclohexane). In other embodiments, the linker comprises a polyethylene glycol moiety (PEG). In other embodiments, the linker comprises an amino acid. In some embodiments, the linker comprises a peptide. In some embodiments, the linker comprises an aryl or heteroaryl moiety. In some embodiments, the linker is based on a phenyl ring. The linker may include a functionalized moiety to facilitate attachment of a nucleophile from the peptide to the linker (e.g., thiol, amino). Any electrophile may be used as part of the linker. Exemplary electrophiles include, but are not limited to, activated esters, activated amides, Michael acceptors, alkyl halides, aryl halides, acyl halides, and isothiocyanates.

いくつかの他の態様において、リンカーはアミノ酸配列(GGGGS)n(配列番号165)、(G)n(配列番号166)、(EAAAK)n(配列番号167)、(GGS)n(配列番号168)、(SGGS)n(配列番号169)、(XP)n(配列番号170)、またはそれらのいずれかの組み合わせを含み、nは独立して1および30の間の整数であり、Xはいずれかのアミノ酸である。いくつかの態様では、リンカーはアミノ酸配列(GGS)N(配列番号176)を含み、nは1、3、または7である。いくつかの態様では、リンカーはアミノ酸配列SGSETPGTSESATPES(配列番号171)を含む。いくつかの態様では、リンカーはアミノ酸配列SGGSSGGSSGSETPGTSESATPESSGGSSGGS(配列番号172)を含む。いくつかの態様では、リンカーはアミノ酸配列SGGSGGSGGS(配列番号173)を含む。いくつかの態様では、リンカーはアミノ酸配列SGGS(配列番号174)を含む。 In some other embodiments, the linker comprises the amino acid sequence (GGGGS)n (SEQ ID NO: 165), (G)n (SEQ ID NO: 166), (EAAAK) n (SEQ ID NO: 167), (GGS) n (SEQ ID NO: 168), (SGGS)n (SEQ ID NO: 169), (XP)n (SEQ ID NO: 170), or any combination thereof, where n is independently an integer between 1 and 30, and X is any amino acid. In some embodiments, the linker comprises the amino acid sequence (GGS)N (SEQ ID NO: 176), where n is 1, 3, or 7. In some embodiments, the linker comprises the amino acid sequence SGSETPGTSESATPES (SEQ ID NO: 171). In some embodiments, the linker comprises the amino acid sequence SGGSSGGSSGSETPGTSESATPESSGGSSGGS (SEQ ID NO: 172). In some embodiments, the linker comprises the amino acid sequence SGGSGGSGGS (SEQ ID NO: 173). In some embodiments, the linker comprises the amino acid sequence SGGS (SEQ ID NO: 174).

特に、次のリンカーが、プライム編集因子ドメインを互いと連結するために種々の態様に用いられ得る:
GGS(配列番号767);
GGSGGS(配列番号768);
GGSGGSGGS(配列番号769);
SGGSSGGSSGSETPGTSESATPESSGGSSGGSS(配列番号127);
SGSETPGTSESATPES(配列番号171);
SGGSSGGSSGSETPGTSESATPESAGSYPYDVPDYAGSAAPAAKKKKLDGSGSGGSSGGS(配列番号175)。
In particular, the following linkers can be used in various embodiments to link the prime editor domains together:
GGS (SEQ ID NO:767);
GGSGGS (SEQ ID NO:768);
GGSGGSGGS (SEQ ID NO:769);
SGGSSGGSSGSETPGTSESATPESSGGSSGGSS (SEQ ID NO: 127);
SGSETPGTSESATPES (SEQ ID NO: 171);
SGGSSGGSSGSETPGTSESATPESAGSYPYDVPDYAGSAAPAAKKKKLDGSGSGGSSGGS (sequence number 175).

B.核局在配列(NLS)
種々の態様において、PE融合タンパク質は1つ以上の核局在配列(NLS)を含み得、これらは細胞核内へのタンパク質の移行を促進することを助ける。かかる配列は当該技術分野で周知であり、次の例を包含し得る:

Figure 2020191243000106

Figure 2020191243000107
B. Nuclear localization sequence (NLS)
In various embodiments, the PE fusion protein may contain one or more nuclear localization sequences (NLS), which aid in promoting the translocation of the protein into the cell nucleus. Such sequences are well known in the art and may be used to , which may include the following examples:
Figure 2020191243000106

Figure 2020191243000107

上のNLS例は限定しない。PE融合タンパク質はいずれかの公知のNLS配列を含み得、Cokol et al.,"Finding nuclear localization signals,"EMBO Rep.,2000,1(5):411-415およびFreitas et al.,"Mechanisms and Signals for the Nuclear Import of Proteins,"Current Genomics,2009,10(8):550-7に記載されているもののいずれかを包含する。これらの夫々は参照によって本願に組み込まれる。 The above NLS examples are not limiting. The PE fusion protein may contain any known NLS sequence, including any of those described in Cokol et al., "Finding nuclear localization signals," EMBO Rep., 2000, 1(5):411-415, and Freitas et al., "Mechanisms and Signals for the Nuclear Import of Proteins," Current Genomics, 2009, 10(8):550-7, each of which is incorporated herein by reference.

種々の態様において、本明細書に開示のプライム編集因子およびプライム編集因子をコードする構築物は、さらに、1つ以上の、好ましくは少なくとも2つの核局在シグナルを含む。ある態様において、プライム編集因子は少なくとも2つのNLSを含む。少なくとも2つのNLSによる態様では、NLSは同じNLSであり得るか、またはそれらは異なるNLSであり得る。加えて、NLSはプライム編集因子の残りの部分との融合タンパク質の一部として発現され得る。いくつかの態様では、NLSの1つ以上は双節型NLS(「bpNLS」)である。ある態様において、本開示の融合タンパク質は2つの双節型NLSを含む。いくつかの態様では、本開示の融合タンパク質は2つよりも多くの双節型NLSを含む。 In various embodiments, the prime editing factors and constructs encoding the prime editing factors disclosed herein further comprise one or more, preferably at least two, nuclear localization signals. In some embodiments, the prime editing factor comprises at least two NLSs. In embodiments with at least two NLSs, the NLSs can be the same NLS or they can be different NLSs. In addition, the NLS can be expressed as part of a fusion protein with the remainder of the prime editing factor. In some embodiments, one or more of the NLSs is a bipartite NLS ("bpNLS"). In some embodiments, the fusion proteins of the present disclosure comprise two bipartite NLSs. In some embodiments, the fusion proteins of the present disclosure comprise more than two bipartite NLSs.

NLS融合の位置付けはプライム編集因子のN末端、C末端、または配列内であり得る(例えば、コードされるnapDNAbp構成要素(例えばCas9)およびポリメラーゼドメイン(例えば逆転写酵素ドメイン)の間に挿入される。 The location of the NLS fusion can be at the N-terminus, C-terminus, or within the sequence of the prime editor (e.g., inserted between the encoded napDNAbp component (e.g., Cas9) and the polymerase domain (e.g., reverse transcriptase domain).

NLSは当該技術分野のいずれかの公知のNLS配列であり得る。NLSは核局在のためのいずれかの将来に発見されるNLSでもまたあり得る。NLSは、いずれかの天然に存在するNLSまたはいずれかの天然に存在しないNLS(例えば、1つ以上の所望の変異を有するNLS)でもまたあり得る。 The NLS can be any known NLS sequence in the art. The NLS can also be any future discovered NLS for nuclear localization. The NLS can also be any naturally occurring NLS or any non-naturally occurring NLS (e.g., an NLS with one or more desired mutations).

用語「核局在配列」または「NLS」は、例えば核輸送による細胞核へのタンパク質の搬入を促進するアミノ酸配列を言う。核局在配列は当該技術分野で知られており、当業者には明らかであろう。例えば、NLS配列は、2001年5月31日にWO/2001/038547として公開された2000年11月23日出願のPlank et al.の国際PCT出願PCT/EP2000/011690に記載されている。これの内容は参照によって本願に組み込まれる。いくつかの態様では、NLSはアミノ酸配列PKKKRKV(配列番号16)、MDSLLMNRRKFLYQFKNVRWAKGRRETYLC(配列番号17)、KRTADGSEFESPKKKRKV(配列番号3864)、またはKRTADGSEFEPKKKRKV(配列番号125)を含む。他の態様において、NLSはアミノ酸配列NLSKRPAAIKKAGQAKKKK(配列番号136)、PAAKRVKLD(配列番号192)、RQRRNELKRSF(配列番号3934)、NQSSNFGPMKGGNFGGRSSGPYGGGGQYFAKPRNQGGY(配列番号3935)を含む。 The term "nuclear localization sequence" or "NLS" refers to an amino acid sequence that facilitates the import of a protein into a cell nucleus, for example, by nuclear transport. Nuclear localization sequences are known in the art and will be apparent to those skilled in the art. For example, NLS sequences are described in International PCT Application PCT/EP2000/011690, filed November 23, 2000, by Plank et al., published as WO/2001/038547 on May 31, 2001, the contents of which are incorporated herein by reference. In some embodiments, the NLS comprises the amino acid sequence PKKKRKV (SEQ ID NO: 16), MDSLLMNRRKFLYQFKNVRWAKGRRETYLC (SEQ ID NO: 17), KRTADGSEFESPKKKRKV (SEQ ID NO: 3864), or KRTADGSEFEPKKKRKV (SEQ ID NO: 125 ). In other embodiments, the NLS comprises the amino acid sequence NLSKRPAAIKKAGQAKKKK (SEQ ID NO: 136 ), PAAKRVKLD (SEQ ID NO: 192), RQRRNELKRSF (SEQ ID NO: 3934 ), NQSSNFGPMKGGNFGGRSSGPYGGGGQYFAKPRNQGGY (SEQ ID NO: 3935 ).

本開示の一側面において、プライム編集因子は、1つ以上の核局在シグナル(NLS)、好ましくは少なくとも2つのNLSによって修飾され得る。ある態様において、プライム編集因子は2つ以上のNLSによって修飾される。本開示は、本開示の時に当該技術分野で公知のいずれかの核局在シグナルまたは本出願時の後の現況技術によって同定されるかもしくはさもなければ利用可能にされるいずれかの核局在シグナルの使用を企図する。代表的な核局在シグナルは、配列が発現される細胞の核にタンパク質を導くペプチド配列である。核局在シグナルは支配的には塩基性であり、タンパク質のアミノ酸配列のほとんどどこにでも位置取り得、一般的には、4アミノ酸(Autieri & Agrawal,(1998)J.Biol.Chem.273:14731-37。参照によって本願に組み込まれる)から8アミノ酸の短い配列を含み、典型的にはリジンおよびアルギニン残基がリッチである(Magin et al.,(2000)Virology 274:11-16。参照によって本願に組み込まれる)。核局在シグナルは多くの場合にはプロリン残基を含む。種々の核局在シグナルが同定されており、細胞質から細胞の核への生物学的分子の輸送を成し遂げるために用いられている。例えば、Tinland et al.,(1992)Proc.Natl.Acad.Sci.U.S.A.89:7442-46;Moede et al.,(1999) FEBS Lett.461:229-34を見よ。これは参照によって組み込まれる。移行は現行では核膜孔タンパク質が関わると考えられる。 In one aspect of the present disclosure, the prime editor may be modified by one or more nuclear localization signals (NLS), preferably at least two NLSs. In some embodiments, the prime editor is modified by two or more NLSs. The present disclosure contemplates the use of any nuclear localization signal known in the art at the time of this disclosure or any nuclear localization signal identified or otherwise made available by the state of the art at a later time of the present application. Exemplary nuclear localization signals are peptide sequences that direct a protein to the nucleus of the cell in which the sequence is expressed. Nuclear localization signals are predominantly basic and can be located almost anywhere in the amino acid sequence of a protein, generally comprising short sequences of 4 amino acids (Autieri & Agrawal, (1998) J. Biol. Chem. 273:14731-37, incorporated herein by reference) to 8 amino acids, and are typically rich in lysine and arginine residues (Magin et al., (2000) Virology 274:11-16, incorporated herein by reference). Nuclear localization signals often contain proline residues. A variety of nuclear localization signals have been identified and used to effect transport of biological molecules from the cytoplasm to the nucleus of the cell. See, e.g., Tinland et al., (1992) Proc. Natl. Acad. Sci. U.S.A. 89:7442-46; Moede et al., (1999) FEBS Lett. 461:229-34, which are incorporated by reference. The transport is currently thought to involve nuclear pore proteins.

ほとんどのNLSは3つの一般的な群に分類され得る:(i)SV40ラージT抗原NLS(PKKKRKV(配列番号16))によって例示される単節型NLS;(ii)XenopusヌクレオプラスミンNLS(KRXXXXXXXXXXKKKL(配列番号3936))によって例示される、可変の数のスペーサーアミノ酸によって分離された2つの塩基性ドメインからなる双節型モチーフ;ならびに(iii)非標準的な配列、例えばhnRNP A1タンパク質のM9、インフルエンザウイルス核タンパク質NLS、および酵母Gal4タンパク質NLS(Dingwall and Laskey 1991)。 Most NLSs can be classified into three general groups: (i) monokaryotic NLSs, exemplified by the SV40 large T antigen NLS (PKKKRKV (SEQ ID NO: 16)); (ii) bikaryotic motifs consisting of two basic domains separated by a variable number of spacer amino acids, exemplified by the Xenopus nucleoplasmin NLS (KRXXXXXXXXXXKKKL (SEQ ID NO: 3936 )); and (iii) non-canonical sequences, such as M9 of the hnRNP A1 protein, influenza virus nucleoprotein NLS, and yeast Gal4 protein NLS (Dingwall and Laskey 1991).

核局在シグナルはタンパク質のアミノ酸配列上の種々の点に出現する。NLSはタンパク質のN末端、C末端、および中心領域から同定されている。それゆえに、本開示は、プライム編集因子のC末端、N末端、および内部の領域において1つ以上のNLSによって修飾され得るプライム編集因子を提供する。核局在シグナルそれ自体と例えば強直的にまたは立体的に干渉しないようにして、構成要素NLS残基として機能しないより長い配列の残基が選択されるべきである。よって、NLSを含む配列の組成に厳格な限定はないが、事実上、かかる配列は長さおよび組成が機能的に限定され得る。 Nuclear localization signals occur at various points along the amino acid sequence of a protein. NLSs have been identified from the N-terminus, C-terminus, and central regions of a protein. Thus, the present disclosure provides prime editors that can be modified with one or more NLSs at the C-terminus, N-terminus, and internal regions of the prime editor. Residues of the longer sequence that do not function as component NLS residues should be selected so as not to interfere, e.g., tonically or sterically, with the nuclear localization signal itself. Thus, while there are no strict limitations on the composition of sequences that include an NLS, such sequences can be functionally limited in length and composition in nature.

本開示は、1つ以上のNLSを包含するようにプライム編集因子を改変するためのいずれかの好適な手段を企図する。一側面において、プライム編集因子は、そのN末端またはそのC末端(または両方)において1つ以上のNLSに翻訳的に融合されているプライム編集因子タンパク質を発現するように、すなわちプライム編集因子-NLS融合体構築物を形成するように、操作され得る。他の態様において、プライム編集因子をコードするヌクレオチド配列は、コードされるプライム編集因子の内部の領域に1つ以上のNLSをコードする読み枠を組み込むように遺伝子改変され得る。加えて、NLSは、プライム編集因子とN末端に、C末端に、または内部に、例えばそしてタンパク質の中心領域に取り付けられたNLSアミノ酸配列との間にコードされる種々のアミノ酸リンカーまたはスペーサー領域を包含し得る。それゆえに、本開示は、プライム編集因子および1つ以上のNLSを含む融合タンパク質を発現するためのヌクレオチド構築物、ベクター、およびホスト細胞をもまた可能にする。 The present disclosure contemplates any suitable means for modifying a prime editor to include one or more NLSs. In one aspect, a prime editor can be engineered to express a prime editor protein that is translationally fused to one or more NLSs at its N-terminus or its C-terminus (or both), i.e., to form a prime editor-NLS fusion construct. In other embodiments, a nucleotide sequence encoding a prime editor can be genetically modified to incorporate an open reading frame encoding one or more NLSs in an internal region of the encoded prime editor. In addition, the NLS can include various amino acid linker or spacer regions encoded between the prime editor and an NLS amino acid sequence attached to the N-terminus, C-terminus, or internally, for example, and in the central region of the protein. Thus, the present disclosure also enables nucleotide constructs, vectors, and host cells for expressing fusion proteins comprising a prime editor and one or more NLSs.

本明細書に記載のプライム編集因子は核局在シグナルをもまた含み得、これらは、1つ以上のリンカー、例えばそしてポリマー性、アミノ酸、核酸、多糖、化学的、または核酸リンカー要素を介してプライム編集因子に連結される。本開示の企図される範囲内のリンカーはいずれかの限定を有することを意図されず、いずれかの好適な型の分子(例えば、ポリマー、アミノ酸、多糖、核酸、脂質、またはいずれかの合成化学的リンカードメイン)であり得、プライム編集因子および1つ以上のNLSの間に結合(例えば、共有結合的連結、水素結合)を形成することを成就するいずれかの好適な戦略によって、プライム編集因子に連結され得る。 The prime editors described herein may also include nuclear localization signals, which are linked to the prime editor via one or more linkers, such as and polymeric, amino acid, nucleic acid, polysaccharide, chemical, or nucleic acid linker elements. Linkers within the contemplated scope of this disclosure are not intended to have any limitation and may be any suitable type of molecule (e.g., polymer, amino acid, polysaccharide, nucleic acid, lipid, or any synthetic chemical linker domain) and may be linked to the prime editor by any suitable strategy that achieves the formation of a bond (e.g., covalent linkage, hydrogen bond) between the prime editor and one or more NLSs.

C.フラップエンドヌクレアーゼ(例えばFEN1)
種々の態様において、PE融合タンパク質は1つ以上のフラップエンドヌクレアーゼ(例えばFEN1)を含み得、これは5'一本鎖DNAフラップの除去を触媒する酵素を言う。これらは天然に存在する酵素であり、これらはDNA複製を包含する細胞性のプロセスの間に形成される5'フラップの除去をプロセシングする。本明細書に記載のプライム編集法は、プライム編集の間に標的部位において形成される内生(endogenouse)DNAの5'フラップを除去するために、内生で供給されるフラップエンドヌクレアーゼまたはトランスで提供されるものを利用し得る。フラップエンドヌクレアーゼは当該技術分野において知られており、Patel et al.,"Flap endonucleases pass 5'-flaps through a flexible arch using a disorder-thread-order mechanism to confer specificity for free 5'-ends,"Nucleic Acids Research,2012,40(10):4507-4519およびTsutakawa et al.,"Human flap endonuclease structures,DNA double-base flipping,and a unified understanding of the FEN1 superfamily,"Cell,2011,145(2):198-211(これら各々は参照により本明細書に組み込まれる)の記載から見出され得る。例示のフラップエンドヌクレアーゼは、以下のアミノ酸配列によって表され得るFEN1である:

Figure 2020191243000108

Figure 2020191243000109
C. Flap endonucleases (e.g., FEN1)
In various embodiments, the PE fusion protein may comprise one or more flap endonucleases (e.g., FEN1), which refers to enzymes that catalyze the removal of 5' single-stranded DNA flaps. These are naturally occurring enzymes that process the removal of 5' flaps formed during cellular processes including DNA replication. The prime editing methods described herein may utilize endogenously provided flap endonucleases or those provided in trans to remove the 5' flap of endogenous DNA formed at the target site during prime editing. Flap endonucleases are known in the art and can be found in Patel et al., "Flap endonucleases pass 5'-flaps through a flexible arch using a disorder-thread-order mechanism to confer specificity for free 5'-ends," Nucleic Acids Research, 2012, 40(10):4507-4519 and Tsutakawa et al., "Human flap endonuclease structures, DNA double-base flipping, and a unified understanding of the FEN1 superfamily," Cell, 2011, 145(2):198-211, each of which is incorporated herein by reference. An exemplary flap endonuclease is FEN1, which can be represented by the following amino acid sequence:
Figure 2020191243000108

Figure 2020191243000109

フラップエンドヌクレアーゼは、いずれかのFEN1バリアント、変異体、または他のフラップエンドヌクレアーゼオーソログ、ホモログ、もしくはバリアントをもまた包含し得る。限定しないFEN1バリアントの例は次のとおりである:

Figure 2020191243000110

Figure 2020191243000111
Flap endonucleases can also include any FEN1 variants, mutants, or other flap endonuclease orthologs, homologs, or variants. Non-limiting examples of FEN1 variants are:
Figure 2020191243000110

Figure 2020191243000111

種々の態様において、本願において企図されるプライム編集因子融合タンパク質は、上の配列のいずれかと少なくとも約70%同一、少なくとも約80%同一、少なくとも約90%同一、少なくとも約95%同一、少なくとも約96%同一、少なくとも約97%同一、少なくとも約98%同一、少なくとも約99%同一、少なくとも約99.5%同一、または少なくとも約99.9%同一であるアミノ酸配列を有する上に開示されている配列のいずれかのフラップエンドヌクレアーゼバリアントを包含し得る。 In various embodiments, the prime editor fusion proteins contemplated herein may include flap endonuclease variants of any of the sequences disclosed above having an amino acid sequence that is at least about 70% identical, at least about 80% identical, at least about 90% identical, at least about 95% identical, at least about 96% identical, at least about 97% identical, at least about 98% identical, at least about 99% identical, at least about 99.5% identical, or at least about 99.9% identical to any of the above sequences.

5'端一本鎖DNAフラップの除去を容易化するために本方法によって利用され得る他のエンドヌクレアーゼは、(1)trex2、(2)exo1エンドヌクレアーゼを包含するが、これらに限定されない(例えば、Keijzers et al.,Biosci Rep.2015,35(3):e00206)。
Trex2
Other endonucleases that can be utilized by the present method to facilitate removal of the 5' single-stranded DNA flap include, but are not limited to, (1) trex2, (2) exo1 endonuclease (e.g., Keijzers et al., Biosci Rep. 2015, 35(3):e00206).
Trex2

3' 3プライム修復エキソヌクレアーゼ2(TREX2)-ヒト 3' 3 prime repair exonuclease 2 (TREX2) - human

受託番号NM_080701
MSEAPRAETFVFLDLEATGLPSVEPEIAELSLFAVHRSSLENPEHDESGALVLPRVLDKLTLCMCPERPFTAKASEITGLSSEGLARCRKAGFDGAVVRTLQAFLSRQAGPICLVAHNGFDYDFPLLCAELRRLGARLPRDTVCLDTLPALRGLDRAHSHGTRARGRQGYSLGSLFHRYFRAEPSAAHSAEGDVHTLLLIFLHRAAELLAWADEQARGWAHIEPMYLPPDDPSLEA(配列番号3865)。
Accession number NM_080701
MSEAPRAETFVFLDLEATGLPSVEPEIAELSLFAVHRSSLENPEHDESGALVLPRVLDKLTLCMCPERPFTAKASEITGLSSEGLARCRKAGFDGAVVRTLQAFLSRQAGPICLVAHNGFDYDFPLLCAELRRLGARLPRDTVCLDTLPALRGLDRAHSHGTRARGRQGYSLGSLFHRYFRAEPSAAHSAEGDVHTLLLIFLHRAAELLAWADEQARGWAHIEPMYLPPDDPSLEA (sequence number 3865).

3' 3プライム修復エキソヌクレアーゼ2(TREX2)-マウス 3' 3 prime repair exonuclease 2 (TREX2) - Mouse

受託番号NM_011907 Accession number NM_011907

MSEPPRAETFVFLDLEATGLPNMDPEIAEISLFAVHRSSLENPERDDSGSLVLPRVLDKLTLCMCPERPFTAKASEITGLSSESLMHCGKAGFNGAVVRTLQGFLSRQEGPICLVAHNGFDYDFPLLCTELQRLGAHLPQDTVCLDTLPALRGLDRAHSHGTRAQGRKSYSLASLFHRYFQAEPSAAHSAEGDVHTLLLIFLHRAPELLAWADEQARSWAHIEPMYVPPDGPSLEA(配列番号3866)。 MSEPPRAETFVFLDLEATGLPNMDPEIAEISLFAVHRSSLENPERDDSGSLVLPRVLDKLTLCMCPERPFTAKASEITGLSSESLMHCGKAGFNGAVVRTLQGFLSRQEGPICLVAHNGFDYDFPLLCTELQRLGAHLPQDTVCLDTLPALRGLDRAHSHGTRAQGRKSYSLASLFHRYFQAEPSAAHSAEGDVHTLLLIFLHRAPELLAWADEQARSWAHIEPMYVPPDGPSLEA (sequence number 3866).

3' 3プライム修復エキソヌクレアーゼ2(TREX2)-ラット 3' 3 prime repair exonuclease 2 (TREX2) - Rat

受託番号NM_001107580 Accession number NM_001107580

MSEPLRAETFVFLDLEATGLPNMDPEIAEISLFAVHRSSLENPERDDSGSLVLPRVLDKLTLCMCPERPFTAKASEITGLSSEGLMNCRKAAFNDAVVRTLQGFLSRQEGPICLVAHNGFDYDFPLLCTELQRLGAHLPRDTVCLDTLPALRGLDRVHSHGTRAQGRKSYSLASLFHRYFQAEPSAAHSAEGDVNTLLLIFLHRAPELLAWADEQARSWAHIEPMYVPPDGPSLEA(配列番号3867)。 MSEPLRAETFVFLDLEATGLPNMDPEIAEISLFAVHRSSLENPERDDSGSLVLPRVLDKLTLCMCPERPFTAKASEITGLSSEGLMNCRKAAFNDAVVRTLQGFLSRQEGPICLVAHNGFDYDFPLLCTELQRLGAHLPRDTVCLDTLPALRGLDRVHSHGTRAQGRKSYSLASLFHRYFQAEPSAAHSAEGDVNTLLLIFLHRAPELLAWADEQARSWAHIEPMYVPPDGPSLEA (sequence number 3867).

ExoI
ヒトエキソヌクレアーゼ1(EXO1)は、DNAミスマッチ修復(MMR)、マイクロ媒介末端結合(micro-mediated end-joining、相同組換え(HR)、および複製を包含する、多くの種々のDNA代謝プロセスに関係する。ヒトEXO1は、真核生物ヌクレアーゼRad2/XPGのファミリーに属し、これはまたFEN1およびGEN1も包含する。Rad2/XPGファミリーは、ファージからヒトまでの種を通してヌクレアーゼドメインが保存されている。EXO1遺伝子産物は、5'エキソヌクレアーゼと5'フラップ活性との両方を呈する。加えて、EXO1は、固有の5'RNase H活性も含有する。ヒトEXO1は、二本鎖DNA(dsDNA)、ニック、ギャップ、シュードY構造のプロセシングに対し高親和性を有し、遺伝で受け継いだそのフラップ活性を使用してホリデイ接点を分解し得る。ヒトEXO1はMMRに関係し、MLH1およびMSH2と直接相互作用する保存された結合ドメインを含有する。EXO1核酸分解活性は、PCNA、MutSα(MSH2/MSH6複合体)、14-3-3、MRN、および9-1-1複合体によって正に刺激される。
ExoI
Human exonuclease 1 (EXO1) is involved in many different DNA metabolic processes, including DNA mismatch repair (MMR), micro-mediated end-joining, homologous recombination (HR), and replication. Human EXO1 belongs to the family of eukaryotic nucleases Rad2/XPG, which also includes FEN1 and GEN1. The Rad2/XPG family has conserved nuclease domains across species from phages to humans. The EXO1 gene product exhibits both 5' exonuclease and 5' flap activities. In addition, EXO1 is a unique 5' RNase Human EXO1 also contains H activity. Human EXO1 has high affinity for processing double-stranded DNA (dsDNA), nicks, gaps, and pseudo-Y structures, and can resolve Holliday junctions using its inherited flap activity. Human EXO1 is involved in MMR and contains a conserved binding domain that directly interacts with MLH1 and MSH2. EXO1 nucleolytic activity is positively stimulated by PCNA, MutSα (MSH2/MSH6 complex), 14-3-3, MRN, and the 9-1-1 complex.

エキソヌクレアーゼ1(EXO1)受託番号NM_003686(Homo sapiensエキソヌクレアーゼ1(EXO1)、転写産物バリアント3)-アイソフォームA
MGIQGLLQFIKEASEPIHVRKYKGQVVAVDTYCWLHKGAIACAEKLAKGEPTDRYVGFCMKFVNMLLSHGIKPILVFDGCTLPSKKEVERSRRERRQANLLKGKQLLREGKVSEARECFTRSINITHAMAHKVIKAARSQGVDCLVAPYEADAQLAYLNKAGIVQAIITEDSDLLAFGCKKVILKMDQFGNGLEIDQARLGMCRQLGDVFTEEKFRYMCILSGCDYLSSLRGIGLAKACKVLRLANNPDIVKVIKKIGHYLKMNITVPEDYINGFIRANNTFLYQLVFDPIKRKLIPLNAYEDDVDPETLSYAGQYVDDSIALQIALGNKDINTFEQIDDYNPDTAMPAHSRSHSWDDKTCQKSANVSSIWHRNYSPRPESGTVSDAPQLKENPSTVGVERVISTKGLNLPRKSSIVKRPRSAELSEDDLLSQYSLSFTKKTKKNSSEGNKSLSFSEVFVPDLVNGPTNKKSVSTPPRTRNKFATFLQRKNEESGAVVVPGTRSRFFCSSDSTDCVSNKVSIQPLDETAVTDKENNLHESEYGDQEGKRLVDTDVARNSSDDIPNNHIPGDHIPDKATVFTDEESYSFESSKFTRTISPPTLGTLRSCFSWSGGLGDFSRTPSPSPSTALQQFRRKSDSPTSLPENNMSDVSQLKSEESSDDESHPLREEACSSQSQESGEFSLQSSNASKLSQCSSKDSDSEESDCNIKLLDSQSDQTSKLRLSHFSKKDTPLRNKVPGLYKSSSADSLSTTKIKPLGPARASGLSKKPASIQKRKHHNAENKPGLQIKLNELWKNFGFKKF(配列番号3868)。
Exonuclease 1 (EXO1) Accession number NM_003686 (Homo sapiens Exonuclease 1 (EXO1), transcript variant 3) - Isoform A
(Sequence number 3868).

エキソヌクレアーゼ1(EXO1)受託番号NM_006027(Homo sapiensエキソヌクレアーゼ1(EXO1)、転写産物バリアント3)-アイソフォームB Exonuclease 1 (EXO1) Accession number NM_006027 (Homo sapiens exonuclease 1 (EXO1), transcript variant 3) - isoform B

MGIQGLLQFIKEASEPIHVRKYKGQVVAVDTYCWLHKGAIACAEKLAKGEPTDRYVGFCMKFVNMLLSHGIKPILVFDGCTLPSKKEVERSRRERRQANLLKGKQLLREGKVSEARECFTRSINITHAMAHKVIKAARSQGVDCLVAPYEADAQLAYLNKAGIVQAIITEDSDLLAFGCKKVILKMDQFGNGLEIDQARLGMCRQLGDVFTEEKFRYMCILSGCDYLSSLRGIGLAKACKVLRLANNPDIVKVIKKIGHYLKMNITVPEDYINGFIRANNTFLYQLVFDPIKRKLIPLNAYEDDVDPETLSYAGQYVDDSIALQIALGNKDINTFEQIDDYNPDTAMPAHSRSHSWDDKTCQKSANVSSIWHRNYSPRPESGTVSDAPQLKENPSTVGVERVISTKGLNLPRKSSIVKRPRSAELSEDDLLSQYSLSFTKKTKKNSSEGNKSLSFSEVFVPDLVNGPTNKKSVSTPPRTRNKFATFLQRKNEESGAVVVPGTRSRFFCSSDSTDCVSNKVSIQPLDETAVTDKENNLHESEYGDQEGKRLVDTDVARNSSDDIPNNHIPGDHIPDKATVFTDEESYSFESSKFTRTISPPTLGTLRSCFSWSGGLGDFSRTPSPSPSTALQQFRRKSDSPTSLPENNMSDVSQLKSEESSDDESHPLREEACSSQSQESGEFSLQSSNASKLSQCSSKDSDSEESDCNIKLLDSQSDQTSKLRLSHFSKKDTPLRNKVPGLYKSSSADSLSTTKIKPLGPARASGLSKKPASIQKRKHHNAENKPGLQIKLNELWKNFGFKKDSEKLPPCKKPLSPVRDNIQLTPEAEEDIFNKPECGRVQRAIFQ(配列番号3869)。 MGIQGLLQFIKEASEPIHVRKYKGQVVAVDTYCWLHKGAIACAEKLAKGEPTDRYVGFCMKFVNMLLSHGIKPILVFDGCTLPSKKEVERSRRERRQANLLKGKQLLREGKVSEARECFTRSINITHAMAHKVIKAARSQGVDCLVAPYEADAQLAYLNKAGIVQAIITEDSDLLAFGCKKVILKMDQFGNGLEIDQARLGMCRQLGDVFTEEKFRYMCILSGCDYLSSLRGIGLAKACKVLRLANNPDIVKVIKKIGHYLKMNITVPEDYINGFIRANNTFLYQLVFDPIKRKLIPLNAYEDDVDPETLSYAGQYVDDSIALQIALGNKDINTFEQIDDYNPDTAMPAHSRSHSWDDKTCQKSANVSSIWHRNYSPRPESGTVSDAPQLKENPSTVGVERVISTKGLNLPRKSSIVKRPRSAELSED DLLSQYSLSFTKKTKKNSSEGNKSLSFSEVFVPDLVNGPTNKKSVSTPPRTRNKFATFLQRKNEESGAVVVPGTRSRFFCSSDSTDCVSNKVSIQPLDETAVTDKENNLHESEYGDQEGKRLVDTDVARNSSDDIPNNHIPGDHIPDKATVFTDEESYSFESSKFTRTISPPTLGTLRGTLSCFSWSGGLGDFSRTPSPSPSTALQQFRRKSDSPTSLPENNMSDVSQLKSEESSDDESHPLREEACSSQSQESGEFSLQSSNASKLSQCSSKDSDSEESDCNIKLLDSQSDQTSKLRLSHFSKKDTPLRNKVPGLYKSSSADSLSTTKIKPLGPARASGLSKKPASIQKRKHHNAENKPGLQIKLNELWKNFGFKKDSEKLPPCKKPLSPVRDNIQLTPEAEEDIFNKPECGRVQRAIFQ (sequence number 3869).

エキソヌクレアーゼ1(EXO1)受託番号NM_001319224(Homo sapiensエキソヌクレアーゼ1(EXO1)、転写産物バリアント4)-アイソフォームC Exonuclease 1 (EXO1) Accession number NM_001319224 (Homo sapiens exonuclease 1 (EXO1), transcript variant 4) - isoform C

MGIQGLLQFIKEASEPIHVRKYKGQVVAVDTYCWLHKGAIACAEKLAKGEPTDRYVGFCMKFVNMLLSHGIKPILVFDGCTLPSKKEVERSRRERRQANLLKGKQLLREGKVSEARECFTRSINITHAMAHKVIKAARSQGVDCLVAPYEADAQLAYLNKAGIVQAIITEDSDLLAFGCKKVILKMDQFGNGLEIDQARLGMCRQLGDVFTEEKFRYMCILSGCDYLSSLRGIGLAKACKVLRLANNPDIVKVIKKIGHYLKMNITVPEDYINGFIRANNTFLYQLVFDPIKRKLIPLNAYEDDVDPETLSYAGQYVDDSIALQIALGNKDINTFEQIDDYNPDTAMPAHSRSHSWDDKTCQKSANVSSIWHRNYSPRPESGTVSDAPQLKENPSTVGVERVISTKGLNLPRKSSIVKRPRSELSEDDLLSQYSLSFTKKTKKNSSEGNKSLSFSEVFVPDLVNGPTNKKSVSTPPRTRNKFATFLQRKNEESGAVVVPGTRSRFFCSSDSTDCVSNKVSIQPLDETAVTDKENNLHESEYGDQEGKRLVDTDVARNSSDDIPNNHIPGDHIPDKATVFTDEESYSFESSKFTRTISPPTLGTLRSCFSWSGGLGDFSRTPSPSPSTALQQFRRKSDSPTSLPENNMSDVSQLKSEESSDDESHPLREEACSSQSQESGEFSLQSSNASKLSQCSSKDSDSEESDCNIKLLDSQSDQTSKLRLSHFSKKDTPLRNKVPGLYKSSSADSLSTTKIKPLGPARASGLSKKPASIQKRKHHNAENKPGLQIKLNELWKNFGFKKDSEKLPPCKKPLSPVRDNIQLTPEAEEDIFNKPECGRVQRAIFQ(配列番号3870)。 MGIQGLLQFIKEASEPIHVRKYKGQVVAVDTYCWLHKGAIACAEKLAKGEPTDRYVGFCMKFVNMLLSHGIKPILVFDGCTLPSKKEVERSRRERRQANLLKGKQLLREGKVSEARECFTRSINITHAMAHKVIKAARSQGVDCLVAPYEADAQLAYLNKAGIVQAIITEDSDLLAFGCKKVILKMDQFGNGLEIDQARLGMCRQLGDVFTEEKFRYMCILSGCDYLSSLRGIGLAKACKVLRLANNPDIVKVIKKIGHYLKMNITVPEDYINGFIRANNTFLYQLVFDPIKRKLIPLNAYEDDVDPETLSYAGQYVDDSIALQIALGNKDINTFEQIDDYNPDTAMPAHSRSHSWDDKTCQKSANVSSIWHRNYSPRPESGTVSDAPQLKENPSTVGVERVISTKGLNLPRKSSIVKRPRSELSEDD LLSQYSLSFTKKTKKNSSEGNKSLSFSEVFVPDLVNGPTNKKSVSTPPRTRNKFATFLQRKNEESGAVVVPGTRSRFFCSSDSTDCVSNKVSIQPLDETAVTDKENNLHESEYGDQEGKRLVDTDVARNSSDDIPNNHIPGDHIPDKATVFTDEESYSFESSKFTRTISPPTLGTLRGTLSCFSWSGGLGDFSRTPSPSPSTALQQFRRKSDSPTSLPENNMSDVSQLKSEESSDDESHPLREEACSSQSQESGEFSLQSSNASKLSQCSSKDSDSEESDCNIKLLDSQSDQTSKLRLSHFSKKDTPLRNKVPGLYKSSSADSLSTTKIKPLGPARASGLSKKPASIQKRKHHNAENKPGLQIKLNELWKNFGFKKDSEKLPPCKKPLSPVRDNIQLTPEAEEDIFNKPECGRVQRAIFQ (sequence number 3870).

D.インテインおよび分裂インテイン
いくつかの態様では(例えば、AAV粒子を用いるインビボのプライム編集因子の送達)、ポリペプチド(例えば、デアミナーゼまたはnapDNAbp)または融合タンパク質(例えばプライム編集因子)をN末端の半分およびC末端の半分へと分裂し、それらを別個に送達し、それからそれらの共局在が完全なタンパク質(または場合に応じて融合タンパク質)を細胞内で再形成することを許すことが有利であり得るということは理解されるであろう。タンパク質または融合タンパク質の別個の半分同士は、夫々が、タンパク質トランススプライシングの機序による完全なタンパク質または融合タンパク質の再形成を容易化するための分裂インテインタグを含み得る。
D. Inteins and Split-Inteins
It will be appreciated that in some embodiments (e.g., delivery of a prime editor in vivo using AAV particles), it may be advantageous to split a polypeptide (e.g., a deaminase or napDNAbp) or a fusion protein (e.g., a prime editor) into N-terminal and C-terminal halves and deliver them separately, then allow their colocalization to reform the complete protein (or fusion protein, as the case may be) within the cell. The separate halves of the protein or fusion protein may each contain a split intein tag to facilitate reformation of the complete protein or fusion protein by a protein trans-splicing mechanism.

分裂インテインによって触媒されるタンパク質トランススプライシングは、タンパク質ライゲーションのための全く酵素的な方法を提供する。分裂インテインは、夫々NインテインおよびCインテインという名称の2つのピースへと分裂された本質的に一続きのインテイン(例えばミニインテイン)である。分裂インテインのNインテインおよびCインテインは、非共有結合的に会合して活性なインテインを形成し、一続きのインテインがするのと本質的に同じやり方でスプライシング反応を触媒し得る。分裂インテインは天然に見出され、実験室でもまた操作されている。本願において用いられる用語「分裂インテイン」は、1つ以上のペプチド結合切断がN末端およびC末端アミノ酸配列の間に存在するいずれかのインテインを言い、その結果、N末端およびC末端配列が別個の分子になり、これらは、トランススプライシング反応について機能的であるインテインへと非共有結合的に再会合または再構成し得る。いずれかの触媒的に活性なインテインまたはそのフラグメントが、本発明の方法への使用のための分裂インテインを導出するために用いられ得る。例えば、一側面において、分裂インテインは真核生物インテインに由来し得る。別の側面において、分裂インテインは細菌インテインに由来し得る。別の側面において、分裂インテインは古細菌インテインに由来し得る。好ましくは、そのように導出された分裂インテインは、トランススプライシング反応を触媒することにとって必須のアミノ酸配列のみを所有するであろう。 Protein trans-splicing catalyzed by split inteins provides a purely enzymatic method for protein ligation. A split intein is essentially a continuous intein (e.g., a mini-intein) that has been split into two pieces, named N and C inteins, respectively. The N and C inteins of a split intein can non-covalently associate to form an active intein and catalyze a splicing reaction in essentially the same way that a continuous intein does. Split inteins are found in nature and have also been engineered in the laboratory. The term "split intein" as used herein refers to any intein in which one or more peptide bond cleavages exist between the N- and C-terminal amino acid sequences, such that the N- and C-terminal sequences become separate molecules that can non-covalently reassociate or reconstitute into an intein that is functional for a trans-splicing reaction. Any catalytically active intein or fragment thereof can be used to derive a split intein for use in the methods of the invention. For example, in one aspect, the split intein can be derived from a eukaryotic intein. In another aspect, the split intein can be derived from a bacterial intein. In another aspect, the split intein can be derived from an archaeal intein. Preferably, the split intein so derived will possess only the amino acid sequences essential for catalyzing the trans-splicing reaction.

本願において用いられる「N末端分裂インテイン(In)」は、トランススプライシング反応について機能的であるN末端アミノ酸配列を含むいずれかのインテイン配列を言う。Inは、それゆえに、トランススプライシングが生起するときにスプライスアウトされる配列をもまた含む。Inは、天然に存在するインテイン配列のN末端部分の改変である配列を含み得る。例えば、かかる追加のおよび/または変異した残基の包含がInをトランススプライシングにおいて非機能的にしない限り、Inは追加のアミノ酸残基および/または変異した残基を含み得る。好ましくは、追加のおよび/または変異した残基の包含は、Inのトランススプライシング活性を改善または増強する。 As used herein, "N-terminal split intein (In)" refers to any intein sequence that includes an N-terminal amino acid sequence that is functional for a trans-splicing reaction. In therefore also includes sequences that are spliced out when trans-splicing occurs. In can include sequences that are modifications of the N-terminal portion of a naturally occurring intein sequence. For example, In can include additional amino acid residues and/or mutated residues, so long as the inclusion of such additional and/or mutated residues does not render In non-functional in trans-splicing. Preferably, the inclusion of additional and/or mutated residues improves or enhances the trans-splicing activity of In.

本願において用いられる「C末端分裂インテイン(Ic)」は、トランススプライシング反応について機能的であるC末端アミノ酸配列を含むいずれかのインテイン配列を言う。一側面において、Icは、それが由来したインテインの最後のβ鎖からである一続きの4から7アミノ酸残基、少なくとも4アミノ酸を含む。Icは、それゆえに、トランススプライシングが生起するときにスプライスアウトされる配列をもまた含む。Icは、天然に存在するインテイン配列のC末端部分の改変である配列を含み得る。例えば、かかる追加のおよび/または変異した残基の包含がInをトランススプライシングにおいて非機能的にしない限り、Icは追加のアミノ酸残基および/または変異した残基を含み得る。好ましくは、追加のおよび/または変異した残基の包含は、Icのトランススプライシング活性を改善または増強する。 As used herein, "C-terminal split intein (Ic)" refers to any intein sequence that includes a C-terminal amino acid sequence that is functional for a trans-splicing reaction. In one aspect, Ic includes a stretch of 4 to 7 amino acid residues, at least 4 amino acids, that are from the last β-strand of the intein from which it is derived. Ic therefore also includes sequences that are spliced out when trans-splicing occurs. Ic can include sequences that are modifications of the C-terminal portion of a naturally occurring intein sequence. For example, Ic can include additional amino acid residues and/or mutated residues, so long as the inclusion of such additional and/or mutated residues does not render In non-functional in trans-splicing. Preferably, the inclusion of additional and/or mutated residues improves or enhances the trans-splicing activity of Ic.

本発明のいくつかの態様では、IcまたはInに連結されたペプチドは、とりわけ蛍光基、ビオチン、ポリエチレングリコール(PEG)、アミノ酸アナログ、非天然のアミノ酸、リン酸基、グリコシル基、放射性同位体標識、および医薬分子を包含する追加の化学的部分を含み得る。他の態様において、Icに連結されたペプチドは、とりわけケトン、アルデヒド、Cys残基、およびLys残基を包含する1つ以上の化学反応性基を含み得る。「インテインスプライシングポリペプチド(ISP)」が存在するときには、分裂インテインのNインテインおよびCインテインは非共有結合的に会合して活性なインテインを形成し、スプライシング反応を触媒し得る。本願において用いられる「インテインスプライシングポリペプチド(ISP)」は、Ic、In、または両方が分裂インテインから除去されるときに留まる分裂インテインのアミノ酸配列の部分を言う。ある態様において、InはISPを含む。別の態様では、IcはISPを含む。さらに別の態様では、ISPはInにもIcにも共有結合的に連結されていない別個のペプチドである。 In some embodiments of the invention, the peptide linked to Ic or In may contain additional chemical moieties including, among others, fluorescent groups, biotin, polyethylene glycol (PEG), amino acid analogs, unnatural amino acids, phosphate groups, glycosyl groups, radioisotope labels, and pharmaceutical molecules. In other embodiments, the peptide linked to Ic may contain one or more chemically reactive groups including, among others, ketones, aldehydes, Cys residues, and Lys residues. When an "intein splicing polypeptide (ISP)" is present, the N intein and C intein of the split intein may non-covalently associate to form an active intein and catalyze the splicing reaction. As used herein, "intein splicing polypeptide (ISP)" refers to the portion of the amino acid sequence of the split intein that remains when Ic, In, or both are removed from the split intein. In some embodiments, In includes an ISP. In other embodiments, Ic includes an ISP. In yet other embodiments, the ISP is a separate peptide that is not covalently linked to either In or Ic.

分裂インテインは、ミニインテインの構造上に見出される-12の保存されたベータ鎖間の構造化されていないループまたは介在アミノ酸配列中に1つ以上の分裂部位を操作することによって、一続きのインテインから生出され得る。分裂の生出が、タンパク質スプライシング活性が失われる十分な度合まではインテインの構造、特に構造化されたベータ鎖を遮断しないであろうという条件で、ベータ鎖間の領域内の分裂部位の位置のいくらかのフレキシビリティーが存在し得る。 Split inteins can be generated from a stretch of inteins by engineering one or more split sites into the unstructured loop or intervening amino acid sequence between the -12 conserved beta strands found on the mini-intein structure. There can be some flexibility in the location of the split site within the region between the beta strands, provided that the creation of the split would not interrupt the structure of the intein, particularly the structured beta strands, to a sufficient degree that protein splicing activity is lost.

タンパク質トランススプライシングでは、1つの前駆体タンパク質はNインテインによって後続されるNエクステインパーツからなり、別の前駆体タンパク質はCエクステインパーツによって後続されるCインテインからなり、トランススプライシング反応(一緒にNおよびCインテインによって触媒される)が2つのインテイン配列を切除、2つのエクステイン配列をペプチド結合によって連結する。酵素反応であるタンパク質トランススプライシングは、非常に低い(例えばマイクロモル)濃度のタンパク質で働き得、生理条件下において実行され得る。 In protein trans-splicing, one precursor protein consists of an N extein part followed by an N intein, another precursor protein consists of a C intein followed by a C extein part, and a trans-splicing reaction (catalyzed together by the N and C inteins) excises the two intein sequences and links the two extein sequences by a peptide bond. Protein trans-splicing, an enzymatic reaction, can work at very low (e.g., micromolar) concentrations of protein and can be carried out under physiological conditions.

例示の配列は次のとおりである:

Figure 2020191243000112

Figure 2020191243000113
An example sequence is as follows:
Figure 2020191243000112

Figure 2020191243000113

インテインは最も頻繁には一続きのドメインとして見出されるが、いくつかは天然に分裂された形態で存在する。このケースでは、2つのフラグメントは別個のポリペプチドとして発現され、スプライシング、いわゆるタンパク質トランススプライシングが生起する前に会合しなければならない。 Inteins are most frequently found as a continuous domain, but some naturally occur in a split form. In this case, the two fragments are expressed as separate polypeptides and must associate before splicing, known as protein trans-splicing, can occur.

例示の分裂インテインはSsp DnaEインテインであり、これは2つのサブユニットつまりDnaE-NおよびDnaE-Cを含む。2つの異なるサブユニットは別個の遺伝子つまりdnaE-nおよびdnaE-cによってコードされ、これらは夫々DnaE-NおよびDnaE-Cサブユニットをコードする。DnaEはSynechocytis sp. PCC6803の天然に存在する分裂インテインであり、夫々がDnaE-NまたはDnaE-Cどちらかとの融合体を含む2つの別個のタンパク質のトランススプライシングを導くことができる。 An exemplary split intein is the Ssp DnaE intein, which contains two subunits, DnaE-N and DnaE-C. The two distinct subunits are encoded by separate genes, dnaE-n and dnaE-c, which encode the DnaE-N and DnaE-C subunits, respectively. DnaE is a naturally occurring split intein in Synechocytis sp. PCC6803 that can direct the trans-splicing of two separate proteins, each of which contains a fusion with either DnaE-N or DnaE-C.

追加の天然に存在するまたは操作された分裂インテイン配列は当該技術分野(the)において公知であるか、または本明細書に記載の丸ごとのインテイン配列もしくは当該技術分野で利用可能なものから作られ得る。分裂インテイン配列の例は、Stevens et al.,"A promiscuous split intein with expanded protein engineering applications,"PNAS,2017,Vol.114:8538-8543;Iwai et al.,"Highly efficient protein trans-splicing by a naturally split DnaE intein from Nostc punctiforme,FEBS Lett,580:1853-1858に見出され得る。これらの夫々は参照によって本願に組み込まれる。追加の分裂インテイン配列は例えばWO2013/045632、WO2014/055782、WO2016/069774、およびEP2877490に見出され得る。これらの夫々の内容は参照によって本願に組み込まれる。 Additional naturally occurring or engineered split intein sequences are known in the art or can be made from whole intein sequences described herein or available in the art. Examples of split intein sequences can be found in Stevens et al., "A promiscuous split intein with expanded protein engineering applications," PNAS, 2017, Vol. 114: 8538-8543; Iwai et al., "Highly efficient protein trans-splicing by a naturally split DnaE intein from Nostc punctiforme, FEBS Lett, 580: 1853-1858, each of which is incorporated herein by reference. Additional split intein sequences can be found, for example, in WO2013/045632, WO2014/055782, WO2016/069774, and EP2877490, the contents of each of which are incorporated herein by reference.

加えて、トランスのタンパク質スプライシングがインビボおよびin vitroで記載されており(Shingledecker,et al.,[0076]Gene 207:187(1998),Southworth,et al.,EMBO J.17:918(1998);Mills,et al.,Proc.Natl.Acad.Sci.USA,95:3543-3548(1998);Lew,et al.,J.Biol.Chem.,273:15887-15890(1998);Wu,et al.,Biochim.Biophys.Acta 35732:1(1998b),Yamazaki,et al.,J.Am.Chem.Soc.120:5591(1998),Evans,et al.,J.Biol.Chem.275:9091(2000);Otomo,et al.,Biochemistry 38:16040-16044(1999);Otomo,et al.,J.Biolmol.NMR 14:105-114(1999);Scott,et al.,Proc.Natl.Acad.Sci.USA 96:13638-13643(1999))、爾後にライゲーションを経過して機能的な産物を形成する2つの不活性なフラグメントとして、あるタンパク質を発現するための機会を提供する。例えば、2つの別個に発現される半分からの完全なPE融合タンパク質の形成について、図66および67に示されているとおりである。 In addition, protein splicing in trans has been described in vivo and in vitro (Shingledecker, et al., Gene 207:187 (1998); Southworth, et al., EMBO J. 17:918 (1998); Mills, et al., Proc. Natl. Acad. Sci. USA, 95:3543-3548 (1998); Lew, et al., J. Biol. Chem., 273:15887-15890 (1998); Wu, et al., Biochim. Biophys. Acta 35732:1 (1998b); Yamazaki, et al., J. Am. Chem. Soc. 120:5591 (1998); Evans, et al. al., J. Biol. Chem. 275:9091 (2000); Otomo, et al., Biochemistry 38:16040-16044 (1999); Otomo, et al., J. Biomol. NMR 14:105-114 (1999); Scott, et al., Proc. Natl. Acad. Sci. USA 96:13638-13643 (1999)), providing the opportunity to express a protein as two inactive fragments that subsequently undergo ligation to form a functional product, as shown, for example, in Figures 66 and 67 for the formation of a complete PE fusion protein from two separately expressed halves.

E.RNA-タンパク質相互作用ドメイン
種々の態様において、2つの別個のタンパク質ドメイン(例えば、Cas9ドメインおよびポリメラーゼドメイン)は、「RNA-タンパク質動員システム」、例えば「MS2タグ付け技術」を用いることによって、機能的な複合体(2つの別個のタンパク質ドメインを含む融合タンパク質の機能と同様)を形成するように互いに共局在させられ得る。かかるシステムは、一般的には、1つのタンパク質ドメインを「RNA-タンパク質相互作用ドメイン」(「RNA-タンパク質動員ドメイン」としてもまた公知)によって、他をRNA-タンパク質相互作用ドメイン、例えば特定のヘアピン構造を特異的に認識および結合する「RNA結合タンパク質」によってタグ付けする。これらの型のシステムは、プライム編集因子のドメイン同士を共局在させるためにおよびUGIドメインなどの追加の機能性をプライム編集因子に動員するために活用され得る。1つの例では、MS2タグ付け技術は、ファージのゲノム上に存在するステムループまたはヘアピン構造、すなわち「MS2ヘアピン」とのMS2バクテリオファージコートタンパク質(「MCP」または「MS2cp」)の天然の相互作用に基づく。MS2ヘアピンのケースでは、それはMS2バクテリオファージコートタンパク質(MCP)によって認識および結合される。それゆえに、1つの例示的シナリオでは、デアミナーゼ-MS2融合体はCas9-MCP融合体を動員し得る。
E. RNA-protein interaction domains
In various embodiments, two separate protein domains (e.g., Cas9 domain and polymerase domain) can be co-localized with each other to form a functional complex (similar to the function of a fusion protein containing two separate protein domains) by using an "RNA-protein recruitment system", e.g., "MS2 tagging technology". Such systems generally tag one protein domain with an "RNA-protein interaction domain" (also known as an "RNA-protein recruitment domain") and the other with an RNA-protein interaction domain, e.g., an "RNA binding protein" that specifically recognizes and binds to a particular hairpin structure. These types of systems can be exploited to co-localize domains of prime editors and to recruit additional functionality to the prime editors, such as UGI domains. In one example, MS2 tagging technology is based on the natural interaction of MS2 bacteriophage coat protein ("MCP" or "MS2cp") with stem-loop or hairpin structures, i.e., "MS2 hairpins", present on the genome of phages. In the case of the MS2 hairpin, it is recognized and bound by the MS2 bacteriophage coat protein (MCP), and therefore, in one exemplary scenario, a deaminase-MS2 fusion can recruit a Cas9-MCP fusion.

他のモジュラーなRNA-タンパク質相互作用ドメインの総説は当該技術分野において例えばJohansson et al.,"RNA recognition by the MS2 phage coat protein,"Sem Virol.,1997,Vol.8(3):176-185;Delebecque et al.,"Organization of intracellular reactions with rationally designed RNA assemblies,"Science,2011,Vol.333:470-474;Mali et al.,"Cas9 transcriptional activators for target specificity screening and paired nickases for cooperative genome engineering,"Nat.Biotechnol.,2013,Vol.31:833-838;およびZalatan et al.,"Engineering complex synthetic transcriptional programs with CRISPR RNA scaffolds,"Cell,2015,Vol.160:339-350に記載されている。これらの夫々はそれらの全体が参照によって本願に組み込まれる。他のシステムは、特異的にPCPタンパク質を動員するPP7ヘアピン、および特異的にComタンパク質を動員する「com」ヘアピンを包含する。Zalatan et al.を見よ。 Other reviews of modular RNA-protein interaction domains are described in the art, for example, in Johansson et al., "RNA recognition by the MS2 phage coat protein," Sem Virol., 1997, Vol. 8(3): 176-185; Delebecque et al., "Organization of intracellular reactions with rationally designed RNA assemblies," Science, 2011, Vol. 333: 470-474; Mali et al., "Cas9 transcriptional activators for target specificity screening and paired nickases for cooperative genome engineering," Nat. Biotechnol., 2013, Vol. 31: 833-838; and Zalatan et al., "Engineering complex synthetic transcriptional programs with CRISPR RNA scaffolds," Cell, 2015, Vol. 160: 339-350, each of which is incorporated herein by reference in its entirety. Other systems include the PP7 hairpin, which specifically recruits the PCP protein, and the "com" hairpin, which specifically recruits the Com protein. See Zalatan et al.

MS2ヘアピン(または「MS2アプタマー」とも等価に称される)のヌクレオチド配列は:GCCAACATGAGGATCACCCATGTCTGCAGGGCC(配列番号763)である。 The nucleotide sequence of the MS2 hairpin (or equivalently referred to as the "MS2 aptamer") is: GCCAACATGAGGATCACCCATGTCTGCAGGGCC (SEQ ID NO: 763 ).

MCPまたはMS2cpのアミノ酸配列は:
GSASNFTQFVLVDNGGTGDVTVAPSNFANGVAEWISSNSRSQAYKVTCSVRQSSAQNRKYTIKVEVPKVATQTVGGEELPVAGWRSYLNMELTIPIFATNSDCELIVKAMQGLLKDGNPIPSAIAANSGIY(配列番号764)である。
The amino acid sequence of MCP or MS2cp is:
GSASNFTQFVLVDNGGTGDVTVAPSNFANGVAEWISSNSRSQAYKVTCSVRQSSAQNRKYTIKVEVPKVATQTVGGEELPVAGWRSYLNMELTIPIFATNSDCELIVKAMQGLLKDGNPIPSAIAANSGIY (sequence number 764 ).

F.UGIドメイン
他の態様において、本明細書に記載のプライム編集因子は1つ以上のウラシルグリコシラーゼ阻害剤ドメインを含み得る。本願において用いられる用語「ウラシルグリコシラーゼ阻害剤(UGI)」または「UGIドメイン」は、ウラシルDNAグリコシラーゼ塩基除去修復酵素を阻害することができるタンパク質を言う。いくつかの態様では、UGIドメインは、野生型UGIまたは配列番号3873で明示されるUGIを含む。いくつかの態様では、本願において提供されるUGIタンパク質は、UGIのフラグメント、およびUGIまたはUGIフラグメントに対して相同的なタンパク質を包含する。例えば、いくつかの態様では、UGIドメインは、配列番号3873で明示されるアミノ酸配列のフラグメントを含む。いくつかの態様では、UGIフラグメントは、配列番号3873で明示されるアミノ酸配列の少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも99.5%を含むアミノ酸配列を含む。いくつかの態様では、UGIは、配列番号3873で明示されるアミノ酸配列に対して相同的なアミノ酸配列、または配列番号3873で明示されるアミノ酸配列のフラグメントに対して相同的なアミノ酸配列を含む。いくつかの態様では、UGIもしくはUGIのフラグメントまたはUGIもしくはUGIフラグメントのホモログを含むタンパク質は、「UGIバリアント」と言われる。UGIバリアントはUGIまたはそのフラグメントに対する相同性を共有する。例えば、UGIバリアントは、野生型UGIまたは配列番号3873で明示されるUGIと少なくとも70%同一、少なくとも75%同一、少なくとも80%同一、少なくとも85%同一、少なくとも90%同一、少なくとも95%同一、少なくとも96%同一、少なくとも97%同一、少なくとも98%同一、少なくとも99%同一、少なくとも99.5%同一、または少なくとも99.9%同一である。いくつかの態様では、UGIバリアントは、フラグメントが野生型UGIまたは配列番号3873で明示されるUGIの対応するフラグメントと少なくとも70%同一、少なくとも80%同一、少なくとも90%同一、少なくとも95%同一、少なくとも96%同一、少なくとも97%同一、少なくとも98%同一、少なくとも99%同一、少なくとも99.5%同一、または少なくとも99.9%であるようにして、UGIのフラグメントを含む。いくつかの態様では、UGIは次のアミノ酸配列を含む:
F. UGI domain
In other embodiments, the prime editors described herein may comprise one or more uracil glycosylase inhibitor domains. As used herein, the term "uracil glycosylase inhibitor (UGI)" or "UGI domain" refers to a protein that can inhibit uracil DNA glycosylase base excision repair enzyme. In some embodiments, the UGI domain comprises wild-type UGI or the UGI set forth in SEQ ID NO: 3873. In some embodiments, the UGI proteins provided herein include fragments of UGI and proteins homologous to UGI or UGI fragments. For example, in some embodiments, the UGI domain comprises a fragment of the amino acid sequence set forth in SEQ ID NO: 3873. In some embodiments, the UGI fragment comprises an amino acid sequence comprising at least 60%, at least 65%, at least 70%, at least 75%, at least 80%, at least 85%, at least 90%, at least 95%, at least 96%, at least 97%, at least 98%, at least 99%, or at least 99.5% of the amino acid sequence set forth in SEQ ID NO: 3873. In some embodiments, UGI comprises an amino acid sequence homologous to the amino acid sequence set forth in SEQ ID NO: 3873, or an amino acid sequence homologous to a fragment of the amino acid sequence set forth in SEQ ID NO: 3873. In some embodiments, a protein comprising UGI or a fragment of UGI or a homolog of UGI or a UGI fragment is referred to as a "UGI variant." A UGI variant shares homology to UGI or a fragment thereof. For example, a UGI variant is at least 70% identical, at least 75% identical, at least 80% identical, at least 85% identical, at least 90% identical, at least 95% identical, at least 96% identical, at least 97% identical, at least 98% identical, at least 99% identical, at least 99.5% identical, or at least 99.9% identical to wild-type UGI or UGI set forth in SEQ ID NO: 3873. In some embodiments, the UGI variant comprises a fragment of UGI such that the fragment is at least 70% identical, at least 80% identical, at least 90% identical, at least 95% identical, at least 96% identical, at least 97% identical, at least 98% identical, at least 99% identical, at least 99.5% identical, or at least 99.9% to the corresponding fragment of wild-type UGI or UGI set forth in SEQ ID NO: 3873. In some embodiments, UGI comprises the following amino acid sequence:

ウラシル-DNAグリコシラーゼインヒビター: Uracil-DNA glycosylase inhibitors:

>sp|P14739|UNGI_BPPB2
MTNLSDIIEKETGKQLVIQESILMLPEEVEEVIGNKPESDILVHTAYDESTDENVMLLTSDAPEYKPWALVIQDSNGENKIKML(配列番号3873)。
>sp|P14739|UNGI_BPPB2
MTNLSDIIEKETGKQLVIQESILMLPEEVEEVIGNKPESDILVHTAYDESTDENVMLLTSDAPEYKPWALVIQDSNGENKIKML (SEQ ID NO: 3873).

本明細書に記載のプライム編集因子は1つよりも多くのUGIドメインを含み得、これらは本明細書に記載の1つ以上のリンカーによって分離され得る。 The prime editing factors described herein may contain more than one UGI domain, which may be separated by one or more linkers as described herein.

G.追加のPEエレメント
ある態様において、本明細書に記載のプライム編集因子は塩基修復の阻害剤を含み得る。用語「塩基修復の阻害剤」または「IBR」は、核酸修復酵素、例えば塩基除去修復酵素の活性を阻害することができるタンパク質を言う。いくつかの態様では、IBRはOGG塩基除去修復の阻害剤である。いくつかの態様では、IBRは塩基除去修復の阻害剤(「iBER」)である。塩基除去修復の例示の阻害剤は、APE1、Endo III、Endo IV、Endo V、Endo VIII、Fpg、hOGG1、hNEIL1、T7 EndoI、T4PDG、UDG、hSMUG1、およびhAAGの阻害剤を包含する。いくつかの態様では、IBRはEndo VまたはhAAGの阻害剤である。いくつかの態様では、IBRは、触媒的に不活性なグリコシラーゼまたは触媒的に不活性なジオキシゲナーゼ、またはオキシダーゼの低分子もしくはペプチド阻害剤、あるいはそれらのバリアントであり得るiBERである。いくつかの態様では、IBRは、TDG阻害剤、MBD4阻害剤、またはAlkBH酵素の阻害剤であり得るiBERである。いくつかの態様では、IBRは、触媒的に不活性なTDGまたは触媒的に不活性なMBD4を含むiBERである。例示の触媒的に不活性なTDGは配列番号3872(ヒトTDG)のN140A変異体である。
G. Additional PE Elements
In some embodiments, the prime editor described herein may comprise an inhibitor of base repair. The term "inhibitor of base repair" or "IBR" refers to a protein that can inhibit the activity of nucleic acid repair enzymes, such as base excision repair enzymes. In some embodiments, the IBR is an inhibitor of OGG base excision repair. In some embodiments, the IBR is an inhibitor of base excision repair ("iBER"). Exemplary inhibitors of base excision repair include inhibitors of APE1, Endo III, Endo IV, Endo V, Endo VIII, Fpg, hOGG1, hNEIL1, T7 EndoI, T4PDG, UDG, hSMUG1, and hAAG. In some embodiments, the IBR is an inhibitor of Endo V or hAAG. In some embodiments, the IBR is an iBER, which can be a small molecule or peptide inhibitor of catalytically inactive glycosylase or catalytically inactive dioxygenase, or oxidase, or a variant thereof. In some embodiments, the IBR is an iBER that can be a TDG inhibitor, an MBD4 inhibitor, or an inhibitor of AlkBH enzyme. In some embodiments, the IBR is an iBER that comprises catalytically inactive TDG or catalytically inactive MBD4. An exemplary catalytically inactive TDG is the N140A mutant of SEQ ID NO: 3872 (human TDG).

いくつかの例示のグリコシラーゼは下で提供される。これらのグリコシラーゼドメインのいずれかの触媒的に不活性化されたバリアントは、本開示で提供されるプライム編集因子のnapDNAbpまたはポリメラーゼドメインに融合され得るiBERである。 Some exemplary glycosylases are provided below. Catalytically inactivated variants of any of these glycosylase domains are iBERs that can be fused to the napDNAbp or polymerase domains of the prime editors provided in this disclosure.

OGG(ヒト) OGG(human)

MPARALLPRRMGHRTLASTPALWASIPCPRSELRLDLVLPSGQSFRWREQSPAHWSGVLADQVWTLTQTEEQLHCTVYRGDKSQASRPTPDELEAVRKYFQLDVTLAQLYHHWGSVDSHFQEVAQKFQGVRLLRQDPIECLFSFICSSNNNIARITGMVERLCQAFGPRLIQLDDVTYHGFPSLQALAGPEVEAHLRKLGLGYRARYVSASARAILEEQGGLAWLQQLRESSYEEAHKALCILPGVGTKVADCICLMALDKPQAVPVDVHMWHIAQRDYSWHPTTSQAKGPSPQTNKELGNFFRSLWGPYAGWAQAVLFSADLRQSRHAQEPPAKRRKGSKGPEG(配列番号3937) MPARALLPRRMGHRTLASTPALWASIPCPRSELRLDLVLPSGQSFRWREQSPAHWSGVLADQVWTLTQTEEQLHCTVYRGDKSQASRPTPDELEAVRKYFQLDVTLAQLYHHWGSVDSHFQEVAQKFQGVRLLRQDPIECLFSFICSSNNNIARITGMVERLCQAFGPRLIQLDDVTYHGFPSLQALAGPEVEAHLRKLGLGYRARYVSASARAILEEQGGLAWLQQLRESSYEEAHKALCILPGVGTKVADCICLMALDKPQAVPVDVHMWHIAQRDYSWHPTTSQAKGPSPQTNKELGNFFRSLWGPYAGWAQAVLFSADLRQSRHAQEPPAKRRKGSKGPEG (Sequence number 3937 )

MPG(ヒト) MPG(human)

MVTPALQMKKPKQFCRRMGQKKQRPARAGQPHSSSDAAQAPAEQPHSSSDAAQAPCPRERCLGPPTTPGPYRSIYFSSPKGHLTRLGLEFFDQPAVPLARAFLGQVLVRRLPNGTELRGRIVETEAYLGPEDEAAHSRGGRQTPRNRGMFMKPGTLYVYIIYGMYFCMNISSQGDGACVLLRALEPLEGLETMRQLRSTLRKGTASRVLKDRELCSGPSKLCQALAINKSFDQRDLAQDEAVWLERGPLEPSEPAVVAAARVGVGHAGEWARKPLRFYVRGSPWVSVVDRVAEQDTQA(配列番号3938) MVTPALQMKKPKQFCRRMGQKKQRPARAGQPHSSSDAAQAPAEQPHSSSDAAQAPCPRERCLGPPTTPGPYRSIYFSSPKGHLTRLGLEFFDQPAVPLARAFLGQVLVRRLPNGTELRGRIVETEAYLGPEDEAAHSRGGRQTPRNRGMFMKPGTLYVYIIYGMYFCMNISSQGDGACVLLRALEPLEGLETMRQLRSTLRKGTASRVLKDRELCSGPSKLCQALAINKSFDQRDLAQDEAVWLERGPLEPSEPAVVAAARVGVGHAGEWARKPLRFYVRGSPWVSVVDRVAEQDTQA (sequence number 3938 )

MBD4(ヒト) MBD4(human)

MGTTGLESLSLGDRGAAPTVTSSERLVPDPPNDLRKEDVAMELERVGEDEEQMMIKRSSECNPLLQEPIASAQFGATAGTECRKSVPCGWERVVKQRLFGKTAGRFDVYFISPQGLKFRSKSSLANYLHKNGETSLKPEDFDFTVLSKRGIKSRYKDCSMAALTSHLQNQSNNSNWNLRTRSKCKKDVFMPPSSSSELQESRGLSNFTSTHLLLKEDEGVDDVNFRKVRKPKGKVTILKGIPIKKTKKGCRKSCSGFVQSDSKRESVCNKADAESEPVAQKSQLDRTVCISDAGACGETLSVTSEENSLVKKKERSLSSGSNFCSEQKTSGIINKFCSAKDSEHNEKYEDTFLESEEIGTKVEVVERKEHLHTDILKRGSEMDNNCSPTRKDFTGEKIFQEDTIPRTQIERRKTSLYFSSKYNKEALSPPRRKAFKKWTPPRSPFNLVQETLFHDPWKLLIATIFLNRTSGKMAIPVLWKFLEKYPSAEVARTADWRDVSELLKPLGLYDLRAKTIVKFSDEYLTKQWKYPIELHGIGKYGNDSYRIFCVNEWKQVHPEDHKLNKYHDWLWENHEKLSLS(配列番号3871) MGTTGLESLSLGDRGAAPTVTSSERLVPDPPNDLRKEDVAMELERVGEDEEQMMIKRSSECNPLLQEPIASAQFGATAGTECRKSVPCGWERVVKQRLFGKTAGRFDVYFISPQGLKFRSKSSLANYLHKNGETSLKPEDFDFTVLSKRGIKSRYKDCSMALTSHLQNQSNNSNWNLRTRSKCKKDVFMPPSSSSELQESRGLSNFTSTHLLLKEDEGVDDVNFRKVRKPKGKVTILKGIPIKKTKKGCRKSCSGFVQSDSKRESVCNKADAESEPVAQKSQLDRTVCISDAGA CGETLSVTSEENSLVKKKERSLSSGSNFCSEQKTSGIINKFCSAKDSEHNEKYEDTFLESEEIGTKVEVVERKEHLHTDILKRGSEMDNNCSPTRKDFTGEKIFQEDTIPRTQIERRKTSLYFSSKYNKEALSPPRRKAFKKWTPPRSPFNLVQETLFHDPWKLLIATIFLNRTSGKMAIPVLWKFLEKYPSAEVARTADWRDVSELLKPLGLYDLRAKTIVKFSDEYLTKQWKYPIELHGIGKYGNDSYRIFCVNEWKQVHPEDHKLNKYHDWLWENHEKLSLS (sequence number 3871)

TDG(ヒト) TDG(human)

MEAENAGSYSLQQAQAFYTFPFQQLMAEAPNMAVVNEQQMPEEVPAPAPAQEPVQEAPKGRKRKPRTTEPKQPVEPKKPVESKKSGKSAKSKEKQEKITDTFKVKRKVDRFNGVSEAELLTKTLPDILTFNLDIVIIGINPGLMAAYKGHHYPGPGNHFWKCLFMSGLSEVQLNHMDDHTLPGKYGIGFTNMVERTTPGSKDLSSKEFREGGRILVQKLQKYQPRIAVFNGKCIYEIFSKEVFGVKVKNLEFGLQPHKIPDTETLCYVMPSSSARCAQFPRAQDKVHYYIKLKDLRDQLKGIERNMDVQEVQYTFDLQLAQEDAKKMAVKEEKYDPGYEAAYGGAYGENPCSSEPCGFSSNGLIESVELRGESAFSGIPNGQWMTQSFTDQIPSFSNHCGTQEQEEESHA(配列番号3872) MEAENAGSYSLQQAQAFYTFPFQQLMAEAPNMAVVNEQQMPEEVPAPAPAQEPVQEAPKGRKRKPRTTEPKQPVEPKKPVESKKSGKSAKSKEKQEKITDTFKVKRKVDRFNGVSEAELLTKTLPDILTFNLDIVIIGINPGLMAAYKGHHYPGPGNHFWKCLFMSGLSEVQLNHMDDHTLPGKYGIGFTNMVERTTPGSKDLSSKEFRE GGRILVQKLQKYQPRIAVFNGKCIYEIFSKEVFGVKVKNLEFGLQPHKIPDTETLCYVMPSSSARCAQFPRAQDKVHYYIKLKDLRDQLKGIERNMDVQEVQYTFDLQLAQEDAKKMAVKEEKYDPGYEAAYGGAYGENPCSSEPCGFSSNGLIESVELRGESAFSGIPNGQWMTQSFTDQIPSFSNHCGTQEQEEESHA (sequence number 3872)

いくつかの態様では、本明細書に記載の融合タンパク質は1つ以上の異種タンパク質ドメインを含み得る(例えば、プライム編集因子構成要素に加えて、約または約1、2、3、4、5、6、7、8、9、10以上のまたはそれよりも多くのドメイン)。融合タンパク質は、いずれかの追加のタンパク質配列と、任意にいずれかの2つのドメイン間のリンカー配列とを含み得る。存在し得る他の例示の特色は、局在配列、例えば細胞質局在配列、搬出配列、例えば核搬出配列、または他の局在配列、および融合タンパク質の可溶化、精製、または検出に有用である配列タグである。 In some embodiments, the fusion proteins described herein may contain one or more heterologous protein domains (e.g., about or about 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 or more domains in addition to the prime editor component). The fusion protein may contain any additional protein sequences and, optionally, a linker sequence between any two domains. Other exemplary features that may be present are localization sequences, e.g., cytoplasmic localization sequences, export sequences, e.g., nuclear export sequences, or other localization sequences, and sequence tags that are useful for solubilizing, purifying, or detecting the fusion protein.

プライム編集因子またはその構成要素(例えば、napDNAbpドメイン、ポリメラーゼドメイン、またはNLSドメイン)を融合するために用いられ得るタンパク質ドメインの例は、限定なしに、エピトープタグ、およびレポーター遺伝子配列を包含する。エピトープタグの限定しない例はヒスチジン(His)タグ、V5タグ、FLAGタグ、インフルエンザヘマグルチニン(HA)タグ、Mycタグ、VSV-Gタグ、およびチオレドキシン(Trx)タグを包含する。レポーター遺伝子の例は、グルタチオン-5-トランスフェラーゼ(GST)、西洋ワサビペルオキシダーゼ(HRP)、クロラムフェニコールアセチルトランスフェラーゼ(CAT)、ベータガラクトシダーゼ、ベータグルクロニダーゼ、ルシフェラーゼ、緑色蛍光タンパク質(GFP)、HcRed、DsRed、シアン蛍光タンパク質(CFP)、黄色蛍光タンパク質(YFP)、および青色蛍光タンパク質(BFP)を包含する自家蛍光タンパク質を包含するが、これらに限定されない。プライム編集因子は、DNA分子に結合または他の細胞分子に結合するタンパク質またはタンパク質のフラグメントをコードする遺伝子配列に融合され得、マルトース結合タンパク質(MBP)、Sタグ、Lex A DNA結合ドメイン(DBD)融合体、GAL4 DNA結合ドメイン融合体、および単純ヘルペスウイルス(HSV)BP16タンパク質融合体を包含するがこれらに限定されない。プライム編集因子の一部を形成し得る追加のドメインは2011年3月11日公開のUS特許公開No.2011/0059502に記載され、その全体が参照によって本願に組み込まれる。 Examples of protein domains that can be used to fuse a prime editor or a component thereof (e.g., napDNAbp domain, polymerase domain, or NLS domain) include, without limitation, epitope tags, and reporter gene sequences. Non-limiting examples of epitope tags include histidine (His) tags, V5 tags, FLAG tags, influenza hemagglutinin (HA) tags, Myc tags, VSV-G tags, and thioredoxin (Trx) tags. Examples of reporter genes include, but are not limited to, glutathione-5-transferase (GST), horseradish peroxidase (HRP), chloramphenicol acetyltransferase (CAT), beta-galactosidase, beta-glucuronidase, luciferase, green fluorescent protein (GFP), HcRed, DsRed, cyan fluorescent protein (CFP), yellow fluorescent protein (YFP), and blue fluorescent protein (BFP). Prime editors can be fused to genetic sequences encoding proteins or fragments of proteins that bind to DNA molecules or other cellular molecules, including, but not limited to, maltose binding protein (MBP), S-tags, Lex A DNA binding domain (DBD) fusions, GAL4 DNA binding domain fusions, and herpes simplex virus (HSV) BP16 protein fusions. Additional domains that can form part of prime editors are described in U.S. Patent Publication No. 2011/0059502, published March 11, 2011, which is incorporated herein by reference in its entirety.

本開示のある側面では、グルタチオン-5-トランスフェラーゼ(GST)、西洋ワサビペルオキシダーゼ(HRP)、クロラムフェニコールアセチルトランスフェラーゼ(CAT)ベータガラクトシダーゼ、ベータグルクロニダーゼ、ルシフェラーゼ、緑色蛍光タンパク質(GFP)、HcRed、DsRed、シアン蛍光タンパク質(CFP)、黄色蛍光タンパク質(YFP)、および青色蛍光タンパク質(BFP)を包含する自家蛍光タンパク質を包含するがこれらに限定されないレポーター遺伝子が、遺伝子産物の発現の変改または改変を測定するためのマーカーとしての用をなす遺伝子産物をコードするように、細胞に導入され得る。本開示のある態様において、遺伝子産物はルシフェラーゼである。本開示のさらなる態様では、遺伝子産物の発現は減少させられる。 In certain aspects of the disclosure, reporter genes, including but not limited to glutathione-5-transferase (GST), horseradish peroxidase (HRP), chloramphenicol acetyltransferase (CAT), beta-galactosidase, beta-glucuronidase, luciferase, autofluorescent proteins, including green fluorescent protein (GFP), HcRed, DsRed, cyan fluorescent protein (CFP), yellow fluorescent protein (YFP), and blue fluorescent protein (BFP), can be introduced into cells to encode a gene product that serves as a marker for measuring alteration or modification of expression of the gene product. In certain embodiments of the disclosure, the gene product is luciferase. In further embodiments of the disclosure, expression of the gene product is decreased.

本願において提供される好適なタンパク質タグは、ビオチンカルボキシラーゼキャリアタンパク質(BCCP)タグ、mycタグ、カルモジュリンタグ、FLAGタグ、ヘマグルチニン(HA)タグ、ヒスチジンタグまたはHisタグともまた言われるポリヒスチジンタグ、マルトース結合タンパク質(MBP)タグ、nusタグ、グルタチオン-S-トランスフェラーゼ(GST)タグ、緑色蛍光タンパク質(GFP)タグ、チオレドキシンタグ、Sタグ、Softag(例えば、Softag 1、Softag 3)、strepタグ、ビオチンリガーゼタグ、FlAsHタグ、V5タグ、およびSBPタグを包含するが、これらに限定されない。追加の好適な配列は当業者には明らかであろう。いくつかの態様では、融合タンパク質は1つ以上のHisタグを含む。 Suitable protein tags provided herein include, but are not limited to, biotin carboxylase carrier protein (BCCP) tags, myc tags, calmodulin tags, FLAG tags, hemagglutinin (HA) tags, polyhistidine tags, also referred to as histidine tags or His tags, maltose binding protein (MBP) tags, nus tags, glutathione-S-transferase (GST) tags, green fluorescent protein (GFP) tags, thioredoxin tags, S tags, Softag (e.g., Softag 1, Softag 3), strep tags, biotin ligase tags, FlAsH tags, V5 tags, and SBP tags. Additional suitable sequences will be apparent to one of skill in the art. In some embodiments, the fusion protein comprises one or more His tags.

本開示のいくつかの態様では、PEシステムの発現される構成要素の滞留時間、量、および/または活性を調整することによって、プライム編集システムの活性は時間的に制御され得る。例えば、本明細書に記載のPEは、PEの細胞内半減期を改変することができるタンパク質ドメインと融合され得る。2つ以上のベクターが関わるある種の態様(例えば、本明細書に記載の構成要素が2つ以上の別個のベクター上にコードされるベクターシステム)では、PEシステムの活性は、ベクターが送達されるタイミングをコントロールすることによって時間的に制御され得る。例えば、いくつかの態様では、鋳型をコードするベクターに先行して、ヌクレアーゼシステムをコードするベクターがPEを送達し得る。他の態様において、PEシステムをコードするベクターに先行して、PEgRNAをコードするベクターはガイドを送達し得る。いくつかの態様では、PEシステムおよびPEgRNAをコードするベクターが同時に送達される。ある態様において、同時に送達されるベクターは、例えばPE、PEgRNA、および/または第2の鎖ガイドRNA構成要素を時間的に送達する。さらなる態様では、ベクター上のコード配列から転写されるRNA(例えば、例えばヌクレアーゼ転写物)は、さらに、RNAの細胞内半減期を改変および/または翻訳コントロールを調節することができる少なくとも1つのエレメントを含み得る。いくつかの態様では、RNAの半減期は増大させられ得る。いくつかの態様では、RNAの半減期は減少させられ得る。いくつかの態様では、エレメントはRNAの安定性を増大させることができ得る。いくつかの態様では、エレメントはRNAの安定性を減少させることができ得る。いくつかの態様では、エレメントはRNAの3'UTR内にあり得る。いくつかの態様では、エレメントはポリアデニル化シグナル(PA)を包含し得る。いくつかの態様では、エレメントは、キャップ、例えば上流のmRNAまたはPEgRNA端を包含し得る。いくつかの態様では、RNAはPAを含まずにあり得、その結果、それは転写後に細胞内でより迅速な分解を受ける。いくつかの態様では、エレメントは少なくとも1つのAUリッチエレメント(ARE)を包含し得る。組織型、細胞型、タイミング、細胞局在、および環境に依存的である様式で、AREはARE結合タンパク質(ARE-BP)によって結合され得る。いくつかの態様では、不安定化エレメントがRNA崩壊を促進、RNA安定性に影響、または翻訳を活性化し得る。いくつかの態様では、AREは長さが50から150ヌクレオチドを含み得る。いくつかの態様では、AREは少なくとも1コピーの配列AUUUAを含み得る。いくつかの態様では、少なくとも1つのAREがRNAの3'UTRに追加され得る。いくつかの態様では、エレメントはウッドチャック肝炎ウイルス(WHP)であり得る。 In some embodiments of the present disclosure, the activity of the prime editing system can be temporally controlled by adjusting the residence time, amount, and/or activity of the expressed components of the PE system. For example, the PE described herein can be fused to a protein domain that can modify the intracellular half-life of the PE. In certain embodiments involving two or more vectors (e.g., vector systems in which the components described herein are encoded on two or more separate vectors), the activity of the PE system can be temporally controlled by controlling the timing at which the vectors are delivered. For example, in some embodiments, a vector encoding a nuclease system can deliver the PE preceding a vector encoding a template. In other embodiments, a vector encoding a PEgRNA can deliver the guide preceding a vector encoding a PE system. In some embodiments, the PE system and the vector encoding the PEgRNA are delivered simultaneously. In some embodiments, the vectors delivered simultaneously temporally deliver, for example, the PE, PEgRNA, and/or second strand guide RNA components. In further embodiments, the RNA transcribed from the coding sequence on the vector (e.g., e.g., nuclease transcript) may further comprise at least one element that can modify the intracellular half-life of the RNA and/or regulate translational control. In some embodiments, the half-life of the RNA may be increased. In some embodiments, the half-life of the RNA may be decreased. In some embodiments, the element may increase the stability of the RNA. In some embodiments, the element may decrease the stability of the RNA. In some embodiments, the element may be within the 3'UTR of the RNA. In some embodiments, the element may comprise a polyadenylation signal (PA). In some embodiments, the element may comprise a cap, e.g., an upstream mRNA or PEgRNA end. In some embodiments, the RNA may be free of PA, such that it undergoes more rapid degradation in the cell after transcription. In some embodiments, the element may comprise at least one AU-rich element (ARE). The ARE may be bound by an ARE-binding protein (ARE-BP) in a manner that is tissue-type, cell-type, timing, cellular localization, and environment dependent. In some embodiments, the destabilizing element may promote RNA decay, affect RNA stability, or activate translation. In some embodiments, the ARE may comprise 50 to 150 nucleotides in length. In some embodiments, the ARE may comprise at least one copy of the sequence AUUUA. In some embodiments, at least one ARE may be added to the 3'UTR of the RNA. In some embodiments, the element may be woodchuck hepatitis virus (WHP).

転写物からの発現を増強するための三次構造を生出する転写後制御エレメント(WPRE)。さらなる態様では、エレメントは、転写物からの発現を増強することができる改変および/または短縮されたWPRE配列であり、例えばZufferey et al., J Virol, 73(4): 2886-92(1999)およびFlajolet et al., J Virol, 72(7): 6175-80(1998)に記載されているとおりである。いくつかの態様では、WPREまたは等価物はRNAの3'UTRに追加され得る。いくつかの態様では、エレメントは、高速でまたは低速で崩壊する転写物どちらかに濃縮された他のRNA配列モチーフから選択され得る。 A post-transcriptional regulatory element (WPRE) that generates a tertiary structure to enhance expression from a transcript. In further embodiments, the element is a modified and/or truncated WPRE sequence that can enhance expression from a transcript, e.g., as described in Zufferey et al., J Virol, 73(4): 2886-92(1999) and Flajolet et al., J Virol, 72(7): 6175-80(1998). In some embodiments, the WPRE or equivalent can be added to the 3'UTR of the RNA. In some embodiments, the element can be selected from other RNA sequence motifs enriched in either fast or slow decay transcripts.

いくつかの態様では、PEまたはPEgRNAをコードするベクターは、PEシステムによるベクター上に存在する標的配列の切断によって自己破壊され得る。切断はベクターからのPEまたはPEgRNAの連続した転写を防止し得る。転写は直線化されたベクター上において何らかの時間量に渡って生起し得るが、細胞内分解を受ける発現された転写物またはタンパク質は、コードするベクターの発現からの連続した供給なしには、オフターゲット効果を生ずるためのより少ない時間を有するであろう。 In some embodiments, a vector encoding a PE or PEgRNA can be self-destructed by cleavage of a target sequence present on the vector by the PE system. Cleavage can prevent continued transcription of the PE or PEgRNA from the vector. Although transcription can occur for any amount of time on a linearized vector, expressed transcripts or proteins that undergo intracellular degradation will have less time to produce off-target effects without a continuous supply from the expression of the encoding vector.

[6]PEgRNA
本明細書に記載のプライム編集システムはいずれかの好適なPEgRNAの使用を企図する。本発明者は、所望のヌクレオチド変化をコードする逆転写(RT)鋳型配列を含む特殊に構成されたガイドRNAの使用によって、プライム標的にプライムされた逆転写(TPRT)の機序が、精密かつ汎用的なCRISPR/Casに基づくゲノム編集を行うことに活用または適合され得るということを発見した。RT鋳型配列は標準のまたは従来のガイドRNA分子の伸長として提供され得るので、本願はこの特殊に構成されたガイドRNAを「伸長されたガイドRNA」または「PEgRNA」と言う。本願は伸長されたガイドRNAについていずれかの好適な構成または配置を企図する。
[6] PEgRNA
The prime editing system described herein contemplates the use of any suitable PEgRNA. The inventors have discovered that the mechanism of primed target-primed reverse transcription (TPRT) can be exploited or adapted to perform precise and versatile CRISPR/Cas-based genome editing by using a specially constructed guide RNA that contains a reverse transcription (RT) template sequence that encodes the desired nucleotide change. Since the RT template sequence can be provided as an extension of a standard or conventional guide RNA molecule, the application refers to the specially constructed guide RNA as an "extended guide RNA" or "PEgRNA". The application contemplates any suitable configuration or arrangement of the extended guide RNA.

PEgRNAアーキテクチャ
図3Aは、本明細書に開示のプライム編集因子系に使用可能な伸長されたガイドRNAの一態様を示すが、既存のガイドRNA(緑色部分)は、~20ntプロトスペーサー配列とgRNAコア領域とを包含し、napDNAbpとともに結合する。この態様において、ガイドRNAは、5'末にて伸長されたRNAセグメント、すなわち、5'伸長を包含する。この態様において、5'伸長は、逆転写鋳型配列、逆転写プライマー結合部位、および任意の5~20ヌクレオチドリンカー配列を包含する。図1A~1Bに示されるとおり、RTプライマー結合部位の、ニックの後に形成される遊離3'末とのハイブリッドは、Rループの非標的鎖に形成され、これによって5'-3'方向におけるDNA重合のために逆転写酵素がプライムされる。
PEgRNA Architecture FIG. 3A shows one embodiment of an extended guide RNA that can be used in the prime editor system disclosed herein, where the existing guide RNA (in green) includes a ∼20 nt protospacer sequence and a gRNA core region, which binds together with the napDNAbp. In this embodiment, the guide RNA includes an RNA segment extended at the 5' end, i.e., a 5' extension. In this embodiment, the 5' extension includes a reverse transcription template sequence, a reverse transcription primer binding site, and an optional 5-20 nucleotide linker sequence. As shown in FIG. 1A-1B, the hybrid of the RT primer binding site with the free 3' end formed after the nick is formed on the non-target strand of the R-loop, thereby priming the reverse transcriptase for DNA polymerization in the 5'-3' direction.

図3Bは、本明細書に開示のプライム編集系に使用可能な伸長されたガイドRNAの別の態様を示すが、既存のガイドRNA(緑色部分)は、~20ntプロトスペーサー配列とgRNAコアとを包含し、napDNAbpとともに結合する。この態様において、ガイドRNAは、3'末にて伸長されたRNAセグメント、すなわち、3'伸長を包含する。この態様において、3'伸長は、逆転写鋳型配列および逆転写プライマー結合部位を包含する。図1C~1Dに示されるとおり、RTプライマー結合部位の、ニックの後に形成される遊離3'末とのハイブリッドは、Rループの非標的鎖に形成され、これによって5'-3'方向におけるDNA重合のために逆転写酵素がプライムされる。 Figure 3B shows another embodiment of an extended guide RNA that can be used in the prime editing system disclosed herein, where the existing guide RNA (in green) includes a ∼20 nt protospacer sequence and a gRNA core, which binds together with the napDNAbp. In this embodiment, the guide RNA includes an extended RNA segment at the 3' end, i.e., a 3' extension. In this embodiment, the 3' extension includes a reverse transcription template sequence and a reverse transcription primer binding site. As shown in Figures 1C-1D, the hybrid of the RT primer binding site with the free 3' end formed after the nick is formed on the non-target strand of the R-loop, thereby priming the reverse transcriptase for DNA polymerization in the 5'-3' direction.

図3Cは、本明細書に開示のプライム編集系に使用可能な、伸長されたガイドRNAの別の態様を示すが、既存のガイドRNA(緑色部分)は、~20ntプロトスペーサー配列とgRNAコアとを包含し、napDNAbpとともに結合する。この態様において、ガイドRNAは、gRNAコア内の分子間のある位置にて伸長されたRNAセグメント、すなわち、分子内伸長を包含する。この態様において、分子内伸長は、逆転写鋳型配列および逆転写プライマー結合部位を包含する。RTプライマー結合部位はニックの後に形成される遊離3'末とハイブリダイズし、Rループの非標的鎖に形成され、これによって5'-3'方向におけるDNA重合のために逆転写酵素がプライムされる。 Figure 3C shows another embodiment of an extended guide RNA that can be used in the prime editing system disclosed herein, where the existing guide RNA (in green) includes a ∼20 nt protospacer sequence and a gRNA core, which binds together with the napDNAbp. In this embodiment, the guide RNA includes an extended RNA segment at an intermolecular position within the gRNA core, i.e., an intramolecular extension. In this embodiment, the intramolecular extension includes a reverse transcription template sequence and a reverse transcription primer binding site. The RT primer binding site hybridizes to the free 3' end formed after the nick and is formed on the non-target strand of the R-loop, thereby priming the reverse transcriptase for DNA polymerization in the 5'-3' direction.

一態様において、分子内RNA伸長の位置は、ガイドRNAのプロトスペーサー配列中にはない。別の態様において、分子内RNA伸長の位置は、gRNAコア中にある。また別の態様において、分子内RNA伸長の位置は、プロトスペーサー配列内を除きガイドRNA分子内のどこにでも、またはプロトスペーサー配列を妨害しない位置にある。 In one embodiment, the location of the intramolecular RNA extension is not within the protospacer sequence of the guide RNA. In another embodiment, the location of the intramolecular RNA extension is within the gRNA core. In yet another embodiment, the location of the intramolecular RNA extension is anywhere within the guide RNA molecule except within the protospacer sequence or at a position that does not interfere with the protospacer sequence.

一態様において、分子内RNA伸長は、プロトスペーサー配列の3'末から下流に挿入される。別の態様において、分子内RNA伸長は、プロトスペーサー配列の3'末の、少なくとも1ヌクレオチド、少なくとも2ヌクレオチド、少なくとも3ヌクレオチド、少なくとも4ヌクレオチド、少なくとも5ヌクレオチド、少なくとも6ヌクレオチド、少なくとも7ヌクレオチド、少なくとも8ヌクレオチド、少なくとも9ヌクレオチド、少なくとも10ヌクレオチド、少なくとも11ヌクレオチド、少なくとも12ヌクレオチド、少なくとも13ヌクレオチド、少なくとも14ヌクレオチド、少なくとも15ヌクレオチド、少なくとも16ヌクレオチド、少なくとも17ヌクレオチド、少なくとも18ヌクレオチド、少なくとも19ヌクレオチド、少なくとも20ヌクレオチド、少なくとも21ヌクレオチド、少なくとも22ヌクレオチド、少なくとも23ヌクレオチド、少なくとも24ヌクレオチド、少なくとも25ヌクレオチド下流に挿入される。 In one embodiment, the intramolecular RNA extension is inserted downstream from the 3' end of the protospacer sequence. In another embodiment, the intramolecular RNA extension is inserted at least 1 nucleotide, at least 2 nucleotides, at least 3 nucleotides, at least 4 nucleotides, at least 5 nucleotides, at least 6 nucleotides, at least 7 nucleotides, at least 8 nucleotides, at least 9 nucleotides, at least 10 nucleotides, at least 11 nucleotides, at least 12 nucleotides, at least 13 nucleotides, at least 14 nucleotides, at least 15 nucleotides, at least 16 nucleotides, at least 17 nucleotides, at least 18 nucleotides, at least 19 nucleotides, at least 20 nucleotides, at least 21 nucleotides, at least 22 nucleotides, at least 23 nucleotides, at least 24 nucleotides, at least 25 nucleotides downstream of the 3' end of the protospacer sequence.

他の態様において、分子内RNA伸長はgRNA中へ挿入され、これは、tracrRNAに対応するかまたはtracrRNAを含むガイドRNAの部分を指し、これはCas9タンパク質またはその等価物(すなわち、異なるnapDNAbp)に結合するかおよび/またはこれと相互作用する。好ましくは、分子内RNA伸長の挿入は、tracrRNA部分とnapDNAbpとの相互作用を妨害しないか、または妨害しても最小限である。 In other embodiments, an intramolecular RNA extension is inserted into the gRNA, which refers to a portion of the guide RNA that corresponds to or includes the tracrRNA, and which binds to and/or interacts with the Cas9 protein or its equivalent (i.e., a different napDNAbp). Preferably, the insertion of the intramolecular RNA extension does not interfere, or only minimally interferes, with the interaction of the tracrRNA portion with the napDNAbp.

RNA伸長の長さは、いずれの有用な長さでもあり得る。様々な態様において、RNA伸長は、長さが少なくとも5ヌクレオチド、少なくとも6ヌクレオチド、少なくとも7ヌクレオチド、少なくとも8ヌクレオチド、少なくとも9ヌクレオチド、少なくとも10ヌクレオチド、少なくとも11ヌクレオチド、少なくとも12ヌクレオチド、少なくとも13ヌクレオチド、少なくとも14ヌクレオチド、少なくとも15ヌクレオチド、少なくとも16ヌクレオチド、少なくとも17ヌクレオチド、少なくとも18ヌクレオチド、少なくとも19ヌクレオチド、少なくとも20ヌクレオチド、少なくとも21ヌクレオチド、少なくとも22ヌクレオチド、少なくとも23ヌクレオチド、少なくとも24ヌクレオチド、少なくとも25ヌクレオチド、少なくとも30ヌクレオチド、少なくとも40ヌクレオチド、少なくとも50ヌクレオチド、少なくとも60ヌクレオチド、少なくとも70ヌクレオチド、少なくとも80ヌクレオチド、少なくとも90ヌクレオチド、少なくとも100ヌクレオチド、少なくとも200ヌクレオチド、少なくとも300ヌクレオチド、少なくとも400ヌクレオチド、または少なくとも500ヌクレオチドである。 The length of the RNA extension can be any useful length. In various embodiments, the RNA extension is at least 5 nucleotides, at least 6 nucleotides, at least 7 nucleotides, at least 8 nucleotides, at least 9 nucleotides, at least 10 nucleotides, at least 11 nucleotides, at least 12 nucleotides, at least 13 nucleotides, at least 14 nucleotides, at least 15 nucleotides, at least 16 nucleotides, at least 17 nucleotides, at least 18 nucleotides, at least 19 nucleotides, at least 20 nucleotides, at least 21 nucleotides, at least 22 nucleotides, at least 23 nucleotides, at least 24 nucleotides, at least 25 nucleotides, at least 30 nucleotides, at least 40 nucleotides, at least 50 nucleotides, at least 60 nucleotides, at least 70 nucleotides, at least 80 nucleotides, at least 90 nucleotides, at least 100 nucleotides, at least 200 nucleotides, at least 300 nucleotides, at least 400 nucleotides, or at least 500 nucleotides in length.

RT鋳型配列はまた、いずれの好適な長さでもあり得る。例えば、RT鋳型配列は、長さが少なくとも3ヌクレオチド、少なくとも4ヌクレオチド、少なくとも5ヌクレオチド、少なくとも6ヌクレオチド、少なくとも7ヌクレオチド、少なくとも8ヌクレオチド、少なくとも9ヌクレオチド、少なくとも10ヌクレオチド、少なくとも11ヌクレオチド、少なくとも12ヌクレオチド、少なくとも13ヌクレオチド、少なくとも14ヌクレオチド、少なくとも15ヌクレオチド、少なくとも16ヌクレオチド、少なくとも17ヌクレオチド、少なくとも18ヌクレオチド、少なくとも19ヌクレオチド、少なくとも20ヌクレオチド、少なくとも30ヌクレオチド、少なくとも40ヌクレオチド、少なくとも50ヌクレオチド、少なくとも60ヌクレオチド、少なくとも70ヌクレオチド、少なくとも80ヌクレオチド、少なくとも90ヌクレオチド、少なくとも100ヌクレオチド、少なくとも200ヌクレオチド、少なくとも300ヌクレオチド、少なくとも400ヌクレオチド、または少なくとも500ヌクレオチドであり得る。 The RT template sequence can also be of any suitable length. For example, the RT template sequence can be at least 3 nucleotides, at least 4 nucleotides, at least 5 nucleotides, at least 6 nucleotides, at least 7 nucleotides, at least 8 nucleotides, at least 9 nucleotides, at least 10 nucleotides, at least 11 nucleotides, at least 12 nucleotides, at least 13 nucleotides, at least 14 nucleotides, at least 15 nucleotides, at least 16 nucleotides, at least 17 nucleotides, at least 18 nucleotides, at least 19 nucleotides, at least 20 nucleotides, at least 30 nucleotides, at least 40 nucleotides, at least 50 nucleotides, at least 60 nucleotides, at least 70 nucleotides, at least 80 nucleotides, at least 90 nucleotides, at least 100 nucleotides, at least 200 nucleotides, at least 300 nucleotides, at least 400 nucleotides, or at least 500 nucleotides in length.

更なる他の態様において、逆転写プライマー結合部位配列は、長さが少なくとも3ヌクレオチド、少なくとも4ヌクレオチド、少なくとも5ヌクレオチド、少なくとも6ヌクレオチド、少なくとも7ヌクレオチド、少なくとも8ヌクレオチド、少なくとも9ヌクレオチド、少なくとも10ヌクレオチド、少なくとも11ヌクレオチド、少なくとも12ヌクレオチド、少なくとも13ヌクレオチド、少なくとも14ヌクレオチド、少なくとも15ヌクレオチド、少なくとも16ヌクレオチド、少なくとも17ヌクレオチド、少なくとも18ヌクレオチド、少なくとも19ヌクレオチド、少なくとも20ヌクレオチド、少なくとも30ヌクレオチド、少なくとも40ヌクレオチド、少なくとも50ヌクレオチド、少なくとも60ヌクレオチド、少なくとも70ヌクレオチド、少なくとも80ヌクレオチド、少なくとも90ヌクレオチド、少なくとも100ヌクレオチドヌクレオチド、少なくとも200ヌクレオチドヌクレオチド、少なくとも300ヌクレオチドヌクレオチド、少なくとも400ヌクレオチドヌクレオチド、または少なくとも500ヌクレオチドヌクレオチドである。 In still other embodiments, the reverse transcription primer binding site sequence is at least 3 nucleotides, at least 4 nucleotides, at least 5 nucleotides, at least 6 nucleotides, at least 7 nucleotides, at least 8 nucleotides, at least 9 nucleotides, at least 10 nucleotides, at least 11 nucleotides, at least 12 nucleotides, at least 13 nucleotides, at least 14 nucleotides, at least 15 nucleotides, at least 16 nucleotides, at least 17 nucleotides, at least 18 nucleotides, at least 19 nucleotides, at least 20 nucleotides, at least 30 nucleotides, at least 40 nucleotides, at least 50 nucleotides, at least 60 nucleotides, at least 70 nucleotides, at least 80 nucleotides, at least 90 nucleotides, at least 100 nucleotides, at least 200 nucleotides, at least 300 nucleotides, at least 400 nucleotides, or at least 500 nucleotides in length.

他の態様において、任意のリンカーまたはスペーサー配列は、長さが少なくとも3ヌクレオチド、少なくとも4ヌクレオチド、少なくとも5ヌクレオチド、少なくとも6ヌクレオチド、少なくとも7ヌクレオチド、少なくとも8ヌクレオチド、少なくとも9ヌクレオチド、少なくとも10ヌクレオチド、少なくとも11ヌクレオチド、少なくとも12ヌクレオチド、少なくとも13ヌクレオチド、少なくとも14ヌクレオチド、少なくとも15ヌクレオチド、少なくとも16ヌクレオチド、少なくとも17ヌクレオチド、少なくとも18ヌクレオチド、少なくとも19ヌクレオチド、少なくとも20ヌクレオチド、少なくとも30ヌクレオチド、少なくとも40ヌクレオチド、少なくとも50ヌクレオチド、少なくとも60ヌクレオチド、少なくとも70ヌクレオチド、少なくとも80ヌクレオチド、少なくとも90ヌクレオチド、少なくとも100ヌクレオチド、少なくとも200ヌクレオチド、少なくとも300ヌクレオチド、少なくとも400ヌクレオチド、または少なくとも500ヌクレオチドである。 In other embodiments, any linker or spacer sequence is at least 3 nucleotides, at least 4 nucleotides, at least 5 nucleotides, at least 6 nucleotides, at least 7 nucleotides, at least 8 nucleotides, at least 9 nucleotides, at least 10 nucleotides, at least 11 nucleotides, at least 12 nucleotides, at least 13 nucleotides, at least 14 nucleotides, at least 15 nucleotides, at least 16 nucleotides, at least 17 nucleotides, at least 18 nucleotides, at least 19 nucleotides, at least 20 nucleotides, at least 30 nucleotides, at least 40 nucleotides, at least 50 nucleotides, at least 60 nucleotides, at least 70 nucleotides, at least 80 nucleotides, at least 90 nucleotides, at least 100 nucleotides, at least 200 nucleotides, at least 300 nucleotides, at least 400 nucleotides, or at least 500 nucleotides in length.

RT鋳型配列は、ある態様において、単鎖DNA分子をコードするが、これは、非標的鎖と相同である(よって、標的鎖の対応する部位に相補的である)が1以上のヌクレオチド変化を包含する。少なくとも1ヌクレオチド変化は、1以上の単一塩基ヌクレオチド変化、1以上の欠失、および1以上の挿入を包含していてもよい。 The RT template sequence, in some embodiments, encodes a single-stranded DNA molecule that is homologous to the non-target strand (and thus complementary to the corresponding site on the target strand) but contains one or more nucleotide changes. The at least one nucleotide change may include one or more single base nucleotide changes, one or more deletions, and one or more insertions.

図1Gに描かれるとおり、RT鋳型配列の合成された単鎖DNA産物は、非標的鎖と相同であって、1以上のヌクレオチド変化を含有する。RT鋳型配列の単鎖DNA産物は、平衡状態で、相補的な標的鎖配列とハイブリダイズし、これによって相同の内生標的鎖配列に取って代わる。取って代わられた内生鎖は、いくつかの態様において、5'内生DNAフラップ種として言及されてもよい(例として、図1Eを参照)。この5'内生DNAフラップ種は、5'フラップエンドヌクレアーゼ(例として、FEN1)によって除去され得、単鎖DNA産物は、今や内生標的鎖とハイブリダイズされており、ライゲートされて内生配列と新しく合成された鎖との間にミスマッチが創出される。ミスマッチは、細胞固有のDNA修復および/または複製プロセスによって分解されてもよい。 As depicted in FIG. 1G, the synthesized single-stranded DNA product of the RT template sequence is homologous to the non-target strand and contains one or more nucleotide changes. At equilibrium, the single-stranded DNA product of the RT template sequence hybridizes to the complementary target strand sequence, thereby displacing the homologous endogenous target strand sequence. The displaced endogenous strand may in some embodiments be referred to as a 5′ endogenous DNA flap species (see, for example, FIG. 1E). This 5′ endogenous DNA flap species may be removed by a 5′ flap endonuclease (for example, FEN1), and the single-stranded DNA product, now hybridized to the endogenous target strand, is ligated to create a mismatch between the endogenous sequence and the newly synthesized strand. The mismatch may be resolved by the cell's intrinsic DNA repair and/or replication processes.

様々な態様において、RT鋳型配列のヌクレオチド配列は、5'フラップ種と取って代わられ、かつ編集されるべき部位と重複する、非標的鎖のヌクレオチド配列に対応する。 In various embodiments, the nucleotide sequence of the RT template sequence corresponds to the nucleotide sequence of the non-target strand that is replaced by the 5' flap species and overlaps with the site to be edited.

伸長されたガイドRNAの様々な態様において、逆転写鋳型配列は、ニック部位に隣接する内生DNA配列に相補的な単鎖DNAフラップをコードしていてもよく、ここで単鎖DNAフラップは、所望のヌクレオチド変化を含む。単鎖DNAフラップは、ニック部位にて内生単鎖DNAに取って代わってもよい。ニック部位にて取って代わられた内生単鎖DNAは、5'末を有し、内生フラップを形成し得るが、これは細胞によって切除され得る。様々な態様において、5'末内生フラップを除去することが、単鎖3'DNAフラップの、対応する相補的なDNA鎖とのハイブリダイゼーション、および単鎖3'DNAフラップが持つ所望のヌクレオチド変化の標的DNA中への組み込みまたは同化を促すところ、5'末内生フラップの切除は、産物形成を推進するのに役立ち得る。 In various embodiments of the extended guide RNA, the reverse transcription template sequence may encode a single-stranded DNA flap complementary to the endogenous DNA sequence adjacent to the nick site, where the single-stranded DNA flap contains the desired nucleotide change. The single-stranded DNA flap may replace the endogenous single-stranded DNA at the nick site. The endogenous single-stranded DNA replaced at the nick site may have a 5' end and form an endogenous flap, which may be excised by the cell. In various embodiments, excision of the 5' endogenous flap may help drive product formation, where removal of the 5' endogenous flap promotes hybridization of the single-stranded 3' DNA flap with the corresponding complementary DNA strand and incorporation or assimilation of the desired nucleotide change carried by the single-stranded 3' DNA flap into the target DNA.

伸長されたガイドRNAの様々な態様において、単鎖DNAフラップの細胞修復は、所望のヌクレオチド変化の組み入れをもたらし、これによって所望の産物が形成される。 In various embodiments of the extended guide RNA, cellular repair of the single-stranded DNA flap results in incorporation of the desired nucleotide change, thereby forming the desired product.

なお他の態様において、所望のヌクレオチド変化は、ニック部位の約-5~+5の間、またはニック部位の約-10~+10の間、またはニック部位の約-20~+20の間、またはニック部位の約-30~+30の間、またはニック部位の約-40~+40の間、またはニック部位の約-50~+50の間、またはニック部位の約-60~+60の間、またはニック部位の約-70~+70の間、またはニック部位の約-80~+80の間、またはニック部位の約-90~+90の間、またはニック部位の約-100~+100の間、またはニック部位の約-200~+200の間である編集窓上に組み入れされる。
他の態様において、所望のヌクレオチド変化は、ニック部位から約+1から+2、またはニック部位から約+1~+3、+1~+4、+1~+5、+1~+6、+1~+7、+1~+8、+1~+9、+1~+10、+1~+11、+1~+12、+1~+13、+1~+14、+1~+15、+1~+16、+1~+17、+1~+18、+1~+19、+1~+20、+1~+21、+1~+22、+1~+23、+1~+24、+1~+25、+1~+26、+1~+27、+1~+28、+1~+29、+1~+30、+1~+31、+1~+32、+1~+33、+1~+34、+1~+35、+1~+36、+1~+37、+1~+38、+1~+39、+1~+40、+1~+41、+1~+42、+1~+43、+1~+44、+1~+45、+1~+46、+1~+47、+1~+48、+1~+49、+1~+50、+1~+51、+1~+52、+1~+53、+1~+54、+1~+55、+1~+56、+1~+57、+1~+58、+1~+59、+1~+60、+1~+61、+1~+62、+1~+63、+1~+64、+1~+65、+1~+66、+1~+67、+1~+68、+1~+69、+1~+70、+1~+71、+1~+72、+1~+73、+1~+74、+1~+75、+1~+76、+1~+77、+1~+78、+1~+79、+1~+80、+1~+81、+1~+82、+1~+83、+1~+84、+1~+85、+1~+86、+1~+87、+1~+88、+1~+89、+1~+90、+1~+90、+1~+91、+1~+92、+1~+93、+1~+94、+1~+95、+1~+96、+1~+97、+1~+98、+1~+99、+1~+100、+1~+101、+1~+102、+1~+103、+1~+104、+1~+105、+1~+106、+1~+107、+1~+108、+1~+109、+1~+110、+1~+111、+1~+112、+1~+113、+1~+114、+1~+115、+1~+116、+1~+117、+1~+118、+1~+119、+1~+120、+1~+121、+1~+122、+1~+123、+1~+124、もしくは+1~+125の間である編集窓上に組み入れされる。
In still other embodiments, the desired nucleotide changes are incorporated over an editing window that is between about -5 to +5 at the nick site, or between about -10 to +10 at the nick site, or between about -20 to +20 at the nick site, or between about -30 to +30 at the nick site, or between about -40 to +40 at the nick site, or between about -50 to +50 at the nick site, or between about -60 to +60 at the nick site, or between about -70 to +70 at the nick site, or between about -80 to +80 at the nick site, or between about -90 to +90 at the nick site, or between about -100 to +100 at the nick site, or between about -200 to +200 at the nick site.
In other embodiments, the desired nucleotide changes are from about +1 to +2 from the nick site, or from about +1 to +3, +1 to +4, +1 to +5, +1 to +6, +1 to +7, +1 to +8, +1 to +9, +1 to +10, +1 to +11, +1 to +12, +1 to +13, +1 to +14, +1 to +15, +1 to +16, +1 to +17, +1 to +18, +1 to +19, +1 to +20, +1 to +21, +1 to +22, +1 to +23, +1 to +24, +1 to +25, +1 to +26, +1 to +27, +1 to +28, +1 to +29, +1 to +30, +1 ~+31, +1~+32, +1~+33, +1~+34, +1~+35, +1~+36, +1~+37, +1~+38, +1~+39, +1~+40, +1~+41, +1~+42, +1~+43, +1~+44, +1~+45, +1~+46, +1~+47, +1~+48, +1~+49, +1~+50, +1~+51, +1~+52, +1~+53, +1~+54, +1~+55, +1~+56, +1~+57, +1~+58, +1~+59, +1~+60, +1~+61, +1~+62, +1~+63, +1~+64, +1~ +65, +1 to +66, +1 to +67, +1 to +68, +1 to +69, +1 to +70, +1 to +71, +1 to +72, +1 to +73, +1 to +74, +1 to +75, +1 to +76, +1 to +77, +1 to +78, +1 to +79, +1 to +80, +1 to +81, +1 to +82, +1 to +83, +1 to +84, +1 to +85, +1 to +86, +1 to +87, +1 to +88, +1 to +89, +1 to +90, +1 to +90, +1 to +91, +1 to +92, +1 to +93, +1 to +94, +1 to +95, +1 to +96, +1 to +97, +1 to + The edit window is placed between 98, +1 to +99, +1 to +100, +1 to +101, +1 to +102, +1 to +103, +1 to +104, +1 to +105, +1 to +106, +1 to +107, +1 to +108, +1 to +109, +1 to +110, +1 to +111, +1 to +112, +1 to +113, +1 to +114, +1 to +115, +1 to +116, +1 to +117, +1 to +118, +1 to +119, +1 to +120, +1 to +121, +1 to +122, +1 to +123, +1 to +124, or +1 to +125.

なお他の態様において、所望のヌクレオチド変化は、ニック部位から約+1から+2の間、またはニック部位から約+1~+5、+1~+10、+1~+15、+1~+20、+1~+25、+1~+30、+1~+35、+1~+40、+1~+45、+1~+50、+1~+55、+1~+100、+1~+105、+1~+110、+1~+115、+1~+120、+1~+125、+1~+130、+1~+135、+1~+140、+1~+145、+1~+150、+1~+155、+1~+160、+1~+165、+1~+170、+1~+175、+1~+180、+1~+185、+1~+190、+1~+195、もしくは+1~+200である編集窓上に組み入れされる。 In still other embodiments, the desired nucleotide change is between about +1 and +2 from the nick site, or about +1 to +5, +1 to +10, +1 to +15, +1 to +20, +1 to +25, +1 to +30, +1 to +35, +1 to +40, +1 to +45, +1 to +50, +1 to +55, +1 to +100, +1 to +105, +1 to +110, +1 to +11 5, +1 to +120, +1 to +125, +1 to +130, +1 to +135, +1 to +140, +1 to +145, +1 to +150, +1 to +155, +1 to +160, +1 to +165, +1 to +170, +1 to +175, +1 to +180, +1 to +185, +1 to +190, +1 to +195, or +1 to +200 will be incorporated into the editing window.

様々な側面において、伸長されたガイドRNAは、ガイドRNAの修飾バージョンである。ガイドRNAは、天然に存在するものであっても、コードする核酸から発現されても、または化学的に合成されてもよい。着目するゲノムの標的部位の標的鎖と相互作用してハイブリダイズするプロトスペーサー配列を包含する、ガイドRNAを入手またはそうでなければ合成するための方法、およびガイドRNAの適切な配列を決定するための方法は、当該技術分野において周知である。 In various aspects, the extended guide RNA is a modified version of a guide RNA. The guide RNA may be naturally occurring, expressed from an encoding nucleic acid, or chemically synthesized. Methods for obtaining or otherwise synthesizing a guide RNA that includes a protospacer sequence that interacts with and hybridizes to a target strand at a genomic target site of interest, and for determining the appropriate sequence of the guide RNA, are well known in the art.

様々な態様において、ガイドRNA配列の具体的なデザイン側面は、PAM配列の場所、標的配列中のパーセントG/C含量、マイクロ相同領域の程度、2次構造等々などの他の因子の中でも、着目するゲノム標的部位のヌクレオチド配列(すなわち、編集されるべき所望の部位)と、本明細書に記載のプライム編集系に存在するnapDNAbpの型(例として、Cas9タンパク質)とに依存するであろう。 In various embodiments, the specific design aspects of the guide RNA sequence will depend on the nucleotide sequence of the genomic target site of interest (i.e., the desired site to be edited) and the type of napDNAbp (e.g., Cas9 protein) present in the prime editing system described herein, among other factors such as the location of the PAM sequence, the percent G/C content in the target sequence, the extent of microhomologous regions, secondary structure, etc.

一般に、ガイド配列は、標的ポリヌクレオチド配列との充分な相補性を有するいずれのポリヌクレオチド配列であって、標的配列とハイブリダイズし、かつnapDNAbp(例として、Cas9、Cas9ホモログ、またはCas9バリアント)の標的配列への配列特異的結合に向けるものである。いくつかの態様において、ガイド配列とその対応する標的配列との間の相補性の程度は、好適な整列(alignment)アルゴリズムを使用して最適に整列されたとき、約50%、60%、75%、80%、85%、90%、95%、97.5%、99%以上、またはこれらより高い。最適な整列は、配列を整列させるためのいずれか好適なアルゴリズムの使用で決定されてもよく、前記アルゴリズムの非限定例は、Smith-Watermanアルゴリズム、Needleman-Wunschアルゴリズム、Burrows-Wheeler Transform(例として、Burrows Wheeler Aligner)、ClustalW、Clustal X、BLAT、Novoalign(Novocraft Technologies)、ELAND(Illumina,San Diego,Calif.)、SOAP(soap.genomics.org.cnにて利用可能)、およびMaq(maq.sourceforge.netにて利用可能)に基づくアルゴリズムを包含する。いくつかの態様において、ガイド配列は、長さが約5、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、35、40、45、50、75ヌクレオチド以上であるか、またはこれらより長い。 In general, a guide sequence is any polynucleotide sequence that has sufficient complementarity with a target polynucleotide sequence to hybridize with the target sequence and direct sequence-specific binding of a napDNAbp (e.g., Cas9, a Cas9 homolog, or a Cas9 variant) to the target sequence. In some embodiments, the degree of complementarity between a guide sequence and its corresponding target sequence is about 50%, 60%, 75%, 80%, 85%, 90%, 95%, 97.5%, 99% or more, when optimally aligned using a suitable alignment algorithm. Optimal alignment may be determined using any suitable algorithm for aligning sequences, non-limiting examples of which include algorithms based on the Smith-Waterman algorithm, the Needleman-Wunsch algorithm, the Burrows-Wheeler Transform (e.g., Burrows Wheeler Aligner), ClustalW, Clustal X, BLAT, Novoalign (Novocraft Technologies), ELAND (Illumina, San Diego, Calif.), SOAP (available at soap.genomics.org.cn), and Maq (available at maq.sourceforge.net). In some embodiments, the guide sequence is about 5, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 35, 40, 45, 50, 75 or more nucleotides in length.

いくつかの態様において、ガイド配列は、長さが約75、50、45、40、35、30、25、20、15、12ヌクレオチド未満であるか、またはこれらより短い。ガイド配列の、プライム編集因子(PE)の標的配列への配列特異的結合に向ける能力は、いずれの好適なアッセイによっても査定されてもよい。例えば、プライム編集因子(PE)の構成要素(試験されるべきガイド配列を包含する)は、本明細書に開示のプライム編集因子(PE)の構成要素をコードするベクターでのトランスフェクション、これに続く、本明細書に記載のとおりのSurveyorアッセイなどによる標的配列内の優先的な切断の査定などによって、対応する標的配列を有する宿主細胞へ提供されてもよい。同様に、標的ポリヌクレオチド配列の切断は試験管中、標的配列、プライム編集因子(PE)の構成要素(試験されるべきガイド配列を包含する)、および試験ガイド配列とは異なる制御ガイド配列を提供すること、ならびに試験ガイド配列とおよび制御ガイド配列との間の反応の、標的配列での結合または切断率を比較することによって、評価されてもよい。他のアッセイもなし得、当業者に思い当たるものであろう。 In some embodiments, the guide sequence is less than about 75, 50, 45, 40, 35, 30, 25, 20, 15, 12 nucleotides in length, or shorter. The ability of the guide sequence to direct sequence-specific binding of the prime editor (PE) to a target sequence may be assessed by any suitable assay. For example, a prime editor (PE) component (including the guide sequence to be tested) may be provided to a host cell having a corresponding target sequence, such as by transfection with a vector encoding a prime editor (PE) component disclosed herein, followed by assessment of preferential cleavage within the target sequence, such as by a Surveyor assay as described herein. Similarly, cleavage of a target polynucleotide sequence may be assessed in a test tube by providing the target sequence, a prime editor (PE) component (including the guide sequence to be tested), and a control guide sequence that is different from the test guide sequence, and comparing the binding or cleavage rate at the target sequence of the reaction between the test guide sequence and the control guide sequence. Other assays may be performed and will occur to those of skill in the art.

ガイド配列は、いずれの標的配列をも標的にするのに選択されてもよい。いくつかの態様において、標的配列は、細胞のゲノム内の配列である。例示の標的配列は、標的ゲノム中にユニークな配列を包含する。例えば、S.pyogenes Cas9について、ゲノム中のユニークな標的配列は、形態MMMMMMMMNNNNNNNNNNNNXGGのCas9標的部位を包含していてもよく、ここでNNNNNNNNNNNNXGG(Nは、A、G、T、またはCである;およびXは、何であってもよい)。ゲノム中のユニークな標的配列は、形態MMMMMMMMMNNNNNNNNNNNXGGのS.pyogenes Cas9標的部位を包含していてもよく、ここでNNNNNNNNNNNXGG(Nは、A、G、T、またはCである;およびXは、何であってもよい)。S.thermophilus CRISPR1Cas9について、ゲノム中のユニークな標的配列は、形態MMMMMMMMNNNNNNNNNNNNXXAGAAW(配列番号208)のCas9標的部位を包含していてもよく、ここでNNNNNNNNNNNNXXAGAAW(配列番号209)(Nは、A、G、T、またはCである;Xは、何であってもよい;およびWは、AまたはTである)。ゲノム中のユニークな標的配列は、形態MMMMMMMMMNNNNNNNNNNNXXAGAAW(配列番号210)のS.thermophilus CRISPR1 Cas9標的部位を包含していてもよく、ここでNNNNNNNNNNNXXAGAAW(配列番号211)(Nは、A、G、T、またはCである;Xは、何であってもよい;およびWは、AまたはTである)。S.pyogenes Cas9について、ゲノム中のユニークな標的配列は、形態MMMMMMMMNNNNNNNNNNNNXGGXGのCas9標的部位を包含していてもよく、ここでNNNNNNNNNNNNXGGXG(Nは、A、G、T、またはCである;およびXは、何であってもよい)。ゲノム中のユニークな標的配列は、形態MMMMMMMMMNNNNNNNNNNNXGGXGのS.pyogenes Cas9標的部位を包含していてもよく、ここでNNNNNNNNNNNXGGXG(Nは、A、G、T、またはC;およびXは、何であってもよい)。これらの配列の各々において、「M」は、A、G、T、またはCであってもよく、配列をユニークなものとして同定する際に考慮される必要はない。 The guide sequence may be selected to target any target sequence. In some embodiments, the target sequence is a sequence in the genome of a cell. Exemplary target sequences include sequences that are unique in the target genome. For example, for S.pyogenes Cas9, a unique target sequence in a genome may include a Cas9 target site of the form MMMMMMMMNNNNNNNNNNNXG G , where NNNNNNNNNNNNXG G ( N is A, G, T, or C; and X can be anything). A unique target sequence in a genome may include a S.pyogenes Cas9 target site of the form MMMMMMMMMNNNNNNNNNNNXG G , where NNNNNNNNNNXG G ( N is A, G, T, or C; and X can be anything). For S. thermophilus CRISPR1Cas9, a unique target sequence in the genome may encompass a Cas9 target site of the form MMMMMMMMNNNNNNNNNNNNXXAGAAW (SEQ ID NO:208), where NNNNNNNNNNNNXXAGAAW (SEQ ID NO:209) (N is A, G, T, or C; X can be anything; and W is A or T). A unique target sequence in the genome may encompass a S. thermophilus CRISPR1 Cas9 target site of the form MMMMMMMMMNNNNNNNNNNNXXAGAAW (SEQ ID NO:210), where NNNNNNNNNNNXXAGAAW (SEQ ID NO:211) (N is A, G, T, or C; X can be anything; and W is A or T). For S. pyogenes Cas9, a unique target sequence in a genome may encompass a Cas9 target site of the form MMMMMMMNNNNNNNNNNNXGGX G , where NNNNNNNNNNNNXGGX G ( N is A, G, T, or C; and X can be anything). A unique target sequence in a genome may encompass a S. pyogenes Cas9 target site of the form MMMMMMMMMNNNNNNNNNNNXGGX G , where NNNNNNNNNNNXGGX G ( N is A, G, T, or C; and X can be anything). In each of these sequences, "M" may be A, G, T, or C and need not be considered in identifying a sequence as unique.

いくつかの態様において、ガイド配列は、ガイド配列内の2次構造の程度を低減するよう選択される。2次構造は、いずれの好適なポリヌクレオチド折り畳みアルゴリズムによっても決定されてもよい。いくつかのプログラムは、最小限のギブス(Gibbs)自由エネルギーを算出することに基づく。かかるアルゴリズムの1つの例は、ZukerおよびStiegler(Nucleic Acids Res.9(1981),133-148)によって記載されるとおりの、mFoldである。別の例の折り畳みアルゴリズムは、重心構造予測アルゴリズムを使用する、ウィーン大学(University of Vienna)の理論化学研究所(Institute for Theoretical Chemistry)にて開発された、オンラインウェブサーバRNA foldである(例として、A.R.Gruber et al.,2008,Cell 106(1):23-24;およびPA Carr and GM Church,2009,Nature Biotechnology 27(12):1151-62を参照)。さらなるアルゴリズムは、米国出願第61/836,080号;Broad参照BI-2013/004A)に見出されるものであってもよい(参照により本明細書に組み込まれる)。 In some embodiments, the guide sequence is selected to reduce the degree of secondary structure within the guide sequence. The secondary structure may be determined by any suitable polynucleotide folding algorithm. Some programs are based on calculating the minimum Gibbs free energy. One example of such an algorithm is mFold, as described by Zuker and Stiegler (Nucleic Acids Res. 9 (1981), 133-148). Another example folding algorithm is the online web server RNAfold, developed at the Institute for Theoretical Chemistry, University of Vienna, which uses a centroid structure prediction algorithm (see, for example, A.R. Gruber et al., 2008, Cell 106(1):23-24; and PA Carr and GM Church, 2009, Nature Biotechnology 27(12):1151-62). Further algorithms may be found in U.S. Application No. 61/836,080; Broad Reference BI-2013/004A (herein incorporated by reference).

一般的に、tracrメイト配列は:(1)対応するtracr配列を含有する細胞におけるtracrメイト配列によってフランキングされるガイド配列の切除;および(2)標的配列における複合体の形成の1つ以上を促進するために、tracr配列との十分な相補性を有するいずれかの配列を包含し、複合体は、tracr配列にハイブリダイズしたtracrメイト配列を含む。一般的に、相補性の度合は、2つの配列の短い方の長さに沿って、tracrメイト配列およびtracr配列の最適な整列の参照によってである。最適な整列は、いずれの好適な整列アルゴリズムによっても決定されてもよく、さらにtracr配列またはtracrメイト配列のいずれかの配列内に自己相補性などの2次構造を構成していてもよい。いくつかの態様において、tracr配列とtracrメイト配列との間の相補性の程度は、その2つのより短い長さに沿って最適に整列されたとき、約25%、30%、40%、50%、60%、70%、80%、90%、95%、97.5%、99%以上、またはこれらより高い。いくつかの態様において、tracr配列は、長さが約5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、25、30、40、50ヌクレオチド以上、またはこれらより長い。いくつかの態様において、tracr配列およびtracrメイト配列は、その2つの間のハイブリダイゼーションがヘアピンなどの2次構造を有する転写産物を産生するように、単一転写産物内に含有される。ヘアピン構造における使用のための好ましいループ形成配列は、長さが4ヌクレオチドであり、最も好ましくは配列GAAAを有する。しかしながら、より長いまたはより短いループ配列も、代替の配列になり得るよう(as may alternative sequences)使用されてもよい。配列は、好ましくは、ヌクレオチドトリプレット(例えば、AAA)、および追加のヌクレオチド(例えばCまたはG)を包含する。ループ形成配列の例は、CAAAおよびAAAGを包含する。本発明の態様において、転写産物または転写されたポリヌクレオチド配列は、少なくとも2つの、またはそれより多くのヘアピンを有する。好ましい一態様において、転写産物は、2、3、4または5つのヘアピンを有する。本発明のさらなる態様において、転写産物は、最大でも5つのヘアピンを有する。いくつかの態様において、単一の転写産物はさらに、転写終止配列を包含する;好ましくは、これは、ポリT配列、例えば6つのTヌクレオチドを包含する。ガイド配列、tracrメイト配列、およびtracr配列を含む単一ポリヌクレオチドのさらなる非限定例は、以下のとおりであるが(5'→3'に列挙)、ここで「N」は、ガイド配列の塩基を表し、第1ブロックの小文字は、tracrブロック配列を表し、および第2ブロックの小文字は、tracr配列を表し、および最後のポリT配列は、転写ターミネータを表す:(1)NNNNNNNNGTTTTTGTACTCTCAAGATTTAGAAATAAATCTTGCAGAAGCTACAAAGATAAGGCTTCATGCCGAAATCAACACCCTGTCATTTTATGGCAGGGTGTTTTCGTTATTTAATTTTTT(配列番号216); In general, a tracr mate sequence includes any sequence that has sufficient complementarity with a tracr sequence to promote one or more of: (1) excision of a guide sequence flanked by tracr mate sequences in cells containing the corresponding tracr sequence; and (2) formation of a complex in a target sequence, the complex including a tracr mate sequence hybridized to a tracr sequence. In general, the degree of complementarity is by reference to optimal alignment of the tracr mate sequence and the tracr sequence along the shorter length of the two sequences. Optimal alignment may be determined by any suitable alignment algorithm, and may further comprise secondary structures, such as self-complementarity, within either the tracr sequence or the tracr mate sequence. In some embodiments, the degree of complementarity between the tracr sequence and the tracr mate sequence is about 25%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 95%, 97.5%, 99% or more, or higher, when optimally aligned along the shorter length of the two. In some embodiments, the tracr sequence is about 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 25, 30, 40, 50 or more nucleotides in length, or longer. In some embodiments, the tracr sequence and the tracr mate sequence are contained within a single transcript, such that hybridization between the two produces a transcript with a secondary structure, such as a hairpin. A preferred loop-forming sequence for use in a hairpin structure is 4 nucleotides in length, and most preferably has the sequence GAAA. However, longer or shorter loop sequences may also be used, as may alternative sequences. The sequence preferably includes a nucleotide triplet (e.g., AAA) and an additional nucleotide (e.g., C or G). Examples of loop-forming sequences include CAAA and AAAG. In an embodiment of the present invention, the transcript or transcribed polynucleotide sequence has at least two, or more, hairpins. In a preferred embodiment, the transcript has 2, 3, 4 or 5 hairpins. In further embodiments of the invention, the transcript has at most 5 hairpins. In some embodiments, the single transcript further includes a transcription termination sequence; preferably, this includes a poly-T sequence, such as 6 T nucleotides. Further non-limiting examples of single polynucleotides including a guide sequence, a tracr mate sequence, and a tracr sequence are as follows (listed 5'→3'), where "N" represents the bases of the guide sequence, the first block of lowercase letters represents the tracr block sequence, and the second block of lowercase letters represents the tracr sequence, and the final poly-T sequence represents the transcription terminator: (1) NNNNNNNNGTTTTTGTACTCTCAAGATTTAGAAATAAATCTTGCAGAAGCTACAAAGATAAGGCTTCATGCCGAAATCAACACCCTGTCATTTTATGGCAGGGTGTTTTCGTTATTTAATTTTTT (SEQ ID NO: 216);

(2)NNNNNNNNNNNNNNNNNNgtttttgtactctcaGAAAtgcagaagctacaaagataaggcttcatgccgaaatcaacaccctgtcattttatggcagggtgttttcgttatttaaTTTTTT(配列番号217); (2) NNNNNNNNNNNNNNNNNNgtttttgtactctcaGAAAtgcagaagctacaaagataaggcttcatgccgaaatcaacaccctgtcattttatggcagggtgttttcgttatttaaTTTTTT (SEQ ID NO: 217);

(3)NNNNNNNNNNNNNNNNNNNNgtttttgtactctcaGAAAtgcagaagctacaaagataaggcttcatgccgaaatcaacaccctgtcattttatggcagggtgtTTTTT(配列番号218); (3)NNNNNNNNNNNNNNNNNNNNgtttttgtactctcaGAAAtgcagaagctacaaagataaggcttcatgccgaaatcaacaccctgtcattttatggcagggtgtTTTTTT (SEQ ID NO: 218);

(4)NNNNNNNNNNNNNNNNNNNNgttttagagctaGAAAtagcaagttaaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtgcTTTTTT(配列番号219); (4)NNNNNNNNNNNNNNNNNNNNgttttagagctaGAAAtagcaagttaaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtgcTTTTTT (sequence number 219);

(5)NNNNNNNNNNNNNNNNNNNNgttttagagctaGAAATAGcaagttaaaataaggctagtccgttatcaacttgaaaaagtgTTTTTTT(配列番号220);および (5) NNNNNNNNNNNNNNNNNNNNgttttagagctaGAAATAGcaagttaaaataaggctagtccgttatcaacttgaaaaagtgTTTTTT (SEQ ID NO: 220); and

(6)NNNNNNNNNNNNNNNNNNNNgttttagagctagAAATAGcaagttaaaataaggctagtccgttatcaTTTTTTTT(配列番号221)。 (6) NNNNNNNNNNNNNNNNNNNNgttttagagctagAAATAGcaagttaaaataaggctagtccgttatcaTTTTTTTT (sequence number 221).

いくつかの態様において、配列(1)~(3)は、S.thermophilus CRISPR1からのCas9と組み合わせて使用される。いくつかの態様において、配列(4)~(6)は、S.pyogenesからのCas9と組み合わせて使用される。いくつかの態様において、tracr配列は、tracrメイト配列を含む転写産物とは別々の転写産物である。 In some embodiments, sequences (1)-(3) are used in combination with Cas9 from S. thermophilus CRISPR1. In some embodiments, sequences (4)-(6) are used in combination with Cas9 from S. pyogenes. In some embodiments, the tracr sequence is a separate transcript from the transcript that contains the tracr mate sequence.

Cas9ドメインと単鎖DNA結合タンパク質とを含む本明細書に開示のとおりの融合タンパク質のいずれも、標的部位(例として、編集されるべき点突然変異を含む部位)に対して、標的にさせるために、典型的には、融合タンパク質をガイドRNA(例として、sgRNA)と一緒に共発現させることが必要であることは、当業者には明らかであろう。本明細書中、他のどこかでより詳細に説明されるとおり、ガイドRNAは、典型的には、Cas9結合を可能にさせるtracrRNAフレームワークと、配列特異性をCas9:核酸編集酵素/ドメイン融合タンパク質へ付与するガイド配列とを含む。 It will be apparent to one of skill in the art that any fusion protein as disclosed herein comprising a Cas9 domain and a single-stranded DNA binding protein typically requires co-expression of the fusion protein with a guide RNA (e.g., an sgRNA) to target the fusion protein to a target site (e.g., a site containing a point mutation to be edited). As described in more detail elsewhere herein, the guide RNA typically comprises a tracrRNA framework that allows for Cas9 binding and a guide sequence that confers sequence specificity to the Cas9:nucleic acid editing enzyme/domain fusion protein.

いくつかの態様において、ガイドRNAは、構造5'-[ガイド配列]-GUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUU-3'(配列番号222)を含み、ここでガイド配列は、標的配列に相補的な配列を含む。ガイド配列は、典型的には20ヌクレオチド長である。Cas9:核酸編集酵素/ドメイン融合タンパク質を特定のゲノム標的部位に対して標的にさせるための好適なガイドRNAの配列は、本開示に基づき当業者に明らかであろう。かかる好適なガイドRNA配列は、典型的には、編集されるべき標的ヌクレオチドから50ヌクレオチド以内上流または下流の核酸配列に相補的なガイド配列を含む。提供される融合タンパク質に、特定の標的配列を標的にさせるのに好適ないくつかの例示のガイドRNA配列は、本明細書に提供される。追加のガイド配列は、当該技術分野において周知であり、本明細書に記載のプライム編集因子(PE)とともに使用され得る。 In some embodiments, the guide RNA comprises the structure 5'-[guide sequence]-GUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUU-3' (SEQ ID NO: 222), where the guide sequence comprises a sequence complementary to the target sequence. The guide sequence is typically 20 nucleotides in length. Suitable guide RNA sequences for targeting Cas9:nucleic acid editing enzyme/domain fusion proteins to specific genomic target sites will be apparent to one of skill in the art based on this disclosure. Such suitable guide RNA sequences typically comprise a guide sequence complementary to a nucleic acid sequence within 50 nucleotides upstream or downstream of the target nucleotide to be edited. Some exemplary guide RNA sequences suitable for targeting the provided fusion proteins to specific target sequences are provided herein. Additional guide sequences are known in the art and may be used with the prime editors (PEs) described herein.

他の態様において、PEgRNAは、図3Dに描かれるものを包含する。 In other embodiments, the PEgRNA includes those depicted in Figure 3D.

更なる他の態様において、PEgRNAは、図3Eに描かれるものを包含していてもよい。 In yet other embodiments, the PEgRNA may include that depicted in Figure 3E.

図3Dは、本明細書に企図され、例2に定義される方法論に従ってデザインされてもよい、ある態様のPEgRNAの構造を提供する。PEgRNAは、5'→3'方向に順序付けられた3大構成要素、つまり:スペーサー、gRNAコア、および3'末にて伸長アームを含む。伸長アームはさらに、5'→3'方向に以下の構造要素、つまり:プライマー結合部位(A)、編集鋳型(B)、および相同アーム(C)に分けられてもよい。加えて、PEgRNAは、任意の3'末修飾領域(e1)および任意の5'末修飾領域(e2)を含んでいてもよい。またさらに、PEgRNAは、PEgRNAの3'末にて転写終止シグナルを含んでいてもよい(描かれず)。これらの構造要素はさらに本明細書に定義される。PEgRNA構造の描画は、限定することを意図しておらず、要素の配置におけるバリエーションを網羅するものである。例えば、任意の配列修飾因子(e1)および(e2)は、示されるいずれの他の領域内またはそれらの間に位置付けられ得るものであって、3'末および5'末にて位置付けられることに限定され得ない。 Figure 3D provides the structure of an embodiment of a PEgRNA that may be designed according to the methodology contemplated herein and defined in Example 2. The PEgRNA comprises three major components ordered in the 5' to 3' direction: a spacer, a gRNA core, and an extension arm at the 3' end. The extension arm may be further divided in the 5' to 3' direction into the following structural elements: a primer binding site (A), an editing template (B), and a homology arm (C). In addition, the PEgRNA may comprise an optional 3' end modification region (e1) and an optional 5' end modification region (e2). Furthermore, the PEgRNA may also comprise a transcription termination signal at the 3' end of the PEgRNA (not depicted). These structural elements are further defined herein. The depiction of the PEgRNA structure is not intended to be limiting and encompasses variations in the arrangement of the elements. For example, the optional sequence modifiers (e1) and (e2) can be located within or between any of the other regions shown and are not limited to being located at the 3' and 5' ends.

図3Eは、本明細書に企図され、例2に定義される方法論に従ってデザインされてもよい、別の態様のPEgRNAの構造を提供する。PEgRNAは、5'→3'方向に順序付けられた3大構成要素、つまり:スペーサー、gRNAコア、および3'末にて伸長アームを含む。伸長アームはさらに、5'→3'方向に以下の構造要素、つまり:プライマー結合部位(A)、編集鋳型(B)、ならびに相同アーム(C)に分けられてもよい。加えて、PEgRNAは、任意の3'末修飾領域(e1)および任意の5'末修飾領域(e2)を含んでいてもよい。またさらに、PEgRNAは、PEgRNAの3'末にて転写終止シグナルを含んでいてもよい(描かれず)。これらの構造要素はさらに本明細書に定義される。PEgRNA構造の描画は、限定することを意図しておらず、要素の配置におけるバリエーションを網羅するものである。例えば、任意の配列修飾因子(e1)および(e2)は、示されるいずれの他の領域内またはそれらの間に位置付けられ得るものであって、3'末および5'末にて位置付けられることに限定され得ない。 Figure 3E provides another embodiment of a PEgRNA structure that may be designed according to the methodology contemplated herein and defined in Example 2. The PEgRNA comprises three major components ordered in the 5' to 3' direction: a spacer, a gRNA core, and an extension arm at the 3' end. The extension arm may be further divided into the following structural elements in the 5' to 3' direction: a primer binding site (A), an editing template (B), and a homology arm (C). In addition, the PEgRNA may comprise an optional 3' end modification region (e1) and an optional 5' end modification region (e2). Furthermore, the PEgRNA may also comprise a transcription termination signal at the 3' end of the PEgRNA (not depicted). These structural elements are further defined herein. The depiction of the PEgRNA structure is not intended to be limiting and encompasses variations in the arrangement of the elements. For example, the optional sequence modifiers (e1) and (e2) can be located within or between any of the other regions shown and are not limited to being located at the 3' and 5' ends.

PEgRNAはまた、PEgRNAの特性および/または特徴を修飾してもよい追加のデザイン改善点も包含していてもよく、これによってプライム編集の有効性が改善される。様々な態様において、これらの改善点は、数多の種々のカテゴリーの1以上に属するものであってもよく、これらに限定されないが、以下を包含する:(1)非ポリメラーゼIII(pol III)プロモーターからの機能的PEgRNAの効率的な発現を可能にさせるデザイン(これによって厄介な配列要件もなく、より長いPEgRNAの発現が可能になるであろう);(2)コア、Cas9結合PEgRNA骨格への改善点(これによって有効性が改善され得る);(3)RT処理能力(processivity)を改善する、PEgRNAへの修飾(標的にされたゲノム遺伝子座にてより長い配列の挿入が可能になる);および(4)RNAモチーフの、PEgRNAの5'末端または3'末端への付加(これによって、PEgRNA安定性が改善されるか、RT処理能力が増強されるか、PEgRNAの誤った折り畳みが防止されるか、またはゲノム編集に重要な追加の因子が動員される)。 PEgRNAs may also include additional design improvements that may modify the properties and/or characteristics of the PEgRNA, thereby improving the efficacy of prime editing. In various embodiments, these improvements may fall into one or more of a number of different categories, including, but not limited to: (1) designs that allow efficient expression of functional PEgRNAs from non-polymerase III (pol III) promoters, which would allow expression of longer PEgRNAs without cumbersome sequence requirements; (2) improvements to the core, Cas9-bound PEgRNA backbone, which may improve efficacy; (3) modifications to the PEgRNA that improve RT processivity, which would allow insertion of longer sequences at the targeted genomic locus; and (4) the addition of RNA motifs to the 5' or 3' end of the PEgRNA, which may improve PEgRNA stability, enhance RT processivity, prevent PEgRNA misfolding, or recruit additional factors important for genome editing.

一態様において、PEgRNAは、より大きな伸長アームをもつより長い長さのPEgRNAの発現を改善するよう、pol IIIプロモーターでデザインされ得る。sgRNAは、典型的には、U6 snRNAプロモーターから発現される。このプロモーターは、pol IIIを動員して関連RNAを発現するものであって、核内に保持される短いRNAの発現に有用である。しかしながら、pol IIIは、処理能力がそれほど高くなく、効率的なゲノム編集に要されるレベルにて長さが数百ヌクレオチドより長いRNAを発現することができない。加えて、pol IIIは、伸展したU(streches of U's)にて失速または終止し、PEgRNAを使用して挿入され得る配列多様性を潜在的に限定し得る。ポリメラーゼII(pCMVなど)またはポリメラーゼI(U1 snRNAプロモーターなど)を動員する他のプロモーターも、それらのより長いsgRNAの発現能について調べられている。しかしながら、これらのプロモーターは、典型的には、部分的に転写され、これによって、発現されたPEgRNA中スペーサーの5'に余分な配列がもたらされ、このことは部位依存的なやり方で著しく低減されたCas9:sgRNA活性をもたらすことが示されている。加えて、pol III転写のPEgRNAは、6~7つ伸びたUにおいて簡単に終止し得るのに対し、pol IIまたはpol Iから転写されたPEgRNAは、異なる終止シグナルを要するであろう。しばしば、かかるシグナルはまた、ポリアデニル化ももたらし、これによってPEgRNAの核からの望ましくない輸送がもたらされるであろう。同様に、pol IIプロモーター(pCMVなど)から発現されるRNAは、典型的には、5'にキャップされており、それらの核外輸送もまたもたらされる。 In one embodiment, PEgRNAs can be designed with pol III promoters to improve expression of longer PEgRNAs with larger extension arms. sgRNAs are typically expressed from the U6 snRNA promoter. This promoter recruits pol III to express the associated RNA and is useful for expressing short RNAs that are retained in the nucleus. However, pol III is not very processive and cannot express RNAs longer than a few hundred nucleotides in length at the levels required for efficient genome editing. In addition, pol III may stall or terminate at stretches of U's, potentially limiting the sequence diversity that can be inserted using PEgRNAs. Other promoters that recruit polymerase II (such as pCMV) or polymerase I (such as the U1 snRNA promoter) have also been investigated for their ability to express longer sgRNAs. However, these promoters are typically partially transcribed, which results in extra sequence 5' of the spacer in the expressed PEgRNA, which has been shown to result in significantly reduced Cas9:sgRNA activity in a site-dependent manner. In addition, pol III transcribed PEgRNAs can simply terminate at the 6-7 U stretch, whereas pol II or pol I transcribed PEgRNAs will require different termination signals. Often such signals will also result in polyadenylation, which will result in the undesired export of the PEgRNA from the nucleus. Similarly, RNAs expressed from pol II promoters (such as pCMV) are typically 5' capped, which will also result in their export from the nucleus.

これまでに、Rinnおよび共同研究者らは、長鎖非コーディングRNA(lncRNA)でタグ付けされたsgRNAの産生のための様々な発現プラットホームをスクリーニングした183。これらのプラットホームは、pCMVから発現され、ヒトのMALAT1 ncRNAからのENE要素184、KSHVからのPAN ENE要素185、またはU1 snRNAからの3'ボックス186において終止するRNAを包含する。注目すべきことに、MALAT1 ncRNAおよびPAN ENEは、ポリAテールを保護する三重ヘリックスを形成する184,187。これらの構築物はまた、RNA安定性をも増強し得る。これらの発現系はまた、より長いPEgRNAの発現も可能にさせるであろうことが企図される。 Previously, Rinn and coworkers screened various expression platforms for the production of sgRNAs tagged with long non-coding RNAs (lncRNAs). These platforms include RNAs expressed from pCMV and terminating in an ENE element from human MALAT1 ncRNA, a PAN ENE element from KSHV, or a 3 ' box from U1 snRNA. Notably , MALAT1 ncRNA and PAN ENE form a triple helix that protects the polyA tail. These constructs may also enhance RNA stability. It is contemplated that these expression systems will also allow the expression of longer PEGRNAs.

加えて、一連の方法は、PEgRNAの一部として転写されるであろうpol IIプロモーターの部分の切断のためにデザインされており、自己切断型リボザイム(ハンマーヘッド188、ピストル189、ハチェット189、ヘアピン190、VS191、ツイスター192、もしくはツイスターシスター192リボザイムなど)、または転写されたガイドを処理する他の自己切断型要素、またはCsy4によって認識されまたガイドのプロセシングへも繋がるヘアピン193のいずれかが付加されている。また、複数のENEモチーフの組み込みは、これまでKSHV PAN RNAおよび要素について実証されたとおり185、改善されたPEgRNA発現および安定性へ繋がり得ることも仮定される。PEgRNAを環状イントロンRNA(ciRNA)の形態に環化することはまた、増強されたRNAの発現および安定性、ならびに核局在化へも繋がり得ることもまた、予想される194 In addition, a series of methods have been designed for cleavage of the portion of the pol II promoter that will be transcribed as part of the PEgRNA, and either a self-cleaving ribozyme (such as the hammerhead188 , pistol189 , hatchet189 , hairpin190 , VS191 , twister192 , or twister sister192 ribozyme) or other self-cleaving elements that process the transcribed guide, or a hairpin193 that is recognized by Csy4 and also leads to processing of the guide. It is also hypothesized that the incorporation of multiple ENE motifs may lead to improved PEgRNA expression and stability, as previously demonstrated for KSHV PAN RNA and elements185 . It is also predicted that circularizing the PEgRNA into the form of a circular intronic RNA (ciRNA) may also lead to enhanced RNA expression and stability, as well as nuclear localization194.

様々な態様において、PEgRNAは、以下の配列によって例示されるとおり、上の様々な要素を包含していてもよい。 In various embodiments, the PEgRNA may include various elements above, as exemplified by the following sequences:

非限定例1-pCMV、Csy4ヘアピン、PEgRNA、およびMALAT1 ENEからなるPEgRNA発現プラットホーム
TAGTTATTAATAGTAATCAATTACGGGGTCATTAGTTCATAGCCCATATATGGAGTTCCGCGTTACATAACTTACGGTAAATGGCCCGCCTGGCTGACCGCCCAACGACCCCCGCCCATTGACGTCAATAATGACGTATGTTCCCATAGTAACGCCAATAGGGACTTTCCATTGACGTCAATGGGTGGAGTATTTACGGTAAACTGCCCACTTGGCAGTACATCAAGTGTATCATATGCCAAGTACGCCCCCTATTGACGTCAATGACGGTAAATGGCCCGCCTGGCATTATGCCCAGTACATGACCTTATGGGACTTTCCTACTTGGCAGTACATCTACGTATTAGTCATCGCTATTACCATGGTGATGCGGTTTTGGCAGTACATCAATGGGCGTGGATAGCGGTTTGACTCACGGGGATTTCCAAGTCTCCACCCCATTGACGTCAATGGGAGTTTGTTTTGGCACCAAAATCAACGGGACTTTCCAAAATGTCGTAACAACTCCGCCCCATTGACGCAAATGGGCGGTAGGCGTGTACGGTGGGAGGTCTATATAAGCAGAGCTGGTTTAGTGAACCGTCAGATCGTTCACTGCCGTATAGGCAGGGCCCAGACTGAGCACGTGAGTTTTAGAGCTAGAAATAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGGACCGAGTCGGTCCTCTGCCATCAAAGCGTGCTCAGTCTGTTTTAGGGTCATGAAGGTTTTTCTTTTCCTGAGAAAACAACACGTATTGTTTTCTCAGGTTTTGCTTTTTGGCCTTTTTCTAGCTTAAAAAAAAAAAAAGCAAAAGATGCTGGTGGTTGGCACTCCTGGTTTCCAGGACGGGGTTCAAATCCCTGCGGCGTCTTTGCTTTGACT(配列番号223)
Non-limiting example 1 - PEgRNA expression platform consisting of pCMV, Csy4 hairpin, PEgRNA, and MALAT1 ENE
(SEQ ID NO:223)

非限定例2-pCMV、Csy4ヘアピン、PEgRNA、およびPAN ENEからなるPEgRNA発現プラットホーム
TAGTTATTAATAGTAATCAATTACGGGGTCATTAGTTCATAGCCCATATATGGAGTTCCGCGTTACATAACTTACGGTAAATGGCCCGCCTGGCTGACCGCCCAACGACCCCCGCCCATTGACGTCAATAATGACGTATGTTCCCATAGTAACGCCAATAGGGACTTTCCATTGACGTCAATGGGTGGAGTATTTACGGTAAACTGCCCACTTGGCAGTACATCAAGTGTATCATATGCCAAGTACGCCCCCTATTGACGTCAATGACGGTAAATGGCCCGCCTGGCATTATGCCCAGTACATGACCTTATGGGACTTTCCTACTTGGCAGTACATCTACGTATTAGTCATCGCTATTACCATGGTGATGCGGTTTTGGCAGTACATCAATGGGCGTGGATAGCGGTTTGACTCACGGGGATTTCCAAGTCTCCACCCCATTGACGTCAATGGGAGTTTGTTTTGGCACCAAAATCAACGGGACTTTCCAAAATGTCGTAACAACTCCGCCCCATTGACGCAAATGGGCGGTAGGCGTGTACGGTGGGAGGTCTATATAAGCAGAGCTGGTTTAGTGAACCGTCAGATCGTTCACTGCCGTATAGGCAGGGCCCAGACTGAGCACGTGAGTTTTAGAGCTAGAAATAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGGACCGAGTCGGTCCTCTGCCATCAAAGCGTGCTCAGTCTGTTTTGTTTTGGCTGGGTTTTTCCTTGTTCGCACCGGACACCTCCAGTGACCAGACGGCAAGGTTTTTATCCCAGTGTATATTGGAAAAACATGTTATACTTTTGACAATTTAACGTGCCTAGAGCTCAAATTAAACTAATACCATAACGTAATGCAACTTACAACATAAATAAAGGTCAATGTTTAATCCATAAAAAAAAAAAAAAAAAAA(配列番号224)
Non-limiting example 2 - PEgRNA expression platform consisting of pCMV, Csy4 hairpin, PEgRNA, and PAN ENE
(SEQ ID NO:224)

非限定例3-pCMV、Csy4ヘアピン、PEgRNA、および3×PAN ENEからなるPEgRNA発現プラットホーム
TAGTTATTAATAGTAATCAATTACGGGGTCATTAGTTCATAGCCCATATATGGAGTTCCGCGTTACATAACTTACGGTAAATGGCCCGCCTGGCTGACCGCCCAACGACCCCCGCCCATTGACGTCAATAATGACGTATGTTCCCATAGTAACGCCAATAGGGACTTTCCATTGACGTCAATGGGTGGAGTATTTACGGTAAACTGCCCACTTGGCAGTACATCAAGTGTATCATATGCCAAGTACGCCCCCTATTGACGTCAATGACGGTAAATGGCCCGCCTGGCATTATGCCCAGTACATGACCTTATGGGACTTTCCTACTTGGCAGTACATCTACGTATTAGTCATCGCTATTACCATGGTGATGCGGTTTTGGCAGTACATCAATGGGCGTGGATAGCGGTTTGACTCACGGGGATTTCCAAGTCTCCACCCCATTGACGTCAATGGGAGTTTGTTTTGGCACCAAAATCAACGGGACTTTCCAAAATGTCGTAACAACTCCGCCCCATTGACGCAAATGGGCGGTAGGCGTGTACGGTGGGAGGTCTATATAAGCAGAGCTGGTTTAGTGAACCGTCAGATCGTTCACTGCCGTATAGGCAGGGCCCAGACTGAGCACGTGAGTTTTAGAGCTAGAAATAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGGACCGAGTCGGTCCTCTGCCATCAAAGCGTGCTCAGTCTGTTTTGTTTTGGCTGGGTTTTTCCTTGTTCGCACCGGACACCTCCAGTGACCAGACGGCAAGGTTTTTATCCCAGTGTATATTGGAAAAACATGTTATACTTTTGACAATTTAACGTGCCTAGAGCTCAAATTAAACTAATACCATAACGTAATGCAACTTACAACATAAATAAAGGTCAATGTTTAATCCATAAAAAAAAAAAAAAAAAAAACACACTGTTTTGGCTGGGTTTTTCCTTGTTCGCACCGGACACCTCCAGTGACCAGACGGCAAGGTTTTTATCCCAGTGTATATTGGAAAAACATGTTATACTTTTGACAATTTAACGTGCCTAGAGCTCAAATTAAACTAATACCATAACGTAATGCAACTTACAACATAAATAAAGGTCAATGTTTAATCCATAAAAAAAAAAAAAAAAAAATCTCTCTGTTTTGGCTGGGTTTTTCCTTGTTCGCACCGGACACCTCCAGTGACCAGACGGCAAGGTTTTTATCCCAGTGTATATTGGAAAAACATGTTATACTTTTGACAATTTAACGTGCCTAGAGCTCAAATTAAACTAATACCATAACGTAATGCAACTTACAACATAAATAAAGGTCAATGTTTAATCCATAAAAAAAAAAAAAAAAAAA(配列番号225)
Non-limiting example 3 - PEgRNA expression platform consisting of pCMV, Csy4 hairpin, PEgRNA, and 3xPAN ENE
(SEQ ID NO:225)

非限定例4-pCMV、Csy4ヘアピン、PEgRNA、および3'ボックスからなるPEgRNA発現プラットホーム
TAGTTATTAATAGTAATCAATTACGGGGTCATTAGTTCATAGCCCATATATGGAGTTCCGCGTTACATAACTTACGGTAAATGGCCCGCCTGGCTGACCGCCCAACGACCCCCGCCCATTGACGTCAATAATGACGTATGTTCCCATAGTAACGCCAATAGGGACTTTCCATTGACGTCAATGGGTGGAGTATTTACGGTAAACTGCCCACTTGGCAGTACATCAAGTGTATCATATGCCAAGTACGCCCCCTATTGACGTCAATGACGGTAAATGGCCCGCCTGGCATTATGCCCAGTACATGACCTTATGGGACTTTCCTACTTGGCAGTACATCTACGTATTAGTCATCGCTATTACCATGGTGATGCGGTTTTGGCAGTACATCAATGGGCGTGGATAGCGGTTTGACTCACGGGGATTTCCAAGTCTCCACCCCATTGACGTCAATGGGAGTTTGTTTTGGCACCAAAATCAACGGGACTTTCCAAAATGTCGTAACAACTCCGCCCCATTGACGCAAATGGGCGGTAGGCGTGTACGGTGGGAGGTCTATATAAGCAGAGCTGGTTTAGTGAACCGTCAGATCGTTCACTGCCGTATAGGCAGGGCCCAGACTGAGCACGTGAGTTTTAGAGCTAGAAATAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGGACCGAGTCGGTCCTCTGCCATCAAAGCGTGCTCAGTCTGTTTGTTTCAAAAGTAGACTGTACGCTAAGGGTCATATCTTTTTTTGTTTGGTTTGTGTCTTGGTTGGCGTCTTAAA(配列番号226)
Non-limiting Example 4 - PEgRNA Expression Platform Consisting of pCMV, Csy4 Hairpin, PEgRNA, and 3' Box
(SEQ ID NO:226)

非限定例5-pU1、Csy4ヘアピン、PEgRNA、および3'ボックスからなるPEgRNA発現プラットホーム
CTAAGGACCAGCTTCTTTGGGAGAGAACAGACGCAGGGGCGGGAGGGAAAAAGGGAGAGGCAGACGTCACTTCCCCTTGGCGGCTCTGGCAGCAGATTGGTCGGTTGAGTGGCAGAAAGGCAGACGGGGACTGGGCAAGGCACTGTCGGTGACATCACGGACAGGGCGACTTCTATGTAGATGAGGCAGCGCAGAGGCTGCTGCTTCGCCACTTGCTGCTTCACCACGAAGGAGTTCCCGTGCCCTGGGAGCGGGTTCAGGACCGCTGATCGGAAGTGAGAATCCCAGCTGTGTGTCAGGGCTGGAAAGGGCTCGGGAGTGCGCGGGGCAAGTGACCGTGTGTGTAAAGAGTGAGGCGTATGAGGCTGTGTCGGGGCAGAGGCCCAAGATCTCAGTTCACTGCCGTATAGGCAGGGCCCAGACTGAGCACGTGAGTTTTAGAGCTAGAAATAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGGACCGAGTCGGTCCTCTGCCATCAAAGCGTGCTCAGTCTGTTTCAGCAAGTTCAGAGAAATCTGAACTTGCTGGATTTTTGGAGCAGGGAGATGGAATAGGAGCTTGCTCCGTCCACTCCACGCATCGACCTGGTATTGCAGTACCTCCAGGAACGGTGCACCCACTTTCTGGAGTTTCAAAAGTAGACTGTACGCTAAGGGTCATATCTTTTTTTGTTTGGTTTGTGTCTTGGTTGGCGTCTTAAA(配列番号227).
Non-limiting Example 5 - PEgRNA Expression Platform Consisting of pU1, Csy4 Hairpin, PEgRNA, and 3' Box
(SEQ ID NO:227).

様々な他の態様において、PEgRNAは、改善点を骨格またはコア配列へ導入することによって改善されてもよい。これは、知られているものを導入することによってなされ得る。 In various other embodiments, the PEGRNA may be improved by introducing improvements into the backbone or core sequence. This may be done by introducing known improvements.

コア、Cas9結合PEgRNA骨格はおそらく、PE活性を増強するのにも改善され得る。数種のかかるアプローチは既に実証されている。実例として、骨格の第1の対形成要素(P1)は、GTTTT-AAAAC(配列番号3939)対形成要素を含有する。かかるT(複数)の伸びは、RNA転写産物のpol III休止(pausing)および未成熟終止をもたらすことが示されている。このP1の部分におけるT-A対の1つの、G-C対への合理的な突然変異は、sgRNA活性を増強するのが示されたが、このアプローチもまたPEgRNAに対して実現可能であろうことを示唆する195。加えて、P1の長さを増大することはまた、sgRNAの折り畳みを増強して改善された活性へ繋がることも示されたが195、これはPEgRNA活性の改善のための別の道として示唆される。コアへの改善点の例は以下を包含し得る: The core, Cas9-bound PEgRNA backbone could conceivably also be improved to enhance PE activity. Several such approaches have already been demonstrated. As an illustration, the first pairing element (P1) of the backbone contains a GTTTT-AAAAC (SEQ ID NO: 3939) pairing element. Such a stretch of T's has been shown to result in pol III pausing and premature termination of the RNA transcript. Rational mutation of one of the TA pairs in this portion of P1 to a GC pair has been shown to enhance sgRNA activity, suggesting that this approach may also be feasible for PEgRNA195 . In addition, increasing the length of P1 has also been shown to enhance sgRNA folding leading to improved activity195 , suggesting this as another avenue for improving PEgRNA activity. Examples of improvements to the core may include:

P1まで6nt伸長を含有するPEgRNA
GGCCCAGACTGAGCACGTGAGTTTTAGAGCTAGCTCATGAAAATGAGCTAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGGACCGAGTCGGTCCTCTGCCATCAAAGCGTGCTCAGTCTGTTTTTTT(配列番号228)
PEgRNA containing a 6 nt extension to P1
GGCCCAGACTGAGCACGTGAGTTTTAGAGCTAGCTCATGAAAATGAGCTAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGGACCGAGTCGGTCCTCTGCCATCAAAGCGTGCTCAGTCTGTTTTTTT (SEQ ID NO: 228)

P1内にT-A→G-C突然変異を含有するPEgRNA
GGCCCAGACTGAGCACGTGAGTTTGAGAGCTAGAAATAGCAAGTTTAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGGACCGAGTCGGTCCTCTGCCATCAAAGCGTGCTCAGTCTGTTTTTTT(配列番号229)
PEgRNA containing a TA→GC mutation in P1
GGCCCAGACTGAGCACGTGAGTTTGAGAGCTAGAAATAGCAAGTTTAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGGACCGAGTCGGTCCTCTGCCATCAAAGCGTGCTCAGTCTGTTTTTTT (SEQ ID NO: 229)

様々な他の態様において、PEgRNAは、修飾を編集鋳型領域へ導入することによって改善されてもよい。PEgRNAによって鋳型にされた(templated)挿入のサイズが増大するにつれて、エンドヌクレアーゼによって分解されるか、自発的加水分解を経るか、または折り畳まれることで2次構造(RTによって逆転写され得ないか、もしくはPEgRNA骨格の折り畳みおよびこれに続くCas9-RT結合を妨害する)になるか、になる可能性が高い。結果的に、PEgRNAの鋳型への修飾が、遺伝子全体の挿入などの大きな挿入に影響を及ぼす必要もあり得る。そうするためのいくつかのストラテジーは、合成または半合成PEgRNA内の修飾ヌクレオチドの組み込み(RNAを、分解もしくは加水分解に対してより耐性があるようにさせるか、または阻害性の2次構造を採用する可能性を低くさせる)を包含する196。かかる修飾は、Gリッチ配列中のRNA2次構造を低減するであろう、8-アザ-7-デアザグアノシン;分解を低減してある種のRNA2次構造を増強する、ロックド核酸(LNA);RNA安定性を増強する、2'-O-メチル修飾、2'-フルオロ修飾、または2'-O-メトキシエトキシ修飾を包含し得る。かかる修飾はまた、安定性および活性を増強するために、PEgRNA中の他のどこかにも包含され得る。代わりに、または加えて、PEgRNAの鋳型は、所望のタンパク質産物をコードするのとともに、RTによって折り畳まれ得ない単純な2次構造を採用する可能性もまた高くなるように、デザインされ得る。かかる単純な構造は、熱力学的な流し台(sink)として作用するであろうが、これによって逆転写を防止するであろうより複雑な構造が生じる可能性が低くなる。最終的に、鋳型を分裂させて2つ別々のPEgRNAにすることもまたあり得ることである。かかるデザインにおいて、PEは、Cas9と融合したRNA結合タンパク質またはPEgRNA自身上のRNA認識要素(MS2アプタマーなど)を介して、転写を開始すること、また別々の鋳型RNAを標的にされた部位へ動員することにも使用されるであろう。RTは、この別々の鋳型RNAへ直接結合するか、または第2鋳型と入れ替える(swapping to)前に元のPEgRNA上で逆転写を開始するか、のいずれかであり得る。かかるアプローチは、長い鋳型を付加した際にPEgRNAの誤った折り畳みを予防することのみならず、長い挿入を生じさせるのにゲノムからのCas9の解離(おそらくPEベースの長い挿入を阻害している可能性がある)を要さないことによってもまた、長い挿入を可能にさせ得る。 In various other embodiments, PEgRNA may be improved by introducing modifications into the editing template region. As the size of the PEgRNA templated insertion increases, it is more likely to be degraded by endonucleases, undergo spontaneous hydrolysis, or fold into secondary structures that cannot be reverse transcribed by RT or that interfere with the folding of the PEgRNA backbone and subsequent Cas9-RT binding. As a result, modifications to the PEgRNA template may also be required to affect large insertions, such as the insertion of entire genes. Some strategies to do so include the incorporation of modified nucleotides in synthetic or semi-synthetic PEgRNA, which make the RNA more resistant to degradation or hydrolysis, or less likely to adopt inhibitory secondary structures.196 Such modifications may include 8-aza-7-deazaguanosine, which will reduce RNA secondary structures in G-rich sequences; locked nucleic acids (LNA), which reduce degradation and enhance certain RNA secondary structures; 2'-O-methyl, 2'-fluoro, or 2'-O-methoxyethoxy modifications, which enhance RNA stability. Such modifications may also be included elsewhere in the PEgRNA to enhance stability and activity. Alternatively, or in addition, the template of the PEgRNA may be designed to encode the desired protein product while also being more likely to adopt a simple secondary structure that cannot be folded by RT. Such a simple structure would act as a thermodynamic sink, which would reduce the likelihood of more complex structures arising that would prevent reverse transcription. Finally, the template may also be split into two separate PEgRNAs. In such a design, PE would be used to initiate transcription and also recruit a separate template RNA to the targeted site, either through an RNA-binding protein fused to Cas9 or an RNA recognition element on the PEgRNA itself (such as the MS2 aptamer). RT could either directly bind to this separate template RNA or initiate reverse transcription on the original PEgRNA before swapping to the second template. Such an approach could allow for long insertions, not only by preventing misfolding of the PEgRNA upon addition of a long template, but also by not requiring dissociation of Cas9 from the genome to generate long insertions (which may potentially inhibit PE-based long insertions).

更なる他の態様において、PEgRNAは、PEgRNAの5'およびは3'末端にて、それらの間の位置(例として、gRNAコア領域中もしくはスペーサー中)にてさえも、追加のRNAモチーフを導入することによって改善されることもある。数種のかかるモチーフ-KSHVからのPAN ENEおよびMALAT1からのENEなどを、非pol IIIプロモーターからのより長いPEgRNAの発現を終止させ得る手段として、上に考察した。これらの要素は、ポリAテールを飲み込むRNA三重ヘリックスを形成し、それらの核内への保持をもたらす184,187。しかしながら、末端ヌクレオチドを塞ぐ複合体構造をPEgRNAの3'末端にて形成することによって、これらの構造はまた、PEgRNAのエキソヌクレアーゼ媒介分解を予防するのにも役立つ可能性があろう。 In yet other embodiments, the PEgRNA may be improved by introducing additional RNA motifs at the 5' and 3' ends of the PEgRNA, or even at positions between them (e.g., in the gRNA core region or in the spacer). Several such motifs--such as the PAN ENE from KSHV and the ENE from MALAT1--were discussed above as possible means of terminating the expression of longer PEgRNAs from non-pol III promoters. These elements form RNA triple helices that engulf the polyA tails, resulting in their retention in the nucleus. 184,187 However, by forming complex structures at the 3' end of the PEgRNA that occlude the terminal nucleotides, these structures may also help prevent exonuclease-mediated degradation of the PEgRNA.

3'末端にて挿入された他の構造要素もまた、非pol IIIプロモーターからの終止を可能にさせることはせずとも、RNA安定性を増強し得る。かかるモチーフは、3'末端を塞ぐであろうヘアピンもしくはRNA四重鎖197、または3'末端にて2'-3'-環状ホスファートの形成をもたらし、また潜在的にPEgRNAをエキソヌクレアーゼによって分解される可能性を低くもさせるHDVなどの自己切断型リボザイム198を包含し得る。不完全なスプライシングを介してPEgRNAを環化するのに誘導する-ciRNAを形成する-ことはまた、PEgRNA安定性を増大させてPEgRNAが核内に保持されることももたらし得る194 Other structural elements inserted at the 3' end may also enhance RNA stability without allowing termination from non-pol III promoters. Such motifs could include hairpins or RNA quadruplexes that would occlude the 3' end, 197 or self-cleaving ribozymes such as HDV that result in the formation of a 2'-3'-cyclic phosphate at the 3' end, potentially also making the PEgRNA less susceptible to exonuclease degradation.198 Inducing the PEgRNA to circularize through incomplete splicing - forming ciRNA - could also increase PEgRNA stability and result in the PEgRNA being retained in the nucleus.194

追加のRNAモチーフはまた、RT処理能力をも改善し得るか、またはDNA-RNA二重鎖へのRTの結合を増強することによってPEgRNA活性をも増強し得る。RTによって結合されるネイティブ配列の、その同族のレトロウイルスゲノム中での付加は、RT活性を増強し得る199。これは、レトロウイルスゲノム二量体化および転写開始に関与する、ネイティブプライマー結合部位(PBS)、ポリプリントラクト(PPT)、またはキッシングループを包含し得る199 Additional RNA motifs may also improve RT processivity or enhance PEgRNA activity by enhancing RT binding to the DNA-RNA duplex. The addition of native sequences bound by RT in its cognate retroviral genome can enhance RT activity. This may include native primer binding sites (PBSs), polypurine tracts ( PPTs ), or kissing loops, which are involved in retroviral genome dimerization and transcription initiation.

二量体化チーフ-キッシングループまたはGNRAテトラループ/テトラループ受容体対200など-の、PEgRNAの5'末端および3'末端での付加はまた、PEgRNAの有効な環状化をももたらし得、安定性が改善される。加えて、これらモチーフの付加は、PEgRNAスペーサーとプライマーとの物理的な分離、PE活性の妨げになるであろうスペーサー閉塞への予防を可能にさせ得ることが想像される。スペーサー領域中もしくはプライマー結合部位に沿って小さいトウホールド(toehold)ヘアピンを形成する、PEgRNAへの短い5'伸長もしくは3'伸長はまた、好ましくは、PEgRNAの長さに沿って分子内相補領域のアニーリング(例として、スペーサーとプライマー結合部位との間に生じ得る相互作用)に対しても競合し得る。最終的に、キッシングループはまた、他の鋳型RNAをゲノム部位へ動員するのにも、あるRNAから他のRNAへのRT活性の入れ替えを可能にさせるのにも、使用され得る。様々な2次構造の例示の態様として、図3Dおよび図3Eに描かれるPEgRNAは、示されるとおり伸長アームの末端部分(すなわち、e1およびe2)にあるものを包含する、数多の2次RNA構造(改変されることで、PEgRNAのいずれの領域にもなり得る)を列挙する。 The addition of dimerization chiefs - such as kissing loops or GNRA tetraloop/tetraloop acceptor pair 200 - at the 5' and 3' ends of the PEgRNA may also result in efficient circularization of the PEgRNA, improving stability. In addition, it is envisioned that the addition of these motifs may allow for physical separation of the PEgRNA spacer and primer, preventing spacer blockage that would otherwise interfere with PE activity. Short 5' or 3' extensions to the PEgRNA that form small toehold hairpins in the spacer region or along the primer binding site may also preferably compete for annealing of intramolecular complementary regions along the length of the PEgRNA (e.g., interactions that may occur between the spacer and primer binding sites). Finally, kissing loops may also be used to recruit other template RNAs to genomic sites and to allow for the switching of RT activity from one RNA to another. As exemplary embodiments of various secondary structures, the PEgRNA depicted in Figures 3D and 3E lists a number of secondary RNA structures (which, upon modification, can be any region of the PEgRNA), including those at the terminal portions of the extended arms (i.e., e1 and e2) as shown.

改善例は、これらに限定されないが、以下を包含する: Examples of improvements include, but are not limited to:

PEgRNA-HDV融合体
GGCCCAGACTGAGCACGTGAGTTTTAGAGCTAGAAATAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGGACCGAGTCGGTCCTCTGCCATCAAAGCGTGCTCAGTCTGGGCCGGCATGGTCCCAGCCTCCTCGCTGGCGCCGGCTGGGCAACATGCTTCGGCATGGCGAATGGGACTTTTTTT(配列番号230)
PEGRNA-HDV fusions
GGCCCAGACTGAGCACGTGAGTTTTAGAGCTAGAAATAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGGACCGAGTCGGTCCTCTGCCATCAAAGCGTGCTCAGTCTGGGCCGGCATGGTCCCAGCCTCCTCGCTGGCGCCGGCTGGGCAACATGCTTCGGCATGGCGAATGGGACTTTTTTT (SEQ ID NO: 230)

PEgRNA-MMLVキッシングループ
GGTGGGAGACGTCCCACCGGCCCAGACTGAGCACGTGAGTTTTAGAGCTAGAAATAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGGACCGAGTCGGTCCTCTGCCATCAAAGCTTCGACCGTGCTCAGTCTGGTGGGAGACGTCCCACCTTTTTTT(配列番号231)
PEgRNA-MMLV kissing loop
GGTGGGAGACGTCCCACCGGCCCAGACTGAGCACGTGAGTTTTAGAGCTAGAAATAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGGACCGAGTCGGTCCTCTGCCATCAAAGCTTCGACCGTGCTCAGTCTGGTGGGAGACGTCCCACCTTTTTTTT (SEQ ID NO: 231)

PEgRNA-VSリボザイムキッシングループ
GAGCAGCATGGCGTCGCTGCTCACGGCCCAGACTGAGCACGTGAGTTTTAGAGCTAGAAATAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGGACCGAGTCGGTCCTCTGCCATCAAAGCTTCGACCGTGCTCAGTCTCCATCAGTTGACACCCTGAGGTTTTTTT(配列番号232)
PEgRNA-VS ribozyme kissing loop
GAGCAGCATGGCGTCGCTGCTCACGGCCCAGACTGAGCACGTGAGTTTTAGAGCTAGAAATAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGGACCGAGTCGGTCCTCTGCCATCAAAGCTTCGACCGTGCTCAGTCTCCATCAGTTGACACCCTGAGGTTTTTTT (SEQ ID NO: 232)

PEgRNA-GNRAテトラループ/テトラループ受容体
GCAGACCTAAGTGGUGACATATGGTCTGGGCCCAGACTGAGCACGTGAGTTTTAGAGCTAUACGTAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTUACGAAGTGGGACCGAGTCGGTCCTCTGCCATCAAAGCTTCGACCGTGCTCAGTCTGCATGCGATTAGAAATAATCGCATGTTTTTTT(配列番号233)
PEgRNA-GNRA tetraloop/tetraloop receptor
GCAGACCTAAGTGGUGACATATGGTCTGGGCCCAGACTGAGCACGTGAGTTTTAGAGCTAUACGTAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTUACGAAGTGGGACCGAGTCGGTCCTCTGCCATCAAAGCTTCGACCGTGCTCAGTCTGCATGCGATTAGAAATAATCGCATGTTTTTTT (SEQ ID NO: 233)

2次RNA-HDV融合体を切り替える(switching)PEgRNA鋳型
TCTGCCATCAAAGCTGCGACCGTGCTCAGTCTGGTGGGAGACGTCCCACCGGCCGGCATGGTCCCAGCCTCCTCGCTGGCGCCGGCTGGGCAACATGCTTCGGCATGGCGAATGGGACTTTTTTT(配列番号234)
PEgRNA template switching the secondary RNA-HDV fusion
TCTGCCATCAAAGCTGCGACCGTGCTCAGTCTGGTGGGAGACGTCCCACCGGCCGGCATGGTCCCAGCCTCCTCGCTGGCGCCGGCTGGGCAACATGCTTCGGCATGGCGAATGGGACTTTTTTT (SEQ ID NO: 234)

PEgRNA骨格は、SpCas9およびプライム編集因子(PE)の改善のされ方に類似した様式で、指向進化を介してさらに改善され得る。指向進化は、Cas9または進化したCas9バリアントによるPEgRNA認識を増強し得る。加えて、種々のPEgRNA骨格配列はおそらく、種々のゲノム遺伝子座にて最適であって、問題になっている部位にてPE活性を増強するか、オフターゲット活性を低減するか、またはその両方のいずれかであろう。最終的に、他のRNAモチーフが付加されたPEgRNA骨格の進化は、未進化の融合RNAと比べて、融合されたPEgRNAの活性をほぼ必ず改善するであろう。実例として、c-ジ-GMP-Iアプタマーおよびハンマーヘッド型リボザイムから構成されるアロステリックリボザイムの進化は、劇的に改善された活性へ繋がったが202、これは進化がハンマーヘッド-PEgRNA融合体の活性も改善するであろうことを示唆する。加えて、Cas9は現行では一般的にsgRNAの5'伸長を忍容しないが、指向性進化は、蓋然的には、この非忍容性を和らげる有能な変異を生成し、追加のRNAモチーフが利用されることを許すであろう。 The PEgRNA backbone can be further improved through directed evolution in a manner similar to how SpCas9 and prime editors (PEs) have been improved. Directed evolution can enhance PEgRNA recognition by Cas9 or evolved Cas9 variants. In addition, different PEgRNA backbone sequences will likely be optimal at different genomic loci, either enhancing PE activity at the site in question, reducing off-target activity, or both. Finally, evolution of PEgRNA backbones with additional RNA motifs will almost always improve the activity of the fused PEgRNA compared to the unevolved fusion RNA. As an illustration, evolution of an allosteric ribozyme composed of a c-di-GMP-I aptamer and a hammerhead ribozyme led to dramatically improved activity, 202 suggesting that evolution will also improve the activity of hammerhead-PEgRNA fusions. In addition, although Cas9 currently does not generally tolerate 5' extensions of sgRNAs, directed evolution will likely generate potent mutations that alleviate this intolerance, allowing additional RNA motifs to be exploited.

本開示は、ここで開示されるプライム編集システムの効力をさらに改善するためのいずれかのかかるやり方を企図する。 The present disclosure contemplates any such manner to further improve the efficacy of the prime editing system disclosed herein.

連続した一連のTはPEgRNAが転写される容量を限定し得るので、種々の態様においては、伸長アームからのTの連続した配列の出現を限定することが有利であり得る。例えば、少なくとも3つの連続したT、少なくとも4つの連続したT、少なくとも5つの連続したT、少なくとも6つの連続したT、少なくとも7つの連続したT、少なくとも8つの連続したT、少なくとも9つの連続したT、少なくとも10の連続したT、少なくとも11の連続したT、少なくとも12の連続したT、少なくとも13の連続したT、少なくとも14の連続したT、または少なくとも15の連続したTのストリングは、PEgRNAをデザインするときに回避されるべきであるか、または少なくとも最終的なデザインされた配列からは除去されるべきである。1つの態様では、連続したA:T核酸塩基対がリッチである標的部位を回避する以外に、PEgRNA伸長アーム上の連続したTの欲されないストリングの包含を回避し得る。 Since a series of consecutive T's can limit the capacity of the PEgRNA to be transcribed, in various embodiments it may be advantageous to limit the appearance of consecutive sequences of T's from the extension arm. For example, strings of at least 3 consecutive T's, at least 4 consecutive T's, at least 5 consecutive T's, at least 6 consecutive T's, at least 7 consecutive T's, at least 8 consecutive T's, at least 9 consecutive T's, at least 10 consecutive T's, at least 11 consecutive T's, at least 12 consecutive T's, at least 13 consecutive T's, at least 14 consecutive T's, or at least 15 consecutive T's should be avoided when designing the PEgRNA, or at least removed from the final designed sequence. In one embodiment, in addition to avoiding target sites that are rich in consecutive A:T nucleobase pairs, the inclusion of unwanted strings of consecutive T's on the PEgRNA extension arm may be avoided.

トランスプライム編集のための分裂PEgRNAデザイン
本開示はトランスプライム編集をもまた企図する。これは、PEgRNAを2つの別物の分子:ガイドRNAおよびtPERT分子へと分離することによって作動するプライム編集の改変されたバージョンを言う。tPERT分子は、標的DNA部位においてプライム編集因子複合体と共局在するようにプログラムされ、プライマー結合部位およびDNA合成鋳型をプライム編集因子にトランスで持って来る。例えば、トランスプライム編集因子(tPE)の態様については図3Gを見よ。これは、(1)動員タンパク質(RP)-PE:gRNA複合体と(2)RNA-タンパク質動員ドメイン(例えば、ステムループまたはヘアピン)に連結されたプライマー結合部位およびDNA合成鋳型を包含するtPERTとを含む2構成要素システムを示す。RP-PE:gRNA複合体の動員タンパク質構成要素は編集されるべき標的部位へとtPERTを動員し、それによって、PBSおよびDNA合成鋳型をプライム編集因子とトランスで会合させる。別の言い方をすると、tPERTは、プライマー結合部位およびDNA合成鋳型を包含するPEgRNAの伸長アーム(の全てまたは一部)を含有するように操作される。このアプローチの1つの利点はPEgRNAの伸長アームをガイドRNAから分離することであり、それによって、伸長アームのPBSとガイドRNAのスペーサー配列との間に生起する傾向があるアニーリング相互作用を最小化する。
Split-PEgRNA Design for Trans-Prime Editing The present disclosure also contemplates trans-prime editing, which refers to a modified version of prime editing that operates by splitting PEgRNA into two separate molecules: guide RNA and tPERT molecules. The tPERT molecule is programmed to co-localize with the prime editor complex at the target DNA site, bringing the primer binding site and DNA synthesis template to the prime editor in trans. For example, see FIG. 3G for an embodiment of a trans-prime editor (tPE). This shows a two-component system that includes (1) a recruitment protein (RP)-PE:gRNA complex and (2) tPERT, which contains a primer binding site and a DNA synthesis template linked to an RNA-protein recruitment domain (e.g., stem-loop or hairpin). The recruitment protein component of the RP-PE:gRNA complex recruits tPERT to the target site to be edited, thereby associating the PBS and DNA synthesis template with the prime editor in trans. In other words, tPERT is engineered to contain (all or part of) the extension arm of PEgRNA, which contains the primer binding site and the DNA synthesis template. One advantage of this approach is that it separates the extension arm of PEgRNA from the guide RNA, thereby minimizing the annealing interaction that tends to occur between the PBS of the extension arm and the spacer sequence of the guide RNA.

トランスプライム編集の鍵の特色は、トランスプライム編集因子がtPERTをDNA編集の部位へと動員する能力であり、それによってプライム編集の部位においてPEgRNAの機能の全てを有効に共局在させる。動員は、MS2アプタマーなどのRNA-タンパク質動員ドメインをtPERTに組み入れることと、対応する動員タンパク質をRNA-タンパク質動員ドメインに特異的に結合することができるプライム編集因子に(例えば、リンカーを介してnapDNAbpに、またはリンカーリンカーを介してポリメラーゼに)融合することとによって達成され得、それによってtPERT分子をプライム編集因子複合体へと動員する。図3Hに記載されているプロセスに図示されているとおり、RP-PE:gRNA複合体は標的DNA配列に結合およびニッキングする。それから、動員タンパク質(RP)は、DNA標的部位に結合したプライム編集因子複合体に共局在するようにtPERTを動員し、それによって、tPERT上に位置付けられたプライマー結合部位がニッキングされた鎖上のプライマー配列に結合することを許し、爾後に、ポリメラーゼ(例えばRT)がtPERTの5'端からtPERT上に位置付けられたDNA合成鋳型に対してDNAの一本鎖を合成することを許す。 A key feature of trans-prime editing is the ability of the trans-prime editor to recruit tPERT to the site of DNA editing, thereby effectively co-localizing all of the functions of the PEgRNA at the site of prime editing. Recruitment can be achieved by incorporating an RNA-protein recruitment domain, such as the MS2 aptamer, into tPERT and fusing the corresponding recruitment protein to a prime editor that can specifically bind to the RNA-protein recruitment domain (e.g., to napDNAbp via a linker, or to the polymerase via a linker linker), thereby recruiting the tPERT molecule to the prime editor complex. As illustrated in the process described in Figure 3H, the RP-PE:gRNA complex binds and nicks the target DNA sequence. The recruitment protein (RP) then recruits tPERT to co-localize with the prime editor complex bound to the DNA target site, thereby allowing the primer binding site located on tPERT to bind to the primer sequence on the nicked strand, and subsequently allowing a polymerase (e.g., RT) to synthesize a single strand of DNA from the 5' end of tPERT to the DNA synthesis template located on tPERT.

tPERTは図3Gおよび図3HにおいてはPBSおよびDNA合成鋳型をRNA-タンパク質動員ドメインの5'端に含むとして示されているが、他の構成のtPERTは、RNA-タンパク質動員ドメインの3'端に位置付けられたPBSおよびDNA合成鋳型を有してデザインされ得る。しかしながら、5’伸長を有するtPERTは、DNAの一本鎖の合成が天然にはtPERTの5'端において終結するであろうという利点を有し、それゆえに、プライム編集のDNA合成ステージの間の鋳型としてRNA-タンパク質動員ドメインのいずれかの部分を用いるリスクがない。 Although tPERT is shown in Figures 3G and 3H as containing a PBS and a DNA synthesis template at the 5' end of the RNA-protein recruitment domain, other configurations of tPERT can be designed with the PBS and DNA synthesis template located at the 3' end of the RNA-protein recruitment domain. However, tPERT with a 5' extension has the advantage that synthesis of a single strand of DNA will naturally terminate at the 5' end of tPERT, and therefore there is no risk of using any part of the RNA-protein recruitment domain as a template during the DNA synthesis stage of prime editing.

PEgRNAデザイン方法
本開示はPEgRNAをデザインするための方法にもまた関する。
Methods for Designing PEgRNAs The present disclosure also relates to methods for designing PEgRNAs.

デザインの一側面において、デザインアプローチは、プライム編集が用いられようとする具体的な適用を考慮に入れ得る。例えば、本願において例示され論じられるとおり、プライム編集は、限定なしに、(a)変異を修正する変化をヌクレオチド配列に組み入れ、(b)タンパク質およびRNAタグを組み入れ、(c)免疫エピトープを目当てのタンパク質に組み入れ、(d)誘導可能な二量体化ドメインをタンパク質に組み入れ、(e)バイオ分子のその活性を変改するために配列を組み入れまたは除去、(f)特定の遺伝子変化を導くためにリコンビナーゼ標的部位を組み入れ、および(g)エラーを起こしやすいRTを用いることによる標的配列の変異導入をするために用いられ得る。目当ての標的部位におけるヌクレオチド配列を一般的に挿入、変化、または欠失させるこれらの方法に加えて、プライム編集因子は、高度にプログラム可能なライブラリを構築するために、ならびに細胞データ記録および系統トレース研究を行うためにもまた用いられ得る。これらの種々の使用では、本明細書に記載のとおり、これらの適用のいずれかの所与のものにとって特に有用であるPEgRNAの調製に当てはまる具体的なデザイン側面があり得る。 In one aspect of the design, the design approach may take into account the specific application for which prime editing is to be used. For example, as exemplified and discussed herein, prime editing may be used, without limitation, to (a) incorporate mutation-correcting changes into a nucleotide sequence, (b) incorporate protein and RNA tags, (c) incorporate immune epitopes into a protein of interest, (d) incorporate inducible dimerization domains into a protein, (e) incorporate or remove sequences in a biomolecule to alter its activity, (f) incorporate recombinase target sites to direct specific genetic changes, and (g) mutate a target sequence by using error-prone RT. In addition to these methods of generally inserting, altering, or deleting nucleotide sequences at a target site of interest, prime editors may also be used to construct highly programmable libraries, as well as to perform cellular data recording and lineage tracing studies. In these various uses, there may be specific design aspects that apply to the preparation of PEgRNAs that are particularly useful for any given of these applications, as described herein.

プライム編集のいずれかの具体的な適用または使用のためのPEgRNAをデザインするときには、いくつもの考慮事項が考慮に入れられ得る。これらは:
(a)1つ以上の核酸塩基改変がプライム編集因子によって組み入れされることを望まれる標的配列、すなわちヌクレオチド配列;
(b)標的配列上のカットされる部位の位置付け、すなわち、プライム編集因子が一本鎖ニックを誘導して、ニックの1つの側に3'端RTプライマー配列およびニックの他の側に5'端の内生フラップ(これは究極的にはFEN1またはその等価物によって除去され、3'ssDNAフラップによって置き換えられる)を生出するであろう特定の核酸塩基位置。カットされる部位は「編集の位置付け」に類縁である。なぜなら、これは3'端RTプライマー配列を生出し、これはRNA依存的なDNA重合の間にRTによって伸長されるようになって、所望の編集を含有する3'ssDNAフラップを生出し、これがそれから標的配列上の5'内生DNAフラップを置き換えるからである;
(c)利用可能なPAM配列(標準的なSpCas9 PAM部位、および拡張されたまたは異なるPAM特異性を有するCas9バリアントおよび等価物によって認識される非標準的なPAM部位を包含する);
(d)標的配列上の利用可能なPAM配列とカットされる部位の位置付けとの間の間隔;
(e)用いられようとするプライム編集因子の具体的なCas9、Cas9バリアント、またはCas9等価物;
(f)プライマー結合部位の配列および長さ;
(g)編集鋳型の配列および長さ;
(h)相同アームの配列および長さ;
(i)スペーサー配列および長さ;ならびに
(j)コア配列、
を包含するが、これらに限定されない。
A number of considerations can be taken into account when designing a PEgRNA for any particular application or use of prime editing. These are:
(a) a target sequence, i.e., a nucleotide sequence, into which one or more nucleobase modifications are desired to be incorporated by a primed editor;
(b) Positioning of the cut site on the target sequence, i.e., the specific nucleobase position where the primed editor will induce a single-stranded nick to generate a 3'-end RT primer sequence on one side of the nick and a 5'-end endogenous flap on the other side of the nick (which is ultimately removed by FEN1 or its equivalent and replaced by a 3'-ssDNA flap). The cut site is analogous to "positioning of the edit" because it generates a 3'-end RT primer sequence that becomes extended by RT during RNA-dependent DNA polymerization to generate a 3'-ssDNA flap containing the desired edit, which then replaces the 5'-endogenous DNA flap on the target sequence;
(c) available PAM sequences (encompassing canonical SpCas9 PAM sites, as well as non-canonical PAM sites recognized by Cas9 variants and equivalents with extended or different PAM specificities);
(d) the spacing between available PAM sequences on the target sequence and the positioning of the site to be cut;
(e) the specific Cas9, Cas9 variant, or Cas9 equivalent of the prime editing element to be used;
(f) the sequence and length of the primer binding site;
(g) the sequence and length of the editing template;
(h) sequence and length of the homology arms;
(i) spacer sequence and length; and
(j) a core sequence;
These include, but are not limited to:

本開示は上のこれらの側面を論ずる。 This disclosure addresses these aspects above.

1つの態様では、好適なPEgRNAと任意に第2部位ニッキングのためのニッキングsgRNAデザインガイドとをデザインするアプローチが、ここに提供される。この態様は、プライム編集のためのPEgRNAおよびニッキングsgRNAをデザインするための説明書のステップバイステップのセットを提供し、これは上の考慮事項の1つ以上を考慮に入れる。ステップは図70A-70Iに示されている例を参照する。
1.標的配列および編集を定める。所望の編集(点変異、挿入、欠失、またはそれらの組み合わせ)の位置付けを中心とした標的DNA領域(~200bp)の配列をリトリーブする。図70Aを見よ。
2.標的PAMを位置付ける。所望の編集位置付けに対して近位のPAMを同定する。PAMは所望の編集位置付けに対して近位のDNAのどちらかの鎖上に同定され得る。編集位置に近接するPAMが好ましいが(すなわち、ニック部位は編集位置から30nt未満である。または編集位置からニック部位まで29nt、28nt、27nt、26nt、25nt、24nt、23nt、22nt、21nt、20nt、19nt、18nt、17nt、16nt、15nt、14nt、13nt、12nt、11nt、10nt、9nt、8nt、7nt、6nt、5nt、4nt、3nt、もしくは2nt未満)、編集位置から≧30ntのニックを置くプロトスペーサーおよびPAMを用いて編集を組み入れることが可能である。図70Bを見よ。
3.ニック部位を位置付ける。考慮されている各PAMについて、対応するニック部位とどの鎖上かとを同定する。Sp Cas9 H840Aニッカーゼでは、切断はNGG PAMの5'の第3および第4の塩基の間においてPAM含有鎖に生起する。全ての編集されるヌクレオチドはニック部位の3'に存在しなければならない。そのため、適当なPAMはPAM含有鎖上の標的の編集の5'にニックを置かなければならない。下で示される例では、2つの可能なPAMがある。単純のために、残りのステップはPAM 1のみを用いるPEgRNAのデザインを実証する。図70Cを見よ。
4.スペーサー配列をデザインする。Sp Cas9のプロトスペーサーはPAM含有鎖上のNGG PAMの5'の20ヌクレオチドに対応する。効率的なPol III転写開始はGが最初に転写されるヌクレオチドであることを要求する。プロトスペーサーの最初のヌクレオチドがGである場合には、PEgRNAのスペーサー配列は単純にプロトスペーサー配列である。プロトスペーサーの最初のヌクレオチドがGではない場合には、PEgRNAのスペーサー配列は、G、次にプロトスペーサー配列である。図70Dを見よ。
5.プライマー結合部位(PBS)をデザインする。出発アレル配列を用いて、PAM含有鎖上のDNAプライマーを同定する。DNAプライマーの3'端はニック部位のちょうど上流のヌクレオチドである(すなわち、Sp Cas9ではNGG PAMの5'の第4の塩基)。PE2およびPE3への使用のための一般的なデザイン原理として、DNAプライマーに対する12から13ヌクレオチドの相補性を含有するPEgRNAプライマー結合部位(PBS)が、~40-60%GC含量を含有する配列に用いられ得る。低いGC含量を有する配列では、より長い(14から15nt)PBSが試験されるべきである。より高いGC含量を有する配列では、より短い(8から11nt)PBSが試験されるべきである。GC含量にかかわらず、最適なPBS配列は経験的に決定されるはずである。長さpのPBS配列をデザインするためには、出発アレル配列を用いて、PAM含有鎖上のニック部位の5'の最初のpヌクレオチドの逆相補体を取る。図70Eを見よ。
6.RT鋳型(またはDNA合成鋳型)をデザインする。RT鋳型(または、ポリメラーゼが逆転写酵素ではないところでは、DNA合成鋳型)は、デザインされた編集と編集に隣接する配列に対する相同性とをコードする。1つの態様では、これらの領域は図3Dおよび図3EのDNA合成鋳型に対応し、DNA合成鋳型は「編集鋳型」および「相同アーム」を含む。最適なRT鋳型長さは標的部位に基づいて変わる。ショートレンジ編集(位置+1から+6)では、短い(9から12nt)、中程度の(13から16nt)、および長い(17から20nt)RT鋳型を試験することが推奨される。ロングレンジ編集(位置+7以降)では、十分な3'DNAフラップ相同性を許すように、編集の位置から少なくとも5nt(好ましくは10nt以上)伸長するRT鋳型を用いることが推奨される。ロングレンジ編集では、機能的なデザインを同定するために、いくつかのRT鋳型がスクリーニングされるべきである。より大きい挿入および欠失(≧5nt)では、RT鋳型上へのより多大な3'相同性(~20nt以上)の組み込みが推奨される。RT鋳型が、逆転写されるDNA産物上の最後のヌクレオチドとしてのG(PEgRNAのRT鋳型上のCに対応する)の合成をコードするときには、編集効率は典型的には損なわれる。多くのRT鋳型が効率的なプライム編集を支持するので、RT鋳型をデザインするときには、最後の合成されるヌクレオチドとしてのGの回避が推奨される。長さrのRT鋳型配列をデザインするためには、所望のアレル配列を用い、PAMを元々含有した鎖上のニック部位の3'の最初のrヌクレオチドの逆相補体を取る。SNP編集と比較して、同じ長さのRT鋳型を用いる挿入または欠失編集は同一の相同性を含有しないであろうということに注意せよ。図70Fを見よ。
7.完全なPEgRNA配列をアセンブリする。PEgRNA構成要素を次の順序(5'から3')でコンカテネーションする:スペーサー、骨格、RT鋳型、およびPBS。図70Gを見よ。
8.PE3のためのニッキングsgRNAをデザインする。編集の上流および下流の非編集鎖上のPAMを同定する。最適なニッキング位置は高度に座位依存的であり、経験的に決定されるはずである。一般的に、PEgRNAによって誘導されるニックの向かいの位置の40から90ヌクレオチド5'に置かれたニックは、より高い編集収量およびより少数のインデルに至る。ニッキングsgRNAは、出発アレル上の20ntプロトスペーサーにマッチするスペーサー配列を有する。プロトスペーサーがGで始まらない場合には5'Gの追加を有する。図70Hを見よ。
9.PE3bニッキングsgRNAをデザインする。PAMが相補鎖に存在し、その対応するプロトスペーサーが編集のために標的化される配列とオーバーラップする場合には、この編集はPE3bシステムの候補であり得る。PE3bシステムでは、ニッキングsgRNAのスペーサー配列は出発アレルではなく所望の編集されたアレルの配列にマッチする。編集されるヌクレオチド(単数または複数)がニッキングsgRNAプロトスペーサーのシード領域(PAMに隣接する~10nt)内に収まるときには、PE3bシステムは効率的に作動する。これは、編集された鎖の組み入れ後まで相補鎖のニッキングを防止し、標的DNAに結合することについてのPEgRNAおよびsgRNAの間の競合を防止する。PE3bは、両方の鎖上の同時のニックの生成をもまた回避し、それゆえに、高い編集効率を維持しながらインデル形成を有意に縮減する。PE3b sgRNAは、所望のアレルの20ntプロトスペーサーにマッチするスペーサー配列を有するはずである。必要とされる場合には5'Gの追加を有する。図70Iを見よ。
In one embodiment, an approach is provided herein for designing a suitable PEgRNA and optionally a nicking sgRNA design guide for second site nicking. This embodiment provides a step-by-step set of instructions for designing a PEgRNA and a nicking sgRNA for prime editing, which takes into account one or more of the above considerations. The steps refer to the examples shown in Figures 70A-70I.
1. Define the target sequence and edit. Retrieve the sequence of the target DNA region (~200bp) centered around the location of the desired edit (point mutation, insertion, deletion, or combination thereof). See Figure 70A.
2. Position the target PAM. Identify a PAM proximal to the desired editing position. A PAM can be identified on either strand of DNA proximal to the desired editing position. Although a PAM proximal to the editing position is preferred (i.e., the nick site is less than 30 nt from the editing position, or less than 29, 28, 27, 26, 25, 24, 23, 22, 21, 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, or 2 nt from the editing position to the nick site), it is possible to incorporate an edit using a protospacer and PAM that places the nick ≧30 nt from the editing position. See Figure 70B.
3. Position the nick site. For each PAM under consideration, identify the corresponding nick site and on which strand. For Sp Cas9 H840A nickase, cleavage occurs on the PAM-containing strand between the third and fourth bases 5' of the NGG PAM. All edited nucleotides must be 3' to the nick site. Therefore, the appropriate PAM must nick 5' of the targeted edit on the PAM-containing strand. In the example shown below, there are two possible PAMs. For simplicity, the remaining steps demonstrate the design of a PEgRNA using only PAM 1. See Figure 70C.
4. Design the spacer sequence. The protospacer of SpCas9 corresponds to the 20 nucleotides 5' of the NGG PAM on the PAM-containing strand. Efficient Pol III transcription initiation requires that G be the first transcribed nucleotide. If the first nucleotide of the protospacer is a G, then the spacer sequence of the PEgRNA is simply the protospacer sequence. If the first nucleotide of the protospacer is not a G, then the spacer sequence of the PEgRNA is a G followed by the protospacer sequence. See Figure 70D.
5. Design the primer binding site (PBS). Using the starting allele sequence, identify a DNA primer on the PAM-containing strand. The 3' end of the DNA primer is the nucleotide just upstream of the nick site (i.e., the fourth base 5' of the NGG PAM for Sp Cas9). As a general design principle for use with PE2 and PE3, a PEgRNA primer binding site (PBS) containing 12 to 13 nucleotides of complementarity to the DNA primer can be used for sequences containing .about.40-60% GC content. For sequences with low GC content, longer (14 to 15 nt) PBSs should be tested. For sequences with higher GC content, shorter (8 to 11 nt) PBSs should be tested. Regardless of GC content, the optimal PBS sequence should be determined empirically. To design a PBS sequence of length p, use the starting allele sequence to take the reverse complement of the first p nucleotides 5' of the nick site on the PAM-containing strand. See Figure 70E.
6. Design the RT template (or DNA synthesis template). The RT template (or DNA synthesis template, where the polymerase is not a reverse transcriptase) codes for the designed edit and homology to the sequence flanking the edit. In one embodiment, these regions correspond to the DNA synthesis template of FIG. 3D and FIG. 3E, where the DNA synthesis template includes the "edit template" and the "homology arms". The optimal RT template length varies based on the target site. For short-range edits (positions +1 to +6), it is recommended to test short (9 to 12 nt), medium (13 to 16 nt), and long (17 to 20 nt) RT templates. For long-range edits (positions +7 and beyond), it is recommended to use an RT template that extends at least 5 nt (preferably 10 nt or more) from the edit position to allow sufficient 3' DNA flap homology. For long-range edits, several RT templates should be screened to identify a functional design. For larger insertions and deletions (≧5 nt), incorporation of greater 3′ homology (≧20 nt) onto the RT template is recommended. Editing efficiency is typically compromised when the RT template codes for synthesis of a G (corresponding to a C on the RT template for PEG RNA) as the last nucleotide on the reverse transcribed DNA product. Because many RT templates support efficient prime editing, avoidance of G as the last synthesized nucleotide is recommended when designing an RT template. To design an RT template sequence of length r, use the desired allele sequence and take the reverse complement of the first r nucleotides 3′ of the nick site on the strand that originally contained the PAM. Note that compared to SNP editing, insertion or deletion edits using an RT template of the same length will not contain the same homology. See Figure 70F.
7. Assemble the complete PEGRNA sequence. Concatenate the PEGRNA building blocks in the following order (5' to 3'): spacer, backbone, RT template, and PBS. See Figure 70G.
8. Design a nicking sgRNA for PE3. Identify PAMs on the non-edited strand upstream and downstream of the edit. The optimal nicking position is highly locus dependent and should be empirically determined. Generally, a nick placed 40 to 90 nucleotides 5' opposite the PEgRNA-induced nick leads to higher editing yields and fewer indels. The nicking sgRNA has a spacer sequence that matches the 20 nt protospacer on the starting allele. If the protospacer does not begin with a G, have an additional 5' G. See Figure 70H.
9. Design a PE3b nicking sgRNA. If a PAM is present on the complementary strand and its corresponding protospacer overlaps with the sequence targeted for editing, this edit may be a candidate for the PE3b system. In the PE3b system, the spacer sequence of the nicking sgRNA matches the sequence of the desired edited allele, not the starting allele. The PE3b system works efficiently when the nucleotide(s) to be edited fall within the seed region (~10 nt adjacent to the PAM) of the nicking sgRNA protospacer. This prevents nicking of the complementary strand until after incorporation of the edited strand, preventing competition between the PEgRNA and the sgRNA for binding to the target DNA. PE3b also avoids the generation of nicks on both strands simultaneously, thus significantly reducing indel formation while maintaining high editing efficiency. The PE3b sgRNA should have a spacer sequence that matches the 20 nt protospacer of the desired allele, with the addition of a 5'G if required. See Figure 70I.

好適なPEgRNAおよび第2部位ニッキングsgRNAをデザインするための上のステップバイステップのプロセスは、決して限定することを意味されない。本開示は上に記載されているステップバイステップのプロセスのバリエーションを企図し、これらは当業者によってそれから導出可能であろう。 The above step-by-step process for designing suitable PEgRNAs and second-site nicking sgRNAs is not meant to be limiting in any way. The present disclosure contemplates variations of the step-by-step process described above that could be derived therefrom by one of skill in the art.

[7]プライム編集を利用する適用
標的化された挿入、欠失、および全ての12の可能な塩基から塩基の変換をヒト細胞の標的座位において二本鎖DNA切断またはドナーDNA鋳型を要求することなしに媒介する新たな「検索置換」ゲノム編集テクノロジーとしての本明細書に記載のプライム編集システムの開発に加えて、本発明者は、特定の適用の広いアレイへのプライム編集因子の使用をもまた企図した。例えば、本願において例示され論じられるとおり、プライム編集は、(a)変異を修正する変化をヌクレオチド配列に組み入れ、(b)タンパク質およびRNAタグを組み入れ、(c)免疫エピトープを目当てのタンパク質に組み入れ、(d)誘導可能な二量体化ドメインをタンパク質に組み入れ、(e)バイオ分子のその活性を変改するために配列を組み入れまたは除去、(f)特定の遺伝子変化を導くためにリコンビナーゼ標的部位を組み入れ、および(g)エラーを起こしやすいRTを用いることによる標的配列の変異導入をするために用いられ得る。目当ての標的部位におけるヌクレオチド配列を一般的に挿入、変化、または欠失させるこれらの方法に加えて、プライム編集因子は、高度にプログラム可能なライブラリを構築するために、ならびに細胞データ記録および系統トレース研究を行うためにもまた用いられ得る。本発明者は、プライム編集の効力を改善することを狙うPEgRNAの追加のデザイン特色をもまた企図した。なお、さらに、本発明者は、インテインドメインを用いてnapDNAbpを分裂することが関わる、ベクター送達システムを用いてプライム編集因子を首尾良く送達するための方法の着想を得た。
[7] Applications Utilizing Prime Editing In addition to developing the prime editing system described herein as a new "search and replace" genome editing technology that mediates targeted insertions, deletions, and conversions of all 12 possible bases at target loci in human cells without requiring double-stranded DNA breaks or donor DNA templates, the inventors have also contemplated the use of prime editing elements for a wide array of specific applications. For example, as exemplified and discussed in this application, prime editing can be used to (a) incorporate mutation-correcting changes into nucleotide sequences, (b) incorporate protein and RNA tags, (c) incorporate immune epitopes into proteins of interest, (d) incorporate inducible dimerization domains into proteins, (e) incorporate or remove sequences in biomolecules to alter their activity, (f) incorporate recombinase target sites to induce specific genetic changes, and (g) mutate target sequences by using error-prone RT. In addition to these methods of generally inserting, changing or deleting nucleotide sequences at a target site of interest, prime editors can also be used to construct highly programmable libraries and to perform cell data recording and lineage tracing studies. The inventors have also contemplated additional design features of PEgRNA that aim to improve the efficacy of prime editing. Furthermore, the inventors have conceived a method for successfully delivering prime editors using a vector delivery system that involves splitting napDNAbp using an intein domain.

プライム編集のこれらの特定の例示の使用は決して限定することを意図されない。本願は、ヌクレオチド配列、例えばゲノムDNA上の標的部位における1つ以上の核酸塩基の組み入れ、除去、および/または改変の何らかの形態が一般的に関わるプライム編集のいずれかの使用を企図する。 These specific exemplary uses of prime editing are not intended to be limiting in any way. The present application contemplates any use of prime editing that generally involves some form of incorporation, removal, and/or modification of one or more nucleic acid bases at a target site on a nucleotide sequence, e.g., genomic DNA.

プライム編集の例示されている使用のいずれかについて、PE1、PE2、PE3、およびPE3b、またはPE-shortを包含する本明細書に開示のいずれかのプライム編集因子を用い得る。 For any of the exemplified uses of prime editing, any prime editing factor disclosed herein may be used, including PE1, PE2, PE3, and PE3b, or PE-short.

A.プライム編集機序
種々の態様において、プライム編集(または「プライム編集」)は、標的DNA分子(これに、ヌクレオチド配列の変化が導入されることが望まれる)を、伸長されたガイドRNAと複合体化した核酸プログラム型DNA結合タンパク質(napDNAbp)と接触させることによって作動する。図1Gを参照すると、伸長されたガイドRNAは、ガイドRNAの3'もしくは5'端にまたはガイドRNAの分子内の位置付けに伸長を含み、所望のヌクレオチド変化(例えば、1ヌクレオチド変化、挿入、または欠失)をコードする。ステップ(a)では、napDNAbp/伸長されたgRNA複合体がDNA分子に接触し、伸長されたgRNAがnapDNAbpをガイドして標的座位に結合させる。ステップ(b)では、ニックが標的座位のDNAの鎖の1つに導入され(例えば、ヌクレアーゼまたは化学的薬剤による)、それによって利用可能な3'端を標的座位の鎖の1つに生出する。ある態様において、ニックは、Rループ鎖に対応するDNAの鎖、すなわちガイドRNA配列にハイブリダイズされない鎖、すなわち「非標的鎖」上に生出される。しかしながら、ニックは鎖のどちらかに導入され得る。つまり、ニックは、Rループ「標的鎖」(すなわち、伸長されたgRNAのプロトスペーサー配列にハイブリダイズされる鎖)または「非標的鎖」(すなわち、Rループの一本鎖部分を形成し、標的鎖に対して相補的である鎖)上に導入され得る。ステップ(c)では、DNA鎖の3'端(ニックによって形成される)は、逆転写をプライムするためにガイドRNAの伸長された部分と相互作用する(すなわち「プライム標的にプライムされたRT」)。ある態様において、3'端DNA鎖は、ガイドRNAの伸長された部分の特定のRTプライム配列、すなわち「逆転写酵素プライム配列」にハイブリダイズする。ステップ(d)では、逆転写酵素が導入され(napDNAbpとの融合タンパク質としてまたはトランスで)、これが、プライムされた部位の3'端から伸長されたガイドRNAの5'端の方へDNAの一本鎖を合成する。これは、ニック部位におけるまたはそれに隣接する内生DNAに対してさもなければ相同的である、所望のヌクレオチド変化(例えば、1塩基変化、挿入、もしくは欠失、またはそれらの組み合わせ)を含む一本鎖DNAフラップを形成する。ステップ(e)では、napDNAbpおよびガイドRNAがリリースされる。ステップ(f)および(g)は一本鎖DNAフラップの分解に関し、その結果、所望のヌクレオチド変化が標的座位に組み込まれるようになる。このプロセスは、ひとたび3'一本鎖DNAフラップが内生DNA配列に侵入およびハイブリダイズすると形成する対応する5'内生DNAフラップを除去することによって、所望の産物形成の方へ駆動され得る(例えば、トランスで、プライム編集因子との融合体として提供、または内生で提供されるFEN1または類似の酵素による)。理論によって拘束されることなしに、細胞の内生DNA修復および複製プロセスは、ミスマッチのDNAを分解してヌクレオチド変化(単数または複数)を組み込んで、所望の変改された産物を形成する。プロセスは、図1Gにおいて例示されるとおり「第2鎖ニッキング」または図1Iにおいて例示され本願において論じられるとおり「時間的(termporal)第2鎖ニッキング」によってもまた、産物形成の方へ駆動され得る。
A. Prime editing mechanism
In various embodiments, prime editing (or "prime editing") operates by contacting a target DNA molecule (in which a nucleotide sequence change is desired to be introduced) with a nucleic acid programmable DNA binding protein (napDNAbp) complexed with an extended guide RNA. With reference to FIG. 1G, the extended guide RNA includes an extension at the 3' or 5' end of the guide RNA or at the intramolecular positioning of the guide RNA, encoding the desired nucleotide change (e.g., a single nucleotide change, an insertion, or a deletion). In step (a), the napDNAbp/extended gRNA complex contacts the DNA molecule, and the extended gRNA guides the napDNAbp to bind to the target locus. In step (b), a nick is introduced (e.g., by a nuclease or chemical agent) into one of the strands of DNA at the target locus, thereby generating an available 3' end on one of the strands at the target locus. In some embodiments, the nick is generated on the strand of DNA corresponding to the R-loop strand, i.e., the strand that is not hybridized to the guide RNA sequence, i.e., the "non-target strand." However, the nick can be introduced on either strand. That is, the nick can be introduced on the R-loop "target strand" (i.e., the strand that hybridizes to the protospacer sequence of the extended gRNA) or on the "non-target strand" (i.e., the strand that forms the single-stranded portion of the R-loop and is complementary to the target strand). In step (c), the 3' end of the DNA strand (formed by the nick) interacts with the extended portion of the guide RNA to prime reverse transcription (i.e., "RT primed to prime target"). In some embodiments, the 3' end DNA strand hybridizes to a specific RT prime sequence of the extended portion of the guide RNA, i.e., the "reverse transcriptase prime sequence". In step (d), a reverse transcriptase is introduced (as a fusion protein with napDNAbp or in trans), which synthesizes a single strand of DNA from the 3' end of the primed site toward the 5' end of the extended guide RNA. This forms a single-stranded DNA flap containing the desired nucleotide change (e.g., a single base change, an insertion, or a deletion, or a combination thereof) that is otherwise homologous to the endogenous DNA at or adjacent to the nick site. In step (e), the napDNAbp and the guide RNA are released. Steps (f) and (g) involve degradation of the single-stranded DNA flap, so that the desired nucleotide change becomes incorporated at the target locus. This process can be driven toward the formation of the desired product by removing the corresponding 5' endogenous DNA flap that forms once the 3' single-stranded DNA flap invades and hybridizes to the endogenous DNA sequence (e.g., by FEN1 or a similar enzyme provided in trans as a fusion with a primed editing factor, or endogenously provided). Without being bound by theory, the cell's endogenous DNA repair and replication processes degrade the mismatched DNA and incorporate the nucleotide change(s) to form the desired altered product. The process can also be driven towards product formation by "second strand nicking" as illustrated in FIG. 1G or "termporal second strand nicking" as illustrated in FIG. 1I and discussed herein.

プライム編集のプロセスは次の遺伝子変化の少なくとも1つ以上を導入し得る:トランスバージョン、トランジション、欠失、および挿入。加えて、プライム編集は特定の適用のために実装され得る。例えば、本願において例示され論じられるとおり、プライム編集は、(a)変異を修正する変化をヌクレオチド配列に組み入れ、(b)タンパク質およびRNAタグを組み入れ、(c)免疫エピトープを目当てのタンパク質に組み入れ、(d)誘導可能な二量体化ドメインをタンパク質に組み入れ、(e)バイオ分子のその活性を変改するために配列を組み入れまたは除去、(f)特定の遺伝子変化を導くためにリコンビナーゼ標的部位を組み入れ、および(g)エラーを起こしやすいRTを用いることによる標的配列の変異導入をするために用いられ得る。目当ての標的部位におけるヌクレオチド配列を一般的に挿入、変化、または欠失させるこれらの方法に加えて、プライム編集因子は、高度にプログラム可能なライブラリを構築するために、ならびに細胞データ記録および系統トレース研究を行うためにもまた用いられ得る。本発明者は、プライム編集の効力を改善することを狙うPEgRNAの追加のデザイン特色をもまた企図した。なお、さらに、本発明者は、インテインドメインを用いてnapDNAbpを分裂することが関わる、ベクター送達システムを用いてプライム編集因子を首尾良く送達するための方法の着想を得た。 The process of prime editing can introduce at least one or more of the following genetic changes: transversions, transitions, deletions, and insertions. In addition, prime editing can be implemented for specific applications. For example, as exemplified and discussed in this application, prime editing can be used to (a) incorporate mutation-correcting changes into nucleotide sequences, (b) incorporate protein and RNA tags, (c) incorporate immune epitopes into proteins of interest, (d) incorporate inducible dimerization domains into proteins, (e) incorporate or remove sequences in biomolecules to alter their activity, (f) incorporate recombinase target sites to direct specific genetic changes, and (g) mutate target sequences by using error-prone RT. In addition to these methods of generally inserting, altering, or deleting nucleotide sequences at target sites of interest, prime editors can also be used to construct highly programmable libraries and to perform cellular data recording and lineage tracing studies. The inventors have also contemplated additional design features of PEgRNA aimed at improving the efficacy of prime editing. Furthermore, the inventors have conceived a method for successfully delivering prime editing factors using a vector delivery system that involves disrupting napDNAbp with an intein domain.

用語「プライム編集システム」または「プライム編集因子(PE)」は、本明細書に記載のプライム標的にプライムされた逆転写(TPRT)を用いるゲノム編集の方法に関わる組成物を言い、napDNAbp、逆転写酵素、融合タンパク質(例えば、DNAbpおよび逆転写酵素を含む)、伸長されたガイドRNA、および融合タンパク質と伸長されたガイドRNAとを含む複合体、ならびに補助的な要素、例えば、プライム編集プロセスを編集された産物形成の方へ駆動することを助けるための第2鎖ニッキング構成要素および5'内生DNAフラップ除去エンドヌクレアーゼ(例えばFEN1)を包含するが、これらに限定されない。 The term "prime editing system" or "prime editing element (PE)" refers to a composition involved in the method of genome editing using primed target-primed reverse transcription (TPRT) described herein, including, but not limited to, napDNAbp, reverse transcriptase, a fusion protein (e.g., comprising a DNAbp and a reverse transcriptase), an extended guide RNA, and a complex comprising a fusion protein and an extended guide RNA, as well as auxiliary elements, such as a second strand nicking component and a 5' endogenous DNA flap removal endonuclease (e.g., FEN1) to help drive the prime editing process toward the formation of an edited product.

別の態様では、図3Fの模式図は、二本鎖DNAの標的部位との典型的なPEgRNAの相互作用と、目当ての遺伝子変化を含有する3'一本鎖DNAフラップの付随的生産とを図示する。二本鎖DNAは、上側鎖が3'から5'の向きで、下方の鎖が5'から3'の方向で示されている。上側の鎖は「プロトスペーサー」およびPAM配列を含み、「標的鎖」と言われる。相補的な下方の鎖は「非標的鎖」と言われる。示されていないが、図示されているPEgRNAはCas9または等価物と複合体化するであろう。模式図に示されているとおり、PEgRNAのスペーサーは、プロトスペーサーと言われる標的鎖上の相補的な領域にアニーリングし、これはPAM配列のちょうど下流に位置付けられ、長さがおよそ20ヌクレオチドである。この相互作用は、スペーサーRNAおよびプロトスペーサーDNAの間にDNA/RNAハイブリッドを形成し、プロトスペーサーに対向する領域におけるRループの形成を誘導する。本願の他所において教示されるとおり、Cas9タンパク質(示されていない)が、それから、示されているとおり非標的鎖上にニックを誘導する。それから、これは3'ssDNAフラップ領域の形成に至り、これは、*z*に従って、プライマー結合部位においてPEgRNAの3'端と相互作用する。ssDNAフラップの3'端(すなわち、逆転写酵素プライマー配列)はPEgRNA上のプライマー結合部位(A)にアニーリングし、それによって逆転写酵素をプライムする。次に、逆転写酵素(例えば、トランスで提供されるか、またはCas9構築物に取り付けられた融合タンパク質としてシスで提供される)が、それから、編集鋳型(B)および相同アーム(C)によってコードされるDNAの一本鎖を重合する。重合は伸長アームの5'端の方へ連続する。ssDNAの重合した鎖はssDNA 3'端フラップを形成する。これは、他所に記載されるとおり(例えば図1Gに示されるとおり)、内生DNAに侵入し、対応する内生鎖を押し除け(これは内生DNAの5'DNAフラップとして除去される)、所望のヌクレオチド編集(1ヌクレオチド塩基対変化、欠失、挿入(遺伝子丸ごとを包含する)を天然に存在するDNA修復/複製ラウンドによって組み入れる。 In another embodiment, the schematic in FIG. 3F illustrates a typical PEgRNA interaction with a target site in double-stranded DNA and the concomitant production of a 3′ single-stranded DNA flap containing the desired genetic alteration. The double-stranded DNA is shown with the top strand in a 3′ to 5′ orientation and the bottom strand in a 5′ to 3′ orientation. The top strand contains the “protospacer” and PAM sequence and is referred to as the “target strand.” The complementary bottom strand is referred to as the “non-target strand.” Although not shown, the illustrated PEgRNA would complex with Cas9 or an equivalent. As shown in the schematic, the spacer of the PEgRNA anneals to a complementary region on the target strand, referred to as the protospacer, which is located just downstream of the PAM sequence and is approximately 20 nucleotides in length. This interaction forms a DNA/RNA hybrid between the spacer RNA and the protospacer DNA, inducing the formation of an R-loop in the region opposite the protospacer. As taught elsewhere in this application, the Cas9 protein (not shown) then induces a nick on the non-target strand as shown. This then leads to the formation of a 3' ssDNA flap region, which interacts with the 3' end of the PEgRNA at the primer binding site according to *z*. The 3' end of the ssDNA flap (i.e., the reverse transcriptase primer sequence) anneals to the primer binding site (A) on the PEgRNA, thereby priming the reverse transcriptase. Next, the reverse transcriptase (e.g., provided in trans or provided in cis as a fusion protein attached to the Cas9 construct) then polymerizes the single strand of DNA encoded by the editing template (B) and the homology arm (C). Polymerization continues toward the 5' end of the extension arm. The polymerized strand of ssDNA forms the ssDNA 3' end flap. It invades the endogenous DNA, displaces the corresponding endogenous strand (which is removed as a 5' DNA flap of the endogenous DNA), and incorporates the desired nucleotide edit (single nucleotide base pair change, deletion, insertion (including entire genes) by naturally occurring rounds of DNA repair/replication), as described elsewhere (e.g., as shown in Figure 1G).

プライム編集のこの適用は例1においてさらに記載され得る。 This application of prime editing can be further described in Example 1.

B.エラーを起こしやすいRTによるプライム編集を用いる変異導入
種々の態様において、プライム編集システム(すなわちプライム編集システム)は、標的化された変異導入を行うための、すなわちゲノムまたは細胞の他のDNAエレメント上の良く定めされたDNAのストレッチのみを変異させるための、エラーを起こしやすい逆転写酵素の使用を包含し得る。図22は、標的座位上のエラーを起こしやすい逆転写酵素による標的化された変異導入を行うことを導入するための例示的プロセスの模式図を提供し、伸長されたガイドRNAと複合体化した核酸プログラム型DNA結合タンパク質(napDNAbp)を用いる。このプロセスは、標的化された変異導入のためのプライム編集のある態様と言われ得る。伸長されたガイドRNAは、ガイドRNAの3'もしくは5'端にまたはガイドRNAの分子内の位置付けに伸長を含む。ステップ(a)では、napDNAbp/gRNA複合体がDNA分子に接触し、gRNAがnapDNAbpをガイドして、変異導入されるべき標的座位に結合させる。ステップ(b)では、ニックが標的座位のDNAの鎖の1つに導入され(例えば、ヌクレアーゼまたは化学的薬剤による)、それによって利用可能な3'端を標的座位の鎖の1つに生出する。ある態様において、ニックは、Rループ鎖に対応するDNAの鎖、すなわちガイドRNA配列にハイブリダイズされない鎖上に生出される。ステップ(c)では、DNA鎖の3'端は、逆転写をプライムするためにガイドRNAの伸長された部分と相互作用する。ある態様において、3'端DNA鎖は、ガイドRNAの伸長された部分の特定のRTプライム配列にハイブリダイズする。ステップ(d)では、エラーを起こしやすい逆転写酵素が導入され、これが、プライムされた部位の3'端からガイドRNAの3'端の方へDNAの変異導入された一本鎖を合成する。例示の変異がアステリスク「*」によって指示されている。これは所望の変異導入された領域を含む一本鎖DNAフラップを形成する。ステップ(e)では、napDNAbpおよびガイドRNAがリリースされる。ステップ(f)および(g)は一本鎖DNAフラップ(変異導入された領域を含む)の分解に関し、その結果、所望の変異導入された領域が標的座位に組み込まれるようになる。このプロセスは、ひとたび3'一本鎖DNAフラップが他の鎖上の相補的な配列に侵入およびハイブリダイズすると形成する対応する5'内生DNAフラップを除去することによって、所望の産物形成の方へ駆動され得る。プロセスは、図1Fにおいて例示されるとおり第2鎖ニッキングによってもまた産物形成の方へ駆動され得る。内生DNA修復および/または複製プロセス後に、変異導入された領域はDNA座位のDNAの両方の鎖上に組み込まれるようになる。
B. Mutagenesis using error-prone RT-primed editing
In various embodiments, a prime editing system (i.e., a prime editing system) may involve the use of an error-prone reverse transcriptase to perform targeted mutagenesis, i.e., to mutate only well-defined stretches of DNA on a genome or other DNA elements of a cell. Figure 22 provides a schematic diagram of an exemplary process for performing targeted mutagenesis by an error-prone reverse transcriptase on a target locus, using a nucleic acid programmable DNA binding protein (napDNAbp) complexed with an extended guide RNA. This process may be referred to as an embodiment of prime editing for targeted mutagenesis. The extended guide RNA includes an extension at the 3' or 5' end of the guide RNA or at the intramolecular positioning of the guide RNA. In step (a), the napDNAbp/gRNA complex contacts the DNA molecule, and the gRNA guides the napDNAbp to bind to the target locus to be mutated. In step (b), a nick is introduced (e.g., by a nuclease or chemical agent) into one of the strands of the DNA at the target locus, thereby generating an available 3' end on one of the strands at the target locus. In some embodiments, a nick is generated on the strand of DNA corresponding to the R-loop strand, i.e., the strand that is not hybridized to the guide RNA sequence. In step (c), the 3' end of the DNA strand interacts with the extended portion of the guide RNA to prime reverse transcription. In some embodiments, the 3' end DNA strand hybridizes to a specific RT prime sequence of the extended portion of the guide RNA. In step (d), an error-prone reverse transcriptase is introduced, which synthesizes a mutated single strand of DNA from the 3' end of the primed site toward the 3' end of the guide RNA. Exemplary mutations are indicated by an asterisk "*". This forms a single stranded DNA flap containing the desired mutated region. In step (e), the napDNAbp and the guide RNA are released. Steps (f) and (g) involve degradation of the single stranded DNA flap (containing the mutated region), resulting in the integration of the desired mutated region into the target locus. This process can be driven towards the desired product formation by removing the corresponding 5' endogenous DNA flap that forms once the 3' single-stranded DNA flap invades and hybridizes to the complementary sequence on the other strand. The process can also be driven towards product formation by second strand nicking as illustrated in Figure 1F. After endogenous DNA repair and/or replication processes, the mutated region becomes incorporated onto both strands of DNA at the DNA locus.

プライム編集のこの適用は例2においてさらに記載され得る。 This application of prime editing can be further described in Example 2.

エラーを起こしやすいまたは変異誘発RT酵素は当該技術分野において公知である。本願において用いられる用語「エラーを起こしやすい」逆転写酵素は、野生型M-MLV逆転写酵素のエラー率未満であるエラー率を有する、天然に存在するかまたは別の逆転写酵素(例えば、野生型M-MLV逆転写酵素)から導出された逆転写酵素酵素を言う。野生型M-MLV逆転写酵素のエラー率は15,000から27,000の核酸塩基組み込みにつき1つのエラーの範囲であることが報告されている。Boutabout et al.(2001) "DNA synthesis fidelity by the reverse transcriptase of the yeast retrotransposon Ty1," Nucleic Acids Res 29(11):2217-2222を見よ。これは参照によって本願に組み込まれる。それゆえに、この適用の目的では、用語「エラーを起こしやすい」は、15,000核酸塩基組み込みにつき1つのエラー(6.7×10-5またはより高く)、例えば、14,000核酸塩基につき1エラー(7.14×10-5またはより高く)、13,000核酸塩基もしくはより少数につき1エラー(7.7×10-5またはより高く)、12,000核酸塩基もしくはより少数につき1エラー(7.7×10-5またはより高く)、11,000核酸塩基もしくはより少数につき1エラー(9.1×10-5またはより高く)、10,000核酸塩基もしくはより少数につき1エラー(1×10-4もしくは0.0001またはより高く)、9,000核酸塩基もしくはより少数につき1エラー(0.00011またはより高く)、8,000核酸塩基もしくはより少数につき1エラー(0.00013またはより高く)、7,000核酸塩基もしくはより少数につき1エラー(0.00014またはより高く)、6,000核酸塩基もしくはより少数につき1エラー(0.00016またはより高く)、5,000核酸塩基もしくはより少数につき1エラー(0.0002またはより高く)、4,000核酸塩基もしくはより少数につき1エラー(0.00025またはより高く)、3,000核酸塩基もしくはより少数につき1エラー(0.00033またはより高く)、2,000核酸塩基もしくはより少数につき1エラー(0.00050またはより高く)、または1,000核酸塩基もしくはより少数につき1エラー(0.001またはより高く)、または500核酸塩基もしくはより少数につき1エラー(0.002またはより高く)、または250核酸塩基もしくはより少数につき1エラー(0.004またはより高く)よりも多大であるエラー率を有するRTを言う。 Error-prone or mutagenic RT enzymes are known in the art. The term "error-prone" reverse transcriptase as used herein refers to a reverse transcriptase enzyme that is naturally occurring or derived from another reverse transcriptase (e.g., wild-type M-MLV reverse transcriptase) that has an error rate that is less than that of wild-type M-MLV reverse transcriptase. The error rate of wild-type M-MLV reverse transcriptase has been reported to range from one error per 15,000 to 27,000 nucleobase incorporations. See Boutabout et al. (2001) "DNA synthesis fidelity by the reverse transcriptase of the yeast retrotransposon Ty1," Nucleic Acids Res 29(11):2217-2222, which is incorporated herein by reference. Therefore, for purposes of this application, the term "error-prone" refers to a nucleic acid sequence that is more likely to have at least one error per 15,000 nucleobase incorporation (6.7×10 −5 or higher), e.g., one error per 14,000 nucleobases (7.14×10 −5 or higher), one error per 13,000 nucleobases or fewer (7.7×10 −5 or higher), one error per 12,000 nucleobases or fewer (7.7×10 −5 or higher), one error per 11,000 nucleobases or fewer (9.1×10 −5 or higher), one error per 10,000 nucleobases or fewer (1×10 -4 or 0.0001 or higher), 1 error per 9,000 nucleobases or less (0.00011 or higher), 1 error per 8,000 nucleobases or less (0.00013 or higher), 1 error per 7,000 nucleobases or less (0.00014 or higher), 1 error per 6,000 nucleobases or less (0.00016 or higher), 1 error per 5,000 nucleobases or less (0.0002 or higher), 1 error per 4,000 nucleobases or less (0.00016 or higher), 1 error per 5,000 nucleobases or less (0.0002 or higher), 1 error per 4,000 nucleobases or less (0.00016 or higher), 1 error per 6,000 nucleobases or less (0.00016 or higher), 1 error per 5,000 nucleobases or less (0.0002 or higher), 1 error per 4,000 nucleobases or less (0.00016 or higher), 1 error per 8,000 nucleobases or less (0.00016 or higher), 1 error per 9,000 nucleobases or less (0.00016 or higher), 1 error per 10 ... It refers to a RT having an error rate that is greater than 1 error (0.00025 or higher), 1 error per 3,000 nucleobases or fewer (0.00033 or higher), 1 error per 2,000 nucleobases or fewer (0.00050 or higher), or 1 error per 1,000 nucleobases or fewer (0.001 or higher), or 1 error per 500 nucleobases or fewer (0.002 or higher), or 1 error per 250 nucleobases or fewer (0.004 or higher).

プライム編集を用いる変異導入された配列の生成のためには、種々の変異誘発RTが想定され得る。2つのかかる例はBordetellaファージ(Handa,S.,et al.Nucl Acids Res 9711-25(2018)を見よ。これは参照によって本願に組み込まれる)およびLegionella pneumophila(Arambula,D.,et al.Proc Natl Acad Sci USA 8212-7(2013)を見よ。これは参照によって組み込まれる)からの変異誘発逆転写酵素である。BordetellaファージからのRT(brt)のケースでは、標的部位に対する変異誘発RTの結合を改善するために、補助的なタンパク質(bavd)がCas9に、および追加のRNA配列がPEgRNAに、追加またはトランスで送達されることをもまた必要とし得る(Handa,S.,et al.Nucl Acids Res 9711-25(2018)を見よ)。変異誘発RTを用いるときには、PEgRNAの鋳型領域は、多様性を増強するためのアデノシンまたはAAYコドンが濃縮され得る。 For the generation of mutated sequences using prime editing, various mutagenic RTs can be envisaged. Two such examples are the mutagenic reverse transcriptases from Bordetella phage (see Handa, S., et al. Nucl Acids Res 9711-25 (2018), which is incorporated herein by reference) and Legionella pneumophila (see Arambula, D., et al. Proc Natl Acad Sci USA 8212-7 (2013), which is incorporated herein by reference). In the case of the RT from Bordetella phage (brt), it may also be necessary to deliver an auxiliary protein (bavd) to Cas9 and an additional RNA sequence to the PEgRNA, either additionally or in trans, to improve binding of the mutagenic RT to the target site (see Handa, S., et al. Nucl Acids Res 9711-25 (2018)). When using mutagenic RT, the template region of the PEgRNA can be enriched for adenosine or AAY codons to enhance diversity.

Bordetellaファージからの変異誘発RTのアミノ酸配列は次のとおり提供される。本明細書に開示の他のRTのように、Brtタンパク質は、機能的なPEを形成するように融合タンパク質としてnapDNAbpに融合され得る。

Figure 2020191243000114

Figure 2020191243000115
The amino acid sequence of the mutagenized RT from Bordetella phage is provided below: As with the other RTs disclosed herein, the Brt protein can be fused to the napDNAbp as a fusion protein to form a functional PE.
Figure 2020191243000114

Figure 2020191243000115

BodetellaからのBrtのケースでは、PE融合体は追加の補助的なタンパク質(Bavd)をもまた包含し得る。補助的なタンパク質はPE融合タンパク質に融合またはトランスで提供され得る。Bavd補助的タンパク質のアミノ酸配列は次のとおり提供される:

Figure 2020191243000116
In the case of Brt from Bodetella, the PE fusion may also include an additional auxiliary protein (Bavd). The auxiliary protein may be fused to the PE fusion protein or provided in trans. The amino acid sequence of the Bavd auxiliary protein is provided as follows:
Figure 2020191243000116

BodetellaからのBrtのケースでは、PEgRNAは、PEgRNA、例えば5'または3'端に追加された追加のヌクレオチド配列を含み得る。例示の配列は次のとおりであり、これは元々はBordetellaファージゲノムからである:

Figure 2020191243000117
In the case of Brt from Bodetella, the PEgRNA can include additional nucleotide sequences added to the PEgRNA, for example, at the 5' or 3' end. An exemplary sequence is as follows, which is originally from the Bordetella phage genome:
Figure 2020191243000117

長さを短くするために、このPEgRNA追加配列は種々のやり方で縮減され得る。例えば、PEgRNA追加1配列は次の例示の代替的な追加配列へと縮減され得る:

Figure 2020191243000118

Figure 2020191243000119
To reduce its length, this PEgRNA addition sequence can be shortened in various ways. For example, the PEgRNA addition 1 sequence can be shortened to the following exemplary alternative addition sequences:
Figure 2020191243000118

Figure 2020191243000119

他の態様において、PEgRNA追加配列もまた変異させられ得る。例えば、PEgRNA追加1配列は次の例示の代替的な追加配列へと変異させられ得る:

Figure 2020191243000120
In other embodiments, the PEgRNA addition sequence can also be mutated. For example, the PEgRNA addition 1 sequence can be mutated to the following exemplary alternative addition sequences:
Figure 2020191243000120

変異を導入するためのPEの使用に関する種々の態様では、特殊なPEgRNAの考慮事項が適用され得る。例えば、理論によって拘束されることなしに、上に記載されている追加のPEgRNA配列は、変異誘発RTによる効率的な変異導入を可能化するために必要とされ得る。 In various embodiments involving the use of PE to introduce mutations, special PEgRNA considerations may apply. For example, without being bound by theory, the additional PEgRNA sequences described above may be required to enable efficient mutagenesis by mutagenic RT.

いずれかの変異誘発RTが本明細書に開示のプライム編集因子に用いられ得る。例えば、次の参照に記載されるエラーを起こしやすいRTが用いられ得、参照によって本願に組み込まれる: Any mutagenic RT may be used in the prime editors disclosed herein. For example, the error-prone RTs described in the following references may be used, which are incorporated herein by reference:

Bebenek et al.,"Error-prone polymerization by HIV-1 reverse transcriptase.Contribution of template-primer misalignment,miscoding,and termination probability to mutational hot spots.,"J.BiolChem,1993,268:10324-34;および Bebenek et al., "Error-prone polymerization by HIV-1 reverse transcriptase. Contribution of template-primer misalignment, miscoding, and termination probability to mutational hot spots.," J. Biol Chem, 1993, 268: 10324-34; and

Menendez-Arias,"Mutation rates and instrinsic fidelity of retroviral reverse transcriptases,"2009,Viruses,1(3):1137-1165。 Menendez-Arias, "Mutation rates and instrinsic fidelity of retroviral reverse transcriptases," 2009, Viruses, 1(3):1137-1165.

種々のエラーを起こしやすいRTは、次のとおり、Menendez-Arias et al.の表1に開示されている次の酵素を包含し得るが、これらに限定されない(これの参照の内容全体は参照によって組み込まれる):

Figure 2020191243000121
Various error-prone RTs may include, but are not limited to, the following enzymes disclosed in Table 1 of Menendez-Arias et al., as follows (the entire contents of which are incorporated by reference):
Figure 2020191243000121

C.トリプレット拡大障害を処置するためのプライム編集の使用
本明細書に記載のプライム編集システムまたはプライム編集(PE)システムは、ハンチントン病および他のトリヌクレオチド反復障害などの疾病を処置するために、トリヌクレオチド反復変異(または「トリプレット拡大疾患」)を縮小するために用いられ得る。トリヌクレオチド反復拡大障害は発達神経生物学が関わる複雑な進行性の障害であり、多くの場合には、認知および感覚運動機能に影響する。障害は遺伝学的な表現促進現象(すなわち、各世代での増大した重症度)を示す。DNA伸長または短縮は、通常は減数分裂的に(すなわち、配偶子形成の時の間に、または胚発生中に早期に)起こり、多くの場合には性バイアスを有し、いくつかの遺伝子は女性から受け継がれるときにのみ、他は男性からのみ伸長するということを意味する。ヒトでは、トリヌクレオチド反復拡大障害は転写または翻訳レベルどちらかで遺伝子サイレンシングを引き起こし得、これは本質的に遺伝子機能をノックアウトする。代替的には、トリヌクレオチド反復拡大障害は、大きい繰り返しアミノ酸配列を有して生成された変改されたタンパク質を引き起こし得る。これは、多くの場合にはドミナントネガティブな様式で(例えばポリグルタミン疾患)、タンパク質機能を無効化するかまたは変化させるかどちらかである。
C. Use of Prime Editing to Treat Triplet Expansion Disorders
The prime editing system or prime editing (PE) system described herein can be used to reduce trinucleotide repeat mutations (or "triplet expansion disorders") to treat diseases such as Huntington's disease and other trinucleotide repeat disorders. Trinucleotide repeat expansion disorders are complex progressive disorders that involve developmental neurobiology and often affect cognitive and sensorimotor functions. The disorders show genetic anticipation (i.e., increasing severity with each generation). DNA expansion or shortening usually occurs meiotically (i.e., during gamete formation or earlier during embryonic development) and often has a sex bias, meaning that some genes are expanded only when inherited from females and others only from males. In humans, trinucleotide repeat expansion disorders can cause gene silencing at either the transcriptional or translational level, which essentially knocks out gene function. Alternatively, trinucleotide repeat expansion disorders can cause altered proteins to be produced with large repeated amino acid sequences. This either disables or alters protein function, often in a dominant-negative manner (eg polyglutamine diseases).

理論によって拘束されることなしに、トリプレット拡大はDNA複製またはDNA修復合成の間のスリップによって引き起こされる。タンデム反復は互いに同一の配列を有するので、2つのDNA鎖間の塩基対形成は配列上の複数の点において生起し得る。これはDNA複製またはDNA修復合成の間の「ループアウト」構造の形成に至り得る。これは繰り返し配列の繰り返しのコピーに至り得、反復数を伸長させる。ハイブリッドRNA:DNA中間体が関わる追加の機序が提案されている。プライム編集は、害をなす繰り返しのコドントリプレットの1つ以上を欠失させることによって、これらのトリプレット拡大領域を縮減または消去するために用いられ得る。この使用のある態様では、図23が、プライム編集によってトリヌクレオチド反復配列を短縮または縮減するためのPEgRNAデザインの模式図を提供する。 Without being bound by theory, triplet expansion is caused by slippage during DNA replication or DNA repair synthesis. Because the tandem repeats have identical sequences to each other, base pairing between the two DNA strands can occur at multiple points along the sequence. This can lead to the formation of "loop-out" structures during DNA replication or DNA repair synthesis. This can lead to repeated copies of the repeat sequence, extending the number of repeats. Additional mechanisms involving hybrid RNA:DNA intermediates have been proposed. Prime editing can be used to reduce or eliminate these triplet expansion regions by deleting one or more of the offending repeat codon triplets. In one embodiment of this use, FIG. 23 provides a schematic of PEgRNA design for shortening or reducing trinucleotide repeat sequences by prime editing.

プライム編集は、カットされる部位へと標的化される充当されたPEgRNAを含むプライム編集因子によって、トリプレット反復領域の上流の領域へニックを入れることによって、トリプレット拡大領域を短縮するように実装され得る。それから、プライム編集因子は、健康な数のトリプレット反復(これは具体的な遺伝子および疾患に依存する)をコードする鋳型(すなわち、その編集鋳型)としてのPEgRNAに基づく新たなDNA鎖(ssDNAフラップ)を合成する。健康なトリプレット反復配列を含む新たに合成されたssDNA鎖は、また、反復の他端に隣接する配列にマッチする相同性の短いストレッチ(すなわち相同アーム)を包含するように合成される(赤色の鎖)。新たに合成された鎖の侵入、および新たに合成されたssDNAフラップによる内生DNAの爾後の置き換えは、短縮された反復アレルに至る。 Prime editing can be implemented to shorten the triplet expansion region by nicking a region upstream of the triplet repeat region with a prime editor containing a dedicated PEgRNA targeted to the site to be cut. The prime editor then synthesizes a new DNA strand (ssDNA flap) based on the PEgRNA as a template (i.e., its editing template) that encodes a healthy number of triplet repeats (this depends on the specific gene and disease). The newly synthesized ssDNA strand containing the healthy triplet repeat sequence is also synthesized to include a short stretch of homology (i.e., a homology arm) that matches the sequence adjacent to the other end of the repeat (red strand). Invasion of the newly synthesized strand and subsequent replacement of the endogenous DNA by the newly synthesized ssDNA flap leads to a shortened repeat allele.

具体的なトリヌクレオチド伸長障害に依存して、欠陥を誘導するトリプレット拡大は「トリヌクレオチド反復拡大タンパク質」において生起し得る。トリヌクレオチド反復拡大タンパク質は、トリヌクレオチド反復拡大障害を発生する感受性、トリヌクレオチド反復拡大障害の存在、トリヌクレオチド反復拡大障害の重症度、またはそれらのいずれかの組み合わせに関連するタンパク質の多様なセットである。トリヌクレオチド反復拡大障害は反復の型によって決定される2つのカテゴリーに分けられる。最も普通の反復はトリプレットCAGであり、これは遺伝子のコード領域に存在するときにはアミノ酸のグルタミン(Q)をコードする。よって、これらの障害はポリグルタミン(ポリQ)障害と言われ、次の疾患を含む:ハンチントン病(HD);球脊髄性筋萎縮症(SBMA);脊髄小脳失調症(SCA1、2、3、6、7、および17型);および歯状核赤核淡蒼球ルイ体萎縮症(DRPLA)。残りのトリヌクレオチド反復拡大障害にはCAGトリプレットが関わらないか、またはCAGトリプレットが遺伝子のコード領域にはないかどちらかであり、よって、非ポリグルタミン障害と言われる。非ポリグルタミン障害は、脆弱X症候群(FRAXA);脆弱XE精神遅滞(FRAXE);フリードライヒ運動失調症(FRDA);筋強直性ジストロフィー(DM);および脊髄小脳失調症(SCA 8および12型)を含む。 Depending on the specific trinucleotide expansion disorder, the triplet expansion inducing defect may occur in a "trinucleotide repeat expansion protein." Trinucleotide repeat expansion proteins are a diverse set of proteins that are associated with susceptibility to developing a trinucleotide repeat expansion disorder, the presence of a trinucleotide repeat expansion disorder, the severity of a trinucleotide repeat expansion disorder, or any combination thereof. Trinucleotide repeat expansion disorders are divided into two categories determined by the type of repeat. The most common repeat is the triplet CAG, which, when present in the coding region of a gene, codes for the amino acid glutamine (Q). Thus, these disorders are referred to as polyglutamine (polyQ) disorders and include the following diseases: Huntington's disease (HD); spinal-bulbar muscular atrophy (SBMA); spinocerebellar ataxia (SCA types 1, 2, 3, 6, 7, and 17); and dentatorubral-pallidoluysian atrophy (DRPLA). The remaining trinucleotide repeat expansion disorders either do not involve a CAG triplet or the CAG triplet is not in the coding region of the gene and are therefore referred to as non-polyglutamine disorders. Non-polyglutamine disorders include Fragile X syndrome (FRAXA); Fragile XE mental retardation (FRAXE); Friedreich's ataxia (FRDA); Myotonic dystrophy (DM); and Spinocerebellar ataxia (SCA types 8 and 12).

トリヌクレオチド反復拡大障害に関連するタンパク質は、トリヌクレオチド反復拡大障害に対するトリヌクレオチド反復拡大障害に関連するタンパク質の実験的関連に基づいて選択され得る。例えば、トリヌクレオチド反復拡大障害に関連するタンパク質の生産速度または循環濃度は、トリヌクレオチド反復拡大障害を欠く集団に対して相対的に、トリヌクレオチド反復拡大障害を有する集団において上昇または降下し得る。タンパク質レベルの違いは、ウエスタンブロット、免疫組織化学染色、酵素結合免疫吸着アッセイ(ELISA)、および質量分析を包含するがこれらに限定されないプロテオミクス技術を用いて評価され得る。代替的には、トリヌクレオチド反復拡大障害に関連するタンパク質はタンパク質をコードする遺伝子の遺伝子発現プロファイルを得ることによって同定され得、DNAマイクロアレイ分析、遺伝子発現の連続分析(SAGE)、および定量的リアルタイムポリメラーゼ連鎖反応(Q-PCR)を包含するがこれらに限定されないゲノム技術を用いる。 Proteins associated with trinucleotide repeat expansion disorders may be selected based on experimental association of the protein associated with trinucleotide repeat expansion disorders to trinucleotide repeat expansion disorders. For example, the production rate or circulating concentration of a protein associated with a trinucleotide repeat expansion disorder may be elevated or depressed in a population with a trinucleotide repeat expansion disorder relative to a population lacking a trinucleotide repeat expansion disorder. Differences in protein levels may be assessed using proteomic techniques, including but not limited to Western blot, immunohistochemical staining, enzyme-linked immunosorbent assay (ELISA), and mass spectrometry. Alternatively, proteins associated with trinucleotide repeat expansion disorders may be identified by obtaining gene expression profiles of genes encoding the proteins, using genomic techniques, including but not limited to DNA microarray analysis, serial analysis of gene expression (SAGE), and quantitative real-time polymerase chain reaction (Q-PCR).

プライム編集によって修正され得るトリヌクレオチド反復拡大障害に関連するタンパク質の限定しない例は、AR(アンドロゲン受容体)、FMR1(脆弱X精神遅滞1)、HTT(ハンチンチン)、DMPK(筋緊張性ジストロフィータンパク質キナーゼ)、FXN(フラタキシン)、ATXN2(アタキシン2)、ATN1(アトロフィン1)、FEN1(フラップ構造特異的エンドヌクレアーゼ1)、TNRC6A(トリヌクレオチド反復含有6A)、PABPN1(核ポリA結合タンパク質1)、JPH3(ジャンクトフィリン3)、MED15(メディエーター複合体サブユニット15)、ATXN1(アタキシン1)、ATXN3(アタキシン3)、TBP(TATAボックス結合タンパク質)、CACNA1A(電位依存性カルシウムチャネルP/Q型アルファ1Aサブユニット)、ATXN80S(ATXN8対向鎖(非タンパク質コード))、PPP2R2B(タンパク質ホスファターゼ2制御サブユニットBベータ)、ATXN7(アタキシン7)、TNRC6B(トリヌクレオチド反復含有6B)、TNRC6C(トリヌクレオチド反復含有6C)、CELF3(CUGBP Elav様ファミリーメンバー3)、MAB21L1(mab-21様1(C.elegans))、MSH2(mutSホモログ2結腸がん非ポリポーシス1型(E.coli))、TMEM185A(膜貫通タンパク質185A)、SIX5(SIXホメオボックス5)、CNPY3(canopy 3ホモログ(ゼブラフィッシュ))、FRAXE(脆弱部位、葉酸型、稀、fra(X)(q28)E)、GNB2(グアニンヌクレオチド結合タンパク質(Gタンパク質)ベータポリペプチド2)、RPL14(リボソームタンパク質L14)、ATXN8(アタキシン8)、INSR(インスリン受容体)、TTR(トランスサイレチン)、EP400(E1A結合タンパク質p400)、GIGYF2(GRB10相互作用GYFタンパク質2)、OGG1(8-オキソグアニンDNAグリコシラーゼ)、STC1(スタニオカルシン1)、CNDP1(カルノシンジペプチダーゼ1(メタロペプチダーゼM20ファミリー))、C10orf2(染色体10オープンリーディングフレーム2)、MAML3 mastermind様3(Drosophila)、DKC1(先天性角化不全症1、ジスケリン)、PAXIP1(PAX相互作用(転写活性化ドメイン)タンパク質1)、CASK(カルシウム/カルモジュリン依存性セリンタンパク質キナーゼ(MAGUKファミリー))、MAPT(微小管関連タンパク質tau)、SP1(Sp1転写因子)、POLG(ポリメラーゼ(DNA依存性)ガンマ)、AFF2(AF4/FMR2ファミリーメンバー2)、THBS1(トロンボスポンジン1)、TP53(腫瘍タンパク質p53)、ESR1(エストロゲン受容体1)、CGGBP1(CGGリプレット反復結合タンパク質1)、ABT1(基本転写活性化因子1)、KLK3(カリクレイン関連ペプチダーゼ3)、PRNP(プリオンタンパク質)、JUN(jun癌遺伝子)、KCNN3(カリウム中/小コンダクタンスカルシウム活性化チャネルサブファミリーNメンバー3)、BAX(BCL2関連Xタンパク質)、FRAXA(脆弱部位、葉酸型、稀、fra(X)(q27.3)A(巨睾丸、精神遅滞))、KBTBD10(kelch反復およびBTB(POZ)ドメイン含有10)、MBNL1(muscleblind様(Drosophila))、RAD51(RAD51ホモログ(RecAホモログ、E.coli)(S. cerevisiae))、NCOA3(核受容体コアクチベーター3)、ERDA1(伸長した反復ドメインCAG/CTG1)、TSC1(結節性硬化症1)、COMP(軟骨オリゴマーマトリックスタンパク質)、GCLC(グルタミン酸-システインリガーゼ触媒サブユニット)、RRAD(糖尿病に関連するRas関連)、MSH3(mutSホモログ3(E.coli))、DRD2(ドーパミン受容体D2)、CD44(CD44分子(インド人血液型))、CTCF(CCCTC結合因子(ジンクフィンガータンパク質))、CCND1(サイクリンD1)、CLSPN(クラスピンホモログ(Xenopus laevis))、MEF2A(筋細胞エンハンサー因子2A)、PTPRU(タンパク質チロシンホスファターゼ受容体型U)、GAPDH(グリセルアルデヒド-3-リン酸デヒドロゲナーゼ)、TRIM22(三節型モチーフ含有22)、WT1(ウィルムス腫瘍1)、AHR(アリール炭化水素受容体)、GPX1(グルタチオンペルオキシダーゼ1)、TPMT(チオプリンS-メチルトランスフェラーゼ)、NDP(ノリエ病(偽神経膠腫))、ARX(aristaless関連ホメオボックス)、MUS81(MUS81エンドヌクレアーゼホモログ(S.cerevisiae))、TYR(チロシナーゼ(眼皮膚白皮症IA))、EGR1(初期増殖応答1)、UNG(ウラシル-DNAグリコシラーゼ)、NUMBL(numbホモログ(Drosophila)様)、FABP2(腸脂肪酸結合タンパク質2)、EN2(engrailedホメオボックス2)、CRYGC(クリスタリンガンマC)、SRP14(シグナル認識粒子14kDa(相同的Alu RNA結合タンパク質))、CRYGBクリスタリンガンマB)、PDCD1(プログラム細胞死1)、HOXA1(ホメオボックスA1)、ATXN2L(アタキシン2様)、PMS2(PMS2減数分裂後分離増大2(S.cerevisiae))、GLA(ガラクトシダーゼアルファ)、CBL(Cas-Br-M(ネズミ)同種指向性レトロウイルス形質転換配列)、FTH1(フェリチン重鎖ポリペプチド1)、IL12RB2(インターロイキン12受容体ベータ2)、OTX2(orthodenticleホメオボックス2)、HOXA5(ホメオボックスA5)、POLG2(ポリメラーゼ(DNA依存性)ガンマ2補助的サブユニット)、DLX2(distal-lessホメオボックス2)、SIRPA(シグナル制御タンパク質アルファ)、OTX1(orthodenticleホメオボックス1)、AHRR(アリール炭化水素受容体リプレッサー)、MANF(中脳アストロサイト由来神経栄養因子)、TMEM158(膜貫通タンパク質158(遺伝子/偽遺伝子))、およびENSG00000078687を包含する。 Non-limiting examples of proteins associated with trinucleotide repeat expansion disorders that can be corrected by prime editing include AR (androgen receptor), FMR1 (Fragile X Mental Retardation 1), HTT (huntingtin), DMPK (myotonic dystrophy protein kinase), FXN (frataxin), ATXN2 (ataxin 2), ATN1 (atrophin 1), FEN1 (flap structure-specific endonuclease 1), TNRC6A (trinucleotide repeat-containing 6A), PABPN1 (nuclear polyA binding protein 1), JPH3 (junctophilin 3), MED 15 (Mediator complex subunit 15), ATXN1 (Ataxin 1), ATXN3 (Ataxin 3), TBP (TATA box binding protein), CACNA1A (Voltage-gated calcium channel P/Q type alpha 1A subunit), ATXN80S (ATXN8 opposing strand (non-protein coding)), PPP2R2B (Protein phosphatase 2 regulatory subunit B beta), ATXN7 (Ataxin 7), TNRC6B (Trinucleotide repeat-containing 6B), TNRC6C (Trinucleotide repeat-containing 6C), CELF3 (CUGBP Elav-like family member 3), MAB21L1 (mab-21-like 1 (C. elegans)), MSH2 (mutS homolog 2 colon cancer nonpolyposis type 1 (E. coli)), TMEM185A (Transmembrane protein 185A), SIX5 (SIX homeobox 5), CNPY3 (canopy 3 homolog (zebrafish)), FRAXE (fragile site, folate type, rare, fra(X)(q28)E), GNB2 (guanine nucleotide-binding protein (G protein) beta polypeptide 2), RPL14 (ribosomal protein L14), ATXN8 (ataxin 8), INSR (insulin receptor), TTR (transthyretin), EP400 (E1A-binding protein p400), GIGYF2 (GRB10-interacting GYF protein 2), OGG1 (8-oxoguanine DNA glycosylase), STC1 (stanniocalcin 1), CNDP1 (carnosine dipeptidase 1 (metallopeptidase M20 family)), C10orf2 (chromosome 10 open reading frame 2), MAML3 mastermind-like 3 (Drosophila), DKC1 (dyskeratosis congenita 1, dyskerin), PAXIP1 (PAX interacting (transcription activation domain) protein 1), CASK (calcium/calmodulin-dependent serine protein kinase (MAGUK family)), MAPT (microtubule-associated protein tau), SP1 (Sp1 transcription factor), POLG (polymerase (DNA-dependent) gamma), AFF2 (AF4/FMR2 family member 2), THBS1 (thrombospondin 1), TP53 (tumor protein p53), ESR1 (estrogen receptor 1), CGGBP1 (CGG triplet repeat binding protein protein 1), ABT1 (basal transcription activator 1), KLK3 (kallikrein-related peptidase 3), PRNP (prion protein), JUN (jun oncogene), KCNN3 (potassium medium/small conductance calcium-activated channel subfamily N member 3), BAX (BCL2-associated X protein), FRAXA (fragile site, folate-type, rare, fra(X)(q27.3)A (macrothrimi, mental retardation)), KBTBD10 (kelch repeat and BTB(POZ) domain containing 10), MBNL1 (muscleblind-like (Drosophila)), RAD51 (RAD51 homolog (RecA homolog, E. coli) (S. cerevisiae), NCOA3 (nuclear receptor coactivator 3), ERDA1 (expanded repeat domain CAG/CTG1), TSC1 (tuberous sclerosis complex 1), COMP (cartilage oligomeric matrix protein), GCLC (glutamate-cysteine ligase catalytic subunit), RRAD (Ras-related associated with diabetes), MSH3 (mutS homolog 3 (E. coli)), DRD2 (dopamine receptor D2), CD44 (CD44 molecule (Indian blood group)), CTCF (CCCTC-binding factor (zinc finger protein)), CCND1 (cyclin D1), CLSPN (claspin homolog (Xenopus laevis), MEF2A (Myocyte enhancer factor 2A), PTPRU (Protein tyrosine phosphatase receptor type U), GAPDH (Glyceraldehyde-3-phosphate dehydrogenase), TRIM22 (Tripartite motif-containing 22), WT1 (Wilms' tumor 1), AHR (Aryl hydrocarbon receptor), GPX1 (Glutathione peroxidase 1), TPMT (Thiopurine S-methyltransferase), NDP (Norrie's disease (pseudoglioma)), ARX (aristaless-associated homeobox), MUS81 (MUS81 endonuclease homolog (S. cerevisiae)), TYR (tyrosinase (oculocutaneous albinism IA)), EGR1 (early growth response 1), UNG (uracil-DNA glycosylase), NUMBL (numb homolog (Drosophila)-like), FABP2 (intestinal fatty acid binding protein 2), EN2 (engrailed homeobox 2), CRYGC (crystallin gamma C), SRP14 (signal recognition particle 14 kDa (homologous Alu RNA-binding protein), CRYGB crystallin gamma B), PDCD1 (programmed cell death 1), HOXA1 (homeobox A1), ATXN2L (ataxin 2-like), PMS2 (PMS2 postmeiotic segregation enhanced 2 (S. cerevisiae)), GLA (galactosidase alpha), CBL (Cas-Br-M (murine) ecotropic retroviral transforming sequence), FTH1 (ferritin heavy chain polypeptide 1), IL12RB2 (interleukin-12 receptor beta 2), OTX2 (orthodenticle homeobox A1), IL12RB3 (interleukin-12 receptor beta 2), IL12RB4 (interleukin-12 receptor beta 2), IL12RB5 (interleukin-12 receptor beta 2), IL12RB6 (interleukin-12 receptor beta 2), IL12RB7 (interleukin-12 receptor beta 2), IL12RB8 (interleukin-12 receptor beta 2), IL12RB9 (interleukin-12 receptor beta 2), IL12RB1 (interleukin-12 receptor beta 2), IL12RB2 ...3 (interleukin-12 receptor beta 2), IL12RB4 (interleukin-12 receptor beta 2), IL12RB5 (interleukin-12 receptor beta 2), IL12RB6 (interleukin-12 receptor beta 2), IL12RB7 (interleukin-12 receptor beta 2), IL12RB8 (interleukin-12 receptor beta 2), IL12RB9 (interleukin- box 2), HOXA5 (homeobox A5), POLG2 (polymerase (DNA-dependent) gamma 2 auxiliary subunit), DLX2 (distal-less homeobox 2), SIRPA (signal regulatory protein alpha), OTX1 (orthodenticle homeobox 1), AHRR (aryl hydrocarbon receptor repressor), MANF (mesencephalic astrocyte-derived neurotrophic factor), TMEM158 (transmembrane protein 158 (gene/pseudogene)), and ENSG00000078687.

本明細書に開示のプライム編集因子は、次のポリグルタミントリプレット拡大疾患遺伝子を包含する、上で指示されている疾患タンパク質のいずれかのトリプレット反復拡大領域を縮小するために用いられ得る(これらは、プライム編集によって丸ごとまたは部分的に除去され得る病原性反復の具体的位置付けを示す):

Figure 2020191243000122

Figure 2020191243000123
The prime editing elements disclosed herein can be used to reduce triplet repeat expansion regions in any of the disease proteins indicated above, including the following polyglutamine triplet expansion disease genes (which indicate the specific locations of the pathogenic repeats that can be removed in whole or in part by prime editing):
Figure 2020191243000122

Figure 2020191243000123

本明細書に開示のプライム編集因子は、次の非ポリグルタミントリプレット拡大疾患遺伝子に典型的に見出されるトリプレット反復拡大領域を縮小するためにもまた用いられ得る:

Figure 2020191243000124
The prime editors disclosed herein can also be used to shrink triplet repeat expansion regions typically found in the following non-polyglutamine triplet expansion disease genes:
Figure 2020191243000124

プライム編集は、トリプレット拡大領域の少なくとも1つのコドンを欠失するようにデザインされている編集鋳型を有するPEgRNAを用いて、トリプレット拡大領域を縮小するために実装され得る。他の態様において、健康な(すなわち、疾患を生ずることに関連しない)数のトリプレット反復に到達するために、これのためにプライム編集に用いるためのPEgRNAは、少なくとも1、または2、または3、または4、または5、または6、または7、または8、または9、または10、または11、または12、または13、または14、または15、または16、または17、または18、または19、または20、または21、または22、または23、または24、または25、または26、または27、または28、または29、または30、または31、または32、または33、または34、または35、または36、または37、または38、または39、または40、または41、または42、または43、または44、または45、または46、または47、または48、または49、または50、または51、または52、または53、または54、または55、または56、または57、または58、または59、または60、または61、または62、または63、または64、または65、または66、または67、または68、または69、または70、または71、または72、または73、または74、または75、または76、または77、または78、または79、または80、または81、または82、または83、または84、または85、または86、または87、または88、または89、または90、または91、または92、または93、または94、または95、または96、または97、または98、または99、または100、またはより多くのコドンをトリプレット拡大領域から欠失させるために用いられる。 Prime editing can be implemented to reduce the triplet expansion region using a PEgRNA having an editing template designed to delete at least one codon in the triplet expansion region. In other embodiments, to reach a healthy (i.e., not associated with causing disease) number of triplet repeats, the PEG RNA for use in priming editing therefor has at least 1, or 2, or 3, or 4, or 5, or 6, or 7, or 8, or 9, or 10, or 11, or 12, or 13, or 14, or 15, or 16, or 17, or 18, or 19, or 20, or 21, or 22, or 23, or 24, or 25, or 26, or 27, or 28, or 29, or 30, or 31, or 32, or 33, or 34, or 35, or 36, or 37, or 38, or 39, or 40, or 41, or 42, or 43, or 44, or 45, or 46, or 47, or is used to delete 48, or 49, or 50, or 51, or 52, or 53, or 54, or 55, or 56, or 57, or 58, or 59, or 60, or 61, or 62, or 63, or 64, or 65, or 66, or 67, or 68, or 69, or 70, or 71, or 72, or 73, or 74, or 75, or 76, or 77, or 78, or 79, or 80, or 81, or 82, or 83, or 84, or 85, or 86, or 87, or 88, or 89, or 90, or 91, or 92, or 93, or 94, or 95, or 96, or 97, or 98, or 99, or 100, or more codons from the triplet expansion region.

他の態様において、健康な(すなわち、疾患を生ずることに関連しない)数のトリプレット反復に到達するために、これのためにプライム編集に用いるためのPEgRNAは、少なくとも1、または2、または3、または4、または5、または6、または7、または8、または9、または10、または11、または12、または13、または14、または15、または16、または17、または18、または19、または20、またはより多くのコドンをトリプレット拡大領域から欠失させるために用いられる。 In other embodiments, to reach a healthy (i.e., not associated with causing disease) number of triplet repeats, the PEG RNA for use in priming editing therefor is used to delete at least 1, or 2, or 3, or 4, or 5, or 6, or 7, or 8, or 9, or 10, or 11, or 12, or 13, or 14, or 15, or 16, or 17, or 18, or 19, or 20, or more codons from the triplet expansion region.

他の態様において、健康な(すなわち、疾患を生ずることに関連しない)数のトリプレット反復に到達するために、これのためにプライム編集に用いるためのPEgRNAは、少なくとも1、または2、または3、または4、または5、または6、または7、または8、または9、または10、または11、または12、または13、または14、または15、またはより多くのコドンをトリプレット拡大領域から欠失させるために用いられる。 In other embodiments, to reach a healthy (i.e., not associated with causing disease) number of triplet repeats, a PEG RNA for use in prime editing therefor is used to delete at least 1, or 2, or 3, or 4, or 5, or 6, or 7, or 8, or 9, or 10, or 11, or 12, or 13, or 14, or 15, or more codons from the triplet expansion region.

他の態様において、健康な(すなわち、疾患を生ずることに関連しない)数のトリプレット反復に到達するために、これのためにプライム編集に用いるためのPEgRNAは、少なくとも1、または2、または3、または4、または5、または6、または7、または8、または9、または10、またはより多くのコドンをトリプレット拡大領域から欠失させるために用いられる。 In other embodiments, to reach a healthy (i.e., not associated with causing disease) number of triplet repeats, a PEgRNA for use in prime editing is used to delete at least 1, or 2, or 3, or 4, or 5, or 6, or 7, or 8, or 9, or 10, or more codons from the triplet expansion region.

プライム編集は、いずれかのトリプレット拡大領域、例えばBudworth et al.,"A Brief History of Triplet Repeat Diseases,"Methods Mol Biol,2013,1010:3-17、US20011/00165540A1(動物のトリヌクレオチド反復拡大障害に関連する遺伝子のゲノム編集)、US2016/0355796A1(crispr-casシステムの組成物およびヌクレオチド反復障害への使用の方法)に記載されているものを修正するように構成され得る。 Prime editing can be configured to correct any triplet expansion region, such as those described in Budworth et al., "A Brief History of Triplet Repeat Diseases," Methods Mol Biol, 2013, 1010:3-17, US20011/00165540A1 (genome editing of genes associated with trinucleotide repeat expansion disorders in animals), and US2016/0355796A1 (compositions of the crispr-cas system and methods of use for nucleotide repeat disorders).

種々の態様において、本開示は、欠陥遺伝子にトリヌクレオチド反復拡大領域を有する細胞への使用にとって好適なプライム編集構築物を提供し、(a)napDNAbpと逆転写酵素とを含むプライム編集因子融合体、(b)トリヌクレオチド反復拡大領域を標的化するスペーサー配列とトリヌクレオチド反復拡大領域の除去をコードする編集鋳型を含む伸長アームとを含むPEgRNAを含む。 In various aspects, the present disclosure provides a prime editing construct suitable for use in a cell having a trinucleotide repeat expansion region in a defective gene, comprising (a) a prime editing factor fusion comprising napDNAbp and a reverse transcriptase, and (b) a PEgRNA comprising a spacer sequence that targets the trinucleotide repeat expansion region and an extension arm that comprises an editing template that codes for removal of the trinucleotide repeat expansion region.

種々の他の態様において、本開示は、プライム編集を用いて細胞の欠陥遺伝子のトリヌクレオチド反復拡大領域の全てまたは部分を欠失させるための方法を提供し、napDNAbpと逆転写酵素とを含むプライム編集因子融合体、およびトリヌクレオチド反復拡大領域を標的化するスペーサー配列とトリヌクレオチド反復拡大領域の除去をコードする編集鋳型を含む伸長アームとを含むPEgRNAに、細胞を接触させることを含む。 In various other embodiments, the disclosure provides a method for deleting all or a portion of a trinucleotide repeat expansion region of a defective gene in a cell using prime editing, comprising contacting the cell with a prime editor fusion comprising napDNAbp and a reverse transcriptase, and a PEgRNA comprising a spacer sequence that targets the trinucleotide repeat expansion region and an extension arm that comprises an editing template that encodes for removal of the trinucleotide repeat expansion region.

種々の態様において、トリヌクレオチド反復は、繰り返すCTG、CAG、CGG、CCG、GAA、またはTTCトリヌクレオチドを含む。 In various embodiments, the trinucleotide repeat comprises repeating CTG, CAG, CGG, CCG, GAA, or TTC trinucleotides.

種々の他の態様において、テトラヌクレオチド反復、ペンタヌクレオチド反復、またはヘキサヌクレオチド反復である。 In various other embodiments, the repeats are tetranucleotide, pentanucleotide, or hexanucleotide.

D.ペプチドタグ付けのためのプライム編集の使用
別の側面において、本開示は、プライム編集を用いてタンパク質上に1つ以上のペプチドタグを遺伝子的にグラフトするために本明細書に記載のプライム編集因子を用いるための方法を提供する。より具体的には、本開示は、1つ以上のペプチドタグをタンパク質上に遺伝子的に組み入れるための方法を提供し:タンパク質をコードする標的ヌクレオチド配列を、1つ以上のペプチドタグをコードする第2のヌクレオチド配列をその中に挿入するように構成されたプライム編集因子と接触させて、タンパク質タグに融合されたタンパク質を含む融合タンパク質をコードする組み換えヌクレオチド配列をもたらすことを含む。
D. Use of Prime Editing for Peptide Tagging
In another aspect, the present disclosure provides a method for using a prime editor described herein to genetically graft one or more peptide tags onto a protein using prime editing. More specifically, the present disclosure provides a method for genetically incorporating one or more peptide tags onto a protein, comprising: contacting a target nucleotide sequence encoding a protein with a prime editor configured to insert a second nucleotide sequence encoding one or more peptide tags therein, resulting in a recombinant nucleotide sequence encoding a fusion protein comprising the protein fused to the protein tag.

他の態様において、本開示は、目当てのペプチドと1つ以上のペプチドタグとを含む融合タンパク質を作るための方法を提供し、方法は:タンパク質をコードする標的ヌクレオチド配列を、1つ以上のペプチドタグをコードする第2のヌクレオチド配列をその中に挿入するように構成されたプライム編集因子と接触させて、タンパク質タグに融合されたタンパク質を含む融合タンパク質をコードする組み換えヌクレオチド配列をもたらすことを含む。 In another aspect, the disclosure provides a method for making a fusion protein comprising a peptide of interest and one or more peptide tags, the method comprising: contacting a target nucleotide sequence encoding a protein with a primed editing element configured to insert therein a second nucleotide sequence encoding one or more peptide tags, resulting in a recombinant nucleotide sequence encoding a fusion protein comprising the protein fused to the protein tag.

種々の態様において、標的ヌクレオチド配列はゲノムDNA上の目当ての特定の遺伝子である。目当ての遺伝子は目当てのタンパク質をコードし得る(例えば、受容体、酵素、治療学的タンパク質、膜タンパク質、輸送タンパク質、シグナル伝達タンパク質、または免疫学的タンパク質など)。目当ての遺伝子はRNA分子をもまたコードし得、メッセンジャーRNA(mRNA)、トランスファーRNA(tRNA)、リボソームRNA(rRNA)、核内低分子RNA(snRNA)、アンチセンスRNA、ガイドRNA、マイクロRNA(miRNA)、低分子干渉RNA(siRNA)、およびセルフリーRNA(cfRNA)を包含するが、これらに限定されない。 In various embodiments, the target nucleotide sequence is a specific gene of interest on genomic DNA. The gene of interest may encode a protein of interest (e.g., a receptor, an enzyme, a therapeutic protein, a membrane protein, a transport protein, a signaling protein, or an immunological protein, etc.). The gene of interest may also encode an RNA molecule, including, but not limited to, messenger RNA (mRNA), transfer RNA (tRNA), ribosomal RNA (rRNA), small nuclear RNA (snRNA), antisense RNA, guide RNA, microRNA (miRNA), small interfering RNA (siRNA), and cell-free RNA (cfRNA).

ペプチドタグは、分離、精製、視覚化、可溶化、または検出などの目的で、1つ以上の機能をタンパク質に授けるいずれかのペプチドタグまたはそのバリアントであり得る。ペプチドタグは、「アフィニティータグ」(タンパク質精製を容易化するため)、「可溶化タグ」(タンパク質の適切なフォールディングを補助するため)、「クロマトグラフィータグ」(タンパク質のクロマトグラフィー特性を変改するため)、「エピトープタグ」(高親和性抗体に結合するため)、および「蛍光タグ」(細胞のまたはin vitroのタンパク質の視覚化を容易化するため)を包含し得る。ペプチドタグの例は次のタグを包含するが、これらに限定されない:

Figure 2020191243000125

Figure 2020191243000126
A peptide tag can be any peptide tag or variant thereof that confers one or more functions to a protein, such as for purposes of separation, purification, visualization, solubilization, or detection. Peptide tags can include "affinity tags" (to facilitate protein purification), "solubilization tags" (to aid in proper folding of the protein), "chromatography tags" (to alter the chromatographic properties of the protein), "epitope tags" (to bind high affinity antibodies), and "fluorescent tags" (to facilitate visualization of the protein in cells or in vitro). Examples of peptide tags include, but are not limited to, the following tags:
Figure 2020191243000125

Figure 2020191243000126

ペプチドタグは次のアフィニティータグ(タンパク質の分離および/または精製のため)でもまたあり得る(Kimple et al.,"Overview of Affinity Tags for Protein Purification,"Curr Protoc Protein Sci,2013,73:Unit-9.9の表9.9.1に記載されているとおり。これは参照によって本願に組み込まれる)。

Figure 2020191243000127
The peptide tag can also be an affinity tag (for protein isolation and/or purification) (as described in Table 9.9.1 of Kimple et al., "Overview of Affinity Tags for Protein Purification," Curr Protoc Protein Sci, 2013, 73:Unit-9.9, which is incorporated herein by reference).
Figure 2020191243000127

具体的な態様では、ペプチドタグはHis6タグ、FLAGタグ、V5タグ、GCN4タグ、HAタグ、Mycタグ、FIAsH/ReAsHタグ、ソルターゼ基質、パイクランプを包含し得る。 In specific embodiments, peptide tags may include His 6 tag, FLAG tag, V5 tag, GCN4 tag, HA tag, Myc tag, FIAsH/ReAsH tag, sortase substrate, pike clamp.

種々の態様において、ペプチドタグは、タンパク質蛍光標識、免疫沈降、イムノブロッティング、免疫組織化学、タンパク質動員、誘導可能なタンパク質デグロン、およびゲノムワイドスクリーニングを包含する適用に用いられ得る。 In various embodiments, peptide tags can be used in applications including protein fluorescent labeling, immunoprecipitation, immunoblotting, immunohistochemistry, protein mobilization, inducible protein degrons, and genome-wide screening.

種々の他の態様において、ペプチドタグは、タンパク質自己スプライシング機能を組み入れるためにインテイン配列を包含し得る。本願において用いられる用語「インテイン」は、生命の全てのドメインからの生物に見出される自己プロセシングポリペプチドドメインを言う。インテイン(介在タンパク質)は、タンパク質スプライシングとして公知の固有の自己プロセシングイベントを実行する。これにおいては、それは2つのペプチド結合の切断によってそれ自体をより大きい前駆体ポリペプチドから切除、プロセスにおいて、新たなペプチド結合の形成によってフランキングするエクステイン(外部タンパク質)配列をライゲーションする。インテイン遺伝子は他のタンパク質コード遺伝子内にインフレームで埋め込まれて見出されるので、この再構成は翻訳後に(またはことによると共翻訳的に)生起する。さらにその上、インテインによって媒介されるタンパク質スプライシングは自発的である;それは外部の因子またはエネルギー源ではなくインテインドメインのフォールディングのみを要求する。このプロセスは、「分裂インテイン」によるトランスタンパク質スプライシングの天然のプロセスと対比してシスタンパク質スプライシングとしてもまた公知である。インテインは自己スプライシングRNAイントロンのタンパク質等価物であり(Perler et al.,Nucleic Acids Res.22:1125-1127(1994)を見よ)、これらは前駆体タンパク質からのそれら自体の切除を触媒し、エクステインとして公知のフランキングタンパク質配列の付随的融合を有する(Perler et al.,Curr.Opin.Chem.Biol.1:292-299(1997);Perler,F.B.Cell 92(1):1-4(1998);Xu et al.,EMBO J. 15(19):5146-5153(1996)において総説されている)。 In various other embodiments, the peptide tag may include an intein sequence to incorporate protein self-splicing functionality. The term "intein" as used herein refers to a self-processing polypeptide domain found in organisms from all domains of life. An intein (intercalating protein) performs a unique self-processing event known as protein splicing, in which it excises itself from a larger precursor polypeptide by cleavage of two peptide bonds, ligating flanking extein (external protein) sequences in the process by forming new peptide bonds. Since intein genes are found embedded in-frame within other protein-coding genes, this rearrangement occurs post-translationally (or possibly co-translationally). Furthermore, intein-mediated protein splicing is spontaneous; it requires only the folding of the intein domain, not external factors or energy sources. This process is also known as cis protein splicing, in contrast to the natural process of trans protein splicing by "split inteins". Inteins are the protein equivalents of self-splicing RNA introns (see Perler et al., Nucleic Acids Res. 22:1125-1127 (1994)), which catalyze their own excision from precursor proteins and have the concomitant fusion of flanking protein sequences known as exteins (reviewed in Perler et al., Curr. Opin. Chem. Biol. 1:292-299 (1997); Perler, F.B. Cell 92(1):1-4 (1998); Xu et al., EMBO J. 15(19):5146-5153 (1996)).

タンパク質スプライシングプロセスの機序は多大に詳細に研究されており(Chong,et al.,J.Biol.Chem.1996,271,22159-22168;Xu,M-Q & Perler,F.B.EMBO Journal,1996,15,5146-5153)、保存されたアミノ酸がインテインおよびエクステインスプライシング点に見出されている(Xu,et al.,EMBO Journal,1994,13 5517-522)。 The mechanism of protein splicing process has been studied in great detail (Chong,et al.,J.Biol.Chem.1996,271,22159-22168;Xu,M-Q & Perler,F.B.EMBO Journal,1996,15,5146-5153), and conserved amino acids have been found at intein and extein splicing points (Xu,et al.,EMBO Journal,1994,13 5517-522).

インテインは2つの別個に転写および翻訳される遺伝子によってコードされる2つのフラグメントとしてもまた存在し得る。これらの所謂分裂インテインは自己会合し(self-associate)、タンパク質-スプライシング活性をtransで触媒する。分裂インテインは、多様なシアノ細菌および古細菌において同定されている(Caspi et al,Mol Microbiol.50:1569-1577(2003);Choi J.et al,J Mol Biol.556:1093-1106(2006.);Dassa B.et al,Biochemistry.46:322-330(2007.);Liu X. and Yang J.,J Biol Chem.275:26315-26318(2003);Wu H.et al.Proc Natl Acad Sci USA.£5:9226-9231(1998.);およびZettler J.et al,FEBS Letters.553:909-914(2009))が、これまでbut have not been found in 真核生物からは見出されていない。近年、環境メタゲノムデータの生物情報学的(bioinformatic)分析から、新規ゲノム配置をもつ26の種々の遺伝子座が明らかにされた。各遺伝子座にて、保存された酵素コード領域は分裂インテインによって遮られており、独立型の(freestanding)エンドヌクレアーゼ遺伝子が、インテインサブドメインをコードする節(sections)間に挿入されている。それらのうち、5つの座位が完全にアセンブリされた:DNAヘリカーゼ(gp41-l、gp41-8);イノシン-5'-一リン酸デヒドロゲナーゼ(IMPDH-1);およびリボヌクレオチドレダクターゼ触媒サブユニット(NrdA-2およびNrdJ-1)である。このばらばらになった遺伝子編成は主にファージに存在するように見える(Dassa et al,Nucleic Acids Research.57:2560-2573(2009))。 Inteins can also exist as two fragments encoded by two separately transcribed and translated genes. These so-called split inteins self-associate and catalyze protein-splicing activity in trans. Split inteins have been identified in a variety of cyanobacteria and archaea (Caspi et al, Mol Microbiol. 50:1569-1577 (2003); Choi J. et al, J Mol Biol. 556:1093-1106 (2006); Dassa B. et al, Biochemistry. 46:322-330 (2007); Liu X. and Yang J., J Biol Chem. 275:26315-26318 (2003); Wu H. et al. Proc Natl Acad Sci USA. £5:9226-9231 (1998); and Zettler J. et al, FEBS Letters. 553:909-914 (2009)), but have not been found in eukaryotes. Recently, bioinformatic analysis of environmental metagenomic data has revealed 26 diverse loci with novel genomic arrangements. At each locus, conserved enzyme-coding regions are interrupted by split inteins, and freestanding endonuclease genes are inserted between sections encoding intein subdomains. Of these, five loci have been fully assembled: DNA helicase (gp41-l, gp41-8); inosine-5'-monophosphate dehydrogenase (IMPDH-1); and ribonucleotide reductase catalytic subunit (NrdA-2 and NrdJ-1). This fragmented gene organization appears to be primarily present in phages (Dassa et al, Nucleic Acids Research. 57:2560-2573 (2009)).

ある態様において、本明細書に記載のプライム編集因子は、分裂インテインタグを2つの異なるタンパク質上に挿入するために用いられ得、共発現されるときにそれらの細胞内ライゲーションを引き起こして融合タンパク質を形成する。タンパク質トランススプライシングでは、1つの前駆体タンパク質はNインテインによって後続されるNエクステインパーツからなり、別の前駆体タンパク質はCエクステインパーツによって後続されるCインテインからなり、トランススプライシング反応(一緒にNおよびCインテインによって触媒される)が2つのインテイン配列を切除、2つのエクステイン配列をペプチド結合によって連結する。酵素反応であるタンパク質トランススプライシングは、非常に低い(例えばマイクロモル)濃度のタンパク質で働き得、生理条件下において実行され得る。 In some embodiments, the prime editors described herein can be used to insert split intein tags onto two different proteins, which when co-expressed cause their intracellular ligation to form a fusion protein. In protein trans-splicing, one precursor protein consists of an N extein part followed by an N intein, and another precursor protein consists of a C intein followed by a C extein part, and the trans-splicing reaction (catalyzed by the N and C inteins together) excises the two intein sequences and links the two extein sequences by a peptide bond. Protein trans-splicing, an enzymatic reaction, can work at very low (e.g., micromolar) concentrations of proteins and can be performed under physiological conditions.

分裂インテインNpu DnaEは、タンパク質トランススプライシング反応について報告された最も高い速度を有するとして特徴付けられた。加えて、Npu DnaEタンパク質スプライシング反応は、異なるエクステイン配列、6から37℃の温度、および最高で6Mの尿素の存在についてロバストかつ高収量と考慮される(Zettler J.et al,FEBS Letters.553:909-914(2009);Iwai I.et al,FEBS Letters 550:1853-1858(2006))。予想されたとおり、これらのインテインのNドメインにおけるCysl Ala変異が導入されたときには、当初のNからSのアシルシフト、よってタンパク質スプライシングがブロックされた。残念ながら、C末端切断反応もまたほとんど完全に阻害された。N末端の切れやすいペプチド結合におけるアシルシフトに対するC末端スプライスジャンクションにおけるアスパラギン環化の依存性は、天然に分裂されたDnaEインテインアレルに普通の固有の特性であるように見える(Zettler J.et al.FEBS Letters.555:909-914(2009))。 The split intein Npu DnaE was characterized as having the highest rate reported for a protein trans-splicing reaction. In addition, the Npu DnaE protein splicing reaction is considered robust and high-yielding for different extein sequences, temperatures from 6 to 37°C, and the presence of up to 6M urea (Zettler J. et al, FEBS Letters. 553:909-914 (2009); Iwai I. et al, FEBS Letters 550:1853-1858 (2006)). As expected, when a Cysl Ala mutation in the N domain of these inteins was introduced, the initial N to S acyl shift and thus protein splicing was blocked. Unfortunately, the C-terminal cleavage reaction was also almost completely inhibited. The dependence of asparagine cyclization at the C-terminal splice junction on acyl shift at the N-terminal scissile peptide bond appears to be a common, intrinsic property of naturally split DnaE intein alleles (Zettler J. et al. FEBS Letters. 555:909-914 (2009)).

分裂インテインによって触媒されるタンパク質トランススプライシングは、タンパク質ライゲーションのための全く酵素的な方法を提供する。分裂インテインは、夫々NインテインおよびCインテインという名称の2つのピースへと分裂された本質的に一続きのインテイン(例えばミニインテイン)である。分裂インテインのNインテインおよびCインテインは、非共有結合的に会合して活性なインテインを形成し、一続きのインテインがするのと本質的に同じやり方でスプライシング反応を触媒し得る。分裂インテインは天然に見出され、実験室でもまた操作されている。本願において用いられる用語「分裂インテイン」は、1つ以上のペプチド結合切断がN末端およびC末端アミノ酸配列の間に存在するいずれかのインテインを言い、その結果、N末端およびC末端配列が別個の分子になり、これらは、トランススプライシング反応について機能的であるインテインへと非共有結合的に再会合または再構成し得る。いずれかの触媒的に活性なインテインまたはそのフラグメントが、本発明の方法への使用のための分裂インテインを導出するために用いられ得る。例えば、一側面において、分裂インテインは真核生物インテインに由来し得る。別の側面において、分裂インテインは細菌インテインに由来し得る。別の側面において、分裂インテインは古細菌インテインに由来し得る。好ましくは、そのように導出された分裂インテインは、トランススプライシング反応を触媒することにとって必須のアミノ酸配列のみを所有するであろう。 Protein trans-splicing catalyzed by split inteins provides a purely enzymatic method for protein ligation. A split intein is essentially a continuous intein (e.g., a mini-intein) that has been split into two pieces, named N and C inteins, respectively. The N and C inteins of a split intein can non-covalently associate to form an active intein and catalyze a splicing reaction in essentially the same way that a continuous intein does. Split inteins are found in nature and have also been engineered in the laboratory. The term "split intein" as used herein refers to any intein in which one or more peptide bond cleavages exist between the N- and C-terminal amino acid sequences, such that the N- and C-terminal sequences become separate molecules that can non-covalently reassociate or reconstitute into an intein that is functional for a trans-splicing reaction. Any catalytically active intein or fragment thereof can be used to derive a split intein for use in the methods of the invention. For example, in one aspect, the split intein can be derived from a eukaryotic intein. In another aspect, the split intein can be derived from a bacterial intein. In another aspect, the split intein can be derived from an archaeal intein. Preferably, the split intein so derived will possess only the amino acid sequences essential for catalyzing the trans-splicing reaction.

分裂インテインは、ミニインテインの構造上に見出される-12の保存されたベータ鎖間の構造化されていないループまたは介在アミノ酸配列中に1つ以上の分裂部位を操作することによって、一続きのインテインから生出され得る。分裂の生出が、タンパク質スプライシング活性が失われる十分な度合まではインテインの構造、特に構造化されたベータ鎖を遮断しないであろうという条件で、ベータ鎖間の領域内の分裂部位の位置のいくらかのフレキシビリティーが存在し得る。 Split inteins can be generated from a stretch of inteins by engineering one or more split sites into the unstructured loop or intervening amino acid sequence between the -12 conserved beta strands found on the mini-intein structure. There can be some flexibility in the location of the split site within the region between the beta strands, provided that the creation of the split would not interrupt the structure of the intein, particularly the structured beta strands, to a sufficient degree that protein splicing activity is lost.

本明細書に記載のプライム編集因子は、ペプチドタグ(インテインを包含する)を目当てのタンパク質のC末端の端に組み込み得る。他の態様において、ペプチドタグ(インテインを包含する)は目当てのタンパク質のN末端の端に組み込まれ得る。ペプチドタグは目当てのタンパク質の内側にもまた組み込まれ得る。本明細書に記載のプライム編集因子によって生出されるもたらされる融合タンパク質は、次の構造を有し得る: The prime editors described herein can incorporate a peptide tag (including an intein) at the C-terminal end of a protein of interest. In other embodiments, a peptide tag (including an intein) can be incorporated at the N-terminal end of a protein of interest. A peptide tag can also be incorporated internally into a protein of interest. The resulting fusion protein produced by the prime editors described herein can have the following structure:

[目当てのタンパク質]-[ペプチドタグ]; [protein of interest]-[peptide tag];

[ペプチドタグ]-[目当てのタンパク質];または [peptide tag]-[protein of interest]; or

[目当てのタンパク質-N末端領域]-[ペプチドタグ]-[目当てのタンパク質-C末端領域]。 [N-terminal region of the protein of interest]-[peptide tag]-[C-terminal region of the protein of interest].

ペプチドタグ付けへの使用のためのガイドRNAデザインの原理は、至る所でペプチドタグ付けに適用され得る。例えば、1つの態様では、ペプチドタグ付けのためのPEgRNA構造は次の構造を有し得る:5'-[スペーサー配列]-[gRNAコアまたは骨格]-[伸長アーム]-3'。伸長アームは、5'から3'方向に、相同アーム、編集鋳型(ペプチドタグをコードする配列を含む)、およびプライマー結合部位を含む。この構成は図3Dおよび図24に図示されている。 The principles of guide RNA design for use in peptide tagging can be applied to peptide tagging throughout. For example, in one embodiment, a PEgRNA structure for peptide tagging can have the following structure: 5'-[spacer sequence]-[gRNA core or backbone]-[extension arm]-3'. The extension arm contains, in the 5' to 3' direction, a homology arm, an editing template (containing a sequence encoding the peptide tag), and a primer binding site. This configuration is illustrated in Figure 3D and Figure 24.

別の態様では、ペプチドタグ付けのためのPEgRNA構造は、次の構造を有し得る:5'-[伸長アーム]-[スペーサー配列]-[gRNAコアまたは骨格]-3'。伸長アームは、5'から3'方向に、相同アーム、編集鋳型(ペプチドタグをコードする配列を含む)、およびプライマー結合部位を含む。この構成は図3Eに図示されている。 In another embodiment, the PEgRNA structure for peptide tagging can have the following structure: 5'-[extension arm]-[spacer sequence]-[gRNA core or backbone]-3'. The extension arm contains, in the 5' to 3' direction, a homology arm, an editing template (containing a sequence encoding the peptide tag), and a primer binding site. This configuration is illustrated in Figure 3E.

プライム編集を用いるペプチドタグ付けの態様は図25および26に図示され、例4に記載されている。 An embodiment of peptide tagging using prime editing is illustrated in Figures 25 and 26 and described in Example 4.

E.プリオン病を防止または処置するためのプライム編集の使用
プライム編集は、疾患の過程においてミスフォールディングされるようになるプリオンタンパク質(PRNP)上への1つ以上の防護性変異の組み入れによって、プリオン病を防止またはその進行を停止させるためにもまた用いられ得る。プリオン病または伝達性海綿状脳症(TSE)は、ヒトおよび動物両方を冒す稀な進行性の神経変性障害のファミリーである。それらは、長い潜伏期間、ニューロン喪失に関連する特徴的な海綿状変化、および炎症性応答を誘導することの失敗によって見分けられる。
E. Use of Prime Editing to Prevent or Treat Prion Diseases
Prime editing can also be used to prevent or halt the progression of prion diseases by incorporating one or more protective mutations on the prion protein (PRNP) that becomes misfolded during the disease process. Prion diseases or transmissible spongiform encephalopathies (TSEs) are a family of rare progressive neurodegenerative disorders that affect both humans and animals. They are distinguished by a long latency period, characteristic spongiform changes associated with neuronal loss, and failure to induce an inflammatory response.

ヒトでは、プリオン病は、クロイツフェルト・ヤコブ病(CJD)、変異型クロイツフェルト・ヤコブ病(vCJD)、ゲルストマン・ストロイスラー・シャインカー症候群、致死性家族性不眠症、およびクールー病を包含する。動物では、プリオン病は牛海綿状脳症(BSEまたは「狂牛病」)、慢性消耗病(CWD)、スクレイピー、伝達性ミンク脳症、ネコ海綿状脳症、および有蹄類海綿状脳症を包含する。これらのプリオン病のいずれか1つを防止またはその進行を停止させるために、プライム編集は防護性の点変異をプリオンタンパク質上に組み入れるために用いられ得る。 In humans, prion diseases include Creutzfeldt-Jakob disease (CJD), variant Creutzfeldt-Jakob disease (vCJD), Gerstmann-Straussler-Scheinker syndrome, fatal familial insomnia, and kuru. In animals, prion diseases include bovine spongiform encephalopathy (BSE or "mad cow disease"), chronic wasting disease (CWD), scrapie, transmissible mink encephalopathy, feline spongiform encephalopathy, and ungulate spongiform encephalopathy. To prevent or halt the progression of any one of these prion diseases, prime editing can be used to incorporate protective point mutations onto the prion protein.

古典的CJDはヒトプリオン病である。それは、特徴的な臨床および診断特色を有する神経変性障害である。この疾患は急速に進行性であり、常に致死的である。この疾患による感染は通常は病気の発症から1年以内に死に至る。CJDは急速に進行性の変わることなく致死的な神経変性障害であり、プリオンタンパク質として公知の細胞性の糖タンパク質の異常なアイソフォームによって引き起こされると信じられている。CJDは世界的に生起し、米国を包含する多くの国の見積もられる年間発生率は100万人の集団あたり約1ケースであることが報告されている。CJD患者の大多数は通常は病気の発症から1年以内に死ぬ。CJDは、ヒトおよび動物において生起する他のプリオン病と併せて、伝達性海綿状脳症(TSE)として分類される。患者の約85%では、CJDは伝達の認識可能なパターンなしに特発性疾患として生起する。患者のより小さい割合(5から15%)は、プリオンタンパク質遺伝子の受け継がれた変異ゆえにCJDを発生する。これらの受け継がれる形態は、ゲルストマン・ストロイスラー・シャインカー症候群および致死性家族性不眠症を包含する。CJDについて、処置は現行では公知ではない。 Classical CJD is a human prion disease. It is a neurodegenerative disorder with characteristic clinical and diagnostic features. The disease is rapidly progressive and invariably fatal. Infection with the disease is usually fatal within one year of disease onset. CJD is a rapidly progressive, invariably fatal neurodegenerative disorder believed to be caused by an abnormal isoform of a cellular glycoprotein known as the prion protein. CJD occurs worldwide, with an estimated annual incidence in many countries, including the United States, reported to be about one case per million population. The majority of CJD patients usually die within one year of disease onset. CJD is classified as a transmissible spongiform encephalopathy (TSE), along with other prion diseases occurring in humans and animals. In approximately 85% of patients, CJD occurs as an idiopathic disease with no discernible pattern of transmission. A smaller percentage of patients (5 to 15%) develop CJD due to inherited mutations in the prion protein gene. These inherited forms include Gerstmann-Straussler-Scheinker syndrome and fatal familial insomnia. There is currently no known treatment for CJD.

変異型クロイツフェルト・ヤコブ病(vCJD)は英国で1996年に最初に記載されたプリオン病である。今や、牛のプリオン病の牛海綿状脳症(BSEまたは「狂牛」病)のアウトブレイクを担う物質が、ヒトのvCJDのアウトブレイクを担う同じ物質であるという強い科学的証拠がある。バリアントCJD(vCJD)は古典的CJD(多くの場合には単純にCJDと呼ばれる)と同じ疾患ではない。それは古典的CJDとは異なる臨床的および病理学的特徴を有する。各疾患はプリオンタンパク質遺伝子の具体的な遺伝子プロファイルをもまた有する。両方の障害は、年で測定される普通でなく長い潜伏期間を有する変わることなく致死的な脳疾患であり、プリオンと呼ばれる非従来的な伝達性物質によって引き起こされる。vCJDについて、処置は現行では公知ではない。 Variant Creutzfeldt-Jakob disease (vCJD) is a prion disease first described in 1996 in the UK. There is now strong scientific evidence that the agent responsible for outbreaks of the prion disease bovine spongiform encephalopathy (BSE or "mad cow" disease) in cattle is the same agent responsible for outbreaks of vCJD in humans. Variant CJD (vCJD) is not the same disease as classical CJD (often simply called CJD). It has different clinical and pathological characteristics than classical CJD. Each disease also has a specific genetic profile of the prion protein gene. Both disorders are invariably fatal brain diseases with unusually long incubation periods measured in years, and are caused by a non-conventionally transmissible agent called a prion. For vCJD, no treatment is currently known.

BSE(牛海綿状脳症または「狂牛病」)は、プリオンと呼ばれる普通でない伝達性物質による感染からもたらされる畜牛の進行性の神経学的障害である。伝達性物質の性質は良く理解されてはいない。現行では、最も受け入れられた理論は、物質が、プリオンタンパク質として公知の正常タンパク質の改変された形態であるということである。まだ理解されていない理由から、正常なプリオンタンパク質は病原性の(有害な)形態へと変化し、これはそれから畜牛の中枢神経系を損傷する。BSEの異なる株があるという増大して行く証拠がある:英国におけるアウトブレイクを担った典型的または古典的BSE株および2つの非典型的な株(HおよびL株)である。BSEについて、処置は現行では公知ではない。 BSE (bovine spongiform encephalopathy or "mad cow disease") is a progressive neurological disorder in cattle that results from infection with an unusual transmissible agent called a prion. The nature of the transmissible agent is not well understood. Currently, the most accepted theory is that the agent is an altered form of a normal protein known as a prion protein. For reasons that are not yet understood, the normal prion protein changes into a pathogenic (harmful) form, which then damages the central nervous system of the cattle. There is growing evidence that there are different strains of BSE: the typical or classical BSE strain, which was responsible for the outbreak in the UK, and two atypical strains (the H and L strains). No treatment is currently known for BSE.

慢性消耗病(CWD)は、鹿、ヘラジカ、トナカイ、ニホンジカ、およびムースを冒すプリオン病である。それはカナダおよび米国を包含する北米、ノルウェー、ならびに韓国のいくつかのエリアにおいて見出されている。感染動物が症状を発生する前には1年超がかかり得、これらは激しい体重減少(消耗)、よろめき、無気力、および他の神経症状を包含し得る。CWDは全ての年齢の動物を冒し得、いくつかの感染動物はいつか疾患を発生することなしに死に得る。CWDは動物にとって致死的であり、処置またはワクチンはない。 Chronic Wasting Disease (CWD) is a prion disease that affects deer, elk, reindeer, sika deer, and moose. It is found in some areas of North America, including Canada and the United States, Norway, and Korea. It can take more than a year before an infected animal develops symptoms, which can include severe weight loss (wasting), staggering, lethargy, and other neurological symptoms. CWD can affect animals of all ages, and some infected animals may die without ever developing the disease. CWD is fatal to animals, and there is no treatment or vaccine.

TSEの原因物質はプリオンであると信じられている。用語「プリオン」は、伝達性であり、脳に最も豊富に見出されるプリオンタンパク質と呼ばれる特定の正常な細胞性タンパク質の異常なフォールディングを誘導する能力がある異常な病原性物質を言う。これらの正常なプリオンタンパク質の機能はなお完全には理解されていない。プリオンタンパク質の異常なフォールディングは脳損傷と疾患の特徴的な徴候および症状とに至る。プリオン病は通常は急速に進行性であり、常に致死的である。 The causative agent of TSEs is believed to be prions. The term "prion" refers to an abnormal pathogenic agent that is transmissible and capable of inducing the abnormal folding of certain normal cellular proteins called prion proteins, which are found most abundantly in the brain. The function of these normal prion proteins is not yet fully understood. The abnormal folding of the prion proteins leads to brain damage and the characteristic signs and symptoms of the disease. Prion diseases are usually rapidly progressive and are always fatal.

本願において用いられる用語「プリオン」は、ヒトおよび動物の疾患(海綿状脳症)を引き起こすことが公知の感染性粒子を意味する。用語「プリオン」は単語「タンパク質」および「感染」の短縮であり、粒子は、専らではないにしても、大きくは、立体配座を変化させてPRNPScになるPRNPCを発現するPRNP遺伝子によってコードされるPRNPSc分子からなる。プリオンは細菌、ウイルス、およびウイロイドとは別物である。公知のプリオンは、動物に感染して、羊および山羊の神経系の伝達性の変性疾患スクレイピー、および牛海綿状脳症(BSE)または狂牛病および猫のネコ海綿状脳症を引き起こすものを包含する。ヒトを冒すことが公知の上で論じられている4つのプリオン病は(1)クールー病、(2)クロイツフェルト・ヤコブ病(CJD)、(3)ゲルストマン・ストロイスラー・シャインカー病(GSS)、および(4)致死性家族性不眠症(FFI)である。本願において用いられるプリオンは、用いられるいずれかの動物、具体的にはヒトおよび飼育畜産動物においてこれらの疾患または他の全てまたはいずれかを引き起こすプリオンの全ての形態を包含する。 The term "prion" as used herein refers to an infectious particle known to cause disease (spongiform encephalopathy) in humans and animals. The term "prion" is a contraction of the words "protein" and "infectious," and the particle is largely, if not exclusively, composed of PRNP Sc molecules encoded by the PRNP gene that expresses PRNP C , which changes conformation to become PRNP Sc . Prions are distinct from bacteria, viruses, and viroids. Known prions include those that infect animals and cause scrapie, a transmissible degenerative disease of the nervous system in sheep and goats, and bovine spongiform encephalopathy (BSE) or mad cow disease, and feline spongiform encephalopathy in cats. The four prion diseases discussed above that are known to affect humans are (1) kuru, (2) Creutzfeldt-Jakob disease (CJD), (3) Gerstmann-Straussler-Scheinker disease (GSS), and (4) fatal familial insomnia (FFI). Prion as used herein includes all forms of prion that cause all or any of these diseases or others in any animal used, particularly humans and domesticated livestock animals.

一般的に、理論によって拘束されることなしに、プリオン病はプリオンタンパク質のミスフォールディングによって引き起こされる。多くの場合に沈着性疾患と呼ばれるかかる疾患、プリオンタンパク質のミスフォールディングは次のとおり説明され得る。Aが、意図される生理的役割をモノマーまたはオリゴマー状態で実行する正常に合成された遺伝子産物であり、かつA*が、劇的な立体配座変化を経過するために有能であるAの立体配座的に活性化された形態である場合には、Bは多量体アセンブリを好む立体配座的に変改された状態であり(すなわち、沈着を形成するミスフォールディングされた形態)、かつBnは、病原性であり、リサイクルすることが相対的に困難である多量体材料である。プリオン病では、PRNPCおよびPRNPScは状態AおよびBnに対応し、ここで、Aは大きくはヘリカルかつモノマー性であり、Bnはβリッチかつ多量体性である。 In general, without being bound by theory, prion diseases are caused by misfolding of prion protein. Such diseases, often referred to as deposition diseases, misfolding of prion protein can be explained as follows: if A is the normally synthesized gene product that performs its intended physiological role in a monomeric or oligomeric state, and A* is the conformationally activated form of A that is capable of undergoing dramatic conformational changes, then B is the conformationally altered state that favors multimeric assembly (i.e., the misfolded form that forms deposits), and Bn is the multimeric material that is pathogenic and relatively difficult to recycle. In prion diseases, PRNP C and PRNP Sc correspond to states A and Bn , where A is largely helical and monomeric, and Bn is β-rich and multimeric.

プリオンタンパク質のある種の変異はプリオン(prior)病の増大したリスクに関連し得るということが公知である。反対に、プリオンタンパク質のある種の変異は天然に防護性であり得る。Bagynszky et al.,"Characterization of mutations in PRNP(prion)gene and their possible roles in neurodegenerative diseases,"Neuropsychiatr Dis Treat.,2018;14:2067-2085を見よ。これの内容は参照によって本願に組み込まれる。 It is known that certain mutations in the prion protein may be associated with an increased risk of prion (prior) diseases. Conversely, certain mutations in the prion protein may be naturally protective. See Bagynszky et al., "Characterization of mutations in PRNP(prion)gene and their possible roles in neurodegenerative diseases," Neuropsychiatr Dis Treat., 2018;14:2067-2085, the contents of which are incorporated herein by reference.

PRNP(NCBI RefSeq No.NP_000302.1(配列番号291))ヒトプリオンタンパク質は、染色体20(4686151-4701588)上に位置付けられた16kb長の遺伝子によってコードされる。それは2つのエキソンを含有し、エキソン2はオープンリーディングフレームを持ち、これは253アミノ酸(AA)長のPrPタンパク質をコードする。エキソン1は非コードエキソンであり、これは転写開始部位としての用をなし得る。翻訳後修飾は最初の22AA N末端フラグメント(NTF)および最後の23AA C末端フラグメント(CTF)の除去をもたらす。NTFは小胞体(ER)へのPrP輸送後に切断され、CTF(グリコシルホスファチジルイノシトール[GPI]シグナルペプチド[GPI-SP])はGPIアンカーによって切断される。GPIアンカーはPrPタンパク質輸送に関わり得る。それは細胞膜の外側表面へのプリオンタンパク質の取り付けの役割をもまた演じ得る。正常なPrPは、長いN末端ループ(これはオクタペプチド反復領域を含有する)、2つの短いβシート、3つのαヘリックス、およびC末端領域(これはGPIアンカーを含有する)から成る。PrPの切断は、細胞膜にアンカー固定される208AA長の糖タンパク質をもたらす。 PRNP (NCBI RefSeq No. NP_000302.1 (SEQ ID NO: 291)) human prion protein is encoded by a 16 kb long gene located on chromosome 20 (4686151-4701588). It contains two exons, exon 2 has an open reading frame, which encodes the 253 amino acid (AA) long PrP protein. Exon 1 is a non-coding exon, which may serve as the transcription start site. Post-translational modification results in the removal of the first 22 AA N-terminal fragment (NTF) and the last 23 AA C-terminal fragment (CTF). The NTF is cleaved after PrP transport to the endoplasmic reticulum (ER), and the CTF (glycosylphosphatidylinositol [GPI] signal peptide [GPI-SP]) is cleaved by the GPI anchor. The GPI anchor may be involved in PrP protein transport. It may also play a role in the attachment of the prion protein to the outer surface of the cell membrane. Normal PrP consists of a long N-terminal loop (which contains an octapeptide repeat region), two short β-sheets, three α-helices, and a C-terminal region (which contains a GPI anchor). Cleavage of PrP results in a 208AA long glycoprotein that is anchored to the cell membrane.

PRNP(NP_000302.1)のアミノ酸配列は以下のとおりである:
MANLGCWMLVLFVATWSDLGLCKKRPKPGGWNTGGSRYPGQGSPGGNRYPPQGGGGWGQPHGGGWGQPHGGGWGQPHGGGWGQPHGGGWGQGGGTHSQWNKPSKPKTNMKHMAGAAAAGAVVGGLGGYMLGSAMSRPIIHFGSDYEDRYYRENMHRYPNQVYYRPMDEYSNQNNFVHDCVNITIKQHTVTTTTKGENFTETDVKMMERVVEQMCITQYERESQAYYQRGSSMVLFSSPPVILLISFLIFLIVG(配列番号291)。
The amino acid sequence of PRNP (NP_000302.1) is as follows:
MANLGCWMLVLFVATWSDLGLCKKRPKPGGWNTGGSRYPGQGSPGGNRYPPQGGGGWGQPHGGGWGQPHGGGWGQPHGGGWGQPHGGGWGQGGGTHSQWNKPSKPKTNMKHMAGAAAAGAVVGGLGGYMLGSAMSRPIIHFGSDYEDRYYRENMHRYPNQVYYRPMDEYSNQNNFVHDCVNITIKQHTVTTTTKGENFTETDVKMMERVVEQMCITQYERESQAYYQRGSSMVLFSSPPVILLISFLIFLIVG (sequence number 291).

PRNP(NP_000302.1)のアミノ酸配列は、以下のヌクレオチド配列(NCBI Ref.Seq No.NM_000311.5,"homo sapiens prion protein(PRNP),transcript variant 1,mRNA)によってコードされ、以下のとおりである:
GCGAACCTTGGCTGCTGGATGCTGGTTCTCTTTGTGGCCACATGGAGTGACCTGGGCCTCTGCAAGAAGCGCCCGAAGCCTGGAGGATGGAACACTGGGGGCAGCCGATACCCGGGGCAGGGCAGCCCTGGAGGCAACCGCTACCCACCTCAGGGCGGTGGTGGCTGGGGGCAGCCTCATGGTGGTGGCTGGGGGCAGCCTCATGGTGGTGGCTGGGGGCAGCCCCATGGTGGTGGCTGGGGACAGCCTCATGGTGGTGGCTGGGGTCAAGGAGGTGGCACCCACAGTCAGTGGAACAAGCCGAGTAAGCCAAAAACCAACATGAAGCACATGGCTGGTGCTGCAGCAGCTGGGGCAGTGGTGGGGGGCCTTGGCGGCTACATGCTGGGAAGTGCCATGAGCAGGCCCATCATACATTTCGGCAGTGACTATGAGGACCGTTACTATCGTGAAAACATGCACCGTTACCCCAACCAAGTGTACTACAGGCCCATGGATGAGTACAGCAACCAGAACAACTTTGTGCACGACTGCGTCAATATCACAATCAAGCAGCACACGGTCACCACAACCACCAAGGGGGAGAACTTCACCGAGACCGACGTTAAGATGATGGAGCGCGTGGTTGAGCAGATGTGTATCACCCAGTACGAGAGGGAATCTCAGGCCTATTACCAGAGAGGATCGAGCATGGTCCTCTTCTCCTCTCCACCTGTGATCCTCCTGATCTCTTTCCTCATCTTCCTGATAGTGGGATGAGGAAGGTCTTCCTGTTTTCACCATCTTTCTAATCTTTTTCCAGCTTGAGGGAGGCGGTATCCACCTGCAGCCCTTTTAGTGGTGGTGTCTCACTCTTTCTTCTCTCTTTGTCCCGGATAGGCTAATCAATACCCTTGGCACTGATGGGCACTGGAAAACATAGAGTAGACCTGAGATGCTGGTCAAGCCCCCTTTGATTGAGTTCATCATGAGCCGTTGCTAATGCCAGGCCAGTAAAAGTATAACAGCAAATAACCATTGGTTAATCTGGACTTATTTTTGGACTTAGTGCAACAGGTTGAGGCTAAAACAAATCTCAGAACAGTCTGAAATACCTTTGCCTGGATACCTCTGGCTCCTTCAGCAGCTAGAGCTCAGTATACTAATGCCCTATCTTAGTAGAGATTTCATAGCTATTTAGAGATATTTTCCATTTTAAGAAAACCCGACAACATTTCTGCCAGGTTTGTTAGGAGGCCACATGATACTTATTCAAAAAAATCCTAGAGATTCTTAGCTCTTGGGATGCAGGCTCAGCCCGCTGGAGCATGAGCTCTGTGTGTACCGAGAACTGGGGTGATGTTTTACTTTTCACAGTATGGGCTACACAGCAGCTGTTCAACAAGAGTAAATATTGTCACAACACTGAACCTCTGGCTAGAGGACATATTCACAGTGAACATAACTGTAACATATATGAAAGGCTTCTGGGACTTGAAATCAAATGTTTGGGAATGGTGCCCTTGGAGGCAACCTCCCATTTTAGATGTTTAAAGGACCCTATATGTGGCATTCCTTTCTTTAAACTATAGGTAATTAAGGCAGCTGAAAAGTAAATTGCCTTCTAGACACTGAAGGCAAATCTCCTTTGTCCATTTACCTGGAAACCAGAATGATTTTGACATACAGGAGAGCTGCAGTTGTGAAAGCACCATCATCATAGAGGATGATGTAATTAAAAAATGGTCAGTGTGCAAAGAAAAGAACTGCTTGCATTTCTTTATTTCTGTCTCATAATTGTCAAAAACCAGAATTAGGTCAAGTTCATAGTTTCTGTAATTGGCTTTTGAATCAAAGAATAGGGAGACAATCTAAAAAATATCTTAGGTTGGAGATGACAGAAATATGATTGATTTGAAGTGGAAAAAGAAATTCTGTTAATGTTAATTAAAGTAAAATTATTCCCTGAATTGTTTGATATTGTCACCTAGCAGATATGTATTACTTTTCTGCAATGTTATTATTGGCTTGCACTTTGTGAGTATTCTATGTAAAAATATATATGTATATAAAATATATATTGCATAGGACAGACTTAGGAGTTTTGTTTAGAGCAGTTAACATCTGAAGTGTCTAATGCATTAACTTTTGTAAGGTACTGAATACTTAATATGTGGGAAACCCTTTTGCGTGGTCCTTAGGCTTACAATGTGCACTGAATCGTTTCATGTAAGAATCCAAAGTGGACACCATTAACAGGTCTTTGAAATATGCATGTACTTTATATTTTCTATATTTGTAACTTTGCATGTTCTTGTTTTGTTATATAAAAAAATTGTAAATGTTTAATATCTGACTGAAATTAAACGAGCGAAGATGAGCACCA(配列番号292)
The amino acid sequence of PRNP (NP_000302.1) is encoded by the following nucleotide sequence (NCBI Ref.Seq No.NM_000311.5, "homo sapiens prion protein (PRNP), transcript variant 1, mRNA) and is as follows:
(SEQ ID NO:292)

CJDおよびFFIにリンクしているPRNP(NP_000302.1)に対して相対的な変異部位が次のとおり報告されている。これらの変異は、本明細書に開示のプライム編集因子を用いて除去または組み入れられ得る。

Figure 2020191243000128

Figure 2020191243000129
The relative mutation sites for PRNP (NP_000302.1) linked to CJD and FFI have been reported as follows: These mutations can be removed or incorporated using the prime editors disclosed herein.
Figure 2020191243000128

Figure 2020191243000129

GSSへ繋がる、PRNP(NP_000302.1)(配列番号291)と比べた突然変異部位は、以下のとおり報告されている:

Figure 2020191243000130

Figure 2020191243000131
The mutation sites relative to PRNP (NP_000302.1) (SEQ ID NO: 291) that lead to GSS are reported as follows:
Figure 2020191243000130

Figure 2020191243000131

プリオン病に対して起こり得る防護特質(protective nature)へ繋がるPRNP(NP_000302.1)(配列番号291)と比べた突然変異部位は以下のとおりである:

Figure 2020191243000132

Figure 2020191243000133
The mutation sites relative to PRNP (NP_000302.1) (SEQ ID NO: 291) that lead to possible protective nature against prion disease are as follows:
Figure 2020191243000132

Figure 2020191243000133

それゆえに、種々の態様において、プライム編集は、プリオン病にリンクしているPRNPの変異を除去するかまたはプリオン病に対して防護性であると考慮されるPRNPの変異を組み入れるために用いられ得る。例えば、プライム編集は、PRNPタンパク質のD178N、V180I、T188K、E196K、E196A、E200K、E200G、V203I、R208H、V210I、E211Q、I215V、またはM232R変異を除去または復元するために用いられ得る(NP_000302.1のPRNPに対して相対的)(配列番号291)。他の態様において、プライム編集は、PRNPタンパク質のP102L、P105L、A117V、G131V、V176G、H187R、F198S、D202N、Q212P、Q217R、またはM232T変異を除去または復元するために用いられ得る(NP_000302.1のPRNPに対して相対的)(配列番号291)。プライム編集を用いてPRNPのかかる変異の存在を除去または修正することによって、プリオン病のリスクが縮減または消去され得る。 Thus, in various embodiments, prime editing can be used to remove PRNP mutations linked to prion disease or to introduce PRNP mutations considered protective against prion disease. For example, prime editing can be used to remove or restore D178N, V180I, T188K, E196K, E196A, E200K, E200G, V203I, R208H, V210I, E211Q, I215V, or M232R mutations in the PRNP protein (relative to PRNP of NP_000302.1) (SEQ ID NO: 291). In other embodiments, prime editing can be used to remove or restore P102L, P105L, A117V, G131V, V176G, H187R, F198S, D202N, Q212P, Q217R, or M232T mutations in the PRNP protein (relative to PRNP of NP_000302.1) (SEQ ID NO: 291). By using prime editing to remove or correct the presence of such mutations in PRNP, the risk of prion disease can be reduced or eliminated.

他の態様において、プライム編集は、1つ以上のプリオン病に対する防護性の効果にリンクしているPRNPの防護性変異を組み入れるために用いられ得る。例えば、プライム編集は、PRNPのG127S、G127V、M129V、D167G、D167N、N171S、E219K、またはP238S防護性変異を組み入れるために用いられ得る(NP_000302.1のPRNPに対して相対的)(配列番号291)。なお他の態様において、防護性変異は、PRNPのG127、G127、M129、D167、D167、N171、E219、またはP238に組み入れされるいずれかの代替アミノ酸であり得る(NP_000302.1のPRNPに対して相対的)(配列番号291)。 In other embodiments, prime editing can be used to incorporate protective mutations in PRNP that are linked to a protective effect against one or more prion diseases. For example, prime editing can be used to incorporate G127S, G127V, M129V, D167G, D167N, N171S, E219K, or P238S protective mutations in PRNP (relative to PRNP in NP_000302.1) (SEQ ID NO: 291). In yet other embodiments, the protective mutations can be any alternative amino acid incorporated into G127, G127, M129, D167, D167, N171, E219, or P238 in PRNP (relative to PRNP in NP_000302.1) (SEQ ID NO: 291).

具体的な態様では、図27において例解され例5において論じられるとおり、プライム編集はG127V防護性変異をPRNPに組み入れるために用いられ得る。 In a specific embodiment, prime editing can be used to incorporate the G127V protective mutation into PRNP, as illustrated in Figure 27 and discussed in Example 5.

別の態様では、プライム編集はE219K防護性変異をPRNPに組み入れるために用いられ得る。 In another embodiment, prime editing can be used to incorporate the E219K protective mutation into PRNP.

PRNPタンパク質および防護性変異部位は哺乳動物において保存されている。そのため、ヒト疾患を処置することに加えて、それは、プリオン病に対して免疫がある牛および羊を生成するか、またはさらにはプリオン病を患っている動物の野生集団を治癒させることを助けるためにもまた用いられ得る。プライム編集はヒト細胞における天然に存在する防護性アレルの~25%組み入れを達成するためにすでに用いられており、先のマウス実験は組み入れのこのレベルがほとんどのプリオン病に対する免疫を引き起こすために十分であるということを指示している。この方法は、ほとんどの細胞型においてかかる高い効率でこのアレルを組み入れるための最初のかつ可能性としては唯一の現行のやり方である。処置のための別の可能な戦略は、プライム編集を用いて、早期停止コドンを遺伝子に組み入れることによってPRNPの発現を縮減または消去することである。 The PRNP protein and protective mutation sites are conserved in mammals. Therefore, in addition to treating human disease, it could also be used to generate cattle and sheep immune to prion disease, or even help cure wild populations of animals suffering from prion disease. Prime editing has already been used to achieve ∼25% incorporation of the naturally occurring protective allele in human cells, and previous mouse experiments indicate that this level of incorporation is sufficient to induce immunity to most prion diseases. This method is the first and potentially only current way to incorporate this allele with such high efficiency in most cell types. Another possible strategy for treatment is to use prime editing to reduce or eliminate expression of PRNP by incorporating a premature stop codon into the gene.

PEgRNAデザインのための本明細書に記載の原理を用いて、所望の防護性変異を組み入れるためのまたはプリオン病関連変異をPRNPから除去するための適当なPEgRNAがデザインされ得る。例えば、PEgRNAの下のリストは、G127V防護性アレルおよびE219K防護性アレルをヒトPRNPに、ならびにG127V防護性アレルを種々の動物のPRNPに組み入れるために用いられ得る。

Figure 2020191243000134

Figure 2020191243000135
Using the principles described herein for PEgRNA design, suitable PEgRNAs can be designed to incorporate desired protective mutations or to remove prion disease-associated mutations from PRNP. For example, the following list of PEgRNAs can be used to incorporate the G127V protective allele and the E219K protective allele into human PRNP, and the G127V protective allele into the PRNP of various animals.
Figure 2020191243000134

Figure 2020191243000135

F.RNAタグ付けのためのプライム編集の使用
プライム編集は、RNAタグ付けによってRNA機能をコードするDNAの配列を操作、変改、および別様に改変するためにもまた用いられ得、このやり方で、RNAの構造および機能を間接的に改変するための手段を提供する。例えば、PEは、非コードRNAまたはmRNAをタグ付けまたは別様に操作するためのRNAレベルで機能的であるモチーフ(これ以降ではRNAモチーフ)を挿入するために用いられ得る。これらのモチーフは、遺伝子発現を増大させるか、遺伝子発現を減少させるか、スプライシングを変改するか、転写後修飾を変化させるか、RNAの細胞下レベル位置付けに影響するか、RNAの単離または細胞内もしくは外の位置付けの決定を可能化するか(例えば、蛍光RNAアプタマー、例えばSpinach、Spinach2、Baby Spinach、またはBroccoliを用いる)、内生もしくは外因的なタンパク質もしくはRNA結合因子を動員するか、sgRNAを導入するか、あるいは自己切断またはRNAseどちらかによるRNAのプロセシングを誘導するための用をなし得る(さらなる詳細については図28Bおよび例6を見よ)。
F. Use of Prime Editing for RNA Tagging
Prime editing can also be used to manipulate, alter and otherwise modify the sequence of DNA that codes for RNA function by RNA tagging, thus providing a means to indirectly modify RNA structure and function. For example, PE can be used to insert motifs (hereafter RNA motifs) that are functional at the RNA level to tag or otherwise manipulate non-coding RNA or mRNA. These motifs can be used to increase gene expression, decrease gene expression, alter splicing, change post-transcriptional modification, affect the subcellular level location of RNA, enable RNA isolation or determination of intracellular or extracellular location (e.g., using fluorescent RNA aptamers, such as Spinach, Spinach2, Baby Spinach, or Broccoli), recruit endogenous or exogenous proteins or RNA binding factors, introduce sgRNA, or induce RNA processing by either self-cleavage or RNAse (see Figure 28B and Example 6 for further details).

次のRNAタグまたはモチーフが、RNA輸送、発現レベル、スプライシング、および検出を包含するRNAの種々の特性に影響するための適当なPEgRNA(本願において提供されるガイダンスを用いてデザインされる)によるプライム編集を用いて目当ての遺伝子上に挿入され得る。

Figure 2020191243000136

Figure 2020191243000137

Figure 2020191243000138

Figure 2020191243000139

Figure 2020191243000140

Figure 2020191243000141

Figure 2020191243000142

Figure 2020191243000143
The following RNA tags or motifs can be inserted onto genes of interest using prime editing with appropriate PEgRNA (designed using the guidance provided herein) to affect various properties of the RNA including RNA transport, expression levels, splicing, and detection.
Figure 2020191243000136

Figure 2020191243000137

Figure 2020191243000138

Figure 2020191243000139

Figure 2020191243000140

Figure 2020191243000141

Figure 2020191243000142

Figure 2020191243000143

上の表のPEgRNAは、上のモチーフの例をHEXA遺伝子(テイ・サックス病において欠陥がある)に部位特異的に挿入するためにデザインされている(例えば、GenBank No.KR710351.1(配列番号369)。しかしながら、これは例解の目的のためのみである。RNAタグ付けへのプライム編集の使用はHEXA遺伝子に限定されず、実にいずれかの遺伝子であり得る。
HEXA mRNAは以下のヌクレオチド配列を有する:
GTTCGTTGCAACAAATTGATGAGCAATGCTTTTTTATAATGCCAACTTTGTACAAAAAAGTTGGCATGACAAGTTCCAGGCTTTGGTTTTCGCTGCTGCTGGCGGCAGCGTTCGCAGGACGGGCGACGGCCCTCTGGCCCTGGCCTCAGAACTTCCAAACCTCCGACCAGCGCTACGTCCTTTACCCGAACAACTTTCAATTCCAGTACGATGTCAGCTCGGCCGCGCAGCCCGGCTGCTCAGTCCTCGACGAGGCCTTCCAGCGCTATCGTGACCTGCTTTTCGGTTCCGGGTCTTGGCCCCGTCCTTACCTCACAGGGAAACGGCATACACTGGAGAAGAATGTGTTGGTTGTCTCTGTAGTCACACCTGGATGTAACCAGCTTCCTACTTTGGAGTCAGTGGAGAATTATACCCTGACCATAAATGATGACCAGTGTTTACTCCTCTCTGAGACTGTCTGGGGAGCTCTCCGAGGTCTGGAGACTTTTAGCCAGCTTGTTTGGAAATCTGCTGAGGGCACATTCTTTATCAACAAGACTGAGATTGAGGACTTTCCCCGCTTTCCTCACCGGGGCTTGCTGTTGGATACATCTCGCCATTACCTGCCACTCTCTAGCATCCTGGACACTCTGGATGTCATGGCGTACAATAAATTGAACGTGTTCCACTGGCATCTGGTAGATGATCCTTCCTTCCCATATGAGAGCTTCACTTTTCCAGAGCTCATGAGAAAGGGGTCCTACAACCCTGTCACCCACATCTACACAGCACAGGATGTGAAGGAGGTCATTGAATACGCACGGCTCCGGGGTATCCGTGTGCTTGCAGAGTTTGACACTCCTGGCCACACTTTGTCCTGGGGACCAGGTATCCCTGGATTACTGACTCCTTGCTACCCTGGGTCTGAGCCCTCTGGCACCTTTGGACCAGTGAATCCCAGTCTCAATAATACCTATGAGTTCATGAGCACATTCTTCTTAGAAGTCAGCTCTGTCTTCCCAGATTTTTATCTTCATCTTGGAGGAGATGAGGTTGATTTCACCTGCTGGAAGTCCAACCCAGAGATCCAGGACTTTATGAGGAAGAAAGGCTTCGGTGAGGACTTCAAGCAGCTGGAGTCCTTCTACATCCAGACGCTGCTGGACATCGTCTCTTCTTATGGCAAGGGCTATGTGGTGTGGCAGGAGGTGTTTGATAATAAAGTAAAGATTCAGCCAGACACAATCATACAGGTGTGGCGAGAGGATATTCCAGTGAACTATATGAAGGAGCTGGAACTGGTCACCAAGGCCGGCTTCCGGGCCCTTCTCTCTGCCCCCTGGTACCTGAACCGTATATCCTATGGCCCTGACTGGAAGGATTTCTACGTAGTGGAACCCCTGGCATTTGAAGGTACCCCTGAGCAGAAGGCTCTGGTGATTGGTGGAGAGGCTTGTATGTGGGGAGAATATGTGGACAACACAAACCTGGTCCCCAGGCTCTGGCCCAGAGCAGGGGCTGTTGCCGAAAGGCTGTGGAGCAACAAGTTGACATCTGACCTGACATTTGCCTATGAACGTTTGTCACACTTCCGCTGTGAGTTGCTGAGGCGAGGTGTCCAGGCCCAACCCCTCAATGTAGGCTTCTGTGAGCAGGAG TTTGAACAGACCTGCCCAACTTTCTTGTACAAAGTTGGCATTATAAGAAAGCATTGCTTATCAATTTGTTGCAACGAAC(配列番号369)。
The PEgRNAs in the table above are designed to site-specifically insert the example motifs above into the HEXA gene (defective in Tay-Sachs disease) (e.g., GenBank No. KR710351.1 (SEQ ID NO: 369)). However, this is for illustrative purposes only. The use of prime editing for RNA tagging is not limited to the HEXA gene, and indeed could be any gene.
HEXA mRNA has the following nucleotide sequence:
GTTCGTTGCAACAAATTGATGAGCAATGCTTTTTTATAATGCCAACTTTGTACAAAAAAGTTGGCATGACAAGTTCCAGGCTTTGGTTTTCGCTGCTGCTGGCGGCAGCGTTCGCAGGACGGGCGACGGCCCTCTGGCCCTGGCCTCAGAACTTCCAAACCTCCGACCAGCGCTACGTCCTTTACCCGAACAACTTTCAATTCCAGTACGATGTCAGCTCGGCCGCGCAGCCCGGCTGCTCAGTCCTCGACGAGGCCTTCCAGCGCTATCGTGACCTGCTTTTCGGTTCCGGGTCTTGGCCCCGTCCTTACCTCACAGGGAAACGGCATACACTGGAGAAGAATGTGTTGGTTGTCTCTGTAGTCACACCTGGATGTAACCAGCTTCCTACTTTGGAGTCAGTGGAGAAT TATACCCTGACCATAAATGATGACCAGTGTTTACTCCTCTCTGAGACTGTCTGGGGAGCTCTCCGAGGTCTGGAGACTTTTAGCCAGCTTGTTTGGAAATCTGCTGAGGGCACATTCTTTATCAACAAGACTGAGATTGAGGACTTTCCCCGCTTTCCTCACCGGGGCTTGCTGTTGGATACATCTCGCCATTACCTGCCACTCTCTAGCATCCTGGACACTCTGGATGTCATGGCGTACAATAAATTGAACGTGTTCCACTGGCATCTGGTAGATGATCCTTCCTTCCCATATGAGAGCTTCACTTTTCCAGAGCTCATGAGAAAGGGGTCCTACAACCCTGTCACCCACATCTACACAGCACAGGATGTGAAGGAGGTCATTGAATACGCACGGCTCCGGGGTATCCG TGTGCTTGCAGAGTTTGACACTCCTGGCCACACTTTGTCCTGGGGACCAGGTATCCCTGGATTACTGACTCCTTGCTACCCTGGGTCTGAGCCCTCTGGCACCTTTGGACCAGTGAATCCCAGTCTCAATAATACCTATGAGTTCATGAGCACATTCTTCTTAGAAGTCAGCTCTGTCTTCCCAGATTTTTATCTTCATCTTGGAGGAGATGAGGTTGATTTCACCTGCTGGAAGTCCAACCCAGAGATCCAGGACTTTATGAGGAAGAAAGGCTTCGGTGAGGACTTCAAGCAGCTGGAGTCCTTCTACATCCAGACGCTGCTGGACATCGTCTCTTCTTATGGCAAGGGCTATGTGGTGGCAGGAGGTGTTTGATAATAAAGTAAAGATTCAGCCAGACACAATCA [0043] TACAGGTGTGGCGAGAGGATATTCCAGTGAACTATATGAAGGAGCTGGAACTGGTCACCAAGGCCGGCTTCCGGGCCCTTCTCTCTGCCCCCTGGTACCTGAACCGTATATCCTATGGCCCTGACTGGAAGGATTTCTACGTAGTGGAACCCCTGGCATTTGAAGGTACCCCTGAGCAGAAGGCTCTGGTGATTGGTGGAGAGGCTTGTATGTGGGGAGAATATGTGGACAACACAAACCTGGTCCCCAGGCTCTGGCCCAGAGCAGGGGCTGTTGCCGAAAGGCTGTGGAGCAACAAGTTGACATCTGACCTGACATTTGCCTATGAACGTTTGTCACACTTCCGCTGTGAGTTGCTGAGGCGAGGTGTCCAGGCCCAACCCCTCAATGTAGGCTTCTGTGAGCAGGAGTTTTGAACAGACCTGCCCAACTTTCTTGTACAAAGTTGGCATTATAAGAAAGCATTGCTTATCAATTTGTTGCAACGAAC (SEQ ID NO: 369).

対応するHEXAタンパク質は以下のアミノ酸配列を有する:
MTSSRLWFSLLLAAAFAGRATALWPWPQNFQTSDQRYVLYPNNFQFQYDVSSAAQPGCSVLDEAFQRYRDLLFGSGSWPRPYLTGKRHTLEKNVLVVSVVTPGCNQLPTLESVENYTLTINDDQCLLLSETVWGALRGLETFSQLVWKSAEGTFFINKTEIEDFPRFPHRGLLLDTSRHYLPLSSILDTLDVMAYNKLNVFHWHLVDDPSFPYESFTFPELMRKGSYNPVTHIYTAQDVKEVIEYARLRGIRVLAEFDTPGHTLSWGPGIPGLLTPCYPGSEPSGTFGPVNPSLNNTYEFMSTFFLEVSSVFPDFYLHLGGDEVDFTCWKSNPEIQDFMRKKGFGEDFKQLESFYIQTLLDIVSSYGKGYVVWQEVFDNKVKIQPDTIIQVWREDIPVNYMKELELVTKAGFRALLSAPWYLNRISYGPDWKDFYVVEPLAFEGTPEQKALVIGGEACMWGEYVDNTNLVPRLWPRAGAVAERLWSNKLTSDLTFAYERLSHFRCELLRRGVQAQPLNVGFCEQEFEQT(配列番号370)。
The corresponding HEXA protein has the following amino acid sequence:
(Sequence number 370).

注意すべきことに、もたらされるRNAモチーフはHEXA遺伝子の翻訳領域内に包含され、タンパク質コード遺伝子の機能を遮断するであろう。挿入されるポリアデニル化モチーフは未成熟転写物終結をもたらすであろう。この部位は、転写される、それゆえにRNA産物を生ずるであろうゲノム部位内における上の表の列記されるRNAモチーフの挿入をもたらし得る可能性あるPEgRNAを単に例解している。 Of note, the resulting RNA motif would be contained within the translational region of the HEXA gene, blocking function of the protein-coding gene. The inserted polyadenylation motif would result in premature transcript termination. This site is merely illustrative of the possible PEgRNAs that could result in the insertion of the RNA motifs listed in the table above within a genomic site that would be transcribed and therefore produce an RNA product.

RNAタグ付けのためのPEへの使用のためのPEgRNAは、U6プロモーター(このケースでは、Gで始まらないプロトスペーサーを包含するガイドでは、単一のグアノシンがPEgRNAの5'端に追加され、6~7つのチミンが3'端に追加されるであろう)またはpolIIプロモーター、例えばpCMV(このケースでは、自己切断エレメントまたはCsy4モチーフによってRNAの5'端からこのプロモーターの本来的に転写される配列を除去することが必要であり得、終結モチーフが、核からのRNAの搬出をもたらさないRNAの3'端に追加されることを必要とするであろう。例えば上に列記されている3'ボックスモチーフである。それはアニーリング領域の3'であろうから、このモチーフはPEの結果としてゲノム上に挿入されないであろうということに注意せよ)から発現され得る。コアPEgRNA骨格は下線付きであり、相同性およびアニーリング領域はイタリックであり、挿入配列は太字である。下で記載されるとおり、挿入される配列は上の例の逆相補体であり、よって、これらのPEgRNAはコード鎖へと標的化されることを必要とするであろうということに注意せよ。 PEgRNAs for use in PE for RNA tagging can be expressed from a U6 promoter (in this case, for guides containing a protospacer that does not begin with a G, a single guanosine would be added to the 5' end of the PEgRNA and 6-7 thymines would be added to the 3' end) or a polII promoter, such as pCMV (in this case, it may be necessary to remove the naturally transcribed sequence of this promoter from the 5' end of the RNA with a self-cleaving element or Csy4 motif, and a termination motif would need to be added to the 3' end of the RNA that does not result in export of the RNA from the nucleus, such as the 3' box motif listed above. Note that this motif will not be inserted on the genome as a result of PE, since it will be 3' of the annealing region). The core PEgRNA backbone is underlined, the homology and annealing regions are italicized, and the insertion sequence is in bold. Note that the inserted sequence is the reverse complement of the example above, as described below, and thus these PEgRNAs will need to be targeted to the coding strand.

また、HDV以外の自己切断リボザイムは、いくつかの態様では、所与の標的部位に合わせて仕立てられることを必要とするということに注意せよ;つまり、HDVはコードされる転写物をそれ自体の直ちに5'において切断するが、全ての他の自己切断リボザイムのカットされる部位はリボザイムそれ自体の内にある。よって、最初および最後の大体5~10ヌクレオチド(そしていくつかの場合には、可能性としては10よりも多く)は実際にはコードされる配列の一部であろう。例として、ハンマーヘッド自己切断リボザイムを用いて、Nがいずれかのヌクレオチドである配列5'NNNNNTCATCCTGATAAACTGCAAA3'(配列番号371)を5つのNの後で切断するためには、次の配列が挿入されるであろう。ここで、下線付き配列は完璧ではないRNA対形成エレメントを形成する。 Also note that self-cleaving ribozymes other than HDV, in some embodiments, need to be tailored to a given target site; that is, HDV cleaves the encoded transcript immediately 5' to itself, while the cutting site for all other self-cleaving ribozymes is within the ribozyme itself. Thus, the first and last approximately 5-10 nucleotides (and in some cases potentially more than 10) will actually be part of the encoded sequence. As an example, to cleave the sequence 5'NNNNNTCATCCTGATAAACTGCAAA3' (SEQ ID NO:371), where N is any nucleotide, after 5 N's using a hammerhead self-cleaving ribozyme, the following sequence would be inserted, where the underlined sequence forms a non-perfect RNA pairing element:

5'NNNNNCAGTTTGTACGGATGACTGATGAGTCCCAAATAGGACGAAACGCGCTTCGGTGCGTCTCATCCTGATAAACTGCAAA-3'(配列番号372)。 5'NNNNNCAGTTTGTACGGATGACTGATGAGTCCCAAATAGGACGAAACGCGCTTCGGTGCGTCTCATCCTGATAAACTGCAAA-3' (sequence number 372).

この対形成エレメントの長さおよび性質の観点からは有意なフレキシビリティーがあり、これは元々の提出物に列記される非HDV自己切断リボザイムのいずれかについて真であろう。上に列記されている構築物と同じプロトスペーサーを有するPEgRNAを用いてhexA mRNAを切断するハンマーヘッドリボザイムを組み入れるためには、次のPEgRNA配列が用いられ得る(標識は上と同じ): There is significant flexibility in terms of the length and nature of this pairing element, which would be true for any of the non-HDV self-cleaving ribozymes listed in the original submission. To incorporate a hammerhead ribozyme that cleaves hexA mRNA using a PEgRNA with the same protospacer as the constructs listed above, the following PEgRNA sequence could be used (labeled as above):

Figure 2020191243000144

Figure 2020191243000145

(ここで、コアPEgRNA骨格に下線を付し、相同領域およびアニーリング領域は斜字体に、挿入配列は太字にしている)(配列番号373)。
Figure 2020191243000144

Figure 2020191243000145

(where the core PEgRNA backbone is underlined, the homology and annealing regions are in italics, and the insert sequence is in bold) (SEQ ID NO:373).

RNAモチーフの挿入のために他のPEgRNAをデザインすることは、本明細書に記載の一般的な原理を踏襲する。しかしながら、RNAモチーフの多くは可能性として高度に構造化されているということが注意される。これはそれらが逆転写およびゲノム上に挿入されることを困難にし得る。いくつかのRNA配列、例えば単純なヘアピンでは、RNA配列それ自体およびその相補体両方が構造化されているが、しかしながら、それは上に記されている配列について真であることは非蓋然的である。よって、これらのモチーフを挿入するときには、最も蓋然的には、PEgRNAがこれらの配列の逆相補体をコードし、ゲノム上への実際にモチーフをコードするDNA配列の挿入をもたらすことが最善であろう。類似に、PEgRNA鋳型領域への自己切断リボザイムの包含はプロセシングおよび非効率的な活性をもたらすであろうが、その逆相補体の包含はもたらさないであろう。それゆえに、これらのPEgRNAは蓋然的にはコード鎖を標的化しなければならないであろうが、他の型の挿入(例えば治療学的な修正)をコードするPEgRNAは理論的にはどちらの鎖も標的化する能力があるであろう。 Designing other PEgRNAs for insertion of RNA motifs follows the general principles described herein. However, it is noted that many of the RNA motifs are potentially highly structured. This can make them difficult to reverse transcribe and insert onto the genome. In some RNA sequences, e.g., simple hairpins, both the RNA sequence itself and its complement are structured, however, that is unlikely to be true for the sequences described above. Thus, when inserting these motifs, it would most likely be best for the PEgRNA to code for the reverse complement of these sequences, resulting in insertion onto the genome of the DNA sequence that actually codes for the motif. Similarly, inclusion of a self-cleaving ribozyme in the PEgRNA template region would result in processing and inefficient activity, but inclusion of its reverse complement would not. Therefore, these PEgRNAs would likely have to target the coding strand, although PEgRNAs encoding other types of insertions (e.g., therapeutic modifications) would theoretically be capable of targeting either strand.

また、挿入されるモチーフの多くでは、もたらされるPEgRNAはU6プロモーターから転写される能力がなくあり得、他のプロモーター、例えばpCMVの使用を要するということに注意せよ。類似に、より長いPEgRNAもまたより安定ではなくあり得る。m6Aマーカーなどのより短いモチーフはこの課題を有さないであろう。 Also note that for many of the inserted motifs, the resulting PEgRNA may not be capable of being transcribed from the U6 promoter, necessitating the use of other promoters, such as pCMV. Similarly, longer PEgRNAs may also be less stable. Shorter motifs, such as the m6A marker, would not have this problem.

G.高性能遺伝子ライブラリの生成のためのプライム編集の使用
プライム編集は、定められたまたは可変の挿入、欠失、または定められたアミノ酸/ヌクレオチド変換を有するタンパク質またはRNAをコードする遺伝子の高性能ライブラリを生成するためにもまた用いられ得、高スループットスクリーニングおよび指向性進化へのそれらの使用が本明細書に記載の。プライム編集のこの適用は例7においてさらに記載され得る。
G. Use of Prime Editing to Generate High-Performance Gene Libraries
Prime editing can also be used to generate high performance libraries of genes encoding proteins or RNAs with defined or variable insertions, deletions, or defined amino acid/nucleotide conversions, and their use in high throughput screening and directed evolution is described herein. This application of prime editing is further described in Example 7.

可変の遺伝子ライブラリの生成は最も普通には変異誘発PCRによって達成されている(Cadwell RC and Joyce GF.PCR Methods Appl.1992を見よ)。この方法は、DNAポリメラーゼの忠実性を縮減する反応条件を用いることまたはより高い変異率を有する改変されたDNAポリメラーゼを用いることどちらかに依拠する。そのため、これらのポリメラーゼのバイアスはライブラリ産物に反映される(例えば、トランスバージョンに対してトランジション変異の選好性)。ライブラリ構築のこのアプローチの内在する限定は、変えられようとする遺伝子のサイズに影響することの相対的不能である。ほとんどのDNAポリメラーゼはインデル変異(挿入または欠失)の極めて低い率を有し、これらのほとんどはタンパク質コード領域におけるフレームシフト変異をもたらし、ライブラリのメンバーがいずれかの下流のセレクションを通過することを非蓋然的にするであろう(McInerney P,Adams P,and Hadi MZ.Mol Biol Int.2014を見よ)。 The generation of variable gene libraries is most commonly accomplished by mutagenic PCR (see Cadwell RC and Joyce GF. PCR Methods Appl. 1992). This method relies on either using reaction conditions that reduce the fidelity of the DNA polymerase or using modified DNA polymerases with higher mutation rates. The biases of these polymerases are then reflected in the library products (e.g., preference for transition mutations over transversions). An inherent limitation of this approach to library construction is the relative inability to affect the size of the gene to be altered. Most DNA polymerases have an extremely low rate of indel mutations (insertions or deletions), and most of these will result in frameshift mutations in protein-coding regions, making it unlikely that library members will pass any downstream selection (see McInerney P, Adams P, and Hadi MZ. Mol Biol Int. 2014).

加えて、PCRおよびクローニングのバイアスは、異なるサイズの遺伝子からなる単一のライブラリを生成することを困難にし得る。これらの限定は、存在するタンパク質機能を増強および新規のタンパク質機能を操作するための指向性進化の効力を厳しく限定し得る。天然の進化では、タンパク質機能または効力の大きい変化は、典型的には、変異導入のための標準的なライブラリ生成の間には生起することが非蓋然的である挿入および欠失変異に関連する。さらにその上、これらの変異は、最も普通には、疎水性コアと対比してループを形成することが予測される当のタンパク質の領域に生起する。それゆえに、従来のバイアスがないアプローチを用いて生成されるほとんどのインデルは、害があるかまたは無効かどちらかであることが蓋然的である。 In addition, PCR and cloning biases can make it difficult to generate a single library of genes of different sizes. These limitations can severely limit the efficacy of directed evolution to enhance existing and engineer novel protein functions. In natural evolution, large changes in protein function or efficacy are typically associated with insertion and deletion mutations that are unlikely to occur during standard library generation for mutagenesis. Furthermore, these mutations most commonly occur in regions of the protein that are predicted to form loops versus the hydrophobic core. Therefore, most indels generated using traditional unbiased approaches are likely to be either harmful or ineffective.

全てのライブラリは可能な変異空間のある画分のみにアクセスするということから、それらが有益であることが最も蓋然的であろうタンパク質上の部位、例えばループ領域にかかる変異を偏らせ得るライブラリは、従来のライブラリと比べて有意な利点を有するであろう。最後に、NNKプライマーを用いるマルチステップPCRおよびクローンアセンブリによってまたはDNAシャッフリングによって、部位特異的なインデル変異を有する遺伝子ライブラリを生成することは可能であるが、これらのライブラリは連続的進化では「インデルジェネシス」の追加のラウンドを経過し得ない。連続的進化は、最小限のユーザー介入によるある型の指向性進化である。1つのかかる例はPACEである(Esvelt KM,Carlson JC,and Liu DR.Nature.2011を見よ)。連続的進化は最小限のユーザー介入によって生起するので、進化の間のライブラリ多様性のいずれかの増大はネイティブな複製機構を用いて生起するはずである。そのため、PACEでは、特定の座位として挿入または除去されたコドンを有する遺伝子のライブラリが生成およびスクリーニングされ得るが、「インデルジェネシス」の追加のラウンドは可能ではない。 Because all libraries have access to only a fraction of the possible mutation space, libraries that can bias mutations towards sites on the protein where they are most likely to be beneficial, such as loop regions, would have a significant advantage over conventional libraries. Finally, while it is possible to generate gene libraries with site-specific indel mutations by multi-step PCR and clone assembly using NNK primers or by DNA shuffling, these libraries cannot undergo additional rounds of "indelgenesis" in continuous evolution. Continuous evolution is a type of directed evolution with minimal user intervention. One such example is PACE (see Esvelt KM, Carlson JC, and Liu DR. Nature. 2011). Since continuous evolution occurs with minimal user intervention, any increase in library diversity during evolution should occur using native replication mechanisms. Thus, in PACE, libraries of genes with inserted or removed codons at specific loci can be generated and screened, but additional rounds of "indelgenesis" are not possible.

プライム編集(PE)のプログラム可能性は、高スループットスクリーニングおよび指向性進化への使用のための高度に高性能なプログラムされた遺伝子ライブラリを生成するために活用され得るということが想定される(図29Aを見よ)。PEは、プライム編集ガイドRNA(PEgRNA)上にコードされた情報を用いて、規定された遺伝子座位から定められた数のヌクレオチドを挿入、変化、または除去し得る(図29Bを見よ)。これは、非機能的なフレームシフト変異のバックグラウンド導入なしに、変異が機能の変化を生じさせることが最も蓋然的であるループ領域から挿入または除去された1つ以上のアミノ酸を有する標的化されたライブラリの生成を可能化する(図29Cを見よ)。PEは、DNAポリメラーゼまたは変異させられようとする配列どちらかに内在するバイアスにかかわらず、特定のセットの変異を組み入れるために用いられ得る。 It is envisioned that the programmability of prime editing (PE) can be exploited to generate highly sophisticated programmed gene libraries for use in high-throughput screening and directed evolution (see FIG. 29A). PE can insert, change, or remove a defined number of nucleotides from a defined gene locus using information encoded on a prime editing guide RNA (PEgRNA) (see FIG. 29B). This allows the generation of targeted libraries with one or more amino acids inserted or removed from loop regions where the mutation is most likely to result in a change in function, without the background introduction of non-functional frameshift mutations (see FIG. 29C). PE can be used to incorporate a specific set of mutations regardless of the biases inherent in either the DNA polymerase or the sequence to be mutated.

例えば、それは2つのトランスバージョンを包含する3つの連続した変異を要求するであろうから、CCCコドンを停止コドンに変換することは標準的なライブラリ生成によっては非蓋然的な生起であろうが、PEは、いずれかの所与の標的コドンをTGA停止コドンへと1ステップで変換するために用いられ得る。それらは、例えば、いずれかの疎水性アミノ酸をコードしながらいずれかの他をコードしないコドンを所与の部位に組み込むことによって、プログラムされた多様性を所与の位置に組み入れるためにもまた用いられ得る。さらにその上、PEのプログラム可能性ゆえに、複数のPEgRNAが複数の異なる編集を複数の部位に同時に生成するために利用され得、高度にプログラムされたライブラリの生成を可能化する(図29Dを見よ)。加えて、より低い忠実性を有する逆転写酵素を用いて、さもなければ不変のライブラリにおいて変異導入の領域を生成することが可能である(例えば、HIV-I逆転写酵素またはBordetellaファージ逆転写酵素)(Naorem SS,Hin J,Wang S,Lee WR,Heng X,Miller JF,Guo H.Proc Natl Acad Sci 2017およびMartinez MA,Vartanian JP,Wain-Hobson S.Proc Natl Acad Sci USA 1994を見よ)。 For example, PEs can be used to convert any given target codon to a TGA stop codon in one step, which would be an unlikely occurrence with standard library generation since it would require three consecutive mutations encompassing two transversions. They can also be used to incorporate programmed diversity at a given position, for example by incorporating a codon that codes for any hydrophobic amino acid but not any other at a given site. Furthermore, because of the programmability of PE, multiple PE gRNAs can be utilized to generate multiple different edits at multiple sites simultaneously, enabling the generation of highly programmed libraries (see Figure 29D). In addition, reverse transcriptases with lower fidelity can be used to generate regions of mutagenesis in otherwise immutable libraries (e.g., HIV-I reverse transcriptase or Bordetella phage reverse transcriptase) (see Naorem SS, Hin J, Wang S, Lee WR, Heng X, Miller JF, Guo H. Proc Natl Acad Sci 2017 and Martinez MA, Vartanian JP, Wain-Hobson S. Proc Natl Acad Sci USA 1994).

同じ部位に対するPEの反復的なラウンドの可能性もまた想定され、例えば、例えばループ領域において、単一の部位におけるコドンの繰り返しの挿入を許す。また、上に記載されているアプローチの全てが連続的進化に組み込まれ得るということが想定され、新規のin situ進化ライブラリの生成を可能化する(図30を見よ)。それらは、大きいライブラリをアセンブリすることがさもなければ困難であろう他の細胞型内において、例えば哺乳類細胞内において、これらのライブラリを構築するためにもまた用いられ得る。指向性進化のための最適化されたPEをコードする細菌株の生成は、改善されたまたは新規の機能性を有するタンパク質およびRNAの同定のための有用な追加のツールであろう。PEのこれらの使用の全てはPEの新規の性質を原因として非自明である。結論として、PEによるライブラリ生成は、合成生物学および指向性進化において、ならびにタンパク質およびRNAのコンビナトリアル変異体の高スループットスクリーニングにとって、高度に有用なツールであろう。
競合するアプローチ
The possibility of repeated rounds of PE on the same site is also envisioned, for example allowing the insertion of repeated codons at a single site, for example in a loop region. It is also envisioned that all of the approaches described above can be incorporated into continuous evolution, allowing the generation of novel in situ evolution libraries (see FIG. 30). They can also be used to construct these libraries in other cell types where it would otherwise be difficult to assemble large libraries, for example in mammalian cells. The generation of bacterial strains encoding optimized PE for directed evolution would be a useful additional tool for the identification of proteins and RNAs with improved or novel functionality. All of these uses of PE are non-obvious due to the novel nature of PE. In conclusion, library generation with PE would be a highly useful tool in synthetic biology and directed evolution, as well as for high-throughput screening of combinatorial mutants of proteins and RNAs.
Competing approaches

多様なライブラリが現行で生成される主だった方法は、上に記載されている変異誘発PCRによってである(Cadwell RC and Joyce GF.PCR Methods Appl.1992を見よ)。挿入または欠失はPCRの間に定められた部位において縮重したNNKプライマーによって導入され得るが、かかる変異を複数の部位において導入することは、より多様なライブラリを変異誘発PCRによって構築する前に複数のラウンドの反復的なPCRおよびクローニングを要求し、方法を低速にする。代替的な相補的な方法はDNAシャッフリングであり、ここでは、DNase処置によって生成された遺伝子のライブラリのフラグメントがプライマーなしのPCR反応に導入され、互いに対する異なるフラグメントのアニーリングと、変異誘発PCR単独よりも多様なライブラリの急速な生成とをもたらす(Meyer AJ,Ellefson JW,Ellington AD.Curr Protoc Mol Biol.2014を見よ)。このアプローチは理論的にはインデル変異を生成し得るが、それはより多くの場合には遺伝子機能を破壊するフレームシフト変異をもたらす。さらにその上、DNAシャッフリングは遺伝子フラグメント間に高い度合の相同性を要求する。 The main way diverse libraries are currently generated is by mutagenic PCR as described above (see Cadwell RC and Joyce GF. PCR Methods Appl. 1992). Insertions or deletions can be introduced by degenerate NNK primers at defined sites during PCR, but introducing such mutations at multiple sites requires multiple rounds of iterative PCR and cloning before a more diverse library can be constructed by mutagenic PCR, making the method slow. An alternative complementary method is DNA shuffling, where fragments of a library of genes generated by DNase treatment are introduced into a primer-free PCR reaction, resulting in annealing of the different fragments to each other and more rapid generation of diverse libraries than mutagenic PCR alone (see Meyer AJ, Ellefson JW, Ellington AD. Curr Protoc Mol Biol. 2014). Although this approach can theoretically generate indel mutations, it more often results in frameshift mutations that disrupt gene function. Furthermore, DNA shuffling requires a high degree of homology between gene fragments.

これらの方法の両方はin vitroでされなければならず、もたらされるライブラリは細胞に形質転換されるが、PEによって生成されるライブラリはin situで構築され得、連続的進化へのそれらの使用を可能化する。ライブラリはインビボの変異導入によってin situで構築され得、これらのライブラリはホスト細胞機構に依拠し、インデルに対してのバイアスを発揮する。類似に、従来のクローニング方法は部位特異的な変異プロファイルを生成するために用いられ得るが、それらはin situでは用いられ得ず、一般的には、細胞に形質転換される前にin vitroで1度に1つずつアセンブリされる。原核および真核細胞型両方におけるPEの効率および幅広い機能性は、さらに、E.coliなどのモデル生物にクローニングされることおよびそれから目当ての細胞または生物に移入されることと対比して、これらのライブラリが目当ての細胞型内において直接的に構築され得るということを示唆する。標的化された多様化の別の競合するアプローチは自動多重ゲノム工学またはMAGEであり、複数の一本鎖DNAオリゴヌクレオチドが複製フォークに組み込まれ得、プログラム可能な変異をもたらし得る7。しかしながら、MAGEはホスト株の有意な改変を要求し、オフターゲットまたはバックグラウンド変異の100倍の増大に至り得るが(Nyerges A et al.Proc Natl Acad Sci USA.2016を見よ)、PEはより高度にプログラムされており、より少数のオフターゲット効果をもたらすことが予期される。加えて、MAGEは哺乳類細胞を包含する広い種々の細胞型においては実証されていない。 While both of these methods must be done in vitro and the resulting libraries transformed into cells, libraries generated by PE can be constructed in situ, enabling their use in continuous evolution. Libraries can be constructed in situ by in vivo mutagenesis, and these libraries rely on the host cell machinery and exert a bias against indels. Similarly, traditional cloning methods can be used to generate site-specific mutation profiles, but they cannot be used in situ and are generally assembled one at a time in vitro before being transformed into cells. The efficiency and broad functionality of PE in both prokaryotic and eukaryotic cell types further suggests that these libraries can be constructed directly within the cell type of interest, versus being cloned into a model organism such as E. coli and then transferred into the cell or organism of interest. Another competing approach to targeted diversification is automated multiplex genome engineering or MAGE, in which multiple single-stranded DNA oligonucleotides can be incorporated into replication forks, resulting in programmable mutations . However, MAGE requires significant modification of the host strain and can lead to a 100-fold increase in off-target or background mutations (see Nyerges A et al. Proc Natl Acad Sci USA. 2016), whereas PE is more highly programmed and is expected to result in fewer off-target effects. In addition, MAGE has not been demonstrated in a wide variety of cell types, including mammalian cells.

対照的に、プライム編集はライブラリ生成のための新規のかつ非自明の補完的技術である。
遺伝子ライブラリを構築するためのPEの使用
In contrast, prime editing is a novel and non-obvious complementary technique for library generation.
Use of PE to construct gene libraries

PEはプログラム可能な様式で遺伝子ライブラリを構築するために用いられ得る。 PE can be used to construct gene libraries in a programmable manner.

1つの例では、PEは、PACEを用いる連続的進化実験の間に遺伝子ライブラリにタンパク質バリアントを導入するために指向性進化実験に用いられ得、従来のアプローチでは可能ではない様式で点変異およびインデル両方の反復的蓄積を許す。 In one example, PE can be used in directed evolution experiments to introduce protein variants into gene libraries during continuous evolution experiments using PACE, allowing the iterative accumulation of both point mutations and indels in a manner not possible with conventional approaches.

PEは部位特異的にかつプログラム可能にヌクレオチドをE.coliの遺伝子配列上に挿入し得るということがすでに示されている。指向性進化は、改変されたツーハイブリッドタンパク質:タンパク質結合PACEセレクションによって、特異的なエピトープに対する改善された結合を有するモノボディを同定するために用いられ得る。これらのモノボディ上の特異的なかつ高度に可変のループは、有意に親和性および特異性に寄与する。改善されたモノボディ結合は、PACEにおいてはこれらのループの長さおよび組成を標的化された様式で変えることによって急速に得られ得る。しかしながら、配列長さを変えることはPACEの確立された機能性ではない。様々なループサイズのライブラリがPACEの出発点として用いられ得るが、長さの爾後の改善はPACEセレクションの間には発生せず、点変異およびインデル変異の有益な相乗的組み合わせへのアクセスを妨害するであろう。 It has already been shown that PE can site-specifically and programmably insert nucleotides into gene sequences in E. coli. Directed evolution can be used to identify monobodies with improved binding to specific epitopes by engineered two-hybrid protein:protein binding PACE selection. The specific and highly variable loops on these monobodies contribute significantly to affinity and specificity. Improved monobody binding can be rapidly obtained in PACE by altering the length and composition of these loops in a targeted manner. However, altering sequence length is not an established functionality of PACE. Although a library of different loop sizes can be used as a starting point for PACE, subsequent refinement of the length will not occur during PACE selection, preventing access to beneficial synergistic combinations of point and indel mutations.

種々の態様において、PEは、様々なループ長さを有するモノボディのin situ生成および進化を可能化することによって、PACEセレクションを改善するために用いられ得る。そうするためには、PACE E.coli株は追加のPEプラスミドに導入され得、これはPE酵素および1つ以上のPEgRNAをコードする。E.coliにおけるPE酵素およびPEgRNAの発現は、実験者によって選択される速度でPACEラグーンに送達される低分子のコントロール下にあるであろう。 In various embodiments, PE can be used to improve PACE selection by enabling the in situ generation and evolution of monobodies with various loop lengths. To do so, a PACE E. coli strain can be introduced with an additional PE plasmid, which encodes the PE enzyme and one or more PEgRNAs. Expression of the PE enzyme and PEgRNAs in E. coli will be under the control of small molecules delivered to the PACE lagoon at a rate selected by the experimenter.

種々の態様において、PEgRNA構成要素は、セレクションファージ上の目当ての部位へとPEを導くスペーサーを含有し、複数の3ヌクレオチドが標的部位に挿入され得るようにしてデザインされるであろう。その結果、新たなPEgRNA結合部位が導入され、標的部位における1つ以上のコドンの反復的挿入を可能化するであろう。 In various embodiments, the PEgRNA component will be designed to contain a spacer that directs PE to the site of interest on the selection phage, allowing multiple trinucleotides to be inserted into the target site. This will introduce new PEgRNA binding sites, allowing repeated insertion of one or more codons at the target site.

並行して、別のホストE.coli株は、1つ以上のコドンの除去の鋳型となるであろうPEgRNAを包含し得、ループサイズが進化の間に縮むことを可能化する。PACE実験は両方の株の混合物を利用し得るか、または2つを交互にしてループ配列の低速のかつコントロールされた追加または除去を許し得る。 In parallel, another host E. coli strain could harbor a PEgRNA that would template the removal of one or more codons, allowing the loop size to shrink during evolution. PACE experiments could utilize a mixture of both strains, or alternate between the two to allow for the slow and controlled addition or removal of loop sequences.

モノボディライブラリを生出するためのPEおよびPACEの使用に加えて、この技術はPEおよびPACEを用いる抗体の進化にもまた適用され得る。抗体を支配する結合原理は、モノボディを支配するものに非常に類似である:抗体相補性決定領域ループの長さはそれらの結合機能にとって重大である。さらに、より長いループ長さは、HIV-1および他のウイルス感染に対する幅広く防護性の活性を有する稀な抗体の開発に重大であることが見出されている(Mascola JR,Haynes BF.Immunol Rev.2013を見よ)。抗体または抗体由来分子への上に記載されているPEの適用は、多様なループ長さおよび様々なループ配列を有する抗体の生成を許すであろう。PACEとの組み合わせで、かかるアプローチは、標準のPACEにとってはアクセス可能でないループジオメトリによる増強された結合を許し、それゆえに高度に機能的な抗体の進化を許すであろう。 In addition to the use of PE and PACE to generate monobody libraries, this technique can also be applied to the evolution of antibodies using PE and PACE. The binding principles governing antibodies are very similar to those governing monobodies: the length of the antibody complementarity determining region loops is critical for their binding function. Furthermore, longer loop lengths have been found to be critical for the development of rare antibodies with broadly protective activity against HIV-1 and other viral infections (see Mascola JR, Haynes BF. Immunol Rev. 2013). Application of the PE described above to antibodies or antibody-derived molecules will allow the generation of antibodies with diverse loop lengths and various loop sequences. In combination with PACE, such an approach will allow enhanced binding by loop geometries not accessible to standard PACE and therefore the evolution of highly functional antibodies.

限定しない例として、次のPEgRNAが、連続的進化実験に用いられるバクテリオファージのゲノムをプログラム可能に改変するために用いられ得る:

Figure 2020191243000146
As a non-limiting example, the following PEgRNA can be used to programmably modify the genome of a bacteriophage used in continuous evolution experiments:
Figure 2020191243000146

種々の態様において、遺伝子ライブラリを構築するためのPEの使用は、エラーを起こしやすい逆転写酵素の変異誘発活性の使用をなし得る。かかる変異誘発逆転写酵素の使用は、エラーを起こしやすいRTのより低い忠実性を原因として、変異導入されたプログラム可能なライブラリの生成を容易化し得る。本願において用いられる用語「エラーを起こしやすい」逆転写酵素は、野生型M-MLV逆転写酵素のエラー率未満であるエラー率を有する、天然に存在するまたは別の逆転写酵素(例えば、野生型M-MLV逆転写酵素)から導出された逆転写酵素酵素を言う。野生型M-MLV逆転写酵素のエラー率は15,000から27,000核酸塩基組み込みにつき1エラーの範囲であることが報告されている。Boutabout et al.(2001)"DNA synthesis fidelity by the reverse transcriptase of the yeast retrotransposon Ty1,"Nucleic Acids Res 29(11):2217-2222を見よ。これは参照によって本願に組み込まれる。 In various embodiments, the use of PE to construct gene libraries can make use of the mutagenic activity of error-prone reverse transcriptases. The use of such mutagenic reverse transcriptases can facilitate the generation of mutagenized programmable libraries due to the lower fidelity of error-prone RT. The term "error-prone" reverse transcriptase as used herein refers to a reverse transcriptase enzyme that is naturally occurring or derived from another reverse transcriptase (e.g., wild-type M-MLV reverse transcriptase) that has an error rate that is less than that of wild-type M-MLV reverse transcriptase. The error rate of wild-type M-MLV reverse transcriptase has been reported to range from 1 error per 15,000 to 27,000 nucleobase incorporation. See Boutabout et al. (2001) "DNA synthesis fidelity by the reverse transcriptase of the yeast retrotransposon Ty1," Nucleic Acids Res 29(11):2217-2222, which is incorporated herein by reference.

それゆえに、この適用の目的には、用語「エラーを起こしやすい」は、15,000核酸塩基組み込みにつき1つのエラー(6.7×10-5またはより高く)、例えば、14,000核酸塩基につき1エラー(7.14×10-5またはより高く)、13,000核酸塩基もしくはより少数につき1エラー(7.7×10-5またはより高く)、12,000核酸塩基もしくはより少数につき1エラー(7.7×10-5またはより高く)、11,000核酸塩基もしくはより少数につき1エラー(9.1×10-5またはより高く)、10,000核酸塩基もしくはより少数につき1エラー(1×10-4もしくは0.0001またはより高く)、9,000核酸塩基もしくはより少数につき1エラー(0.00011またはより高く)、8,000核酸塩基もしくはより少数につき1エラー(0.00013またはより高く)、7,000核酸塩基もしくはより少数につき1エラー(0.00014またはより高く)、6,000核酸塩基もしくはより少数につき1エラー(0.00016またはより高く)、5,000核酸塩基もしくはより少数につき1エラー(0.0002またはより高く)、4,000核酸塩基もしくはより少数につき1エラー(0.00025またはより高く)、3,000核酸塩基もしくはより少数につき1エラー(0.00033またはより高く)、2,000核酸塩基もしくはより少数につき1エラー(0.00050またはより高く)、または1,000核酸塩基もしくはより少数につき1エラー(0.001またはより高く)、または500核酸塩基もしくはより少数につき1エラー(0.002またはより高く)、または250核酸塩基もしくはより少数につき1エラー(0.004またはより高く)よりも多大であるエラー率を有するRTを言う。 Therefore, for purposes of this application, the term "error-prone" refers to a nucleic acid sequence that is more likely to have an error than one error per 15,000 nucleobase incorporation (6.7×10 −5 or higher), e.g., one error per 14,000 nucleobases (7.14×10 −5 or higher), one error per 13,000 nucleobases or fewer (7.7×10 −5 or higher), one error per 12,000 nucleobases or fewer (7.7×10 −5 or higher), one error per 11,000 nucleobases or fewer (9.1×10 −5 or higher), one error per 10,000 nucleobases or fewer (1×10 -4 or 0.0001 or higher), 1 error per 9,000 nucleobases or less (0.00011 or higher), 1 error per 8,000 nucleobases or less (0.00013 or higher), 1 error per 7,000 nucleobases or less (0.00014 or higher), 1 error per 6,000 nucleobases or less (0.00016 or higher), 1 error per 5,000 nucleobases or less (0.0002 or higher), 1 error per 4,000 nucleobases or less (0.00016 or higher), 1 error per 5,000 nucleobases or less (0.0002 or higher), 1 error per 4,000 nucleobases or less (0.00016 or higher), 1 error per 6,000 nucleobases or less (0.00016 or higher), 1 error per 5,000 nucleobases or less (0.0002 or higher), 1 error per 4,000 nucleobases or less (0.00016 or higher), 1 error per 8,000 nucleobases or less (0.00016 or higher), 1 error per 9,000 nucleobases or less (0.00016 or higher), 1 error per 10 ... It refers to a RT having an error rate that is greater than 1 error (0.00025 or higher), 1 error per 3,000 nucleobases or fewer (0.00033 or higher), 1 error per 2,000 nucleobases or fewer (0.00050 or higher), or 1 error per 1,000 nucleobases or fewer (0.001 or higher), or 1 error per 500 nucleobases or fewer (0.002 or higher), or 1 error per 250 nucleobases or fewer (0.004 or higher).

高度に変異導入されたプログラム可能なライブラリの生成のためには、種々の変異誘発RTが想定され得る。2つのかかる例はBordetellaファージ(Handa,S.,et al.Nucl Acids Res 9711-25(2018)を見よ。これは参照によって本願に組み込まれる)およびLegionella pneumophila(Arambula,D.,et al.Proc Natl Acad Sci USA 8212-7(2013)を見よ。これは参照によって組み込まれる)からの変異誘発逆転写酵素である。BordetellaファージからのRT(brt)のケースでは、標的部位に対する変異誘発RTの結合を改善するために、補助的なタンパク質(bavd)がCas9に、および追加のRNA配列がPEgRNAに、追加またはトランスで送達されることをもまた必要とし得る(Handa,S.,et al.Nucl Acids Res 9711-25(2018)を見よ)。変異誘発RTを用いるときには、PEgRNAの鋳型領域は、多様性を増強するためのアデノシンまたはAAYコドンが濃縮され得る。 For the generation of highly mutagenized programmable libraries, various mutagenizing RTs can be envisaged. Two such examples are the mutagenizing reverse transcriptases from Bordetella phage (see Handa, S., et al. Nucl Acids Res 9711-25 (2018), which is incorporated herein by reference) and Legionella pneumophila (see Arambula, D., et al. Proc Natl Acad Sci USA 8212-7 (2013), which is incorporated herein by reference). In the case of the RT from Bordetella phage (brt), it may also be necessary to deliver an auxiliary protein (bavd) to Cas9 and an additional RNA sequence to the PEgRNA, either additionally or in trans, to improve binding of the mutagenizing RT to the target site (see Handa, S., et al. Nucl Acids Res 9711-25 (2018)). When using mutagenic RT, the template region of the PEgRNA can be enriched for adenosine or AAY codons to enhance diversity.

Bordetellaファージからの変異誘発RTのアミノ酸配列は次のとおり提供される。本明細書に開示の他のRTのように、Brtタンパク質は、機能的なPEを形成するように融合タンパク質としてnapDNAbpに融合され得る。

Figure 2020191243000147
The amino acid sequence of the mutagenized RT from Bordetella phage is provided below: As with the other RTs disclosed herein, the Brt protein can be fused to the napDNAbp as a fusion protein to form a functional PE.
Figure 2020191243000147

BodetellaからのBrtのケースでは、PE融合体は追加の補助的なタンパク質(Bavd)をもまた包含し得る。補助的なタンパク質はPE融合タンパク質に融合またはトランスで提供され得る。Bavd補助的タンパク質のアミノ酸配列は次のとおり提供される:

Figure 2020191243000148
In the case of Brt from Bodetella, the PE fusion may also include an additional auxiliary protein (Bavd). The auxiliary protein may be fused to the PE fusion protein or provided in trans. The amino acid sequence of the Bavd auxiliary protein is provided as follows:
Figure 2020191243000148

BodetellaからのBrtのケースでは、PEgRNAは、PEgRNA、例えば5'または3'端に追加された追加のヌクレオチド配列を含み得る。例示の配列は次のとおりであり、これは元々はBordetellaファージゲノムからである:

Figure 2020191243000149
In the case of Brt from Bodetella, the PEgRNA can include additional nucleotide sequences added to the PEgRNA, for example, at the 5' or 3' end. An exemplary sequence is as follows, which is originally from the Bordetella phage genome:
Figure 2020191243000149

長さを短くするために、このPEgRNA追加配列は種々のやり方で縮減され得る。例えば、PEgRNA追加1配列は次の例示の代替的な追加配列へと縮減され得る:

Figure 2020191243000150
To reduce its length, this PEgRNA addition sequence can be shortened in various ways. For example, the PEgRNA addition 1 sequence can be shortened to the following exemplary alternative addition sequences:
Figure 2020191243000150

他の態様において、PEgRNA追加配列もまた変異させられ得る。例えば、PEgRNA追加1配列は次の例示の代替的な追加配列へと変異させられ得る:

Figure 2020191243000151
In other embodiments, the PEgRNA addition sequence can also be mutated. For example, the PEgRNA addition 1 sequence can be mutated to the following exemplary alternative addition sequences:
Figure 2020191243000151

遺伝子ライブラリをデザインするためのPEの使用に関する種々の態様では、特殊なPEgRNAの考慮事項が適用され得る。例えば、理論によって拘束されることなしに、上に記載されている追加のPEgRNA配列は、変異誘発RTによる効率的な変異導入を可能化するために必要とされ得る。別の態様では、PEを用いる反復的なコドン挿入は特定のPEgRNAデザインを要求し得る。例えば、GGG(グリシン)コドンを反復的に挿入するためには、上に示されているとおり、PEgRNAの相同性領域全体がGから成ることを必要とし得る。これはある種の部位のみが反復的な挿入をし得るということを意味するであろう。加えて、PAM配列はPEによって遮断される能力はないであろう。 In various embodiments involving the use of PE to design gene libraries, special PEgRNA considerations may apply. For example, without being bound by theory, the additional PEgRNA sequences described above may be required to enable efficient mutagenesis by mutagenic RT. In another embodiment, repetitive codon insertion using PE may require specific PEgRNA design. For example, to repetitively insert GGG (glycine) codons, as shown above, the entire homology region of the PEgRNA may need to consist of Gs. This would mean that only certain sites would be capable of repetitive insertion. In addition, PAM sequences would not be capable of being blocked by PE.

H.免疫エピトープの挿入のためのプライム編集の使用
プライム編集因子は、公知の免疫原性エピトープを内生または外生のゲノムDNA上に挿入するための手段としてもまた用いられ得、治療学的またはバイオテクノロジー的適用のための対応するタンパク質の改変をもたらす(図31および32を見よ)。プライム編集の本発明に先行しては、かかる挿入は、非効率的にかつDSBからの高いインデル形成率によってのみ達成され得た。プライム編集は挿入編集からの高いインデル形成の問題を解決しながら、一般的にHDRよりも高い効率をオファーする。このより低いインデル形成率は、特に免疫原性エピトープを挿入するという記載されている適用において、標的化されたDNA挿入のための方法としてのHDRと比べたプライム編集の主要な利点を提示する。エピトープの長さは少数塩基から数百塩基の範囲である。プライム編集因子はかかる標的化された挿入を哺乳類細胞において達成するための効率的なアプローチである。
H. Use of Prime Editing for Insertion of Immune Epitopes
Prime editors can also be used as a means to insert known immunogenic epitopes onto endogenous or exogenous genomic DNA, resulting in the modification of the corresponding protein for therapeutic or biotechnological applications (see Figures 31 and 32). Prior to the present invention of prime editing, such insertions could only be achieved inefficiently and with high indel formation rates from DSBs. Prime editing offers higher efficiency than HDR in general, while solving the problem of high indel formation from insertion editing. This lower indel formation rate presents a major advantage of prime editing compared to HDR as a method for targeted DNA insertion, especially in the described application of inserting immunogenic epitopes. The length of the epitopes ranges from a few bases to several hundred bases. Prime editors are an efficient approach to achieve such targeted insertions in mammalian cells.

本発明の鍵の概念は、それらのタンパク質産物および/または発現細胞型の下方制御および/または破壊のために、内生または外生のゲノムDNA上に、先に記載された免疫原性エピトープを含有するヌクレオチド配列を挿入するためのプライム編集因子の使用である。標的遺伝子のコードされるタンパク質と挿入される免疫原性のエピトープの対応するタンパク質翻訳との融合タンパク質を生ずる様式で、免疫原性のエピトープ挿入のためのヌクレオチド配列が、遺伝子へと標的化されるであろう。患者の免疫系は、例えば破傷風またジフテリアまたは麻疹に対するルーチンの予防接種からの先行する標準免疫化の結果として、これらのエピトープを認識するように先に訓練されているであろう。融合されるエピトープの免疫原性の性質の結果として、患者の免疫系は、プライム編集されたタンパク質(ただの挿入されるエピトープではない)と可能性としてはそれが発現された細胞とを認識および不能化することが予想されるであろう。 The key concept of the present invention is the use of a prime editor to insert nucleotide sequences containing the immunogenic epitopes described above onto endogenous or exogenous genomic DNA for downregulation and/or destruction of their protein products and/or expressing cell types. The nucleotide sequences for immunogenic epitope insertion will be targeted into the gene in a manner that results in a fusion protein between the encoded protein of the target gene and the corresponding protein translation of the inserted immunogenic epitope. The patient's immune system will have been previously trained to recognize these epitopes as a result of prior standard immunization, e.g., from routine vaccinations against tetanus or diphtheria or measles. As a result of the immunogenic nature of the fused epitopes, the patient's immune system will be expected to recognize and disable the prime edited protein (and not just the inserted epitope) and potentially the cells in which it is expressed.

CRISPR/Casシステムを用いる精密なゲノム標的化テクノロジーが、最近では、標的ゲノム座位上への操作されたDNA配列の挿入を包含する広い範囲の適用において調査されている。先には、相同組み換え修復(HDR)がこの適用について用いられ、ssDNAドナー鋳型と二本鎖DNA切断(DSB)の手段による修復開始とを要求した。この戦略は、細胞になされるべき可能な変化の最も幅広い範囲をオファーし、大きいDNA配列を哺乳類細胞に挿入するために利用可能な唯一の方法である。しかしながら、HDRは、そのDSBを開始することから派生する望まれない細胞副作用、例えば高いレベルのインデル形成、DNA転座、大きい欠失、およびP53活性化によって邪魔される。これらの欠点に加えて、HDRは多くの細胞型における低い効率によって限定される(T細胞はこの観察の注意すべき例外である)。これらの欠点を克服するための最近の作業は、ヒトRad51変異体をCas9 D10Aニッカーゼに融合することを包含し(RDN)、DSBフリーHDRシステムをもたらす。これは、改善されたHDR産物:インデル比およびより低いオフターゲット編集を特色とするが、細胞型依存性および控えめなのみのHDR編集効率によってなお邪魔される。 Precise genome targeting technologies using the CRISPR/Cas system have recently been explored in a wide range of applications, including the insertion of engineered DNA sequences onto target genomic loci. Previously, homology-directed repair (HDR) was used for this application, requiring a ssDNA donor template and repair initiation by means of a double-stranded DNA break (DSB). This strategy offers the broadest range of possible changes to be made to the cell and is the only method available for inserting large DNA sequences into mammalian cells. However, HDR is hampered by unwanted cellular side effects derived from initiating the DSB, such as high levels of indel formation, DNA translocations, large deletions, and P53 activation. In addition to these drawbacks, HDR is limited by low efficiency in many cell types (T cells are a notable exception to this observation). Recent work to overcome these drawbacks involves fusing a human Rad51 mutant to the Cas9 D10A nickase (RDN), resulting in a DSB-free HDR system. This features improved HDR product:indel ratios and lower off-target editing, but is still hampered by cell-type dependency and only modest HDR editing efficiency.

PEgRNAとカップリングされた逆転写酵素へのCas9の最近開発された融合体(「プライム編集因子」)は、存在するゲノム編集法と比べていくつもの利点をオファーする新規のゲノム編集テクノロジーを表し、部位特異的な様式で、いずれかの1ヌクレオチド置換を組み入れおよびヌクレオチドのいずれかの短いストレッチ(最高で少なくとも何ダースもの塩基)を挿入または欠失する能力を包含する。注意すべきことに、PE編集は一般的には低い意図されないインデル率によって達成される。そのため、PEは、先には不可能または非実用的であった標的化された挿入に基づく編集適用を可能化する。 The recently developed fusion of Cas9 to a reverse transcriptase coupled with PEgRNA (the "prime editor") represents a novel genome editing technology that offers several advantages over existing genome editing methods, including the ability to incorporate any single nucleotide substitution and to insert or delete any short stretch of nucleotides (up to at least several dozen bases) in a site-specific manner. Of note, PE editing is generally achieved with a low rate of unintended indels. Therefore, PE enables targeted insertion-based editing applications that were previously impossible or impractical.

この具体的な側面は、公知の免疫原性エピトープを内生または外生のゲノムDNA上に挿入するための手段としてプライム編集を用いるための方法を記載し、治療学的またはバイオテクノロジー的適用のための対応するタンパク質の改変をもたらす(図31および32を見よ)。プライム編集の本発明に先行しては、かかる挿入は、非効率的にかつDSBからの高いインデル形成率によってのみ達成され得た。プライム編集は挿入編集からの高いインデル形成の問題を解決しながら、一般的にHDRよりも高い効率をオファーする。このより低いインデル形成率は、特に免疫原性エピトープを挿入するという記載されている適用において、標的化されたDNA挿入のための方法としてのHDRと比べたプライム編集の主要な利点を提示する。エピトープの長さは少数塩基から数百塩基の範囲である。プライム編集因子はかかる標的化された挿入を哺乳類細胞において達成するための効率的なかつ最もクリーンなアプローチである。 This particular aspect describes a method for using prime editing as a means to insert known immunogenic epitopes onto endogenous or exogenous genomic DNA, resulting in the modification of the corresponding protein for therapeutic or biotechnological applications (see Figures 31 and 32). Prior to the present invention of prime editing, such insertions could only be achieved inefficiently and with high indel formation rates from DSBs. Prime editing offers higher efficiency than HDR in general, while solving the problem of high indel formation from insertion editing. This lower indel formation rate presents a major advantage of prime editing compared to HDR as a method for targeted DNA insertion, especially in the described application of inserting immunogenic epitopes. The length of the epitopes ranges from a few bases to hundreds of bases. Prime editors are an efficient and cleanest approach to achieve such targeted insertions in mammalian cells.

この側面の鍵の概念は、それらのタンパク質産物および/または発現細胞型の下方制御および/または破壊のために、先に記載された免疫原性エピトープを含有するヌクレオチド配列を内生または外生のゲノムDNA上に挿入するためのプライム編集因子の使用である。標的遺伝子のコードされるタンパク質と挿入される免疫原性のエピトープの対応するタンパク質翻訳との融合タンパク質を生ずる様式で、免疫原性のエピトープ挿入のためのヌクレオチド配列は、遺伝子へと標的化されるであろう。患者の免疫系は、例えば破傷風またジフテリアまたは麻疹に対するルーチンの予防接種からの先行する標準免疫化の結果として、これらのエピトープを認識するように先に訓練されているであろう。融合されるエピトープの免疫原性の性質の結果として、患者の免疫系は、プライム編集されたタンパク質(ただの挿入されるエピトープではない)と可能性としてはそれが発現された細胞とを認識および不能化することが予想されるであろう。 The key concept of this aspect is the use of a prime editor to insert nucleotide sequences containing the immunogenic epitopes described above onto endogenous or exogenous genomic DNA for downregulation and/or destruction of their protein products and/or expressing cell types. The nucleotide sequences for immunogenic epitope insertion will be targeted into the gene in a manner that results in a fusion protein between the encoded protein of the target gene and the corresponding protein translation of the inserted immunogenic epitope. The patient's immune system will have been previously trained to recognize these epitopes as a result of prior standard immunization, e.g., from routine vaccinations against tetanus or diphtheria or measles. As a result of the immunogenic nature of the fused epitopes, the patient's immune system will be expected to recognize and disable the prime edited protein (and not just the inserted epitope) and potentially the cells in which it is expressed.

標的遺伝子への融合体は、挿入されたエピトープタンパク質翻訳が免疫系認識のために暴露されるということを保証するために必要とされるとおり操作されるであろう。これは、免疫原性エピトープがタンパク質構造の表面に暴露された領域にコードされるようにして、標的遺伝子への免疫原性エピトープのC末端融合体、標的遺伝子への免疫原性エピトープのN末端融合体、または遺伝子上へのヌクレオチドの挿入を生むタンパク質翻訳をもたらす標的化されたヌクレオチド挿入を包含し得る。 Fusions to the target gene will be engineered as required to ensure that the inserted epitope protein translation is exposed for immune system recognition. This may include C-terminal fusions of the immunogenic epitope to the target gene, N-terminal fusions of the immunogenic epitope to the target gene, or targeted nucleotide insertions that result in protein translation resulting in the insertion of nucleotides onto the gene such that the immunogenic epitope is encoded in a surface-exposed region of the protein structure.

標的遺伝子の免疫系認識、細胞輸送、タンパク質機能、またはタンパク質フォールディングを容易化するために、標的遺伝子配列と挿入される免疫原性エピトープヌクレオチド配列との間に挿入されるヌクレオチドとしてコードされるタンパク質リンカーが、本発明の一部として操作されることを必要とし得る。これらの挿入されるヌクレオチドによってコードされるタンパク質リンカーは、可変の長さおよび配列のXTENリンカーまたは可変の長さおよび配列のグリシン-セリンリンカーを包含し得る(が、これらに限定されない)。これらの操作されたリンカーは、タンパク質融合を首尾良く容易化するために先に用いられている。例示のリンカーは、本明細書に記載のもののいずれかを包含し得、アミノ酸配列(GGGGS)n(配列番号165)、(G)n(配列番号166)、(EAAAK)n(配列番号167)、(GGS)n(配列番号168)、(SGGS)n(配列番号169)、(XP)n(配列番号170)、またはそれらのいずれかの組み合わせを包含し、nは独立して1および30の間の整数であり、Xはいずれかのアミノ酸である。いくつかの態様では、リンカーはアミノ酸配列(GGS)n(配列番号176)を含み、nは1、3、または7である。いくつかの態様では、リンカーはアミノ酸配列SGSETPGTSESATPES(配列番号171)を含む。いくつかの態様では、リンカーはアミノ酸配列SGGSSGGSSGSETPGTSESATPESSGGSSGGS(配列番号172)を含む。いくつかの態様では、リンカーはアミノ酸配列SGGSGGSGGS(配列番号173)を含む。いくつかの態様では、リンカーはアミノ酸配列SGGS(配列番号174)を含む。 To facilitate immune system recognition of the target gene, cellular trafficking, protein function, or protein folding, a protein linker encoded as nucleotides inserted between the target gene sequence and the inserted immunogenic epitope nucleotide sequence may need to be engineered as part of the invention. The protein linkers encoded by these inserted nucleotides may include (but are not limited to) XTEN linkers of variable length and sequence or glycine-serine linkers of variable length and sequence. These engineered linkers have been used previously to successfully facilitate protein fusion. Exemplary linkers may include any of those described herein, including the amino acid sequences (GGGGS)n (SEQ ID NO: 165), (G)n (SEQ ID NO: 166), (EAAAK)n (SEQ ID NO: 167), (GGS)n (SEQ ID NO: 168), (SGGS)n (SEQ ID NO: 169), (XP)n (SEQ ID NO: 170), or any combination thereof, where n is independently an integer between 1 and 30, and X is any amino acid. In some embodiments, the linker comprises the amino acid sequence (GGS)n (SEQ ID NO: 176), where n is 1, 3, or 7. In some embodiments, the linker comprises the amino acid sequence SGSETPGTSESATPES (SEQ ID NO: 171). In some embodiments, the linker comprises the amino acid sequence SGGSSGGSSGSETPGTSESATPESSGGSSGGS (SEQ ID NO: 172). In some embodiments, the linker comprises the amino acid sequence SGGSGGSGGS (SEQ ID NO: 173). In some embodiments, the linker comprises the amino acid sequence SGGS (SEQ ID NO: 174).

この側面の際立った特色は、さもなければ非免疫原性のタンパク質に対する免疫応答を誘導するための手段として、特定のアミノ酸配列に対する先に獲得された免疫応答を用いる能力を包含する。別の際立った特色は、副産物編集としての欲されないインデルの高いレベルを誘導せずかつその挿入が効率的である標的様式で、これらの免疫原性のエピトープのヌクレオチド配列を挿入する能力である。PEのこの特定の適用は、細胞型特異的な送達方法(例えばAAV血清型)を組み合わせて、それに対する免疫応答を誘発することが目当てである細胞型にエピトープを挿入する能力を有する。 A distinguishing feature of this aspect includes the ability to use a previously acquired immune response to a particular amino acid sequence as a means to induce an immune response to an otherwise non-immunogenic protein. Another distinguishing feature is the ability to insert the nucleotide sequences of these immunogenic epitopes in a targeted manner that does not induce high levels of unwanted indels as by-product editing and whose insertion is efficient. This particular application of PE has the ability to combine a cell type specific delivery method (e.g., AAV serotype) to insert an epitope into a cell type against which it is desired to elicit an immune response.

免疫原性のエピトープを病原性の遺伝子上に挿入する手段としてのプライム編集は、広い種々の疾患(免疫腫瘍学戦略のがんに限定されない)と戦うように患者の免疫系をプログラムするために用いられ得る。このテクノロジーの直ちに該当する使用は、がんの治療学としてであろう。なぜなら、それは、HER2のような該当するがん遺伝子またはEGFRのような増殖因子に対する免疫応答を引き起こすことによって、腫瘍の免疫エスケープ機序を阻み得るからである。かかるアプローチはT細胞操作に類似に見え得るが、このアプローチの1つの新規の進歩は、操作されたT細胞を生成し患者に導入することを必要とすることなしに、それが多くの細胞型におよびがん以外の疾患に利用され得るということである。 Prime editing as a means of inserting immunogenic epitopes onto pathogenic genes can be used to program a patient's immune system to fight a wide variety of diseases (not limited to cancer in an immuno-oncology strategy). An immediately relevant use of this technology would be as cancer therapeutics, since it could thwart the immune escape mechanisms of tumors by triggering an immune response against relevant oncogenes such as HER2 or growth factors such as EGFR. While such an approach may appear similar to T cell engineering, one novel advancement of this approach is that it can be utilized for many cell types and diseases other than cancer, without the need to generate and introduce engineered T cells into patients.

PEを用いて、ほとんどの者がすでに予防接種されている免疫原性エピトープ(破傷風、百日咳、ジフテリア、麻疹、ムンプス、風疹など)を疾患を駆動する外生のまたは内生遺伝子上に挿入し、そのため、患者の免疫系はそのタンパク質を不能化することを学習する。 Using PE, immunogenic epitopes against which most people are already vaccinated (tetanus, whooping cough, diphtheria, measles, mumps, rubella, etc.) are inserted onto exogenous or endogenous disease-driving genes so that the patient's immune system learns to disable the protein.

前述の戦略からの可能性ある治療学的な利益を有しそうな疾患は、毒性のタンパク質の凝集によって引き起こされるもの、例えば致死性家族性不眠症を包含する。利し得る他の疾患は、さもなければ非毒性の内生タンパク質の病原性の過剰発現によって引き起こされるもの、および外生の病原体によって引き起こされるものを包含する。 Diseases that would have potential therapeutic benefit from the aforementioned strategies include those caused by toxic protein aggregation, such as fatal familial insomnia. Other diseases that may benefit include those caused by pathogenic overexpression of otherwise non-toxic endogenous proteins, and those caused by exogenous pathogens.

一次的な治療学的適応は、上で言及されているもの、例えばがん、プリオン、および他の神経変性疾患の治療学、感染性疾患、ならびに予防的な医療を包含する。二次的な治療学的適応は、遅発性の遺伝子疾患を有する患者の予防的ケアを包含し得る。特に侵襲性のがんのようないくつかの疾患では、または薬物治療が疾患が完全に治癒するまで疾患症状を緩和することを助けるケースでは、現行の標準治療の医療がプライム編集と併せて用いられ得るということが予想される。下は、本明細書に開示のプライム編集因子によって遺伝子上に挿入され得る免疫エピトープの例である:

Figure 2020191243000152

Figure 2020191243000153

Figure 2020191243000154

Figure 2020191243000155

Figure 2020191243000156
Primary therapeutic indications include those mentioned above, such as therapeutics for cancer, prion, and other neurodegenerative diseases, infectious diseases, and preventative medicine. Secondary therapeutic indications may include preventative care for patients with late-onset genetic diseases. It is expected that in some diseases, especially aggressive cancers, or in cases where drug treatments help alleviate disease symptoms until the disease is completely cured, current standard of care medicines may be used in conjunction with prime editing. Below are examples of immune epitopes that can be inserted onto genes by the prime editing elements disclosed herein:
Figure 2020191243000152

Figure 2020191243000153

Figure 2020191243000154

Figure 2020191243000155

Figure 2020191243000156

当該技術分野で公知の追加の免疫エピトープもまた組み入れられ得る。Immune Epitope Database and Analysis Resource(iedb.org/epitopedetails_v3.php)(これの内容は参照によって本願に組み込まれる)から利用可能な免疫エピトープのいずれかは、本明細書に開示のプライム編集因子によって組み入れられ得る。 Additional immune epitopes known in the art may also be incorporated. Any of the immune epitopes available from the Immune Epitope Database and Analysis Resource (iedb.org/epitopedetails_v3.php), the contents of which are incorporated herein by reference, may be incorporated by the prime editors disclosed herein.

いくつかの態様では、本明細書に開示のプライム編集因子によって組み入れられ得る免疫エピトープは次のエピトープのいずれかを包含し得る:

Figure 2020191243000157

Figure 2020191243000158

Figure 2020191243000159

Figure 2020191243000160

Figure 2020191243000161

Figure 2020191243000162

Figure 2020191243000163

Figure 2020191243000164

Figure 2020191243000165

Figure 2020191243000166

Figure 2020191243000167

Figure 2020191243000168

Figure 2020191243000169

Figure 2020191243000170

Figure 2020191243000171

Figure 2020191243000172

Figure 2020191243000173

Figure 2020191243000174

Figure 2020191243000175

Figure 2020191243000176

Figure 2020191243000177

Figure 2020191243000178

Figure 2020191243000179

Figure 2020191243000180

Figure 2020191243000181

Figure 2020191243000182

Figure 2020191243000183

Figure 2020191243000184

Figure 2020191243000185

Figure 2020191243000186

Figure 2020191243000187

Figure 2020191243000188

Figure 2020191243000189

Figure 2020191243000190

Figure 2020191243000191

Figure 2020191243000192

Figure 2020191243000193

Figure 2020191243000194

Figure 2020191243000195

Figure 2020191243000196

Figure 2020191243000197

Figure 2020191243000198

Figure 2020191243000199

Figure 2020191243000200

Figure 2020191243000201

Figure 2020191243000202

Figure 2020191243000203

Figure 2020191243000204

Figure 2020191243000205

Figure 2020191243000206

Figure 2020191243000207

Figure 2020191243000208

Figure 2020191243000209

Figure 2020191243000210

Figure 2020191243000211

Figure 2020191243000212

Figure 2020191243000213

Figure 2020191243000214

Figure 2020191243000215

Figure 2020191243000216

Figure 2020191243000217

Figure 2020191243000218

Figure 2020191243000219

Figure 2020191243000220

Figure 2020191243000221

Figure 2020191243000222
In some embodiments, immune epitopes that can be incorporated by the prime editors disclosed herein can include any of the following epitopes:
Figure 2020191243000157

Figure 2020191243000158

Figure 2020191243000159

Figure 2020191243000160

Figure 2020191243000161

Figure 2020191243000162

Figure 2020191243000163

Figure 2020191243000164

Figure 2020191243000165

Figure 2020191243000166

Figure 2020191243000167

Figure 2020191243000168

Figure 2020191243000169

Figure 2020191243000170

Figure 2020191243000171

Figure 2020191243000172

Figure 2020191243000173

Figure 2020191243000174

Figure 2020191243000175

Figure 2020191243000176

Figure 2020191243000177

Figure 2020191243000178

Figure 2020191243000179

Figure 2020191243000180

Figure 2020191243000181

Figure 2020191243000182

Figure 2020191243000183

Figure 2020191243000184

Figure 2020191243000185

Figure 2020191243000186

Figure 2020191243000187

Figure 2020191243000188

Figure 2020191243000189

Figure 2020191243000190

Figure 2020191243000191

Figure 2020191243000192

Figure 2020191243000193

Figure 2020191243000194

Figure 2020191243000195

Figure 2020191243000196

Figure 2020191243000197

Figure 2020191243000198

Figure 2020191243000199

Figure 2020191243000200

Figure 2020191243000201

Figure 2020191243000202

Figure 2020191243000203

Figure 2020191243000204

Figure 2020191243000205

Figure 2020191243000206

Figure 2020191243000207

Figure 2020191243000208

Figure 2020191243000209

Figure 2020191243000210

Figure 2020191243000211

Figure 2020191243000212

Figure 2020191243000213

Figure 2020191243000214

Figure 2020191243000215

Figure 2020191243000216

Figure 2020191243000217

Figure 2020191243000218

Figure 2020191243000219

Figure 2020191243000220

Figure 2020191243000221

Figure 2020191243000222

I.プライム編集因子の送達
別の側面において、本開示は、種々の戦略を用いてin vitroおよびインビボのプライム編集因子の送達を可能にし、分裂インテインを用いる別個のベクター、ならびにエレクトロポレーションなどの技術を用いるリボヌクレオタンパク質複合体(すなわち、PEgRNAおよび/または第2部位gRNAと複合体化したプライム編集因子)、カチオン性脂質によって媒介される製剤の使用、およびリボヌクレオタンパク質複合体に融合された受容体リガンドを用いる誘導性エンドサイトーシス法という直接的送達戦略を包含する。いずれかのかかる方法が本願において企図される。
I. Delivery of Prime Editing Factors
In another aspect, the present disclosure allows for the delivery of prime editors in vitro and in vivo using a variety of strategies, including separate vectors using split inteins, as well as direct delivery strategies using ribonucleoprotein complexes (i.e., prime editors complexed with PE gRNA and/or second site gRNA) using techniques such as electroporation, the use of cationic lipid-mediated formulations, and inducible endocytosis methods using receptor ligands fused to ribonucleoprotein complexes. Any such method is contemplated herein.

送達オプションの概観
いくつかの側面では、本発明は、1つ以上のプライム編集因子をコードするポリヌクレオチド、例えば本明細書に記載のプライム編集システムの1つ以上の構成要素をコードする本明細書に記載の1つ以上のベクター、その1つ以上の転写物、および/またはそれから転写される1つ以上のタンパク質を、ホスト細胞に送達することを含む方法を提供する。いくつかの側面では、本発明は、さらに、かかる方法によって生ずる細胞、およびかかる細胞を含むかまたはそれから生ずる生物(例えば動物、植物、または真菌)を提供する。いくつかの態様では、本明細書に記載のプライム編集因子は、ガイド配列との組み合わせで(任意に、それと複合体化されて)、細胞に送達される。従来のウイルスおよび非ウイルスに基づく遺伝子移入方法が、哺乳類細胞または標的組織において核酸を導入するために用いられ得る。かかる方法は、プライム編集因子の構成要素をコードする核酸を培養中のまたはホスト生物中の細胞に投与するために用いられ得る。非ウイルスベクター送達システムは、DNAプラスミド、RNA(例えば、本明細書に記載のベクターの転写物)、裸の核酸、およびリポソームなどの送達基剤と複合体化した核酸を包含する。ウイルスベクター送達システムはDNAおよびRNAウイルスを包含し、これらは細胞への送達後にエピソーム性のまたは取り入れされたゲノムどちらかを有する。遺伝子療法の総説については、Anderson,Science 256:808-813(1992);Nabel & Felgner,TIBTECH 11:211-217(1993);Mitani & Caskey,TIBTECH 11:162-166(1993);Dillon,TIBTECH 11:167-175(1993);Miller,Nature 357:455-460(1992);Van Brunt,Biotechnology 6(10):1149-1154(1988);Vigne,Restorative Neurology and Neuroscience 8:35-36(1995);Kremer & Perricaudet,British Medical Bulletin 51(1):31-44(1995);Haddada et al.,in Current Topics in Microbiology and Immunology Doerfler and Bihm(eds)(1995);およびYu et al.,Gene Therapy 1:13-26(1994)を参照。
Overview of Delivery Options In some aspects, the present invention provides methods that include delivering to a host cell a polynucleotide encoding one or more prime editors, such as one or more vectors described herein encoding one or more components of the prime editing system described herein, one or more transcripts thereof, and/or one or more proteins transcribed therefrom. In some aspects, the present invention further provides cells resulting from such methods, and organisms (e.g., animals, plants, or fungi) that contain or result from such cells. In some embodiments, the prime editors described herein are delivered to cells in combination with (and optionally complexed with) a guide sequence. Conventional viral and non-viral based gene transfer methods can be used to introduce nucleic acids in mammalian cells or target tissues. Such methods can be used to administer nucleic acids encoding components of the prime editors to cells in culture or in a host organism. Non-viral vector delivery systems include DNA plasmids, RNA (e.g., transcripts of vectors described herein), naked nucleic acid, and nucleic acid complexed with a delivery vehicle such as a liposome. Viral vector delivery systems include DNA and RNA viruses, which have either episomal or integrated genomes after delivery to the cell. For reviews of gene therapy, see Anderson, Science 256:808-813 (1992); Nabel & Felgner, TIBTECH 11:211-217 (1993); Mitani & Caskey, TIBTECH 11:162-166 (1993); Dillon, TIBTECH 11:167-175 (1993); Miller, Nature 357:455-460 (1992); Van Brunt, Biotechnology 6(10):1149-1154 (1988); Vigne, Restorative Neurology and Neuroscience 8:35-36 (1995); Kremer & Perricaudet, British Medical Bulletin 51(1):31-44 (1995); Haddada et al., in Current Topics in Microbiology and Immunology Doerfler and See Bihm (eds) (1995); and Yu et al., Gene Therapy 1:13-26 (1994).

核酸の非ウイルス的送達の方法は、リポフェクション、ヌクレオフェクション、マイクロインジェクション、バイオリスティック、ビロソーム、リポソーム、イムノリポソーム、ポリカチオンまたは脂質:核酸コンジュゲート、裸のDNA、人工ビリオン、およびDNAの薬剤によって増強された取り込みを包含する。リポフェクションは例えば米国特許第5,049,386号、第4,946,787号;および第4,897,355号に記載され、リポフェクション試薬は市販で販売されている(例えば、Transfectam(商標)およびLipofectin(商標))。ポリヌクレオチドの効率的な受容体認識リポフェクションにとって好適であるカチオン性および中性脂質は、FeignerのWO91/17424;WO91/16024のものを包含する。送達は細胞(例えば、in vitroのまたはエクスビボの投与)または標的組織(例えばインビボの投与)にであり得る。 Methods for non-viral delivery of nucleic acids include lipofection, nucleofection, microinjection, biolistics, virosomes, liposomes, immunoliposomes, polycation or lipid:nucleic acid conjugates, naked DNA, artificial virions, and drug-enhanced uptake of DNA. Lipofection is described, for example, in U.S. Pat. Nos. 5,049,386; 4,946,787; and 4,897,355, and lipofection reagents are commercially available (e.g., Transfectam™ and Lipofectin™). Cationic and neutral lipids that are suitable for efficient receptor-recognition lipofection of polynucleotides include those of Feigner, WO 91/17424; WO 91/16024. Delivery can be to cells (e.g., in vitro or ex vivo administration) or to target tissues (e.g., in vivo administration).

イムノ脂質複合体などの標的化リポソームを包含する脂質:核酸複合体の調製は当業者に周知である(例として、Crystal,Science 270:404-410(1995);Blaese et al.,Cancer Gene Ther.2:291-297(1995);Behr et al.,Bioconjugate Chem.5:382-389(1994);Remy et al.,Bioconjugate Chem.5:647-654(1994);Gao et al.,Gene Therapy 2:710-722(1995);Ahmad et al.,Cancer Res.52:4817-4820(1992);米国特許第4,186,183号、第4,217,344号、第4,235,871号、第4,261,975号、第4,485,054号、第4,501,728号、第4,774,085号、第4,837,028号、および第4,946,787を参照)。 The preparation of lipid:nucleic acid complexes, including targeted liposomes such as immunolipid complexes, is well known to those of skill in the art (see, e.g., Crystal, Science 270:404-410 (1995); Blaese et al., Cancer Gene Ther. 2:291-297 (1995); Behr et al., Bioconjugate Chem. 5:382-389 (1994); Remy et al., Bioconjugate Chem. 5:647-654 (1994); Gao et al., Gene Therapy 2:710-722 (1995); Ahmad et al., Cancer Res. 52:4817-4820 (1992); see U.S. Patent Nos. 4,186,183, 4,217,344, 4,235,871, 4,261,975, 4,485,054, 4,501,728, 4,774,085, 4,837,028, and 4,946,787).

核酸の送達のためのRNAまたはDNAウイルスに基づくシステムの使用は、体の特定の細胞へとウイルスを標的化およびウイルスペイロードを核に輸送するための高度に進化したプロセスを利する。ウイルスベクターは、直接的に患者に投与され得るか(インビボ)、またはそれらはin vitroの細胞を処置するために用いられ得、改変された細胞が任意に患者に投与され得る(エクスビボ)。従来のウイルスに基づくシステムは、遺伝子移入のためのレトロウイルス、レンチウイルス、アデノウイルス、アデノ随伴、および単純ヘルペスウイルスベクターを包含し得る。ホストゲノムへの取り入れはレトロウイルス、レンチウイルス、およびアデノ随伴ウイルス遺伝子移入法で可能であり、多くの場合には、挿入されたトランスジーンの長期的発現をもたらす。加えて、高い形質導入効率が多くの異なる細胞型および標的組織で観察されている。 The use of RNA or DNA virus-based systems for delivery of nucleic acids takes advantage of the highly evolved processes for targeting viruses to specific cells of the body and transporting the viral payload to the nucleus. Viral vectors can be administered directly to patients (in vivo) or they can be used to treat cells in vitro and the modified cells can optionally be administered to patients (ex vivo). Traditional virus-based systems can include retroviral, lentiviral, adenoviral, adeno-associated, and herpes simplex virus vectors for gene transfer. Integration into the host genome is possible with retroviral, lentiviral, and adeno-associated viral gene transfer methods, often resulting in long-term expression of the inserted transgene. In addition, high transduction efficiencies have been observed in many different cell types and target tissues.

ウイルスのトロピズムは外生のエンベロープタンパク質を組み込むことによって変改され得、標的細胞の可能性ある標的集団を拡張する。レンチウイルスベクターは、非分裂細胞に形質導入または感染する能力があるレトロウイルスベクターであり、典型的には高いウイルス力価を生ずる。よって、レトロウイルス遺伝子移入システムの選択は標的組織に依存するであろう。レトロウイルスベクターはシスに作用する長い末端反復からなり、最高で6-10kbの外生の配列のパッケージング容量を有する。最小のシスに作用するLTRはベクターの複製およびパッケージングにとって十分であり、これらはそれから治療学的な遺伝子を標的細胞に取り入れするために用いられて、永久的なトランスジーン発現を提供する。広く用いられるレトロウイルスベクターは、ネズミ白血病ウイルス(MuLV)、テナガザル白血病ウイルス(GaLV)、サル免疫不全ウイルス(SIV)、ヒト免疫不全ウイルス(HIV)、およびそれらの組み合わせに基づくものを包含する(例えば、Buchscher et al.,J.Virol.66:2731-2739(1992);Johann et al.,J.Virol.66:1635-1640(1992);Sommnerfelt et al.,Virol.176:58-59(1990);Wilson et al.,J.Virol.63:2374-2378(1989);Miller et al.,J.Virol.65:2220-2224(1991);PCT/US94/05700を見よ)。一過性の発現が好ましい適用では、アデノウイルスに基づくシステムが用いられ得る。アデノウイルスに基づくベクターは、多くの細胞型において非常に高い形質導入効率ができ、細胞分裂を要求しない。かかるベクターによって、高い力価および発現レベルが得られている。このベクターは相対的に単純なシステムによって大きい数量で生じ得る。アデノ随伴ウイルス(「AAV」)ベクターもまた細胞に標的核酸を形質導入するために、例えば、核酸およびペプチドのin vitro生産にならびにインビボおよびエクスビボの遺伝子治療手続きに用いられ得る(例として、West et al.,Virology 160:38-47(1987);米国特許第4,797,368号;WO93/24641;Kotin,Human Gene Therapy 5:793-801(1994);Muzyczka,J.Clin.Invest.94:1351(1994)を参照)。組換えAAVベクターの構築は、米国特許第5,173,414号;Tratschin et al.,Mol.Cell.Biol.5:3251-3260(1985);Tratschin,et al.,Mol.Cell.Biol.4:2072-2081(1984);Hermonat & Muzyczka,PNAS 81:6466-6470(1984);およびSamulski et al.,J.Virol.63:03822-3828(1989)を包含する数多の刊行物に記載されている。 Viral tropism can be altered by incorporating exogenous envelope proteins, expanding the potential target population of target cells. Lentiviral vectors are retroviral vectors capable of transducing or infecting non-dividing cells and typically produce high viral titers. Thus, the choice of retroviral gene transfer system will depend on the target tissue. Retroviral vectors consist of cis-acting long terminal repeats and have a packaging capacity of up to 6-10 kb of exogenous sequence. The minimal cis-acting LTRs are sufficient for vector replication and packaging, which can then be used to introduce therapeutic genes into target cells to provide permanent transgene expression. Widely used retroviral vectors include those based on murine leukemia virus (MuLV), gibbon ape leukemia virus (GaLV), simian immunodeficiency virus (SIV), human immunodeficiency virus (HIV), and combinations thereof (see, e.g., Buchscher et al., J. Virol. 66:2731-2739 (1992); Johann et al., J. Virol. 66:1635-1640 (1992); Sommnerfelt et al., Virol. 176:58-59 (1990); Wilson et al., J. Virol. 63:2374-2378 (1989); Miller et al., J. Virol. 65:2220-2224 (1991); PCT/US94/05700). In applications where transient expression is preferred, adenovirus-based systems may be used. Adenovirus-based vectors are capable of very high transduction efficiency in many cell types and do not require cell division. High titers and expression levels have been obtained with such vectors. The vectors can be produced in large quantities with a relatively simple system. Adeno-associated virus ("AAV") vectors can also be used to transduce target nucleic acids into cells, for example, for in vitro production of nucleic acids and peptides and in vivo and ex vivo gene therapy procedures (see, e.g., West et al., Virology 160:38-47 (1987); U.S. Patent No. 4,797,368; WO 93/24641; Kotin, Human Gene Therapy 5:793-801 (1994); Muzyczka, J. Clin. Invest. 94:1351 (1994)). The construction of recombinant AAV vectors is described in numerous publications, including U.S. Pat. No. 5,173,414; Tratschin et al., Mol. Cell. Biol. 5:3251-3260 (1985); Tratschin, et al., Mol. Cell. Biol. 4:2072-2081 (1984); Hermonat & Muzyczka, PNAS 81:6466-6470 (1984); and Samulski et al., J. Virol. 63:03822-3828 (1989).

パッケージング細胞は、ホスト細胞に感染することができるウイルス粒子を形成するために典型的に用いられる。かかる細胞は、アデノウイルスをパッケージングする293細胞およびレトロウイルスをパッケージングするψ2細胞またはPA317細胞を包含する。遺伝子治療に用いられるウイルスベクターは、通常は、核酸ベクターをウイルス粒子にパッケージングする細胞株を生ずることによって生成される。ベクターは、典型的には、パッケージングおよびホストへの爾後の取り入れに要求される最小限のウイルス配列を含有し、他のウイルス配列は発現されるべきポリヌクレオチド(単数または複数)の発現カセットによって置き換えられる。欠けているウイルス機能は典型的にはパッケージング細胞株によってトランスで供給される。例えば、遺伝子治療に用いられるAAVベクターは、典型的には、パッケージングおよびホストゲノムへの取り入れに要求されるAAVゲノムからのITR配列のみを所有する。ウイルスDNAは細胞株によってパッケージングされ、これは、他のAAV遺伝子つまりrepおよびcapをコードするがITR配列を欠くヘルパープラスミドを含有する。細胞株はヘルパーとしてのアデノウイルスにもまた感染し得る。ヘルパーウイルスはAAVベクターの複製およびヘルパープラスミドからのAAV遺伝子の発現を促進する。ヘルパープラスミドはITR配列の欠如を原因として有意な量ではパッケージングされない。アデノウイルスによるコンタミネーションは、例えば、アデノウイルスがAAVよりも敏感である熱処置によって縮減され得る。細胞への核酸の送達のための追加の方法は当業者に公知である。例えば、参照によって本願に組み込まれるUS20030087817を見よ。 Packaging cells are typically used to form viral particles capable of infecting host cells. Such cells include 293 cells, which package adenovirus, and ψ2 or PA317 cells, which package retrovirus. Viral vectors used in gene therapy are usually produced by generating cell lines that package nucleic acid vectors into viral particles. The vectors typically contain the minimal viral sequences required for packaging and subsequent incorporation into the host, with other viral sequences being replaced by an expression cassette for the polynucleotide(s) to be expressed. Missing viral functions are typically supplied in trans by the packaging cell line. For example, AAV vectors used in gene therapy typically possess only the ITR sequences from the AAV genome required for packaging and incorporation into the host genome. The viral DNA is packaged by a cell line, which contains a helper plasmid that encodes the other AAV genes, namely rep and cap, but lacks the ITR sequences. The cell line can also be infected with adenovirus as a helper. The helper virus facilitates replication of the AAV vector and expression of AAV genes from the helper plasmid, which is not packaged in significant amounts due to the lack of ITR sequences. Contamination with adenovirus can be reduced, for example, by heat treatment, to which adenovirus is more sensitive than AAV. Additional methods for delivery of nucleic acids to cells are known to those of skill in the art. See, for example, US20030087817, which is incorporated herein by reference.

種々の態様において、PE構築物(分裂構築物を包含する)は1つ以上のrAAVベクターによる送達のために操作され得る。本願において提供される方法および組成物のいずれかに関するrAAVは、いずれかの誘導体またはシュードタイプを包含するいずれかの血清型であり得る(例えば、1、2、3、4、5、6、7、8、9、10、11、12、13、2/1、2/5、2/8、2/9、3/1、3/5、3/8、または3/9)。rAAVは細胞に送達されるべきである遺伝子積荷(すなわち、rAAVによって細胞内に持ち込まれる丸ごとのまたは分裂のPE融合タンパク質などの目当ての遺伝子を発現する組み換え核酸ベクター)を含み得る。rAAVはキメラであり得る。 In various embodiments, the PE construct (including split constructs) can be engineered for delivery by one or more rAAV vectors. The rAAV for any of the methods and compositions provided herein can be of any serotype, including any derivative or pseudotype (e.g., 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 2/1, 2/5, 2/8, 2/9, 3/1, 3/5, 3/8, or 3/9). The rAAV can contain a genetic cargo to be delivered to a cell (i.e., a recombinant nucleic acid vector expressing a gene of interest, such as a whole or split PE fusion protein, which is carried into the cell by the rAAV). The rAAV can be chimeric.

rAAVの本願において用いられる血清型は、組み換えウイルスのカプシドタンパク質の血清型を言う。誘導体およびシュードタイプの限定しない例は、rAAV2/1、rAAV2/5、rAAV2/8、rAAV2/9、AAV2-AAV3ハイブリッド、AAVrh.10、AAVhu.14、AAV3a/3b、AAVrh32.33、AAV-HSC15、AAV-HSC17、AAVhu.37、AAVrh.8、CHt-P6、AAV2.5、AAV6.2、AAV2i8、AAV-HSC15/17、AAVM41、AAV9.45、AAV6(Y445F/Y731F)、AAV2.5T、AAV-HAE1/2、AAVクローン32/83、AAVShH10、AAV2(Y->F)、AAV8(Y733F)、AAV2.15、AAV2.4、AAVM41、およびAAVr3.45を包含する。キメラVP1タンパク質を有する誘導体およびシュードタイプの限定しない例はrAAV2/5-1VP1uであり、これはAAV2のゲノム、AAV5のカプシドバックボーン、およびAAV1のVP1uを有する。キメラVP1タンパク質を有する誘導体およびシュードタイプの他の限定しない例はrAAV2/5-8VP1u、rAAV2/9-1VP1u、およびrAAV2/9-8VP1uである。 Serotype as used herein for rAAV refers to the serotype of the capsid protein of the recombinant virus. Non-limiting examples of derivatives and pseudotypes include rAAV2/1, rAAV2/5, rAAV2/8, rAAV2/9, AAV2-AAV3 hybrid, AAVrh.10, AAVhu.14, AAV3a/3b, AAVrh32.33, AAV-HSC15, AAV-HSC17, AAVhu.37, AAVrh.8, CHt-P6, AAV2.5, AA V6.2, AAV2i8, AAV-HSC15/17, AAVM41, AAV9.45, AAV6(Y445F/Y731F), AAV2.5T, AAV-HAE1/2, AAV clone 32/83, AAVShH10, AAV2(Y->F), AAV8(Y733F), AAV2.15, AAV2.4, AAVM41, and AAVr3.45. A non-limiting example of a derivative and pseudotype with a chimeric VP1 protein is rAAV2/5-1VP1u, which has the genome of AAV2, the capsid backbone of AAV5, and the VP1u of AAV1. Other non-limiting examples of derivatives and pseudotypes with chimeric VP1 proteins are rAAV2/5-8VP1u, rAAV2/9-1VP1u, and rAAV2/9-8VP1u.

AAV誘導体/シュードタイプ、およびかかる誘導体/シュードタイプを生ずるための方法は、当該技術分野で公知である(例えば、Mol Ther.2012 Apr;20(4):699-708.doi:10.1038/mt.2011.287.Epub 2012 Jan 24.The AAV vector toolkit:poised at the clinical crossroads.Asokan A1,Schaffer DV,Samulski RJ.を見よ)。シュードタイプのrAAVベクターを生ずるおよび用いるための方法は当該技術分野で公知である(例えば、Duan et al.,J.Virol.,75:7662-7671,2001;Halbert et al.,J.Virol.,74:1524-1532,2000;Zolotukhin et al.,Methods,28:158-167,2002;およびAuricchio et al.,Hum.Molec.Genet.,10:3075-3081,2001を見よ)。 AAV derivatives/pseudotypes and methods for generating such derivatives/pseudotypes are known in the art (see, e.g., Mol Ther. 2012 Apr;20(4):699-708. doi:10.1038/mt.2011.287. Epub 2012 Jan 24. The AAV vector toolkit: poised at the clinical crossroads. Asokan A1, Schaffer DV, Samulski RJ.). Methods for generating and using pseudotyped rAAV vectors are known in the art (see, e.g., Duan et al., J. Virol., 75:7662-7671, 2001; Halbert et al., J. Virol., 74:1524-1532, 2000; Zolotukhin et al., Methods, 28:158-167, 2002; and Auricchio et al., Hum. Molec. Genet., 10:3075-3081, 2001).

rAAV粒子を作るまたはパッケージングする方法は当該技術分野で知られており、試薬が市販で利用可能である(例えば、Zolotukhin et al.Production and purification of serotype 1,2,and 5 recombinant adeno-associated viral vectors.Methods 28(2002)158-167;および米国特許公開番号US20070015238およびUS20120322861を見よ。これらは参照によって本願に組み込まれる;プラスミドおよびキットはATCCおよびCell Biolabs,Inc.から利用可能)。例えば、目当ての遺伝子を含むプラスミドが、例えばrep遺伝子(例えば、Rep78、Rep68、Rep52、およびRep40をコードする)およびcap遺伝子(本明細書に記載の改変されたVP2領域を包含するVP1、VP2、およびVP3をコードする)を含有する1つ以上のヘルパープラスミドと組み合わせられ、組み換え細胞にトランスフェクションされ得る。その結果、rAAV粒子がパッケージングおよび爾後に精製され得る。 Methods for making or packaging rAAV particles are known in the art, and reagents are commercially available (see, e.g., Zolotukhin et al. Production and purification of serotype 1, 2, and 5 recombinant adeno-associated viral vectors. Methods 28 (2002) 158-167; and U.S. Patent Publication Nos. US20070015238 and US20120322861, which are incorporated herein by reference; plasmids and kits are available from ATCC and Cell Biolabs, Inc.). For example, a plasmid containing a gene of interest can be combined with one or more helper plasmids containing, for example, rep genes (e.g., encoding Rep78, Rep68, Rep52, and Rep40) and cap genes (encoding VP1, VP2, and VP3, including the modified VP2 region described herein) and transfected into a recombinant cell. As a result, rAAV particles can be packaged and subsequently purified.

組み換えAAVは核酸ベクターを含み得、これは、最小で:(a)目当てのタンパク質もしくはポリペプチドまたは目当てのRNA(例えば、siRNAもしくはmicroRNA)をコードする配列を含む1つ以上の異種核酸領域と、(b)1つ以上の核酸領域(例えば、異種核酸領域)をフランキングする逆位末端反復(ITR)配列(例えば、野生型ITR配列または操作されたITR配列)を含む1つ以上の領域とを含み得る。本願において、目当てのタンパク質または目当てのRNAをコードする配列を含む異種核酸領域は目当ての遺伝子と言われる。 A recombinant AAV may comprise a nucleic acid vector, which may contain, at a minimum: (a) one or more heterologous nucleic acid regions comprising a sequence encoding a protein or polypeptide of interest or an RNA of interest (e.g., an siRNA or microRNA), and (b) one or more regions comprising inverted terminal repeat (ITR) sequences (e.g., wild-type ITR sequences or engineered ITR sequences) flanking the one or more nucleic acid regions (e.g., heterologous nucleic acid regions). In this application, a heterologous nucleic acid region comprising a sequence encoding a protein or RNA of interest is referred to as a gene of interest.

本願において提供されるrAAV粒子のいずれか1つは、VP1u領域の外に異なる血清型のアミノ酸を有するカプシドタンパク質を有し得る。いくつかの態様では、VP1タンパク質のバックボーンの血清型はITRおよび/またはRep遺伝子の血清型とは異なる。いくつかの態様では、粒子のVP1カプシドタンパク質のバックボーンの血清型はITRの血清型と同じである。いくつかの態様では、粒子のVP1カプシドタンパク質のバックボーンの血清型はRep遺伝子の血清型と同じである。いくつかの態様では、rAAV粒子のカプシドタンパク質は改善された形質導入効率をもたらすアミノ酸変異を含む。 Any one of the rAAV particles provided herein may have a capsid protein with amino acids of different serotypes outside of the VP1u region. In some embodiments, the serotype of the backbone of the VP1 protein is different from the serotype of the ITRs and/or the Rep genes. In some embodiments, the serotype of the backbone of the VP1 capsid protein of the particle is the same as the serotype of the ITRs. In some embodiments, the serotype of the backbone of the VP1 capsid protein of the particle is the same as the serotype of the Rep gene. In some embodiments, the capsid protein of the rAAV particle includes amino acid mutations that result in improved transduction efficiency.

いくつかの態様では、核酸ベクターは、核酸(例えば、異種核酸)の発現を容易化する配列、例えば核酸に作動可能に連結された発現コントロール配列を含む1つ以上の領域を含む。数々のかかる配列が当該技術分野で公知である。発現コントロール配列の限定しない例は、プロモーター、インシュレーター、サイレンサー、応答エレメント、イントロン、エンハンサー、開始部位、終結シグナル、およびポリAテールを包含する。かかるコントロール配列のいずれかの組み合わせは本願において企図される(例えば、プロモーターおよびエンハンサー)。 In some embodiments, the nucleic acid vector includes one or more regions that include sequences that facilitate expression of a nucleic acid (e.g., a heterologous nucleic acid), such as expression control sequences operably linked to the nucleic acid. Numerous such sequences are known in the art. Non-limiting examples of expression control sequences include promoters, insulators, silencers, response elements, introns, enhancers, initiation sites, termination signals, and polyA tails. Any combination of such control sequences is contemplated herein (e.g., promoters and enhancers).

最終的なAAV構築物はPEgRNAをコードする配列を組み込み得る。他の態様において、AAV構築物は、第2部位ニッキングガイドRNAをコードする配列を組み込み得る。なお他の態様において、AAV構築物は、第2部位ニッキングガイドRNAをコードする配列とPEgRNAをコードする配列とを組み込み得る。 The final AAV construct may incorporate a sequence encoding a PEgRNA. In other embodiments, the AAV construct may incorporate a sequence encoding a second site nicking guide RNA. In yet other embodiments, the AAV construct may incorporate a sequence encoding a second site nicking guide RNA and a sequence encoding a PEgRNA.

種々の態様において、PEgRNAおよび第2部位ニッキングガイドRNAは、適当なプロモーター、例えばヒトU6(hU6)プロモーター、マウスU6(mU6)プロモーター、または他の適当なプロモーターから発現され得る。PEgRNAおよび第2部位ニッキングガイドRNAは同じプロモーターまたは異なるプロモーターから駆動され得る。 In various embodiments, the PEgRNA and the second-site nicking guide RNA can be expressed from a suitable promoter, such as the human U6 (hU6) promoter, the mouse U6 (mU6) promoter, or other suitable promoter. The PEgRNA and the second-site nicking guide RNA can be driven from the same promoter or different promoters.

いくつかの態様では、rAAV構築物または本願の組成物は対象に経腸的に投与される。いくつかの態様では、rAAV構築物または本願の組成物は対象に非経口的に投与される。いくつかの態様では、rAAV粒子または本願の組成物は、対象に皮下で、眼内で、硝子体内で、網膜下で、静脈内で(IV)、脳室内で、筋肉内で、髄腔内で(IT)、脳槽内で、腹腔内で、吸入によって、局所的に、または1つ以上の細胞、組織、もしくは臓器への直接的注射によって投与される。いくつかの態様では、rAAV粒子または本願の組成物は、対象に肝動脈または門脈への注射によって投与される。
分裂PEベクターに基づく戦略
In some embodiments, the rAAV construct or composition of the present application is administered to the subject enterally. In some embodiments, the rAAV construct or composition of the present application is administered to the subject parenterally. In some embodiments, the rAAV particle or composition of the present application is administered to the subject subcutaneously, intraocularly, intravitreally, subretinal, intravenously (IV), intracerebroventricularly, intramuscularly, intrathecally (IT), intracisternally, intraperitoneally, by inhalation, topically, or by direct injection into one or more cells, tissues, or organs. In some embodiments, the rAAV particle or composition of the present application is administered to the subject by injection into the hepatic artery or portal vein.
Split PE vector-based strategy

この側面では、プライム編集因子は分裂部位において割られ得、丸ごとの/完全なプライム編集因子の2つの半分として提供され得る。2つの半分は細胞に送達され得(例えば、発現されたタンパク質として、または別個の発現ベクター上において)、ひとたび細胞内で接触をすると、2つの半分は各プライム編集因子半分のインテインの自己スプライシング作用によって完全なプライム編集因子を形成する。細胞内におけるそれらのトランススプライシングと完全な機能するPEの付随的復元とを容易化するために、分裂インテイン配列が、コードされるプライム編集因子の半分の夫々に操作され得る。 In this aspect, the prime editor can be split at the split site and provided as two halves of a whole/complete prime editor. The two halves can be delivered to a cell (e.g., as expressed proteins or on separate expression vectors) and once in contact within the cell, the two halves form a complete prime editor by the self-splicing action of the inteins of each prime editor half. A split intein sequence can be engineered into each of the encoded prime editor halves to facilitate their trans-splicing within the cell and the concomitant restoration of a complete, functional PE.

これらの分裂インテインに基づく方法はインビボ送達のいくつかの関門を克服する。例えば、プライム編集因子をコードするDNAはrAAVパッケージング限界よりも大きく、そのため、特殊な解決を要求する。1つのかかる解決は、分裂インテインペアに融合された編集因子を製剤することであり、これらが2つの別個のrAAV粒子にパッケージングされ、これらは細胞に同時送達されるときに機能的な編集因子タンパク質を再構成する。プライム編集の固有の特色を説明するいくつかの他の特殊な考慮事項が記載され、第2部位ニッキング標的の最適化と、レンチウイルスおよびrAAVを包含するウイルスベクターにプライム編集因子を適切にパッケージングすることとを包含する。 These split-intein-based methods overcome several barriers to in vivo delivery. For example, the DNA encoding the prime editor is larger than the rAAV packaging limit and therefore requires specialized solutions. One such solution is to formulate the editor fused to a split-intein pair, which are packaged into two separate rAAV particles that reconstitute functional editor proteins when co-delivered to cells. Several other special considerations that account for the unique features of prime editing have been described, including optimization of second-site nicking targets and proper packaging of the prime editor into viral vectors, including lentiviruses and rAAVs.

この側面では、プライム編集因子は分裂部位において割られ得、丸ごとの/完全なプライム編集因子の2つの半分として提供され得る。2つの半分は細胞に送達され得(例えば、発現されたタンパク質として、または別個の発現ベクター上において)、ひとたび細胞内で接触をすると、2つの半分は各プライム編集因子半分のインテインの自己スプライシング作用によって完全なプライム編集因子を形成する。細胞内におけるそれらのトランススプライシングと完全な機能するPEの付随的復元とを容易化するために、分裂インテイン配列が、コードされるプライム編集因子の半分の夫々に操作され得る。 In this aspect, the prime editor can be split at the split site and provided as two halves of a whole/complete prime editor. The two halves can be delivered to a cell (e.g., as expressed proteins or on separate expression vectors) and once in contact within the cell, the two halves form a complete prime editor by the self-splicing action of the inteins of each prime editor half. A split intein sequence can be engineered into each of the encoded prime editor halves to facilitate their trans-splicing within the cell and the concomitant restoration of a complete, functional PE.

図66は、2つのPEの半分のタンパク質として提供されているプライム編集因子の1つの態様を図示する。これらは、プライム編集因子の半分のタンパク質の夫々の終わりまたは始まりに位置付けられた分裂インテインの半分同士の自己スプライシング作用によって、丸ごとのプライム編集因子を再生する。本願において用いられる用語「PE N末端半分」は、完全なプライム編集因子のPE N末端半分のC末端の端に「Nインテイン」を含む、完全なプライム編集因子のN末端半分を言う(すなわち、N末端エクステイン)。「Nインテイン」は、完全な十分に形成された分裂インテイン部分のN末端半分を言う。本願において用いられる用語「PE C末端半分」は、完全なプライム編集因子のC末端半分のN末端の端に「Cインテイン」を含む完全なプライム編集因子のC末端半分を言う(すなわち、C末端エクステイン)。2つの半分タンパク質、すなわちPE N末端半分およびPE C末端半分が例えば細胞内において互いと接触をするときには、NインテインおよびCインテインは、自己切除とPE N末端半分のC末端の端およびPE C末端半分のN末端の端の間のペプチド結合の形成との同時プロセスを経過して、完全なnapDNAbpドメイン(例えばCas9ニッカーゼ)およびRTドメインを含む完全なプライム編集因子タンパク質を再形成する。図面には示されていないが、プライム編集因子は、N末端および/またはC末端のNLSと各ドメインを連結するアミノ酸リンカー配列とを包含する追加の配列をもまた含み得る。 Figure 66 illustrates one embodiment of a prime editor provided as two PE half proteins. These regenerate the entire prime editor by self-splicing of the split intein halves located at the end or beginning of each of the prime editor half proteins. As used herein, the term "PE N-terminal half" refers to the N-terminal half of a complete prime editor that includes an "N intein" at the C-terminal end of the PE N-terminal half of the complete prime editor (i.e., the N-terminal extein). The "N intein" refers to the N-terminal half of the complete fully formed split intein portion. As used herein, the term "PE C-terminal half" refers to the C-terminal half of a complete prime editor that includes a "C intein" at the N-terminal end of the C-terminal half of the complete prime editor (i.e., the C-terminal extein). When the two half proteins, i.e., the PE N-terminal half and the PE C-terminal half, come into contact with each other, e.g., in a cell, the N-intein and the C-intein undergo a simultaneous process of self-excision and formation of a peptide bond between the C-terminal end of the PE N-terminal half and the N-terminal end of the PE C-terminal half to reform the complete prime editor protein, including the complete napDNAbp domain (e.g., Cas9 nickase) and the RT domain. Although not shown in the figures, the prime editor may also include additional sequences, including N- and/or C-terminal NLSs and amino acid linker sequences connecting each domain.

種々の態様において、プライム編集因子は、丸ごとのプライム編集因子を「分裂部位」において(as)「分裂」することによって、2つの半分タンパク質(すなわち、PE N末端半分およびPE C末端半分)として操作され得る。「分裂部位」は、プライム編集因子上の2つの隣接するアミノ酸残基の間における分裂インテイン配列(すなわち、NインテインおよびCインテイン)の挿入の位置付けを言う。より具体的には、「分裂部位」は丸ごとのプライム編集因子を2つの別個の半分へと割る位置付けを言い、各半分は分裂部位においてNインテインまたはCインテインモチーフどちらかに融合される。分裂部位はプライム編集因子融合タンパク質上のいずれかの好適な位置付けであり得るが、好ましくは、分裂部位は送達(例えば発現ベクターによる)にとって適当なサイズである2つの半分タンパク質の形成を許す位置に位置付けられ、分裂部位末端において各半分タンパク質に融合されているインテインは、1つの半分タンパク質が細胞内において他の半分タンパク質に接触するときに互いと十分に相互作用するように利用可能である。 In various embodiments, the prime editor can be engineered as two half proteins (i.e., a PE N-terminal half and a PE C-terminal half) by "splitting" the whole prime editor at a "split site". The "split site" refers to the positioning of the insertion of the split intein sequence (i.e., the N intein and the C intein) between two adjacent amino acid residues on the prime editor. More specifically, the "split site" refers to the positioning of the whole prime editor into two separate halves, each half fused to either the N intein or the C intein motif at the split site. The split site can be at any suitable position on the prime editor fusion protein, but preferably, the split site is positioned to allow the formation of two half proteins that are appropriately sized for delivery (e.g., by an expression vector), and the inteins fused to each half protein at the split site end are available to interact sufficiently with each other when one half protein contacts the other half protein in a cell.

いくつかの態様では、分裂部位はnapDNAbpドメイン上に位置付けられる。他の態様において、分裂部位はRTドメイン上に位置付けられる。他の態様において、分裂部位はnapDNAbpドメインおよびRTドメインを連結するリンカー上に位置付けられる。 In some embodiments, the division site is located on the napDNAbp domain. In other embodiments, the division site is located on the RT domain. In other embodiments, the division site is located on the linker connecting the napDNAbp domain and the RT domain.

種々の態様において、分裂部位デザインは、2つの半分のプライム編集因子ドメインを2つの異なるAAVゲノムにパッケージングする目的を両方が構造的に許容するNおよびC末端インテインを分裂および挿入するための部位を見出すことを要求する。加えて、トランススプライシングに必要なインテイン残基は、C末端エクステインのN末端の残基を変異させることまたはインテインの「傷跡」を残すであろう残基を挿入することによって組み込まれ得る。 In various embodiments, the split site design requires finding sites for splitting and inserting N- and C-terminal inteins that are both structurally acceptable for the purpose of packaging the two halves of the prime editor domain into two different AAV genomes. In addition, intein residues required for trans-splicing can be incorporated by mutating residues at the N-terminus of the C-terminal extein or by inserting residues that would leave an intein "scar".

SpCas9ニッカーゼまたはSaCas9ニッカーゼどちらかを含む分裂されたプライム編集因子の例示の分裂構成は次のとおりである。

Figure 2020191243000223

Figure 2020191243000224

Figure 2020191243000225

Figure 2020191243000226
Exemplary split constructs of split prime editors containing either SpCas9 nickase or SaCas9 nickase are as follows:
Figure 2020191243000223

Figure 2020191243000224

Figure 2020191243000225

Figure 2020191243000226

種々の態様では、例としてSpCas9ニッカーゼ(配列番号18、1368アミノ酸)を用いて、分裂は、1および1368の間のいずれかの2つのアミノ酸の間においてであり得る。しかしながら、好ましい分裂は、タンパク質の中心領域の間に、例えば、配列番号18のアミノ酸50~1250、または100~1200、または150~1150、または200~1100、または250~1050、または300~1000、または350~950、または400~900、または450~850、または500~800、または550~750、または600~700に位置付けられるであろう。特定の例示の態様では、分裂部位は740/741、または801/802、または1010/1011、または1041/1042の間であり得る。他の態様において、分裂部位は、配列番号18のSpCas9に対して相対的に、1/2、2/3、3/4、4/5、5/6、6/7、7/8、8/9、9/10、10/11、12/13、14/15、15/16、17/18、19/20、20/21、21/22、22/23、23/24、24/25、25/26、26/27、27/28、28/29、29/30、30/31、31/32、32/33、33/34、34/35、35/36、36/37、38/39、39/40、41/42、42/43、43/44、44/45、45/46、46/47、47/48、48/49、49/50、51/52、52/53、53/54、54/55、55/56、56/57、57/58、58/59、59/60、61/62、62/63、63/64、64/65、65/66、66/67、67/68、68/69、69/70、71/72、72/73、73/74、74/75、75/76、76/77、77/78、78/79、79/80、81/82、82/83、83/84、84/85、85/86、86/87、87/88、88/89、89/90の間、または90~100、100~150、150~200、200~250、250~300、300~350、350~400、450~500、500~550、550~600、600~650、650~700、700~750、750~800、800~850、850~900、900~950、950~1000、1000~1050、1050~1100、1100~1150、1150~1200、1200~1250、1250~1300、1300~1350、および1350~1368の間の隣接する残基のいずれか2つのペアの間、配列番号18と少なくとも80%、85%、90%、95%、98%、99%、または99.9%配列同一性を有するアミノ酸配列上のいずれか2つの対応する残基の間、あるいは配列番号19~88のアミノ酸配列のいずれかのSpCas9のバリアントもしくは等価物、または配列番号19~88のいずれかと少なくとも80%、85%、90%、95%、98%、99%、もしくは99.9%配列同一性を有するアミノ酸配列のいずれか2つの対応する残基の間であり得る。 In various embodiments, using SpCas9 nickase (SEQ ID NO: 18, 1368 amino acids) as an example, the split can be between any two amino acids between 1 and 1368. However, preferred splits will be located between the central region of the protein, for example, amino acids 50-1250, or 100-1200, or 150-1150, or 200-1100, or 250-1050, or 300-1000, or 350-950, or 400-900, or 450-850, or 500-800, or 550-750, or 600-700 of SEQ ID NO: 18. In certain exemplary embodiments, the split site can be between 740/741, or 801/802, or 1010/1011, or 1041/1042. In other embodiments, the division sites are 1/2, 2/3, 3/4, 4/5, 5/6, 6/7, 7/8, 8/9, 9/10, 10/11, 12/13, 14/15, 15/16, 17/18, 19/20, 20/21, 21/22, 22/23, 23/24, 24/25, 25/26, 26/27, 27/28, 28/29, 29/30, 30/31, 31/32, 32/33, 33/34, 34/35, 35/36, 36/37, 38/39, 39/40, 41/42, 42/43, 43/44, , 44/45, 45/46, 46/47, 47/48, 48/49, 49/50, 51/52, 52/53, 53/54, 54/55, 55/56, 56/57, 57/58, 58/59, 59/60, 61/62, 62/63, 63/64, 64/65, 65/66, 66/67, 67/68, 68/69, 69/70, 71/72, 72/73, 73/74, 74/75, 75/76, 76/77, 77/78, 78/79, 79/80, 81/82, 82/83, 83/84, 84/85, 85/86, 86/87, 87/88, Between 88/89, 89/90, or 90-100, 100-150, 150-200, 200-250, 250-300, 300-350, 350-400, 450-500, 500-550, 550-600, 600-650, 650-700, 700-750, 750-800, 800-850, 850-900, 900-950, 950-1000, 1000-1050, 1050-1100, 1100-1150, 1150-1200, 1200-1250, 1250-1300, 1300-1350, and 1350-13 68, between any two corresponding residues on an amino acid sequence having at least 80%, 85%, 90%, 95%, 98%, 99%, or 99.9% sequence identity to SEQ ID NO:18, or between any two corresponding residues on an SpCas9 variant or equivalent of any of the amino acid sequences of SEQ ID NOs:19-88, or between any two corresponding residues on an amino acid sequence having at least 80%, 85%, 90%, 95%, 98%, 99%, or 99.9% sequence identity to any of SEQ ID NOs:19-88.

種々の態様において、分裂インテイン配列は次のインテイン配列からによって操作され得る。

Figure 2020191243000227

Figure 2020191243000228

Figure 2020191243000229
In various embodiments, the split intein sequence can be engineered from the following intein sequences:
Figure 2020191243000227

Figure 2020191243000228

Figure 2020191243000229

種々の他の態様において、分裂インテイン配列は次のとおり用いられ得る:

Figure 2020191243000230
In various other embodiments, split intein sequences can be used as follows:
Figure 2020191243000230

種々の態様において、分裂インテインは完全なPE融合タンパク質の別個の部分を細胞に別個に送達するために用いられ得、これらは、細胞内での発現によって、トランススプライシングによって完全なPE融合タンパク質として再構成されるようになる。 In various embodiments, split inteins can be used to separately deliver separate portions of a complete PE fusion protein to a cell, which upon expression in the cell become reconstituted into the complete PE fusion protein by trans-splicing.

いくつかの態様では、本開示は、PE融合タンパク質を細胞に送達する方法を提供し:
(a)第1の分裂インテイン配列に融合されたPE融合タンパク質のN末端フラグメントをコードする第1の発現ベクターを構築すること;
(b)第2の分裂インテイン配列に融合されたPE融合タンパク質のC末端フラグメントをコードする第2の発現ベクターを構築すること;
(c)第1および第2の発現ベクターを細胞に送達すること、
を含み、
第1および第2の分裂インテイン配列の自己切除を引き起こすトランススプライシング活性の結果として、N末端およびC末端フラグメントは、細胞内においてPE融合タンパク質として再構成される。
In some aspects, the disclosure provides a method of delivering a PE fusion protein to a cell, comprising:
(a) constructing a first expression vector encoding an N-terminal fragment of a PE fusion protein fused to a first split-intein sequence;
(b) constructing a second expression vector encoding a C-terminal fragment of the PE fusion protein fused to a second split-intein sequence;
(c) delivering the first and second expression vectors to the cell;
Including,
As a result of trans-splicing activity that leads to self-excision of the first and second split intein sequences, the N- and C-terminal fragments are reconstituted as PE fusion proteins within the cell.

分裂部位は、いくつかの態様では、napDNAbpドメイン、リンカー、または逆転写酵素ドメインを包含するプライム編集因子融合体のどこかであり得る。 The division site, in some embodiments, can be anywhere in the prime editor fusion, including the napDNAbp domain, the linker, or the reverse transcriptase domain.

他の態様において、分裂部位はnapDNAbpドメイン上である。 In other embodiments, the division site is on the napDNAbp domain.

なお他の態様において、分裂部位は逆転写酵素またはポリメラーゼドメイン上である。 In yet other embodiments, the cleavage site is on the reverse transcriptase or polymerase domain.

さらに他の態様において、分裂部位はリンカー上である。 In yet other embodiments, the division site is on the linker.

種々の態様において、本開示は、napDNAbp(例えばCas9ドメイン)と逆転写酵素とを含むプライム編集因子を提供し、napDNAbpおよび/または逆転写酵素の1つまたは両方は、インテイン、例えばリガンド依存性インテインを含む。典型的には、インテインはリガンド依存性インテインであり、これはリガンド(例えば、4-ヒドロキシタモキシフェンなどの低分子、ペプチド、タンパク質、ポリヌクレオチド、アミノ酸、およびヌクレオチド)の不在下ではタンパク質スプライシング活性を発揮しないか、または最小限発揮する。リガンド依存性インテインは知られており、U.S.2014/0065711A1として公開された米国特許出願U.S.S.N.14/004,280に記載されているものを包含する。これの内容全体は参照によって本願に組み込まれる。加えて、分裂Cas9アーキテクチャの使用、いくつかの態様では、インテインは配列番号8-15、447、452、462、および472-479からなる群から選択されるアミノ酸配列を含む。 In various embodiments, the disclosure provides a primed editor comprising a napDNAbp (e.g., a Cas9 domain) and a reverse transcriptase, wherein one or both of the napDNAbp and/or the reverse transcriptase comprise an intein, e.g., a ligand-dependent intein. Typically, the intein is a ligand-dependent intein, which exerts no or minimal protein splicing activity in the absence of a ligand (e.g., small molecules such as 4-hydroxytamoxifen, peptides, proteins, polynucleotides, amino acids, and nucleotides). Ligand-dependent inteins are known and include those described in U.S. Patent Application U.S.S.N. 14/004,280, published as U.S. 2014/0065711A1, the entire contents of which are incorporated herein by reference. In addition, using a split-Cas9 architecture, in some embodiments, the intein comprises an amino acid sequence selected from the group consisting of SEQ ID NOs: 8-15, 447, 452, 462, and 472-479.

種々の態様において、napDNAbpドメインは配列番号18の標準的なSpCas9ドメインと比較して小さいサイズのnapDNAbpドメインである。 In various embodiments, the napDNAbp domain is a napDNAbp domain of reduced size compared to the standard SpCas9 domain of SEQ ID NO:18.

標準的なSpCas9タンパク質は長さが1368アミノ酸であり、158キロダルトンという予測される分子量を有する。本願において用いられる用語「小さいサイズのCas9バリアント」は、少なくとも1300アミノ酸未満、または少なくとも1290アミノ酸未満、または1280アミノ酸未満(than less than)、または1270アミノ酸未満、または1260アミノ酸未満、または1250アミノ酸未満、または1240アミノ酸未満、または1230アミノ酸未満、または1220アミノ酸未満、または1210アミノ酸未満、または1200アミノ酸未満、または1190アミノ酸未満、または1180アミノ酸未満、または1170アミノ酸未満、または1160アミノ酸未満、または1150アミノ酸未満、または1140アミノ酸未満、または1130アミノ酸未満、または1120アミノ酸未満、または1110アミノ酸未満、または1100アミノ酸未満、または1050アミノ酸未満、または1000アミノ酸未満、または950アミノ酸未満、または900アミノ酸未満、または850アミノ酸未満、または800アミノ酸未満、または750アミノ酸未満、または700アミノ酸未満、または650アミノ酸未満、または600アミノ酸未満、または550アミノ酸未満、または500アミノ酸未満だが、少なくとも約400アミノ酸よりも大きく、かつCas9タンパク質の要求される機能を保持する、天然に存在するか、操作されたか、または別様のいずれかのCas9バリアントを言う。 The standard SpCas9 protein is 1368 amino acids in length and has a predicted molecular weight of 158 kilodaltons. As used herein, the term "small size Cas9 variant" refers to a Cas9 variant having at least 1300 amino acids, or at least 1290 amino acids, or less than 1280 amino acids, or less than 1270 amino acids, or less than 1260 amino acids, or less than 1250 amino acids, or less than 1240 amino acids, or less than 1230 amino acids, or less than 1220 amino acids, or less than 1210 amino acids, or less than 1200 amino acids, or less than 1190 amino acids, or less than 1180 amino acids, or less than 1170 amino acids, or less than 1160 amino acids, or less than 1150 amino acids, or less than 1140 amino acids, or less than 1130 amino acids, or less than 1120 amino acids, or less than 1110 amino acids, or less than 1100 amino acids. "Cas9 variants" refers to Cas9 variants, either naturally occurring, engineered, or otherwise, that are less than about 400 amino acids long, or less than 1050 amino acids long, or less than 1000 amino acids long, or less than 950 amino acids long, or less than 900 amino acids long, or less than 850 amino acids long, or less than 800 amino acids long, or less than 750 amino acids long, or less than 700 amino acids long, or less than 650 amino acids long, or less than 600 amino acids long, or less than 550 amino acids long, or less than 500 amino acids long, but greater than about 400 amino acids long, and that retain the required function of the Cas9 protein.

1つの態様では、例20に図示されるとおり、本明細書は次の分裂インテインPE構築物を包摂する。これらは標準的なSpCas9(配列番号18)の残基1024および1025の間で分裂される(または、これらはMetマイナスの配列番号18に対して相対的に夫々残基1023および1024と言われ得る)。 In one embodiment, as illustrated in Example 20, the present disclosure encompasses the following split-intein PE constructs, which are split between residues 1024 and 1025 of standard SpCas9 (SEQ ID NO:18) (or these may be referred to as residues 1023 and 1024, respectively, relative to SEQ ID NO:18 minus Met).

第1に、配列番号18のアミノ酸配列は次のとおり示される。1024(「K」)および1025(「S」)残基の間の分裂部位の位置付けを指示している:

Figure 2020191243000231
First, the amino acid sequence of SEQ ID NO:18 is shown as follows, indicating the location of the split site between residues 1024 ("K") and 1025 ("S"):
Figure 2020191243000231

この構成において、N末端半分のアミノ酸配列(アミノ酸1~1024)は以下のとおりである: In this configuration, the amino acid sequence of the N-terminal half (amino acids 1-1024) is as follows:

Figure 2020191243000232
Figure 2020191243000232

この構成において、N末端半分のアミノ酸配列(アミノ酸1~1023)(ここでタンパク質は位置1にてMetマイナスである)は以下のとおりである: In this configuration, the amino acid sequence of the N-terminal half (amino acids 1-1023) (where the protein is Met minus at position 1) is as follows:

Figure 2020191243000233
Figure 2020191243000233

この構成において、C末端半分のアミノ酸配列(アミノ酸1024~1368)(またはMetマイナスCas9中アミノ酸1023~1367として数えた)は以下のとおりである: In this configuration, the amino acid sequence of the C-terminal half (amino acids 1024-1368) (or counted as amino acids 1023-1367 in Met minus Cas9) is as follows:

Figure 2020191243000234
Figure 2020191243000234

例20に示されているとおり、PE2(これは配列番号18のSpCas9に基づく)構築物を、次のとおり、(Metマイナス配列番号18に対して相対的に)位置1023/1024で2つの別個の構築物へと分裂した: As shown in Example 20, the PE2 (based on SpCas9 of SEQ ID NO:18) construct was split into two separate constructs at positions 1023/1024 (relative to Met minus SEQ ID NO:18) as follows:

1023/1024のN末端半分でのSpPE2分裂 SpPE2 splitting in the N-terminal half of 1023/1024

Figure 2020191243000235
Figure 2020191243000235

Figure 2020191243000236
Figure 2020191243000236

1023/1024のC末端半分でのSpPE2分裂

Figure 2020191243000237

Figure 2020191243000238
SpPE2 cleavage in the C-terminal half of 1023/1024
Figure 2020191243000237

Figure 2020191243000238

Figure 2020191243000239
Figure 2020191243000239

本開示は、分裂インテインプライム編集因子を細胞に送達および/または分裂インテインプライム編集因子によって細胞を処置する方法をもまた企図する。 The present disclosure also contemplates methods of delivering split intein prime editing factors to cells and/or treating cells with split intein prime editing factors.

いくつかの態様では、本開示はPE融合タンパク質を細胞に送達する方法を提供し:
(a)第1の分裂インテイン配列に融合されたPE融合タンパク質のN末端フラグメントをコードする第1の発現ベクターを構築すること;
(b)第2の分裂インテイン配列に融合されたPE融合タンパク質のC末端フラグメントをコードする第2の発現ベクターを構築すること;
(c)第1および第2の発現ベクターを細胞に送達すること、
を含み、
第1および第2の分裂インテイン配列の自己切除を引き起こすトランススプライシング活性の結果として、N末端およびC末端フラグメントは細胞内においてPE融合タンパク質として再構成される。
In some embodiments, the disclosure provides a method of delivering a PE fusion protein to a cell, comprising:
(a) constructing a first expression vector encoding an N-terminal fragment of a PE fusion protein fused to a first split-intein sequence;
(b) constructing a second expression vector encoding a C-terminal fragment of the PE fusion protein fused to a second split-intein sequence;
(c) delivering the first and second expression vectors to the cell;
Including,
As a result of trans-splicing activity that causes self-excision of the first and second split intein sequences, the N- and C-terminal fragments are reconstituted intracellularly as a PE fusion protein.

ある態様において、第1の分裂インテイン配列に融合されたPE融合タンパク質のN末端フラグメントは、配列番号3875、または配列番号3875との少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも98%、または少なくとも99.9%配列同一性を有するアミノ酸配列である。 In some embodiments, the N-terminal fragment of the PE fusion protein fused to the first split-intein sequence is SEQ ID NO:3875, or an amino acid sequence having at least 80%, at least 85%, at least 90%, at least 95%, at least 98%, or at least 99.9% sequence identity to SEQ ID NO:3875.

他の態様において、第1の分裂インテイン配列に融合されたPE融合タンパク質のC末端フラグメントは、配列番号3876、または配列番号3876との少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも98%、または少なくとも99.9%配列同一性を有するアミノ酸配列である。 In other embodiments, the C-terminal fragment of the PE fusion protein fused to the first split-intein sequence is SEQ ID NO:3876, or an amino acid sequence having at least 80%, at least 85%, at least 90%, at least 95%, at least 98%, or at least 99.9% sequence identity to SEQ ID NO:3876.

他の態様において、本開示は、細胞内の標的DNA配列を編集する方法を提供し:
(a)第1の分裂インテイン配列に融合されたPE融合タンパク質のN末端フラグメントをコードする第1の発現ベクターを構築すること;
(b)第2の分裂インテイン配列に融合されたPE融合タンパク質のC末端フラグメントをコードする第2の発現ベクターを構築すること;
(c)第1および第2の発現ベクターを細胞に送達すること、
を含み、
第1および第2の分裂インテイン配列の自己切除を引き起こすトランススプライシング活性の結果として、N末端およびC末端フラグメントは細胞内においてPE融合タンパク質として再構成される。
In another aspect, the present disclosure provides a method for editing a target DNA sequence in a cell, comprising:
(a) constructing a first expression vector encoding an N-terminal fragment of a PE fusion protein fused to a first split-intein sequence;
(b) constructing a second expression vector encoding a C-terminal fragment of the PE fusion protein fused to a second split-intein sequence;
(c) delivering the first and second expression vectors to the cell;
Including,
As a result of trans-splicing activity that causes self-excision of the first and second split intein sequences, the N- and C-terminal fragments are reconstituted intracellularly as a PE fusion protein.

ある態様において、第1の分裂インテイン配列に融合されたPE融合タンパク質のN末端フラグメントは、配列番号3875、または配列番号3875との少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも98%、または少なくとも99.9%配列同一性を有するアミノ酸配列である。 In some embodiments, the N-terminal fragment of the PE fusion protein fused to the first split-intein sequence is SEQ ID NO:3875, or an amino acid sequence having at least 80%, at least 85%, at least 90%, at least 95%, at least 98%, or at least 99.9% sequence identity to SEQ ID NO:3875.

他の態様において、第1の分裂インテイン配列に融合されたPE融合タンパク質のC末端フラグメントは、配列番号3876、または配列番号3876との少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも98%、または少なくとも99.9%配列同一性を有するアミノ酸配列である。
PEリボヌクレオタンパク質複合体の送達
In other embodiments, the C-terminal fragment of the PE fusion protein fused to the first split-intein sequence is SEQ ID NO:3876, or an amino acid sequence having at least 80%, at least 85%, at least 90%, at least 95%, at least 98%, or at least 99.9% sequence identity to SEQ ID NO:3876.
Delivery of PE ribonucleoprotein complexes

この側面では、プライム編集因子は、エレクトロポレーションおよび脂質ナノ粒子を包含する種々の方法によって、PEgRNAと複合体化したプライム編集因子(すなわち、PEリボヌクレオタンパク質複合体)の送達が関わる非ウイルス的送達戦略によって送達され得る。核酸の非ウイルス的送達の方法は、リポフェクション、ヌクレオフェクション、マイクロインジェクション、バイオリスティック、ビロソーム、リポソーム、イムノリポソーム、ポリカチオンまたは脂質:核酸コンジュゲート、裸のDNA、人工ビリオン、およびDNAの薬剤によって増強された取り込みを包含する。リポフェクションは例えば米国特許第5,049,386号、第4,946,787号;および第4,897,355号に記載され、リポフェクション試薬は市販で販売されている(例えば、Transfectam(商標)およびLipofectin(商標))。ポリヌクレオチドの効率的な受容体認識リポフェクションにとって好適であるカチオン性および中性脂質は、FeignerのWO91/17424;WO91/16024のものを包含する。送達は細胞(例えば、in vitroのまたはエクスビボの投与)または標的組織(例えばインビボの投与)にであり得る。 In this aspect, the prime editing factor can be delivered by non-viral delivery strategies involving delivery of the prime editing factor complexed with PEgRNA (i.e., PE ribonucleoprotein complexes) by a variety of methods including electroporation and lipid nanoparticles. Methods of non-viral delivery of nucleic acids include lipofection, nucleofection, microinjection, biolistics, virosomes, liposomes, immunoliposomes, polycation or lipid:nucleic acid conjugates, naked DNA, artificial virions, and drug-enhanced uptake of DNA. Lipofection is described, for example, in U.S. Patent Nos. 5,049,386, 4,946,787; and 4,897,355, and lipofection reagents are commercially available (e.g., Transfectam™ and Lipofectin™). Cationic and neutral lipids that are suitable for efficient receptor-recognition lipofection of polynucleotides include those of Feigner, WO91/17424; WO91/16024. Delivery can be to cells (e.g., in vitro or ex vivo administration) or to target tissues (e.g., in vivo administration).

イムノ脂質複合体などの標的化リポソームを包含する脂質:核酸複合体の調製は当業者に周知である(例として、Crystal,Science 270:404-410(1995);Blaese et al.,Cancer Gene Ther.2:291-297(1995);Behr et al.,Bioconjugate Chem.5:382-389(1994);Remy et al.,Bioconjugate Chem.5:647-654(1994);Gao et al.,Gene Therapy 2:710-722(1995);Ahmad et al.,Cancer Res.52:4817-4820(1992);米国特許第4,186,183号、第4,217,344号、第4,235,871号、第4,261,975号、第4,485,054号、第4,501,728号、第4,774,085号、第4,837,028号、および第4,946,787号を参照)。 The preparation of lipid:nucleic acid complexes, including targeted liposomes such as immunolipid complexes, is well known to those of skill in the art (see, e.g., Crystal, Science 270:404-410 (1995); Blaese et al., Cancer Gene Ther. 2:291-297 (1995); Behr et al., Bioconjugate Chem. 5:382-389 (1994); Remy et al., Bioconjugate Chem. 5:647-654 (1994); Gao et al., Gene Therapy 2:710-722 (1995); Ahmad et al., Cancer Res. 52:4817-4820 (1992); see U.S. Patent Nos. 4,186,183, 4,217,344, 4,235,871, 4,261,975, 4,485,054, 4,501,728, 4,774,085, 4,837,028, and 4,946,787).

リボヌクレオタンパク質複合体の非ウイルス的送達のためのアプローチを論ずる次の参照の追加の参照がなされ得る。これらの夫々は参照によって本願に組み込まれる。 Additional reference may be made to the following references, each of which is incorporated herein by reference, which discuss approaches for non-viral delivery of ribonucleoprotein complexes:

Chen,Sean,et al."Highly efficient mouse genome editing by CRISPR ribonucleoprotein electroporation of zygotes."Journal of Biological Chemistry(2016):jbc-M116.PubMed Chen,Sean,et al. "Highly efficient mouse genome editing by CRISPR ribonucleoprotein electroporation of zygotes." Journal of Biological Chemistry(2016):jbc-M116.PubMed

Zuris,John A.,et al."Cationic lipid-mediated delivery of proteins enables efficient protein-based genome editing in vitro and in vivo."Nature biotechnology 33.1(2015):73.PubMed Zuris, John A., et al. "Cationic lipid-mediated delivery of proteins enables efficient protein-based genome editing in vitro and in vivo." Nature biotechnology 33.1 (2015): 73. PubMed

Rouet,Romain,et al."Receptor-Mediated Delivery of CRISPR-Cas9 Endonuclease for Cell-Type-Specific Gene Editing."Journal of the American Chemical Society 140.21(2018):6596-6603.PubMed. Rouet, Romain, et al. "Receptor-Mediated Delivery of CRISPR-Cas9 Endonuclease for Cell-Type-Specific Gene Editing." Journal of the American Chemical Society 140.21(2018):6596-6603.PubMed.

図68Cは、種々の開示されるPEリボヌクレオタンパク質複合体(高濃度のPE2、高濃度のPE3、および低濃度のPE3)がこの様式で送達され得るということを示すデータを提供する。
mRNAによるPEの送達
Figure 68C provides data showing that a variety of the disclosed PE ribonucleoprotein complexes (high concentration PE2, high concentration PE3, and low concentration PE3) can be delivered in this manner.
Delivery of PE by mRNA

プライム編集に基づくゲノム編集が望まれる細胞に、プライム編集因子および/またはPEgRNAを送達するために使用され得る別の方法は、メッセンジャーRNA(mRNA)送達方法およびテクノロジーの使用を使用することによってである。本開示に利用され得るmRNA送達方法および組成物の例は、例えばPCT/US2014/028330、US8822663B2、NZ700688A、ES2740248T3、EP2755693A4、EP2755986A4、WO2014152940A1、EP3450553B1、BR112016030852A2、およびEP3362461A1を包含する。これらの夫々はそれらの全体が参照によって本願に組み込まれる。参照によってここに組み込まれる追加の開示はKowalski et al.,"Delivering the Messenger:Advances in Technologies for Therapeutic mRNA Delivery,"Mol Therap.,2019; 27(4):710-728に見出され得る。 Another method that can be used to deliver prime editing factors and/or PEgRNA to cells in which prime editing-based genome editing is desired is by using messenger RNA (mRNA) delivery methods and technologies. Examples of mRNA delivery methods and compositions that can be utilized in the present disclosure include, for example, PCT/US2014/028330, US8822663B2, NZ700688A, ES2740248T3, EP2755693A4, EP2755986A4, WO2014152940A1, EP3450553B1, BR112016030852A2, and EP3362461A1, each of which is incorporated herein by reference in their entirety. Additional disclosures incorporated herein by reference can be found in Kowalski et al., "Delivering the Messenger: Advances in Technologies for Therapeutic mRNA Delivery," Mol Therap., 2019; 27(4):710-728.

プライム編集因子をコードするDNAベクターとは対照的に、プライム編集因子の送達物質としてのRNAの使用は、遺伝物質がその機能を果たすために核に入らなくてもよいという利点を有する。送達されたmRNAは細胞質において直接的に所望のタンパク質(例えば、プライム編集因子融合タンパク質)および核酸産物(例えばPEgRNA)へと翻訳され得る。しかしながら、より安定である(例えば、細胞質のRNA分解酵素に抵抗する)ためには、いくつかの態様では、送達効率を改善するためにmRNAを安定化することが必要である。ある種の送達担体、例えばカチオン性脂質またはポリマー性の送達担体は、トランスフェクションされたmRNAを内生RNase酵素から防護することをもまた助け得る。これらは、さもなければ、所望のプライム編集因子融合タンパク質をコードする治療学的なmRNAを分解し得る。加えて、修飾されたmRNAの増大した安定性にもかかわらず、治療学的レベルのタンパク質生産を許す様式でのインビボの細胞へのmRNA、特に全長タンパク質をコードするmRNAの送達は、課題のままに留まっている。 In contrast to DNA vectors encoding prime editors, the use of RNA as a delivery agent for prime editors has the advantage that the genetic material does not have to enter the nucleus to perform its function. The delivered mRNA can be translated directly in the cytoplasm into the desired protein (e.g., prime editor fusion protein) and nucleic acid product (e.g., PEgRNA). However, to be more stable (e.g., resistant to cytoplasmic RNA-degrading enzymes), in some embodiments it is necessary to stabilize the mRNA to improve delivery efficiency. Certain delivery vehicles, such as cationic lipids or polymeric delivery vehicles, can also help protect the transfected mRNA from endogenous RNase enzymes, which could otherwise degrade the therapeutic mRNA encoding the desired prime editor fusion protein. In addition, despite the increased stability of modified mRNAs, delivery of mRNAs, especially mRNAs encoding full-length proteins, to cells in vivo in a manner that allows therapeutic levels of protein production remains a challenge.

いくつかの例外はあるが、mRNAの細胞内送達は小さいオリゴヌクレオチドのものよりも一般的に難しく、それは送達ナノ粒子へのカプセル化を要求する。部分的には、他の型のRNA(低分子干渉RNA[siRNA]、~14kDa;アンチセンスオリゴヌクレオチド[ASO]、4~10kDa)と比較して、mRNA分子の有意に大きいサイズ(300~5,000kDa、~1~15kb)を原因とする。 With some exceptions, intracellular delivery of mRNA is generally more difficult than that of small oligonucleotides, which requires encapsulation into delivery nanoparticles, in part due to the significantly larger size of mRNA molecules (300-5,000 kDa; ~1-15 kb) compared with other types of RNA (small interfering RNA [siRNA], ~14 kDa; antisense oligonucleotides [ASO], 4-10 kDa).

mRNAは細胞質に達するためには細胞膜を横断しなければならない。細胞膜は細胞内送達への動的なかつ手強い関門である。それは主として双性イオン性のおよび負荷電のリン脂質の脂質二重層から作り上げられており、ここで、リン脂質の極性頭部は水性環境の方を向き、疎水性テールは疎水性コアを形成する。 To reach the cytoplasm, mRNA must cross the cell membrane. The cell membrane is a dynamic and formidable barrier to intracellular delivery. It is made up of a lipid bilayer of primarily zwitterionic and negatively charged phospholipids, where the polar heads of the phospholipids face towards the aqueous environment and the hydrophobic tails form a hydrophobic core.

いくつかの態様では、本開示のmRNA組成物は、mRNA(プライム編集因子および/またはPEgRNAをコードする)、輸送基剤、および任意に標的細胞との接触と爾後のトランスフェクションとを容易化する薬剤を含む。 In some embodiments, the mRNA compositions of the present disclosure include an mRNA (encoding a primed editing factor and/or a PEgRNA), a delivery vehicle, and optionally an agent that facilitates contact with and subsequent transfection of a target cell.

いくつかの態様では、mRNAは、(例えば、mRNAの野生型のまたはネイティブなバージョンと比較して)mRNAに安定性を付与し、タンパク質の関連する異常な発現に関わる1つ以上の改変を包含し得る。欠陥を修正する野生型の1つ以上の改変もまた包含され得る。例えば、本発明の核酸は5'非翻訳領域または3'非翻訳領域の1つまたは両方の改変を包含し得る。かかる改変は、サイトメガロウイルス(CMV)最初期1(IE1)遺伝子、ポリAテール、キャップ1構造、またはヒト成長ホルモン(hGH)の部分配列をコードする配列の包含を包含し得る。いくつかの態様では、mRNAはmRNA免疫原性を縮減するように修飾される。 In some embodiments, the mRNA may include one or more modifications that confer stability to the mRNA and are involved in the associated aberrant expression of a protein (e.g., compared to a wild-type or native version of the mRNA). One or more modifications of the wild-type that correct a defect may also be included. For example, the nucleic acids of the invention may include modifications of one or both of the 5' untranslated region or the 3' untranslated region. Such modifications may include the inclusion of a sequence encoding the cytomegalovirus (CMV) immediate early 1 (IE1) gene, a polyA tail, a cap 1 structure, or a partial sequence of human growth hormone (hGH). In some embodiments, the mRNA is modified to reduce mRNA immunogenicity.

1つの態様では、本発明の組成物中の「プライム編集因子」mRNAは、標的細胞への送達を容易化するためにリポソーム移入基剤によって製剤され得る。企図される移入基剤は、1つ以上のカチオン性脂質、非カチオン性脂質、および/またはPEG修飾脂質を包含し得る。例えば、移入基剤は次のカチオン性脂質の少なくとも1つを包含し得る:C12-200、DLin-KC2-DMA、DODAP、HGT4003、ICE、HGT5000、またはHGT5001。態様では、移入基剤はコレステロール(chol)および/またはPEG修飾脂質を含む。いくつかの態様では、移入基剤はDMG-PEG2Kを含む。ある態様において、移入基剤は次の脂質製剤を有する:C12-200、DOPE、chol、DMG-PEG2K;DODAP、DOPE、コレステロール、DMG-PEG2K;HGT5000、DOPE、chol、DMG-PEG2K、HGT5001、DOPE、chol、DMG-PEG2Kの1つ。 In one embodiment, the "prime editing factor" mRNA in the composition of the invention may be formulated with a liposomal import vehicle to facilitate delivery to target cells. Contemplated import vehicles may include one or more cationic lipids, non-cationic lipids, and/or PEG-modified lipids. For example, the import vehicle may include at least one of the following cationic lipids: C12-200, DLin-KC2-DMA, DODAP, HGT4003, ICE, HGT5000, or HGT5001. In embodiments, the import vehicle includes cholesterol (chol) and/or a PEG-modified lipid. In some embodiments, the import vehicle includes DMG-PEG2K. In some embodiments, the transfer vehicle has one of the following lipid formulations: C12-200, DOPE, chol, DMG-PEG2K; DODAP, DOPE, cholesterol, DMG-PEG2K; HGT5000, DOPE, chol, DMG-PEG2K, HGT5001, DOPE, chol, DMG-PEG2K.

本開示は、1つ以上のPEをコードするmRNA分子による標的細胞のトランスフェクションを容易化することにとって有用な組成物および方法をもまた提供する。例えば、本発明の組成物および方法は、1つ以上の標的細胞に対する組成物の親和性を増大させ得る標的化リガンドの使用を企図する。1つの態様では、標的化リガンドはアポリポタンパク質Bまたはアポリポタンパク質Eであり、対応する標的細胞は低密度リポタンパク質受容体を発現し、それゆえに標的化リガンドの認識を促進する。膨大な数の標的細胞が本開示の方法および組成物を用いて選好的に標的化され得る。例えば、企図される標的細胞は、肝細胞、上皮細胞、造血細胞、上皮細胞、内皮細胞、肺細胞、骨細胞、幹細胞、間葉系細胞、神経細胞、心臓細胞、脂肪細胞、血管平滑筋包含(Includes)細胞、心筋細胞、骨格筋細胞、ベータ細胞、下垂体細胞、滑膜表層細胞、卵巣細胞、精巣細胞、線維芽細胞、B細胞、T細胞、網赤血球、白血球、顆粒球、および腫瘍細胞を包含する。しかしながら、それはこれらに限定されない。 The present disclosure also provides compositions and methods useful for facilitating transfection of target cells with mRNA molecules encoding one or more PEs. For example, the compositions and methods of the present invention contemplate the use of targeting ligands that can increase the affinity of the composition for one or more target cells. In one embodiment, the targeting ligand is apolipoprotein B or apolipoprotein E, and the corresponding target cells express the low density lipoprotein receptor, thus facilitating recognition of the targeting ligand. A vast number of target cells can be selectively targeted using the methods and compositions of the present disclosure. For example, contemplated target cells include hepatocytes, epithelial cells, hematopoietic cells, epithelial cells, endothelial cells, lung cells, bone cells, stem cells, mesenchymal cells, neural cells, cardiac cells, adipocytes, vascular smooth muscle includes cells, cardiac myocytes, skeletal muscle cells, beta cells, pituitary cells, synovial lining cells, ovarian cells, testicular cells, fibroblasts, B cells, T cells, reticulocytes, leukocytes, granulocytes, and tumor cells. However, it is not limited thereto.

いくつかの態様では、PEをコードするmRNAは、任意に、例えばかかるmRNAの安定性および/もしくは半減期を改善するかまたはタンパク質生産を改善もしくは別様に容易化する化学的または生物学的修飾を有し得る。トランスフェクションによって、本発明の組成物中の天然のmRNAは30分および何日かの間の半減期で崩壊し得る。本開示の組成物中のmRNAは翻訳される少なくともいくらかの能力を保持し得、それによって機能的なタンパク質または酵素を生ずる。従って、本発明は、安定化されたmRNAを含む組成物およびそれを投与する方法を提供する。いくつかの態様では、mRNAの活性は伸長された期間に渡って遷延する。例えば、本開示の組成物が半週毎もしくは隔週毎の基準で、またはより好ましくは毎月、隔月毎、四半期毎、もしくは毎年の基準で対象に投与されるようにして、mRNAの活性は遷延し得る。本発明のmRNAの伸長または遷延した活性は、かかるmRNAから生ずるタンパク質または酵素の数量に直接的に関係する。類似に、本開示の組成物の活性は、mRNAの翻訳を改善または増強するためになされる改変によってさらに伸長または遷延し得る。さらにその上、標的細胞によって生ずる機能的なタンパク質または酵素の数量は、標的細胞に送達されるmRNAの数量およびかかるmRNAの安定性の関数である。本発明のmRNAの安定性が改善または増強され得る程度に合わせて、半減期、生ずるタンパク質または酵素の活性、および組成物の投薬頻度はさらに伸長され得る。 In some embodiments, the mRNA encoding the PE may optionally have chemical or biological modifications, for example, that improve the stability and/or half-life of such mRNA or improve or otherwise facilitate protein production. Upon transfection, the natural mRNA in the compositions of the present disclosure may decay with a half-life between 30 minutes and days. The mRNA in the compositions of the present disclosure may retain at least some ability to be translated, thereby resulting in a functional protein or enzyme. Thus, the present invention provides compositions comprising stabilized mRNA and methods of administering the same. In some embodiments, the activity of the mRNA is prolonged for an extended period of time. For example, the activity of the mRNA may be prolonged such that the compositions of the present disclosure are administered to a subject on a semi-weekly or biweekly basis, or more preferably on a monthly, bimonthly, quarterly, or yearly basis. The extended or prolonged activity of the mRNA of the present invention is directly related to the quantity of protein or enzyme that results from such mRNA. Similarly, the activity of the compositions of the present disclosure may be further prolonged or prolonged by modifications made to improve or enhance translation of the mRNA. Furthermore, the amount of functional protein or enzyme produced by a target cell is a function of the amount of mRNA delivered to the target cell and the stability of such mRNA. To the extent that the stability of the mRNA of the present invention can be improved or enhanced, the half-life, activity of the resulting protein or enzyme, and dosing frequency of the composition can be further extended.

従って、いくつかの態様では、本開示の組成物中のmRNAは、例えばインビボのヌクレアーゼ消化に対する改善された耐性を包含する増大または増強された安定性を核酸に付与する少なくとも1つの改変を含む。本願において用いられる用語「改変」および「改変される」は、かかる用語が本願において提供される核酸に関すると、好ましくは安定性を増強し、mRNAの野生型または天然に存在するバージョンよりもmRNAを安定に(例えば、ヌクレアーゼ消化に対して耐性に)する少なくとも1つの変改を包含する。本願において用いられる用語「安定」および「安定性」は、かかる用語が特にmRNAについて本発明の核酸に関すると、例えば正常ではかかるmRNAを分解することができるヌクレアーゼ(すなわち、エンドヌクレアーゼまたはエキソヌクレアーゼ)による分解に対する増大または増強した耐性を言う。増大した安定性は、例えば、標的細胞または組織内の内生酵素(例えば、エンドヌクレアーゼもしくはエキソヌクレアーゼ)または条件による加水分解または他の破壊に対するより少ない感度を包含し得、それによって、標的細胞、組織、対象、および/または細胞質におけるかかるmRNAの滞留を増大または増強する。本願において提供される安定化されたmRNA分子は、それらの天然に存在する未改変のカウンターパート(例えば、mRNAの野生型バージョン)に対して相対的に、長い半減期を実証する。また、かかる用語が本発明のmRNAに関係すると、用語「改変」および「改変される」によって、mRNA核酸の翻訳を改善または増強する変改が企図される。例えば、タンパク質翻訳の開始に機能する配列(例えば、Kozakコンセンサス配列)の包含を包含する。(Kozak,M.,Nucleic Acids Res 15(20):8125-48(1987))。 Thus, in some embodiments, the mRNA in the compositions of the present disclosure includes at least one modification that confers increased or enhanced stability to the nucleic acid, including, for example, improved resistance to nuclease digestion in vivo. The terms "modified" and "modified," as such terms relate to the nucleic acids provided herein, preferably include at least one alteration that enhances stability and makes the mRNA more stable (e.g., resistant to nuclease digestion) than a wild-type or naturally occurring version of the mRNA. The terms "stable" and "stability," as such terms relate to the nucleic acids of the present invention, particularly for mRNA, refer to, for example, increased or enhanced resistance to degradation by nucleases (i.e., endonucleases or exonucleases) that would normally degrade such mRNA. Increased stability can include, for example, less susceptibility to hydrolysis or other destruction by endogenous enzymes (e.g., endonucleases or exonucleases) or conditions within the target cell or tissue, thereby increasing or enhancing the residence of such mRNA in the target cell, tissue, subject, and/or cytoplasm. The stabilized mRNA molecules provided herein demonstrate a longer half-life relative to their naturally occurring unmodified counterparts (e.g., wild-type versions of mRNA). Also contemplated by the terms "modification" and "modified" as such terms relate to the mRNA of the present invention are alterations that improve or enhance translation of the mRNA nucleic acid. For example, they include the inclusion of sequences (e.g., Kozak consensus sequences) that function in the initiation of protein translation. (Kozak, M., Nucleic Acids Res 15(20):8125-48(1987)).

いくつかの態様では、本開示の組成物に用いられるmRNAは、それらをより安定にするための化学的または生物学的修飾を経過している。mRNAの例示の修飾は、塩基の枯渇(例えば、1つのヌクレオチドの欠失もしくは別のものへの置換による)または塩基の修飾、例えば塩基の化学修飾を包含する。本願において用いられる言い回し「化学修飾」は、天然に存在するmRNAに見られるものとは異なるケミストリーを導入する修飾、例えば共有結合的修飾、例えば修飾ヌクレオチドの導入(例えば、ヌクレオチドアナログ、またはかかるmRNA分子に天然には見出されないペンダント基の包含)を包含する。 In some embodiments, the mRNAs used in the compositions of the present disclosure have undergone chemical or biological modifications to make them more stable. Exemplary modifications of mRNA include base depletion (e.g., by deleting one nucleotide or substituting another) or modification of the bases, e.g., chemical modification of the bases. As used herein, the phrase "chemical modification" includes modifications that introduce a different chemistry than that found in naturally occurring mRNA, e.g., covalent modifications, e.g., the introduction of modified nucleotides (e.g., inclusion of nucleotide analogs or pendant groups not naturally found in such mRNA molecules).

本開示の組成物に用いられるPEをコードするmRNAに組み込まれ得る他の好適なポリヌクレオチド修飾は、4'-チオ修飾塩基:4'-チオアデノシン、4'-チオグアノシン、4'-チオシチジン、4'-チオウリジン、4'-チオ-5-メチル-シチジン、4'-チオシュードウリジン、および4'-チオ2-チオウリジン、ピリジン-4-オンリボヌクレオシド、5-アザ-ウリジン、2-チオ-5-アザ-ウリジン、2-チオウリジン、4-チオシュードウリジン、2-チオシュードウリジン、5-ヒドロキシウリジン、3-メチルウリジン、5-カルボキシメチル-ウリジン、1-カルボキシメチル-シュードウリジン、5-プロピニルウリジン、1-プロピニルシュードウリジン、5-タウリノメチルウリジン、1-タウリノメチル-シュードウリジン、5-タウリノメチル-2-チオウリジン、1-タウリノメチル-4-チオウリジン、5-メチル-ウリジン、1-メチル-シュードウリジン、4-チオ-1-メチル-シュードウリジン、2-チオ-1-メチル-シュードウリジン、1-メチル-1-デアザ-シュードウリジン、2-チオ-1-メチル-1-デアザ-シュードウリジン、ジヒドロウリジン、ジヒドロシュードウリジン、2-チオジヒドロウリジン、2-チオジヒドロシュードウリジン、2-メトキシウリジン、2-メトキシ-4-チオウリジン、4-メトキシ-シュードウリジン、4-メトキシ-2-チオシュードウリジン、5-アザ-シチジン、シュードイソシチジン、3-メチル-シチジン、N4-アセチルシチジン、5-ホルミルシチジン、N4-メチルシチジン、5-ヒドロキシメチルシチジン、1-メチル-シュードイソシチジン、ピロロ-シチジン、ピロロ-シュードイソシチジン、2-チオシチジン、2-チオ-5-メチル-シチジン、4-チオシュードイソシチジン、4-チオ-1-メチル-シュードイソシチジン、4-チオ-1-メチル-1-デアザ-シュードイソシチジン、1-メチル-1-デアザ-シュードイソシチジン、ゼブラリン、5-アザ-ゼブラリン、5-メチルゼブラリン、5-アザ-2-チオゼブラリン、2-チオゼブラリン、2-メトキシ-シチジン、2-メトキシ-5-メチル-シチジン、4-メトキシ-シュードイソシチジン、4-メトキシ-1-メチル-シュードイソシチジン、2-アミノプリン、2,6-ジアミノプリン、7-デアザ-アデニン、7-デアザ-8-アザ-アデニン、7-デアザ-2-アミノプリン、7-デアザ-8-アザ-2-アミノプリン、7-デアザ-2,6-ジアミノプリン、7-デアザ-8-アザ-2,6-ジアミノプリン、1-メチルアデノシン、N6-メチルアデノシン、N6-イソペンテニルアデノシン、N6-(シス-ヒドロキシイソペンテニル)アデノシン、2-メチルチオ-N6-(シス-ヒドロキシイソペンテニル)アデノシン、N6-グリシニルカルバモイルアデノシン、N6-スレオニルカルバモイルアデノシン、2-メチルチオ-N6-スレオニルカルバモイルアデノシン、N6,N6-ジメチルアデノシン、7-メチルアデニン、2-メチルチオアデニン、および2-メトキシ-アデニン、イノシン、1-メチル-イノシン、ワイオシン、ワイブトシン、7-デアザ-グアノシン、7-デアザ-8-アザ-グアノシン、6-チオグアノシン、6-チオ-7-デアザ-グアノシン、6-チオ-7-デアザ-8-アザ-グアノシン、7-メチル-グアノシン、6-チオ-7-メチル-グアノシン、7-メチルイノシン、6-メトキシ-グアノシン、1-メチルグアノシン、sN2-メチルグアノシン、N2,N2-ジメチルグアノシン、8-オキソ-グアノシン、7-メチル-8-オキソ-グアノシン、1-メチル-6-チオグアノシン、N2-メチル-6-チオグアノシン、およびN2,N2-ジメチル-6-チオグアノシン、ならびにそれらの組み合わせを包含するが、これらに限定されない。用語修飾は、例えば、本発明のmRNA配列上への非ヌクレオチド連結部または修飾ヌクレオチドの組み込みをもまた包含する(例えば、機能的なタンパク質または酵素をコードするmRNA分子の3'および5'端の1つまたは両方の修飾)。かかる修飾は、mRNA配列への塩基の追加(例えば、ポリAテールまたはより長いポリAテールの包含)、3'UTRまたは5'UTRの変改、mRNAを薬剤(例えば、タンパク質または相補的な核酸分子)と複合体化すること、mRNA分子の構造を変化させるエレメント(例えば、これは二次構造を形成する)の包含を包含する。 Other suitable polynucleotide modifications that may be incorporated into the mRNA encoding the PE used in the compositions of the present disclosure include 4'-thio modified bases: 4'-thioadenosine, 4'-thioguanosine, 4'-thiocytidine, 4'-thiouridine, 4'-thio-5-methyl-cytidine, 4'-thiopseudouridine, and 4'-thio-2-thiouridine, pyridin-4-one ribonucleosides, 5-aza-uridine, 2-thio-5-aza-uridine, 2-thiouridine, 4-thio-5-methyl-cyt ... Thiopseudouridine, 2-thiopseudouridine, 5-hydroxyuridine, 3-methyluridine, 5-carboxymethyl-uridine, 1-carboxymethyl-pseudouridine, 5-propynyluridine, 1-propynylpseudouridine, 5-taurinomethyluridine, 1-taurinomethyl-pseudouridine, 5-taurinomethyl-2-thiouridine, 1-taurinomethyl-4-thiouridine, 5-methyl-uridine, 1-methyl-pseudouridine uridine, 4-thio-1-methyl-pseudouridine, 2-thio-1-methyl-pseudouridine, 1-methyl-1-deaza-pseudouridine, 2-thio-1-methyl-1-deaza-pseudouridine, dihydrouridine, dihydropseudouridine, 2-thiodihydrouridine, 2-thiodihydropseudouridine, 2-methoxyuridine, 2-methoxy-4-thiouridine, 4-methoxy-pseudouridine, 4-methoxy-2-thiopseudouridine , 5-aza-cytidine, pseudoisocytidine, 3-methyl-cytidine, N4-acetylcytidine, 5-formylcytidine, N4-methylcytidine, 5-hydroxymethylcytidine, 1-methyl-pseudoisocytidine, pyrrolo-cytidine, pyrrolo-pseudoisocytidine, 2-thiocytidine, 2-thio-5-methyl-cytidine, 4-thiopseudoisocytidine, 4-thio-1-methyl-pseudoisocytidine, 4-thio-1-methyl-1-deaza-pseudoisocytidine doisocytidine, 1-methyl-1-deaza-pseudoisocytidine, zebularine, 5-aza-zebularine, 5-methylzebularine, 5-aza-2-thiozebularine, 2-thiozebularine, 2-methoxy-cytidine, 2-methoxy-5-methyl-cytidine, 4-methoxy-pseudoisocytidine, 4-methoxy-1-methyl-pseudoisocytidine, 2-aminopurine, 2,6-diaminopurine, 7-deaza-adenine, 7-deaza-8-aza-adenine, 7-Deaza-2-aminopurine, 7-Deaza-8-aza-2-aminopurine, 7-Deaza-2,6-diaminopurine, 7-Deaza-8-aza-2,6-diaminopurine, 1-Methyladenosine, N6-Methyladenosine, N6-Isopentenyladenosine, N6-(cis-Hydroxyisopentenyl)adenosine, 2-Methylthio-N6-(cis-Hydroxyisopentenyl)adenosine, N6-Glycinylcarbamoyladenosine, N6-Threonylcarbamoyladenosine, 2-methylthio-N6-threonylcarbamoyl adenosine, N6,N6-dimethyl adenosine, 7-methyladenine, 2-methylthioadenine, and 2-methoxy-adenine, inosine, 1-methyl-inosine, wyosine, wybutosine, 7-deaza-guanosine, 7-deaza-8-aza-guanosine, 6-thioguanosine, 6-thio-7-deaza-guanosine, 6-thio-7-deaza-8-aza-guanosine, 7-methyl -guanosine, 6-thio-7-methyl-guanosine, 7-methylinosine, 6-methoxy-guanosine, 1-methylguanosine, sN2-methylguanosine, N2,N2-dimethylguanosine, 8-oxo-guanosine, 7-methyl-8-oxo-guanosine, 1-methyl-6-thioguanosine, N2-methyl-6-thioguanosine, and N2,N2-dimethyl-6-thioguanosine, and combinations thereof. The term modification also includes, for example, the incorporation of non-nucleotide linkages or modified nucleotides onto the mRNA sequences of the invention (e.g., modification of one or both of the 3' and 5' ends of an mRNA molecule encoding a functional protein or enzyme). Such modifications include adding bases to the mRNA sequence (e.g., inclusion of a polyA tail or a longer polyA tail), altering the 3'UTR or 5'UTR, complexing the mRNA with an agent (e.g., a protein or a complementary nucleic acid molecule), and inclusion of elements that change the structure of the mRNA molecule (e.g., which form secondary structures).

いくつかの態様では、PEをコードするmRNAは5'キャップ構造を包含する。5'キャップは典型的には次のとおり追加される:第1に、RNA末端ホスファターゼが末端リン酸基の1つを5'ヌクレオチドから除去し、2つの末端リン酸を残す;それから、グアノシン三リン酸(GTP)がグアニリルトランスフェラーゼによって末端リン酸に追加され、5'5'5三リン酸連結部を生ずる;それから、グアニンの7-窒素がメチルトランスフェラーゼによってメチル化される。キャップ構造の例は、m7G(5')ppp(5'(A、G(5')ppp(5')A、およびG(5')ppp(5')Gを包含するが、これらに限定されない。天然に存在するキャップ構造は、三リン酸ブリッジを介して最初に転写されるヌクレオチドの5'端に連結されている7-メチルグアノシンを含み、m7G(5')ppp(5')Nのジヌクレオチドキャップをもたらし、Nはいずれかのヌクレオシドである。インビボでは、キャップは酵素的に追加される。キャップは核内で追加され、酵素グアニリルトランスフェラーゼによって触媒される。RNAの5'末端の端へのキャップの追加は転写の開始後に直ちに生起する。末端ヌクレオシドは典型的にはグアノシンであり、全ての他のヌクレオチドとは逆向き、すなわちG(5')ppp(5')GpNpNpである。 In some embodiments, the mRNA encoding PE includes a 5' cap structure. The 5' cap is typically added as follows: first, an RNA terminal phosphatase removes one of the terminal phosphate groups from the 5' nucleotide, leaving two terminal phosphates; then, guanosine triphosphate (GTP) is added to the terminal phosphate by a guanylyltransferase, resulting in a 5'5'5 triphosphate linkage; then, the 7-nitrogen of guanine is methylated by a methyltransferase. Examples of cap structures include, but are not limited to, m7G(5')ppp(5'(A, G(5')ppp(5')A, and G(5')ppp(5')G. Naturally occurring cap structures contain a 7-methylguanosine linked to the 5' end of the first transcribed nucleotide via a triphosphate bridge, resulting in a dinucleotide cap of m7G(5')ppp(5')N, where N is any nucleoside. In vivo, the cap is added enzymatically. The cap is added in the nucleus and is catalyzed by the enzyme guanylyltransferase. Addition of the cap to the 5' end of the RNA occurs immediately after the initiation of transcription. The terminal nucleoside is typically guanosine and is in the opposite orientation to all other nucleotides, i.e., G(5')ppp(5')GpNpNp.

追加のキャップアナログは、m7GpppG、m7GpppA、m7GpppC;非メチル化キャップアナログ(例えばGpppG);ジメチル化キャップアナログ(例えばm2,7GpppG)、トリメチル化キャップアナログ(例えば、m2,2,7GpppG)、ジメチル化対称キャップアナログ(例えば、m7Gpppm7G)、またはアンチリバースキャップアナログ(例えば、ARCA;m7,2'OmeGpppG、m72'dGpppG、m7,3'OmeGpppG、m7,3'dGpppG、およびそれらの四リン酸誘導体)からなる群から選択される化学構造を包含するが、これらに限定されない(例えば、Jemielity,J.et al.,"Novel 'anti-reverse'cap analogs with superior translational properties",RNA,9:1108-1122(2003)を見よ)。 Additional cap analogs include, but are not limited to, chemical structures selected from the group consisting of m7GpppG, m7GpppA, m7GpppC; unmethylated cap analogs (e.g., GpppG); dimethylated cap analogs (e.g., m2,7GpppG), trimethylated cap analogs (e.g., m2,2,7GpppG), dimethylated symmetric cap analogs (e.g., m7Gpppm7G), or anti-reverse cap analogs (e.g., ARCA; m7,2'OmeGpppG, m72'dGpppG, m7,3'OmeGpppG, m7,3'dGpppG, and their tetraphosphate derivatives) (see, e.g., Jemielity, J. et al., "Novel 'anti-reverse' cap analogs with superior translational properties", RNA, 9:1108-1122 (2003)).

典型的には、「テール」の存在はエキソヌクレアーゼ分解からmRNAを防護するための用をなす。ポリAまたはポリUテールは天然のメッセンジャーおよび合成センスRNAを安定化すると考えられる。よって、ある態様において、長いポリAまたはポリUテールがmRNA分子に追加され得、それゆえにRNAをより安定にする。ポリAまたはポリUテールは種々の当該技術分野で認識される技術を用いて追加され得る。例えば、長いポリAテールは、ポリAポリメラーゼを用いて合成のまたはin vitro転写されたRNAに追加され得る(Yokoe,et al.Nature Biotechnology.1996;14:1252-1256)。転写ベクターもまた長いポリAテールをコードし得る。加えて、ポリAテールは直接的にPCR産物からの転写によって追加され得る。ポリAはRNAリガーゼによってもまたセンスRNAの3’端にライゲーションされ得る(例えば、Sambrook、FritschおよびManiatisによるMolecular Cloning A Laboratory Manual,2nd Ed.,ed.(Cold Spring Harbor Laboratory Press:1991 edition)を見よ)。 Typically, the presence of a "tail" serves to protect the mRNA from exonuclease degradation. PolyA or polyU tails are thought to stabilize natural messenger and synthetic sense RNA. Thus, in some embodiments, a long polyA or polyU tail can be added to an mRNA molecule, thus making the RNA more stable. PolyA or polyU tails can be added using a variety of art-recognized techniques. For example, a long polyA tail can be added to synthetic or in vitro transcribed RNA using polyA polymerase (Yokoe, et al. Nature Biotechnology. 1996;14:1252-1256). Transcription vectors can also encode long polyA tails. Additionally, polyA tails can be added by transcription directly from PCR products. Poly A can also be ligated to the 3' end of the sense RNA by RNA ligase (see, e.g., Molecular Cloning A Laboratory Manual, 2nd Ed., ed. by Sambrook, Fritsch, and Maniatis (Cold Spring Harbor Laboratory Press: 1991 edition)).

典型的には、ポリAまたはポリUテールの長さは少なくとも約10、50、100、200、300、400、少なくとも500ヌクレオチドであり得る。いくつかの態様では、mRNAの3'末端のポリAテールは典型的には約10から300アデノシンヌクレオチドを包含する(例えば、約10から200アデノシンヌクレオチド、約10から150アデノシンヌクレオチド、約10から100アデノシンヌクレオチド、約20から70アデノシンヌクレオチド、または約20から60アデノシンヌクレオチド)。いくつかの態様では、mRNAは3'ポリCテール構造を包含する。mRNAの3'末端の好適なポリCテールは典型的には約10から200シトシンヌクレオチドを包含する(例えば、約10から150シトシンヌクレオチド、約10から100シトシンヌクレオチド、約20から70シトシンヌクレオチド、約20から60シトシンヌクレオチド、または約10から40シトシンヌクレオチド)。ポリCテールはポリAまたはポリUテールに追加され得るか、あるいはポリAまたはポリUテールを置換し得る。 Typically, the length of the polyA or polyU tail can be at least about 10, 50, 100, 200, 300, 400, at least 500 nucleotides. In some embodiments, the polyA tail at the 3' end of the mRNA typically includes about 10 to 300 adenosine nucleotides (e.g., about 10 to 200 adenosine nucleotides, about 10 to 150 adenosine nucleotides, about 10 to 100 adenosine nucleotides, about 20 to 70 adenosine nucleotides, or about 20 to 60 adenosine nucleotides). In some embodiments, the mRNA includes a 3' polyC tail structure. A suitable polyC tail at the 3' end of the mRNA typically includes about 10 to 200 cytosine nucleotides (e.g., about 10 to 150 cytosine nucleotides, about 10 to 100 cytosine nucleotides, about 20 to 70 cytosine nucleotides, about 20 to 60 cytosine nucleotides, or about 10 to 40 cytosine nucleotides). The poly-C tail can be in addition to or replace the poly-A or poly-U tail.

本開示に従うPEをコードするmRNAは種々の公知の方法のいずれかに従って合成され得る。例えば、本発明に従うmRNAはin vitro転写(IVT)によって合成され得る。手短かには、IVTは、典型的には、プロモーターを含有する直線状または環状DNA鋳型、リボヌクレオチド三リン酸のプール、DTTおよびマグネシウムイオンを包含し得る緩衝液系、ならびに適当なRNAポリメラーゼ(例えば、T3、T7、またはSP6 RNAポリメラーゼ)、DNAse I、ピロホスファターゼ、および/またはRNAse阻害剤によって行われる。厳密な条件は特定の適用に従って変わるであろう。 The mRNA encoding the PE according to the present disclosure may be synthesized according to any of a variety of known methods. For example, the mRNA according to the present invention may be synthesized by in vitro transcription (IVT). Briefly, IVT is typically performed with a linear or circular DNA template containing a promoter, a pool of ribonucleotide triphosphates, a buffer system that may include DTT and magnesium ions, and an appropriate RNA polymerase (e.g., T3, T7, or SP6 RNA polymerase), DNAse I, pyrophosphatase, and/or RNAse inhibitors. Stringent conditions will vary according to the particular application.

mRNA送達が関わる態様では、PE融合タンパク質をコードするmRNA対PEgRNAの比は効率的な編集にとって重要であり得る。ある態様において、mRNA(PE融合タンパク質をコードする)対PEgRNAの重量比は1:1である。ある種の他の態様において、mRNA(PE融合タンパク質をコードする)対PEgRNAの重量比は2:1である。なお他の態様において、mRNA(PE融合タンパク質をコードする)対PEgRNAの重量比は1:2である。なおさらなる態様では、mRNA(PE融合タンパク質をコードする)対PEgRNAの重量比は、約1:1000、1:900;1:800;1:700;1:600;1:500;1:400;1:300;1:200;1:100;1:90;1:80;1:70;1:60;1:50;1:40;1:30;1:20;1:10;および1:1からなる群から選択される。他の態様において、mRNA(PE融合タンパク質をコードする)対PEgRNAの重量比は、約1:1000、1:900;800:1;700:1;600:1;500:1;400:1;300:1;200:1;100:1;90:1;80:1;70:1;60:1;50:1;40:1;30:1;20:1;10:1;および1:1からなる群から選択される。 In embodiments involving mRNA delivery, the ratio of mRNA encoding the PE fusion protein to PEgRNA can be important for efficient editing. In certain embodiments, the weight ratio of mRNA (encoding the PE fusion protein) to PEgRNA is 1:1. In certain other embodiments, the weight ratio of mRNA (encoding the PE fusion protein) to PEgRNA is 2:1. In still other embodiments, the weight ratio of mRNA (encoding the PE fusion protein) to PEgRNA is 1:2. In still further embodiments, the weight ratio of mRNA (encoding the PE fusion protein) to PEgRNA is selected from the group consisting of about 1:1000, 1:900; 1:800; 1:700; 1:600; 1:500; 1:400; 1:300; 1:200; 1:100; 1:90; 1:80; 1:70; 1:60; 1:50; 1:40; 1:30; 1:20; 1:10; and 1:1. In other embodiments, the weight ratio of mRNA (encoding the PE fusion protein) to PEgRNA is selected from the group consisting of about 1:1000, 1:900; 800:1; 700:1; 600:1; 500:1; 400:1; 300:1; 200:1; 100:1; 90:1; 80:1; 70:1; 60:1; 50:1; 40:1; 30:1; 20:1; 10:1; and 1:1.

J.バイアスがない様式でオフターゲット編集を同定するためのプライム編集の使用
他のゲノム編集因子のように、PEはそのプログラムされた遺伝子変改をゲノム上の意図されない部位、すなわち「オフターゲット」部位において導入し得るといういくらかのリスクが存在する。しかしながら、現行では、プライム編集因子によるオフターゲット編集を検出するための記載されている方法はない。かかる方法は、プライム編集因子を用いるオフターゲット編集の可能性ある部位の同定を許すであろう。
J. Using prime editing to identify off-target edits in an unbiased manner
Like other genome editing elements, there is some risk that PE may introduce its programmed genetic alteration at unintended sites on the genome, i.e., "off-target" sites. However, currently, there is no method described for detecting off-target editing by prime editing elements. Such a method would allow identification of possible sites of off-target editing using prime editing elements.

この側面の鍵の概念は、プライム編集を用いて、同じPEgRNAを鋳型として、オンターゲットおよびオフターゲット部位において同じアダプター配列および/またはプライマー結合部位を挿入して、napDNAbpヌクレアーゼまたはプライム編集因子のゲノムオフターゲット改変部位の急速な同定を可能化するという発想である。アダプターおよび/またはプライマー結合配列がnapDNAbpによるDNA結合およびニッキングと同じイベントにおいて挿入され、下流プロセシングを単純化するので、この方法はヌクレアーゼオフターゲット部位を同定する他の技術から見分けられる。 The key concept of this aspect is the idea of using prime editing to insert the same adaptor sequences and/or primer binding sites at on-target and off-target sites using the same PEgRNA as a template, enabling rapid identification of genomic off-target modification sites of napDNAbp nucleases or prime editors. This method is distinguished from other techniques for identifying nuclease off-target sites because the adaptor and/or primer binding sequences are inserted in the same event as DNA binding and nicking by napDNAbp, simplifying downstream processing.

図33はオフターゲット同定の基本的原理を例解する。図は、プライマー結合配列挿入のためのPEgRNAデザインと、オフターゲット編集を決定するためのプライム編集を用いるゲノムDNA上へのプライマー結合挿入とを示す模式図である。この態様では、プライム編集が生細胞、組織、または動物モデル内において行われる。第1のステップとして、適当なPEgRNAがデザインされる。上側の模式図は、この側面に用いられ得る例示のPEgRNAを示す。PEgRNA上のスペーサー(「プロトスペーサー」と標識されている)はゲノム標的の鎖の1つに対して相補的である。PE:PEgRNA複合体(すなわちPE複合体)は一本鎖3'端フラップをニック部位に組み入れし、これは、コードされるプライマー結合配列と、カットされる部位のちょうど下流の領域に対して相補的である相同領域(PEgRNAの相同アームによってコードされる)とを含有する(赤色による)。フラップ侵入およびDNA修復/複製プロセスによって、合成された鎖はDNA上に組み込まれるようになり、それによってプライマー結合部位を組み入れる。このプロセスは、所望のゲノム標的において生起し得るが、オフターゲットの様式でPEgRNAと相互作用し得る他のゲノム部位においてもまた生起し得る(すなわち、意図されるゲノム部位ではない他のゲノム部位に対するスペーサー領域の相補性を原因として、PEgRNAはPE複合体を他のオフターゲット部位へとガイドする)。それゆえに、プライマー結合配列は、所望のゲノム標的においてのみならず、ゲノム上の他所のオフターゲットゲノム部位において組み入れられ得る。意図されるゲノム標的部位およびオフターゲットゲノム部位両方におけるこれらのプライマー結合部位の挿入を検出するためには、ゲノムDNA(PE後)が単離、フラグメント化、およびアダプターヌクレオチドにライゲーションされ得る(赤色で示されている)。次に、アダプターおよび挿入されたプライマー結合配列にアニールするPCRオリゴヌクレオチドによって、PCRが実行されて、プライマー結合部位がPEによって挿入されたオンターゲットおよびオフターゲットゲノムDNA領域を増幅し得る。それから、高スループット配列決定および配列アラインメントが行われて、オンターゲット部位またはオフターゲット部位どちらかにおけるPEによって挿入されたプライマー結合配列の挿入点を同定し得る。 Figure 33 illustrates the basic principle of off-target identification. The figure shows a schematic diagram of PEgRNA design for primer binding sequence insertion and primer-bound insertion onto genomic DNA using prime editing to determine off-target editing. In this embodiment, prime editing is performed in a living cell, tissue, or animal model. As a first step, a suitable PEgRNA is designed. The top schematic diagram shows an exemplary PEgRNA that can be used in this aspect. The spacer on the PEgRNA (labeled "protospacer") is complementary to one of the strands of the genomic target. The PE:PEgRNA complex (i.e., the PE complex) incorporates a single-stranded 3' end flap at the nick site, which contains the encoded primer binding sequence and a homologous region (encoded by the homologous arm of the PEgRNA) that is complementary to the region just downstream of the site to be cut (by red). By flap invasion and DNA repair/replication processes, the synthesized strand becomes incorporated onto the DNA, thereby incorporating the primer binding site. This process may occur at the desired genomic target, but also at other genomic sites that may interact with the PEgRNA in an off-target manner (i.e., due to the complementarity of the spacer region to other genomic sites that are not the intended genomic site, the PEgRNA guides the PE complex to other off-target sites). Thus, primer binding sequences may be incorporated not only at the desired genomic target, but also at other off-target genomic sites on the genome. To detect the insertion of these primer binding sites at both the intended genomic target site and the off-target genomic site, the genomic DNA (post-PE) may be isolated, fragmented, and ligated to adapter nucleotides (shown in red). Then, PCR may be performed with PCR oligonucleotides that anneal to the adapter and the inserted primer binding sequence to amplify the on-target and off-target genomic DNA regions where the primer binding sites were inserted by PE. High-throughput sequencing and sequence alignment may then be performed to identify the insertion point of the primer binding sequence inserted by PE at either the on-target site or the off-target site.

それゆえに、図33は、生細胞内、組織培養、または動物モデルにおいて編集するときのオフターゲット編集部位の同定についての1つの側面を例解する。この方法を行うためには、最終的な所望のプライム編集因子と同一のスペーサー(そして、プライム編集オフターゲットを検査する場合には、最終的な所望の編集因子と同一のプライマー結合部位配列)を有するが、プライム編集による逆転写後にアダプターまたはプライマー結合部位を組み入れるための必要な配列を包含するPEgRNAが生成される。プライム編集因子またはRTに融合したヌクレアーゼを用いるインビボ編集が行われ、ゲノムDNAを単離する。ゲノムDNAは酵素的なまたは機械的な手段によってフラグメント化され、DNAフラグメント化の部位に異なるアダプターを付加する。1つのアダプターからPEgRNAによって組み入れされたアダプターまでを増幅するためのPCRが用いられる。もたらされた産物はディープ配列決定されて、全ての改変された部位を同定する。 Thus, FIG. 33 illustrates one aspect of identifying off-target editing sites when editing in live cells, tissue culture, or animal models. To perform this method, a PEgRNA is generated that has the same spacer as the final desired prime editor (and the same primer binding site sequence as the final desired editor, if prime editing off-targets are being examined), but includes the necessary sequences for incorporating an adapter or primer binding site after reverse transcription by prime editing. In vivo editing using a nuclease fused to the prime editor or RT is performed, and genomic DNA is isolated. The genomic DNA is fragmented by enzymatic or mechanical means, adding different adapters at the sites of DNA fragmentation. PCR is used to amplify from one adapter to the adapter incorporated by the PEgRNA. The resulting product is deep sequenced to identify all modified sites.

別の側面において、PEによるオフターゲット編集の評価がin vitroで行われ得る。この側面では、ゲノムDNAのin vitro改変を用いるオフターゲット編集部位のゲノムDNA同定のin vitro改変の間に、PEが用いられる。この方法を行うためには、精製されたプライム編集因子融合タンパク質およびPEgRNAのリボヌクレオタンパク質(RNP)(すなわちPE複合体)がアセンブリされる。これは、アダプターまたはプライマー結合配列を標的部位において組み入れるように構成されるが、さもなければ目当てのPEgRNAと同じである。このRNP(すなわち、PE複合体)がDNAのフラグメント化前または後に抽出されたゲノムDNAとインキュベーションされる。フラグメント化後に、異なるアダプター配列がフラグメントDNAの端にライゲーションされる。挿入されたアダプター配列(すなわち、EPによって挿入された)とフラグメントの端にライゲーションされたアダプターとにまたがるゲノム部位を増幅するためのPCRが用いられる。アダプター配列間の高スループット配列決定は、オンターゲットおよびオフターゲットである改変のゲノム部位を同定し得る。細胞性のDNA修復は、プライム編集因子によって追加された逆転写されたDNAアダプターを消去しないであろうので、このin vitro編集法は、検出の感度を増強するはずである。 In another aspect, evaluation of off-target editing by PE can be performed in vitro. In this aspect, PE is used during in vitro modification of genomic DNA identification of off-target editing sites using in vitro modification of genomic DNA. To perform this method, a purified prime editor fusion protein and a ribonucleoprotein (RNP) of PEgRNA (i.e., a PE complex) is assembled that is configured to incorporate an adapter or primer binding sequence at the target site, but is otherwise identical to the PEgRNA of interest. This RNP (i.e., the PE complex) is incubated with extracted genomic DNA before or after fragmentation of the DNA. After fragmentation, different adapter sequences are ligated to the ends of the fragment DNA. PCR is used to amplify the genomic sites that span the inserted adapter sequence (i.e., inserted by EP) and the adapters ligated to the ends of the fragments. High-throughput sequencing between the adapter sequences can identify genomic sites of modification that are on-target and off-target. This in vitro editing method should enhance the sensitivity of detection, as cellular DNA repair will not erase the reverse-transcribed DNA adapters added by the primed editor.

これらの方法は、いずれかのプライム編集因子、または標的のカットされる部位を認識するためにガイドRNAを用いるいずれかのゲノム編集因子(ほとんどのCasヌクレアーゼ)について、オフターゲット編集を同定するために用いられ得る。 These methods can be used to identify off-target edits for any primed editor or any genome editor that uses a guide RNA to recognize the target site to be cut (most Cas nucleases).

これらの方法は、ゲノム編集因子が処置への使用を考慮される全ての遺伝子疾患に適用され得る。 These methods can be applied to all genetic diseases for which genome editing elements are being considered for treatment.

PEによって組み入れられ得る例示のアダプターおよび/またはプライマー結合配列は:

Figure 2020191243000240

を包含するが、これらに限定されない。 Exemplary adaptor and/or primer binding sequences that may be incorporated by PE are:
Figure 2020191243000240

These include, but are not limited to:

これらのアダプターおよび/またはプライマー結合配列もまた、上で概説されているとおりゲノムDNAフラグメント化後のライゲーションステップに用いられ得る。 These adaptor and/or primer binding sequences may also be used in the ligation step following genomic DNA fragmentation as outlined above.

オフターゲット編集を評価するための本明細書に記載の方法の使用を例解する例示のPEgRNAデザインと、それらの編集標的座位とは、次のとおりである:

Figure 2020191243000241

Figure 2020191243000242
Exemplary PEgRNA designs and their editing target loci illustrating the use of the methods described herein to assess off-target editing are as follows:
Figure 2020191243000241

Figure 2020191243000242

K.誘導可能な二量体化ドメインの挿入のためのプライム編集の使用
本明細書に記載のプライム編集因子は、二量体化ドメインを1つ以上のタンパク質標的に組み入れるためにもまた用いられ得る。二量体化ドメインは、二重特異的な様式で結合する連結部分(例えば、低分子、ペプチド、またはタンパク質)を介する1つ以上のタンパク質標的の二量体化に関連する活性の誘導可能な制御を容易化し得る。種々の側面では、二量体化ドメインは、異なるタンパク質(例えば、同じ型または異なるタンパク質)上に組み入れされるときに、夫々が同じ二重特異性部分(例えば、別個に二量体化ドメインに結合する少なくとも(a least)2つの領域を有する二重特異性低分子、ペプチド、またはポリペプチド)に結合し、それによって、二重特異性リガンドに対するそれらの共通の相互作用によってタンパク質の二量体化を引き起こす。この様式で、二重特異性リガンドは2つのタンパク質の二量体化の「誘導因子」として機能する。いくつかのケースでは、二重特異性リガンドまたは化合物は、同じである2つの標的化部分を有するであろう。他の態様において、二重特異性リガンドまたは化合物は夫々が他とは異なる標的化部分を有するであろう。同じ2つの標的化部分を有する二重特異性リガンドまたは化合物は、異なるタンパク質標的上に組み入れされた同じ二量体化ドメインを標的化する能力があるであろう。異なる標的化部分を有する二重特異性リガンドまたは化合物は、異なるタンパク質標的上に組み入れされた異なる二量体化ドメインを標的化する能力があるであろう。
K. Use of Prime Editing to Insert Inducible Dimerization Domains
The prime editors described herein can also be used to incorporate a dimerization domain into one or more protein targets. The dimerization domain can facilitate inducible control of the activity associated with dimerization of one or more protein targets through a linking moiety (e.g., a small molecule, peptide, or protein) that binds in a bispecific manner. In various aspects, when the dimerization domains are incorporated on different proteins (e.g., the same type or different proteins), each binds to the same bispecific moiety (e.g., a bispecific small molecule, peptide, or polypeptide having at least two regions that bind separately to the dimerization domain), thereby causing the proteins to dimerize due to their common interaction with the bispecific ligand. In this manner, the bispecific ligand functions as an "inducer" of dimerization of the two proteins. In some cases, the bispecific ligand or compound will have two targeting moieties that are the same. In other embodiments, the bispecific ligand or compound will have a targeting moiety that is different from the other, respectively. A bispecific ligand or compound with the same two targeting moieties will be capable of targeting the same dimerization domain incorporated on different protein targets. A bispecific ligand or compound with different targeting moieties will be capable of targeting different dimerization domains incorporated on different protein targets.

本願において用いられる用語「二量体化ドメイン」は、二重特異性リガンドの結合部分に結合するリガンド結合ドメインを言う。「第1の」二量体化ドメインは二重特異性リガンドの第1の結合部分に結合し、「第2の」二量体化ドメインは同じ二重特異性リガンドの第2の結合部分に結合する。第1の二量体化ドメインが第1のタンパク質に融合され(例えば、本願において論じられるとおりPEによる)、かつ第2の二量体化ドメイン(例えば、本願において論じられるとおりPEによる)が第2のタンパク質に融合されるときには、第1および第2のタンパク質は二重特異性リガンドの存在下において二量体化し、二重特異性リガンドは、第1の二量体化ドメインに結合する少なくとも1つの部分と第2の二量体化ドメインに結合する少なくとも別の部分とを有する。 The term "dimerization domain" as used herein refers to a ligand binding domain that binds to a binding portion of a dual-specific ligand. A "first" dimerization domain binds to a first binding portion of a dual-specific ligand, and a "second" dimerization domain binds to a second binding portion of the same dual-specific ligand. When a first dimerization domain is fused to a first protein (e.g., by PE as discussed herein) and a second dimerization domain is fused to a second protein (e.g., by PE as discussed herein), the first and second proteins dimerize in the presence of the dual-specific ligand, and the dual-specific ligand has at least one portion that binds to the first dimerization domain and at least another portion that binds to the second dimerization domain.

本願において用いられる用語「二重特異性リガンド」または「二重特異性部分」は、2つの異なるリガンド結合ドメインに結合するリガンドを言う。種々の態様においては、二重特異性部分はそれ自体が2つの同じまたは2つの異なる化学的部分の二量体であり、各部分は二量体化ドメインに特異的にかつきつく結合する。ある態様において、リガンドは低分子化合物またはペプチドまたはポリペプチドである。他の態様において、リガンド結合ドメインはペプチドタグとしてタンパク質上に組み入れられ得る「二量体化ドメイン」である。種々の態様においては、同じかまたは異なる二量体化ドメインを夫々が含む2つのタンパク質が、二重特異性リガンドに対する各二量体化ドメインの結合によって二量体化するように誘導され得る。それらの分子は「二量体化の化学的誘導因子」またはCIDともまた言われ得る。加えて、二重特異性リガンドは、(例えば、標準化された化学的連結部によって)2つの同じ部分を一緒にまたは2つの異なる部分を一緒にカップリングすることによって調製され得、各部分は二量体化ドメインにきつくかつ特異的に結合する。 The term "dual-specific ligand" or "dual-specific moiety" as used herein refers to a ligand that binds to two different ligand-binding domains. In various embodiments, the bispecific moiety is itself a dimer of two identical or two different chemical moieties, each of which binds tightly and specifically to a dimerization domain. In some embodiments, the ligand is a small molecule compound or a peptide or polypeptide. In other embodiments, the ligand-binding domain is a "dimerization domain" that can be incorporated onto a protein as a peptide tag. In various embodiments, two proteins, each of which contains the same or different dimerization domains, can be induced to dimerize by binding of each dimerization domain to a dual-specific ligand. These molecules can also be referred to as "chemical inducers of dimerization" or CIDs. In addition, dual-specific ligands can be prepared by coupling together (e.g., by standardized chemical linkages) two identical moieties or two different moieties, each of which binds tightly and specifically to a dimerization domain.

種々の側面では、PEによって組み入れされる二量体化ドメイン同士は同じかまたは異なり得る。 In various aspects, the dimerization domains incorporated by the PE can be the same or different.

例えば、二量体化ドメインはFKBP12であり得る。これは次のアミノ酸配列を有する:

Figure 2020191243000243
For example, the dimerization domain can be FKBP12, which has the following amino acid sequence:
Figure 2020191243000243

別の例では、二量体化ドメインは、FKBP12-F36Vと言われるFKBP12の変異体、合成バンプFK506ミミックに結合する操作された穴を有するFKBP12の変異体であり得る(2、図3)107:

Figure 2020191243000244
In another example, the dimerization domain can be a mutant of FKBP12, termed FKBP12-F36V, a mutant of FKBP12 with an engineered hole that binds to the synthetic bump FK506 mimic (2, Figure 3) 107 :
Figure 2020191243000244

別の例では、二量体化ドメインは次のとおりシクロフィリンであり得る:

Figure 2020191243000245
In another example, the dimerization domain can be a cyclophilin, as follows:
Figure 2020191243000245

種々の態様において、これらの二量体化ドメインのアミノ酸配列は、ネイティブな標的に対する結合を最適化するかまたは結合直交性を改善するために変改され得る。低分子結合タンパク質をコードする遺伝子の核酸配列は、例えばPEgRNA二次構造を縮減することによってPEプロセスの効率を最適化するために変改され得る。 In various embodiments, the amino acid sequences of these dimerization domains can be altered to optimize binding to the native target or improve binding orthogonality. The nucleic acid sequences of genes encoding small molecule binding proteins can be altered to optimize the efficiency of the PE process, for example, by reducing PEgRNA secondary structure.

好適な二量体化ドメインおよびそれに結合する対応する低分子化合物の他の例は次のとおり提供される。2つの二量体化ドメインに結合し得る二重特異性リガンドを形成するためには、対応する低分子化合物は第2の低分子化合物(同じ化合物または異なる化合物どちらか)に(例えば、化学的リンカーによって)カップリングされ得るということに注意せよ。FK506およびシクロスポリンAなどのいくつかのケースでは、夫々の二量体化(例えば、FK506-FK506またはシクロスポリンA-シクロスポリンA)はモノマー化合物の免疫抑制活性を縮減または消去する。

Figure 2020191243000246

Figure 2020191243000247

Figure 2020191243000248

Figure 2020191243000249
Other examples of suitable dimerization domains and corresponding small molecule compounds that bind thereto are provided below. Note that the corresponding small molecule compound can be coupled (e.g., by a chemical linker) to a second small molecule compound (either the same compound or a different compound) to form a dual-specific ligand that can bind to two dimerization domains. In some cases, such as FK506 and cyclosporin A, the respective dimerization (e.g., FK506-FK506 or cyclosporin A-cyclosporin A) reduces or eliminates the immunosuppressive activity of the monomeric compound.
Figure 2020191243000246

Figure 2020191243000247

Figure 2020191243000248

Figure 2020191243000249

天然に存在する二機能性分子およびそれらの二元的な標的受容体の他の例は次のとおりである。プライム編集は、二元的な標的受容体を異なるタンパク質に組み入れるために用いられ得る。ひとたび異なるタンパク質が二機能性分子受容体を含有するようにPEによって改変されると、二機能性分子は導入され得、それによって、異なる二量体化ドメインを含むように改変されたタンパク質の二量体化を引き起こす。(1)二機能性(biofunctional)分子および(2)それらの二元的な標的受容体のペアリングの例は次のとおりである:

Figure 2020191243000250

Figure 2020191243000251

Figure 2020191243000252

Figure 2020191243000253
Other examples of naturally occurring bifunctional molecules and their dual target receptors are as follows: Prime editing can be used to incorporate a dual target receptor into a different protein. Once a different protein has been modified by PE to contain a bifunctional molecule receptor, the bifunctional molecule can be introduced, thereby causing dimerization of the proteins modified to contain different dimerization domains. Examples of pairing of (1) biofunctional molecules and (2) their dual target receptors are as follows:
Figure 2020191243000250

Figure 2020191243000251

Figure 2020191243000252

Figure 2020191243000253

プライム編集のこの側面で使用され得る他の二機能性分子の例は以下のとおりである: Examples of other bifunctional molecules that can be used in this aspect of prime editing are:

Synstab A: Synstab A:

Figure 2020191243000254
Figure 2020191243000254

パクリタキセル:

Figure 2020191243000255
Paclitaxel:
Figure 2020191243000255

ディスコデルモリド:

Figure 2020191243000256
Discodermolide:
Figure 2020191243000256

GNE-0011

Figure 2020191243000257
GNE-0011
Figure 2020191243000257

ARV-825、および

Figure 2020191243000258
ARV-825, and
Figure 2020191243000258

dBET1

Figure 2020191243000259

。 dBET1
Figure 2020191243000259

.

Synstab A、パクリテキセル、およびディスコデルモライドは微小管安定化剤である。それゆえに、これらの化合物は、微小管タンパク質を含むようにPEによって改変されたタンパク質同士を二量体化するために用いられ得る。GNE-0011、ARV-825、およびdBET1はBRD4結合モチーフおよびCRBN結合モチーフを含む。それゆえに、これらの化合物は、これらの標的化ドメインを含むようにPEによって改変されたタンパク質同士を二量体化するために用いられ得る。 Synstab A, paclitexel, and discodermolide are microtubule stabilizing agents. Therefore, these compounds can be used to dimerize proteins that have been modified with PE to contain microtubule proteins. GNE-0011, ARV-825, and dBET1 contain BRD4- and CRBN-binding motifs. Therefore, these compounds can be used to dimerize proteins that have been modified with PE to contain these targeting domains.

二量体化ドメインを組み入れるためのPEgRNAは次の構造を含み得る(図3Dの参照による):
5'-[スペーサー]-[gRNAコア]-[伸長アーム]-3'であって、伸長アームは5'-[相同アーム]-[編集鋳型]-[プライマー結合部位]-3'を含む;または
5'-[伸長アーム]-[スペーサー]-[gRNAコア]-3'であって、伸長アームは5'-[相同アーム]-[編集鋳型]-[プライマー結合部位]-3'を含み、どちらの構成でも「編集鋳型」は二量体化ドメインのヌクレオチド配列を含む。
A PEgRNA for incorporating a dimerization domain may comprise the following structure (with reference to FIG. 3D):
5'-[spacer]-[gRNA core]-[extension arm]-3', wherein the extension arm comprises 5'-[homology arm]-[editing template]-[primer binding site]-3'; or
The structure is 5'-[extension arm]-[spacer]-[gRNA core]-3', where the extension arm comprises 5'-[homology arm]-[editing template]-[primer binding site]-3', and in both configurations the "editing template" comprises the nucleotide sequence of the dimerization domain.

1つの例では、ヒトインスリン受容体のC末端の端におけるFKBP12二量体化ドメインの挿入のためのPEgRNA(スペーサーは下線付き、gRNAコアはプレーン、フラップ相同性は太字、FKBP12挿入はイタリック、アニーリング領域は太字イタリック):

Figure 2020191243000260

Figure 2020191243000261
In one example, a PEgRNA for insertion of the FKBP12 dimerization domain at the C-terminal end of the human insulin receptor (spacer underlined, gRNA core plain, flap homology bold, FKBP12 insertion italic, annealing region bold italic):
Figure 2020191243000260

Figure 2020191243000261

別の例では、(最適化のための)HEK3座位におけるFKBP12二量体化ドメインの挿入のためのPEgRNA:

Figure 2020191243000262
In another example, PEgRNA for insertion of the FKBP12 dimerization domain in the HEK3 locus (for optimization):
Figure 2020191243000262

二量体化ドメインを組み入れるための標的タンパク質は特に限定されない;しかしながら、二重特異性リガンドの存在下におけるそれらの二量体化は(ひとたびPEによって改変されると)、何らかの有利な生物学的効果、例えばシグナル経路、減少した免疫応答性などを生ずるということが有利である。種々の側面では、二量体化ドメインのPE依存的組み入れによって二量体化させられるべきである標的タンパク質同士は、同じタンパク質または異なるタンパク質であり得る。好ましくは、タンパク質は、二量体化したときには、1つ以上の下流の生物学的カスケード、例えばシグナル伝達カスケード、リン酸化などを誘発する。PEが二量体化ドメインを組み入れるために用いられ得る例示の標的タンパク質は:

Figure 2020191243000263

Figure 2020191243000264

を包含するが、これらに限定されない。 The target proteins for incorporating the dimerization domain are not particularly limited; however, it is advantageous that their dimerization in the presence of a dual-specific ligand (once modified by PE) results in some beneficial biological effect, such as signal pathways, reduced immune responsiveness, etc. In various aspects, the target proteins to be dimerized by the PE-dependent incorporation of the dimerization domain can be the same protein or different proteins. Preferably, the proteins, when dimerized, trigger one or more downstream biological cascades, such as signaling cascades, phosphorylation, etc. Exemplary target proteins for which PE can be used to incorporate the dimerization domain are:
Figure 2020191243000263

Figure 2020191243000264

These include, but are not limited to:

一側面において、本明細書に記載のプライム編集因子は、生細胞または患者の目当ての標的タンパク質をコードする1つ以上の遺伝子上に、二量体化ドメインをコードする配列を組み入れるために用いられ得る。これは「プライム編集-CIDシステム」と言われ得、CIDは二重特異性リガンドであり、これは、PEによって組み入れされる二量体化ドメインに夫々が融合された標的タンパク質の二量体化を誘導した。この編集は単独では生理学的効果を有さないはずである。典型的には夫々が標的タンパク質のコピーに融合されている2つの二量体化ドメインに同時に結合し得る二量体低分子である二重特異性リガンドの投与によって、二重特異性リガンドは標的タンパク質の二量体化を引き起こす。それから、この標的タンパク質二量体化イベントは、生物学的シグナルイベント、例えば赤血球形成またはインスリンシグナルを誘導する。プライム編集による低分子結合タンパク質(すなわち、二量体化ドメイン)をコードする遺伝子のゲノム取り入れによって、二量体化によって誘導される生物学的プロセス、例えば受容体シグナルを便利な低分子薬物(すなわち、二重特異性リガンド)のコントロール下に置くための新たな方法が、本明細書に記載の。 In one aspect, the prime editing factors described herein can be used to incorporate sequences encoding dimerization domains onto one or more genes encoding target proteins of interest in living cells or patients. This can be referred to as a "prime editing-CID system," where the CID is a bispecific ligand that induces dimerization of target proteins, each fused to a dimerization domain incorporated by PE. This editing alone should have no physiological effect. Upon administration of the bispecific ligand, typically a dimeric small molecule that can simultaneously bind to two dimerization domains, each fused to a copy of the target protein, the bispecific ligand causes dimerization of the target protein. This target protein dimerization event then induces a biological signaling event, such as erythropoiesis or insulin signaling. Described herein is a new method for placing dimerization-induced biological processes, such as receptor signaling, under the control of convenient small molecule drugs (i.e., bispecific ligands) by genomic incorporation of genes encoding small molecule binding proteins (i.e., dimerization domains) via prime editing.

タンパク質二量体化はユビキタスな生物学的プロセスである。注意すべきことに、多くの膜結合受容体のホモ二量体化はシグナルカスケードを開始することが知られており、多くの場合に深大な生物学的帰結を有する。薬物としての使用を認可されたいくつもの天然低分子産物は、それらの作用機序の一部としてタンパク質二量体化の化学的誘導因子として作用する92。例えば、FK506はFKBP12にきつく結合し、もたらされる低分子-タンパク質複合体はそれからホスファターゼカルシニューリンに結合し、それによってT細胞受容体シグナルのあるステップを阻害する93。同様に、シクロスポリンAはシクロフィリンおよびカルシニューリンの二量体化を誘導し、ラパマイシンはFKBPおよびmTORの二量体化を誘導する93,94 Protein dimerization is a ubiquitous biological process. Of note, homodimerization of many membrane-bound receptors is known to initiate signaling cascades, often with profound biological consequences. Several natural small molecule products approved for use as drugs act as chemical inducers of protein dimerization as part of their mechanism of action92. For example, FK506 tightly binds FKBP12, and the resulting small molecule-protein complex then binds to the phosphatase calcineurin , thereby inhibiting certain steps of T cell receptor signaling93 . Similarly, cyclosporin A induces dimerization of cyclophilin and calcineurin, and rapamycin induces dimerization of FKBP and mTOR93,94 .

1つの態様では、FK506:FKBP12およびシクロスポリンA:シクロフィリン低分子:タンパク質結合相互作用の選択的な高親和性の結合を活用して、二量体化の合成の化学的誘導因子もまた開発されている。ある例では、シグナル受容体の細胞質ドメインがFKBP12によってタグ付けされたときに、FK1012と呼称されるFK506の2つの単位からなる低分子がシグナル伝達を成し遂げることが示された95。以来、二量体化の化学的誘導因子(CID)がいくつものシグナル経路をコントロールするために用いられている96~103 In one embodiment, synthetic chemical inducers of dimerization have also been developed, taking advantage of the selective high affinity binding of FK506:FKBP12 and cyclosporin A:cyclophilin small molecule:protein binding interactions. In one example, a two-unit small molecule of FK506, designated FK1012, was shown to achieve signal transduction when the cytoplasmic domain of a signaling receptor was tagged with FKBP12.95 Since then, chemical inducers of dimerization (CIDs) have been used to control several signaling pathways.96-103

生物学的プロセスを研究するための有用なツールではあるが、治療学的適用について合成CIDに当面する1つの課題は、患者へのFKBP12またはシクロフィリン-標的タンパク質キメラの導入が難しいということである。 Although a useful tool for studying biological processes, one challenge facing synthetic CID for therapeutic applications is the difficulty of introducing FKBP12 or cyclophilin-targeted protein chimeras into patients.

本開示は2つの概念を一緒に持って来て、先にはアクセス不可能な治療学的プロセスを生出する。第1の概念は、本明細書に記載のプライム編集であり、これは生細胞における標的化された挿入を包含する精密なゲノム編集を許す。第2の概念は化学物質によって誘導される二量体化であり、細胞培養物におけるシグナルおよびオリゴマー化プロセスの低分子コントロールを可能化した強力なツールである。 This disclosure brings together two concepts to generate previously inaccessible therapeutic processes. The first concept is prime editing, described herein, which allows precise genome editing, including targeted insertions, in living cells. The second concept is chemically induced dimerization, a powerful tool that has enabled small molecule control of signaling and oligomerization processes in cell culture.

タンパク質二量体化の化学的コントロールが有益な治療学的効果を有し得た特定のケースが同定されている。 Specific cases have been identified in which chemical control of protein dimerization could have beneficial therapeutic effects.

インスリン受容体は、細胞質キナーゼドメインのリン酸化によって細胞外ドメインへのインスリン結合に応答するヘテロ四量体膜貫通タンパク質である104。膜局在構成要素、インスリン受容体のC末端キナーゼドメイン、および3コピーのFKBP12から成る操作されたキメラタンパク質は、細胞培養物においてFK1012に応答し、インスリン応答を開始する99。類似に、患者細胞のネイティブなインスリン受容体のキナーゼドメインのC末端の端へのFKBP12の融合は、FK1012依存的なリン酸化とインスリンシグナルカスケードの開始とを許すはずであるということが予想される。このシステムは、インスリンを作り得ない(例えば1型糖尿病)または弱くインスリンに応答する(例えば2型糖尿病)患者において、インスリン使用を置き換えるかまたは補完し得る。 The insulin receptor is a heterotetrameric transmembrane protein that responds to insulin binding to the extracellular domain by phosphorylation of the cytoplasmic kinase domain104 . An engineered chimeric protein consisting of a membrane-localized component, the C-terminal kinase domain of the insulin receptor, and three copies of FKBP12, responds to FK1012 in cell culture and initiates an insulin response99. Similarly, it is predicted that fusion of FKBP12 to the C-terminal end of the kinase domain of the native insulin receptor in patient cells should allow FK1012-dependent phosphorylation and initiation of the insulin signaling cascade. This system could replace or complement insulin use in patients who cannot make insulin (e.g., type 1 diabetes) or who respond poorly to insulin (e.g., type 2 diabetes).

加えて、エリスロポエチンは、エリスロポエチン受容体(EpoR)に結合することによって赤血球増殖を刺激し、二量体化または予め形成された受容体二量体の立体配座変化どちらかを誘導し、これはJak/STATシグナルカスケードの活性化をもたらす105。FKBP12によってタグ付けされたEpoRの膜にアンカー固定される細胞質ドメインのFK1012によって誘導されるオリゴマー化は、Jak/STATシグナルカスケードシグナルを開始および細胞増殖を促進するために十分であるということが実証されている106。患者細胞においてプライム編集によってFKBP12をネイティブなEpoRに融合することは、赤血球増殖(赤血球形成)のFK1012によって誘導されるコントロールを許すであろうということが予期される。このシステムは貧血患者において赤血球成長を誘発するために用いられ得る。FK1012誘導性のEpoRは、エクスビボ操作を経過した血液細胞のインビボの選択マーカーとしてもまた使用され得る。 In addition, erythropoietin stimulates erythrocyte proliferation by binding to the erythropoietin receptor (EpoR) and induces either dimerization or conformational changes in preformed receptor dimers, which result in activation of the Jak/STAT signaling cascade105 . It has been demonstrated that FK1012-induced oligomerization of the membrane-anchored cytoplasmic domain of FKBP12-tagged EpoR is sufficient to initiate Jak/STAT signaling cascade signals and promote cell proliferation106. It is expected that fusing FKBP12 to native EpoR by prime editing in patient cells will allow FK1012 -induced control of erythrocyte proliferation (erythropoiesis). This system can be used to induce erythrocyte growth in anemic patients. FK1012-inducible EpoR can also be used as an in vivo selection marker for blood cells that have undergone ex vivo manipulation.

原理的には、いずれかの受容体チロシンキナーゼはプライム編集-CID治療学の見込みある標的である。下の表は、ヒトゲノム上の全ての受容体チロシンキナーゼのリストを包含する110

Figure 2020191243000265
In principle, any receptor tyrosine kinase is a potential target for prime editing-CID therapeutics. The table below contains a list of all receptor tyrosine kinases in the human genome.
Figure 2020191243000265

プライム編集-CIDシステムには数々の利点がある。1つのかかる利点は、それが、典型的には製造、コスト、送達、生産、または貯蔵において複雑化を呈するタンパク質である内生リガンドを薬物様低分子によって置き換え得るということである。これらはIVまたは注射によって投与される代わりに経口投与され得、FDA認可された薬物から難なく調製され(またはそれら自体がすでに薬物である)、タンパク質薬物に典型的に関連する特殊な生産または貯蔵コストを招かない。別の利点は、編集が単独では生理学的効果を有さないはずであるということである。標的タンパク質二量体化の量は低分子CIDを投薬することによってコントロールされ得る。さらに、標的タンパク質二量体化は、CIDのモノマー形態を追加することによって難なくかつ急速に可逆的である。さらに別の利点は、単一のリガンドが複数の受容体を標的化する場合に、1つの受容体のみをプライム編集することによって選択性が達成され得るということである。最後に、プライム編集に用いられる送達方法に依存して、局在した組織または臓器に編集を制限することもまた可能であり得、特定のエリアのみにおいて誘導可能な受容体活性化を許す。 The prime editing-CID system has a number of advantages. One such advantage is that it can replace endogenous ligands, which are typically proteins that present complexities in manufacturing, cost, delivery, production, or storage, with drug-like small molecules. They can be administered orally instead of by IV or injection, can be readily prepared from FDA-approved drugs (or are already drugs themselves), and do not incur specialized production or storage costs typically associated with protein drugs. Another advantage is that the editing should have no physiological effect alone. The amount of target protein dimerization can be controlled by dosing the small molecule CID. Furthermore, target protein dimerization is readily and rapidly reversible by adding a monomeric form of the CID. Yet another advantage is that in cases where a single ligand targets multiple receptors, selectivity can be achieved by prime editing only one receptor. Finally, depending on the delivery method used for prime editing, it may also be possible to restrict editing to a localized tissue or organ, allowing inducible receptor activation only in specific areas.

プライム編集による編集効率が十分高く、2つの別個の編集イベントが高いレベルで生起し得る場合には、目当ての2つのタンパク質を異なる低分子結合ドメイン(例えばFKBPおよびシクロフィリン)によってタグ付けし、低分子ヘテロ二量体(例えばFK506-シクロスポリンA二量体)によるヘテロ二量体化を誘導することもまた可能であろう。 If the editing efficiency of prime editing is high enough that two separate editing events can occur at high levels, it may also be possible to tag the two proteins of interest with different small molecule binding domains (e.g., FKBP and cyclophilin) and induce heterodimerization with a small molecule heterodimer (e.g., FK506-cyclosporine A dimer).

ネイティブなタンパク質へのFKBP12または他の低分子結合タンパク質の融合体は、一般的には、組織培養によるプラスミドからの過剰発現によって達成されている。爾後の化学物質によって誘導される二量体化は、融合タンパク質を生ずる細胞に表現型変化を誘導することが実証されている。 Fusion of FKBP12 or other small molecule binding proteins to native proteins is typically achieved by overexpression from plasmids in tissue culture. Subsequent chemically induced dimerization has been demonstrated to induce phenotypic changes in cells bearing the fusion protein.

以下の参考文献がセクションGにおいて上で引用され、参照により本明細書に組み込まれる。

Figure 2020191243000266

Figure 2020191243000267
The following references are cited above in Section G and are incorporated herein by reference:
Figure 2020191243000266

Figure 2020191243000267

L.細胞データ記録のためのプライム編集の使用
プライム編集因子およびもたらされるゲノム改変は、細胞性のプロセスおよび発生を研究および記録するためにもまた用いられ得る。例えば、核酸プログラム型DNA結合タンパク質(napDNAbp)および逆転写酵素を有する融合タンパク質をコードする第1の核酸配列を細胞に提供することと、PEgRNAをコードする少なくとも第2の核酸配列を細胞に提供することとによって、本明細書に記載のプライム編集因子は、細胞への刺激の存在および持続時間を記録するために用いられ得る。第1の、第2の、または両方の核酸配列どちらかは、細胞刺激に応答性である誘導性プロモーターに作動可能に連結され、その結果、それは融合タンパク質および/またはPEgRNAの発現を誘導し、それによって細胞内の標的配列の改変を引き起こす。
L. Using Prime Editing to Record Cellular Data
Prime editing factors and the resulting genome modifications can also be used to study and record cellular processes and development. For example, by providing a cell with a first nucleic acid sequence encoding a fusion protein having a nucleic acid programmable DNA binding protein (napDNAbp) and reverse transcriptase, and providing a cell with at least a second nucleic acid sequence encoding a PEgRNA, the prime editing factors described herein can be used to record the presence and duration of a stimulus to a cell. Either the first, second, or both nucleic acid sequences are operably linked to an inducible promoter that is responsive to a cellular stimulus, so that it induces the expression of the fusion protein and/or the PEgRNA, thereby causing modification of a target sequence in the cell.

本明細書に記載のプライム編集因子は細胞バーコード化および系統トレースにもまた用いられ得る。例えば、固有のゲノムバーコードによって各細胞をバーコード化することによって、プライム編集因子は、1つ以上の標的配列になされる改変に基づく系統樹の構築を許すことによって、細胞系統マップを明らかにすることを助け得る。前駆細胞から出発して、プライム編集因子システムは、丸ごとの生物中の単一細胞について細胞運命マップを築くことを可能化し得る。これは、1つ以上の標的配列になされた改変を分析することによって読み解かれ得る。細胞の系統(linage)をトレースするための方法は、napDNAbpおよび逆転写酵素による融合タンパク質をコードする核酸を提供することと、PEgRNAをコードする少なくとも1つの第2の核酸を提供することとを包含し得る。1つ以上の標的配列に1つ以上の改変を生出するために融合タンパク質およびPEgRNAを用いて固有の細胞バーコードが生成され得、それによって、最初の細胞から発生するいずれかの細胞の系統(linage)が固有の細胞バーコードを用いてトレースされることを許す。細胞データ記録および系統(linage)トレース両方のためのプライム編集因子の使用は例13においてさらに記載される。 The prime editors described herein can also be used for cell barcoding and lineage tracing. For example, by barcoding each cell with a unique genomic barcode, the prime editors can help define a cell lineage map by allowing the construction of a lineage tree based on modifications made to one or more target sequences. Starting from progenitor cells, the prime editor system can make it possible to build a cell fate map for a single cell in a whole organism. This can be deciphered by analyzing modifications made to one or more target sequences. A method for tracing the lineage of a cell can include providing a nucleic acid encoding a fusion protein with napDNAbp and reverse transcriptase, and providing at least one second nucleic acid encoding a PEgRNA. A unique cell barcode can be generated using the fusion protein and the PEgRNA to generate one or more modifications to one or more target sequences, thereby allowing the lineage of any cell that develops from the initial cell to be traced using the unique cell barcode. The use of the prime editors for both cell data recording and lineage tracing is further described in Example 13.

プライム編集因子は、ゲノム標的配列または取り入れされた予めデザインされた配列を改変することによって、系統トレースおよび細胞シグナル記録両方を行い得る。プライム編集因子は、Cas9ニッカーゼフラグメント(SpCas9 H840Aバリアントを包含するが、これに限定されない)および逆転写酵素ドメインを含む合成融合タンパク質を、操作されたプライム編集ガイドRNA(PEgRNA)と併せて用いる。一緒になって、これらの構成要素は特異的なゲノム配列または取り入れされた予めデザインされた配列を標的化し、予め決定された編集を組み入れる。PEgRNAは標的ゲノム配列および編集アウトカム両方を規定するので、高度に特異的なかつコントロールされたゲノム改変が複数のPEgRNAを用いて同じ細胞内において同時に達成され得る。アクセス可能なゲノム改変は、全ての1ヌクレオチド置換、小から中程度のサイズの配列挿入、および小から中程度のサイズの欠失を包含する。このゲノム編集テクノロジーの汎用性は細胞内における時間的にカップリングされたシグナル特異的な記録を可能化し得る。 Prime editors can perform both lineage tracing and cell signal recording by modifying genomic target sequences or incorporated pre-designed sequences. Prime editors use synthetic fusion proteins containing a Cas9 nickase fragment (including but not limited to the SpCas9 H840A variant) and a reverse transcriptase domain in conjunction with an engineered prime editing guide RNA (PEgRNA). Together, these components target specific genomic sequences or incorporated pre-designed sequences and incorporate predetermined edits. Because the PEgRNA specifies both the target genomic sequence and the editing outcome, highly specific and controlled genome modifications can be achieved simultaneously in the same cell using multiple PEgRNAs. Accessible genome modifications include all single nucleotide substitutions, small to medium sized sequence insertions, and small to medium sized deletions. The versatility of this genome editing technology can enable temporally coupled signal-specific recording in cells.

細胞データ記録のためのプライム編集因子の使用は、細胞の一生の過程に渡って内生または外因的な刺激の強さおよび/または持続時間を記録するための、組成物(例えば核酸)、細胞、システム、キット、および方法を包含し得る。細胞データ記録システムは、細胞の刺激または変化に応答して、標的化されかつ配列が規定されたゲノム挿入、欠失、または変異を生出することによって変化を誘導するための融合タンパク質の発現を誘導するプロモーターに作動可能に連結された、napDNAbp(例えば、Cas9ドメイン)および逆転写酵素からなる融合タンパク質を包含し得る。情報(例えば、刺激の存在または不在)を2つの別物の状態の1つ(すなわち、「オン」または「オフ」)として貯蔵するデジタルメモリーデバイスとは対照的に、これらの細胞データレコーダは、1つ以上の刺激の強さ(すなわち振幅)および持続時間両方を反映する様式で細胞DNA上に永久的なマークを誘導し得る。それゆえに、いくつかの側面では、細胞データ記録システムは、複数の細胞状態を同時に記録する能力を有する。例えば、低分子、タンパク質、ペプチド、アミノ酸、代謝物質、無機分子、有機金属分子、有機分子、薬物もしくは薬物候補、糖、脂質、金属、核酸、内生もしくは外因的なシグナルカスケードの活性化の間に生ずる分子、光、熱、音、圧力、機械的ストレス、剪断ストレス、またはウイルスもしくは他の微生物に対する暴露を包含する。これらの細胞データレコーダは読み出し(例えば、細胞DNAの変化)を測定するためには配列決定テクノロジー(例えば、高スループット配列決定)を使用し得、刺激の記録または刺激によって誘導される細胞DNAの変化(単数または複数)の読み出し両方について、大きい細胞集団に依存しない。 The use of prime editing factors for cellular data recording may include compositions (e.g., nucleic acids), cells, systems, kits, and methods for recording the strength and/or duration of endogenous or exogenous stimuli over the course of a cell's lifespan. The cellular data recording system may include a fusion protein consisting of napDNAbp (e.g., Cas9 domain) and reverse transcriptase operably linked to a promoter that induces expression of the fusion protein to induce changes by generating targeted and sequence-defined genomic insertions, deletions, or mutations in response to a cellular stimulus or change. In contrast to digital memory devices that store information (e.g., the presence or absence of a stimulus) as one of two distinct states (i.e., "on" or "off"), these cellular data recorders may induce permanent marks on cellular DNA in a manner that reflects both the strength (i.e., amplitude) and duration of one or more stimuli. Thus, in some aspects, the cellular data recording system has the ability to record multiple cellular states simultaneously. Examples include small molecules, proteins, peptides, amino acids, metabolites, inorganic molecules, organometallic molecules, organic molecules, drugs or drug candidates, sugars, lipids, metals, nucleic acids, molecules that arise during activation of endogenous or exogenous signal cascades, light, heat, sound, pressure, mechanical stress, shear stress, or exposure to viruses or other microorganisms. These cellular data recorders can use sequencing technologies (e.g., high-throughput sequencing) to measure readouts (e.g., changes in cellular DNA) and do not rely on large cell populations for both recording the stimulus or readout of the change(s) in cellular DNA induced by the stimulus.

一般的に、細胞への使用のための本願において提供される細胞データレコーダシステムは、napDNAbpおよび逆転写酵素からなる融合タンパク質を含み、融合体プラスミドをコードする核酸配列はプロモーター(例えば、誘導性プロモーターまたは恒常的プロモーター)に作動可能に連結されている。刺激が存在するかまたは細胞状態の変化が生起するときには、刺激は融合タンパク質の発現を誘導する。napDNAbpと会合し、napDNAbpまたは融合タンパク質を標的配列へと導く少なくとも1つのPEgRNAをコードする1つ以上の核酸もまた細胞内に存在する(すなわち、PEgRNAは標的配列に対して相補的である)。PEgRNAをコードする核酸もまた、または代替的に、プロモーター(例えば、誘導性プロモーターまたは恒常的プロモーター)に作動可能に連結され得る。正しい刺激または正しいセットの刺激下においては、融合タンパク質およびPEgRNA両方が細胞によって発現され、PEgRNAは融合タンパク質と会合してそれを標的配列へと導く。この標的配列はプライム編集因子の活性を記録し、それによって、刺激もしくは刺激のセットの存在または細胞状態の変化を記録する。1つよりも多くのPEgRNA配列もまた細胞内に存在し得、融合タンパク質を別物の標的配列へと導き得るこれらの追加のPEgRNA配列は夫々が、異なる刺激の存在を感知するプロモーターに作動可能に連結され得、刺激またはセットの刺激の存在および持続時間の順序付けられた記録のための複雑な細胞データレコーダシステムが構築されることを許す。いくつかのケースでは、細胞データレコーダシステムの構成要素(例えば、融合タンパク質およびPEgRNA)の1つ以上は、細胞によって恒常的に発現され得る。組成物への使用のための細胞データレコーダシステムの例示の構成要素が本明細書に記載の。本願において提供される構成要素の追加の好適な組み合わせは、本開示および当該技術分野の知識に基づいて当業者には明らかであろう。それゆえに本開示の範囲に包摂される。 In general, the cell data recorder system provided herein for use in a cell includes a fusion protein consisting of napDNAbp and reverse transcriptase, with the nucleic acid sequence encoding the fusion plasmid operably linked to a promoter (e.g., an inducible promoter or a constitutive promoter). When a stimulus is present or a change in the cell state occurs, the stimulus induces expression of the fusion protein. One or more nucleic acids encoding at least one PEgRNA that associates with the napDNAbp and directs the napDNAbp or the fusion protein to a target sequence are also present in the cell (i.e., the PEgRNA is complementary to the target sequence). The nucleic acid encoding the PEgRNA may also, or alternatively, be operably linked to a promoter (e.g., an inducible promoter or a constitutive promoter). Under the correct stimulus or the correct set of stimuli, both the fusion protein and the PEgRNA are expressed by the cell, and the PEgRNA associates with and directs the fusion protein to the target sequence. This target sequence records the activity of the prime editor, thereby recording the presence of a stimulus or set of stimuli or a change in the cell state. More than one PEgRNA sequence may also be present in a cell, and these additional PEgRNA sequences that may direct the fusion protein to a different target sequence may each be operably linked to a promoter that senses the presence of a different stimulus, allowing complex cellular data recorder systems to be constructed for ordered recording of the presence and duration of a stimulus or set of stimuli. In some cases, one or more of the components of the cellular data recorder system (e.g., the fusion protein and the PEgRNA) may be constitutively expressed by the cell. Exemplary components of the cellular data recorder system for use in the compositions are described herein. Additional suitable combinations of the components provided herein will be apparent to one of skill in the art based on this disclosure and knowledge of the art. Thus, are encompassed within the scope of this disclosure.

標的アンプリコン配列決定および/またはRNA配列決定(これは単一細胞記録実験にとって特に価値がある)によって配列決定され得るDNA標的の繰り返しの改変が、シグナルカスケードの活性化、代謝状態、および細胞分化プログラムを包含する幾多の重要な生物学的プロセスを記録するために用いられ得る。内部のおよび外部の細胞性シグナルをゲノム上の配列改変に接続することは、シグナル応答性プロモーターが存在するいずれかのシグナルについて可能である。いくつかの態様では、プロモーターは原核生物システムへの使用にとって好適なプロモーターである(すなわち、細菌プロモーター)。いくつかの態様では、プロモーターは真核生物システムへの使用にとって好適なプロモーターである(すなわち、真核生物プロモーター)。いくつかの態様では、プロモーターは哺乳類(例えば、ヒト)システムへの使用にとって好適なプロモーターである(すなわち、哺乳類プロモーター)。いくつかの態様では、プロモーターは刺激によって誘導される(すなわち、誘導性プロモーター)。いくつかの態様では、刺激は、低分子、タンパク質、ペプチド、アミノ酸、代謝物質、無機分子、有機金属分子、有機分子、薬物もしくは薬物候補、糖、脂質、金属、核酸、内生もしくは外因的なシグナルカスケードの活性化の間に生ずる分子、光、熱、音、圧力、機械的ストレス、剪断ストレス、またはウイルスもしくは他の微生物、pHの変化、または酸化還元状態の変化である。いくつかの態様では、刺激は光である。いくつかの態様では、刺激はウイルスである。いくつかの態様では、刺激は低分子である。いくつかの態様では、刺激は抗生物質である。いくつかの態様では、刺激はアンヒドロテトラサイクリンまたはドキシサイクリンである。いくつかの態様では、刺激は糖である。いくつかの態様では、刺激はアラビノース、ラムノース、またはIPTGである。いくつかの態様では、刺激は活性化したシグナルカスケードの間に生ずるシグナル分子である(例えば、活性化したWntシグナルカスケードの間に生ずるベータカテニン)。シグナル分子を検出する追加のプロモーターが、プロモーターに作動可能に連結された核酸配列の発現を誘導するために生成され得る。例えば、免疫応答(IL-2プロモーター)、cAMP応答エレメント(CREB)、NFκBシグナル、インターフェロン応答、P53(DNA損傷)、Sox2、TGF-βシグナル(SMAD)、Erk(例えば、活性化したRas/Raf/Mek/Erkカスケードから)、PI3K/AKT(例えば、活性化したRas/PI3K/Aktカスケードから)、熱ショック、Notchシグナル、Oct4、アリール炭化水素受容体、またはAP-1転写因子を包含する内在的経路を記録するプロモーターである。いくつかの態様では、プロモーターは恒常的プロモーターである。いくつかの態様では、プロモーターは表3に列記されるプロモーターである。原核生物および真核生物システム両方への使用のための追加の好適なプロモーターは、本開示および当該技術分野の知識に基づいて当業者には明らかであろう。本開示の範囲内である。 Repeated modifications of DNA targets, which can be sequenced by targeted amplicon sequencing and/or RNA sequencing (which is particularly valuable for single-cell recording experiments), can be used to record a number of important biological processes, including activation of signal cascades, metabolic states, and cell differentiation programs. Connecting internal and external cellular signals to sequence modifications on the genome is possible for any signal for which a signal-responsive promoter exists. In some embodiments, the promoter is a promoter suitable for use in a prokaryotic system (i.e., a bacterial promoter). In some embodiments, the promoter is a promoter suitable for use in a eukaryotic system (i.e., a eukaryotic promoter). In some embodiments, the promoter is a promoter suitable for use in a mammalian (e.g., human) system (i.e., a mammalian promoter). In some embodiments, the promoter is induced by a stimulus (i.e., an inducible promoter). In some embodiments, the stimulus is a small molecule, a protein, a peptide, an amino acid, a metabolite, an inorganic molecule, an organometallic molecule, an organic molecule, a drug or drug candidate, a sugar, a lipid, a metal, a nucleic acid, a molecule occurring during the activation of an endogenous or exogenous signal cascade, light, heat, sound, pressure, mechanical stress, shear stress, or a virus or other microorganism, a change in pH, or a change in redox state. In some embodiments, the stimulus is light. In some embodiments, the stimulus is a virus. In some embodiments, the stimulus is a small molecule. In some embodiments, the stimulus is an antibiotic. In some embodiments, the stimulus is anhydrotetracycline or doxycycline. In some embodiments, the stimulus is a sugar. In some embodiments, the stimulus is arabinose, rhamnose, or IPTG. In some embodiments, the stimulus is a signal molecule occurring during an activated signal cascade (e.g., beta-catenin occurring during an activated Wnt signal cascade). Additional promoters that detect signal molecules can be generated to induce expression of a nucleic acid sequence operably linked to the promoter. For example, promoters that encode endogenous pathways including immune response (IL-2 promoter), cAMP response element (CREB), NFκB signaling, interferon response, P53 (DNA damage), Sox2, TGF-β signaling (SMAD), Erk (e.g., from an activated Ras/Raf/Mek/Erk cascade), PI3K/AKT (e.g., from an activated Ras/PI3K/Akt cascade), heat shock, Notch signaling, Oct4, aryl hydrocarbon receptor, or AP-1 transcription factor. In some embodiments, the promoter is a constitutive promoter. In some embodiments, the promoter is a promoter listed in Table 3. Additional suitable promoters for use in both prokaryotic and eukaryotic systems will be apparent to one of skill in the art based on this disclosure and knowledge in the art. It is within the scope of this disclosure.

プライム編集因子は細胞系統をトレースするためにもまた用いられ得る。個々の細胞を追跡するために、固有の細胞バーコードを生成するための繰り返しの配列改変が用いられ得る。バーコードのアレイ、それらの順序、およびサイズは全て、細胞系統を推論するために用いられ得る。例えば、相同性配列(すなわち、Cas9ニックの位置付けの3'の配列)、具体的には関連するバーコードを有する相同性配列の挿入は、特に有用な系統プライム編集因子戦略であるように見える。これらのシステムは、編集の順次のラウンドが、同じ細胞の他のPEgRNA編集イベントによっては改変され得ないPEgRNAカセットからのバーコードの挿入をもたらすようにしてデザインされ得る。バーコード化システムは複数のバーコードを利用し得、これらは所与の刺激に関連し得る。このシステムは標的プロトスペーサーの多数を保全し得るが、シード配列、PAM、および下流の隣接ヌクレオチドを変改し得る。これは、用いられようとするPEgRNAの有意な再デザインなしに、複数のシグナルが1つの編集座位に接続されることを可能化する。戦略は、多数の細胞性の刺激(内部または外部どちらかの)に応答して単一の座位において多重化されたバーコード挿入を可能化し得る。それは、固有のバーコードが存在するだけ多くのシグナルの強度、持続時間、および順序の記録を可能化し得る(これらは4^Nの可能なバーコードを生成するように複数のNヌクレオチドによってデザインされ得る。例えば、5ntバーコードは4^5または1024の固有のシグナルの一度での記録を可能化するであろう)。このシステムはin vitroおよびインビボ両方で用いられ得る。 Prime editors can also be used to trace cell lineage. To track individual cells, repeated sequence modifications can be used to generate unique cell barcodes. The array of barcodes, their order, and size can all be used to infer cell lineage. For example, the insertion of homologous sequences (i.e., sequences 3' to the positioning of the Cas9 nick), specifically homologous sequences with associated barcodes, appears to be a particularly useful lineage prime editor strategy. These systems can be designed such that sequential rounds of editing result in the insertion of barcodes from the PEgRNA cassette that cannot be modified by other PEgRNA editing events in the same cell. Barcoding systems can utilize multiple barcodes, which can be associated with a given stimulus. The system can preserve many of the target protospacers, but alter the seed sequence, PAM, and downstream adjacent nucleotides. This allows multiple signals to be connected to one editing locus without significant redesign of the PEgRNA to be used. The strategy can allow multiple barcode insertions at a single locus in response to multiple cellular stimuli (either internal or external). It can allow recording of the intensity, duration, and order of as many signals as there are unique barcodes (these can be designed with multiple N nucleotides to generate 4^N possible barcodes; for example, a 5 nt barcode would allow recording of 4^5 or 1024 unique signals at once). This system can be used both in vitro and in vivo.

M.バイオ分子活性を調節するためのプライム編集の使用
本明細書に記載のプライム編集因子の使用は、DNA、RNA、およびタンパク質などのバイオ分子の細胞下レベル局在および修飾状態を制御するためにもまた用いられ得る。転写コントロール、細胞代謝、およびシグナル伝達カスケードのような特定の生物学的機能は、細胞内の具体的な位置付けにおいて丁寧にオーケストレーションされている。タンパク質をこれらのおよび他の固有の細胞区画に輸送する能力は、いくつもの生物学的プロセスを変改するための機会を提供し得る。
M. Use of Prime Editing to Modulate Biomolecule Activity
The use of the prime editors described herein can also be used to control the subcellular localization and modification state of biomolecules such as DNA, RNA, and proteins. Certain biological functions, such as transcriptional control, cellular metabolism, and signal transduction cascades, are carefully orchestrated in specific locations within cells. The ability to transport proteins to these and other specific cellular compartments can provide the opportunity to alter a number of biological processes.

従って、プライム編集は、遺伝子にコードされたシグナルによるバイオ分子(例えばタンパク質、脂質、糖、および核酸)の変改された修飾状態および細胞下レベルの輸送を許すであろう遺伝子にコードされたハンドルを組み入れるために用いられ得る。種々の態様において、プライム編集因子によって媒介される薬物治療の標的バイオ分子はDNAである。例えば、DNAは、標的座位のアクセス可能性を変化させるいくつものDNA配列を組み入れることによって改変され得る。これは所望の配列の増大または減少したどちらかの転写に至り得る。他の態様において、プライム編集因子によって媒介される薬物治療の標的バイオ分子はRNAである。例えば、RNAの活性は、その細胞局在、相互作用パートナー、構造ダイナミクス、またはフォールディングの熱力学を変化させることによって改変され得る。さらに他の態様において、プライム編集因子によって媒介される薬物治療の標的バイオ分子はタンパク質である。タンパク質は翻訳後修飾にインパクトを及ぼすように改変され得るか、タンパク質モチーフがタンパク質の細胞下レベル局在を変化させるように組み入れられ得るか、またはタンパク質はタンパク質-タンパク質複合体化イベントに存在するそれらの能力を生出するかもしくは破壊するかどちらかのために改変され得る。 Thus, prime editing can be used to incorporate genetically encoded handles that would allow altered modification states and subcellular transport of biomolecules (e.g., proteins, lipids, sugars, and nucleic acids) via genetically encoded signals. In various embodiments, the target biomolecule of a drug therapy mediated by a prime editor is DNA. For example, DNA can be modified by incorporating a number of DNA sequences that change the accessibility of the target locus. This can lead to either increased or decreased transcription of the desired sequence. In other embodiments, the target biomolecule of a drug therapy mediated by a prime editor is RNA. For example, the activity of the RNA can be modified by changing its cellular localization, interaction partners, structural dynamics, or folding thermodynamics. In yet other embodiments, the target biomolecule of a drug therapy mediated by a prime editor is a protein. Proteins can be modified to impact post-translational modifications, protein motifs can be incorporated to change the subcellular localization of the protein, or proteins can be modified to either create or destroy their ability to exist in protein-protein complexation events.

プライム編集のこの適用は例14においてさらに記載され得る。 This application of prime editing can be further described in Example 14.

DNA改変
PEによって媒介される改変の1つの標的バイオ分子はDNAである。標的座位のアクセス可能性を変化させるいくつものDNA配列を組み入れるためのDNAの改変がなされ得る。クロマチンアクセス可能性は遺伝子転写アウトプットをコントロールする。クロマチンコンパクト化酵素を動員するためのマークの組み入れは、隣り合う遺伝子の転写アウトプットを減少させるはずであるが、クロマチン開放に関連する配列の組み入れは、領域をよりアクセス可能にし、翻って転写を増大させるはずである。ネイティブな制御配列を真似たより複雑な配列モチーフの組み入れは、現行で利用可能なdCas9融合体よりも微妙なかつ生物学的に敏感なコントロールを異なるエピジェネティックなリーダー、ライター、またはイレーサー酵素に提供するはずである。典型的には、具体的な生物学的祖先を有さずにあり得る多数の単一型のマークを組み入れるツールである。3Dゲノムアーキテクチャの急成長分野において実証されているとおり、2つの座位を近接する近位に持って来るかまたは座位を核膜との接触に持って来るであろう配列の組み入れもまた、それらの座位の転写アウトプットを変改するはずである。
DNA modification
One target biomolecule for PE-mediated modification is DNA. DNA can be modified to incorporate any number of DNA sequences that change the accessibility of the target locus. Chromatin accessibility controls gene transcription output. Incorporation of a mark to recruit chromatin compacting enzymes should decrease the transcription output of neighboring genes, while incorporation of sequences associated with chromatin opening should make the region more accessible, which in turn should increase transcription. Incorporation of more complex sequence motifs that mimic native regulatory sequences should provide more subtle and biologically sensitive control of different epigenetic reader, writer, or eraser enzymes than currently available dCas9 fusions. Typically, it is a tool that incorporates a large number of possible single-type marks without a specific biological ancestry. As demonstrated in the burgeoning field of 3D genome architecture, incorporation of sequences that would bring two loci into close proximity or bring loci into contact with the nuclear membrane should also alter the transcription output of those loci.

RNA改変
それらの細胞局在、相互作用パートナー、構造ダイナミクス、またはフォールディングの熱力学を変化させることによってそれらの活性を変改するためのRNAの改変もまたなされ得る。翻訳中断またはフレームシフトを引き起こすであろうモチーフの組み入れは、種々のmRNAプロセシング機序によってmRNA種の存在量を変化させ得る。コンセンサススプライス配列を改変することもまた、異なるRNA種の存在量および保有率を変改するであろう。異なるスプライスアイソフォームの相対比を変化させることは、予測可能に、タンパク質翻訳産物の比の変化に至るであろう。これは多くの生物学的経路を変改するために用いられ得る。例えば、ミトコンドリア対核のDNA修復タンパク質のバランスをシフトさせることは、化学療法試薬に対する異なるがんのレジリエンスを変改するであろう。さらにその上、RNAは、新規のタンパク質標的への結合を可能化する配列によって修飾され得る。高い親和性で細胞タンパク質に結合するいくつものRNAアプタマーが開発されている。これらのアプタマーの1つの組み入れは、それらの翻訳、生物活性を防止するであろうタンパク質標的への結合によって異なるRNA種を隔離するために、またはRNA種を特定の細胞下レベル区画に持って来るためにどちらかで用いられ得る。バイオ分子分解は局在改変の別のクラスである。
RNA Modifications RNAs can also be modified to alter their activity by changing their cellular localization, interaction partners, structural dynamics, or folding thermodynamics. Incorporation of motifs that would cause translational interruption or frameshifting could alter the abundance of mRNA species by various mRNA processing mechanisms. Modifying consensus splice sequences would also alter the abundance and prevalence of different RNA species. Changing the relative ratio of different splice isoforms would predictably lead to changes in the ratio of protein translation products. This can be used to alter many biological pathways. For example, shifting the balance of mitochondrial versus nuclear DNA repair proteins would alter the resilience of different cancers to chemotherapy agents. Furthermore, RNA can be modified with sequences that allow binding to novel protein targets. A number of RNA aptamers have been developed that bind cellular proteins with high affinity. Incorporation of one of these aptamers can be used either to sequester different RNA species by binding to a protein target that would prevent their translation, biological activity, or to bring the RNA species to a specific subcellular compartment. Biomolecular degradation is another class of localized modification.

例えば、細胞内のRNAを制御するためのRNAメチル化が用いられる。メチル化のコンセンサスモチーフがPEによって標的RNAコード配列上に導入され得る。RNAは、ナンセンスによって媒介される崩壊機構または標的RNA種を分解するための他の核酸代謝経路を導く配列を包含するようにもまた改変され得、細胞内のRNAのプールを変化させるであろう。加えて、RNA種はそれらの凝集状態を変改するように改変され得る。RNAの絡まりを生成するための配列が目当ての単一のRNAまたは複数のRNA上に組み入れされ得、これはそれらを翻訳またはシグナルにとって無効な基質にするであろう。 For example, RNA methylation is used to control RNA in cells. A consensus motif for methylation can be introduced onto the target RNA coding sequence by PE. RNA can also be modified to include sequences that direct nonsense-mediated decay mechanisms or other nucleic acid metabolic pathways to degrade the target RNA species, which will alter the pool of RNA in the cell. In addition, RNA species can be modified to alter their aggregation state. Sequences to generate RNA tangles can be incorporated onto a single RNA or multiple RNAs of interest, which will make them ineffective substrates for translation or signaling.

タンパク質修飾
翻訳後修飾(PTM)によるタンパク質の修飾もまたPEによって実行され得るバイオ分子操作の重要なクラスを表す。RNA種のように、細胞内のタンパク質の存在量を変化させることは、PEの重要な能力である。オープンリーディングフレームに停止コドンを組み入れるための編集がされ得る。これは編集されたDNA配列から生ずる全長産物を消去するであろう。代替的には、タンパク質分解の速度が標的タンパク質について変改されることを引き起こすペプチドモチーフが組み入れられ得る。遺伝子本体上への分解タグの組み入れが、細胞内のタンパク質の存在量を変改するために用いられ得る。その上、低分子によって誘導されるデグロンの導入はタンパク質分解の時間的コントロールを可能化し得る。これは研究および治療学両方にとって重要な関連性を有し得る。なぜなら、研究者は所与の標的の低分子によって媒介される治療学的タンパク質分解が見込みある治療学的戦略であるかどうかを難なく評価し得るからである。タンパク質の細胞下レベル局在を変化させるためのタンパク質モチーフもまた組み入れられ得る。核、ミトコンドリア、細胞膜、ペルオキシソーム、リソソーム、プロテアソーム、エキソソーム、および他を包含するいくつもの細胞下レベル区画にタンパク質を選好的に輸送するためのアミノ酸モチーフが組み入れられ得る。
Protein Modification Modification of proteins by post-translational modifications (PTMs) also represents an important class of biomolecular manipulations that can be performed by PE. Like RNA species, altering the abundance of proteins in cells is an important capability of PE. Open reading frames can be edited to incorporate stop codons. This will eliminate the full-length product resulting from the edited DNA sequence. Alternatively, peptide motifs can be incorporated that cause the rate of protein degradation to be altered for the target protein. Incorporation of degradation tags onto the gene body can be used to alter the abundance of proteins in cells. Moreover, introduction of small molecule-induced degrons can allow for temporal control of protein degradation. This can have important implications for both research and therapeutics, since researchers can readily assess whether small molecule-mediated therapeutic protein degradation of a given target is a promising therapeutic strategy. Protein motifs can also be incorporated to change the subcellular localization of proteins. Amino acid motifs can be incorporated to preferentially target proteins to any number of subcellular compartments, including the nucleus, mitochondria, cell membrane, peroxisomes, lysosomes, proteasomes, exosomes, and others.

PTM機構によって修飾されるモチーフを組み入れまたは破壊することはタンパク質翻訳後修飾を変改し得る。リン酸化、ユビキチン化、グリコシル化、脂質修飾(例えばファルネシル化、ミリストイル化、パルミトイル化、プレニル化、GPIアンカー)、ヒドロキシル化、メチル化、アセチル化、クロトニル化、SUMO化、ジスルフィド結合形成、側鎖結合切断イベント、ポリペプチドバックボーン切断イベント(タンパク質分解)、およびいくつもの他のタンパク質PTMが同定されている。これらのPTMは、多くの場合には細胞下レベル局在を変化させることによってタンパク質機能を変化させる。実に、キナーゼは多くの場合にはリン酸化イベントによって下流のシグナルカスケードを活性化する。標的ホスホ部位の除去はシグナル伝達を防止するであろう。全長タンパク質発現を保持しながらいずれかのPTMモチーフを部位特異的に切除または組み入れる能力は、基礎研究および治療学両方にとって重要な進歩であろう。PEの配列組み入れ範囲および標的窓は、それを幅広いPTM改変空間に良く適するようにしている。 Incorporating or disrupting motifs modified by PTM mechanisms can alter protein post-translational modifications. Phosphorylation, ubiquitination, glycosylation, lipid modifications (e.g., farnesylation, myristoylation, palmitoylation, prenylation, GPI anchors), hydroxylation, methylation, acetylation, crotonylation, sumoylation, disulfide bond formation, side chain bond cleavage events, polypeptide backbone cleavage events (proteolysis), and several other protein PTMs have been identified. These PTMs alter protein function, often by altering subcellular localization. Indeed, kinases often activate downstream signaling cascades through phosphorylation events. Removal of the target phosphosite would prevent signal transduction. The ability to site-specifically excise or incorporate any PTM motif while retaining full-length protein expression would be an important advance for both basic research and therapeutics. PE's sequence incorporation range and targeting window make it well suited to the broad PTM modification space.

脂質修飾部位の除去は細胞膜へのタンパク質の輸送を防止するはずである。翻訳後修飾プロセスを標的化する現行の治療学における主要な限定はそれらの特異性である。ファルネシルトランスフェラーゼ阻害剤は細胞膜へのKRAS局在を消去するそれらの能力について鋭意に試験されている。残念ながら、ファルネシル化の全面的な阻害は数々のオフターゲット効果を伴い、これらはこれらの低分子の幅広い使用を防止している。類似に、低分子によるタンパク質キナーゼの特異的阻害は、ヒトゲノムの大きいサイズおよび種々のキナーゼ間の類似性を原因として非常に難しくあり得る。PEはこの特異性問題に可能性ある解決をオファーする。なぜなら、それは全面的な酵素阻害の代わりに修飾部位の切除による標的タンパク質の修飾の阻害を可能化するからである。例えば、KRAS上の脂質修飾ペプチドモチーフの除去は、ファルネシルトランスフェラーゼ阻害の代わりに用いられ得る標的化されたアプローチであろう。このアプローチは、膜結合するようにデザインされていないタンパク質上に脂質標的化モチーフを組み入れることによって標的タンパク質活性を阻害することの機能的な反対物である。 Removal of the lipid modification site should prevent transport of the protein to the cell membrane. A major limitation of current therapeutics targeting post-translational modification processes is their specificity. Farnesyltransferase inhibitors are being actively tested for their ability to eliminate KRAS localization to the cell membrane. Unfortunately, blanket inhibition of farnesylation is accompanied by numerous off-target effects that prevent the widespread use of these small molecules. Similarly, specific inhibition of protein kinases by small molecules can be very difficult due to the large size of the human genome and the similarity between various kinases. PE offers a potential solution to this specificity problem because it allows inhibition of target protein modification by excision of the modification site instead of blanket enzyme inhibition. For example, removal of the lipid modification peptide motif on KRAS would be a targeted approach that could be used instead of farnesyltransferase inhibition. This approach is the functional opposite of inhibiting target protein activity by incorporating lipid targeting motifs onto proteins that are not designed to be membrane bound.

PEはタンパク質-タンパク質複合体化イベントを取り調べる(instigate)ためにもまた用いられ得る。タンパク質は多くの場合には複合体内で機能してそれらの生物活性を遂行する。PEは、タンパク質がこれらの複合体内に存在する能力を生出するかまたは破壊するかどちらかのために用いられ得る。複合体形成イベントを消去するためには、タンパク質:タンパク質インターフェース上のアミノ酸置換または挿入が、複合体化を好まないように組み入れられ得る。SSX18は重要なヒストンリモデリング複合体のBAF複合体のタンパク質構成要素である。SSX18の変異は滑膜肉腫を駆動する。PEは、SSX18が複合体のそのタンパク質パートナーに結合することを防止する側鎖を組み入れしてその発がん活性を防止するために用いられ得る。PEは病原性の変異を除去してこのタンパク質のWT活性を復元するためにもまた用いられ得る。代替的には、PEは、タンパク質をそれらのネイティブな複合体中に保つために、またはそれらのネイティブな活性とは無関係である相互作用に関与するようにそれらを引っ張ってそれらの活性を阻害するためにどちらかで用いられ得る。別のものと比べて1つの相互作用状態を維持する複合体を形成することは、重要な治療学的モダリティーを表し得る。タンパク質:タンパク質インターフェースを変改して相互作用のKdを減少させることは、それらのタンパク質がより長く互いにくっついていることを保つであろう。疾患においては神経芽腫シグナルカスケードを駆動するが、さもなければ他の細胞では健康な転写コントロールに関与するn-mycのように、タンパク質複合体は複数のシグナル複合体を有し得る。PEは、健康な相互作用パートナーとのn-myc会合を駆動しかつ発がん相互作用パートナーに対するその親和性を減少させる変異を組み入れるために用いられ得る。
セクションIに引用された参考文献
以下の参考文献の各々は参照により本明細書に組み込まれる。

Figure 2020191243000268
PE can also be used to instigate protein-protein complexation events. Proteins often function in complexes to carry out their biological activities. PE can be used to either create or destroy the ability of proteins to reside in these complexes. To eliminate complexation events, amino acid substitutions or insertions on the protein:protein interface can be incorporated to disfavor complexation. SSX18 is a protein component of the BAF complex, an important histone remodeling complex. Mutations in SSX18 drive synovial sarcoma. PE can be used to incorporate side chains that prevent SSX18 from binding to its protein partners in the complex, preventing its oncogenic activity. PE can also be used to remove pathogenic mutations to restore the WT activity of this protein. Alternatively, PE can be used either to keep proteins in their native complexes or to pull them into interactions that are unrelated to their native activity, inhibiting their activity. Forming complexes that maintain one interaction state over another may represent an important therapeutic modality. Altering protein:protein interfaces to decrease the Kd of an interaction will keep the proteins attached to each other longer. Protein complexes can have multiple signaling complexes, such as n-myc, which drives the neuroblastoma signaling cascade in disease but is otherwise involved in healthy transcriptional control in other cells. PE can be used to incorporate mutations that drive n-myc association with healthy interacting partners and decrease its affinity for oncogenic interacting partners.
References cited in Section I
Each of the following references is incorporated herein by reference.
Figure 2020191243000268

N.プライム編集のためのPEgRNAの改善されたデザイン側面
他の態様において、プライム編集システムはプライム編集効率を改善し得るPEgRNAデザインおよび戦略の使用を包含し得る。これらの戦略は、プライム編集に要求されるマルチステッププロセスゆえに存在するいくつかのイシューを克服することを探究する。例えば、PEgRNA上に形成し得る好ましくないRNA構造は、DNA編集がPEgRNAからゲノム座位にコピーされることの阻害をもたらし得る。これらの限定はPEgRNA構成要素の再デザインおよび操作によって克服され得る。これらの再デザインはプライム編集因子効率を改善し得、ゲノム上へのより長い挿入配列の組み入れを許し得る。
N. Improved design aspects of PEGRNA for prime editing
In other embodiments, the prime editing system may include the use of PEgRNA design and strategies that can improve prime editing efficiency.These strategies seek to overcome some of the issues that exist due to the multi-step process required for prime editing.For example, unfavorable RNA structures that may form on PEgRNA may result in inhibition of DNA editing from PEgRNA to genome locus copying.These limitations may be overcome by redesigning and manipulating PEgRNA components.These redesigns may improve the efficiency of prime editing factors and allow the incorporation of longer insertion sequences on genomes.

従って、種々の態様において、PEgRNAデザインは、非ポリメラーゼIII(pol III)プロモーターからの機能的なPEgRNAの効率的な発現を可能化することによって、より長いPEgRNAをもたらし得る。これは難儀な配列要件の必要を回避するであろう。他の態様において、コアのCas9結合PEgRNA骨格はシステムの効力を改善するように改善され得る。さらに他の態様において、逆転写酵素(RT)処理能力を改善するための改変がPEgRNAになされ得る。これは標的ゲノム座位におけるより長い配列の挿入を可能化するであろう。他の態様において、安定性を改善、RT処理能力を増強、PEgRNAのミスフォールディングを防止、および/またはゲノム編集にとって重要な追加の因子を動員するために、RNAモチーフがPEgRNAの5'および/または3'末端に追加され得る。さらに別の態様では、PEgRNA骨格を改善およびプライム編集因子効率を増強し得る所与の配列標的についてのPEgRNAの進化のためのプラットフォームが提供される。これらのデザインは、いずれかのCas9またはその進化したバリアントによって認識されるいずれかのPEgRNAを改善するために用いられ得る。 Thus, in various embodiments, the PEgRNA design may result in longer PEgRNAs by enabling efficient expression of functional PEgRNAs from non-polymerase III (pol III) promoters. This would avoid the need for laborious sequence requirements. In other embodiments, the core Cas9-binding PEgRNA backbone may be improved to improve the efficacy of the system. In yet other embodiments, modifications may be made to the PEgRNA to improve reverse transcriptase (RT) processivity. This would allow for the insertion of longer sequences at the target genomic locus. In other embodiments, RNA motifs may be added to the 5' and/or 3' ends of the PEgRNA to improve stability, enhance RT processivity, prevent PEgRNA misfolding, and/or recruit additional factors important for genome editing. In yet another embodiment, a platform is provided for the evolution of PEgRNAs for a given sequence target that may improve the PEgRNA backbone and enhance prime editor efficiency. These designs may be used to improve any PEgRNA recognized by any Cas9 or evolved variants thereof.

プライム編集のこの適用は例15にさらに記載され得る。 This application of prime editing can be further described in Example 15.

PEgRNAは、PEgRNAの特性および/または特徴を改変し得る追加のデザイン改善を包含し得、それによってプライム編集の効力を改善する。種々の態様において、これらの改善は、いくつもの異なるカテゴリーの1つ以上に属し得る:(1)難儀な配列要件なしにより長いPEgRNAの発現を可能化するであろう非ポリメラーゼIII(pol III)プロモーターからの機能的なPEgRNAの効率的な発現を可能化するためのデザイン;(2)効力を改善し得るコアのCas9結合PEgRNA骨格の改善;(3)RT処理能力を改善し、標的ゲノム座位におけるより長い配列の挿入を可能化するPEgRNAの改変;および(4)PEgRNA安定性を改善、RT処理能力を増強、PEgRNAのミスフォールディングを防止、またはゲノム編集にとって重要な追加の因子を動員するPEgRNAの5'または3'末端へのRNAモチーフの追加を包含するが、これらに限定されない。 The PEgRNA may include additional design improvements that may modify the properties and/or characteristics of the PEgRNA, thereby improving the efficacy of prime editing. In various embodiments, these improvements may fall into one or more of a number of different categories: (1) designs to enable efficient expression of functional PEgRNA from non-polymerase III (pol III) promoters, which would enable expression of longer PEgRNAs without onerous sequence requirements; (2) improvements to the core Cas9-binding PEgRNA backbone, which may improve efficacy; (3) modifications of the PEgRNA to improve RT processivity and enable insertion of longer sequences at the target genomic locus; and (4) addition of RNA motifs to the 5' or 3' end of the PEgRNA that improve PEgRNA stability, enhance RT processivity, prevent PEgRNA misfolding, or recruit additional factors important for genome editing.

1つの態様では、より大きい伸長アームを有するより長い長さのPEgRNAの発現を改善するためのpol IIIプロモーターによるPEgRNAがデザインされ得る。sgRNAは典型的にはU6 snRNAプロモーターから発現される。このプロモーターはpol IIIを動員して関連するRNAを発現し、核内に保持される短いRNAの発現にとって有用である。しかしながら、pol IIIは高度にプロセッシブではなく、長さが数百ヌクレオチドよりも長いRNAを効率的なゲノム編集に要求されるレベルで発現する能力はない。加えて、pol IIIはUのストレッチにおいてストールまたは終結し得、可能性として、PEgRNAを用いて挿入され得る配列多様性を限定する。ポリメラーゼII(例えばpCMV)またはポリメラーゼI(例えばU1 snRNAプロモーター)を動員する他のプロモーターが、より長いsgRNAを発現するそれらの能力について検分されている。しかしながら、これらのプロモーターは典型的には部分的に転写され、これは発現されるPEgRNA上のスペーサーの5'に余分な配列をもたらすであろう。これは顕著に縮減されたCas9:sgRNA活性を部位依存的な様式でもたらすことが示されている。加えて、pol IIIによって転写されるPEgRNAは単純に一続きの6-7つのUで終結し得るが、pol IIまたはpol Iから転写されるPEgRNAは異なる終結シグナルを要求するであろう。多くの場合に、かかるシグナルはポリアデニル化をもまたもたらし、これは核からのPEgRNAの望まれない輸送をもたらすであろう。類似に、pCMVなどのpol IIプロモーターから発現されたRNAは典型的には5'キャッピングされ、それらの核搬出をもまたもたらすであろう。 In one embodiment, PEgRNAs can be designed with pol III promoters to improve expression of longer lengths of PEgRNAs with larger extension arms. sgRNAs are typically expressed from the U6 snRNA promoter. This promoter recruits pol III to express the associated RNA and is useful for expression of short RNAs that are retained in the nucleus. However, pol III is not highly processive and is not capable of expressing RNAs longer than several hundred nucleotides in length at the levels required for efficient genome editing. In addition, pol III can stall or terminate at stretches of U, potentially limiting the sequence diversity that can be inserted with PEgRNAs. Other promoters that recruit polymerase II (e.g., pCMV) or polymerase I (e.g., U1 snRNA promoter) have been surveyed for their ability to express longer sgRNAs. However, these promoters are typically partially transcribed, which would result in extra sequence 5' of the spacer on the expressed PEgRNA. This has been shown to result in significantly reduced Cas9:sgRNA activity in a site-dependent manner. In addition, PEgRNA transcribed by pol III may simply terminate with a stretch of 6-7 U's, whereas PEgRNA transcribed from pol II or pol I will require a different termination signal. In many cases, such signals will also result in polyadenylation, which will result in the undesired transport of the PEgRNA from the nucleus. Similarly, RNAs expressed from pol II promoters such as pCMV are typically 5' capped, which will also result in their nuclear export.

先に、Rinnおよび同僚は、長鎖非コードRNA(lncRNA)タグ付きsgRNAの生産について、種々の発現プラットフォームをスクリーニングした183。これらのプラットフォームは、ヒトのMALAT1 ncRNAからのENEエレメント184、KSHVからのPAN ENEエレメント185、またはU1 snRNAからの3'ボックス186で終結する、pCMVから発現されるRNAを包含する。注意すべきことに、MALAT1 ncRNAおよびPAN ENEは三重らせんを形成し、ポリAテールを防護する184,187。これらの構築物もまたRNA安定性を増強し得る。これらの発現システムもまたより長いPEgRNAの発現を可能化するであろうということが企図される。 Previously, Rinn and colleagues screened various expression platforms for the production of long non-coding RNA (lncRNA) tagged sgRNAs . These platforms include RNAs expressed from pCMV that terminate with an ENE element from human MALAT1 ncRNA, a PAN ENE element from KSHV , or a 3 ' box from U1 snRNA. Of note, MALAT1 ncRNA and PAN ENE form triple helices and protect the polyA tail. These constructs may also enhance RNA stability. It is contemplated that these expression systems will also enable the expression of longer PEGRNAs.

加えて、PEgRNAの一部として転写されるであろうpol IIプロモーターの部分の切断のための一連の方法がデザインされており、転写されたガイドをプロセシングするための自己切断リボザイム、例えばハンマーヘッド188、ピストル189、ハチェット189、ヘアピン190、VS191、ツイスター192、もしくはツイスターシスター192リボザイム、または他の自己切断エレメント、あるいはCsy4によって認識され193、またガイドのプロセシングに至るヘアピンどちらかを追加している。また、KSHV PAN RNAおよびエレメントについて先に実証されているとおり、複数のENEモチーフの組み込みが、改善されたPEgRNA発現および安定性に至り得るという仮説が立てられている185。環状イントロン性RNA(ciRNA)の形態でPEgRNAを環状化することもまた増強されたRNA発現および安定性ならびに核局在に至り得るということもまた予期される194 In addition, a series of methods have been designed for cleavage of the portion of the pol II promoter that will be transcribed as part of the PEgRNA, adding either a self-cleaving ribozyme, such as a hammerhead , pistol, hatchet , hairpin , VS, twister , or twister sister ribozyme, or other self-cleaving elements, to process the transcribed guide, or a hairpin that is recognized by Csy4 and leads to processing of the guide. It has also been hypothesized that the incorporation of multiple ENE motifs may lead to improved PEgRNA expression and stability, as previously demonstrated for KSHV PAN RNA and elements. It is also anticipated that circularizing the PEgRNA in the form of a circular intronic RNA (ciRNA) may also lead to enhanced RNA expression and stability as well as nuclear localization.

様々な態様において、PEgRNAは、以下の配列によって例示されるとおり、上の様々な要素を包含していてもよい。 In various embodiments, the PEgRNA may include various elements of the above, as exemplified by the following sequences:

非限定例1-pCMV、Csy4ヘアピン、PEgRNA、およびMALAT1 ENEからなるPEgRNA発現プラットホーム
TAGTTATTAATAGTAATCAATTACGGGGTCATTAGTTCATAGCCCATATATGGAGTTCCGCGTTACATAACTTACGGTAAATGGCCCGCCTGGCTGACCGCCCAACGACCCCCGCCCATTGACGTCAATAATGACGTATGTTCCCATAGTAACGCCAATAGGGACTTTCCATTGACGTCAATGGGTGGAGTATTTACGGTAAACTGCCCACTTGGCAGTACATCAAGTGTATCATATGCCAAGTACGCCCCCTATTGACGTCAATGACGGTAAATGGCCCGCCTGGCATTATGCCCAGTACATGACCTTATGGGACTTTCCTACTTGGCAGTACATCTACGTATTAGTCATCGCTATTACCATGGTGATGCGGTTTTGGCAGTACATCAATGGGCGTGGATAGCGGTTTGACTCACGGGGATTTCCAAGTCTCCACCCCATTGACGTCAATGGGAGTTTGTTTTGGCACCAAAATCAACGGGACTTTCCAAAATGTCGTAACAACTCCGCCCCATTGACGCAAATGGGCGGTAGGCGTGTACGGTGGGAGGTCTATATAAGCAGAGCTGGTTTAGTGAACCGTCAGATCGTTCACTGCCGTATAGGCAGGGCCCAGACTGAGCACGTGAGTTTTAGAGCTAGAAATAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGGACCGAGTCGGTCCTCTGCCATCAAAGCGTGCTCAGTCTGTTTTAGGGTCATGAAGGTTTTTCTTTTCCTGAGAAAACAACACGTATTGTTTTCTCAGGTTTTGCTTTTTGGCCTTTTTCTAGCTTAAAAAAAAAAAAAGCAAAAGATGCTGGTGGTTGGCACTCCTGGTTTCCAGGACGGGGTTCAAATCCCTGCGGCGTCTTTGCTTTGACT(配列番号501)
Non-limiting example 1 - PEgRNA expression platform consisting of pCMV, Csy4 hairpin, PEgRNA, and MALAT1 ENE
(SEQ ID NO:501)

非限定例2-pCMV、Csy4ヘアピン、PEgRNA、およびPAN ENEからなるPEgRNA発現プラットホーム
TAGTTATTAATAGTAATCAATTACGGGGTCATTAGTTCATAGCCCATATATGGAGTTCCGCGTTACATAACTTACGGTAAATGGCCCGCCTGGCTGACCGCCCAACGACCCCCGCCCATTGACGTCAATAATGACGTATGTTCCCATAGTAACGCCAATAGGGACTTTCCATTGACGTCAATGGGTGGAGTATTTACGGTAAACTGCCCACTTGGCAGTACATCAAGTGTATCATATGCCAAGTACGCCCCCTATTGACGTCAATGACGGTAAATGGCCCGCCTGGCATTATGCCCAGTACATGACCTTATGGGACTTTCCTACTTGGCAGTACATCTACGTATTAGTCATCGCTATTACCATGGTGATGCGGTTTTGGCAGTACATCAATGGGCGTGGATAGCGGTTTGACTCACGGGGATTTCCAAGTCTCCACCCCATTGACGTCAATGGGAGTTTGTTTTGGCACCAAAATCAACGGGACTTTCCAAAATGTCGTAACAACTCCGCCCCATTGACGCAAATGGGCGGTAGGCGTGTACGGTGGGAGGTCTATATAAGCAGAGCTGGTTTAGTGAACCGTCAGATCGTTCACTGCCGTATAGGCAGGGCCCAGACTGAGCACGTGAGTTTTAGAGCTAGAAATAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGGACCGAGTCGGTCCTCTGCCATCAAAGCGTGCTCAGTCTGTTTTGTTTTGGCTGGGTTTTTCCTTGTTCGCACCGGACACCTCCAGTGACCAGACGGCAAGGTTTTTATCCCAGTGTATATTGGAAAAACATGTTATACTTTTGACAATTTAACGTGCCTAGAGCTCAAATTAAACTAATACCATAACGTAATGCAACTTACAACATAAATAAAGGTCAATGTTTAATCCATAAAAAAAAAAAAAAAAAAA(配列番号502)
Non-limiting example 2 - PEgRNA expression platform consisting of pCMV, Csy4 hairpin, PEgRNA, and PAN ENE
(SEQ ID NO:502)

非限定例3-pCMV、Csy4ヘアピン、PEgRNA、および3×PAN ENEからなるPEgRNA発現プラットホーム
TAGTTATTAATAGTAATCAATTACGGGGTCATTAGTTCATAGCCCATATATGGAGTTCCGCGTTACATAACTTACGGTAAATGGCCCGCCTGGCTGACCGCCCAACGACCCCCGCCCATTGACGTCAATAATGACGTATGTTCCCATAGTAACGCCAATAGGGACTTTCCATTGACGTCAATGGGTGGAGTATTTACGGTAAACTGCCCACTTGGCAGTACATCAAGTGTATCATATGCCAAGTACGCCCCCTATTGACGTCAATGACGGTAAATGGCCCGCCTGGCATTATGCCCAGTACATGACCTTATGGGACTTTCCTACTTGGCAGTACATCTACGTATTAGTCATCGCTATTACCATGGTGATGCGGTTTTGGCAGTACATCAATGGGCGTGGATAGCGGTTTGACTCACGGGGATTTCCAAGTCTCCACCCCATTGACGTCAATGGGAGTTTGTTTTGGCACCAAAATCAACGGGACTTTCCAAAATGTCGTAACAACTCCGCCCCATTGACGCAAATGGGCGGTAGGCGTGTACGGTGGGAGGTCTATATAAGCAGAGCTGGTTTAGTGAACCGTCAGATCGTTCACTGCCGTATAGGCAGGGCCCAGACTGAGCACGTGAGTTTTAGAGCTAGAAATAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGGACCGAGTCGGTCCTCTGCCATCAAAGCGTGCTCAGTCTGTTTTGTTTTGGCTGGGTTTTTCCTTGTTCGCACCGGACACCTCCAGTGACCAGACGGCAAGGTTTTTATCCCAGTGTATATTGGAAAAACATGTTATACTTTTGACAATTTAACGTGCCTAGAGCTCAAATTAAACTAATACCATAACGTAATGCAACTTACAACATAAATAAAGGTCAATGTTTAATCCATAAAAAAAAAAAAAAAAAAAACACACTGTTTTGGCTGGGTTTTTCCTTGTTCGCACCGGACACCTCCAGTGACCAGACGGCAAGGTTTTTATCCCAGTGTATATTGGAAAAACATGTTATACTTTTGACAATTTAACGTGCCTAGAGCTCAAATTAAACTAATACCATAACGTAATGCAACTTACAACATAAATAAAGGTCAATGTTTAATCCATAAAAAAAAAAAAAAAAAAATCTCTCTGTTTTGGCTGGGTTTTTCCTTGTTCGCACCGGACACCTCCAGTGACCAGACGGCAAGGTTTTTATCCCAGTGTATATTGGAAAAACATGTTATACTTTTGACAATTTAACGTGCCTAGAGCTCAAATTAAACTAATACCATAACGTAATGCAACTTACAACATAAATAAAGGTCAATGTTTAATCCATAAAAAAAAAAAAAAAAAAA(配列番号503)
Non-limiting example 3 - PEgRNA expression platform consisting of pCMV, Csy4 hairpin, PEgRNA, and 3xPAN ENE
(SEQ ID NO:503)

非限定例4-pCMV、Csy4ヘアピン、PEgRNA、および3'ボックスからなるPEgRNA発現プラットホーム
TAGTTATTAATAGTAATCAATTACGGGGTCATTAGTTCATAGCCCATATATGGAGTTCCGCGTTACATAACTTACGGTAAATGGCCCGCCTGGCTGACCGCCCAACGACCCCCGCCCATTGACGTCAATAATGACGTATGTTCCCATAGTAACGCCAATAGGGACTTTCCATTGACGTCAATGGGTGGAGTATTTACGGTAAACTGCCCACTTGGCAGTACATCAAGTGTATCATATGCCAAGTACGCCCCCTATTGACGTCAATGACGGTAAATGGCCCGCCTGGCATTATGCCCAGTACATGACCTTATGGGACTTTCCTACTTGGCAGTACATCTACGTATTAGTCATCGCTATTACCATGGTGATGCGGTTTTGGCAGTACATCAATGGGCGTGGATAGCGGTTTGACTCACGGGGATTTCCAAGTCTCCACCCCATTGACGTCAATGGGAGTTTGTTTTGGCACCAAAATCAACGGGACTTTCCAAAATGTCGTAACAACTCCGCCCCATTGACGCAAATGGGCGGTAGGCGTGTACGGTGGGAGGTCTATATAAGCAGAGCTGGTTTAGTGAACCGTCAGATCGTTCACTGCCGTATAGGCAGGGCCCAGACTGAGCACGTGAGTTTTAGAGCTAGAAATAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGGACCGAGTCGGTCCTCTGCCATCAAAGCGTGCTCAGTCTGTTTGTTTCAAAAGTAGACTGTACGCTAAGGGTCATATCTTTTTTTGTTTGGTTTGTGTCTTGGTTGGCGTCTTAAA(配列番号504)
Non-limiting Example 4 - PEgRNA Expression Platform Consisting of pCMV, Csy4 Hairpin, PEgRNA, and 3' Box
(SEQ ID NO:504)

非限定例5-pU1、Csy4ヘアピン、PEgRNA、および3'ボックスからなるPEgRNA発現プラットホーム
CTAAGGACCAGCTTCTTTGGGAGAGAACAGACGCAGGGGCGGGAGGGAAAAAGGGAGAGGCAGACGTCACTTCCCCTTGGCGGCTCTGGCAGCAGATTGGTCGGTTGAGTGGCAGAAAGGCAGACGGGGACTGGGCAAGGCACTGTCGGTGACATCACGGACAGGGCGACTTCTATGTAGATGAGGCAGCGCAGAGGCTGCTGCTTCGCCACTTGCTGCTTCACCACGAAGGAGTTCCCGTGCCCTGGGAGCGGGTTCAGGACCGCTGATCGGAAGTGAGAATCCCAGCTGTGTGTCAGGGCTGGAAAGGGCTCGGGAGTGCGCGGGGCAAGTGACCGTGTGTGTAAAGAGTGAGGCGTATGAGGCTGTGTCGGGGCAGAGGCCCAAGATCTCAGTTCACTGCCGTATAGGCAGGGCCCAGACTGAGCACGTGAGTTTTAGAGCTAGAAATAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGGACCGAGTCGGTCCTCTGCCATCAAAGCGTGCTCAGTCTGTTTCAGCAAGTTCAGAGAAATCTGAACTTGCTGGATTTTTGGAGCAGGGAGATGGAATAGGAGCTTGCTCCGTCCACTCCACGCATCGACCTGGTATTGCAGTACCTCCAGGAACGGTGCACCCACTTTCTGGAGTTTCAAAAGTAGACTGTACGCTAAGGGTCATATCTTTTTTTGTTTGGTTTGTGTCTTGGTTGGCGTCTTAAA(配列番号505)
Non-limiting Example 5 - PEgRNA Expression Platform Consisting of pU1, Csy4 Hairpin, PEgRNA, and 3' Box
(SEQ ID NO:505)

種々の他の態様において、PEgRNAは、骨格またはコア配列への改善を導入することによって改善され得る。これは公知を導入することによってされ得る。 In various other embodiments, the PEGRNA can be improved by introducing improvements to the backbone or core sequence. This can be done by introducing known.

コアのCas9結合PEgRNA骨格は、蓋然的には、PE活性を増強するように改善され得る。いくつかのかかるアプローチはすでに実証されている。例えば、骨格の第1の対形成エレメント(P1)はGTTTT-AAAAC(配列番号3939)対形成エレメントを含有する。かかる一続きのTはpol III中断とRNA転写物の未成熟な終結とをもたらすことが示されている。P1のこの部分におけるT-Aペアの1つからG-Cペアへの合理的な変異はsgRNA活性を増強することが示されており、このアプローチがPEgRNAについてもまた実現可能であろうということを示唆している195。加えて、P1の長さを増大させることは、sgRNAフォールディングを増強し、改善された活性に至るということもまた示されており195、それをPEgRNA活性の改善のための別の道として示唆している。コアの例の改善は: The core Cas9-bound PEgRNA backbone could conceivably be improved to enhance PE activity. Several such approaches have already been demonstrated. For example, the first pairing element (P1) of the backbone contains a GTTTT-AAAAC (SEQ ID NO: 3939) pairing element. Such a run of Ts has been shown to result in pol III pausing and premature termination of the RNA transcript. Rational mutation of one of the TA pairs to a GC pair in this portion of P1 has been shown to enhance sgRNA activity, suggesting that this approach may also be feasible for PEgRNA195 . In addition, increasing the length of P1 has also been shown to enhance sgRNA folding, leading to improved activity195 , suggesting it as another avenue for improving PEgRNA activity. Example improvements of the core are:

P1まで6nt伸長を含有するPEgRNA
GGCCCAGACTGAGCACGTGAGTTTTAGAGCTAGCTCATGAAAATGAGCTAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGGACCGAGTCGGTCCTCTGCCATCAAAGCGTGCTCAGTCTGTTTTTTT(配列番号228)
PEgRNA containing a 6 nt extension to P1
GGCCCAGACTGAGCACGTGAGTTTTAGAGCTAGCTCATGAAAATGAGCTAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGGACCGAGTCGGTCCTCTGCCATCAAAGCGTGCTCAGTCTGTTTTTTT (SEQ ID NO: 228)

P1内にT-A→G-C突然変異を含有するPEgRNA
GGCCCAGACTGAGCACGTGAGTTTGAGAGCTAGAAATAGCAAGTTTAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGGACCGAGTCGGTCCTCTGCCATCAAAGCGTGCTCAGTCTGTTTTTTT(配列番号229)
を包含し得る。
PEgRNA containing a TA→GC mutation in P1
GGCCCAGACTGAGCACGTGAGTTTGAGAGCTAGAAATAGCAAGTTTAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGGACCGAGTCGGTCCTCTGCCATCAAAGCGTGCTCAGTCTGTTTTTTT (SEQ ID NO: 229)
may include.

種々の他の態様において、PEgRNAは編集鋳型領域の改変を導入することによって改善され得る。PEgRNAを鋳型とする挿入のサイズが増大すると、それは、エンドヌクレアーゼによって分解されるか、自発的加水分解を経過するか、またはRTによって逆転写される能力がないもしくはPEgRNA骨格のフォールディングおよび爾後のCas9-RT結合を遮断する二次構造へとフォールディングすることがより蓋然的である。従って、PEgRNAの鋳型の改変が、大きい挿入、例えば遺伝子丸ごとの挿入を成し遂げる(affect)ために必要であり得るということが蓋然的である。そうするためのいくつかの戦略は、合成または半合成PEgRNA上の修飾ヌクレオチドの組み込みを包含し、これらがRNAを分解もしくは加水分解に対してより耐性にするか、または阻害性の二次構造を採用することをより蓋然的でなくする196。かかる修飾は、Gリッチ配列のRNA二次構造を縮減するであろう8-アザ-7-デアザグアノシン;分解を縮減し、ある種の種類のRNA二次構造を増強するロック核酸(LNA);RNA安定性を増強する2'-O-メチル、2'-フルオロ、または2'-O-メトキシエトキシ修飾を包含し得る。かかる修飾は、安定性および活性を増強するためにPEgRNA上の他所にもまた包含され得る。代替的にはまたは加えて、それが所望のタンパク質産物をコードすることと、RTによってアンフォールディングされる能力がある単純な二次構造を採用することがより蓋然的でもまたあることと両方であるようにして、PEgRNAの鋳型がデザインされ得る。かかる単純な構造は熱力学的シンクとして作用し、逆転写を防止するであろうより複雑化した構造が生起することをより蓋然的でなくするであろう。最後に、鋳型を2つの別個のPEgRNAに分裂し得る。かかるデザインでは、転写を開始し、Cas9に融合されたRNA結合タンパク質またはMS2アプタマーなどのPEgRNAそれ自体の上のRNA認識エレメントによって別個の鋳型RNAを標的部位に動員するためにもまた、PEは用いられるであろう。RTは、直接的にこの別個の鋳型RNAに結合し得るか、または第2の鋳型へのスワッピング前に元々のPEgRNAから逆転写を開始し得るかどちらかである。かかるアプローチは、長い鋳型の追加によるPEgRNAのミスフォールディングを防止することによって、また、長い挿入が生起するために、ことによるとPEに基づく長い挿入を阻害し得るゲノムからのCas9の解離を要求しないことによって両方で、長い挿入を可能化し得る。 In various other embodiments, PEgRNA can be improved by introducing modifications to the editing template region.As the size of the PEgRNA-templated insert increases, it is more likely to be degraded by endonucleases, undergo spontaneous hydrolysis, or fold into a secondary structure that is incapable of being reverse transcribed by RT or blocks the folding of the PEgRNA backbone and subsequent Cas9-RT binding.Therefore, it is likely that modifications to the PEgRNA template may be necessary to affect large insertions, such as the insertion of whole genes.Some strategies for doing so include the incorporation of modified nucleotides on synthetic or semi-synthetic PEgRNA, which make the RNA more resistant to degradation or hydrolysis, or less likely to adopt inhibitory secondary structures196 . Such modifications may include 8-aza-7-deazaguanosine, which will reduce RNA secondary structure in G-rich sequences; locked nucleic acid (LNA), which reduces degradation and enhances certain types of RNA secondary structure; 2'-O-methyl, 2'-fluoro, or 2'-O-methoxyethoxy modifications, which enhance RNA stability. Such modifications may also be included elsewhere on the PEgRNA to enhance stability and activity. Alternatively or in addition, the template of the PEgRNA may be designed such that it both encodes the desired protein product and is also more likely to adopt a simple secondary structure capable of being unfolded by RT. Such a simple structure would act as a thermodynamic sink, making it less likely that a more complicated structure would arise that would prevent reverse transcription. Finally, the template may be split into two separate PEgRNAs. In such a design, PE will also be used to initiate transcription and recruit a separate template RNA to the target site by an RNA recognition element on the PEgRNA itself, such as an RNA-binding protein fused to Cas9 or an MS2 aptamer. RT can either directly bind to this separate template RNA or initiate reverse transcription from the original PEgRNA before swapping to the second template. Such an approach can enable long insertions both by preventing misfolding of the PEgRNA upon addition of a long template and by not requiring dissociation of Cas9 from the genome for long insertions to occur, which could potentially inhibit PE-based long insertions.

なお他の態様において、PEgRNAは、追加のRNAモチーフをPEgRNAの5'および3'末端に導入することによって改善され得る。いくつかのかかるモチーフ、例えばKSHVからのPAN ENEおよびMALAT1からのENEは、非pol IIIプロモーターからのより長いPEgRNAの発現を終結させるための可能な手段として上で論じられた。これらのエレメントはRNA三重らせんを形成し、これらはポリAテールを取り囲み、それらが核内に保持されることをもたらす184,187。しかしながら、末端ヌクレオチドを閉じ込めるPEgRNAの3'末端の複雑な構造を形成することによって、これらの構造は、蓋然的には、PEgRNAのエキソヌクレアーゼによって媒介される分解を防止することをもまた助けるであろう。 In still other embodiments, PEgRNAs can be improved by introducing additional RNA motifs into the 5' and 3' ends of the PEgRNA. Some such motifs, such as the PAN ENE from KSHV and the ENE from MALAT1, were discussed above as possible means to terminate the expression of longer PEgRNAs from non-pol III promoters. These elements form RNA triple helices that surround the polyA tail and result in their retention in the nucleus. 184,187 However, by forming complex structures at the 3' end of the PEgRNA that confine the terminal nucleotides, these structures would likely also help prevent exonuclease-mediated degradation of the PEgRNA.

非pol IIIプロモーターからの終結を可能化することなしにであっても、3'末端に挿入される他の構造要素もまたRNA安定性を増強し得る。かかるモチーフは、3'末端を閉じ込めるであろうヘアピンもしくはRNA四重鎖197、または3'末端における2’-3'-環状リン酸の形成をもたらし、また、可能性としてはPEgRNAがエキソヌクレアーゼによって分解されることをより蓋然的でなくするであろうHDVなどの自己切断リボザイム198を包含し得る。不完全なスプライシングによってPEgRNAが環化することを誘導して、ciRNAを形成することもまた、PEgRNA安定性を増大させ得、PEgRNAが核内に保持されることをもたらし得る194 Other structural elements inserted at the 3' end may also enhance RNA stability, even without enabling termination from a non-pol III promoter. Such motifs could include hairpins or RNA quadruplexes that would trap the 3' end, 197 or self-cleaving ribozymes such as HDV that would result in the formation of a 2'-3'-cyclic phosphate at the 3' end and potentially make the PEgRNA less likely to be degraded by exonucleases.198 Inducing the PEgRNA to circularize by incomplete splicing to form ciRNA could also increase PEgRNA stability and result in the PEgRNA being retained in the nucleus.194

追加のRNAモチーフもまた、DNA-RNA二重鎖に対するRT結合を増強することによって、RT処理能力を改善またはPEgRNA活性を増強し得る。その対応するレトロウイルスゲノム上のRTによって結合されるネイティブな配列の追加は、RT活性を増強し得る199。これは、ネイティブなプライマー結合部位(PBS)、ポリプリントラクト(PPT)、またはレトロウイルスゲノム二量体化および転写の開始に関わるキッシングループを包含し得る199 Additional RNA motifs may also improve RT processivity or enhance PEgRNA activity by enhancing RT binding to the DNA-RNA duplex. The addition of native sequences bound by RT on its corresponding retroviral genome can enhance RT activity. This may include native primer binding sites (PBSs), polypurine tracts (PPTs), or kissing loops involved in retroviral genome dimerization and initiation of transcription.

PEgRNAの5'および3'末端におけるキッシングループまたはGNRAテトラループ/テトラループレセプターペア200などの二量体化モチーフの追加もまた、PEgRNAの有効な環状化をもたらし得、安定性を改善する。加えて、これらのモチーフの追加はPEgRNAスペーサーおよびプライマーの物理的分離を可能化し得、PE活性を妨げるであろうスペーサーの閉じ込めを防止する(prevention)ということが想定される。スペーサー領域における小さいトーホールドヘアピンを形成するPEgRNAの短い5'または3'伸長もまた、スペーサーに結合するPEgRNAのアニーリング領域に対して好ましく競合し得る。最後に、キッシングループもまた他の鋳型RNAをゲノム部位に動員するために用いられ得、1つのRNAから他へのRT活性のスワッピングを可能化し得る。例の改善は: The addition of kissing loops or dimerization motifs such as GNRA tetraloop/tetraloop receptor pair 200 at the 5' and 3' ends of the PEgRNA can also result in efficient circularization of the PEgRNA, improving stability. In addition, it is envisioned that the addition of these motifs can allow for physical separation of the PEgRNA spacer and primer, preventing spacer entrapment that would interfere with PE activity. Short 5' or 3' extensions of the PEgRNA that form small toehold hairpins in the spacer region can also compete favorably for the annealing region of the PEgRNA that binds to the spacer. Finally, kissing loops can also be used to recruit other template RNAs to genomic sites, allowing swapping of RT activity from one RNA to another. Example improvements are:

PEgRNA-HDV融合体
GGCCCAGACTGAGCACGTGAGTTTTAGAGCTAGAAATAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGGACCGAGTCGGTCCTCTGCCATCAAAGCGTGCTCAGTCTGGGCCGGCATGGTCCCAGCCTCCTCGCTGGCGCCGGCTGGGCAACATGCTTCGGCATGGCGAATGGGACTTTTTTT(配列番号230)
PEGRNA-HDV fusions
GGCCCAGACTGAGCACGTGAGTTTTAGAGCTAGAAATAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGGACCGAGTCGGTCCTCTGCCATCAAAGCGTGCTCAGTCTGGGCCGGCATGGTCCCAGCCTCCTCGCTGGCGCCGGCTGGGCAACATGCTTCGGCATGGCGAATGGGACTTTTTTT (SEQ ID NO: 230)

PEgRNA-MMLVキッシングループ
GGTGGGAGACGTCCCACCGGCCCAGACTGAGCACGTGAGTTTTAGAGCTAGAAATAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGGACCGAGTCGGTCCTCTGCCATCAAAGCTTCGACCGTGCTCAGTCTGGTGGGAGACGTCCCACCTTTTTTT(配列番号231)
PEgRNA-MMLV kissing loop
GGTGGGAGACGTCCCACCGGCCCAGACTGAGCACGTGAGTTTTAGAGCTAGAAATAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGGACCGAGTCGGTCCTCTGCCATCAAAGCTTCGACCGTGCTCAGTCTGGTGGGAGACGTCCCACCTTTTTTTT (SEQ ID NO: 231)

PEgRNA-VSリボザイムキッシングループ
GAGCAGCATGGCGTCGCTGCTCACGGCCCAGACTGAGCACGTGAGTTTTAGAGCTAGAAATAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGGACCGAGTCGGTCCTCTGCCATCAAAGCTTCGACCGTGCTCAGTCTCCATCAGTTGACACCCTGAGGTTTTTTT(配列番号232)
PEgRNA-VS ribozyme kissing loop
GAGCAGCATGGCGTCGCTGCTCACGGCCCAGACTGAGCACGTGAGTTTTAGAGCTAGAAATAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGGACCGAGTCGGTCCTCTGCCATCAAAGCTTCGACCGTGCTCAGTCTCCATCAGTTGACACCCTGAGGTTTTTTT (SEQ ID NO: 232)

PEgRNA-GNRAテトラループ/テトラループ受容体
GCAGACCTAAGTGGUGACATATGGTCTGGGCCCAGACTGAGCACGTGAGTTTTAGAGCTAUACGTAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTUACGAAGTGGGACCGAGTCGGTCCTCTGCCATCAAAGCTTCGACCGTGCTCAGTCTGCATGCGATTAGAAATAATCGCATGTTTTTTT(配列番号233)
PEgRNA-GNRA tetraloop/tetraloop receptor
GCAGACCTAAGTGGUGACATATGGTCTGGGCCCAGACTGAGCACGTGAGTTTTAGAGCTAUACGTAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTUACGAAGTGGGACCGAGTCGGTCCTCTGCCATCAAAGCTTCGACCGTGCTCAGTCTGCATGCGATTAGAAATAATCGCATGTTTTTTT (SEQ ID NO: 233)

2次RNA-HDV融合体を切り替えるPEgRNA鋳型
TCTGCCATCAAAGCTGCGACCGTGCTCAGTCTGGTGGGAGACGTCCCACCGGCCGGCATGGTCCCAGCCTCCTCGCTGGCGCCGGCTGGGCAACATGCTTCGGCATGGCGAATGGGACTTTTTTT(配列番号234)
を包含するが、これらに限定されない。
PEgRNA template to switch secondary RNA-HDV fusions
TCTGCCATCAAAGCTGCGACCGTGCTCAGTCTGGTGGGAGACGTCCCACCGGCCGGCATGGTCCCAGCCTCCTCGCTGGCGCCGGCTGGGCAACATGCTTCGGCATGGCGAATGGGACTTTTTTT (SEQ ID NO: 234)
These include, but are not limited to:

PEgRNA骨格は、どのようにしてSpCas9およびプライム編集因子(PE)が改善されたかに類縁の様式で、指向性進化によってさらに改善され得る。指向性進化はCas9または進化したCas9バリアントによるPEgRNA認識を増強し得る。加えて、異なるPEgRNA骨格配列が異なるゲノム座位においては最適であろうということが蓋然的であり、当の部位におけるPE活性を増強するか、オフターゲット活性を縮減するか、または両方かどちらかである。最後に、他のRNAモチーフが追加されたPEgRNA骨格の進化は、ほとんど確実に、未進化の融合RNAに対して相対的に融合PEgRNAの活性を改善するであろう。例えば、c-ジ-GMP-Iアプタマーおよびハンマーヘッドリボザイムから成るアロステリックリボザイムの進化は劇的に改善された活性に至り202、進化がハンマーヘッド-PEgRNA融合体の活性も改善するであろうということを示唆した。加えて、Cas9は現行では一般的にsgRNAの5'伸長を忍容しないが、指向性進化は、蓋然的には、この非忍容性を和らげる有能な変異を生成し、追加のRNAモチーフが利用されることを許すであろう。 The PEgRNA backbone can be further improved by directed evolution in a manner analogous to how SpCas9 and prime editors (PEs) have been improved. Directed evolution can enhance PEgRNA recognition by Cas9 or evolved Cas9 variants. In addition, it is likely that different PEgRNA backbone sequences will be optimal at different genomic loci, either enhancing PE activity at the site, reducing off-target activity, or both. Finally, evolution of the PEgRNA backbone with additional RNA motifs will almost certainly improve the activity of the fusion PEgRNA relative to the unevolved fusion RNA. For example, evolution of an allosteric ribozyme consisting of a c-di-GMP-I aptamer and a hammerhead ribozyme led to dramatically improved activity, 202 suggesting that evolution will also improve the activity of hammerhead-PEgRNA fusions. In addition, although Cas9 currently does not generally tolerate 5' extensions of sgRNAs, directed evolution will likely generate potent mutations that alleviate this intolerance, allowing additional RNA motifs to be exploited.

本開示は、ここで開示されるプライム編集システムの効力をさらに改善するためのいずれかのかかるやり方を企図する。 The present disclosure contemplates any such manner to further improve the efficacy of the prime editing system disclosed herein.

O.拡張された標的化範囲を有するプライム編集の使用
Streptococcus pyogenes Cas9(SpCas9)を用いるプライム編集(PE)は、SpCas9が効率的に結合し得る好適に置かれたNGGプロトスペーサー隣接モチーフ(PAM)があるゲノム座位において、全ての1塩基置換、挿入、欠失、およびそれらの組み合わせを効率的に組み入れ組み入れ得る。しかしながら、別の側面において、本明細書に記載の方法は、アクセス可能なPAM、よって効率的なPEのためのアクセス可能な標的化可能なゲノム座位を拡張することによって、PEの標的化能力を幅広くする。SpCas9以外のRNAによってガイドされるDNA結合タンパク質を用いるプライム編集因子は、異なるPAMへのアクセスを許すことによってゲノム座位の拡張された標的化可能な範囲を可能化する。加えて、SpCas9よりも小さいRNAによってガイドされるDNA結合タンパク質の使用は、より効率的なウイルス送達をもまた許す。SpCas9以外のCasタンパク質または他のRNAによってガイドされるDNA結合タンパク質によるPEは、SpCas9に基づくPEを用いてはアクセス不可能または非効率的どちらかであった高効率の治療学的編集を許すであろう。
O. Use of Prime Editing with Extended Targeting Range
Prime editing (PE) using Streptococcus pyogenes Cas9 (SpCas9) can efficiently incorporate all single base substitutions, insertions, deletions, and combinations thereof at genomic loci with appropriately placed NGG protospacer adjacent motifs (PAMs) to which SpCas9 can efficiently bind. However, in another aspect, the methods described herein broaden the targeting capabilities of PE by expanding the accessible PAMs, and thus the accessible targetable genomic loci for efficient PE. Prime editing using RNA-guided DNA-binding proteins other than SpCas9 allows for an expanded targetable range of genomic loci by allowing access to different PAMs. In addition, the use of RNA-guided DNA-binding proteins smaller than SpCas9 also allows for more efficient viral delivery. PE with Cas proteins other than SpCas9 or other RNA-guided DNA-binding proteins will allow for highly efficient therapeutic editing that was either inaccessible or inefficient using SpCas9-based PE.

これは、NGG PAMに対して相対的な編集の非理想的な間隔を原因として、SpCas9に基づくPEが非効率的であるか、またはSpCas9に基づく構築物の総体的なサイズが細胞発現および/もしくは送達にとって法外であるかどちらかの状況に用いられることが予想される。SpCas9の少数のかつ不良に位置付けられたNGG PAMを標的領域の近くに有するハンチンチン遺伝子などの特定の疾患に該当する(relevent)座位は、NGA PAMを認識するSpCas9-VRQRなどのPEシステムの異なるCasタンパク質を用いて容易に標的化され得る。より効率的にAAVベクターにパッケージングされ得るより小さいPE構築物を生成するために、より小さいCasタンパク質が用いられ、標的組織へのより良好な送達を可能化するであろう。図61は、RNAによってガイドされるDNA結合タンパク質としてStaphylococcus aureus CRISPR-Casを用いるプライム編集の実施化を示す。NTは無処置の対照である。 This is expected to be used in situations where SpCas9-based PE is either inefficient due to non-ideal spacing of the edits relative to the NGG PAM, or the overall size of the SpCas9-based construct is prohibitive for cellular expression and/or delivery. Certain disease-relevant loci, such as the huntingtin gene, which have SpCas9's few and poorly positioned NGG PAMs close to the target region, can be easily targeted using a different Cas protein of the PE system, such as SpCas9-VRQR, which recognizes the NGA PAM. Smaller Cas proteins would be used to generate smaller PE constructs that can be more efficiently packaged into AAV vectors, enabling better delivery to target tissues. Figure 61 shows the implementation of prime editing using Staphylococcus aureus CRISPR-Cas as an RNA-guided DNA-binding protein. NT is untreated control.

図62A~62Bは、プライム編集による精密な位置付けにおける所望の編集の効率的な組み入れのためのプロトスペーサーの重要性の実証を提供する。これは、このテクノロジーの新規の特色としての代替的なPAMおよびプロトスペーサーの重要性を強調する。図62Aの「n.d.」は「検出されない」である。 Figures 62A-62B provide a demonstration of the importance of the protospacer for efficient incorporation of the desired edit at precise positioning by prime editing. This highlights the importance of alternative PAMs and protospacers as a novel feature of this technology. "n.d." in Figure 62A is "not detected."

図63は、プライム編集因子システムのRNAによってガイドされるDNA結合タンパク質としてSpCas9(H840A)-VRQRおよびSpCas9(H840A)-VRERを用いるPEの実施化を示す。SpCas9(H840A)-VRQR napDNAbpは配列番号87として本明細書に開示の。SpCas9(H840A)-VRER napDNAbpは配列番号88として本明細書に開示の。SpCas9(H840A)-VRER-MMLV RT融合タンパク質は配列番号516として本願において開示され、MMLV RTはD200N、L603W、T330P、T306K、およびW313F置換を野生型MMLV RTに対して相対的に含む。SpCas9(H840A)-VRQR-MMLV RT融合タンパク質は配列番号515として本願において開示され、MMLV RTはD200N、L603W、T330P、T306K、およびW313F置換を野生型MMLV RTに対して相対的に含む。ヒトゲノム上の7つの異なる座位が標的化される:4つはSpCas9(H840A)-VRQR-MMLV RTプライム編集因子システムにより、3つはSpCas9(H840A)-VRER-MMLV RTシステムによる。試験された構築物のアミノ酸配列は次のとおりである:

Figure 2020191243000269

Figure 2020191243000270

Figure 2020191243000271

Figure 2020191243000272
Figure 63 shows the implementation of PE using SpCas9(H840A)-VRQR and SpCas9(H840A)-VRER as the RNA-guided DNA binding proteins of the prime editor system. SpCas9(H840A)-VRQR napDNAbp is disclosed herein as SEQ ID NO: 87. SpCas9(H840A)-VRER napDNAbp is disclosed herein as SEQ ID NO: 88. The SpCas9(H840A)-VRER-MMLV RT fusion protein is disclosed herein as SEQ ID NO: 516, where the MMLV RT contains D200N, L603W, T330P, T306K, and W313F substitutions relative to wild-type MMLV RT. The SpCas9(H840A)-VRQR-MMLV RT fusion protein is disclosed herein as SEQ ID NO:515, in which the MMLV RT contains D200N, L603W, T330P, T306K, and W313F substitutions relative to wild-type MMLV RT. Seven different loci on the human genome are targeted: four by the SpCas9(H840A)-VRQR-MMLV RT prime editor system and three by the SpCas9(H840A)-VRER-MMLV RT system. The amino acid sequences of the constructs tested are as follows:
Figure 2020191243000269

Figure 2020191243000270

Figure 2020191243000271

Figure 2020191243000272

図63に示されているとおり、SpCas9(H840A)-VRQR-MMLV RTは「AGAG」および「GGAG」を包含するPAM部位において作動性であり、いくらかの編集活性を「GGAT」および「AGAT」PAM配列において有した。SpCas9(H840A)-VRER-MMLV RTは「AGCG」および「GGCG」を包含するPAM部位において作動性であり、いくらかの編集活性を「TGCG」において有した。 As shown in Figure 63, SpCas9(H840A)-VRQR-MMLV RT was active at PAM sites including "AGAG" and "GGAG" and had some editing activity at "GGAT" and "AGAT" PAM sequences. SpCas9(H840A)-VRER-MMLV RT was active at PAM sites including "AGCG" and "GGCG" and had some editing activity at "TGCG".

データは、プライム編集が、異なるPAM特異性を持つnapDNAbp、例えば本明細書に記載のCas9バリアントを用いて行われ得るということを実証している。 The data demonstrate that prime editing can be performed using napDNAbp with different PAM specificities, such as the Cas9 variants described herein.

種々の態様において、変改されたPAM特異性を有するnapDNAbp(例えばCas9)は、その3'端に5'-NAA-3'PAM配列を含む標的配列に対して活性を発揮する変異の組み合わせを含む。いくつかの態様では、変異の組み合わせは、表1の列記されているクローンのいずれか1つに存在する。いくつかの態様では、変異の組み合わせは、表1の列記されているクローンの保存的変異である。いくつかの態様では、Cas9タンパク質は、表1に列記されるCas9クローンのいずれか1つの変異の組み合わせを含む。 In various embodiments, the napDNAbp (e.g., Cas9) with altered PAM specificity comprises a combination of mutations that exert activity against a target sequence that comprises a 5'-NAA-3'PAM sequence at its 3' end. In some embodiments, the combination of mutations is present in any one of the clones listed in Table 1. In some embodiments, the combination of mutations is a conservative mutation of the clones listed in Table 1. In some embodiments, the Cas9 protein comprises a combination of mutations of any one of the Cas9 clones listed in Table 1.

表1:NAA PAMクローン

Figure 2020191243000273

Figure 2020191243000274
Table 1: NAA PAM clones
Figure 2020191243000273

Figure 2020191243000274

いくつかの態様では、Cas9タンパク質は、表1のバリアントのいずれか1つによって提供されるCas9タンパク質のアミノ酸配列と少なくとも80%同一であるアミノ酸配列を含む。いくつかの態様では、Cas9タンパク質は、表1のバリアントのいずれか1つによって提供されるCas9タンパク質のアミノ酸配列と少なくとも85%、少なくとも90%、少なくとも92%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも99.5%同一であるアミノ酸配列を含む。 In some embodiments, the Cas9 protein comprises an amino acid sequence that is at least 80% identical to the amino acid sequence of a Cas9 protein provided by any one of the variants in Table 1. In some embodiments, the Cas9 protein comprises an amino acid sequence that is at least 85%, at least 90%, at least 92%, at least 95%, at least 96%, at least 97%, at least 98%, at least 99%, or at least 99.5% identical to the amino acid sequence of a Cas9 protein provided by any one of the variants in Table 1.

いくつかの態様では、Cas9タンパク質は、配列番号18によって提供されるStreptococcus pyogenes Cas9と比較して、その3'端に標準的なPAM(5'-NGG-3')を含まない標的配列に対する増大した活性を発揮する。いくつかの態様では、Cas9タンパク質は、同じ標的配列に対する配列番号18によって提供されるStreptococcus pyogenes Cas9の活性と比較して、少なくとも5倍増大した標準的なPAM配列(5'-NGG-3')に直接的に隣接しない3'端を有する標的配列に対する活性を発揮する。いくつかの態様では、Cas9タンパク質は、同じ標的配列に対する配列番号18によって提供されるStreptococcus pyogenesの活性と比較して、少なくとも10倍、少なくとも50倍、少なくとも100倍、少なくとも500倍、少なくとも1,000倍、少なくとも5,000倍、少なくとも10,000倍、少なくとも50,000倍、少なくとも100,000倍、少なくとも500,000倍、または少なくとも1,000,000倍増大した標準的なPAM配列(5'-NGG-3')に直接的に隣接しない標的配列に対する活性を発揮する。いくつかの態様では、標的配列の3'端はAAA、GAA、CAA、またはTAA配列に直接的に隣接する。いくつかの態様では、Cas9タンパク質は、その3'端に5'-NAC-3'PAM配列を含む標的配列に対する活性を発揮する変異の組み合わせを含む。いくつかの態様では、変異の組み合わせは、表2の列記されているクローンのいずれか1つに存在する。いくつかの態様では、変異の組み合わせは表2の列記されているクローンの保存的変異である。いくつかの態様では、Cas9タンパク質は、表2に列記されるCas9クローンのいずれか1つの変異の組み合わせを含む。 In some embodiments, the Cas9 protein exhibits increased activity against a target sequence that does not contain a canonical PAM (5'-NGG-3') at its 3' end compared to the Streptococcus pyogenes Cas9 provided by SEQ ID NO: 18. In some embodiments, the Cas9 protein exhibits at least a 5-fold increased activity against a target sequence having a 3' end that is not immediately adjacent to a canonical PAM sequence (5'-NGG-3') compared to the activity of the Streptococcus pyogenes Cas9 provided by SEQ ID NO: 18 against the same target sequence. In some embodiments, the Cas9 protein exerts at least 10-fold, at least 50-fold, at least 100-fold, at least 500-fold, at least 1,000-fold, at least 5,000-fold, at least 10,000-fold, at least 50,000-fold, at least 100,000-fold, at least 500,000-fold, or at least 1,000,000-fold increased activity against a target sequence that is not immediately adjacent to a standard PAM sequence (5'-NGG-3') compared to the activity of Streptococcus pyogenes provided by SEQ ID NO: 18 against the same target sequence. In some embodiments, the 3' end of the target sequence is immediately adjacent to an AAA, GAA, CAA, or TAA sequence. In some embodiments, the Cas9 protein comprises a combination of mutations that exerts activity against a target sequence that comprises a 5'-NAC-3' PAM sequence at its 3' end. In some embodiments, the combination of mutations is present in any one of the clones listed in Table 2. In some embodiments, the combination of mutations is a conservative mutation of the clones listed in Table 2. In some embodiments, the Cas9 protein comprises a combination of mutations in any one of the Cas9 clones listed in Table 2.

表2:NAC PAMクローン

Figure 2020191243000275

Figure 2020191243000276

Figure 2020191243000277
Table 2: NAC PAM clones
Figure 2020191243000275

Figure 2020191243000276

Figure 2020191243000277

いくつかの態様では、Cas9タンパク質は、表2のバリアントのいずれか1つによって提供されるCas9タンパク質のアミノ酸配列と少なくとも80%同一であるアミノ酸配列を含む。いくつかの態様では、Cas9タンパク質は、表2のバリアントのいずれか1つによって提供されるCas9タンパク質のアミノ酸配列と少なくとも85%、少なくとも90%、少なくとも92%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも99.5%同一であるアミノ酸配列を含む。 In some embodiments, the Cas9 protein comprises an amino acid sequence that is at least 80% identical to the amino acid sequence of a Cas9 protein provided by any one of the variants in Table 2. In some embodiments, the Cas9 protein comprises an amino acid sequence that is at least 85%, at least 90%, at least 92%, at least 95%, at least 96%, at least 97%, at least 98%, at least 99%, or at least 99.5% identical to the amino acid sequence of a Cas9 protein provided by any one of the variants in Table 2.

いくつかの態様では、Cas9タンパク質は、配列番号18によって提供されるStreptococcus pyogenes Cas9と比較して、その3'端に標準的なPAM(5'-NGG-3')を含まない標的配列に対する増大した活性を発揮する。いくつかの態様では、Cas9タンパク質は、同じ標的配列に対する配列番号18によって提供されるStreptococcus pyogenes Cas9の活性と比較して、少なくとも5倍増大した標準的なPAM配列(5'-NGG-3')に直接的に隣接しない3'端を有する標的配列に対する活性を発揮する。いくつかの態様では、Cas9タンパク質は、同じ標的配列に対する配列番号18によって提供されるStreptococcus pyogenesの活性と比較して、少なくとも10倍、少なくとも50倍、少なくとも100倍、少なくとも500倍、少なくとも1,000倍、少なくとも5,000倍、少なくとも10,000倍、少なくとも50,000倍、少なくとも100,000倍、少なくとも500,000倍、または少なくとも1,000,000倍増大した、標準的なPAM配列(5'-NGG-3')に直接的に隣接しない標的配列に対する活性を発揮する。いくつかの態様では、標的配列の3'端はAAC、GAC、CAC、またはTAC配列に直接的に隣接する。 In some embodiments, the Cas9 protein exhibits increased activity against a target sequence that does not contain a canonical PAM (5'-NGG-3') at its 3' end compared to the Streptococcus pyogenes Cas9 provided by SEQ ID NO: 18. In some embodiments, the Cas9 protein exhibits at least 5-fold increased activity against a target sequence having a 3' end that is not immediately adjacent to a canonical PAM sequence (5'-NGG-3') compared to the activity of the Streptococcus pyogenes Cas9 provided by SEQ ID NO: 18 against the same target sequence. In some embodiments, the Cas9 protein exerts at least 10-fold, at least 50-fold, at least 100-fold, at least 500-fold, at least 1,000-fold, at least 5,000-fold, at least 10,000-fold, at least 50,000-fold, at least 100,000-fold, at least 500,000-fold, or at least 1,000,000-fold increased activity against a target sequence that is not immediately adjacent to a canonical PAM sequence (5'-NGG-3') compared to the activity of Streptococcus pyogenes provided by SEQ ID NO: 18 against the same target sequence. In some embodiments, the 3' end of the target sequence is immediately adjacent to an AAC, GAC, CAC, or TAC sequence.

いくつかの態様では、Cas9タンパク質は、その3'端に5'-NAT-3'PAM配列を含む標的配列に対する活性を発揮する変異の組み合わせを含む。いくつかの態様では、変異の組み合わせは表3の列記されているクローンのいずれか1つに存在する。いくつかの態様では、変異の組み合わせは表3の列記されているクローンの保存的変異である。いくつかの態様では、Cas9タンパク質は、表3に列記されるCas9クローンのいずれか1つの変異の組み合わせを含む。 In some embodiments, the Cas9 protein comprises a combination of mutations that exerts activity against a target sequence that comprises a 5'-NAT-3'PAM sequence at its 3' end. In some embodiments, the combination of mutations is present in any one of the clones listed in Table 3. In some embodiments, the combination of mutations is a conservative mutation of the clones listed in Table 3. In some embodiments, the Cas9 protein comprises a combination of mutations of any one of the Cas9 clones listed in Table 3.

表3:NAT PAMクローン

Figure 2020191243000278
Table 3: NAT PAM clones
Figure 2020191243000278

標準的なSpCas9と比較して差次的なPAM特異性を呈示する上のCas9バリアントのいずれかは、本明細書に開示のプライム編集因子に用いられ得る。 Any of the above Cas9 variants that exhibit differential PAM specificity compared to standard SpCas9 can be used in the prime editors disclosed herein.

P.リコンビナーゼ標的部位を挿入するためのプライム編集の使用
別の側面において、プライム編集は、リコンビナーゼ部位(または「リコンビナーゼ認識配列」)を所望のゲノム部位に挿入するために用いられ得る。リコンビナーゼ部位の挿入は、部位特異的な遺伝子変化をゲノムに成し遂げるためのプログラムされた位置付けを提供する。かかる遺伝子変化は、他の遺伝子変化の中でも、例えばプラスミドのゲノム取り入れ、ゲノム欠失または挿入、染色体転座、およびカセット交換を包含し得る。遺伝子変化のこれらの例示の型は図64B~64Fにおいて例解されている。それから、組み入れされたリコンビナーゼ認識配列は、その部位における部位特異的な組み換えを行うために用いられて、種々の組み換えアウトカム、例えば切除、取り入れ、逆位、またはDNAフラグメントの交換を成就し得る。例えば、図65はリコンビナーゼ部位の組み入れを例解し、これはそれからGFP発現マーカーを含むDNAドナー鋳型を取り入れするために用いられ得る。リコンビナーゼ部位に取り入れされたGFP発現システムを含有する細胞は、蛍光発光するであろう。
P. Use of prime editing to insert recombinase target sites
In another aspect, prime editing can be used to insert a recombinase site (or "recombinase recognition sequence") into a desired genomic site. The insertion of the recombinase site provides a programmed location to effect site-specific genetic alterations into the genome. Such genetic alterations can include, for example, genomic incorporation of a plasmid, genomic deletion or insertion, chromosomal translocation, and cassette exchange, among other genetic alterations. These exemplary types of genetic alterations are illustrated in Figures 64 B-64F . The incorporated recombinase recognition sequence can then be used to effect site-specific recombination at that site to achieve various recombination outcomes, such as excision, incorporation, inversion, or exchange of DNA fragments. For example, Figure 65 illustrates the incorporation of a recombinase site, which can then be used to incorporate a DNA donor template containing a GFP-expressing marker. Cells containing a GFP expression system incorporated into the recombinase site will fluoresce.

リコンビナーゼ部位をゲノムに組み入れる機序は、ペプチド/タンパク質およびRNAタグなどの他の配列をゲノムに組み入れることに類縁である。リコンビナーゼ標的配列の組み入れを例示する模式図が図64(a)に示されている。プロセスは、リコンビナーゼ標的配列が導入されるであろう所望の標的座位を選択することによって始まる。次に、プライム編集因子融合体が提供される(「RT-Cas9:gRNA」)。ここで、「gRNA」はPEgRNAを言い、これは本明細書に記載の原理を用いてデザインされ得る。PEgRNAは種々の態様において図3Dに対応するアーキテクチャを含むであろう(5'-[~20ntスペーサー]-[gRNAコア]-[伸長アーム]-3'であって、伸長アームは3'から5'の方向にプライマー結合部位(「A」)、編集鋳型(「B」)、および相同アーム(「C」)を含む。編集鋳型(「B」)は、リコンビナーゼ部位に対応する配列、すなわち、リコンビナーゼ部位のセンスまたはアンチセンス鎖どちらかでありかつプライム編集プロセスによってゲノムDNA標的座位に組み込まれる相補的な一本鎖DNAをコードするPEgRNAの一本鎖RNAを含むであろう。 The mechanism of incorporating recombinase sites into a genome is analogous to incorporating other sequences into a genome, such as peptide/protein and RNA tags. A schematic illustrating the incorporation of a recombinase target sequence is shown in Figure 64(a). The process begins by selecting a desired target locus where a recombinase target sequence will be introduced. Next, a primed editor fusion is provided ("RT-Cas9:gRNA"), where "gRNA" refers to a PEgRNA, which may be designed using the principles described herein. The PEgRNA will in various embodiments comprise an architecture corresponding to FIG. 3D (5'-[~20 nt spacer]-[gRNA core]-[extension arm]-3', where the extension arm comprises, in a 3' to 5' direction, a primer binding site ("A"), an editing template ("B"), and a homology arm ("C"). The editing template ("B") will comprise a single strand of PEgRNA encoding a sequence corresponding to a recombinase site, i.e., a complementary single strand of DNA that is either the sense or antisense strand of the recombinase site and that is integrated into the genomic DNA target locus by the primed editing process.

種々の側面では、本開示は、ヒトまたは他のゲノム上の高価値の座位にリコンビナーゼ認識配列を導入するためのPEの使用を可能にする。これらは、部位特異的なリコンビナーゼ(単数または複数)に対する暴露後に、精密なかつ効率的なゲノム改変を導くであろう(図64)。図64に示されている(show)種々の態様では、PEは、(b)DNAドナー鋳型のゲノム取り入れの部位としての使用のための単一のSSR標的を挿入するために用いられ得る。(c)は、どのようにしてSSR標的部位のタンデム挿入がゲノムのある部分を欠失させるために用いられ得るかを示す。(d)は、どのようにしてSSR標的部位のタンデム挿入がゲノムのある部分を逆位させるために用いられ得るかを示す。(e)は、どのようにして2つの遠位の染色体領域における2つのSSR標的部位の挿入が染色体転座をもたらし得るかを示す。(f)は、どのようにしてゲノム上の2つの異なるSSR標的部位の挿入がDNAドナー鋳型からのカセットを交換するために用いられ得るかを示す。ゲノム改変の型の夫々は、SSR標的を挿入するためにPEを用いることによって想定されるが、このリストもまた限定することを意味されない。 In various aspects, the present disclosure enables the use of PE to introduce recombinase recognition sequences at high-value loci on human or other genomes. These will lead to precise and efficient genome modification after exposure to site-specific recombinase(s) (Figure 64). In various embodiments shown in Figure 64, PE can be used to insert (b) a single SSR target for use as a site of genomic incorporation of a DNA donor template. (c) shows how tandem insertion of SSR target sites can be used to delete a portion of a genome. (d) shows how tandem insertion of SSR target sites can be used to invert a portion of a genome. (e) shows how insertion of two SSR target sites in two distal chromosomal regions can result in a chromosomal translocation. (f) shows how insertion of two different SSR target sites on a genome can be used to exchange a cassette from a DNA donor template. Each of the types of genome modifications envisioned by using PE to insert SSR targets, but this list is also not meant to be limiting.

リコンビナーゼ認識配列のPEによって媒介される導入は、大スケールのゲノム欠陥、例えば遺伝子喪失、逆位、もしくは重複、または染色体転座によって引き起こされる遺伝子疾患の処置にとって特に有用であり得る1~7(表6)。例えば、ウィリアムズ・ボイレン症候群は染色体7上の24の欠失によって引き起こされる発達障害である21。現行では、生細胞における複数の遺伝子全体の効率的なかつ標的化された挿入のためのテクノロジーは存在しない(かかる全長遺伝子挿入をするPEのポテンシャルは現行では調査されているが、まだ確立されていない);しかしながら、PEによって挿入される標的におけるリコンビナーゼによって媒介される取り入れは、このおよび他の疾患の永久的な治癒への1つのアプローチをオファーする。加えて、リコンビナーゼ認識配列の標的化された導入は、トランスジェニック植物、動物研究モデル、バイオプロダクション細胞株、または他のカスタム真核細胞株の生成を包含する適用にとって高度に有能であり得る。例えば、PE特異的な標的におけるトランスジェニック植物のリコンビナーゼによって媒介されるゲノム再構成は、改善された特性を有する農作物を生成することのボトルネックの1つを克服し得る8,9 PE-mediated introduction of recombinase recognition sequences may be particularly useful for the treatment of genetic diseases caused by large-scale genomic defects, such as gene losses, inversions, or duplications, or chromosomal translocations1-7 (Table 6). For example, Williams-Beuren syndrome is a developmental disorder caused by a deletion of 24 on chromosome 721. Currently, no technology exists for efficient and targeted insertion of entire genes in living cells (the potential of PE for such full-length gene insertion is currently being explored but not yet established); however, recombinase-mediated incorporation in PE-inserted targets offers one approach to a permanent cure of this and other diseases. In addition, targeted introduction of recombinase recognition sequences may be highly effective for applications involving the generation of transgenic plants, animal research models, bioproduction cell lines, or other custom eukaryotic cell lines. For example, recombinase-mediated genome reorganization of transgenic plants in PE-specific targets may overcome one of the bottlenecks in generating agricultural crops with improved properties8,9 .

表6.リコンビナーゼ認識配列のPEに基づく組み入れによって修復され得る大スケールゲノム改変にリンクした遺伝子疾患の例。

Figure 2020191243000279
Table 6. Examples of genetic diseases linked to large-scale genome modifications that can be repaired by PE-based integration of recombinase recognition sequences.
Figure 2020191243000279

いくつものSSRファミリーメンバーが特徴付けられ、それらのリコンビナーゼ認識配列が記載されており、天然のおよび操作されたチロシンリコンビナーゼ(表7)、ラージセリンインテグラーゼ(表8)、セリンリゾルバーゼ(表9)、およびチロシンインテグラーゼ(表10)を包含する。増強されたゲノム取り入れ率を実証する改変された標的配列もまたいくつかのSSRについて記載されている22-30。天然のリコンビナーゼに加えて、別物の特異性を有するプログラム可能なリコンビナーゼが開発されている31~40。所望の適用に依存して、PEを用いて、これらの認識配列の1つ以上が、規定された位置付け、例えばセーフハーバー座位においてゲノム上に導入され得る41~43 Several SSR family members have been characterized and their recombinase recognition sequences described, including natural and engineered tyrosine recombinases (Table 7), large serine integrases (Table 8), serine resolvases (Table 9), and tyrosine integrases (Table 10). Modified target sequences that demonstrate enhanced genome integration rates have also been described for some SSRs. 22-30 In addition to natural recombinases, programmable recombinases with alternative specificities have been developed. 31-40 Depending on the desired application, one or more of these recognition sequences can be introduced into the genome at defined locations, such as safe harbor loci, using PE. 41-43

例えば、プライム編集によるゲノム上の単一のリコンビナーゼ認識配列の導入は、DNAドナー鋳型との取り入れ的な組み換えをもたらすであろう(図64b)。ヒト細胞においてロバストに作動するセリンインテグラーゼは、遺伝子取り入れに特に良く適し得る44,45 For example, introduction of a single recombinase recognition sequence into the genome by prime editing would result in integrative recombination with a DNA donor template (Figure 64b). Serine integrase, which operates robustly in human cells, may be particularly well suited for gene integration44,45 .

加えて、標的のアイデンティティーおよび向きに依存して、2つのリコンビナーゼ認識配列の導入は介在配列の欠失、介在配列の逆位、染色体転座、またはカセット交換をもたらし得る(図64C~64F)。すでにリコンビナーゼ標的に密に似ている内生配列を選ぶことによって、完全なリコンビナーゼ標的を導入するために要求される編集の範囲は縮減されるであろう。 In addition, depending on the identity and orientation of the targets, introduction of two recombinase recognition sequences can result in an intervening sequence deletion, an intervening sequence inversion, a chromosomal translocation, or a cassette exchange (Figures 64C-64F ). By choosing an endogenous sequence that already closely resembles a recombinase target, the extent of editing required to introduce a perfect recombinase target will be reduced.

最後に、いくつかのリコンビナーゼは、ネイティブに生起する偽部位(pseudosite)においてヒトまたは真核ゲノムに取り入れすることが実証されている46~64。PE編集は、これらの天然の偽部位における取り入れ率を増強するために、または代替的には欲されないオフターゲット配列としての用をなし得る偽部位を消去するために、これらの座位を改変するために用いられ得る。 Finally, several recombinases have been demonstrated to integrate into human or eukaryotic genomes at natively occurring pseudosites. 46-64 PE editing can be used to modify these loci to enhance integration rates at these natural pseudosites, or alternatively to eliminate pseudosites that may serve as unwanted off-target sequences.

本開示は、PEを用いて真核ゲノム上にリコンビナーゼ標的配列を導入するための一般的な方法論を記載する。これの適用は無限に近い。ゲノム編集反応はCRISPR/Cas9タンパク質と逆転写酵素ドメインとのキメラ融合体の「プライム編集因子」による使用を意図され、これはカスタムのプライム編集ガイドRNA(PEgRNA)を利用する。さらに伸長して、Cas9ツールおよび相同組み換え修復(HDR)経路は、いくつかの技術を用いてインデル率を低下させることによって、DNA鋳型からリコンビナーゼ認識配列を導入するためにもまた有効利用され得る65~67。ヒト細胞培養における概念実証実験が図65に示されている。 This disclosure describes a general methodology for introducing recombinase target sequences onto eukaryotic genomes using PE. The applications of this are nearly limitless. The genome editing reaction is intended for use with a "prime editor" of a chimeric fusion of CRISPR/Cas9 protein and reverse transcriptase domain, which utilizes a custom prime editing guide RNA (PEgRNA). Extending further, the Cas9 tool and the homology-directed repair (HDR) pathway can also be exploited to introduce recombinase recognition sequences from DNA templates by reducing the indel rate using several techniques65-67 . A proof-of-concept experiment in human cell culture is shown in Figure 65.

次のいくつかの表は、リコンビナーゼ認識配列のPEによって導かれる組み入れに関して上の記載に引用され、用いられ得る例示のリコンビナーゼとPEによって組み入れられ得るそれらの対応するリコンビナーゼ認識配列とのリストを提供する。
表7.チロシンリコンビナーゼおよびSSR標的配列。

Figure 2020191243000280

Figure 2020191243000281

表8.ラージセリンインテグラーゼおよびSSR標的配列。
Figure 2020191243000282

Figure 2020191243000283

Figure 2020191243000284

表9.セリンリゾルバーゼおよびSSR標的配列。
Figure 2020191243000285

Figure 2020191243000286

表10.チロシンインテグラーゼおよび標的配列。
Figure 2020191243000287

Figure 2020191243000288
The next several tables provide a list of exemplary recombinases that can be used in the discussion above with respect to PE-directed incorporation of recombinase recognition sequences and their corresponding recombinase recognition sequences that can be incorporated by PE.
Table 7. Tyrosine recombinases and SSR target sequences.
Figure 2020191243000280

Figure 2020191243000281

Table 8. Large serine integrase and SSR target sequences.
Figure 2020191243000282

Figure 2020191243000283

Figure 2020191243000284

Table 9. Serine resolvases and SSR target sequences.
Figure 2020191243000285

Figure 2020191243000286

Table 10. Tyrosine integrases and target sequences.
Figure 2020191243000287

Figure 2020191243000288

種々の他の側面では、本開示は、1つ以上のリコンビナーゼ認識配列を組み入れるためにPEを用いる方法と、部位特異的な組み換えへのそれらの使用とに関する。 In various other aspects, the disclosure relates to methods of using PE to incorporate one or more recombinase recognition sequences and their use for site-specific recombination.

いくつかの態様では、部位特異的な組み換えは、種々の組み換えアウトカム、例えば切除、取り入れ、逆位、またはDNAフラグメントの交換を成就させ得る。 In some embodiments, site-specific recombination can achieve a variety of recombination outcomes, such as excision, integration, inversion, or exchange of DNA fragments.

いくつかの態様では、方法は、2つ以上の核酸(例えばDNA)分子の2つ以上の領域のまたはそれらの間の組み換えを誘導することにとって有用である。他の態様において、方法は、単一の核酸分子(例えばDNA)の2つ以上の領域のまたはそれらの間の組み換えを誘導することにとって有用である。 In some embodiments, the methods are useful for inducing recombination of or between two or more regions of two or more nucleic acid (e.g., DNA) molecules. In other embodiments, the methods are useful for inducing recombination of or between two or more regions of a single nucleic acid molecule (e.g., DNA).

いくつかの態様では、本開示は、部位特異的な組み換えによってドナーDNA鋳型を取り入れするための方法を提供し:(a)プライム編集によってゲノム座位にリコンビナーゼ認識配列を組み入れること;(b)リコンビナーゼの存在下において、リコンビナーゼ認識配列をもまた含むDNAドナー鋳型とゲノム座位を接触させることを含む。 In some embodiments, the disclosure provides a method for incorporating a donor DNA template by site-specific recombination, comprising: (a) incorporating a recombinase recognition sequence into a genomic locus by prime editing; (b) contacting the genomic locus with a DNA donor template that also contains a recombinase recognition sequence in the presence of a recombinase.

他の態様において、本開示は、部位特異的な組み換えによってゲノム領域を欠失させるための方法を提供し:(a)プライム編集によってゲノム座位にリコンビナーゼ認識配列のペアを組み入れること;(b)ゲノム座位をリコンビナーゼと接触させることを含み、それによって、リコンビナーゼ認識配列のペア間のゲノム領域の欠失を触媒する。 In another aspect, the disclosure provides a method for deleting a genomic region by site-specific recombination, comprising: (a) incorporating a pair of recombinase recognition sequences at a genomic locus by prime editing; (b) contacting the genomic locus with a recombinase, thereby catalyzing the deletion of the genomic region between the pair of recombinase recognition sequences.

さらに他の態様において、本開示は、部位特異的な組み換えによってゲノム領域を逆位させるための方法を提供し:(a)プライム編集によってゲノム座位にリコンビナーゼ認識配列のペアを組み入れること;(b)ゲノム座位をリコンビナーゼと接触させることを含み、それによって、リコンビナーゼ認識配列のペア間のゲノム領域の逆位を触媒する。 In yet another aspect, the disclosure provides a method for inverting a genomic region by site-specific recombination, comprising: (a) incorporating a pair of recombinase recognition sequences at a genomic locus by prime editing; and (b) contacting the genomic locus with a recombinase, thereby catalyzing inversion of the genomic region between the pair of recombinase recognition sequences.

なお他の態様において、本開示は、第1のゲノム部位と第2のゲノム部位との間の染色体転座を誘導するための方法を提供し:(a)プライム編集によって第1のゲノム座位に第1のリコンビナーゼ認識配列を組み入れること;(b)プライム編集によって第2のゲノム座位に第2のリコンビナーゼ認識配列を組み入れること;(c)第1および第2のゲノム座位をリコンビナーゼと接触させることを含み、それによって、第1および第2のゲノム座位の染色体転座を触媒する。 In yet other aspects, the present disclosure provides a method for inducing a chromosomal translocation between a first genomic site and a second genomic site, comprising: (a) incorporating a first recombinase recognition sequence at the first genomic locus by prime editing; (b) incorporating a second recombinase recognition sequence at the second genomic locus by prime editing; and (c) contacting the first and second genomic loci with a recombinase, thereby catalyzing a chromosomal translocation of the first and second genomic loci.

他の態様において、本開示は、ゲノム座位とカセットを含むドナーDNAとの間のカセット交換を誘導するための方法を提供し:(a)プライム編集によって第1のゲノム座位に第1のリコンビナーゼ認識配列を組み入れること;(b)プライム編集によって第2のゲノム座位に第2のリコンビナーゼ認識配列を組み入れること;(c)第1および第2のリコンビナーゼ認識配列によってフランキングされているカセットを含むドナーDNAおよびリコンビナーゼと第1および第2のゲノム座位を接触させることを含み、それによって、フランキングされたゲノム座位とDNAドナー上のカセットとの交換を触媒する。 In other aspects, the disclosure provides a method for inducing cassette exchange between a genomic locus and a donor DNA containing a cassette, comprising: (a) incorporating a first recombinase recognition sequence at a first genomic locus by prime editing; (b) incorporating a second recombinase recognition sequence at a second genomic locus by prime editing; (c) contacting the first and second genomic loci with donor DNA containing a cassette flanked by the first and second recombinase recognition sequences and a recombinase, thereby catalyzing exchange of the flanked genomic locus with the cassette on the DNA donor.

ゲノム上の1つよりも多くのリコンビナーゼ認識配列の挿入が関わる種々の態様では、リコンビナーゼ認識配列は同じかまたは異なり得る。いくつかの態様では、リコンビナーゼ認識配列は同じである。他の態様において、リコンビナーゼ認識配列は異なる。 In various embodiments involving the insertion of more than one recombinase recognition sequence onto a genome, the recombinase recognition sequences can be the same or different. In some embodiments, the recombinase recognition sequences are the same. In other embodiments, the recombinase recognition sequences are different.

種々の態様において、リコンビナーゼはチロシンリコンビナーゼ、例えばCre、Dre、Vcre、Scre、Flp、B2、B3、Kw、R、TD1-40、Vika、Nigri、Panto、Kd、Fre、Cre(ALSHG)、Tre、Brec1、またはCre-R3M3であり得、表7に示されているとおりである。かかる態様では、リコンビナーゼ認識配列は使用中のリコンビナーゼに対応する表7のRRSであり得る。 In various embodiments, the recombinase can be a tyrosine recombinase, such as Cre, Dre, Vcre, Scre, Flp, B2, B3, Kw, R, TD1-40, Vika, Nigri, Panto, Kd, Fre, Cre(ALSHG), Tre, Brec1, or Cre-R3M3, as shown in Table 7. In such embodiments, the recombinase recognition sequence can be the RRS of Table 7 that corresponds to the recombinase being used.

種々の他の態様において、リコンビナーゼはラージセリンリコンビナーゼ、例えばBxb1、PhiC31、R4、phiBT1、MJ1、MR11、TP901-1、A118、V153、phiRV1、phi370.1、TG1、WB、BL3、SprA、phiJoe、phiK38、Int2、Int3、Int4、Int7、Int8、Int9、Int10、Int11、Int12、Int13、L1、peaches、Bxz2、またはSV1であり得、表8に示されているとおりである。かかる態様では、リコンビナーゼ認識配列は使用中のリコンビナーゼに対応する表8のRRSであり得る。 In various other embodiments, the recombinase can be a large serine recombinase, such as Bxb1, PhiC31, R4, phiBT1, MJ1, MR11, TP901-1, A118, V153, phiRV1, phi370.1, TG1, WB, BL3, SprA, phiJoe, phiK38, Int2, Int3, Int4, Int7, Int8, Int9, Int10, Int11, Int12, Int13, L1, peaches, Bxz2, or SV1, as shown in Table 8. In such embodiments, the recombinase recognition sequence can be the RRS of Table 8 corresponding to the recombinase being used.

なお他の態様において、リコンビナーゼはセリンリコンビナーゼ、例えばBxb1、PhiC31、R4、phiBT1、MJ1、MR11、TP901-1、A118、V153、phiRV1、phi370.1、TG1、WB、BL3、SprA、phiJoe、phiK38、Int2、Int3、Int4、Int7、Int8、Int9、Int10、Int11、Int12、Int13、L1、peaches、Bxz2、またはSV1であり得、表8に示されているとおりである。かかる態様では、リコンビナーゼ認識配列は使用中のリコンビナーゼに対応する表8のRRSであり得る。 In still other embodiments, the recombinase can be a serine recombinase, such as Bxb1, PhiC31, R4, phiBT1, MJ1, MR11, TP901-1, A118, V153, phiRV1, phi370.1, TG1, WB, BL3, SprA, phiJoe, phiK38, Int2, Int3, Int4, Int7, Int8, Int9, Int10, Int11, Int12, Int13, L1, peaches, Bxz2, or SV1, as shown in Table 8. In such embodiments, the recombinase recognition sequence can be the RRS of Table 8 corresponding to the recombinase being used.

他の態様において、リコンビナーゼは表9に示されているとおりGin、Cin、Hin、Min、またはSinなどのセリンリゾルバーゼであり得る。かかる態様では、リコンビナーゼ認識配列は、使用中のリコンビナーゼに対応する表9のRRSであり得る。 In other embodiments, the recombinase can be a serine resolvase, such as Gin, Cin, Hin, Min, or Sin, as shown in Table 9. In such embodiments, the recombinase recognition sequence can be the RRS of Table 9 that corresponds to the recombinase being used.

種々の他の態様において、リコンビナーゼは表10に示されているとおりHK022、P22、またはL5などのチロシンインテグラーゼであり得る。かかる態様では、リコンビナーゼ認識配列は、使用中のリコンビナーゼに対応する表10のRRSであり得る。 In various other embodiments, the recombinase can be a tyrosine integrase, such as HK022, P22, or L5, as shown in Table 10. In such embodiments, the recombinase recognition sequence can be the RRS of Table 10 that corresponds to the recombinase being used.

いくつかの態様では、PEによる部位特異的な組み換えのための方法のいずれかがインビボでまたはin vitroで行われ得る。いくつかの態様では、部位特異的な組み換えための方法のいずれかが細胞に行われる(例えば、細胞のゲノムDNAを組み換える)。細胞は原核または真核であり得る。真核細胞などの細胞は本明細書に記載の対象などの個体(例えば、ヒト対象)中にあり得る。本明細書に記載の方法は、in vitroおよびインビボの細胞の遺伝子改変にとって、例えば、トランスジェニック細胞、細胞株、もしくは動物の生成という文脈において、または対象の細胞のゲノム配列の変改、例えば遺伝子欠陥の修正において、有用である。 In some embodiments, any of the methods for site-specific recombination with PE can be performed in vivo or in vitro. In some embodiments, any of the methods for site-specific recombination are performed on a cell (e.g., to recombine the genomic DNA of the cell). The cell can be prokaryotic or eukaryotic. The cell, such as a eukaryotic cell, can be in an individual, such as a subject described herein (e.g., a human subject). The methods described herein are useful for genetic modification of cells in vitro and in vivo, e.g., in the context of generating transgenic cells, cell lines, or animals, or in altering the genomic sequence of a cell of a subject, e.g., correcting a genetic defect.

セクションLに引用された参考文献
以下の参考文献の各々は例17に引用され、これらの各々は参照により本明細書に組み込まれる。

Figure 2020191243000289

Figure 2020191243000290
REFERENCES CITED IN SECTION L Each of the following references is cited in Example 17, each of which is incorporated herein by reference.
Figure 2020191243000289

Figure 2020191243000290

[8]処置の方法
本開示は、例示されるとおりであるがプリオン病(例えば本願の例5)、トリヌクレオチド反復拡大疾患(例えば本願の例3)、またはCDKL5欠損症障害(CDD)(例えば本願の例23)に限定されない、本願において提供されるプライム編集システムによって修正され得る点変異または他の変異(例えば、欠失、挿入、逆位、重複など)に関連するかまたはそれによって引き起こされる疾患と診断された対象の処置のための方法を提供する。
[8] Methods of Treatment The present disclosure provides methods for the treatment of a subject diagnosed with a disease associated with or caused by a point mutation or other mutation (e.g., deletion, insertion, inversion, duplication, etc.) that can be corrected by the prime editing system provided herein, including, but not limited to, a prion disease (e.g., Example 5 of the present application), a trinucleotide repeat expansion disease (e.g., Example 3 of the present application), or a CDKL5 deficiency disorder (CDD) (e.g., Example 23 of the present application).

実質的にいずれかの疾患を引き起こす遺伝子欠陥は、プライム編集を用いることによって修復され得る。これは、napDNAbpおよびポリメラーゼ(例えば逆転写酵素)を包含する適当なプライム編集因子融合タンパク質の選択と、(a)編集部位を含有する適当な標的DNAを標的化し、(b)ニック部位の直ちに下流の内生鎖を押し除け、置き換える所望の編集を包含するニック部位の3’端からのDNAの一本鎖の合成のための鋳型を提供するようにデザインされる適当なPEgRNAのデザインとを包含する。プライム編集は、限定なしに、(a)変異を修正する変化をヌクレオチド配列に組み入れ、(b)タンパク質およびRNAタグを組み入れ、(c)免疫エピトープを目当てのタンパク質上に組み入れ、(d)誘導可能な二量体化ドメインをタンパク質に組み入れ、(e)バイオ分子のその活性を変改するための配列を組み入れまたは除去、(f)特定の遺伝子変化を導くためのリコンビナーゼ標的部位を組み入れ、および(g)エラーを起こしやすいRTを用いることによって標的配列の変異導入をするために用いられ得る。 Virtually any disease-causing genetic defect can be repaired by using prime editing. This involves the selection of an appropriate prime editor fusion protein, including napDNAbp and a polymerase (e.g., reverse transcriptase), and the design of an appropriate PEgRNA designed to (a) target the appropriate target DNA containing the editing site, and (b) provide a template for synthesis of a single strand of DNA from the 3' end of the nick site that contains the desired edit that displaces and replaces the endogenous strand immediately downstream of the nick site. Prime editing can be used, without limitation, to (a) incorporate mutation-correcting changes into a nucleotide sequence, (b) incorporate protein and RNA tags, (c) incorporate immune epitopes onto a protein of interest, (d) incorporate inducible dimerization domains into a protein, (e) incorporate or remove sequences in a biomolecule to alter its activity, (f) incorporate recombinase target sites to direct specific genetic changes, and (g) mutate a target sequence by using error-prone RT.

障害を処置する方法には、早期のステップとして、本明細書に記載の方法に従う適当なPEgRNAおよびプライム編集因子融合タンパク質のデザインが関わり、これらは、考慮に入れられ得るいくつもの考慮事項を包含する。例えば:
(a)1つ以上の核酸塩基改変がプライム編集因子によって組み入れされることを望まれる標的配列、すなわちヌクレオチド配列;
(b)標的配列上のカットされる部位の位置付け、すなわち、プライム編集因子が一本鎖ニックを誘導して、ニックの1つの側に3'端RTプライマー配列およびニックの他の側に5'端の内生フラップ(これは究極的にはFEN1またはその等価物によって除去され、3'ssDNAフラップによって置き換えられる)を生出するであろう特定の核酸塩基位置。カットされた部位は3'端プライマー配列を生出し、これはRNA依存的なDNA重合の間にPE融合タンパク質(例えばRT酵素)のポリメラーゼによって伸長されるようになって、所望の編集を含有する3'ssDNAフラップを生出し、これがそれから標的配列上の5'内生DNAフラップを置き換える;
(c)利用可能なPAM配列(標準的なSpCas9 PAM部位、および拡張されたまたは異なるPAM特異性を有するCas9バリアントおよび等価物によって認識される非標準的なPAM部位を包含する);
(d)PAM鎖上の利用可能なPAM配列とカットされる部位の位置付けとの間の間隔;
(e)用いられるべき利用可能なプライム編集因子の具体的なCas9、Cas9バリアント、またはCas9等価物(これは部分的には利用可能なPAMによって記述される);
(f)プライマー結合部位の配列および長さ;
(g)編集鋳型の配列および長さ;
(h)相同アームの配列および長さ;
(i)スペーサー配列および長さ;ならびに
(j)gRNAコア配列。
Methods of treating disorders involve, as an early step, the design of appropriate PEgRNA and prime editor fusion proteins according to the methods described herein, which encompass a number of considerations that can be taken into account, for example:
(a) a target sequence, i.e., a nucleotide sequence, into which one or more nucleobase modifications are desired to be incorporated by a primed editor;
(b) Positioning of the cut site on the target sequence, i.e., the specific nucleobase position where the primed editing factor will induce a single-stranded nick to generate a 3'-end RT primer sequence on one side of the nick and a 5'-end endogenous flap on the other side of the nick (which is ultimately removed by FEN1 or its equivalent and replaced by a 3'-ssDNA flap). The cut site generates a 3'-end primer sequence that becomes extended by the polymerase of the PE fusion protein (e.g., the RT enzyme) during RNA-dependent DNA polymerization to generate a 3'-ssDNA flap containing the desired edit, which then replaces the 5'-endogenous DNA flap on the target sequence;
(c) available PAM sequences (encompassing canonical SpCas9 PAM sites, as well as non-canonical PAM sites recognized by Cas9 variants and equivalents with extended or different PAM specificities);
(d) the spacing between available PAM sequences on the PAM strand and the positioning of the site to be cut;
(e) the specific Cas9, Cas9 variant, or Cas9 equivalent of the available prime editor to be used (this is dictated in part by the available PAM);
(f) the sequence and length of the primer binding site;
(g) the sequence and length of the editing template;
(h) sequence and length of the homology arms;
(i) spacer sequence and length; and
(j) gRNA core sequence.

好適なPEgRNAと任意に第2部位ニッキングのためのニッキングsgRNAデザインガイドとが、説明書の次の例示の(exemplarly)ステップバイステップのセットによってデザインされ得る。これは上の考慮事項の1つ以上を考慮に入れる。ステップは図70A-70Iに示されている例を参照する。
1.標的配列および編集を定める。所望の編集(点変異、挿入、欠失、またはそれらの組み合わせ)の位置付けを中心とした標的DNA領域(~200bp)の配列をリトリーブする。図70Aを見よ。
2.標的PAMを位置付ける。所望の編集位置付けに対して近位のPAMを同定する。PAMは所望の編集位置付けに対して近位のDNAのどちらかの鎖上に同定され得る。編集位置に近接するPAMが好ましいが(すなわち、ニック部位は編集位置から30nt未満である。または編集位置からニック部位まで29nt、28nt、27nt、26nt、25nt、24nt、23nt、22nt、21nt、20nt、19nt、18nt、17nt、16nt、15nt、14nt、13nt、12nt、11nt、10nt、9nt、8nt、7nt、6nt、5nt、4nt、3nt、もしくは2nt未満)、編集位置から≧30ntのニックを置くプロトスペーサーおよびPAMを用いて編集を組み入れることが可能である。図70Bを見よ。
3.ニック部位を位置付ける。考慮されている各PAMについて、対応するニック部位とどの鎖上かとを同定する。Sp Cas9 H840Aニッカーゼでは、切断はNGG PAMの5'の第3および第4の塩基の間においてPAM含有鎖に生起する。全ての編集されるヌクレオチドはニック部位の3'に存在しなければならない。そのため、適当なPAMはPAM含有鎖上の標的の編集の5'にニックを置かなければならない。下で示される例では、2つの可能なPAMがある。単純のために、残りのステップはPAM 1のみを用いるPEgRNAのデザインを実証する。図70Cを見よ。
4.スペーサー配列をデザインする。Sp Cas9のプロトスペーサーはPAM含有鎖上のNGG PAMの5'の20ヌクレオチドに対応する。効率的なPol III転写開始はGが最初に転写されるヌクレオチドであることを要求する。プロトスペーサーの最初のヌクレオチドがGである場合には、PEgRNAのスペーサー配列は単純にプロトスペーサー配列である。プロトスペーサーの最初のヌクレオチドがGではない場合には、PEgRNAのスペーサー配列は、G、次にプロトスペーサー配列である。図70Dを見よ。
5.プライマー結合部位(PBS)をデザインする。出発アレル配列を用いて、PAM含有鎖上のDNAプライマーを同定する。DNAプライマーの3'端はニック部位のちょうど上流のヌクレオチドである(すなわち、Sp Cas9ではNGG PAMの5'の第4の塩基)。PE2およびPE3への使用のための一般的なデザイン原理として、DNAプライマーに対する12から13ヌクレオチドの相補性を含有するPEgRNAプライマー結合部位(PBS)が、~40-60%GC含量を含有する配列に用いられ得る。低いGC含量を有する配列では、より長い(14から15nt)PBSが試験されるべきである。より高いGC含量を有する配列では、より短い(8から11nt)PBSが試験されるべきである。GC含量にかかわらず、最適なPBS配列は経験的に決定されるはずである。長さpのPBS配列をデザインするためには、出発アレル配列を用いて、PAM含有鎖上のニック部位の5'の最初のpヌクレオチドの逆相補体を取る。図70Eを見よ。
6.RT鋳型(またはDNA合成鋳型)をデザインする。RT鋳型(または、ポリメラーゼが逆転写酵素ではないところでは、DNA合成鋳型)は、デザインされた編集と編集に隣接する配列に対する相同性とをコードする。1つの態様では、これらの領域は図3Dおよび図3EのDNA合成鋳型に対応し、DNA合成鋳型は「編集鋳型」および「相同アーム」を含む。最適なRT鋳型長さは標的部位に基づいて変わる。ショートレンジ編集(位置+1から+6)では、短い(9から12nt)、中程度の(13から16nt)、および長い(17から20nt)RT鋳型を試験することが推奨される。ロングレンジ編集(位置+7以降)では、十分な3'DNAフラップ相同性を許すように、編集の位置から少なくとも5nt(好ましくは10nt以上)伸長するRT鋳型を用いることが推奨される。ロングレンジ編集では、機能的なデザインを同定するために、いくつかのRT鋳型がスクリーニングされるべきである。より大きい挿入および欠失(≧5nt)では、RT鋳型上へのより多大な3'相同性(~20nt以上)の組み込みが推奨される。RT鋳型が、逆転写されるDNA産物上の最後のヌクレオチドとしてのG(PEgRNAのRT鋳型上のCに対応する)の合成をコードするときには、編集効率は典型的には損なわれる。多くのRT鋳型が効率的なプライム編集を支持するので、RT鋳型をデザインするときには、最後の合成されるヌクレオチドとしてのGの回避が推奨される。長さrのRT鋳型配列をデザインするためには、所望のアレル配列を用い、PAMを元々含有した鎖上のニック部位の3'の最初のrヌクレオチドの逆相補体を取る。SNP編集と比較して、同じ長さのRT鋳型を用いる挿入または欠失編集は同一の相同性を含有しないであろうということに注意せよ。図70Fを見よ。
7.完全なPEgRNA配列をアセンブリする。PEgRNA構成要素を次の順序(5'から3')でコンカテネーションする:スペーサー、骨格、RT鋳型、およびPBS。図70Gを見よ。
8.PE3のためのニッキングsgRNAをデザインする。編集の上流および下流の非編集鎖上のPAMを同定する。最適なニッキング位置は高度に座位依存的であり、経験的に決定されるはずである。一般的に、PEgRNAによって誘導されるニックの向かいの位置の40から90ヌクレオチド5'に置かれたニックは、より高い編集収量およびより少数のインデルに至る。ニッキングsgRNAは、出発アレル上の20ntプロトスペーサーにマッチするスペーサー配列を有する。プロトスペーサーがGで始まらない場合には5'Gの追加を有する。図70Hを見よ。
9.PE3bニッキングsgRNAをデザインする。PAMが相補鎖に存在し、その対応するプロトスペーサーが編集のために標的化される配列とオーバーラップする場合には、この編集はPE3bシステムの候補であり得る。PE3bシステムでは、ニッキングsgRNAのスペーサー配列は出発アレルではなく所望の編集されたアレルの配列にマッチする。編集されるヌクレオチド(単数または複数)がニッキングsgRNAプロトスペーサーのシード領域(PAMに隣接する~10nt)内に収まるときには、PE3bシステムは効率的に作動する。これは、編集された鎖の組み入れ後まで相補鎖のニッキングを防止し、標的DNAに結合することについてのPEgRNAおよびsgRNAの間の競合を防止する。PE3bは、両方の鎖上の同時のニックの生成をもまた回避し、それゆえに、高い編集効率を維持しながらインデル形成を有意に縮減する。PE3b sgRNAは所望のアレルの20ntプロトスペーサーにマッチするスペーサー配列を有するべきである。必要とされる場合には5'Gの追加を有する。図70Iを見よ。
A suitable PEgRNA and optionally a nicking sgRNA design guide for second site nicking can be designed by the following exemplarly step-by-step set of instructions, which takes into account one or more of the above considerations. The steps refer to the examples shown in Figures 70A-70I.
1. Define the target sequence and edit. Retrieve the sequence of the target DNA region (~200bp) centered around the location of the desired edit (point mutation, insertion, deletion, or combination thereof). See Figure 70A.
2. Position the target PAM. Identify a PAM proximal to the desired editing position. A PAM can be identified on either strand of DNA proximal to the desired editing position. Although a PAM proximal to the editing position is preferred (i.e., the nick site is less than 30 nt from the editing position, or less than 29, 28, 27, 26, 25, 24, 23, 22, 21, 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, or 2 nt from the editing position to the nick site), it is possible to incorporate an edit using a protospacer and PAM that places the nick ≧30 nt from the editing position. See Figure 70B.
3. Position the nick site. For each PAM under consideration, identify the corresponding nick site and on which strand. For Sp Cas9 H840A nickase, cleavage occurs on the PAM-containing strand between the third and fourth bases 5' of the NGG PAM. All edited nucleotides must be 3' to the nick site. Therefore, the appropriate PAM must nick 5' of the targeted edit on the PAM-containing strand. In the example shown below, there are two possible PAMs. For simplicity, the remaining steps demonstrate the design of a PEgRNA using only PAM 1. See Figure 70C.
4. Design the spacer sequence. The protospacer of SpCas9 corresponds to the 20 nucleotides 5' of the NGG PAM on the PAM-containing strand. Efficient Pol III transcription initiation requires that G be the first transcribed nucleotide. If the first nucleotide of the protospacer is a G, then the spacer sequence of the PEgRNA is simply the protospacer sequence. If the first nucleotide of the protospacer is not a G, then the spacer sequence of the PEgRNA is a G followed by the protospacer sequence. See Figure 70D.
5. Design the primer binding site (PBS). Using the starting allele sequence, identify a DNA primer on the PAM-containing strand. The 3' end of the DNA primer is the nucleotide just upstream of the nick site (i.e., the fourth base 5' of the NGG PAM for Sp Cas9). As a general design principle for use with PE2 and PE3, a PEgRNA primer binding site (PBS) containing 12 to 13 nucleotides of complementarity to the DNA primer can be used for sequences containing .about.40-60% GC content. For sequences with low GC content, longer (14 to 15 nt) PBSs should be tested. For sequences with higher GC content, shorter (8 to 11 nt) PBSs should be tested. Regardless of GC content, the optimal PBS sequence should be determined empirically. To design a PBS sequence of length p, use the starting allele sequence to take the reverse complement of the first p nucleotides 5' of the nick site on the PAM-containing strand. See Figure 70E.
6. Design the RT template (or DNA synthesis template). The RT template (or DNA synthesis template, where the polymerase is not a reverse transcriptase) codes for the designed edit and homology to the sequence flanking the edit. In one embodiment, these regions correspond to the DNA synthesis template of FIG. 3D and FIG. 3E, where the DNA synthesis template includes the "edit template" and the "homology arms". The optimal RT template length varies based on the target site. For short-range edits (positions +1 to +6), it is recommended to test short (9 to 12 nt), medium (13 to 16 nt), and long (17 to 20 nt) RT templates. For long-range edits (positions +7 and beyond), it is recommended to use an RT template that extends at least 5 nt (preferably 10 nt or more) from the edit position to allow sufficient 3' DNA flap homology. For long-range edits, several RT templates should be screened to identify a functional design. For larger insertions and deletions (≧5 nt), incorporation of greater 3′ homology (≧20 nt) onto the RT template is recommended. Editing efficiency is typically compromised when the RT template codes for synthesis of a G (corresponding to a C on the RT template for PEG RNA) as the last nucleotide on the reverse transcribed DNA product. Because many RT templates support efficient prime editing, avoidance of G as the last synthesized nucleotide is recommended when designing an RT template. To design an RT template sequence of length r, use the desired allele sequence and take the reverse complement of the first r nucleotides 3′ of the nick site on the strand that originally contained the PAM. Note that compared to SNP editing, insertion or deletion edits using an RT template of the same length will not contain the same homology. See Figure 70F.
7. Assemble the complete PEgRNA sequence. Concatenate the PEgRNA components in the following order (5' to 3'): spacer, backbone, RT template, and PBS. See Figure 70G.
8. Design a nicking sgRNA for PE3. Identify PAMs on the non-edited strand upstream and downstream of the edit. The optimal nicking position is highly locus dependent and should be empirically determined. Generally, a nick placed 40 to 90 nucleotides 5' opposite the PEgRNA-induced nick leads to higher editing yields and fewer indels. The nicking sgRNA has a spacer sequence that matches the 20 nt protospacer on the starting allele. If the protospacer does not begin with a G, have an additional 5' G. See Figure 70H.
9. Design a PE3b nicking sgRNA. If a PAM is present on the complementary strand and its corresponding protospacer overlaps with the sequence targeted for editing, this edit may be a candidate for the PE3b system. In the PE3b system, the spacer sequence of the nicking sgRNA matches the sequence of the desired edited allele, not the starting allele. The PE3b system works efficiently when the nucleotide(s) to be edited fall within the seed region (~10 nt adjacent to the PAM) of the nicking sgRNA protospacer. This prevents nicking of the complementary strand until after incorporation of the edited strand, preventing competition between the PEgRNA and the sgRNA for binding to the target DNA. PE3b also avoids the generation of nicks on both strands simultaneously, thus significantly reducing indel formation while maintaining high editing efficiency. The PE3b sgRNA should have a spacer sequence that matches the 20 nt protospacer of the desired allele. With the addition of a 5'G if required. See Figure 70I.

好適なPEgRNAおよび第2部位ニッキングsgRNAをデザインするための上のステップバイステップのプロセスは、決して限定することを意味されない。本開示は上に記載されているステップバイステップのプロセスのバリエーションを企図し、これらは当業者によってそれから導出可能であろう。 The above step-by-step process for designing suitable PEgRNAs and second-site nicking sgRNAs is not meant to be limiting in any way. The present disclosure contemplates variations of the step-by-step process described above, which could be derived therefrom by one of skill in the art.

ひとたび好適なPEgRNAおよびPE融合タンパク質が選択/デザインされると、それらは、好適な方法論によって、例えば、ベクターに基づくトランスフェクション(これにおいては、ベクターによるトランスフェクションによって細胞内で発現される、PEgRNAおよびPE融合タンパク質をコードするDNAを含む1つ以上のベクター)、送達フォーマット(例えば、脂質粒子、ナノ粒子)でPEgRNAと複合体化したPE融合タンパク質の直接的送達(例えばRNP送達)によって、またはmRNAに基づく送達システムによって、投与され得る。かかる方法は本願において本開示によって記載され、いずれかの公知の方法が利用され得る。 Once suitable PEgRNA and PE fusion proteins have been selected/designed, they can be administered by a suitable methodology, for example, by vector-based transfection (in which one or more vectors containing DNA encoding the PEgRNA and PE fusion protein are expressed in a cell by transfection with the vector), by direct delivery (e.g., RNP delivery) of the PE fusion protein complexed with the PEgRNA in a delivery format (e.g., lipid particles, nanoparticles), or by an mRNA-based delivery system. Such methods are described by this disclosure in this application and any known method can be utilized.

目当ての標的DNAに接触することによって、所望の編集がそれに組み入れされるようになるようにして、PEgRNAおよびPE融合タンパク質(または一緒にPE複合体と言われる)は治療学的有効量で細胞に送達され得る。 The PEgRNA and PE fusion protein (or together referred to as a PE complex) can be delivered to a cell in a therapeutically effective amount such that they contact the desired target DNA, thereby allowing the desired edits to be incorporated therein.

適当な細胞への送達が実現可能である限りは、いずれかの疾患は、着想上はかかる方法によって処置可能である。当業者は、意図される目的および意図される標的細胞に適するようにPE送達方法論を選ぶおよび/またはセレクションする能力があるであろう。 Any disease could conceivably be treated by such methods, so long as delivery to the appropriate cells is feasible. One of skill in the art would be able to choose and/or select a PE delivery methodology appropriate for the intended purpose and intended target cells.

例えば、いくつかの態様において、かかる疾患(例として、上に記載のとおりの点突然変異に関連するがん)を有する対象へ、有効量の、本明細書に記載のプライム編集系(所望の遺伝子変化を含むドナーDNA分子の存在下での相同特異的(homology-directed)修復によって媒介されるとおりに、点突然変異を修正するかまたは疾患関連遺伝子中へ不活性化突然変異を導入する)を投与することを含む方法が提供される。いくつかの態様において、かかる疾患(例として、上に記載のとおりの点突然変異に関連するがん)を有する対象へ、有効量の、本明細書に記載のプライム編集系(点突然変異を修正するかまたは疾患関連遺伝子中へ不活性化突然変異を導入する)を投与することを含む方法が提供される。いくつかの態様において、疾患は、増殖性疾患である。いくつかの態様において、疾患は、遺伝的疾患である。いくつかの態様において、疾患は、新生物疾患である。いくつかの態様において、疾患は、代謝疾患である。いくつかの態様において、疾患は、リソソーム蓄積症である。点突然変異を修正するかまたは疾患関連遺伝子中へ不活性化突然変異を導入することによって処置され得る他の疾患は当業者に知られており、本開示はこの点において限定されない。 For example, in some embodiments, a method is provided that includes administering to a subject having such a disease (e.g., cancer associated with a point mutation as described above) an effective amount of a prime editing system described herein (that corrects the point mutation or introduces an inactivating mutation into the disease-associated gene as mediated by homology-directed repair in the presence of a donor DNA molecule containing the desired genetic alteration). In some embodiments, a method is provided that includes administering to a subject having such a disease (e.g., cancer associated with a point mutation as described above) an effective amount of a prime editing system described herein (that corrects the point mutation or introduces an inactivating mutation into the disease-associated gene). In some embodiments, the disease is a proliferative disease. In some embodiments, the disease is a genetic disease. In some embodiments, the disease is a neoplastic disease. In some embodiments, the disease is a metabolic disease. In some embodiments, the disease is a lysosomal storage disease. Other diseases that can be treated by correcting a point mutation or introducing an inactivating mutation into the disease-associated gene are known to those of skill in the art, and the disclosure is not limited in this respect.

本開示は、追加の疾患または障害(例として、TPRT媒介の遺伝子編集によって修正され得る点突然変異に関連するかもしくはこれによって引き起こされる疾患または障害)の処置のための方法を提供する。いくつかのかかる疾患は本明細書に記載されており、本明細書に提供されるストラテジーおよび融合タンパク質で処置され得る追加の好適な疾患は本開示に基づき当業者に明らかであろう。例示の好適な疾患および障害は下に列挙される。夫々の配列における特定の位置または残基のナンバリングが、使用される具体的なタンパク質およびナンバリングスキームに依存することは、理解されるであろう。ナンバリングは、例として、成熟したタンパク質の前駆体および成熟したタンパク質それ自体において異なることもあり、種ごと(from species to species)の配列の差異はナンバリングに影響を及ぼすこともある。当業者は、当該技術分野において周知である方法によって(例として、配列の整列および相同の残基の決定によって)、いずれの相同のタンパク質および夫々のコード核酸における夫々の残基を同定することができるであろう。例示の好適な疾患および障害は、限定せずに以下を包含する:2-メチル-3-ヒドロキシ酪酸尿症;3ベータ-ヒドロキシステロイドデヒドロゲナーゼ欠損症;3-メチルグルタコン酸尿症;3-オキソ-5アルファ-ステロイドデルタ4-デヒドロゲナーゼ欠損症;46,XY性転換、1型,3型および5型;5-オキソプロリナーゼ欠損症;6-ピルボイル-テトラヒドロプテリンシンターゼ欠損症;アースコグ症候群;アーセ症候群;2型軟骨無発生症;色覚異常2および7;後天性QT延長症候群;シンゲル(Schinzel)型先端脳梁症候群;先端大腿骨頭異形成症;ホルモン耐性の有無に関わらない先端骨形成不全症2;先端紅斑角皮症(Acroerythrokeratoderma);先端短肢異形成症;Acth-非依存性の副腎皮質大結節性過形成2;活性化PI3K-delta症候群;急性間欠性ポルフィリン症;アシル-CoAデヒドロゲナーゼファミリー、メンバー9の欠損症;アダムス-オリバー症候群5および6;アデニンホスホリボシルトランスフェラーゼ欠損症;アデニル酸キナーゼ欠損症;アデニロコハク酸リアーゼ欠損症に起因する溶血性貧血;青年期のネフロン癆;腎・肝・膵異形成症;7型メッケル症候群;副腎白質ジストロフィー;成人接合部型表皮水疱症;表皮水疱症、接合部型、限局性バリアント;成人神経セロイドリポフスチン症;成人神経セロイドリポフスチン症;成人発症の、眼球運動失効を伴う運動失調症;ADULT症候群;無フィブリノーゲン血症および先天性無フィブリノーゲン血症;常染色体潜性無ガンマグロブリン血症2;加齢性黄斑変性症3,6,11および12;アイカルディ・グティエール症候群1,4および5;凍傷状狼瘡1;アラジール症候群1および2;アレキサンダー病;アルカプトン尿症;アラン・ハーンドン・ダドリー症候群;先天性の汎発性脱毛症;アルパース脳症;アルファ-1-抗トリプシン欠損症;常染色体優性の、常染色体劣性の、およびX連鎖劣性のアルポート症候群;アルツハイマー病、家族性、3、痙性対麻痺および運動失行あり;アルツハイマー病、1型,3型および4型;低石灰化型および低成熟型、IIA1遺伝性エナメル質形成不全症;アミノアシラーゼ1欠損症;アーミッシュ小児てんかん症候群;アミロイド形成性トランスサイレチンアミロイドーシス;トランスサイレチンに関する、アミロイド心筋症;心筋症;筋萎縮性側索硬化症1型,6型,15型(前頭側頭型認知症の有無に関わらない),22型(前頭側頭型認知症の有無に関わらない),および10型;TARDBPに関する、TDP43封入体を伴う前頭側頭型認知症;アンダーマン(Andermann)症候群;アンダーセン・タウィル症候群;先天性QT延長症候群;G6PD欠損症に起因する非球形溶血性の貧血症;アンジェルマン(Angelman)症候群;小頭症を伴う、新生児発症の重症脳症;自閉症、X連鎖性3に対する感受性;腎症、動脈瘤、および筋痙攣を伴う遺伝性の血管症;アンジオテンシンi変換酵素、穏やかな血清増加;無虹彩症、小脳性運動失調症、および精神遅滞;無爪症;アンチトロンビンIII欠損症;性器奇形およびステロイド産生異常を伴うアントレー・ビクスラー症候群;家族性胸部大動脈瘤4,6および9;胸部大動脈瘤および大動脈解離;多臓器平滑筋機能障害症候群(multisystemic smooth muscle dysfunction syndrome);もやもや病5;再生不良性貧血;見かけの鉱質コルチコイド過剰;アルギナーゼ欠損症;アルギニノコハク酸リアーゼ欠損症;アロマターゼ欠損症;5型,8型および10型不整脈原性右室心筋症;原発性家族性肥大型心筋症;先天性多発性関節拘縮症、末梢の、X連鎖性;関節拘縮-腎機能障害-胆汁うっ滞症候群;関節拘縮、腎機能障害、および胆汁うっ滞2;アスパラギン合成酵素欠損症;神経細胞移動の異常性;ビタミンE欠損症を伴う運動失調症;感覚性の、常染色体優性の、運動失調症;運動失調症-毛細血管拡張症候群;遺伝性がん素因症候群(hereditary cancer-predisposing syndrome);無トランスフェリン血症;家族性の心房細動11,12,13および16;心房中隔欠損症2,4および7(心室伝導欠陥の有無に関わらない);心房停止2;房室中隔欠損症4;遺伝性眼球萎縮;ATR-X症候群;耳介下顎骨症候群2;自己免疫疾患、多臓器、小児発症;1a型自己免疫リンパ増殖性症候群;常染色体優性の無汗性外胚葉形成不全症;ミトコンドリアDNA欠失1および3を伴う、常染色体優性の進行性外眼筋麻痺;常染色体優性の捻転ジストニア4;常染色体劣性の中心核ミオパチー;常染色体劣性の先天性魚鱗癬1,2,3,4Aおよび4B;常染色体劣性のIA型および1B型皮膚弛緩症;常染色体劣性の無汗性外胚葉形成不全症候群;外胚葉異形成症11b;発汗低下/毛髪/歯型、常染色体劣性;常染色体劣性低リン酸血症性の骨疾患;3型アクセンフェルト・リーガー症候群;ベインブリッジ・ロパーズ症候群;バナヤン・ライリー・ルバルカ症候群;PTEN過誤腫症候群;バライスター(Baraitser)・ウインター症候群1および2;バラカート症候群;バルデ・ビードル症候群1,11,16および19;2型裸リンパ球症候群、相補群E;出生前2型バーター症候群;バーター症候群の3型,低カルシウム尿を伴う3型,および4型;特発性基底核石灰化症4;連珠毛;良性家族性血尿;良性家族性新生児発作1および2;発作、良性家族性新生児1、および/またはミオキミア;発作、早期小児てんかん性脳症7;良性家族性新生児-小児発作;良性遺伝性舞踏病;心筋症を伴う良性肩甲骨骨膜筋ジストロフィー;A1型およびA2型(常染色体優性)ベルナール・スーリエ症候群;ベストロフィノパチー(常染色体劣性);ベータ サラセミア;ベスレムミオパチーおよびベスレムミオパチー2;ビエッティ結晶性角膜網膜ジストロフィー;胆汁酸合成欠損症、先天性2;ビオチニダーゼ欠損症;バーク・バレル(Birk Barel)精神遅滞異形症候群;眼裂縮小、眼瞼下垂症、および眼瞼内反症;ブルーム症候群;ベルエソン・フォルスマン・レーマン症候群;バウチャー・ノイハウザー(Boucher Neuhauser)症候群;A1型およびA2型乳頭症;高血圧症を伴う乳頭症;出血を伴う脳小血管疾患;分岐鎖ケト酸デヒドロゲナーゼキナーゼ欠損症;分岐鎖症候群2および3;乳がん、早期発症;乳房卵巣がん、家族性1,2および4;角膜脆性症候群2;ブロディミオパチー;汗の塩化物上昇の有無に関わらない気管支拡張症3;ブラウン・ビアレット・ヴァン レアレ症候群およびブラウン・ビアレット・ヴァン レアレ症候群2;ブルガダ症候群;ブルガダ症候群1;心室細動;発作性家族性心室細動;ブルガダ症候群およびブルガダ症候群4;QT延長症候群;心臓性突然死;標的(Bull eye)黄斑ジストロフィー;スターガート病4;錐体桿体ジストロフィー12;水疱性魚鱗癬様紅皮症;バーン・マッキューン(Burn-Mckeown)症候群;家族性カンジダ症2,5,6および8;I型およびII型糖タンパク質糖鎖不全症候群;高アンモニア血症に起因する炭酸脱水酵素VA欠損症;結腸癌;心筋不整脈;QT延長症候群、LQT1亜型;チトクロームcオキシダーゼ欠損症に起因する致死性乳児心臓脳筋症;心筋症;ダノン病;肥大型心筋症;左心室非圧縮心筋症;カルネヴァーレ症候群;1型カーニー複合体;カルニチンアシルカルニチントランスロカーゼ欠損症;カルニチンパルミトイルトランスフェラーゼI,II,II(遅発性)およびII(小児性)欠損症;白内障1,4、常染色体優性、常染色体優性の多型、微小角膜を伴う、コポック様、若年性、微小角膜と糖尿を伴う、および核びまん性非進行性;カテコラミン作動性多形心室頻拍;尾状回帰症候群;家族性Cd8欠損症;中心核疾患;1,9および16番染色体の中心核不安定性ならびに免疫不全;進行性外眼筋を伴う小児小脳性運動失調症および小脳性運動失調症、精神遅滞、ならびに平衡障害症候群2;APPに関する脳アミロイド血管症;大脳皮質下梗塞および白質脳症を伴う、脳の常染色体優性および劣性の動脈症;脳海綿状奇形2;脳・眼・顔・骨格症候群2;脳-眼-顔-骨格症候群;石灰化および嚢胞を伴う脳網膜微小血管症;セロイドリポフスチン症神経細胞2,6,7および10;Ch\xc3\xa9diak・東症候群;成人型チェディアック・東症候群;シャルコー・マリー・トゥース病の1B型,2B2型,2C型,2F型,2I型,2U型(軸索性),1C型(脱髄性),優性中間C型,劣性中間A型,2A2型,4C型,4D型,4H型,IF型,IVF型およびX型;肩甲骨腹側脊髄筋萎縮症;遠位型脊髄性筋萎縮症、先天性非進行性;脊髄筋萎縮症、遠位型、常染色体劣性、5;CHARGE関連;小児低リン酸塩症;成人低リン酸塩症;胆嚢炎;進行性家族性肝内胆汁うっ滞3;妊娠性肝内胆汁うっ滞3;コレスタノール蓄積症;コレステロールモノオキシゲナーゼ(側鎖切断)欠損症;ブロムストランド型軟骨異形成症;穿刺性軟骨異形成症1、X連鎖劣性および2 X連鎖優性;CHOPS症候群;慢性肉芽腫性疾患、常染色体劣性チトクロームb陽性、1型および2型;チュドリー・マッカラー症候群; 原発性毛様体ジスキネジア、7,11,15,20および22;I型シトルリン血症;I型およびII型シトルリン血症;頭蓋骨裂傷症;C様症候群;A型コケイン症候群;原発性補酵素Q10欠乏症、1,4および7;コフィン・シリス/知的障害;コフィン・ローリー症候群;コーエン症候群;寒冷時発汗症候群1;コール・カーペンター症候群2;肉芽腫を伴う、細胞性および体液性免疫複合欠損症;d-2-およびl-2-ヒドロキシグルタル酸複合尿症;マロン酸およびメチルマロン酸複合尿症;酸化的リン酸化複合欠損症1,3,4,12,15および25;一部および全部の17-アルファ-ヒドロキシラーゼ/17,20-リアーゼ複合欠損症;共通可変性免疫不全症9;c1インヒビターの機能不全に起因する補体成分4の部分欠損;補体因子B欠損症;錐体単色症;錐体桿体ジストロフィー2および6;錐体桿体ジストロフィー遺伝性エナメル質形成不全症;先天性副腎過形成および先天性副腎低形成、X連鎖性;先天性無巨核球性血小板減少症;先天性無虹彩症;先天性中枢性低換気;ヒルシュスプルング病3;先天性収縮性腕十二指腸症;四肢および顔面の先天性拘縮、低緊張、および発育遅延;グリコシル化の先天性障害1B型,1D型,1G型,1H型,1J型,1K型,1N型,1P型,2C型,2J型,2K型,IIm型;I型およびII型先天性赤血球異形成貧血;顔面の先天性外胚葉異形成症;先天性赤血球生成性ポルフィリン症;2型先天性全身性リポジストロフィー;先天性心疾患、多発型2;先天性心疾患;大動脈弓離断症;先天性脂肪腫性過成長、血管奇形、および表皮母斑;非小細胞肺がん;卵巣の新生物;心伝導系障害、非特異性;先天性微絨毛萎縮症;先天性筋ジストロフィー;LAMA2の部分的欠損に起因する先天性筋ジストロフィー;先天性筋ジストロフィー-脳および眼の異常を伴うジストログリカノパチー、A2型,A7型,A8型,A11型およびA14型;先天性筋ジストロフィー-精神遅滞を伴うジストログリカノパチー、B2型,B3型,B5型およびB15型;先天性筋ジストロフィー-精神遅滞を伴わないジストログリカノパチー、B5型;先天性筋肥大-大脳症候群;先天性筋無力症候群、アセタゾールアミド反応性;繊維型不均衡を伴う先天性ミオパチー;先天性眼球コロボマ;先天性静止型夜盲症、1A型,1B型,1C型,1E型,1F型および2A型;コプロポルフィリン症;角膜平板症2;角膜ジストロフィー、フックス内皮性4;2型角膜内皮性ジストロフィー;角膜脆弱性ケラトグロブ、青色強膜、および関節過度可動性;コーネリア ド ランゲ症候群1および5;常染色体優性の冠動脈疾患2;冠状動脈疾患;高αリポタンパク質血症2; 皮質異形成症(他の脳奇形との複合)5および6;後頭部の皮質奇形;コルチコステロイド結合グロブリン欠損症;2型コルチコステロンメチルオキシダーゼ欠損症;コステロ症候群;カウデン症候群1;扁平股;常染色体優性の頭蓋骨異形成症;頭蓋縫合早期癒合症1お
よび4;頭蓋縫合早期癒合症および歯異常;クレアチン欠損症、X連鎖;クルーゾン症候群;潜在眼球症候群;停留精巣、片側または両側;クッシング指節癒合症;皮膚悪性黒色腫1;骨異栄養症と、肺、胃腸、および泌尿器の重度の異常とを伴う皮膚弛緩症;チアノーゼ、一過的な新生児のおよび非定型の腎症;嚢胞性線維症;シスチン尿症;シトクロムcオキシダーゼi欠損症;シトクロムcオキシダーゼ欠損症;D-2-ヒドロキシグルタル酸尿症2;分節性ダリエー病;内耳形成不全、小耳症、および小歯症(LAMM)を伴う難聴;難聴、常染色体優性3a,4,12,13,15、常染色体優性の非症候性感音性17,20および65;難聴、常染色体劣性1A,2,3,6,8,9,12,15,16,18b,22,28,31,44,49,63,77,86および89;難聴、蝸牛の、近視および知的障害あり、前庭障害なし、常染色体優性、X連鎖2;2-メチルブチリル-CoA脱水素酵素の欠損症;3-ヒドロキシアシル-CoA脱水素酵素の欠損症;アルファ-マンノシダーゼの欠損症;芳香族-L-アミノ酸脱炭酸酵素の欠損症;ビスホスホグリセリン酸ムターゼの欠損症;ブチリル-CoA脱水素酵素の欠損症;フェロキシダーゼの欠損症;ガラクトキナーゼの欠損症;グアニジノ酢酸メチルトランスフェラーゼの欠損症;ヒアルロノグルコサミニダーゼの欠損症;リボース-5-リン酸イソメラーゼの欠損症;ステロイド11-ベータ-モノオキシゲナーゼの欠損症;UDPグルコース-ヘキソース-1-リン酸ウリジリルトランスフェラーゼの欠損症;キサンチンオキシダーゼの欠損症;デジェリン・ソッタス病;シャルコー・マリー・トゥース病、ID型およびIVF型;デジェリン・ソッタス症候群、常染色体優性;樹状細胞、単球、Bリンパ球、およびナチュラルキラーリンパ球の欠損症;デビュクワ(Desbuquois)異形成症2; デビュクワ症候群;DFNA 2非症候性の聴力低下;視神経萎縮および難聴を伴う糖尿病および尿崩症;2型糖尿病、およびインスリン依存性20;ダイアモンド・ブラックファン貧血1,5,8および10;下痢3(分泌性ナトリウム、先天性、症候性)、および5(タフティング腸症(tufting enteropathy)を伴う、先天性);ジカルボキシルアミノ酸尿症;びまん性掌蹠角化症、ボスニア型;デジトレノ脳症候群;ジヒドロプテリジン還元酵素欠損症;拡張型心筋症1A,1AA,1C,1G,1BB,1DD,1FF,1HH,1I,1KK,1N,1S,1Yおよび3B;左心室非圧縮3;シトクロムp450酸化還元酵素欠損症に起因するステロイド産生異常;遠位型関節拘縮2B型;遠位型遺伝性運動ニューロン症2B型;遠位型ミオパチーMarkesbery-Griggs型;遠位型脊髄性筋萎縮症、X連鎖3;二重睫毛・リンパ浮腫症候群;皮膚の欠如を伴う、優性栄養傷害性表皮水疱症;優性遺伝性視神経萎縮症;ドンナイ・バロウ症候群;ドーパミン ベータ水酸化酵素欠損症;ドーパミン受容体d2、脳内密度低下;ダウリング・デゴス病4;ドイン蜂巣状網膜ジストロフィー;マラティア・レベンチーヌ(Malattia leventinese);2型デュアン症候群;デュビン・ジョンソン症候群;デュシェンヌ型筋ジストロフィー;ベッカー型筋ジストロフィー;異常フィブリノーゲン血症;常染色体優性の先天性角化異常症および常染色体優性、3;常染色体劣性の先天性角化異常症1,3,4および5;X連鎖性の先天性角化異常症;顔面ミオキミアを伴う、家族性ジスキネジア;プラスミノーゲン分子異常症;ジストニア2(捻転、常染色体劣性),3(捻転、X連鎖),5(ドーパ反応型),10,12,16,25,26(ミオクロニー);良性家族性乳児の発作2;早期乳児てんかん性脳症2,4,7,9,10,11,13および14;非定型レット症候群;初期T細胞前駆体急性リンパ性白血病;外胚葉性異形成表皮水疱症候群;外胚葉性異形成-合指症候群1;偏位水晶体、単独で(isolated)常染色体劣性および優性;裂手裂足(Ectrodactyly)、外胚葉性異形成、および口唇口蓋裂症候群3;エーラス・ダンロス症候群7型(常染色体劣性)、古典型、2型(早老性)、ヒドロキシリジン欠損型、4型、4型バリアント、およびテナシンX欠損に起因するもの;アイヒスフェルト型先天性筋ジストロフィー;内分泌-大脳骨異形成症(cerebroosteodysplasia);S錐体増強症候群;拡大前庭水管症候群;エンテロキナーゼ欠損症;疣贅状表皮発育異常症;単純型表皮水疱症および肢帯筋ジストロフィー、斑状色素沈着(mottled pigmentation)を伴う単純型、幽門閉鎖を伴う単純型、単純型、常染色体劣性、および幽門閉鎖を伴う;表皮剥離性掌蹠角化症;家族性熱性痙攣8;てんかん、小児欠神2,12(特発性全身、感受性),5(夜間前頭葉型)、夜間前頭葉型1、部分性、可変の病巣があるもの(with variable foci)、進行性ミオクロニー3、およびX連鎖性、可変の学習障害および行動障害があるもの;てんかん性脳症、小児期発症、乳児期早期、1,19,23,25,30および32;骨端異形成症、多発性、近視および伝音難聴を伴う;一過性運動失調症2型;一過性疼痛症候群、家族性、3;エプスタイン症候群;フェクトナー症候群;赤芽球増殖性プロトポルフィリン症;エストロゲン抵抗性;滲出性硝子体網膜症6;ファブリー病、およびファブリー病、心臓変異型;第H因子、第VII因子、第X因子、第v因子、および第viii因子の、2つの複合欠損症、第xiii因子、サブユニット、欠損症;家族性腺腫性ポリポーシス1および3;蕁麻疹および難聴を伴う家族性アミロイド腎症;家族性寒冷蕁麻疹;家族性の小脳虫部無発生;家族性良性天疱瘡;家族性乳がん;乳がん感受性(Breast cancer, susceptibility to);骨肉腫;膵臓がん3;家族性心筋症;家族性寒冷自己炎症性症候群2;家族性大腸がん;家族性滲出性硝子体網膜症、X連鎖性;家族性片麻痺性片頭痛1型および2型;家族性高コレステロール血症;家族性肥大型心筋症1,2,3,4,7,10,23および24;家族性低カリウム血症-低マグネシウム血症;家族性低形成の、糸球体嚢胞腎;家族性乳児筋無力症;家族性若年性痛風;家族性地中海熱、および家族性地中海熱、常染色体優性;家族性多弁症;家族性晩発性皮膚ポルフィリン症;家族性肺毛細血管腫症;家族性腎性糖尿;家族性腎性低尿酸血症;家族性拘束性心筋症1;家族性1型および3型高リポ蛋白血症;ファンコニー貧血,補欠群E,I,NおよびO;ファンコニー・ビッケル症候群;ファビズム感受性(Favism, susceptibility to);熱性痙攣、家族性、11;フェインゴールド症候群1;胎児ヘモグロビン量的形質遺伝子座1;FG症候群およびFG症候群4;眼球外筋の線維症、先天性、1,2,3a(眼球外病変の有無に関わらない),3b;魚眼病;フレック角膜ジストロフィー;フローティング・ハーバー症候群;精神遅滞の有無に関わらない、言語障害を伴う焦点てんかん;巣状分節性糸球体硬化症5;前脳欠損症;フランク・テル・ハール症候群;Borrone Di Rocco Crovato症候群;フレイジャー症候群;ウィルムス腫瘍1;フリーマン・シェルドン症候群;前頭骨幹端異形成症1および3;前頭側頭型認知症;前頭側頭型認知症および/または筋萎縮性側索硬化症3および4;前頭側頭型認知症第3染色体連鎖性および前頭側頭型認知症ユビキチン陽性;フルクトース-ビホスファターゼ欠損症;フールマン(Fuhrmann)症候群;ガンマ-アミノ酪酸トランスアミナーゼ欠損症;ガムストープ・ウォールファールト(Gamstorp-Wohlfart)症候群; ゴーシェ病1型および亜急性神経障害性;進行性の脊椎側弯症を伴う、家族性水平注視麻痺;全般性優性ジストロフィー型表皮水疱症;全般性てんかん、熱性痙攣プラス3,1型,2型を伴う;レノックス・ガストー型てんかん脳症;巨大軸索ニューロパチー;グランツマン血栓症;緑内障1、開放角、e,FおよびG;緑内障3、原発性先天性、d;先天性緑内障、および先天性緑内障、コロボマ;緑内障、原発性開放角、若年性発症;神経膠腫感受性1;グルコーストランスポーター1型欠損症候群;ルコース-6-リン酸輸送欠損症;GLUT1欠損症候群2;特発性全般性てんかん感受性、12;グルタミン酸ホルミノトランスフェラーゼ欠損症;グルタル酸血症IIAおよびIIB;グルタル酸尿症1型;グルタチオン合成酵素欠損症;糖原病0(筋肉),II(成人形),IXa2,IXc,1A型;II型,IV型,IV(肝とミオパチーとの複合),V型およびVI型;ゴールドマン・ファーブル症候群;ゴードン症候群;ゴーリン症候群;全前脳胞症シークエンス;全前脳胞症7;顆粒腫性疾患、慢性、X連鎖性、バリアント;卵巣の顆粒膜細胞腫瘍;灰色血小板症候群;グリセリ症候群3型;グレーノー角膜ジストロフィーI型;成長および精神遅滞、下顎顔面異形症、小頭症、および口蓋裂;下垂体異常を伴う成長ホルモン欠損症;免疫不全を伴う成長ホルモン不感受性;GTPシクロハイドロラーゼI欠損症;ハジュ・チーニー症候群;手足子宮症候群;聴覚障害;小児毛細血管腫;血液腫瘍;ヘモクロマトーシス1型,2B型および3型;糖尿病の微小血管合併症7;トランスフェリン血清レベル量的形質座2;ヘモグロビンH病、無欠損;グルコースリン酸イソメラーゼ欠損症に起因する、溶血性貧血、非球状赤血球性;血球貪食性リンパ組織球症、家族性、2;血球貪食性リンパ組織球症、家族性、3;ヘパリン補因子II欠損症;遺伝性腸性先端皮膚炎;遺伝性乳がん・卵巣がん症候群;運動失調・毛細血管拡張症様障害;遺伝性びまん性胃がん;スフェロイドを伴う遺伝性びまん性白質脳症;遺伝性第II,第IX,第VIII因子欠損症;遺伝性出血性毛細血管拡張症2型;無汗症を伴う遺伝性無痛症;遺伝性リンパ浮腫I型;視神経萎縮を伴う遺伝性運動・感覚神経症;早期呼吸不全を伴う遺伝性ミオパチー;遺伝性神経痛性筋萎縮症;遺伝性非ポリポーシス大腸新生物;リンチ症候群IおよびII;遺伝性膵炎;慢性膵炎感受性;遺伝性感覚・自律神経障害IIB型およびIIA型;遺伝性鉄芽球性貧血;ヘルマンスキー・ポドラック症候群1,3,4および6;内臓錯位、2,4および6、常染色体;内臓錯位、X連鎖性;組織球性髄様細網症;異所形成;組織球症-リンパ節腫大プラス症候群;ホロカルボキシラーゼ合成酵素欠損症;全前脳胞症2,3,7および9;ホルト・オラム症候群;MTHFR欠損症、CBS欠損症、およびホモシステイン尿症に起因するホモシステイン血症、ピリドキシン応答性;コバラミン代謝異常に起因する、ホモシステイン尿症-巨赤芽球性貧血、cblE相補型;ハウエル・エバンス(Howel-Evans)症候群;ハーラー症候群;ハッチンソン・ギルフォード症候群;水頭症;高アンモニア血症、III型;高コレステロール血症、および高コレステロール血症、常染色体劣性;過剰驚愕症2および遺伝性の過剰驚愕症;高フェリチン血症白内障症候群;高グリシン尿症;周期性発熱を伴う高免疫グロブリンD;メバロン酸尿症;高免疫グロブリンE症候群;家族性の高インスリン血症性低血糖症3,4および5;高インスリン血症-高アンモニア血症症候群;高リシン血症;ジストニア、赤血球増加症、および肝硬変を伴う高マンガン血症;高オルニチン血症-高アンモニア血症-ホモシトルリン尿症症候群;副甲状腺機能亢進症1および2;副甲状腺機能亢進症、新生児重度;部分的pts欠損症、BH4欠損症、D、非pkuに起因する、高フェニルアラニン血症、bh4欠損症、a;精神遅滞症候群2,3および4を伴う高リン酸血症;多毛性骨軟骨異形成症;apob32に関連する、低ベータリポ蛋白血症、家族性;低カルシウム血症、常染色体優性1;低カルシウム尿性高カルシウム血症、家族性、1型および3型;低軟骨形成症;鉄過剰症を伴う低クロム小球性貧血;肝臓中グリコーゲン合成酵素の欠損症を伴う低血糖症;臭覚障害の有無に関わらない低ゴナドトロピン性性腺機能低下症11;免疫不全を伴う無汗性外胚葉形成不全症;発汗低下のX連鎖性外胚葉異形成;低カリウム性周期性四肢麻痺1および2;低マグネシウム血症1、腸の;低マグネシウム血症、発作、および精神遅滞;低髄性白質ジストロフィー7;左心低形成症候群;房室中隔欠損症および共通房室接合部;尿道下裂1および2、X連鎖性;甲状腺機能低下症、先天性非甲状腺腫、1;減毛症8および12;減毛症-リンパ浮腫-血管拡張症候群;I血液型系;シーメンス型水疱性魚鱗癬;剥脱性魚鱗癬;未熟児魚鱗癬症候群;特発性基底核石灰化症5;特発性線維性肺胞炎、慢性型;先天性角化不全症、常染色体優性、2および5;乳児期の特発性高カルシウム血症;カルシウム流入障害2に起因するT細胞不活性化を伴う免疫機能障害; 1型および2型高IgMを伴う、cd3-ゼータの欠陥に起因する、免疫不全15,16,19,30,31C,38,40,8、ならびにマグネシウム欠陥を伴う、X連鎖性、エプスタイン・バーウイルス感染、および新形成;免疫不全-動原体不安定性-顔面奇形症候群2;封入体ミオパチー2および3;野中ミオパチー;乳児痙攣および発作性舞踏症、家族性;乳児皮質過骨症;乳児GM1ガングリオシドーシス;乳児低ホスファタシアーゼ血症;乳児ネフロン癆;乳児眼振、X連鎖性;乳児パーキンソン病-ジストニア;多尾性精子および過剰なDNAに関連する不妊症;イ
ンスリン抵抗性;インスリン抵抗性糖尿病および黒色表皮腫;インスリン依存性糖尿病分泌性下痢症候群;間質性腎炎、核巨大化(karyomegalic);子宮内発育遅延、骨幹端異形成症、先天性副腎低形成、および性器奇形;ヨードチロシン結合欠損症;IRAK4欠損症;虹彩隅角異発生優性型および1型;脳内鉄蓄積;坐骨膝蓋骨異形成;膵島細胞過形成;17,20-リアーゼ単独欠損症;ルトロピン単独欠損症;イソバレリル-CoAデヒドロゲナーゼ欠損症;ヤンコヴィッチ・リベラ症候群;ジャーベルおよびランゲ・ニールセン症候群2;ジュベール症候群1,6,7,9/15(2遺伝子性),14,16および17、ならびに口顔面指症候群xiv;ヘルリッツの接合部表皮水疱症;若年性GM>1<ガングリオシドーシス;若年性ポリポーシス症候群;若年性ポリポーシス/遺伝性出血性毛細血管拡張症症候群;若年性網膜炎;歌舞伎メーキャップ症候群;カルマン症候群1,2および6;思春期遅延症;神崎病;カラック症候群;カルタゲナー症候群;ケニー・ケイフィ症候群2型;ケッペン・ルビンスキー(Keppen-Lubinsky)症候群;円錐角膜1;毛包性角化症;掌蹠膿疱症1;キンドラー症候群;L-2-ヒドロキシグルタル酸尿症;ラーセン症候群、優性型;格子状角膜ジストロフィーIII型;レーバー黒内障;ツェルウェガー症候群;ペルオキシソーム生合成異常症;ツェルウェガー症候群スペクトラム;レーバー先天性黒内障11,12,13,16,4,7および9;レーバー視神経萎縮症;アミノグリコシド誘発性難聴;難聴、非症候性感音性、ミトコンドリア;左心室非圧縮症5;左右軸奇形;リー病;ミトコンドリア短鎖エノイル-CoAヒドラターゼ1欠損症;ミトコンドリア複合体I欠損症に起因するリー症候群;ライナー病;レリー・ワイル軟骨骨異形成症;致死性先天性拘縮症候群6;白血球接着不全症I型およびIII型;白骨ジストロフィー、ミエリン形成不全性、11および6;白質脳症、運動失調を伴う、脳幹・脊髄障害と乳酸値上昇とを伴う、白質の消失を伴う、および進行性の、卵巣不全を伴う;全白爪;レビー小体型認知症;リヒテンシュタイン・クノール症候群;リー・フラウメニ症候群1;Lig4症候群;肢帯筋ジストロフィー1B型,2A型,2B型,2D型,C1型,C5型,C9型,C14型;脳および眼の異常を伴う先天性筋ジストロフィー-ジストログリカノパチー、A14型およびB14型;複合型リパーゼ欠損症;脂肪蛋白症;リポジストロフィー、家族性部分的、2型および3型;脳回欠損1,2(X連鎖性),3,6(小頭症を伴う),X連鎖性;皮質下帯状ヘテロトピア、X連鎖性;急性乳児肝不全;ロイス・ディーツ症候群1,2,3;QT延長症候群1,2,2/9,2/5,(2遺伝子性),3,5および5、後天性、感受性;肺がん;リンパ浮腫、遺伝性、id;リンパ浮腫、原発性、骨髄異形成を伴う;リンパ増殖症候群1,1(X連鎖性)および2;リソソーム酸リパーゼ欠損症;大頭症、巨人症、顔面異形症候群;黄斑変性症、卵黄様、成人期に発症;悪性高熱感受性1型;悪性リンパ腫、非ホジキン;悪性黒色腫;前立腺の悪性腫瘍;下顎骨異形成症;A型またはB型リポジストロフィーを伴う下顎骨異形成症、非定型;下顎顔面異形成症、トレーチャー・コリンズ型、常染色体劣性;マンノース結合タンパク質欠乏症;メープルシロップ尿症1A型および3型;マルデン・ウォーカー様症候群;マルファン症候群;マリネスコ・Sj\xc3\xb6gren症候群;マートソフル(Martsolf)症候群;成熟期に発症する若年性糖尿病、1型,2型,11型,3型および9型;メイ・ヘグリン異常症;MYH9関連疾患;セバスチャン症候群;マキュン・オルブライト症候群;体細胞腺腫;性索-間質性腫瘍;クッシング症候群;マクシック・カウフマン症候群;マクラウド神経赤血球症症候群;メッケル・グルーバー症候群;中鎖アシル-補酵素A脱水素酵素欠損症;髄芽腫;皮質下嚢胞1および2aを伴う大脳白質脳症;大頭-先天性大理石様皮膚;PIK3CA関連過成長スペクトラム;巨脳-多小脳回-多指-水頭症候群2;巨大芽球性貧血、チアミン反応性、糖尿病および感音性難聴を伴う;マイヤー・ゴーリン症候群1および4;メルニック・ニードルズ症候群;髄膜腫;精神遅滞、X連鎖性、3,21,30および72;精神遅滞および小頭症、脳橋および小脳の低形成を伴う;X連鎖精神遅滞症候群5;精神遅滞、上顎前突、および斜視;精神遅滞、常染色体優性12,13,15,24,3,30,4,5,6および9;精神遅滞、常染色体劣性15,44,46および5;精神遅滞、定型動作、てんかん、および/または脳奇形;精神遅滞、症候群性、クラース・ジェンセン(Claes-Jensen)型、X連鎖性;精神遅滞、X連鎖、非特異的、症候性、ヘデラ(Hedera)型、および症候性、ウー(wu)型;メロシン欠損型先天性筋ジストロフィー;異染性白質ジストロフィー若年型、乳児期後期型、および成人型;異染性白質ジストロフィー;変容性骨異形成症;メトヘモグロビン血症I型および2型;メチオニンアデノシルトランスフェラーゼ欠損症、常染色体優性;ホモシスチン尿症を伴うメチルマロン酸血症;メチルマロン酸尿症cblB型;メチルマロニル-CoAムターゼ欠損症に起因するメチルマロン酸尿症;メチルマロン酸尿症mut(0)型;小頭症性骨異形成原基性小人症2型;絨毛網膜症、リンパ浮腫、または精神遅滞の有無に関わらない小頭症;小頭症、裂孔ヘルニア、およびネフローゼ症候群;小頭症;脳梁の低形成症;痙性対麻痺50、常染色体劣性;全身性発育遅延;CNSミエリン形成不全症;脳萎縮;小頭症、正常な知能および免疫不全;小頭症-毛細血管奇形症候群;小球性貧血;症候群性小眼球症5,7および9;小眼球症、単独3,5,6,8、およびコロボマ6を伴う;微小球症;片頭痛、家族性片麻痺性;ミラー症候群;外眼筋麻痺を伴うミニコアミオパチー;コアを伴う先天性ミオパチー;ミッチェル・ライリー症候群;ミトコンドリア3-ヒドロキシ-3-メチルグルタリル-CoA合成酵素欠損症;ミトコンドリア複合体I,II,III,III(核型2,4または8)欠損症;ミトコンドリアDNA枯渇症候群11,12(心筋症型),2,4B(MNGIE型),8B(MNGIE型);ミトコンドリアDNA枯渇症候群3および7,肝脳型および13(脳筋症型);ミトコンドリアリン酸担体およびピルビン酸担体欠損症;ミトコンドリア三機能性タンパク質欠損症;長鎖3-ヒドロキシアシル-CoAデヒドロゲナーゼ欠損症;三好型筋ジストロフィー1;遠位型ミオパチー、前脛骨発症を伴う;モーア・トラネジャーグ(Mohr-Tranebjaerg)症候群;モリブデン補因子欠損症、相補群A;モワット・ウィルソン症候群;ムコリピドーシスIIIガンマ;ムコ多糖症VI型,VI型(重症)およびVII型;ムコ多糖症、MPS-I-H/S,MPS-II,MPS-III-A,MPS-III-B,MPS-III-C、MPS-IV-A,MPS-IV-B;網膜色素変性症73;ガングリオシドーシスGM1型1(心臓障害を伴う)3;多中心性骨溶解腎症;多中心性骨溶解、結節症、および関節症;多発性先天異常;心房中隔欠損症2;多発性先天異常-筋緊張低下-発作症候群3;多発性の皮膚および粘膜静脈奇形;多発性内分泌腺新形成1型および4型;多発性骨端異形成症5型または優性;多発性腸管閉鎖症;多発性翼状片症候群エスコバール型;多発性スルファターゼ欠損症;多発性骨癒合症症候群3;筋AMPグアニンオキシダーゼ欠損症;筋眼脳疾患;筋ジストロフィー、先天性、巨円錐体型;筋無力症、家族性小児、1;アセチルコリン受容体欠損症に関連する、先天性筋無力症症候群11;先天性筋無力症症候群17,2A(スローチャネル),4B(ファストチャネル)および管状集合体を伴わない;ミエロペルオキシダーゼ欠損症;MYH関連ポリポーシス;子宮内膜癌;心筋梗塞1;ミオクローヌス性ジストニア;ミオクローヌス性-無緊張性てんかん;赤色ボロ繊維・ミオクローヌスてんかん;筋原線維ミオパチー1およびZASP関連;ミオグロビン尿、急性再発性、常染色体劣性;筋神経胃腸管性脳症症候群;進行性外眼筋麻痺を伴う小児小脳性運動失調症;ミトコンドリアDNA枯渇症候群4B、MNGIE型;ミオパチー、中心核、1、先天性、過剰の筋紡錘を伴う、遠位の、1、乳酸アシドーシス、および鉄芽球性貧血1、先天性白内障を伴うミトコンドリア進行性の、聴覚消失、および発育遅延、および管状集合体、2;近視6;筋硬化症、常染色体劣性;先天性筋強直症;先天性筋強直症、常染色体優性型および劣性型;爪膝蓋骨症候群;ナンス・ホラン症候群;小眼球症2;ナバホ神経肝障害;ネマリンミオパチー3および9;新生児筋緊張低下;知的障害;痙攣;言語発達遅延;精神遅滞、常染色体優性31;シトリン欠損症によって引き起こされる新生児肝内胆汁うっ滞;腎性尿崩症、腎性尿崩症、X連鎖性;腎結石症/骨粗鬆症、低リン酸血症性、2;ネフロン癆13,15および4;不妊症;脳-眼-腎症候群(ネフロン癆、眼球運動失効、および小脳異常);ネフローゼ症候群、3型,5型、眼球異常の有無に関わらない、7型および9型;ネスター・グレルモプロジェリア症候群;ノイ・ラクソバ(Neu-Laxova)症候群1;脳鉄蓄積を伴う神経変性症4および6;神経フェリチン症;神経線維腫症、1型および2型;神経線維肉腫;神経下垂体性尿崩症;ニューロパチー、遺伝性感覚性、IC型;中性1アミノ酸輸送障害;ミオパチーを伴う中性脂質蓄積症;好中球免疫不全症候群;ニコライデス・バライスター症候群;ニーマン・ピック病C1型,C2型,A型およびC1、成人型;非ケトーシス性高グリシン血症;ヌーナン症候群1および4、LEOPARD症候群1;若年性骨髄単球性白血病の有無に関わらないヌーナン症候群様障害;正常カリウム血性周期性四肢麻痺、カリウム感受性;ノルム病;てんかん、聴覚消失、および精神遅滞症候群;精神遅滞、X連鎖性102および症候性13;肥満;眼白子症、I型;眼皮膚白子症1B型,3型および4型;眼歯指異形成症;歯限局型低ホスファターゼ症;歯-毛髪-四肢症候群(Odontotrichomelic syndrome);大口病;減歯症-大腸直腸癌症候群;オピッツG/BBB症候群;視神経萎縮症9;口腔顔面指趾症候群;オルニチンアミノトランスフェラーゼ欠損症;口腔顔面裂11および7、口唇/口蓋外胚葉異形成症候群;オルスタビック・リンデマン・ソルベルグ症候群;軽度の軟骨異形成症を伴う骨関節炎;離断性骨軟骨炎;骨形成不全症12型,5型,7型,8型,I型,III型、正常な強膜を伴う、優性型、劣性周産期致死性;頭蓋骨硬化症を伴う線条骨症;常染色体優性の大理石骨症1型および2型,劣性4型,劣性1型,劣性6型;偽神経膠腫を伴う骨粗鬆症;耳口蓋指症候群I型およびII型;卵巣形成不全1;卵巣白質脳症;先天性爪肥厚症4および2型;骨パジェット病、家族性;パリスター・ホール症候群;掌蹠角化症、非表皮剥離性、局所性またはびまん性;膵臓無形成および先天性心疾患;パピロン・Lef\xc3\xa8vre症候群;傍神経膠節腫3;フォン・オレインブルグ(von Eulenburg)の先天性異常筋強直症;副甲状腺癌;パーキンソン病14,15,19(若年性発症),2,20(早期発症),6,(常染色体劣性の早期発症)および9;限局性白皮証;ヒポキサンチン-グアニンホスホリボシルトランスフェラーゼ部分欠損症;網膜色素上皮の模様ジストロフィー;PC-K6a;ペリザウス・メルツバッハー病;ペンドレッド症候群;末梢性脱髄性神経障害、中枢性脱髄性;ヒルシュスプルング病;永続型新生児糖尿病;永続型新生児糖尿病、神経学的特色を伴う;新生児インスリン依存性糖尿病;若年発症成人型糖尿病、2型;ペルオキシソーム生合成障害14B,2A,4A,5B,6A,7Aおよび7B;ペロー症候群4;ペリー症候群;新生児の持続性高インスリン性低血糖症;家族性高インスリン症;表現型;フェニルケトン尿症;褐色細胞腫;遺伝性パラガングリオーマ-褐色細胞腫症候群;パラガングリオーマ1;腸のカルチノイド腫瘍;カウデン症候群3;ホスホグリセリン酸脱水素酵素欠損症;ホスホグリセリン酸キナーゼ1欠損症;光感受性硫黄欠乏性毛髪発育異常症;フィタン酸蓄積病;ピック病;ピアソン症候群;色素性網膜ジストロフィー;色素性結節状副腎皮質病変、原発性、1;石灰化上皮腫;ピット・ホプキンス症候群;下垂体依存性高コルチゾール症;下垂体ホルモン欠損症、複合型1,2,3および4;プラスミノーゲン活性化因子インヒビター1型欠損症;プラスミノーゲン欠損症、I型;血小板型出血障害15および8;多形皮膚萎縮症、遺伝性線維化、腱性拘縮、ミオパチー、および肺線維症を伴う;多発性嚢胞腎疾患2、成人型および乳児型;硬化性白質脳症を伴う多嚢胞性脂肪膜性骨異形成症;免疫不全の有無に関わらないポリグルコサン体ミオパチー1;多小脳回、非対称性、両側性前頭頭頂部;多発性神経炎、聴覚消失、運動失調、網膜色素変性、および白内障;4型橋小脳形成不全症;膝窩部贅皮症候群;孔脳症2;汗孔角化症8、伝染性表層化学活性型;ポルフォビリノーゲン合成酵素欠損症;晩発性皮膚ポルフィリン症;網膜色素変性症を伴う脊髄後索性失調症;後極白内障2型;プラダー・ウィリー様症候群;早発卵巣不全4,5,7および9;原発性常染色体劣性小頭症10,2,3および5;原発性線毛機能不全24;原発性拡張
型心筋症;左心緻密化障害6;4、左心緻密化障害10;発作性心房細動;原発性高シュウ酸尿症、I型およびIII型;原発性肥大性骨関節症、常染色体劣性2;原発性低マグネシウム血症;原発性開放隅角緑内障若年発症1;原発性肺高血圧症;プリムローズ症候群;進行性家族性心ブロック1B型;進行性家族性肝内胆汁うっ滞2および3;進行性肝内胆汁うっ滞;運動失調症を伴う進行性ミオクローヌスてんかん;進行性偽リウマチ性異形成症;進行性硬化性灰白異栄養症;プロリダーゼ欠損症;プロリン脱水素酵素欠損症;統合失調症4;プロパジン欠損症、X連鎖性;プロピオン酸血症;プロタンパク質変換酵素1/3欠損症;前立腺がん、遺伝性、2;プロタン欠損症;蛋白尿;フィンランド型先天性ネフローゼ症候群;プロテウス症候群;乳腺癌;偽軟骨発育不全脊椎骨端異形成症;偽性低アルドステロン症1型常染色体優性および劣性および2型;偽性副甲状腺機能低下症1A型;偽性偽性副甲状腺機能低下症;仮性新生児副腎白質ジストロフィー;偽原発性高アルドステロン症;弾性線維性仮性黄色腫;乳児の全身性動脈石灰化症2;多発性凝固因子欠損症を伴う弾性線維性仮性黄色腫様障害;乾癬感受性2;PTEN過誤腫症候群;遺伝性出血性毛細血管拡張症に関連する肺動脈性高血圧症;肺線維症および/または骨髄不全、テロメアに関連する、1および3;遺伝性出血性毛細血管拡張症を伴う、肺高血圧症、原発性、1;プリン-ヌクレオシドホスホリラーゼ欠損症;ピルビン酸カルボキシラーゼ欠損症;ピルビン酸脱水素酵素E1-アルファ欠損症;赤血球のピルビン酸キナーゼ欠損症;レイン症候群;ラスオパチー;劣性栄養障害性表皮水疱症;爪障害、非症候性先天性、8;ライフェンスタイン症候群;腎欠損症;腎カルニチン輸送障害;腎コロボマ症候群;腎異形成症;腎異形成症、網膜色素性ジストロフィー、小脳性運動失調症、および骨格異形成症;遅発性感音性聴覚消失を伴うか、または溶血性貧血を伴う、腎尿細管性アシドーシス、遠位型、常染色体劣性;眼球異常および精神遅滞を伴う、腎尿細管性アシドーシス、近位型;網膜錐体ジストロフィー3B;網膜色素変性症;網膜色素変性症10,11,12,14,15,17および19;網膜色素変性症2,20,25,35,36,38,39,4,40,43,45,48,66,7,70,72;網膜芽細胞腫;レット障害;ラブドイド腫瘍素因症候群2;裂孔原生網膜剥離、常染色体優性;肢根型点状軟骨異形成症2型および3型;ロバーツ-SCあざらし肢奇形症候群;ロビノー・ソラウフ(Robinow Sorauf)症候群;ロビノー症候群、常染色体劣性、短合多指症を伴う常染色体劣性;ロスムンド・トムソン症候群;ラパデリノ症候群;RRM2B関連ミトコンドリア病;ルービンシュタイン・タイビ症候群;サラ病;サンドホフ病、成人型および乳児型;サルコイドーシス、早期発症;ブラウ症候群;シンドラー病、1型;裂脳症;統合失調症15;蝸牛様骨盤異形成症;神経鞘腫症2;シュワルツ・ヤンペル症候群1型;角膜硬化、常染色体劣性;硬結性骨化症;二次性甲状腺機能低下症;瀬川症候群、常染色体劣性;セニオール・ローケン症候群4および5;感覚性運動失調型ニューロパチー、構音障害、および眼麻痺;セピアプテリン還元酵素欠損症;SeSAME症候群;小頭症、成長遅延、電離放射線感受性を伴う、ADA欠損症に起因する重症複合免疫不全症、非定型、常染色体劣性、T細胞陰性、B細胞陽性、NK細胞陽性のNK細胞陰性;重症先天性好中球減少症;重症先天性好中球減少症3、常染色体劣性または優性;重症先天性好中球減少症および6、常染色体劣性;乳児期の重篤なミオクロニーてんかん;熱性痙攣プラスの全般てんかん、1型および2型;重篤なX連鎖性筋細管ミオパチー;QT短縮症候群3型;非特異的な骨格異常を伴う低身長;低身長、耳道狭窄症、下顎形成不全、骨格異常;低身長、爪甲形成不全、顔異形、および貧毛症;原基性小人症;多指症の有無に関わらない短肋胸郭異形成症11または3;シアリドーシスI型およびII型;シルバー痙性対麻痺症候群;神経伝導速度遅延、常染色体優性;スミス・レムリ・オピッツ症候群;スナイダー・ロビンソン症候群;成長ホルモン分泌腺腫;プロラクチノーマ;家族性、下垂体腺腫素因;ソトス症候群1または2;痙性失調症5、常染色体劣性、シャルルボワ・サグネ型、1,10または11、常染色体劣性;筋萎縮性側索硬化症5型;痙性対麻痺15,2,3,35,39,4、常染色体優性、55、常染色体劣性、および5A;胆汁酸合成障害、先天性、3;精子形成不全11,3および8;球状赤血球症4型および5型;球状体ミオパチー;脊髄性筋萎縮症、下肢優位2、常染色体優性;脊髄性筋萎縮症、II型;脊髄小脳失調症14,21,35,40および6;脊髄小脳失調症、常染色体劣性1および16;脾臓低形成;脊椎手根骨足根骨癒合症候群;脊椎手掌異形成、エーラス・ダンロス症候群様、免疫調節異常を伴う、アグリカン型、先天性関節脱臼を伴う、短肢-手型、セダガッテン(Sedaghatian)型、錐体桿体ジストロフィーを伴う、およびコズロウスキー型; 捩れ小人症;シュタルガルト病1;錐体桿体ジストロフィー3;スティックラー症候群1型;クニースト(Kniest)異形成症;スティックラー症候群、1型(非症候性眼性)および4型;スティング関連脈管障害、小児期発症;ストームオルケン症候群;スタージ・ウェーバー症候群、毛細血管奇形、先天性、1;サクシニル-CoAアセト酢酸転移酵素欠損症;スクラーゼ-イソマルターゼ欠損症;乳児突然死症候群;亜硫酸酸化酵素欠損症、独立型;大動脈弁上狭窄;肺サーファクタント代謝機能障害、2および3;指節癒合症、近位、1b;セナニー・レンツ型合指症;3型合指症;症候性X連鎖性精神遅滞16;内反尖足;タンジール病;TARP症候群;テイ・サックス病、B1バリアント、Gm2ガングリオシドーシス(成人)、Gm2ガングリオシドーシス(成人発症);テムタリー(Temtamy)症候群;テノリオ症候群;肢端骨異形成;テストステロン17-ベータ-デヒドロゲナーゼ欠損症;無四肢症、常染色体劣性;ファロー四徴症;左心低形成症候群2;動脈瘤;心臓および大血管の奇形;心室中隔欠損症1;ティール・ベーンケ(Thiel-Behnke)角膜ジストロフィー;胸部大動脈瘤および大動脈解離;マルファン様体型;3M症候群2;血小板減少症、血小板機能障害、溶血、およびグロビン合成不均衡;血小板減少症、X連鎖性;血栓症、遺伝性、プロテインC欠損症に起因、常染色体優性および劣性;甲状腺無形成;甲状腺がん、濾胞性;甲状腺ホルモン代謝異常;甲状腺ホルモン抵抗性、汎発性、常染色体優性;甲状腺中毒性周期性四肢麻痺および甲状腺中毒性周期性四肢麻痺2;サイトロピン放出ホルモン抵抗性、汎発性;チモシー症候群;TNF受容体関連周期熱症候群(TRAPS);歯無発生、選択的、3および4;多形性心室頻拍(Torsades de pointes);タウンズ・ブロックス鰓弓耳腎様症候群;新生児の一過性表皮水疱症;トリーチャー・コリンズ症候群1;精神遅滞、小人症、および網膜の色素変性を伴う長睫毛症;三叉神経節異形成症I型;三叉神経節症候群3型;トリメチルアミン尿症;結節性硬化症症候群;リンパ管筋腫症;結節性硬化症1および2;チロシナーゼ陰性眼皮膚白皮症;チロシナーゼ陽性眼皮膚白皮症;チロシン血症I型;UDPグルコース-4-エピメラーゼ欠損症;ウルリッヒ型先天性筋ジストロフィー;重度の四肢欠損を伴う尺骨・腓骨欠損症;アップショー・シュールマン症候群;ウロカニン酸加水酵素欠損症;アッシャー症候群、1型,1B型,1D型,1G型,2A型,2C型および2D型;網膜色素変性症39;紫外線感受性症候群;ファン・デル・ウーデ(Van der Woude)症候群;ヴァン・マルダーゲム(Van Maldergem)症候群2;ヘンカムリンパ管拡張症-リンパ浮腫症候群2;異型ポルフィリン症;嚢胞性腎疾患を伴う脳室拡大;ヴェルヘイ(Verheij)症候群;超長鎖アシル-CoA脱水素酵素欠損症;膀胱尿管逆流症8;内臓逆位5、常染色体;腹部ミオパチー;ビタミンD依存性くる病、1型および2型;卵黄型ジストロフィー;フォン・ヴィルブランド病2M型および3型;ワールデンブルグ症候群1型,4C型および2E型(神経学的病変を伴う);クライン・ワールデンブルグ症候群;ウォーカー・ワールブルグ先天性筋ジストロフィー;ワールブルグ・マイクロ症候群2および4;イボ、低ガンマグロブリン血症、感染症、および骨髄性細胞貯留;ウィーバー症候群;ヴァイユ・マルケザーニ症候群1および3;ヴァイユ・マルケザーニ様症候群;ワイセンバッハー・ツウェイミュラー(Weissenbacher-Zweymuller)症候群;ウェルドニッヒ・ホフマン病;シャルコー・マリー・トゥース病;ウェルナー症候群;WFS1関連障害;ウィデマン・スタイナー症候群;ウィルソン病;ウォルフラム様症候群、常染色体優性;ワース(Worth)病;ファン・ブッヘム病2型;色素性乾皮症、相補群b,群D,群Eおよび群G;X連鎖無ガンマグロブリン血症;X連鎖性 遺伝性運動感覚性ニューロパチー;ステリルスルファターゼ欠損症を伴うX連鎖性魚鱗癬;X連鎖性脳室周囲異所性灰白質;耳口蓋指症候群、I型;X連鎖性重症複合免疫不全症;チンメルマン・レーバンド(Zimmermann-Laband)症候群およびチンメルマン・レーバンド症候群2;ならびに小帯(Zonular)粉状白内障3。
The present disclosure provides methods for the treatment of additional diseases or disorders, for example, diseases or disorders associated with or caused by point mutations that can be corrected by TPRT-mediated gene editing. Some such diseases are described herein, and additional suitable diseases that can be treated with the strategies and fusion proteins provided herein will be apparent to the skilled artisan based on the present disclosure. Exemplary suitable diseases and disorders are listed below. It will be understood that the numbering of specific positions or residues in each sequence will depend on the specific protein and numbering scheme used. The numbering may be different, for example, in the precursor of the mature protein and the mature protein itself, and sequence differences from species to species may affect the numbering. The skilled artisan will be able to identify any homologous proteins and the respective residues in the respective encoding nucleic acids by methods well known in the art, for example, by aligning sequences and determining homologous residues. Exemplary suitable diseases and disorders include, without limitation, the following: 2-methyl-3-hydroxybutyric aciduria; 3 beta-hydroxysteroid dehydrogenase deficiency; 3-methylglutaconic aciduria; 3-oxo-5 alpha-steroid delta 4-dehydrogenase deficiency; 46,XY sex reversal, types 1, 3 and 5; 5-oxoprolinase deficiency; 6-pyruvoyl-tetrahydropterin synthase deficiency; Aarskog syndrome; Aase syndrome; achondroplasia type 2; color vision deficiencies 2 and 7; acquired long QT syndrome; Schinzel type acrocallosal syndrome; acrofemoral head dysplasia; acroostosis deficiency 2 with or without hormone resistance; acroerythrokeratoderma; acrobrachydysplasia; Acth-independent adrenal macronodular hyperplasia 2; activity PI3K-delta syndrome;acute intermittent porphyria;acyl-CoA dehydrogenase family, member 9 deficiency;Adams-Oliver syndrome 5 and 6;adenine phosphoribosyltransferase deficiency;adenylate kinase deficiency;hemolytic anemia due to adenylosuccinate lyase deficiency;nephronophthisis of adolescence;renal-hepatic-pancreatic dysplasia;Meckel syndrome type 7;adrenoleukodystrophy;adult junctional epidermolysis bullosa;epidermolysis bullosa, junctional, focal variant;adult neuronal ceroid lipofuscinosis;adult-onset ataxia with ocular lag;ADULT syndrome;afibrinogenemia and congenital afibrinogenemia;autosomal recessive agammaglobulinemia 2;age-related macular degeneration 3, 6, 11 and 12;Aicardi-Goutier syndrome Alzheimer's syndrome 1, 4, and 5; lupus pernio 1; Alagille syndrome 1 and 2; Alexander disease; alkaptonuria; Allan Herndon-Dudley syndrome; alopecia universalis; Alpers encephalopathy; alpha-1-antitrypsin deficiency; autosomal dominant, autosomal recessive, and X-linked recessive Alport syndrome; Alzheimer's disease, familial, 3, with spastic paraplegia and apraxia; Alzheimer's disease, types 1, 3, and 4; hypocalcifying and hypomature, IIA1 hereditary amelogenesis imperfecta; aminoacylase 1 deficiency; Amish childhood epilepsy syndrome; amyloidogenic transthyretin amyloidosis; transthyretin-related amyloid cardiomyopathy; cardiomyopathy; amyotrophic lateral sclerosis types 1, 6, 15 (with or without frontotemporal dementia), and 22 (with or without frontotemporal dementia) with or without, and type 10; frontotemporal dementia with TDP43 inclusions related to TARDBP; Andermann syndrome; Andersen-Tawil syndrome; congenital long QT syndrome; non-spherolytic anemia due to G6PD deficiency; Angelman syndrome; neonatal onset severe encephalopathy with microcephaly; susceptibility to autism, X-linked 3; hereditary vasculopathy with nephropathy, aneurysms, and muscle spasms; mild serum elevation of angiotensin I converting enzyme; aniridia, cerebellar ataxia, and mental retardation; onychomycosis; antithrombin III deficiency; Antley-Bixler syndrome with genital anomalies and steroidogenesis abnormalities; familial thoracic aortic aneurysms 4, 6, and 9; thoracic aortic aneurysm and aortic dissection; multisystemic smooth muscle dysfunction syndrome smooth muscle dysfunction syndrome;moyamoya disease 5;aplastic anemia;apparent mineralocorticoid excess;arginase deficiency;argininosuccinate lyase deficiency;aromatase deficiency;arrhythmogenic right ventricular cardiomyopathy types 5, 8, and 10;primary familial hypertrophic cardiomyopathy;arthrogryposis multiplex congenital, peripheral, X-linked;arthrogryposis-renal dysfunction-cholestasis syndrome;arthrogryposis, renal dysfunction, and cholestasis 2;asparagine synthetase deficiency;neuronal migration abnormalities;ataxia with vitamin E deficiency;sensory, autosomal dominant, ataxia;ataxia-telangiectasia syndrome;hereditary cancer-predisposing syndrome syndrome);atransferrinemia;familial atrial fibrillation 11, 12, 13 and 16;atrial septal defect 2, 4 and 7 (with or without ventricular conduction defect);atrial stop 2;atrioventricular septal defect 4;hereditary ophthalmotrophy;ATR-X syndrome;auriculomandibular syndrome 2;autoimmune disease, multisystem, childhood onset;autoimmune lymphoproliferative syndrome type 1a;autosomal dominant anhidrotic ectodermal dysplasia;autosomal dominant progressive external ophthalmoplegia with mitochondrial DNA deletions 1 and 3;autosomal dominant torsion dystonia 4;autosomal recessive centronuclear myopathy;autosomal recessive congenital ichthyosis 1, 2, 3, 4A and 4B;autosomal recessive cutis laxa types IA and 1B;autosomal recessive anhidrotic ectodermal dysplasia syndrome;ectodermal dysplasia 11b;hypophidrosis/hair/dentition, autosomal recessive;autosomal recessive hypophosphatemic bone disease;accentre type 3 Feldt-Rieger syndrome;Bainbridge-Lopers syndrome;Banayan-Riley-Rubarka syndrome;PTEN hamartoma syndrome;Baraitser-Winter syndrome 1 and 2;Baracart syndrome;Bardet-Biedl syndrome 1, 11, 16 and 19;Bare lymphocyte syndrome type 2, complementation group E;Prenatal Bartter syndrome type 2;Bartter syndrome type 3, type 3 with hypocalciuria, and type 4;Idiopathic basal ganglia calcification 4;Monethlis;Benign familial hematuria;Benign familial neonatal seizures 1 and 2;Seizures, benign familial neonatal 1, and/or myokymia;Seizures, early childhood epileptic encephalopathy 7;Benign familial neonatal-pediatric seizures;Benign hereditary chorea;Benign scapular periosteal muscular dystrophy with cardiomyopathy;Types A1 and A2 (autosomal dominant) Bernard-Soulier syndrome;Bestrophinopathies (autosomal recessive);Beta Thalassemia;Bethlem myopathy and Bethlem myopathy 2;Vietti crystalline corneal retinal dystrophy;Bile acid synthesis deficiency, congenital 2;Biotinidase deficiency;Birk Barel mental retardation dysmorphic syndrome;Eyelid reduction, ptosis, and entropion;Bloom syndrome;Bielson-Forssmann-Lehmann syndrome;Boucher-Neuhauser syndrome;Papillary disease types A1 and A2;Papillary disease with hypertension;Cerebral small vessel disease with hemorrhage;Branched-chain ketoacid dehydrogenase kinase deficiency;Branched-chain syndromes 2 and 3;Breast cancer, early onset;Breast and ovarian cancer, familial 1, 2, and 4;Corneal fragility syndrome 2;Brody myopathy;Bronchiectasis with or without elevated sweat chloride 3;Brown-Vialet-Van Reale syndrome and Brown-Vialet-Van Reale syndrome Reale syndrome 2;Brugada syndrome;Brugada syndrome 1;Ventricular fibrillation;Paroxysmal familial ventricular fibrillation;Brugada syndrome and Brugada syndrome 4;Long QT syndrome;Sudden cardiac death;Bull eye macular dystrophy;Stargardt disease 4;Cone-rod dystrophy 12;Bullous ichthyosiform erythroderma;Burn-McKeown syndrome;Familial candidiasis 2, 5, 6 and 8;Types I and II glycoprotein glycosylation deficiency syndromes;Carbonic anhydrase VA deficiency due to hyperammonemia;Colon cancer;Cardiomyopathy;Long QT syndrome, LQT1 variant;Fatal infantile cardiac encephalomyopathy due to cytochrome c oxidase deficiency;Cardiomyopathy;Danon disease;Hypertrophic cardiomyopathy;Left ventricular noncompaction cardiomyopathy;Carnevale syndrome;Type 1 Carney complex; carnitine acylcarnitine translocase deficiency; carnitine palmitoyltransferase I, II, II (late-onset) and II (pediatric) deficiency; cataract 1, 4, autosomal dominant, autosomal dominant polymorphism, with microcornea, Coppock-like, juvenile, with microcornea and glycosuria, and nuclear diffuse nonprogressive; catecholaminergic polymorphic ventricular tachycardia; caudate regression syndrome; familial Cd8 deficiency; central core disease; central core instability of chromosomes 1, 9 and 16 and immunodeficiency; childhood cerebellar ataxia and cerebellar ataxia with progressive extraocular muscles ataxia, mental retardation, and balance disorder syndrome 2; cerebral amyloid angiopathy related to APP; cerebral autosomal dominant and recessive arteriopathy with subcortical infarctions and leukoencephalopathy; cerebral cavernous malformations 2; cerebro-oculofacial-skeletal syndrome 2; cerebro-oculofacial-skeletal syndrome; cerebro-retinal microangiopathy with calcifications and cysts; cerebro-lipofuscinosis neuronal 2, 6, 7, and 10; Ch\xc3\xa9diak-Higashi syndrome; adult Chédiak-Higashi syndrome; Charcot-Marie-Tooth disease types 1B, 2B2, 2C, 2F, 2I, and 2U (axonal ), 1C (demyelinating), dominant intermediate C, recessive intermediate A, 2A2, 4C, 4D, 4H, IF, IVF and X; ventral scapular spinal muscular atrophy; distal spinal muscular atrophy, congenital non-progressive; spinal muscular atrophy, distal, autosomal recessive, 5; CHARGE-related; childhood hypophosphatemia; adult hypophosphatemia; cholecystitis; progressive familial intrahepatic cholestasis 3; intrahepatic cholestasis of pregnancy 3; cholestanol storage disease; cholesterol monooxygenase (side chain truncation) deficiency; Blomstrand chondrodysplasia; perforating chondrodysplasia 1, X-linked recessive and 2 X-linked dominant; CHOPS syndrome; chronic granulomatous disease, autosomal recessive cytochrome b positive, types 1 and 2; Chudhry-McCuller syndrome; Primary ciliary dyskinesia, 7, 11, 15, 20 and 22; citrullinemia type I; citrullinemia types I and II; craniofacial fissure; C-like syndrome; Cockayne syndrome type A; primary coenzyme Q10 deficiency, 1, 4 and 7; Coffin-Siris/intellectual disability; Coffin-Lowry syndrome; Cohen syndrome; cold sweats syndrome 1; Cole-Carpenter syndrome 2; combined cellular and humoral immune deficiency with granulomas; d-2- and l-2-hydroxyglutaric acid complexuria; malonic and methylmalonic acid complexuria; combined oxidative phosphorylation deficiency 1, 3, 4, 12, 15 and 25; partial and total 17-alpha- Combined hydroxylase/17,20-lyase deficiency;common variable immunodeficiency 9;partial deficiency of complement component 4 due to c1 inhibitor dysfunction;complement factor B deficiency;cone monochromacytosis;cone-rod dystrophies 2 and 6;cone-rod dystrophies;hereditary amelogenesis imperfecta;congenital adrenal hyperplasia and congenital adrenal hypoplasia, X-linked;congenital amegakaryocytic thrombocytopenia;congenital aniridia;congenital central hypoventilation;Hirschsprung's disease 3;congenital contractile brachioduodenopathy;congenital contractures, hypotonia, and growth retardation of the limbs and face;congenital disorders of glycosylation types 1B, 1D, 1G, 1H, 1J, 1K, 1N, and 1P type 2, type 2C, type 2J, type 2K, type IIm; types I and II congenital dyserythroid anemia; congenital ectodermal dysplasia of the face; congenital erythropoietic porphyria; type 2 congenital generalized lipodystrophy; congenital heart disease, multiple type 2; congenital heart disease; interrupted aortic arch; congenital lipomatous overgrowth, vascular malformations, and epidermal nevi; non-small cell lung cancer; ovarian neoplasms; cardiac conduction disorders, nonspecific; congenital microvillous atrophy; congenital muscular dystrophies; congenital muscular dystrophies due to partial deficiency of LAMA2; congenital muscular dystrophies - dystroglycanopathy with brain and eye abnormalities, types A2, A7, A8, A11, and A14 type;congenital muscular dystrophy - dystroglycanopathy with mental retardation, types B2, B3, B5 and B15;congenital muscular dystrophy - dystroglycanopathy without mental retardation, type B5;congenital hypertrophy-cerebral syndrome;congenital myasthenic syndrome, acetazolamide responsive;congenital myopathy with fiber type imbalance;congenital ocular coloboma;congenital stationary night blindness, types 1A, 1B, 1C, 1E, 1F and 2A;coproporphyria;planokeratosis 2;corneal dystrophy, Fuchs endothelial 4;endothelial corneal dystrophy type 2;corneal fragility keratoglobus, blue sclera and joint hypermobility;Cornelia de Lange syndrome 1 and 5;autosomal dominant coronary artery disease 2;coronary artery disease;hyperalphalipoproteinemia 2; Cortical dysplasia (combined with other brain anomalies) 5 and 6; occipital cortical malformations; corticosteroid-binding globulin deficiency; corticosterone methyloxidase deficiency type 2; Costello syndrome; Cowden syndrome 1; flat coxa; autosomal dominant cranial dysplasia; craniosynostosis 1 and 4; craniosynostosis and dental anomalies; creatine deficiency, X-linked; Crouzon syndrome; cryptophthalmos syndrome; cryptorchidism, unilateral or bilateral; Cushing synostosis; cutaneous melanoma 1; bone dystrophies with severe pulmonary, gastrointestinal, and urinary anomalies cutis laxa with cyanosis;cyanosis, transient neonatal and atypical nephropathy;cystic fibrosis;cystinuria;cytochrome c oxidase I deficiency;cytochrome c oxidase deficiency;D-2-hydroxyglutaric aciduria 2;segmental Darier's disease;hearing loss with cochlear hypoplasia, microtia, and microdontia (LAMM);hearing loss, autosomal dominant 3a, 4, 12, 13, 15, autosomal dominant nonsyndromic sensorineural 17, 20 and 65;hearing loss, autosomal recessive 1A, 2, 3, 6, 8, 9, 12, 15, 16, 18b, 22, 28, 31, 44, 49 , 63, 77, 86 and 89; hearing loss, cochlear, myopic and intellectual disability, no vestibular disorder, autosomal dominant, X-linked 2; 2-methylbutyryl-CoA dehydrogenase deficiency; 3-hydroxyacyl-CoA dehydrogenase deficiency; alpha-mannosidase deficiency; aromatic-L-amino acid decarboxylase deficiency; bisphosphoglycerate mutase deficiency; butyryl-CoA dehydrogenase deficiency; ferroxidase deficiency; galactokinase deficiency; guanidinoacetate methyltransferase deficiency; hyaluronan Glucosaminidase deficiency;ribose-5-phosphate isomerase deficiency;steroid 11-beta-monooxygenase deficiency;UDP glucose-hexose-1-phosphate uridylyltransferase deficiency;xanthine oxidase deficiency;Dejerine-Sottas disease;Charcot-Marie-Tooth disease, ID and IVF;Dejerine-Sottas syndrome, autosomal dominant;dendritic cell, monocyte, B lymphocyte, and natural killer lymphocyte deficiencies;Desbuquois dysplasia 2;Debuquois syndrome;DFNA 2 nonsyndromic hearing loss;diabetes and diabetes insipidus with optic atrophy and deafness;type 2 diabetes, and insulin-dependent 20;Diamond-Blackfan anemia 1, 5, 8, and 10;diarrhoea 3 (secretory sodium, congenital, symptomatic), and 5 (tufting enteropathy) enteropathy);congenital;dicarboxyaminoaciduria;diffuse palmoplantar keratoderma, Bosnian type;digitrenoencephalic syndrome;dihydropteridine reductase deficiency;dilated cardiomyopathy 1A, 1AA, 1C, 1G, 1BB, 1DD, 1FF, 1HH, 1I, 1KK, 1N, 1S, 1Y and 3B;left ventricular noncompaction 3;steroidogenesis disorder due to cytochrome p450 oxidoreductase deficiency;distal arthrogryposis type 2B;distal hereditary motor neuronopathy type 2B;distal myopathy Markesbery-Griggs type;distal spinal muscular atrophy, X-linked 3;double lash-lymphoedema syndrome;dominant tropholytic epidermolysis bullosa with absence of skin;dominant hereditary optic atrophy;Donnay-Barrow syndrome;dopamine Beta-hydroxylase deficiency; dopamine receptor d2, brain density reduction; Dowling-Degos disease 4; Doyne honeycomb retinal dystrophy; Malattia leventi leventinese);Duane syndrome type 2;Dubin-Johnson syndrome;Duchenne muscular dystrophy;Becker muscular dystrophy;Dysfibrinogenemia;Dyskeratosis congenita autosomal dominant and autosomal dominant, 3;Dyskeratosis congenita autosomal recessive 1, 3, 4 and 5;X-linked dyskeratosis congenita;Familial dyskinesia with facial myokymia;Plasminogen molecule disorders;Dystonia 2 (torsion, autosomal recessive), 3 (torsion, X-linked), 5 (dopa-responsive), 10, 12, 16, 25, 26 (myoclonic);Benign familial infantile seizures 2;Early infantile epileptic encephalopathy 2, 4, 7, 9, 10, 11, 13 and 14;Atypical Rett syndrome;Early T-cell precursor acute lymphoblastic leukemia disease;ectodermal dysplasia-epidermolysis bullosa syndrome;ectodermal dysplasia-syndactyly syndrome 1;ectopic phakia, isolated autosomal recessive and dominant;ectodactyly, ectodermal dysplasia, and cleft lip and palate syndrome 3;Ehlers-Danlos syndrome type 7 (autosomal recessive), classic, type 2 (progeroid), hydroxylysine deficiency, type 4, type 4 variant, and due to tenascin X deficiency;Eichsfeldt congenital muscular dystrophy;cerebroosteodysplasia;S cone enhancement syndrome;enlarged vestibular aqueduct syndrome;enterokinase deficiency;epidermodysplasia verruciformis;epidermolysis bullosa simplex and limb-girdle muscular dystrophy, mottled pigmentation simple with pyloric atresia, simple, autosomal recessive, and with pyloric atresia;epidermolytic palmoplantar keratoderma;familial febrile convulsions 8;epilepsy, childhood absence 2, 12 (idiopathic generalized, susceptible), 5 (nocturnal frontal type), nocturnal frontal type 1, partial, with variable foci, progressive myoclonia 3, and X-linked, with variable learning and behavioral disorders;epileptic encephalopathy, childhood onset, early infancy, 1, 19, 23, 25, 30, and 32;epiphyseal dysplasia, multiple, with myopia and conductive hearing loss;transient ataxia type 2;transient pain syndrome, familial, 3;Epstein syndrome;Fechtner syndrome;erythropoietic protoporphyria;estrogen resistance;exudation Fabry disease and Fabry disease, cardiac variant; two combined deficiencies of factors H, VII, X, V, and VIII; factor XIII subunit deficiency; familial adenomatous polyposis 1 and 3; familial amyloid nephropathy with urticaria and hearing loss; familial cold urticaria; familial cerebellar vermis agenesis; familial benign pemphigus; familial breast cancer; breast cancer susceptibility cancer, susceptibility to);osteosarcoma;pancreatic cancer 3;familial cardiomyopathy;familial cold autoinflammatory syndrome 2;familial colorectal cancer;familial exudative vitreoretinopathy, X-linked;familial hemiplegic migraine types 1 and 2;familial hypercholesterolemia;familial hypertrophic cardiomyopathy 1, 2, 3, 4, 7, 10, 23 and 24;familial hypokalemia-hypomagnesemia;familial hypoplastic glomerular cystic kidney disease;familial infantile myasthenia;familial juvenile gout;familial Mediterranean fever, and familial Mediterranean fever, autosomal dominant;familial polypharyngeal syndrome;familial porphyria cutanea tarda;familial pulmonary capillary hemangiomatosis;familial renal glycosuria;familial renal hypouricemia;familial restrictive cardiomyopathy 1;familial types 1 and 3 hyperlipoproteinemia;Fanconi anemia, complement groups E, I, N and O;Fanconi-Bickel syndrome;Favism susceptibility (Favism, susceptibility to);febrile convulsions, familial, 11;Feingold syndrome 1;fetal hemoglobin quantitative trait locus 1;FG syndrome and FG syndrome 4;fibrosis of extraocular muscles, congenital, 1,2,3a (with or without extraocular involvement), 3b;fish eye disease;Fleck corneal dystrophy;Floating-Haber syndrome;focal epilepsy with speech disorder with or without mental retardation;focal segmental glomerulosclerosis 5;forebrain coloboma;Frank-ter-Haar syndrome;Borrone Di Rocco Crovato syndrome;Frasier syndrome;Wilms tumor 1;Freeman-Sheldon syndrome;Frontometaphyseal dysplasia 1 and 3;Frontotemporal dementia;Frontotemporal dementia and/or amyotrophic lateral sclerosis 3 and 4;Frontotemporal dementia chromosome 3 linked and frontotemporal dementia ubiquitin positive;Fructose biphosphatase deficiency;Fuhrmann syndrome;Gamma-aminobutyric acid transaminase deficiency;Gamstorp-Wohlfart syndrome; Gaucher disease type 1 and subacute neuropathic;familial horizontal gaze palsy with progressive scoliosis;generalized dominant dystrophic epidermolysis bullosa;generalized epilepsy with febrile seizures plus type 3, 1, 2;Lennox-Gastaut epileptic encephalopathy;giant axonal neuropathy;Glanzmann thrombosis;glaucoma 1, open angle, e, F and G;glaucoma 3, primary congenital, d;congenital glaucoma, and congenital glaucoma, coloboma;glaucoma, primary open angle, early-onset;glioma susceptibility 1;glucose transporter type 1 deficiency syndrome;glucose-6-phosphate transport deficiency;GLUT1 deficiency syndrome 2;idiopathic generalized epilepsy susceptibility, 12 ;glutamate forminotransferase deficiency;glutaric acidemia IIA and IIB;glutaric aciduria type 1;glutathione synthetase deficiency;glycogen storage diseases types 0 (muscle), II (adult form), IXa2, IXc, 1A; types II, IV, IV (combined hepatic and myopathic), V and VI;Goldman-Fabre syndrome;Gordon syndrome;Gorlin syndrome;holoprosencephaly sequence;holoprosencephaly 7;granulomatous disease, chronic, X-linked, variant;granulosa cell tumor of the ovary;gray platelet syndrome;Griselli syndrome type 3;Grenau corneal dystrophy type I;growth and mental retardation, mandibulofacial dysmorphism, microcephaly, and Cleft palate;growth hormone deficiency with pituitary abnormalities;growth hormone insensitivity with immunodeficiency;GTP cyclohydrolase I deficiency;Hajj-Cheney syndrome;hand-foot-uterine syndrome;hearing impairment;infantile capillary hemangioma;hematological neoplasms;hemochromatosis types 1, 2B, and 3;microvascular complications of diabetes mellitus 7;transferrin serum level quantitative trait locus 2;hemoglobin H disease, nondeficient;hemolytic anemia, nonspherocytic, due to glucose phosphate isomerase deficiency;hemophagocytic lymphohistiocytosis, familial, 2;hemophagocytic lymphohistiocytosis, familial, 3;heparin cofactor II deficiency;hereditary acrodermatitis enteropathica;hereditary breast and ovarian cancer Cancer syndromes; ataxia-telangiectasia-like disorder; hereditary diffuse gastric cancer; hereditary diffuse leukoencephalopathy with spheroids; hereditary factor II, IX, and VIII deficiency; hereditary hemorrhagic telangiectasia type 2; hereditary insensitivity to pain with anhidrosis; hereditary lymphedema type I; hereditary motor and sensory neuropathy with optic atrophy; hereditary myopathy with early respiratory failure; hereditary neuralgic amyotrophy; hereditary nonpolyposis colon neoplasms; Lynch syndrome I and II; hereditary pancreatitis; chronic pancreatitis susceptibility; hereditary sensory and autonomic neuropathy types IIB and IIA; hereditary sideroblastic anemia; Hermansky-Podlak syndromes 1, 3, 4, and 6; visceral paresis position, 2, 4, and 6, autosomal; heterotaxy, X-linked; histiocytic medullary reticulosis; heterotopia; histiocytosis-lymphadenopathy plus syndrome; holocarboxylase synthase deficiency; holoprosencephaly 2, 3, 7, and 9; Holt-Oram syndrome; homocysteinemia due to MTHFR deficiency, CBS deficiency, and homocysteinuria, pyridoxine responsive; homocysteinuria-megaloblastic anemia, cblE complementation type, due to abnormal cobalamin metabolism; Howel-Evans syndrome; Hurler syndrome; Hutchinson-Gilford syndrome; hydrocephalus; hyperammonemia, type III; hypercholesterolemia hypercholesterolemia, autosomal recessive;hyperconvulsant 2 and hereditary hyperconvulsant 2;hyperferritinemia cataract syndrome;hyperglycinuria;hyperimmunoglobulin D with periodic fever;mevalonic aciduria;hyperimmunoglobulin E syndrome;familial hyperinsulinemic hypoglycemia 3, 4 and 5;hyperinsulinemia-hyperammonemia syndrome;hyperlysinemia;hypermanganemia with dystonia, polycythemia, and cirrhosis;hyperornithinemic-hyperammonemia-homocitrullinuria syndrome;hyperparathyroidism 1 and 2;hyperparathyroidism, neonatal severe;partial pts deficiency, BH4 deficiency, D, non Hyperphenylalaninemia, BH4 deficiency, A due to PKU; hyperphosphatemia with mental retardation syndromes 2, 3, and 4; polychondrodysplasia; hypobetalipoproteinemia, familial, associated with APOB32; hypocalcemia, autosomal dominant 1; hypocalciuric hypercalcemia, familial, types 1 and 3; hypochondroplasia; hypochromic microcytic anemia with iron overload; hypoglycemia with hepatic glycogen synthase deficiency; hypogonadotropic hypogonadism with or without anosmia 11; anhidrotic ectodermal dysplasia with immunodeficiency; X-linked ectodermal dysplasia with hypohidrosis; hypokalemic periodic paralysis 1 and 2 ;hypomagnesemia 1, intestinal;hypomagnesemia, seizures, and mental retardation;hypomedullary leukodystrophy 7;hypoplastic left heart syndrome;atrioventricular septal defect and common atrioventricular junction;hypospadias 1 and 2, X-linked;hypothyroidism, congenital nongoiter, 1;hypotrichosis 8 and 12;hypotrichosis-lymphoedema-vasoectasia syndrome;I blood group system;bullous ichthyosis of Siemens type;exfoliative ichthyosis;ichthyosis of prematurity syndrome;idiopathic basal ganglia calcification 5;idiopathic fibrosing alveolitis, chronic type;dyskeratosis congenita, autosomal dominant, 2 and 5;idiopathic hypercalcemia of infancy;immune dysfunction with T-cell inactivation due to impaired calcium influx 2; Immunodeficiency15,16,19,30,31C,38,40,8 with hyper-IgM, due to defects in CD3-zeta, and with magnesium deficiency, X-linked, Epstein-Barr virus infection, and neoplasia; immunodeficiency-centromeric instability-facial malformation syndrome2; inclusion body myopathy2 and 3; Nonaka myopathy; infantile spasms and paroxysmal chorea, familial; infantile cortical hyperostosis; infantile GM1 gangliosidosis; infantile hypophosphatasia; infantile nephronophthisis; infantile nystagmus, X-linked; infantile Parkinson's disease-dystonia; infertility associated with polyturias and excess DNA; insulin resistance; insulin-resistant diabetes and black table erythroderma; insulin-dependent diabetes mellitus secretory diarrhea syndrome; interstitial nephritis, karyomegalic; intrauterine growth retardation, metaphyseal dysplasia, congenital adrenal hypoplasia, and genital anomalies; iodotyrosine binding deficiency; IRAK4 deficiency; iris angle dysplasia dominant and type 1; brain iron accumulation; ischiopatellar dysplasia; islet cell hyperplasia; isolated 17,20-lyase deficiency; isolated lutropin deficiency; isovaleryl-CoA dehydrogenase deficiency; Jankovic-Rivera syndrome; Jarvell and Lange-Nielsen syndromes 2; Joubert syndromes 1, 6, 7, 9/15 (bigénicent), 14, 16, and 17, and orofaciodigital syndrome xiv; Herlitz's joint syndrome Syndesmotic epidermolysis bullosa;Juvenile GM>1<gangliosidosis;Juvenile polyposis syndrome;Juvenile polyposis/hereditary hemorrhagic telangiectasia syndrome;Juvenile retinitis;Kabuki makeup syndrome;Kalmann syndrome 1, 2 and 6;Delayed puberty;Kanzaki disease;Karak syndrome;Kartagener syndrome;Kenny-Cafe syndrome type 2;Köppen-Lubinsky syndrome;Keratoconus 1;Folliculor keratosis;Palmoplantar pustulosis 1;Kindler syndrome;L-2-hydroxyglutaric aciduria;Larsen syndrome, dominant;Lattice corneal dystrophy type III;Leber amaurosis;Zellweger syndrome;Peroxisome biogenesis disorders;Tu Wellweger syndrome spectrum;Leber congenital amaurosis 11, 12, 13, 16, 4, 7 and 9;Leber optic atrophy;Aminoglycoside-induced hearing loss;Hearing loss, nonsyndromic, sensorineural, mitochondrial;Left ventricular noncompaction 5;Leigh-right axis anomaly;Leigh disease;Mitochondrial short-chain enoyl-CoA hydratase 1 deficiency;Leigh syndrome due to mitochondrial complex I deficiency;Reiner disease;Lelly-Weil chondro-osseous dysplasia;Lethal congenital contracture syndrome 6;Leukocyte adhesion deficiency types I and III;Leukodystrophy, hypomyelination, 11 and 6;Leukoencephalopathy, with ataxia, with brainstem and spinal cord involvement and elevated lactate, with loss of white matter, and progressive , with ovarian failure;white nails;dementia with Lewy bodies;Liechtenstein-Knorr syndrome;Li-Fraumeni syndrome 1;Lig4 syndrome;limb-girdle muscular dystrophy types 1B, 2A, 2B, 2D, C1, C5, C9, C14;congenital muscular dystrophy-dystroglycanopathy with brain and eye abnormalities, types A14 and B14;combined lipase deficiency;lipoproteinosis;lipodystrophy, familial partial, types 2 and 3;liary dysencephaly 1,2 (X-linked), 3,6 (with microcephaly), X-linked;subcortical band heterotopia, X-linked;acute infantile liver failure;Loeys-Dietz syndrome 1,2,3;long QT syndrome 1,2,2/9,2/5,( 2, genetic), 3, 5 and 5, acquired, susceptible;lung cancer;lymphoedema, hereditary, id;lymphoedema, primary, with myelodysplasia;lymphoproliferative syndrome 1, 1 (X-linked) and 2;lysosomal acid lipase deficiency;macrophagia, gigantism, facial dysmorphism syndrome;macular degeneration, vitelliform, adult onset;malignant hyperthermia type 1;malignant lymphoma, non-Hodgkin;malignant melanoma;malignant tumor of the prostate;mandibular dysplasia;mandibular dysplasia with lipodystrophy types A or B, atypical;mandibulofacial dysplasia, Treacher-Collins type, autosomal recessive;mannose-binding protein deficiency;maple syrup urine disease types 1A and 3;Malden-Walker-like syndrome;malf Fan syndrome;Marinesco-Sj\xc3\xb6gren syndrome;Martsolf syndrome;Maturity-onset diabetes mellitus, types 1, 2, 11, 3 and 9;May-Hegglin syndrome;MYH9-related disorders;Sebastian syndrome;McCun-Albright syndrome;Somatic adenoma;Sex cord-stromal tumor;Cushing syndrome;Macksick-Kauffman syndrome;McLeod neuroerythrocytosis syndrome;Meckel-Gruber syndrome;Medium-chain acyl-coenzyme A dehydrogenase deficiency;Medulloblastoma;Cerebral leukoencephalopathy with subcortical cysts 1 and 2a;Macrocephaly-congenital marbled cutis;PIK3CA-related overgrowth spectrum;Megalencephaly-polymicrogyria-polydactyly-hydrocephalus syndrome 2;megaloblastic anemia, thiamine-responsive, with diabetes mellitus, and sensorineural hearing loss;Meyer-Gorlin syndrome 1 and 4;Melnick-Needles syndrome;meningioma;mental retardation, X-linked, 3, 21, 30, and 72;mental retardation and microcephaly, with pontine and cerebellar hypoplasia;X-linked mental retardation syndrome 5;mental retardation, maxillary prognathism, and strabismus;mental retardation, autosomal dominant 12, 13, 15, 24, 3, 30, 4, 5, 6, and 9;mental retardation, autosomal recessive 15, 44, 46, and 5;mental retardation, stereotypical behavior, epilepsy, and/or brain malformations;mental retardation, syndromic, Claes-Jensen, X-linked;mental retardation, X-linked, nonspecific merosin-deficient congenital muscular dystrophy;metachromatic leukodystrophy juvenile, late infantile, and adult;metachromatic leukodystrophy;metamorphic bone dysplasia;methemoglobinemia types I and 2;methionine adenosyltransferase deficiency, autosomal dominant;methylmalonic acidemia with homocystinuria;methylmalonic aciduria type cblB;methylmalonic aciduria due to methylmalonyl-CoA mutase deficiency;methylmalonic aciduria type mut(0);microcephalic osteodysplasia primordial dwarfism type 2;microcephaly with or without chorioretinopathy, lymphedema, or mental retardation ;microcephaly, hiatal hernia, and nephrotic syndrome;microcephaly;hypoplasia of the corpus callosum;spastic paraplegia50, autosomal recessive;generalized developmental delay;CNS hypomyelination;cerebral atrophy;microcephaly, normal intelligence and immunodeficiency;microcephaly-capillary malformation syndrome;microcytic anemia;syndromic microphthalmia5,7 and 9;microphthalmia, isolated3,5,6,8, and with coloboma6;microcytosis;migraine, familial hemiplegic;Miller syndrome;minicore myopathy with external ophthalmoplegia;congenital myopathy with core;Mitchell-Riley syndrome;mitochondrial 3-hydroxy-3-methylglutaryl-CoA synthetase deficiency;mitochondrial complexes I, II, III, III (nuclear Mitochondrial DNA depletion syndromes 11, 12 (cardiomyopathic type), 2, 4B (MNGIE type), 8B (MNGIE type); mitochondrial DNA depletion syndromes 3 and 7, hepatocerebral type and 13 (encephalomyopathic type); mitochondrial phosphate carrier and pyruvate carrier deficiency; mitochondrial trifunctional protein deficiency; long-chain 3-hydroxyacyl-CoA dehydrogenase deficiency; Miyoshi muscular dystrophy 1; distal myopathy with pretibial involvement; Mohr-Tranebjaerg syndrome; molybdenum cofactor deficiency, complementation group A; Mowat-Wilson syndrome; mucolipidosis III gamma; mucopolypeptide Saccharidosis type VI, type VI (severe) and type VII;mucopolysaccharidosis, MPS-IH/S, MPS-II, MPS-III-A, MPS-III-B, MPS-III-C, MPS-IV-A, MPS-IV-B;retinitis pigmentosa 73;gangliosidosis GM1 type 1 (with cardiac involvement) 3;multicentric osteolytic nephropathy;multicentric osteolysis, nodular disease and arthropathy;multiple congenital anomalies;atrial septal defect 2;multiple congenital anomalies-hypotonia-seizure syndrome 3;multiple skin and mucosal venous malformations;multiple endocrine neoplasia types 1 and 4;multiple epiphyseal dysplasia type 5 or dominant;multiple intestinal atresia;multiple pterygium syndrome Escobar type;multiple sulfatase deficiency;multiple Synostosis syndrome 3;muscle AMP guanine oxidase deficiency;muscle oculoencephalopathy;muscular dystrophy, congenital, megaconoid type;myasthenia, familial childhood, 1;congenital myasthenic syndrome 11, associated with acetylcholine receptor deficiency;congenital myasthenic syndrome 17, without 2A (slow channel), 4B (fast channel) and tubular assembly;myeloperoxidase deficiency;MYH-associated polyposis;endometrial cancer;myocardial infarction 1;myoclonic dystonia;myoclonic-atonic epilepsy;red rag fiber myoclonic epilepsy;myofibrillar myopathy 1 and ZASP associated;myoglobinuria, acute relapsing, autosomal recessive;myoneurogastroenteric cerebral cerebellar ataxia with progressive external ophthalmoplegia;mitochondrial DNA depletion syndrome 4B, MNGIE type;myopathy, central, 1, congenital, with excess muscle spindles, distal, 1, lactic acidosis, and sideroblastic anemia 1;mitochondrial progressive with congenital cataracts, hearing loss, and developmental delay, and tubular aggregates, 2;myopia 6;myosclerosis, autosomal recessive;myotonia congenita;myotonia congenita, autosomal dominant and recessive;nail-patella syndrome;Nance-Hollan syndrome;microphthalmia 2;Navajo neurohepatopathy;nemaline myopathy 3 and 9;neonatal hypotonia;intellectual disability;seizures;language delay;mental retardation, autosomal dominant 31;citrine deficiency Neonatal intrahepatic cholestasis caused by nephropathy;nephrogenic diabetes insipidus, nephrogenic diabetes insipidus, X-linked;nephrolithiasis/osteoporosis, hypophosphatemic, 2;nephronophthisis 13, 15 and 4;infertility;cerebro-ocular-renal syndrome (nephronophthisis, oculomotor ataxia, and cerebellar abnormalities);nephrotic syndrome, types 3, 5, with or without ocular abnormalities, types 7 and 9;Nester-Greermoprogeria syndrome;Neu-Laxova syndrome 1;neurodegeneration with brain iron accumulation 4 and 6;neuroferritinopathy;neurofibromatosis, types 1 and 2;neurofibrosarcoma;neurohypophyseal diabetes insipidus;neuropathy, hereditary sensory, type IC;neutral 1 amino acid transport disorder;myopathy Neutral lipid storage disease with leukemia;Neutrophil immunodeficiency syndrome;Nicolades-Baraist syndrome;Niemann-Pick disease types C1, C2, A, and C1, adult type;Nonketotic hyperglycinemia;Noonan syndrome 1 and 4, LEOPARD syndrome 1;Noonan-like disorder with or without juvenile myelomonocytic leukemia;Emokalemic periodic paralysis, potassium sensitivity;Norm disease;Epilepsy, deafness, and mental retardation syndrome;Mental retardation, X-linked 102 and syndromic 13;Obesity;Ocular albinism, type I;Oculocutaneous albinism types 1B, 3, and 4;Oculodentodigital dysplasia;Odontohypophosphatasia;Odonto-hair-limb syndrome syndrome); macrostomia; hypodontia-colorectal cancer syndrome; Opitz G/BBB syndrome; optic atrophy 9; orofacial dactyly syndrome; ornithine aminotransferase deficiency; orofacial clefts 11 and 7; lip/palate ectodermal dysplasia syndrome; Olstavic-Lindemann-Solberg syndrome; osteoarthritis with mild chondrodysplasia; osteochondritis dissecans; osteogenesis imperfecta types 12, 5, 7, 8, I, and III, with normal sclera, dominant, recessive perinatal lethal; craniosclerosis striated osteomyelopathy with osteoporosis;autosomal dominant osteopetrosis types 1 and 2, recessive type 4, recessive type 1, recessive type 6;osteoporosis with pseudoglioma;otopalatodactyl syndrome types I and II;ovarian hypoplasia 1;ovarian leukoencephalopathy;congenital pachyonychia types 4 and 2;Paget's disease of bone, familial;Pallister-Hall syndrome;palmoplantar keratoderma, non-epidermolytic, focal or diffuse;pancreatic agenesis and congenital heart disease;Papillon-Lef\xc3\xa8vre syndrome;paraganglioma 3;von Oleinburg Congenital anomaly myotonia of Eulenburg;parathyroid carcinoma;Parkinson's disease 14, 15, 19 (early onset), 2, 20 (early onset), 6, (autosomal recessive early onset) and 9;localized albinism;hypoxanthine-guanine phosphoribosyltransferase partial deficiency;pattern dystrophy of the retinal pigment epithelium;PC-K6a;Pelizaeus-Merzbacher disease;Pendred syndrome;peripheral demyelinating neuropathy, central demyelinating;Hirschsprung's disease;permanent neonatal diabetes mellitus;permanent neonatal diabetes mellitus, with neurological features;neonatal insulin-dependent diabetes mellitus;maturity-onset diabetes mellitus of the young, Type 2;Peroxisome biogenesis disorders 14B, 2A, 4A, 5B, 6A, 7A and 7B;Perot syndrome 4;Perry syndrome;Persistent hyperinsulinemic hypoglycemia of the newborn;Familial hyperinsulinism;Phenotype;Phenylketonuria;Pheochromocytoma;Hereditary paraganglioma-pheochromocytoma syndrome;Paraganglioma 1;Intestinal carcinoid tumors;Cowden syndrome 3;Phosphoglycerate dehydrogenase deficiency;Phosphoglycerate kinase 1 deficiency;Photosensitive sulfur deficiency hair dystrophy;Phytanic acid storage disease;Pick's disease;Pearson syndrome;Pigmentary retinal dystrophy;Pigmented nodular adrenal corticopathy aberrant, primary, 1;calcifying epithelioma;Pitt-Hopkins syndrome;pituitary-dependent hypercortisolism;pituitary hormone deficiency, combined types 1, 2, 3, and 4;plasminogen activator inhibitor type 1 deficiency;plasminogen deficiency, type I;platelet-type bleeding disorders 15 and 8;poikiloderma, with hereditary fibrosis, tendon contractures, myopathy, and pulmonary fibrosis;polycystic kidney disease 2, adult and infantile types;polycystic lipomembranous dysplasia with sclerosing leukoencephalopathy;polyglucosan body myopathy 1 with or without immunodeficiency;polymicrogyria, asymmetric, bilateral frontoparietal;polyneuritis, Hearing loss, ataxia, retinitis pigmentosa, and cataract;pontocerebellar hypoplasia type 4;popliteal fold syndrome;porencephaly 2;porokeratosis 8, contagious superficial chemoactive type;porphobilinogen synthase deficiency;porphyria cutanea tarda;spinal ataxia with retinitis pigmentosa;posterior polar cataract type 2;Prader-Willi-like syndrome;premature ovarian failure 4, 5, 7, and 9;primary autosomal recessive microcephaly 10, 2, 3, and 5;primary ciliary dyskinesia 24;primary dilated cardiomyopathy;left heart noncompaction 6;4,left heart noncompaction 10;paroxysmal atrial fibrillation;primary hyperoxaluria, types I and III;primary hypertrophic bone Arthropathy, autosomal recessive 2;primary hypomagnesemia;primary open-angle glaucoma early-onset 1;primary pulmonary hypertension;Primrose syndrome;progressive familial heart block type 1B;progressive familial intrahepatic cholestasis 2 and 3;progressive intrahepatic cholestasis;progressive myoclonic epilepsy with ataxia;progressive pseudorheumatic dysplasia;progressive sclerosing poliodystrophy;prolidase deficiency;proline dehydrogenase deficiency;schizophrenia 4;propazine deficiency, X-linked;propionic acidemia;proprotein convertase 1/3 deficiency;prostate cancer, hereditary, 2;protan deficiency;proteinuria;Finland congenital nephrotic syndrome; Proteus syndrome; breast cancer; pseudoachondroplasia spondyloepiphyseal dysplasia; pseudohypoaldosteronism type 1 autosomal dominant and recessive and type 2; pseudohypoparathyroidism type 1A; pseudopseudohypoparathyroidism; pseudoneonatal adrenoleukodystrophy; pseudoprimary hyperaldosteronism; pseudoxanthoma elasticum; generalized arterial calcification of infancy 2; pseudoxanthoma elasticum-like disorder with multiple coagulation factor deficiencies; psoriasis susceptibility 2; PTEN hamartoma syndrome; pulmonary arterial hypertension associated with hereditary hemorrhagic telangiectasia; pulmonary fibrosis and/or bone marrow failure, telomere-related, 1 and and 3; pulmonary hypertension, primary, with hereditary hemorrhagic telangiectasia; 1; purine-nucleoside phosphorylase deficiency; pyruvate carboxylase deficiency; pyruvate dehydrogenase E1-alpha deficiency; erythrocyte pyruvate kinase deficiency; Raine syndrome; rasopathy; recessive dystrophic epidermolysis bullosa; nail disorder, nonsyndromic congenital, 8; Reifenstein syndrome; renal coloboma syndrome; renal dysplasia; renal dysplasia, pigmentary retinal dystrophy, cerebellar ataxia, and skeletal dysplasia; with delayed sensorineural hearing loss or with hemolytic anemia renal tubular acidosis, distal, autosomal recessive; renal tubular acidosis, proximal, with ocular abnormalities and mental retardation; cone dystrophy 3B; retinitis pigmentosa; retinitis pigmentosa 10, 11, 12, 14, 15, 17, and 19; retinitis pigmentosa 2, 20, 25, 35, 36, 38, 39, 4, 40, 43, 45, 48, 66, 7, 70, 72; retinoblastoma; Rett's disorder; rhabdoid tumor predisposition syndrome 2; rhegmatogenous retinal detachment, autosomal dominant; rhabdoid chondrodysplasia punctata types 2 and 3; Roberts-SC azoobium limb anomaly syndrome; Robinow-Solauf Sorauf syndrome;Robinow syndrome, autosomal recessive, autosomal recessive with brachypolydactyly;Rothmund-Thomson syndrome;Lapadellino syndrome;RRM2B-related mitochondrial disease;Rubinstein-Taybi syndrome;Salla disease;Sandhoff disease, adult and infantile;Sarcoidosis, early onset;Blau syndrome;Schindler disease, type 1;schizencephaly;schizophrenia 15;cochlear-pelvic dysplasia;schwannomatosis 2;Schwartz-Jampel syndrome type 1;keratosclerosis, autosomal recessive;sclerosteosis;secondary hypothyroidism;Segawa syndrome, autosomal recessive;Senior-Loken syndromes 4 and 5;sensory ataxic neuropathies Qi, dysarthria, and ophthalmoplegia;sepiapterin reductase deficiency;SeSAME syndrome;severe combined immunodeficiency due to ADA deficiency, with microcephaly, growth retardation, and sensitivity to ionizing radiation, atypical, autosomal recessive, T cell negative, B cell positive, NK cell negative with NK cell positive;severe congenital neutropenia;severe congenital neutropenia 3, autosomal recessive or dominant;severe congenital neutropenia and 6, autosomal recessive;severe myoclonic epilepsy of infancy;generalized epilepsy with febrile convulsions, types 1 and 2;severe X-linked myotubular myopathy;short QT syndrome type 3;short stature with nonspecific skeletal abnormalities;short stature, auditory canal stenosis , mandibular hypoplasia, skeletal abnormalities; short stature, onychodysplasia, facial dysmorphism, and hypotrichosis; primordial dwarfism; short-costothoracic dysplasia 11 or 3 with or without polydactyly; sialidosis types I and II; Silver spastic paraplegia syndrome; nerve conduction velocity slowing, autosomal dominant; Smith-Lemli-Opitz syndrome; Snyder-Robinson syndrome; growth hormone-secreting adenoma; prolactinoma; familial, predisposition to pituitary adenoma; Sotos syndrome 1 or 2; spastic ataxia 5, autosomal recessive; Charlevoix-Saguenay type 1,10 or 11, autosomal recessive; amyotrophic lateral sclerosis type 5; spastic paraplegia 15,2,3,35,39,4, autosomal dominant , 55, autosomal recessive, and 5A; bile acid synthesis disorder, congenital, 3; spermatogenesis impair, 11, 3, and 8; spherocytosis types 4 and 5; spherocytosis, spherocytosis, 2, autosomal dominant; spinal muscular atrophy, type II; spinocerebellar ataxia, 14, 21, 35, 40, and 6; spinocerebellar ataxia, autosomal recessive, 1 and 16; splenic hypoplasia; spinocarpal synostosis syndrome; spondylopalmal dysplasia, Ehlers-Danlos-like, with immune dysregulation, aggrecan type, with congenital joint dislocation, brachy-hand type, Sedaghatian type, with cone-rod dystrophy, and Kozlowski type; twisted dwarfism;Stargardt disease 1;cone-rod dystrophy 3;Stickler syndrome type 1;Kniest dysplasia;Stickler syndrome, types 1 (nonsyndromic ocular) and 4;Sting-associated vasculopathy, childhood onset;Storm-Olken syndrome;Sturge-Weber syndrome, capillary malformation, congenital, 1;succinyl-CoA acetoacetate transferase deficiency;sucrase-isomaltase deficiency;sudden infant death syndrome;subcutaneous Sulfate oxidase deficiency, isolated;Supravalvular aortic stenosis;Pulmonary surfactant metabolic dysfunction, 2 and 3;Synopsis, proximal, 1b;Senanyi-Lenz syndactyly;Syndactyly type 3;Syndromic X-linked mental retardation 16;Equilateral talipes;Tangier disease;TARP syndrome;Tay-Sachs disease, B1 variant;Gm2 gangliosidosis (adult);Gm2 gangliosidosis (adult onset);Temtamy syndrome;Tenorio syndrome;Epiphyseal dysplasia formation;testosterone 17-beta-dehydrogenase deficiency;atetramelia, autosomal recessive;tetralogy of Fallot;hypoplastic left heart syndrome 2;aneurysm;cardiac and great vascular anomalies;ventricular septal defect 1;Thiel-Behnke corneal dystrophy;thoracic aortic aneurysm and aortic dissection;marfanoid habitus;3M syndrome 2;thrombocytopenia, platelet dysfunction, hemolysis, and globin synthesis imbalance;thrombocytopenia, X-linked;thrombosis, hereditary, due to protein C deficiency, autosomal dominant and recessive;thyroid agenesis;thyroid cancer, follicular;thyroid hormone metabolism disorders;thyroid hormone resistance, generalized, autosomal dominant;thyrotoxic periodic paralysis and thyrotoxic periodic paralysis 2;cytotropin-releasing hormone resistance, generalized;timothy syndrome;tumor necrosis factor receptor-associated periodic fever syndrome (TRAPS);tooth agenesis, selective, 3 and 4;polymorphic ventricular tachycardia (Torsades de pointes);Townes-Brocks branchio-oto-nephroid syndrome;Epidermolysis bullosa transientes of the newborn;Treacher Collins syndrome 1;Lymphocytosis with mental retardation, dwarfism, and pigmentary degeneration of the retina;Trigeminal ganglion dysplasia type I;Trigeminal ganglion syndrome type 3;Trimethylaminuria;Tuberous sclerosis syndrome;Lymphangiomyomatosis;Tuberous sclerosis complex 1 and 2;Tyrosinase-negative oculocutaneous albinism;Tyrosinase-positive oculocutaneous albinism;Tyrosinemia type I;UDP-glucose-4-epimerase deficiency;Ullrich congenital muscular dystrophy;Ulnar-peroneal deficiency with severe limb defects;Upshaw-Schulman syndrome;Urocanic acid hydratase deficiency;Usher syndrome, types 1, 1B, 1D, 1G, 2A, 2C, and 2D;Retinitis pigmentosa 39;UVA-sensitive syndrome;Van der Woude Woude syndrome; Van Maldergem syndrome 2; Henkam lymphangiectasia-lymphedema syndrome 2; variant porphyria; ventricular enlargement with cystic kidney disease; Verheij syndrome; very long-chain acyl-CoA dehydrogenase deficiency; vesicoureteral reflux 8; situs inversus 5, autosomal; abdominal myopathy; vitamin D-dependent rickets, types 1 and 2; vitellogenic dystrophy; von Willebrand disease types 2M and 3; Waardenburg syndrome types 1, 4C, and 2E (with neurological involvement); Klein-Waardenburg syndrome; Walker-Warburg congenital muscular dystrophy; Warburg-Micro syndrome 2 and 4; IgE , hypogammaglobulinemia, infection, and myeloid cellular pools;Weaver syndrome;Weill-Marchesani syndromes 1 and 3;Weill-Marchesani-like syndromes;Weissenbacher-Zweymuller syndrome;Werdnig-Hoffmann disease;Charcot-Marie-Tooth disease;Werner syndrome;WFS1-related disorders;Wiedemann-Steiner syndrome;Wilson's disease;Wolfram-like syndromes, autosomal dominant;Worth disease;van Buchem disease type 2;xeroderma pigmentosum, complementation groups b, D, E, and G;X-linked agammaglobulinemia;X-linked Hereditary motor and sensory neuropathies; X-linked ichthyosis with sterylsulfatase deficiency; X-linked periventricular heterotopic gray matter; Otopalatodactyl syndrome, type I; X-linked severe combined immunodeficiency; Zimmermann-Laband syndrome and Zimmermann-Laband syndrome 2; and Zonular powdery cataract 3.

標的ヌクレオチド配列は、疾患、障害、または疾病に関連する標的配列(例えば点変異)を含み得る。標的配列は疾患、障害、または疾病に関連するTからC(またはAからG)の点変異を含み得、変異体C塩基の脱アミノ化は、疾患、障害、または疾病に関連しない配列へのミスマッチ修復によって媒介される修正をもたらす。標的配列は疾患、障害、または疾病に関連するGからA(またはCからT)の点変異を含み得、変異体A塩基の脱アミノ化は、疾患、障害、または疾病に関連しない配列へのミスマッチ修復によって媒介される修正をもたらす。標的配列はタンパク質をコードし得、点変異がコドンにあるところでは、野生型コドンと比較して変異体コドンによってコードされるアミノ酸の変化をもたらす。標的配列はスプライス部位にもまたあり得、点変異は野生型転写物と比較してmRNA転写物のスプライシングの変化をもたらす。加えて、標的は遺伝子の非コード配列、例えばプロモーターにもまたあり得、点変異は遺伝子の増大または減少した発現をもたらす。 The target nucleotide sequence may include a target sequence (e.g., a point mutation) associated with a disease, disorder, or condition. The target sequence may include a T to C (or A to G) point mutation associated with a disease, disorder, or condition, where deamination of the mutant C base results in mismatch repair-mediated correction to a sequence not associated with the disease, disorder, or condition. The target sequence may include a G to A (or C to T) point mutation associated with a disease, disorder, or condition, where deamination of the mutant A base results in mismatch repair-mediated correction to a sequence not associated with the disease, disorder, or condition. The target sequence may code for a protein, where the point mutation is in a codon, resulting in a change in the amino acid encoded by the mutant codon compared to the wild-type codon. The target sequence may also be in a splice site, where the point mutation results in an altered splicing of the mRNA transcript compared to the wild-type transcript. In addition, the target may also be in a non-coding sequence of a gene, such as a promoter, where the point mutation results in increased or decreased expression of the gene.

それゆえに、いくつかの側面では、変異体Cの脱アミノ化は変異体コドンによってコードされるアミノ酸の変化をもたらし、これはいくつかのケースでは野生型アミノ酸の発現をもたらし得る。他の側面では、変異体Aの脱アミノ化は変異体コドンによってコードされるアミノ酸の変化をもたらし、これはいくつかのケースでは野生型アミノ酸の発現をもたらし得る。 Thus, in some aspects, deamination of mutant C results in a change in the amino acid encoded by the mutant codon, which may in some cases result in the expression of the wild-type amino acid. In other aspects, deamination of mutant A results in a change in the amino acid encoded by the mutant codon, which may in some cases result in the expression of the wild-type amino acid.

細胞を組成物またはrAAV粒子と接触させることが関わる本明細書に記載の方法は、in vitroで、エクスビボで、またはインビボで生起し得る。ある態様において、接触させるステップは対象に生起する。ある態様において、対象は疾患、障害、または疾病と診断されている。 The methods described herein involving contacting a cell with a composition or rAAV particle can occur in vitro, ex vivo, or in vivo. In some embodiments, the contacting step occurs in a subject. In some embodiments, the subject has been diagnosed with a disease, disorder, or condition.

いくつかの態様では、本明細書に開示の方法には、哺乳類細胞を組成物またはrAAV粒子と接触させることが関わる。具体的な態様では、方法には、網膜細胞、皮質細胞、または小脳細胞に接触することが関わる。 In some embodiments, the methods disclosed herein involve contacting a mammalian cell with a composition or rAAV particle. In specific embodiments, the methods involve contacting a retinal cell, a cortical cell, or a cerebellar cell.

本明細書に記載の方法を用いて送達される分裂されたCas9タンパク質または分裂されたプライム編集因子は、好ましくは、元々のCas9タンパク質またはプライム編集因子(すなわち、丸ごと細胞に送達または細胞によって発現される未分裂のタンパク質)と比較して遜色ない活性を有する。例えば、分裂されたCas9タンパク質または分裂されたプライム編集因子は、元々のCas9タンパク質またはプライム編集因子の活性の少なくとも50%(例えば、少なくとも50%、少なくとも60%、少なくとも70%、少なくとも80%、少なくとも90%、少なくとも95%、少なくとも98%、少なくとも99%、または100%)を保持する。いくつかの態様では、分裂されたCas9タンパク質または分裂されたプライム編集因子は、元々のCas9タンパク質またはプライム編集因子のものよりも(例えば、2倍、5倍、10倍、100倍、1000倍、またはより多く)活性である。 The split Cas9 protein or split prime editor delivered using the methods described herein preferably has comparable activity to the original Cas9 protein or prime editor (i.e., the unsplit protein delivered to or expressed by the cell in its entirety). For example, the split Cas9 protein or split prime editor retains at least 50% (e.g., at least 50%, at least 60%, at least 70%, at least 80%, at least 90%, at least 95%, at least 98%, at least 99%, or 100%) of the activity of the original Cas9 protein or prime editor. In some embodiments, the split Cas9 protein or split prime editor is more active (e.g., 2-fold, 5-fold, 10-fold, 100-fold, 1000-fold, or more) than that of the original Cas9 protein or prime editor.

本明細書に記載の組成物は、対象が患っている疾患または障害を処置および/または防止するための治療学的有効量でその必要がある対象に投与され得る。CRISPR/Cas9に基づくゲノム編集テクノロジーを用いて処置および/または防止され得るいずれかの疾患または障害は、本明細書に記載の分裂されたCas9タンパク質または分裂されたプライム編集因子によって処置され得る。分裂されたCas9タンパク質またはプライム編集因子をコードするヌクレオチド配列がさらにgRNAをコードしない場合には、gRNAをコードする別個の核酸ベクターが本明細書に記載の組成物と一緒に投与され得るということは理解されるはずである。 The compositions described herein may be administered to a subject in need thereof in a therapeutically effective amount to treat and/or prevent a disease or disorder from which the subject suffers. Any disease or disorder that can be treated and/or prevented using CRISPR/Cas9-based genome editing technology may be treated by the split Cas9 protein or split prime editor described herein. It should be understood that in cases where the nucleotide sequence encoding the split Cas9 protein or prime editor does not further encode a gRNA, a separate nucleic acid vector encoding a gRNA may be administered together with the compositions described herein.

例示の好適な疾患、障害、または疾病は、限定なしに:嚢胞性線維症、フェニルケトン尿症、表皮剥離性角質増殖症(EHK)、慢性閉塞性肺疾患(COPD)、シャルコー・マリー・トゥース病4J型、神経芽腫(NB)、フォン・ヴィレブランド病(vWD)、先天性ミオトニー、遺伝性腎アミロイドーシス、拡張型心筋症、遺伝性リンパ浮腫、家族性アルツハイマー病、プリオン病、慢性乳児神経皮膚関節症候群(CINCA)、先天性難聴、ニーマン・ピック病C型(NPC)疾患、およびデスミン関連ミオパチー(DRM)からなる群から選択される疾患または障害を包含する。具体的な態様では、疾患または疾病はニーマン・ピック病C型(NPC)疾患である。 Exemplary suitable diseases, disorders, or conditions include, without limitation, a disease or condition selected from the group consisting of: cystic fibrosis, phenylketonuria, epidermolytic hyperkeratosis (EHK), chronic obstructive pulmonary disease (COPD), Charcot-Marie-Tooth disease type 4J, neuroblastoma (NB), von Willebrand disease (vWD), congenital myotonia, hereditary renal amyloidosis, dilated cardiomyopathy, hereditary lymphedema, familial Alzheimer's disease, prion disease, chronic infantile neurological cutaneous and articular syndrome (CINCA), congenital hearing loss, Niemann-Pick disease type C (NPC) disease, and desmin-related myopathy (DRM). In a specific embodiment, the disease or condition is Niemann-Pick disease type C (NPC) disease.

いくつかの態様では、疾患、障害、または状態はNPC遺伝子、DNMT1遺伝子、PCSK9遺伝子、またはTMC1遺伝子の点変異に関連する。ある態様において、点変異はNPCのT3182C変異であり、これはI1061Tアミノ酸置換をもたらす。 In some embodiments, the disease, disorder, or condition is associated with a point mutation in the NPC gene, the DNMT1 gene, the PCSK9 gene, or the TMC1 gene. In some embodiments, the point mutation is a T3182C mutation in NPC, which results in an I1061T amino acid substitution.

ある態様において、点変異はTMC1のA545G変異であり、これはY182Cアミノ酸置換をもたらす。TMC1は内耳の感覚有毛細胞の機械受容イオンチャネルを形成するタンパク質をコードし、正常な聴覚機能に要求される。Y182Cアミノ酸置換は先天性難聴に関連する。 In some embodiments, the point mutation is an A545G mutation in TMC1, which results in a Y182C amino acid substitution. TMC1 encodes a protein that forms mechanosensitive ion channels in sensory hair cells of the inner ear and is required for normal hearing function. The Y182C amino acid substitution is associated with congenital hearing loss.

いくつかの態様では、疾患、障害、または疾病は、停止コドン、例えば遺伝子のコード領域内の未成熟停止コドンを生成する点変異に関連する。 In some embodiments, the disease, disorder, or condition is associated with a stop codon, e.g., a point mutation that creates a premature stop codon in the coding region of a gene.

追加の例示の疾患、障害、または疾病は、嚢胞性線維症(例えば、Schwank et al.,Functional repair of CFTR by CRISPR/Cas9 in intestinal stem cell organoids of cystic fibrosis patients.Cell stem cell.2013;13:653-658;およびWu et.al.,Correction of a genetic disease in mouse via use of CRISPR-Cas9.Cell stem cell.2013;13:659-662を見よ。これらのいずれも、遺伝子欠陥を修正するためにデアミナーゼ融合タンパク質を用いていない);フェニルケトン尿症-例えば、フェニルアラニンヒドロキシラーゼ遺伝子の位置835(マウス)もしくは240(ヒト)または相同残基におけるフェニルアラニンからセリンの変異(T>C変異)-例えばMcDonald et al.,Genomics.1997;39:402-405を見よ;ベルナール・スーリエ症候群(BSS)-例えば、血小板膜糖タンパク質IXの位置55もしくは相同残基におけるフェニルアラニンからセリンの変異または残基24もしくは相同残基におけるシステインからアルギニン(T>C変異)-例えばNoris et al.,British Journal of Haematology.1997;97:312-320およびAli et al.,Hematol.2014;93:381-384を見よ;表皮剥離性角質増殖症(EHK)-例えば、ケラチン1の位置160もしくは161(開始メチオニンをカウントする場合)または相同残基におけるロイシンからプロリンの変異(T>C変異)-例えば、Chipev et al.,Cell.1992;70:821-828を見よ。www[dot]uniprot[dot]orgのUNIPROTデータベースのアクセッション番号P04264をもまた見よ;慢性閉塞性肺疾患(COPD)-例えば、α1-アンチトリプシンのプロセシングされた形態の位置54もしくは55(開始メチオニンをカウントする場合)または相同残基あるいはプロセシングされない形態の残基78または相同残基におけるロイシンからプロリンの変異(T>C変異)-例えば、Poller et al.,Genomics.1993;17:740-743を見よ。UNIPROTデータベースのアクセッション番号P01011をもまた見よ;シャルコー・マリー・トゥース病4J型 - 例えばFIG4の位置41または相同残基におけるイソロイシンからトレオニンの変異(T>C変異)-例えば、Lenk et al.,PLoS Genetics.2011;7:e1002104を見よ;神経芽腫(NB)-例えば、カスパーゼ-9の位置197または相同残基におけるロイシンからプロリンの変異(T>C変異)-例えば、Kundu et al.,3 Biotech.2013,3:225-234を見よ;フォン・ヴィレブランド病(vWD)-例えば、フォン・ヴィレブランド因子のプロセシングされた形態の位置509もしくは相同残基またはフォン・ヴィレブランド因子のプロセシングされない形態の位置1272もしくは相同残基におけるシステインからアルギニンの変異(T>C変異)-例えば、Lavergne et al.,Br.J.Haematol.1992を見よ。UNIPROTデータベースのアクセッション番号P04275をもまた見よ;82:66-72;先天性ミオトニー-例えば、筋肉塩素チャネル遺伝子CLCN1の位置277または相同残基におけるシステインからアルギニンの変異(T>C変異)-例えば、Weinberger et al.,The J.of Physiology.2012;590:3449-3464を見よ;遺伝性腎アミロイドーシス-例えば、アポリポタンパク質AIIのプロセシングされた形態の位置78もしくは相同残基またはプロセシングされない形態の位置101もしくは相同残基における停止コドンからアルギニンの変異(T>C変異)-例えば、Yazaki et al.,Kidney Int.2003;64:11-16を見よ;拡張型心筋症(DCM)-例えば、FOXD4遺伝子の位置148または相同残基におけるトリプトファンからアルギニンの変異(T>C変異)、例えば、Minoretti et.al.,Int.J.of Mol.Med.2007;19:369-372を見よ;遺伝性リンパ浮腫 - 例えば、VEGFR3チロシンキナーゼの位置1035または相同残基におけるヒスチジンからアルギニンの変異(A>G変異)、例えば、Irrthum et al.,Am.J.Hum.Genet.2000;67:295-301を見よ;家族性アルツハイマー病-例えば、プレセニリン1の位置143または相同残基におけるイソロイシンからバリンの変異(A>G変異)、例えば、Gallo et.al.,J.Alzheimer's Disease.2011;25:425-431を見よ;プリオン病-例えば、プリオンタンパク質の位置129または相同残基におけるメチオニンからバリンの変異(A>G変異)-例えば、Lewis et.al.,J.of General Virology.2006;87:2443-2449を見よ;慢性乳児神経皮膚関節症候群(CINCA)-例えば、クリオピリンの位置570または相同残基におけるチロシンからシステインの変異(A>G変異)-例えば、Fujisawa et.al.Blood.2007;109:2903-2911を見よ;ならびにデスミン関連ミオパチー(DRM)-例えば、αβクリスタリンの位置120または相同残基におけるアルギニンからグリシンの変異(A>G変異)を包含する。例えば、Kumar et al.,J.Biol.Chem.1999;274:24137-24141を見よ。全ての参照およびデータベースエントリーの内容全体は参照によって本願に組み込まれる。 Additional exemplary diseases, disorders, or conditions include cystic fibrosis (see, e.g., Schwank et al., Functional repair of CFTR by CRISPR/Cas9 in intestinal stem cell organoids of cystic fibrosis patients. Cell stem cell. 2013;13:653-658; and Wu et.al., Correction of a genetic disease in mouse via use of CRISPR-Cas9. Cell stem cell. 2013;13:659-662, neither of which use a deaminase fusion protein to correct the genetic defect); phenylketonuria - e.g., a phenylalanine to serine mutation (T>C mutation) at position 835 (mouse) or 240 (human) of the phenylalanine hydroxylase gene or at a homologous residue - see, e.g., McDonald et al. al., Genomics. 1997;39:402-405; Bernard-Soulier syndrome (BSS) - e.g., a phenylalanine to serine mutation at position 55 or homologous residues of platelet membrane glycoprotein IX or a cysteine to arginine at residue 24 or homologous residues (T>C mutation) - see, e.g., Noris et al., British Journal of Haematology. 1997;97:312-320 and Ali et al., Hematol. 2014;93:381-384; epidermolytic hyperkeratosis (EHK) - e.g., a leucine to proline mutation at position 160 or 161 (counting the initiator methionine) or homologous residues of keratin 1 (T>C mutation) - see, e.g., Chipev et al., Cell. 1992;70:821-828. See also accession number P04264 in the UNIPROT database at www[dot]uniprot[dot]org; chronic obstructive pulmonary disease (COPD) - e.g., a leucine to proline mutation (T>C mutation) at positions 54 or 55 (counting the initiator methionine) or homologous residues in the processed form of α1 -antitrypsin or at residue 78 or homologous residues in the unprocessed form - see, e.g., Poller et al., Genomics. 1993;17:740-743. see also UNIPROT database accession number P01011; Charcot-Marie-Tooth disease type 4J - e.g., an isoleucine to threonine mutation at position 41 or a homologous residue in FIG4 (T>C mutation) - see, e.g., Lenk et al., PLoS Genetics. 2011;7:e1002104; Neuroblastoma (NB) - e.g., a leucine to proline mutation at position 197 or a homologous residue in caspase-9 (T>C mutation) - see, e.g., Kundu et al., 3 Biotech. 2013,3:225-234; von Willebrand disease (vWD) - e.g., a cysteine to arginine mutation at position 509 or a homologous residue in the processed form of von Willebrand factor or at position 1272 or a homologous residue in the unprocessed form of von Willebrand factor (T>C mutation) - see, e.g., Lavergne et al., See al., Br. J. Haematol. 1992. see also UNIPROT database accession number P04275;82:66-72;myotonia congenita - e.g., a cysteine to arginine mutation (T>C mutation) at position 277 or a homologous residue in the muscle chloride channel gene CLCN1 - see, e.g., Weinberger et al., The J. of Physiology. 2012;590:3449-3464;hereditary renal amyloidosis - e.g., a stop codon to arginine mutation (T>C mutation) at position 78 or a homologous residue in the processed form of apolipoprotein AII or at position 101 or a homologous residue in the unprocessed form - see, e.g., Yazaki et al., Kidney Int. 2003;64:11-16;dilated cardiomyopathy (DCM) - e.g., a tryptophan to arginine mutation (T>C mutation) at position 148 or a homologous residue in the FOXD4 gene, see, e.g., Minoretti et.al., Int. J. of Mol. Med. 2007;19:369-372; hereditary lymphedema - e.g., a histidine to arginine mutation (A>G mutation) at position 1035 or a homologous residue in VEGFR3 tyrosine kinase, see e.g., Irrthum et al., Am. J. Hum. Genet. 2000;67:295-301; familial Alzheimer's disease - e.g., an isoleucine to valine mutation (A>G mutation) at position 143 or a homologous residue in presenilin 1, see e.g., Gallo et.al., J. Alzheimer's Disease. 2011;25:425-431; prion disease - e.g., a methionine to valine mutation (A>G mutation) at position 129 or a homologous residue in the prion protein - see e.g., Lewis et.al., J. of General Virology. 2006;87:2443-2449; chronic infantile neurological cutaneous articular syndrome (CINCA) - e.g., a tyrosine to cysteine mutation (A>G mutation) at position 570 or homologous residues in cryopyrin - see, e.g., Fujisawa et.al. Blood. 2007;109:2903-2911; and desmin-related myopathy (DRM) - e.g., an arginine to glycine mutation (A>G mutation) at position 120 or homologous residues in αβ crystallin. See, e.g., Kumar et al., J. Biol. Chem. 1999;274:24137-24141. The entire contents of all references and database entries are incorporated herein by reference.

トリヌクレオチド反復拡大疾患
トリヌクレオチド反復拡大は、ハンチントン病、脆弱X症候群、およびフリードライヒ運動失調症を包含するいくつものヒト疾患に関連する。最も普通のトリヌクレオチド反復はCAGトリプレットを含有するが、GAAトリプレット(フリードライヒ運動失調症)およびCGGトリプレット(脆弱X症候群)もまた生起する。拡大の素因を受け継ぐことまたはすでに伸長した親のアレルを獲得することは、疾患を獲得する蓋然性を増大させる。トリヌクレオチド反復の病原性の拡大は仮説上はプライム編集を用いて修正され得る。
Trinucleotide repeat expansion diseases Trinucleotide repeat expansions are associated with a number of human diseases, including Huntington's disease, fragile X syndrome, and Friedreich's ataxia. The most common trinucleotide repeat contains a CAG triplet, but GAA triplets (Friedreich's ataxia) and CGG triplets (Fragile X syndrome) also occur. Inheriting a predisposition to an expansion or acquiring an already expanded parental allele increases the likelihood of acquiring the disease. Pathogenic expansions of trinucleotide repeats could hypothetically be corrected using prime editing.

図1Gまたは図22に概説されている一般的な機序に従って、反復領域の上流の領域が、RNAによってガイドされるヌクレアーゼによってニッキングされ得、それから、健康な反復数(これは具体的な遺伝子および疾患に依存する)を含有する新たなDNA鎖の合成をプライムするために用いられ得る。反復配列の後には、反復の他端に隣接する配列のアイデンティティーにマッチする相同性の短いストレッチが追加される(赤色の鎖)。TPRTシステムによる新たに合成された鎖の侵入、および新たに合成されたフラップによる内生DNAの爾後の置き換えは、短縮された反復アレルに至る。用語「短縮された」はヌクレオチド反復領域の長さの短くなることを言い、それによって、トリヌクレオチド反復領域を修復することをもたらす。 Following the general mechanism outlined in Figure 1G or Figure 22, a region upstream of the repeat region can be nicked by an RNA-guided nuclease and then used to prime the synthesis of a new DNA strand containing a healthy number of repeats (this depends on the specific gene and disease). The repeat sequence is followed by a short stretch of homology that matches the identity of the sequence adjacent to the other end of the repeat (the red strand). Invasion of the newly synthesized strand by the TPRT system and subsequent replacement of the endogenous DNA by the newly synthesized flap leads to a truncated repeat allele. The term "truncated" refers to a shortening of the length of the nucleotide repeat region, thereby resulting in repairing the trinucleotide repeat region.

本明細書に記載のプライム編集システムまたはプライム編集(PE)システムは、ハンチントン病および他のトリヌクレオチド反復障害などの疾病を処置するために、トリヌクレオチド反復変異(または「トリプレット拡大疾患」)を短縮するために用いられ得る。トリヌクレオチド反復拡大障害は発達神経生物学が関わる複雑な進行性の障害であり、多くの場合には、認知および感覚運動機能に影響する。障害は遺伝学的な表現促進現象(すなわち、各世代での増大した重症度)を示す。DNA伸長または短縮は、通常は減数分裂的に(すなわち、配偶子形成の時の間に、または胚発生中に早期に)起こり、多くの場合には性バイアスを有し、いくつかの遺伝子は女性から受け継がれるときにのみ、他は男性からのみ伸長するということを意味する。ヒトでは、トリヌクレオチド反復拡大障害は転写または翻訳レベルどちらかで遺伝子サイレンシングを引き起こし得、これは本質的に遺伝子機能をノックアウトする。代替的には、トリヌクレオチド反復拡大障害は、大きい繰り返しアミノ酸配列を有して生成された変改されたタンパク質を引き起こし得る。これは、多くの場合にはドミナントネガティブな様式で(例えばポリグルタミン疾患)、タンパク質機能を無効化するかまたは変化させるかどちらかである。 The prime editing system or prime editing (PE) system described herein can be used to shorten trinucleotide repeat mutations (or "triplet expansion disorders") to treat diseases such as Huntington's disease and other trinucleotide repeat disorders. Trinucleotide repeat expansion disorders are complex, progressive disorders that involve developmental neurobiology and often affect cognitive and sensorimotor functions. The disorders show genetic anticipation (i.e., increasing severity with each generation). DNA expansion or shortening usually occurs meiotically (i.e., during gamete formation or earlier during embryonic development) and often has a sex bias, meaning that some genes are expanded only when inherited from females and others only from males. In humans, trinucleotide repeat expansion disorders can cause gene silencing at either the transcriptional or translational level, which essentially knocks out gene function. Alternatively, trinucleotide repeat expansion disorders can cause altered proteins to be produced with large repeated amino acid sequences. This either disables or alters protein function, often in a dominant-negative manner (e.g., polyglutamine diseases).

理論によって拘束されることなしに、トリプレット拡大はDNA複製またはDNA修復合成の間のスリップによって引き起こされる。タンデム反復は互いに同一の配列を有するので、2つのDNA鎖間の塩基対形成は配列上の複数の点において生起し得る。これはDNA複製またはDNA修復合成の間の「ループアウト」構造の形成に至り得る。これは繰り返し配列の繰り返しのコピーに至り得、反復数を伸長させる。ハイブリッドRNA:DNA中間体が関わる追加の機序が提案されている。プライム編集は、害をなす繰り返しのコドントリプレットの1つ以上を欠失させることによって、これらのトリプレット拡大領域を縮減または消去するために用いられ得る。この使用のある態様では、図23が、プライム編集によってトリヌクレオチド反復配列を短縮または縮減するためのPEgRNAデザインの模式図を提供する。 Without being bound by theory, triplet expansion is caused by slippage during DNA replication or DNA repair synthesis. Because the tandem repeats have identical sequences to each other, base pairing between the two DNA strands can occur at multiple points along the sequence. This can lead to the formation of "loop-out" structures during DNA replication or DNA repair synthesis. This can lead to repeated copies of the repeat sequence, extending the number of repeats. Additional mechanisms involving hybrid RNA:DNA intermediates have been proposed. Prime editing can be used to reduce or eliminate these triplet expansion regions by deleting one or more of the offending repeated codon triplets. In one embodiment of this use, FIG. 23 provides a schematic of PEgRNA design for shortening or reducing trinucleotide repeat sequences by prime editing.

プライム編集は、カットされる部位へと標的化される充当されたPEgRNAを含むプライム編集因子によって、トリプレット反復領域の上流の領域へニックを入れることによって、トリプレット拡大領域を短縮するように実装され得る。それから、プライム編集因子は、健康な数のトリプレット反復(これは具体的な遺伝子および疾患に依存する)をコードする鋳型(すなわち、その編集鋳型)としてのPEgRNAに基づく新たなDNA鎖(ssDNAフラップ)を合成する。新たに合成されたssDNA鎖は健康なトリプレット反復配列を含み、また、反復の他端に隣接する配列にマッチする相同性の短いストレッチ(すなわち相同アーム)を包含するように合成される(赤色の鎖)。新たに合成された鎖の侵入、および新たに合成されたssDNAフラップによる内生DNAの爾後の置き換えは、短縮された反復アレルに至る。 Prime editing can be implemented to shorten the triplet expansion region by nicking a region upstream of the triplet repeat region with a prime editor containing a dedicated PEgRNA targeted to the site to be cut. The prime editor then synthesizes a new DNA strand (ssDNA flap) based on the PEgRNA as a template (i.e., its editing template) that encodes a healthy number of triplet repeats (this depends on the specific gene and disease). The newly synthesized ssDNA strand contains the healthy triplet repeat sequence and is also synthesized to include a short stretch of homology (i.e., a homology arm) that matches the sequence adjacent to the other end of the repeat (red strand). Invasion of the newly synthesized strand and subsequent replacement of the endogenous DNA by the newly synthesized ssDNA flap leads to a shortened repeat allele.

具体的なトリヌクレオチド伸長障害に依存して、欠陥を誘導するトリプレット拡大は「トリヌクレオチド反復拡大タンパク質」において生起し得る。トリヌクレオチド反復拡大タンパク質は、トリヌクレオチド反復拡大障害を発生する感受性、トリヌクレオチド反復拡大障害の存在、トリヌクレオチド反復拡大障害の重症度、またはそれらのいずれかの組み合わせに関連するタンパク質の多様なセットである。トリヌクレオチド反復拡大障害は反復の型によって決定される2つのカテゴリーに分けられる。最も普通の反復はトリプレットCAGであり、これは遺伝子のコード領域に存在するときにはアミノ酸のグルタミン(Q)をコードする。よって、これらの障害はポリグルタミン(ポリQ)障害と言われ、次の疾患を含む:ハンチントン病(HD);球脊髄性筋萎縮症(SBMA);脊髄小脳失調症(SCA 1、2、3、6、7、および17型);および歯状核赤核淡蒼球ルイ体萎縮症(DRPLA)。残りのトリヌクレオチド反復拡大障害にはCAGトリプレットが関わらないか、またはCAGトリプレットが遺伝子のコード領域にはないかどちらかであり、よって、非ポリグルタミン障害と言われる。非ポリグルタミン障害は、脆弱X症候群(FRAXA);脆弱XE精神遅滞(FRAXE);フリードライヒ運動失調症(FRDA);筋強直性ジストロフィー(DM);および脊髄小脳失調症(SCA 8および12型)を含む。 Depending on the specific trinucleotide expansion disorder, the triplet expansion inducing defect may occur in a "trinucleotide repeat expansion protein." Trinucleotide repeat expansion proteins are a diverse set of proteins that are associated with susceptibility to developing a trinucleotide repeat expansion disorder, the presence of a trinucleotide repeat expansion disorder, the severity of a trinucleotide repeat expansion disorder, or any combination thereof. Trinucleotide repeat expansion disorders are divided into two categories determined by the type of repeat. The most common repeat is the triplet CAG, which, when present in the coding region of a gene, codes for the amino acid glutamine (Q). Thus, these disorders are referred to as polyglutamine (polyQ) disorders and include the following diseases: Huntington's disease (HD); spinal-bulbar muscular atrophy (SBMA); spinocerebellar ataxia (SCA types 1, 2, 3, 6, 7, and 17); and dentatorubral-pallidoluysian atrophy (DRPLA). The remaining trinucleotide repeat expansion disorders either do not involve a CAG triplet or the CAG triplet is not in the coding region of the gene and are therefore referred to as non-polyglutamine disorders. Non-polyglutamine disorders include Fragile X syndrome (FRAXA); Fragile XE mental retardation (FRAXE); Friedreich's ataxia (FRDA); Myotonic dystrophy (DM); and Spinocerebellar ataxia (SCA types 8 and 12).

トリヌクレオチド反復拡大障害に関連するタンパク質は、トリヌクレオチド反復拡大障害に対するトリヌクレオチド反復拡大障害に関連するタンパク質の実験的関連に基づいて選択され得る。例えば、トリヌクレオチド反復拡大障害に関連するタンパク質の生産速度または循環濃度は、トリヌクレオチド反復拡大障害を欠く集団に対して相対的に、トリヌクレオチド反復拡大障害を有する集団において上昇または降下し得る。タンパク質レベルの違いは、ウエスタンブロット、免疫組織化学染色、酵素結合免疫吸着アッセイ(ELISA)、および質量分析を包含するがこれらに限定されないプロテオミクス技術を用いて評価され得る。代替的には、トリヌクレオチド反復拡大障害に関連するタンパク質はタンパク質をコードする遺伝子の遺伝子発現プロファイルを得ることによって同定され得、DNAマイクロアレイ分析、遺伝子発現の連続分析(SAGE)、および定量的リアルタイムポリメラーゼ連鎖反応(Q-PCR)を包含するがこれらに限定されないゲノム技術を用いる。 Proteins associated with trinucleotide repeat expansion disorders may be selected based on experimental association of the protein associated with trinucleotide repeat expansion disorders to trinucleotide repeat expansion disorders. For example, the production rate or circulating concentration of a protein associated with trinucleotide repeat expansion disorders may be elevated or depressed in a population with a trinucleotide repeat expansion disorder relative to a population lacking a trinucleotide repeat expansion disorder. Differences in protein levels may be assessed using proteomic techniques, including but not limited to Western blots, immunohistochemical staining, enzyme-linked immunosorbent assays (ELISAs), and mass spectrometry. Alternatively, proteins associated with trinucleotide repeat expansion disorders may be identified by obtaining gene expression profiles of genes encoding the proteins, using genomic techniques, including but not limited to DNA microarray analysis, serial analysis of gene expression (SAGE), and quantitative real-time polymerase chain reaction (Q-PCR).

プライム編集によって修正され得るトリヌクレオチド反復拡大障害に関連するタンパク質の限定しない例は、AR(アンドロゲン受容体)、FMR1(脆弱X精神遅滞1)、HTT(ハンチンチン)、DMPK(筋緊張性ジストロフィータンパク質キナーゼ)、FXN(フラタキシン)、ATXN2(アタキシン2)、ATN1(アトロフィン1)、FEN1(フラップ構造特異的エンドヌクレアーゼ1)、TNRC6A(トリヌクレオチド反復含有6A)、PABPN1(核ポリA結合タンパク質1)、JPH3(ジャンクトフィリン3)、MED15(メディエーター複合体サブユニット15)、ATXN1(アタキシン1)、ATXN3(アタキシン3)、TBP(TATAボックス結合タンパク質)、CACNA1A(電位依存性カルシウムチャネルP/Q型アルファ1Aサブユニット)、ATXN80S(ATXN8対向鎖(非タンパク質コード))、PPP2R2B(タンパク質ホスファターゼ2制御サブユニットBベータ)、ATXN7(アタキシン7)、TNRC6B(トリヌクレオチド反復含有6B)、TNRC6C(トリヌクレオチド反復含有6C)、CELF3(CUGBP Elav様ファミリーメンバー3)、MAB21L1(mab-21様1(C.elegans))、MSH2(mutSホモログ2結腸がん非ポリポーシス1型(E.coli))、TMEM185A(膜貫通タンパク質185A)、SIX5(SIXホメオボックス5)、CNPY3(canopy 3ホモログ(ゼブラフィッシュ))、FRAXE(脆弱部位、葉酸型、稀、fra(X)(q28)E)、GNB2(グアニンヌクレオチド結合タンパク質(Gタンパク質)ベータポリペプチド2)、RPL14(リボソームタンパク質L14)、ATXN8(アタキシン8)、INSR(インスリン受容体)、TTR(トランスサイレチン)、EP400(E1A結合タンパク質p400)、GIGYF2(GRB10相互作用GYFタンパク質2)、OGG1(8-オキソグアニンDNAグリコシラーゼ)、STC1(スタニオカルシン1)、CNDP1(カルノシンジペプチダーゼ1(メタロペプチダーゼM20ファミリー))、C10orf2(染色体10オープンリーディングフレーム2)、MAML3 mastermind様3(Drosophila)、DKC1(先天性角化不全症1、ジスケリン)、PAXIP1(PAX相互作用(転写活性化ドメイン)タンパク質1)、CASK(カルシウム/カルモジュリン依存性セリンタンパク質キナーゼ(MAGUKファミリー))、MAPT(微小管関連タンパク質tau)、SP1(Sp1転写因子)、POLG(ポリメラーゼ(DNA依存性)ガンマ)、AFF2(AF4/FMR2ファミリーメンバー2)、THBS1(トロンボスポンジン1)、TP53(腫瘍タンパク質p53)、ESR1(エストロゲン受容体1)、CGGBP1(CGGリプレット反復結合タンパク質1)、ABT1(基本転写活性化因子1)、KLK3(カリクレイン関連ペプチダーゼ3)、PRNP(プリオンタンパク質)、JUN(junがん遺伝子)、KCNN3(カリウム中/小コンダクタンスカルシウム活性化チャネルサブファミリーNメンバー3)、BAX(BCL2関連Xタンパク質)、FRAXA(脆弱部位、葉酸型、稀、fra(X)(q27.3)A(巨睾丸、精神遅滞))、KBTBD10(kelch反復およびBTB(POZ)ドメイン含有10)、MBNL1(muscleblind様(Drosophila))、RAD51(RAD51ホモログ(RecAホモログ、E.coli)(S.cerevisiae))、NCOA3(核受容体コアクチベーター3)、ERDA1(伸長した反復ドメインCAG/CTG1)、TSC1(結節性硬化症1)、COMP(軟骨オリゴマーマトリックスタンパク質)、GCLC(グルタミン酸-システインリガーゼ触媒サブユニット)、RRAD(糖尿病に関連するRas関連)、MSH3(mutSホモログ3(E.coli))、DRD2(ドーパミン受容体D2)、CD44(CD44分子(インド人血液型))、CTCF(CCCTC結合因子(ジンクフィンガータンパク質))、CCND1(サイクリンD1)、CLSPN(クラスピンホモログ(Xenopus laevis))、MEF2A(筋細胞エンハンサー因子2A)、PTPRU(タンパク質チロシンホスファターゼ受容体型U)、GAPDH(グリセルアルデヒド-3-リン酸デヒドロゲナーゼ)、TRIM22(三節型モチーフ含有22)、WT1(ウィルムス腫瘍1)、AHR(アリール炭化水素受容体)、GPX1(グルタチオンペルオキシダーゼ1)、TPMT(チオプリンS-メチルトランスフェラーゼ)、NDP(ノリエ病(偽神経膠腫))、ARX(aristaless関連ホメオボックス)、MUS81(MUS81エンドヌクレアーゼホモログ(S.cerevisiae))、TYR(チロシナーゼ(眼皮膚白皮症IA))、EGR1(初期増殖応答1)、UNG(ウラシル-DNAグリコシラーゼ)、NUMBL(numbホモログ(Drosophila)様)、FABP2(腸脂肪酸結合タンパク質2)、EN2(engrailedホメオボックス2)、CRYGC(クリスタリンガンマC)、SRP14(シグナル認識粒子14kDa(相同的Alu RNA結合タンパク質))、CRYGBクリスタリンガンマB)、PDCD1(プログラム細胞死1)、HOXA1(ホメオボックスA1)、ATXN2L(アタキシン2様)、PMS2(PMS2減数分裂後分離増大2(S.cerevisiae))、GLA(ガラクトシダーゼアルファ)、CBL(Cas-Br-M(ネズミ)同種指向性レトロウイルス形質転換配列)、FTH1(フェリチン重鎖ポリペプチド1)、IL12RB2(インターロイキン12受容体ベータ2)、OTX2(orthodenticleホメオボックス2)、HOXA5(ホメオボックスA5)、POLG2(ポリメラーゼ(DNA依存性)ガンマ2補助的サブユニット)、DLX2(distal-lessホメオボックス2)、SIRPA(シグナル制御タンパク質アルファ)、OTX1(orthodenticleホメオボックス1)、AHRR(アリール炭化水素受容体リプレッサー)、MANF(中脳アストロサイト由来神経栄養因子)、TMEM158(膜貫通タンパク質158(遺伝子/偽遺伝子))、およびENSG00000078687を包含する。 Non-limiting examples of proteins associated with trinucleotide repeat expansion disorders that can be corrected by prime editing include AR (androgen receptor), FMR1 (Fragile X Mental Retardation 1), HTT (huntingtin), DMPK (myotonic dystrophy protein kinase), FXN (frataxin), ATXN2 (ataxin 2), ATN1 (atrophin 1), FEN1 (flap structure-specific endonuclease 1), TNRC6A (trinucleotide repeat-containing 6A), PABPN1 (nuclear polyA binding protein 1), JPH3 (junctophilin 3), MED 15 (Mediator complex subunit 15), ATXN1 (Ataxin 1), ATXN3 (Ataxin 3), TBP (TATA box binding protein), CACNA1A (Voltage-gated calcium channel P/Q type alpha 1A subunit), ATXN80S (ATXN8 opposing strand (non-protein coding)), PPP2R2B (Protein phosphatase 2 regulatory subunit B beta), ATXN7 (Ataxin 7), TNRC6B (Trinucleotide repeat-containing 6B), TNRC6C (Trinucleotide repeat-containing 6C), CELF3 (CUGBP Elav-like family member 3), MAB21L1 (mab-21-like 1 (C. elegans)), MSH2 (mutS homolog 2 colon cancer nonpolyposis type 1 (E. coli)), TMEM185A (Transmembrane protein 185A), SIX5 (SIX homeobox 5), CNPY3 (canopy 3 homolog (zebrafish)), FRAXE (fragile site, folate type, rare, fra(X)(q28)E), GNB2 (guanine nucleotide-binding protein (G protein) beta polypeptide 2), RPL14 (ribosomal protein L14), ATXN8 (ataxin 8), INSR (insulin receptor), TTR (transthyretin), EP400 (E1A-binding protein p400), GIGYF2 (GRB10-interacting GYF protein 2), OGG1 (8-oxoguanine DNA glycosylase), STC1 (stanniocalcin 1), CNDP1 (carnosine dipeptidase 1 (metallopeptidase M20 family)), C10orf2 (chromosome 10 open reading frame 2), MAML3 mastermind-like 3 (Drosophila), DKC1 (dyskeratosis congenita 1, dyskerin), PAXIP1 (PAX interacting (transcription activation domain) protein 1), CASK (calcium/calmodulin-dependent serine protein kinase (MAGUK family)), MAPT (microtubule-associated protein tau), SP1 (Sp1 transcription factor), POLG (polymerase (DNA-dependent) gamma), AFF2 (AF4/FMR2 family member 2), THBS1 (thrombospondin 1), TP53 (tumor protein p53), ESR1 (estrogen receptor 1), CGGBP1 (CGG repeat binding protein 1), ABT1 (basal transcription activator 1), KLK3 (kallikrein-related peptidase 3), PRNP (prion protein), JUN (jun oncogene), KCNN3 (potassium medium/small conductance calcium-activated channel subfamily N member 3), BAX (BCL2-associated X protein), FRA XA (fragile site, folate type, rare, fra(X)(q27.3)A (macrothrimi, mental retardation)), KBTBD10 (kelch repeat and BTB(POZ) domain containing 10), MBNL1 (muscleblind-like (Drosophila)), RAD51 (RAD51 homolog (RecA homolog, E. coli) (S. cerevisiae)), NCOA3 (nuclear receptor coactivator 3), ERDA1 (expanded repeat domain CAG/CTG1), TSC1 (tubercular sclerosis) 1), COMP (cartilage oligomeric matrix protein), GCLC (glutamate-cysteine ligase catalytic subunit), RRAD (Ras-related associated with diabetes), MSH3 (mutS homolog 3 (E. coli)), DRD2 (dopamine receptor D2), CD44 (CD44 molecule (Indian blood group)), CTCF (CCCTC-binding factor (zinc finger protein)), CCND1 (cyclin D1), CLSPN (claspin homolog (Xenopus laevis), MEF2A (Myocyte enhancer factor 2A), PTPRU (Protein tyrosine phosphatase receptor type U), GAPDH (Glyceraldehyde-3-phosphate dehydrogenase), TRIM22 (Tripartite motif-containing 22), WT1 (Wilms' tumor 1), AHR (Aryl hydrocarbon receptor), GPX1 (Glutathione peroxidase 1), TPMT (Thiopurine S-methyltransferase), NDP (Norrie's disease (pseudoglioma)), ARX (aristaless-associated homeobox), MUS81 (MUS81 endonuclease homolog (S. cerevisiae)), TYR (tyrosinase (oculocutaneous albinism IA)), EGR1 (early growth response 1), UNG (uracil-DNA glycosylase), NUMBL (numb homolog (Drosophila)-like), FABP2 (intestinal fatty acid binding protein 2), EN2 (engrailed homeobox 2), CRYGC (crystallin gamma C), SRP14 (signal recognition particle 14 kDa (homologous Alu RNA-binding protein), CRYGB crystallin gamma B), PDCD1 (programmed cell death 1), HOXA1 (homeobox A1), ATXN2L (ataxin 2-like), PMS2 (PMS2 postmeiotic segregation enhanced 2 (S. cerevisiae)), GLA (galactosidase alpha), CBL (Cas-Br-M (murine) ecotropic retroviral transforming sequence), FTH1 (ferritin heavy chain polypeptide 1), IL12RB2 (interleukin-12 receptor beta 2), OTX2 (orthodenticle homeobox A1), IL12RB3 (interleukin-12 receptor beta 2), IL12RB4 (interleukin-12 receptor beta 2), IL12RB5 (interleukin-12 receptor beta 2), IL12RB6 (interleukin-12 receptor beta 2), IL12RB7 (interleukin-12 receptor beta 2), IL12RB8 (interleukin-12 receptor beta 2), IL12RB9 (interleukin-12 receptor beta 2), IL12RB1 (interleukin-12 receptor beta 2), IL12RB2 ...3 (interleukin-12 receptor beta 2), IL12RB4 (interleukin-12 receptor beta 2), IL12RB5 (interleukin-12 receptor beta 2), IL12RB6 (interleukin-12 receptor beta 2), IL12RB7 (interleukin-12 receptor beta 2), IL12RB8 (interleukin-12 receptor beta 2), IL12RB9 (interleukin- box 2), HOXA5 (homeobox A5), POLG2 (polymerase (DNA-dependent) gamma 2 auxiliary subunit), DLX2 (distal-less homeobox 2), SIRPA (signal regulatory protein alpha), OTX1 (orthodenticle homeobox 1), AHRR (aryl hydrocarbon receptor repressor), MANF (mesencephalic astrocyte-derived neurotrophic factor), TMEM158 (transmembrane protein 158 (gene/pseudogene)), and ENSG00000078687.

具体的な側面において、本開示は、拡大反復障害(また反復拡大障害もしくはトリヌクレオチド反復障害としても知られている)と診断された対象の処置のためのTPRTベースの方法を提供する。拡大反復障害は、マイクロサテライト反復が長さ閾値を超えて拡大したときに生じる。目下、少なくとも30の遺伝的疾患は、反復拡大によって引き起こされるものと考えられている。この多様な群の障害への科学的理解は、1990年代初頭に、トリヌクレオチド反復が、脆弱X、球脊髄性筋萎縮症、筋強直症ジストロフィー、およびハンチントン病(Nelson et al,"The unstable repeats-3 evolving faces of neurological disease,"Neuron,March 6,2013,Vol.77;825-843(これは参照により本明細書に組み込まれる))、ならびにホー・リバー(Haw River)症候群、ヤコブセン症候群、歯状核赤核淡蒼球ルイ体萎縮症(DRPLA)、マシャド・ジョセフ病、合多指症(SPD II)、手足生殖器症候群(HFGS)、鎖骨頭蓋異形成症(CCD)、全前脳欠損障害(HPE)、先天性中枢性低換気症候群(CCHS)、ARX非症候性のX連鎖精神遅滞(XLMR)、および眼咽頭型筋ジストロフィー(OPMD)(参照を包含する、数種の主要な遺伝性疾病にあるという発見で明るみに出た。マイクロサテライト反復の不安定性は、反復拡大が、後に続く各世代に生じ得、子孫におけるより重度の表現型および発症の低年齢へ繋がるという現象が予想されたとおり、これらの疾病の証であることが見出された。反復拡大は、数種の異なる機序を介して疾患を引き起こすものと考えられている。つまり、拡大は、遺伝子、mRNA転写産物、および/またはコードされたタンパク質のレベルにて機能する細胞に干渉し得る。いくつかの疾病において、突然変異は、反復含有遺伝子をサイレンシングすることによる機能喪失型の機序を介して作用する。その他において、疾患は、mRNA転写産物またはタンパク質のいずれかが新しい異常な機能を帯びるようになる機能獲得型の機序の結果として生じる。 In a specific aspect, the present disclosure provides a TPRT-based method for the treatment of subjects diagnosed with an expanded repeat disorder (also known as a repeat expansion disorder or a trinucleotide repeat disorder). Expanded repeat disorders arise when microsatellite repeats expand beyond a length threshold. Currently, at least 30 genetic diseases are believed to be caused by repeat expansions. Scientific understanding of this diverse group of disorders began in the early 1990s when it was discovered that trinucleotide repeats were involved in the pathogenesis of a number of disorders, including fragile X, spinal-bulbar muscular atrophy, myotonic dystrophy, and Huntington's disease (Nelson et al, "The unstable repeats-3 evolving faces of neurological disease," Neuron, March 6, 2013, Vol. 77; 825-843, which is incorporated herein by reference), as well as Haw River syndrome, Jacobsen syndrome, dentatorubral-pallidoluysian atrophy (DRPLA), Machado-Joseph disease, and synpolydactyly (SPD). This has come to light with the discovery that microsatellite repeat instability is responsible for several major genetic diseases, including glaucoma, hand-foot-genital syndrome (HFGS), cleidocranial dysplasia (CCD), holoprosencephalic deficiency syndrome (HPE), congenital central hypoventilation syndrome (CCHS), ARX nonsyndromic X-linked mental retardation (XLMR), and oculopharyngeal muscular dystrophy (OPMD) (see references). It has been found that instability of microsatellite repeats is a hallmark of these diseases, as repeat expansions can occur in each successive generation, leading to more severe phenotypes in the offspring and earlier ages of onset. Repeat expansions are thought to cause disease through several different mechanisms; the expansions can interfere with cell functioning at the level of the gene, the mRNA transcript, and/or the encoded protein. In some diseases, mutations act through a loss-of-function mechanism by silencing the repeat-containing gene. In others, disease occurs as a result of a gain-of-function mechanism, where either the mRNA transcript or the protein takes on a new abnormal function.

一態様において、トリヌクレオチド反復障害を処置する方法は、図23に描かれている。一般に、アプローチは、プライム編集プロセスの機序を通して内生の罹患トリヌクレオチド反復配列を置き換えることが意図される、所望されかつ健常な置き換えトリヌクレオチド反復配列をコードする領域を含む伸長されたgRNAと組み合わせて、TPRTゲノム編集(すなわち、プライム編集)を使用することを伴う。例示の、トリヌクレオチド反復配列を縮小するためのgRNAデザインおよびTPRTゲノム編集でのトリヌクレオチド反復縮小の概略図が、図23に示される。 In one embodiment, a method for treating a trinucleotide repeat disorder is depicted in FIG. 23. In general, the approach involves using TPRT genome editing (i.e., prime editing) in combination with an extended gRNA that includes a region encoding a desired and healthy replacement trinucleotide repeat sequence that is intended to replace the endogenous diseased trinucleotide repeat sequence through the mechanism of the prime editing process. An exemplary gRNA design for reducing the trinucleotide repeat sequence and a schematic of trinucleotide repeat reduction with TPRT genome editing are shown in FIG. 23.

プリオン病
プライム編集は、疾患の過程においてミスフォールディングされるようになるプリオンタンパク質(PRNP)上への1つ以上の防護性変異の組み入れによって、プリオン病を防止またはその進行を停止させるためにもまた用いられ得る。プリオン病または伝達性海綿状脳症(TSE)は、ヒトおよび動物両方を冒す稀な進行性の神経変性障害のファミリーである。それらは、長い潜伏期間、ニューロン喪失に関連する特徴的な海綿状変化、および炎症性応答を誘導することの失敗によって見分けられる。
Prion diseases Prime editing can also be used to prevent or halt the progression of prion diseases by incorporating one or more protective mutations on the prion protein (PRNP) that becomes misfolded during the course of the disease. Prion diseases or transmissible spongiform encephalopathies (TSEs) are a family of rare progressive neurodegenerative disorders that affect both humans and animals. They are distinguished by a long latency period, characteristic spongiform changes associated with neuronal loss, and failure to induce an inflammatory response.

ヒトでは、プリオン病は、クロイツフェルト・ヤコブ病(CJD)、変異型クロイツフェルト・ヤコブ病(vCJD)、ゲルストマン・ストロイスラー・シャインカー症候群、致死性家族性不眠症、およびクールー病を包含する。動物では、プリオン病は牛海綿状脳症(BSEまたは「狂牛病」)、慢性消耗病(CWD)、スクレイピー、伝達性ミンク脳症、ネコ海綿状脳症、および有蹄類海綿状脳症を包含する。これらのプリオン病のいずれか1つを防止またはその進行を停止させるために、プライム編集は防護性の点変異をプリオンタンパク質上に組み入れるために用いられ得る。 In humans, prion diseases include Creutzfeldt-Jakob disease (CJD), variant Creutzfeldt-Jakob disease (vCJD), Gerstmann-Straussler-Scheinker syndrome, fatal familial insomnia, and kuru. In animals, prion diseases include bovine spongiform encephalopathy (BSE or "mad cow disease"), chronic wasting disease (CWD), scrapie, transmissible mink encephalopathy, feline spongiform encephalopathy, and ungulate spongiform encephalopathy. To prevent or halt the progression of any one of these prion diseases, prime editing can be used to incorporate protective point mutations onto the prion protein.

古典的CJDはヒトプリオン病である。それは、特徴的な臨床および診断特色を有する神経変性障害である。この疾患は急速に進行性であり、常に致死的である。この疾患による感染は通常は病気の発症から1年以内に死に至る。CJDは急速に進行性の変わることなく致死的な神経変性障害であり、プリオンタンパク質として公知の細胞性の糖タンパク質の異常なアイソフォームによって引き起こされると信じられている。CJDは世界的に生起し、米国を包含する多くの国の見積もられる年間発生率は100万人の集団あたり約1ケースであることが報告されている。CJD患者の大多数は通常は病気の発症から1年以内に死ぬ。CJDは、ヒトおよび動物において生起する他のプリオン病と併せて、伝達性海綿状脳症(TSE)として分類される。患者の約85%では、CJDは伝達の認識可能なパターンなしに特発性疾患として生起する。患者のより小さい割合(5から15%)は、プリオンタンパク質遺伝子の受け継がれた変異ゆえにCJDを発生する。これらの受け継がれる形態は、ゲルストマン・ストロイスラー・シャインカー症候群および致死性家族性不眠症を包含する。CJDについて、処置は現行では公知ではない。 Classical CJD is a human prion disease. It is a neurodegenerative disorder with characteristic clinical and diagnostic features. The disease is rapidly progressive and invariably fatal. Infection with the disease is usually fatal within one year of disease onset. CJD is a rapidly progressive, invariably fatal neurodegenerative disorder believed to be caused by an abnormal isoform of a cellular glycoprotein known as the prion protein. CJD occurs worldwide, with an estimated annual incidence in many countries, including the United States, reported to be about one case per million population. The majority of CJD patients usually die within one year of disease onset. CJD is classified as a transmissible spongiform encephalopathy (TSE), along with other prion diseases occurring in humans and animals. In approximately 85% of patients, CJD occurs as an idiopathic disease with no discernible pattern of transmission. A smaller percentage of patients (5 to 15%) develop CJD due to inherited mutations in the prion protein gene. These inherited forms include Gerstmann-Straussler-Scheinker syndrome and fatal familial insomnia. There is currently no known treatment for CJD.

変異型クロイツフェルト・ヤコブ病(vCJD)は英国で1996年に最初に記載されたプリオン病である。今や、牛のプリオン病の牛海綿状脳症(BSEまたは「狂牛」病)のアウトブレイクを担う物質が、ヒトのvCJDのアウトブレイクを担う同じ物質であるという強い科学的証拠がある。バリアントCJD(vCJD)は古典的CJD(多くの場合には単純にCJDと呼ばれる)と同じ疾患ではない。それは古典的CJDとは異なる臨床的および病理学的特徴を有する。各疾患はプリオンタンパク質遺伝子の具体的な遺伝子プロファイルをもまた有する。両方の障害は、年で測定される普通でなく長い潜伏期間を有する変わることなく致死的な脳疾患であり、プリオンと呼ばれる非従来的な伝達性物質によって引き起こされる。vCJDについて、処置は現行では公知ではない。 Variant Creutzfeldt-Jakob disease (vCJD) is a prion disease first described in 1996 in the UK. There is now strong scientific evidence that the agent responsible for outbreaks of the prion disease bovine spongiform encephalopathy (BSE or "mad cow" disease) in cattle is the same agent responsible for outbreaks of vCJD in humans. Variant CJD (vCJD) is not the same disease as classical CJD (often simply called CJD). It has different clinical and pathological characteristics than classical CJD. Each disease also has a specific genetic profile of the prion protein gene. Both disorders are invariably fatal brain diseases with unusually long incubation periods measured in years, and are caused by a non-conventionally transmissible agent called a prion. For vCJD, no treatment is currently known.

BSE(牛海綿状脳症または「狂牛病」)は、プリオンと呼ばれる普通でない伝達性物質による感染からもたらされる畜牛の進行性の神経学的障害である。伝達性物質の性質は良く理解されてはいない。現行では、最も受け入れられた理論は、物質が、プリオンタンパク質として公知の正常タンパク質の改変された形態であるということである。まだ理解されていない理由から、正常なプリオンタンパク質は病原性の(有害な)形態へと変化し、これはそれから畜牛の中枢神経系を損傷する。BSEの異なる株があるという増大して行く証拠がある:英国におけるアウトブレイクを担った典型的または古典的BSE株および2つの非典型的な株(HおよびL株)である。BSEについて、処置は現行では公知ではない。 BSE (bovine spongiform encephalopathy or "mad cow disease") is a progressive neurological disorder in cattle that results from infection with an unusual transmissible agent called a prion. The nature of the transmissible agent is not well understood. Currently, the most accepted theory is that the agent is an altered form of a normal protein known as a prion protein. For reasons that are not yet understood, the normal prion protein changes into a pathogenic (harmful) form, which then damages the central nervous system of the cattle. There is growing evidence that there are different strains of BSE: the typical or classical BSE strain, which was responsible for the outbreak in the UK, and two atypical strains (the H and L strains). No treatment is currently known for BSE.

慢性消耗病(CWD)は、鹿、ヘラジカ、トナカイ、ニホンジカ、およびムースを冒すプリオン病である。それはカナダおよび米国を包含する北米、ノルウェー、ならびに韓国のいくつかのエリアにおいて見出されている。感染動物が症状を発生する前には1年超がかかり得、これらは激しい体重減少(消耗)、よろめき、無気力、および他の神経症状を包含し得る。CWDは全ての年齢の動物を冒し得、いくつかの感染動物はいつか疾患を発生することなしに死に得る。CWDは動物にとって致死的であり、処置またはワクチンはない。 Chronic Wasting Disease (CWD) is a prion disease that affects deer, elk, reindeer, sika deer, and moose. It is found in some areas of North America, including Canada and the United States, Norway, and Korea. It can take more than a year before an infected animal develops symptoms, which can include severe weight loss (wasting), staggering, lethargy, and other neurological symptoms. CWD can affect animals of all ages, and some infected animals may die without ever developing the disease. CWD is fatal to animals, and there is no treatment or vaccine.

TSEの原因物質はプリオンであると信じられている。用語「プリオン」は、伝達性であり、脳に最も豊富に見出されるプリオンタンパク質と呼ばれる特定の正常な細胞性タンパク質の異常なフォールディングを誘導する能力がある異常な病原性物質を言う。これらの正常なプリオンタンパク質の機能はなお完全には理解されていない。プリオンタンパク質の異常なフォールディングは脳損傷と疾患の特徴的な徴候および症状とに至る。プリオン病は通常は急速に進行性であり、常に致死的である。 The causative agent of TSEs is believed to be prions. The term "prion" refers to an abnormal pathogenic agent that is transmissible and capable of inducing the abnormal folding of certain normal cellular proteins called prion proteins, which are found most abundantly in the brain. The function of these normal prion proteins is not yet fully understood. The abnormal folding of the prion proteins leads to brain damage and the characteristic signs and symptoms of the disease. Prion diseases are usually rapidly progressive and invariably fatal.

本願において用いられる用語「プリオン」は、ヒトおよび動物の疾患(海綿状脳症)を引き起こすことが公知の感染性粒子を意味する。用語「プリオン」は単語「タンパク質」および「感染」の短縮であり、粒子は、専らではないにしても、大きくは、立体配座を変化させてPRNPScになるPRNPCを発現するPRNP遺伝子によってコードされるPRNPSc分子からなる。プリオンは細菌、ウイルス、およびウイロイドとは別物である。公知のプリオンは、動物に感染して、羊および山羊の神経系の伝達性の変性疾患スクレイピー、ならびに牛海綿状脳症(BSE)または狂牛病および猫のネコ海綿状脳症を引き起こすものを包含する。ヒトを冒すことが公知の上で論じられている4つのプリオン病は(1)クールー病、(2)クロイツフェルト・ヤコブ病(CJD)、(3)ゲルストマン・ストロイスラー・シャインカー病(GSS)、および(4)致死性家族性不眠症(FFI)である。本願において用いられるプリオンは、用いられるいずれかの動物、具体的にはヒトおよび飼育畜産動物においてこれらの疾患または他の全てまたはいずれかを引き起こすプリオンの全ての形態を包含する。 The term "prion" as used herein refers to an infectious particle known to cause disease (spongiform encephalopathy) in humans and animals. The term "prion" is a contraction of the words "protein" and "infectious," and the particle is largely, if not exclusively, composed of PRNP Sc molecules encoded by the PRNP gene that expresses PRNP C , which changes conformation to become PRNP Sc . Prions are distinct from bacteria, viruses, and viroids. Known prions include those that infect animals and cause scrapie, a transmissible degenerative disease of the nervous system in sheep and goats, as well as bovine spongiform encephalopathy (BSE) or mad cow disease and feline spongiform encephalopathy in cats. The four prion diseases discussed above that are known to affect humans are (1) kuru, (2) Creutzfeldt-Jakob disease (CJD), (3) Gerstmann-Straussler-Scheinker disease (GSS), and (4) fatal familial insomnia (FFI). Prion as used herein includes all forms of prion that cause all or any of these diseases or others in any animal used, particularly humans and domesticated livestock animals.

一般的に、理論によって拘束されることなしに、プリオン病はプリオンタンパク質のミスフォールディングによって引き起こされる。多くの場合に沈着性疾患と呼ばれるかかる疾患、プリオンタンパク質のミスフォールディングは次のとおり説明され得る。Aが、意図される生理的役割をモノマーまたはオリゴマー状態で実行する正常に合成された遺伝子産物であり、かつA*が、劇的な立体配座変化を経過するために有能であるAの立体配座的に活性化された形態である場合には、Bは多量体アセンブリを好む立体配座的に変改された状態であり(すなわち、沈着を形成するミスフォールディングされた形態)、かつBnは、病原性であり、リサイクルすることが相対的に困難である多量体材料である。プリオン病では、PRNPCおよびPRNPScは状態AおよびBnに対応し、ここで、Aは大きくはヘリカルかつモノマー性であり、Bnはβリッチかつ多量体性である。 In general, without being bound by theory, prion diseases are caused by misfolding of prion protein. Such diseases, often referred to as deposition diseases, misfolding of prion protein can be explained as follows: if A is the normally synthesized gene product that performs its intended physiological role in a monomeric or oligomeric state, and A* is the conformationally activated form of A that is capable of undergoing dramatic conformational changes, then B is the conformationally altered state that favors multimeric assembly (i.e., the misfolded form that forms deposits), and Bn is the multimeric material that is pathogenic and relatively difficult to recycle. In prion diseases, PRNP C and PRNP Sc correspond to states A and Bn , where A is largely helical and monomeric, and Bn is β-rich and multimeric.

プリオンタンパク質のある種の変異はプリオン(prior)病の増大したリスクに関連し得るということが公知である。反対に、プリオンタンパク質のある種の変異は天然に防護性であり得る。Bagynszky et al.,"Characterization of mutations in PRNP(prion)gene and their possible roles in neurodegenerative diseases,"Neuropsychiatr Dis Treat.,2018;14:2067-2085を見よ。これの内容は参照によって本願に組み込まれる。 It is known that certain mutations in the prion protein may be associated with an increased risk of prion (prior) diseases. Conversely, certain mutations in the prion protein may be naturally protective. See Bagynszky et al., "Characterization of mutations in PRNP(prion)gene and their possible roles in neurodegenerative diseases," Neuropsychiatr Dis Treat., 2018;14:2067-2085, the contents of which are incorporated herein by reference.

PRNP(NCBI RefSeq No.NP_000302.1(配列番号291))ヒトプリオンタンパク質は、染色体20(4686151-4701588)上に位置付けられた16kb長の遺伝子によってコードされる。それは2つのエキソンを含有し、エキソン2はオープンリーディングフレームを持ち、これは253アミノ酸(AA)長のPrPタンパク質をコードする。エキソン1は非コードエキソンであり、これは転写開始部位としての用をなし得る。翻訳後修飾は最初の22AA N末端フラグメント(NTF)および最後の23AA C末端フラグメント(CTF)の除去をもたらす。NTFは小胞体(ER)へのPrP輸送後に切断され、CTF(グリコシルホスファチジルイノシトール[GPI]シグナルペプチド[GPI-SP])はGPIアンカーによって切断される。GPIアンカーはPrPタンパク質輸送に関わり得る。それは細胞膜の外側表面へのプリオンタンパク質の取り付けの役割をもまた演じ得る。正常なPrPは、長いN末端ループ(これはオクタペプチド反復領域を含有する)、2つの短いβシート、3つのαヘリックス、およびC末端領域(これはGPIアンカーを含有する)から成る。PrPの切断は、細胞膜にアンカー固定される208AA長の糖タンパク質をもたらす。 PRNP (NCBI RefSeq No. NP_000302.1 (SEQ ID NO: 291)) human prion protein is encoded by a 16 kb long gene located on chromosome 20 (4686151-4701588). It contains two exons, exon 2 has an open reading frame, which encodes the 253 amino acid (AA) long PrP protein. Exon 1 is a non-coding exon, which may serve as the transcription start site. Post-translational modification results in the removal of the first 22 AA N-terminal fragment (NTF) and the last 23 AA C-terminal fragment (CTF). The NTF is cleaved after PrP transport to the endoplasmic reticulum (ER), and the CTF (glycosylphosphatidylinositol [GPI] signal peptide [GPI-SP]) is cleaved by the GPI anchor. The GPI anchor may be involved in PrP protein transport. It may also play a role in the attachment of the prion protein to the outer surface of the cell membrane. Normal PrP consists of a long N-terminal loop (which contains an octapeptide repeat region), two short β-sheets, three α-helices, and a C-terminal region (which contains a GPI anchor). Cleavage of PrP results in a 208AA long glycoprotein that is anchored to the cell membrane.

PRNP(NP_000302.1)の253アミノ酸配列は以下のとおりである:
MANLGCWMLVLFVATWSDLGLCKKRPKPGGWNTGGSRYPGQGSPGGNRYPPQGGGGWGQPHGGGWGQPHGGGWGQPHGGGWGQPHGGGWGQGGGTHSQWNKPSKPKTNMKHMAGAAAAGAVVGGLGGYMLGSAMSRPIIHFGSDYEDRYYRENMHRYPNQVYYRPMDEYSNQNNFVHDCVNITIKQHTVTTTTKGENFTETDVKMMERVVEQMCITQYERESQAYYQRGSSMVLFSSPPV(配列番号291)。
The 253 amino acid sequence of PRNP (NP_000302.1) is as follows:
MANLGCWMLVLFVATWSDLGLCKKRPKPGGWNTGGSRYPGQGSPGGNRYPPQGGGGWGQPHGGGWGQPHGGGWGQPHGGGWGQPHGGGWGQGGGTHSQWNKPSKPKTNMKHMAGAAAAGAVVGGLGGYMLGSAMSRPIIHFGSDYEDRYYRENMHRYPNQVYYRPMDEYSNQNNFVHDCVNITIKQHTVTTTTKGENFTETDVKMMERVVEQMCITQYERESQAYYQRGSSMVLFSSPPV (sequence number 291).

PRNP(NP_000302.1)の253アミノ酸配列は、以下のヌクレオチド配列(NCBI Ref.Seq No.NM_000311.5,"homo sapiens prion protein(PRNP),transcript variant 1,mRNA)によってコードされており、以下のとおりである:
GCGAACCTTGGCTGCTGGATGCTGGTTCTCTTTGTGGCCACATGGAGTGACCTGGGCCTCTGCAAGAAGCGCCCGAAGCCTGGAGGATGGAACACTGGGGGCAGCCGATACCCGGGGCAGGGCAGCCCTGGAGGCAACCGCTACCCACCTCAGGGCGGTGGTGGCTGGGGGCAGCCTCATGGTGGTGGCTGGGGGCAGCCTCATGGTGGTGGCTGGGGGCAGCCCCATGGTGGTGGCTGGGGACAGCCTCATGGTGGTGGCTGGGGTCAAGGAGGTGGCACCCACAGTCAGTGGAACAAGCCGAGTAAGCCAAAAACCAACATGAAGCACATGGCTGGTGCTGCAGCAGCTGGGGCAGTGGTGGGGGGCCTTGGCGGCTACATGCTGGGAAGTGCCATGAGCAGGCCCATCATACATTTCGGCAGTGACTATGAGGACCGTTACTATCGTGAAAACATGCACCGTTACCCCAACCAAGTGTACTACAGGCCCATGGATGAGTACAGCAACCAGAACAACTTTGTGCACGACTGCGTCAATATCACAATCAAGCAGCACACGGTCACCACAACCACCAAGGGGGAGAACTTCACCGAGACCGACGTTAAGATGATGGAGCGCGTGGTTGAGCAGATGTGTATCACCCAGTACGAGAGGGAATCTCAGGCCTATTACCAGAGAGGATCGAGCATGGTCCTCTTCTCCTCTCCACCTGTGATCCTCCTGATCTCTTTCCTCATCTTCCTGATAGTGGGATGAGGAAGGTCTTCCTGTTTTCACCATCTTTCTAATCTTTTTCCAGCTTGAGGGAGGCGGTATCCACCTGCAGCCCTTTTAGTGGTGGTGTCTCACTCTTTCTTCTCTCTTTGTCCCGGATAGGCTAATCAATACCCTTGGCACTGATGGGCACTGGAAAACATAGAGTAGACCTGAGATGCTGGTCAAGCCCCCTTTGATTGAGTTCATCATGAGCCGTTGCTAATGCCAGGCCAGTAAAAGTATAACAGCAAATAACCATTGGTTAATCTGGACTTATTTTTGGACTTAGTGCAACAGGTTGAGGCTAAAACAAATCTCAGAACAGTCTGAAATACCTTTGCCTGGATACCTCTGGCTCCTTCAGCAGCTAGAGCTCAGTATACTAATGCCCTATCTTAGTAGAGATTTCATAGCTATTTAGAGATATTTTCCATTTTAAGAAAACCCGACAACATTTCTGCCAGGTTTGTTAGGAGGCCACATGATACTTATTCAAAAAAATCCTAGAGATTCTTAGCTCTTGGGATGCAGGCTCAGCCCGCTGGAGCATGAGCTCTGTGTGTACCGAGAACTGGGGTGATGTTTTACTTTTCACAGTATGGGCTACACAGCAGCTGTTCAACAAGAGTAAATATTGTCACAACACTGAACCTCTGGCTAGAGGACATATTCACAGTGAACATAACTGTAACATATATGAAAGGCTTCTGGGACTTGAAATCAAATGTTTGGGAATGGTGCCCTTGGAGGCAACCTCCCATTTTAGATGTTTAAAGGACCCTATATGTGGCATTCCTTTCTTTAAACTATAGGTAATTAAGGCAGCTGAAAAGTAAATTGCCTTCTAGACACTGAAGGCAAATCTCCTTTGTCCATTTACCTGGAAACCAGAATGATTTTGACATACAGGAGAGCTGCAGTTGTGAAAGCACCATCATCATAGAGGATGATGTAATTAAAAAATGGTCAGTGTGCAAAGAAAAGAACTGCTTGCATTTCTTTATTTCTGTCTCATAATTGTCAAAAACCAGAATTAGGTCAAGTTCATAGTTTCTGTAATTGGCTTTTGAATCAAAGAATAGGGAGACAATCTAAAAAATATCTTAGGTTGGAGATGACAGAAATATGATTGATTTGAAGTGGAAAAAGAAATTCTGTTAATGTTAATTAAAGTAAAATTATTCCCTGAATTGTTTGATATTGTCACCTAGCAGATATGTATTACTTTTCTGCAATGTTATTATTGGCTTGCACTTTGTGAGTATTCTATGTAAAAATATATATGTATATAAAATATATATTGCATAGGACAGACTTAGGAGTTTTGTTTAGAGCAGTTAACATCTGAAGTGTCTAATGCATTAACTTTTGTAAGGTACTGAATACTTAATATGTGGGAAACCCTTTTGCGTGGTCCTTAGGCTTACAATGTGCACTGAATCGTTTCATGTAAGAATCCAAAGTGGACACCATTAACAGGTCTTTGAAATATGCATGTACTTTATATTTTCTATATTTGTAACTTTGCATGTTCTTGTTTTGTTATATAAAAAAATTGTAAATGTTTAATATCTGACTGAAATTAAACGAGCGAAGATGAGCACCA(配列番号292)
The 253 amino acid sequence of PRNP (NP_000302.1) is encoded by the following nucleotide sequence (NCBI Ref.Seq No.NM_000311.5, "homo sapiens prion protein (PRNP), transcript variant 1, mRNA) as follows:
(SEQ ID NO:292)

CJDおよびFFIにリンクしているPRNP(NP_000302.1)に対して相対的な変異部位は報告されており、次のとおりである。これらの変異は本明細書に開示のプライム編集因子を用いて除去または組み入れられ得る。

Figure 2020191243000291

Figure 2020191243000292
Mutation sites relative to PRNP (NP_000302.1) linked to CJD and FFI have been reported and are as follows: These mutations can be removed or incorporated using the prime editors disclosed herein.
Figure 2020191243000291

Figure 2020191243000292

GSSにリンクしているPRNP(NP_000302.1)(配列番号291)に対して相対的な変異部位は次のとおり報告されている:

Figure 2020191243000293

Figure 2020191243000294
The mutation sites relative to the GSS-linked PRNP (NP_000302.1) (SEQ ID NO: 291) are reported as follows:
Figure 2020191243000293

Figure 2020191243000294

プリオン病に対する可能な防護性の性質にリンクしているPRNP(NP_000302.1)(配列番号291)に対して相対的な変異部位は次のとおり:

Figure 2020191243000295

Figure 2020191243000296
The mutation sites relative to PRNP (NP_000302.1) (SEQ ID NO: 291) that are linked to possible protective properties against prion disease are as follows:
Figure 2020191243000295

Figure 2020191243000296

それゆえに、種々の態様において、プライム編集は、プリオン病にリンクしているPRNPの変異を除去するかまたはプリオン病に対して防護性であると考慮されるPRNPの変異を組み入れるために用いられ得る。例えば、プライム編集は、PRNPタンパク質のD178N、V180I、T188K、E196K、E196A、E200K、E200G、V203I、R208H、V210I、E211Q、I215V、またはM232R変異を除去または復元するために用いられ得る(NP_000302.1のPRNPに対して相対的)(配列番号291)。他の態様において、プライム編集は、PRNPタンパク質のP102L、P105L、A117V、G131V、V176G、H187R、F198S、D202N、Q212P、Q217R、またはM232T変異を除去または復元するために用いられ得る(NP_000302.1のPRNPに対して相対的)(配列番号291)。プライム編集を用いてPRNPのかかる変異の存在を除去または修正することによって、プリオン病のリスクが縮減または消去され得る。 Thus, in various embodiments, prime editing can be used to remove PRNP mutations linked to prion disease or to introduce PRNP mutations considered protective against prion disease. For example, prime editing can be used to remove or restore D178N, V180I, T188K, E196K, E196A, E200K, E200G, V203I, R208H, V210I, E211Q, I215V, or M232R mutations in the PRNP protein (relative to PRNP of NP_000302.1) (SEQ ID NO: 291). In other embodiments, prime editing can be used to remove or restore P102L, P105L, A117V, G131V, V176G, H187R, F198S, D202N, Q212P, Q217R, or M232T mutations in the PRNP protein (relative to PRNP of NP_000302.1) (SEQ ID NO: 291). By using prime editing to remove or correct the presence of such mutations in PRNP, the risk of prion disease can be reduced or eliminated.

他の態様において、プライム編集は、1つ以上のプリオン病に対する防護性の効果にリンクしているPRNPの防護性変異を組み入れるために用いられ得る。例えば、プライム編集は、PRNPのG127S、G127V、M129V、D167G、D167N、N171S、E219K、またはP238S防護性変異を組み入れるために用いられ得る(NP_000302.1のPRNPに対して相対的)(配列番号291)。なお他の態様において、防護性変異は、PRNPのG127、G127、M129、D167、D167、N171、E219、またはP238に組み入れされるいずれかの代替アミノ酸であり得る(NP_000302.1のPRNPに対して相対的)(配列番号291)。 In other embodiments, prime editing can be used to incorporate protective mutations in PRNP that are linked to a protective effect against one or more prion diseases. For example, prime editing can be used to incorporate G127S, G127V, M129V, D167G, D167N, N171S, E219K, or P238S protective mutations in PRNP (relative to PRNP in NP_000302.1) (SEQ ID NO: 291). In yet other embodiments, the protective mutations can be any alternative amino acid incorporated into G127, G127, M129, D167, D167, N171, E219, or P238 in PRNP (relative to PRNP in NP_000302.1) (SEQ ID NO: 291).

具体的な態様では、図27において例解され例5において論じられるとおり、プライム編集はG127V防護性変異をPRNPに組み入れるために用いられ得る。 In a specific embodiment, prime editing can be used to incorporate the G127V protective mutation into PRNP, as illustrated in Figure 27 and discussed in Example 5.

別の態様では、プライム編集はE219K防護性変異をPRNPに組み入れるために用いられ得る。 In another embodiment, prime editing can be used to incorporate the E219K protective mutation into PRNP.

PRNPタンパク質および防護性変異部位は哺乳動物において保存されている。そのため、ヒト疾患を処置することに加えて、それは、プリオン病に対して免疫がある牛および羊を生成するか、またはさらにはプリオン病を患っている動物の野生集団を治癒させることを助けるためにもまた用いられ得る。プライム編集はヒト細胞における天然に存在する防護性アレルの~25%組み入れを達成するためにすでに用いられており、先のマウス実験は組み入れのこのレベルがほとんどのプリオン病に対する免疫を引き起こすために十分であるということを指示している。この方法は、ほとんどの細胞型においてかかる高い効率でこのアレルを組み入れるための第1のかつ可能性としては唯一の現行のやり方である。処置のための別の可能な戦略は、プライム編集を用いて、早期停止コドンを遺伝子に組み入れることによってPRNPの発現を縮減または消去することである。 The PRNP protein and protective mutation sites are conserved in mammals. Therefore, in addition to treating human disease, it could also be used to generate cattle and sheep immune to prion disease, or even help cure wild populations of animals suffering from prion disease. Prime editing has already been used to achieve ∼25% incorporation of the naturally occurring protective allele in human cells, and previous mouse experiments indicate that this level of incorporation is sufficient to induce immunity to most prion diseases. This method is the first and potentially only current way to incorporate this allele with such high efficiency in most cell types. Another possible strategy for treatment is to use prime editing to reduce or eliminate expression of PRNP by incorporating a premature stop codon into the gene.

PEgRNAデザインのための本明細書に記載の原理を用いて、適当なPEgRNAが、所望の防護性変異を組み入れるために、またはPRNPからプリオン病関連変異を除去するためにデザインされ得る。例えば、PEgRNAの下のリストは、G127V防護性アレルおよびE219K防護性アレルをヒトPRNPに、ならびにG127V防護性アレルを種々の動物のPRNPに組み入れるために用いられ得る。 Using the principles described herein for PEgRNA design, suitable PEgRNAs can be designed to incorporate desired protective mutations or to remove prion disease-associated mutations from PRNP. For example, the below list of PEgRNAs can be used to incorporate the G127V and E219K protective alleles into human PRNP, and the G127V protective allele into PRNP of various animals.

[9]医薬組成物
他の本開示の側面は、本明細書に記載のプライム編集系の様々な構成要素のいずれも(例として、これらに限定されないが、napDNAbp、逆転写酵素、融合タンパク質(例として、napDNAbpsと逆転写酵素とを含む)、伸長されたガイドRNA、および融合タンパク質と伸長されたガイドRNAとを含む複合体、ならびに第2鎖へニックを入れる構成要素および5'内生DNAフラップ除去エンドヌクレアーゼなどの、編集済産物形成へのプライム編集プロセスを推進するのに役立つ付属要素を包含する)含む医薬組成物に関する。
[9] Pharmaceutical Compositions Other aspects of the present disclosure relate to pharmaceutical compositions comprising any of the various components of the prime editing system described herein, including by way of example and not limitation, napDNAbp, reverse transcriptase, fusion proteins (including by way of example napDNAbps and reverse transcriptase), extended guide RNA, and complexes comprising fusion proteins and extended guide RNA, as well as accessory components that serve to drive the prime editing process to form an edited product, such as a second strand nicking component and a 5' endogenous DNA flap removal endonuclease.

用語「医薬組成物」は、本明細書に使用されるとき、医薬使用のために製剤化された組成物を指す。いくつかの態様において、医薬組成物はさらに、薬学的に許容し得る担体を含む。いくつかの態様において、医薬組成物は、追加の剤(例として、特定の送達、半減期の増大、または他の治療的化合物のための)を含む。 The term "pharmaceutical composition" as used herein refers to a composition formulated for pharmaceutical use. In some embodiments, the pharmaceutical composition further comprises a pharma- ceutical acceptable carrier. In some embodiments, the pharmaceutical composition includes additional agents (e.g., for specific delivery, increased half-life, or other therapeutic compounds).

ここで使用されるとき、用語「薬学的に許容し得る担体」は、液体または固体の充填剤、希釈剤、賦形剤、製造補助剤(例として、潤滑剤、タルクマグネシウム、カルシウム、またはステアリン酸亜鉛もしくはステアリン酸)、あるいは身体のある部位(例として、送達部位)から別の部位(例として、器官、組織、もしくは身体部分)へ化合物を運搬または輸送することに関与する溶媒封入材料などの、薬学的に許容し得る材料、組成物、またはビヒクルを意味する。薬学的に許容し得る担体は、製剤の他の成分と相溶性があるが対象の組織に対しては傷害性がない(例として、生理学的に相溶性のある、滅菌された、生理学的なpH、等々)という意味で「許容し得る」ものである。薬学的に許容し得る担体として働き得る材料のいくつかの例は以下を包含する:(1)ラクトース、グルコース、およびスクロースなどの、糖;(2)コーンスターチおよびジャガイモデンプンなどの、デンプン;(3)ナトリウムカルボキシメチルセルロース、メチルセルロース、エチルセルロース、微結晶性セルロース、および酢酸セルロースなどの、セルロースおよびその誘導体;(4)粉末状トラガカント;(5)麦芽;(6)ゼラチン;(7)ステアリン酸マグネシウム、ラウリル硫酸ナトリウム、およびタルクなどの、平滑剤;(8)カカオバターおよび坐薬蝋などの、賦形剤;(9)落花生油、綿実油、紅花油、ゴマ 油、オリーブ油、トウモロコシ油、および大豆油などの、油;(10)プロピレングリコールなどの、グリコール;(11)グリセリン、ソルビトール、マンニトール、およびポリエチレングリコール(PEG)などの、ポリオール;(12)オレイン酸エチルおよびラウリン酸エチルなどの、エステル;(13)寒天;(14)水酸化マグネシウムおよび水酸化アルミニウムなどの、緩衝剤;(15)アルギン酸;(16)パイロジェンフリー水;(17)等浸透圧の生理食塩水;(18)リンガー溶液;(19)エチルアルコール;(20)pH緩衝溶液;(21)ポリエステル、ポリカーボネート、および/またはポリ酸無水物;(22)ポリペプチドおよびアミノ酸などの、増量剤;(23)血清アルブミン、HDL、およびLDLなどの、血清構成要素;(22)エタノールなどの、C2~C12アルコール;ならびに(23)医薬製剤に採用される、相溶性のある他の非毒性物質。湿潤剤、着色剤、離型剤、コーティング剤、甘味剤、香味剤、芳香剤、保存料、および抗酸化剤もまた、製剤中に存在し得る。「賦形剤」、「担体」、「薬学的に許容し得る担体」または同種のものなどの用語は本明細書中、互換的に使用される。 As used herein, the term "pharmaceutical acceptable carrier" means a pharma- ceutically acceptable material, composition, or vehicle, such as a liquid or solid filler, diluent, excipient, manufacturing aid (e.g., lubricant, magnesium, calcium, or zinc stearate or stearic acid), or solvent encapsulant involved in carrying or transporting a compound from one site in the body (e.g., a delivery site) to another (e.g., an organ, tissue, or body part). A pharma- ceutically acceptable carrier is "acceptable" in the sense of being compatible with the other ingredients of the formulation but not toxic to the tissue of the subject (e.g., physiologically compatible, sterile, physiological pH, etc.). Some examples of materials which may serve as pharma- ceutically acceptable carriers include: (1) sugars, such as lactose, glucose, and sucrose; (2) starches, such as corn starch and potato starch; (3) cellulose and its derivatives, such as sodium carboxymethylcellulose, methylcellulose, ethylcellulose, microcrystalline cellulose, and cellulose acetate; (4) powdered tragacanth; (5) malt; (6) gelatin; (7) lubricants, such as magnesium stearate, sodium lauryl sulfate, and talc; (8) excipients, such as cocoa butter and suppository wax; (9) peanut oil, cottonseed oil, safflower oil, sesame oil, and the like. (10) oils, such as olive oil, corn oil, and soybean oil; (11) polyols, such as glycerin, sorbitol, mannitol, and polyethylene glycol (PEG); (12) esters, such as ethyl oleate and ethyl laurate; (13) agar; (14) buffers, such as magnesium hydroxide and aluminum hydroxide; (15) alginic acid; (16) pyrogen-free water; (17) isotonic saline; (18) Ringer's solution; (19) ethyl alcohol; (20) pH buffer solutions; (21) polyesters, polycarbonates, and/or polyanhydrides; (22) bulking agents, such as polypeptides and amino acids; (23) serum components, such as serum albumin, HDL, and LDL; (22) C2-C12 alcohols, such as ethanol; and (23) other compatible non-toxic substances employed in pharmaceutical formulations. Wetting agents, coloring agents, release agents, coating agents, sweetening agents, flavoring agents, fragrances, preservatives, and antioxidants may also be present in the formulation. Terms such as "excipient," "carrier," "pharmaceutical acceptable carrier" or the like are used interchangeably herein.

いくつかの態様において、医薬組成物は、対象への送達のために、例として、遺伝子編集のために、製剤化される。本明細書に記載の医薬組成物を投与する好適なルートは、限定せずに、以下を包含する:局所、皮下、経皮、皮内、病巣内、関節内、腹腔内、膀胱内、経粘膜、歯肉、歯内(intradental)、蝸牛内、経鼓膜、器官内、硬膜外、髄腔内、筋肉内、静脈内、血管内、骨内、眼周囲、腫瘍内、脳内、および脳室内の投与。 In some embodiments, the pharmaceutical composition is formulated for delivery to a subject, e.g., for gene editing. Suitable routes of administration of the pharmaceutical compositions described herein include, without limitation, topical, subcutaneous, transdermal, intradermal, intralesional, intraarticular, intraperitoneal, intravesical, transmucosal, gingival, intradental, intracochlear, transtympanic, intraorgan, epidural, intrathecal, intramuscular, intravenous, intravascular, intraosseous, periocular, intratumoral, intracerebral, and intraventricular administration.

いくつかの態様において、本明細書に記載の医薬組成物は、罹患部位(例として、腫瘍部位)へ局部的に投与される。いくつかの態様において、本明細書に記載の医薬組成物は、注射によって、カテーテルを用いて、坐薬を用いて、あるいは移植片(多孔性材料、非多孔性材料、またはゼラチン材料(シラスティック膜などの膜もしくは繊維を包含する)の移植片)を用いて、対象へ投与される。 In some embodiments, the pharmaceutical compositions described herein are administered locally to the affected site (e.g., the site of a tumor). In some embodiments, the pharmaceutical compositions described herein are administered to the subject by injection, using a catheter, using a suppository, or using an implant (an implant of a porous, non-porous, or gelatinous material, including membranes such as silastic membranes or fibers).

他の態様において、本明細書に記載の医薬組成物は、制御放出系において送達される。一態様において、ポンプが使用されてもよい(例として、Langer,1990,Science 249:1527-1533;Sefton,1989,CRC Crit.Ref.Biomed.Eng.14:201;Buchwald et al.,1980,Surgery 88:507;Saudek et al.,1989,N.Engl.J.Med.321:574を参照)。別の態様において、ポリマー材料が使用され得る。(例として、Langer and Wise eds.,CRC Press,Boca Raton,Fla.,1974);Controlled Drug Bioavailability, Drug Product Design and Performance(Smolen and Ball eds.,Wiley,New York,1984);Ranger and Peppas,1983,Macromol.Sci.Rev.Macromol.Chem.23:61を参照。またLevy et al.,1985,Science 228:190;During et al.,1989,Ann.Neurol.25:351;Howard et al.,1989,J.Neurosurg.71:105も参照。)他の制御放出系も、例えば、Langer(上記を参照)において考察されている。 In other embodiments, the pharmaceutical compositions described herein are delivered in a controlled release system. In one embodiment, a pump may be used (see, e.g., Langer, 1990, Science 249:1527-1533; Sefton, 1989, CRC Crit. Ref. Biomed. Eng. 14:201; Buchwald et al., 1980, Surgery 88:507; Saudek et al., 1989, N. Engl. J. Med. 321:574). In another embodiment, a polymeric material may be used (see, e.g., Langer and Wise eds., CRC Press, Boca Raton, Fla., 1974); Controlled Drug Bioavailability, Drug Product Design and Performance (Smolen and Ball eds., Wiley, New York, 1984); Ranger and Peppas, 1983, Macromol. Sci. Rev. Macromol. Chem. 23:61). See also Levy et al., 1985, Science 228:190; During et al., 1989, Ann. Neurol. 25:351; Howard et al., 1989, J. Neurosurg. 71:105.) Other controlled release systems are discussed, for example, in Langer (see above).

いくつかの態様において、医薬組成物は、対象(例として、ヒト)への静脈内投与または皮下投与に適した組成物として、定型的な手順に従って製剤化される。いくつかの態様において、注射による投与のための医薬組成物は、滅菌された等浸透圧の水性緩衝液中の溶液である。必要なら、医薬はまた、可溶化剤、および注射部位での疼痛を和らげるリグノカインなどの局所麻酔薬も包含し得る。一般に、成分は、個別にまたは一緒に混合されて、例えば、活性剤の分量を示したアンプルもしくは小袋(sachette)などの密閉容器中の凍結乾燥された(dry liophilized)粉末または水がない濃縮物として単位剤形で供給される。医薬が注入によって投与されることになっている場合、滅菌医薬グレードの水または生理食塩水を含有する注入瓶で分配され得る。医薬組成物が注射によって投与される場合、注射用滅菌水または生理食塩水のアンプルは、成分が投与に先立ち混合され得るように、提供され得る。 In some embodiments, the pharmaceutical composition is formulated according to routine procedures as a composition suitable for intravenous or subcutaneous administration to a subject (e.g., a human). In some embodiments, the pharmaceutical composition for administration by injection is a solution in a sterile isotonic aqueous buffer. If necessary, the medicament may also include a solubilizing agent and a local anesthetic, such as lignocaine, to ease pain at the site of the injection. Generally, the ingredients are supplied in unit dosage form, either individually or mixed together, for example, as a dry liophilized powder or water-free concentrate in a hermetically sealed container, such as an ampule or sachette indicating the quantity of active agent. If the medicament is to be administered by injection, it may be dispensed with an infusion bottle containing sterile pharmaceutical grade water or saline. If the pharmaceutical composition is to be administered by injection, an ampoule of sterile water for injection or saline may be provided so that the ingredients may be mixed prior to administration.

全身投与のための医薬組成物は、液体、例として、滅菌された生理食塩水、乳酸リンガー溶液またはハンクス溶液であってもよい。加えて、医薬組成物は固体形態であって、使用に先立ち即時に再溶解または懸濁され得る。凍結乾燥された形態もまた企図される。 Pharmaceutical compositions for systemic administration may be liquids, such as sterile saline, lactated Ringer's solution, or Hank's solution. In addition, pharmaceutical compositions may be in solid form and redissolved or suspended extemporaneously prior to use. Lyophilized forms are also contemplated.

医薬組成物は、非経口投与にも好適なリポソームもしくはマイクロ結晶などの脂質粒子またはベシクル内に含有され得る。粒子は、組成物がこれに含有される限り、単層(unilamellar)または多層(plurilamellar)などの、いずれの好適な構造でもあり得る。化合物は、膜融合(fusogenic)脂質ジオレオイルホスファチジルエタノールアミン(DOPE)、低レベル(5~10mol%)のカチオン性脂質を含有し、かつポリエチレングリコール(PEG)コーティングによって安定化された「安定化プラスミド-脂質粒子」(SPLP)に封入され得る(Zhang Y.P.et al.,Gene Ther.1999,6:1438-47)。N-[1-(2,3-ジオレオイルオキシ)プロピル]-N,N,N-トリメチル-アンモニウムメチルスルファート、または「DOTAP」などの、正に帯電した脂質は、かかる粒子およびベシクルにとって具体的に好ましい。かかる脂質粒子の調製は周知である。例として、米国特許第4,880,635号;第4,906,477号;第4,911,928号;第4,917,951号;第4,920,016号;および第4,921,757号を参照;これらの各々は参照により本明細書に組み込まれる。 The pharmaceutical composition may be contained within lipid particles or vesicles, such as liposomes or microcrystals, which are also suitable for parenteral administration. The particles may be of any suitable structure, such as unilamellar or plurilamellar, so long as the composition is contained therein. The compound may be encapsulated in "stabilized plasmid-lipid particles" (SPLPs) that contain the fusogenic lipid dioleoylphosphatidylethanolamine (DOPE), low levels (5-10 mol%) of cationic lipids, and stabilized by a polyethylene glycol (PEG) coating (Zhang Y.P. et al., Gene Ther. 1999, 6:1438-47). Positively charged lipids, such as N-[1-(2,3-dioleoyloxy)propyl]-N,N,N-trimethyl-ammonium methylsulfate, or "DOTAP", are specifically preferred for such particles and vesicles. Preparation of such lipid particles is well known. See, e.g., U.S. Patent Nos. 4,880,635; 4,906,477; 4,911,928; 4,917,951; 4,920,016; and 4,921,757; each of which is incorporated herein by reference.

本明細書に記載の医薬組成物は、例えば、単位用量として投与またはパッケージされてもよい。用語「単位用量」は、本開示の医薬組成物に関して使用されるとき、まとまった投薬量として対象に好適な、物理的に不連続な単位を指し、予め決められた分量の活性材料を含有する各単位は、要求される希釈剤;すなわち、担体またはビヒクルを伴って所望の治療効果を産生するよう算出される。 The pharmaceutical compositions described herein may be administered or packaged, for example, as unit doses. The term "unit dose" as used with respect to the pharmaceutical compositions of the present disclosure refers to physically discrete units suitable for subject administration as a discrete dosage, each unit containing a predetermined quantity of active material calculated to produce the desired therapeutic effect together with the required diluent; i.e., carrier or vehicle.

さらに、医薬組成物は、(a)本発明の化合物を凍結乾燥形態で含有する容器、および(b)注射のための薬学的に許容し得る希釈剤(例として、滅菌水)を含有する第2容器を含む医薬のキットとして提供され得る。薬学的に許容し得る希釈剤は、凍結乾燥された本発明の化合物の再構成または希釈のために使用され得る。任意に、かかる容器(単数または複数)に関連する通知は、医薬もしくは生物学的産物の製造、使用、または販売を規制する政府機関によって規定される形態であり得、前記通知は、ヒト投与のための製造、使用、または販売の機関による承認を反映する。 Furthermore, the pharmaceutical composition may be provided as a pharmaceutical kit comprising (a) a container containing the compound of the invention in lyophilized form, and (b) a second container containing a pharma- ceutically acceptable diluent for injection (e.g., sterile water). The pharma- ceutically acceptable diluent may be used for reconstitution or dilution of the lyophilized compound of the invention. Optionally, notice associated with such container(s) may be in a form prescribed by a governmental agency regulating the manufacture, use, or sale of pharmaceutical or biological products, said notice reflecting approval by the agency of manufacture, use, or sale for human administration.

別の側面において、上に記載の疾患の処置に有用な材料を含有する製造物品が、包含される。いくつかの態様において、製造物品は、容器およびラベルを含む。好適な容器は、例えば、瓶、バイアル、シリンジ、および試験管を包含する。容器は、ガラスまたはプラスチックなどの様々な材料から形成されてもよい。いくつかの態様において、容器は、本明細書に記載の疾患を処置するのに有効であって滅菌アクセスポートを有していてもよい組成物をとどめておく。例えば、容器は、皮下注射針によって穿刺可能なストッパーを有する静脈内溶液バッグまたはバイアルであってもよい。組成物中の活性剤は本発明の化合物である。いくつかの態様において、容器上のまたはこれに関連したラベルは、組成物が、選んだ疾患を処置するのに使用されることを示す。製造物品はさらに、リン酸緩衝生理食塩水、リンガー溶液、またはデキストロース溶液などの薬学的に許容し得る緩衝液を含む第2容器を含んでもよい。これはさらに、他の緩衝液、希釈剤、フィルター、針、シリンジ、および使用のための指示がある添付文書を包含する、商業的観点およびユーザーの観点から所望される他の材料も包含していてもよい。 In another aspect, an article of manufacture is included that contains materials useful for treating the diseases described above. In some embodiments, the article of manufacture includes a container and a label. Suitable containers include, for example, bottles, vials, syringes, and test tubes. The containers may be formed from a variety of materials, such as glass or plastic. In some embodiments, the container holds a composition that is effective for treating the diseases described herein and may have a sterile access port. For example, the container may be an intravenous solution bag or vial with a stopper pierceable by a hypodermic needle. The active agent in the composition is a compound of the present invention. In some embodiments, a label on or associated with the container indicates that the composition is used to treat the disease of choice. The article of manufacture may further include a second container that contains a pharma- ceutically acceptable buffer, such as phosphate buffered saline, Ringer's solution, or dextrose solution. It may further include other materials desirable from a commercial and user standpoint, including other buffers, diluents, filters, needles, syringes, and package inserts with instructions for use.

[10]キット、ベクター、細胞、および送達
キット
本開示の組成物は、キット中へ集められ得る。いくつかの態様において、キットは、本明細書に記載のプライム編集因子の発現のための核酸ベクターを含む。他の態様において、キットはさらに、適切なガイドヌクレオチド配列(例として、PEgRNAおよび第2部位gRNA)、またはかかるガイドヌクレオチド配列(Cas9タンパク質またはプライム編集因子に所望の標的配列を標的にさせる)の発現のための核酸ベクターを含む。
[10] Kits, vectors, cells, and delivery
Kits The compositions of the present disclosure can be assembled into a kit. In some embodiments, the kit comprises a nucleic acid vector for the expression of the prime editors described herein. In other embodiments, the kit further comprises a suitable guide nucleotide sequence (e.g., PE gRNA and second site gRNA) or a nucleic acid vector for the expression of such a guide nucleotide sequence (which allows the Cas9 protein or prime editor to target the desired target sequence).

本明細書に記載のキットは、本明細書に記載の方法を実施するための構成要素および任意に使用のための指示を収納する1以上の容器を包含していてもよい。本明細書に記載のキットのいずれも、アッセイ方法を実施するのに必要とされる構成要素をさらに含んでいてもよい。キットの各構成要素は、適用可能であれば、液体形態(例として、溶液中)で、または固体形態(例として、乾燥粉末)で提供されてもよい。あるケースにおいて、構成要素のいくつかは、例えば、好適な溶媒または他の種(例えば、水)(これらはキットとともに提供されてもまたはされなくてもよい)の添加によって、再構成可能または別様に(例として、活性形態へ)処理可能であってもよい。 The kits described herein may include one or more containers housing components for carrying out the methods described herein and, optionally, instructions for use. Any of the kits described herein may further include components required for carrying out an assay method. Each component of the kit may be provided in liquid form (e.g., in solution) or in solid form (e.g., as a dry powder), if applicable. In some cases, some of the components may be reconstituted or otherwise processable (e.g., into an active form), for example, by the addition of a suitable solvent or other species (e.g., water), which may or may not be provided with the kit.

いくつかの態様において、キットは任意に、提供される構成要素の使用のための指示および/または促進(promotion)を包含していてもよい。本明細書に使用されるとき、「指示」は、指示および/または促進の構成要素を定義し得るものであって、典型的には、本開示のパッケージング上にまたはこれに関連して書面の指示を伴い得る。指示はまた、ユーザーが明確に、指示がキットに関連するものであることを認識できるように(例えば、視聴覚に訴えるもの(例として、ビデオテープ、DVD、等々)、インターネット、および/またはウェブベースの連絡、等々)、形はどうあれ、いずれの口授または電子的指示も包含し得る。書面の指示は、医薬もしくは生物学的産物の製造、使用、または販売を規制する政府機関によって規定される形態であってもよく、これは動物投与のための製造、使用、または販売の機関による承認も反映し得る。本明細書に使用されるとき、「促進された」は、本開示に関連する、教育方法、病院のおよび他の臨床の指示、科学研究、薬物の発見または開発、学術研究、医薬産業活動(医薬販売を包含する)、ならびにいずれの広告活動または他の宣伝活動(いずれの形態の書面の、口述の、および電子的な連絡を包含する)を包含する、営業行為のすべての方法を包含する。加えて、キットは、本明細書に記載のとおりの特定の用途に応じて、他の構成要素も包含していてもよい。 In some embodiments, the kit may optionally include instructions and/or promotion for the use of the components provided. As used herein, "instructions" may define the components of instructions and/or promotion, and may typically involve written instructions on or in association with the packaging of the present disclosure. Instructions may also include any oral or electronic instructions in any form (e.g., audiovisual (e.g., videotape, DVD, etc.), internet, and/or web-based communication, etc.) such that a user clearly recognizes that the instructions are relevant to the kit. Written instructions may be in a form prescribed by a government agency regulating the manufacture, use, or sale of pharmaceutical or biological products, which may also reflect approval by the agency of manufacture, use, or sale for animal administration. As used herein, "promoted" includes all methods of business conduct, including educational methods, hospital and other clinical instruction, scientific research, drug discovery or development, academic research, pharmaceutical industry activities (including pharmaceutical sales), and any advertising or other promotional activities (including any form of written, oral, and electronic communication) related to the present disclosure. In addition, the kit may also include other components depending on the particular application as described herein.

キットは、1以上の容器中に、本明細書に記載のいずれの構成要素の1以上を含有していてもよい。構成要素は、滅菌的に調製され、シリンジ中にパッケージされ、および冷凍保存されて出荷されてもよい。代替的に、これは、バイアルまたは保管のための他の容器に収納されてもよい。第2容器は、滅菌的に調製された他の構成要素も有していてもよい。代替的に、キットは、予め混合されて、バイアル、管、または他の容器中で出荷される活性剤を包含していてもよい。 The kit may contain one or more of any of the components described herein in one or more containers. The components may be sterilely prepared, packaged in syringes, and shipped frozen. Alternatively, it may be housed in a vial or other container for storage. A second container may also have other components sterilely prepared. Alternatively, the kit may include an active agent that is premixed and shipped in a vial, tube, or other container.

キットは、パウチ、1以上の管、容器、箱、または袋内に緩くパックされた付属物とともに、ブリスターパウチ(blister pouch)、収縮包装パウチ、真空シール可能なパウチ、シール可能な熱成形トレイ、または同様のパウチもしくはトレイの形態などの様々な形態を有してもよい。キットは、付属物が加えられた後に滅菌されてもよく、これによって容器中の個々の付属物が別様に開封され得る。キットは、放射線滅菌、加熱滅菌、または当該技術分野において知られている他の滅菌方法などの、いずれの適切な滅菌技法も使用して滅菌され得る。キットはまた、特定の用途に応じて、他の構成要素、例えば、容器、細胞培地、塩、緩衝剤、試薬、シリンジ、針、殺菌剤を適用または除去するための生地(ガーゼなど)、使い捨て手袋、投与に先立ち剤を支持するためのもの等々も包含していてもよい。本開示のいくつかの側面は、本明細書に記載のプライム編集系の様々な構成要素(例として、これらに限定されないが、napDNAbp、逆転写酵素、ポリメラーゼ、融合タンパク質(例として、napDNAbpと逆転写酵素(またはより広くは、ポリメラーゼ)とを含む)、伸長されたガイドRNA、および融合タンパク質と伸長されたガイドRNAとを含む複合体、ならびに第2鎖へニックを入れる構成要素(例として、第2鎖へニックを入れるgRNA)および5'内生DNAフラップ除去エンドヌクレアーゼなどの付属要素(編集済産物形成へのプライム編集プロセスを推進するのに役立つ)を包含する)をコードするヌクレオチド配列を含む核酸構築物を含むキットを提供する。いくつかの態様において、ヌクレオチド配列(単数または複数)は、プライム編集系構成要素の発現を推進する異種プロモーター(または単一のプロモーターより多く)を含む。 The kit may have various forms, such as a blister pouch, shrink-wrap pouch, vacuum-sealable pouch, sealable thermoformed tray, or similar pouch or tray form, with the accessories loosely packed in a pouch, one or more tubes, containers, boxes, or bags. The kit may be sterilized after the accessories are added, which allows the individual accessories in the container to be opened separately. The kit may be sterilized using any suitable sterilization technique, such as radiation sterilization, heat sterilization, or other sterilization methods known in the art. The kit may also include other components, such as containers, cell culture media, salts, buffers, reagents, syringes, needles, fabrics (such as gauze) for applying or removing disinfectants, disposable gloves, for supporting the agent prior to administration, etc., depending on the particular application. Some aspects of the present disclosure provide kits that include nucleic acid constructs that include nucleotide sequences that encode various components of the prime editing system described herein, including, by way of example and not limitation, napDNAbp, reverse transcriptase, polymerase, fusion proteins (e.g., napDNAbp and reverse transcriptase (or more broadly, polymerase)), extended guide RNAs, and complexes comprising fusion proteins and extended guide RNAs, as well as accessory elements such as second strand nicking components (e.g., gRNAs that nick the second strand) and 5' endogenous DNA flap removal endonucleases that serve to drive the prime editing process to edited product formation). In some embodiments, the nucleotide sequence(s) include a heterologous promoter (or more than a single promoter) that drives expression of the prime editing system components.

本開示の他の側面は、本明細書に記載のプライム編集因子系の様々な構成要素(例として、標的DNA配列を修飾することが可能なプライム編集因子系の構成要素をコードするヌクレオチド配列を含む)をコードする1以上の核酸構築物を含むキットを提供する。いくつかの態様において、ヌクレオチド配列は、プライム編集因子系構成要素の発現を推進する異種プロモーターを含む。 Another aspect of the present disclosure provides kits that include one or more nucleic acid constructs encoding various components of the prime editing system described herein, including, by way of example, nucleotide sequences encoding components of the prime editing system capable of modifying a target DNA sequence. In some embodiments, the nucleotide sequences include a heterologous promoter that drives expression of the prime editing system components.

本開示のいくつかの側面は、(a)逆転写酵素と融合したnapDNAbp(例として、Cas9ドメイン)をコードするヌクレオチド配列、および(b)(a)の配列の発現を推進する異種プロモーターを含む核酸構築物を含むキットを提供する。 Some aspects of the disclosure provide a kit that includes a nucleic acid construct that includes (a) a nucleotide sequence encoding a napDNAbp (e.g., a Cas9 domain) fused to a reverse transcriptase, and (b) a heterologous promoter driving expression of the sequence of (a).

細胞
本明細書に記載の組成物のいずれも含有していてもよい細胞は、原核細胞および真核細胞を包含する。本明細書に記載の方法は、Cas9タンパク質またはプライム編集因子を真核細胞(例として、ヒト細胞などの哺乳動物の細胞)中へ送達するのに使用される。いくつかの態様において、細胞は、in vitroにある(例として、培養された細胞)。いくつかの態様において、細胞は、in vivoにある(例として、ヒト対象などの対象中にある)。いくつかの態様において、細胞は、ex vivoにある(例として、対象から単離され、同じ対象へ戻すかまたは異なる対象へ投与されてもよい)。
Cells Cells that may contain any of the compositions described herein include prokaryotic and eukaryotic cells. The methods described herein are used to deliver Cas9 proteins or prime editors into eukaryotic cells (e.g., mammalian cells, such as human cells). In some embodiments, the cells are in vitro (e.g., cultured cells). In some embodiments, the cells are in vivo (e.g., in a subject, such as a human subject). In some embodiments, the cells are ex vivo (e.g., isolated from a subject and may be administered back to the same subject or to a different subject).

本開示の哺乳動物の細胞は、ヒト細胞、霊長目の動物細胞(例として、ベロ細胞)、ラット細胞(例として、GH3細胞、OC23細胞)、またはマウス細胞(例として、MC3T3細胞)を包含する。様々なヒト細胞株には、限定せずに、ヒト胚性腎臓(HEK)細胞、HeLa細胞、国立がん研究所の60のがん細胞株(NCI60)からのがん細胞、DU145(前立腺がん)細胞、Lncap(前立腺がん)細胞、MCF-7(乳がん)細胞、MDA-MB-438(乳がん)細胞、PC3(前立腺がん)細胞、T47D(乳がん)細胞、THP-1(急性骨髄性白血病)細胞、U87(膠芽腫)細胞、SHSY5Yヒト神経芽細胞腫細胞(骨髄腫からクローン化)、およびSaos-2(骨がん)細胞が包含される。いくつかの態様において、rAAVベクターは、ヒト胚性腎臓(HEK)細胞(例として、HEK293またはHEK 293T細胞)中へ送達される。いくつかの態様において、rAAVベクターは、例えば、多能性幹細胞(例として、ヒト人工(induced)多能性幹細胞(hiPSC)を包含するヒト多能性幹細胞)などの、幹細胞(例として、ヒト幹細胞)中へ送達される。幹細胞は培養中、無期限に分裂して、特化された細胞を生じさせる能力をもつ細胞を指す。多能性幹細胞は、分化して生物のすべての組織になることが可能であるが、完全な生物の発生を単独では支えることが可能でないある種の幹細胞を指す。ヒト人工多能性幹細胞は、胚性幹細胞を定義する特性を維持するのに重要な遺伝子および因子の発現が強いられることによって胚性幹細胞様状態へ再プログラムされる体細胞(例として、成熟した(mature)細胞または成熟(adult)細胞)を指す(例として、Takahashi and Yamanaka,Cell 126(4):663-76,2006を参照(参照により本明細書に組み込まれる))。ヒト人工多能性幹細胞は、幹細胞マーカーを発現しており、全3種の胚葉(外胚葉、内胚葉、中胚葉)の細胞特徴を生成するのが可能である。 Mammalian cells of the present disclosure include human cells, primate cells (e.g., Vero cells), rat cells (e.g., GH3 cells, OC23 cells), or mouse cells (e.g., MC3T3 cells). Various human cell lines include, but are not limited to, human embryonic kidney (HEK) cells, HeLa cells, cancer cells from the National Cancer Institute's 60 cancer cell lines (NCI60), DU145 (prostate cancer) cells, Lncap (prostate cancer) cells, MCF-7 (breast cancer) cells, MDA-MB-438 (breast cancer) cells, PC3 (prostate cancer) cells, T47D (breast cancer) cells, THP-1 (acute myeloid leukemia) cells, U87 (glioblastoma) cells, SHSY5Y human neuroblastoma cells (cloned from a myeloma), and Saos-2 (bone cancer) cells. In some embodiments, the rAAV vector is delivered into a human embryonic kidney (HEK) cell (e.g., HEK293 or HEK 293T cell). In some embodiments, the rAAV vector is delivered into a stem cell (e.g., a human stem cell), such as, for example, a pluripotent stem cell (e.g., a human pluripotent stem cell, including a human induced pluripotent stem cell (hiPSC)). Stem cells refer to cells that have the ability to divide indefinitely in culture to give rise to specialized cells. Pluripotent stem cells refer to a type of stem cell that can differentiate into all tissues of an organism, but cannot support the development of a complete organism by itself. Human induced pluripotent stem cells refer to somatic cells (e.g., mature or adult cells) that are reprogrammed into an embryonic stem cell-like state by forcing the expression of genes and factors important for maintaining the characteristics that define embryonic stem cells (see, e.g., Takahashi and Yamanaka, Cell 126(4):663-76, 2006, incorporated herein by reference). Human induced pluripotent stem cells express stem cell markers and are capable of generating cells characteristic of all three germ layers (ectoderm, endoderm, and mesoderm).

本開示に従って使用されてもよい追加の細胞株の非限定例は、293-T、293-T、3T3、4T1、721、9L、A-549、A172、A20、A253、A2780、A2780ADR、A2780cis、A431、ALC、B16、B35、BCP-1、BEAS-2B、bEnd.3、BHK-21、BR 293、BxPC3、C2C12、C3H-10T1/2、C6、C6/36、Cal-27、CGR8、CHO、CML T1、CMT、COR-L23、COR-L23/5010、COR-L23/CPR、COR-L23/R23、COS-7、COV-434、CT26、D17、DH82、DU145、DuCaP、E14Tg2a、EL4、EM2、EM3、EMT6/AR1、EMT6/AR10.0、FM3、H1299、H69、HB54、HB55、HCA2、Hepa1c1c7、High Five細胞、HL-60、HMEC、HT-29、HUVEC、J558L細胞、Jurkat、JY細胞、K562細胞、KCL22、KG1、Ku812、KYO1、LNCap、Ma-Mel 1、2、3....48、MC-38、MCF-10A、MCF-7、MDA-MB-231、MDA-MB-435、MDA-MB-468、MDCK II、MG63、MONO-MAC 6、MOR/0.2R、MRC5、MTD-1A、MyEnd、NALM-1、NCI-H69/CPR、NCI-H69/LX10、NCI-H69/LX20、NCI-H69/LX4、NIH-3T3、NW-145、OPCN/OPCT Peer、PNT-1A/PNT 2、PTK2、Raji、RBL細胞、RenCa、RIN-5F、RMA/RMAS、S2、Saos-2細胞、Sf21、Sf9、SiHa、SKBR3、SKOV-3、T-47D、T2、T84、THP1、U373、U87、U937、VCaP、WM39、WT-49、X63、YAC-1、およびYAR細胞を包含する。 Non-limiting examples of additional cell lines that may be used in accordance with the present disclosure include 293-T, 293-T, 3T3, 4T1, 721, 9L, A-549, A172, A20, A253, A2780, A2780ADR, A2780cis, A431, ALC, B16, B35, BCP-1, BEAS-2B, bEnd.3, BHK-21, BR 293, BxPC3, C2C12, C3H-10T1/2, C6, C6/36, Cal-27, CGR8, CHO, CML. T1, CMT, COR-L23, COR-L23/5010, COR-L23/CPR, COR-L23/R23, COS-7, COV-434, CT26, D17, DH82, DU145, DuCaP, E14Tg2a, EL4, EM2, EM3, EMT6/AR1, EMT6/AR10.0, FM3, H1299, H69, HB54, HB55, HCA2, Hepa1c1c7, High Five cells, HL-60, HMEC, HT-29, HUVEC, J558L cells, Jurkat, JY cells, K562 cells, KCL22, KG1, Ku812, KYO1, LNCap, Ma-Mel 1, 2, 3....48, MC-38, MCF-10A, MCF-7, MDA-MB-231, MDA-MB-435, MDA-MB-468, MDCK II, MG63, MONO-MAC 6, MOR/0.2R, MRC5, MTD-1A, MyEnd, NALM-1, NCI-H69/CPR, NCI-H69/LX10, NCI-H69/LX20, NCI-H69/LX4, NIH-3T3, NW-145, OPCN/OPCT Peer, PNT-1A/PNT 2, PTK2, Raji, RBL cells, RenCa, RIN-5F, RMA/RMAS, S2, Saos-2 cells, Sf21, Sf9, SiHa, SKBR3, SKOV-3, T-47D, T2, T84, THP1, U373, U87, U937, VCaP, WM39, WT-49, X63, YAC-1, and YAR cells.

本開示のいくつかの側面は、本明細書に開示される構築物のいずれも含む細胞を提供する。いくつかの態様において、宿主細胞は、本明細書に記載の1以上のベクターで一過的または非一過的にトランスフェクトされている。いくつかの態様において、細胞は、対象中に天然に存在するとき、トランスフェクトされる。いくつかの態様において、トランスフェクトされる細胞は、対象から採られる。いくつかの態様において、細胞は、細胞株などの、対象から採られた細胞に由来する。組織培養のための多種多様の細胞株が当該技術分野において知られている。細胞株の例は、これらに限定されないが、C8161、CCRF-CEM、MOLT、mIMCD-3、NHDF、HeLa-S3、Huh1、Huh4、Huh7、HUVEC、HASMC、HEKn、HEKa、MiaPaCell、Panc1、PC-3、TF1、CTLL-2、C1R、Rat6、CV1、RPTE、A10、T24、J82、A375、ARH-77、Calu1、SW480、SW620、SKOV3、SK-UT、CaCo2、P388D1、SEM-K2、WEHI-231、HB56、TIB55、Jurkat、J45.01、LRMB、Bcl-1、BC-3、IC21、DLD2、Raw264.7、NRK、NRK-52E、MRC5、MEF、Hep G2、HeLa B、HeLa T4、COS、COS-1、COS-6、COS-M6A、BS-C-1サル腎臓上皮、BALB/3T3マウス胚線維芽細胞、3T3 Swiss、3T3-L1、132-d5ヒト胎児線維芽細胞;10.1マウス線維芽細胞、293-T、3T3、721、9L、A2780、A2780ADR、A2780cis、A 172、A20、A253、A431、A-549、ALC、B16、B35、BCP-1細胞、BEAS-2B、bEnd.3、BHK-21、BR 293.BxPC3.C3H-10T1/2、C6/36、Cal-27、CHO、CHO-7、CHO-IR、CHO-K1、CHO-K2、CHO-T、CHO Dhfr -/-、COR-L23、COR-L23/CPR、COR-L23/5010、COR-L23/R23、COS-7、COV-434、CML T1、CMT、CT26、D17、DH82、DU145、DuCaP、EL4、EM2、EM3、EMT6/AR1、EMT6/AR10.0、FM3、H1299、H69、HB54、HB55、HCA2、HEK-293、HeLa、Hepa1c1c7、HL-60、HMEC、HT-29、Jurkat、JY細胞、K562細胞、Ku812、KCL22、KG1、KYO1、LNCap、Ma-Mel 1-48、MC-38、MCF-7、MCF-10A、MDA-MB-231、MDA-MB-468、MDA-MB-435、MDCK II、MDCK 11、MOR/0.2R、MONO-MAC 6、MTD-1A、MyEnd、NCI-H69/CPR、NCI-H69/LX10、NCI-H69/LX20、NCI-H69/LX4、NIH-3T3、NALM-1、NW-145、OPCN/OPCT細胞株、Peer、PNT-1A/PNT 2、RenCa、RIN-5F、RMA/RMAS、Saos-2細胞、Sf-9、SkBr3、T2、T-47D、T84、THP1細胞株、U373、U87、U937、VCaP、Vero細胞、WM39、WT-49、X63、YAC-1、YAR、およびそれらのトランスジェニック種を包含する。 Some aspects of the disclosure provide a cell comprising any of the constructs disclosed herein. In some embodiments, the host cell is transiently or non-transiently transfected with one or more vectors described herein. In some embodiments, the cell is transfected as it naturally occurs in the subject. In some embodiments, the transfected cell is taken from the subject. In some embodiments, the cell is derived from a cell taken from the subject, such as a cell line. A wide variety of cell lines for tissue culture are known in the art. Examples of cell lines include, but are not limited to, C8161, CCRF-CEM, MOLT, mIMCD-3, NHDF, HeLa-S3, Huh1, Huh4, Huh7, HUVEC, HASMC, HEKn, HEKa, MiaPaCell, Panc1, PC-3, TF1, CTLL-2, C1R, Rat6, CV1, RPTE, A10, T24, J82, A375, ARH-77, Calu1, SW480, SW620, SKOV3, SK-UT, CaCo2, P388D1, SEM-K2, WEHI-231, HB56, TIB55, Jurkat, J45.01, LRMB, Bcl-1, BC-3, IC21, DLD2, Raw264.7, NRK, NRK-52E, MRC5, MEF, Hep G2, HeLa B, HeLa T4, COS, COS-1, COS-6, COS-M6A, BS-C-1 monkey kidney epithelium, BALB/3T3 mouse embryonic fibroblasts, 3T3 Swiss, 3T3-L1, 132-d5 human fetal fibroblasts; 10.1 mouse fibroblasts, 293-T, 3T3, 721, 9L, A2780, A2780ADR, A2780cis, A 172, A20, A253, A431, A-549, ALC, B16, B35, BCP-1 cells, BEAS-2B, bEnd.3, BHK-21, BR 293.BxPC3.C3H-10T1/2, C6/36, Cal-27, CHO, CHO-7, CHO-IR, CHO-K1, CHO-K2, CHO-T, CHO Dhfr -/-, COR-L23, COR-L23/CPR, COR-L23/5010, COR-L23/R23, COS-7, COV-434, CML T1, CMT, CT26, D17, DH82, DU145, DuCaP, EL4, EM2, EM3, EMT6/AR1, EMT6/AR10.0, FM3, H1299, H69, HB54, HB55, HCA2, HEK-293, HeLa, Hepa1c1c7, HL-60, HMEC, HT-29, Jurkat, JY cells, K562 cells, Ku812, KCL22, KG1, KYO1, LNCap, Ma-Mel 1-48, MC-38, MCF-7, MCF-10A, MDA-MB-231, MDA-MB-468, MDA-MB-435, MDCK II, MDCK 11, MOR/0.2R, MONO-MAC 6, MTD-1A, MyEnd, NCI-H69/CPR, NCI-H69/LX10, NCI-H69/LX20, NCI-H69/LX4, NIH-3T3, NALM-1, NW-145, OPCN/OPCT cell lines, Peer, PNT-1A/PNT 2, RenCa, RIN-5F, RMA/RMAS, Saos-2 cells, Sf-9, SkBr3, T2, T-47D, T84, THP1 cell lines, U373, U87, U937, VCaP, Vero cells, WM39, WT-49, X63, YAC-1, YAR, and transgenic varieties thereof.

細胞株は、当業者に知られている様々な供給源から利用可能である(例として、American Type Culture Collection(ATCC)(Manassus,Va.)を参照)。いくつかの態様において、本明細書に記載の1以上のベクターでトランスフェクトされた細胞は、1以上のベクター由来配列を含む新しい細胞株を確立するのに使用される。いくつかの態様において、本明細書に記載のとおりのCRISPR系の構成要素で(1以上のベクターの一過的なトランスフェクション、またはRNAでのトランスフェクションなどによって)一過的にトランスフェクトされて、CRISPR複合体の活性を通して修飾された細胞は、修飾は含有するが他の外来配列のいずれも欠く細胞を含む新しい細胞株を確立するのに使用される。いくつかの態様において、本明細書に記載の1以上のベクターで一過的もしくは非一過的にトランスフェクトされた細胞、またはかかる細胞に由来する細胞株は、1以上の試験化合物を査定するのに使用される。 Cell lines are available from a variety of sources known to those of skill in the art (see, e.g., American Type Culture Collection (ATCC), Manassus, Va.). In some embodiments, cells transfected with one or more vectors described herein are used to establish new cell lines that contain one or more vector-derived sequences. In some embodiments, cells that have been transiently transfected (such as by transient transfection of one or more vectors or transfection with RNA) with components of the CRISPR system as described herein and modified through the activity of the CRISPR complex are used to establish new cell lines that include cells that contain the modifications but lack any other exogenous sequences. In some embodiments, cells transiently or non-transiently transfected with one or more vectors described herein, or cell lines derived from such cells, are used to assess one or more test compounds.

ベクター
本開示のいくつかの側面は、本明細書に記載のプライム編集因子またはその構成要素(例として、分裂Cas9タンパク質もしくは分裂核酸塩基プライム編集因子)の細胞中への送達のための、組換えウイルスベクター(例として、アデノ随伴ウイルスベクター、アデノウイルスベクター、または単純ヘルペスウイルスベクター)の使用に関する。分裂-PEアプローチのケースにおいて、全長Cas9タンパク質またはプライム編集因子が様々なウイルスベクター(例として、rAAV(~4.9kb))のパッケージング限界を超えることから、PE融合タンパク質のN末端部分およびPE融合のC末端部分は、別々の組換えウイルスベクター(例として、アデノ随伴ウイルスベクター、アデノウイルスベクター、または単純ヘルペスウイルスベクター)によって同じ細胞中へ送達される。
Vectors Some aspects of the disclosure relate to the use of recombinant viral vectors (e.g., adeno-associated viral vectors, adenoviral vectors, or herpes simplex viral vectors) for delivery of the prime editors or components thereof (e.g., split Cas9 proteins or split nucleobase prime editors) described herein into cells. In the case of the split-PE approach, since the full-length Cas9 protein or prime editor exceeds the packaging limit of various viral vectors (e.g., rAAV (~4.9 kb)), the N-terminal portion of the PE fusion protein and the C-terminal portion of the PE fusion are delivered into the same cell by separate recombinant viral vectors (e.g., adeno-associated viral vectors, adenoviral vectors, or herpes simplex viral vectors).

よって、一態様において、本開示は、分裂プライム編集因子融合タンパク質またはそれらの分裂構成要素を送達するのか可能なベクターを企図する。いくつかの態様において、分裂Cas9タンパク質または分裂プライム編集因子を細胞(例として、哺乳動物の細胞、ヒト細胞)中へ送達するための組成物が提供される。いくつかの態様において、本開示の組成物は以下を含む:(i)そのC末端にてインテイン-Nと融合したCas9タンパク質またはプライム編集因子のN末端部分をコードする第1ヌクレオチド配列を含む第1組換えアデノ随伴ウイルス(rAAV)粒子;および(ii)Cas9のタンパク質またはプライム編集因子のC末端部分のN末端と融合したインテイン-Cをコードする第2ヌクレオチド配列を含む第2組換えアデノ随伴ウイルス(rAAV)粒子。本開示のrAAV粒子は、ウイルスのカプシドタンパク質で包まれた(encapsidated)rAAVベクター(すなわち、rAAVの組換えゲノム)を含む。 Thus, in one embodiment, the disclosure contemplates vectors capable of delivering split-prime editor fusion proteins or their split components. In some embodiments, compositions for delivering split-Cas9 proteins or split-prime editors into cells (e.g., mammalian cells, human cells) are provided. In some embodiments, compositions of the disclosure include: (i) a first recombinant adeno-associated virus (rAAV) particle comprising a first nucleotide sequence encoding an N-terminal portion of a Cas9 protein or prime editor fused at its C-terminus to an intein-N; and (ii) a second recombinant adeno-associated virus (rAAV) particle comprising a second nucleotide sequence encoding an intein-C fused to the N-terminus of the C-terminal portion of a Cas9 protein or prime editor. The rAAV particles of the disclosure include a rAAV vector (i.e., a recombinant genome of rAAV) encapsidated with viral capsid proteins.

いくつかの態様において、rAAVベクターは以下を含む:(1)本明細書に記載のとおりのいずれの形態の分裂Cas9タンパク質もしくは分裂プライム編集因子のN末端部分またはC末端部分をコードする第1あるいは第2ヌクレオチド配列を含む異種核酸領域、(2)異種核酸領域の発現を容易にさせる配列(例として、プロモーター)を含む1以上のヌクレオチド配列、および(3)異種核酸領域(任意に、発現を容易にさせる配列を含む1以上の核酸領域をもつ)の細胞ゲノム中への組み入れを容易にさせる配列を含む1以上の核酸領域。いくつかの態様において、組み入れを容易にさせるウイルスの配列は、逆方向末端反復(ITR)配列を含む。いくつかの態様において、分裂Cas9タンパク質もしくは分裂プライム編集因子のN末端部分またはC末端部分をコードする第1あるいは第2ヌクレオチド配列は、ITR配列によって両側から挟まれている。いくつかの態様において、核酸ベクターはさらに、本明細書に記載のとおりのAAV Repタンパク質をコードする領域を含むが、前記領域は、ITRによって挟まれる領域内またはその領域外のいずれかに含有される。ITR配列は、いずれかのAAV血清型(例として、1、2、3、4、5、6、7、8、9もしくは10)に由来し得るか、または1より多くの血清型に由来し得る。いくつかの態様において、ITR配列は、AAV2またはAAV6に由来する。 In some embodiments, the rAAV vector comprises: (1) a heterologous nucleic acid region comprising a first or second nucleotide sequence encoding an N- or C-terminal portion of a split-Cas9 protein or split-prime editor in any form as described herein; (2) one or more nucleotide sequences comprising a sequence (e.g., a promoter) that facilitates expression of the heterologous nucleic acid region; and (3) one or more nucleic acid regions comprising a sequence that facilitates integration of the heterologous nucleic acid region (optionally with one or more nucleic acid regions comprising sequences that facilitate expression) into a cellular genome. In some embodiments, the viral sequence that facilitates integration comprises an inverted terminal repeat (ITR) sequence. In some embodiments, the first or second nucleotide sequence encoding the N- or C-terminal portion of the split-Cas9 protein or split-prime editor is flanked on both sides by ITR sequences. In some embodiments, the nucleic acid vector further comprises a region encoding an AAV Rep protein as described herein, but the region is contained either within or outside the region flanked by the ITRs. The ITR sequences can be derived from any AAV serotype (e.g., 1, 2, 3, 4, 5, 6, 7, 8, 9, or 10) or from more than one serotype. In some embodiments, the ITR sequences are derived from AAV2 or AAV6.

よって、いくつかの態様において、本明細書に開示のrAAV粒子は、少なくとも1のrAAV2粒子、rAAV6粒子、rAAV8粒子、rPHP.B粒子、rPHP.eB粒子、もしくはrAAV9粒子、またはそのバリアントを含む。具体的な態様において、開示されたrAAV粒子は、rPHP.B粒子、rPHP.eB粒子、rAAV9粒子である。 Thus, in some embodiments, the rAAV particles disclosed herein comprise at least one rAAV2 particle, rAAV6 particle, rAAV8 particle, rPHP.B particle, rPHP.eB particle, or rAAV9 particle, or variants thereof. In specific embodiments, the disclosed rAAV particles are rPHP.B particles, rPHP.eB particles, or rAAV9 particles.

ITR配列およびITR配列含有プラスミドは当該技術分野において知られており、市販されている(例として、Vector Biolabs,Philadelphia,PA;Cellbiolabs,San Diego,CA;Agilent Technologies,Santa Clara,Ca;およびAddgene,Cambridge,MAから利用可能な製品ならびにサービス;ならびに、骨格筋への遺伝子送達は治療用タンパク質の持続発現および全身送達をもたらす。Kessler PD,Podsakoff GM,Chen X,McQuiston SA,Colosi PC,Matelis LA,Kurtzman GJ,Byrne BJ.Proc Natl Acad Sci USA.1996 Nov 26;93(24):14082-7;およびCurtis A.Machida.Methods in Molecular MedicineTM.Viral Vectors for Gene Therapy Methods and Protocols.10.1385/1-59259-304-6:201cHumana Press Inc.2003.Chapter 10.Targeted Integration by Adeno-Associated Virus.Matthew D.Weitzman,Samuel M.Young Jr.,Toni Cathomen and Richard Jude Samulski;米国特許第5,139,941号および第5,962,313号を参照(これらすべては参照により本明細書に組み込まれる))。 ITR sequences and ITR sequence-containing plasmids are known in the art and commercially available (e.g., products and services available from Vector Biolabs, Philadelphia, PA; Cellbiolabs, San Diego, CA; Agilent Technologies, Santa Clara, Ca; and Addgene, Cambridge, MA; and gene delivery to skeletal muscle results in sustained expression and systemic delivery of therapeutic proteins. Kessler PD, Podsakoff GM, Chen X, McQuiston SA, Colosi PC, Matelis LA, Kurtzman GJ, Byrne BJ. Proc Natl Acad Sci USA. 1996 Nov 26;93(24):14082-7; and Curtis A. Machida. Methods in Molecular Medicine TM . Viral Vectors for Gene Therapy Methods and Protocols. 10.1385/1-59259-304-6:201c Humana Press Inc. 2003. Chapter 10. Targeted Integration by Adeno-Associated Virus. Matthew D. Weitzman, Samuel M. Young Jr., Toni Cathomen and Richard Jude Samulski; see U.S. Patent Nos. 5,139,941 and 5,962,313, all of which are incorporated herein by reference.

いくつかの態様において、本開示のrAAVベクターは、異種核酸領域の発現を制御する1以上の調節要素(例として、プロモーター、転写ターミネータ、および/または他の調節要素)を含む。いくつかの態様において、第1および/または第2ヌクレオチド配列は、1以上の(例として、1、2、3、4、5、またはそれ以上の)転写ターミネータへ作動可能に(operably)連結されている。本開示に従って使用されてもよい転写ターミネータの非限定例は、ウシ成長ホルモン遺伝子(bGH)、ヒト成長ホルモン遺伝子(hGH)、SV40、CW3、φ、またはそれらの組み合わせの転写ターミネータを包含する。数種の転写ターミネータの効率が試験され、分裂Cas9タンパク質または分裂プライム編集因子の発現レベルにおけるそれら夫々の効果を決定した。いくつかの態様において、本開示に使用される転写ターミネータは、bGH転写ターミネータである。いくつかの態様において、rAAVベクターはさらに、ウッドチャック肝炎ウイルス転写後調節要素(WPRE)を含む。ある態様において、WPREは、「W3」などのトランケートされたWPRE配列である。いくつかの態様において、WPREは、転写ターミネータの5'に挿入されている。かかる配列は、転写されたとき、発現、とりわけウイルスベクターからの発現を増強する3次構造を創出する。 In some embodiments, the rAAV vector of the present disclosure comprises one or more regulatory elements (e.g., a promoter, a transcription terminator, and/or other regulatory elements) that control expression of the heterologous nucleic acid region. In some embodiments, the first and/or second nucleotide sequence is operably linked to one or more (e.g., one, two, three, four, five, or more) transcription terminators. Non-limiting examples of transcription terminators that may be used according to the present disclosure include the bovine growth hormone gene (bGH), human growth hormone gene (hGH), SV40, CW3, φ, or combinations thereof. The efficiency of several transcription terminators has been tested to determine their respective effects on the expression levels of split-Cas9 proteins or split-primed editors. In some embodiments, the transcription terminator used in the present disclosure is a bGH transcription terminator. In some embodiments, the rAAV vector further comprises a woodchuck hepatitis virus post-transcriptional regulatory element (WPRE). In some embodiments, the WPRE is a truncated WPRE sequence, such as "W3". In some embodiments, the WPRE is inserted 5' to a transcription terminator. Such sequences, when transcribed, create a tertiary structure that enhances expression, particularly from viral vectors.

いくつかの態様において、本明細書に使用されるベクターは、PE融合タンパク質、またはそれら構成要素(例として、napDNAbp、リンカー、もしくはポリメラーゼ)のいずれもコードしていてもよい。加えて、本明細書に使用されるベクターは、PEgRNA、および/または第2鎖へニックを入れるための付属(accessory)gRNAをコードしていてもよい。ベクターは、細胞中の1以上のコード配列の発現を推進するのが可能であってもよい。いくつかの態様において、細胞は、例として細菌性細胞などの、原核細胞であってもよい。いくつかの態様において、細胞は、例として、酵母、植物、昆虫、または哺乳動物の細胞などの、真核細胞であってもよい。いくつかの態様において、真核細胞は、哺乳動物の細胞であってもよい。いくつかの態様において、真核細胞は、齧歯類の動物の細胞であってもよい。いくつかの態様において、真核細胞は、ヒトの細胞であってもよい。種々の型の細胞中の発現を推進する好適なプロモーターは当該技術分野において知られている。いくつかの態様において、プロモーターは、野生型であってもよい。他の態様において、プロモーターは、より効率的またはより効果的な発現のために修飾されていてもよい。もう1つの他の態様において、プロモーターは、トランケートされていてもよいが、依然としてその機能を保持する。例えば、プロモーターは、正常なサイズ、またはベクターのウイルス中への正しいパッケージングに好適な低減されたサイズを有していてもよい。 In some embodiments, the vectors used herein may encode a PE fusion protein or any of its components (e.g., napDNAbp, linker, or polymerase). In addition, the vectors used herein may encode a PE gRNA, and/or an accessory gRNA for nicking the second strand. The vector may be capable of driving expression of one or more coding sequences in a cell. In some embodiments, the cell may be a prokaryotic cell, e.g., a bacterial cell. In some embodiments, the cell may be a eukaryotic cell, e.g., a yeast, plant, insect, or mammalian cell. In some embodiments, the eukaryotic cell may be a mammalian cell. In some embodiments, the eukaryotic cell may be a rodent cell. In some embodiments, the eukaryotic cell may be a human cell. Suitable promoters for driving expression in various types of cells are known in the art. In some embodiments, the promoter may be wild type. In other embodiments, the promoter may be modified for more efficient or more effective expression. In another other embodiment, the promoter may be truncated but still retain its function. For example, the promoter may have a normal size or a reduced size suitable for correct packaging of the vector into a virus.

いくつかの態様において、プライム編集因子ベクターに使用されてもよいプロモーターは、構成的、誘導的、または組織特異的であってもよい。いくつかの態様において、プロモーターは、構成的プロモーターであってもよい。非限定的な例示の構成的プロモーターは、サイトメガロウイルス前初期プロモーター(CMV)、サルウイルス(SV40)プロモーター、アデノウイルス主要後期(MLP)プロモーター、ラウス肉腫ウイルス(RSV)プロモーター、マウス乳腺腫瘍ウイルス(MMTV)プロモーター、ホスホグリセリン酸キナーゼ(PGK)プロモーター、伸長(elongation)因子-アルファ(EFla)プロモーター、ユビキチンプロモーター、アクチンプロモーター、チューブリンプロモーター、免疫グロブリンプロモーター、それらの機能的フラグメント、または上記のいずれの組み合わせを包含する。いくつかの態様において、プロモーターは、CMVプロモーターであってもよい。いくつかの態様において、プロモーターは、トランケートされたCMVプロモーターであってもよい。他の態様において、プロモーターは、EFlaプロモーターであってもよい。いくつかの態様において、プロモーターは、誘導性プロモーターであってもよい。非限定的な例示の誘導性プロモーターは、熱ショック、光、化学物質、ペプチド、金属、ステロイド、抗生物質、またはアルコールによって誘導可能なものを包含する。いくつかの態様において、誘導性プロモーターは、基底(非誘導)発現レベルが低いもの、例として、Tet-On(登録商標)プロモーター(Clontech)などであってもよい。いくつかの態様において、プロモーターは、組織特異的プロモーターであってもよい。いくつかの態様において、組織特異的プロモーターは、専らまたは主として、肝臓組織に発現される。非限定的な例示の組織特異的プロモーターは、B29プロモーター、CD14プロモーター、CD43プロモーター、CD45プロモーター、CD68プロモーター、デスミンプロモーター、エラスターゼ-1プロモーター、エンドグリンプロモーター、フィブロネクチンプロモーター、Flt-1プロモーター、GFAPプロモーター、GPIIbプロモーター、ICAM-2プロモーター、INF-βプロモーター、Mbプロモーター、Nphslプロモーター、OG-2プロモーター、SP-Bプロモーター、SYN1プロモーター、およびWASPプロモーターを包含する。 In some embodiments, the promoters that may be used in the prime editor vector may be constitutive, inducible, or tissue-specific. In some embodiments, the promoter may be a constitutive promoter. Non-limiting exemplary constitutive promoters include cytomegalovirus immediate early promoter (CMV), simian virus (SV40) promoter, adenovirus major late (MLP) promoter, Rous sarcoma virus (RSV) promoter, mouse mammary tumor virus (MMTV) promoter, phosphoglycerate kinase (PGK) promoter, elongation factor-alpha (EFla) promoter, ubiquitin promoter, actin promoter, tubulin promoter, immunoglobulin promoter, functional fragments thereof, or any combination of the above. In some embodiments, the promoter may be a CMV promoter. In some embodiments, the promoter may be a truncated CMV promoter. In other embodiments, the promoter may be an EFla promoter. In some embodiments, the promoter may be an inducible promoter. Non-limiting exemplary inducible promoters include those that are inducible by heat shock, light, chemicals, peptides, metals, steroids, antibiotics, or alcohol. In some embodiments, the inducible promoter may be one that has a low basal (non-induced) expression level, such as, for example, the Tet-On® promoter (Clontech). In some embodiments, the promoter may be a tissue-specific promoter. In some embodiments, the tissue-specific promoter is expressed exclusively or primarily in liver tissue. Non-limiting exemplary tissue-specific promoters include B29 promoter, CD14 promoter, CD43 promoter, CD45 promoter, CD68 promoter, desmin promoter, elastase-1 promoter, endoglin promoter, fibronectin promoter, Flt-1 promoter, GFAP promoter, GPIIb promoter, ICAM-2 promoter, INF-β promoter, Mb promoter, Nphsl promoter, OG-2 promoter, SP-B promoter, SYN1 promoter, and WASP promoter.

いくつかの態様において、プライム編集因子ベクター(例として、プライム編集因子融合タンパク質および/またはPEgRNA、および/または第2鎖へニックを入れる付属gRNAをコードするいずれのベクターも包含する)は、標的細胞へ送達された後にしか発現を開始しない誘導性プロモーターを含んでいてもよい。非限定的な例示の誘導性プロモーターは、熱ショック、光、化学物質、ペプチド、金属、ステロイド、抗生物質、またはアルコールによって誘導可能なものを包含する。いくつかの態様において、誘導性プロモーターは、基底(非誘導)発現レベルが低いもの、例として、Tet-On(登録商標)プロモーター(Clontech)などであってもよい。 In some embodiments, the prime editor vector (including, by way of example, any vector encoding a prime editor fusion protein and/or a PE gRNA, and/or an accessory gRNA that nicks the second strand) may include an inducible promoter that begins expression only after delivery to a target cell. Non-limiting exemplary inducible promoters include those that are inducible by heat shock, light, chemicals, peptides, metals, steroids, antibiotics, or alcohol. In some embodiments, the inducible promoter may have a low basal (uninduced) expression level, such as, by way of example, the Tet-On® promoter (Clontech).

追加の態様において、プライム編集因子ベクター(例として、プライム編集因子融合タンパク質および/またはPEgRNA、および/または第2鎖へニックを入れる付属gRNAをコードするいずれのベクターも包含する)は、特定の組織へ送達された後にしか発現を開始しない組織特異的なプロモーターを含んでいてもよい。非限定的な例示の組織特異的プロモーターは、B29プロモーター、CD14プロモーター、CD43プロモーター、CD45プロモーター、CD68プロモーター、デスミンプロモーター、エラスターゼ-1プロモーター、エンドクリンプロモーター、フィブロネクチンプロモーター、Flt-1プロモーター、GFAPプロモーター、GPIIbプロモーター、ICAM-2プロモーター、INF-βプロモーター、Mbプロモーター、Nphslプロモーター、OG-2プロモーター、SP-Bプロモーター、SYN1プロモーター、およびWASPプロモーターを包含する。 In additional embodiments, the prime editor vector (including, by way of example, any vector encoding a prime editor fusion protein and/or a PE gRNA, and/or an accessory gRNA that nicks the second strand) may include a tissue-specific promoter that only begins expression after delivery to a particular tissue. Non-limiting exemplary tissue-specific promoters include B29 promoter, CD14 promoter, CD43 promoter, CD45 promoter, CD68 promoter, desmin promoter, elastase-1 promoter, endocrine promoter, fibronectin promoter, Flt-1 promoter, GFAP promoter, GPIIb promoter, ICAM-2 promoter, INF-β promoter, Mb promoter, Nphsl promoter, OG-2 promoter, SP-B promoter, SYN1 promoter, and WASP promoter.

いくつかの態様において、PEgRNA(またはプライム編集に関係して使用されるいずれのガイドRNA)をコードするヌクレオチド配列は、少なくとも1の転写または翻訳制御配列へ作動可能に連結されていてもよい。いくつかの態様において、ガイドRNAをコードするヌクレオチド配列は、少なくとも1のプロモーターへ作動可能に連結されていてもよい。いくつかの態様において、プロモーターは、RNAポリメラーゼ III(Pol III)によって認識されてもよい。Pol IIIプロモーターの非限定例は、U6、HI、およびtRNAプロモーターを包含する。いくつかの態様において、ガイドRNAをコードするヌクレオチド配列は、マウスまたはヒトU6プロモーターへ作動可能に連結されていてもよい。他の態様において、ガイドRNAをコードするヌクレオチド配列は、マウスまたはヒトHIプロモーターへ作動可能に連結されていてもよい。いくつかの態様において、ガイドRNAをコードするヌクレオチド配列は、マウスまたはヒトtRNAプロモーターへ作動可能に連結されていてもよい。1より多くのガイドRNAを用いる態様において、発現を推進するのに使用されるプロモーターは、同じであっても、または異なっていてもよい。いくつかの態様において、ガイドRNAのcrRNAをコードするヌクレオチド、およびガイドRNAのtracr RNAをコードするヌクレオチドは、同じベクター上に提供されていてもよい。いくつかの態様において、crRNAをコードするヌクレオチド、およびtracr RNAをコードするヌクレオチドは、同じプロモーターによって推進されてもよい。いくつかの態様において、crRNAおよびtracr RNAは、転写されて単一の転写産物になってもよい。例えば、crRNAおよびtracr RNAは、単一の転写産物からプロセシングされて二本鎖分子(double-molecule)ガイドRNAを形成してもよい。代替的に、crRNAおよびtracr RNAは、転写されて単一分子ガイドRNAになってもよい。 In some embodiments, the nucleotide sequence encoding the PEgRNA (or any guide RNA used in connection with prime editing) may be operably linked to at least one transcriptional or translational control sequence. In some embodiments, the nucleotide sequence encoding the guide RNA may be operably linked to at least one promoter. In some embodiments, the promoter may be recognized by RNA polymerase III (Pol III). Non-limiting examples of Pol III promoters include U6, HI, and tRNA promoters. In some embodiments, the nucleotide sequence encoding the guide RNA may be operably linked to a mouse or human U6 promoter. In other embodiments, the nucleotide sequence encoding the guide RNA may be operably linked to a mouse or human HI promoter. In some embodiments, the nucleotide sequence encoding the guide RNA may be operably linked to a mouse or human tRNA promoter. In embodiments using more than one guide RNA, the promoters used to drive expression may be the same or different. In some embodiments, the nucleotides encoding the crRNA of the guide RNA and the nucleotides encoding the tracr RNA of the guide RNA may be provided on the same vector. In some embodiments, the nucleotides encoding the crRNA and the nucleotides encoding the tracr RNA may be driven by the same promoter. In some embodiments, the crRNA and tracr RNA may be transcribed into a single transcript. For example, the crRNA and tracr RNA may be processed from a single transcript to form a double-molecule guide RNA. Alternatively, the crRNA and tracr RNA may be transcribed into a single-molecule guide RNA.

いくつかの態様において、ガイドRNAをコードするヌクレオチド配列は、PE融合タンパク質をコードするヌクレオチド配列を含む同じベクター上に位置付けられていてもよい。いくつかの態様において、ガイドRNAの発現およびPE融合タンパク質の発現は、それらの対応するプロモーターによって推進されてもよい。いくつかの態様において、ガイドRNAの発現は、PE融合タンパク質の発現を推進する同じプロモーターによって推進されてもよい。いくつかの態様において、ガイドRNAおよびPE融合タンパク質の転写産物は、単一の転写産物内に含有されていてもよい。例えば、ガイドRNAは、Cas9タンパク質転写産物の非翻訳領域(UTR)内にあってもよい。いくつかの態様において、ガイドRNAは、PE融合タンパク質転写産物の5'UTR内にあってもよい。他の態様において、ガイドRNAは、PE融合タンパク質転写産物の3'UTR内にあってもよい。いくつかの態様において、PE融合タンパク質転写産物の細胞内半減期は、ガイドRNAをその3'UTR内に含有することによって低減されることもあり、これによってその3'UTRの長さが短縮される。追加の態様において、ガイドRNAは、PE融合タンパク質転写産物のイントロン内にあってもよい。いくつかの態様において、好適なスプライシング部位は、ガイドRNAが転写産物から正しくスプライシングされるように、ガイドRNAが位置付けられるイントロンに付加されてもよい。いくつかの態様において、同じベクター上の極めて近いところにあるCas9タンパク質およびガイドRNAの発現は、CRISPR複合体のより効率的な形成を容易にさせることもある。 In some embodiments, the nucleotide sequence encoding the guide RNA may be located on the same vector that contains the nucleotide sequence encoding the PE fusion protein. In some embodiments, the expression of the guide RNA and the expression of the PE fusion protein may be driven by their corresponding promoters. In some embodiments, the expression of the guide RNA may be driven by the same promoter that drives the expression of the PE fusion protein. In some embodiments, the transcript of the guide RNA and the PE fusion protein may be contained within a single transcript. For example, the guide RNA may be within the untranslated region (UTR) of the Cas9 protein transcript. In some embodiments, the guide RNA may be within the 5'UTR of the PE fusion protein transcript. In other embodiments, the guide RNA may be within the 3'UTR of the PE fusion protein transcript. In some embodiments, the intracellular half-life of the PE fusion protein transcript may be reduced by containing the guide RNA within its 3'UTR, thereby shortening the length of the 3'UTR. In additional embodiments, the guide RNA may be within an intron of the PE fusion protein transcript. In some embodiments, a suitable splicing site may be added to the intron in which the guide RNA is located so that the guide RNA is correctly spliced from the transcript. In some embodiments, expression of the Cas9 protein and guide RNA in close proximity on the same vector may facilitate more efficient formation of CRISPR complexes.

プライム編集因子ベクター系は、1つのベクター、もしくは2つのベクター、もしくは3つのベクター、もしくは4つのベクター、もしくは5つのベクター、またはこれ以上を含んでいてもよい。いくつかの態様において、ベクター系は、PE融合タンパク質とPEgRNAとの両方をコードする1つの単一ベクターを含んでいてもよい。他の態様において、ベクター系は2つのベクターを含んでいてもよいが、ここで一方のベクターはPE融合タンパク質をコードし、他方がPEgRNAをコードする。追加の態様において、ベクター系は3つのベクターを含んでいてもよいが、ここで第3ベクターは、本明細書の方法に使用される、第2鎖へニックを入れるgRNAをコードする。 The prime editor vector system may include one vector, or two vectors, or three vectors, or four vectors, or five vectors, or more. In some embodiments, the vector system may include one single vector encoding both the PE fusion protein and the PE gRNA. In other embodiments, the vector system may include two vectors, where one vector encodes the PE fusion protein and the other encodes the PE gRNA. In additional embodiments, the vector system may include three vectors, where a third vector encodes a gRNA that nicks the second strand for use in the methods herein.

いくつかの態様において、rAAV粒子を含む組成物(本明細書に企図されるいずれの形態)はさらに、薬学的に許容し得る担体を含む。いくつかの態様において、組成物は、ヒトまたは動物の対象への投与に適切な医薬ビヒクル中で製剤化される。 In some embodiments, a composition comprising rAAV particles (in any form contemplated herein) further comprises a pharma- ceutically acceptable carrier. In some embodiments, the composition is formulated in a pharmaceutical vehicle suitable for administration to a human or animal subject.

薬学的に許容し得る担体として働き得る材料のいくつかの例は以下を包含する:(1)ラクトース、グルコース、およびスクロースなどの、糖;(2)コーンスターチおよびジャガイモデンプンなどの、デンプン;(3)ナトリウムカルボキシメチルセルロース、メチルセルロース、エチルセルロース、微結晶性セルロース、および酢酸セルロースなどの、セルロースおよびその誘導体;(4)粉末状トラガカント;(5)麦芽;(6)ゼラチン;(7)ステアリン酸マグネシウム、ラウリル硫酸ナトリウム、およびタルクなどの、平滑剤;(8)カカオバターおよび坐薬蝋などの、賦形剤;(9)落花生油、綿実油、紅花油、ゴマ 油、オリーブ油、トウモロコシ油、および大豆油などの、油;(10)プロピレングリコールなどの、グリコール;(11)グリセリン、ソルビトール、マンニトール、およびポリエチレングリコール(PEG)などの、ポリオール;(12)オレイン酸エチルおよびラウリン酸エチルなどの、エステル;(13)寒天;(14)水酸化マグネシウムおよび水酸化アルミニウムなどの、緩衝剤;(15)アルギン酸;(16)パイロジェンフリー水;(17)等浸透圧の生理食塩水;(18)リンガー溶液;(19)エチルアルコール;(20)pH緩衝溶液;(21)ポリエステル、ポリカーボネート、および/またはポリ酸無水物;(22)ポリペプチドおよびアミノ酸などの、増量剤;(23)血清アルブミン、HDL、およびLDLなどの、血清構成要素;(22)エタノールなどの、C2~C12アルコール;ならびに(23)医薬製剤に採用される、相溶性のある他の非毒性物質。湿潤剤、着色剤、離型剤、コーティング剤、甘味剤、香味剤、芳香剤、保存料、および抗酸化剤もまた、製剤中に存在し得る。「賦形剤」、「担体」、「薬学的に許容し得る担体」または同種のものなどの用語は本明細書中、互換的に使用される。 Some examples of materials that may serve as pharma- ceutically acceptable carriers include: (1) sugars, such as lactose, glucose, and sucrose; (2) starches, such as corn starch and potato starch; (3) cellulose and its derivatives, such as sodium carboxymethylcellulose, methylcellulose, ethylcellulose, microcrystalline cellulose, and cellulose acetate; (4) powdered tragacanth; (5) malt; (6) gelatin; (7) lubricants, such as magnesium stearate, sodium lauryl sulfate, and talc; (8) excipients, such as cocoa butter and suppository wax; (9) peanut oil, cottonseed oil, safflower oil, sesame oil, and other oils. (10) oils, such as olive oil, corn oil, and soybean oil; (11) polyols, such as glycerin, sorbitol, mannitol, and polyethylene glycol (PEG); (12) esters, such as ethyl oleate and ethyl laurate; (13) agar; (14) buffers, such as magnesium hydroxide and aluminum hydroxide; (15) alginic acid; (16) pyrogen-free water; (17) isotonic saline; (18) Ringer's solution; (19) ethyl alcohol; (20) pH buffer solutions; (21) polyesters, polycarbonates, and/or polyanhydrides; (22) bulking agents, such as polypeptides and amino acids; (23) serum components, such as serum albumin, HDL, and LDL; (22) C2-C12 alcohols, such as ethanol; and (23) other compatible non-toxic substances employed in pharmaceutical formulations. Wetting agents, coloring agents, release agents, coating agents, sweetening agents, flavoring agents, fragrances, preservatives, and antioxidants may also be present in the formulation. Terms such as "excipient," "carrier," "pharmaceutical acceptable carrier" or the like are used interchangeably herein.

送達方法
いくつかの側面において、本発明は、それらの1以上の転写産物、および/またはそれらから転写される1以上のタンパク質をコードする1以上のベクターなどの、本明細書に記載のとおりの1以上のポリヌクレオチドを宿主細胞へ送達することを含む方法を提供する。いくつかの側面において、本発明はさらに、かかる方法によって産生される細胞、およびかかる細胞を含むかまたはかかる細胞から産生される生物(動物、植物、もしくは真菌など)を提供する。いくつかの態様において、本明細書に記載のとおりの塩基編集因子は、ガイド配列と組み合わせて(任意にこれと複合化されて)、細胞へ送達される。
Delivery Methods In some aspects, the invention provides methods comprising delivering one or more polynucleotides as described herein, such as one or more vectors encoding one or more transcription products thereof, and/or one or more proteins transcribed therefrom, to a host cell. In some aspects, the invention further provides cells produced by such methods, and organisms (such as animals, plants, or fungi) comprising or produced from such cells. In some embodiments, base editors as described herein are delivered to a cell in combination with (optionally complexed with) a guide sequence.

例示の送達ストラテジーは、本明細書のどこかに記載されるが、ベクターベースのストラテジー、PEリボヌクレオタンパク質複合体の送達、およびmRNA方法によるPEの送達を包含する。 Exemplary delivery strategies are described elsewhere herein and include vector-based strategies, delivery of PE ribonucleoprotein complexes, and delivery of PE via mRNA methods.

いくつかの態様において、提供される送達方法は、ヌクレオフェクション、マイクロ注射、微粒子銃(biolistics)、ビロソーム、リポソーム、イムノリポソーム、ポリカチオンまたは脂質:核酸抱合体、裸のDNA、人工ビリオン、およびDNAの取り込みを増強する剤を包含する。 In some embodiments, delivery methods provided include nucleofection, microinjection, biolistics, virosomes, liposomes, immunoliposomes, polycation or lipid:nucleic acid conjugates, naked DNA, artificial virions, and agents that enhance DNA uptake.

例示の核酸送達方法は、リポフェクション、ヌクレオフェクション、エレクトロポレーション、安定したゲノム組み入れ(例として、piggybac)、マイクロ注射、微粒子銃(biolistics)、ビロソーム、リポソーム、イムノリポソーム、ポリカチオンまたは脂質:核酸抱合体、裸のDNA、人工ビリオン、およびDNAの取り込みを増強する剤を包含する。リポフェクションは、例として、米国特許第5,049,386号、第4,946,787号;および第4,897,355号)に記載されており、リポフェクション試薬は商業的に販売されている(例として、Transfectam(商標)、Lipofectin(商標)、およびSF細胞株4D-Nucleofector X Kit(商標)(Lonza))。ポリヌクレオチドの効率的な受容体認識リポフェクションに好適なカチオン性脂質および中性脂質は、Feigner、WO91/17424;WO91/16024の脂質を包含する。送達は、細胞(例として、in vitro投与もしくはex vivo投与)、または標的組織(例として、in vivo投与)に対するものであり得る。送達は、RNP複合体の使用を通して達成されてもよい。 Exemplary nucleic acid delivery methods include lipofection, nucleofection, electroporation, stable genomic integration (e.g., piggybac), microinjection, biolistics, virosomes, liposomes, immunoliposomes, polycation or lipid:nucleic acid conjugates, naked DNA, artificial virions, and agents that enhance DNA uptake. Lipofection is described, for example, in U.S. Pat. Nos. 5,049,386; 4,946,787; and 4,897,355, and lipofection reagents are commercially available (e.g., Transfectam™, Lipofectin™, and SF cell line 4D-Nucleofector X Kit™ (Lonza)). Cationic and neutral lipids suitable for efficient receptor-recognition lipofection of polynucleotides include those of Feigner, WO91/17424; WO91/16024. Delivery can be to a cell (e.g., in vitro or ex vivo administration) or to a target tissue (e.g., in vivo administration). Delivery may be achieved through the use of an RNP complex.

イムノ脂質複合体などの標的化リポソームを包含する脂質:核酸複合体の調製は、当業者に周知である(例として、Crystal,Science 270:404-410(1995);Blaese et al.,Cancer Gene Ther.2:291-297(1995);Behr et al.,Bioconjugate Chem.5:382-389(1994);Remy et al.,Bioconjugate Chem.5:647-654(1994);Gao et al.,Gene Therapy 2:710-722(1995);Ahmad et al.,Cancer Res.52:4817-4820(1992);米国特許第4,186,183号、第4,217,344号、第4,235,871号、第4,261,975号、第4,485,054号、第4,501,728号、第4,774,085号、第4,837,028号、および第4,946,787号を参照)。 The preparation of lipid:nucleic acid complexes, including targeted liposomes such as immunolipid complexes, is well known to those of skill in the art (see, e.g., Crystal, Science 270:404-410 (1995); Blaese et al., Cancer Gene Ther. 2:291-297 (1995); Behr et al., Bioconjugate Chem. 5:382-389 (1994); Remy et al., Bioconjugate Chem. 5:647-654 (1994); Gao et al., Gene Therapy 2:710-722 (1995); Ahmad et al., Cancer Res. 52:4817-4820 (1992); see U.S. Patent Nos. 4,186,183, 4,217,344, 4,235,871, 4,261,975, 4,485,054, 4,501,728, 4,774,085, 4,837,028, and 4,946,787).

他の態様において、本明細書に提供される送達方法およびベクターは、RNP複合体である。融合タンパク質のRNP送達は、塩基編集のDNA特異性を著しく増大させる。融合タンパク質のRNP送達は、オン-およびオフ-ターゲットDNA編集の分断(decoupling)へ繋がる。RNP送達は、プラスミド送達に匹敵するオン-ターゲット編集を維持しながら、非反復部位にてオフターゲット編集を小さくし(ablates)、高度に反復したVEGFA部位2でさえもオフ-ターゲットDNA編集を大いに低減させる。Rees,H.A.et al.,Improving the DNA specificity and applicability of base editing through protein engineering and protein delivery,Nat.Commun.8,15790(2017)、2016年12月27日に発行された米国特許第9,526,784号、および2017年8月22日に発行された米国特許第9,737,604号を参照(これらの各々は参照により本明細書に組み込まれる)。 In other embodiments, the delivery methods and vectors provided herein are RNP complexes. RNP delivery of fusion proteins significantly increases DNA specificity of base editing. RNP delivery of fusion proteins leads to decoupling of on- and off-target DNA editing. RNP delivery ablates off-target editing at non-repetitive sites while maintaining on-target editing comparable to plasmid delivery, greatly reducing off-target DNA editing even at the highly repetitive VEGFA site 2. See Rees, H.A. et al., Improving the DNA specificity and applicability of base editing through protein engineering and protein delivery, Nat.Commun.8,15790(2017); U.S. Patent No. 9,526,784 issued December 27, 2016; and U.S. Patent No. 9,737,604 issued August 22, 2017, each of which is incorporated herein by reference.

細胞への核酸送達のための追加の方法は当業者に知られている。例えば、US 2003/0087817を参照(参照により本明細書に組み込まれる)。 Additional methods for nucleic acid delivery to cells are known to those of skill in the art. See, e.g., US 2003/0087817, incorporated herein by reference.

他の本開示の側面は、プライム編集因子構築物を細胞中へ送達して、完全かつ機能的なプライム編集因子を細胞内に形成する方法を提供する。例えば、いくつかの態様において、細胞は、本明細書に記載の組成物(例として、分裂Cas9もしくは分裂プライム編集因子をコードするヌクレオチド配列、またはかかるヌクレオチド配列を含む核酸ベクターを含有するAAV粒子を含む組成物)と接触させられる。いくつかの態様において、接触させることは、かかるヌクレオチド配列の細胞中への送達をもたらすが、ここでCas9タンパク質またはプライム編集因子のN末端部分、およびCas9タンパク質またはプライム編集因子のC末端部分は、細胞中で発現され結び合わされて、完全なCas9タンパク質または完全なプライム編集因子を形成する。 Other aspects of the disclosure provide methods of delivering a prime editor construct into a cell to form a complete and functional prime editor within the cell. For example, in some embodiments, a cell is contacted with a composition described herein (e.g., a composition comprising an AAV particle containing a nucleotide sequence encoding a split-Cas9 or split-prime editor, or a nucleic acid vector comprising such a nucleotide sequence). In some embodiments, the contacting results in delivery of such a nucleotide sequence into the cell, where an N-terminal portion of the Cas9 protein or prime editor and a C-terminal portion of the Cas9 protein or prime editor are expressed and associated in the cell to form a complete Cas9 protein or complete prime editor.

本明細書に提供されるいずれのrAAV粒子、核酸分子、または組成物も、安定的または一過的のいずれかのいずれか好適なやり方で、細胞中へ導入されてもよいことは解されるはずである。いくつかの態様において、開示されたタンパク質は、細胞中へトランスフェクトされてもよい。いくつかの態様において、細胞は、核酸分子で形質導入またはトランスフェクトされてもよい。例えば、細胞は、分裂タンパク質をコードする核酸分子、もしくは1以上の核酸分子をコードするウイルスのゲノムを含有するrAAV粒子で、形質導入されても(例として、分裂タンパク質をコードするウイルスで)、またはトランスフェクトされてもよい(例として、分裂タンパク質をコードするプラスミドで)。かかる形質導入は、安定的な形質導入または一過的な形質導入であってもよい。いくつかの態様において、分裂タンパク質を発現するかまたは分裂タンパク質を含有する細胞は、例えば、分裂Cas9(例として、nCas9)タンパク質の送達において、1以上のガイドRNA配列で形質導入またはトランスフェクトされてもよい。いくつかの態様において、分裂タンパク質を発現するプラスミドは、電気穿孔法、一過的な(例として、リポフェクション)および安定したゲノム取り入れ(例として、piggybac)、およびウイルスの形質導入または当業者に知られている他の方法を通して、細胞中へ導入されてもよい。 It should be understood that any rAAV particle, nucleic acid molecule, or composition provided herein may be introduced into a cell in any suitable manner, either stably or transiently. In some embodiments, the disclosed proteins may be transfected into a cell. In some embodiments, a cell may be transduced or transfected with a nucleic acid molecule. For example, a cell may be transduced (e.g., with a virus encoding a split protein) or transfected (e.g., with a plasmid encoding a split protein) with a rAAV particle containing a nucleic acid molecule encoding a split protein, or a genome of a virus encoding one or more nucleic acid molecules. Such transduction may be stable or transient. In some embodiments, a cell expressing or containing a split protein may be transduced or transfected with one or more guide RNA sequences, for example, in the delivery of a split Cas9 (e.g., nCas9) protein. In some embodiments, plasmids expressing the disruption proteins may be introduced into cells through electroporation, transient (e.g., lipofection) and stable genomic integration (e.g., piggybac), and viral transduction or other methods known to those of skill in the art.

ある態様において、本明細書に提供される組成物は、脂質および/またはポリマーを含む。ある態様において、脂質および/またはポリマーはカチオン性である。かかる脂質粒子の調製は周知である。例として、米国特許第4,880,635号;第4,906,477号;第4,911,928号;第4,917,951号;第4,920,016号;第4,921,757号;および第9,737,604号を参照(これらの各々は参照により本明細書に組み込まれる)。 In some embodiments, the compositions provided herein include lipids and/or polymers. In some embodiments, the lipids and/or polymers are cationic. The preparation of such lipid particles is well known. See, e.g., U.S. Patent Nos. 4,880,635; 4,906,477; 4,911,928; 4,917,951; 4,920,016; 4,921,757; and 9,737,604, each of which is incorporated herein by reference.

ガイドRNA配列は長さが15~100ヌクレオチドであってもよく、標的ヌクレオチド配列に相補的な少なくとも10、少なくとも15、または少なくとも20の連続したヌクレオチドの配列を含む。ガイドRNAは、標的ヌクレオチド配列に相補的な15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、または40の連続したヌクレオチドの配列を含んでいてもよい。ガイドRNAは、長さが15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、または50ヌクレオチドであってもよい。 The guide RNA sequence may be 15-100 nucleotides in length and comprises a sequence of at least 10, at least 15, or at least 20 contiguous nucleotides complementary to the target nucleotide sequence. The guide RNA may comprise a sequence of 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, or 40 contiguous nucleotides complementary to the target nucleotide sequence. The guide RNA may be 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, or 50 nucleotides in length.

いくつかの態様において、標的ヌクレオチド配列は、ゲノム(例として、真核生物のゲノム)中のDNA配列である。ある態様において、標的ヌクレオチド配列は、哺乳類の動物(例として、ヒト)ゲノム中にある。 In some embodiments, the target nucleotide sequence is a DNA sequence in a genome (e.g., a eukaryotic genome). In some embodiments, the target nucleotide sequence is in a mammalian (e.g., human) genome.

本開示の組成物は、例えば、単位用量として投与またはパッケージされてもよい。用語「単位用量」は、本開示の医薬組成物に関して使用されるとき、まとまった投薬量として対象に好適な、物理的に不連続な単位を指し、予め決められた分量の活性材料を含有する各単位は、要求される希釈剤;すなわち、担体またはビヒクルを伴って所望の治療効果を産生するよう算出される。 The compositions of the present disclosure may be administered or packaged, for example, as unit doses. The term "unit dose" as used in reference to pharmaceutical compositions of the present disclosure refers to physically discrete units suitable for subject administration as a discrete dosage, each unit containing a predetermined quantity of active material calculated to produce the desired therapeutic effect together with the required diluent; i.e., carrier or vehicle.

疾患または障害の処置は、疾患の発症もしくは進行を遅延させるか、または疾患の重症度を低減させることを包含する。疾患を処置することは、根治した(curative)結果を必ずしも要さない。 Treating a disease or disorder includes delaying the onset or progression of the disease or reducing the severity of the disease. Treating a disease does not necessarily require a curative outcome.

そこで使用されたとおり、疾患の発症を「遅延すること」は、疾患の進行を、先送りする(defer)、妨げる(hinder)、遅らせる(slow)、妨害する(retard)、留める(stabilize)、および/または延ばす(postpone)ことを意味する。この遅延は、病歴および/または処置される個体に応じて、時間の長さを変動させることでもあり得る。疾患の発症を「遅延」もしくは緩和する方法、または疾患の発病を遅延する方法は、この方法を使用しない場合と比較して、所定の時間枠での疾患の1以上の症状を発症する確率を低減するか、および/または所定の時間枠での症状の程度を低減する方法である。かかる比較は、典型的には、統計的に有意な結果を与えるのに充分数多の対象を使用する臨床研究に基づく。 As used therein, "delaying" the onset of a disease means to defer, hinder, slow, retard, stabilize, and/or postpone the progression of a disease. The delay may be of varying lengths of time, depending on the history of the disease and/or the individual being treated. A method of "delaying" or mitigating the onset of a disease, or a method of delaying the onset of a disease, is a method that reduces the probability of developing one or more symptoms of a disease in a given time frame and/or reduces the severity of symptoms in a given time frame, compared to not using the method. Such comparisons are typically based on clinical studies using a sufficient number of subjects to provide statistically significant results.

疾患の「発症」または「進行」は、最初の兆候および/またはその後の疾患の進行を意味する。疾患の発症は、当該技術分野において周知のとおりの標準の臨床技法を使用し検出可能であり、かつ査定され得る。しかしながら、発症はまた、検出不能なこともある進行も指す。本開示の目的上、発症または進行は、症状の生物学的な経過を指す。「発症」は、発生、再発、および発病を包含する。 "Onset" or "progression" of a disease refers to the first symptoms and/or subsequent progression of the disease. Onset of a disease can be detected and assessed using standard clinical techniques as known in the art. However, onset also refers to progression, which may be undetectable. For purposes of this disclosure, onset or progression refers to the biological course of a condition. "Onset" encompasses occurrence, recurrence, and onset.

本明細書に使用されるとき、疾患の「発病」または「発生」は、最初の発病および/または再発を包含する。医学の当業者に知られている従来の方法は、処置されるべき疾患の型または疾患の部位に応じて、単離されたポリペプチドまたは医薬組成物を対象へ投与するのに使用され得る。 As used herein, "onset" or "occurrence" of a disease includes initial onset and/or recurrence. Conventional methods known to those skilled in the art of medicine can be used to administer the isolated polypeptide or pharmaceutical composition to a subject, depending on the type of disease or site of disease to be treated.

さらなる詳細化はしないが、当業者は、上の記載に基づき、本開示を最大限に利用し得るものと思われる。したがって、以下の特定の態様は、単なる説明として解釈されるべきであって、いずれにしても本開示の残りを何ら限定するものではない。本明細書に引用されるすべての刊行物は、本明細書に言及される目的または主題のため、参照により組み込まれる。 Without going into further detail, it is believed that one skilled in the art can utilize the present disclosure to its fullest extent based on the above description. The following specific aspects are therefore to be construed as merely illustrative, and not limitative of the remainder of the disclosure in any way whatsoever. All publications cited herein are incorporated by reference for the purposes or subject matter discussed herein.


例1.ゲノム中に正確なヌクレオチド変化を組み入れるためのプライム編集(PE)
目的は、正確なゲノム編集の変革技術を開発すること、および哺乳動物ゲノム中の単一ヌクレオチドの変化の組み入れを生成することである。この技術は、研究者らに、事実上いずれの哺乳動物遺伝子においても、単一ヌクレオチドのバリエーションの効果を研究できるようにさせ、ヒト患者における病原性の点突然変異を修正するための治療的介入を潜在的に可能にさせるであろう。
example
Example 1. Prime editing (PE) to incorporate precise nucleotide changes into a genome
The goal is to develop a precise genome editing transformation technique and generate the incorporation of single nucleotide changes in mammalian genomes. This technique will allow researchers to study the effects of single nucleotide variations in virtually any mammalian gene, potentially enabling therapeutic intervention to correct pathogenic point mutations in human patients.

ゲノム編集のための、クラスター化して規則的な配置の短い回文配列反復(CRISPR)系の採用は、生命科学に革命をもたらした1~3。CRISPRを使用する遺伝子の断絶は今やルーチンとなっているが、単一ヌクレオチドの編集の正確な組み入れは、疾患が原因の多数の突然変異を研究または修正するのに必要であるにも関わらず、大きな課題のままである。相同組み換え修復(HDR)は、かかる編集を達成させることは可能ではあるが、低い効率(しばしば<5%)、ドナーDNA修復鋳型のための要件、および二本鎖DNA破壊(DSB)形成の有害効果に悩まされている。近年、Liu実験室が塩基編集を開発したが、これによってDSBのない効率的な単一ヌクレオチドの編集が達成される。塩基編集因子(BE)は、CRISPR系を塩基修飾デアミナーゼ酵素と組み合わせて、標的C・GまたはA・T塩基対を夫々A・TまたはG・Cへ変換する4~6。研究者らによって既に幅広く世界的に使用されているが(Addgeneによって流通された>5,000 Liu実験室のBE構築物)、最新のBEは12塩基対の起こり得る変換のうちたった4つしかできず、小さい挿入または欠失を修正することはできない。その上、塩基編集の標的範囲は、標的塩基に隣接する非標的CまたはA塩基の編集(「バイスタンダー(bystander)編集」)によって、およびPAM配列が標的塩基から15±2bpに存在するという要件によって限定されている。したがって、これらの欠点を克服することは、ゲノム編集の基礎研究および治療用途を大幅に広げるであろう。 The adoption of the clustered regularly interspaced short palindromic repeats (CRISPR) system for genome editing has revolutionized the life sciences. 1 - 3 Although gene disruption using CRISPR is now routine, precise incorporation of single-nucleotide edits remains a major challenge, despite being necessary to study or correct a large number of disease-causing mutations. Homologous directed repair (HDR) can achieve such edits but suffers from low efficiency (often <5%), the requirement for a donor DNA repair template, and the deleterious effects of double-stranded DNA break (DSB) formation. Recently, the Liu laboratory developed base editing, which achieves efficient single-nucleotide editing without DSBs. Base editors (BEs) combine the CRISPR system with base-modifying deaminase enzymes to convert targeted C·G or A·T base pairs to A·T or G·C, respectively. 4 - 6 Although already widely used by researchers worldwide (>5,000 Liu lab BE constructs distributed by Addgene), the latest BEs can only modify 4 of 12 possible base pair conversions and cannot correct small insertions or deletions. Moreover, the target scope of base editing is limited by the editing of non-targeted C or A bases adjacent to the target base ("bystander editing") and by the requirement that the PAM sequence be present 15±2bp from the target base. Thus, overcoming these shortcomings would greatly broaden the basic research and therapeutic applications of genome editing.

ここで、塩基編集の利益の多く-つまり、二本鎖破壊の回避およびドナーDNA修復鋳型-を、その大きな欠点を克服しつつ与える、新しい高精度編集アプローチを開発することが提案される。この意欲的な目標を達成するため、標的にプライムされた逆転写(TPRT)を使用して、標的ゲノムの部位にて編集済DNA鎖を直接組み入れることを目的とする。本明細書に考察されるデザインにおいて、CRISPRガイドRNA(gRNA)は、結び付けられた逆転写酵素(RT)鋳型配列によって実行される、変異誘発DNA鎖合成をコードする鋳型を持つよう改変されるであろう。CRISPRヌクレアーゼ(Cas9)によってニックが入れられた標的部位DNAは、修飾gRNA上の鋳型配列の逆転写のためのプライマーとして働き、いずれの所望のヌクレオチド編集の直接的な組み込みを可能にするであろう。 Here, we propose to develop a new precision editing approach that offers many of the benefits of base editing – namely, avoidance of double-strand breaks and donor DNA repair template – while overcoming its major drawbacks. To achieve this ambitious goal, we aim to directly incorporate an edited DNA strand at a site in the target genome using target-primed reverse transcription (TPRT). In the design considered here, a CRISPR guide RNA (gRNA) will be modified to carry a template encoding mutagenic DNA strand synthesis, which is carried out by an attached reverse transcriptase (RT) template sequence. The target site DNA nicked by the CRISPR nuclease (Cas9) will act as a primer for reverse transcription of the template sequence on the modified gRNA, allowing direct incorporation of any desired nucleotide edits.

セクション1
変異誘発DNA鎖の、ガイドRNAを鋳型にした逆転写を確立する。先行研究によって、DNA切断の後であって複合体解離の前に、Cas9が非標的DNA鎖を放出して遊離の3'末端を晒すことが示された。このDNA鎖が、ポリメラーゼ酵素による伸長へアクセス可能であって、gRNAが、それらの5'末端または3'末端の伸長を通してDNA合成の鋳型として働くよう改変され得るものと仮定する。in vitroでの予備研究において、Cas9:gRNA結合複合体内のニックが入ったDNA鎖が、結合したgRNAを鋳型として使用する逆転写(transのRT酵素)を実際にプライムし得ることが確立された。次に、種々のgRNAリンカー、プライマー結合部位、および合成鋳型を、in vitroでの最適なデザイン規則を決定するために詳しく研究する。次いで、transで作用するかまたはCas9との融合体として作用する種々のRT酵素をin vitroで評価する。最終的に、細胞中の効率的な結合および切断活性を保持する改変gRNAデザインを同定する。これを目的とした実証実験の成功によって、細胞中の変異誘発鎖合成を遂行するための基盤が提供される。
Section 1
Guide RNA-templated reverse transcription of the mutagenized DNA strand is established. Previous studies have shown that after DNA cleavage but before complex dissociation, Cas9 releases the non-targeted DNA strand to expose a free 3' end. We hypothesize that this DNA strand is accessible to extension by a polymerase enzyme and that gRNAs can be modified to serve as templates for DNA synthesis through extension of their 5' or 3' ends. Preliminary in vitro studies have established that the nicked DNA strand in the Cas9:gRNA-bound complex can indeed prime reverse transcription (RT enzyme in trans) using the bound gRNA as a template. Next, different gRNA linkers, primer binding sites, and synthesis templates are studied in detail to determine optimal design rules in vitro. Different RT enzymes acting in trans or as fusions with Cas9 are then evaluated in vitro. Finally, modified gRNA designs that retain efficient binding and cleavage activity in cells are identified. Successful demonstration experiments to this end will provide the basis for accomplishing mutagenized strand synthesis in cells.

セクション2
ヒト細胞中のプライム編集を確立する。DNAプロセシングおよび修復機序に基づき、変異誘発DNA鎖(単鎖フラップ)は、標的ヌクレオチドの特異的かつ効率的な編集に向かうのに使用し得るものと仮定する。有望な予備研究において、このストラテジーの実現性を、変異誘発フラップを含有するモデルプラスミド基質での編集を実証することによって確立した。目的1と同時に、修復成果を、変異誘発フラップの長さ、配列組成、標的ヌクレオチドの同一性、および3'末端を系統的に変動させることによってさらに評価する。1~3ヌクレオチドの小さい挿入および欠失もまた試験する。目的1と並行して目的1から組み立て、融合タンパク質および非共有結合動員ストラテジーを包含するCas9-RT構造を評価する。Cas9-RT構造および伸長されたgRNAを、ヒトゲノム中の複数の標的部位での細胞の編集についてアッセイし、次いで高効率のために最適化する。成功した場合、この目的によって、基礎科学への適用のためのTPRTゲノム編集(すなわち、プライム編集)が即時に確立される。
Section 2
Establishing prime editing in human cells. Based on DNA processing and repair mechanisms, we hypothesize that the mutagenized DNA strand (single-stranded flap) can be used to direct specific and efficient editing of targeted nucleotides. In promising preliminary studies, the feasibility of this strategy was established by demonstrating editing in a model plasmid substrate containing the mutagenized flap. Concurrent with objective 1, repair outcomes are further evaluated by systematically varying the length, sequence composition, identity of the targeted nucleotide, and 3' end of the mutagenized flap. Small insertions and deletions of 1-3 nucleotides are also tested. Assembled from objective 1 in parallel with objective 1, Cas9-RT structures encompassing fusion proteins and non-covalent mobilization strategies are evaluated. Cas9-RT structures and extended gRNAs are assayed for cellular editing at multiple target sites in the human genome and then optimized for high efficiency. If successful, this objective will immediately establish TPRT genome editing (i.e., prime editing) for basic science applications.

セクション3
培養ヒト細胞中の病原性の突然変異の部位特異的編集を達成する。この技術の潜在的な普遍性は、目下BEによっては修正不能なトランスバージョン突然変異およびインデルの編集を可能にし得る。目的1および目的2の結果によって導かれて、鎌状赤血球病の創始者突然変異をベータグロビン中に(修正にはA・T→T・Aトランスバージョンを要する)および最も蔓延しているウィルソン病の突然変異をATP7B中に(修正にはG・C→T・Aトランスバージョンを要する)包含する培養ヒト細胞中の病原性のトランスバージョン突然変異を標的にする。嚢胞性線維症を引き起こすCFTR中の3ヌクレオチド△F508欠失を包含する、小さい挿入および欠失の突然変異の修正もまた調べる。成功した場合、これは、これらの重要なヒト疾患に対処する強力な治療的アプローチを開発するための基盤を据える。
Section 3
Achieve site-specific editing of pathogenic mutations in cultured human cells. The potential universality of this technology may enable editing of transversion mutations and indels currently uncorrectable by BE. Guided by the results of Aim 1 and Aim 2, we target pathogenic transversion mutations in cultured human cells, including the founder mutation of sickle cell disease in beta globin (requiring an A-T → T-A transversion for correction) and the most prevalent Wilson disease mutation in ATP7B (requiring a G-C → T-A transversion for correction). We also examine the correction of small insertion and deletion mutations, including the three-nucleotide ΔF508 deletion in CFTR that causes cystic fibrosis. If successful, this will lay the foundation for developing powerful therapeutic approaches to address these important human diseases.

アプローチ
目標は、標的にされたゲノム部位にて点突然変異を直接組み入れるゲノム編集ストラテジーを開発することである。技術開発段階において、CRISPR/Cas系中へTPRT機能性を組み込む努力が、タンパク質およびRNA工学に注がれる。TPRTの各ステップの機能を慎重に探り、基礎から組み立てるのにIn vitroアッセイを使用する(目的1)。第2集中領域は、モデル基質と改変CRISPR/Cas系との組み合わせを使用して哺乳動物の細胞中の編集成果を評価する(目的2)。最終的に、適用段階は、他の方法によるゲノム編集では解決困難な突然変異を修正する技術を使用する(目的3)。
The approach goal is to develop genome editing strategies that directly incorporate point mutations at targeted genomic sites. During the technology development phase, efforts to incorporate TPRT functionality into the CRISPR/Cas system will focus on protein and RNA engineering. In vitro assays will be used to carefully explore the function of each step of TPRT and build it from the ground up (Aim 1). A second area of focus will be to evaluate the editing outcomes in mammalian cells using a combination of model substrates and the engineered CRISPR/Cas system (Aim 2). Finally, the application phase will use the technology to correct mutations that are difficult to resolve using other methods of genome editing (Aim 3).

一般的な編集デザインを図1A~1Bに示す。Cas9ニッカーゼは、PAM含有鎖(非標的鎖)へのDNA切断を制限する、HNHヌクレアーゼドメインに対する不活性化突然変異(Spy Cas9 H840AまたはN863A)を含有する。ガイドRNA(gRNA)を、逆転写のための鋳型を含有するよう改変する(デザインはスライド5上に詳細化)。示されるのはgRNAの5'伸長であるが、3'伸長でも実践できる。Cas9ニッカーゼを、C末端またはN末端のいずれかを通して、逆転写酵素(RT)酵素と融合させる。gRNA:Cas9-RT複合体は、着目するDNA領域を標的にし、非標的鎖に取って代わった後にRループを形成する。Cas9は非標的DNA鎖へニックを入れる。ニックが入った鎖の放出によって遊離の3'-OH末端が晒されるが、前記末端は、伸長されたgRNAを鋳型として使用する逆転写のプライム能がある。このDNA合成反応は、融合されたRT酵素によって遂行される。gRNA鋳型は、編集が標的にするヌクレオチドを除いて、元のDNA二重鎖と相同のDNA配列をコードする。逆転写産物は、所望の編集をコードする単鎖DNAフラップである。遊離の3'末端を含有するこのフラップは、隣接するDNA鎖と平衡化でき、5'フラップ種がもたらされる。後者の種は、FEN1(フラップエンドヌクレアーゼ1)の効率的な基質として働くものと仮定されており、前記酵素は、ラギング鎖DNA合成の最中に岡崎フラグメントから5'フラップを天然に切除し、長いパッチ(long-patch)の塩基切除修復の最中に生じる鎖置き換え合成の後に5'フラップを除去する。ニックが入ったDNAのライゲーションは、ミスマッチした塩基対を産生する。この中間体は、ミスマッチ修復(MMR)プロセスを介して、元の塩基対への復元または所望される編集済塩基対への変換のいずれかを経ることができる。代替的に、半保存的DNA複製によって、復元と編集との各1コピーが生み出され得る。 A general editing design is shown in Figure 1A-1B. The Cas9 nickase contains an inactivating mutation to the HNH nuclease domain (Spy Cas9 H840A or N863A) that restricts DNA cleavage to the PAM-containing strand (non-target strand). The guide RNA (gRNA) is modified to contain a template for reverse transcription (design detailed on slide 5). Shown is a 5' extension of the gRNA, but a 3' extension can also be performed. The Cas9 nickase is fused to a reverse transcriptase (RT) enzyme through either the C-terminus or N-terminus. The gRNA:Cas9-RT complex targets the DNA region of interest and forms an R-loop after displacing the non-target strand. Cas9 nicks the non-target DNA strand. Release of the nicked strand exposes a free 3'-OH end that can prime reverse transcription using the extended gRNA as a template. This DNA synthesis reaction is accomplished by the fused RT enzyme. The gRNA template encodes a DNA sequence that is homologous to the original DNA duplex, except for the nucleotides targeted by the edit. The product of reverse transcription is a single-stranded DNA flap that encodes the desired edit. This flap, which contains a free 3' end, can equilibrate with the adjacent DNA strand, resulting in a 5' flap species. The latter species is hypothesized to serve as an efficient substrate for FEN1 (flap endonuclease 1), an enzyme that naturally excises the 5' flap from Okazaki fragments during lagging strand DNA synthesis and removes the 5' flap after strand displacement synthesis that occurs during long-patch base excision repair. Ligation of the nicked DNA produces a mismatched base pair. This intermediate can undergo either restoration to the original base pair or conversion to the desired edited base pair via the mismatch repair (MMR) process. Alternatively, one copy each of restoration and edit can be generated by semi-conservative DNA replication.

1.変異誘発DNA鎖の、ガイドRNAを鋳型にした逆転写を確立する。
背景および論拠
提案されたゲノム編集ストラテジーにおいて、Cas9によってニックが入れられた非標的DNA鎖(Rループを形成するPAM含有鎖)は、DNA合成のためのプライマーとして作用する。これは生化学的データおよび構造のデータの数種の実例(pieces)に基づき起こり得るものと仮定される。ヌクレアーゼ保護実験32、結晶学的研究33、および塩基編集窓4,24は、Cas9結合複合体の所謂Rループ内の非標的鎖ヌクレオチド-20~-10について、柔軟性および障害のかなりの程度を実証した(ナンバリングは第1PAMヌクレオチドの5'からの距離を示す)。その上、相補的なssDNAが加えられたとき、切断された非標的鎖のPAM遠位部分は、緊密に結合した3元複合体から外され得る20。これらの研究によって、非標的鎖が高度に柔軟であって酵素へのアクセスが可能であること、およびニックが入った後にPAM遠位フラグメントの3'末端がCas9解離に先立ち放出されることが支持される。さらにまた、gRNAが、鋳型DNA合成まで伸長され得るものと仮定される。先行研究によって、SpCas9、SaCas9、およびLbCas12a(かつてはCpf1)のためのgRNAが、RNAアプタマー34、リガンド誘導性自己切断型リボザイム35、および長鎖ノンコーディングRNA36でのgRNA伸長を許容することが示された。生かされる2つの主要な特色に対し、この文献によって前例が確立される。このストラテジーの査定において、数種のCRISPR-Cas系を、in vitroでのアッセイと細胞アッセイとの組み合わせを使用し5'および3'伸長されたgRNAデザインと併せて評価する(図2A~2C)。
1. Establish guide RNA-templated reverse transcription of the mutagenized DNA strand.
Background and Rationale In the proposed genome editing strategy, the non-targeted DNA strand nicked by Cas9 (the PAM-containing strand forming the R-loop) acts as a primer for DNA synthesis. This is hypothesized to occur based on several pieces of biochemical and structural data. Nuclease protection experiments32 , crystallographic studies33 , and base editing windows4,24 have demonstrated a significant degree of flexibility and disorder for non-targeted strand nucleotides -20 to -10 within the so-called R-loop of the Cas9-bound complex (numbering indicates distance from the 5' of the first PAM nucleotide). Moreover, when complementary ssDNA is added, the PAM-distal portion of the cleaved non-targeted strand can be displaced from the tightly bound ternary complex20 . These studies support that the non-targeted strand is highly flexible and accessible to the enzyme and that the 3' end of the PAM-distal fragment is released prior to Cas9 dissociation after nicking. Furthermore, it is hypothesized that the gRNA can be extended to template DNA synthesis. Previous studies have shown that gRNAs for SpCas9, SaCas9, and LbCas12a (formerly Cpf1) tolerate gRNA extension with RNA aptamers34 , ligand-induced self-cleaving ribozymes35 , and long noncoding RNAs.36 This literature establishes precedent for two key features to be exploited. In assessing this strategy, several CRISPR-Cas systems will be evaluated in conjunction with 5'- and 3'-extended gRNA designs using a combination of in vitro and cellular assays (Figures 2A-2C).

TRT編集のための改変gRNAのためのデザインを図3A~3Bに示す。DNA合成は5'→3'に進み、よってRNA鋳型を3'→5'方向にコピーする。5'伸長のためのデザインは、リンカー領域、ニックが入ったDNA鎖がアニールするプライマー結合部位、および逆転写によるDNA合成のための鋳型を含有する。3'伸長されたgRNAは、プライマー結合部位および逆転写鋳型を含有する。in vitroでの実験によって、逆転写が、3'伸長されたgRNA構築物のgRNAコア中へ、~3ヌクレオチド伸長することが示されたところ、いくつかのケースにおいて、gRNAコアの3'RNAヘアピンをDNA標的配列とマッチするよう修飾する(ヘアピンRNA構造の維持を代償する変化がなされる限り、ヘアピン配列の修飾には十分耐性があるように見える)。DNA合成は、ヌクレオチドが成長するDNA鎖の3'OHへ付加されながら5'→3'に進む。 The designs for modified gRNAs for TRT editing are shown in Figures 3A-3B. DNA synthesis proceeds 5'→3', thus copying the RNA template in the 3'→5' direction. The design for 5' extension contains a linker region, a primer binding site to which the nicked DNA strand anneals, and a template for DNA synthesis by reverse transcription. The 3' extended gRNA contains a primer binding site and a reverse transcription template. In vitro experiments have shown that reverse transcription extends 3 nucleotides into the gRNA core of the 3' extended gRNA construct, and in some cases the 3' RNA hairpin of the gRNA core is modified to match the DNA target sequence (modification of the hairpin sequence appears to be well tolerated as long as changes are made that compensate for maintaining the hairpin RNA structure). DNA synthesis proceeds 5'→3' with nucleotides being added to the 3' OH of the growing DNA strand.

予備実験結果
Cas9によってニックが入れられたDNAは、gRNA鋳型の逆転写をプライムする。ニックが入れられた非標的DNA鎖へのアクセス可能性を評価するため、in vitroでの生化学的アッセイを、S.pyogenes(SpCas9)からのCas9ヌクレアーゼおよびCy5蛍光標識二重鎖DNA基質(51塩基対)を使用して実施した。第1に、合成鋳型の長さが変動する一連の5'伸長含有gRNAを、in vitroでの転写によって調製した(全体的なデザインは図2Bに示される)。ヌクレアーゼ不活性型Cas9(dCas9)を用いた電気泳動移動度シフトアッセイ(EMSA)によって、5'伸長されたgRNAが標的への結合親和性を維持することが確立された(データは示さず)。次に、TPRT活性を、dCas9、5'伸長されたgRNA、およびモロニー-マウス白血病ウイルス(M-MLV)逆転写酵素(Superscript III)を使用して、予めニックが入れられたCy5標識二重鎖DNA基質に対し試験した。37℃での1時間のインキュベーション後、産物を変性ポリアクリルアミドゲル電気泳動(PAGE)によって評価し、Cy5蛍光を使用して撮像した(図4A)。5'伸長されたgRNAバリアントは各々、有意な産物形成をもたらし、観察されたDNA産物サイズは伸長鋳型の長さと一致した(図4B)。重要なことに、dCas9の不在下で、予めニックが入れられた基質はDNA基質の全長51bpまで伸長されたが、これは相補的なDNA鎖(gRNAではない)が、dCas9が存在しないときにDNA合成のための鋳型として使用されたことを強く示唆する(図4C)。注目すべきは、新しく合成されたDNA鎖が、標的部位の編集に要求される産物(単一ヌクレオチドの変化と相同の鎖)を映し出す(mirrors)ように、系をデザインした。この結果は、Cas9:gRNA結合によってニックが入れられた非標的鎖の3'末が晒されること、および非標的鎖が逆転写へアクセス可能であることを確立する。
Preliminary experiment results
DNA nicked by Cas9 primes reverse transcription of gRNA templates. To assess the accessibility of the nicked non-target DNA strand, an in vitro biochemical assay was performed using Cas9 nuclease from S.pyogenes (SpCas9) and Cy5 fluorescently labeled double-stranded DNA substrates (51 base pairs). First, a series of 5' extension-containing gRNAs of varying lengths on synthetic templates were prepared by in vitro transcription (overall design shown in Figure 2B). Electrophoretic mobility shift assays (EMSAs) using nuclease-inactive Cas9 (dCas9) established that the 5' extended gRNAs maintained binding affinity to the target (data not shown). Next, TPRT activity was tested against pre-nicked Cy5-labeled double-stranded DNA substrates using dCas9, 5' extended gRNAs, and Moloney-Murine Leukemia Virus (M-MLV) reverse transcriptase (Superscript III). After 1 h of incubation at 37°C, products were assessed by denaturing polyacrylamide gel electrophoresis (PAGE) and imaged using Cy5 fluorescence (Figure 4A). Each of the 5'-extended gRNA variants resulted in significant product formation, with the observed DNA product sizes consistent with the length of the extended template (Figure 4B). Importantly, in the absence of dCas9, the pre-nicked substrate was extended to the full 51 bp length of the DNA substrate, strongly suggesting that the complementary DNA strand (not the gRNA) was used as a template for DNA synthesis in the absence of dCas9 (Figure 4C). Of note, the system was designed such that the newly synthesized DNA strand mirrors the product required for editing of the target site (the strand homologous to the single nucleotide change). This result establishes that the 3' end of the non-targeted strand nicked by Cas9:gRNA binding is exposed and that the non-targeted strand is accessible to reverse transcription.

次に、ニックが入れられていないdsDNA基質を、非標的DNA鎖へニックを入れるCas9(H840A)突然変異体を使用して評価した。第1に、5'伸長されたgRNAを用いてCas9(H840A)ニッカーゼ活性を試験するため、in vitroでの切断アッセイを、これまでに記載されたとおりに実施した37。ニックを入れることは、標準のgRNAと比較すると損なわれていたが、相当の切断産物が形成されていた(図4D)。重要なことに、TPRT反応を5'伸長されたgRNAおよびCas9(H840A)で遂行したとき、より低い収率(ニックを入れる活性の減少によって説明可能)ではあるがRT産物もまた観察された(図4D)。この結果によって、5'伸長されたgRNA:Cas9(H840A)複合体がDNAへニックを入れ、逆転写の鋳型となり得ることが確立される。 Next, unnicked dsDNA substrates were evaluated using a Cas9(H840A) mutant that nicks the non-target DNA strand. First, to test Cas9(H840A) nickase activity with 5'-extended gRNA, an in vitro cleavage assay was performed as previously described37 . Although nicking was impaired compared to standard gRNA, substantial cleavage products were formed (Figure 4D). Importantly, when TPRT reactions were performed with 5'-extended gRNA and Cas9(H840A), RT products were also observed, albeit at lower yields (explainable by reduced nicking activity) (Figure 4D). This result establishes that the 5'-extended gRNA:Cas9(H840A) complex can nick DNA and serve as a template for reverse transcription.

最終的に、3'gRNA伸長を、Cas9(H840A)のニック入れおよびTPRTについて評価した。5'伸長されたgRNAと比較すると、3'伸長されたgRNAによるDNA切断は、標準のgRNAと比較していずれも検出可能な程度までには損なわれていなかった。有意に、3'伸長されたgRNA鋳型もまた、M-MLV RTがtransで供給されたとき、予めニックが入れられた二重鎖DNA基質と無傷の二重鎖DNA基質との両方で効率的な逆転写を支持した(図4E)。驚くべきことに、3'伸長された鋳型について単一産物のみが観察されたが、これは逆転写がgRNA骨格に沿った特定の場所にて終止することを示す。末端トランスフェラーゼでの産物のホモポリマーテール化(Homopolymer tailing)、これに続くクレノウ伸長およびサンガー配列決定によって、全gRNA合成鋳型がgRNAコアの末端3ヌクレオチドが付加されてコピーされたことが明らかにされた。今後、フラップ末端は、末端gRNA配列を修飾することによって再プログラムされるであろう38,39。この結果は、3'伸長されたgRNAが、効率的なヌクレアーゼ標的化ガイドとして働き、逆転写の鋳型となり得ることを実証する。 Finally, 3' gRNA extension was evaluated for Cas9(H840A) nicking and TPRT. Compared to 5' extended gRNA, DNA cleavage by 3' extended gRNA was not detectably impaired compared to standard gRNA either. Significantly, 3' extended gRNA templates also supported efficient reverse transcription on both pre-nicked and intact duplex DNA substrates when M-MLV RT was supplied in trans (Figure 4E). Surprisingly, only a single product was observed for the 3' extended template, indicating that reverse transcription terminates at a specific location along the gRNA backbone. Homopolymer tailing of the product with terminal transferase, followed by Klenow extension and Sanger sequencing, revealed that the entire gRNA synthesis template was copied with the addition of the terminal three nucleotides of the gRNA core. In the future, the flap ends will be reprogrammed by modifying the terminal gRNA sequence38,39 . This result demonstrates that the 3'-extended gRNA can serve as an efficient nuclease targeting guide and serve as a template for reverse transcription.

Cas9-TPRTは、ニックが入ったDNAおよびgRNAをcisで使用する。二色実験を、RT反応が優先的にgRNAとともにcisで(同じ複合体中に結合されている)生じるかを決定するのに使用した(図8を参照)。2つ別々の実験を、5'伸長されたgRNAおよび3'伸長されたgRNAについて行った。所定の実験について、dCas9、gRNA、およびDNA基質の3元複合体を別々の管中に形成させた。一方の管中、gRNAは長いRT産物をコードし、DNA基質はCy3(赤色)で標識されている;他方の管中、gRNAは短いRT産物をコードし、DNA基質はCy5(青色)で標識されている。短いインキュベーションの後、複合体を混合し、次いでRT酵素およびdNTPsで処置する。産物を尿素-変性PAGEによって分離し、Cy3およびCy5チャネルの蛍光によって視覚化した。反応産物は、予めDNA基質と複合体化されたgRNA鋳型を使用して優先的に形成されることが見出されたが、これはRT反応がcisで生じ得る可能性があることを示す。この結果は、単一のCas9:gRNA複合体がDNA部位を標的にし、変異誘発DNA鎖の逆転写の鋳型になり得ることを支持する。 Cas9-TPRT uses nicked DNA and gRNA in cis. Dual-color experiments were used to determine whether the RT reaction occurs preferentially in cis (bound in the same complex) with the gRNA (see Figure 8). Two separate experiments were performed with 5'-extended and 3'-extended gRNAs. For a given experiment, ternary complexes of dCas9, gRNA, and DNA substrate were formed in separate tubes. In one tube, the gRNA encodes a long RT product and the DNA substrate is labeled with Cy3 (red); in the other tube, the gRNA encodes a short RT product and the DNA substrate is labeled with Cy5 (blue). After a short incubation, the complexes are mixed and then treated with RT enzyme and dNTPs. Products were separated by urea-denaturing PAGE and visualized by fluorescence in the Cy3 and Cy5 channels. Reaction products were found to be preferentially formed using gRNA templates that were previously complexed with DNA substrates, indicating that the RT reaction may occur in cis. This result supports the idea that a single Cas9:gRNA complex can target a DNA site and serve as a template for reverse transcription of the mutagenized DNA strand.

TPRTを他のCas系で試験する
先のセクションにおいて提示されたものと同様の実験を、S.aureusからのCas9およびL.bacteriumからCas12aを包含する他のCas系を使用して、遂行する(図2A~2Cを参照)。TRPTもまた、これらのCasバリアントについて実証され得る場合、潜在的な編集範囲および細胞において全般的に成功する可能性が増大するであろう。
Testing TPRT with other Cas systems Experiments similar to those presented in the previous section will be performed using other Cas systems, including Cas9 from S. aureus and Cas12a from L. bacterium (see Figures 2A-2C). If TRPT can also be demonstrated for these Cas variants, it will increase the potential editing scope and the overall chance of success in cells.

TPRTをRT-Cas9融合タンパク質で試験する
第1に、商業的に入手可能または精製可能な一連のRT酵素をTPRT活性についてtransで評価する。M-MLVからの既に試験されたRTに加えて、トリ骨髄芽球症ウイルス(AMV)、Geobacillus stearothermophilusグループIIイントロン(GsI-IIC)41,42、およびEubacterium rectaleグループIIイントロン(Eu.re.I2)43,44からのRTを評価する。有意に、後者2つのRTは、それら天然の生物学的な文脈において、TPRTを実施する。関係のある場合、RNAse不活性化突然変異および他の潜在的に有益なRT酵素修飾も試験する。transで供給されたとき機能的RTが同定されたら、各々を融合タンパク質としてCas9バリアントに対し評価する。N末端融合配向とC末端融合配向との両方を、様々なリンカー長さおよび構造と併せて試験する。速度論的な時間経過実験を、TPRTがRT酵素をcisで使用して生じ得るか決定するのに使用する。効率的なTPRT化学を可能にするRT-Cas9融合構造体が構築され得る場合、これは、細胞という文脈における機能的編集の可能性を大いに増大するであろう。
Testing TPRT with RT-Cas9 Fusion Proteins First, a series of commercially available or purifiable RT enzymes will be evaluated in trans for TPRT activity. In addition to the already tested RT from M-MLV, RTs from avian myeloblastosis virus (AMV), Geobacillus stearothermophilus group II intron (GsI-IIC) 41,42 , and Eubacterium rectale group II intron (Eu.re.I2) 43,44 will be evaluated. Significantly, the latter two RTs perform TPRT in their native biological context. Where relevant, RNAse inactivating mutations and other potentially beneficial RT enzyme modifications will also be tested. Once functional RTs are identified when supplied in trans, each will be evaluated against Cas9 variants as fusion proteins. Both N- and C-terminal fusion orientations will be tested along with various linker lengths and structures. Kinetic time course experiments will be used to determine if TPRT can occur using the RT enzymes in cis. If an RT-Cas9 fusion construct could be constructed that enabled efficient TPRT chemistry, this would greatly increase the likelihood of functional editing in the cellular context.

細胞中の改変gRNAでのCas9標的化
先の副目的(sub-aims)において開発された改変gRNA候補を、Cas9標的化効率を確認するため、ヒト細胞培養実験(HEK293)において評価する。野生型SpCas9を採用する、確立されたインデル形成アッセイ45を使用して、改変gRNAを、ヒトゲノム中5部位またはそれ以上の部位にわたり、標準のgRNAと並べて(side-by-side)比較する。ゲノム編集効率を、実験室に収納されているIllumina MiSeqプラットホームを使用する多重アンプリコン配列決定によって特徴付ける。本セクションおよび先行するセクションからの結果から、これに続くデザイン-組み立て-試験サイクルの反復(iterations)という情報を与える洞察力が生み出されることが予想されるが、ここでgRNAは細胞中、逆転写の鋳型化と効率的なCas9標的化との両方に最適化され得る。
Cas9 targeting with modified gRNA in cells The modified gRNA candidates developed in the previous sub-aims are evaluated in human cell culture experiments (HEK293) to confirm Cas9 targeting efficiency. Using an established indel formation assay45 employing wild-type SpCas9, the modified gRNA is compared side-by-side with standard gRNA across 5 or more sites in the human genome. Genome editing efficiency is characterized by multiplex amplicon sequencing using a laboratory-housed Illumina MiSeq platform. It is expected that the results from this section and the previous section will generate insights that will inform subsequent iterations of design-build-test cycles, where gRNAs can be optimized for both reverse transcription template and efficient Cas9 targeting in cells.

in vitroでの検証結果を図5~7に示す。In vitroでの実験は、ニックが入れられた非標的DNA鎖がDNA合成をプライムするのに柔軟かつ利用可能であること、およびgRNA伸長が逆転写のための鋳型として働き得ることを実証した(図5を参照)。この一連の実験は、編集鋳型の長さを変動させた(左側へ列挙)、5'伸長されたgRNA(図3A~3Bに示されるとおりにデザインされた)を使用した。蛍光標識(Cy5)DNA標的を基質として使用し、この一連の実験においてこれへ予めニックを入れた。これらの実験に使用されたCas9は触媒不活性型Cas9(dCas9)であり、そのためDNAは切れないが、依然として効率的に結合することはできる。モロニーマウス白血病ウイルス(M-MLV)に由来する商業的RTであるSuperscript IIIをtransで供給した。第1に、dCas9:gRNA複合体を精製された構成要素から構成させた。次いで、蛍光標識DNA基質をdNTPsおよびRT酵素と一緒に加えた。37Cでの1時間のインキュベーション後、反応産物を変性尿素-ポリアクリルアミドゲル電気泳動(PAGE)によって分析した。ゲル画像は、逆転写鋳型の長さと一致する長さまで元のDNA鎖が伸長したことを示す。注目すべきことに、dCas9の不在下で遂行された反応は、使用されたgRNAを問わず、51ヌクレオチド長のDNA産物を産生した。この産物は、DNA合成のための鋳型として相補的なDNA(RNAではない)鎖の使用に対応する(データは示さず)。よって、Cas9結合は、DNA合成をRNA鋳型へ向けるのに要される。この一連のin vitroでの実験は、DNA基質へ予めニックが入れられておらず、かつCas9ニッカーゼ(SpyCas9 H840A 突然変異体)を使用する以外は、図5に示されるものと厳密に類似する(closely parallels)。ゲルに示されるとおり、ニッカーゼは、標準のgRNAを使用したときDNA鎖を効率的に切断する(gRNA_0、レーン3)。複数の切断産物が観察されるが、SpyCas9の先行する生化学的研究と一致する。5'伸長はニックを入れる活性(レーン4~8)を損なうが、あるRT産物は依然として観察される。図7は、3'伸長がDNA合成を支持し、Cas9ニッカーゼ活性を有意には生じさせないことを示す。予めニックが入れられた基質(黒色矢印)は、dCas9またはCas9ニッカーゼのいずれかを使用したとき、ほぼ定量的にRT産物へ変換される(レーン4および5)。RT産物(赤色矢印)への50%超の変換が全基質で観察される(レーン3)。RT産物の長さおよび配列を決定するため、産物バンドをゲルから切除し、抽出して配列決定した。これはRTがgRNAコアの3'末端ヘアピン中へ3ヌクレオチド伸長したことを明らかにした。これに続く実験(示されず)は、これらの3ヌクレオチドが、ヘアピンRNA構造を維持する相補的な変化がなされる限り、標的DNA配列とマッチするために変化され得ることを実証した。 In vitro validation results are shown in Figures 5-7. In vitro experiments demonstrated that the nicked non-target DNA strand is flexible and available to prime DNA synthesis, and that the gRNA extension can serve as a template for reverse transcription (see Figure 5). This series of experiments used 5'-extended gRNAs (designed as shown in Figures 3A-3B) with varying lengths of editing templates (listed on the left). A fluorescently labeled (Cy5) DNA target was used as the substrate, which was pre-nicked in this series of experiments. The Cas9 used in these experiments was a catalytically inactive Cas9 (dCas9), which does not cleave DNA but can still bind efficiently. Superscript III, a commercial RT derived from Moloney Murine Leukemia Virus (M-MLV), was supplied in trans. First, the dCas9:gRNA complex was assembled from purified components. Then, the fluorescently labeled DNA substrate was added together with dNTPs and the RT enzyme. After 1 h of incubation at 37 C, the reaction products were analyzed by denaturing urea-polyacrylamide gel electrophoresis (PAGE). The gel image shows that the original DNA strand was extended to a length consistent with that of the reverse transcription template. Notably, reactions performed in the absence of dCas9 produced a 51-nucleotide-long DNA product, regardless of the gRNA used. This product corresponds to the use of the complementary DNA (not RNA) strand as a template for DNA synthesis (data not shown). Thus, Cas9 binding is required to direct DNA synthesis to the RNA template. This set of in vitro experiments closely parallels the one shown in FIG. 5, except that the DNA substrate was not pre-nicked and Cas9 nickase (SpyCas9 H840A mutant) was used. As shown in the gel, the nickase efficiently cleaves the DNA strand when a standard gRNA is used (gRNA_0, lane 3). Multiple cleavage products are observed, consistent with previous biochemical studies of SpyCas9. 5' extension abolishes nicking activity (lanes 4-8), but some RT product is still observed. Figure 7 shows that 3' extension supports DNA synthesis and does not significantly induce Cas9 nickase activity. Pre-nicked substrates (black arrows) are nearly quantitatively converted to RT products when using either dCas9 or Cas9 nickase (lanes 4 and 5). More than 50% conversion to RT products (red arrows) is observed for all substrates (lane 3). To determine the length and sequence of the RT products, product bands were excised from the gel, extracted, and sequenced. This revealed that RT extended three nucleotides into the 3' terminal hairpin of the gRNA core. Subsequent experiments (not shown) demonstrated that these three nucleotides could be altered to match the target DNA sequence, as long as complementary changes were made that maintained the hairpin RNA structure.

潜在的な困難および代替手段
(1)RTは、融合体としては機能しない:分子密集および/または好ましくない形状(geometries)は、Cas9融合RT酵素によるポリメラーゼ伸長を妨げ得る。第1に、リンカー最適化は試験できる。DNAプライマーとgRNAとRT酵素との間の空間的な関係性を再配向し得るCas9の循環置換バリアントを評価する。目的2に詳述したとおりの非共有結合のRT動員ストラテジーは試験できる。(2)伸長されたgRNAバリアントによって減少したCas標的化効率:これは、最も5'伸長されたgRNAの問題点になり得るものである。構造データ24に基づき、Cas9突然変異体をデザイン、スクリーニングし、gRNA伸長に対してより耐性があるバリアントを同定できる。加えて、gRNAライブラリは、標的化活性を改善するリンカーについて細胞中でスクリーニングできる。
Potential Difficulties and Alternatives
(1) RT does not function as a fusion: molecular crowding and/or unfavorable geometries may hinder polymerase extension by Cas9-fused RT enzyme. First, linker optimization can be tested. Circular permutation variants of Cas9 that can reorient the spatial relationship between the DNA primer, gRNA, and RT enzyme are evaluated. Non-covalent RT recruitment strategies as detailed in objective 2 can be tested. (2) Reduced Cas targeting efficiency by extended gRNA variants: This can be an issue for most 5'-extended gRNAs. Based on structural data24 , Cas9 mutants can be designed and screened to identify variants that are more resistant to gRNA extension. In addition, gRNA libraries can be screened in cells for linkers that improve targeting activity.

有意性
これらの予備実験結果は、Cas9ニッカーゼおよび伸長されたgRNAが、transで供給された逆転写酵素を使用して、結合したDNA標的上、標的にプライムされた逆転写を開始し得ることを確立する。重要なことに、Cas9結合は、産物形成にとって極めて重要であることが見出された。おそらく細胞中のゲノム編集にとって絶対的な要件ではないが、RT酵素機能をcisで組み込む系のさらなる開発は、細胞ベースの適用において成功する可能性を有意に増大させるであろう。この目的の残りの側面を達成すると、ヒトゲノムという文脈における高精度ゲノム編集を遂行するための分子基盤が提供されるであろう。
Significance These preliminary experimental results establish that Cas9 nickase and extended gRNA can initiate target-primed reverse transcription on bound DNA targets using reverse transcriptase supplied in trans. Importantly, Cas9 binding was found to be crucial for product formation. Although perhaps not an absolute requirement for genome editing in cells, further development of a system that incorporates RT enzyme function in cis would significantly increase the chances of success in cell-based applications. Achieving the remaining aspects of this objective would provide a molecular basis for carrying out high-precision genome editing in the context of the human genome.

2.ヒト細胞中のプライム編集を確立する。
背景および論拠
提案のストラテジーにおいて、改変RT-Cas9:gRNA複合体は、変異誘発3'DNAフラップをゲノムの標的部位にて導入する。単一ミスマッチを含有する変異誘発3'フラップは、エネルギー的に利用しやすい隣接5'フラップ(これは優先的に除去される)との平衡を通して、DNA修復機構によって組み込まれるものと仮定する(図1C~1D)。DNA複製および修復機構は、岡崎フラグメントをプロセシングするとき46かつ長いパッチの塩基切除修復(LP-BER)の最中47、5'ssDNAフラップに遭遇する。5'フラップは、幅広く発現されるフラップエンドヌクレアーゼFEN1の好ましい基質であって、前記酵素は、ホモ三量体のスライド型(sliding)クランプ複合体PCNAによってDNA修復部位へ動員される48。PCNAはまた、他の修復因子(DNAリガーゼLig1を包含する)も同時に動員するための骨格としても働く49。PCNAは、「ツールベルト(toolbelt)」として作用すると、細胞分裂の最中ごとに生成される数百万の岡崎フラグメントをプロセシングするのに不可欠である連続フラップ切断およびライゲーションを加速させる50,51。これら天然のDNA中間体との類似点に基づき、変異誘発鎖は、5'フラップとの平衡、これに続く5'フラップ切除とライゲーションとの連携を通して組み込まれるものと仮定される。次いで、ミスマッチ修復(MMR)が、いずれかの鎖上に等しい確率で生じるはずであって、編集または復元へ繋がる(図1C~1D)。代替的に、DNA複製が最初に生じ、新しく合成された娘鎖中の編集の組み込みへ直接繋がり得る。このプロセスから期待される最も高い収率は50%ではあるが、複数の基質編集を試みることによって、編集修復の不可逆性に起因して完成へ向かう反応が推進され得る。
2. Establishing prime editing in human cells.
Background and Rationale In the proposed strategy, a modified RT-Cas9:gRNA complex introduces a mutagenic 3' DNA flap at a genomic target site. We hypothesize that the mutagenic 3' flap, which contains a single mismatch, is incorporated by the DNA repair machinery through equilibrium with the energetically accessible adjacent 5' flap, which is preferentially removed (Figures 1C-1D). DNA replication and repair machinery encounters the 5' ssDNA flap when processing Okazaki fragments46 and during long patch base excision repair (LP-BER) .47 The 5' flap is the preferred substrate for the broadly expressed flap endonuclease FEN1, which is recruited to DNA repair sites by the homotrimeric sliding clamp complex PCNA.48 PCNA also serves as a scaffold for the simultaneous recruitment of other repair factors, including the DNA ligase Lig1.49 Acting as a "toolbelt," PCNA accelerates the sequential flap cleavage and ligation that are essential for processing the millions of Okazaki fragments generated during each cell division. Based on similarities with these natural DNA intermediates, it is hypothesized that the mutagenized strand is incorporated through equilibration with the 5' flap followed by coordinated 5' flap excision and ligation. Mismatch repair (MMR) should then occur with equal probability on either strand, leading to editing or restoration (Figures 1C-1D). Alternatively, DNA replication can occur first, leading directly to incorporation of the edit in the newly synthesized daughter strand. Although the highest yield expected from this process is 50%, multiple substrate editing attempts can drive the reaction toward completion due to the irreversibility of edit repair.

予備実験結果
DNAフラップは、酵母およびHEK細胞中のプラスミドモデル基質中に部位特異的変異誘発を包含する。提案の編集ストラテジーを試験するため、TPRT産物と似ている変異誘発3'フラップ含有モデルプラスミド基質で研究を始めた。GFPとmCherryとの間に停止コドンをコードする二重蛍光タンパク質レポーターを創出した。変異誘発フラップは停止コドンへの修正をコードしており(図9A)、mCherry合成を可能にさせる。よって、変異誘発効率はGFP:mCherry比率によって定量化できる。プラスミド基質をin vitroで調製し、酵母(S.cerevisiae)またはヒト細胞(HEK293)中へ導入した。高頻度変異誘発が両系ともに観察され(図9B)、単離された酵母コロニーは、元の状態の(reverted)塩基、突然変異塩基、または両産物の混合物のいずれかを含有していた(図9C)。後者の検出は、これらのケースにおいてプラスミド複製がMMRに先立ち生じたことを示唆し、さらに、フラップ切除およびライゲーションがMMRに先行することを示唆する。この結果は、3'変異誘発鎖を使用するDNA編集の実現性を確立する。
Preliminary experiment results
DNA flaps involve site-directed mutagenesis in plasmid model substrates in yeast and HEK cells. To test the proposed editing strategy, we began with model plasmid substrates containing a mutagenized 3' flap that resembles the TPRT product. We created a dual fluorescent protein reporter that encodes a stop codon between GFP and mCherry. The mutagenized flap encodes a correction to the stop codon (Figure 9A), allowing mCherry synthesis. Thus, mutagenesis efficiency can be quantified by the GFP:mCherry ratio. Plasmid substrates were prepared in vitro and introduced into yeast (S. cerevisiae) or human cells (HEK293). Hypermutagenesis was observed in both systems (Figure 9B), and isolated yeast colonies contained either reverted bases, mutated bases, or a mixture of both products (Figure 9C). Detection of the latter suggests that plasmid replication occurred prior to MMR in these cases, and further suggests that flap excision and ligation precede MMR. This result establishes the feasibility of DNA editing using the 3' mutagenized strand.

●モデルラップ基質での系統的な研究
上に記載の予備実験結果に基づき、効率的な編集の原理を推察するため、より広範囲のフラップ基質をHEK細胞において評価する。ミスマッチ対形成の影響、フラップに沿った変異誘発ヌクレオチドの場所、および末端ヌクレオチドの同一性を決定するため、3'ssDNAフラップを系統的に変動させる(図9D)。単一ヌクレオチドの挿入および欠失もまた試験する。編集高精度を分析するため、アンプリコン配列決定を使用する。これらの結果は、gRNA逆転写鋳型のデザイン情報を与えるのに役立つ。
● Systematic studies on model flap substrates Based on the preliminary experimental results described above, a wider range of flap substrates will be evaluated in HEK cells to infer the principles of efficient editing. The 3'ssDNA flap will be systematically varied to determine the effects of mismatch pairing, the location of the mutagenic nucleotide along the flap, and the identity of the terminal nucleotide (Figure 9D). Single nucleotide insertions and deletions will also be tested. Amplicon sequencing will be used to analyze the editing precision. These results will help inform the design of gRNA reverse transcription templates.

プラスミド基質上のIn vitroでのTPRTは、効率的な編集成果へ繋がる。目的1において開発されたTPRT反応を、プラスミド基質内に変異誘発を導入するのに使用した。反応を環状DNAプラスミド基質上で遂行した(図10を参照)。これは、先のin vitroでの実験におけるRT伸長の機序としてDNA鎖が解離する可能性を除外する。これはまた、細胞中のフラップ基質のDNA修復も可能にさせる。二重蛍光レポータープラスミドを酵母(S.cerevisiae)発現のために構築した。このプラスミドは、停止コドン(TGA)を介在してGFP(緑色蛍光タンパク質)およびmCherry(赤色蛍光タンパク質)をコードする。この構築物の酵母中の発現は、GFPしか産生しない。プラスミドを、in vitroでのTRT[Cas9(H840A)ニッカーゼ、改変gRNA、MLV RT酵素、dNTPS]のための基質として使用した。gRNA伸長は、停止コドンに対する突然変異をコードする。フラップ鎖を停止コドンの修復のために使用すると、GFPとmCherryとの両方を発現するプラスミドを融合タンパク質として産生するものと予想される。酵母二重FPプラスミド形質転換体を図10に示す。親プラスミドまたはin vitroでCas9(H840A)がニックを入れたプラスミドを形質転換すると、緑色GFP発現コロニーのみがもたらされる。5'伸長されたgRNAまたは3'伸長されたgRNAでのTRT反応は、緑色コロニーと黄色コロニーとの混合を産生する。後者はGFPとmCherryとの両方を発現する。より多くの黄色コロニーが3'伸長されたgRNAで観察される。停止コドンを含有しない陽性対照も示す。 In vitro TPRT on plasmid substrates leads to efficient editing results. The TPRT reaction developed in Objective 1 was used to introduce mutagenesis into plasmid substrates. The reaction was performed on circular DNA plasmid substrates (see Figure 10). This excludes the possibility of DNA strand dissociation as a mechanism for RT extension in previous in vitro experiments. This also allows DNA repair of flap substrates in cells. A dual fluorescent reporter plasmid was constructed for yeast (S. cerevisiae) expression. This plasmid encodes GFP (green fluorescent protein) and mCherry (red fluorescent protein) with an intervening stop codon (TGA). Expression of this construct in yeast produces only GFP. The plasmid was used as a substrate for in vitro TRT [Cas9(H840A) nickase, modified gRNA, MLV RT enzyme, dNTPS]. gRNA extension encodes a mutation for the stop codon. Using the flap strand for repair of the stop codon is expected to produce a plasmid expressing both GFP and mCherry as a fusion protein. Yeast dual FP plasmid transformants are shown in FIG. 10. Transformation of the parental plasmid or the in vitro Cas9(H840A) nicked plasmid results in only green GFP expressing colonies. TRT reactions with 5' extended or 3' extended gRNAs produce a mixture of green and yellow colonies, the latter expressing both GFP and mCherry. More yellow colonies are observed with the 3' extended gRNA. A positive control containing no stop codon is also shown.

この結果は、長い二本鎖の基質がTPRTを経り得ること、およびTPRT産物が真核細胞中に編集を誘導することを確立する。 These results establish that long double-stranded substrates can undergo TPRT and that TPRT products induce editing in eukaryotic cells.

上記のプライム編集実験と同様の別の実験も遂行したが、停止コドン中に点突然変異を組み入れる代わりに、TRT編集は、フレームシフト突然変異を修復しかつ下流mCherryの合成を可能にさせる単一ヌクレオチドの挿入(左)または欠失(右)を取り入れる(図11を参照)。両実験とも、3'伸長されたgRNAを使用した。TRT形質転換体からの個々のコロニーを選択し、サンガー配列決定によって分析した(図12を参照)。緑色コロニーは元のDNA配列をもつプラスミドを含有し、一方黄色コロニーは、TRT編集gRNAによってデザインされた正確な突然変異を含有していた。他の点突然変異もインデルも観察されなかった。 Another experiment similar to the prime editing experiment above was also performed, but instead of incorporating a point mutation in the stop codon, TRT editing introduces a single nucleotide insertion (left) or deletion (right) that repairs the frameshift mutation and allows synthesis of downstream mCherry (see Figure 11). In both experiments, 3' extended gRNAs were used. Individual colonies from the TRT transformants were selected and analyzed by Sanger sequencing (see Figure 12). Green colonies contained a plasmid with the original DNA sequence, while yellow colonies contained the precise mutation designed by the TRT-edited gRNA. No other point mutations or indels were observed.

RT-Cas9構造体を使用するHEK細胞中のプライム編集を確立する
先の目的から最適化された構築物を、哺乳動物発現およびヒトゲノム中の標的部位での編集のために適合させる。複数のRT酵素および融合構造体を、2次gRNA(ニックが入れられるのを防止するためにトランケートされた)での隣接標的化に加えて、試験する。非共有結合のRT動員もまた、Sun-Tag系52およびMS2アプタマー系53を使用して評価する。インデル形成アッセイを、標準のgRNAおよびRT-Cas9融合体(上のとおり)での標的化効率を評価するのに使用する。次いで、各ゲノムの部位について、伸長されたgRNAとRT-Cas9との対を、単一ヌクレオチドの編集についてアッセイする。編集成果をMiSeqで評価する。
Establishing prime editing in HEK cells using RT-Cas9 constructs The optimized constructs from the previous objectives are adapted for mammalian expression and editing at target sites in the human genome. Multiple RT enzymes and fusion constructs are tested, in addition to adjacent targeting with a secondary gRNA (truncated to prevent nicking). Non-covalent RT recruitment is also evaluated using the Sun-Tag system52 and the MS2 aptamer system53 . Indel formation assays are used to evaluate targeting efficiency with standard gRNA and RT-Cas9 fusions (as above). For each genomic site, the extended gRNA and RT-Cas9 pair are then assayed for single nucleotide editing. Editing outcomes are evaluated with MiSeq.

HEK細胞における最初の実験を、Cas9-RT融合体を使用して実施した。細胞内に発現される構成要素による編集には、Cas9(H840A)ニッカーゼ、逆転写酵素(融合体として発現されるか、またはtransで供給される)、および3'伸長をもつ改変gRNAを要する(図14を参照)。予備研究は、gRNA伸長内のプライマー結合部位の長さがヒト細胞中の編集の効率を増大させるのに重要であることを示した(図15を参照)。 Initial experiments in HEK cells were performed using Cas9-RT fusions. Editing with intracellularly expressed components requires Cas9(H840A) nickase, reverse transcriptase (expressed as a fusion or supplied in trans), and a modified gRNA with a 3' extension (see Figure 14). Preliminary studies showed that the length of the primer binding site within the gRNA extension is important to increase the efficiency of editing in human cells (see Figure 15).

HEK細胞中のプライム編集パラメータを最適化する
細胞中でプライム編集を実施できるCas9-RT構造体を同定した後、構成要素およびデザインを、高効率編集を達成するのに最適化する。コードされた点突然変異の場所およびヌクレオチド同一性、ならびに新しく合成されたDNA鎖の全長を、編集範囲および潜在的な欠点を評価するために変動させる。短い挿入および欠失の突然変異もまた評価する。タンパク質発現構築物をコドン最適化する。成功した場合、これは、哺乳動物細胞中の効率的なプライム編集を確立するであろう。
Optimize the prime editing parameters in HEK cells After identifying the Cas9-RT construct that can perform prime editing in cells, optimize the components and design to achieve high-efficiency editing. Vary the location and nucleotide identity of the encoded point mutation, and the total length of the newly synthesized DNA strand to evaluate the editing range and potential defects. Also evaluate short insertion and deletion mutations. Codon-optimize the protein expression construct. If successful, this will establish efficient prime editing in mammalian cells.

予備実験結果。
万一、融合RT酵素による分子内逆転写が起こり得なかったという場合には、追加のgRNAを、RT酵素が編集遺伝子座にてより高い局所濃度になるようデザインした。これらの補助ガイドを5'末にてトランケートするが(14~15ntスペーサー)、これによってCas9切断は防止されるが結合は保持されることがこれまでに示されている(図16を参照)。HEK3遺伝子座を、このストラテジーを探索するために選んだ。
Preliminary experimental results.
In the unlikely event that intramolecular reverse transcription by the fused RT enzyme could not occur, additional gRNAs were designed to bring the RT enzyme to a higher local concentration at the editing locus. These auxiliary guides were truncated at the 5' end (14-15 nt spacer), which has previously been shown to prevent Cas9 cleavage but retain binding (see Figure 16). The HEK3 locus was chosen to explore this strategy.

潜在的な困難および代替手段
(1)細胞中のgRNA分解:伸長されたgRNA末端が細胞中でトランケートされた場合、安定化2次構造を組み入れるか、または安定化修飾をもつ合成gRNAを試験できる。(2)ヒト細胞中で編集が観察されない:RT-Cas9融合体の隣接ゲノム部位への2次標的化を包含する、追加のストラテジーを探索する54。加えて、E.coliまたはS.cerevisiae中の潜在的な指向進化ストラテジーも探索できる。
Potential Difficulties and Alternatives
(1) gRNA degradation in cells: if extended gRNA ends are truncated in cells, synthetic gRNAs incorporating stabilizing secondary structures or with stabilizing modifications can be tested. (2) No editing is observed in human cells: additional strategies are explored, including secondary targeting of RT-Cas9 fusions to adjacent genomic sites.54 In addition, potential directed evolution strategies in E. coli or S. cerevisiae can also be explored.

有意性
プライム編集を実験の細胞株中で確立できた場合、これは、ヒト遺伝子中の多数の点突然変異の迅速な生成および特徴付けを可能にすることによって、生物医学の基礎研究に直接の影響を有するであろう。塩基編集因子に関する方法の一般論、およびその直交する編集窓は、目下アクセス不能な多くの突然変異を取り入れるアプローチを提供する。その上、プライム編集を高い効率および産物純度に最適化できた場合、他のヒト細胞型中の疾患突然変異を修正することへのその潜在的な適用性は意義深い。
If significant prime editing could be established in experimental cell lines, it would have a direct impact on basic biomedical research by enabling the rapid generation and characterization of large numbers of point mutations in human genes. The generality of the method for base editors and their orthogonal editing windows provide an approach to incorporate many currently inaccessible mutations. Moreover, if prime editing could be optimized for high efficiency and product purity, its potential applicability to correct disease mutations in other human cell types is significant.

3.培養ヒト細胞中の病原性の突然変異の部位特異的編集を達成する。3. Achieve site-specific editing of pathogenic mutations in cultured human cells.
背景および論拠。Background and rationale.

多数の病原性の突然変異は、PAMの制限に起因する最新の塩基編集因子によっては修正できない、すなわちトランスバージョンまたはインデル突然変異の修正が必要とされる。プライム編集で、すべてのトランジションおよびトランスバージョンは、挿入および欠失が小さい場合ではあるが、理論上起こり得る。その上、PAMとの関係において、プライム編集窓(-3~+4と予想される)は、塩基編集因子(-18~-12)とは違う(図13)。目下、塩基編集因子によって修正不能であるメンデル型疾病は、以下を包含する:(1)ヘモグロビンベータ中の鎌状赤血球病Glu6Val創始者突然変異(A・T→T・Aトランスバージョンを要する);(2)ATP7B中の最も一般的なウィルソン病バリアントHis1069Gln(G・C→T・Aトランスバージョンを要する);および(3)嚢胞性線維症を引き起こすCFTR中の△Phe508突然変異(3ヌクレオチド挿入を要する)。これらの標的の各々は、SpCas9標的化およびプライム編集にとって適切に位置付けられたPAMを含有する。
予備実験結果。
●HEK3細胞中のT→A編集は、最新の塩基編集では達成できないが、TRPT編集では達成できる(図17A~17Cを参照)。
Many pathogenic mutations cannot be corrected by current base editors due to PAM restriction, i.e., correction of transversion or indel mutations is required. With prime editing, all transitions and transversions can theoretically occur, although insertions and deletions are small. Moreover, the prime editing window (expected to be -3 to +4) in relation to the PAM is different from that of base editors (-18 to -12) (Figure 13). Mendelian diseases that are currently uncorrectable by base editors include: (1) the sickle cell disease Glu6Val founder mutation in hemoglobin beta (requiring an A-T to T-A transversion); (2) the most common Wilson disease variant His1069Gln in ATP7B (requiring a G-C to T-A transversion); and (3) the △Phe508 mutation in CFTR that causes cystic fibrosis (requiring a three nucleotide insertion). Each of these targets contains a PAM appropriately positioned for SpCas9 targeting and prime editing.
Preliminary experimental results.
●T→A editing in HEK3 cells cannot be achieved with modern base editing, but can be achieved with TRPT editing (see Figures 17A-17C).

図17Aは、ヒト胚性腎臓(HEK)細胞中の構成要素のトランスフェクション後の標的ヌクレオチドでの%T→A変換を表示するグラフを示す。このデータは、野生型MLV逆転写酵素のCas9(H840A)ニッカーゼ(32アミノ酸リンカー)とのN末端融合体を使用する結果を提示する。編集効率は、プライマー結合部位の長さが7ヌクレオチドから11または12ヌクレオチドまで伸長されたとき劇的に改善した。加えて、編集遺伝子座のちょうど上流に位置付けられる補助(auxiliary)ガイドAは(図16を参照)、具体的にはプライマー結合部位の長さがより短い場合に、編集活性を有意に改善する。編集効率を、MiSeqプラットホームを使用するアンプリコン配列決定によって定量化した。図17Bはまた、ヒト胚性腎臓(HEK)細胞中の構成要素のトランスフェクション後の標的ヌクレオチドでの%T→A変換も示すが、このデータは、RT酵素のC末端融合体を使用する結果を提示する。ここで、補助ガイドAはそれほどの(as much of)効果を有さず、編集効率全体はより高い。図17Cは、図17Aにおいて使用されたものと同様の野生型MLV逆転写酵素のCas9(H840A)ニッカーゼとのN末端融合体を使用する結果を提示するデータを示す;しかしながら、MLV RTとCas9との間のリンカーは、32アミノ酸の代わりに60アミノ酸長である。 Figure 17A shows a graph displaying the % T→A conversion at the target nucleotide after transfection of the constructs in human embryonic kidney (HEK) cells. The data presents the results using an N-terminal fusion of wild-type MLV reverse transcriptase with Cas9 (H840A) nickase (32 amino acid linker). Editing efficiency improved dramatically when the length of the primer binding site was extended from 7 nucleotides to 11 or 12 nucleotides. In addition, auxiliary guide A, which is positioned just upstream of the editing locus (see Figure 16), significantly improves editing activity, especially when the length of the primer binding site is shorter. Editing efficiency was quantified by amplicon sequencing using the MiSeq platform. Figure 17B also shows the % T→A conversion at the target nucleotide after transfection of the constructs in human embryonic kidney (HEK) cells, but the data presents the results using a C-terminal fusion of the RT enzyme. Here, auxiliary guide A has not as much of an effect and the overall editing efficiency is higher. FIG. 17C shows data presenting the results of using an N-terminal fusion of wild-type MLV reverse transcriptase with the Cas9(H840A) nickase similar to that used in FIG. 17A; however, the linker between the MLV RT and Cas9 is 60 amino acids long instead of 32 amino acids.

●RPT編集結果によるHEK3部位でのT→A編集は高純度を表示する。
図18は、ハイスループットアンプリコン配列決定による配列決定分析の入力を示す。入力は、編集済細胞の最も豊富な遺伝子型を表示する。注目すべきことに、主要なインデル産物は得られず、所望の点突然変異(T→A)は、バイスタンダー編集をせずとも明確に取り入れられる。第1配列は参照遺伝子型を示す。上側2つの産物は、内生多型を含有する出発遺伝子型(GまたはA)である。下側2つの産物は、修正して編集された遺伝子型を表す。
●The T→A edit at the HEK3 site by RPT editing shows high purity.
FIG. 18 shows the input of the sequencing analysis by high-throughput amplicon sequencing. The input displays the most abundant genotype of the edited cells. Notably, no major indel products are obtained and the desired point mutation (T→A) is clearly incorporated without bystander editing. The first sequence shows the reference genotype. The top two products are the starting genotype (G or A) containing the endogenous polymorphism. The bottom two products represent the corrected edited genotype.

●MLV RT突然変異体は編集を改善する。
Baranauskasら(doi:10.1093/protein/gzs034)に記載される突然変異逆転写酵素を、ヒト胚性腎臓(HEK)細胞中の標的ヌクレオチド編集について、Cas9(H840A)ニッカーゼとのC末端融合体として試験した。Cas9-RT編集因子プラスミドを、逆転写の鋳型となる3'プライム編集ガイドRNAをコードするプラスミドとともに共トランスフェクトした。図19において標的ヌクレオチドでの編集効率(青色バー)を、インデル率(オレンジ色バー)と並べて示す。WTは野生型MLV RT酵素を指す。突然変異酵素(M1~M4)は、右に列挙された突然変異を含有する。編集率をゲノムDNAアンプリコンのハイスループット配列決定によって定量化した。
•MLV RT mutants improve editing.
Mutant reverse transcriptases described in Baranauskas et al. (doi:10.1093/protein/gzs034) were tested as C-terminal fusions with Cas9(H840A) nickase for targeted nucleotide editing in human embryonic kidney (HEK) cells. Cas9-RT editor plasmids were co-transfected with a plasmid encoding a 3' prime editing guide RNA that served as a template for reverse transcription. Editing efficiency at the targeted nucleotide (blue bars) is shown alongside the indel rate (orange bars) in Figure 19. WT refers to wild-type MLV RT enzyme. Mutant enzymes (M1-M4) contain the mutations listed on the right. Editing rates were quantified by high-throughput sequencing of genomic DNA amplicons.

第2gRNAで相補鎖へニックを入れることは編集を改善する。
この実験は、単鎖ニックが、標的ヌクレオチドに近接する相補的なDNA鎖中に導入されたときの、標的ヌクレオチドの編集効率を評価する(これがミスマッチ修復へ指向して、元のヌクレオチドを優先的に除去しかつ塩基対を所望の編集へ変換するとの仮説から)。Cas9(H840A)-RT編集構築物を、2つのガイドRNA(その一方が逆転写反応の鋳型になり、他方が、ニックを入れるための相補的なDNA鎖を標的にする)をコードするプラスミドとともに共トランスフェクトした。標的ヌクレオチドから様々な距離にてニックを入れることを試験した(オレンジ色三角形)(図20を参照)。標的塩基対での編集効率(青色バー)を、インデル率(オレンジ色バー)と並べて示す。「なし」の例は、相補鎖へニックを入れるガイドRNAを含有しない。編集率をゲノムDNAアンプリコンのハイスループット配列決定によって定量化した。
Nicking the complementary strand with a second gRNA improves editing.
This experiment evaluates the editing efficiency of a target nucleotide when a single-stranded nick is introduced into the complementary DNA strand adjacent to the target nucleotide (with the hypothesis that this will direct mismatch repair to preferentially remove the original nucleotide and convert the base pair to the desired edit). The Cas9(H840A)-RT editing construct was co-transfected with a plasmid encoding two guide RNAs, one of which serves as a template for reverse transcription and the other of which targets the complementary DNA strand for nicking. Nicking at various distances from the target nucleotide was tested (orange triangles) (see Figure 20). The editing efficiency at the target base pair (blue bars) is shown alongside the indel rate (orange bars). The "none" example does not contain a guide RNA that nicks the complementary strand. The editing rate was quantified by high-throughput sequencing of genomic DNA amplicons.

図21は、所望のT→Aトランスバージョン突然変異と、他の主要ゲノム編集副産物が全体的に存在しないこととを示す、処理済ハイスループット配列決定データを示す。 Figure 21 shows processed high-throughput sequencing data showing the desired T->A transversion mutation and the overall absence of other major genome editing by-products.

範囲。
新しい編集技術のための潜在的な範囲を図13に示し、デアミナーゼ媒介の塩基編集因子技術と比較する。これまでに開発された塩基編集因子は、PAMの上流、~15±2bp領域を標的にする。標的CまたはAヌクレオチドを夫々、TまたはGへ変換することによって、これまでに開発された塩基編集因子は、すべてのトランジション突然変異(A:T→G:C変換)を可能にする。しかしながら、これまでに開発された塩基編集因子は、トランスバージョン突然変異(A→T、A→C、G→T、G→C、T→A、T→G、C→A、C→G)を取り入れることはできない。その上、編集窓に複数の標的ヌクレオチドがある場合、望ましくない追加の編集をもたらすことがある。
range.
The potential scope for new editing technologies is shown in Figure 13 and compared with deaminase-mediated base editor technologies. Base editors developed to date target a ~15±2 bp region upstream of the PAM. By converting targeted C or A nucleotides to T or G, respectively, base editors developed to date enable all transition mutations (A:T→G:C conversions). However, base editors developed to date cannot incorporate transversion mutations (A→T, A→C, G→T, G→C, T→A, T→G, C→A, C→G). Moreover, if there are multiple targeted nucleotides in the editing window, it may result in unwanted additional edits.

新しいプライム編集技術は理論上、いずれのヌクレオチドおよび塩基対の変換も、潜在的に小さい挿入および欠失の編集も取り入れられる。PAMに関し、プライム編集窓は、DNAへニックを入れる部位(PAMの3塩基上流)にて始まり、PAMの下流の、これまでのところ決定されていない位置にて終わる。注目すべきことに、この編集窓は、デアミナーゼ塩基編集因子とは違う。TPRT系は、DNAポリメラーゼ酵素を使用して編集を実施することから、一般性、高精度、および忠実度を包含するそれら利益のすべてを有する。 The new prime editing technology can theoretically accommodate any nucleotide and base pair change, potentially even small insertion and deletion edits. For PAM, the prime editing window begins at the site where the DNA is nicked (three bases upstream of the PAM) and ends at a so far undetermined location downstream of the PAM. Notably, this editing window is distinct from that of deaminase base editors. The TPRT system uses a DNA polymerase enzyme to perform the edits, and thus has all of those benefits, including generality, high precision, and fidelity.

患者由来細胞株中の病原性の突然変異を修正する。
関係のある突然変異を内包する細胞株(鎌状赤血球病:CD34+造血幹細胞;ウィルソン病:培養線維芽細胞;嚢胞性線維症:培養気管支上皮)を、ATCC、Coriell Biobank、またはハーバード/ブロード連携共同研究所(collaborating Harvard/Broad affiliate laboratories)から得る。編集効率をハイスループット配列決定によって評価し、修正された遺伝子型の有効性を、表現型アッセイ(ヘモグロビンHPLC、ATP7B免疫染色、およびCFTR膜電位アッセイ)を使用して試験する。
Correcting pathogenic mutations in patient-derived cell lines.
Cell lines harboring the relevant mutations (Sickle cell disease: CD34+ hematopoietic stem cells; Wilson's disease: cultured fibroblasts; Cystic Fibrosis: cultured bronchial epithelium) are obtained from ATCC, Coriell Biobank, or collaborating Harvard/Broad affiliate laboratories. Editing efficiency is assessed by high-throughput sequencing, and the efficacy of the corrected genotype is tested using phenotypic assays (hemoglobin HPLC, ATP7B immunostaining, and CFTR membrane potential assay).

オフターゲット編集活性を特徴付けする。
潜在的なオフターゲット編集を、野生型Cas9と対になった標的gRNAを使用し、GUIDE-seq55およびCIRCLE-seq56などの確立された方法でスクリーニングする。潜在的なオフターゲットが同定された場合、これらの遺伝子座をTPRT編集済細胞から探り、真のオフターゲット編集事象を同定する。
Characterize off-target editing activity.
Potential off-target editing will be screened using targeted gRNAs paired with wild-type Cas9 with established methods such as GUIDE- seq55 and CIRCLE- seq.56 If potential off-targets are identified, these loci will be probed in TPRT-edited cells to identify true off-target editing events.

潜在的な困難および代替手段。
(1)低い編集効率:プライム編集因子(PE)は各標的について最適化を要することがある。このケースにおいて、gRNAライブラリは、特定の用途への最高機能バリアントを同定するのに試験できる。RT-Cas融合体の発現および核局在化は最適化できる。リポソームRNP送達を、オフターゲット編集を制限するのに使用できる。
Potential difficulties and alternatives.
(1) Low editing efficiency: Prime editing elements (PEs) may require optimization for each target. In this case, gRNA libraries can be tested to identify the best-functioning variants for a particular application. Expression and nuclear localization of RT-Cas fusions can be optimized. Liposomal RNP delivery can be used to limit off-target editing.

次の実験。
gRNAデザインの最適化は、プライマー結合部位の長さおよび編集鋳型の伸長のさらなる探査によって達成できる。範囲および一般性を試験することは、種々のヌクレオチド変換、小さい挿入および欠失、ならびに、PAMに関する種々の編集位置、およびヒトゲノム中の複数部位を包含する。RT構成要素の最適化は、MLV RT中の活性(Rnase Hの不活化、プライマー-鋳型結合親和性の増大、処理能力(processivity)の調整)を増強する突然変異、および新しいRT酵素(グループIIイントロンRT、他のレトロウイルスのRT)中の突然変異を探査することを包含する。
Next experiment.
Optimization of gRNA design can be achieved by further exploration of primer binding site length and editing template extension. Testing scope and generality includes various nucleotide conversions, small insertions and deletions, and various editing positions relative to the PAM and multiple sites in the human genome. Optimization of RT components includes exploring mutations that enhance activity in MLV RT (inactivation of Rnase H, increasing primer-template binding affinity, tuning processivity) and mutations in new RT enzymes (group II intron RT, RT of other retroviruses).

有意性。
無数の遺伝性障害は、個々の遺伝子中の単一ヌクレオチドの変化からもたらされる。ここに記載のゲノム編集技術を開発すること、およびこれを疾患に関係のある細胞型に適用することは、臨床へ移行するための基礎を確立するであろう。鎌状赤血球病などのいくつかの疾患について、単一の点突然変異は、その集団全体にわたって優性遺伝子型を表す。しかしながら、多くの他の遺伝性障害について、単一遺伝子内の種々の点突然変異の大きな不均一性は、患者集団(この各々は同様の疾患表現型を生じている)全体にわたって観察される。したがって、一般のゲノム編集方法は理論上かかる多数の突然変異を標的にできるところ、この技術はこれら患者および彼らの家族の多くへ莫大な潜在的利益を提供できる。これら適用のための原理の証明が細胞中で確立できた場合、疾患の動物モデルにおいて研究するための基盤を確立するであろう。
Significance.
A myriad of genetic disorders result from single nucleotide changes in individual genes. Developing the genome editing technology described here and applying it to disease-relevant cell types will establish the basis for moving to the clinic. For some diseases, such as sickle cell disease, a single point mutation represents the dominant genotype throughout the population. However, for many other genetic disorders, a large heterogeneity of different point mutations within a single gene is observed throughout the patient population, each of which results in a similar disease phenotype. Thus, common genome editing methods could theoretically target such a large number of mutations, providing enormous potential benefits to many of these patients and their families. If proof of principle for these applications can be established in cells, it will establish the basis for studying in animal models of disease.

利点
高精度:所望の編集は、核酸配列にコード、指向される。一般性:理論上、トランスバージョン編集、ならびに小さい挿入または欠失を包含する、いずれの塩基対変換もなし得る。Cas9プロトスペーサー隣接モチーフ(PAM)配列に関する塩基編集因子とは違う編集窓がある。この方法は相同組み換え修復(HDR)の編集能の多くを獲得するが、HDRの主な欠点(ほとんどの細胞型において非効率であって、大抵、インデルなどの望ましくない過剰の副産物が付随する)がない。前記方法はまた、二本鎖DNA破壊(DSB)、極少数のインデル、転座、大きな欠失、p53活性化等々もない。
Advantages High precision: the desired edits are encoded and directed in the nucleic acid sequence. Generality: in theory, any base pair change can be made, including transversion edits as well as small insertions or deletions. There is a different editing window than base editors for the Cas9 protospacer adjacent motif (PAM) sequence. This method captures many of the editing capabilities of homology-directed repair (HDR), but without the major drawbacks of HDR (inefficiency in most cell types, often accompanied by excess unwanted by-products such as indels). The method also lacks double-stranded DNA breaks (DSBs), very few indels, translocations, large deletions, p53 activation, etc.

例2-エラーを起こしやすいプライム編集(PE)Example 2 – Error-prone Prime Editing (PE)

本明細書に記載のプライム編集(PE)システムは、ゲノム上に変異を組み入れるためにエラーを起こしやすい逆転写酵素酵素と併せてもまた用いられ得る。 The prime editing (PE) system described herein can also be used in conjunction with error-prone reverse transcriptase enzymes to incorporate mutations into the genome.

ある態様が図22に図示されている。これは、標的座位に対してエラーを起こしやすい逆転写酵素による標的化された変異導入を行うための例示のプロセスの模式図であり、伸長されたガイドRNAと複合体化した核酸プログラム型DNA結合タンパク質(napDNAbp)を用いている。このプロセスは標的化された変異導入のためのプライム編集のある態様と言われ得る。伸長されたガイドRNAは、ガイドRNAの3'もしくは5'端にまたはガイドRNAの分子内の位置付けに伸長を含む。ステップ(a)では、napDNAbp/gRNA複合体がDNA分子に接触し、gRNAがnapDNAbpをガイドして、変異導入されるべき標的座位に結合させる。ステップ(b)では、ニックが標的座位のDNAの鎖の1つに導入され(例えば、ヌクレアーゼまたは化学的薬剤による)、それによって利用可能な3'端を標的座位の鎖の1つに生出する。ある態様において、ニックは、Rループ鎖に対応するDNAの鎖、すなわちガイドRNA配列にハイブリダイズされない鎖上に生出される。ステップ(c)では、3'端DNA鎖が、逆転写をプライムするためにガイドRNAの伸長された部分と相互作用する。ある態様において、3'端DNA鎖は、ガイドRNAの伸長された部分の特定のRTプライム配列にハイブリダイズする。ステップ(d)では、エラーを起こしやすい逆転写酵素が導入され、これが、プライムされた部位の3'端からガイドRNAの3'端の方へDNAの変異導入された一本鎖を合成する。例示の変異がアステリスク「*」によって指示されている。これは所望の変異導入された領域を含む一本鎖DNAフラップを形成する。ステップ(e)では、napDNAbpおよびガイドRNAがリリースされる。ステップ(f)および(g)は一本鎖DNAフラップ(変異導入された領域を含む)の分解に関し、その結果、所望の変異導入された領域が標的座位に組み込まれるようになる。このプロセスは、ひとたび3'一本鎖DNAフラップが他の鎖上の相補的な配列に侵入およびハイブリダイズすると形成する対応する5'内生DNAフラップを除去することによって、所望の産物形成の方へ駆動され得る。プロセスは、図1Fにおいて例示されるとおり第2鎖ニッキングによってもまた産物形成の方へ駆動され得る。内生DNA修復および/または複製プロセス後に、変異導入された領域はDNA座位のDNAの両方の鎖上に組み込まれるようになる。 An embodiment is illustrated in FIG. 22, which is a schematic diagram of an exemplary process for performing error-prone reverse transcriptase targeted mutagenesis at a target locus, using a nucleic acid programmable DNA binding protein (napDNAbp) complexed with an extended guide RNA. This process may be referred to as an embodiment of prime editing for targeted mutagenesis. The extended guide RNA includes an extension at the 3' or 5' end of the guide RNA or at the intramolecular positioning of the guide RNA. In step (a), the napDNAbp/gRNA complex contacts the DNA molecule, and the gRNA guides the napDNAbp to bind to the target locus to be mutagenized. In step (b), a nick is introduced (e.g., by a nuclease or chemical agent) into one of the strands of the DNA at the target locus, thereby generating an available 3' end on one of the strands at the target locus. In an embodiment, the nick is generated on the strand of DNA corresponding to the R-loop strand, i.e., the strand that is not hybridized to the guide RNA sequence. In step (c), the 3'-end DNA strand interacts with the extended portion of the guide RNA to prime reverse transcription. In some embodiments, the 3'-end DNA strand hybridizes to a specific RT prime sequence of the extended portion of the guide RNA. In step (d), an error-prone reverse transcriptase is introduced, which synthesizes a mutated single strand of DNA from the 3'-end of the primed site toward the 3'-end of the guide RNA. Exemplary mutations are indicated by an asterisk "*". This forms a single-stranded DNA flap containing the desired mutated region. In step (e), the napDNAbp and the guide RNA are released. Steps (f) and (g) involve the degradation of the single-stranded DNA flap (containing the mutated region), so that the desired mutated region is integrated into the target locus. This process can be driven toward the desired product formation by removing the corresponding 5' endogenous DNA flap that forms once the 3' single-stranded DNA flap invades and hybridizes to a complementary sequence on the other strand. The process can also be driven toward product formation by second strand nicking as illustrated in Figure 1F. After endogenous DNA repair and/or replication processes, the mutated region becomes incorporated onto both strands of DNA at the DNA locus.

例3-PEによるトリヌクレオチド反復短縮
本明細書に記載のプライム編集システムまたはプライム編集(PE)システムは、トリヌクレオチド反復変異(または「トリプレット拡大疾患」)を短縮してハンチントン病および他のトリヌクレオチド反復障害などの疾病を処置するために用いられ得る。理論によって拘束されることなしに、トリプレット拡大はDNA複製またはDNA修復合成の間のスリップによって引き起こされる。タンデム反復は互いに同一の配列を有するので、2つのDNA鎖間の塩基対形成は配列上の複数の点において生起し得る。これはDNA複製またはDNA修復合成の間の「ループアウト」構造の形成に至り得る。これは繰り返し配列の繰り返しのコピーに至り得、反復数を伸長させる。ハイブリッドRNA:DNA中間体が関わる追加の機序が提案されている。プライム編集は、害をなす繰り返しのコドントリプレットの(or)1つ以上を欠失させること(deletion)によって、これらのトリプレット拡大領域を縮減または消去するために用いられ得る。この使用のある態様では、図23が、プライム編集によってトリヌクレオチド反復配列を短縮または縮減するためのPEgRNAデザインの模式図を提供する。
Example 3 - Trinucleotide Repeat Truncation by PE The prime editing system or prime editing (PE) system described herein can be used to shorten trinucleotide repeat mutations (or "triplet expansion diseases") to treat diseases such as Huntington's disease and other trinucleotide repeat disorders. Without being bound by theory, triplet expansion is caused by slippage during DNA replication or DNA repair synthesis. Because the tandem repeats have identical sequences to each other, base pairing between the two DNA strands can occur at multiple points along the sequence. This can lead to the formation of "loop-out" structures during DNA replication or DNA repair synthesis. This can lead to repeated copies of the repeat sequence, expanding the number of repeats. An additional mechanism involving a hybrid RNA:DNA intermediate has been proposed. Prime editing can be used to reduce or eliminate these triplet expansion regions by deletion of one or more of the offending repeated codon triplets. In one embodiment of this use, Figure 23 provides a schematic of PEgRNA design for shortening or reducing trinucleotide repeat sequences by prime editing.

それゆえに、プライム編集は、ハンチントン病、脆弱X症候群、およびフリードライヒ運動失調症を包含するいずれかのトリヌクレオチド反復障害を修正するために用いられる能力があり得る。 Therefore, prime editing may be capable of being used to correct any trinucleotide repeat disorder, including Huntington's disease, Fragile X syndrome, and Friedreich's ataxia.

最も普通のトリヌクレオチド反復はCAGトリプレットを含有するが、GAAトリプレット(フリードライヒ運動失調症)およびCGGトリプレット(脆弱X症候群)もまた生起する。CAGトリプレットはグルタミン(Q)をコードし、それゆえに、CAG反復は有疾患タンパク質のコード領域においてはポリグルタミントラクトをもたらす。トリヌクレオチド反復障害のこの具体的なクラスは「ポリグルタミン(ポリQ)疾患」ともまた呼ばれる。他のトリヌクレオチド反復は遺伝子制御の変改を引き起こし得、「非ポリグルタミン疾患」と言われる。拡大の素因を受け継ぐことまたはすでに伸長した親のアレルを獲得することは、疾患を獲得する蓋然性を増大させる。トリヌクレオチド反復の病原性の拡大はプライム編集を用いて修正され得る。 The most common trinucleotide repeat contains a CAG triplet, but GAA triplets (Friedreich's ataxia) and CGG triplets (Fragile X syndrome) also occur. The CAG triplet codes for glutamine (Q), and therefore, CAG repeats result in polyglutamine tracts in the coding regions of diseased proteins. This specific class of trinucleotide repeat disorders is also called "polyglutamine (polyQ) diseases". Other trinucleotide repeats can cause alterations in gene regulation and are referred to as "non-polyglutamine diseases". Inheriting a predisposition to the expansion or acquiring an already expanded parental allele increases the probability of acquiring the disease. Pathogenic expansions of trinucleotide repeats can be corrected using prime editing.

プライム編集は、カットされる部位へと標的化される充当されたPEgRNAを含むプライム編集因子によって、トリプレット反復領域の上流の領域へニックを入れることによって、トリプレット拡大領域を短縮するように実装され得る。それから、プライム編集因子は、健康な数のトリプレット反復(これは具体的な遺伝子および疾患に依存する)をコードする鋳型(すなわち、その編集鋳型)としてのPEgRNAに基づく新たなDNA鎖(ssDNAフラップ)を合成する。健康なトリプレット反復配列を含む新たに合成されたssDNA鎖は、また、反復の他端に隣接する配列にマッチする相同性の短いストレッチ(すなわち相同アーム)を包含するように合成される(赤色の鎖)。新たに合成された鎖の侵入、および新たに合成されたssDNAフラップによる内生DNAの爾後の置き換えは、短縮された反復アレルに至る。 Prime editing can be implemented to shorten the triplet expansion region by nicking a region upstream of the triplet repeat region with a prime editor containing a dedicated PEgRNA targeted to the site to be cut. The prime editor then synthesizes a new DNA strand (ssDNA flap) based on the PEgRNA as a template (i.e., its editing template) that encodes a healthy number of triplet repeats (this depends on the specific gene and disease). The newly synthesized ssDNA strand containing the healthy triplet repeat sequence is also synthesized to include a short stretch of homology (i.e., a homology arm) that matches the sequence adjacent to the other end of the repeat (red strand). Invasion of the newly synthesized strand and subsequent replacement of the endogenous DNA by the newly synthesized ssDNA flap leads to a shortened repeat allele.

例4-PEによるペプチドタグ付け
本明細書に記載のプライム編集システム(すなわち、PEシステム)は、種々のペプチドタグをタンパク質コード遺伝子上に導入するためにもまた用いられ得る。かかるタグはHEXAヒスチジンタグ、FLAGタグ、V5タグ、GCN4タグ、HAタグ、Mycタグ、および他を包含し得る。このアプローチは、タンパク質蛍光標識、免疫沈降、イムノブロッティング、免疫組織化学、タンパク質動員、誘導可能なタンパク質デグロン、およびゲノムワイドスクリーニングなどの適用に有用であり得る。態様が図25および26に図示されている。
Example 4 - Peptide tagging with PE The prime editing system described herein (i.e., the PE system) can also be used to introduce various peptide tags onto protein-coding genes. Such tags can include HEXA histidine tags, FLAG tags, V5 tags, GCN4 tags, HA tags, Myc tags, and others. This approach can be useful for applications such as protein fluorescent labeling, immunoprecipitation, immunoblotting, immunohistochemistry, protein mobilization, inducible protein degrons, and genome-wide screening. An embodiment is illustrated in Figures 25 and 26.

図25は、内生ゲノム座位の遺伝子をペプチドタグ付けするためのgRNAデザインと、TPRTゲノム編集(すなわち、プライム編集)によるペプチドタグ付けとを示す模式図である。FlAsHおよびReAsHタグ付けシステムは2つのパーツを含む:(1)フルオロフォア-二ヒ素系プローブおよび(2)配列FLNCCPGCCMEP(配列番号1)によって例示されるテトラシステインモチーフを含有する遺伝子によってコードされるペプチドである。細胞内で発現されるときに、テトラシステインモチーフを含有するタンパク質はフルオロフォア-ヒ素プローブによって蛍光標識され得る(ref:J.Am.Chem.Soc.,2002,124(21),pp 6063-6076.DOI:10.1021/ja017687nを見よ)。「ソルタギング」システムは、標識されたペプチドプローブを好適なペプチド基質を含有するタンパク質に共有結合的にコンジュゲート化する細菌ソルターゼ酵素を使用する(ref:Nat.Chem.Biol.2007 Nov;3(11):707-8.DOI:10.1038/nchembio.2007.31を見よ)。FLAGタグ(DYKDDDDK(配列番号2))、V5タグ(GKPIPNPLLGLDST(配列番号3))、GCN4タグ(EELLSKNYHLENEVARLKK(配列番号4))、HAタグ(YPYDVPDYA(配列番号5))、およびMycタグ(EQKLISEEDL(配列番号6))はエピトープタグとしてイムノアッセイに普通に使用される。パイクランプはペンタフルオロ-芳香族基質によって標識され得るペプチド配列(FCPF)(配列番号622)をコードする(ref:Nat.Chem.2016 Feb;8(2):120-8.doi:10.1038/nchem.2413)。 Figure 25 is a schematic diagram showing gRNA design for peptide tagging of genes at endogenous genomic loci and peptide tagging by TPRT genome editing (i.e., prime editing). The FlAsH and ReAsH tagging systems include two parts: (1) a fluorophore-biarsenical probe and (2) a peptide encoded by a gene containing a tetracysteine motif, exemplified by the sequence FLNCCPGCCMEP (SEQ ID NO: 1). When expressed in cells, proteins containing a tetracysteine motif can be fluorescently labeled by the fluorophore-arsenical probe (see ref: J. Am. Chem. Soc., 2002, 124(21), pp 6063-6076. DOI: 10.1021/ja017687n). The "sortagging" system uses bacterial sortase enzymes to covalently conjugate labeled peptide probes to proteins containing suitable peptide substrates (see ref: Nat. Chem. Biol. 2007 Nov;3(11):707-8. DOI:10.1038/nchembio.2007.31). The FLAG tag (DYKDDDDK (SEQ ID NO:2)), V5 tag (GKPIPNPLLGLDST (SEQ ID NO:3)), GCN4 tag (EELLSKNYHLENEVARLKK (SEQ ID NO:4)), HA tag (YPYDVPDYA (SEQ ID NO:5)), and Myc tag (EQKLISEEDL (SEQ ID NO:6)) are commonly used in immunoassays as epitope tags. The pike clamp encodes a peptide sequence (FCPF) (sequence number 622) that can be labeled with a pentafluoro-aromatic substrate (ref: Nat. Chem. 2016 Feb;8(2):120-8.doi:10.1038/nchem.2413).

図26は、ゲノムDNA上へのHis6タグおよびFLAGタグの精密な組み入れを示す。18nt Hisタグ挿入または24nt FLAGタグ挿入どちらかをコードする逆転写鋳型を有するHEK3座位を標的化するガイドRNAをデザインした。トランスフェクションされたHEK細胞の編集効率をアンプリコン配列決定を用いて評価した。FLAGタグの完全な24nt配列はビューフレーム外であるということに注意せよ(配列決定は完全なかつ精密な挿入を確認した)。 Figure 26 shows the precise incorporation of His6 and FLAG tags onto genomic DNA. Guide RNAs were designed to target the HEK3 locus with reverse transcription templates encoding either an 18nt His tag insertion or a 24nt FLAG tag insertion. Editing efficiency in transfected HEK cells was assessed using amplicon sequencing. Note that the complete 24nt sequence of the FLAG tag is outside the view frame (sequencing confirmed complete and precise insertion).

例5-PEによるプリオン病の防止または処置Example 5 – Prevention or treatment of prion disease with PE

本発明はヒト、家畜、および野生生物のプリオン病の問題に対処することを助け得る。先に記載されている編集戦略は、防護性変異を組み入れまたはPRNPを確かにノックダウンするために十分に効率的かつクリーンではない。Cas9ヌクレアーゼおよびHDRは用いられ得るが、ほぼPRNPインデルバリアントの混合物を生成するであろう。これらのいくつかは病原性であると考えられる。その上、HDRは細胞のほとんどの型においては働かない。プライム編集は、余分な二本鎖DNA切断またはもたらされるインデルを生成することなしに、変異の両方の型を組み入れることにおいて確かでかつ効率的である。 The present invention may help address the problem of prion disease in humans, livestock, and wildlife. Previously described editing strategies are not efficient and clean enough to incorporate protective mutations or reliably knock down PRNP. Cas9 nuclease and HDR could be used, but would generate a mixture of mostly PRNP indel variants. Some of these are thought to be pathogenic. Moreover, HDR does not work in most types of cells. Prime editing is reliable and efficient in incorporating both types of mutations without generating extra double-stranded DNA breaks or resulting indels.

本発明は、どのようにしてプリオン病を防止またはその進行を停止させるPRNPの防護性変異を組み入れるのかを記載する。この部位は哺乳動物において保存され、そのため、ヒト疾患を処置することに加えて、それはプリオン病に対して免疫がある牛および羊を生成するかまたはさらにはプリオン病を患う動物の野生集団を治癒させることを助けるためにもまた用いられ得る。プライム編集はヒト細胞における天然に存在する防護性アレルの~25%の組み入れを達成するためにすでに用いられており、先のマウス実験は、このレベルの組み入れがほとんどのプリオン病に対する免疫を引き起こすために十分であるということを指示している。この方法は、かかる高い効率でほとんどの細胞型においてこのアレルを組み入れるための第1のかつ可能性としては唯一の現行のやり方である。処置のための別の可能な戦略は、プライム編集を用いて、早期停止コドンを遺伝子に組み入れることによってPRNPの発現を縮減または消去することである。多くの研究者がそうすることは疾患を処置するであろうということを予測している。 The present invention describes how to incorporate protective mutations in PRNP that prevent or halt the progression of prion disease. This site is conserved in mammals, so in addition to treating human disease, it can also be used to generate cattle and sheep that are immune to prion disease or even help cure wild populations of animals that suffer from prion disease. Prime editing has already been used to achieve incorporation of ∼25% of the naturally occurring protective allele in human cells, and previous mouse experiments indicate that this level of incorporation is sufficient to induce immunity to most prion diseases. This method is the first and potentially only current way to incorporate this allele in most cell types with such high efficiency. Another possible strategy for treatment is to use prime editing to reduce or eliminate expression of PRNP by incorporating a premature stop codon into the gene. Many researchers predict that doing so will treat the disease.

3つの可能性ある治療学的戦略は、PrPの発現を縮減するためのプライム編集を包含する。このゴールは、未成熟停止コドンをPRNPに引き起こすか、スタートコドンを消去するか、必須アミノ酸コドンを変異もしくは欠失させるか、異状な転写物を生成するためのスプライス部位を導入もしくは除去するか、または転写物レベルを縮減する制御エレメントを変改する変異の導入によって達成され得る。疾患変異を消去するためのプライム編集。疾患に罹患する増大した蓋然性に至るPRNPの多くのバリアントが記載されている(ncbi.nlm.nih.gov/pmc/articles/PMC6097508/#b154-ndt-14-2067)。プライム編集は全ての可能な型の点変異、局所的挿入、および局所的欠失をなし得るので、各公知のバリアントはプライム編集を用いて逆転させられ得る。プリオン形成および/または伝達を遮断する1つ以上の防護性変異をPRNPに導入するためのプライム編集。例えば、ヒトPRNP遺伝子のG127Vは、プリオン病の多くの形態から防護することが実証されている(ncbi.nlm.nih.gov/pmc/articles/PMC4486072/)。後に、この変異は安定なベータシートおよび二量体の形成を防止することによってプリオン形成に干渉することが記載された(ncbi.nlm.nih.gov/pubmed/30181558、ncbi.nlm.nih.gov/pubmed/26906032)。1ヌクレオチド多型の導入に加えて、プリオン形成に干渉するであろうPRNP上の配列の挿入または欠失もまた、プリオン病から防護またはそれを処置するために用いられ得る。 Three potential therapeutic strategies include prime editing to reduce the expression of PrP. This goal can be achieved by introducing mutations that cause a premature stop codon in PRNP, erase the start codon, mutate or delete an essential amino acid codon, introduce or remove a splice site to generate an aberrant transcript, or alter a regulatory element to reduce transcript levels. Prime editing to erase disease mutations. Many variants of PRNP that lead to an increased probability of suffering from the disease have been described (ncbi.nlm.nih.gov/pmc/articles/PMC6097508/#b154-ndt-14-2067). Each known variant can be reversed using prime editing, since prime editing can make all possible types of point mutations, local insertions, and local deletions. Prime editing to introduce one or more protective mutations into PRNP that block prion formation and/or transmission. For example, G127V in the human PRNP gene has been demonstrated to protect against many forms of prion disease (ncbi.nlm.nih.gov/pmc/articles/PMC4486072/). This mutation was later described to interfere with prion formation by preventing the formation of stable beta sheets and dimers (ncbi.nlm.nih.gov/pubmed/30181558, ncbi.nlm.nih.gov/pubmed/26906032). In addition to the introduction of single nucleotide polymorphisms, the insertion or deletion of sequences on PRNP that would interfere with prion formation can also be used to protect against or treat prion disease.

防護性のバリアントの導入は相対的に小さい数の細胞が編集を経験するときでさえも利益を付与し得るので、第3の治療学的戦略は特に有利である。さらにその上、防護性のバリアント、特にG127Vなどのヒト集団に天然に存在するものの導入は、いずれかの不利益な帰結を有することは予想されないであろうが、PRNPノックアウトマウスにおいて立証されているとおり、戦略1のようにプリオンタンパク質の発現を縮減することはいくつかの不利益な表現型を有し得る(ncbi.nlm.nih.gov/pmc/articles/PMC4601510/、ncbi.nlm.nih.gov/pmc/articles/PMC2634447/)。 The third therapeutic strategy is particularly advantageous because the introduction of a protective variant may confer benefit even when a relatively small number of cells undergo editing. Furthermore, the introduction of a protective variant, particularly one that occurs naturally in the human population, such as G127V, would not be expected to have any adverse consequences, whereas reducing expression of the prion protein as in strategy 1 may have some adverse phenotypes, as has been demonstrated in PRNP knockout mice (ncbi.nlm.nih.gov/pmc/articles/PMC4601510/, ncbi.nlm.nih.gov/pmc/articles/PMC2634447/).

およそ2:1の比の野生型ヒトプリオンタンパク質:ヒトプリオンタンパク質の防護性G127Vバリアント(防護性のバリアントのおよそ33%発現)を発現するマウスは、プリオン病のほとんどの試験された形態に対して全く免疫があり、牛海綿状脳症(BSEまたは狂牛病)から伝達されるヒト疾患の変異型クロイツフェルト・ヤコブ病(vCJD)に対してもまた耐性であったということが先に実証されている91。防護性のG127Vバリアントのみを発現するマウスは、vCJDを包含する全ての試験されたプリオン病課題に対して全く免疫があった。 It has previously been demonstrated that mice expressing an approximately 2:1 ratio of wild-type human prion protein:the protective G127V variant of human prion protein (approximately 33% expression of the protective variant) were completely immune to most tested forms of prion disease and were also resistant to variant Creutzfeldt-Jakob disease (vCJD), a human disease transmitted from bovine spongiform encephalopathy (BSE or mad cow disease) .91 Mice expressing only the protective G127V variant were completely immune to all tested prion disease challenges, including vCJD.

防護性のG127V変異はプライム編集を用いて組織培養においてヒト細胞に効率的に組み入れられ得るということが本願において実証される(図27を見よ)。 It is demonstrated herein that the protective G127V mutation can be efficiently introduced into human cells in tissue culture using prime editing (see Figure 27).

これらの結果によって情報提供され、PRNP編集が用いられ得る3つの設定が記載される。1つの設定のPRNP編集は、プリオン病を防止または処置するためのヒト患者におけるプライム編集に用いられ得る。第2の設定のPRNP編集は、プリオン病の生起および広がりを防止するための家畜におけるプライム編集に(is)用いられ得る。牛および羊両方の家畜は、PRNP遺伝子によって生成されるタンパク質によって引き起こされるプリオン病の特発性の生起を経験している。動物が患う衰弱性のかつ致命的な疾患に加えて、これらのケースは経済的にもまた破壊的である。部分的には、極めて感染性の疾患の広がりを防止するために取られなければならないケアを原因とする。ワシントン州の単一の乳牛が2003年の12月にBSEについて検査陽性となり、これは次の年の牛肉売上の28-42億ドルという推測される損失に至った(bookstore.ksre.ksu.edu/pubs/MF2678.pdf)。PRNP遺伝子は哺乳動物において高度に保存されている。G127VなどのPRNP変異を家畜生殖細胞系列に導入することは、BSEまたは羊におけるプリオン病の現れのスクレイピーの生起を消去し得る。第3の設定のPRNP編集は野生生物のプライム編集に(is)用いられ得、野生のプリオン病の広がりを防止し得る。現行では、北米の鹿、ヘラジカ、およびムースを包含するシカ科集団が、これらの種においてPNRPによって引き起こされるプリオン病の現れの慢性消耗病(CWD)を患う。生起はいくつかの集団においては25%ほども高いことが報告されている(cdc.gov/prions/cwd/occurrence.html)。CWDはノルウェー、フィンランド、および韓国においてもまた報告されている。疾患がこれらの種からヒト(cdc.gov/prions/cwd/transmission.html)または家畜へと伝達性であるかどうかはまだ未知である。これらの種の生殖細胞系列におけるG127VなどのPRNP変異の導入は、それらをCWDから防護し得、ヒトを包含する他の種への伝達のリスクを縮減し得る。 Informed by these results, three settings are described in which PRNP editing may be used. One setting, PRNP editing, may be used for prime editing in human patients to prevent or treat prion disease. A second setting, PRNP editing, may be used for prime editing in livestock to prevent the occurrence and spread of prion disease. Livestock, both cattle and sheep, have experienced idiopathic occurrences of prion disease caused by the protein produced by the PRNP gene. In addition to the debilitating and fatal disease suffered by the animals, these cases are also economically devastating, in part due to the care that must be taken to prevent the spread of the highly infectious disease. A single dairy cow in Washington state tested positive for BSE in December 2003, leading to an estimated loss of $2.8-4.2 billion in beef sales the following year (bookstore.ksre.ksu.edu/pubs/MF2678.pdf). The PRNP gene is highly conserved in mammals. Introducing PRNP mutations such as G127V into the germline of livestock may eliminate the occurrence of BSE or scrapie, a prion disease manifestation in sheep. A third set of PRNP edits may be used to prime wildlife to prevent the spread of prion disease in the wild. Currently, cervid populations, including North American deer, elk, and moose, suffer from chronic wasting disease (CWD), a prion disease manifestation caused by PNRP in these species. Incidence has been reported to be as high as 25% in some populations (cdc.gov/prions/cwd/occurrence.html). CWD has also been reported in Norway, Finland, and Korea. It is not yet known whether the disease is transmissible from these species to humans (cdc.gov/prions/cwd/transmission.html) or livestock. Introducing PRNP mutations such as G127V in the germline of these species may protect them from CWD and reduce the risk of transmission to other species, including humans.

この方法はクロイツフェルト・ヤコブ病(CJD)、クールー病、ゲルストマン・ストロイスラー・シャインカー病、致死性家族性不眠症(FFI)、牛海綿状脳症(BSE;狂牛病)、スクレイピー(羊)、および慢性消耗病(CWD;鹿、ヘラジカ、およびムース)を処置するために用いられ得る。 This method can be used to treat Creutzfeldt-Jakob disease (CJD), kuru, Gerstmann-Straussler-Scheinker disease, fatal familial insomnia (FFI), bovine spongiform encephalopathy (BSE; mad cow disease), scrapie (sheep), and chronic wasting disease (CWD; deer, elk, and moose).

方法は、胚または成体ニューロンのための送達方法論、例えばマイクロインジェクション、脂質ナノ粒子、またはAAVベクターと組み合わせられることを必要とするであろう。 The method will need to be combined with delivery methodologies for embryonic or adult neurons, such as microinjection, lipid nanoparticles, or AAV vectors.

例6-PEを用いるRNAタグ付けおよび操作
哺乳類、真核生物、および細菌細胞においてRNAをタグ付けまたは別様に操作する遺伝子配列上へのモチーフの挿入のための新たな方法が、本明細書に記載の。ヒトゲノムの1%のみがタンパク質をコードするということが見積もられているが、ゲノムの実質的に全ては何らかのレベルで転写される。もたらされる非コードRNA(ncRNA)のどれくらい多くが機能的な役割を演ずるのか、ましてやこれらの推定RNAのほとんどの役割が何であるのかは、未解決の問いかけである。目当ての遺伝子上への有用な特性を有する新規のRNAコード配列の挿入によるこれらのRNA分子の「タグ付け」は、細胞におけるRNA分子の生物学的機能を研究するための有用な方法である。それは、どのようにしてmRNA修飾が細胞機能に影響し得るかを撹乱し、それゆえにより良く理解するための手段として、タンパク質をコードするmRNA上にタグを組み入れるにもまた有用であり得る。例えば、ユビキタスな天然のRNAタグのポリアデニル化は、細胞質へのmRNAの輸送に影響するために細胞によって用いられる。異なる型のポリアデニル化シグナルは、異なる輸送速度および異なるmRNA寿命、それゆえにコードされるタンパク質が発現されるレベルの違いをもたらす。
Example 6 - RNA tagging and manipulation using PE Described herein are new methods for the insertion of motifs onto gene sequences to tag or otherwise manipulate RNA in mammalian, eukaryotic, and bacterial cells. Although it has been estimated that only 1% of the human genome codes for proteins, virtually all of the genome is transcribed at some level. It remains an open question how many of the resulting non-coding RNAs (ncRNAs) play functional roles, much less what the role of most of these putative RNAs is. "Tagging" these RNA molecules by the insertion of novel RNA coding sequences with useful properties onto genes of interest is a useful method to study the biological function of RNA molecules in cells. It may also be useful to incorporate tags onto mRNAs that code for proteins as a means to perturb and therefore better understand how mRNA modifications can affect cellular functions. For example, polyadenylation, a ubiquitous natural RNA tag, is used by cells to affect the transport of mRNAs into the cytoplasm. Different types of polyadenylation signals result in different transport rates and different mRNA lifetimes and hence different levels at which the encoded protein is expressed.

タグ付けされたRNAを細胞内で発現するための普通のアプローチは、合成構築物を外因的に導入することであり、(i)短期的な突発的な遺伝子発現を多くの場合には超生理学的レベルで生ずる一過性プラスミドトランスフェクション;または(ii)遷延した発現を可能化するレンチウイルス取り入れもしくはトランスポゾンを用いるゲノム上への(ランダムな部位における)タグ付けされたRNA遺伝子の永久的な取り入れどちらかを用いる。これらのアプローチの両方は、変改された発現レベルの生産によっておよび遺伝子の発現または活性を制御する天然の機序の不在によって限定される。代替的な戦略は、Cas9または他の標的化されたDNAヌクレアーゼによって誘導される二本鎖DNA切断の相同組み換え修復(HDR)を用いて、目当ての遺伝子をその内生座位において直接的にタグ付けすることである。このアプローチは広い範囲の内生でタグ付けされた遺伝子の生成を可能化するが、HDRは顕著に非効率的であり、そのため、首尾良くタグ付けされた細胞の所望のクローン集団を同定するための有意なスクリーニングを要求する。その上、HDRは、多数の細胞型、最も注意すべきことに有糸分裂後細胞において典型的には非常に非効率的または全く不活性である。HDRの低い効率は望まれないインデル産物の生成によってさらに複雑化し、これはRNA遺伝子のケースにおいて特に問題であり得る。なぜなら、それらはその活性が正常アレルの機能に干渉するRNAの生産に至り得るからである。最後に、最適な性能を達成するためには、研究者は多くの場合にはRNA分子上の種々のタグ付け位置をスクリーニングすることを必要とする。組み合わせると、これらの欠点は、HDRをRNA上のタグの組み入れのためのより望ましくない方法にしている。 The common approach to express tagged RNA in cells is to exogenously introduce synthetic constructs, either (i) using transient plasmid transfection, which results in short-term bursts of gene expression, often at supraphysiological levels; or (ii) permanent incorporation of tagged RNA genes (at random sites) into the genome using lentiviral incorporation or transposons, which allow for sustained expression. Both of these approaches are limited by the production of altered expression levels and by the absence of native mechanisms to control gene expression or activity. An alternative strategy is to directly tag the gene of interest at its endogenous locus, using homology-directed repair (HDR) of double-stranded DNA breaks induced by Cas9 or other targeted DNA nucleases. Although this approach allows for the generation of a wide range of endogenously tagged genes, HDR is significantly inefficient and therefore requires significant screening to identify the desired clonal population of successfully tagged cells. Moreover, HDR is typically very inefficient or completely inactive in many cell types, most notably in postmitotic cells. The low efficiency of HDR is further complicated by the generation of unwanted indel products, which can be particularly problematic in the case of RNA genes, as they can lead to the production of RNA whose activity interferes with the function of normal alleles. Finally, to achieve optimal performance, researchers often need to screen various tagging positions on the RNA molecule. Combined, these drawbacks make HDR a less desirable method for the incorporation of tags on RNA.

プライム編集は新たなゲノム編集テクノロジーであり、これはRNAからDNAへの遺伝情報の移入によってゲノム座位の標的化された編集を可能化する。プライム編集を用いて、RNA遺伝子は、種々の構成要素、例えばRNAアプタマー、リボザイム、または他のRNAモチーフによってタグ付けされ得る。プライム編集は、HDR戦略と比較して、多大な種々の細胞型において高速、安価、有効であるポテンシャルを有する。そのため、記載される発明は、健康および疾患におけるRNA遺伝子の生物学を取り調べるための新規の有用なかつ非自明のツールを表す。プライム編集因子(PE)を用いてRNAをタグ付けまたは別様に操作する遺伝子配列上へのRNAモチーフの挿入のための新たな方法が、本明細書に記載の。PEは、CRISPR/Casシステムによって標的化可能である所望のゲノム座位において、複数のヌクレオチドを部位特異的に挿入、変異、および/または欠失させることができる。PEはCas9ヌクレアーゼドメインと逆転写酵素ドメインとの間の融合体からなる。それらは、DNA標的化のためのガイドスペーサー部分と所望のゲノム編集をコードする逆転写の鋳型とを含有する操作されたPEgRNA(プライム編集ガイドRNA)によってそれらのゲノム標的へとガイドされる(図28Aを見よ)。PEは、RNAレベルで機能的であるモチーフ(これ以降ではRNAモチーフ)を挿入して非コードRNAまたはmRNAをタグ付けまたは別様に操作するために用いられ得るということが想定される。これらのモチーフは、遺伝子発現を増大させるか、遺伝子発現を減少させるか、スプライシングを変改するか、転写後修飾を変化させるか、RNAの細胞下レベル位置付けに影響するか、RNAの単離またはその細胞内もしくは外の位置付けの決定を可能化するか(例えば、蛍光RNAアプタマー、例えばSpinach、Spinach2、Baby Spinach、またはBroccoliを用いる)、内生または外因的なタンパク質またはRNA結合因子を動員するか、sgRNAを導入するか、あるいは自己切断またはRNAseどちらかによるRNAのプロセシングを誘導するための用をなし得る(図28Bを見よ)。プライム編集のフレキシビリティーを原因として、ゲノム上に組み入れられ得るRNAモチーフの網羅的なリストを提供することは可能ではない。ここでは、RNA遺伝子にタグ付けするために用いられ得るPEによって組み入れされるRNAモチーフの予測される範囲を幅広く例解する一連の例が示される。PE以外のいずれかの他の報告されたゲノム編集法を用いては、これらの変化を効率的にかつ相当クリーンになすことは、ほとんどの型の細胞(HDRを支持しない多くを包含する)において現行では可能ではない。 Prime editing is a new genome editing technology that allows targeted editing of genomic loci by transfer of genetic information from RNA to DNA. With prime editing, RNA genes can be tagged with various components, such as RNA aptamers, ribozymes, or other RNA motifs. Prime editing has the potential to be fast, cheap, and effective in a vast variety of cell types compared to HDR strategies. As such, the described invention represents a novel, useful, and non-obvious tool for interrogating the biology of RNA genes in health and disease. Described herein are novel methods for the insertion of RNA motifs onto gene sequences that tag or otherwise engineer RNA using prime editors (PEs). PEs can site-specifically insert, mutate, and/or delete multiple nucleotides at desired genomic loci that are targetable by the CRISPR/Cas system. PEs consist of a fusion between the Cas9 nuclease domain and the reverse transcriptase domain. They are guided to their genomic targets by engineered PE gRNAs (prime editing guide RNAs) that contain a guide spacer portion for DNA targeting and a template for reverse transcription that encodes the desired genome edit (see FIG. 28A). It is envisioned that PE can be used to insert motifs (hereafter RNA motifs) that are functional at the RNA level to tag or otherwise manipulate non-coding RNAs or mRNAs. These motifs can serve to increase gene expression, decrease gene expression, alter splicing, change post-transcriptional modifications, affect the subcellular localization of RNA, enable isolation of RNA or determination of its intracellular or extracellular localization (e.g., using fluorescent RNA aptamers, e.g., Spinach, Spinach2, Baby Spinach, or Broccoli), recruit endogenous or exogenous proteins or RNA binding factors, introduce sgRNAs, or induce processing of RNA by either self-cleavage or RNAse (see FIG. 28B). Due to the flexibility of prime editing, it is not possible to provide an exhaustive list of RNA motifs that can be incorporated into the genome. Here, a series of examples are presented that broadly illustrate the expected range of RNA motifs incorporated by PE that can be used to tag RNA genes. Making these changes efficiently and fairly cleanly is not currently possible in most types of cells (including many that do not support HDR) using any other reported genome editing method other than PE.

遺伝子発現は、核輸送もしくは保持またはmRNA寿命の変化をもたらす3'非翻訳領域(UTR)をコードすることによって影響され得る。例えば、ポリオーマウイルスサルウイルス40(SV40)からのポリAテールは、効率的な転写終結を可能化する追加のヘルパー配列を有し、他の3'UTRに対して相対的に遺伝子発現を増大させ得る57,58。SV40ポリAテールの例の配列:

Figure 2020191243000297
Gene expression can be influenced by encoding 3' untranslated regions (UTRs) that result in nuclear transport or retention or altered mRNA lifetime. For example, the polyA tail from the polyomavirus simian virus 40 (SV40) has additional helper sequences that allow efficient transcription termination and can increase gene expression relative to other 3'UTRs. 57,58 An example sequence of the SV40 polyA tail:
Figure 2020191243000297

ポリアデニル化シグナル以外の翻訳後修飾シグナルもまたPEによってコードされ得る。これらの包含されるシグナルは、N6-メチルアデノシン、N1-メチルアデノシン、5-メチルシトシン、およびシュードウリジン修飾を組み込む59。PEを用いて、RNA転写物上のこれらの修飾を書き込むかまたは除去する酵素によって結合される配列を包含することによって、それらの書き込みまたは消し去りを誘導することが可能であろう。これは、これらのマーカーの効果を研究するための、細胞分化を誘導するための、ストレス応答に影響するための、またはこれらのマーカーの機能がまだ未調査であるということからは、他の様式で標的細胞に影響するためのツールとして用いられ得る。 Post-translational modification signals other than polyadenylation signals can also be encoded by PE. These included signals incorporate N6-methyladenosine, N1-methyladenosine, 5-methylcytosine, and pseudouridine modifications. 59 It would be possible to use PE to induce the writing or erasure of these modifications on the RNA transcript by including sequences that are bound by enzymes that write or remove them. This could be used as a tool to study the effects of these markers, to induce cell differentiation, to affect stress responses, or to affect target cells in other ways, since the functions of these markers are yet to be explored.

PEは細胞下レベル局在に影響する変異をコードし得る。例えば、mRNA上のtRNA-Lysの組み込みは、理論的にはミトコンドリアへの輸送をもたらし得るが60、種々の3'UTRは核保持または輸送をもたらし得る61 PEs can encode mutations that affect subcellular localization: for example, incorporation of tRNA-Lys on the mRNA could theoretically result in transport to mitochondria60 , whereas different 3′UTRs could result in nuclear retention or transport61 .

例: example:

SV40ポリAシグナルが輸送をもたらす。

Figure 2020191243000298
The SV40 polyA signal mediates transport.
Figure 2020191243000298

U1 snRNA 3ボックスは保持をもたらす。

Figure 2020191243000299
The U1 snRNA 3 box confers retention.
Figure 2020191243000299

内生RNAの細胞下レベル局在を決定することは難しくあり得、FISHのケースのように外因的な蛍光タグ付けされたヌクレオチドプローブの追加、または時間を消費するかつ可能性として不正確な細胞分画、次にRNA検出を要求する。内生RNA上にプローブをコードすることは、これらのイシューの多くを取り除くであろう。1つの例は、蛍光RNAアプタマー、例えばSpinach62またはBroccoliを内生RNA上にコードし、それによって、低分子プロトフルオロフォアの追加によってRNAの存在を視覚化することであろう。 Determining the subcellular localization of endogenous RNAs can be difficult, requiring the addition of exogenous fluorescently tagged nucleotide probes, as in the case of FISH, or time-consuming and potentially imprecise cell fractionation followed by RNA detection. Coding probes onto endogenous RNAs would eliminate many of these issues. One example would be to code fluorescent RNA aptamers, such as Spinach 62 or Broccoli, onto endogenous RNAs, thereby visualizing the presence of the RNA by the addition of a small protofluorophore.

Broccoliアプタマー:

Figure 2020191243000300
Broccoli aptamer:
Figure 2020191243000300

PEは、RNA結合タンパク質によって認識されるRNAをコードする配列を挿入または除去し得、RNA安定性、発現、局在、または修飾に影響する(例えば、列記されているタンパク質を見よ63)。 PE can insert or remove sequences encoding RNAs recognized by RNA-binding proteins, affecting RNA stability, expression, localization, or modification (see, for example, listed proteins 63 ).

ウイルスまたはがん防御機序として、PEはsgRNAをコードする配列をゲノム上に挿入し得る。類似に、それは、標的遺伝子のサイレンシングを導くためのマイクロRNA(例えば、プレマイクロRNA)を挿入するために用いられ得る。 As a viral or cancer defense mechanism, PE can insert sequences encoding sgRNAs into the genome. Similarly, it can be used to insert microRNAs (e.g., pre-microRNAs) to direct the silencing of target genes.

PEは、治療、またはRNAの種々の部分の機能を研究するためのツールとしてどちらかで、それ自体によるかまたは外部の因子によるかどちらかのRNAのプロセシングをもたらす配列を挿入し得る。例えば、HDVリボザイム64は、RNA配列上に包含されるときには、リボザイムの直ちに5'のRNAのプロセシングをもたらし、ハンマーヘッドリボザイムはリボザイム上の第3のステムに先行して切断する65。他の自己切断リボザイムは、ピストル66、ハチェット66、ヘアピン67、Neuropora Varkudサテライト68、glmS69、ツイスター70、およびツイスターシスター66を包含する。これらの配列はリボザイムの野生型のまたは操作されたまたは進化したバージョンを包含し得る。リボザイムによってカットされる部位がどこに位置付けられるかに依存して、これらのリボザイムの多数はそれらが関連するRNAの領域に依存して異なる配列を有し得る。外部の因子、例えば配列特異的RNAse71、特定の構造を認識するRNAse72、例えばDicer73およびDrosha74によるRNAのプロセシングを導くであろう配列もまた達成され得る。 PE can insert sequences that result in processing of the RNA either by itself or by external factors, either for therapeutic purposes or as a tool to study the function of various parts of the RNA. For example, the HDV ribozyme 64 , when included on an RNA sequence, results in processing of the RNA immediately 5' of the ribozyme, and the hammerhead ribozyme cleaves preceding the third stem on the ribozyme 65. Other self-cleaving ribozymes include pistol 66 , hatchet 66 , hairpin 67 , Neuropora Varkud satellite 68 , glmS 69 , twister 70 , and twister sister 66. These sequences can include wild-type or engineered or evolved versions of the ribozyme. Depending on where the site cut by the ribozyme is located, many of these ribozymes can have different sequences depending on the region of the RNA they are associated with. Sequences that would direct the processing of RNA by external factors, such as sequence-specific RNAses 71 , RNAses that recognize specific structures 72 , such as Dicer 73 and Drosha 74 , can also be achieved.

Figure 2020191243000301
Figure 2020191243000301

例6のための参考文献References for Example 6

以下の参考文献はこれら全体が参照されることによって本明細書に組み込まれる。

Figure 2020191243000302

Figure 2020191243000303
The following references are incorporated herein by reference in their entirety:
Figure 2020191243000302

Figure 2020191243000303

例7-PEによる遺伝子ライブラリの生成
定められたまたは可変の挿入、欠失、または定められたアミノ酸/ヌクレオチド変換を有するタンパク質またはRNAをコードする遺伝子の高度に高性能なライブラリの細胞性の生成のための新たな方法と、高スループットスクリーニングおよび指向性進化へのそれらの使用とが、本明細書に記載の。例において引用される参照はこの例の終わりに包含される参照のリストに基づく。
Example 7 - Generation of Gene Libraries by PE Described herein are novel methods for the cellular generation of highly sophisticated libraries of protein- or RNA-encoding genes with defined or variable insertions, deletions, or defined amino acid/nucleotide conversions, and their use in high-throughput screening and directed evolution. References cited in the examples are based on the list of references included at the end of this example.

可変の遺伝子ライブラリの生成は最も普通には変異誘発PCRによって達成されている1。この方法は、DNAポリメラーゼの忠実性を縮減する反応条件を用いることまたはより高い変異率を有する改変されたDNAポリメラーゼを用いることどちらかに依拠する。そのため、これらのポリメラーゼのバイアスはライブラリ産物に反映される(例えば、トランスバージョンに対してトランジション変異の選好性)。ライブラリ構築のこのアプローチの内在する限定は、変えられようとする遺伝子のサイズに影響することの相対的不能である。ほとんどのDNAポリメラーゼは極めて低いインデル変異2(挿入または欠失)率を有し、これらのほとんどはタンパク質をコードする領域のフレームシフト変異をもたらし、ライブラリのメンバーがいずれかの下流セレクションを通過することを非蓋然的にするであろう。加えて、PCRおよびクローニングのバイアスは、異なるサイズの遺伝子からなる単一のライブラリを生成することを困難にし得る。これらの限定は、存在するタンパク質機能を増強または新規のタンパク質機能を操作するための指向性進化の効力を厳しく限定し得る。天然の進化では、タンパク質機能または効力の大きい変化は典型的には挿入および欠失変異に関連し、これらは変異導入のための標準的なライブラリ生成の間に生起することが非蓋然的である。さらにその上、これらの変異は、最も普通には、疎水性コアと対比してループを形成することが予測される当のタンパク質の領域に生起する。それゆえに、従来のバイアスがないアプローチを用いて生成されるほとんどのインデルは、害があるかまたは無効であるかどちらかであることが蓋然的である。 The generation of variable gene libraries is most commonly achieved by mutagenic PCR. 1 This method relies on either using reaction conditions that reduce the fidelity of the DNA polymerase or using modified DNA polymerases with higher mutation rates. Thus, the biases of these polymerases are reflected in the library products (e.g., preference for transition mutations over transversions). An inherent limitation of this approach to library construction is the relative inability to affect the size of the genes to be altered. Most DNA polymerases have extremely low indel mutation2 (insertion or deletion) rates, and most of these will result in frameshift mutations in protein-coding regions, making it unlikely that library members will pass any downstream selection. In addition, PCR and cloning biases can make it difficult to generate a single library of genes of different sizes. These limitations can severely limit the efficacy of directed evolution to enhance existing or engineer novel protein functions. In natural evolution, large changes in protein function or potency are typically associated with insertion and deletion mutations, which are unlikely to occur during standard library generation for mutagenesis. Furthermore, these mutations most commonly occur in regions of the protein that are predicted to form loops versus the hydrophobic core, and therefore most indels generated using traditional unbiased approaches are likely to be either deleterious or ineffective.

全てのライブラリは可能な変異空間のある画分のみにアクセスするということから、それらが有益であることが最も蓋然的であろうタンパク質上の部位、例えばループ領域にかかる変異を偏らせ得るライブラリは、従来のライブラリと比べて有意な利点を有するであろう。最後に、NNKプライマーを用いるマルチステップPCRおよびクローンアセンブリによってまたはDNAシャッフリングによって、部位特異的なインデル変異を有する遺伝子ライブラリを生成することは可能であるが、これらのライブラリは連続的進化の「インデルジェネシス」の追加のラウンドを経過し得ない。連続的進化は、最小限のユーザー介入によるある型の指向性進化である。1つのかかる例はPACEである3。連続的進化は最小限のユーザー介入によって生起するので、進化の間のライブラリ多様性のいずれかの増大はネイティブな複製機構を用いて生起するはずである。そのため、PACEでは、特定の座位として挿入または除去されたコドンを有する遺伝子のライブラリが生成およびスクリーニングされ得るが、「インデルジェネシス」の追加のラウンドは可能ではない。 Since all libraries have access to only a fraction of the possible mutation space, libraries that can bias mutations towards sites on the protein where they are most likely to be beneficial, such as loop regions, would have a significant advantage over conventional libraries. Finally, although it is possible to generate gene libraries with site-specific indel mutations by multi-step PCR and clone assembly using NNK primers or by DNA shuffling, these libraries cannot undergo additional rounds of continuous evolution "indelgenesis". Continuous evolution is a type of directed evolution with minimal user intervention. One such example is PACE3 . Since continuous evolution occurs with minimal user intervention, any increase in library diversity during evolution should occur using native replication mechanisms. Thus, in PACE, libraries of genes with inserted or removed codons at specific loci can be generated and screened, but additional rounds of "indelgenesis" are not possible.

プライム編集(PE)のプログラム可能性は、高スループットスクリーニングおよび指向性進化への使用のための高度に高性能なプログラムされた遺伝子ライブラリを生成するために活用され得るということが想定される(図29Aを見よ)。PEは、プライム編集ガイドRNA(PEgRNA)上にコードされた情報を用いて、規定された遺伝子座位から定められた数のヌクレオチドを挿入、変化、または除去し得る(図29Bを見よ)。これは、非機能的なフレームシフト変異のバックグラウンド導入なしに、変異が機能の変化を生じさせることが最も蓋然的であるループ領域から挿入または除去された1つ以上のアミノ酸を有する標的化されたライブラリの生成を可能化する(図29Cを見よ)。PEは、DNAポリメラーゼまたは変異させられようとする配列どちらかに内在するバイアスにかかわらず、特定のセットの変異を組み入れるために用いられ得る。 It is envisioned that the programmability of prime editing (PE) can be exploited to generate highly sophisticated programmed gene libraries for use in high-throughput screening and directed evolution (see FIG. 29A). PE can insert, change, or remove a defined number of nucleotides from a defined gene locus using information encoded on a prime editing guide RNA (PEgRNA) (see FIG. 29B). This allows the generation of targeted libraries with one or more amino acids inserted or removed from loop regions where the mutation is most likely to result in a change in function, without the background introduction of non-functional frameshift mutations (see FIG. 29C). PE can be used to incorporate a specific set of mutations regardless of the biases inherent in either the DNA polymerase or the sequence to be mutated.

例えば、それは2つのトランスバージョンを包含する3つの連続した変異を要求するであろうから、CCCコドンを停止コドンに変換することは標準的なライブラリ生成によっては非蓋然的な生起であろうが、PEは、いずれかの所与の標的コドンをTGA停止コドンへと1ステップで変換するために用いられ得る。それらは、例えば、いずれかの疎水性アミノ酸をコードしながらいずれかの他をコードしないコドンを所与の部位に組み込むことによって、プログラムされた多様性を所与の位置に組み入れるためにもまた用いられ得る。さらにその上、PEのプログラム可能性ゆえに、複数のPEgRNAが複数の異なる編集を複数の部位に同時に生成するために利用され得、高度にプログラムされたライブラリの生成を可能化する(図29Dを見よ)。加えて、より低い忠実性を有する逆転写酵素を用いて、さもなければ不変のライブラリにおいて変異導入の領域を生成することが可能である(例えば、HIV-I逆転写酵素4またはBordetellaファージ逆転写酵素5)。 For example, PEs can be used to convert any given target codon to a TGA stop codon in one step, which would be an unlikely occurrence with standard library generation since it would require three consecutive mutations encompassing two transversions. They can also be used to incorporate programmed diversity at a given position, for example by incorporating a codon that codes for any hydrophobic amino acid but not any other at that site. Furthermore, because of the programmability of PE, multiple PE gRNAs can be utilized to generate multiple different edits at multiple sites simultaneously, enabling the generation of highly programmed libraries (see FIG. 29D). In addition, it is possible to generate regions of mutagenesis in an otherwise unaltered library using reverse transcriptases with lower fidelity (e.g., HIV-I reverse transcriptase 4 or Bordetella phage reverse transcriptase 5 ).

同じ部位に対するPEの反復的なラウンドの可能性もまた想定され、例えば、単一の部位におけるコドンの繰り返しの挿入を許す。最後に、上に記載されているアプローチの全てが連続的進化に組み込まれ得るということが想定され、新規のin situ進化ライブラリの生成を可能化する(図30を見よ)。それらは、大きいライブラリをアセンブリすることがさもなければ困難であろう他の細胞型内において、例えば哺乳類細胞内において、これらのライブラリを構築するためにもまた用いられ得る。指向性進化のための最適化されたPEをコードする細菌株の生成は、改善されたまたは新規の機能性を有するタンパク質およびRNAの同定のための有用な追加のツールであろう。PEのこれらの使用の全てはPEの新規の性質を原因として非自明である。結論として、PEによるライブラリ生成は、合成生物学および指向性進化において、ならびにタンパク質およびRNAのコンビナトリアル変異体の高スループットスクリーニングにとって、高度に有用なツールであろう。 The possibility of repeated rounds of PE on the same site is also envisioned, for example allowing repeated insertion of a codon at a single site. Finally, it is envisioned that all of the approaches described above can be incorporated into continuous evolution, allowing the generation of novel in situ evolution libraries (see FIG. 30). They can also be used to construct these libraries in other cell types where it would otherwise be difficult to assemble large libraries, for example in mammalian cells. The generation of bacterial strains encoding optimized PE for directed evolution would be a useful additional tool for the identification of proteins and RNAs with improved or novel functionality. All of these uses of PE are non-obvious due to the novel properties of PE. In conclusion, library generation with PE would be a highly useful tool in synthetic biology and directed evolution, as well as for high-throughput screening of combinatorial mutants of proteins and RNAs.

競合するアプローチ
多様なライブラリが現行で生成される主だった方法は、上に記載されている変異誘発PCRによってである1。挿入または欠失はPCRの間に定められた部位において縮重したNNKプライマーによって導入され得るが、かかる変異を複数の部位において導入することは、より多様なライブラリを変異誘発PCRによって構築する前に複数のラウンドの反復的なPCRおよびクローニングを要求し、方法を低速にする。代替的な補完的な方法はDNAシャッフリングであり、ここでは、DNase処置によって生成された遺伝子のライブラリのフラグメントがプライマーなしのPCR反応に導入され、互いに対する異なるフラグメントのアニーリングと、変異誘発PCR単独よりも多様なライブラリの急速な生成とをもたらす6。このアプローチは理論的にはインデル変異を生成し得るが、それはより多くの場合には遺伝子機能を破壊するフレームシフト変異をもたらす。さらにその上、DNAシャッフリングは遺伝子フラグメント間に高い度合の相同性を要求する。これらの方法の両方はin vitroでされなければならず、もたらされるライブラリは細胞に形質転換されるが、PEによって生成されるライブラリはin situで構築され得、連続的進化へのそれらの使用を可能化する。ライブラリはインビボの変異導入によってin situで構築され得、これらのライブラリはホスト細胞機構に依拠し、インデルに対してバイアスを発揮する。類似に、従来のクローニング方法は部位特異的な変異プロファイルを生成するために用いられ得るが、それらはin situでは用いられ得ず、一般的には、細胞に形質転換される前にin vitroで1度に1つずつアセンブリされる。原核および真核細胞型両方におけるPEの効率および幅広い機能性は、さらに、E.coliなどのモデル生物にクローニングされることおよびそれから目当ての細胞または生物に移入されることと対比して、これらのライブラリが目当ての細胞型内において直接的に構築され得るということを示唆する。標的化された多様化の別の競合するアプローチは自動多重ゲノム工学またはMAGEであり、複数の一本鎖DNAオリゴヌクレオチドが複製フォークに組み込まれ得、プログラム可能な変異をもたらし得る7。しかしながら、MAGEはホスト株の有意な改変を要求し、オフターゲットまたはバックグラウンド変異の100倍の増大に至り得るが8、PEはより高度にプログラムされており、より少数のオフターゲット効果をもたらすことが予期される。加えて、MAGEは哺乳類細胞を包含する広い種々の細胞型においては実証されていない。プライム編集はライブラリ生成のための新規のかつ非自明な補完的な技術である。
遺伝子ライブラリを構築するための指向性進化におけるPEの例
Competing Approaches The primary method by which diverse libraries are currently generated is by mutagenic PCR, as described above.1 Although insertions or deletions can be introduced by degenerate NNK primers at defined sites during PCR, introducing such mutations at multiple sites requires multiple rounds of iterative PCR and cloning before a more diverse library can be constructed by mutagenic PCR, making the method slow. An alternative, complementary method is DNA shuffling, in which fragments of a library of genes generated by DNase treatment are introduced into a primer-less PCR reaction, resulting in annealing of the different fragments to each other and more rapid generation of a diverse library than mutagenic PCR alone.6 Although this approach can theoretically generate indel mutations, it more often results in frameshift mutations that disrupt gene function. Furthermore, DNA shuffling requires a high degree of homology between gene fragments. Both of these methods must be done in vitro, and the resulting libraries are transformed into cells, whereas libraries generated by PE can be constructed in situ, enabling their use for continuous evolution. Libraries can be constructed in situ by in vivo mutagenesis, and these libraries rely on the host cell machinery and exert a bias against indels. Similarly, traditional cloning methods can be used to generate site-specific mutation profiles, but they cannot be used in situ and are generally assembled one at a time in vitro before being transformed into cells. The efficiency and broad functionality of PE in both prokaryotic and eukaryotic cell types further suggests that these libraries can be constructed directly within the cell type of interest, versus being cloned into a model organism such as E. coli and then transferred into the cell or organism of interest. Another competing approach to targeted diversification is automated multiplex genome engineering or MAGE, in which multiple single-stranded DNA oligonucleotides can be incorporated into replication forks , resulting in programmable mutations. However, MAGE requires significant modification of the host strain and can lead to a 100-fold increase in off-target or background mutations, whereas PE is more highly programmed and is expected to result in fewer off-target effects. In addition, MAGE has not been demonstrated in a wide variety of cell types, including mammalian cells. Prime editing is a novel and non-obvious complementary technique for library generation.
An example of PE in directed evolution for constructing gene libraries

1つの例では、PEは、PACEを用いる連続的進化実験の間に遺伝子ライブラリにタンパク質バリアントを導入するために指向性進化実験に用いられ得、従来のアプローチでは可能ではない様式で点変異およびインデル両方の反復的蓄積を許す。PEは部位特異的にかつプログラム可能にヌクレオチドをE.coliの遺伝子配列上に挿入し得るということがすでに示されている。概説された指向性進化では、改変されたツーハイブリッドタンパク質:タンパク質結合PACEセレクションによって、特異的なエピトープに対する改善された結合を有するモノボディを同定することが提案されている。これらのモノボディ上の特異的なかつ高度に可変のループは親和性および特異性に有意に寄与する。改善されたモノボディ結合は、PACEにおいてはこれらのループの長さおよび組成を標的化された様式で変えることによって急速に得られ得る。しかしながら、配列長さを変えることはPACEの確立された機能性ではない。様々なループサイズのライブラリがPACEの出発点として用いられ得るが、長さの爾後の改善はPACEセレクションの間に発生せず、点変異およびインデル変異の有益な相乗的組み合わせへのアクセスを妨害するであろう。PEをPACEセレクションに導入することは、様々なループ長さを有するモノボディのin situ生成および進化を可能化するであろう。そうするためには、それは、ホストE.coli株へのPE酵素および1つ以上のPEgRNAをコードする追加のPEプラスミドの導入を想定される。PE酵素およびPEgRNAの発現は、実験者によって選択される速度でPACEラグーンに送達される低分子のコントロール下にあるであろう。 In one example, PE can be used in directed evolution experiments to introduce protein variants into gene libraries during continuous evolution experiments with PACE, allowing the recursive accumulation of both point mutations and indels in a manner not possible with conventional approaches. It has already been shown that PE can site-specifically and programmably insert nucleotides into gene sequences in E. coli. In the directed evolution outlined, modified two-hybrid protein:protein binding PACE selection is proposed to identify monobodies with improved binding to specific epitopes. The specific and highly variable loops on these monobodies contribute significantly to affinity and specificity. Improved monobody binding can be rapidly obtained in PACE by altering the length and composition of these loops in a targeted manner. However, altering sequence length is not an established functionality of PACE. Although a library of various loop sizes can be used as a starting point for PACE, subsequent improvements in length would not occur during PACE selection, preventing access to beneficial synergistic combinations of point and indel mutations. Introducing PE into the PACE selection would allow for the in situ generation and evolution of monobodies with various loop lengths. To do so, it is envisioned the introduction of an additional PE plasmid encoding the PE enzyme and one or more PEgRNAs into the host E. coli strain. Expression of the PE enzyme and PEgRNAs would be under the control of small molecules delivered to the PACE lagoon at rates selected by the experimenter.

種々の態様において、PEgRNA構成要素は、セレクションファージ上の目当ての部位へとPEを導くスペーサーを含有し、複数の3ヌクレオチドが標的部位に挿入され得るようにしてデザインされるであろう。その結果、新たなPEgRNA結合部位が導入され、標的部位における1つ以上のコドンの反復的挿入を可能化するであろう。 In various embodiments, the PEgRNA component will be designed to contain a spacer that directs PE to the site of interest on the selection phage, allowing multiple trinucleotides to be inserted into the target site. This will introduce new PEgRNA binding sites, allowing repeated insertion of one or more codons at the target site.

並行して、別のホストE.coli株は、1つ以上のコドンの除去の鋳型となるPEgRNAを包含し得、ループサイズが進化の間に縮むことを可能化する。PACE実験は両方の株の混合物を利用し得るか、または2つを交互にしてループ配列の低速のかつコントロールされた追加もしくは除去を許し得る。 In parallel, another host E. coli strain could harbor a PEgRNA that templates the removal of one or more codons, allowing the loop size to shrink during evolution. PACE experiments could utilize a mixture of both strains, or alternate between the two to allow for the slow and controlled addition or removal of loop sequences.

この技術は抗体の進化にもまた適用され得るということが注意される。抗体を支配する結合原理は、モノボディを支配するものに非常に類似である:抗体相補性決定領域ループの長さはそれらの結合機能にとって重大である。さらに、より長いループ長さは、HIV-1および他のウイルス感染に対する幅広く防護性の活性を有する稀な抗体の開発において重大であることが見出されている9。抗体または抗体由来分子への上に記載されているPEの適用は、多様なループ長さおよび様々なループ配列を有する抗体の生成を許すであろう。PACEとの組み合わせで、かかるアプローチは標準のPACEにとってはアクセス可能でないループジオメトリによる増強された結合を許し、それゆえに高度に機能的な抗体の進化を許すであろう。 It is noted that this technique can also be applied to antibody evolution. The binding principles governing antibodies are very similar to those governing monobodies: the length of antibody complementarity determining region loops is critical for their binding function. Furthermore, longer loop lengths have been found to be critical in the development of rare antibodies with broadly protective activity against HIV-1 and other viral infections9. Application of the above described PE to antibodies or antibody-derived molecules will allow the generation of antibodies with diverse loop lengths and various loop sequences. In combination with PACE, such an approach will allow enhanced binding by loop geometries not accessible to standard PACE and therefore the evolution of highly functional antibodies.

実験は、ファージによって補助される非連続的進化(PANCE)においてバクテリオファージM3の害がある変異を修正するためにPEを用いる能力を示すであろう。連続的進化にPEを用いるための必要な第1ステップである(図69を見よ)。 The experiment will demonstrate the ability to use PE to correct harmful mutations in bacteriophage M3 in phage-assisted discontinuous evolution (PANCE), a necessary first step for using PE in continuous evolution (see Figure 69).

例7のための参考文献 References for Example 7

以下の参考文献はこれら全体が参照されることによって本明細書に組み込まれる。

Figure 2020191243000304
The following references are incorporated herein by reference in their entirety:
Figure 2020191243000304

例8-PEによる免疫エピトープ挿入
CRISPR/Casシステムを用いる精密なゲノム標的化テクノロジーが、最近では、標的ゲノム座位上への操作されたDNA配列の挿入を包含する広い範囲の適用において調査されている。先には、相同組み換え修復(HDR)がこの適用について用いられ、ssDNAドナー鋳型と二本鎖DNA切断(DSB)の手段による修復開始とを要求した。この戦略は、細胞になされるべき可能な変化の最も幅広い範囲をオファーし、大きいDNA配列を哺乳類細胞に挿入するために利用可能な唯一の方法である。しかしながら、HDRは、そのDSBを開始することから派生する望まれない細胞副作用、例えば高いレベルのインデル形成、DNA転座、大きい欠失、およびP53活性化によって邪魔される。これらの欠点に加えて、HDRは多くの細胞型における低い効率によって限定される(T細胞はこの観察の注意すべき例外である)。これらの欠点を克服するための最近の作業は、ヒトRad51変異体をCas9 D10Aニッカーゼに融合することを包含し(RDN)、DSBフリーHDRシステムをもたらす。これは、改善されたHDR産物:インデル比およびより低いオフターゲット編集を特色とするが、細胞型依存性および控えめなのみのHDR編集効率によってなお邪魔される。
Example 8 – PE-mediated immune epitope insertion
Precise genome targeting technologies using the CRISPR/Cas system have recently been explored in a wide range of applications, including the insertion of engineered DNA sequences onto target genomic loci. Previously, homology-directed repair (HDR) was used for this application, requiring a ssDNA donor template and repair initiation by means of a double-stranded DNA break (DSB). This strategy offers the broadest range of possible changes to be made to the cell and is the only method available for inserting large DNA sequences into mammalian cells. However, HDR is hampered by unwanted cellular side effects derived from initiating the DSB, such as high levels of indel formation, DNA translocations, large deletions, and P53 activation. In addition to these drawbacks, HDR is limited by low efficiency in many cell types (T cells are a notable exception to this observation). Recent work to overcome these drawbacks involves fusing a human Rad51 mutant to the Cas9 D10A nickase (RDN), resulting in a DSB-free HDR system. This features improved HDR product:indel ratios and lower off-target editing, but is still hampered by cell-type dependency and only modest HDR editing efficiency.

PEgRNAとカップリングされた逆転写酵素へのCas9の最近開発された融合体(「プライム編集因子」)は、存在するゲノム編集法と比べていくつもの利点をオファーする新規のゲノム編集テクノロジーを表し、部位特異的な様式で、いずれかの1ヌクレオチド置換を組み入れおよびヌクレオチドのいずれかの短いストレッチ(最高で少なくとも何ダースもの塩基)を挿入または欠失する能力を包含する。注意すべきことに、PE編集は一般的に低い意図されないインデル率で達成される。そのため、PEは、先には不可能または非実用的であった標的化された挿入に基づく編集適用を可能化する。 The recently developed fusion of Cas9 to a reverse transcriptase coupled with PEgRNA (the "prime editor") represents a novel genome editing technology that offers several advantages over existing genome editing methods, including the ability to incorporate any single nucleotide substitution and to insert or delete any short stretch of nucleotides (up to at least several dozen bases) in a site-specific manner. Of note, PE editing is generally achieved with a low rate of unintended indels. Thus, PE enables targeted insertion-based editing applications that were previously impossible or impractical.

具体的な本発明は、公知の免疫原性エピトープを内生または外生のゲノムDNA上に挿入するための手段としてプライム編集を用いるための方法を記載し、治療学的またはバイオテクノロジー的適用のための対応するタンパク質の改変をもたらす(図31および32を見よ)。プライム編集の本発明に先行しては、かかる挿入は、非効率的にかつDSBからの高いインデル形成率によってのみ達成され得た。プライム編集は挿入編集からの高いインデル形成の問題を解決しながら、一般的にHDRよりも高い効率をオファーする。このより低いインデル形成率は、特に免疫原性エピトープを挿入するという記載されている適用において、標的化されたDNA挿入のための方法としてのHDRと比べたプライム編集の主要な利点を提示する。エピトープの長さは少数塩基から数百塩基の範囲である。プライム編集因子はかかる標的化された挿入を哺乳類細胞において達成するための効率的なかつ最もクリーンなテクノロジーである。 The specific invention describes a method for using prime editing as a means to insert known immunogenic epitopes onto endogenous or exogenous genomic DNA, resulting in the modification of the corresponding protein for therapeutic or biotechnological applications (see Figures 31 and 32). Prior to the invention of prime editing, such insertions could only be achieved inefficiently and with high indel formation rates from DSBs. Prime editing offers higher efficiency than HDR in general, while solving the problem of high indel formation from insertion editing. This lower indel formation rate presents a major advantage of prime editing compared to HDR as a method for targeted DNA insertion, especially in the described application of inserting immunogenic epitopes. The length of the epitopes ranges from a few bases to several hundred bases. Prime editors are an efficient and cleanest technology for achieving such targeted insertions in mammalian cells.

本発明の鍵の概念は、それらのタンパク質産物および/または発現細胞型の下方制御および/または破壊のために、先に記載された免疫原性エピトープを含有するヌクレオチド配列を内生または外生のゲノムDNA上に挿入するためのプライム編集因子の使用である。標的遺伝子のコードされるタンパク質と挿入される免疫原性のエピトープの対応するタンパク質翻訳との融合タンパク質を生ずる様式で、免疫原性のエピトープ挿入のためのヌクレオチド配列は、遺伝子へと標的化されるであろう。患者の免疫系は、例えば破傷風またジフテリアまたは麻疹に対するルーチンの予防接種からの先行する標準免疫化の結果として、これらのエピトープを認識するように先に訓練されているであろう。融合されるエピトープの免疫原性の性質の結果として、患者の免疫系は、プライム編集されたタンパク質(ただの挿入されるエピトープではない)と可能性としてはそれが発現された細胞とを認識および不能化することが予想されるであろう。 The key concept of the present invention is the use of a prime editing agent to insert nucleotide sequences containing the immunogenic epitopes described above onto endogenous or exogenous genomic DNA for downregulation and/or destruction of their protein products and/or expressing cell types. The nucleotide sequences for immunogenic epitope insertion will be targeted into the gene in a manner that results in a fusion protein between the encoded protein of the target gene and the corresponding protein translation of the inserted immunogenic epitope. The patient's immune system will have been previously trained to recognize these epitopes as a result of prior standard immunization, for example from routine vaccination against tetanus or diphtheria or measles. As a result of the immunogenic nature of the fused epitopes, the patient's immune system will be expected to recognize and disable the prime edited protein (and not just the inserted epitope) and potentially the cells in which it is expressed.

標的遺伝子への融合体は、挿入されたエピトープタンパク質翻訳が免疫系認識のために暴露されるということを保証するために必要とされるとおり操作されるであろう。これは、標的遺伝子への免疫原性エピトープのC末端融合体、標的遺伝子への免疫原性エピトープのN末端融合体、または遺伝子上へのヌクレオチドの挿入を生むタンパク質翻訳をもたらす標的化されたヌクレオチド挿入を包含し得、その結果、免疫原性エピトープがタンパク質構造の表面の暴露された領域にコードされる。 Fusions to the target gene will be engineered as required to ensure that the inserted epitope protein translation is exposed for immune system recognition. This can include C-terminal fusions of the immunogenic epitope to the target gene, N-terminal fusions of the immunogenic epitope to the target gene, or targeted nucleotide insertions that result in protein translation yielding insertion of nucleotides onto the gene such that the immunogenic epitope is encoded in an exposed region on the surface of the protein structure.

標的遺伝子の免疫系認識、細胞輸送、タンパク質機能、またはタンパク質フォールディングを容易化するために、標的遺伝子配列と挿入される免疫原性エピトープヌクレオチド配列との間に挿入されるヌクレオチドとしてコードされるタンパク質リンカーが、本発明の一部として操作されることを必要とし得る。これらの挿入されるヌクレオチドによってコードされるタンパク質リンカーは、可変の長さおよび配列のXTENリンカーまたは可変の長さおよび配列のグリシン-セリンリンカーを包含し得る(が、これらに限定されない)。これらの操作されたリンカーは、タンパク質融合を首尾良く容易化するために先に用いられている。 To facilitate immune system recognition of the target gene, cellular trafficking, protein function, or protein folding, protein linkers encoded as nucleotides inserted between the target gene sequence and the inserted immunogenic epitope nucleotide sequence may need to be engineered as part of the invention. Protein linkers encoded by these inserted nucleotides may include (but are not limited to) XTEN linkers of variable length and sequence or glycine-serine linkers of variable length and sequence. These engineered linkers have been used previously to successfully facilitate protein fusion.

本発明の際立った特色は、さもなければ非免疫原性のタンパク質に対する免疫応答を誘導するための手段として、特定のアミノ酸配列に対する先に獲得された免疫応答を用いる能力を包含する。別の際立った特色は、副産物編集としての欲されないインデルの高いレベルを誘導せずかつその挿入が効率的である標的様式で、これらの免疫原性のエピトープのヌクレオチド配列を挿入する能力である。本願において論じられる本発明は、細胞型特異的な送達方法(例えばAAV血清型)を組み合わせて、それに対する免疫応答を誘発することが目当てである細胞型にエピトープを挿入する能力をもまた有する。 A distinguishing feature of the present invention includes the ability to use a previously acquired immune response to a particular amino acid sequence as a means to induce an immune response to an otherwise non-immunogenic protein. Another distinguishing feature is the ability to insert the nucleotide sequences of these immunogenic epitopes in a targeted manner that does not induce high levels of unwanted indels as by-product editing and whose insertion is efficient. The invention discussed in this application also has the ability to combine cell type specific delivery methods (e.g., AAV serotypes) to insert epitopes into the cell type against which it is desired to elicit an immune response.

免疫原性のエピトープを病原性の遺伝子上に挿入する手段としてのプライム編集は、広い種々の疾患(免疫腫瘍学戦略のがんに限定されない)と戦うように患者の免疫系をプログラムするために用いられ得る。このテクノロジーの直ちに該当する使用は、がんの治療学としてであろう。なぜなら、それは、HER2のような該当するがん遺伝子またはEGFRのような増殖因子に対する免疫応答を引き起こすことによって、腫瘍の免疫エスケープ機序を阻み得るからである。かかるアプローチはT細胞操作に類似に見え得るが、このアプローチの1つの新規の進歩は、操作されたT細胞を生成し患者に導入することを必要とすることなしに、それが多くの細胞型におよびがん以外の疾患に利用され得るということである。 Prime editing as a means of inserting immunogenic epitopes onto pathogenic genes can be used to program a patient's immune system to fight a wide variety of diseases (not limited to cancer in an immuno-oncology strategy). An immediately relevant use of this technology would be as cancer therapeutics, since it could thwart the immune escape mechanisms of tumors by triggering an immune response against relevant oncogenes such as HER2 or growth factors such as EGFR. While such an approach may appear similar to T cell engineering, one novel advancement of this approach is that it can be utilized for many cell types and diseases other than cancer, without the need to generate and introduce engineered T cells into patients.

PEを用いて、ほとんどの者がすでに予防接種されている免疫原性エピトープ(破傷風、百日咳、ジフテリア、麻疹、ムンプス、風疹など)を疾患を駆動する外生のまたは内生遺伝子上に挿入し、そのため、患者の免疫系はそのタンパク質を不能化することを学習する。 Using PE, immunogenic epitopes against which most people are already vaccinated (tetanus, whooping cough, diphtheria, measles, mumps, rubella, etc.) are inserted onto exogenous or endogenous disease-driving genes so that the patient's immune system learns to disable the protein.

前述の戦略からの可能性ある治療学的な利益を有しそうな疾患は、毒性のタンパク質の凝集によって引き起こされるもの、例えば致死性家族性不眠症を包含する。利し得る他の疾患は、さもなければ非毒性の内生タンパク質の病原性の過剰発現によって引き起こされるもの、および外生の病原体によって引き起こされるものを包含する。 Diseases that would have potential therapeutic benefit from the aforementioned strategies include those caused by toxic protein aggregation, such as fatal familial insomnia. Other diseases that may benefit include those caused by pathogenic overexpression of otherwise non-toxic endogenous proteins, and those caused by exogenous pathogens.

一次的な治療学的適応は、上で言及されているもの、例えばがん、プリオン、および他の神経変性疾患の治療学、感染性疾患、ならびに予防的な医療を包含する。二次的な治療学的適応は、遅発性の遺伝子疾患を有する患者の予防的ケアを包含し得る。特に侵襲性のがんのようないくつかの疾患では、または薬物治療が疾患が完全に治癒するまで疾患症状を緩和することを助けるケースでは、現行の標準治療の医療がプライム編集と併せて用いられ得るということが予想される。下は、プライム編集因子によって挿入され得る、達成するために用いられ得る免疫エピトープの例である:

Figure 2020191243000305

Figure 2020191243000306

Figure 2020191243000307

Figure 2020191243000308
Primary therapeutic indications include those mentioned above, such as therapeutics for cancer, prion, and other neurodegenerative diseases, infectious diseases, and preventative medicine. Secondary therapeutic indications may include preventative care for patients with late-onset genetic diseases. It is anticipated that in some diseases, such as particularly aggressive cancers, or in cases where drug therapy helps to alleviate disease symptoms until the disease is completely cured, current standard of care medicine may be used in conjunction with prime editing. Below are examples of immune epitopes that may be inserted by prime editing agents and used to achieve:
Figure 2020191243000305

Figure 2020191243000306

Figure 2020191243000307

Figure 2020191243000308

下は、免疫エピトープタグ付けのために標的遺伝子上に取り入れされ得るエピトープの追加の例である: Below are examples of additional epitopes that can be incorporated onto target genes for immune epitope tagging:

例8に引用された参考文献
以下の参考文献はこれら全体が参照されることによって本明細書に組み込まれる。

Figure 2020191243000309
REFERENCES CITED IN EXAMPLE 8 The following references are incorporated herein by reference in their entirety:
Figure 2020191243000309

例9-PE薬剤のインビボ送達
CRISPR/Casシステムを用いる精密なゲノム標的化テクノロジーが、最近では、遺伝子治療を包含する広い範囲の適用において調査されている。遺伝子治療におけるCas9およびCas9に基づくゲノム編集薬剤の適用の主要な限定はCas9のサイズ(>4kb)であり、組み換えアデノ随伴ウイルス(rAAV)によるその効率的な送達の足枷となる。逆転写酵素へのCas9の最近開発された融合体(「プライム編集因子」)は、存在するゲノム編集法と比べていくつもの利点を所有する新規のゲノム編集テクノロジーを表し、部位特異的な様式でいずれかの1ヌクレオチド置換を組み入れおよびヌクレオチドのいずれかの随意に定められた短い(<~20)ストレッチを挿入または欠失する能力を包含する。そのため、この方法は先には修正をし難かったヒト病原性バリアントの編集を可能化する。プライム編集試薬の送達は、ヒト疾患を引き起こす遺伝子配列の修正を可能化し得るか、または疾患を防止する遺伝子バリアントの組み入れを許し得る。
Example 9 - In vivo delivery of PE drugs
Precise genome targeting technologies using the CRISPR/Cas system have been recently explored in a wide range of applications, including gene therapy. A major limitation of the application of Cas9 and Cas9-based genome editing agents in gene therapy is the size of Cas9 (>4kb), which hampers its efficient delivery by recombinant adeno-associated viruses (rAAV). Recently developed fusions of Cas9 to reverse transcriptase ("prime editors") represent a novel genome editing technology that possesses several advantages over existing genome editing methods, including the ability to incorporate any single nucleotide substitution in a site-specific manner and to insert or delete any arbitrarily defined short (<~20) stretches of nucleotides. Thus, this method allows the editing of previously inaccessible human pathogenic variants. Delivery of prime editing reagents may enable the correction of gene sequences that cause human disease or allow the incorporation of disease-preventing gene variants.

本発明は、in vitroおよびインビボの細胞にプライム編集因子を送達するための方法を記載する。プライム編集因子は培養細胞だけにおいて開発および特徴付けられている。公知の方法はプライム編集因子をインビボで送達し得ない。rAAVまたは予めアセンブリされたリボヌクレオタンパク質(RNP)複合体によってプライム編集因子を送達するための本開示の方法は、インビボの送達へのいくつかの関門を克服するであろう。例えば、プライム編集因子をコードするDNAはrAAVパッケージング限界よりも大きく、そのため、特殊な解決を要求する。1つのかかる解決は分裂インテインペアに融合された編集因子を製剤することであり、これらが2つの別個のrAAV粒子にパッケージングされる。これらは細胞に同時送達されるときに機能的な編集因子タンパク質を再構成する。プライム編集の固有の特色を説明するいくつかの他の特殊な考慮事項が記載され、第2部位ニッキング標的の最適化とプライム編集因子をレンチウイルスおよびrAAVを包含するウイルスベクターに適切にパッケージングすることとを包含する。 The present invention describes methods for delivering prime editors to cells in vitro and in vivo. Prime editors have been developed and characterized only in cultured cells. Known methods cannot deliver prime editors in vivo. The disclosed methods for delivering prime editors by rAAV or preassembled ribonucleoprotein (RNP) complexes will overcome several barriers to in vivo delivery. For example, DNA encoding prime editors is larger than the rAAV packaging limit and therefore requires specialized solutions. One such solution is to formulate the editor fused to a split intein pair, which are packaged into two separate rAAV particles. These reconstitute functional editor proteins when co-delivered to cells. Several other special considerations are described that account for the unique features of prime editing, including optimization of second-site nicking targets and proper packaging of prime editors into viral vectors, including lentiviruses and rAAVs.

際立った特色はリボヌクレオタンパク質(RNP)送達製剤を用いることを包含し、プライム編集因子および近傍のニッキング標的がそれらの特異的なsgRNA/PEgRNAと予め複合体化され得る。これは可能な標的化可能な部位の範囲を増強し、DNA送達を用いた現行のデータに対して相対的に編集効率の多大な最適化を許すであろう。RNPまたはmRNA送達製剤どちらかを用いて、夫々がそれら自身のガイドRNAバリアントと複合体化するバリアントCasタンパク質が用いられ得る。これは、可能性あるニッキング座位のより多大な多様性をもまた許すであろう。そのため、いずれかの所与の適用について、より多大な効率のための最適化が達成され得るということが予想される。RNPを用いると、それは先のRNP報告に基づいて編集特異性を増大させることが予想される(Rees et al.,2017)。これはオフターゲットプライム編集を縮減するであろう。インビボまたはエクスビボの送達のためにプライム編集因子を2つのAAVベクターへと分裂するための可能性あるアーキテクチャが記載される。プライム編集因子を二元的AAVシステムにパッケージングすることは、分裂部位、再構成方法(例えばインテイン)、およびガイド発現アーキテクチャを包含するデザイン考慮事項の最適化を要求する。プライム編集因子の送達のためのウイルスおよびRNPの混合物を用いると、編集が経時的にコントロールされるであろうということが予想される。なぜなら、RNPはインビボでは結局は分解し、これはRNPがもはや供給されない後にはプライム編集をストップするであろうからである。 A distinctive feature involves using a ribonucleoprotein (RNP) delivery formulation, where the prime editor and nearby nicking targets can be pre-complexed with their specific sgRNA/PEgRNA. This would increase the range of possible targetable sites and allow for greater optimization of editing efficiency relative to current data using DNA delivery. With either an RNP or mRNA delivery formulation, variant Cas proteins can be used, each complexed with their own guide RNA variant. This would also allow for a greater diversity of possible nicking loci. It is therefore anticipated that optimization for greater efficiency can be achieved for any given application. With an RNP, it is anticipated that it will increase editing specificity based on previous RNP reports (Rees et al., 2017). This would reduce off-target prime editing. A potential architecture for splitting the prime editor into two AAV vectors for in vivo or ex vivo delivery is described. Packaging prime editing elements into a binary AAV system requires optimization of design considerations including the division site, reconstitution method (e.g., inteins), and guide expression architecture. Using a mixture of virus and RNPs for delivery of prime editing elements, it is expected that editing will be controlled over time, since RNPs will eventually degrade in vivo, which will stop prime editing after RNPs are no longer supplied.

インビボおよびエクスビボのゲノムDNAを変改するために、プライム編集因子リボヌクレオタンパク質(RNP)、プライム編集因子ガイドRNAと共にmRNA、またはDNAは脂質ナノ粒子、rAAV、もしくはレンチウイルスにパッケージング、注射、摂取、または吸入され得る。ヒト疾患の動物モデルを確立、ヒト疾患の動物モデルにおいて治療学的および科学的仮説を試験、ならびにヒトの疾患を処置する目的のためを包含する。 Prime editor ribonucleoproteins (RNPs), mRNA with prime editor guide RNA, or DNA can be packaged in lipid nanoparticles, rAAV, or lentiviruses and injected, ingested, or inhaled to alter genomic DNA in vivo and ex vivo, including for purposes of establishing animal models of human disease, testing therapeutic and scientific hypotheses in animal models of human disease, and treating human disease.

インビボの該当する細胞型への送達の好適な手段が開発される場合には、プライム編集因子は、実現可能に、全ての遺伝子疾患の大きい画分(Clinvarの病原性のヒト遺伝子バリアントの~89%)を修正するために用いられ得る。血液疾患、網膜疾患、および肝臓疾患は、他の試薬の確立された送達システムを原因として、最も蓋然的な第1の適用である。AAVカプシド、他の進化したまたは操作されたウイルスベクター、および脂質ナノ粒子製剤が、本発明との組み合わせで用いられることを必要とするであろう。 If suitable means of delivery to the relevant cell types in vivo are developed, primed editors could feasibly be used to correct a large fraction of all genetic diseases (~89% of Clinvar pathogenic human genetic variants). Hematological, retinal, and liver diseases are the most likely first applications due to established delivery systems of other reagents. AAV capsids, other evolved or engineered viral vectors, and lipid nanoparticle formulations will need to be used in combination with the present invention.

ある態様において、プライム編集因子ドメインの1つ以上(例えば、napDNAbpドメインまたはRTドメイン)がインテイン配列を有して操作され得る。 In some embodiments, one or more of the prime editor domains (e.g., the napDNAbp domain or the RT domain) can be engineered with an intein sequence.

例10-オフターゲット編集を同定するためのPEの使用
現行では、プライム編集因子によるオフターゲット編集を検出するための記載された方法はない(プライム編集それ自体がまだ公開されていない)。これらの方法は、研究者がプライム編集因子を用いてオフターゲット編集の可能性ある部位を同定することを許すであろう。これは、この技術が患者の遺伝子疾患を処置するために用いられる場合には重要な考慮事項であろう。
Example 10 - Use of PE to Identify Off-Target Edits Currently, there are no methods described for detecting off-target editing by prime editors (prime editing itself has not yet been published). These methods would allow researchers to identify possible sites of off-target editing using prime editors, which would be an important consideration if this technology is to be used to treat genetic diseases in patients.

ここに記載される方法は、Casヌクレアーゼのオフターゲットを同定するためにもまた有用であり得る。これらのオフターゲットはBLESS、Guide-Seq、CIRCLE-Seq、およびDigenome-Seqを用いて先に同定されている。しかしながら、この方法はプロセスの感度および単純さにおいて有利である。 The methods described here may also be useful for identifying off-targets of Cas nucleases. These off-targets have been previously identified using BLESS, Guide-Seq, CIRCLE-Seq, and Digenome-Seq. However, this method has advantages in the sensitivity and simplicity of the process.

この側面の鍵の概念は、プライム編集を用いて、PEgRNAを鋳型とするアダプター配列またはプライマー結合部位を挿入して、Casヌクレアーゼまたはプライム編集因子のゲノムオフターゲット改変部位の急速な同定を可能化するという発想である。 The key concept of this aspect is the idea of using prime editing to insert PEgRNA-templated adapter sequences or primer binding sites to enable rapid identification of genomic off-target modification sites for Cas nucleases or prime editors.

バイアスがない様式でプライム編集オフターゲット部位を同定するための方法は公知ではない。アダプター配列がDNA結合およびニッキングと同じイベントにおいて挿入され、下流プロセシングを単純化するので、この方法はヌクレアーゼオフターゲット部位を同定する他の技術から見分けられる。 No methods are known for identifying prime editing off-target sites in an unbiased manner. This method is distinct from other techniques that identify nuclease off-target sites because the adapter sequence is inserted in the same event as DNA binding and nicking, simplifying downstream processing.

本発明は、組織培養または動物モデルにおいて、生細胞内で編集するときのオフターゲット編集部位の同定を包含する(図33を見よ)。この方法を行うためには、最終的な所望の編集因子と同一のプロトスペーサー(およびプライム編集オフターゲットを検査する場合には最終的な所望の編集因子と同一のプライマー結合部位配列)を有するが、プライム編集による逆転写後にアダプターまたはプライマー結合部位を組み入れるための必要な配列を包含するPEgRNAが生成される。インビボ編集がプライム編集因子またはRT融合ヌクレアーゼを用いて行われ、ゲノムDNAを単離する。ゲノムDNAが酵素的または機械的手段によってフラグメント化され、異なるアダプターをDNAフラグメント化の部位に付加する。PCRが用いられて、1つのアダプターからPEgRNAによって組み入れされたアダプターまで増幅する。もたらされた産物がディープ配列決定されて、全ての改変された部位を同定する。 The invention encompasses the identification of off-target editing sites when editing in living cells, in tissue culture or animal models (see FIG. 33). To carry out this method, a PEgRNA is generated that has the same protospacer as the final desired editing element (and the same primer binding site sequence as the final desired editing element if prime editing off-targets are being examined), but includes the necessary sequences for incorporating adapters or primer binding sites after reverse transcription with prime editing. In vivo editing is carried out using a prime editing element or RT fusion nuclease, and genomic DNA is isolated. The genomic DNA is fragmented by enzymatic or mechanical means, and different adapters are added to the sites of DNA fragmentation. PCR is used to amplify from one adapter to the adapter incorporated by the PEgRNA. The resulting product is deep sequenced to identify all modified sites.

本発明は、ゲノムDNAのin vitro改変を用いるオフターゲット編集部位の同定をもまた包含する(図33を見よ)。この方法を行うためには、精製されたプライム編集因子タンパク質と、アダプターまたはプライマー結合配列を組み入れるであろうが、さもなければ目当てのPEgRNAと同じであるPEgRNAとのRNPがアセンブリされる。このRNPは、DNAのフラグメント化およびDNA切断の部位への異なるアダプターの取り付けの前または後に、抽出されたゲノムDNAとインキュベーションされる。PCRが用いられて、フラグメント化された部位からPEによって組み入れされたアダプターまで増幅する。ディープ配列決定して改変の部位を同定する。細胞性のDNA修復はプライム編集因子によって追加される逆転写されたDNAアダプターを消去することがないであろうから、このin vitro編集法は検出の感度を増強するはずである。 The present invention also encompasses the identification of off-target editing sites using in vitro modification of genomic DNA (see FIG. 33). To carry out this method, an RNP is assembled with purified prime editor protein and a PEgRNA that will incorporate an adapter or primer binding sequence, but is otherwise identical to the PEgRNA of interest. This RNP is incubated with extracted genomic DNA before or after DNA fragmentation and attachment of a different adapter to the site of DNA cleavage. PCR is used to amplify from the fragmented site to the adapter incorporated by PE. Deep sequencing identifies the site of modification. This in vitro editing method should enhance the sensitivity of detection, since cellular DNA repair will not erase the reverse transcribed DNA adapter added by the prime editor.

これらの方法は、いずれかのプライム編集因子、または標的のカットされる部位を認識するためにガイドRNAを用いるいずれかのゲノム編集因子(ほとんどのCasヌクレアーゼ)について、オフターゲット編集を同定するために用いられ得る。 These methods can be used to identify off-target edits for any primed editor or any genome editor that uses a guide RNA to recognize the site of the target cut (most Cas nucleases).

これらの方法は、ゲノム編集因子が処置への使用を考慮される全ての遺伝子疾患に適用され得る。 These methods can be applied to all genetic diseases for which genome editing elements are being considered for treatment.

例11-インビボの標的タンパク質の化学物質によって誘導される二量体化を可能化するためのPEの使用
本明細書に記載のプライム編集因子は、プライム編集による低分子結合タンパク質をコードする遺伝子のゲノム取り入れによって、二量体化によって誘導される生物学的プロセス、例えば受容体シグナルを、便利な低分子薬物のコントロール下に置くためにもまた用いられ得、本明細書に記載の。本明細書に記載のプライム編集因子を用いて、低分子結合タンパク質をコードする遺伝子配列が、生細胞または患者の目当ての標的タンパク質をコードする遺伝子上に挿入され得る。この編集は単独では生理学的効果を有さないはずである。典型的には夫々が標的タンパク質のコピーに融合されている2つの薬物結合タンパク質ドメインに同時に結合し得る二量体低分子である低分子薬物の投与によって、低分子は標的タンパク質の二量体化を誘導する。それから、この標的タンパク質二量体化イベントは、生物学的シグナルイベント、例えば赤血球形成またはインスリンシグナルを誘導する。
Example 11 - Use of PE to enable chemical-induced dimerization of target proteins in vivo Prime editors described herein can also be used to place dimerization-induced biological processes, such as receptor signaling, under the control of convenient small molecule drugs by genomic incorporation of genes encoding small molecule binding proteins by prime editing, as described herein. Using the prime editors described herein, a genetic sequence encoding a small molecule binding protein can be inserted onto a gene encoding a target protein of interest in a living cell or patient. This editing should have no physiological effect alone. By administration of a small molecule drug, typically a dimeric small molecule that can simultaneously bind to two drug binding protein domains, each fused to a copy of the target protein, the small molecule induces dimerization of the target protein. This target protein dimerization event then induces a biological signaling event, such as erythropoiesis or insulin signaling.

例12-プライム編集:二本鎖DNA切断なしのヒト細胞における高度に汎用的なかつ精密な検索置換ゲノム編集
現行のゲノム編集法は、プログラム可能なヌクレアーゼを用いて二本鎖DNA切断の随伴する副産物と共に標的遺伝子を遮断、欠失、または挿入し得、塩基編集因子を用いて標的座位に4つのトランジション点変異を組み入れ組み入れ得る。しかしながら、小さい挿入、小さい欠失、および8つのトランスバージョン点変異は、集合的にはほとんどの病原性の遺伝子バリアントを表すが、ほとんどの細胞型において、効率的にかつ余分な副産物なしに修正はされ得ない。標的部位を規定することおよび所望の編集をコードすることの両方をする操作されたプライム編集ガイドRNA(PEgRNA)によってプログラムされる操作された逆転写酵素に融合された触媒的に損なわれたCas9を用いて、新たな遺伝情報を規定されたDNA部位に直接的に書き込む高度に汎用的なかつ精密なゲノム編集法、プライム編集が本明細書に記載の。ヒト細胞の175よりも多大な別物の編集を行って、プライム編集が、標的化された挿入、欠失、全ての12の可能な型の点変異、およびそれらの組み合わせを、効率的に(未ソーティングの細胞において典型的には20-60%、最高で77%)かつ低い副産物(典型的には1-10%)によって、二本鎖切断またはドナーDNA鋳型を要求することなしになし得るということを確立した。プライム編集をヒト細胞において適用して、鎌状赤血球症(HBBのA・TからT・Aのトランスバージョンを要求する)およびテイ・サックス病(HEXAの4塩基欠失を要求する)の一次的な遺伝学的原因を修正し、両方のケースにおいて、最小限の副産物によって病原性のゲノムアレルを野生型に効率的に復帰させた。これらの病原性のHBBトランスバージョンおよびHEXA挿入変異を有するヒト細胞株を生出するために、プリオン病に対する耐性を付与するG127V変異をPRNPに組み入れるために(G・CからT・Aのトランスバージョンを要求する)、ならびにHis6タグ、FLAGエピトープタグ、および伸長されたLoxP部位をヒト細胞の標的座位に効率的に挿入するためにもまた、プライム編集を用いた。プライム編集は、HDRと比べて効率および産物純度の利点、ならびに塩基編集と比較して補完的な強さおよび弱さをオファーする。3つの別物の塩基対形成イベントを要求するその検索置換機序と整合して、プライム編集は公知のCas9オフターゲット部位においてCas9よりもかなりオフターゲットDNA改変をしにくい。プライム編集はゲノム編集の範囲および能力を実質的に拡張し、原理的には、公知の病原性のヒト遺伝子バリアントの~89%を修正し得る。
Example 12 - Prime Editing: Highly Versatile and Precise Search and Replace Genome Editing in Human Cells Without Double-Stranded DNA Breaks Current genome editing methods can use programmable nucleases to block, delete, or insert target genes with the concomitant by-products of double-stranded DNA breaks, and base editors to incorporate four transition point mutations at target loci. However, small insertions, small deletions, and eight transversion point mutations, which collectively represent most pathogenic genetic variants, cannot be corrected efficiently and without extra by-products in most cell types. Described herein is a highly versatile and precise genome editing method, prime editing, that uses a catalytically impaired Cas9 fused to an engineered reverse transcriptase that is programmed by an engineered prime editing guide RNA (PEgRNA) that both defines the target site and encodes the desired edit to directly write new genetic information into a defined DNA site. Editing more than 175 variants in human cells has established that prime editing can make targeted insertions, deletions, and point mutations of all 12 possible types, and combinations thereof, efficiently (typically 20-60% in unsorted cells, up to 77%) and with low by-products (typically 1-10%), without requiring double-strand breaks or a donor DNA template. Prime editing has been applied in human cells to correct the primary genetic cause of sickle cell disease (requiring an HBB A.T to T.A transversion) and Tay-Sachs disease (requiring a HEXA tetranucleotide deletion), efficiently reverting the pathogenic genomic allele to wild type in both cases with minimal by-products. To generate human cell lines carrying these pathogenic HBB transversion and HEXA insertion mutations, we also used prime editing to incorporate the G127V mutation (requiring a G-C to T-A transversion) that confers resistance to prion disease into PRNP, and to efficiently insert His6 tags, FLAG epitope tags, and extended LoxP sites into target loci in human cells. Prime editing offers the advantages of efficiency and product purity compared to HDR, and complementary strengths and weaknesses compared to base editing. Consistent with its search-and-replace mechanism, which requires three separate base-pairing events, prime editing is much less prone to off-target DNA modifications than Cas9 at known Cas9 off-target sites. Prime editing substantially expands the scope and capabilities of genome editing and, in principle, can correct ∼89% of known pathogenic human gene variants.

実質的にいずれかの標的化された変化をいずれかの生細胞または生物のゲノムになす能力は、生命科学の長年の熱望である。ゲノム編集テクノロジーの急速な進歩にもかかわらず、疾患に関連する>75,000の公知のヒト遺伝子バリアントの多数は111、ほとんどの治療学的に該当する細胞においては修正または組み入れされ得ない(図38A)。CRISPR-Cas9などのプログラム可能なヌクレアーゼは二本鎖DNA切断(DSB)を作り、これは挿入および欠失の混合物(インデル)を標的部位において誘導することによって遺伝子を遮断し得る112~114。ヌクレアーゼは、相同性非依存的プロセスによって、標的遺伝子を欠失115,116または外因的な遺伝子を挿入117-119するためにもまた用いられ得る。しかしながら、二本鎖DNA切断は、産物の複雑な混合物、転座120、およびp53活性化121,122を包含する望まれないアウトカムにもまた関連する。その上、病原性のアレルの大多数は、それらの非病原性のカウンターパートとは小さい挿入、欠失、または塩基置換が異なり、これらは修正するためにはかなりより精密な編集テクノロジーを要求する(図38A)。ヌクレアーゼによって誘導されるDSBによって刺激される相同組み換え修復(HDR)123は、種々の精密なDNA変化を組み入れるために広く用いられている。しかしながら、HDRは外因的なドナーDNA修復鋳型に依拠し、典型的にはDSBの末端結合修復からの余分なインデル副産物を生成し、ほとんどの治療学的に該当する細胞型では非効率的である(T細胞およびいくつかの幹細胞は重要な例外である)124,125。DSBによって媒介されるゲノム編集の効率および精度を増強することは有望な作業のフォーカスのままに留まっており126~130、これらの課題は代替的な精密ゲノム編集戦略の調査を要する。 The ability to make virtually any targeted change to the genome of any living cell or organism is a long-standing aspiration of life science. Despite rapid advances in genome editing technology, the majority of the >75,000 known human genetic variants associated with disease111 cannot be corrected or incorporated in most therapeutically relevant cells (Figure 38A). Programmable nucleases such as CRISPR-Cas9 create double-stranded DNA breaks (DSBs), which can shut off genes by inducing a mixture of insertions and deletions (indels) at the target site112-114 . Nucleases can also be used to delete targeted genes115,116 or insert exogenous genes117-119 by a homology-independent process. However, double-stranded DNA breaks are also associated with unwanted outcomes including a complex mixture of products, translocations120 , and p53 activation121,122 . Moreover, the majority of pathogenic alleles differ from their nonpathogenic counterparts by small insertions, deletions, or base substitutions, which require significantly more precise editing technologies to correct (Figure 38A). Homologous recombination repair (HDR) stimulated by nuclease-induced DSBs123 has been widely used to incorporate a variety of precise DNA changes. However, HDR relies on exogenous donor DNA repair templates, typically generates extra indel by-products from end-joining repair of DSBs, and is inefficient in most therapeutically relevant cell types (T cells and some stem cells are important exceptions) 124,125 . Enhancing the efficiency and precision of DSB-mediated genome editing remains the focus of promising work126-130 , and these challenges necessitate the investigation of alternative precise genome editing strategies.

塩基編集は、哺乳動物を包含する広い種々の細胞型および生物において、DSBを要求することなしに、4つの型のトランジション変異(CからT、GからA、AからG、およびTからC)を効率的に組み入れまたは修正し得るが128~131、現行では、8つのトランスバージョン変異(CからA、CからG、GからC、GからT、AからC、AからT、TからA、およびTからG)のいずれか、例えば鎌状赤血球症の最も普通の原因(HBB E6V)を直接的に修正するために必要とされるT・AからA・Tの変異を達成し得ない132。加えて、標的の欠失、例えばテイ・サックス病を引き起こす4塩基重複(HEXA 1278+TATC)の除去133、または標的化された挿入、例えば嚢胞性線維症の最も普通の原因(CFTR ΔF508)を直接的に修正するために要求される精密な3塩基挿入134を行うためのDSBフリーの方法は報告されていない。それゆえに、それらは集合的にほとんどの公知の病原性アレルを説明するにもかかわらず、標的化されたトランスバージョン点変異、挿入、および欠失は、ほとんどの細胞型においては効率的にかつ余分な副産物なしに組み入れまたは修正することが困難である(図38A)。 Although base editing can efficiently incorporate or correct four types of transition mutations (C to T, G to A, A to G, and T to C) without requiring DSBs in a wide variety of cell types and organisms, including mammals, 128-131 it is currently unable to achieve any of the eight transversion mutations (C to A, C to G, G to C, G to T, A to C, A to T, T to A, and T to G), such as the T-A to A-T mutation required to directly correct the most common cause of sickle cell disease (HBB E6V) .132 In addition, no DSB-free methods have been reported to make targeted deletions, such as the removal of the 4-base duplication (HEXA 1278+TATC) that causes Tay-Sachs disease, 133 or targeted insertions, such as the precise 3-base insertion required to directly correct the most common cause of cystic fibrosis (CFTR ΔF508) .134 Therefore, although they collectively account for most known pathogenic alleles, targeted transversion point mutations, insertions, and deletions are difficult to incorporate or correct efficiently and without excess by-products in most cell types (Figure 38A).

二本鎖DNA切断またはドナーDNA鋳型を要求することなしに、ヒト細胞の標的座位における標的化された挿入、欠失、および全ての12の可能な塩基から塩基の変換を媒介する新たな「検索置換」ゲノム編集テクノロジー、プライム編集の開発が本明細書に記載の。当初にPE1によって例示されたプライム編集因子は、プログラム可能なニッカーゼに融合された逆転写酵素とプライム編集の伸長されたガイドRNA(PEgRNA)とを用いて、遺伝情報をPEgRNA上の伸長から標的ゲノム座位に直接的にコピーする。第2世代プライム編集因子(PE2)は、操作された逆転写酵素を用いて最小限の(典型的には<2%)インデル形成によって編集効率を実質的に増大させ、第3世代PE3システムは第2のガイドRNAを追加して非編集鎖にニッキングし、それによって非編集鎖の置き換えを好み、約1~10%インデル形成によってヒト細胞において典型的には約20~50%まで編集効率をさらに増大させる。PE3は最適化されたCas9ヌクレアーゼによって開始されるHDRと比較してずっと少数の副産物および高いかまたは類似の効率をオファーし、現行世代の塩基編集因子と比較して補完的な強さおよび弱さをオファーする。 Described herein is the development of a novel "search and replace" genome editing technology, prime editing, that mediates targeted insertions, deletions, and base conversions from all 12 possible bases at target loci in human cells without requiring double-stranded DNA breaks or donor DNA templates. Prime editors, initially exemplified by PE1, use a reverse transcriptase fused to a programmable nickase and a prime editing extended guide RNA (PEgRNA) to directly copy genetic information from an extension on the PEgRNA to a target genomic locus. A second generation prime editor (PE2) uses an engineered reverse transcriptase to substantially increase editing efficiency with minimal (typically <2%) indel formation, and a third generation PE3 system adds a second guide RNA to nick the non-edited strand, thereby favoring replacement of the non-edited strand, further increasing editing efficiency to typically about 20-50% in human cells with about 1-10% indel formation. PE3 offers much fewer by-products and higher or similar efficiency compared to HDR initiated by optimized Cas9 nucleases, and offers complementary strengths and weaknesses compared to current generation base editors.

PE3をヒトHEK293T細胞のゲノム座位において適用して、HBB E6Vから野生型HBBへの効率的変換、HEXA 1278+TATCを野生型HEXAに復元するための挿入されたTATCの欠失、プリオン病に対する耐性を付与するG127V変異のPRNPへの組み入れ135(G・CからT・Aのトランスバージョンを要求する)、ならびにHis6タグ(18bp)、FLAGエピトープタグ(24bp)、およびCreによって媒介される組み換えのための伸長されたLoxP部位(44bp)の標的化された挿入を達成した。プライム編集は3つの他のヒト細胞株および有糸分裂後初代マウス皮質ニューロンにおいてもまた様々な効率で首尾良かった。当初のニックおよび編集の位置付けの間の距離の高い度合のフレキシビリティーを原因として、プライム編集はCas9のPAM要件によって実質的に制約されず、原理的にはゲノム座位の大多数を標的化し得る。蓋然的には、生産的なプライム編集が生起するための3つの別物のDNA塩基対形成イベントという要件を原因として、オフターゲットプライム編集は公知のCas9オフターゲット座位におけるオフターゲットCas9編集よりもかなり稀である。精密な標的化された挿入、欠失、および全ての12の可能なクラスの点変異を広い種々のゲノム座位においてDSBまたはドナーDNA鋳型の必要なしに可能化することによって、プライム編集は多くの遺伝子バリアントの研究および修正を進歩させるポテンシャルを有する。 PE3 was applied in genomic loci of human HEK293T cells to achieve efficient conversion of HBB E6V to wild-type HBB, deletion of the inserted TATC to restore HEXA 1278+TATC to wild-type HEXA, incorporation of the G127V mutation into PRNP 135 (requiring a G·C to T·A transversion) that confers resistance to prion disease, and targeted insertion of a His6 tag (18 bp), a FLAG epitope tag (24 bp), and an extended LoxP site (44 bp) for Cre-mediated recombination. Prime editing was also successful with various efficiencies in three other human cell lines and in postmitotic primary mouse cortical neurons. Due to the high degree of flexibility in the distance between the initial nick and the positioning of the edit, prime editing is not substantially constrained by the PAM requirement of Cas9 and could in principle target the vast majority of genomic loci. Presumably, due to the requirement of three separate DNA base pairing events for productive prime editing to occur, off-target prime editing is much rarer than off-target Cas9 editing at known Cas9 off-target loci.By enabling precise targeted insertion, deletion, and all 12 possible classes of point mutations at a wide variety of genomic loci without the need for DSB or donor DNA template, prime editing has the potential to advance the study and correction of many genetic variants.

結果
伸長されたガイドRNAからの情報を標的DNA座位上に移入するための戦略
Cas9は、標的DNA部位にハイブリダイズするスペーサー配列を含有するガイドRNAを用いてDNAを標的化する112~114,136,137。狙いは、天然のCRISPRシステムのようにDNA標的を規定するように138,139、また、標的座位の対応するDNAヌクレオチドを置き換える新たな遺伝情報を含有するように両方でガイドRNAを操作することであった。伸長されたガイドRNAから規定されたDNA部位への遺伝情報の直接的移入、次に元々の編集されないDNAの置き換えは、原理的には、DSBまたはドナーDNA鋳型への依存性なしに、標的化されたDNA配列変化を生細胞に組み入れる一般的手段を提供し得る。この直接的情報移入を達成するために、狙いは、3'-ヒドロキシル基を暴露するように標的部位においてニッキングされたゲノムDNAを用いて、操作されたガイドRNA(これ以降では、プライム編集ガイドRNAまたはPEgRNAと言われる)の伸長から直接的に標的部位への遺伝情報の逆転写をプライムすることであった(図38A)。
Results Strategy for transferring information from extended guide RNAs to target DNA loci
Cas9 targets DNA using guide RNAs that contain spacer sequences that hybridize to the target DNA site. 112-114,136,137 The aim was to engineer guide RNAs to both define DNA targets as in the natural CRISPR system, 138,139 and also to contain new genetic information that replaces the corresponding DNA nucleotides at the target locus. Direct transfer of genetic information from an extended guide RNA to a defined DNA site, then replacing the original unedited DNA, could in principle provide a general means of incorporating targeted DNA sequence changes into living cells without dependency on DSBs or donor DNA templates. To achieve this direct information transfer, the aim was to prime reverse transcription of genetic information into the target site directly from an extended engineered guide RNA (hereafter referred to as prime editing guide RNA or PEgRNA) using genomic DNA nicked at the target site to expose a 3'-hydroxyl group (Figure 38A).

いくつかの天然の可動遺伝因子によって用いられる機序に似るニッキングおよび逆転写のこれらの当初のステップは140、2つの冗長性の一本鎖DNAフラップを1つの鎖上に有する分岐した中間体をもたらす:編集されないDNA配列を含有する5'フラップおよびPEgRNAからコピーされた編集された配列を含有する3'フラップである(図38B)。首尾良い編集を達成するためには、編集された3'フラップが編集されない5'フラップを置き換えるようにして、この分岐した中間体は分解されなければならない。編集された3'フラップは編集されない鎖とより少数の塩基対を作り得るので、編集されない鎖との5'フラップのハイブリダイゼーションは熱力学的に有利であることが蓋然的であるが、5'フラップはFEN1などの構造特異的エンドヌクレアーゼの好ましい基質である141。これは、ラギング鎖DNA合成およびロングパッチ塩基除去修復の間に生成された5'フラップを切り出す。選好的5'フラップ切除および3'フラップライゲーションは、編集されたDNA鎖の組み込みを駆動し得、1つの編集された鎖および1つの編集されない鎖を含有するヘテロ二重鎖DNAを生出するということが推論された(図38B)。 These initial steps of nicking and reverse transcription, similar to the mechanism used by some natural mobile genetic elements, 140 result in a branched intermediate with two redundant single-stranded DNA flaps on one strand: a 5' flap containing the unedited DNA sequence and a 3' flap containing the edited sequence copied from the PEgRNA (Figure 38B). To achieve successful editing, this branched intermediate must be degraded, with the edited 3' flap replacing the unedited 5' flap. Because the edited 3' flap can make fewer base pairs with the unedited strand, hybridization of the 5' flap with the unedited strand is likely thermodynamically favored, but the 5' flap is a preferred substrate for structure-specific endonucleases such as FEN1,141 which excise the 5' flap generated during lagging strand DNA synthesis and long-patch base excision repair. It was reasoned that preferential 5' flap excision and 3' flap ligation might drive integration of the edited DNA strand, generating a heteroduplex DNA containing one edited and one unedited strand (Figure 38B).

編集の永久的な組み入れは、編集された鎖から相補的なDNA鎖に情報をコピーする様式で、2つのDNA鎖間のミスマッチを分解する爾後のDNA修復から発生し得る(図38C)。DNA塩基編集の効率を最大化するために開発された類似の戦略に基づいて131~133、二本鎖切断形成を最小化するために当初のニックの部位から十分遠くにおける非編集DNA鎖へニックを入れることは、非編集鎖を選好的に置き換えるようにDNA修復を偏らせ得るということが想定された。 Permanent incorporation of the edit can result from subsequent DNA repair that resolves the mismatch between the two DNA strands in a manner that copies information from the edited strand to the complementary DNA strand (Figure 38C). Based on similar strategies developed to maximize the efficiency of DNA base editing ,131-133 it was hypothesized that nicking the non-edited DNA strand far enough away from the site of the original nick to minimize double-strand break formation could bias DNA repair to preferentially replace the non-edited strand.

in vitroおよび酵母細胞におけるプライム編集ステップの検証
Cas9のRuvCヌクレアーゼドメインによるPAM含有DNA鎖の切断後に、この鎖のPAM遠位フラグメントは、さもなければ安定なCas9:sgRNA:DNA複合体から解離し得る143。この解放された鎖の3'端は、DNA重合をプライムするために十分にアクセス可能であり得るという仮説が立てられた。ガイドRNA操作作業144~146およびCas9:sgRNA:DNA複合体の結晶構造147~149は、sgRNAの5'および3'末端がCas9:sgRNA活性を廃止することなしに伸長され得るということを示唆する。2つの重大な構成要素を包含するようにsgRNAを伸長することによって、PEgRNAをデザインした:ニッキングされたDNA鎖の3'端がPEgRNAにハイブリダイズすることを許すプライマー結合部位(PBS)、およびニッキングされたDNA鎖の3'端がポリメラーゼによってRNA鋳型上を伸長されるとゲノムDNA部位に直接的にコピーされるであろう所望の編集を含有する逆転写酵素(RT)鋳型である(図38C)。
Validation of the prime editing step in vitro and in yeast cells
Following cleavage of the PAM-containing DNA strand by the RuvC nuclease domain of Cas9, the PAM-distal fragment of this strand may dissociate from the otherwise stable Cas9:sgRNA:DNA complex.143 It was hypothesized that the 3' end of this released strand may be sufficiently accessible to prime DNA polymerization. Guide RNA engineering work144-146 and the crystal structure of the Cas9:sgRNA:DNA complex147-149 suggest that the 5' and 3' ends of the sgRNA can be extended without abolishing Cas9:sgRNA activity. PEgRNA was designed by extending the sgRNA to encompass two critical components: a primer binding site (PBS) that allows the 3' end of the nicked DNA strand to hybridize to the PEgRNA, and a reverse transcriptase (RT) template containing the desired edit that would be copied directly into the genomic DNA site once the 3' end of the nicked DNA strand is extended onto the RNA template by a polymerase (Figure 38C).

これらの仮説を、精製されたS.pyogenes Cas9タンパク質を用いてin vitroで試験した。sgRNAをどちらかの末端においてPBS配列(5から6ヌクレオチド、nt)およびRT鋳型(7から22nt)によって伸長することによって、一連のPEgRNA候補を構築した。5'伸長されたPEgRNAは標的DNAに対するCas9結合を導くということ、ならびに5'伸長されたPEgRNAおよび3'伸長されたPEgRNA両方がin vitroのCas9によって媒介される標的ニッキングと哺乳類細胞におけるDNA切断活性とを支持するということが確認された(図44A~44C)。これらの候補PEgRNAデザインを、予めニックが入った5'-Cy5標識dsDNA基質、触媒的に不活性型Cas9(dCas9)、およびモロニーマウス白血病ウイルス(M-MLV)逆転写酵素の市販のバリアントを用いて試験した(図44D)。全ての構成要素が存在するときには、ゲル移動度によって、蛍光標識されたDNA鎖からより長いDNA産物への効率的な変換が観察され、RT鋳型に沿った逆転写と整合した(図38D、図44D~44E)。所望の長さの産物が、5'伸長または3'伸長されたPEgRNAどちらかで形成された(図38D-38E)。dCas9の省略は、PEgRNA情報移入なしに、DNA鋳型上の逆転写酵素によって媒介されるDNA重合に由来するニックトランスレーション産物に至った(図38D)。PEgRNAが従来のsgRNAによって置き換えられたときには、DNA重合産物は観察されず、PEgRNAのPBSおよびRT鋳型構成要素の必要性を確認した(図38D)。これらの結果は、Cas9によって媒介されるDNA融解が一本鎖Rループを暴露し、これは、ニッキングされる場合には、5'伸長または3'伸長されたPEgRNAどちらかからの逆転写をプライムすることに有能であるということを実証している。 These hypotheses were tested in vitro using purified S. pyogenes Cas9 protein. A series of PEgRNA candidates was constructed by extending sgRNAs at either end with PBS sequences (5 to 6 nucleotides, nt) and RT templates (7 to 22 nt). It was confirmed that 5'-extended PEgRNAs direct Cas9 binding to target DNA, and that both 5'- and 3'-extended PEgRNAs support Cas9-mediated target nicking in vitro and DNA cleavage activity in mammalian cells (Figures 44A-44C). These candidate PEgRNA designs were tested with pre-nicked 5'-Cy5-labeled dsDNA substrates, catalytically inactive Cas9 (dCas9), and a commercially available variant of Moloney murine leukemia virus (M-MLV) reverse transcriptase (Figure 44D). When all components were present, efficient conversion of fluorescently labeled DNA strands to longer DNA products was observed by gel mobility, consistent with reverse transcription along the RT template (Figure 38D, Figure 44D-44E). Products of the desired length were formed with either 5'- or 3'-extended PEgRNA (Figure 38D-38E). Omission of dCas9 led to nick translation products derived from reverse transcriptase-mediated DNA polymerization on the DNA template without PEgRNA information transfer (Figure 38D). No DNA polymerization products were observed when PEgRNA was replaced by a conventional sgRNA, confirming the requirement for the PBS and RT template components of PEgRNA (Figure 38D). These results demonstrate that Cas9-mediated DNA melting exposes single-stranded R-loops that, when nicked, are competent to prime reverse transcription from either 5'- or 3'-extended PEgRNA.

次に、ニッキングされないdsDNA基質を、専らPAM含有鎖へニックを入れるCas9ニッカーゼ(H840A変異体)によって試験した112。これらの反応では、ことによると損なわれたCas9ニッカーゼ活性を原因として、5'伸長されたPEgRNAは逆転写産物を非効率的に生成した(図44F)。しかしながら、3'伸長されたPEgRNAはロバストなCas9ニッキングおよび効率的な逆転写を可能化した(図38E)。原理的には逆転写がPEgRNAの残りのどこかで終結するポテンシャルにもかかわらず、3'伸長されたPEgRNAの使用は単一の明らかな産物のみを生成した。Cas9ニッカーゼ、RT、および3'伸長されたPEgRNAによる反応の産物のDNA配列決定は、完全なRT鋳型配列がDNA基質へと逆転写されるということを明らかにした(図44G)。これらの実験は、3'伸長されたPEgRNAが、Cas9ニッカーゼ活性を導く能力を保持しながら、新たなDNA鎖の逆転写の鋳型となり得るということを確立した。 Next, the unnicked dsDNA substrate was tested with Cas9 nickase (H840A mutant), which exclusively nicks the PAM-containing strand. In these reactions, 5' - extended PEgRNA generated reverse transcription products inefficiently (Figure 44F), possibly due to impaired Cas9 nickase activity. However, 3'-extended PEgRNA enabled robust Cas9 nicking and efficient reverse transcription (Figure 38E). Despite the potential for reverse transcription to terminate anywhere in the remainder of the PEgRNA in principle, use of 3'-extended PEgRNA generated only a single distinct product. DNA sequencing of the products of reactions with Cas9 nickase, RT, and 3'-extended PEgRNA revealed that the entire RT template sequence was reverse transcribed into the DNA substrate (Figure 44G). These experiments established that 3'-extended PEgRNA could serve as a template for reverse transcription of a new DNA strand while retaining the ability to direct Cas9 nickase activity.

in vitroのPEgRNAによってプログラムされる逆転写によって生ずる3'フラップの真核細胞DNA修復アウトカムを評価するために、レポータープラスミド基質に対するin vitroのPEgRNA、Cas9ニッカーゼ、およびRTを用いるDNAニッキングおよび逆転写を行い、それから、反応産物を酵母(S.cerevisiae)細胞に形質転換した(図45A)。心強いことに、プラスミドが、未成熟停止コドンを修正するT・AからA・Tのトランスバージョンをコードする3'伸長されたPEgRNAによってin vitroで編集されたときには、酵母形質転換体の37%がGFPおよびmCherryタンパク質両方を発現した(図38F、図45C)。図38Eおよび図44Fの結果と整合して、5'伸長されたPEgRNAによってin vitroで実行された編集反応は、3'伸長されたPEgRNAによるものよりも少数のGFPおよびmCherry二重陽性コロニー(9%)を生んだ(図38Fおよび図45D)。生産的な編集は、フレームシフト変異を修正するために1ヌクレオチドを挿入するか(15%の二重陽性形質転換体)または1ヌクレオチドを欠失する(29%の二重陽性形質転換体)3'伸長されたPEgRNAを用いてもまた観察された(図38Fおよび図45E~45F)。二重陽性の酵母コロニーから回復した編集されたプラスミドのDNA配列決定は、コードされるトランスバージョン編集が所望の配列位置において生起するということを確認した(図45G)。これらの結果は、真核細胞のDNA修復がプライム編集から発生する3'DNAフラップを分解して、トランスバージョン、挿入、および欠失を包含する精密なDNA編集を組み込み得るということを実証している。 To evaluate the eukaryotic DNA repair outcomes of the 3' flap generated by in vitro PEgRNA-programmed reverse transcription, we performed in vitro DNA nicking and reverse transcription with PEgRNA, Cas9 nickase, and RT on a reporter plasmid substrate, and then transformed the reaction products into yeast (S. cerevisiae) cells (Figure 45A). Encouragingly, when the plasmid was edited in vitro with a 3'-extended PEgRNA encoding a T·A to A·T transversion correcting the premature stop codon, 37% of the yeast transformants expressed both GFP and mCherry proteins (Figure 38F, Figure 45C). Consistent with the results in Figure 38E and Figure 44F, the editing reaction performed in vitro with the 5'-extended PEgRNA yielded fewer GFP and mCherry double-positive colonies (9%) than with the 3'-extended PEgRNA (Figure 38F and Figure 45D). Productive editing was also observed using 3'-extended PEgRNAs that inserted (15% of double-positive transformants) or deleted (29% of double-positive transformants) one nucleotide to correct the frameshift mutation (Figure 38F and Figures 45E-45F). DNA sequencing of edited plasmids recovered from double-positive yeast colonies confirmed that the encoded transversion edit occurred at the desired sequence location (Figure 45G). These results demonstrate that eukaryotic DNA repair can resolve the 3' DNA flap resulting from the prime edit and incorporate precise DNA edits, including transversions, insertions, and deletions.

プライム編集因子1(PE1)のデザイン
in vitroのおよび酵母の結果によって促されて、哺乳類細胞のゲノムDNAを編集することができる最小の数の構成要素によるプライム編集システムを、開発のために探求した。3'伸長されたPEgRNA(これ以降では単純にPEgRNAと言われる。図39A)とフレキシブルなリンカーを介した逆転写酵素へのCas9 H840Aの直接的融合体とは、機能的な2構成要素プライム編集システムを構成し得るという仮説が立てられた。HEK293T(不死化ヒト胎児腎臓)細胞を、Cas9 H840Aニッカーゼのどちらかの末端への野生型M-MLV逆転写酵素の融合体をコードする1つのプラスミドと、PEgRNAをコードする第2のプラスミドとによってトランスフェクションした。当初の試みはHEK3標的座位における検出可能なT・AからA・Tの変換には至らなかった。
Design of prime editing factor 1 (PE1)
Encouraged by the in vitro and yeast results, we sought to develop a prime editing system with a minimal number of components capable of editing genomic DNA in mammalian cells. It was hypothesized that a 3'-extended PEgRNA (hereafter simply referred to as PEgRNA, Figure 39A) and a direct fusion of Cas9 H840A to reverse transcriptase via a flexible linker could constitute a functional two-component prime editing system. HEK293T (immortalized human embryonic kidney) cells were transfected with one plasmid encoding a fusion of wild-type M-MLV reverse transcriptase to either end of Cas9 H840A nickase and a second plasmid encoding PEgRNA. Initial attempts did not result in detectable T·A to A·T conversion at the HEK3 target locus.

しかしながら、8-15塩基へのPEgRNA上のPBSの伸長は(図39A)、HEK3標的部位における検出可能なT・AからA・Tの編集に至った(図39B)。RTがCas9ニッカーゼのC末端に融合されたプライム編集因子構築物(8~15ntの範囲であるPBS長さによって、3.7%の最大のT・AからA・Tの変換)では、N末端RT-Cas9ニッカーゼ融合体(1.3%の最大のT・AからA・Tの変換)と比較して高い効率であった(図39B;別様に規定されない限り、本願の全ての哺乳類細胞データは、セレクションまたはソーティングなしの処置された細胞集団全体の値を報告している)。これらの結果は、トランスで供給されるM-MLV RTの市販のバリアントを用いてin vitroで要求されるものと比較して、Cas9に融合された野生型M-MLV RTがヒト細胞におけるゲノム編集のための長いPBS配列を要求するということを示唆する。Cas9 H840AニッカーゼのC末端に融合されたこの第1世代野生型M-MLV逆転写酵素はPE1として指定された。 However, extension of the PBS on the PEGRNA to 8-15 bases (Figure 39A) led to detectable T·A to A·T editing at the HEK3 target site (Figure 39B). Primed editor constructs in which the RT was fused to the C-terminus of the Cas9 nickase were more efficient (maximum T·A to A·T conversion of 3.7% with PBS lengths ranging from 8 to 15 nt) compared to N-terminal RT-Cas9 nickase fusions (maximum T·A to A·T conversion of 1.3%) (Figure 39B; unless otherwise specified, all mammalian cell data in this application report values for the entire treated cell population without selection or sorting). These results suggest that wild-type M-MLV RT fused to Cas9 requires a long PBS sequence for genome editing in human cells compared to that required in vitro using a commercially available variant of M-MLV RT supplied in trans. This first-generation wild-type M-MLV reverse transcriptase fused to the C-terminus of Cas9 H840A nickase was designated PE1.

PEgRNAによって規定される4つの追加のゲノム標的部位におけるトランスバージョン点変異を精密に導入するPE1の能力(図39C)を試験した。HEK3座位における編集と類似に、これらのゲノム部位における効率はPBS長さに依存的であり、最大の編集効率は0.7-5.5%の範囲であった(図39C)。PE1からのインデルは低く、各部位の編集効率を最大化する条件下において、5つの部位について平均で0.2±0.1%であった(図46A)。PE1は、HEK3座位において、1ヌクレオチド欠失(4.0%効率)、1ヌクレオチド挿入(9.7%)、および3ヌクレオチド挿入(17%)によって例示される標的化された挿入および欠失を組み入れる能力があった(図39C)。これらの結果は、二本鎖DNA切断またはDNA鋳型を要求することなしに、標的化されたトランスバージョン、挿入、および欠失を直接的に組み入れるPE1の能力を確立する。 The ability of PE1 to precisely introduce transversion point mutations at four additional genomic target sites defined by the PEgRNA (Figure 39C) was tested. Similar to editing at the HEK3 locus, efficiency at these genomic sites was PBS length dependent, with maximum editing efficiencies ranging from 0.7-5.5% (Figure 39C). Indels from PE1 were low, averaging 0.2 ± 0.1% for the five sites under conditions that maximized editing efficiency at each site (Figure 46A). PE1 was capable of incorporating targeted insertions and deletions at the HEK3 locus, exemplified by a 1-nucleotide deletion (4.0% efficiency), a 1-nucleotide insertion (9.7%), and a 3-nucleotide insertion (17%) (Figure 39C). These results establish the ability of PE1 to directly incorporate targeted transversions, insertions, and deletions without requiring double-stranded DNA breaks or a DNA template.

プライム編集因子2(PE2)のデザイン Design of Prime Editing Factor 2 (PE2)

PE1は種々の編集をHEK293T細胞のいくつかの座位において組み入れ組み入れ得るが、編集効率は一般的に低かった(典型的には≦5%)(図39C)。PE1の逆転写酵素を操作することは、プライム編集複合体の固有の立体配座制約内でDNA合成の効率を改善し得、より高いゲノム編集収量をもたらすという仮説が立てられた。酵素熱安定性150,151、処理能力150、およびDNA:RNAヘテロ二重鎖基質親和性152を増大させる、ならびにRNaseH活性を不活性化する153M-MLV RT変異が先に報告されている。種々の逆転写酵素変異を含有する19のPE1バリアントを構築して、それらのプライム編集効率をヒト細胞において評価した。 Although PE1 could incorporate various edits at several loci in HEK293T cells, the editing efficiency was generally low (typically ≦5%) (Figure 39C). It was hypothesized that engineering the reverse transcriptase of PE1 could improve the efficiency of DNA synthesis within the unique conformational constraints of the prime editing complex, resulting in higher genome editing yields. M- MLV RT mutations have been previously reported that increase enzyme thermostability, processivity, and DNA:RNA heteroduplex substrate affinity, as well as inactivate RNase H activity. Nineteen PE1 variants containing various reverse transcriptase mutations were constructed and their prime editing efficiencies were evaluated in human cells.

第1に、上昇した温度における逆転写を支持するそれらの能力について先に実験室進化から新興した一連のM-MLV RTバリアント150を取り調べた。これ以降ではM3と言われるM-MLV RT上へのこれらのアミノ酸置換の3つ(D200N、L603W、およびT330P)の順次の導入は、PE1のものと比較して、HEK293T細胞の5つのゲノム座位におけるトランスバージョンおよび挿入編集効率の6.8倍の平均の増大に至った(図47A-47S)。 First, we interrogated a series of M-MLV RT variants that had previously emerged from laboratory evolution for their ability to support reverse transcription at elevated temperatures.150 Sequential introduction of three of these amino acid substitutions (D200N, L603W, and T330P) onto M-MLV RT, hereafter referred to as M3, led to an average 6.8-fold increase in transversion and insertion editing efficiency at five genomic loci in HEK293T cells compared to that of PE1 (Figures 47A-47S).

次に、M3との組み合わせで、鋳型:PBS複合体に対する結合、酵素処理能力、および熱安定性を増強することが先に示された追加の逆転写酵素変異152を試験した。分析された14の追加の変異体のうち、M3変異に加えてT306KおよびW313F置換を有するバリアントは、ヒト細胞の5つのゲノム部位における6つのトランスバージョンまたは挿入編集について、M3と比較して編集効率を追加の1.3倍から3.0倍改善した(図47A~47S)。PE1アーキテクチャに組み込まれたM-MLV逆転写酵素のこの五重変異体(Cas9 H840A-M-MLV RT(D200N L603W T330P T306K W313F))はこれ以降ではPE2と言われる。 Next, we tested additional reverse transcriptase mutations 152 that were previously shown to enhance binding to the template:PBS complex, enzymatic processivity, and thermostability in combination with M3. Of the 14 additional mutants analyzed, a variant carrying the M3 mutations plus T306K and W313F substitutions improved editing efficiency by an additional 1.3- to 3.0-fold compared to M3 for six transversion or insertion edits at five genomic sites in human cells (Figures 47A-47S). This quintuple mutant of M-MLV reverse transcriptase (Cas9 H840A-M-MLV RT(D200N L603W T330P T306K W313F)) incorporated into the PE1 architecture is hereafter referred to as PE2.

PE2は、1ヌクレオチドトランスバージョン、挿入、および欠失変異をPE1よりも実質的に高い効率で組み入れし(図39C)、より短いPBS PEgRNA配列と適合性であり(図39C)、一過性のゲノムDNA:PBS複合体に生産的に係合する増強された能力と整合する。平均で、PE2はPE1と比べてプライム編集点変異効率の1.6から5.1倍の改善に至り(図39C)、いくつかのケースでは、編集収量を最高で46倍まで劇的に改善した(図47Fおよび図47I)。PE2は標的化された挿入および欠失をPE1よりも効率的に成し遂げ、PE1によってこの挿入を組み入れる効率と比べて15倍の改善の4.5%の効率でHEK3座位における24bp FLAGエピトープタグの標的化された挿入を達成し(図47D)、PE1のものよりも2.1倍高い8.6%の効率でHEK3の1bp欠失を媒介した(図39C)。これらの結果はPE2をPE1よりも効率的なプライム編集因子として確立する。 PE2 incorporated single nucleotide transversion, insertion, and deletion mutations with substantially higher efficiency than PE1 (Figure 39C) and was compatible with the shorter PBS PEgRNA sequence (Figure 39C), consistent with its enhanced ability to productively engage transient genomic DNA:PBS complexes. On average, PE2 led to a 1.6- to 5.1-fold improvement in prime editing point mutation efficiency compared to PE1 (Figure 39C), and in some cases dramatically improved editing yields by up to 46-fold (Figures 47F and 47I). PE2 accomplished targeted insertions and deletions more efficiently than PE1, achieving targeted insertion of a 24-bp FLAG epitope tag at the HEK3 locus with 4.5% efficiency, a 15-fold improvement compared to the efficiency of incorporating this insertion by PE1 (Figure 47D), and mediated a 1-bp deletion in HEK3 with 8.6% efficiency, 2.1-fold higher than that of PE1 (Figure 39C). These results establish PE2 as a more efficient prime editor than PE1.

PEgRNA特色の最適化 Optimization of PEgRNA characteristics

PEgRNAアーキテクチャおよびプライム編集効率の間の関係性をHEK293T細胞の5つのゲノム座位においてPE2によって体系的に探査した(図39C)。一般的に、より低いGC含量を有するプライム部位はより長いPBS配列を要求するが(EMX1およびRNF2。夫々40%および30%GC含量をニックの上流の最初の10ntに含有する)、より多大なGC含量を有するものはより短いPBS配列によるプライム編集を支持し(HEK4およびFANCF。夫々80%および60%GC含量をニックの上流の最初の10ntに含有する)(図39C)、PEgRNA PBSに対するニッキングされたDNA鎖のハイブリダイゼーションのためのエネルギー的要件と整合する。PBS長さまたはGC含量レベルはプライム編集効率を厳格には予測せず、DNAプライマーまたはPEgRNA伸長の二次構造などの他の因子もまた編集活性に影響を及ぼし得る。典型的な標的配列では~13ntのPBS長さから出発し、配列が、~40~60%GC含量から逸脱する場合には異なるPBS長さを調査することが推奨される。必要なときには、最適なPBS配列は経験的に決定されるはずである。 The relationship between PEgRNA architecture and prime editing efficiency was systematically explored by PE2 at five genomic loci in HEK293T cells (Figure 39C). In general, prime sites with lower GC content require longer PBS sequences (EMX1 and RNF2, containing 40% and 30% GC content, respectively, in the first 10 nt upstream of the nick), whereas those with more extensive GC content support prime editing with shorter PBS sequences (HEK4 and FANCF, containing 80% and 60% GC content, respectively, in the first 10 nt upstream of the nick) (Figure 39C), consistent with the energetic requirements for hybridization of the nicked DNA strand to the PEgRNA PBS. PBS length or GC content level does not strictly predict prime editing efficiency, and other factors such as the secondary structure of the DNA primer or the PEgRNA extension may also affect editing activity. It is recommended to start with a PBS length of ~13 nt for typical target sequences and to investigate different PBS lengths if the sequence deviates from ~40-60% GC content. When necessary, optimal PBS sequences should be determined empirically.

次に、PEgRNAのRT鋳型部分の性能決定要因を研究した。長さが10~20ntの範囲であるRT鋳型を有するPEgRNAを、5つのゲノム標的部位においてPE2を用いて(図39D)および31ntほども長いより長いRT鋳型によって3つのゲノム部位において(図48A~48C)体系的に評価した。PBS長さのように、RT鋳型長さもまたプライム編集効率を最大化するために変えられ得るが、一般的には、多くのRT鋳型長さ≧10nt長はより効率的なプライム編集を支持する(図39D)。いくつかの標的部位はより高い編集効率(FANCF、EMX1)を達成するためにはより長いRT鋳型(>15nt)を好み、他の座位は短いRT鋳型(HEK3、HEK4)を好むので(図39D)、~10~16ntから出発して、PEgRNAを最適化するときには、短いおよび長いRT鋳型両方が試験されるということが推奨される。 Next, we investigated the performance determinants of the RT template portion of PEgRNA. PEgRNAs with RT templates ranging in length from 10 to 20 nt were systematically evaluated with PE2 at five genomic target sites (Figure 39D) and with longer RT templates as long as 31 nt at three genomic sites (Figures 48A-48C). Like the PBS length, the RT template length can also be varied to maximize prime editing efficiency, but in general, most RT template lengths ≥ 10 nt support more efficient prime editing (Figure 39D). Because some target sites prefer longer RT templates (> 15 nt) to achieve higher editing efficiency (FANCF, EMX1) and other loci prefer short RT templates (HEK3, HEK4) (Figure 39D), it is recommended that both short and long RT templates be tested when optimizing PEgRNA, starting from ∼10-16 nt.

重要なことに、sgRNA骨格の末端ヘアピンに隣接するヌクレオチドとしてCを置くRT鋳型は、一般的に、類似の長さのRT鋳型を有する他のPEgRNAと比較して低い編集効率をもたらした(図48A~48C)。Cas9に結合したsgRNAの構造に基づいて148,149、標準的なsgRNAの3'伸長の最初のヌクレオチドとしてのCの存在は、Cas9のTyr 1356とのパイスタックおよびsgRNA A68との非標準的な塩基対をネイティブに形成するヌクレオチドG81との対形成によって、sgRNA骨格折り畳みを遮断し得るということが推量された。多くのRT鋳型長さはプライム編集を支持するので、3'伸長の最初の塩基(RT鋳型の最後の逆転写される塩基)がCではないPEgRNAを選ぶことが推奨される。 Importantly, RT templates that placed a C as the nucleotide adjacent to the terminal hairpin of the sgRNA backbone generally resulted in lower editing efficiency compared to other PEgRNAs with RT templates of similar length (Figures 48A-48C). Based on the structure of sgRNAs bound to Cas9,148,149 it was speculated that the presence of a C as the first nucleotide of the 3' extension of a canonical sgRNA may block sgRNA backbone folding by pairing with nucleotide G81, which natively forms a non-canonical base pair with Cas9 Tyr 1356 and sgRNA A68. Because many RT template lengths support primed editing, it is recommended to choose PEgRNAs where the first base of the 3' extension (the last reverse transcribed base of the RT template) is not a C.

プライム編集因子3システム(PE3およびPE3b)のデザイン Design of the prime editing factor 3 system (PE3 and PE3b)

PE2は遺伝情報をPEgRNAから標的座位にPE1よりも効率的に移入し得るが、細胞が1つの編集された鎖および1つの編集されない鎖によって生出されるもたらされるヘテロ二重鎖DNAを分解する様式は、編集が耐久性であるかどうかを決定する。シトシンまたはアデニン脱アミノ化の当初の産物は1つの編集されたおよび1つの非編集の鎖を含有するヘテロ二重鎖DNAであるので、塩基編集の先の開発は類似の課題に当面した。塩基編集の効率を増大させるために、Cas9 D10Aニッカーゼを用いてニックを非編集鎖に導入し、編集された鎖を鋳型として用いるDNA修復をその鎖へと導いた129,130,142。この原理を有効利用してプライム編集効率を増強するために、細胞による非編集鎖の選好的置き換えを誘導するために、すでにPE2に存在するCas9 H840Aニッカーゼと単純なsgRNAとを用いて非編集鎖へニックを入れる類似の戦略(図40A)を試験した。編集されたDNA鎖もまたプライム編集を開始するためにニッキングされたので、種々のsgRNAによってプログラムされるニックの位置付けを非編集鎖について試験して、インデルに至る二本鎖DNA切断の生産を最小化した。 Although PE2 can transfer genetic information from PEgRNA to the target locus more efficiently than PE1, the manner in which cells degrade the resulting heteroduplex DNA generated by one edited and one unedited strand determines whether the edit is durable. Previous developments in base editing faced similar challenges, since the initial product of cytosine or adenine deamination is heteroduplex DNA containing one edited and one unedited strand. To increase the efficiency of base editing, a nick was introduced into the unedited strand using Cas9 D10A nickase to guide DNA repair to that strand using the edited strand as a template. 129,130,142 To exploit this principle and enhance the efficiency of prime editing, a similar strategy was tested to nick the unedited strand using Cas9 H840A nickase already present in PE2 and a simple sgRNA to induce preferential replacement of the unedited strand by the cell (Figure 40A). Because the edited DNA strand was also nicked to initiate prime editing, the positioning of the nicks programmed by different sgRNAs was tested on the non-edited strand to minimize the production of double-stranded DNA breaks leading to indels.

PAMの5'または3'どちらかのPEgRNAによって誘導されるニックの部位から14から116塩基に位置付けられるニックを誘導するsgRNAをスクリーニングすることによって、このPE3戦略を最初にHEK293T細胞の5つのゲノム部位において試験した。試験された5つの部位のうち4つでは、非編集鎖へニックを入れることは、インデルフリーなプライム編集産物の量を、PE2システムと比較して1.5から4.2倍、55%ほども高くまで増大させた(図40B)。最適なニッキング位置はゲノム部位に依存して変わったが、PEgRNAによって誘導されるニックからおよそ40-90bpのPAMの3'に位置取るニックは(図40Bの正の距離)、一般的には、プライム編集効率の好ましい増大(平均で41%である)を余分なインデル形成なしに生じた(試験された5つの部位の夫々において、最も高い編集効率をもたらすsgRNAでは6.8%の平均インデル)(図40B)。予想されるとおり、いくつかの部位では、PEgRNAによって誘導されるニックの40bp以内に非編集鎖ニックを置くことは、最高で22%のインデル形成の大きい増大に至った(図40B)。おそらくは、近接する両方の鎖に一緒へニックを入れることからの二本鎖切断の形成を原因とする。しかしながら、他の部位では、PEgRNAによって誘導されるニックから14bpほども近接するニッキングは5%インデルのみを生じ(図40B)、座位依存性因子が近位の二元的なニックから二本鎖DNA切断への変換をコントロールするということを示唆した。1つの試験された部位(HEK4)では、PEgRNAによって誘導されるニックから距離>70bpに置かれるときでさえも、相補鎖ニックは利益を提供しないかまたは編集効率を越えるインデルレベル(最高で26%)に至るかどちらかであり、その部位の編集された鎖が細胞によってニッキングされるかまたは非効率的にライゲーションされる普通でない傾向と整合した。PEgRNAによって媒介されるニックからおよそ50bpの非編集鎖ニックから出発することと、インデル度数が許容されるレベルを超過する場合には代替的なニック位置付けを試験することとが推奨される。 This PE3 strategy was first tested at five genomic sites in HEK293T cells by screening sgRNAs that induce nicks located 14 to 116 bases from the site of the PEgRNA-induced nick either 5' or 3' of the PAM. In four of the five sites tested, nicking the non-edited strand increased the amount of indel-free prime editing product by 1.5 to 4.2-fold, as much as 55% higher, compared to the PE2 system (Figure 40B). Although the optimal nicking position varied depending on the genomic site, nicks located approximately 40-90 bp 3' of the PAM from the PEgRNA-induced nick (positive distance in Figure 40B) generally resulted in a favorable increase in prime editing efficiency (41% on average) without extra indel formation (6.8% average indels for the sgRNA resulting in the highest editing efficiency at each of the five sites tested) (Figure 40B). As expected, at some sites, placing a non-edited strand nick within 40 bp of the PEgRNA-induced nick led to a large increase in indel formation, up to 22% (Figure 40B), presumably due to the formation of double-stranded breaks from nicking both adjacent strands together. However, at other sites, nicking as close as 14 bp from the PEgRNA-induced nick resulted in only 5% indels (Figure 40B), suggesting that locus-dependent factors control the conversion of the proximal double nick to a double-stranded DNA break. At one tested site (HEK4), even when placed >70 bp away from the PEgRNA-induced nick, complementary strand nicks either provided no benefit or led to indel levels that exceeded the editing efficiency (up to 26%), consistent with the unusual tendency of the edited strand at that site to be nicked or inefficiently ligated by the cells. It is recommended to start with a non-edited strand nick approximately 50 bp from the PEGRNA-mediated nick and to test alternative nick positioning if indel frequency exceeds tolerated levels.

どのようにして相補鎖ニッキングがプライム編集効率を改善するのかについてのこのモデルは(図40A)、編集された鎖のフラップ分解後にのみ非編集鎖へニックを入れることが、同時的なニックの存在を最小化し得、引き続きインデルを形成する二本鎖切断の度数を減少させるということを予測した。非編集鎖ニッキングの時間的コントロールを達成するために、元々のアレルではなく編集された鎖にマッチするスペーサー配列を有するsgRNAをデザインした。これ以降ではPE3bと言われるこの戦略を用いて、スペーサーおよび編集されないアレルの間のミスマッチは、PAM鎖上の編集イベントが生起する後までは、sgRNAによるニッキングを好まないはずである。このPE3bアプローチを、HEK293T細胞の3つのゲノム部位における5つの異なる編集によって試験し、アウトカムをPE2およびPE3システムによって達成されるものと比較した。全てのケースで、PE3bは、PE3と比較して総体的な編集効率のいずれかの明白な減少なしに、PE3と比較して実質的に低いレベルのインデルに関連した(3.5から30倍。平均で12倍低いインデルまたは0.85%である)(図40C)。よって、編集が第2のプロトスペーサー上に在ったときには、PE3bシステムは、PE2と比較して編集効率を多くの場合にはPE3のものと類似のレベルまでなお改善しながら、インデルを減少させ得た(図40C)。 This model of how complementary strand nicking improves prime editing efficiency (Figure 40A) predicted that nicking the non-edited strand only after flap degradation of the edited strand would minimize the presence of simultaneous nicks and subsequently reduce the frequency of double-stranded breaks forming indels. To achieve temporal control of non-edited strand nicking, we designed sgRNAs with spacer sequences that match the edited strand but not the original allele. With this strategy, hereafter referred to as PE3b, mismatches between the spacer and the non-edited allele should not favor nicking by the sgRNA until after an editing event on the PAM strand has occurred. We tested this PE3b approach with five different edits at three genomic sites in HEK293T cells and compared outcomes to those achieved by the PE2 and PE3 systems. In all cases, PE3b was associated with substantially lower levels of indels compared to PE3 (3.5 to 30-fold, with an average of 12-fold lower indels or 0.85%) without any apparent decrease in overall editing efficiency compared to PE3 (Figure 40C). Thus, when editing was on the second protospacer, the PE3b system was able to reduce indels compared to PE2 while still improving editing efficiency, often to levels similar to that of PE3 (Figure 40C).

一緒になって、これらの知見は、PE3システム(Cas9ニッカーゼ-最適化逆転写酵素+PEgRNA+sgRNA)が編集効率をPE2と比較して~3倍改善するということを確立した(図40B~40C)。PE3の追加のニッキング活性から、予想されるとおり、PE3はPE2よりも広い範囲のインデルによって随伴された。PE3の使用はプライム編集効率を優先するときに推奨される。インデルの最小化が重大であるときには、PE2は~10倍低いインデル度数をオファーする。組み入れされた編集を認識して非編集鎖へニックを入れるsgRNAを用いることが可能であるときには、PE3bシステムはインデル形成を多大に縮減しながらPE3様の編集レベルを達成し得る。 Together, these findings establish that the PE3 system (Cas9 nickase-optimized reverse transcriptase + PEgRNA + sgRNA) improves editing efficiency by ∼3-fold compared to PE2 (Figures 40B-40C). As expected from the additional nicking activity of PE3, PE3 was accompanied by a broader range of indels than PE2. Use of PE3 is recommended when prioritizing prime editing efficiency. When indel minimization is critical, PE2 offers ∼10-fold lower indel frequency. When it is possible to use a sgRNA that recognizes the incorporated edit and nicks the non-edited strand, the PE3b system can achieve PE3-like editing levels while greatly reducing indel formation.

PE3によるプライム編集の標的化範囲および汎用性を実証するために、HEK3標的部位の+1から+8位置(PEgRNAによって誘導されるニックの3'の最初の塩基を位置+1としてカウントする)における全ての可能な1ヌクレオチド置換の組み入れを、PE3と10ヌクレオチドRT鋳型を有するPEgRNAとを用いて(図41A)調査した。集合的に、これらの24の別物の編集は全ての4つのトランジション変異および全ての8つのトランスバージョン変異をカバーし、平均で33±7.9%である(14%および48%の間の範囲である)編集効率(インデルを含有しない)で、平均で7.5±1.8%のインデルによって進む。 To demonstrate the targeting scope and versatility of primed editing with PE3, the incorporation of all possible single nucleotide substitutions at positions +1 to +8 (counting the first base 3' of the nick induced by the PEgRNA as position +1) of the HEK3 target site was explored using PE3 and PEgRNA with a 10-nucleotide RT template (Figure 41A). Collectively, these 24 alternative edits covered all four transition mutations and all eight transversion mutations, proceeding with an average of 7.5±1.8% indels, with an editing efficiency (not including indels) of 33±7.9% (ranging between 14% and 48%).

重要なことに、長距離RT鋳型もまたPE3による効率的なプライム編集を生じさせ得る。例えば、PE3を34nt RT鋳型と共に用いて、点変異をHEK3座位の位置+12、+14、+17、+20、+23、+24、+26、+30、および+33(PEgRNAによって誘導されるニックから12から33塩基)に組み入れし、平均で36±8.7%の効率および8.6±2.0%のインデルを有した(図41B)。他の座位における+10位置以降の編集は試みなかったが、3つの代替的な部位における他のRT鋳型≧30ntもまた効率的編集を支持する(図48A-C)。長いRT鋳型の実行可能性は、当初のニック部位から何ダースものヌクレオチドについて効率的なプライム編集を可能化した。どちらかのDNA鎖上のNGG PAMは、効率的なプライム編集を支持する編集およびPAMの間の最大距離よりもずっと少ない平均で~8bp毎に生起するので、他の精密ゲノム編集法とは対照的に、プライム編集は近傍のPAM配列の利用可能性によって実質的に制約されない125,142,154。RNA二次構造とプライム編集効率との間の推定される関係性から、ロングレンジ編集のためのPEgRNAをデザインするときには、種々の長さおよび必要な場合には配列組成(例えば、同義コドン)のRT鋳型を試験して編集効率を最適化することが賢明である。 Importantly, long-distance RT templates can also generate efficient prime editing with PE3. For example, PE3 was used with a 34-nt RT template to incorporate point mutations at positions +12, +14, +17, +20, +23, +24, +26, +30, and +33 (12 to 33 bases from the nicks induced by PEgRNA) at the HEK3 locus with an average efficiency of 36±8.7% and 8.6±2.0% indels (Figure 41B). Although editing beyond the +10 position at other loci was not attempted, other RT templates ≥30 nt at three alternative sites also support efficient editing (Figure 48A-C). The feasibility of long RT templates enabled efficient prime editing for dozens of nucleotides from the original nick site. In contrast to other precision genome editing methods, prime editing is not substantially constrained by the availability of nearby PAM sequences, since NGG PAMs on either DNA strand occur on average every ∼8 bp, much less than the maximum distance between edits and PAMs that supports efficient prime editing. 125,142,154 Given the predicted relationship between RNA secondary structure and prime editing efficiency, it is prudent to test RT templates of different lengths and, if necessary, sequence composition (e.g., synonymous codons) to optimize editing efficiency when designing PEgRNAs for long-range editing.

トランジションおよびトランスバージョン点変異を導入するためのPE3システムの範囲および限定をさらに試験するために、全ての12の可能な方の点変異をカバーする72の追加の編集を6つの追加のゲノム標的部位(図41C~41H)について試験した。総体的に、インデルフリーな編集効率は平均で25±14%であり、インデル形成は平均で8.3±7.5%であった。PEgRNA RT鋳型はPAM配列を包含したので、プライム編集はPAM配列の変化を誘導し得た。これらのケースでは、より高い編集効率(平均で39±9.7%である)およびより低いインデル生成(平均で5.0±2.9%である)が観察された(図41A~41K。位置+5または+6における点変異)。PAM編集の効率のこの増大およびインデル形成の減少は、Cas9ニッカーゼが相補鎖の修復に先行して編集された鎖に再結合およびニッキングすることの不能から発生し得る。プライム編集は編集効率の明らかな損失なしに組み合わせ編集を支持するので、可能なときには、他の所望の変化に加えてPAMを編集することが推奨される。 To further test the scope and limitations of the PE3 system for introducing transition and transversion point mutations, 72 additional edits covering all 12 possible point mutations were tested at six additional genomic target sites (Figures 41C-41H). Overall, indel-free editing efficiency averaged 25 ± 14%, and indel formation averaged 8.3 ± 7.5%. Because the PEgRNA RT template encompassed the PAM sequence, prime editing could induce changes in the PAM sequence. In these cases, higher editing efficiency (average of 39 ± 9.7%) and lower indel generation (average of 5.0 ± 2.9%) were observed (Figures 41A-41K; point mutations at positions +5 or +6). This increase in efficiency of PAM editing and decrease in indel formation may result from the inability of Cas9 nickase to rebind and nick the edited strand prior to repair of the complementary strand. Prime editing supports combinatorial editing without any apparent loss of editing efficiency, so when possible, it is recommended to edit the PAM in addition to other desired changes.

次に、14の標的化された小さい挿入および14の標的化された小さい欠失を、7つのゲノム部位において、PE3を用いて(図41I)行った。標的化された1bp挿入は32±9.8%の平均効率で進み、3bp挿入は39±16%の平均効率で組み入れされた。標的化された1bpおよび3bp欠失もまた効率的であり、夫々29±14%および32±11%の平均収量で進んだ。インデル生成(標的化された挿入または欠失以外)は平均で6.8±5.4%であった。位置+1および+6の間に導入された挿入および欠失はPAMの位置または構造を変改するので、PAMを編集する点変異と類似に、Cas9ニッカーゼが相補鎖の修復に先行して編集された鎖に再結合およびニッキングすることの不能を原因として、この範囲の挿入および欠失編集は典型的にはより効率的であるということが推量された。 Next, 14 targeted small insertions and 14 targeted small deletions were made with PE3 (Figure 41I) at seven genomic sites. Targeted 1 bp insertions proceeded with an average efficiency of 32 ± 9.8%, and 3 bp insertions were incorporated with an average efficiency of 39 ± 16%. Targeted 1 bp and 3 bp deletions were also efficient, proceeding with average yields of 29 ± 14% and 32 ± 11%, respectively. Indel generation (other than targeted insertions or deletions) averaged 6.8 ± 5.4%. Because insertions and deletions introduced between positions +1 and +6 alter the position or structure of the PAM, it was speculated that insertion and deletion edits in this range are typically more efficient due to the inability of Cas9 nickase to rebind and nick the edited strand prior to repair of the complementary strand, similar to point mutations that edit the PAM.

PE3は、HEK3部位における5bpから80bpのより大きい精密な欠失を媒介するその能力についてもまた試験された(図41J)。13nt PBSと夫々29、24、または19bpの相同性を標的座位に対して含有するRT鋳型とを用いたときには、非常に高い編集効率(52から78%)が5、10、および15bp欠失について観察された。26nt RT鋳型を用いることは、72±4.2%の効率で25bpというより大きい欠失を支持し、20nt RT鋳型は52±3.8%の効率で80bp欠失を可能化した。これらの標的化された欠失は平均で11±4.8%であるインデル度数によって随伴された(図41J)。 PE3 was also tested for its ability to mediate larger, precise deletions of 5 bp to 80 bp at the HEK3 site (Figure 41J). Very high editing efficiencies (52 to 78%) were observed for 5, 10, and 15 bp deletions when using the 13 nt PBS and RT templates containing 29, 24, or 19 bp of homology to the target locus, respectively. Using a 26 nt RT template supported larger deletions of 25 bp with an efficiency of 72 ± 4.2%, and a 20 nt RT template enabled an 80 bp deletion with an efficiency of 52 ± 3.8%. These targeted deletions were accompanied by an indel frequency that averaged 11 ± 4.8% (Figure 41J).

最後に、3つのゲノム部位における挿入および欠失、挿入および点変異、欠失および点変異、または2つの点変異からなる同じ標的座位における複数の編集の12の組み合わせを媒介するPE3の能力を試験した。これらの組み合わせ編集は非常に効率的であり、6.4%のインデルによって平均で55%の標的編集であり(図41K)、精密な挿入、欠失、および点変異の組み合わせを個々の標的部位において高い効率および低いインデル度数でなすプライム編集の能力を実証した。 Finally, we tested the ability of PE3 to mediate 12 combinations of multiple edits at the same target locus consisting of an insertion and deletion, an insertion and a point mutation, a deletion and a point mutation, or two point mutations at three genomic sites. These combinatorial edits were highly efficient, averaging 55% targeted edits with 6.4% indels (Figure 41K), demonstrating the ability of primed editing to make precise combinations of insertions, deletions, and point mutations at individual target sites with high efficiency and low indel frequency.

一緒になって、図41A-41Kの例は7つのヒトゲノム座位における156の別物のトランジション、トランスバージョン、挿入、欠失、および組み合わせ編集を表す。これらの知見はプライム編集の汎用性、精度、および標的化フレキシビリティーを確立する。 Together, the examples in Figures 41A-41K represent 156 distinct transitions, transversions, insertions, deletions, and combinatorial edits at seven human genomic loci. These findings establish the versatility, precision, and targeting flexibility of prime editing.

塩基編集と比較したプライム編集 Prime editing compared to base editing

現行世代のシチジン塩基編集因子(CBE)およびアデニン塩基編集因子(ABE)は、C・GからT・Aのトランジション変異およびA・TからG・Cのトランジション変異を高い効率および低いインデルで組み入れ組み入れ得る129,130,142。塩基編集の適用は、欲されないバイスタンダー編集を生じさせる塩基編集活性窓(典型的には~5bpの幅)上の複数のシチジンまたはアデニン塩基の存在によって129,130,142,155、または標的ヌクレオチドからおよそ15±2ntに位置取るPAMの不在によって142,156限定され得る。プライム編集は、バイスタンダー編集なしの、または好適に位置取ったPAMの欠如が標的ヌクレオチドをCBEまたはABE活性窓上に好ましく位置取らせることを不可能にするときの、トランジション変異の精密な組み入れにとって特に有用であり得るということが予期された。 Current generation cytidine base editors (CBEs) and adenine base editors (ABEs) can incorporate C.G to T.A and A.T to G.C transition mutations with high efficiency and low indels.129,130,142 The application of base editing can be limited by the presence of multiple cytidine or adenine bases on the base editing activity window (typically ~5 bp wide) that results in unwanted bystander editing, 129,130,142,155 or by the absence of a PAM located approximately 15 ± 2 nt from the target nucleotide.142,156 It was anticipated that prime editing could be particularly useful for precise incorporation of transition mutations without bystander editing or when the lack of a suitably positioned PAM makes it impossible to favorably position the target nucleotide on the CBE or ABE activity window.

プライム編集およびシトシン塩基編集を、複数の標的シチジンを標準的な塩基編集窓(プロトスペーサー位置4~8。PAMを位置21~23としてカウントする)上に含有する3つのゲノム座位を編集することによって比較した。ニッカーゼ活性なしの(BE2max)もしくはニッカーゼ活性ありの(BE4max)最適化されたCBE157を用いるか、または類縁のPE2およびPE3プライム編集システムを用いた。3つの部位の塩基編集窓上の9つのトータルの標的シトシンのうち、BE4maxは、PE3よりも2.2倍高い平均のトータルのC・GからT・Aの変換を塩基編集窓の中心の塩基(プロトスペーサー位置5~7。図42A)について生んだ。同様に、非ニッキングBE2maxはこれらの良く位置取った塩基においてPE2に平均で1.4倍優った(図42A)。しかしながら、塩基編集窓の中心以外のシトシンについて、PE3はBE4maxに2.7倍優り、PE2はBE2maxに2.0倍優った(PE3の40±17%対BE4maxの15±18%、およびPE2の22±11%対BE2maxの11±13%の平均編集)。総体的に、PE2のインデル度数は非常に低く(平均で0.86±0.47%であった)、PE3では、BE4maxのものに類似かまたはそれよりも控えめに高かった(BE4max範囲:2.5%から14%;PE3範囲:2.5%から21%)(図42B)。 Primed editing and cytosine base editing were compared by editing three genomic loci containing multiple targeted cytidines over a standard base editing window (protospacer positions 4-8, counting the PAM as positions 21-23). Optimized CBE 157 was used without (BE2max) or with (BE4max) nickase activity, or the related PE2 and PE3 primed editing systems were used. Of the nine total targeted cytosines over the three-site base editing window, BE4max produced 2.2-fold higher average total C.G to T.A conversions than PE3 for bases in the center of the base editing window (protospacer positions 5-7; Figure 42A). Similarly, non-nicking BE2max outperformed PE2 on average by 1.4-fold at these well-positioned bases (Figure 42A). However, for cytosines outside the center of the base editing window, PE3 outperformed BE4max by 2.7-fold and PE2 outperformed BE2max by 2.0-fold (average edits of 40±17% for PE3 vs. 15±18% for BE4max, and 22±11% for PE2 vs. 11±13% for BE2max). Overall, the indel frequency in PE2 was very low (average 0.86±0.47%) and in PE3 it was similar to or modestly higher than that of BE4max (BE4max range: 2.5% to 14%; PE3 range: 2.5% to 21%) (Figure 42B).

精密なC・GからT・Aの編集の組み入れ(いずれかのバイスタンダー編集なし)について塩基編集の効率をプライム編集と比較したときには、プライム編集の効率は上の部位において塩基編集のものを多大に超過した。これらは、ほとんどのゲノムDNA部位のように、複数のシトシンを~5bp塩基編集窓上に含有する(図42C)。シトシンをプロトスペーサー位置C5、C6、およびC7に含有するEMX1などのこれらの部位では、BE4maxは、バイスタンダー編集なしの単一の標的塩基対変換のみを含有する少数の産物を生成した。対照的に、この部位におけるプライム編集は、C・GからT・Aの編集をいずれかの位置または位置の組み合わせ(C5、C6、C7、C5+C6、C6+C7、C5+C7、またはC5+C6+C7)において選択的に組み入れるために用いられ得た(図42C)。全ての精密な1塩基または2塩基編集(つまり、いずれかの他の近傍塩基を改変しない編集)は、PE3またはPE2では夫々BE4maxまたはBE2よりもかなり効率的であったが、3塩基のC・GからT・Aの編集はBE4maxでより効率的であり(図42C)、活性窓上の全ての標的塩基を編集する塩基編集因子の傾向を反映した。一緒にすると、これらの結果は、シトシン塩基編集因子は最適に位置取った標的塩基においてPE2またはPE3よりも高いレベルの編集をもたらし得るが、プライム編集は非最適に位置取った標的塩基において塩基編集に優り得、複数の編集可能な塩基ではかなり高い精度で編集し得るということを実証している。 When comparing the efficiency of base editing to prime editing for the incorporation of precise C/G to T/A edits (without any bystander editing), the efficiency of prime editing greatly exceeded that of base editing at the above sites, which, like most genomic DNA sites, contain multiple cytosines over the ~5 bp base editing window (Figure 42C). At these sites, such as EMX1, which contains cytosines at protospacer positions C5, C6, and C7, BE4max generated a small number of products that contained only a single targeted base pair conversion without bystander editing. In contrast, prime editing at this site could be used to selectively incorporate C/G to T/A edits at any position or combination of positions (C5, C6, C7, C5+C6, C6+C7, C5+C7, or C5+C6+C7) (Figure 42C). All precise single- or double-base edits (i.e., edits that do not modify any other nearby bases) were significantly more efficient with PE3 or PE2 than with BE4max or BE2, respectively, while triple C-G to T-A edits were more efficient with BE4max (Figure 42C), reflecting the tendency of base editors to edit all target bases over their activity window. Together, these results demonstrate that cytosine base editors can produce higher levels of editing than PE2 or PE3 at optimally positioned target bases, but primed edits can outperform base edits at non-optimally positioned target bases and can edit with significantly greater precision at multiple editable bases.

最適化された非ニッキングABE(Cas9ニッカーゼの代わりにdCas9によるABEmax152。これ以降ではABEdmaxと言われる)対PE2によるおよび最適化されたニッキングアデニン塩基編集因子ABEmax対PE3によるA・TからG・Cの編集を2つのゲノム座位において比較した。2つの標的アデニンを塩基編集窓上に含有する部位(HEK3)では、ABEはA5の変換についてPE2またはPE3よりも効率的であったが、PE3はABEmax編集窓の縁部に在るA8の変換についてより効率的であった(図42D)。単一のアデニンのみが変換される精密編集の効率を比較するときには、PE3はA5およびA8両方においてABEmaxに優った(図42E)。総体的には、ABEはプライム編集因子よりもずっと少数のインデルをHEK3において生じた(ABEdmaxの0.19±0.02%対PE2の1.5±0.46%、およびABEmaxの0.53±0.16%対PE3の11±2.3%、図42F)。単一のAのみが塩基編集窓上に存在するFANCFにおいては、ABE2およびABEmaxはトータルの標的塩基対変換がそれらのプライム編集カウンターパートに1.8から2.9倍優り、塩基編集およびプライム編集両方からの実質的に全ての編集された産物は精密な編集のみを含有した(図42D~42E)。HEK3部位のように、ABEはFANCF部位においてずっと少数のインデルを生じた(図42F)。 A.T to G.C editing by optimized non-nicking ABE (ABEmax 152 with dCas9 instead of Cas9 nickase, henceforth referred to as ABEdmax) versus PE2 and optimized nicking adenine base editor ABEmax versus PE3 were compared at two genomic loci. At sites containing two targeted adenines in the base editing window (HEK3), ABE was more efficient than PE2 or PE3 for converting A5, while PE3 was more efficient for converting A8, which is at the edge of the ABEmax editing window (Figure 42D). When comparing the efficiency of precision editing where only a single adenine is converted, PE3 outperformed ABEmax at both A5 and A8 (Figure 42E). Overall, ABE produced far fewer indels in HEK3 than prime editors (0.19±0.02% ABEdmax vs. 1.5±0.46% PE2, and 0.53±0.16% ABEmax vs. 11±2.3% PE3, Figure 42F). In FANCF, where only a single A is present in the base editing window, ABE2 and ABEmax outperformed their prime editing counterparts by 1.8-2.9-fold in total target base pair conversion, and virtually all edited products from both base editing and prime editing contained only precise edits (Figures 42D-42E). As in the HEK3 site, ABE produced far fewer indels in the FANCF site (Figure 42F).

集合的に、これらの結果は、標的化されたトランジション変異を作ることについて、塩基編集およびプライム編集が補完的な強さおよび弱さをオファーするということを指示する。単一の標的ヌクレオチドが塩基編集窓上に存在するケースでは、またはバイスタンダー編集が許容されるときには、現行の塩基編集因子は典型的にはプライム編集因子よりも効率的であり、少数のインデルをもたらす。複数のシトシンまたはアデニンが存在しかつバイスタンダー編集が望ましくないときには、または標的塩基が利用可能なPAMに対して相対的に塩基編集にとって不良に位置取るときには、プライム編集因子は実質的な利点をオファーする。 Collectively, these results indicate that base editing and prime editing offer complementary strengths and weaknesses for creating targeted transition mutations. In cases where a single target nucleotide falls within the base editing window, or when bystander editing is permitted, current base editors are typically more efficient than prime editors, resulting in fewer indels. Prime editors offer a substantial advantage when multiple cytosines or adenines are present and bystander editing is undesirable, or when the target base is poorly positioned for base editing relative to the available PAMs.

オフターゲットプライム編集 Off-target prime edits

生産的な編集をもたらすためには、プライム編集は、Cas9ドメインが結合するための相補的な標的座位:PEgRNAスペーサー、PEgRNAによってプライムされる逆転写が開始するための標的座位:PEgRNA PBS相補性、およびフラップ分解のための標的座位:逆転写酵素産物相補性を要求する。これらの3つの別物のDNAハイブリダイゼーション要件は、他のゲノム編集法のものと比較してオフターゲットプライム編集を最小化し得るという仮説が立てられた。この可能性を試験するために、HEK293T細胞を、PE3またはPE2と4つのオンターゲットゲノム座位を標的化するようにデザインされたトータルで16のPEgRNAとによって、Cas9と同じプロトスペーサーを標的化する4つの対応するsgRNAとによって、またはCas9と同じ16のPEgRNAとによって処置した。夫々が、Cas9および対応するオンターゲットsgRNAがHEK293T細胞において実質的なオフターゲットDNA改変を引き起こすことが公知である少なくとも4つの良く特徴付けられたオフターゲット部位を有するので118,159、これらの4つの標的座位が選ばれた。処置後に、各オンターゲットスペーサーにとっての4つのオンターゲット座位および上位4つの公知のCas9オフターゲット部位をトータルで16のオフターゲット部位について配列決定した(表1)。 To produce productive editing, prime editing requires a complementary target locus:PEgRNA spacer for the Cas9 domain to bind, a target locus:PEgRNA PBS complementarity for the initiation of reverse transcription primed by PEgRNA, and a target locus:reverse transcriptase product complementarity for flap degradation. It was hypothesized that these three separate DNA hybridization requirements may minimize off-target prime editing compared to other genome editing methods. To test this possibility, HEK293T cells were treated with PE3 or PE2 and a total of 16 PEgRNAs designed to target four on-target genome loci, with four corresponding sgRNAs targeting the same protospacer as Cas9, or with the same 16 PEgRNAs as Cas9. These four target loci were chosen because each has at least four well-characterized off-target sites where Cas9 and the corresponding on-target sgRNA are known to cause substantial off-target DNA modifications in HEK293T cells.118,159 After treatment, the four on-target loci for each on-target spacer and the top four known Cas9 off-target sites were sequenced for a total of 16 off-target sites (Table 1).

先の研究と整合して118、Cas9および4つの標的sgRNAは、先に報告されたオフターゲット座位の全ての16を改変した(図42G)。HEK3標的座位について、4つのオフターゲット部位におけるCas9オフターゲット改変効率は平均で16%であった。Cas9およびHEK4を標的化するsgRNAは、4つの試験された公知のオフターゲット部位の平均で60%の改変をもたらした。同様に、EMX1およびFANCFのオフターゲット部位は、Cas9:sgRNAによって夫々48%および4.3%の平均度数で改変された(図42G)。sgRNAと比較して、PEgRNAはCas9ヌクレアーゼと共にオンターゲット部位を平均して類似の(1から1.5倍低い)効率で改変するが、PEgRNAはCas9ヌクレアーゼと共にオフターゲット部位をsgRNAよりも~4倍低い平均効率で改変するということが注意された。 Consistent with previous studies, 118 Cas9 and the four targeting sgRNAs modified all 16 of the previously reported off-target loci (Figure 42G). For the HEK3 target locus, the Cas9 off-target modification efficiency at the four off-target sites averaged 16%. Cas9 and sgRNA targeting HEK4 resulted in an average of 60% modification of the four known off-target sites tested. Similarly, the off-target sites of EMX1 and FANCF were modified by Cas9:sgRNA at an average frequency of 48% and 4.3%, respectively (Figure 42G). It was noted that, compared to sgRNA, PEgRNA modified on-target sites with Cas9 nuclease with similar (1- to 1.5-fold lower) efficiency on average, but PEgRNA modified off-target sites with Cas9 nuclease with an average efficiency ~4-fold lower than sgRNA.

著しくは、これらの4つの標的スペーサーを含有する同じ16の試験されたPEgRNAによるPE3またはPE2はかなり低いオフターゲット編集をもたらした(図42H)。Cas9+sgRNAによるオフターゲット編集を経過することが公知の16の部位のうち、PE3+PEgRNAまたはPE2+PEgRNAは16のオフターゲット部位のうち3つのみにおいて検出可能なオフターゲットプライム編集をもたらし、16のうち1つのみがオフターゲット編集効率≧1%を示した(図42H)。これらの16の公知のCas9オフターゲット部位におけるHEK3、HEK4、EMX1、およびFANCFを標的化するPEgRNAの平均オフターゲットプライム編集は、夫々<0.1%、<2.2±5.2%、<0.1%、および<0.13±0.11%であった(図42H)。注意すべきことに、Cas9+PEgRNA1が97%効率で編集するHEK4オフターゲット3部位では、PE2+PEgRNA1は同じスペーサー配列を共有するにもかかわらず0.7%オフターゲット編集のみをもたらし、Cas9編集と比較してプライム編集に要求される2つの追加のDNAハイブリダイゼーションイベントが、どのようにしてオフターゲット編集を多大に縮減し得るのかということを実証する。一緒にすると、これらの結果は、PE3およびPEgRNAが、Cas9および同じプロトスペーサーを標的化するsgRNAよりもヒト細胞におけるかなり低いオフターゲットDNA編集を誘導するということを示唆する。 Remarkably, PE3 or PE2 with the same 16 tested PEgRNAs containing these four target spacers resulted in significantly less off-target editing (Figure 42H). Of the 16 sites known to undergo off-target editing by Cas9+sgRNA, PE3+PEgRNA or PE2+PEgRNA resulted in detectable off-target prime editing at only 3 of the 16 off-target sites, with only 1 of the 16 showing an off-target editing efficiency of ≥1% (Figure 42H). The average off-target prime editing of PEgRNAs targeting HEK3, HEK4, EMX1, and FANCF at these 16 known Cas9 off-target sites was <0.1%, <2.2±5.2%, <0.1%, and <0.13±0.11%, respectively (Figure 42H). Of note, at three HEK4 off-target sites where Cas9+PEgRNA1 edits with 97% efficiency, PE2+PEgRNA1 results in only 0.7% off-target editing despite sharing the same spacer sequence, demonstrating how the two additional DNA hybridization events required for prime editing compared to Cas9 editing can greatly reduce off-target editing. Together, these results suggest that PE3 and PEgRNA induce significantly less off-target DNA editing in human cells than Cas9 and sgRNA targeting the same protospacer.

3'伸長されたPEgRNAの逆転写は原理的にはガイドRNA骨格上へと進み得る。もたらされる3'フラップが、編集されないDNA鎖とのその3'端における相補性の欠如にもかかわらず、標的座位に組み込まれる場合には、アウトカムはPEgRNA骨格ヌクレオチドの挿入であり、これはインデル度数に寄与する。我々は、HEK293T細胞の4つの座位における66のPE3によって媒介される編集実験からの配列決定データを分析し、いずれかの数のPEgRNA骨格ヌクレオチドの平均で1.7±1.5%のトータルの挿入である低い度数で、PEgRNA骨格挿入を観察した(図56A~56D)。Cas9ドメイン結合を原因とする逆転写酵素にとってのガイドRNA骨格のアクセス不可能性と、PEgRNA骨格逆転写からもたらされる3'フラップのミスマッチの3'端のフラップ分解の間の細胞性の切除とは、PEgRNA骨格ヌクレオチドを組み込む産物を最小化するということが推量される。かかるイベントは稀であるが、PEgRNA骨格組み込みを最小化するPEgRNAまたはプライム編集因子タンパク質を操作するための将来の作業は、インデル度数をさらに減少させ得る。 Reverse transcription of 3'-extended PEgRNA can in principle proceed onto the guide RNA backbone. If the resulting 3' flap is integrated into the target locus despite the lack of complementarity at its 3' end with the unedited DNA strand, the outcome is the insertion of PEgRNA backbone nucleotides, which contributes to the indel frequency. We analyzed sequencing data from 66 PE3-mediated editing experiments at four loci in HEK293T cells and observed PEgRNA backbone insertions at a low frequency, averaging 1.7 ± 1.5% of the total insertion of any number of PEgRNA backbone nucleotides (Figures 56A-56D). We speculate that the inaccessibility of the guide RNA backbone to reverse transcriptase due to Cas9 domain binding and cellular excision during flap degradation of the 3' end of the mismatched 3' flap resulting from PEgRNA backbone reverse transcription minimizes the product of incorporation of PEgRNA backbone nucleotides. Although such events are rare, future work to engineer PEgRNAs or prime editor proteins that minimize PEgRNA backbone incorporation may further reduce indel frequency.

デアミナーゼはいくつかの塩基編集因子ではCas9非依存的様式で作用し得、低レベルだが広範囲のオフターゲットDNA編集を(ABEではなく)第1世代CBEにおいて160~162、ならびにオフターゲットRNA編集を第1世代CBEおよびABEにおいてもたらすが163~165、操作されたデアミナーゼによるより新たなCBEおよびABEバリアントはCas9非依存的なオフターゲットDNAおよびRNA編集を多大に縮減する163~165。プライム編集因子はデアミナーゼなどの塩基修飾酵素を欠き、よって、Cas9非依存的様式でDNAまたはRNA塩基を改変する内在的能力を有さない。 Although deaminases can act in a Cas9-independent manner in some base editors, resulting in low-level but extensive off-target DNA editing in first-generation CBEs (but not ABEs) ,160-162 and off-target RNA editing in first-generation CBEs and ABEs, 163-165 newer CBE and ABE variants with engineered deaminases greatly reduce Cas9-independent off-target DNA and RNA editing.163-165 Prime editors lack base-modifying enzymes such as deaminases and therefore do not have the intrinsic ability to modify DNA or RNA bases in a Cas9-independent manner.

原理的には、プライム編集因子の逆転写酵素ドメインは適切にプライムされたRNAまたはDNA鋳型を細胞内でプロセシングし得るが、レトロトランスポゾン、例えばLINE-1ファミリー166、内生レトロウイルス167,168、およびヒトテロメラーゼのものは全て、活性な内生ヒト逆転写酵素を提供するということが注意された。ヒト細胞におけるそれらの天然の存在は、逆転写酵素活性それ自体は実質的に毒性ではないということを示唆する。実に、dCas9、Cas9 H840Aニッカーゼ、または逆転写酵素を不活性化するR110S+K103L変異を有するPE2(PE2-dRT)を発現する対照のものと比較して、HEK293T細胞生存性のPE3依存的な違いは観察されなかった169(図49A~49B)。 In principle, the reverse transcriptase domain of a primed editor could process appropriately primed RNA or DNA templates in cells, but it was noted that retrotransposons, such as those of the LINE-1 family, 166 endogenous retroviruses, 167,168 and human telomerase all provide active endogenous human reverse transcriptase. Their natural presence in human cells suggests that reverse transcriptase activity is not substantially toxic in itself. Indeed, no PE3-dependent differences in HEK293T cell viability were observed compared to controls expressing dCas9, Cas9 H840A nickase, or PE2 with the R110S+K103L mutations that inactivate reverse transcriptase (PE2-dRT) 169 (Figures 49A-49B).

上のデータおよび分析にもかかわらず、オフターゲットプライム編集をバイアスがないゲノムワイドな様式で評価するために、およびプライム編集因子またはプライム編集中間体の逆転写酵素バリアントが細胞に影響し得る程度を特徴付けるために、追加の研究が必要とされる。 Despite the above data and analyses, additional studies are needed to evaluate off-target prime editing in an unbiased genome-wide manner and to characterize the extent to which reverse transcriptase variants of prime editing factors or prime editing intermediates may affect cells.

ヒト細胞の病原性のトランスバージョン、挿入、および欠失変異をプライム編集する Prime editing pathogenic transversion, insertion, and deletion mutations in human cells

遺伝子疾患を引き起こすトランスバージョン、小さい挿入、および小さい欠失変異をヒト細胞に直接的に組み入れまたは修正するPE3の能力を試験した。鎌状赤血球症は最も普通にはHBBのA・TからT・Aのトランスバージョン変異によって引き起こされ、ベータグロビンのGlu6→Valの変異をもたらす。Cas9ヌクレアーゼとHDRのためのドナーDNA鋳型とによるエクスビボの造血幹細胞の処置、次に編集された細胞の濃縮、移植、および定着は、鎌状赤血球症の処置のための有望な可能性ある戦略である170。しかしながら、このアプローチは、正しく編集されたHBBアレルに加えてなお多くのインデル含有副産物を生成する170~171。塩基編集因子は一般的にはずっと少数のインデルを生ずるが、それらはHBBの正常配列を直接的に復元するために必要とされるT・AからA・Tのトランスバージョン変異を現行ではなし得ない。 We tested the ability of PE3 to directly incorporate or correct genetic disease-causing transversions, small insertions, and small deletion mutations in human cells. Sickle cell disease is most commonly caused by an A-T to T-A transversion mutation in HBB, resulting in a Glu6→Val mutation in beta globin . Ex vivo treatment of hematopoietic stem cells with Cas9 nuclease and a donor DNA template for HDR, followed by enrichment, transplantation, and engraftment of the edited cells, is a promising potential strategy for the treatment of sickle cell disease.170 However, this approach still generates many indel-containing by-products in addition to the correctly edited HBB allele.170-171 Although base editors generally generate much fewer indels, they are currently unable to make the T-A to A-T transversion mutation required to directly restore the normal sequence of HBB.

PE3を用いて、44%の効率および4.8%インデルでHEK293T細胞にHBB E6V変異を組み入れした(図43A)。PE3処置された細胞の混合物から、我々はHBB E6Vアレルについてホモ接合(三倍体)である6つのHEK293T細胞株を単離し(図53A~53E)、プライム編集が病原性の変異を有するヒト細胞株を生成する能力を実証した。HBB E6Vアレルを野生型HBBに修正するために、我々は、HBB E6V変異を野生型HBBに直接的に復帰させるようにプログラムされたPE3およびPEgRNAによってホモ接合HBB E6V HEK293T細胞を処置した。トータルで、14のPEgRNAデザインを試験した。3日後に、DNA配列決定は、全ての14のPEgRNAがPE3と組み合わせられたときに、HBB E6Vから野生型HBBへの効率的な修正と(インデルなしの≧26%野生型HBB)平均で2.8±0.70%であるインデルレベルとを与えるということを明らかにした(図50A)。最も良好なPEgRNAはHBB E6Vから野生型への52%修正を2.4%インデルでもたらした(図43A)。PEgRNAによって認識されるPAMを改変するサイレントな変異の導入は、編集効率および産物純度を1.4%インデルによる58%修正まで控えめに改善した(図43A)。これらの結果は、プライム編集がヒト細胞株の病原性のトランスバージョン点変異を高い効率および最小限の副産物によって組み入れおよび修正し得るということを確立する。 Using PE3, we engineered the HBB E6V mutation into HEK293T cells with 44% efficiency and 4.8% indels (Figure 43A). From the mixture of PE3-treated cells, we isolated six HEK293T cell lines that were homozygous (triploid) for the HBB E6V allele (Figures 53A- 53E ), demonstrating the ability of prime editing to generate human cell lines with pathogenic mutations. To correct the HBB E6V allele to wild-type HBB, we treated homozygous HBB E6V HEK293T cells with PE3 and PEgRNA programmed to directly revert the HBB E6V mutation to wild-type HBB. In total, 14 PEgRNA designs were tested. After 3 days, DNA sequencing revealed that all 14 PEgRNAs, when combined with PE3, provided efficient correction of HBB E6V to wild-type HBB with indel levels averaging 2.8±0.70% (>26% wild-type HBB without indels) (Figure 50A). The best PEgRNA provided 52% correction of HBB E6V to wild-type with 2.4% indels (Figure 43A). Introduction of silent mutations that alter the PAM recognized by the PEgRNA modestly improved editing efficiency and product purity to 58% correction with 1.4% indels (Figure 43A). These results establish that prime editing can incorporate and correct pathogenic transversion point mutations in human cell lines with high efficiency and minimal by-products.

テイ・サックス病は最も多くの場合にはHEXA遺伝子上への4bp挿入(HEXA 1278+TATC)によって引き起こされる136。PE3を用いて、この4bp挿入をHEK293T細胞に31%の効率および0.8%のインデルで組み入れし(図43B)、HEXA 1278+TATCアレルについてホモ接合である2つのHEK293T細胞株を単離した(図53A-53E)。これらの細胞を用いて、43のPEgRNAおよび3つのニッキングsgRNAを、PE3またはPE3bシステムによって、HEXAの病原性の挿入の修正について試験した(図50B)。野生型アレルへの完璧な復帰によるか、またはPAMを遮断しかつサイレントな変異を組み入れるシフトした4bp欠失によるかどちらかである。試験された43のPEgRNAのうち19は≧20%編集をもたらした。PE3またはPE3bおよび最も良好なPEgRNAによる野生型HEXAへの完璧な修正は類似の平均効率で進んだが(PE3の30%対PE3bの33%)、PE3bシステムは5.3倍少数のインデル産物によって随伴された(PE3の1.7%対PE3bの0.32%)(図43Bおよび図50B)。これらの知見は、哺乳類細胞の病原性のアレルを効率的にかつ最小の副産物によって組み入れまたは修正する精密な小さい挿入および欠失をなすプライム編集の能力を実証する。 Tay-Sachs disease is most often caused by a 4-bp insertion (HEXA 1278+TATC) on the HEXA gene. Using PE3, we integrated this 4-bp insertion into HEK293T cells with 31% efficiency and 0.8% indels (Figure 43B), and isolated two HEK293T cell lines homozygous for the HEXA 1278+TATC allele (Figures 53A - 53E ). Using these cells, 43 PEgRNAs and three nicking sgRNAs were tested for correction of the pathogenic insertion in HEXA by the PE3 or PE3b system (Figure 50B). Either by complete reversion to the wild-type allele, or by a shifted 4-bp deletion that blocks the PAM and incorporates a silent mutation. Nineteen of the 43 PEgRNAs tested resulted in ≧20% editing. Complete correction of wild-type HEXA by PE3 or PE3b and the best PEgRNA proceeded with similar average efficiency (30% for PE3 vs. 33% for PE3b), but the PE3b system was accompanied by 5.3-fold fewer indel products (1.7% for PE3 vs. 0.32% for PE3b) (Figure 43B and Figure 50B). These findings demonstrate the ability of prime editing to make precise small insertions and deletions that incorporate or correct pathogenic alleles in mammalian cells efficiently and with minimal side effects.

最後に、ヒトプリオンタンパク質(PrP)をコードする遺伝子PRNP上への防護性のSNPの組み入れを試験した。PrPミスフォールディングは進行性のかつ致死的な神経変性プリオン病を引き起こし、これはPRNP遺伝子上の受け継がれた優性変異によってまたはミスフォールディングしたPrPに対する暴露によって自発的に発生し得る172。天然に存在するPRNP G127V変異体アレルはヒト138およびマウス173においてプリオン病に対する耐性を付与する。PE3を用いてG127VをHEK293T細胞のヒトPRNPアレルに組み入れした。これはG・CからT・Aのトランスバージョンを要求する。4つのPEgRNAおよび3つのニッキングsgRNAをPE3システムによって評価した。最も有効なPE3およびPEgRNAに対する3日の暴露後に、DNA配列決定は、G127V変異を組み入れる53±11%の効率と1.7±0.7%のインデルレベルとを明らかにした(図43C)。一緒にすると、これらの結果は、プライム編集がヒト細胞においてトランスバージョン、挿入、または欠失変異を組み入れまたは修正する能力を確立する。これらは、疾患に対する耐性を効率的にかつ最小の副産物によって引き起こすかまたは付与する。 Finally, we tested the incorporation of a protective SNP on the gene PRNP, which codes for the human prion protein (PrP). PrP misfolding causes progressive and fatal neurodegenerative prion disease, which can occur spontaneously by inherited dominant mutations on the PRNP gene or by exposure to misfolded PrP172 . The naturally occurring PRNP G127V mutant allele confers resistance to prion disease in humans138 and mice173 . PE3 was used to incorporate G127V into the human PRNP allele in HEK293T cells, which requires a G-C to T-A transversion. Four PEgRNAs and three nicking sgRNAs were evaluated with the PE3 system. After 3 days of exposure to the most effective PE3 and PEgRNA, DNA sequencing revealed a 53±11% efficiency of incorporating the G127V mutation and an indel level of 1.7±0.7% (Figure 43C). Taken together, these results establish the ability of prime editing to incorporate or correct transversion, insertion, or deletion mutations in human cells that cause or confer resistance to disease efficiently and with minimal by-products.

種々のヒト細胞株および初代マウスニューロンのプライム編集 Prime editing of various human cell lines and primary mouse neurons

次に、プライム編集を、3つの追加のヒト細胞株の内生部位を編集するその能力について試験した。K562(白血病骨髄)細胞では、PE3を用いて、HEK3、EMX1、およびFANCF部位のトランスバージョン編集、ならびにHEK3における6xHisタグの18bp挿入を行った。15-30%の平均編集効率がこれらの4つのPE3によって媒介される編集の夫々について観察され、インデルは平均で0.85~2.2%であった(図43A)。U2OS(骨肉腫)細胞では、HEK3およびFANCFのトランスバージョン変異、ならびにHEK3への3bp挿入および6xHisタグ挿入を、インデル形成を10から76倍超過する7.9-22%の編集効率によって組み入れした(図43A)。最後に、HeLa(子宮頸がん)細胞では、HEK3への3bp挿入を12%平均効率および1.3%インデルによって行った(図43A)。集合的に、これらのデータはHEK293T細胞以外の複数の細胞株がプライム編集を支持するということを指示しているが、編集効率は細胞型によって変わり、一般的にはHEK293T細胞よりも効率的ではない。編集:インデル比は、全ての試験されたヒト細胞株において高いままに留まった。 Prime editing was then tested for its ability to edit endogenous sites in three additional human cell lines. In K562 (leukemic myeloid) cells, PE3 was used to perform transversion editing of HEK3, EMX1, and FANCF sites, as well as an 18-bp insertion of a 6xHis tag in HEK3. Average editing efficiencies of 15-30% were observed for each of these four PE3-mediated edits, with indels averaging 0.85-2.2% (Figure 43A). In U2OS (osteosarcoma) cells, HEK3 and FANCF transversion mutations, as well as 3-bp insertions and 6xHis tag insertions in HEK3, were incorporated with editing efficiencies of 7.9-22%, which exceeded indel formation by 10-76-fold (Figure 43A). Finally, in HeLa (cervical cancer) cells, 3-bp insertions in HEK3 were performed with 12% average efficiency and 1.3% indels (Figure 43A). Collectively, these data indicate that multiple cell lines other than HEK293T cells support prime editing, although editing efficiency varies by cell type and is generally less efficient than HEK293T cells. Edit:indel ratios remained high in all human cell lines tested.

プライム編集が有糸分裂後の終末分化した初代細胞において可能であるかどうかを決定するために、E18.5マウスから収穫された初代皮質ニューロンを二元的な分裂PE3レンチウイルス送達システムによって形質導入した。これにおいては、分裂インテインスプライシング203が、夫々が別個のウイルスから送達されるN末端およびC末端半分からPE2タンパク質を再構成する。編集を有糸分裂後ニューロンに制限するために、成熟したニューロンに高度に特異的であるヒトシナプシンプロモーター204を用いて両方のPE2タンパク質構成要素の発現を駆動した。GFPを自己切断P2Aペプチド205を介してPE2のN末端半分に融合した。ニューロンからの核を二元的なウイルス形質導入の2週後に単離し、直接的に配列決定するかまたは配列決定前にGFP発現についてソーティングした。ソーティングされた核において0.58±0.14%の平均インデルによってDNMT1座位におけるトランスバージョンを組み入れるための7.1±1.2%の平均プライム編集(図43D)が観察された。同じ分裂インテインの二元的レンチウイルスシステムにおけるCas9ヌクレアーゼは、ソーティングされた皮質ニューロン核において31±5.5%のインデルをもたらした(図43D)。これらのデータは、有糸分裂後の終末分化した初代細胞がプライム編集を支持し得るということを指示し、それゆえにプライム編集が細胞複製を要求しないということを確立する。 To determine whether prime editing is possible in postmitotic terminally differentiated primary cells, primary cortical neurons harvested from E18.5 mice were transduced with a binary split PE3 lentiviral delivery system, in which split intein splicing 203 reconstitutes the PE2 protein from N- and C-terminal halves, each delivered from a separate virus. To restrict editing to postmitotic neurons, the human synapsin promoter 204 , which is highly specific for mature neurons, was used to drive expression of both PE2 protein components. GFP was fused to the N-terminal half of PE2 via a self-cleaving P2A peptide 205. Nuclei from neurons were isolated 2 weeks after binary viral transduction and either sequenced directly or sorted for GFP expression prior to sequencing. An average prime editing of 7.1 ± 1.2% was observed to incorporate transversions at the DNMT1 locus (Figure 43D), with an average indel of 0.58 ± 0.14% in the sorted nuclei. Cas9 nuclease in the same split intein binary lentiviral system resulted in 31±5.5% indels in sorted cortical neuron nuclei (Figure 43D). These data indicate that postmitotic terminally differentiated primary cells can support prime editing, thus establishing that prime editing does not require cell replication.

Cas9によって開始されるHDRと比較したプライム編集 Prime editing compared to Cas9-initiated HDR

PE3の性能を、HDRを支持する有糸分裂細胞株において128、最適化されたCas9によって開始されるHDR128,125のものと比較した。HEK293T、HeLa、K562、およびU2OS細胞を、種々のトランスバージョンおよび挿入編集を組み入れるようにデザインされたCas9ヌクレアーゼ、sgRNA、およびssDNAドナーオリゴヌクレオチド鋳型によって処置した(図43E-43Gおよび図51A-51G)。Cas9によって開始されるHDRは、全てのケースにおいて、二本鎖切断を引き起こす処置から予想されるとおりずっと高いレベルの副産物(支配的にはインデル)によって、所望の編集を首尾良く組み入れした。PE3をHEK293T細胞に用いて、HBB E6V組み入れおよび修正は夫々42%および58%の平均編集効率で2.6%および1.4%の平均インデルによって進んだ(図43Eおよび図43G)。対照的に、Cas9ヌクレアーゼおよびHDR鋳型による同じ編集は、5.2%および6.7%の平均編集効率を79%および51%の平均インデル度数によってもたらした(図43Eおよび図43G)。類似に、PE3はPRNP G127Vを53%の効率および1.7%インデルで組み入れしたが、Cas9によって開始されるHDRはこの変異を6.9%の効率および53%インデルで組み入れした(図43Eおよび図43G)。それゆえに、HBB E6V組み入れ、HBB E6V修正、およびPRNP G127V組み入れの編集:インデルの比は、Cas9によって開始されるHDRよりもPE3では平均で270倍高かった。 The performance of PE3 was compared to that of optimized Cas9-initiated HDR128,125 in mitotic cell lines that support HDR. HEK293T , HeLa, K562, and U2OS cells were treated with Cas9 nuclease, sgRNA, and ssDNA donor oligonucleotide templates designed to incorporate various transversion and insertion edits (Figures 43E-43G and Figures 51A- 51G ). Cas9-initiated HDR successfully incorporated the desired edits in all cases with much higher levels of by-products (predominantly indels) as expected from a treatment that causes double-strand breaks. Using PE3 in HEK293T cells, HBB E6V incorporation and correction proceeded with an average indel of 2.6% and 1.4%, with an average editing efficiency of 42% and 58%, respectively (Figures 43E and 43G). In contrast, the same edits with Cas9 nuclease and HDR templates resulted in average editing efficiencies of 5.2% and 6.7%, with average indel frequencies of 79% and 51% (Figures 43E and 43G). Similarly, PE3 incorporated PRNP G127V with 53% efficiency and 1.7% indels, whereas Cas9-initiated HDR incorporated this mutation with 6.9% efficiency and 53% indels (Figures 43E and 43G). Thus, the edit:indel ratios of HBB E6V incorporation, HBB E6V correction, and PRNP G127V incorporation were, on average, 270-fold higher with PE3 than with Cas9-initiated HDR.

HEK293T以外のヒト細胞株におけるPE3およびHDRの間の比較は、より低いPE3編集効率でだが、類似の結果を示した。例えば、K562細胞では、HEK3上へのPE3によって媒介される3bp挿入は、Cas9によって開始されるHDRの17%編集および72%インデルと比較して25%の効率および2.8%のインデル、PE3を好む40倍の編集:インデル率という利点によって進んだ(図43F~43G)。U2OS細胞では、PE3はこの3bp挿入を22%効率および2.2%インデルで行い、Cas9によって開始されるHDRは、74%のインデルによる15%の編集、49倍低い編集:インデル比をもたらした(図43F-43G)。HeLa細胞では、Cas9によって開始されるHDRの3.0%の編集および69%のインデルに対して、PE3はこの挿入を12%の効率および1.3%のインデル、210倍の編集:インデル比の違いによってなした(図43F~43G)。集合的に、これらのデータは、HDRが、典型的には、試験された4つの細胞株においてPE3よりも低いかまたは類似の編集効率およびずっと高いインデルをもたらすということを指示した(図51A~51G)。 Comparisons between PE3 and HDR in human cell lines other than HEK293T showed similar results, albeit with lower PE3 editing efficiency. For example, in K562 cells, 3bp insertion mediated by PE3 on HEK3 proceeded with 25% efficiency and 2.8% indels compared to 17% editing and 72% indels for Cas9-initiated HDR, a 40-fold edit:indel ratio advantage favoring PE3 (Figures 43F-43G). In U2OS cells, PE3 performed this 3bp insertion with 22% efficiency and 2.2% indels, while Cas9-initiated HDR resulted in 15% editing with 74% indels, a 49-fold lower edit:indel ratio (Figures 43F-43G). In HeLa cells, PE3 achieved this insertion with 12% efficiency and 1.3% indels, a 210-fold difference in edit:indel ratio, compared with 3.0% edits and 69% indels for Cas9-initiated HDR (Figures 43F-43G). Collectively, these data indicated that HDR typically results in lower or similar editing efficiencies and much higher indels than PE3 in the four cell lines tested (Figures 51A- 51G ).

考察および将来の方向 Considerations and future directions

1ヌクレオチド精度でDNA配列を挿入する能力は、特に有能なプライム編集能力である。例えば、PE3を用いて、HEK293T細胞のHEK3座位にHis6タグ(18bp、65%平均効率)、FLAGエピトープタグ(24bp、18%平均効率)、およびCreリコンビナーゼのネイティブな基質である伸長されたLoxP部位(44bp、23%平均効率)を精密に挿入した。平均インデルはこれらの例では3.0%および5.9%の間の範囲であった(図43H)。多くのバイオテクノロジー、合成生物学、および治療学的適用が、新たなDNA配列を生細胞の目当ての標的部位に効率的にかつ精密に導入する能力から発生することが想定される。 The ability to insert DNA sequences with single nucleotide accuracy is a particularly powerful prime editing capability. For example, PE3 was used to precisely insert a His 6 tag (18 bp, 65% average efficiency), a FLAG epitope tag (24 bp, 18% average efficiency), and an extended LoxP site that is a native substrate for Cre recombinase (44 bp, 23% average efficiency) into the HEK3 locus in HEK293T cells. The average indels ranged between 3.0% and 5.9% in these examples (Figure 43H). It is envisioned that many biotechnology, synthetic biology, and therapeutic applications will arise from the ability to efficiently and precisely introduce new DNA sequences into desired target sites in living cells.

集合的に、本明細書に記載のプライム編集実験は、最高で44bpの18の挿入、最高で80bpの22の欠失、77のトランスバージョンを包含する113の点変異、および18の組み合わせ編集を、ヒトおよびマウスゲノムの12の内生座位において、PAMのスタートの3bp上流から29bp下流の範囲である位置付けにおいて、あからさまな二本鎖DNA切断を作ることなしに組み入れした。これらの結果はプライム編集を著しく汎用的なゲノム編集法として確立する。ClinVarの挿入、欠失、インデル、および重複の圧倒的多数(85-99%)は≦30bpであるので(図52A~52D)、原理的には、プライム編集はClinVarの75,122の現行で公知の病原性のヒト遺伝子バリアントの最高で~89%を修正し得(図38Aのトランジション、トランスバージョン、挿入、欠失、インデル、および重複)、コピー数獲得または損失によって引き起こされる疾患を改善する追加のポテンシャルを有する。 Collectively, the prime editing experiments described herein incorporated 113 point mutations, including 18 insertions of up to 44 bp, 22 deletions of up to 80 bp, 77 transversions, and 18 combination edits, at 12 endogenous loci in the human and mouse genomes, at locations ranging from 3 bp upstream to 29 bp downstream of the start of the PAM, without creating overt double-stranded DNA breaks. These results establish prime editing as a remarkably versatile genome editing method. Because the vast majority (85-99%) of ClinVar insertions, deletions, indels, and duplications are ≦30 bp (Figures 52A-52D), in principle, prime editing could correct up to ∼89% of the 75,122 currently known pathogenic human genetic variants in ClinVar (transitions, transversions, insertions, deletions, indels, and duplications in Figure 38A), with the additional potential to ameliorate diseases caused by copy number gains or losses.

重要なことに、いずれかの所望の編集について、プライム編集のフレキシビリティーは、PEgRNAによって誘導されるニックの位置付け、sgRNAによって誘導される第2のニックの位置付け、PBS長さ、RT鋳型長さ、およびどの鎖が最初に編集されるかの多くの可能な選択肢を、本願において鋭意実証されるとおりオファーする。他の精密ゲノム編集法で典型的に利用可能なより限定されたオプション125,142,154とは対照をなすこのフレキシビリティーは、編集効率、産物純度、DNA特異性、または他のパラメータが、所与の適用の必要に適するように最適化されることを許す。図50A~50Bに示されているとおりであり、これらにおいては、ある範囲のプライム編集戦略をカバーする14および43のPEgRNAを試験することが、夫々病原性のHBBおよびHEXAアレルの修正を最適化した。 Importantly, for any desired editing, the flexibility of prime editing offers many possible options for the location of the nick induced by the PEgRNA, the location of the second nick induced by the sgRNA, the PBS length, the RT template length, and which strand is edited first, as demonstrated in this application. In contrast to the more limited options typically available in other precision genome editing methods, 125,142,154 , this flexibility allows editing efficiency, product purity, DNA specificity, or other parameters to be optimized to suit the needs of a given application. As shown in Figures 50A-50B, in which 14 and 43 PEgRNAs covering a range of prime editing strategies were tested to optimize the correction of pathogenic HBB and HEXA alleles, respectively.

かなりの追加の研究が、プライム編集をさらに理解および改善するために必要とされる。プライム編集因子システムの追加の改変が、有糸分裂後細胞などの他の細胞型を包含するようにそれらの適合性を拡張するために要求され得る。プライム編集をウイルス的および非ウイルス的なin vitroおよびインビボ送達戦略とインターフェース接続することが、遺伝子疾患の研究および処置を包含する広い範囲の適用を可能化するプライム編集のポテンシャルを十分に調査するために必要とされる。しかしながら、二本鎖切断またはHDRを要求することなしに、哺乳類細胞のゲノム上の高度に精密な標的化されたトランジション、トランスバージョン、小さい挿入、および小さい欠失を可能化することによって、プライム編集は、ゲノム編集の範囲を実質的に拡張する新たな「検索置換」能力を提供する。 Considerable additional research is needed to further understand and improve prime editing. Additional modifications of the prime editing factor system may be required to extend their compatibility to include other cell types, such as postmitotic cells. Interfacing prime editing with viral and nonviral in vitro and in vivo delivery strategies is needed to fully explore the potential of prime editing to enable a wide range of applications, including genetic disease research and treatment. However, by enabling highly precise targeted transitions, transversions, small insertions, and small deletions on mammalian cell genomes without requiring double-strand breaks or HDR, prime editing offers a new "search and replace" capability that substantially expands the scope of genome editing.

方法
一般的な方法
Methods <br/> General methods

別様に記されない限り、DNA増幅はPhusion U Green Multiplex PCRマスターミックス(ThermoFisher Scientific)またはQ5 Hot Start高忠実性2×マスターミックス(New England BioLabs)を用いるPCRによって行った。Cy5標識DNAオリゴヌクレオチド、dCas9タンパク質、およびCas9 H840Aタンパク質を包含するDNAオリゴヌクレオチドはIntegrated DNA Technologiesから得た。酵母レポータープラスミドは先に記載されたプラスミド64に由来し、Gibsonアセンブリ法によってクローニングされた。本願において用いられる全ての哺乳類編集因子プラスミドは先に記載されているとおりUSERクローニング法を用いてアセンブリされた175。sgRNAを発現するプラスミドは、BsmBI消化されたアクセプターベクター上へのアニーリングされたオリゴヌクレオチドのライゲーションによって構築した。PEgRNAを発現するプラスミドはGibsonアセンブリまたはゴールデンゲートアセンブリによってカスタムのアクセプタープラスミドを用いて構築した(補足の「ゴールデンゲートアセンブリ」概説を見よ)。本願において用いられるsgRNAおよびPEgRNA構築物の配列は表2A-2Cおよび表3A-3Rに列記されている。哺乳類細胞実験のための全てのベクターはPlasmid Plusミニプレップキット(Qiagen)またはPureYieldプラスミドミニプレップキット(Promega)を用いて精製した。これらはエンドトキシン除去ステップを包含する。生きた動物を用いる全ての実験はBroad Institute動物実験委員会によって認可された。野生型C57BL/6マウスはCharles Riverから得た(#027)。 Unless otherwise noted, DNA amplification was performed by PCR using Phusion U Green Multiplex PCR Master Mix (ThermoFisher Scientific) or Q5 Hot Start High Fidelity 2x Master Mix (New England BioLabs). DNA oligonucleotides encompassing Cy5-labeled DNA oligonucleotides, dCas9 protein, and Cas9 H840A protein were obtained from Integrated DNA Technologies. Yeast reporter plasmids were derived from previously described plasmids64 and cloned by the Gibson assembly method. All mammalian editor plasmids used in this application were assembled using the USER cloning method as previously described175 . Plasmids expressing sgRNAs were constructed by ligation of annealed oligonucleotides onto BsmBI-digested acceptor vectors. Plasmids expressing PEgRNAs were constructed using custom acceptor plasmids by Gibson assembly or Golden Gate assembly (see supplemental "Golden Gate Assembly" overview). The sequences of sgRNA and PEgRNA constructs used in this application are listed in Tables 2A-2C and 3A-3R. All vectors for mammalian cell experiments were purified using Plasmid Plus miniprep kit (Qiagen) or PureYield plasmid miniprep kit (Promega), which includes an endotoxin removal step. All experiments using live animals were approved by the Broad Institute Animal Care and Use Committee. Wild-type C57BL/6 mice were obtained from Charles River (#027).

in vitroの生化学アッセイ In vitro biochemical assays

PEgRNAおよびsgRNAは、HiScribe T7in vitro転写キット(New England Biolabs)を用いて、T7プロモーター配列を含有するPCR増幅された鋳型からin vitro転写した。RNAを変性尿素PAGEによって精製し、使用に先行して分析ゲルによって品質確認した。5'-Cy5標識DNA二重鎖基質は、ニッキングされていない基質には2つのオリゴヌクレオチド(Cy5-AVA024およびAVA025;1:1.1比)または予めニックが入った基質には3つのオリゴヌクレオチド(Cy5-AVA023、AVA025、およびAVA026;1:1.1:1.1)を用いて、95℃への3分に渡る加熱、次に室温への低速の冷却によってアニーリングした(表2A~2C)。Cas9切断および逆転写反応はdNTPを足された1×切断緩衝液中で実行した205(20mM HEPES-K、pH7.5;100mM KCl;5%グリセロール;0.2mM EDTA、pH8.0;3mM MgCl2;0.5mM dNTPミックス;5mM DTT)。dCas9またはCas9 H840A(最終5μM)およびsgRNAまたはPEgRNA(最終5μM)を、二重鎖DNA基質(最終400nM)の追加、適用可能なときには次に開示されていないM-MLV RTバリアントSuperscript III逆転写酵素(ThermoFisher Scientific)の追加に先立って、10分に渡って5μL反応混合物中で室温においてプレインキュベーションした。反応を37℃で1時間に渡って実行し、それから水によって10μLの体積まで希釈し、0.2μLのプロテイナーゼK溶液(20mg/mL、ThermoFisher Scientific)によって処置し、室温で30分に渡ってインキュベーションした。10分の95℃における熱不活性化後に、反応産物を2×ホルムアミドゲルローディング緩衝液(90%ホルムアミド;10%グリセロール;0.01%ブロモフェノールブルー)と組み合わせ、95℃で5分に渡って変性し、変性尿素-PAGEゲル(15%TBE-尿素、55℃、200V)によって分離した。DNA産物はTyphoon FLA 7000バイオ分子イメージャーを用いてCy5蛍光シグナルによって視覚化した。 PEgRNA and sgRNA were in vitro transcribed from PCR amplified templates containing T7 promoter sequences using the HiScribe T7 in vitro transcription kit (New England Biolabs). RNA was purified by denaturing urea PAGE and quality checked by analytical gel prior to use. 5'-Cy5-labeled DNA duplex substrates were annealed with two oligonucleotides (Cy5-AVA024 and AVA025; 1:1.1 ratio) for unnicked substrates or three oligonucleotides (Cy5-AVA023, AVA025, and AVA026; 1:1.1:1.1) for pre-nicked substrates by heating to 95°C for 3 min followed by slow cooling to room temperature (Tables 2A-2C). Cas9 cleavage and reverse transcription reactions were carried out in 1× cleavage buffer supplemented with dNTPs (20 mM HEPES-K, pH 7.5; 100 mM KCl; 5% glycerol; 0.2 mM EDTA, pH 8.0; 3 mM MgCl2; 0.5 mM dNTP mix; 5 mM DTT). dCas9 or Cas9 H840A (5 μM final) and sgRNA or PEgRNA (5 μM final) were preincubated in a 5 μL reaction mixture for 10 min at room temperature prior to the addition of double-stranded DNA substrate (400 nM final) and, when applicable, followed by the addition of undisclosed M-MLV RT variant Superscript III reverse transcriptase (ThermoFisher Scientific). The reaction was carried out at 37°C for 1 h, then diluted to a volume of 10 μL with water, treated with 0.2 μL of proteinase K solution (20 mg/mL, ThermoFisher Scientific), and incubated at room temperature for 30 min. After heat inactivation at 95°C for 10 min, the reaction products were combined with 2× formamide gel loading buffer (90% formamide; 10% glycerol; 0.01% bromophenol blue), denatured at 95°C for 5 min, and separated on a denaturing urea-PAGE gel (15% TBE-urea, 55°C, 200 V). DNA products were visualized by Cy5 fluorescent signal using a Typhoon FLA 7000 biomolecular imager.

電気泳動移動度シフトアッセイを、プレインキュベーションされたdCas9:sgRNAまたはdCas9:PEgRNA複合体(最終5nMおよび1μMの間の濃度範囲)およびCy5標識された二重鎖DNA(Cy5-AVA024およびAVA025;最終20nM)を用いて、1×結合緩衝液(1×切断緩衝液+10μg/mLヘパリン)中で実行した。37℃における15分のインキュベーション後に、サンプルをネイティブPAGEゲル(10%TBE)によって分析し、Cy5蛍光についてイメージングした。 Electrophoretic mobility shift assays were performed in 1x binding buffer (1x cleavage buffer + 10 μg/mL heparin) with pre-incubated dCas9:sgRNA or dCas9:PEgRNA complexes (concentration range between 5 nM and 1 μM final) and Cy5-labeled duplex DNA (Cy5-AVA024 and AVA025; 20 nM final). After 15 min incubation at 37 °C, samples were analyzed by native PAGE gel (10% TBE) and imaged for Cy5 fluorescence.

逆転写産物のDNA配列決定のために、蛍光バンドを尿素-PAGEゲルから切除、精製し、それから、ターミナルトランスフェラーゼ(TdT;New England Biolabs)によってdGTPまたはdATPの存在下において製造者のプロトコールに従って3'テーリングした。テーリングされたDNA産物を結合緩衝液(40%塩化グアニジニウム飽和水溶液+60%イソプロパノール)によって10倍希釈し、QIAquickスピンカラム(Qiagen)によって精製し、それから、プライマーAVA134(Aテーリングされた産物)またはAVA135(Gテーリングされた産物)を用いるKlenowフラグメント(New England Biolabs)によるプライマー伸長のための鋳型として用いた(表2A-2C)。伸長を10サイクルのPCRによってプライマーAVA110およびAVA122を用いて増幅し、それからAVA037によってSanger法を用いて配列決定した(表2A-2C)。 For DNA sequencing of the reverse transcription products, the fluorescent bands were excised from urea-PAGE gels, purified, and then 3'-tailed with terminal deoxyribonuclease (TdT; New England Biolabs) in the presence of dGTP or dATP according to the manufacturer's protocol. The tailed DNA products were diluted 10-fold with binding buffer (40% guanidinium chloride saturated aqueous solution + 60% isopropanol), purified by QIAquick spin columns (Qiagen), and then used as templates for primer extension with Klenow fragment (New England Biolabs) using primers AVA134 (A-tailed products) or AVA135 (G-tailed products) (Tables 2A-2C). The extensions were amplified by 10 cycles of PCR with primers AVA110 and AVA122, and then sequenced by the Sanger method with AVA037 (Tables 2A-2C).

酵母蛍光レポーターアッセイ Yeast fluorescent reporter assay

インフレーム停止コドン、+1フレームシフト、または-1フレームシフトを含有する二元的な蛍光レポータープラスミドを、上に記載されているとおりin vitroの5'伸長されたPEgRNAまたは3'伸長されたPEgRNAのプライム編集反応に付した。37℃での1時間のインキュベーション後に、反応を水によって希釈し、プラスミドDNAを0.3M酢酸ナトリウムおよび70%エタノールによって沈殿した。再懸濁されたDNAを先に記載されているとおりエレクトロポレーションによってS.cerevisiaeに形質転換し67、ロイシンなしの合成完全培地(SC(グルコース)、L-)にプレーティングした。GFPおよびmCherry蛍光シグナルをTyphoon FLA 7000バイオ分子イメージャーによってコロニーから視覚化した。 Binary fluorescent reporter plasmids containing an in-frame stop codon, a +1 frameshift, or a -1 frameshift were subjected to in vitro 5'- or 3'-extended PEgRNA primed editing reactions as described above. After 1 h incubation at 37°C, the reactions were diluted with water and the plasmid DNA was precipitated with 0.3 M sodium acetate and 70% ethanol. The resuspended DNA was transformed into S. cerevisiae by electroporation as previously described67 and plated on synthetic complete medium without leucine (SC(glucose), L-). GFP and mCherry fluorescent signals were visualized from colonies by a Typhoon FLA 7000 biomolecular imager.

一般的な哺乳類細胞培養条件 General mammalian cell culture conditions

HEK293T(ATCC CRL-3216)、U2OS(ATTC HTB-96)、K562(CCL-243)、およびHeLa(CCL-2)細胞はATCCから購入し、夫々が10%(v/v)ウシ胎児血清(Gibco、品質保証)および1×ペニシリンストレプトマイシン(Corning)を足された夫々ダルベッコ改変イーグル培地(DMEM)プラスGlutaMAX(ThermoFisher Scientific)、マッコイ5A培地(Gibco)、RPMI培地1640プラスGlutaMAX(Gibco)、またはイーグル最小必須培地(EMEM、ATCC)によって培養および継代した。全ての細胞型は37℃において5%CO2でインキュベーション、維持、および培養した。細胞株はそれらの夫々のサプライヤーによって認証され、マイコプラズマ検査陰性であった。 HEK293T (ATCC CRL-3216), U2OS (ATTC HTB-96), K562 (CCL-243), and HeLa (CCL-2) cells were purchased from ATCC and cultured and passaged in Dulbecco's Modified Eagle's Medium (DMEM) plus GlutaMAX (ThermoFisher Scientific), McCoy's 5A Medium (Gibco), RPMI Medium 1640 plus GlutaMAX (Gibco), or Eagle's Minimum Essential Medium (EMEM, ATCC), each supplemented with 10% (v/v) fetal bovine serum (Gibco, quality assurance) and 1× penicillin-streptomycin (Corning). All cell types were incubated, maintained, and cultured at 37°C with 5% CO2 . Cell lines were authenticated by their respective suppliers and tested negative for mycoplasma.

HEK293T組織培養トランスフェクションプロトコールおよびゲノムDNA調製 HEK293T tissue culture transfection protocol and genomic DNA preparation

成長したHEK293T細胞を48ウェルポリD-リジンコーティングプレート(Corning)上に播種した。播種の16から24時間後に、細胞を、およそ60%コンフルエンシーで、製造者のプロトコールに従う1μLのLipofectamine 2000(Thermo Fisher Scientific)、ならびに750ngのPEプラスミド、250ngのPEgRNAプラスミド、および83ngのsgRNAプラスミド(PE3およびPE3bについて)によってトランスフェクションした。別様に申し立てられない限り、細胞はトランスフェクション後に3日培養し、これの後に培地を除去し、細胞を1×PBS溶液(Thermo Fisher Scientific)によって洗浄し、ゲノムDNAを、直接的に組織培養プレートの各ウェルへの150μLの新しく調製されたリシス緩衝液(10mM Tris-HCl、pH7.5;0.05%SDS;25μg/mLプロテイナーゼK(ThermoFisher Scientific))の追加によって抽出した。ゲノムDNA混合物を37℃で1から2時間に渡ってインキュベーションし、次に30分の80℃の酵素不活性化ステップをした。哺乳類細胞ゲノムDNA増幅に用いられたプライマーは表4に列記されている。HEK293T細胞におけるHDR実験では、231 ngのヌクレアーゼ発現プラスミド、69 ngのsgRNA発現プラスミド、50 ng(1.51 pmol)の100nt ssDNAドナー鋳型(PAGE精製済み;Integrated DNA Technologies)を、1.4 μLのLipofectamine 2000(ThermoFisher)を用いてウェル当たりリポフェクションした。全てのHDR実験からのゲノムDNAはAgencourt DNAdvanceキット(Beckman Coulter)を用いて製造者のプロトコールに従って精製した。 Grown HEK293T cells were seeded on 48-well poly-D-lysine coated plates (Corning). 16 to 24 hours after seeding, cells were transfected at approximately 60% confluency with 1 μL of Lipofectamine 2000 (Thermo Fisher Scientific) according to the manufacturer's protocol, and 750 ng of PE plasmid, 250 ng of PEgRNA plasmid, and 83 ng of sgRNA plasmid (for PE3 and PE3b). Unless otherwise stated, cells were cultured for 3 days after transfection, after which the medium was removed, cells were washed with 1× PBS solution (Thermo Fisher Scientific), and genomic DNA was extracted by adding 150 μL of freshly prepared lysis buffer (10 mM Tris-HCl, pH 7.5; 0.05% SDS; 25 μg/mL proteinase K (ThermoFisher Scientific)) directly to each well of the tissue culture plate. The genomic DNA mixture was incubated at 37°C for 1 to 2 h, followed by a 30-min enzyme inactivation step at 80°C. Primers used for mammalian cell genomic DNA amplification are listed in Table 4. For HDR experiments in HEK293T cells, 231 ng of nuclease expression plasmid, 69 ng of sgRNA expression plasmid, and 50 ng (1.51 pmol) of 100-nt ssDNA donor template (PAGE-purified; Integrated DNA Technologies) were lipofected per well using 1.4 μL of Lipofectamine 2000 (ThermoFisher). Genomic DNA from all HDR experiments was purified using the Agencourt DNAdvance kit (Beckman Coulter) according to the manufacturer's protocol.

ゲノムDNAサンプルの高スループットDNA配列決定 High-throughput DNA sequencing of genomic DNA samples

目当てのゲノム部位をゲノムDNAサンプルから増幅し、次の改変によって先に記載されているとおりIllumina MiSeqによって配列決定した129,130。手短かには、Illuminaフォワードおよびリバースアダプターを含有する増幅プライマー(表4)を第1ラウンドのPCR(PCR1)に用い、目当てのゲノム領域を増幅した。25μLのPCR1反応を、0.5μMの各フォワードおよびリバースプライマー、1μLのゲノムDNA抽出物、および12.5μLのPhusion U Green Multiplex PCRマスターミックスによって行った。PCR反応は次のとおり実行した:2分の98℃、それから30サイクルの[10秒の98℃、20秒の61℃、および30秒の72℃]、次に2分の最終の72℃伸長。固有のIlluminaバーコード化プライマーペアを二次PCR反応(PCR2)の各サンプルに追加した。具体的には、25μLの所与のPCR2反応は、0.5μMの各固有のフォワードおよびリバースilluminaバーコード化プライマーペア、1μLの未精製のPCR1反応混合物、および12.5μLのPhusion U Green Multiplex PCR 2×マスターミックスを含有した。バーコード化PCR2反応は次のとおり実行した:2分の98℃、それから12サイクルの[10秒の98℃、20秒の61℃、および30秒の72℃]、次に2分の最終の72℃伸長。PCR産物は1.5%アガロースゲルによる電気泳動によって分析的に評価した。PCR2産物(共通アンプリコンによってプールされた)を1.5%アガロースゲルによる電気泳動によって精製した。QIAquickゲル抽出キット(Qiagen)を用い、40μLの水によって溶出した。DNA濃度をフルオロメトリー定量(Qubit、ThermoFisher Scientific)またはqPCR(KAPAライブラリ定量キット-Illumina、KAPA Biosystems)によって測定し、製造者のプロトコールに従ってIllumina MiSeq装置によって配列決定した。 Genomic sites of interest were amplified from genomic DNA samples and sequenced by Illumina MiSeq as previously described with the following modifications129,130 . Briefly, amplification primers containing Illumina forward and reverse adapters (Table 4) were used in a first round PCR (PCR1) to amplify the genomic regions of interest. A 25 μL PCR1 reaction was performed with 0.5 μM of each forward and reverse primer, 1 μL of genomic DNA extract, and 12.5 μL of Phusion U Green Multiplex PCR Master Mix. The PCR reaction was performed as follows: 98°C for 2 min, then 30 cycles [98°C for 10 s, 61°C for 20 s, and 72°C for 30 s], followed by a final 72°C extension for 2 min. A unique Illumina barcoded primer pair was added to each sample in the second PCR reaction (PCR2). Specifically, 25 μL of a given PCR2 reaction contained 0.5 μM of each unique forward and reverse Illumina barcoded primer pair, 1 μL of unpurified PCR1 reaction mixture, and 12.5 μL of Phusion U Green Multiplex PCR 2× master mix. Barcoded PCR2 reactions were run as follows: 98°C for 2 min, then 12 cycles [98°C for 10 s, 61°C for 20 s, and 72°C for 30 s], followed by a final 72°C extension for 2 min. PCR products were analytically assessed by electrophoresis through a 1.5% agarose gel. PCR2 products (pooled by common amplicon) were purified by electrophoresis through a 1.5% agarose gel. Elution was performed with 40 μL of water using a QIAquick gel extraction kit (Qiagen). DNA concentrations were measured by fluorimetric quantification (Qubit, ThermoFisher Scientific) or qPCR (KAPA Library Quantification Kit-Illumina, KAPA Biosystems) and sequenced by an Illumina MiSeq instrument according to the manufacturer's protocol.

配列決定読取をMiSeqレポーター(Illumina)を用いてデマルチプレックスした。参照配列に対するアンプリコン配列のアラインメントをCRISPResso2を用いて行った178。点変異編集の定量のためには、CRISPResso2を「discard_indel_reads」オンによる標準モードで走らせた。編集効率は:(捨てられなかった読取における規定された点変異の度数)×(捨てられなかった読取の#)÷トータル読取として計算した。挿入または欠失編集では、CRISPResso2を「discard_indel_reads」オンで予想されるアレル(e flag)として所望のアレルを用いてHDRモードで走らせた。編集収量はトータル読取によって割られたHDRアラインメント読取の数として計算した。全ての編集について、インデル収量はトータル読取によって割られた捨てられた読取の数として計算した。 Sequencing reads were demultiplexed using MiSeq reporter (Illumina). Alignment of amplicon sequences to reference sequences was performed using CRISPResso2. For quantification of point mutation edits, CRISPResso2 was run in standard mode with "discard_indel_reads" on. Editing efficiency was calculated as: (frequency of defined point mutation in non-discarded reads) x (# of non-discarded reads) ÷ total reads. For insertion or deletion edits, CRISPResso2 was run in HDR mode with "discard_indel_reads" on and the desired allele as the expected allele (e flag). Editing yield was calculated as the number of HDR aligned reads divided by total reads. For all edits, indel yield was calculated as the number of discarded reads divided by total reads.

U2OS、K562、およびHeLa細胞のヌクレオフェクション Nucleofection of U2OS, K562, and HeLa cells

ヌクレオフェクションは全ての実験においてK562、HeLa、およびU2OS細胞を用いて行った。これらの細胞型のPE条件では、800ngプライム編集因子発現プラスミド、200ngのPEgRNA発現プラスミド、および83ngのニッキングプラスミドを20μLの最終体積で16ウェルnucleocuvetteストリップ(Lonza)上でヌクレオフェクションした。これらの3つの細胞型のHDR条件では、350ngヌクレアーゼ発現プラスミド、150ngのsgRNA発現プラスミド、および200pmol(6.6μg)の100nt ssDNAドナー鋳型(PAGE精製済み;Integrated DNA Technologies)をサンプル当たり20 μLの最終体積で16ウェルNucleocuvetteストリップ(Lonza)上でヌクレオフェクションした。K562細胞は、SF Cell Line 4D-Nucleofector Xキット(Lonza)を用いて、サンプル当たり5×105細胞で(プログラムFF-120)、製造者のプロトコールに従ってヌクレオフェクションした。U2OS細胞は、SE Cell Line 4D-Nucleofector Xキット(Lonza)を用いて、サンプル当たり3-4×105細胞で(プログラムDN-100)、製造者のプロトコールに従ってヌクレオフェクションした。HeLa細胞は、SE Cell Line 4D-Nucleofector Xキット(Lonza)を用いて、サンプル当たり2×105細胞で(プログラムCN-114)、製造者のプロトコールに従ってヌクレオフェクションした。細胞はヌクレオフェクションの72時間後にゲノムDNA抽出のために収穫した。 Nucleofections were performed with K562, HeLa, and U2OS cells in all experiments. For PE conditions for these cell types, 800 ng prime editor expression plasmid, 200 ng PEgRNA expression plasmid, and 83 ng nicking plasmid were nucleofected on 16-well nucleocuvette strips (Lonza) in a final volume of 20 μL. For HDR conditions for these three cell types, 350 ng nuclease expression plasmid, 150 ng sgRNA expression plasmid, and 200 pmol (6.6 μg) of 100 nt ssDNA donor template (PAGE purified; Integrated DNA Technologies) were nucleofected on 16-well Nucleocuvette strips (Lonza) in a final volume of 20 μL per sample. K562 cells were nucleofected with the SF Cell Line 4D-Nucleofector X Kit (Lonza) at 5 × 10 5 cells per sample (program FF-120) according to the manufacturer's protocol. U2OS cells were nucleofected with the SE Cell Line 4D-Nucleofector X Kit (Lonza) at 3-4 × 10 5 cells per sample (program DN-100) according to the manufacturer's protocol. HeLa cells were nucleofected with the SE Cell Line 4D-Nucleofector X Kit (Lonza) at 2 × 10 5 cells per sample (program CN-114) according to the manufacturer's protocol. Cells were harvested for genomic DNA extraction 72 hours after nucleofection.

HDR実験のためのゲノムDNA抽出 Genomic DNA extraction for HDR experiments

HEK293T、HEK293T HBB E6V、K562、U2OS、およびHeLa細胞における全てのHDR比較実験からのゲノムDNAは、製造者のプロトコールに従ってAgencourt DNAdvanceキット(Beckman Coulter)を用いて精製した。 Genomic DNA from all HDR comparison experiments in HEK293T, HEK293T HBB E6V, K562, U2OS, and HeLa cells was purified using the Agencourt DNAdvance kit (Beckman Coulter) according to the manufacturer's protocol.

PE2、PE3、BE2、BE4max、ABEdmax、およびABEmaxの間の比較 Comparison between PE2, PE3, BE2, BE4max, ABEdmax, and ABEmax

HEK293T細胞を48ウェルポリD-リジンコーティングプレート(Corning)に播種した。16から24時間後に、細胞をおよそ60%コンフルエンシーでトランスフェクションした。CBEまたはABE構築物による塩基編集では、細胞を750ngの塩基編集因子プラスミド、250ngのsgRNA発現プラスミド、および1μLのLipofectamine 2000(Thermo Fisher Scientific)によってトランスフェクションした。PEトランスフェクションは上に記載されているとおり行った。PEおよびBEのゲノムDNA抽出は上に記載されているとおり行った。 HEK293T cells were seeded in 48-well poly-D-lysine coated plates (Corning). After 16 to 24 hours, cells were transfected at approximately 60% confluency. For base editing with CBE or ABE constructs, cells were transfected with 750 ng of base editor plasmid, 250 ng of sgRNA expression plasmid, and 1 μL of Lipofectamine 2000 (Thermo Fisher Scientific). PE transfection was performed as described above. Genomic DNA extraction for PE and BE was performed as described above.

公知のCas9オフターゲット部位におけるPE3活性の決定 Determining PE3 activity at known Cas9 off-target sites

公知のCas9オフターゲット部位におけるPE3オフターゲット編集活性を評価するために、PE3によるトランスフェクションの3日後にHEK293T細胞から抽出されたゲノムDNAを、16の先に報告されたCas9オフターゲットゲノム部位のPCR増幅のための鋳型として用いた118,159(夫々HEK3、EMX1、FANCF、およびHEK4スペーサーの上位4つのオフターゲット部位;プライマー配列は表4に列記されている)。これらのゲノムDNAサンプルは、図41A-41Kに示されているオンターゲットPE3編集活性を定量するために用いられたものと同一であった;PEgRNAおよびニッキングsgRNA配列は表3A-3Rに列記されている。オフターゲット部位のPCR増幅後に、アンプリコンを上に記載されているとおりIllumina MiSeqプラットフォームによって配列決定した(HTS分析)。Cas9ヌクレアーゼ、Cas9 H840Aニッカーゼ、dCas9、ならびにPE2-dRTオンターゲットおよびオフターゲット編集活性を決定するために、HEK293T細胞を750ngの編集因子プラスミド(Cas9ヌクレアーゼ、Cas9 H840Aニッカーゼ、dCas9、またはPE2-dRT)、250ngのPEgRNAまたはsgRNAプラスミド、および1μLのLipofectamine 2000によってトランスフェクションした。ゲノムDNAを上に記載されているとおりトランスフェクションの3日後に細胞から単離した。オンターゲットおよびオフターゲットゲノム座位を表4のプライマー配列を用いてPCRによって増幅し、Illumina MiSeqによって配列決定した。 To evaluate PE3 off-target editing activity at known Cas9 off-target sites, genomic DNA extracted from HEK293T cells 3 days after transfection with PE3 was used as a template for PCR amplification of 16 previously reported Cas9 off-target genomic sites118,159 (top four off-target sites in HEK3, EMX1, FANCF, and HEK4 spacers, respectively; primer sequences are listed in Table 4). These genomic DNA samples were identical to those used to quantify on-target PE3 editing activity shown in Figures 41A-41K; PEgRNA and nicking sgRNA sequences are listed in Tables 3A-3R. After PCR amplification of off-target sites, amplicons were sequenced by Illumina MiSeq platform as described above (HTS analysis). To determine the Cas9 nuclease, Cas9 H840A nickase, dCas9, and PE2-dRT on-target and off-target editing activities, HEK293T cells were transfected with 750 ng of editor plasmid (Cas9 nuclease, Cas9 H840A nickase, dCas9, or PE2-dRT), 250 ng of PEgRNA or sgRNA plasmid, and 1 μL of Lipofectamine 2000. Genomic DNA was isolated from cells 3 days after transfection as described above. On-target and off-target genomic loci were amplified by PCR using the primer sequences in Table 4 and sequenced by Illumina MiSeq.

HTSデータ分析をCRISPResso2を用いて行った178。Cas9ヌクレアーゼ、Cas9 H840Aニッカーゼ、およびdCas9の編集効率を、インデルを含有する配列決定総読取のパーセントとして定量した。PE3およびPE3-dRTオフターゲットの定量のために、アラインメントされた配列決定読取を、Cas9ニック部位において開始されるPEgRNA逆転写の予期される産物と整合する点変異、挿入、または欠失について検分した。サンプル中のトータル読取のうち<0.1%の総体的な度数で生起する1ヌクレオチドバリエーションは、分析から排除した。度数≧0.1%で生起するかつPEgRNAによってコードされる編集と部分的に整合する両方である1ヌクレオチドバリエーションを含有する読取については、t検定(対応なし、片側、α=0.5)を用いて、同じスペーサーを含有するが異なる編集をコードするPEgRNAによって処置されたサンプルと比較して、バリアントが有意に高いレベルで生起するかどうかを決定した。配列決定エラーの違いを回避するために、同じMiSeqランによって同時に配列決定されたサンプル間の比較をなした。p値>0.05の基準を満たさなかったバリアントは排除した。それから、オフターゲットPE3編集活性を上の基準を満たす配列決定総読取のパーセンテージとして計算した。 HTS data analysis was performed using CRISPResso2.178 Editing efficiencies of Cas9 nuclease, Cas9 H840A nickase, and dCas9 were quantified as the percentage of total sequencing reads containing indels. For quantification of PE3 and PE3-dRT off-targets, aligned sequencing reads were inspected for point mutations, insertions, or deletions that were consistent with the expected products of PEgRNA reverse transcription initiated at the Cas9 nick site. Single nucleotide variations occurring at an overall frequency of <0.1% of the total reads in a sample were excluded from analysis. For reads containing single nucleotide variations that both occurred at a frequency ≥0.1% and were partially consistent with the edit encoded by the PEgRNA, a t-test (unpaired, one-sided, α=0.5) was used to determine whether the variant occurred at a significantly higher level compared to samples treated with a PEgRNA containing the same spacer but encoding a different edit. To avoid differences in sequencing errors, comparisons were made between samples sequenced simultaneously by the same MiSeq run. Variants that did not meet the criterion of p-value > 0.05 were excluded. Off-target PE3 editing activity was then calculated as the percentage of total sequenced reads that met the above criterion.

Cas9によって開始されるHDRを用いるHBB E6V変異を含有するHEK293T細胞株の生成 Generation of HEK293T cell lines containing HBB E6V mutations using Cas9-initiated HDR

HEK293T細胞を48ウェルプレートに播種し、およそ60%コンフルエンシーで、1.5μLのLipofectamine 2000、300ngのCas9 D10Aニッカーゼプラスミド、100ngのsgRNAプラスミド、および200ngの100mer ssDNAドナー鋳型(表5)によってトランスフェクションした。トランスフェクションの3日後に、培地を新しい培地に交換した。トランスフェクションの4日後に、細胞を30μLのTrypLE溶液を用いて解離させ、1.5mLの培地に懸濁した。単細胞を蛍光活性化細胞ソーティング(FACS)(Beckman-Coulter Astrios)によって2つの96ウェルプレートの個々のウェルに単離した。代表的なFACSソーティング例は図53A-53Bを見よ。細胞を、上に記載されているとおりゲノムDNA配列決定に先行して14日に渡って拡大培養した。単離されたクローン集団からは、いずれもHBB E6V変異についてホモ接合であることは見出されなかった。そのため、リポフェクションによる編集、ソーティング、およびアウトグロースの第2ラウンドを部分的に編集された細胞株において繰り返して、E6Vアレルについてホモ接合の細胞株を生んだ。 HEK293T cells were seeded in 48-well plates and transfected at approximately 60% confluency with 1.5 μL Lipofectamine 2000, 300 ng Cas9 D10A nickase plasmid, 100 ng sgRNA plasmid, and 200 ng 100mer ssDNA donor template (Table 5). Three days after transfection, the medium was replaced with fresh medium. Four days after transfection, cells were dissociated with 30 μL TrypLE solution and suspended in 1.5 mL medium. Single cells were isolated into individual wells of two 96-well plates by fluorescence-activated cell sorting (FACS) (Beckman-Coulter Astrios). See Figures 53A-53B for representative FACS sorting examples. Cells were expanded for 14 days prior to genomic DNA sequencing as described above. None of the isolated clonal populations were found to be homozygous for the HBB E6V mutation, so a second round of lipofection-editing, sorting, and outgrowth was repeated in the partially edited cell line to generate a cell line homozygous for the E6V allele.

PE3を用いるHBB E6V変異を含有するHEK293T細胞株の生成 Generation of HEK293T cell lines containing HBB E6V mutations using PE3

抗生物質の不在下で成長させた2.5×104のHEK293T細胞を48ウェルポリD-リジンコーティングプレート(Corning)に播種した。播種の16から24時間後に、細胞を、およそ70%コンフルエンシーで、製造者のプロトコールに従って1μLのLipofectamine 2000(Thermo Fisher Scientific)、ならびに750ngのPE2-P2A-GFPプラスミド、250ngのPEgRNAプラスミド、および83ngのsgRNAプラスミドによってトランスフェクションした。トランスフェクション後の3日後に、細胞をリン酸緩衝生理食塩水(Gibco)によって洗浄し、TrypLE Express(Gibco)を用いて解離させた。それから、細胞を10%(v/v)FBS(Gibco)を足されたDMEMプラスGlutaMax(Thermo Fisher Scientific)によって希釈し、ソーティングに先行して35μmセルストレーナー(Corning)を通過させた。フローサイトメトリーをLE-MA900セルソーター(Sony)によって実行した。細胞は3nM DAPI(BioLegend)によってソーティングに15分先行して処置した。ダブレット除去のためのゲーティング後に、GFP陰性対照細胞集団のものよりも上のGFP蛍光を有するDAPI陰性単細胞を、10%FBSを足されたGlutaMaxありの予冷されたDMEMを充填した96ウェル平底細胞培養プレート(Corning)にソーティングした。代表的なFACSソーティング例は図53A-53Bを見よ。細胞は、上に記載されているとおり、ゲノムDNA抽出およびHTSによる特徴付けに先行して10日に渡って培養した。HBBのE6V変異についてホモ接合であるトータルで6つのクローン細胞株を同定した。 2.5 × 104 HEK293T cells grown in the absence of antibiotics were seeded into 48-well poly-D-lysine-coated plates (Corning). 16 to 24 hours after seeding, cells were transfected at approximately 70% confluency with 1 μL Lipofectamine 2000 (Thermo Fisher Scientific) according to the manufacturer's protocol, as well as 750 ng of PE2-P2A-GFP plasmid, 250 ng of PEgRNA plasmid, and 83 ng of sgRNA plasmid. Three days after transfection, cells were washed with phosphate-buffered saline (Gibco) and dissociated using TrypLE Express (Gibco). Cells were then diluted with DMEM plus GlutaMax (Thermo Fisher Scientific) supplemented with 10% (v/v) FBS (Gibco) and passed through a 35 μm cell strainer (Corning) prior to sorting. Flow cytometry was performed on a LE-MA900 cell sorter (Sony). Cells were treated with 3 nM DAPI (BioLegend) 15 min prior to sorting. After gating to exclude doublets, DAPI-negative single cells with GFP fluorescence above that of the GFP-negative control cell population were sorted into 96-well flat-bottom cell culture plates (Corning) filled with pre-chilled DMEM with GlutaMax supplemented with 10% FBS. See Figures 53A-53B for a representative FACS sorting example. Cells were cultured for 10 days prior to genomic DNA extraction and characterization by HTS as described above. A total of six clonal cell lines homozygous for the HBB E6V mutation were identified.

PE3を用いるHEXA 1278+TATC挿入を含有するHEK293T細胞株の生成 Generation of HEK293T cell lines containing HEXA 1278+TATC insertions using PE3

HEXA 1278+TATCアレルを含有するHEK293T細胞を、HBB E6V細胞株の生出について上に記載されているプロトコールを踏襲して生成した;PEgRNAおよびsgRNA配列は表2A-2Cにおいて図43A-43H小見出し下に列記されている。トランスフェクションおよびソーティング後に、細胞を、上に記載されているとおりゲノムDNA抽出およびHTSによる特徴付けに先行して10日に渡って培養した。50%のHEXA 1278+TATCアレルを含有する2つのヘテロ接合体細胞株を単離し、100%のHEXA 1278+TATCアレルを含有する2つのホモ接合細胞株を回復した。 HEK293T cells containing HEXA 1278+TATC alleles were generated following the protocol described above for the generation of the HBB E6V cell line; PEgRNA and sgRNA sequences are listed in Tables 2A-2C under the subheadings of Figures 43A-43H. After transfection and sorting, cells were cultured for 10 days prior to genomic DNA extraction and characterization by HTS as described above. Two heterozygous cell lines containing 50% HEXA 1278+TATC alleles were isolated and two homozygous cell lines containing 100% HEXA 1278+TATC alleles were recovered.

細胞生存性アッセイ Cell viability assay

HEK293T細胞を48ウェルプレートに播種し、およそ70%コンフルエンシーにおいて、750ngの編集因子プラスミド(PE3、PE3 R110S K103L、Cas9 H840Aニッカーゼ、またはdCas9)、250ngのHEK3標的化PEgRNAプラスミド、および1μLのLipofectamine 2000によって、上に記載されているとおりトランスフェクションした。細胞生存性を、トランスフェクション後に3日に渡って24時間毎に測定した。製造者のプロトコールに従ってCellTiter-Glo 2.0アッセイ(Promega)を用いた。ルミネセンスを96ウェル平底ポリスチレンマイクロプレート(Corning)上でM1000 Proマイクロプレートリーダー(Tecan)を用いて1秒の積算時間で測定した。 HEK293T cells were seeded in 48-well plates and transfected at approximately 70% confluency with 750 ng of editing factor plasmid (PE3, PE3 R110S K103L, Cas9 H840A nickase, or dCas9), 250 ng of HEK3-targeted PEgRNA plasmid, and 1 μL of Lipofectamine 2000 as described above. Cell viability was measured every 24 h for 3 days after transfection using the CellTiter-Glo 2.0 assay (Promega) according to the manufacturer's protocol. Luminescence was measured on 96-well flat-bottom polystyrene microplates (Corning) using an M1000 Pro microplate reader (Tecan) with an integration time of 1 s.

レンチウイルス生産 Lentivirus production

レンチウイルスは先に記載されているとおり生じた206。T-75フラスコの急速に分裂するHEK293T細胞(ATCC;マナサス、VA、USA)を、インテイン分裂PE2編集因子を持つ改変されたlentiCRISPR_v2ゲノムとの組み合わせで、レンチウイルス生産ヘルパープラスミドpVSV-GおよびpsPAX2によってトランスフェクションした。製造者の説明に従ってFuGENE HD(Promega、マディソン、WI、USA)を用いた。4つの分裂インテイン編集因子構築物をデザインした:1)U6-PEgRNA発現カセットとNpu Nインテイン、自己切断P2Aペプチド、およびGFP-KASHに融合されたCas9 H840AニッカーゼのN末端部分(1-573)とをコードするウイルスゲノム;2)PE2のC末端残りに融合されたNpu Cインテインをコードするウイルスゲノム;3)Cas9対照のためのCas9のC末端残りに融合されたNpu Cインテインをコードするウイルスゲノム;および4)DNMT1のニッキングsgRNAである。分裂インテインはPE2またはCas9の2つの半分同士を連結するためのトランススプライシングを媒介し、P2A GFP-KASHは核膜局在したGFPの共翻訳的生産を可能化する。48時間後に、上清を収集し、500gで5分に渡って遠心して細胞破片を除去し、0.45μmフィルターを用いて濾過した。濾過された上清を製造者の説明に従ってPEG-itウイルス沈殿溶液(System Biosciences、パロアルト、CA、USA)を用いて濃縮した。もたらされたペレットを元々の培地体積の1%を用いてOpti-MEM(Thermo Fisher Scientific、ウォルサム、MA、USA)に再懸濁した。再懸濁されたペレットを瞬間凍結し、使用まで-80℃で貯蔵した。 Lentiviruses were generated as previously described . Rapidly dividing HEK293T cells (ATCC; Manassas, VA, USA) in T-75 flasks were transfected with the lentivirus production helper plasmids pVSV-G and psPAX2 in combination with the modified lentiCRISPR_v2 genome carrying the intein-split PE2 editing element using FuGENE HD (Promega, Madison, WI, USA) according to the manufacturer's instructions. Four split-intein editor constructs were designed: 1) a viral genome encoding a U6-PEgRNA expression cassette and the Npu N intein, a self-cleaving P2A peptide, and the N-terminal portion (1-573) of Cas9 H840A nickase fused to GFP-KASH; 2) a viral genome encoding an Npu C intein fused to the C-terminal remainder of PE2; 3) a viral genome encoding an Npu C intein fused to the C-terminal remainder of Cas9 for the Cas9 control; and 4) a nicking sgRNA for DNMT1. The split intein mediates trans-splicing to link the two halves of PE2 or Cas9 together, and the P2A GFP-KASH enables co-translational production of nuclear membrane-localized GFP. After 48 h, the supernatant was collected, centrifuged at 500 g for 5 min to remove cell debris, and filtered using a 0.45 μm filter. The filtered supernatant was concentrated using PEG-it virus precipitation solution (System Biosciences, Palo Alto, CA, USA) according to the manufacturer's instructions. The resulting pellet was resuspended in Opti-MEM (Thermo Fisher Scientific, Waltham, MA, USA) using 1% of the original medium volume. The resuspended pellet was flash frozen and stored at -80°C until use.

マウス初代皮質ニューロン解剖および培養 Dissection and culture of mouse primary cortical neurons

E18.5解離皮質培養物を計画妊娠C57BL/6マウス(Charles River)から収穫した。CO2による安楽死後に、胎児を妊娠マウスから収穫し、次に断頭をした。皮質キャップをペニシリン/ストレプトマイシン(Life Technologies)を足された氷冷Hibernate-E中で解剖した。氷冷Hibernate-Eによるリンス後に、組織を37℃で8分に渡ってパパイン/DNase(Worthington/Sigma)によって消化した。組織をDNaseを足されたNBActiv4(BrainBits)中でトリチュレーションした。細胞をカウントし、ウェル当たり100,000細胞で24ウェルプレートに置いた。培地の半分を週当たり2回換えた。 E18.5 dissociated cortical cultures were harvested from planned pregnant C57BL/6 mice (Charles River). After euthanasia with CO2, fetuses were harvested from pregnant mice and then decapitated. Cortical caps were dissected in ice-cold Hibernate-E supplemented with penicillin/streptomycin (Life Technologies). After rinsing with ice-cold Hibernate-E, tissues were digested with papain/DNase (Worthington/Sigma) for 8 min at 37°C. Tissues were triturated in NBActiv4 (BrainBits) supplemented with DNase. Cells were counted and plated in 24-well plates at 100,000 cells per well. Half of the medium was changed twice per week.

初代ニューロンのプライム編集および核単離 Priming and nuclear isolation of primary neurons

DIV1において、15μLのレンチウイルスを10:10:1比のN末端:C末端:ニッキングsgRNAで追加した。DIV14において、ニューロン核を製造者のプロトコールを踏襲してEZ-PREP緩衝液(Sigma D8938)を用いて単離した。全てのステップは氷上でまたは4℃で行った。培地を解離した培養物から除去し、培養物を氷冷PBSによって洗浄した。PBSをアスピレーションし、200μLのEZ-PREP溶液によって置き換えた。氷上での5分のインキュベーション後に、EZ-PREPをウェルの表面上にピペッティングし、残りの細胞を取り去った。サンプルを500gで5分に渡って遠心し、上清を除去した。サンプルを200μLのEZ-PREPによって洗浄し、500gで5分に渡って遠心した。サンプルは、穏やかなピペッティングによって、1×PBS中の100μg/mL BSAおよび3.33μM Vybrant DyeCycle Ruby(Thermo Fisher)からなる200μL氷冷核懸濁緩衝液(NSB)に再懸濁し、それから500gで5分に渡って遠心した。上清を除去し、核を100μLのNSBに再懸濁し、Broad Instituteフローサイトメトリー施設においてMoFlo Astrios(Beckman Coulter)を用いて100μLのAgencourt DNAdvanceリシス緩衝液中にソーティングした。ゲノムDNAは製造者のAgencourt DNAdvanceの説明書に従って精製した。 At DIV1, 15 μL of lentivirus was added at a 10:10:1 ratio of N-terminal:C-terminal:nicking sgRNA. At DIV14, neuronal nuclei were isolated using EZ-PREP buffer (Sigma D8938) following the manufacturer's protocol. All steps were performed on ice or at 4°C. Media was removed from dissociated cultures and cultures were washed with ice-cold PBS. PBS was aspirated and replaced with 200 μL of EZ-PREP solution. After 5 min of incubation on ice, EZ-PREP was pipetted onto the surface of the wells to dislodge remaining cells. Samples were centrifuged at 500 g for 5 min and the supernatant was removed. Samples were washed with 200 μL of EZ-PREP and centrifuged at 500 g for 5 min. Samples were resuspended in 200 μL ice-cold nuclei suspension buffer (NSB) consisting of 100 μg/mL BSA and 3.33 μM Vybrant DyeCycle Ruby (Thermo Fisher) in 1× PBS by gentle pipetting and then centrifuged at 500 g for 5 min. The supernatant was removed and nuclei were resuspended in 100 μL NSB and sorted into 100 μL Agencourt DNAdvance lysis buffer using MoFlo Astrios (Beckman Coulter) at the Broad Institute flow cytometry facility. Genomic DNA was purified according to the manufacturer's Agencourt DNAdvance instructions.

RNA配列決定およびデータ分析 RNA sequencing and data analysis

HEK293T細胞を、PRNP標的化またはHEXA標的化PEgRNAおよびPE2、PE2-dRT、またはCas9 H840Aニッカーゼによってコトランスフェクションした。トランスフェクションの72時間後に、トータルRNAをTRIzol試薬(Thermo Fisher)を用いて細胞から収穫し、オンカラムのDNaseI処置を包含するRNeasyミニキット(Qiagen)によって精製した。TruSeq StrandedトータルRNAライブラリプレップキット(Illumina)のrRNA除去プロトコールを用いて、リボソームをトータルRNAから枯渇させ、爾後にRNAClean XPビーズ(Beckman Coulter)によって洗浄した。製造者のプロトコールを踏襲して、SMARTer PrepX Apollo NGSライブラリプレップシステム(Takara)によって、配列決定ライブラリをリボ枯渇したRNAを用いて調製した。もたらされたライブラリを2200 TapeStation(Agilent Technologies)によって視覚化し、Qubit dsDNA HSアッセイ(Thermo Fisher)を用いて正規化し、75bpペアエンド読取として高アウトプットv2フローセル(Illumina)を用いてNextSeq 550によって配列決定した。Fastqファイルをbcl2fastq2バージョン2.20によって生成し、TrimGaloreバージョン0.6.2を用いてトリミングして(github.com/FelixKrueger/TrimGalore)、低品質塩基、非ペア配列、およびアダプター配列を除去した。トリミングされた読取を、RSEMバージョン1.3.1207を用いて、カスタムのCas9 H840A遺伝子エントリーによって、Homo sapiensゲノムアセンブリGRCh148とアラインメントした。limma-voom208パッケージを用いて遺伝子発現レベルを正規化し、バッチ効果補正によって差次的発現分析を行った。差次的に発現される遺伝子をFDR補正されたp値<0.05および~倍の変化>2のカットオフでコールし、結果をRによって視覚化した。 HEK293T cells were co-transfected with PRNP-targeted or HEXA-targeted PEgRNA and PE2, PE2-dRT, or Cas9 H840A nickase. 72 hours after transfection, total RNA was harvested from cells using TRIzol reagent (Thermo Fisher) and purified by RNeasy mini kit (Qiagen) including on-column DNaseI treatment. Ribosomes were depleted from total RNA using the rRNA removal protocol of TruSeq Stranded total RNA library prep kit (Illumina) and then washed with RNAClean XP beads (Beckman Coulter). Sequencing libraries were prepared with ribo-depleted RNA by SMARTer PrepX Apollo NGS library prep system (Takara) following the manufacturer's protocol. The resulting libraries were visualized by 2200 TapeStation (Agilent Technologies), normalized using Qubit dsDNA HS assay (Thermo Fisher), and sequenced by NextSeq 550 using a high output v2 flow cell (Illumina) as 75 bp paired-end reads. Fastq files were generated by bcl2fastq2 version 2.20 and trimmed using TrimGalore version 0.6.2 (github.com/FelixKrueger/TrimGalore ) to remove low quality bases, unpaired sequences, and adapter sequences. Trimmed reads were aligned to the Homo sapiens genome assembly GRCh 148 with custom Cas9 H840A gene entries using RSEM version 1.3.1 207. Gene expression levels were normalized using the limma-voom 208 package, and differential expression analysis was performed with batch effect correction. Differentially expressed genes were called with a cutoff of FDR-corrected p-value <0.05 and fold change >2, and results were visualized by R.

ClinVar分析 ClinVar analysis

ClinVarバリアントサマリーをNCBIからダウンロードし(2019年7月15日にアクセス)、それに含有される情報を全ての下流分析に用いた。全ての報告されたバリアントのリストを、重複物を除去するためのアレルIDによって、および分析を病原性のバリアントに制限するための臨床的有意性によってフィルタリングした。挿入、欠失などである病原性のバリアントの画分を計算するためには、病原性のバリアントのリストをバリアント型によって逐次的にフィルタリングした。1ヌクレオチドバリアント(SNV)を、報告された参照および代替対立遺伝子に基づいて2つのカテゴリー(トランジションおよびトランスバージョン)に分離した。参照または代替対立遺伝子を報告しなかったSNVは分析から排除した。 The ClinVar variant summary was downloaded from NCBI (accessed on July 15, 2019) and the information contained therein was used for all downstream analyses. The list of all reported variants was filtered by allele ID to remove duplicates and by clinical significance to restrict the analysis to pathogenic variants. To calculate the fraction of pathogenic variants that were insertions, deletions, etc., the list of pathogenic variants was sequentially filtered by variant type. Single nucleotide variants (SNVs) were separated into two categories (transitions and transversions) based on the reported reference and alternative alleles. SNVs that did not report a reference or alternative allele were excluded from the analysis.

報告された挿入、欠失、および重複の長さを、参照/代替対立遺伝子、バリアントスタート/ストップ位置、またはバリアント名称の適当な識別情報を用いて計算した。上の情報のいずれかを報告しないバリアントは分析から排除した。報告されたインデル(参照ゲノムに対して相対的に挿入および欠失両方を包含する単一のバリアント)の長さは、参照および代替対立遺伝子間の最も良好なペアワイズアラインメントにおけるミスマッチまたはギャップの数を決定することによって計算された。バリアント長さの度数分布はGraphPad Prism 8を用いて計算された。 The lengths of reported insertions, deletions, and duplications were calculated using appropriate identifying information for the reference/alternate alleles, variant start/stop positions, or variant name. Variants that did not report any of the above information were excluded from the analysis. The lengths of reported indels (single variants encompassing both insertions and deletions relative to the reference genome) were calculated by determining the number of mismatches or gaps in the best pairwise alignment between the reference and alternative alleles. Frequency distributions of variant lengths were calculated using GraphPad Prism 8.

データ利用性 Data availability

高スループット配列決定データはNCBI配列読取アーカイブデータベースに寄託されている。PE1、PE2/PE3、およびPEgRNA発現ベクターをコードするプラスミドはAddgeneから利用可能であろう。 High-throughput sequencing data have been deposited in the NCBI Sequence Read Archive database. Plasmids encoding PE1, PE2/PE3, and the PEgRNA expression vector will be available from Addgene.

コード利用性 Code availability

PEgRNA骨格挿入を定量するために用いられるスクリプトは図60A-60Bに提供される。 The script used to quantify PEgRNA backbone insertion is provided in Figures 60A-60B.

補足情報:表および配列 Additional information: tables and sequences

表1:HEK3、HEK4、EMX1、およびFANCFオンターゲットおよびオフターゲット部位におけるプライム編集因子、Cas9ヌクレアーゼ、Cas9 H840Aニッカーゼ、およびPE2-dRTの活性。PE2/PE3編集が%インデル(括弧内)と並べて%プライム編集として示されている。%インデルは、Cas9、Cas9 H840Aニッカーゼ(nCas9)、およびPE2-dRTについて、上位4つの先に特徴付けられたオフターゲット部位において示されている179,180。sgRNAおよびPEgRNA配列は表3A~3Rにおいて図42A-42Hの見出しの下に見出され得る。全ての値は3つの独立した生物学的レプリケートの平均である。 Table 1: Activity of prime editors, Cas9 nuclease, Cas9 H840A nickase, and PE2-dRT at HEK3, HEK4, EMX1, and FANCF on-target and off-target sites. PE2/PE3 editing is shown as % prime editing alongside % indels (in brackets). % indels are shown at the top four previously characterized off-target sites for Cas9, Cas9 H840A nickase (nCas9), and PE2-dRT. sgRNA and PEgRNA sequences can be found in Tables 3A-3R under the headings of Figures 42A-42H. All values are the average of three independent biological replicates.

Figure 2020191243000310
Figure 2020191243000310

表2A~2C:in vitroでの実験のために使用されたDNAオリゴヌクレオチド、PEgRNA、およびsgRNAの配列。 Tables 2A-2C: Sequences of DNA oligonucleotides, PEgRNA, and sgRNA used for in vitro experiments.

表2A:DNAオリゴヌクレオチド

Figure 2020191243000311
Table 2A: DNA oligonucleotides
Figure 2020191243000311

表2B:5'-伸長されたPEgRNA

Figure 2020191243000312
Table 2B: 5'-Extended PEG RNA
Figure 2020191243000312

表2C:3'-伸長されたPEgRNA

Figure 2020191243000313
Table 2C: 3'-Extended PEG RNA
Figure 2020191243000313

表3A~3R:哺乳類細胞実験に用いられたPEgRNAおよびsgRNAの配列。全ての配列は5'から3'の向きで示されている。PEgRNAを構築するためには、下に列記されるスペーサー配列をsgRNA骨格の5'端に追加し、プライマー結合部位とRT鋳型とを含有する下に列記される3'伸長をsgRNA骨格の3'端に追加した。sgRNA骨格配列はGTTTTAGAGCTAGAAATAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGCACCGAGTCGGTGC(配列番号131)である。 Tables 3A-3R: Sequences of PEgRNA and sgRNA used in mammalian cell experiments. All sequences are shown in 5' to 3' orientation. To construct PEgRNA, the spacer sequence listed below was added to the 5' end of the sgRNA backbone and the 3' extension listed below containing a primer binding site and RT template was added to the 3' end of the sgRNA backbone. The sgRNA backbone sequence is GTTTTAGAGCTAGAAATAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGCACCGAGTCGGTGC (SEQ ID NO: 131).

表3A:図39A~39D PEgRNA

Figure 2020191243000314

Figure 2020191243000315

Figure 2020191243000316

Figure 2020191243000317

Figure 2020191243000318

Figure 2020191243000319
Table 3A: Figures 39A-39D PEgRNA
Figure 2020191243000314

Figure 2020191243000315

Figure 2020191243000316

Figure 2020191243000317

Figure 2020191243000318

Figure 2020191243000319

表3B:図40A~40C PEgRNA

Figure 2020191243000320
Table 3B: Figures 40A-40C PEgRNA
Figure 2020191243000320

表3C:図40A~40C ニックを入れるsgRNA配列

Figure 2020191243000321
Table 3C: Figures 40A-40C sgRNA sequences to be nicked
Figure 2020191243000321

表3D:図41A~41K PEgRNA

Figure 2020191243000322

Figure 2020191243000323

Figure 2020191243000324

Figure 2020191243000325

Figure 2020191243000326

Figure 2020191243000327

Figure 2020191243000328

Figure 2020191243000329
Table 3D: Figures 41A-41K PEgRNA
Figure 2020191243000322

Figure 2020191243000323

Figure 2020191243000324

Figure 2020191243000325

Figure 2020191243000326

Figure 2020191243000327

Figure 2020191243000328

Figure 2020191243000329

表3E:図41A~41Kニックを入れるsgRNA Table 3E: sgRNAs for nicking in Figures 41A-41K

Figure 2020191243000330
Figure 2020191243000330

Figure 2020191243000331
Figure 2020191243000331

表3F:図42A~42H PEgRNA Table 3F: Figures 42A-42H PEgRNA

Figure 2020191243000332
Figure 2020191243000332

表3G:図42A~42Hニックを入れるsgRNA

Figure 2020191243000333

Figure 2020191243000334
Table 3G: sgRNAs nicked in Figures 42A-42H
Figure 2020191243000333

Figure 2020191243000334

表3H:図42A~42H塩基編集sgRNA

Figure 2020191243000335
Table 3H: Figures 42A-42H base-edited sgRNAs
Figure 2020191243000335

表3I:図42A~42HオンターゲットsgRNA

Figure 2020191243000336
Table 3I: Figures 42A-42H on-target sgRNAs
Figure 2020191243000336

表3J:図42A~42H オンターゲットPEgRNA

Figure 2020191243000337

Figure 2020191243000338
Table 3J: Figures 42A-42H On-target PEgRNA
Figure 2020191243000337

Figure 2020191243000338

表3K:図49A~49B PEgRNA

Figure 2020191243000339

Figure 2020191243000340
Table 3K: Figures 49A-49B PEgRNA
Figure 2020191243000339

Figure 2020191243000340

表3L:図47A~74D PEgRNA

Figure 2020191243000341
Table 3L: Figures 47A-74D PEgRNA
Figure 2020191243000341

表3M:図48A~48C PEgRNA

Figure 2020191243000342

Figure 2020191243000343

Figure 2020191243000344

Figure 2020191243000345

Figure 2020191243000346
Table 3M: Figures 48A-48C PEgRNA
Figure 2020191243000342

Figure 2020191243000343

Figure 2020191243000344

Figure 2020191243000345

Figure 2020191243000346

表3N:図48A~48C PEgRNA

Figure 2020191243000347
Table 3N: Figures 48A-48C PEgRNA
Figure 2020191243000347

表3O:図48A~48Cニックを入れるsgRNA

Figure 2020191243000348
Table 3O: sgRNA nicking in Figures 48A-48C
Figure 2020191243000348

表3P:図50A~50B PRgRNA

Figure 2020191243000349

Figure 2020191243000350

Figure 2020191243000351
Table 3P: Figure 50A-50B PRgRNA
Figure 2020191243000349

Figure 2020191243000350

Figure 2020191243000351

表3Q:図50A~50Bニックを入れるsgRNA

Figure 2020191243000352
Table 3Q: sgRNA nicking in Figures 50A-50B
Figure 2020191243000352

表3R:図51A~51G PEgRNA

Figure 2020191243000353

Figure 2020191243000354
Table 3R: Figures 51A- 51G PEgRNA
Figure 2020191243000353

Figure 2020191243000354

表4:哺乳動物細胞ゲノムDNA増幅およびHTS181に使用されたプライマーの配列。

Figure 2020191243000355

Figure 2020191243000356

Figure 2020191243000357
Table 4: Sequences of primers used for mammalian cell genomic DNA amplification and HTS 181 .
Figure 2020191243000355

Figure 2020191243000356

Figure 2020191243000357

表5:HDR実験におよびHBB E6V HEK293T細胞株の生出に用いられた100mer一本鎖DNAオリゴヌクレオチドドナー鋳型の配列。オリゴヌクレオチドは長さが100-103ntであり、編集の部位を中心とした相同アームを有する。オリゴヌクレオチドはIntegrated DNA Technologiesからであり、PAGEによって精製された。

Figure 2020191243000358

Figure 2020191243000359
Table 5: Sequences of 100mer single-stranded DNA oligonucleotide donor templates used for HDR experiments and for generation of HBB E6V HEK293T cell lines. Oligonucleotides are 100-103 nt in length with homology arms centered at the site of editing. Oligonucleotides were from Integrated DNA Technologies and were purified by PAGE.
Figure 2020191243000358

Figure 2020191243000359

追加の配列 Additional arrays

本明細書に使用された酵母二重蛍光レポータープラスミドの配列
p425-GFP_停止_mCherry:

Figure 2020191243000360

Figure 2020191243000361

Figure 2020191243000362

Figure 2020191243000363

Figure 2020191243000364

Figure 2020191243000365

Figure 2020191243000366

Figure 2020191243000367

Figure 2020191243000368

Figure 2020191243000369

Figure 2020191243000370

Figure 2020191243000371

Figure 2020191243000372
Sequences of the yeast dual fluorescent reporter plasmids used herein
p425-GFP_stop_mCherry:
Figure 2020191243000360

Figure 2020191243000361

Figure 2020191243000362

Figure 2020191243000363

Figure 2020191243000364

Figure 2020191243000365

Figure 2020191243000366

Figure 2020191243000367

Figure 2020191243000368

Figure 2020191243000369

Figure 2020191243000370

Figure 2020191243000371

Figure 2020191243000372

哺乳動物プライム編集因子プラスミドおよび例となるPEgRNAプラスミドのDNA配列

Figure 2020191243000373

Figure 2020191243000374

Figure 2020191243000375

Figure 2020191243000376

Figure 2020191243000377

Figure 2020191243000378

Figure 2020191243000379

Figure 2020191243000380

Figure 2020191243000381

Figure 2020191243000382

Figure 2020191243000383

Figure 2020191243000384

Figure 2020191243000385

Figure 2020191243000386

Figure 2020191243000387

Figure 2020191243000388

Figure 2020191243000389

Figure 2020191243000390

Figure 2020191243000391

Figure 2020191243000392

Figure 2020191243000393

Figure 2020191243000394

Figure 2020191243000395

Figure 2020191243000396

pLenti-U6-DNMT1_ニックを入れる_sgRNA:
Figure 2020191243000397

Figure 2020191243000398

Figure 2020191243000399

Figure 2020191243000400
DNA sequences of mammalian prime editor plasmids and exemplary PEgRNA plasmids
Figure 2020191243000373

Figure 2020191243000374

Figure 2020191243000375

Figure 2020191243000376

Figure 2020191243000377

Figure 2020191243000378

Figure 2020191243000379

Figure 2020191243000380

Figure 2020191243000381

Figure 2020191243000382

Figure 2020191243000383

Figure 2020191243000384

Figure 2020191243000385

Figure 2020191243000386

Figure 2020191243000387

Figure 2020191243000388

Figure 2020191243000389

Figure 2020191243000390

Figure 2020191243000391

Figure 2020191243000392

Figure 2020191243000393

Figure 2020191243000394

Figure 2020191243000395

Figure 2020191243000396

pLenti-U6-DNMT1_Nick_sgRNA:
Figure 2020191243000397

Figure 2020191243000398

Figure 2020191243000399

Figure 2020191243000400

本明細書に使用されたモロニーマウス白血病ウイルス逆転写酵素(M-MLV RT)バリアントのアミノ酸配列。
PE1 M-MLV RT:
TLNIEDEYRLHETSKEPDVSLGSTWLSDFPQAWAETGGMGLAVRQAPLIIPLKATSTPVSIKQYPMSQEARLGIKPHIQRLLDQGILVPCQSPWNTPLLPVKKPGTNDYRPVQDLREVNKRVEDIHPTVPNPYNLLSGLPPSHQWYTVLDLKDAFFCLRLHPTSQPLFAFEWRDPEMGISGQLTWTRLPQGFKNSPTLFDEALHRDLADFRIQHPDLILLQYVDDLLLAATSELDCQQGTRALLQTLGNLGYRASAKKAQICQKQVKYLGYLLKEGQRWLTEARKETVMGQPTPKTPRQLREFLGTAGFCRLWIPGFAEMAAPLYPLTKTGTLFNWGPDQQKAYQEIKQALLTAPALGLPDLTKPFELFVDEKQGYAKGVLTQKLGPWRRPVAYLSKKLDPVAAGWPPCLRMVAAIAVLTKDAGKLTMGQPLVILAPHAVEALVKQPPDRWLSNARMTHYQALLLDTDRVQFGPVVALNPATLLPLPEEGLQHNCLDILAEAHGTRPDLTDQPLPDADHTWYTDGSSLLQEGQRKAGAAVTTETEVIWAKALPAGTSAQRAELIALTQALKMAEGKKLNVYTDSRYAFATAHIHGEIYRRRGLLTSEGKEIKNKDEILALLKALFLPKRLSIIHCPGHQKGHSAEARGNRMADQAARKAAITETPDTSTLLIENSSP(配列番号739)

M3 M-MLV RT(D200N、T330P、L603W)(Baranauskas et al.182を参照):

Figure 2020191243000401

PE2 M-MLV RT(D200N、T306K、W313F、T330P、L603W):
Figure 2020191243000402

Figure 2020191243000403

M3-不活性型RT M-MLV RT:
Figure 2020191243000404
Amino acid sequences of Moloney murine leukemia virus reverse transcriptase (M-MLV RT) variants used herein.
PE1 M-MLV RT:
(SEQ ID NO:739)

M3 M-MLV RT (D200N, T330P, L603W) (see Baranauskas et al. 182 ):
Figure 2020191243000401

PE2 M-MLV RT (D200N, T306K, W313F, T330P, L603W):
Figure 2020191243000402

Figure 2020191243000403

M3-inactive RT M-MLV RT:
Figure 2020191243000404

例12のための参考文献
以下の参考文献の各々は例12に引用され、これらの各々は参照により本明細書に組み込まれる。

Figure 2020191243000405

Figure 2020191243000406

Figure 2020191243000407

Figure 2020191243000408

Figure 2020191243000409
REFERENCES FOR EXAMPLE 12 Each of the following references is cited in Example 12, each of which is incorporated herein by reference.
Figure 2020191243000405

Figure 2020191243000406

Figure 2020191243000407

Figure 2020191243000408

Figure 2020191243000409

例13-PEによる細胞データ記録および系統トレース
背景
ゲノム改変は、細胞性のプロセスおよび発生を研究および記録するためにもまた用いられ得る。細胞分裂またはシグナルカスケード活性化のような細胞性のイベントをDNA配列改変にリンクすることは、解釈可能なDNA配列変化として細胞の履歴を貯蔵し、これらは特定の細胞性のイベントが生起したかどうかを記述するであろう。DNAは、RNAおよびタンパク質がされないやり方で1つの細胞から次へと忠実に受け渡されるので、DNA編集はこれらの適用にとって必要である。改変が短寿命のタンパク質およびRNA分子になされるときには、細胞状態および系統に関する情報は一般的には失われる。単一の細胞内の細胞性のイベントを記録することは、どのようにして疾患状態が開始、維持、および健康な対照に対して相対的に変化するかを理解するための強力なやり方である。これらの問いかけを探査する能力は、がん、神経学的疾患、およびヒトの健康の幾多の他の重要な問題の発生を理解することに関連性を有する。プライム編集(PE)は、標的化されたかつ配列によって規定されたゲノム挿入、欠失、または変異を生出するためのシステムを提供する。標的アンプリコン配列決定および/またはRNA配列決定(これは単細胞記録実験にとって特に価値がある)によって配列決定され得るDNA標的の繰り返しの改変が、シグナルカスケードの活性化、代謝状態、および細胞分化プログラムを包含する幾多の重要な生物学的プロセスを記録するために用いられ得る。内部のおよび外部の細胞性シグナルをゲノム上の配列改変に接続することは、理論上は、シグナル応答性プロモーターが存在するいずれかのシグナルについて可能である。PEは、培養条件およびインビボの両方において真核および原核細胞の細胞系統およびシグナルの履歴を探査するための多大に拡張されたツールキットを可能化するということが信じられる。
Example 13 - Cellular Data Recording and Lineage Tracing with PE Background Genomic modifications can also be used to study and record cellular processes and development. Linking cellular events such as cell division or signal cascade activation to DNA sequence modifications would store the history of the cell as interpretable DNA sequence changes that would describe whether a particular cellular event occurred. DNA editing is necessary for these applications because DNA is faithfully passed from one cell to the next in a way that RNA and proteins are not. When modifications are made to short-lived protein and RNA molecules, information about cell state and lineage is generally lost. Recording cellular events within a single cell is a powerful way to understand how disease states are initiated, maintained, and altered relative to healthy controls. The ability to explore these questions has relevance to understanding the development of cancer, neurological diseases, and numerous other important problems in human health. Prime editing (PE) provides a system for generating targeted and sequence-defined genomic insertions, deletions, or mutations. Repeated modifications of DNA targets, which can be sequenced by targeted amplicon sequencing and/or RNA sequencing (which is particularly valuable for single-cell recording experiments), can be used to record a number of important biological processes, including activation of signal cascades, metabolic states, and cell differentiation programs. Connecting internal and external cellular signals to sequence modifications on genomes is theoretically possible for any signal for which a signal-responsive promoter exists. It is believed that PE will enable a greatly expanded toolkit for probing the cell lineage and signal history of eukaryotic and prokaryotic cells both in culture and in vivo.

先の標準 Previous standard

標的化された配列挿入、欠失、または変異は、系統トレースおよび細胞性の刺激の記録を包含するいくつもの重要な生物学的問いかけを研究するために用いられ得る。ゲノム上にこれらのシグネチャーを生成するための現行のツールキットは限定されている。標的座位の変異導入は今日までDNAヌクレアーゼおよび塩基編集因子両方を用いて開発されている。 Targeted sequence insertions, deletions, or mutations can be used to study a number of important biological questions, including lineage tracing and recording cellular stimuli. The current toolkit for generating these signatures across genomes is limited. To date, targeted locus mutagenesis has been developed using both DNA nucleases and base editors.

標的配列のCRISPR/Cas9ヌクレアーゼカットは、確率的な配列変化を生成して、多数の挿入または欠失(インデル)産物を生成する。Cas9カットから発生する多数の配列アウトカムは、ヌクレアーゼによってカットされた配列の明瞭な決定を許す。カット対非カット配列を見分ける能力は2つの支配的なやり方で用いられた。 CRISPR/Cas9 nuclease cuts of target sequences generate stochastic sequence changes, producing multiple insertion or deletion (indel) products. The multiple sequence outcomes that arise from Cas9 cuts allow unambiguous determination of the sequences that were cut by the nuclease. The ability to distinguish cut versus uncut sequences has been used in two predominant ways.

第1に、Cas9ヌクレアーゼおよび/またはそのシングルガイドRNA(sgRNA)の発現が細胞シグナルに接続された。加えて、Cas9標的ゲノム座位の配列改変に基づいて、そのシグナルが生起したかどうかが記録された。しかしながら、このアプローチは限定される。なぜなら、各シグナルは固有の標的座位を要求し、これは複数のシグナルの相対的タイミングを追跡することを解釈困難にするからである。このアプローチの別の限定は、ある特定のsgRNAについて、複数の標的座位が望まれるということである。なぜなら、インデルの生成は多くの場合には標的座位の追加の変異導入を厳しく妨げるからである;多くの場合には、これは、内生座位の直接的変異導入の代わりに、予め操作された標的座位が編集のために細胞に取り入れられるということを意味する。 First, expression of the Cas9 nuclease and/or its single guide RNA (sgRNA) was connected to a cellular signal. In addition, the occurrence of the signal was recorded based on sequence modification of the Cas9 target genomic locus. However, this approach is limited because each signal requires a unique target locus, which makes tracking the relative timing of multiple signals difficult to interpret. Another limitation of this approach is that multiple target loci are desired for a given sgRNA, because the generation of indels often severely precludes additional mutagenesis of the target locus; in many cases, this means that a pre-engineered target locus is introduced into the cell for editing, instead of direct mutagenesis of the endogenous locus.

第2に、Cas9インデルが細胞系統を追跡するために用いられた。本明細書に記載のとおり、Cas9ヌクレアーゼ活性によって生成される多数の可能なインデル状態は、細胞発生樹形図の生成を許す。これらは時間的にどの細胞が互いから発生したかを示唆する。このアプローチは、どのようにして細胞が互いから発生したかを理解するための強力なやり方であり、選択された細胞プールに対するRNA配列決定を行うことによって固有の細胞状態および型を発生時間的に同定することを助けるために用いられている。このアプローチは細胞シグナルイベント、それらの順序について独立しては報告し得ず、前駆体対終末分化した細胞状態について報告するときにはバイアスを有し得る。 Second, Cas9 indels have been used to trace cell lineages. As described herein, the large number of possible indel states generated by Cas9 nuclease activity allows the generation of cell developmental trees. These suggest which cells evolved from each other in time. This approach is a powerful way to understand how cells evolved from each other and has been used to help identify unique cell states and types in developmental time by performing RNA sequencing on selected cell pools. This approach cannot independently report on cell signaling events, their order, and can be biased when reporting on precursor versus terminally differentiated cell states.

Cas9ヌクレアーゼによって媒介される系統トレースおよびシグナル記録は、いくつかの重要な警告を伴う強力な技術である。Cas9ヌクレアーゼによるシグナル記録は多くの場合には非常に技術的に難しい。Cas9カットは標的座位を消耗させ(ひとたびインデルが生成されると、繰り返しのカットは困難である)、単一細胞レベルにおいて長期的刺激を記録することを困難にする。Cas9カットのキネティクスはイベントをより長期間記録することを可能化するようにチューニングされ得るが、複数の刺激の順序、強度、および持続時間を取り入れする能力は非常に難しい技術的問題のままに留まり、これはこのツールでは達成可能でなくあり得る。Cas9系統トレース実験はとてつもなく強力であるが、標的座位における同時のCas9カットを原因とする配列の崩れという軽度の技術的課題を患う。これらの系統トレース実験は予めデザインされた標的座位の編集を要求し、このアプローチのフレキシビリティーを限定する。 Cas9 nuclease-mediated lineage tracing and signal recording is a powerful technique with some important caveats. Signal recording with Cas9 nuclease is often very technically challenging. Cas9 cuts deplete the target locus (once an indel is generated, repeated cuts are difficult), making it difficult to record long-term stimulation at the single-cell level. Although the kinetics of Cas9 cuts can be tuned to allow for longer-term recording of events, the ability to incorporate the sequence, strength, and duration of multiple stimuli remains a formidable technical problem that may not be achievable with this tool. Cas9 lineage tracing experiments are extremely powerful but suffer from minor technical challenges of sequence collapse due to simultaneous Cas9 cuts at the target locus. These lineage tracing experiments require predesigned edits of the target locus, limiting the flexibility of this approach.

DNA塩基編集は細胞シグナルイベントを追跡するためにもまた用いられている。Cas9インデルによって生成される状態の数に対して相対的に編集イベントによって生成されるアウトカム状態の低い数を原因として、塩基編集は系統トレースにはあまり適さない;しかしながら、塩基編集因子によって作られる配列改変の予め定められた性質は、内部のおよび外部の細胞性の刺激を追跡することにとって特に有用である。本明細書に記載の塩基編集因子またはsgRNA発現どちらかは、具体的な生物学的または化学的刺激に接続され得る。哺乳類および細菌細胞両方において多数の個々の刺激を追跡するために、塩基編集活性が用いられた。このアプローチは、第2の編集が生起し得る前に第1の編集イベントが必要である連続した刺激を追跡するためにもまた用いられた。 DNA base editing has also been used to track cellular signaling events. Due to the low number of outcome states generated by editing events relative to the number of states generated by Cas9 indels, base editing is less suitable for lineage tracing; however, the predefined nature of the sequence modifications made by base editors makes them particularly useful for tracking internal and external cellular stimuli. Either base editors or sgRNA expression described herein can be connected to specific biological or chemical stimuli. Base editing activity has been used to track multiple individual stimuli in both mammalian and bacterial cells. This approach has also been used to track sequential stimuli where the first editing event is required before the second edit can occur.

塩基編集シグナル記録は分野にとって重要な第1ステップであるが、それはいくつもの限定を有する。1つのかかる限定は、塩基編集が編集後にその標的を消耗させ、技術のダイナミックレンジを限定するということである。これは、イベントを記録するために内生標的を用いることが多くの場合には困難であり、単一細胞レベルにおける活性の代わりにバルクの活性を記録することに限定されるということを意味する。これの代替は予めデザインされた繰り返し記録座位の導入であるが、これは今日まで行われていない。2シグナル記録のイシューもまたある。これらの2シグナル記録実験は第1の後の第2の刺激の存在についてのみ報告する;それは、どの刺激が最初に起こったのかまたはどのくらい長く刺激が存在したのかを報告しない。これは実験から拾い集められる生物学的理解を根本的に限定する。 Although base editing signal recording is an important first step for the field, it has a number of limitations. One such limitation is that base editing depletes its target after editing, limiting the dynamic range of the technique. This means that it is often difficult to use endogenous targets to record events, and one is limited to recording bulk activity instead of activity at the single cell level. An alternative to this would be the introduction of pre-designed repeated recording loci, but this has not been done to date. There is also the issue of two-signal recording. These two-signal recording experiments only report on the presence of a second stimulus after the first; they do not report which stimulus occurred first or how long the stimulus was present. This fundamentally limits the biological understanding that can be gleaned from the experiments.

ゲノム標的配列および取り入れされた予めデザインされた配列を改変することによって、PE系統トレースは系統トレースおよび細胞シグナル記録両方をし得るということが提案されている。PEは、Cas9ニッカーゼフラグメント(多くの場合にはSpCas9 H840Aバリアント)と逆転写酵素(RT)ドメインとを含む合成融合タンパク質を、操作されたプライム編集ガイドRNA(PEgRNA)と併せて用いる。一緒になって、これらの構成要素は特定のゲノム配列を標的化し、予め決定された編集を組み入れる。PEgRNAは標的ゲノム配列および編集アウトカム両方を規定するので、高度に特異的なかつコントロールされたゲノム改変が、同じ細胞内の複数のPEgRNAを用いて同時に達成され得る。アクセス可能なゲノム改変は、全ての1ヌクレオチド置換、小から中程度のサイズの配列挿入、および小から中程度のサイズの配列欠失を包含する。このゲノム編集テクノロジーの汎用性は、細胞内の時間的にカップリングされたシグナル特異的な記録を可能化するはずである。 It has been proposed that PE lineage tracing can both lineage trace and record cell signals by modifying genomic target sequences and incorporating pre-designed sequences. PE uses a synthetic fusion protein containing a Cas9 nickase fragment (often the SpCas9 H840A variant) and a reverse transcriptase (RT) domain in conjunction with an engineered prime editing guide RNA (PEgRNA). Together, these components target specific genomic sequences and incorporate predetermined edits. Because the PEgRNA specifies both the target genomic sequence and the editing outcome, highly specific and controlled genome modifications can be achieved simultaneously using multiple PEgRNAs in the same cell. Accessible genome modifications include all single nucleotide substitutions, small to medium sized sequence insertions, and small to medium sized sequence deletions. The versatility of this genome editing technology should enable temporally coupled signal-specific recording in cells.

PE系統および細胞シグナル記録の有用性 The utility of PE lineages and cell signaling recordings

細胞シグナルを記録することはいくつものやり方で達成され得る。このアプローチの1つの重要な第1の適用は、DNA改変イベントをサイクリン、CDK、または細胞寿命の局面に特異的な他のタンパク質の発現のような細胞周期関連シグナルに接続することであり、細胞時計を生成し得る。細胞時計は、研究者が個々の細胞によって受容およびプロセシングされている種々のシグナルの順序を理解することを許す。分子時計は長期的なシグナル対短期的な突発的シグナルの決定をもまた可能化するであろう。細胞周期に1回のみ編集し得るプライム編集構成要素を用いることもまた分子時計に至り得る。連続したDNA改変なしに(おそらく、非編集DNA鎖にニッキングしないことによって)、編集が細胞周期に1回のみ進み得る場合には、爾後の細胞分裂において第2の標的化PEsgRNAによってのみ編集され得るシステムを想像し得る。それは規定されたやり方で座位を繰り返して挿入、欠失、または変異させ得るので、PEは細胞時計として特に有用であり、挿入は特に重宝である。なぜなら、繰り返しの規則的挿入がいずれかの標的ゲノム座位においてなされ得るからである。 Recording cellular signals can be accomplished in a number of ways. One important first application of this approach is to connect DNA modification events to cell cycle-related signals, such as the expression of cyclins, CDKs, or other proteins specific to aspects of cell life, to generate a cellular clock. A cellular clock allows researchers to understand the sequence of various signals being received and processed by individual cells. A molecular clock would also enable the determination of long-term signals versus short-term bursty signals. Using a prime editing component that can edit only once per cell cycle can also lead to a molecular clock. If editing can proceed only once per cell cycle, without successive DNA modifications (perhaps by not nicking the unedited DNA strand), one can imagine a system in which editing can only be done by a second targeted PEsgRNA in a subsequent cell division. PE is particularly useful as a cellular clock because it can repeatedly insert, delete, or mutate loci in a defined manner, and insertions are particularly handy because repeated, ordered insertions can be made at any target genomic locus.

細胞シグナルを記録することに関する別の重要な適用は、多数の細胞性のインプットの並行的な記録である。細胞シグナルイベントをDNA改変にリンクすることは、かかるシグナルイベントが生起したかどうかを記録することを可能化する。Cas9ヌクレアーゼに基づくまたは塩基編集に基づく記録システムに類似に、細胞性のイベントの記録はgRNAまたは編集因子発現にテザリングされ得る。これらの他のアプローチとは違って、系統プライム編集は、順序付けられた編集のための厳格な配列モチーフを要求することなしに、シグナルイベントの順序、強度、および持続時間を記録する能力があるはずである。実に、系統プライム編集は、生物学的シグナルの順序、強度、および持続時間を研究するために、上に記載されている細胞性のカウンターをシグナル特異的な挿入、欠失、または変異と取り入れする能力があるはずである。プライム編集のプログラム可能な性質を原因として、このアプローチは目当ての標的細胞に予め存在するゲノム座位において達成され得る(これが細菌、マウス、ラット、サル、ブタ、ヒト、ゼブラフィッシュ、C.elegansなどにおいてであるかにかかわらない)。プライム編集記録はガイドRNA依存的な様式でバーコードを組み入れるということに注意することも重要であり、インプットの数は、確かなシグナル特異的なガイドRNA発現カセットがあるシグナルの数に限定される(これは、これらの発現をRNA Pol IIプロモーターの活性にテザリングする能力を原因として非常に高いはずである)。記録可能なシグナルの数は必要とされるPEgRNAの数に直線的に比例する。 Another important application of recording cellular signals is the parallel recording of multiple cellular inputs. Linking cellular signaling events to DNA modifications allows for recording whether such signaling events have occurred. Similar to Cas9 nuclease-based or base editing-based recording systems, recording of cellular events can be tethered to gRNA or editor expression. Unlike these other approaches, lineage prime editing should be capable of recording the order, intensity, and duration of signaling events without requiring strict sequence motifs for ordered editing. Indeed, lineage prime editing should be capable of incorporating the cellular counters described above with signal-specific insertions, deletions, or mutations to study the order, intensity, and duration of biological signals. Due to the programmable nature of prime editing, this approach can be achieved at genomic loci that pre-exist in the target cells of interest (whether this is in bacteria, mice, rats, monkeys, pigs, humans, zebrafish, C. elegans, etc.). It is also important to note that prime editing recording incorporates barcodes in a guide RNA-dependent manner, and the number of inputs is limited to the number of signals for which there are robust signal-specific guide RNA expression cassettes (which should be very high due to the ability to tether their expression to the activity of RNA Pol II promoters). The number of signals that can be recorded is linearly proportional to the number of PEgRNAs required.

PEは細胞系統をトレースするためにもまた用いられ得る。個々の細胞を追跡するための固有の細胞バーコードを生成するために、繰り返しの配列改変が用いられ得る。バーコードのアレイ、それらの順序、およびサイズは全て、Cas9ヌクレアーゼによって生成される多数のインデル状態に対して相補的であり得るやり方で、細胞系統を推論するために用いられ得る。 PE can also be used to trace cell lineage. Repetitive sequence modifications can be used to generate unique cellular barcodes to track individual cells. The array of barcodes, their order, and size can all be used to infer cell lineage in a manner that can be complementary to the multiple indel states generated by Cas9 nuclease.

繰り返しの配列改変のためのプライム編集方法論 Prime editing methodology for repeated sequence modifications

プライム編集(PE)を用いる繰り返しの配列改変のいくつもの別物のモダリティーが想定された:DNA変異導入;配列欠失;および配列挿入である。注意すべきことに、これらの適用は、予め存在するゲノムDNA標的に対してまたは研究者が標的細胞に取り入れする予めデザインされたDNA配列に対してどちらかで用いられ得る。連続配列改変のこれらの技術は、連続的な様式で、情報を記録することにとって、および標的座位のデザインされたまたは確率的な改変にとって価値を有する。連続標的座位改変は、種々のホストにおいてバリアントのライブラリを生成ことにとって特に有用であり得る。 Several distinct modalities of iterative sequence modification using prime editing (PE) have been envisioned: DNA mutagenesis; sequence deletion; and sequence insertion. Of note, these applications can be used either on pre-existing genomic DNA targets or on pre-designed DNA sequences that researchers introduce into target cells. These techniques of sequential sequence modification are valuable for recording information and for the designed or stochastic modification of target loci in a sequential manner. Serial targeted locus modification can be particularly useful for generating libraries of variants in various hosts.

繰り返しの配列変異は、細胞シグナルイベントについて報告するために、反復的な様式で、ゲノムDNAまたは予めデザインされた取り入れされたDNA配列どちらかを変改するために用いられ得る。このパラダイムでは、PE gRNA活性によって組み入れされる変異は細胞性のシグナルの存在に対応するであろう。これらの点変異は、連続編集イベントにとって必要なPAMモチーフ、および特定のシグナルの存在に対応する点変異を組み入れ組み入れ得る。各順次のガイドRNAは新規のプロトスペーサーを用いるであろうから、このシステムは使用に先行してgRNAデザインを要求するであろう;しかしながら、それは特に目当ての個々のまたは小さい数の刺激を検分することにとって特に強力であり得る。これらの変異の組み入れは個々の生物学的刺激に依存的であり得るか、または細胞時間をマークするであろう整合する細胞性のプロセスに接続され得る。下の配列は配列番号743、744、744、および745に対応する。

Figure 2020191243000410
Repeated sequence mutations can be used to alter either genomic DNA or pre-designed introduced DNA sequences in a repetitive manner to report on cellular signaling events. In this paradigm, mutations incorporated by PE gRNA activity will correspond to the presence of cellular signals. These point mutations can incorporate PAM motifs necessary for sequential editing events, and point mutations corresponding to the presence of specific signals. Because each successive guide RNA will use a new protospacer, this system will require gRNA design prior to use; however, it can be particularly powerful for monitoring individual or small numbers of stimuli of interest. The incorporation of these mutations can be dependent on individual biological stimuli or can be connected to corresponding cellular processes that will mark cellular time. The sequences below correspond to SEQ ID NOs: 743, 744, 744, and 745.
Figure 2020191243000410

別の類似のPEガイドRNA集約型の方法は標的配列の繰り返しの欠失である。標的座位からの個々の配列の除去は、DNAモチーフの喪失によってシグナルイベントを再構築する能力を許すであろう。順次の配列を欠失するPEgRNAのデザインは、連続したシグナルの追跡を可能化するであろう。これは、研究者が1つのシグナルが別のものに後続する場合を同定することを許すであろう。これは、研究者がどのシグナルイベントがどの順序で起こるかを探査することを許すであろう。かかるシステムはCAMERAを用いて試験されている;しかしながら、これは固有の配列要件を有する具体的な座位の予めの選択を要求する。特定の配列決定要因が要求されないので、PEを用いる順次の配列欠失は、個々の細胞におけるペアワイズなイベントの並行的な記録を許すであろう。これは、目当てのいずれかの標的細胞内における多重化された様式のペアワイズなシグナルイベントを探査する能力を研究者に許すであろう。下の配列は配列番号746、747、および748に対応する。 Another similar PE guide RNA intensive method is repeated deletion of target sequences. Removal of individual sequences from the target locus would allow the ability to reconstruct signaling events by loss of DNA motifs. Designing PE gRNAs to delete sequential sequences would enable tracking of sequential signals. This would allow researchers to identify cases where one signal follows another. This would allow researchers to explore which signaling events occur in which order. Such a system has been tested using CAMERA; however, this requires the preselection of specific loci with unique sequence requirements. Since no specific sequence determinants are required, sequential sequence deletion using PE would allow parallel recording of pairwise events in individual cells. This would allow researchers the ability to explore pairwise signaling events in a multiplexed manner in any target cell of interest. The sequences below correspond to SEQ ID NOs: 746, 747, and 748.

Figure 2020191243000411
Figure 2020191243000411

配列挿入は、細胞シグナルイベントを追跡するための第3のアプローチである。この戦略のいくつかのバリアントは変異導入または欠失よりもPEgRNA依存的でない。短い配列の挿入、プロトスペーサーの挿入、プロトスペーサーおよびバーコードの挿入、新規の相同性配列の挿入、ならびにバーコードを有する相同性配列の挿入の、いくつもの異なる挿入戦略が存在する。 Sequence insertion is a third approach to tracking cell signaling events. Some variants of this strategy are less PEGRNA-dependent than mutations or deletions. Several different insertion strategies exist: insertion of a short sequence, insertion of a protospacer, insertion of a protospacer and a barcode, insertion of a novel homologous sequence, and insertion of a homologous sequence with a barcode.

短い繰り返し配列の挿入は、細胞時間の経過を測定するために標的配列のサイズを漸増的に増大させるためのやり方である。このシステムでは、5ヌクレオチド以上の繰り返し配列の挿入が、時間の経過または予め決定された刺激の連続した存在どちらかに関して反復拡大を引き起こし得る。系統PEの座位アグノスティックな性質は、再度、別々の生物学的シグナルに関して複数の固有の配列伸長の並行的な追跡を可能化する。これは、個々の細胞において細胞時間に渡って複数の生物学的シグナルの強度の測定を可能化するはずである。下の配列は配列番号749、750、および751に対応する。 The insertion of short repeat sequences is a way to incrementally increase the size of a target sequence to measure cellular time. In this system, the insertion of repeat sequences of 5 or more nucleotides can cause repeat expansion over either time or the continued presence of a predetermined stimulus. The locus agnostic nature of lineage PE again allows for parallel tracking of multiple unique sequence expansions with respect to separate biological signals. This should allow for measurement of the intensity of multiple biological signals over cellular time in individual cells. The sequences below correspond to SEQ ID NOs: 749, 750, and 751.

Figure 2020191243000412
Figure 2020191243000412

異なる短い配列の挿入は、欠失空間に類似の様式でわずかのPEgRNAを要求するであろう。記録されようとするシグナルの数および挿入される配列のサイズは、必要とされるPEgRNAの組み合わせの数を決定するであろう。このシステムにおいて複数の配列を記録することの1つの課題は、そのカーゴ配列を挿入することにおける各PEgRNAの異なる効率であろう。 Insertion of different short sequences will require few PEgRNAs in a similar fashion to the deletion space. The number of signals to be recorded and the size of the sequences to be inserted will determine the number of PEgRNA combinations required. One challenge of recording multiple sequences in this system will be the differing efficiency of each PEgRNA in inserting its cargo sequence.

細胞シグナルの指標としてのプロトスペーサーの挿入は魅惑的であるが、技術的課題がこのアプローチの効率を侵害し得る。PEgRNAカセットはそれら自体が基質であり、順次の編集の効率および忠実性を毀損するPEgRNA上への挿入を引き起こすであろうから、単一PEgRNAシステムは用いることが難しいであろう。この同じ問題は2または3 PEgRNAシステムについても残存する。なぜなら、各ガイドは別のものの基質であり、ガイドカセットそれ自体への他の配列の挿入を可能化し、これは間違ったシグナルに関してプロトスペーサー配列の不適当な挿入に至り得るからである。これらのプロトスペーサー挿入システムはバーコード配列の包含について想像することもまた困難である。単一PEgRNAバーコードシステムは用いられるバーコードを単純に書き換え、第1の編集に貯蔵されたデータを除去するであろう。再度、複数ガイドシステムは他のPEgRNA発現構築物上への挿入を患い、その有用性を(特にインビボで)限定する。下の配列は配列番号752、752、753、754、754、755、および756に対応する。 Although the insertion of protospacers as indicators of cellular signals is attractive, technical challenges may compromise the efficiency of this approach. Single-PEgRNA systems would be difficult to use because the PEgRNA cassettes are substrates themselves, which would cause insertions onto the PEgRNA that would disrupt the efficiency and fidelity of subsequent edits. This same problem remains for two- or three-PEgRNA systems, because each guide is a substrate for another, allowing the insertion of other sequences into the guide cassette itself, which could lead to inappropriate insertion of the protospacer sequence for the wrong signal. These protospacer insertion systems are also difficult to envision for the inclusion of barcode sequences. A single-PEgRNA barcode system would simply rewrite the barcode used, removing the data stored in the first edit. Again, multiple-guide systems suffer from insertion onto other PEgRNA expression constructs, limiting their usefulness (especially in vivo). The sequences below correspond to SEQ ID NOs: 752, 752, 753, 754, 754, 755, and 756.

Figure 2020191243000413
Figure 2020191243000413

相同性配列(すなわち、Cas9ニックの位置付けの3'の配列)、特に関連するバーコードを有する相同性配列の挿入は、特に有用な系統PE戦略であるように見える。このシステムは、編集の順次のラウンドが、同じ細胞の他のPEgRNA編集イベントによっては改変され得ないPEgRNAカセットからのバーコードの挿入をもたらすということを保証することによって、プロトスペーサー挿入に関連するイシューを回避する。バーコード化システムは、複数のバーコードが所与の刺激に関連し得るので重宝である。このシステムは標的プロトスペーサーの多数を保全するが、シード配列、PAM、および下流の隣接ヌクレオチドを変改する。これは、用いられようとするPEgRNAの有意な再デザインなしに、複数のシグナルが1つの編集座位に接続されることを可能化する。この戦略は、多数の細胞性の刺激(内部または外部どちらかの)に応答して単一の座位において多重化されたバーコード挿入を可能化するであろう。それは、固有のバーコードが存在するだけ多くのシグナルの強度、持続時間、および順序の記録を可能化し得る(これらは4^Nの可能なバーコードを生成するように複数のNヌクレオチドによってデザインされ得る。すなわち、5ntバーコードは4^5または1024の固有のシグナルの一度での記録を可能化するであろう)。このシステムはin vitroおよびインビボ両方で用いられ得る。 Insertion of homologous sequences (i.e., sequences 3' to the position of the Cas9 nick), especially those with associated barcodes, appears to be a particularly useful lineage PE strategy. This system avoids issues associated with protospacer insertion by ensuring that successive rounds of editing result in the insertion of a barcode from the PEgRNA cassette that cannot be altered by other PEgRNA editing events in the same cell. Barcoding systems are useful because multiple barcodes can be associated with a given stimulus. This system preserves the majority of the target protospacer but alters the seed sequence, PAM, and downstream adjacent nucleotides. This allows multiple signals to be connected to one editing locus without significant redesign of the PEgRNA to be used. This strategy would allow multiple barcode insertions at a single locus in response to multiple cellular stimuli (either internal or external). It can allow recording of the intensity, duration, and order of as many signals as there are unique barcodes (these can be designed with multiple N nucleotides to generate 4^N possible barcodes, i.e. a 5nt barcode would allow recording of 4^5 or 1024 unique signals at once). This system can be used both in vitro and in vivo.

例13において引用された参考文献
以下の参考文献の各々は参照により本明細書に組み込まれる。
1.Recording development with single cell dynamic lineage tracing. Aaron McKenna,James A.Gagnon.
2.Whole-organism lineage tracing by combinatorial and cumulative genome editing.Mckenna et al.Science.2016 Jul 29;353(6298):aaf7907.doi10.1126/science.aaf7907. Epub 2016 May 26.
3.Molecular recording of mammalian embryogenesis.Chan et al.2019.Nature.Jun;570(7759):77-82.doi:10.1038/s41586-019-1184-5.Epub 2019 May 13.
References Cited in Example 13 Each of the following references is incorporated herein by reference.
1. Recording development with single cell dynamic lineage tracing. Aaron McKenna, James A. Gagnon.
2. Whole-organism lineage tracing by combinatorial and cumulative genome editing.Mckenna et al.Science.2016 Jul 29;353(6298):aaf7907.doi10.1126/science.aaf7907. Epub 2016 May 26.
3. Molecular recording of mammalian embryogenesis.Chan et al.2019.Nature.Jun;570(7759):77-82.doi:10.1038/s41586-019-1184-5.Epub 2019 May 13.

例14-PEによってバイオ分子活性および/または局在を調節する
バイオ分子の細胞下レベルの局在および修飾状態はそれらの活性を制御する。転写コントロール、細胞代謝、およびシグナル伝達カスケードのような特定の生物学的機能は、全て、細胞内の具体的な位置付けにおいて丁寧にオーケストレーションされている。そのため、タンパク質の細胞局在および修飾状態を調節することは、疾患の処置のための可能性ある治療学的戦略を表す。標的タンパク質の局在を変改するためのいくつかの存在する治療学が開発されている。例えば、ファルネシル化阻害剤は、KRASのような重要な発がんタンパク質の脂質修飾および膜標的化を防止するようにデザインされる。類似に、標的タンパク質の低分子によって誘導されるユビキチン化は、それらを分解のためのプロテアソームに導く。タンパク質をこれらのおよび他の固有の細胞区画に輸送する能力は、いくつもの生物学的プロセスを変改するための機会を提供する。治療学の目的で、遺伝子にコードされたシグナルによってバイオ分子(例えばタンパク質、脂質、糖、および核酸)の修飾状態および細胞下レベルの輸送を変改するための遺伝子にコードされたハンドルを組み入れるために、プライム編集(PE)を用いることが本願において提案される。
Example 14 - Regulating Biomolecule Activity and/or Localization by PE The subcellular localization and modification state of biomolecules controls their activity. Certain biological functions such as transcriptional control, cellular metabolism, and signaling cascades are all carefully orchestrated in specific locations within the cell. Therefore, modulating the cellular localization and modification state of proteins represents a potential therapeutic strategy for the treatment of diseases. Several existing therapeutics have been developed to alter the localization of target proteins. For example, farnesylation inhibitors are designed to prevent lipid modification and membrane targeting of important oncogenic proteins such as KRAS. Similarly, small molecule-induced ubiquitination of target proteins directs them to the proteasome for degradation. The ability to transport proteins to these and other specific cellular compartments provides an opportunity to alter a number of biological processes. For therapeutic purposes, it is proposed in this application to use prime editing (PE) to incorporate genetically encoded handles to alter the modification state and subcellular trafficking of biomolecules (e.g., proteins, lipids, sugars, and nucleic acids) by genetically encoded signals.

PEは、Cas9酵素によって標的化可能ないずれかのゲノム座位上への短いDNA配列の組み入れ、欠失、または置き換えを可能化するゲノム編集テクノロジーである。このテクノロジーを用いて、原理的には、これらの重要なバイオ分子の活性を変化させる重要なDNA、RNA、またはタンパク質コード配列を組み入れまたは除去し得る。より具体的には、プライム編集は、バイオ分子の局在または修飾特性を変化させるモチーフまたはシグナルを組み入れるために用いられ得る。いくつかの例は:タンパク質アミノ酸配列;翻訳後修飾のモチーフ;フォールディングまたは局在を変化させるRNAモチーフ;および周囲のDNAの局所的クロマチン状態またはアーキテクチャを変化させるDNA配列の組み入れの改変を包含する。 PE is a genome editing technology that allows for the incorporation, deletion, or replacement of short DNA sequences on any genomic locus that can be targeted by the Cas9 enzyme. Using this technology, in principle, one can incorporate or remove important DNA, RNA, or protein coding sequences that alter the activity of these important biomolecules. More specifically, prime editing can be used to incorporate motifs or signals that change the localization or modification properties of biomolecules. Some examples include: alterations of protein amino acid sequences; motifs of post-translational modifications; RNA motifs that change folding or localization; and the incorporation of DNA sequences that change the local chromatin state or architecture of the surrounding DNA.

PEによって媒介される改変の1つの標的バイオ分子はDNAである。標的座位のアクセス可能性を変化させるいくつものDNA配列を組み入れるためのDNAの改変がなされ得る。クロマチンアクセス可能性は遺伝子転写アウトプットをコントロールする。クロマチンコンパクト化酵素を動員するためのマークの組み入れは、隣り合う遺伝子の転写アウトプットを減少させるはずであるが、クロマチン開放に関連する配列の組み入れは、領域をよりアクセス可能にし、翻って転写を増大させるはずである。ネイティブな制御配列を真似たより複雑な配列モチーフの組み入れは、現行で利用可能なdCas9融合体よりも微妙なかつ生物学的に敏感なコントロールを異なるエピジェネティックなリーダー、ライター、またはイレーサー酵素に提供するはずである。典型的には、具体的な生物学的祖先を有さずにあり得る多数の単一型のマークを組み入れるツールである。3Dゲノムアーキテクチャの急成長分野において実証されているとおり、2つの座位を近接する近位に持って来るかまたは座位を核膜との接触に持って来るであろう配列の組み入れもまた、それらの座位の転写アウトプットを変改するはずである。 One target biomolecule for PE-mediated modifications is DNA. DNA can be modified to incorporate any number of DNA sequences that alter the accessibility of the target locus. Chromatin accessibility controls gene transcription output. Incorporation of a mark to recruit chromatin compaction enzymes should decrease the transcription output of neighboring genes, while incorporation of sequences associated with chromatin opening should make the region more accessible and in turn increase transcription. Incorporation of more complex sequence motifs that mimic native regulatory sequences should provide more subtle and biologically sensitive control over different epigenetic reader, writer, or eraser enzymes than currently available dCas9 fusions. Typically, it is a tool that incorporates a large number of possible monotypic marks without a specific biological ancestry. Incorporation of sequences that would bring two loci into close proximity or bring loci into contact with the nuclear membrane should also alter the transcription output of those loci, as demonstrated in the burgeoning field of 3D genome architecture.

それらの細胞局在、相互作用パートナー、構造ダイナミクス、またはフォールディングの熱力学を変化させることによってそれらの活性を変改するためのRNAの改変もまたなされ得る。翻訳中断またはフレームシフトを引き起こすであろうモチーフの組み入れは、種々のmRNAプロセシング機序によってmRNA種の存在量を変化させ得る。コンセンサススプライス配列を改変することもまた、異なるRNA種の存在量および保有率を変改するであろう。異なるスプライスアイソフォームの相対比を変化させることは、予測可能に、タンパク質翻訳産物の比の変化に至るであろう。これは多くの生物学的経路を変改するために用いられ得る。例えば、ミトコンドリア対核のDNA修復タンパク質のバランスをシフトさせることは、化学療法試薬に対する異なるがんのレジリエンスを変改するであろう。さらにその上、RNAは、新規のタンパク質標的への結合を可能化する配列によって修飾され得る。高い親和性で細胞タンパク質に結合するいくつものRNAアプタマーが開発されている。これらのアプタマーの1つの組み入れは、それらの翻訳、生物活性を防止するであろうタンパク質標的への結合によって異なるRNA種を隔離するために、またはRNA種を特定の細胞下レベル区画に持って来るためにどちらかで用いられ得る。バイオ分子分解は局在改変の別のクラスである。例えば、細胞内のRNAを制御するためのRNAメチル化が用いられる。メチル化のコンセンサスモチーフがPEによって標的RNAコード配列上に導入され得る。RNAは、ナンセンスによって媒介される崩壊機構または標的RNA種を分解するための他の核酸代謝経路を導く配列を包含するようにもまた改変され得、細胞内のRNAのプールを変化させるであろう。加えて、RNA種はそれらの凝集状態を変改するように改変され得る。RNAの絡まりを生成するための配列が目当ての単一のRNAまたは複数のRNA上に組み入れされ得、これはそれらを翻訳またはシグナルにとって無効な基質にするであろう。 Modifications of RNAs can also be made to alter their activity by changing their cellular localization, interaction partners, structural dynamics, or folding thermodynamics. Incorporation of motifs that would cause translational interruption or frameshifting could alter the abundance of mRNA species by various mRNA processing mechanisms. Modifying consensus splice sequences would also alter the abundance and prevalence of different RNA species. Changing the relative ratio of different splice isoforms would predictably lead to changes in the ratio of protein translation products. This can be used to alter many biological pathways. For example, shifting the balance of mitochondrial versus nuclear DNA repair proteins would alter the resilience of different cancers to chemotherapy agents. Furthermore, RNAs can be modified with sequences that allow binding to novel protein targets. A number of RNA aptamers have been developed that bind cellular proteins with high affinity. Incorporation of one of these aptamers can be used either to sequester different RNA species by binding to a protein target that would prevent their translation, biological activity, or to bring the RNA species to a specific subcellular compartment. Biomolecular degradation is another class of localized modification. For example, RNA methylation is used to control RNA in cells. A consensus motif for methylation can be introduced by PE onto the target RNA coding sequence. RNA can also be modified to include sequences that direct nonsense-mediated decay mechanisms or other nucleic acid metabolic pathways to degrade the target RNA species, which would change the pool of RNA in the cell. In addition, RNA species can be modified to alter their aggregation state. Sequences to generate RNA tangles can be incorporated onto the target RNA or RNAs, which would make them ineffective substrates for translation or signaling.

翻訳後修飾(PTM)によるタンパク質の修飾もまたPEによって実行され得るバイオ分子操作の重要なクラスを表す。RNA種のように、細胞内のタンパク質の存在量を変化させることは、PEの重要な能力である。オープンリーディングフレームに停止コドンを組み入れるための編集がされ得る。これは編集されたDNA配列から生ずる全長産物を消去するであろう。代替的には、タンパク質分解の速度が標的タンパク質について変改されることを引き起こすペプチドモチーフが組み入れられ得る。遺伝子本体上への分解タグの組み入れが、細胞内のタンパク質の存在量を変改するために用いられ得る。その上、低分子によって誘導されるデグロンの導入はタンパク質分解の時間的コントロールを可能化し得る。これは研究および治療学両方にとって重要な関連性を有し得る。なぜなら、研究者は所与の標的の低分子によって媒介される治療学的タンパク質分解が見込みある治療学的戦略であるかどうかを難なく評価し得るからである。タンパク質の細胞下レベル局在を変化させるためのタンパク質モチーフもまた組み入れられ得る。核、ミトコンドリア、細胞膜、ペルオキシソーム、リソソーム、プロテアソーム、エキソソーム、および他を包含するいくつもの細胞下レベル区画にタンパク質を選好的に輸送するためのアミノ酸モチーフが組み入れられ得る。 Modification of proteins by post-translational modifications (PTMs) also represents an important class of biomolecular manipulations that can be performed by PE. Like RNA species, altering the abundance of proteins in cells is an important capability of PE. Open reading frames can be edited to incorporate stop codons. This will eliminate the full-length product resulting from the edited DNA sequence. Alternatively, peptide motifs can be incorporated that cause the rate of protein degradation to be altered for the target protein. Incorporation of degradation tags onto the gene body can be used to alter the abundance of proteins in cells. Moreover, introduction of small molecule-induced degrons can allow for temporal control of protein degradation. This can have important implications for both research and therapeutics, since researchers can readily assess whether small molecule-mediated therapeutic protein degradation of a given target is a promising therapeutic strategy. Protein motifs can also be incorporated to change the subcellular localization of proteins. Amino acid motifs can be incorporated to preferentially target proteins to a number of subcellular compartments, including the nucleus, mitochondria, cell membrane, peroxisomes, lysosomes, proteasomes, exosomes, and others.

PTM機構によって修飾されるモチーフを組み入れまたは破壊することはタンパク質翻訳後修飾を変改し得る。リン酸化、ユビキチン化、グリコシル化、脂質修飾(例えばファルネシル化、ミリストイル化、パルミトイル化、プレニル化、GPIアンカー)、ヒドロキシル化、メチル化、アセチル化、クロトニル化、SUMO化、ジスルフィド結合形成、側鎖結合切断イベント、ポリペプチドバックボーン切断イベント(タンパク質分解)、およびいくつもの他のタンパク質PTMが同定されている。これらのPTMは、多くの場合には細胞下レベル局在を変化させることによってタンパク質機能を変化させる。実に、キナーゼは多くの場合にはリン酸化イベントによって下流のシグナルカスケードを活性化する。標的ホスホ部位の除去はシグナル伝達を防止するであろう。全長タンパク質発現を保持しながらいずれかのPTMモチーフを部位特異的に切除または組み入れる能力は、基礎研究および治療学両方にとって重要な進歩であろう。PEの配列組み入れ範囲および標的窓は、それを幅広いPTM改変空間に良く適するようにしている。 Incorporating or disrupting motifs modified by PTM mechanisms can alter protein post-translational modifications. Phosphorylation, ubiquitination, glycosylation, lipid modifications (e.g., farnesylation, myristoylation, palmitoylation, prenylation, GPI anchors), hydroxylation, methylation, acetylation, crotonylation, sumoylation, disulfide bond formation, side chain bond cleavage events, polypeptide backbone cleavage events (proteolysis), and several other protein PTMs have been identified. These PTMs alter protein function, often by altering subcellular localization. Indeed, kinases often activate downstream signaling cascades through phosphorylation events. Removal of the target phosphosite would prevent signal transduction. The ability to site-specifically excise or incorporate any PTM motif while retaining full-length protein expression would be an important advance for both basic research and therapeutics. PE's sequence incorporation range and targeting window make it well suited to the broad PTM modification space.

脂質修飾部位の除去は細胞膜へのタンパク質の輸送を防止するはずである。翻訳後修飾プロセスを標的化する現行の治療学における主要な限定はそれらの特異性である。ファルネシルトランスフェラーゼ阻害剤は細胞膜へのKRAS局在を消去するそれらの能力について鋭意に試験されている。残念ながら、ファルネシル化の全面的な阻害は数々のオフターゲット効果を伴い、これらはこれらの低分子の幅広い使用を防止している。類似に、低分子によるタンパク質キナーゼの特異的阻害は、ヒトゲノムの大きいサイズおよび種々のキナーゼ間の類似性を原因として非常に難しくあり得る。PEはこの特異性問題に可能性ある解決をオファーする。なぜなら、それは全面的な酵素阻害の代わりに修飾部位の切除による標的タンパク質の修飾の阻害を可能化するからである。例えば、KRAS上の脂質修飾ペプチドモチーフの除去は、ファルネシルトランスフェラーゼ阻害の代わりに用いられ得る標的化されたアプローチであろう。このアプローチは、膜結合するようにデザインされていないタンパク質上に脂質標的化モチーフを組み入れることによって標的タンパク質活性を阻害することの機能的な反対物である。 Removal of the lipid modification site should prevent transport of the protein to the cell membrane. A major limitation of current therapeutics targeting post-translational modification processes is their specificity. Farnesyltransferase inhibitors are being actively tested for their ability to eliminate KRAS localization to the cell membrane. Unfortunately, blanket inhibition of farnesylation is accompanied by numerous off-target effects that prevent the widespread use of these small molecules. Similarly, specific inhibition of protein kinases by small molecules can be very difficult due to the large size of the human genome and the similarity between various kinases. PE offers a potential solution to this specificity problem because it allows inhibition of target protein modification by excision of the modification site instead of blanket enzyme inhibition. For example, removal of the lipid modification peptide motif on KRAS would be a targeted approach that could be used instead of farnesyltransferase inhibition. This approach is the functional opposite of inhibiting target protein activity by incorporating lipid targeting motifs onto proteins that are not designed to be membrane bound.

PEはタンパク質-タンパク質複合体化イベントを取り調べるためにもまた用いられ得る。タンパク質は多くの場合には複合体内で機能してそれらの生物活性を遂行する。PEは、タンパク質がこれらの複合体内に存在する能力を生出するかまたは破壊するかどちらかのために用いられ得る。複合体形成イベントを消去するためには、タンパク質:タンパク質インターフェース上のアミノ酸置換または挿入が、複合体化を好まないように組み入れられ得る。SSX18は重要なヒストンリモデリング複合体のBAF複合体のタンパク質構成要素である。SSX18の変異は滑膜肉腫を駆動する。PEは、SSX18が複合体のそのタンパク質パートナーに結合することを防止する側鎖を組み入れしてその発がん活性を防止するために用いられ得る。PEは病原性の変異を除去してこのタンパク質のWT活性を復元するためにもまた用いられ得る。代替的には、PEは、タンパク質をそれらのネイティブな複合体中に保つために、またはそれらのネイティブな活性とは無関係である相互作用に関与するようにそれらを引っ張ってそれらの活性を阻害するためにどちらかで用いられ得る。別のものと比べて1つの相互作用状態を維持する複合体を形成することは、重要な治療学的モダリティーを表し得る。タンパク質:タンパク質インターフェースを変改して相互作用のKdを減少させることは、それらのタンパク質がより長く互いにくっついていることを保つであろう。疾患においては神経芽腫シグナルカスケードを駆動するが、さもなければ他の細胞では健康な転写コントロールに関与するn-mycのように、タンパク質複合体は複数のシグナル複合体を有し得る。PEは、健康な相互作用パートナーとのn-myc会合を駆動しかつ発がん相互作用パートナーに対するその親和性を減少させる変異を組み入れるために用いられ得る。 PE can also be used to interrogate protein-protein complexation events. Proteins often function in complexes to carry out their biological activities. PE can be used to either create or destroy the ability of proteins to reside in these complexes. To eliminate complexation events, amino acid substitutions or insertions on the protein:protein interface can be incorporated to disfavor complexation. SSX18 is a protein component of the BAF complex, an important histone remodeling complex. Mutations in SSX18 drive synovial sarcoma. PE can be used to incorporate side chains that prevent SSX18 from binding to its protein partners in the complex to prevent its oncogenic activity. PE can also be used to remove pathogenic mutations to restore WT activity of this protein. Alternatively, PE can be used either to keep proteins in their native complexes or to pull them to engage in interactions that are unrelated to their native activity to inhibit their activity. Forming complexes that maintain one interaction state relative to another may represent an important therapeutic modality. Altering protein:protein interfaces to decrease the Kd of an interaction will keep the proteins attached to each other longer. Protein complexes can have multiple signaling complexes, such as n-myc, which drives the neuroblastoma signaling cascade in disease but is otherwise involved in healthy transcriptional control in other cells. PE can be used to incorporate mutations that drive n-myc association with healthy interacting partners and decrease its affinity for oncogenic interacting partners.

例14において引用された参考文献
以下の参考文献の各々は参照により本明細書に組み込まれる。
1. Selective Target Protein Degradation via Phthalimide Conjugation.Winter et al.Science.Author manuscript;available in PMC 2016 Jul 8.
References Cited in Example 14 Each of the following references is incorporated herein by reference.
1. Selective Target Protein Degradation via Phthalimide Conjugation. Winter et al. Science. Author manuscript; available in PMC 2016 Jul 8.

2. Reversible disruption of mSWI/SNF(BAF)complexes by the SS18-SSX oncogenic fusion in synovial sarcoma.Kadoch and Crabtree.Cell.2013 Mar 28;153(1):71-85.doi:10.1016/j.cell.2013.02.036.
3. Ribosomal frameshifting and transcriptional slippage:From genetic steganography and cryptography to adventitious use.Atkins et al.Nucleic Acids Research,Volume 44,Issue 15,6 September 2016,Pages 7007-7078.
4. Transcriptional Regulation and its Misregulation in Disease.Lee and Young.Cell.Author manuscript;available in PMC 2014 Mar 14.
5. Protein localization in disease and therapy.Mien-Chie Hung,Wolfgang Link Journal of Cell Science 2011 124:3381-3392.
6. Loss of post-translational modification sites in disease.Li et al.Pac Symp Biocomput.2010:337-47.PTMD:A Database of Human Disease-associated Post-translational Modifications.Xu et al.Genomics Proteomics Bioinformatics.2018 Aug;16(4):244-251.Epub 2018 Sep 21.
7. Post-transcriptional gene regulation by mRNA modifications.Zhao et al.Nature Reviews Molecular Cell Biology volume18,pages31-42(2017).
2. Reversible disruption of mSWI/SNF(BAF) complexes by the SS18-SSX oncogenic fusion in synovial sarcoma.Kadoch and Crabtree.Cell.2013 Mar 28;153(1):71-85.doi:10.1016/j.cell.2013.02.036.
3. Ribosomal frameshifting and transcriptional slippage: From genetic steganography and cryptography to adventitious use. Atkins et al. Nucleic Acids Research, Volume 44, Issue 15, 6 September 2016, Pages 7007-7078.
4. Transcriptional Regulation and its Misregulation in Disease. Lee and Young. Cell. Author manuscript; available in PMC 2014 Mar 14.
5. Protein localization in disease and therapy.Mien-Chie Hung,Wolfgang Link Journal of Cell Science 2011 124:3381-3392.
6. Loss of post-translational modification sites in disease.Li et al.Pac Symp Biocomput.2010:337-47.PTMD:A Database of Human Disease-associated Post-translational Modifications.Xu et al.Genomics Proteomics Bioinformatics.2018 Aug;16(4):244-251.Epub 2018 Sep 21.
7. Post-transcriptional gene regulation by mRNA modifications.Zhao et al.Nature Reviews Molecular Cell Biology volume 18, pages 31-42(2017).

例15-PEgRNASのデザインおよび改変
本明細書に記載されるのは、プライム編集(PE)効率を改善し得る一連のPEgRNAデザインおよびストラテジーである。
Example 15 - Design and modification of PEgRNAs Described herein are a series of PEgRNA designs and strategies that can improve prime editing (PE) efficiency.

プライム編集(PE)は、プライム編集因子ガイドRNA(PEgRNA)内にコードされた情報を使用して、標的にされた遺伝子座内の定義されたDNA配列を置き換え得、挿入し得、または除去し得るゲノム編集技術である。プライム編集因子(PE)は、逆転写酵素(RT)酵素と融合したヌクレアーゼ活性(Cas9)をもつ配列-プログラム型DNA結合タンパク質からなる。PEはPEgRNAと複合体を形成するが、前記複合体は、それらのスペーサー配列内に標的化特定DNA遺伝子座のための情報、ならびに標準のsgRNA骨格中へ備えられた改変伸長中に所望の編集を特定する情報を含有する。PE:PEgRNA複合体は、プログラムされた標的DNA遺伝子座に結合しニックを入れるが、これによってニックが入れられたDNA鎖の、PEgRNAの改変プライマー結合配列(PBS)とのハイブリダイゼーションが可能になる。次いで、逆転写酵素ドメインは、ニックが入れられたゲノムDNAをDNA重合のためのプライマーとして使用して、PEgRNAのRT鋳型部分内の編集コード情報をコピーする。これに続くDNA修復プロセスは、新しく合成された編集済DNA鎖をゲノム遺伝子座中へ組み込む。プライム編集の多用途性は、研究ツールおよび潜在的な治療薬として前途有望ではあるものの、効率および範囲における数種の限界が、編集に要される多段階プロセスに起因して存在する。例えば、PEgRNA内に形成される好ましくないRNA構造は、PEgRNAからゲノム遺伝子座へのDNA編集のコピーを阻害し得る。PE技術を改善する潜在的な1つのやり方は、不可欠なPEgRNA構成要素の再デザインおよび改変を介する。これらPEgRNAのデザインへの改善は、改善されたPE効率に必要とされそうであって、挿入されるより長い配列のゲノム中への組み入れを可能にさせそうである。 Prime editing (PE) is a genome editing technology that can replace, insert, or remove defined DNA sequences in targeted loci using information encoded in a prime editor guide RNA (PEgRNA). Prime editors (PE) consist of a sequence-programmed DNA binding protein with nuclease activity (Cas9) fused to a reverse transcriptase (RT) enzyme. PE forms a complex with PEgRNA, which contains information for the targeted specific DNA locus in their spacer sequence, as well as information that specifies the desired edit during a modified extension into a standard sgRNA backbone. The PE:PEgRNA complex binds to the programmed target DNA locus and nicks it, allowing hybridization of the nicked DNA strand with a modified primer binding sequence (PBS) of the PEgRNA. The reverse transcriptase domain then copies the editing code information in the RT template portion of the PEgRNA, using the nicked genomic DNA as a primer for DNA polymerization. The subsequent DNA repair process incorporates the newly synthesized edited DNA strand into the genomic locus. Although the versatility of prime editing holds promise as a research tool and potential therapeutic agent, several limitations in efficiency and scope exist due to the multi-step process required for editing. For example, unfavorable RNA structures formed within the PEgRNA may inhibit the copying of DNA edits from the PEgRNA to the genomic locus. One potential way to improve PE technology is through the redesign and modification of essential PEgRNA components. These improvements to the design of the PEgRNA are likely to be required for improved PE efficiency and allow for the incorporation of longer inserted sequences into the genome.

本明細書に記載されるのは、PEの有効性を改善するのを思い描いた一連のPEgRNAデザインである。これらのデザインは、sgRNAの有効性および/または安定性を改善するための、これまでに公開された数多のアプローチ利点を生かし、ならびに数多の新規ストラテジーを利用する。これらの改善点は、数多の種々のカテゴリーの1以上に属し得る: Described herein are a series of PE gRNA designs envisioned to improve PE efficacy. These designs take advantage of a number of previously published approaches to improve sgRNA efficacy and/or stability, as well as utilize a number of novel strategies. These improvements can fall into one or more of a number of different categories:

(1)より長いPEgRNA。このカテゴリーは、非ポリメラーゼIII(pol III)プロモーターからの機能的PEgRNAの効率的な発現を可能にさせる、改善されたデザイン(これによって厄介な配列要件もなく、より長いPEgRNAの発現が可能になるであろう)に関する; (1) Longer PEgRNAs. This category concerns improved designs that allow efficient expression of functional PEgRNAs from non-polymerase III (pol III) promoters, which would allow expression of longer PEgRNAs without cumbersome sequence requirements;

(2)コア改善。このカテゴリーはコアのCas9結合PEgRNA骨格の改善に関し、これは効力を改善し得る; (2) Core improvements. This category concerns improvements to the core Cas9-linked PEgRNA scaffold, which may improve efficacy;

(3)RT処理能力。このカテゴリーは、RT処理能力を改善するPEgRNAの改善に関し、標的ゲノム座位におけるより長い配列の挿入を可能化する;および (3) RT processivity. This category concerns improvements to PEgRNA that improve RT processivity, allowing the insertion of longer sequences at the target genomic locus; and

(4)末端モチーフ。このカテゴリーはPEgRNAの5'および/または3'末端へのRNAモチーフの追加に関し、これらはPEgRNA安定性を改善するか、RT処理能力を増強するか、PEgRNAのミスフォールディングを防止するか、またはゲノム編集にとって重要な追加の因子を動員する。 (4) Terminal motifs. This category involves the addition of RNA motifs to the 5' and/or 3' ends of the PEgRNA that improve PEgRNA stability, enhance RT processivity, prevent PEgRNA misfolding, or recruit additional factors important for genome editing.

本明細書に記載されるのは、各カテゴリーにおいて、数多の潜在的なかかるPEgRNAである。これらのデザインの数種は、Cas9をもつsgRNA活性を改善するためにこれまでにも記載されており、それ自体示されている。また本明細書に記載されるのには、PEgRNA骨格の洗練化(polishing)を可能にさせてPE活性(5)を増強させる、所定の配列標的のためのPEgRNAの進化のためのプラットホームもある。注目すべきことに、これらのデザインはまた、いずれのCas9またはその進化バリアントによって認識されるPEgRNAを改善するのにも容易に適用され得る。 Described herein are a number of potential such PEgRNAs in each category. Several of these designs have been previously described and shown to improve sgRNA activity with Cas9. Also described herein is a platform for the evolution of PEgRNAs for a given sequence target that allows for polishing of the PEgRNA scaffold to enhance PE activity (5). Notably, these designs can also be readily applied to improve the PEgRNAs recognized by any Cas9 or its evolutionary variants.

(1)より長いPEgRNA。 (1) Longer PEgRNA.

sgRNAは、典型的には、U6 snRNAプロモーターから発現される。このプロモーターは、pol IIIを動員して関連RNAを発現するものであって、核内に保持される短いRNAの発現に有用である。しかしながら、pol IIIは、処理能力がそれほど高くなく、効率的なゲノム編集に要されるレベルにて長さが数百ヌクレオチドより長いRNAを発現することができない183。加えて、pol IIIは、伸展したUにて失速または終止し、PEgRNAを使用して挿入され得る配列多様性を潜在的に限定し得る。ポリメラーゼII(pCMVなど)またはポリメラーゼI(U1 snRNAプロモーターなど)を動員する他のプロモーターも、それらのより長いsgRNAの発現能について調べられている183。しかしながら、これらのプロモーターは、典型的には、部分的に転写され、これによって、発現されたPEgRNA中スペーサーの5'に余分な配列がもたらされ、このことは部位依存的なやり方で著しく低減されたCas9:sgRNA活性をもたらすことが示されている。加えて、pol III転写のPEgRNAは、6~7つ伸びたUにおいて簡単に終止し得るのに対し、pol IIまたはpol Iから転写されたPEgRNAは、異なる終止シグナルを要するであろう。しばしば、かかるシグナルはまた、ポリアデニル化ももたらし、これによってPEgRNAの核からの望ましくない輸送がもたらされるであろう。同様に、pol IIプロモーター(pCMVなど)から発現されるRNAは、典型的には、5'にキャップされており、それらの核外輸送もまたもたらされる。 sgRNAs are typically expressed from the U6 snRNA promoter. This promoter recruits pol III to express the associated RNA and is useful for expressing short RNAs that are retained in the nucleus. However, pol III is not very processive and cannot express RNAs longer than a few hundred nucleotides in length at the levels required for efficient genome editing183. In addition, pol III may stall or terminate at the extended U , potentially limiting the sequence diversity that can be inserted using PEgRNA. Other promoters that recruit polymerase II (such as pCMV) or polymerase I (such as the U1 snRNA promoter) have also been investigated for their ability to express longer sgRNAs183 . However, these promoters are typically partially transcribed, which results in extra sequence 5' of the spacer in the expressed PEgRNA, which has been shown to result in significantly reduced Cas9:sgRNA activity in a site-dependent manner. In addition, pol III transcribed PEgRNAs can simply terminate at the stretch of 6-7 U's, whereas PEgRNAs transcribed from pol II or pol I will require different termination signals. Often such signals will also result in polyadenylation, which will result in the undesired export of the PEgRNA from the nucleus. Similarly, RNAs expressed from pol II promoters (such as pCMV) are typically 5' capped, which will also result in their export from the nucleus.

これまでに、Rinnおよび共同研究者らは、長鎖非コーディングRNA(lncRNA)でタグ付けされたsgRNAの産生のための様々な発現プラットホームをスクリーニングした183。これらのプラットホームは、pCMVから発現され、ヒトのMALAT1 ncRNAからのENE要素184、KSHVからのPAN ENE要素185、またはU1 snRNAからの3'ボックス186において終止するRNAを包含する。注目すべきことに、MALAT1 ncRNAおよびPAN ENEは、ポリAテールを保護する三重ヘリックスを形成する184,187。これらの構築物はまた、RNAの発現を可能にさせることに加え、RNA安定性をも増強し得ることが予想される(セクションivを参照)。U1 snRNAからのプロモーターを使用すると、これらのより長いsgRNAの発現が可能になることもまた183、探索した。これらの発現系はまた、より長いPEgRNAの発現も可能にさせるであろうことが予想される。加えて、一連の方法は、PEgRNAの一部として転写されるであろうpol IIプロモーターの部分の切断のためにデザインされており、自己切断型リボザイム(ハンマーヘッド188、ピストル189、ハチェット189、ヘアピン190、VS191、ツイスター192、もしくはツイスターシスター192リボザイムなど)、または転写されたガイドを処理する他の自己切断型要素、またはCsy4によって認識されまたガイドのプロセシングへも繋がるヘアピン193のいずれかが付加されている。また、複数のENEモチーフの組み込みは、これまでKSHV PAN RNAおよび要素について実証されたとおり185、改善されたPEgRNA発現および安定性へ繋がり得ることも仮定される。PEgRNAを環状イントロンRNA(ciRNA)の形態に環化することはまた、増強されたRNAの発現および安定性、ならびに核局在化へも繋がり得ることもまた、予想される194 Previously, Rinn and coworkers screened various expression platforms for the production of sgRNAs tagged with long non-coding RNAs (lncRNAs). These platforms include RNAs expressed from pCMV and terminating in an ENE element from human MALAT1 ncRNA, a PAN ENE element from KSHV, or a 3 ' box from U1 snRNA. Notably, MALAT1 ncRNA and PAN ENE form a triple helix that protects the polyA tail. These constructs are also expected to enhance RNA stability in addition to allowing expression of RNA (see section iv). Using a promoter from U1 snRNA was also explored to allow expression of these longer sgRNAs. It is expected that these expression systems will also allow expression of longer PEgRNAs. In addition, a series of methods have been designed to cleave the portion of the pol II promoter that will be transcribed as part of the PEgRNA, and either self-cleaving ribozymes (such as hammerhead188 , pistol189 , hatchet189 , hairpin190 , VS191 , twister192 , or twister sister192 ribozymes) or other self-cleaving elements that process the transcribed guide, or hairpins193 that are recognized by Csy4 and also lead to processing of the guide. It is also hypothesized that the incorporation of multiple ENE motifs may lead to improved PEgRNA expression and stability, as previously demonstrated for KSHV PAN RNA and elements185 . It is also predicted that circularizing the PEgRNA into the form of a circular intronic RNA (ciRNA) may also lead to enhanced RNA expression and stability, as well as nuclear localization194.

pCMV、Csy4ヘアピン、PEgRNA、およびMALAT1 ENEからなるPEgRNA発現プラットホーム
TAGTTATTAATAGTAATCAATTACGGGGTCATTAGTTCATAGCCCATATATGGAGTTCCGCGTTACATAACTTACGGTAAATGGCCCGCCTGGCTGACCGCCCAACGACCCCCGCCCATTGACGTCAATAATGACGTATGTTCCCATAGTAACGCCAATAGGGACTTTCCATTGACGTCAATGGGTGGAGTATTTACGGTAAACTGCCCACTTGGCAGTACATCAAGTGTATCATATGCCAAGTACGCCCCCTATTGACGTCAATGACGGTAAATGGCCCGCCTGGCATTATGCCCAGTACATGACCTTATGGGACTTTCCTACTTGGCAGTACATCTACGTATTAGTCATCGCTATTACCATGGTGATGCGGTTTTGGCAGTACATCAATGGGCGTGGATAGCGGTTTGACTCACGGGGATTTCCAAGTCTCCACCCCATTGACGTCAATGGGAGTTTGTTTTGGCACCAAAATCAACGGGACTTTCCAAAATGTCGTAACAACTCCGCCCCATTGACGCAAATGGGCGGTAGGCGTGTACGGTGGGAGGTCTATATAAGCAGAGCTGGTTTAGTGAACCGTCAGATCGTTCACTGCCGTATAGGCAGGGCCCAGACTGAGCACGTGAGTTTTAGAGCTAGAAATAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGGACCGAGTCGGTCCTCTGCCATCAAAGCGTGCTCAGTCTGTTTTAGGGTCATGAAGGTTTTTCTTTTCCTGAGAAAACAACACGTATTGTTTTCTCAGGTTTTGCTTTTTGGCCTTTTTCTAGCTTAAAAAAAAAAAAAGCAAAAGATGCTGGTGGTTGGCACTCCTGGTTTCCAGGACGGGGTTCAAATCCCTGCGGCGTCTTTGCTTTGACT(配列番号757)
PEgRNA expression platform consisting of pCMV, Csy4 hairpin, PEgRNA, and MALAT1 ENE
(SEQ ID NO:757)

pCMV、Csy4ヘアピン、PEgRNA、およびPAN ENEからなるPEgRNA発現プラットホーム
TAGTTATTAATAGTAATCAATTACGGGGTCATTAGTTCATAGCCCATATATGGAGTTCCGCGTTACATAACTTACGGTAAATGGCCCGCCTGGCTGACCGCCCAACGACCCCCGCCCATTGACGTCAATAATGACGTATGTTCCCATAGTAACGCCAATAGGGACTTTCCATTGACGTCAATGGGTGGAGTATTTACGGTAAACTGCCCACTTGGCAGTACATCAAGTGTATCATATGCCAAGTACGCCCCCTATTGACGTCAATGACGGTAAATGGCCCGCCTGGCATTATGCCCAGTACATGACCTTATGGGACTTTCCTACTTGGCAGTACATCTACGTATTAGTCATCGCTATTACCATGGTGATGCGGTTTTGGCAGTACATCAATGGGCGTGGATAGCGGTTTGACTCACGGGGATTTCCAAGTCTCCACCCCATTGACGTCAATGGGAGTTTGTTTTGGCACCAAAATCAACGGGACTTTCCAAAATGTCGTAACAACTCCGCCCCATTGACGCAAATGGGCGGTAGGCGTGTACGGTGGGAGGTCTATATAAGCAGAGCTGGTTTAGTGAACCGTCAGATCGTTCACTGCCGTATAGGCAGGGCCCAGACTGAGCACGTGAGTTTTAGAGCTAGAAATAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGGACCGAGTCGGTCCTCTGCCATCAAAGCGTGCTCAGTCTGTTTTGTTTTGGCTGGGTTTTTCCTTGTTCGCACCGGACACCTCCAGTGACCAGACGGCAAGGTTTTTATCCCAGTGTATATTGGAAAAACATGTTATACTTTTGACAATTTAACGTGCCTAGAGCTCAAATTAAACTAATACCATAACGTAATGCAACTTACAACATAAATAAAGGTCAATGTTTAATCCATAAAAAAAAAAAAAAAAAAA(配列番号758)
PEgRNA expression platform consisting of pCMV, Csy4 hairpin, PEgRNA, and PAN ENE
(SEQ ID NO:758)

pCMV、Csy4ヘアピン、PEgRNA、および3×PAN ENEからなるPEgRNA発現プラットホーム
TAGTTATTAATAGTAATCAATTACGGGGTCATTAGTTCATAGCCCATATATGGAGTTCCGCGTTACATAACTTACGGTAAATGGCCCGCCTGGCTGACCGCCCAACGACCCCCGCCCATTGACGTCAATAATGACGTATGTTCCCATAGTAACGCCAATAGGGACTTTCCATTGACGTCAATGGGTGGAGTATTTACGGTAAACTGCCCACTTGGCAGTACATCAAGTGTATCATATGCCAAGTACGCCCCCTATTGACGTCAATGACGGTAAATGGCCCGCCTGGCATTATGCCCAGTACATGACCTTATGGGACTTTCCTACTTGGCAGTACATCTACGTATTAGTCATCGCTATTACCATGGTGATGCGGTTTTGGCAGTACATCAATGGGCGTGGATAGCGGTTTGACTCACGGGGATTTCCAAGTCTCCACCCCATTGACGTCAATGGGAGTTTGTTTTGGCACCAAAATCAACGGGACTTTCCAAAATGTCGTAACAACTCCGCCCCATTGACGCAAATGGGCGGTAGGCGTGTACGGTGGGAGGTCTATATAAGCAGAGCTGGTTTAGTGAACCGTCAGATCGTTCACTGCCGTATAGGCAGGGCCCAGACTGAGCACGTGAGTTTTAGAGCTAGAAATAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGGACCGAGTCGGTCCTCTGCCATCAAAGCGTGCTCAGTCTGTTTTGTTTTGGCTGGGTTTTTCCTTGTTCGCACCGGACACCTCCAGTGACCAGACGGCAAGGTTTTTATCCCAGTGTATATTGGAAAAACATGTTATACTTTTGACAATTTAACGTGCCTAGAGCTCAAATTAAACTAATACCATAACGTAATGCAACTTACAACATAAATAAAGGTCAATGTTTAATCCATAAAAAAAAAAAAAAAAAAAACACACTGTTTTGGCTGGGTTTTTCCTTGTTCGCACCGGACACCTCCAGTGACCAGACGGCAAGGTTTTTATCCCAGTGTATATTGGAAAAACATGTTATACTTTTGACAATTTAACGTGCCTAGAGCTCAAATTAAACTAATACCATAACGTAATGCAACTTACAACATAAATAAAGGTCAATGTTTAATCCATAAAAAAAAAAAAAAAAAAATCTCTCTGTTTTGGCTGGGTTTTTCCTTGTTCGCACCGGACACCTCCAGTGACCAGACGGCAAGGTTTTTATCCCAGTGTATATTGGAAAAACATGTTATACTTTTGACAATTTAACGTGCCTAGAGCTCAAATTAAACTAATACCATAACGTAATGCAACTTACAACATAAATAAAGGTCAATGTTTAATCCATAAAAAAAAAAAAAAAAAAA(配列番号759)
PEgRNA expression platform consisting of pCMV, Csy4 hairpin, PEgRNA, and 3×PAN ENE
(SEQ ID NO:759)

pCMV、Csy4ヘアピン、PEgRNA、および3'ボックスからなるPEgRNA発現プラットホーム
TAGTTATTAATAGTAATCAATTACGGGGTCATTAGTTCATAGCCCATATATGGAGTTCCGCGTTACATAACTTACGGTAAATGGCCCGCCTGGCTGACCGCCCAACGACCCCCGCCCATTGACGTCAATAATGACGTATGTTCCCATAGTAACGCCAATAGGGACTTTCCATTGACGTCAATGGGTGGAGTATTTACGGTAAACTGCCCACTTGGCAGTACATCAAGTGTATCATATGCCAAGTACGCCCCCTATTGACGTCAATGACGGTAAATGGCCCGCCTGGCATTATGCCCAGTACATGACCTTATGGGACTTTCCTACTTGGCAGTACATCTACGTATTAGTCATCGCTATTACCATGGTGATGCGGTTTTGGCAGTACATCAATGGGCGTGGATAGCGGTTTGACTCACGGGGATTTCCAAGTCTCCACCCCATTGACGTCAATGGGAGTTTGTTTTGGCACCAAAATCAACGGGACTTTCCAAAATGTCGTAACAACTCCGCCCCATTGACGCAAATGGGCGGTAGGCGTGTACGGTGGGAGGTCTATATAAGCAGAGCTGGTTTAGTGAACCGTCAGATCGTTCACTGCCGTATAGGCAGGGCCCAGACTGAGCACGTGAGTTTTAGAGCTAGAAATAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGGACCGAGTCGGTCCTCTGCCATCAAAGCGTGCTCAGTCTGTTTGTTTCAAAAGTAGACTGTACGCTAAGGGTCATATCTTTTTTTGTTTGGTTTGTGTCTTGGTTGGCGTCTTAAA(配列番号760)
PEgRNA expression platform consisting of pCMV, Csy4 hairpin, PEgRNA, and 3' box
(SEQ ID NO:760)

pU1、Csy4ヘアピン、PEgRNA、および3'ボックスからなるPEgRNA発現プラットホーム
CTAAGGACCAGCTTCTTTGGGAGAGAACAGACGCAGGGGCGGGAGGGAAAAAGGGAGAGGCAGACGTCACTTCCCCTTGGCGGCTCTGGCAGCAGATTGGTCGGTTGAGTGGCAGAAAGGCAGACGGGGACTGGGCAAGGCACTGTCGGTGACATCACGGACAGGGCGACTTCTATGTAGATGAGGCAGCGCAGAGGCTGCTGCTTCGCCACTTGCTGCTTCACCACGAAGGAGTTCCCGTGCCCTGGGAGCGGGTTCAGGACCGCTGATCGGAAGTGAGAATCCCAGCTGTGTGTCAGGGCTGGAAAGGGCTCGGGAGTGCGCGGGGCAAGTGACCGTGTGTGTAAAGAGTGAGGCGTATGAGGCTGTGTCGGGGCAGAGGCCCAAGATCTCAGTTCACTGCCGTATAGGCAGGGCCCAGACTGAGCACGTGAGTTTTAGAGCTAGAAATAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGGACCGAGTCGGTCCTCTGCCATCAAAGCGTGCTCAGTCTGTTTCAGCAAGTTCAGAGAAATCTGAACTTGCTGGATTTTTGGAGCAGGGAGATGGAATAGGAGCTTGCTCCGTCCACTCCACGCATCGACCTGGTATTGCAGTACCTCCAGGAACGGTGCACCCACTTTCTGGAGTTTCAAAAGTAGACTGTACGCTAAGGGTCATATCTTTTTTTGTTTGGTTTGTGTCTTGGTTGGCGTCTTAAA(配列番号761)
PEgRNA expression platform consisting of pU1, Csy4 hairpin, PEgRNA, and 3' box
(SEQ ID NO:761)

(2)コアの改善。 (2) Core improvements.

コア、Cas9結合PEgRNA骨格はおそらく、PE活性を増強するのにも改善され得る。数種のかかるアプローチは既に実証されている。実例として、骨格の第1の対形成要素(P1)は、GTTTT-AAAAC(配列番号3939)対形成要素を含有する。かかるT(複数)の伸びは、RNA転写産物のpol III休止(pausing)および未成熟終止をもたらすことが示されている。このP1の部分におけるT-A対の1つの、G-C対への合理的な突然変異は、sgRNA活性を増強するのが示されたが、このアプローチもまたPEgRNAに対して実現可能であろうことを示唆する195。加えて、P1の長さを増大することはまた、sgRNAの折り畳みを増強して改善された活性へ繋がることも示されたが195、これはPEgRNA活性の改善のための別の道として示唆される。最終的に、所定DNA標的上のPEgRNAの指向進化を通じたPEgRNA骨格の洗練化がまた、改善された活性ももたらす可能性がある。これはセクション(v)に記載される。 The core, Cas9-bound PEgRNA backbone could conceivably also be improved to enhance PE activity. Several such approaches have already been demonstrated. As an illustration, the first pairing element (P1) of the backbone contains a GTTTT-AAAAC (SEQ ID NO: 3939) pairing element. Such a stretch of T's has been shown to result in pol III pausing and premature termination of the RNA transcript. Rational mutation of one of the TA pairs in this portion of P1 to a GC pair has been shown to enhance sgRNA activity, suggesting that this approach may also be feasible for PEgRNA195 . In addition, increasing the length of P1 has also been shown to enhance sgRNA folding leading to improved activity195 , suggesting this as another avenue for improving PEgRNA activity. Finally, refinement of the PEgRNA backbone through directed evolution of PEgRNA on a given DNA target may also result in improved activity. This is described in section (v).

P1まで6ntの伸長を含有するPEgRNA
GGCCCAGACTGAGCACGTGAGTTTTAGAGCTAGCTCATGAAAATGAGCTAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGGACCGAGTCGGTCCTCTGCCATCAAAGCGTGCTCAGTCTGTTTTTTT(配列番号228)
PEgRNA containing a 6 nt extension to P1
GGCCCAGACTGAGCACGTGAGTTTTAGAGCTAGCTCATGAAAATGAGCTAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGGACCGAGTCGGTCCTCTGCCATCAAAGCGTGCTCAGTCTGTTTTTTT (SEQ ID NO: 228)

P1内にT-A→G-C突然変異を含有するPEgRNA
GGCCCAGACTGAGCACGTGAGTTTGAGAGCTAGAAATAGCAAGTTTAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGGACCGAGTCGGTCCTCTGCCATCAAAGCGTGCTCAGTCTGTTTTTTT(配列番号229)
PEgRNA containing a TA→GC mutation in P1
GGCCCAGACTGAGCACGTGAGTTTGAGAGCTAGAAATAGCAAGTTTAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGGACCGAGTCGGTCCTCTGCCATCAAAGCGTGCTCAGTCTGTTTTTTT (SEQ ID NO: 229)

(iii)PEgRNAの鋳型領域への修飾を介したRT処理能力の改善 (iii) Improved RT processivity through modification of the template region of PEGRNA

PEgRNAによって鋳型にされた(templated)挿入のサイズが増大するにつれて、エンドヌクレアーゼによって分解されるか、自発的加水分解を経るか、または折り畳まれることで2次構造(RTによって逆転写され得ないか、もしくはPEgRNA骨格の折り畳みおよびこれに続くCas9-RT結合を妨害する)になるか、になる可能性が高い。結果的に、PEgRNAの鋳型への修飾が、遺伝子全体の挿入などの大きな挿入に影響を及ぼす必要もあり得る。そうするためのいくつかのストラテジーは、合成または半合成PEgRNA内の修飾ヌクレオチドの組み込み(RNAを、分解もしくは加水分解に対してより耐性があるようにさせるか、または阻害性の2次構造を採用する可能性を低くさせる)を包含する196。かかる修飾は、Gリッチ配列中のRNA2次構造を低減するであろう、8-アザ-7-デアザグアノシン;分解を低減してある種のRNA2次構造を増強する、ロックド核酸(LNA);RNA安定性を増強する、2'-O-メチル修飾、2'-フルオロ修飾、または2'-O-メトキシエトキシ修飾を包含し得る。かかる修飾はまた、安定性および活性を増強するために、PEgRNA中の他のどこかにも包含され得る。代わりに、または加えて、PEgRNAの鋳型は、所望のタンパク質産物をコードするのとともに、RTによって折り畳まれ得ない単純な2次構造を採用する可能性もまた高くなるように、デザインされ得る。かかる単純な構造は、熱力学的な流し台(sink)として作用するであろうが、これによって逆転写を防止するであろうより複雑な構造が生じる可能性が低くなる。最終的に、鋳型を分裂させて2つ別々のPEgRNAにすることもまたあり得ることである。かかるデザインにおいて、PEは、Cas9と融合したRNA結合タンパク質またはPEgRNA自身上のRNA認識要素(MS2アプタマーなど)を介して、転写を開始すること、また別々の鋳型RNAを標的にされた部位へ動員することにも使用されるであろう。RTは、この別々の鋳型RNAへ直接結合するか、または第2鋳型と入れ替える前に元のPEgRNA上で逆転写を開始するか、のいずれかであり得る。かかるアプローチは、長い鋳型を付加した際にPEgRNAの誤った折り畳みを予防することのみならず、長い挿入を生じさせるのにゲノムからのCas9の解離(おそらくPEベースの長い挿入を阻害している可能性がある)を要さないことによってもまた、長い挿入を可能にさせ得る。 As the size of the PEgRNA-templated insertion increases, it is likely to be degraded by endonucleases, undergo spontaneous hydrolysis, or fold into secondary structures that cannot be reverse transcribed by RT or that interfere with the folding of the PEgRNA backbone and subsequent Cas9-RT binding. Consequently, modifications to the PEgRNA template may be necessary to affect large insertions, such as the insertion of entire genes. Some strategies to do so include the incorporation of modified nucleotides within synthetic or semi-synthetic PEgRNAs, which render the RNA more resistant to degradation or hydrolysis or less likely to adopt inhibitory secondary structures. 196 Such modifications may include 8-aza-7-deazaguanosine, which will reduce RNA secondary structure in G-rich sequences; locked nucleic acids (LNAs), which reduce degradation and enhance certain RNA secondary structures; 2'-O-methyl, 2'-fluoro, or 2'-O-methoxyethoxy modifications, which enhance RNA stability. Such modifications can also be included elsewhere in the PEgRNA to enhance stability and activity. Alternatively or in addition, the template of the PEgRNA can be designed to encode the desired protein product while also being more likely to adopt a simple secondary structure that cannot be folded by RT. Such a simple structure would act as a thermodynamic sink, making it less likely that a more complex structure would arise that would prevent reverse transcription. Finally, the template could also be split into two separate PEgRNAs. In such a design, PE would be used to initiate transcription and also recruit separate template RNAs to the targeted site, via an RNA-binding protein fused to Cas9 or an RNA recognition element on the PEgRNA itself (such as the MS2 aptamer). RT could either directly bind to this separate template RNA or initiate reverse transcription on the original PEgRNA before replacing the second template. Such an approach may allow for long insertions not only by preventing misfolding of the PEgRNA upon addition of long templates, but also by not requiring dissociation of Cas9 from the genome to generate long insertions, which may potentially inhibit PE-based long insertions.

(iv)追加のRNAモチーフの5'末端または3'末端での組み入れ (iv) Incorporation of additional RNA motifs at the 5' or 3' end

PEgRNAデザインはまた、追加のモチーフの、RNAの末端のいずれかの末での組み入れを介しても改善され得る。数種のかかるモチーフ-KSHVからのPAN ENEおよびMALAT1からのENEなどを、非pol IIIプロモーターからのより長いPEgRNAの発現を終止させ得る手段として、前にパート(i)において考察した184,185。これらの要素は、ポリAテールを飲み込むRNA三重ヘリックスを形成し、それらの核内への保持をもたらす184,187。しかしながら、末端ヌクレオチドを塞ぐ複合体構造をPEgRNAの3'末端にて形成することによって、これらの構造はまた、PEgRNAのエキソヌクレアーゼ媒介分解を予防するのにも役立つ可能性があろう。3'末端にて挿入された他の構造要素もまた、非pol IIIプロモーターからの終止を可能にさせることはせずとも、RNA安定性を増強し得る。かかるモチーフは、3'末端を塞ぐであろうヘアピンもしくはRNA四重鎖197、または3'末端にて2'-3'-環状ホスファートの形成をもたらし、また潜在的にPEgRNAをエキソヌクレアーゼによって分解される可能性を低くもさせるHDVなどの自己切断型リボザイム198を包含し得る。不完全なスプライシングを介してPEgRNAを環化するのに誘導する-ciRNAを形成する-ことはまた、PEgRNA安定性を増大させてPEgRNAが核内に保持されることももたらし得る194 PEgRNA design can also be improved through the incorporation of additional motifs at either end of the RNA. Several such motifs - such as the PAN ENE from KSHV and the ENE from MALAT1 - were previously discussed in part (i) as a means by which longer PEgRNAs can be terminated from non-pol III promoters184,185. These elements form RNA triple helices that engulf the polyA tail, leading to their retention in the nucleus184,187 . However, by forming a complex structure at the 3' end of the PEgRNA that occludes the terminal nucleotides, these structures could also help prevent exonuclease-mediated degradation of the PEgRNA. Other structural elements inserted at the 3' end may also enhance RNA stability without allowing termination from non-pol III promoters. Such motifs could include hairpins or RNA quadruplexes that would occlude the 3' end, 197 or self-cleaving ribozymes such as HDV that result in the formation of a 2'- 3' -cyclic phosphate at the 3' end and potentially also render the PEgRNA less susceptible to exonuclease degradation.198 Inducing circularization of the PEgRNA through incomplete splicing - forming a ciRNA - could also increase PEgRNA stability resulting in PEgRNA being retained in the nucleus.194

追加のRNAモチーフはまた、RT処理能力をも改善し得るか、またはDNA-RNA二重鎖へのRTの結合を増強することによってPEgRNA活性をも増強し得る。RTによって結合されるネイティブ配列の、その同族のレトロウイルスゲノム中での付加は、RT活性を増強し得る199。これは、レトロウイルスゲノム二量体化および転写開始に関与する、ネイティブプライマー結合部位(PBS)、ポリプリントラクト(PPT)、またはキッシングループを包含し得る199。二量体化チーフ-キッシングループまたはGNRAテトラループ/テトラループ受容体対200など-の、PEgRNAの5'末端および3'末端での付加はまた、PEgRNAの有効な環状化をももたらし得、安定性が改善される。加えて、これらモチーフの付加は、PEgRNAスペーサーとプライマーとの物理的な分離、PE活性の妨げになるであろうスペーサー閉塞への予防を可能にさせ得ることが想像される。スペーサー領域中に小さいトウホールド(toehold)ヘアピンを形成する、PEgRNAへの短い5'伸長はまた、好ましくは、PEgRNA結合スペーサーのアニーリング領域に対しても競合し得る。最終的に、キッシングループはまた、他の鋳型RNAをゲノム部位へ動員するのにも、あるRNAから他のセクションiii)のRT活性の入れ替えを可能にさせるのにも、使用され得る。 Additional RNA motifs may also improve RT processivity or enhance PEgRNA activity by enhancing RT binding to the DNA-RNA duplex. The addition of native sequences bound by RT in its cognate retroviral genome can enhance RT activity.199 This may include native primer binding sites (PBS), polypurine tracts ( PPT ), or kissing loops, which are involved in retroviral genome dimerization and transcription initiation.199 The addition of dimerization chiefs—such as kissing loops or GNRA tetraloop/ tetraloop receptor pairs—at the 5′ and 3′ ends of the PEgRNA may also result in efficient circularization of the PEgRNA, improving stability. In addition, it is envisioned that the addition of these motifs may allow for physical separation of the PEgRNA spacer and primer, preventing spacer occlusion that would otherwise hinder PE activity. A short 5' extension to the PEgRNA, forming a small toehold hairpin in the spacer region, may also preferably compete for the annealing region of the PEgRNA-binding spacer. Finally, kissing loops may also be used to recruit other template RNAs to genomic sites and allow for the swapping of RT activity from one RNA to the other, section iii).

PEgRNA-HDV融合体
GGCCCAGACTGAGCACGTGAGTTTTAGAGCTAGAAATAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGGACCGAGTCGGTCCTCTGCCATCAAAGCGTGCTCAGTCTGGGCCGGCATGGTCCCAGCCTCCTCGCTGGCGCCGGCTGGGCAACATGCTTCGGCATGGCGAATGGGACTTTTTTT(配列番号230)
PEGRNA-HDV fusions
GGCCCAGACTGAGCACGTGAGTTTTAGAGCTAGAAATAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGGACCGAGTCGGTCCTCTGCCATCAAAGCGTGCTCAGTCTGGGCCGGCATGGTCCCAGCCTCCTCGCTGGCGCCGGCTGGGCAACATGCTTCGGCATGGCGAATGGGACTTTTTTT (SEQ ID NO: 230)

PEgRNA-MMLVキッシングループ
GGTGGGAGACGTCCCACCGGCCCAGACTGAGCACGTGAGTTTTAGAGCTAGAAATAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGGACCGAGTCGGTCCTCTGCCATCAAAGCTTCGACCGTGCTCAGTCTGGTGGGAGACGTCCCACCTTTTTTT(配列番号231)
PEgRNA-MMLV kissing loop
GGTGGGAGACGTCCCACCGGCCCAGACTGAGCACGTGAGTTTTAGAGCTAGAAATAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGGACCGAGTCGGTCCTCTGCCATCAAAGCTTCGACCGTGCTCAGTCTGGTGGGAGACGTCCCACCTTTTTTTT (SEQ ID NO: 231)

PEgRNA-VSリボザイムキッシングループ
GAGCAGCATGGCGTCGCTGCTCACGGCCCAGACTGAGCACGTGAGTTTTAGAGCTAGAAATAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGGACCGAGTCGGTCCTCTGCCATCAAAGCTTCGACCGTGCTCAGTCTCCATCAGTTGACACCCTGAGGTTTTTTT(配列番号232)
PEgRNA-VS ribozyme kissing loop
GAGCAGCATGGCGTCGCTGCTCACGGCCCAGACTGAGCACGTGAGTTTTAGAGCTAGAAATAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGGACCGAGTCGGTCCTCTGCCATCAAAGCTTCGACCGTGCTCAGTCTCCATCAGTTGACACCCTGAGGTTTTTTT (SEQ ID NO: 232)

PEgRNA-GNRAテトラループ/テトラループ受容体
GCAGACCTAAGTGGUGACATATGGTCTGGGCCCAGACTGAGCACGTGAGTTTTAGAGCTAUACGTAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTUACGAAGTGGGACCGAGTCGGTCCTCTGCCATCAAAGCTTCGACCGTGCTCAGTCTGCATGCGATTAGAAATAATCGCATGTTTTTTT(配列番号233)
PEgRNA-GNRA tetraloop/tetraloop receptor
GCAGACCTAAGTGGUGACATATGGTCTGGGCCCAGACTGAGCACGTGAGTTTTAGAGCTAUACGTAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTUACGAAGTGGGACCGAGTCGGTCCTCTGCCATCAAAGCTTCGACCGTGCTCAGTCTGCATGCGATTAGAAATAATCGCATGTTTTTTT (SEQ ID NO: 233)

2次RNA-HDV融合体を切り替えるPEgRNA鋳型
TCTGCCATCAAAGCTGCGACCGTGCTCAGTCTGGTGGGAGACGTCCCACCGGCCGGCATGGTCCCAGCCTCCTCGCTGGCGCCGGCTGGGCAACATGCTTCGGCATGGCGAATGGGACTTTTTTT(配列番号234)
PEgRNA template to switch secondary RNA-HDV fusions
TCTGCCATCAAAGCTGCGACCGTGCTCAGTCTGGTGGGAGACGTCCCACCGGCCGGCATGGTCCCAGCCTCCTCGCTGGCGCCGGCTGGGCAACATGCTTCGGCATGGCGAATGGGACTTTTTTT (SEQ ID NO: 234)

(v)PEgRNAの進化 (v) Evolution of PEGRNA

PEgRNA骨格は、SpCas9および塩基編集因子の改善のされ方に類似した様式で、指向進化を介してさらに改善され得る。指向進化は、Cas9または進化したCas9バリアントによるPEgRNA認識を増強し得る。加えて、種々のPEgRNA骨格配列はおそらく、種々のゲノム遺伝子座にて最適であって、問題になっている部位にてPE活性を増強するか、オフターゲット活性を低減するか、またはその両方のいずれかであろう。最終的に、他のRNAモチーフが付加されたPEgRNA骨格の進化は、未進化の融合RNAと比べて、融合されたPEgRNAの活性をほぼ必ず改善するであろう。実例として、c-ジ-GMP-Iアプタマーおよびハンマーヘッド型リボザイムから構成されるアロステリックリボザイムの進化は、劇的に改善された活性へ繋がったが202、これは進化がハンマーヘッド-PEgRNA融合体の活性も改善するであろうことを示唆する。加えて、目下Cas9は一般にsgRNAの5'伸長の耐性がないものの、指向進化は、この不耐性を和らげることを可能にする突然変異を生成し、追加のRNAモチーフが利用され得るようになる可能性があろう。 The PEgRNA backbone can be further improved through directed evolution in a manner similar to how SpCas9 and base editors have been improved. Directed evolution can enhance PEgRNA recognition by Cas9 or evolved Cas9 variants. In addition, different PEgRNA backbone sequences are likely optimal at different genomic loci, either enhancing PE activity at the site of interest, reducing off-target activity, or both. Finally, evolution of PEgRNA backbones with additional RNA motifs will almost always improve the activity of the fused PEgRNA compared to the unevolved fusion RNA. As an illustration, evolution of an allosteric ribozyme composed of a c-di-GMP-I aptamer and a hammerhead ribozyme led to dramatically improved activity, 202 suggesting that evolution will also improve the activity of hammerhead-PEgRNA fusions. In addition, although Cas9 currently does not generally tolerate 5' extensions of sgRNAs, directed evolution could generate mutations that allow for alleviating this intolerance, allowing additional RNA motifs to be exploited.

本明細書に記載のとおり、数多のこれらアプローチは既に、Cas9:sgRNA複合体との使用のために記載されているが、PEgRNA活性を改善するためのデザインは報告されていない。プログラム可能な突然変異をゲノム中へ組み入れるための他のストラテジーも、塩基編集、相同組み換え修復(HDR)、正確なマイクロ相同媒介末端結合(MMEJ)、またはトランスポサーゼ媒介編集を包含する。しかしながら、これらアプローチのすべてが、PEと比較すると著しい難点を有する。最新の塩基編集因子は、現行のPEより効率的ではあるが、あるクラスのゲノム突然変異しか組み入れられず、着目部位にて、望ましくない追加のヌクレオチド変換をもたらし得る。HDRは、極少数の細胞型にしか実現可能でなく、比較的高比率のランダムな挿入および欠失の突然変異(インデル)をもたらす。正確なMMEJは、二本鎖破壊の予測可能な修復へ繋がり得るが、欠失の組み入れに大きく限定されており、極めて部位依存性であって、また比較的高比率の望ましくないインデルも有し得る。トランスポサーゼ媒介編集は、今日まで、細菌において機能することしか示されていない。してみると、PEへの改善点は、ゲノム突然変異の広範な見本の治療的修正へのおそらく最良の道を表す。 As described herein, a number of these approaches have already been described for use with Cas9:sgRNA complexes, but no designs have been reported to improve PE gRNA activity. Other strategies for incorporating programmable mutations into genomes include base editing, homology-directed repair (HDR), precise microhomology-mediated end joining (MMEJ), or transposase-mediated editing. However, all of these approaches have significant drawbacks compared to PE. Although current base editors are more efficient than PE, they can only incorporate certain classes of genomic mutations and can result in unwanted additional nucleotide changes at the site of interest. HDR is feasible in only a few cell types and results in a relatively high rate of random insertion and deletion mutations (indels). Precise MMEJ can lead to predictable repair of double-strand breaks, but is largely limited to the incorporation of deletions, is highly site-dependent, and can also have a relatively high rate of unwanted indels. Transposase-mediated editing has only been shown to function in bacteria to date. Thus, improvements to PE represent perhaps the best avenue for therapeutic correction of a broad corpus of genomic mutations.

References cited in例15において引用された参考文献
以下の参考文献の各々は例15において引用されており、これらの各々は参照により本明細書に組み込まれる。
1. Schechner,DM,Hacisuleyman E.,Younger ST,Rinn JL.Nat Methods 664-70(2015).
2. Brown JA,et al.Nat Struct Mol Biol 633-40(2014).
3. Conrad NA and Steitz JA.EMBO J 1831-41(2005).
4. Bartlett JS,et al.Proc Natl Acad Sci USA 8852-7(1996).
5. Mitton-Fry RM,DeGregorio SJ,Wang J,Steitz TA,Steitz JA.Science 1244-7(2010).
6. Forster AC,Symons RH.Cell.1987.
7. Weinberg Z,Kim PB,Chen TH,Li S,Harris KA,Lunse CE,Breaker RR.Nat.Chem.Biol.2015.
8. Feldstein PA,Buzayan JM,Bruening G.Gene 1989.
9. Saville BJ,Collins RA.Cell.1990.
10. Roth A,Weinberg Z,Chen AG,Kim PG,Ames TD,Breaker RR.Nat Chem Biol.2013.
11. Borchardt EK,et al.RNA 1921-30(2015).
12. Zhang Y,et al.Mol Cell 792-806(2013).
13. Dang Y,et al.Genome Biol 280(2015).
14. Schaefer M,Kapoor U,and Jantsch MF.Open Biol 170077(2017).
15. Nahar S,et al.Chem Comm 2377-80(2018).
References cited in Example 15 Each of the following references is cited in Example 15, each of which is incorporated herein by reference.
1. Schechner, D. M., Hacisuleyman, E., Younger, S. T., Rinn, J. L. Nat Methods 664-70 (2015).
2. Brown JA, et al. Nat Struct Mol Biol 633-40(2014).
3. Conrad NA and Steitz JA. EMBO J 1831-41 (2005).
4. Bartlett JS, et al. Proc Natl Acad Sci USA 8852-7(1996).
5. Mitton-Fry RM, DeGregorio SJ, Wang J, Steitz TA, Steitz JA. Science 1244-7 (2010).
6. Forster AC, Symons RH. Cell. 1987.
7. Weinberg Z, Kim PB, Chen TH, Li S, Harris KA, Lunse CE, Breaker RR. Nat. Chem. Biol. 2015.
8. Feldstein PA, Buzayan JM, Bruening G. Gene 1989.
9. Saville BJ, Collins RA. Cell. 1990.
10. Roth A, Weinberg Z, Chen AG, Kim PG, Ames TD, Breaker RR. Nat Chem Biol. 2013.
11. Borchardt EK, et al. RNA 1921-30 (2015).
12. Zhang Y, et al. Mol Cell 792-806(2013).
13. Dang Y, et al. Genome Biol 280(2015).
14. Schaefer M, Kapoor U, and Jantsch MF. Open Biol 170077(2017).
15. Nahar S, et al. Chem Comm 2377-80(2018).

例16-SPCAS9以外のDNA結合タンパク質を用いてPEの標的化範囲を拡張する
SpCas9が効率的に結合し得る好適に置かれたNGGプロトスペーサー隣接モチーフ(PAM)があるゲノム座位において、Streptococcus pyogenes Cas9(SpCas9)を用いるプライム編集(PE)は全ての1塩基置換、挿入、欠失、およびそれらの組み合わせを効率的に組み入れ組み入れ得る。本明細書に記載の方法は、効率的なPEにとってアクセス可能なPAM、よってアクセス可能な標的化可能なゲノム座位を拡張することによって、PEの標的化能力を幅広くする。SpCas9以外のRNAによってガイドされるDNA結合タンパク質を用いるプライム編集因子は、異なるPAMへのアクセスを許すことによってゲノム座位の拡張された標的化可能な範囲を可能化する。加えて、SpCas9よりも小さいRNAによってガイドされるDNA結合タンパク質の使用は、より効率的なウイルス送達をもまた許す。SpCas9以外のCasタンパク質または他のRNAによってガイドされるDNA結合タンパク質によるPEは、SpCas9に基づくPEを用いてはアクセス不可能または非効率的どちらかであった高効率の治療学的編集を許すであろう。
Example 16 - Expanding the targeting range of PE using DNA binding proteins other than SPCAS9
Prime editing (PE) using Streptococcus pyogenes Cas9 (SpCas9) can efficiently incorporate all single base substitutions, insertions, deletions, and combinations thereof at genomic loci with appropriately placed NGG protospacer adjacent motifs (PAMs) to which SpCas9 can efficiently bind. The methods described herein broaden the targeting capabilities of PE by expanding the PAMs accessible to efficient PE, and thus the targetable genomic loci accessible. Prime editing using RNA-guided DNA-binding proteins other than SpCas9 allows for an expanded targetable range of genomic loci by allowing access to different PAMs. In addition, the use of RNA-guided DNA-binding proteins smaller than SpCas9 also allows for more efficient viral delivery. PE with Cas proteins other than SpCas9 or other RNA-guided DNA-binding proteins will allow for highly efficient therapeutic editing that was either inaccessible or inefficient using SpCas9-based PE.

これは、NGG PAMに対して相対的な編集の非理想的な間隔を原因として、SpCas9に基づくPEが非効率的であるか、またはSpCas9に基づく構築物の総体的なサイズが細胞発現および/または送達にとって法外であるかどちらかの状況に用いられることが予想される。SpCas9の少数のかつ不良に位置付けられたNGG PAMを標的領域の近くに有するハンチンチン遺伝子などの特定の疾患に該当する(relevent)座位は、NGA PAMを認識するSpCas9-VRQRなどのPEシステムの異なるCasタンパク質を用いて容易に標的化され得る。より効率的にAAVベクターにパッケージングされ得るより小さいPE構築物を生成するために、より小さいCasタンパク質が用いられ、標的組織へのより良好な送達を可能化するであろう。図61は、RNAによってガイドされるDNA結合タンパク質としてStaphylococcus aureus CRISPR-Casを用いるプライム編集の実施化を示す。NTは無処置の対照である。 This is expected to be used in situations where SpCas9-based PE is either inefficient due to non-ideal spacing of edits relative to the NGG PAM, or the overall size of the SpCas9-based construct is prohibitive for cellular expression and/or delivery. Certain disease-relevant loci, such as the huntingtin gene, which have SpCas9's few and poorly positioned NGG PAMs close to the target region, can be easily targeted using a different Cas protein of the PE system, such as SpCas9-VRQR, which recognizes the NGA PAM. Smaller Cas proteins would be used to generate smaller PE constructs that can be more efficiently packaged into AAV vectors, enabling better delivery to target tissues. Figure 61 shows the implementation of prime editing using Staphylococcus aureus CRISPR-Cas as an RNA-guided DNA-binding protein. NT is untreated control.

図62A~62Bは、プライム編集による精密な位置付けにおける所望の編集の効率的な組み入れのためのプロトスペーサーの重要性の実証を提供する。これは、このテクノロジーの新規の特色としての代替的なPAMおよびプロトスペーサーの重要性を強調する。図62Aの「n.d.」は「検出されない」である。 Figures 62A-62B provide a demonstration of the importance of the protospacer for efficient incorporation of the desired edit at precise positioning by prime editing. This highlights the importance of alternative PAMs and protospacers as a novel feature of this technology. "n.d." in Figure 62A is "not detected."

図63は、プライム編集因子システムのRNAによってガイドされるDNA結合タンパク質としてSpCas9(H840A)-VRQRおよびSpCas9(H840A)-VRERを用いるPEの実施化を示す。SpCas9(H840A)-VRQR napDNAbpは配列番号87として本明細書に開示の。SpCas9(H840A)-VRER napDNAbpは配列番号88として本明細書に開示の。SpCas9(H840A)-VRER-MMLV RT融合タンパク質は配列番号516として本願において開示され、MMLV RTはD200N、L603W、T330P、T306K、およびW313F置換を野生型MMLV RTに対して相対的に含む。SpCas9(H840A)-VRQR-MMLV RT融合タンパク質は配列番号515として本願において開示され、MMLV RTはD200N、L603W、T330P、T306K、およびW313F置換を野生型MMLV RTに対して相対的に含む。ヒトゲノム上の7つの異なる座位が標的化される:4つはSpCas9(H840A)-VRQR-MMLV RTプライム編集因子システムにより、3つはSpCas9(H840A)-VRER-MMLV RTシステムによる。試験された構築物のアミノ酸配列は次のとおりである:

Figure 2020191243000414

Figure 2020191243000415

Figure 2020191243000416
Figure 63 shows the implementation of PE using SpCas9(H840A)-VRQR and SpCas9(H840A)-VRER as the RNA-guided DNA binding proteins of the prime editor system. SpCas9(H840A)-VRQR napDNAbp is disclosed herein as SEQ ID NO: 87. SpCas9(H840A)-VRER napDNAbp is disclosed herein as SEQ ID NO: 88. The SpCas9(H840A)-VRER-MMLV RT fusion protein is disclosed herein as SEQ ID NO: 516, where MMLV RT contains D200N, L603W, T330P, T306K, and W313F substitutions relative to wild-type MMLV RT. The SpCas9(H840A)-VRQR-MMLV RT fusion protein is disclosed herein as SEQ ID NO:515, in which the MMLV RT contains D200N, L603W, T330P, T306K, and W313F substitutions relative to wild-type MMLV RT. Seven different loci on the human genome are targeted: four by the SpCas9(H840A)-VRQR-MMLV RT prime editor system and three by the SpCas9(H840A)-VRER-MMLV RT system. The amino acid sequences of the constructs tested are as follows:
Figure 2020191243000414

Figure 2020191243000415

Figure 2020191243000416

図63に示されているとおり、SpCas9(H840A)-VRQR-MMLV RTは「AGAG」および「GGAG」を包含するPAM部位において作動性であり、いくらかの編集活性を「GGAT」および「AGAT」PAM配列において有した。SpCas9(H840A)-VRER-MMLV RTは「AGCG」および「GGCG」を包含するPAM部位において作動性であり、いくらかの編集活性を「TGCG」において有した。 As shown in Figure 63, SpCas9(H840A)-VRQR-MMLV RT was active at PAM sites including "AGAG" and "GGAG" and had some editing activity at "GGAT" and "AGAT" PAM sequences. SpCas9(H840A)-VRER-MMLV RT was active at PAM sites including "AGCG" and "GGCG" and had some editing activity at "TGCG".

データは、プライム編集が、異なるPAM特異性を持つnapDNAbp、例えば本明細書に記載のCas9バリアントを用いて行われ得るということを実証している。 The data demonstrate that prime editing can be performed using napDNAbp with different PAM specificities, such as the Cas9 variants described herein.

例17-PEによるリコンビナーゼ標的部位の導入
この例は、高い特異性および効率で哺乳類および他のゲノムにリコンビナーゼ標的部位(SSR標的部位)を導入するためにプライム編集(PE)を用いることによって、遺伝子疾患に対処するかまたはテーラーメイド動物もしくは植物モデルを生成するための方法を記載する。
Example 17 - Introduction of recombinase target sites with PE This example describes a method to address genetic diseases or generate tailored animal or plant models by using prime editing (PE) to introduce recombinase target sites (SSR target sites) into mammalian and other genomes with high specificity and efficiency.

この例は、ヒトまたは他のゲノム上の高価値の座位にリコンビナーゼ認識配列を導入するためのPEの使用を記載する。これらは、部位特異的リコンビナーゼ(単数または複数)に対する暴露後に、精密なかつ効率的なゲノム改変を導くであろう(図64)。図64に示されている種々の態様では、PEは、(b)DNAドナー鋳型のゲノム取り入れの部位としての使用のための単一のSSR標的を挿入するために用いられ得る。(c)は、どのようにしてSSR標的部位のタンデム挿入がゲノムのある部分を欠失させるために用いられ得るかを示す。(d)は、どのようにしてSSR標的部位のタンデム挿入がゲノムのある部分を逆位させるために用いられ得るかを示す。(e)は、どのようにして2つの遠位の染色体領域における2つのSSR標的部位の挿入が染色体転座をもたらし得るかを示す。(f)は、どのようにしてゲノム上の2つの異なるSSR標的部位の挿入がDNAドナー鋳型からのカセットを交換するために用いられ得るかを示す。ゲノム改変の型の夫々は、SSR標的を挿入するためにPEを用いることによって想定されるが、このリストもまた限定することを意味されない。 This example describes the use of PE to introduce recombinase recognition sequences at high-value loci on human or other genomes. These will lead to precise and efficient genome modification after exposure to site-specific recombinase(s) (Figure 64). In various embodiments shown in Figure 64, PE can be used to (b) insert a single SSR target for use as a site of genomic incorporation of a DNA donor template. (c) shows how tandem insertion of SSR target sites can be used to delete a portion of a genome. (d) shows how tandem insertion of SSR target sites can be used to invert a portion of a genome. (e) shows how insertion of two SSR target sites at two distal chromosomal regions can result in a chromosomal translocation. (f) shows how insertion of two different SSR target sites on a genome can be used to exchange a cassette from a DNA donor template. Each of the types of genome modifications are envisioned by using PE to insert an SSR target, but this list is also not meant to be limiting.

多くの大スケールゲノム変化、例えば遺伝子挿入、欠失、逆位、または染色体転座が遺伝子疾患に関連付けられている1-7。加えて、真核ゲノムのカスタムのかつ標的化された操作は、ヒト疾患の研究、およびトランスジェニック植物8,9またはほかのバイオテクノロジー製品の生成にとって重要である。例えば、染色体の微小欠失は疾患に至り得、重大なDNAエレメントの挿入によるこれらの欠失の置き換えは疾患の永久的な改善に至り得る。加えて、逆位、遺伝子コピー数変化、または染色体転座からもたらされる疾患は、有疾患細胞の先の遺伝子構造を復元することによって対処され得る。代替的には、産業に用いられる植物または他の高価値真核生物において、組み換えDNAまたは標的化されたゲノム再構成の導入は、改善された製品、例えばより少数の資源を要求するかまたは病原体に対して耐性である作物に至り得る。大スケールゲノム変化を成し遂げるための現行のテクノロジーはランダムなまたは確率的なプロセス、例えばトランスポゾンまたはレトロウイルスの使用に依拠し、他の所望のゲノム改変は相同組み換え戦略のみによって達成されている。 Many large-scale genomic changes, such as gene insertions, deletions, inversions, or chromosomal translocations, have been associated with genetic diseases. 1-7 In addition, custom and targeted manipulation of eukaryotic genomes is important for the study of human diseases and for the generation of transgenic plants8,9 or other biotechnology products. For example, chromosomal microdeletions can lead to disease, and replacement of these deletions by the insertion of critical DNA elements can lead to permanent amelioration of the disease. In addition, diseases resulting from inversions, gene copy number changes, or chromosomal translocations can be addressed by restoring the previous genetic structure of diseased cells. Alternatively, in plants or other high-value eukaryotes used in industry, the introduction of recombinant DNA or targeted genome rearrangements can lead to improved products, such as crops that require fewer resources or are resistant to pathogens. Current technologies for achieving large-scale genomic changes rely on random or stochastic processes, such as the use of transposons or retroviruses, and other desired genome modifications are achieved only by homologous recombination strategies.

標的化されたかつ効率的なゲノム改変を達成するためのタンパク質の1つの魅力的なクラスは部位特異的リコンビナーゼ(SSR)である。SSRはゲノム改変のためのツールとして用いられた長い履歴を有する10~13。SSRは遺伝子治療のための有望なツールとして考慮される。なぜなら、それらは、インデル、転座、他のDNA再構成、またはp53活性化を誘導し得る二本鎖切断の内生修復に依拠することなしに15~18、定められた組み換え標的における精密な切断、鎖交換、およびDNAフラグメントの再連結を誘導し得るからである14。SSRによって触媒される反応は、相同組み換え修復のものを超過する効率で標的DNAフラグメントの直接的置き換え、挿入、または欠失をもたらし得る14,19 One attractive class of proteins for achieving targeted and efficient genome modification is site-specific recombinases (SSRs). SSRs have a long history of being used as tools for genome modification10-13. SSRs are considered as promising tools for gene therapy because they can induce precise cleavage, strand exchange, and religation of DNA fragments in defined recombination targets14 without relying on endogenous repair of double-strand breaks that can induce indels , translocations, other DNA rearrangements, or p53 activation15-18 . Reactions catalyzed by SSRs can result in the direct replacement, insertion, or deletion of target DNA fragments with an efficiency that exceeds that of homology-directed repair14,19.

SSRは多くの利点をオファーするが、それらはそれらの対応する標的配列に対して強い自然の選好性を有するので、それらは広く用いられてはいない。SSRの認識配列は典型的には≧20塩基対であり、それゆえに、ヒトまたはモデル生物のゲノム上に生起することは非蓋然的である。さらに、SSRのネイティブな基質選好性は大規模な実験室操作または進化によってであっても容易には変改されない20。この限定は、リコンビナーゼ標的をゲノム上に直接的に導入するためにまたはリコンビナーゼ標的にネイティブに似ている内生ゲノム配列を改変するためにPEを用いることによって克服される。リコンビナーゼタンパク質に対する細胞の爾後の暴露は、リコンビナーゼ標的(単数または複数)の位置付けおよび向きによって導かれる精密なかつ効率的なゲノム改変を許すであろう(図64)。 Although SSRs offer many advantages, they have not been widely used because they have strong natural preferences for their corresponding target sequences. The recognition sequences of SSRs are typically ≧20 base pairs and therefore unlikely to occur on the genomes of humans or model organisms. Furthermore, the native substrate preferences of SSRs are not easily altered even by extensive laboratory manipulation or evolution. This limitation is overcome by using PE to directly introduce a recombinase target onto the genome or to modify an endogenous genomic sequence that natively resembles the recombinase target. Subsequent exposure of cells to the recombinase protein will allow precise and efficient genome modification guided by the positioning and orientation of the recombinase target(s) (Figure 64).

リコンビナーゼ標的のPEによって媒介される導入は、大スケールゲノム欠陥、例えば遺伝子喪失、逆位、もしくは重複、または染色体転座によって引き起こされる遺伝子疾患の処置にとって特に有用であり得る1-7(表6)。例えば、ウィリアムズ・ボイレン症候群は染色体7上の24の欠失によって引き起こされる発達障害である21。現行では、生細胞における複数の遺伝子全体の効率的なかつ標的化された挿入のためのテクノロジーは存在しない(かかる全長遺伝子挿入をするPEのポテンシャルは現行では調査されているが、まだ確立されていない);しかしながら、PEによって挿入される標的におけるリコンビナーゼによって媒介される取り入れは、このおよび他の疾患の永久的な治癒への1つのアプローチをオファーする。加えて、リコンビナーゼ認識配列の標的化された導入は、トランスジェニック植物、動物研究モデル、バイオプロダクション細胞株、または他のカスタム真核細胞株の生成を包含する適用にとって高度に有能であり得る。例えば、PE特異的な標的におけるトランスジェニック植物のリコンビナーゼによって媒介されるゲノム再構成は、改善された特性を有する農作物を生成することのボトルネックの1つを克服し得る8,9。 PE-mediated introduction of recombinase targets may be particularly useful for the treatment of genetic diseases caused by large-scale genomic defects, such as gene losses, inversions, or duplications, or chromosomal translocations1-7 (Table 6). For example, Williams-Beuren syndrome is a developmental disorder caused by a deletion of 24 on chromosome 721. Currently, no technology exists for efficient and targeted insertion of entire genes in living cells (the potential of PE to make such full-length gene insertions is currently being explored but not yet established); however, recombinase-mediated incorporation in PE-inserted targets offers one approach to a permanent cure of this and other diseases. In addition, targeted introduction of recombinase recognition sequences may be highly effective for applications involving the generation of transgenic plants, animal research models, bioproduction cell lines, or other custom eukaryotic cell lines. For example, recombinase-mediated genome reorganization of transgenic plants in PE-specific targets may overcome one of the bottlenecks in generating agricultural crops with improved properties8,9.

いくつものSSRファミリーメンバーが特徴付けられ、それらの標的配列が記載されており、天然のおよび操作されたチロシンリコンビナーゼ(表7)、ラージセリンインテグラーゼ(表8)、セリンリゾルバーゼ(表9)、およびチロシンインテグラーゼ(表10)を包含する。増強されたゲノム取り入れ率を実証する改変された標的配列もまたいくつかのSSRについて記載されている22~30。天然のリコンビナーゼに加えて、別物の特異性を有するプログラム可能なリコンビナーゼが開発されている31~40。所望の適用に依存して、PEを用いて、これらの認識配列の1つ以上が、規定された位置付け、例えばセーフハーバー座位においてゲノム上に導入され得る41~43 Several SSR family members have been characterized and their target sequences described, including natural and engineered tyrosine recombinases (Table 7), large serine integrases (Table 8), serine resolvases (Table 9), and tyrosine integrases (Table 10). Modified target sequences that demonstrate enhanced genome integration rates have also been described for some SSRs. 22-30 In addition to natural recombinases, programmable recombinases with alternative specificities have been developed. 31-40 Depending on the desired application, one or more of these recognition sequences can be introduced into the genome at defined locations, e.g., safe harbor loci, using PE. 41-43

例えば、ゲノム上の単一のリコンビナーゼ標的の導入は、DNAドナー鋳型との取り入れ的な組み換えをもたらすであろう(図64B)。ヒト細胞においてロバストに作動するセリンインテグラーゼは、遺伝子取り入れに特に良く適し得る44,45。加えて、標的のアイデンティティーおよび向きに依存して、2つのリコンビナーゼ標的の導入は介在配列の欠失、介在配列の逆位、染色体転座、またはカセット交換をもたらし得る(図64C64F)。すでにリコンビナーゼ標的に密に似ている内生配列を選ぶことによって、完全なリコンビナーゼ標的を導入するために要求される編集の範囲は縮減されるであろう。 For example, introduction of a single recombinase target on the genome will result in integrative recombination with the DNA donor template (Figure 64B ). Serine integrases, which operate robustly in human cells, may be particularly well suited for gene integration44,45. In addition, depending on the identity and orientation of the targets, introduction of two recombinase targets may result in intervening sequence deletion, intervening sequence inversion, chromosomal translocation, or cassette exchange (Figures 64C - 64F ). By choosing endogenous sequences that already closely resemble the recombinase target, the extent of editing required to introduce the complete recombinase target will be reduced.

最後に、いくつかのリコンビナーゼは、ネイティブに生起する偽部位においてヒトまたは真核ゲノムに取り入れすることが実証されている46-64。PE編集は、これらの天然の偽部位における取り入れ率を増強するために、または代替的には欲されないオフターゲット配列としての用をなし得る偽部位を消去するために、これらの座位を改変するために用いられ得る。 Finally, several recombinases have been demonstrated to integrate into human or eukaryotic genomes at natively occurring pseudosites. 46-64 PE editing can be used to modify these loci to enhance integration rates at these natural pseudosites, or alternatively to eliminate pseudosites that may serve as unwanted off-target sequences.

この報告は、PEを用いて真核ゲノム上にリコンビナーゼ標的配列を導入するための一般的な方法論を記載する。これの適用は無限に近い。ゲノム編集反応はCRISPR/Cas9タンパク質と逆転写酵素ドメインとのキメラ融合体の「プライム編集因子」による使用を意図され、これはカスタムのプライム編集ガイドRNA(PEgRNA)を利用する。さらに伸長して、Cas9ツールおよび相同組み換え修復(HDR)経路もまた、いくつかの技術を用いてインデル率を低下させることによって、DNA鋳型からリコンビナーゼ標的を導入するために有効利用され得る65~67。ヒト細胞培養における概念実証実験が図65に示されている。
表6.大スケールゲノム改変にリンクした遺伝子疾患の例。

Figure 2020191243000417

表7.チロシンリコンビナーゼおよびSSR標的配列
Figure 2020191243000418

Figure 2020191243000419

表8.大セリンインテグラーゼおよびSSR標的配列。
Figure 2020191243000420

Figure 2020191243000421

Figure 2020191243000422

表9.セリンリゾルバーゼおよびSSR標的配列。
Figure 2020191243000423

表10.チロシンインテグラーゼおよび標的配列。
Figure 2020191243000424
This report describes a general methodology for introducing recombinase target sequences onto eukaryotic genomes using PE. The applications of this are nearly limitless. The genome editing reaction is intended for use with a "prime editor" of a chimeric fusion of CRISPR/Cas9 protein and reverse transcriptase domain, which utilizes a custom prime editing guide RNA (PEgRNA). Extending further, the Cas9 tool and the homology directed repair (HDR) pathway can also be exploited to introduce recombinase targets from DNA templates by reducing the indel rate using several techniques65-67 . A proof-of-concept experiment in human cell culture is shown in Figure 65.
Table 6. Examples of genetic diseases linked to large-scale genome modifications.
Figure 2020191243000417

Table 7. Tyrosine recombinases and SSR target sequences
Figure 2020191243000418

Figure 2020191243000419

Table 8. Large serine integrase and SSR target sequences.
Figure 2020191243000420

Figure 2020191243000421

Figure 2020191243000422

Table 9. Serine resolvases and SSR target sequences.
Figure 2020191243000423

Table 10. Tyrosine integrases and target sequences.
Figure 2020191243000424

例17において引用された参考文献
以下の参考文献の各々は例17において引用されており、これらの各々は参照により本明細書に組み込まれる。

Figure 2020191243000425

Figure 2020191243000426

Figure 2020191243000427

Figure 2020191243000428

Figure 2020191243000429

Figure 2020191243000430

Figure 2020191243000431

Figure 2020191243000432

Figure 2020191243000433

Figure 2020191243000434
References Cited in Example 17 Each of the following references is cited in Example 17, each of which is incorporated herein by reference.
Figure 2020191243000425

Figure 2020191243000426

Figure 2020191243000427

Figure 2020191243000428

Figure 2020191243000429

Figure 2020191243000430

Figure 2020191243000431

Figure 2020191243000432

Figure 2020191243000433

Figure 2020191243000434

例18-プライマー結合部位(PBS)中の3'トウループの組み込みはPEgRNA活性を改善する
さらにPE活性を改善するために、本発明者らは、3'伸長アームを有するPEgRNAの3'末にてトウループ配列を付加することを企図した。図71Aは、3'伸長アームを有する全体的な(generic)SpCas9 PEgRNAの例(上の分子)を提供する。次に、3'伸長アームは、RT鋳型(これは、その所望の編集を包含する)および分子の3'末にてプライマー結合部位(PBS)を含む。分子は、3つのU核酸塩基を含むポリ(U)配列(すなわち、5'-UUU-3')で終止する。
Example 18 - Incorporation of a 3' toe loop in the primer binding site (PBS) improves PEgRNA activity To further improve PE activity, we contemplated adding a toe loop sequence at the 3' end of a PEgRNA with a 3' extension arm. Figure 71A provides an example of a generic SpCas9 PEgRNA (top molecule) with a 3' extension arm. The 3' extension arm then contains the RT template (which contains the desired edit) and a primer binding site (PBS) at the 3' end of the molecule. The molecule terminates with a poly(U) sequence containing three U nucleobases (i.e., 5'-UUU-3').

これに反して、図71Aの下部は、図71Aの上部と同じPEgRNA分子を示すが、ここで5'-GAAANNNNN-3'の9核酸塩基配列は、プライマー結合部位の3'末と末端ポリ(U)配列の5'末との間に挿入されている。この構造は、自身を180°まで後方へ折り畳み「トウループ」RNA構造を形成するが、ここで9核酸塩基挿入の5'-NNNNN-3'の配列はプライマー結合部位中の相補的な配列とアニールし、5'-GAAA-3'部分は180°のひねり(turn)を形成する。図71Aに描かれるトウループ配列の特色は、その場所において使用され得るトウループの範囲を限定も制限もする意図はない。さらに、トウループの配列は、プライマー結合部位の相補的な配列に依存するであろう。とは言え、本質的にはトウループ配列は、様々な態様において、180°を形成する第1配列部分、およびプライマー結合部位の部分に相補的な配列を有する第2配列部分を有していてもよい。 In contrast, the bottom portion of FIG. 71A shows the same PEgRNA molecule as the top portion of FIG. 71A, but now with a 9 nucleobase sequence of 5'-GAAANNNNN-3' inserted between the 3' end of the primer binding site and the 5' end of the terminal poly(U) sequence. This structure folds back on itself by 180° to form a "toe loop" RNA structure, where the 5'-NNNNN-3' sequence of the 9 nucleobase insertion anneals to a complementary sequence in the primer binding site and the 5'-GAAA-3' portion forms a 180° turn. The features of the toe loop sequence depicted in FIG. 71A are not intended to limit or restrict the scope of toe loops that may be used therein. Furthermore, the sequence of the toe loop will depend on the complementary sequence of the primer binding site. However, essentially the toe loop sequence may have a first sequence portion that forms 180° and a second sequence portion that has a sequence complementary to a portion of the primer binding site in various embodiments.

理論によって拘泥されないが、トウループ配列は、別様には可能性が十二分にあるものより(than would otherwise be possible)、プライマー結合部位が益々長くなるPEgRNAの使用をPEgRNAに可能にさせると考えられる。次に、より長いPBS配列は、PE活性を改善すると考えられる。PEgRNAのより具体的には、トウループのあり得る機能は、PBSを塞ぐか、または少なくともスペーサーと相互作用するPBSを最小化することである。PBSとスペーサーとの間の安定したヘアピン形成は、不活性なPEgRNAへ繋がり得る。トウループがないと、この相互作用は、PBSの長さ制限を要することになり得る。3'末トウループを使用してスペーサーとPBSとの間の相互作用を遮断または最小化することは、PE活性の改善へ繋がることもある。 Without being bound by theory, it is believed that the toe loop sequence allows the PEgRNA to use longer and longer primer binding sites than would otherwise be possible. Longer PBS sequences are then believed to improve PE activity. More specifically, the possible function of the toe loop in the PEgRNA is to block the PBS or at least minimize PBS interactions with the spacer. Stable hairpin formation between the PBS and the spacer can lead to an inactive PEgRNA. In the absence of a toe loop, this interaction can require a PBS length restriction. Using a 3' toe loop to block or minimize the interaction between the spacer and the PBS can also lead to improved PE activity.

例19-代替的な核酸鋳型および編集因子タンパク質構築物によるプライム編集
この例に先行して、プライム編集はPEgRNAを要求することが記載される。プライム編集への使用のための好適なPEgRNAの可能な構成を記載する例示の態様が、図3A(5'伸長アームを有するPEgRNA)、図3B(3'伸長アームを有するPEgRNA)、図3C(内部に伸長されたPEgRNA)、図3D(3'伸長アームを有し、プライマー結合部位、編集鋳型、相同アーム、ならびに任意の3'および5'修飾領域と、DNA合成鋳型として指示される領域とを含むPEgRNA)、および図3E(5’伸長アームを有し、プライマー結合部位、編集鋳型、相同アーム、ならびに任意の3'および5'修飾領域と、DNA合成鋳型として指示される領域とを含むPEgRNA)に図示されている。加えて、PEgRNA構造および組成は本願において発明を実施するための形態および至る所で鋭意に記載される。
Example 19 - Prime editing with alternative nucleic acid templates and editor protein constructs Prior to this example, it is described that prime editing requires PEgRNA. Exemplary embodiments describing possible configurations of suitable PEgRNAs for use in prime editing are illustrated in Figure 3A (PEgRNA with 5' extension arm), Figure 3B (PEgRNA with 3' extension arm), Figure 3C (internal extension PEgRNA), Figure 3D (PEgRNA with 3' extension arm and including primer binding site, editing template, homology arm, and optional 3' and 5' modified regions and region designated as DNA synthesis template), and Figure 3E (PEgRNA with 5' extension arm and including primer binding site, editing template, homology arm, and optional 3' and 5' modified regions and region designated as DNA synthesis template). In addition, PEgRNA structure and composition are described in detail in the detailed description and throughout this application.

この例は、PEgRNAの追加のデザインバリエーション、いくつかのケースでは、細胞外で丸ごとまたは部分的に化学合成されるPEgRNAを記載する。これらは、本明細書のプライム編集因子と併せて働くことが想定される。かかる代替的なデザインはプライム編集の種々の側面を改善し得、プライム編集によるより長いDNA配列の挿入、可能性としては増大した効率および/または忠実性で作動する代替的なポリメラーゼ(すなわち、逆転写酵素の代替)の使用、ならびにプライム編集を増強または拡大するための代替的なおよび/または追加のプライム編集因子タンパク質エフェクター構成要素の使用または動員を包含する。加えて、化学合成PEgRNAの使用は、可能性としては、より安定であり、かつプライム編集効率および能力を増強する望ましい特色を所有する分子の生産に至り得る。 This example describes additional design variations of PEgRNA, in some cases PEgRNAs that are entirely or partially chemically synthesized outside the cell. These are envisioned to work in conjunction with the prime editing factors of the present specification. Such alternative designs may improve various aspects of prime editing, including the insertion of longer DNA sequences by prime editing, the use of alternative polymerases (i.e., alternatives to reverse transcriptase) that potentially operate with increased efficiency and/or fidelity, and the use or recruitment of alternative and/or additional prime editing factor protein effector components to enhance or extend prime editing. In addition, the use of chemically synthesized PEgRNA may potentially lead to the production of molecules that are more stable and possess desirable features that enhance prime editing efficiency and capacity.

PEgRNAは、標的部位に組み込まれるべきである所望の編集された遺伝情報をコードする核酸鋳型としての用をなす。一側面において、PEgRNAは、伸長アームをsgRNAの5'端もしくは3’端どちらかに追加することによって(例えば、図3A、3B、3D、もしくは3Eの態様に示されているとおり)または類似の配列をsgRNA上の内部に挿入することによって(例えば、図3Cの態様に示されているとおり)生出される。伸長アームはDNA合成鋳型を含み、これはポリメラーゼ(例えば逆転写酵素)によるssDNA産物をコードすることができ、かつこれは目当ての編集された遺伝情報を包含する。伸長アームは、napDNAbpによってニッキングされたゲノムDNA鎖にアニールするためのプライマー結合部位(PBS)と、カウンターパートDNA鎖を置き換えることによって内生DNA標的部位に組み込まれるようになる目当ての編集されたDNA鎖をコードするためのDNA合成鋳型とを含む。PEgRNAは、プラスミドDNAもしくはゲノム取り入れされたDNAカセットから細胞内で発現され得るか、またはそれらは細胞外でin vitro転写によってもしくは化学合成によって作られ得、爾後に細胞に送達され得る。特に化学合成による細胞外におけるPEgRNAの調製は、実質的にPEgRNAを改変するための機会をオファーする。本発明はプライム編集鋳型の代替的なデザインを記載する(図72)。 The PEgRNA serves as a nucleic acid template that encodes the desired edited genetic information to be integrated into the target site. In one aspect, the PEgRNA is generated by adding an extension arm to either the 5' or 3' end of the sgRNA (e.g., as shown in the embodiment of Figure 3A, 3B, 3D, or 3E) or by inserting a similar sequence internally onto the sgRNA (e.g., as shown in the embodiment of Figure 3C). The extension arm includes a DNA synthesis template that can encode a ssDNA product by a polymerase (e.g., reverse transcriptase) and that contains the desired edited genetic information. The extension arm includes a primer binding site (PBS) for annealing to the genomic DNA strand nicked by napDNAbp, and a DNA synthesis template for encoding the desired edited DNA strand that becomes integrated into the endogenous DNA target site by displacing the counterpart DNA strand. The PEgRNA can be expressed intracellularly from plasmid DNA or a DNA cassette incorporated into the genome, or they can be made outside the cell by in vitro transcription or by chemical synthesis and then delivered to the cell. Preparation of PEgRNA outside the cell, especially by chemical synthesis, offers the opportunity to substantially modify the PEgRNA. The present invention describes an alternative design of the prime editing template (Figure 72).

(A)ガイドRNAとは別個の分子として発現されるDNA合成鋳型(すなわち、プライム編集因子複合体(napDNAbp+ガイドRNA)にトランスで提供されるDNA合成鋳型。
本明細書に記載の種々の態様では、プライム編集はプログラム可能な標的化分子および編集をコードする分子両方としての用をなす単一のPEgRNAを利用する。この態様は3’伸長アームを有するPEgRNAについて図72Aに図示されている。しかしながら、いくつかのケースでは、これは、特に、より複雑なPEgRNA分子、例えば大きい挿入をコードするものにとっては不利であり得る。これらのRNAは大規模な二次構造を含有し得、これがPEgRNA骨格構造およびCas9との相互作用に干渉し得る。代替的には、プライム編集はPEgRNAを2つの別個のRNA分子によって置換することによって実行され得る:図72Bに図示されているとおりsgRNAおよびトランスプライム編集RNA鋳型(tPERT)である。sgRNAはCas9(またはより一般的にはnapDNAbp)を所望のゲノム標的部位へと標的化するための用をなし、tPERTは新たなDNA配列を標的座位に書き込むためにポリメラーゼ(例えば逆転写酵素)によって用いられる。
(A) A DNA synthesis template expressed as a separate molecule from the guide RNA (i.e., a DNA synthesis template provided in trans to the primed editor complex (napDNAbp + guide RNA).
In various embodiments described herein, prime editing utilizes a single PEgRNA that serves as both a programmable targeting molecule and an editing-encoding molecule. This embodiment is illustrated in Figure 72 A for a PEgRNA with a 3' extension arm. However, in some cases, this may be a disadvantage, especially for more complex PEgRNA molecules, such as those that encode large insertions. These RNAs may contain extensive secondary structures that may interfere with the PEgRNA backbone structure and interaction with Cas9. Alternatively, prime editing may be performed by replacing the PEgRNA with two separate RNA molecules: an sgRNA and a trans-prime editing RNA template (tPERT), as illustrated in Figure 72 B. The sgRNA serves to target Cas9 (or more generally napDNAbp) to the desired genomic target site, and the tPERT is used by a polymerase (e.g., reverse transcriptase) to write new DNA sequences into the target locus.

一般的に、tPERTの単純な発現はPEgRNAと比較して低い編集効率に至る。しかしながら、トランスプライム編集の効率は、プライム編集因子タンパク質へのMS2コートタンパク質(MS2cp)の融合体(MS2cp-Cas9-RTを作るため)と併せたtPERT RNA上への1つ以上のMS2 RNAアプタマーの導入によって増強され得る。これはMS2 RNAアプタマーがMS2cpに結合することを許し、それによって、プライム編集因子複合体によってtPERT(これはDNA合成鋳型を含む)を編集の部位に共局在させる。アプタマー配列の逆転写を回避するために、MS2アプタマーは好ましくはtPERTの3’端に置かれる。 In general, simple expression of tPERT leads to lower editing efficiency compared to PEgRNA. However, the efficiency of trans-prime editing can be enhanced by the introduction of one or more MS2 RNA aptamers onto the tPERT RNA in conjunction with a fusion of the MS2 coat protein (MS2cp) to the prime editor protein (to make MS2cp-Cas9-RT). This allows the MS2 RNA aptamer to bind to MS2cp, thereby colocalizing tPERT (which contains the DNA synthesis template) to the site of editing by the prime editor complex. To avoid reverse transcription of the aptamer sequence, the MS2 aptamer is preferably placed at the 3' end of tPERT.

この例はMS2タグ付け技術を利用するが(プライム編集因子に融合されたMS2cpタンパク質とペアリングされたtPERTのMS2 RNAアプタマーを含む)、他のRNA-タンパク質動員システムが代替で用いられ得る。ここで想定される一般的な概念は、tPERTのDNA合成鋳型がRNA動員二次構造(例えば、MS2アプタマーのような特殊化したヘアピン)を含有するように改変され、その結果、tPERTが、tPERT分子上のRNA動員二次(second)構造を特異的に認識および結合するRNA結合タンパク質をさらに含む改変されたプライム編集因子融合タンパク質によって動員され得るということである。他のRNA-タンパク質動員ドメインの総説は当該技術分野において例えばJohansson et al.,"RNA recognition by the MS2 phage coat protein,"Sem Virol.,1997,Vol.8(3):176-185;Delebecque et al.,"Organization of intracellular reactions with rationally designed RNA assemblies,"Science,2011,Vol.333:470-474;Mali et al.,"Cas9 transcriptional activators for target specificity screening and paired nickases for cooperative genome engineering,"Nat.Biotechnol.,2013,Vol.31:833-838;およびZalatan et al.,"Engineering complex synthetic transcriptional programs with CRISPR RNA scaffolds,"Cell,2015,Vol.160:339-350に記載されている。これらの夫々はそれらの全体が参照によって本願に組み込まれる。他のシステムは、PCPタンパク質を特異的に動員するPP7ヘアピンおよびComタンパク質を特異的に動員する「com」ヘアピンを包含する。Zalatan et al.を見よ。これらの周知の動員システムのいずれかは本明細書に記載のトランスプライム編集に使用され得る。 While this example utilizes MS2 tagging technology (comprising the MS2 RNA aptamer of tPERT paired with the MS2cp protein fused to the prime editor), other RNA-protein recruitment systems could alternatively be used. The general concept envisioned here is that the DNA synthesis template of tPERT is modified to contain an RNA recruitment secondary structure (e.g., a specialized hairpin such as the MS2 aptamer) such that tPERT can be recruited by a modified prime editor fusion protein that further comprises an RNA binding protein that specifically recognizes and binds to the RNA recruitment second structure on the tPERT molecule. Reviews of other RNA-protein recruitment domains are provided in the art, e.g., Johansson et al., "RNA recognition by the MS2 phage coat protein," Sem Virol., 1997, Vol. 8(3):176-185; Delebecque et al., "Organization of intracellular reactions with rationally designed RNA assemblies," Science, 2011, Vol. 333:470-474; Mali et al., "Cas9 transcriptional activators for target specificity screening and paired nickases for cooperative genome engineering," Nat. Biotechnol., 2013, Vol. 31:833-838; and Zalatan et al., "Engineering complex synthetic transcriptional programs with CRISPR RNA scaffolds," Cell, 2015, Vol. 160:339-350, each of which is incorporated herein by reference in its entirety. Other systems include the PP7 hairpin, which specifically recruits the PCP protein, and the "com" hairpin, which specifically recruits the Com protein. See Zalatan et al. Any of these well-known recruitment systems can be used for trans-prime editing as described herein.

本tPERTトランスプライム編集システムの効率を試験した。His6挿入(18bp)の最高で20%の効率がHEK293T細胞のHEK3部位において達成された。単一の3’MS2アプタマー、13ntプライマー結合部位、および挿入配列と座位に対する34ntの相同性とを含有するRT鋳型を含有するtPERTを、PE2のN末端に融合されたMS2cpを含有する編集因子と併せて用いた。図73を見よ。トランスプライム編集の戦略は、PEgRNAのPEgRNAデザインに関連する複雑化に対処するポテンシャルを有し、プライム編集因子ニック部位からさらに遠くの距離におけるより大きい挿入、欠失、または編集を達成するためのより長いRT鋳型により適し得る。 The efficiency of the present tPERT trans-prime editing system was tested. A maximum efficiency of 20% of His6 insertion (18bp) was achieved at the HEK3 site in HEK293T cells. tPERT containing an RT template containing a single 3'MS2 aptamer, a 13nt primer binding site, and 34nt of homology to the insert sequence and locus was used in conjunction with an editor containing MS2cp fused to the N-terminus of PE2. See Figure 73. The trans-prime editing strategy has the potential to address complications associated with the PEgRNA design of the PEgRNA and may be more amenable to longer RT templates to achieve larger insertions, deletions, or edits at greater distances from the prime editor nick site.

(B)RNAおよびDNA合成鋳型を有する化学合成PEgRNA
代替的な核酸鋳型が化学合成PEgRNA上に用いられ得る(図72C)。例えば、合成PEgRNAはRNA/DNAハイブリッドとして構築され得、スペーサー配列およびsgRNA骨格がRNAヌクレオチドから成り、プライマー結合部位および合成鋳型(図72Cにおいて3'伸長として示される)がDNAヌクレオチドから成る。これはDNA依存性DNAポリメラーゼが逆転写酵素の代わりにプライム編集因子上に用いられることを許し得る。それはsgRNA骨格配列を鋳型とするDNAの合成をもまた防止し得る。他のデザインでは、鋳型とされないヌクレオチドから成る化学的リンカーまたは他の好適なリンカー部分が、核酸編集鋳型(RNAまたはDNAから成る)をsgRNA骨格にテザリングするために用いられ得る。これはsgRNA骨格の連続したDNA重合を防止し得、より効率的な鋳型による合成を許す伸長のフレキシビリティーを許し得る。最後に、核酸合成鋳型の方向性が逆位させられ得、その結果、DNA重合が、それの方と対比してsgRNA骨格から別方向に進む。
(B) Chemically synthesized PEgRNA with RNA and DNA synthesis templates.
Alternative nucleic acid templates can be used on the chemically synthesized PEgRNA (Figure 72C ). For example, the synthetic PEgRNA can be constructed as an RNA/DNA hybrid, with the spacer sequence and sgRNA backbone composed of RNA nucleotides, and the primer binding site and synthesis template (shown as the 3' extension in Figure 72C ) composed of DNA nucleotides. This can allow a DNA-dependent DNA polymerase to be used to prime the editor instead of reverse transcriptase. It can also prevent DNA synthesis templated to the sgRNA backbone sequence. In other designs, a chemical linker composed of non-templated nucleotides or other suitable linker moieties can be used to tether the nucleic acid editing template (composed of RNA or DNA) to the sgRNA backbone. This can prevent continued DNA polymerization of the sgRNA backbone and allow flexibility in the extension to allow more efficient templated synthesis. Finally, the orientation of the nucleic acid synthesis template can be reversed, so that DNA polymerization proceeds in the other direction from the sgRNA backbone versus towards it.

(C)トランスで発現されるDNAポリメラーゼの動員
プライム編集の主な態様では、ポリメラーゼ(例えば、逆転写酵素酵素)はnapDNAbp(例えば、Cas9ニッカーゼ)への融合体として発現される。代替的には、ポリメラーゼ(例えば、逆転写酵素)はトランスで発現され得、その活性が、MS2 RNAアプタマーおよびMS2コートタンパク質などの動員システム、または当該技術分野で公知の他の類似の動員システムを用いて編集部位に局在し得る。このシステムでは、PEgRNAはMS2アプタマーをsgRNA骨格ヘアピンの1つに包含するように改変され、ポリメラーゼ(例えば、逆転写酵素)はMS2cpへの融合タンパク質として発現される。napDNAbp(例えば、Cas9ニッカーゼ)は独立したポリペプチドとしてもまた発現される。このシステムは野生型M-MLV逆転写酵素について実証されており(図74)、他のRTバリアントに適用可能であるはずである。加えて、他のRNA-タンパク質相互作用またはタンパク質-タンパク質相互作用がRT動員に用いられ得る。
次の配列は例19に当てはまる:
tPERTの配列:

Figure 2020191243000435

MS2 PEgRNAの配列:
Figure 2020191243000436

タンパク質配列:
Figure 2020191243000437

Figure 2020191243000438

Figure 2020191243000439

Figure 2020191243000440

Figure 2020191243000441
(C) Recruitment of DNA polymerase expressed in trans In the main embodiment of prime editing, the polymerase (e.g., reverse transcriptase enzyme) is expressed as a fusion to napDNAbp (e.g., Cas9 nickase). Alternatively, the polymerase (e.g., reverse transcriptase) can be expressed in trans and its activity can be localized to the editing site using a recruitment system such as MS2 RNA aptamer and MS2 coat protein, or other similar recruitment systems known in the art. In this system, the PEgRNA is modified to include the MS2 aptamer in one of the sgRNA backbone hairpins, and the polymerase (e.g., reverse transcriptase) is expressed as a fusion protein to MS2cp. The napDNAbp (e.g., Cas9 nickase) is also expressed as an independent polypeptide. This system has been demonstrated for wild-type M-MLV reverse transcriptase (Figure 74) and should be applicable to other RT variants. In addition, other RNA-protein interactions or protein-protein interactions can be used for RT recruitment.
The following sequence applies to Example 19:
tPERT sequence:
Figure 2020191243000435

MS2 PEGRNA sequence:
Figure 2020191243000436

Protein sequence:
Figure 2020191243000437

Figure 2020191243000438

Figure 2020191243000439

Figure 2020191243000440

Figure 2020191243000441

例20.プライム編集因子の分裂インテイン送達
この例は、別個のベクターによって細胞にプライム編集因子を送達するための手段として、プライム編集因子がインテインを用いて分裂され得るということを実証する。各ベクターはプライム編集因子融合タンパク質のある部分をコードする。この例は標準的なSpCas9(配列番号18)を含むPE融合タンパク質にフォーカスする。他のCas9タンパク質の分裂部位は対応する同じ部位であり得るか、または各異なるCas9タンパク質について最適化されることを必要とし得る。本例では、プライム編集因子をSpCas9(配列番号18)の残基1023および1024の間で分裂した。これは「1023/1024」分裂部位と言われる。
Example 20. Split Intein Delivery of Prime Editor This example demonstrates that a prime editor can be split using an intein as a means to deliver the prime editor to cells by separate vectors. Each vector encodes a portion of a prime editor fusion protein. This example focuses on a PE fusion protein containing the standard SpCas9 (SEQ ID NO: 18). The split site for other Cas9 proteins can be the same corresponding site or may need to be optimized for each different Cas9 protein. In this example, the prime editor was split between residues 1023 and 1024 of SpCas9 (SEQ ID NO: 18). This is referred to as the "1023/1024" split site.

プライム編集因子(PE)はAAVパッケージング容量を超過する。よって、トランススプライシングNpuインテインを配列番号18のS. pyogenes Cas9残基1024に挿入することによってPEを分裂し、夫々が二元的AAVシステムの1つによってコードされる2つの別個のポリペプチドとしての分裂SpPEの送達を許すことが企図された。それは(1)ガイドカセット(単数または複数)および最小限の制御エレメントのための空間を容れながら、2つのAAVへのパッケージングを許す、(2)ネイティブなセリンからシステインへの変異は相対的に保存的であろう、(3)部位は、スプライシングが生起することを許すことが立体的に予測されるCas9の辺縁部の近くのフレキシブルなループである、そして(4)Cas9は(先には、この特定の分裂部位ではないが)このループにおいて循環置換によって首尾良く変改されているので、分裂部位1023/1024が選ばれた。 The prime editor (PE) exceeds AAV packaging capacity. Therefore, it was envisioned to split PE by inserting a trans-splicing Npu intein into S. pyogenes Cas9 residue 1024 of SEQ ID NO:18, allowing delivery of the split SpPE as two separate polypeptides, each encoded by one of the binary AAV systems. The split site 1023/1024 was chosen because it (1) allows packaging into two AAVs while allowing space for the guide cassette(s) and minimal control elements, (2) the native serine to cysteine mutation would be relatively conservative, (3) the site is a flexible loop near the edge of Cas9 that is sterically predicted to allow splicing to occur, and (4) Cas9 has been successfully altered by circular permutation in this loop (although not previously at this particular split site).

Npu分裂プライム編集因子が活性化であるかどうかを決定するために、HEK細胞を分裂編集因子をコードするプラスミドによってトランスフェクションし、それらが全長PE3の活性を再現するということを見出した。高スループット配列決定によって分析した。さらにその上、C末端エクステインの3つのネイティブなNpuアミノ末端残基は最も効率的にスプライシングすることが公知であるが、Cas9残基1024をネイティブにフランキングするものとは異なる。ネイティブなNpu残基によるこれらのCas9残基の置き換えは、プライム編集因子の活性を変改し得る。よって、Cas9にネイティブな「SEQ」からNpuインテイン「CFN」配列への変異がプライム編集の効率を変改するかどうかを決定した。「SEQ」残基は、全長に類似の効率でプライム編集を容易化し、インテイン分裂PEの半分同士が会合しプライム編集を媒介する能力があるということを示唆する。「CFN」への変異によるさらなる増大は見られず、我々が先にインテイン分裂塩基編集因子で観察したとおり、会合単独が分裂PE活性にとって十分であり得るということを示唆した。 To determine whether the Npu split prime editors are active, we transfected HEK cells with plasmids encoding the split editors and found that they recapitulated the activity of full-length PE3. We analyzed them by high-throughput sequencing. Furthermore, the three native Npu amino-terminal residues of the C-terminal extein known to splice most efficiently are different from those natively flanking Cas9 residue 1024. Replacement of these Cas9 residues with native Npu residues may alter the activity of the prime editor. We therefore determined whether mutation of the Cas9 native “SEQ” to the Npu intein “CFN” sequence altered the efficiency of prime editing. The “SEQ” residues facilitated prime editing with an efficiency similar to the full-length, suggesting that the intein split PE halves are capable of associating with each other and mediating prime editing. Mutation to “CFN” did not result in any further increase, suggesting that association alone may be sufficient for split PE activity, as we have previously observed with intein split base editors.

会合した未スプライシングの編集因子は活性であり得るが、開始ステップの間の不完全なスプライシングからもたらされるプライム編集因子の立体性の撹乱が編集アウトカムに影響し得る。よって、1024-CFNをさらなる研究のために選んだ。なぜなら、それもまた全長PE3活性を再現するからである。 Although the associated unspliced editors can be active, steric disturbance of the prime editor resulting from incomplete splicing during the initiation step may affect the editing outcome. Therefore, 1024-CFN was chosen for further studies because it also recapitulates full-length PE3 activity.

以下は1023/1024分裂のアミノ酸配列である。 Below is the amino acid sequence of the 1023/1024 split.

1023/1024 N末端半分でのSpPE2分裂 1023/1024 SpPE2 splitting at the N-terminal half

Figure 2020191243000442
Figure 2020191243000442

Figure 2020191243000443
Figure 2020191243000443

Figure 2020191243000444
Figure 2020191243000444

1023/1024 C末端半分でのSpPE2分裂 1023/1024 SpPE2 split at the C-terminal half

Figure 2020191243000445
Figure 2020191243000445

Figure 2020191243000446
Figure 2020191243000446

二元的AAVシステムによってパッケージングされた(packages)プライム編集因子
Npuトランススプライシングインテインによって残基1023および1024の間で分裂されたプライム編集因子はAAV内にパッケージングされる(packages)ようになり、同じ様式で生じた類似のゲノムサイズの塩基編集因子のものと遜色ない高い力価を有する。
Prime editing factors packaged by the binary AAV system
Primed editors split between residues 1023 and 1024 by the Npu trans-splicing intein become packaged into AAV with high titers that compare favorably with those of base editors of similar genome size generated in the same manner.

インビボのプライム編集
P0マウスへの脳室内注射によってAAV9によって送達された分裂SpPE3は、インビボの脳組織においてプライム編集を媒介する。GからTの位置+5におけるヌクレオチド置換(すなわち、ニック部位の5ヌクレオチド塩基下流かつPAM配列上)は、DNMT1のN末端の近くのPro>Glnをコードする変異の組み入れをもたらす。この編集はインビボのプライム編集の実行可能性を実証し、編集された細胞に対するいずれかの選択圧を導入するとは考えられない(「+5」はニック部位の下流の+5位置を言う)。試験されたAAVアーキテクチャは全長MMLV RTとRNAse Hドメインを欠く短縮されたバリアントとを包含する。短縮された転写後制御エレメントW3をもまた評価した。なぜなら、それは、インビボのウイルスカセットからの発現を増大させることが示されているが、その重要性は塩基編集因子またはプライム編集因子コンテキストにおいては試験されていなかったからである。全長RTは短縮されたRTに優り、W3配列の追加は活性を改善するということが見出された。W3が存在するときの編集活性の増大は、プライム編集因子の発現がインビボでは限定されるということを指示し、細胞培養に対してインビボのプライム編集の別物の課題を実証する。
In vivo prime editing
Split SpPE3 delivered by AAV9 via intracerebroventricular injection into P0 mice mediates prime editing in brain tissue in vivo. A nucleotide substitution at position +5 from G to T (i.e., 5 nucleotide bases downstream of the nick site and on the PAM sequence) results in the incorporation of a mutation encoding Pro>Gln near the N-terminus of DNMT1. This edit demonstrates the feasibility of prime editing in vivo and is not expected to introduce any selective pressure on edited cells ("+5" refers to the +5 position downstream of the nick site). The AAV architectures tested include full-length MMLV RT and a truncated variant lacking the RNAse H domain. The truncated posttranscriptional control element W3 was also evaluated because it has been shown to increase expression from viral cassettes in vivo, but its importance had not been tested in a base editor or prime editor context. It was found that full-length RT outperforms truncated RT and the addition of the W3 sequence improves activity. The increase in editing activity in the presence of W3 indicates that expression of prime editing factors is limiting in vivo and demonstrates the distinct challenge of prime editing in vivo versus cell culture.

参考文献
Oakes,B.L.,Fellmann,C.et al.CRISPR-Cas9 Circular Permutants as Programmable Scaffolds for Genome Modification.Cell.2019 Jan 10;176(1-2):254-267.e16.doi:10.1016/j.cell.2018.11.052.
References
Oakes, BL, Fellmann, C. et al. CRISPR-Cas9 Circular Permutants as Programmable Scaffolds for Genome Modification. Cell. 2019 Jan 10;176(1-2):254-267.e16.doi:10.1016/j.cell.2018.11.052.

例21.PE2フォーマットでのリンカー最適化
この例は、全てPE2に基づくいくつものバリアントプライム編集因子を構築した。PE2は次の配列および構造を有する:
Example 21. Linker optimization in PE2 format. In this example, several variant prime editors were constructed that are all based on PE2. PE2 has the following sequence and structure:

本願において用いられる「PE2」は、次の構造を有するCas9(H840A)とバリアントMMLV RTとを含む融合タンパク質を含むPE複合体を言う:[NLS]-[Cas9(H840A)]-[リンカー]-[MMLV_RT(D200N)(T330P)(L603W)(T306K)(W313F)]+所望のPEgRNA。PE融合体は配列番号134のアミノ酸配列を有し、これは次のとおり示される:

Figure 2020191243000447
As used herein, "PE2" refers to a PE complex that includes a fusion protein comprising Cas9(H840A) and a variant MMLV RT having the following structure: [NLS]-[Cas9(H840A)]-[Linker]-[MMLV_RT(D200N)(T330P)(L603W)(T306K)(W313F)]+desired PE gRNA. The PE fusion has the amino acid sequence of SEQ ID NO: 134, which is set forth as follows:
Figure 2020191243000447

M-MLV逆転写酵素(配列番号139)。 M-MLV reverse transcriptase (sequence number 139).

PE2リンカーは、SGGSSGGSSGSETPGTSESATPESSGGSSGGSS(配列番号127)である。 The PE2 linker is SGGSSGGSSGSETPGTSESATPESSGGSSGGSS (sequence number 127).

この実験では、PE2のリンカーを次の代わりのリンカーの1つによって置き換えた(または1つの場合にはリンカーなし):

Figure 2020191243000448

Figure 2020191243000449
In this experiment, the linker in PE2 was replaced by one of the following alternative linkers (or in one case no linker):
Figure 2020191243000448

Figure 2020191243000449

図79は置き換えリンカー構築物の編集効率を示す。特に、データは、現行のリンカーによるPE2構築物(PE2として記されている。白色のボックス)の編集効率を、指示されている配列によって置き換えられたリンカーによる種々のバージョンと比較して、HEK3、EMX1、FANCF、RNF2座位において、トランジション、トランスバージョン、挿入、および欠失編集のための代表的なPEgRNAについて示す。置き換えリンカーは「1×SGGS」(配列番号174)、「2×SGGS」(配列番号446)、「3×SGGS」(配列番号3889)、「1×XTEN」(配列番号171)、「リンカーなし」、「1×Gly」、「1×Pro」、「1×EAAAK」(配列番号3968)、「2×EAAAK」(配列番号3969)、および「3×EAAAK」(配列番号3970)と言われる。編集効率は棒グラフフォーマットでPE2の「対照」編集効率に対して相対的に測定される。PE2のリンカーはSGGSSGGSSGSETPGTSESATPESSGGSSGGSS(配列番号127)である。全ての編集はPE3システムという文脈でされた。すなわち、これはPE2編集構築物プラス最適な二次sgRNAニッキングガイドの追加を言う。 Figure 79 shows the editing efficiency of replacement linker constructs. In particular, the data shows the editing efficiency of the PE2 construct with the current linker (denoted as PE2, white box) compared to various versions with the linker replaced by the indicated sequence for representative PEgRNAs for transition, transversion, insertion, and deletion editing at the HEK3, EMX1, FANCF, and RNF2 loci. The replacement linkers are referred to as "1xSGGS" (SEQ ID NO: 174) , "2xSGGS" (SEQ ID NO: 446) , "3xSGGS" (SEQ ID NO: 3889) , "1xXTEN" (SEQ ID NO: 171) , "No Linker", "1xGly", "1xPro", "1xEAAAK" (SEQ ID NO: 3968) , "2xEAAAK" (SEQ ID NO: 3969) , and "3xEAAAK" (SEQ ID NO: 3970) . Editing efficiency is measured relative to the "control" editing efficiency of PE2 in a bar graph format. The linker for PE2 is SGGSSGGSSGSETPGTSESATPESSGGSSGGSS (SEQ ID NO: 127). All edits were made in the context of the PE3 system, i.e., this refers to the addition of the PE2 editing construct plus an optimal secondary sgRNA nicking guide.

図80は、1×XTEN(配列番号171)リンカーが編集効率の増大を提供したということを示す。PE2に対して相対的な平均の~倍効力を取ることは、示されているグラフを生み、1×XTEN(配列番号171)リンカー配列の使用が編集効率を平均で1.14倍改善するということを指示している(n=15)。 Figure 80 shows that the 1xXTEN (SEQ ID NO: 171) linker provided increased editing efficiency. Taking the average fold potency relative to PE2 produced the graph shown, indicating that use of the 1xXTEN (SEQ ID NO: 171) linker sequence improved editing efficiency by an average of 1.14-fold (n=15).

例22.改善された活性を有するプライム編集因子ガイドRNA
種々の態様において、PEgRNAは標的DNA部位および編集依存的であることが蓋然的である。つまり、PEgRNAの配列は、標的DNA配列およびプライム編集によってそれに導入されようとする具体的な編集(例えば、欠失、挿入、逆位、置換)に依存するであろう。例えば、ある態様において、PEgRNAのプライマー結合部位(PBS)の3'のモチーフを取り付けるときには、PE融合タンパク質のポリメラーゼドメイン(例えば、逆転写酵素)との立体的衝突を防止するために、PBSおよびモチーフの間のリンカーが好ましい。しかしながら、そのリンカーの性質は各部位について異なり得る。例えば、同じリンカーが各部位に用いられた場合には、それはスペーサー配列に対する偶然の対形成によって偽性的に13nt PBSを16nt PBSにし得る。類似に、リンカーはPBSそれ自体に塩基対形成し得、その閉じ込めをもたらし、可能性としては活性を縮減する。そのため、PEまたはBE4などのタンパク質に基づく編集因子とは違って、2つのエレメントを接続する単一リンカー配列オプションは各構築物に有効ではなくあり得、部分的には、標的DNA配列および目当ての編集の配列に依存するであろう。
Example 22. Prime editor guide RNAs with improved activity
In various embodiments, the PEgRNA is likely to be target DNA site and editing dependent. That is, the sequence of the PEgRNA will depend on the target DNA sequence and the specific edit (e.g., deletion, insertion, inversion, substitution) to be introduced therein by prime editing. For example, in some embodiments, when attaching a motif 3' of the primer binding site (PBS) of the PEgRNA, a linker between the PBS and the motif is preferred to prevent steric clashes with the polymerase domain (e.g., reverse transcriptase) of the PE fusion protein. However, the nature of the linker may be different for each site. For example, if the same linker is used for each site, it may spuriously turn a 13nt PBS into a 16nt PBS by fortuitous pairing to the spacer sequence. Similarly, the linker may base pair to the PBS itself, resulting in its entrapment and possibly reducing activity. Therefore, unlike protein-based editing factors such as PE or BE4, a single linker sequence option connecting the two elements may not be effective for each construct and will depend, in part, on the sequence of the target DNA sequence and the desired edit.

部分的には、例15(PEgRNAのデザインおよび操作)において提示されている情報に立脚して、この例は、PEgRNAになされた種々の構造改変を構築し、それから、他の側面の中でも編集機能に対するそれの効果を試験した。
非pol IIIプロモーターからのPEgRNAの発現
Building in part on the information presented in Example 15 (Design and Engineering of PEgRNA), this example constructed various structural modifications made to PEgRNA and then tested their effect on editing function, among other aspects.
Expression of PEgRNA from a non-pol III promoter

種々のPEgRNA発現システムを、PEgRNAを生成するそれらの能力について試験した。読み出しとしてFKBPからの102ヌクレオチド配列の挿入を用いた。 Various PEgRNA expression systems were tested for their ability to produce PEgRNA, using the insertion of a 102 nucleotide sequence from FKBP as readout.

PEgRNAの転写はU6プロモーターなどの典型的な恒常的プロモーターによって導かれ得る。U6プロモーターはほとんどのケースではPEgRNAの転写を導くことに有効であるが、U6プロモーターはより長いPEgRNAまたはUリッチなRNAの転写を導くことにはあまり有効ではない。UリッチなRNAストレッチは転写の未成熟な終結を引き起こす。この例は、CMVプロモーターまたはU1プロモーターから発現されるガイドの編集アウトカムをU6プロモーターと比較した。これらのプロモーターは下で提供されるMASC ENEまたはPAN ENEなどの異なるターミネーター配列を要求する。編集の増大がpCMV/MASC-ENEシステムでは観察された。しかしながら、これらのガイドは配列の不完全な挿入をもたらしたが、U6プロモーターでは、完全な挿入がより低いレベルの編集において観察された。図81を見よ。データは、代替的な発現システムが長い挿入にとって有用であり得るという蓋然性を示唆している。 Transcription of PEgRNA can be driven by a typical constitutive promoter such as the U6 promoter. Although the U6 promoter is effective in driving transcription of PEgRNA in most cases, the U6 promoter is less effective at driving transcription of longer PEgRNA or U-rich RNAs. U-rich RNA stretches cause premature termination of transcription. This example compares the editing outcomes of guides expressed from the CMV promoter or U1 promoter with the U6 promoter. These promoters require different terminator sequences such as MASC ENE or PAN ENE as provided below. Increased editing was observed with the pCMV/MASC-ENE system. However, these guides resulted in incomplete insertion of sequences, whereas with the U6 promoter, complete insertion was observed at lower levels of editing. See Figure 81. The data suggests the possibility that alternative expression systems may be useful for long insertions.

pCMV/MASC-ENE発現システムのヌクレオチド配列は次のとおり(5'から3'の方向)(モチーフの名称はそれが指す領域に直ちに先立って太字である): The nucleotide sequence of the pCMV/MASC-ENE expression system is as follows (5' to 3' orientation) (the names of motifs are in bold immediately preceding the region they refer to):

Figure 2020191243000450

Figure 2020191243000451

Figure 2020191243000452

PEgRNA骨格の改善
Figure 2020191243000450

Figure 2020191243000451

Figure 2020191243000452

Improvement of the PEGRNA backbone

gRNA骨格のいくつもの構造改変をもまた試験した。これらのいずれも編集活性の有意な増大を示さなかった(3.30と比較してX軸の3.30.13から3.30.19において図82を見よ)。しかしながら、このデータは注意する価値がある2つの警告を有する。第1に、このガイドはすでに割と良く働いており、より有効でないガイドが試験される方が良かったであろう。第2に、HEK細胞では、トランスフェクションが割と効率的であり、トランスフェクションされるガイドRNAの量は、必要とされるものと比較して大過剰であるということが注意された(量を、~4~8倍縮減することは編集に対する効果を有さない)。これらの改善は、トランスフェクション効率がより低い他の細胞型で、またはより有効でないガイドによってのみ見られ得る。これらの変化の多くは、他の細胞株においてsgRNA活性を改善するための前例とされる。 Several structural modifications of the gRNA backbone were also tested. None of these showed a significant increase in editing activity (see Figure 82 at 3.30.13 to 3.30.19 on the X-axis compared to 3.30). However, this data has two caveats worth noting. First, this guide already worked quite well, and a less effective guide would have been better tested. Second, it was noted that in HEK cells, transfection was quite efficient, and the amount of guide RNA transfected was in vast excess compared to what was needed (reducing the amount by 4-8 fold had no effect on editing). These improvements may only be seen in other cell types with lower transfection efficiency, or with less effective guides. Many of these changes are precedents for improving sgRNA activity in other cell lines.

図82の構築物の配列は次のとおりである:

Figure 2020191243000453

Figure 2020191243000454

Figure 2020191243000455

Figure 2020191243000456

末端モチーフが存在しないかまたは一続きのUで終わらない末端モチーフが存在するかどちらかであるところではいつも、転写物は次のHDVリボザイムを用いて終結させられたということに注意せよ:
GGCCGGCAUGGUCCCAGCCUCCUCGCUGGCGCCGGCUGGGCAACAUGCUUCGGCAUGGCGAAUGGGAC [配列番号3990] The sequence of the construct in Figure 82 is as follows:
Figure 2020191243000453

Figure 2020191243000454

Figure 2020191243000455

Figure 2020191243000456

Note that wherever there was either no terminal motif present or a terminal motif that did not end with a stretch of U's, the transcript was terminated using the following HDV ribozyme:
GGCCGGCAUGGUCCCAGCCUCCUCGCUGGCGCCGGCUGGGCAACAUGCUUCGGCAUGGCGAAUGGGAC [SEQ ID NO: 3990 ]

追加のRNAモチーフ
ある種のモチーフ、例えばPEgRNAの3'のHDVリボザイム、またはG四重鎖挿入、P1伸長、鋳型ヘアピン、およびテトラループサークルの詳細については、図82を見よ。これらはその性能を改善するためにPEgRNA上に導入され得る。
Additional RNA Motifs Certain motifs, such as the HDV ribozyme 3' of the PEgRNA, or G-quadruplex insertions, P1 extensions, templated hairpins, and tetraloop circles, see Figure 82 for details, which can be introduced onto the PEgRNA to improve its performance.

特に、この例は、プライマー結合部位の3'にtRNAモチーフを組み入れることの効果を試験した。このエレメントは複数の可能性ある機能ゆえに選ばれた: In particular, this example tested the effect of incorporating a tRNA motif 3' to the primer binding site. This element was chosen because of several possible functions:

(1)tRNAモチーフは非常に安定なRNAモチーフであり、そのため、可能性としてはPEgRNA分解を縮減し得る; (1) The tRNA motif is a highly stable RNA motif and therefore potentially reduces PEgRNA degradation;

(2)MMLV RTは転写の間にウイルスゲノムをDNAに変換するときのプライマーとしてプロリル-tRNAを用いる。そのため、同じキャップがRTによって結合され得、PEによるPEgRNAの結合、RNA安定性を改善し、PBSをゲノム部位の近接する近位に再び持って来て、可能性としては活性をもまた改善するのではないかと思われた。 (2) MMLV RT uses prolyl-tRNA as a primer to convert the viral genome to DNA during transcription. Therefore, it was thought that the same cap could be bound by RT, improving PE-gRNA binding by PE, RNA stability, and bringing the PBS back into close proximity to the genomic site, potentially improving activity as well.

これらの構築物では、tRNAのP1(図84を見よ)を伸長した。P1はtRNAの第1のステム/塩基対形成エレメントを言う(図84を見よ)。これは、PEgRNAからのその除去をもたらすであろうP1の5’のtRNAのRNAsePによって媒介される切断を防止するために必要であると信じられた。 In these constructs, P1 (see Figure 84) of the tRNA was extended. P1 refers to the first stem/base-pairing element of the tRNA (see Figure 84). This was believed to be necessary to prevent RNAse P-mediated cleavage of the tRNA 5' to P1, which would result in its removal from the PEgRNA.

このデザインでは、tRNAおよびPBSの間の短い3ntリンカーおよび伸長されたP1を有するプロリル-tRNA(コドンCGG)を用いた。種々のtRNAデザインを試験し、編集効率をtRNAキャップを有さないPEgRNAと比較して試験した。図83(HEK3遺伝子の編集を標的化したPE実験を図示する。ニック部位に対して相対的に位置+1における10nt挿入の挿入を特異的に標的化し、PE3を用いた)、図85(FANCF遺伝子の編集を標的化したPE実験を図示する。ニック部位に対して相対的に位置+5におけるGからTの変換を特異的に標的化し、PE3構築物を用いた)、および図86(HEK3遺伝子の編集を標的化したPE実験を図示する。ニック部位に対して相対的に位置+1における71nt FLAGタグ挿入の挿入を特異的に標的化し、PE3構築物を用いた)の比較データを見よ。tRNA修飾されたPEgRNAを未修飾のPEgRNA対照に対して試験した。 This design used a prolyl-tRNA (codon CGG) with a short 3 nt linker between the tRNA and PBS and an extended P1. Various tRNA designs were tested and editing efficiency was compared to PEgRNA without a tRNA cap. See comparative data in Figure 83 (illustrating a PE experiment targeted to HEK3 gene editing, specifically targeting the insertion of a 10 nt insertion at position +1 relative to the nick site, using PE3), Figure 85 (illustrating a PE experiment targeted to FANCF gene editing, specifically targeting the G to T conversion at position +5 relative to the nick site, using PE3 construct), and Figure 86 (illustrating a PE experiment targeted to HEK3 gene editing, specifically targeting the insertion of a 71 nt FLAG tag insertion at position +1 relative to the nick site, using PE3 construct). tRNA modified PEgRNA was tested against unmodified PEgRNA control.

UGG/CGGは用いられたコドンを言い、数は追加されたP1伸長の長さを言い、長は8ntリンカーを指示し、指定なしは3ntリンカーである。 UGG/CGG refers to the codons used, the number refers to the length of the P1 extension added, length indicates an 8 nt linker, no specification is a 3 nt linker.

データは、tRNAの組み入れがより短いPBSの使用を可能化し得るということを示唆している。これは蓋然的には追加の活性改善をもたらすであろう。RNF2のケースでは、用いられたリンカーが、スペーサーに対する改善されたPBS結合と活性のもたらされる逓減とをもたらしたということが可能/蓋然的である。 The data suggest that incorporation of tRNA may allow the use of shorter PBSs, which would likely result in additional activity improvements. In the case of RNF2, it is possible/probable that the linker used resulted in improved PBS binding to the spacer and a resulting decrease in activity.

使用されたいくつかの配列: Some sequences used:

HEK3+1 FLAG-タグ挿入、プロリル-tRNA{UGG} P1 ext 5nt、リンカー3nt HEK3+1 FLAG-tag insertion, prolyl-tRNA{UGG} P1 ext 5nt, linker 3nt

GGCCCAGACUGAGCACGUGAGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUGGAGGAAGCAGGGCUUCCUUUCCUCUGCCAUCACUUAUCGUCGUCAUCCUUGUAAUCCGUGCUCAGUCUGUCUGGCGGGGCUCGUUGGUCUAGGGGUAUGAUUCUCGCUUCGGGUGCGAGAGGUCCCGGGUUCAAAUCCCGGACGAGCCCCGCCUUUU[配列番号3902] GGCCCAGACUGAGCACGUGAGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUGGAGGAAGCAGGGCUUCCUUUCCUGCCAUCACUUAUCGUCGUCAUCCUUGUAAUCCGUGCUCAGUCUGUCUGGCGGGGCUCGUUGGUCUAGGGGUAUGAUUCUCGCUUCGGGUGCGAGAGGUCCCGGGUUCAAAUCCCGGACGAGCCCCGCCUUUU[Sequence number 3902]

FANCF+5G→Tプロリル-tRNA{CGG} P1 ext 5nt、リンカー3nt FANCF+5G→T prolyl-tRNA{CGG} P1 ext 5nt, linker 3nt

GGAAUCCCUUCUGCAGCACCGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCGGAAAAGCGAUCAAGGUGCUGCAGAAGGGAUCUGGCGGGGCUCGUUGGUCUAGGGGUAUGAUUCUCGCUUCGGGUGCGAGAGGUCCCGGGUUCAAAUCCCGGACGAGCCCCGCCUUUU[配列番号3903] GGAAUCCCUUCUGCAGCACCGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCGGAAAAGCGAUCAAGGUGCUGCAGAAGGGAUCUGGCGGGGCUCGUUGGUCUAGGGGUAUGAUUCUCGCUUCGGGUGCGAGAGGUCCCGGGUUCAAAUCCCGGACGAGCCCCGCCUUUU[Sequence number 3903]

HEK3++1 10nt挿入,、プロリル-tRNA{UGG} P1 ext 5nt、リンカー3nt HEK3++1 10nt insertion, prolyl-tRNA{UGG} P1 ext 5nt, linker 3nt

GGCCCAGACUGAGCACGUGAGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGGACCGAGUCGGUCCUCUGCCAUCAAAGCUUCGACCGUGCUCAGUCUUCUGCUCGAGGCGGGGCUCGUUGGUCUAGGGGUAUGAUUCUCGCUUCGGGUGCGAGAGGUCCCGGGUUCAAAUCCCGGACGAGCCCCGCCUCGAGCUUUU[配列番号3904] GGCCCAGACUGAGCACGUGAGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGGACCGAGUCGGUCCUCUGCCAUCAAAGCUUCGACCGUGCUCAGUCUUCUGCUCGAGGCGGGGCUCGUUGGUCUAGGGGUAUGAUUCUCGCUUCGGGUGCGAGAGGUCCCGGGUUCAAAUCCCGGACGAGCCCCGCCUCGAGCUUUU[Sequence number 3904]

図85および86のデータに報告された配列は以下のとおりである:

Figure 2020191243000457

Figure 2020191243000458

Figure 2020191243000459

Figure 2020191243000460
The sequences reported in the data in Figures 85 and 86 are as follows:
Figure 2020191243000457

Figure 2020191243000458

Figure 2020191243000459

Figure 2020191243000460

例23.CDKL5および鎌状赤血球症を修正するためのプライム編集の使用
1412delA変異を有するCDKL5のマウスモデルをデザインするためのPEの使用
CDKL5欠損症障害(CDD)は神経変性疾患であり、最も多くの場合にはサイクリン依存性キナーゼ様5遺伝子の自然突然変異によって引き起こされる。症状は早期小児期に現れ、痙攣発作、不規則な睡眠パターン、胃腸ストレス、および発達遅滞を包含する。1412delAを包含するCDDを引き起こすいくつかの変異は塩基編集によって修正され得ない。しかしながら、プライム編集は全ての塩基から塩基の変化、欠失、および挿入を精密に修正するポテンシャルを有する。1412delA変異へのフォーカスによって、変異を抱くマウスニューロン細胞株(N2A)を確立することを期待して、この例は変異を挿入することができるpegRNAをデザインおよび試験した。これは、変異を修正する可能性として治療学的なpegRNAを大規模スクリーニングすることを許すであろう。究極的なゴールは、1412delA変異を有するCDDマウスモデルまで進展して、治療学的効果を評価する能力があることである。CDDの現行のマウスモデルはヒト化アレルを有さない。しかしながら、pegRNAの最適化がHEK293T細胞においても進行中である。図87および88はpegRNAが1412Adelを組み入れるN2A細胞におけるパイロットスクリーンからの結果であり、プライマー結合部位(PBS)長さおよび逆転写酵素(RT)鋳型長さについての詳細を有する(インデルありおよびなしで示されている)。
Example 23. Use of prime editing to correct CDKL5 and sickle cell disease
Using PE to design a mouse model of CDKL5 harboring the 1412delA mutation
CDKL5 deficiency disorder (CDD) is a neurodegenerative disease, most often caused by spontaneous mutations in the cyclin-dependent kinase-like 5 gene. Symptoms appear in early childhood and include seizures, irregular sleep patterns, gastrointestinal stress, and developmental delay. Some mutations that cause CDD, including 1412delA, cannot be corrected by base editing. However, prime editing has the potential to precisely correct base changes, deletions, and insertions from every base. By focusing on the 1412delA mutation, this example designed and tested a pegRNA that can insert the mutation, with the hope of establishing a mouse neuronal cell line (N2A) that harbors the mutation. This will allow large-scale screening of therapeutic pegRNAs as potential corrections of the mutation. The ultimate goal is to progress to a CDD mouse model carrying the 1412delA mutation with the ability to evaluate therapeutic effects. Current mouse models of CDD do not have a humanized allele. However, optimization of pegRNA is also underway in HEK293T cells. Figures 87 and 88 are results from a pilot screen in N2A cells where pegRNA incorporates 1412Adel, with details on primer binding site (PBS) length and reverse transcriptase (RT) template length (shown with and without the indel).

鎌状赤血球症(SCA)を処置するためのPEの使用
鎌状赤血球症(SCA)は劣性血液障害であり、β-グロビン遺伝子の位置6におけるグルタミン酸からバリンの変異によって引き起こされる。結果は鎌状赤血球であり、これらは不良な酸素輸送体であり、凝集をしやすい。凝集の症状は生命を脅かし得る。先に、D. LiuラボはDNAプラスミドトランスフェクションによるプライム編集を用いてHEK293T細胞のSCA座位の組み入れおよび修正両方を示す能力があった。造血幹細胞(HSC)はDNAプラスミドトランスフェクションによって編集することが困難であるので、この例はタンパク質およびmRNAヌクレオフェクションによってHSCにおいてPE3システムを試験した。図89は、健康なHSCのβ-グロビン遺伝子の近位(proxy)座位およびHEK3における編集の結果であり、編集因子対pegRNAおよびニッキングgRNAの濃度を変えている。
Use of PE to Treat Sickle Cell Disease (SCA) Sickle cell disease (SCA) is a recessive blood disorder caused by a glutamic acid to valine mutation at position 6 of the β-globin gene. The result is sickle-shaped red blood cells, which are poor oxygen transporters and prone to clumping. The clumping condition can be life-threatening. Previously, the D. Liu lab was able to demonstrate both integration and correction of the SCA locus in HEK293T cells using prime editing by DNA plasmid transfection. Since hematopoietic stem cells (HSCs) are difficult to edit by DNA plasmid transfection, this example tested the PE3 system in HSCs by protein and mRNA nucleofection. Figure 89 shows the results of editing the proxy locus of the β-globin gene in healthy HSCs and HEK3 with varying concentrations of editing factors versus pegRNA and nicking gRNA.

mRNAヌクレオフェクションプロトコール:
編集因子対ガイドの比([編集因子]対[ガイド]比または編集因子:ガイド比)を調整することによって、プロトコールを改善した。
mRNA Nucleofection Protocol:
The protocol was improved by adjusting the ratio of editing factor to guide ([editing factor] to [guide] ratio or editing factor:guide ratio).

ニッキングガイドプロトスペーサー配列は:CCTTGATACCAACCTGCCCA(配列番号3991)であった。 The nicking guide protospacer sequence was: CCTTGATACCAACCTGCCCA (SEQ ID NO:3991) .

pegRNA配列は:
CATGGTGCACCTGACTCCTGGTTTTAGAGCTAGAAATAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGCACCGAGTCGGTGCAGACTTCTCTTCAGGAGTCAGGTGCACTTT(配列番号3992)であった。
The pegRNA sequence is:
CATGGTGCACCTGACTCCTGGTTTTAGAGCTAGAAATAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGCACCGAGTCGGTGCAGACTTCTCTTCAGGAGTCAGGTGCACTTT (sequence number 3992) .

1.CD34+細胞を融解し、X-Vivo15培地においてサイトカイン(SCF、Flt3、およびTPO)によって24hrに渡って予備刺激する。播種密度100万細胞/mL。 1. CD34+ cells were thawed and pre-stimulated with cytokines (SCF, Flt3, and TPO) in X-Vivo15 medium for 24hr. Seeding density 1 million cells/mL.

2.次の日に(24hr後に)、CD34+細胞(1×105)をアスピレーションし、PBSによって1回洗浄し(遠心は300gで10minに渡ってRTで行う)、P3溶液(Lonza)に再懸濁する(条件当たり20ul)。 2. The next day (24 hr later), CD34+ cells (1x105) were aspirated, washed once with PBS (centrifuged at 300g for 10 min at RT), and resuspended in P3 solution (Lonza) (20 ul per condition).

3.フード内で、2ugのSpPE2 mRNA、pegRNAおよびsgRNAの組み合わせた1ugを氷上の無菌PCRストリップ上で組み合わせる。体積を20ulに調整する(P3溶液中の細胞+mRNA&gRNAミックス)。 3. In the hood, combine 2ug of SpPE2 mRNA, 1ug of pegRNA and sgRNA combination on a sterile PCR strip on ice. Adjust the volume to 20ul (cells + mRNA&gRNA mix in P3 solution).

4.細胞懸濁液を20uLのLonza4D 16ウェルストリップにピペッティングし、プログラムDS130でエレクトロポレーションする。 4. Pipette 20uL of cell suspension into Lonza4D 16-well strips and electroporate using program DS130.

5.エレクトロポレーション後に10から15min待ち、80uLのX-Vivo10+サイトカイン培地を細胞懸濁液に追加し、サイトカインを有する予温したX-Vivo10培地に移入する。 5. Wait 10 to 15 min after electroporation, add 80uL of X-Vivo10+cytokine medium to the cell suspension, and transfer to pre-warmed X-Vivo10 medium with cytokines.

6.細胞をエレクトロポレーションの72時間後に収穫し、細胞回復をチェックし、バルク集団およびソーティングされたCD34+およびCD34+90+集団についても遺伝子型判定する。
野生型CDKL5タンパク質(受託番号NP_001032420)(アイソフォーム1-ヒト)
MKIPNIGNVM NKFEILGVVG EGAYGVVLKC RHKETHEIVA IKKFKDSEEN EEVKETTLRE LKMLRTLKQE NIVELKEAFR RRGKLYLVFE YVEKNMLELL EEMPNGVPPE KVKSYIYQLI KAIHWCHKND IVHRDIKPEN LLISHNDVLK LCDFGFARNL SEGNNANYTE YVATRWYRSP ELLLGAPYGK SVDMWSVGCI LGELSDGQPL FPGESEIDQL FTIQKVLGPL PSEQMKLFYS NPRFHGLRFP AVNHPQSLER RYLGILNSVL LDLMKNLLKL DPADRYLTEQ CLNHPTFQTQ RLLDRSPSRS AKRKPYHVES STLSNRNQAG KSTALQSHHR SNSKDIQNLS VGLPRADEGL PANESFLNGN LAGASLSPLH TKTYQASSQP GSTSKDLTNN NIPHLLSPKE AKSKTEFDFN IDPKPSEGPG TKYLKSNSRS QQNRHSFMES SQSKAGTLQP NEKQSRHSYI DTIPQSSRSP SYRTKAKSHG ALSDSKSVSN LSEARAQIAE PSTSRYFPSS CLDLNSPTSP TPTRHSDTRT LLSPSGRNNR NEGTLDSRRT TTRHSKTMEE LKLPEHMDSS HSHSLSAPHE SFSYGLGYTS PFSSQQRPHR HSMYVTRDKV RAKGLDGSLS IGQGMAARAN SLQLLSPQPG EQLPPEMTVA RSSVKETSRE GTSSFHTRQK SEGGVYHDPH SDDGTAPKEN RHLYNDPVPR RVGSFYRVPS PRPDNSFHEN NVSTRVSSLP SESSSGTNHS KRQPAFDPWK SPENISHSEQ LKEKEKQGFF RSMKKKKKKS QTVPNSDSPD LLTLQKSIHS ASTPSSRPKE WRPEKISDLQ TQSQPLKSLR KLLHLSSASN HPASSDPRFQ PLTAQQTKNS FSEIRIHPLS QASGGSSNIR QEPAPKGRPA LQLPDGGCDG RRQRHHSGPQ DRRFMLRTTE QQGEYFCCGD PKKPHTPCVP NRALHRPISS PAPYPVLQVR GTSMCPTLQV RGTDAFSCPT QQSGFSFFVR HVMREALIHR AQVNQAALLT YHENAALTGK(配列番号3993)

野生型CDKL5タンパク質(受託番号NP_001310218)(アイソフォーム2-ヒト)
MKIPNIGNVM NKFEILGVVG EGAYGVVLKC RHKETHEIVA IKKFKDSEEN EEVKETTLRE LKMLRTLKQE NIVELKEAFR RRGKLYLVFE YVEKNMLELL EEMPNGVPPE KVKSYIYQLI KAIHWCHKND IVHRDIKPEN LLISHNDVLK LCDFGFARNL SEGNNANYTE YVATRWYRSP ELLLGAPYGK SVDMWSVGCI LGELSDGQPL FPGESEIDQL FTIQKVLGPL PSEQMKLFYS NPRFHGLRFP AVNHPQSLER RYLGILNSVL LDLMKNLLKL DPADRYLTEQ CLNHPTFQTQ
RLLDRSPSRS AKRKPYHVES STLSNRNQAG KSTALQSHHR SNSKDIQNLS VGLPRADEGL PANESFLNGN LAGASLSPLH TKTYQASSQP GSTSKDLTNN NIPHLLSPKE AKSKTEFDFN IDPKPSEGPG TKYLKSNSRS QQNRHSFMES SQSKAGTLQP NEKQSRHSYI DTIPQSSRSP SYRTKAKSHG ALSDSKSVSN LSEARAQIAE PSTSRYFPSS CLDLNSPTSP TPTRHSDTRT LLSPSGRNNR NEGTLDSRRT TTRHSKTMEE LKLPEHMDSS HSHSLSAPHE SFSYGLGYTS PFSSQQRPHR HSMYVTRDKV RAKGLDGSLS IGQGMAARAN SLQLLSPQPG EQLPPEMTVARSSVKETSRE GTSSFHTRQK SEGGVYHDPH SDDGTAPKEN RHLYNDPVPR RVGSFYRVPS PRPDNSFHEN NVSTRVSSLP SESSSGTNHS KRQPAFDPWK SPENISHSEQ LKEKEKQGFF RSMKKKKKKS QTVPNSDSPD LLTLQKSIHS ASTPSSRPKE WRPEKISDLQ TQSQPLKSLR KLLHLSSASN HPASSDPRFQ PLTAQQTKNS FSEIRIHPLS QASGGSSNIR QEPAPKGRPA LQLPGQMDPG WHVSSVTRSA TEGPSYSEQL GAKSGPNGHP YNRTNRSRMP NLNDLKETAL(配列番号3994)
6. Cells are harvested 72 hours after electroporation to check for cell recovery and also genotype the bulk and sorted CD34+ and CD34+90+ populations.
Wild-type CDKL5 protein (accession number NP_001032420) (isoform 1-human)
MKIPNIGNVM NKFEILGVVG EGAYGVVLKC RHKETHEIVA IKKFKDSEEN EEVKETTLRE LKMLRTLKQE NIVELKEAFR RRGKLYLVFE YVEKNMLELL EEMPNGVPPE KVKSYIYQLI KAIHWCHKND IVHRDIKPEN LLISHNDVLK LCDFGFARNL SEGNNANYTE YVATRWYRSP ELLLGAPYGK SVDMWSVGCI LGELSDGQPL FPGESEIDQL FTIQKVLGPL PSEQMKLFYS NPRFHGLRFP AVNHPQSLER RYLGILNSVL LDLMKNLLKL DPADRYLTEQ CLNHPTFQTQ RLLDRSPSRS AKRKPYHVES STLSNRNQAG KSTALQSHHR SNSKDIQNLS VGLPRADEGL PANESFLNGN LAGASLSPLH TKTYQASSQP GSTSKDLTNN NIPHLLSPKE AKSKTEFDFN IDPKPSEGPG TKYLKSNSRS QQNRHSFMES SQSKAGTLQP NEKQSRHSYI DTIPQSSRSP SYRTKAKSHG ALSDSKSVSN LSEARAQIAE PSTSRYFPSS CLDLNSPTSP TPTRHSDTRT LLSPSGRNNR NEGTLDSRRT TTRHSKTMEE LKLPEHMDSS HSHSLSAPHE SFSYGLGYTS PFSSQQRPHR HSMYVTRDKV RAKGLDGSLS IGQGMAARAN SLQLLSPQPG EQLPPEMTVA RSSVKETSRE GTSSFHTRQK SEGGVYHDPH SDDGTAPKEN RHLYNDPVPR RVGSFYRVPS PRPDNSFHEN NVSTRVSSLP SESSSGTNHS KRQPAFDPWK SPENISHSEQ LKEKEKQGFF RSMKKKKKKS QTVPNSDSPD LLTLQKSIHS ASTPSSRPKE WRPEKISDLQ TQSQPLKSLR KLLHLSSASN HPASSDPRFQ PLTAQQTKNS FSEIRIHPLS QASGGSSNIR QEPAPKGRPA LQLPDGGCDG RRQRHHSGPQ DRRFMLRTTE QQGEYFCCGD PKKPHTPCVP NRALHRPISS PAPYPVLQVR GTSMCPTLQV RGTDAFSCPT QQSGFSFFVR HVMREALIHR AQVNQAALLT YHENAALTGK (SEQ ID NO: 3993)

Wild-type CDKL5 protein (accession number NP_001310218) (isoform 2-human)
MKIPNIGNVM NKFEILGVVG EGAYGVVLKC RHKETHEIVA IKKFKDSEEN EEVKETTLRE LKMLRTLKQE NIVELKEAFR RRGKLYLVFE YVEKNMLELL EEMPNGVPPE KVKSYIYQLI KAIHWCHKND IVHRDIKPEN LLISHNDVLK LCDFGFARNL SEGNNANYTE YVATRWYRSP ELLLGAPYGK SVDMWSVGCI LGELSDGQPL FPGESEIDQL FTIQKVLGPL PSEQMKLFYS NPRFHGLRFP AVNHPQSLER RYLGILNSVL LDLMKNLLKL DPADRYLTEQ CLNHPTFQTQ
RLLDRSPSRS AKRKPYHVES STLSNRNQAG KSTALQSHHR SNSKDIQNLS VGLPRADEGL PANESFLNGN LAGASLSPLH TKTYQASSQP GSTSKDLTNN NIPHLLSPKE AKSKTEFDFN IDPKPSEGPG TKYLKSNSRS QQNRHSFMES SQSKAGTLQP NEKQSRHSYI DTIPQSSRSP SYRTKAKSHG ALSDSKSVSN LSEARAQIAE PSTSRYFPSS CLDLNSPTSP TPTRHSDTRT LLSPSGRNNR NEGTLDSRRT TTRHSKTMEE LKLPEHMDSS HSHSLSAPHE SFSYGLGYTS PFSSQQRPHR HSMYVTRDKV RAKGLDGSLS IGQGMAARAN SLQLLSPQPG EQLPPEMTVARSSVKETSRE GTSSFHTRQK SEGGVYHDPH SDDGTAPKEN RHLYNDPVPR RVGSFYRVPS PRPDNSFHEN NVSTRVSSLP SESSSGTNHS KRQPAFDPWK SPENISHSEQ LKEKEKQGFF RSMKKKKKKS QTVPNSDSPD LLTLQKSIHS ASTPSSRPKE WRPEKISDLQ TQSQPLKSLR KLLHLSSASN HPASSDPRFQ PLTAQQTKNS FSEIRIHPLS QASGGSSNIR QEPAPKGRPA LQLPGQMDPG WHVSSVTRSA TEGPSYSEQL GAKSGPNGHP YNRTNRSRMP NLNDLKETAL (SEQ ID NO: 3994)

例24.非糖尿病性慢性腎臓病の処置のために病原性のAOL1アレルを標的化するためのプライム編集の使用
この例は、腎疾患を処置またはそれを発生する蓋然性を縮減するためのプライム編集への使用のための、病原性のAPOL1アレルを標的化することができるPEgRNAをデザインした。
Example 24. Use of prime editing to target pathogenic AOL1 alleles for the treatment of non-diabetic chronic kidney disease . This example designs PEgRNAs capable of targeting pathogenic APOL1 alleles for use in prime editing to treat or reduce the likelihood of developing kidney disease.

末期腎不全(ESKD)は今や米国の50万超の個人を冒す成長していく問題である。ESKDを有する患者をケアするコストは現行では年当たり400億ドル超である。米国では、アフリカ系血統の対象がESKDを発生するであろう蓋然性はアフリカ家系なしのアメリカ人よりも4から5倍高い。これらの事実は、アフリカ系血統を有するU.S.集団の12~13%とアフリカ系アメリカ人であるU.S.透析患者の40%との間の相違に反映されている。肥満および代謝症候群などの腎疾患リスク因子の流行は、この問題の大きさは増大するのみであろうということを示唆している。 End-stage kidney disease (ESKD) is a growing problem that now affects over 500,000 individuals in the United States. The cost of caring for patients with ESKD is currently over $40 billion per year. In the United States, subjects of African ancestry are four to five times more likely to develop ESKD than Americans without African ancestry. These facts are reflected in the disparity between the 12-13% of the U.S. population with African ancestry and the 40% of U.S. dialysis patients who are African American. The prevalence of kidney disease risk factors such as obesity and metabolic syndrome suggests that the magnitude of this problem will only increase.

進行性の腎臓病の大多数について、特定の治療はない。いくつかの型の慢性腎疾患進行は特定の薬剤による血圧コントロールによって低速化され得るが、腎臓病医はどの患者が応答するであろうかを正確には予測し得ない。その上、首尾良い処置は典型的には進行を低速化させるが、それは疾患を防止も疾患進行を停止させもしない。 For the vast majority of progressive kidney diseases, there is no specific treatment. Although some types of chronic kidney disease progression can be slowed by blood pressure control with certain medications, nephrologists cannot accurately predict which patients will respond. Moreover, while successful treatment typically slows progression, it does not prevent or halt disease progression.

最近では、アポリポタンパク質L1(APOL1)のタンパク質配列を変改する特定の遺伝子バリアントは進行性の腎臓病に関連するということが決定された。驚くべきことに、APOL1腎臓病バリアントは、高血圧関連末期腎疾患(H-ESRD)、巣状分節性糸球体硬化症(FSGS)、およびHIV関連腎症(HIVAN)を包含する腎臓病の複数の異なる型に対して主要なインパクトを有する。これらのバリアントAPOL1アレルを有する個人は7~30倍増大したリスクを腎臓病について有する。これらのAPOL1リスクアレルの高い度数に基づくと、350万よりも多くのアフリカ系アメリカ人が蓋然的には高リスクAPOL1遺伝子型を有する。高リスク遺伝子型なしのアフリカ系アメリカ人はヨーロッパ家系のアメリカ人と比較してわずかな余分なリスクしか有さない。 Recently, it has been determined that certain genetic variants that alter the protein sequence of apolipoprotein L1 (APOL1) are associated with progressive kidney disease. Surprisingly, APOL1 kidney disease variants have a major impact on several different types of kidney disease, including hypertension-related end-stage renal disease (H-ESRD), focal segmental glomerulosclerosis (FSGS), and HIV-associated nephropathy (HIVAN). Individuals with these variant APOL1 alleles have a 7-30 fold increased risk for kidney disease. Based on the high frequency of these APOL1 risk alleles, more than 3.5 million African Americans likely have a high-risk APOL1 genotype. African Americans without the high-risk genotype have only a small excess risk compared to Americans of European descent.

APOL1遺伝子のバリアントが腎疾患を引き起こすという証拠にもかかわらず、その産物APOL1の生物学または腎臓におけるその役割については、非常にわずかしか公知ではない。APOL1はトリパノソーマに対する耐性において定められた役割を有し、G1およびG2バリアントはアフリカにおいては普通になっているように見える。なぜなら、それらはアフリカ睡眠病を引き起こすトリパノソーマの形態からの防護を付与するからである。 Despite evidence that variants in the APOL1 gene cause kidney disease, very little is known about the biology of its product, APOL1, or its role in the kidney. APOL1 has a defined role in resistance to trypanosomes, and the G1 and G2 variants appear to be common in Africa because they confer protection against the form of trypanosome that causes African sleeping sickness.

1つ以上のAPOL1リスクアレルを有する患者の腎臓病のための治療の必要がなお存在する。これらは、このおよび他の対象集団において多大な罹患率および死亡率を引き起こし、高い経済的インパクトを有する。 There remains a need for treatments for kidney disease in patients with one or more APOL1 risk alleles. These cause significant morbidity and mortality in this and other target populations and have a high economic impact.

この例は、3つの例示のPEgRNAデザインオプションを提供する。APOL1欠陥アレルを修正するためにプライム編集に用いられ得る特定の例示の標的配列に基づく。 This example provides three exemplary PEGRNA design options based on specific exemplary target sequences that can be used for prime editing to correct defective APOL1 alleles.

PEgRNA 1 PEgRNA 1

APOL1アレルrs73885319(p.S342G)のPEgRNAをデザインする。これは有疾患個体のG→A修正を表す。標的配列は5-GGAGTCAAGCTCACGGATGTGGCCCCTGTA(GからA)GCTTCTTTCTTGTGCTGGATGTAGTCTACCT-3(配列番号3995)である。 A PEG RNA was designed for APOL1 allele rs73885319 (p.S342G), which represents the G to A correction in affected individuals. The target sequence is 5-GGAGTCAAGCTCACGGATGTGGCCCCTGTA(G to A)GCTTCTTTCTTGTGCTGGATGTAGTCTACCT-3 (SEQ ID NO: 3995) .

プロトスペーサー(上の太字)はAAGCTCACGGATGTGGCCCC(配列番号3996)である。選択されたPEはSaCas9(D10A)を含む。 The protospacer (bold above) is AAGCTCACGGAGTGGCCCC (SEQ ID NO: 3996) . The selected PE contains SaCas9(D10A).

プライマー結合部位は以下であってもよい: The primer binding site may be:

GTGGCCCC(配列番号3997) GTGGCCCC (SEQ ID NO:3997)

TGTGGCCCC(配列番号3998) TGTGGCCCC (SEQ ID NO:3998)

ATGTGGCCCC(配列番号3999) ATGTGGCCCC (SEQ ID NO:3999)

GATGTGGCCCC(配列番号4000) GATGTGGCCCC (SEQ ID NO: 4000)

GGATGTGGCCCC(配列番号4001) GGATGTGGCCCC (SEQ ID NO: 4001)

CGGATGTGGCCCC(配列番号4002) CGGATGTGGCCCC (SEQ ID NO: 4002)

ACGGATGTGGCCCC(配列番号4003) ACGGATGTGGCCCC (SEQ ID NO: 4003)

CACGGATGTGGCCCC(配列番号4004) CACGGATGTGGCCCC (SEQ ID NO:4004)

TCACGGATGTGGCCCC(配列番号4005) TCACGGATGTGGCCCC (SEQ ID NO: 4005)

CTCACGGATGTGGCCCC(配列番号4006) CTCACGGATGTGGCCCC (sequence number 4006) .

RT鋳型は以下であってもよい: The RT template may be:

AAGAAGCTTACA(配列番号4007) AAGAAGCTTACA (SEQ ID NO: 4007)

AAAGAAGCTTACA(配列番号4008) AAAGAAGCTTACA (SEQ ID NO: 4008)

GAAAGAAGCTTACA(配列番号4009) GAAAGAAGCTTACA (SEQ ID NO: 4009)

AGAAAGAAGCTTACA(配列番号4010) AGAAAGAAGCTTACA (SEQ ID NO: 4010)

AAGAAAGAAGCTTACA(配列番号4011) AAGAAAGAAGCTTACA (SEQ ID NO: 4011)

CAAGAAAGAAGCTTACA(配列番号4012) CAAGAAAGAAGCTTACA (SEQ ID NO: 4012)

ACAAGAAAGAAGCTTACA(配列番号4013) ACAAGAAAGAAGCTTACA (SEQ ID NO: 4013)

CACAAGAAAGAAGCTTACA(配列番号4014) CACAAGAAAGAAGCTTACA (SEQ ID NO: 4014)

GCACAAGAAAGAAGCTTACA(配列番号4015) GCACAAGAAAGAAGCTTACA (SEQ ID NO: 4015)

AGCACAAGAAAGAAGCTTACA(配列番号4016) AGCACAAGAAAGAAGCTTACA (SEQ ID NO: 4016)

CAGCACAAGAAAGAAGCTTACA(配列番号4017) CAGCACAAGAAAGAAGCTTACA (SEQ ID NO: 4017)

CCAGCACAAGAAAGAAGCTTACA(配列番号4018) CCAGCACAAGAAAGAAGCTTACA (SEQ ID NO: 4018)

TCCAGCACAAGAAAGAAGCTTACA(配列番号4019) TCCAGCACAAGAAAGAAGCTTACA (SEQ ID NO: 4019)

ATCCAGCACAAGAAAGAAGCTTACA(配列番号4020) ATCCAGCACAAGAAAGAAGCTTACA (sequence number 4020) .

ニックを入れる鋳型は、GCTTTGATTCGTACACGAGG(配列番号4021)であってもよい。 The nicking template may be GCTTTGATTCGTACACGAGG (SEQ ID NO: 4021) .

PEgRNA 2 PEgRNA 2

APOL1アレルrs60910145のPEgRNAをデザインする。これは有疾患個体におけるG→T修正を表す。 Design a PEgRNA for APOL1 allele rs60910145, which represents the G→T correction in affected individuals.

プロトスペーサーはGCTGGAGGAGAAGCTAAACA(配列番号4022)である。選択されるPEは、SpCas9(D10A)-NGを含む。 The protospacer is GCTGGAGGAGAAGCTAAACA (SEQ ID NO: 4022) . The selected PE includes SpCas9(D10A)-NG.

プライマー結合部位は以下であってもよい: The primer binding site may be:

GAAGCTAA(配列番号4023) GAAGCTAA (SEQ ID NO: 4023)

AGAAGCTAA(配列番号4024) AGAAGCTAA (SEQ ID NO: 4024)

GAGAAGCTAA(配列番号4025) GAGAAGCTAA (SEQ ID NO: 4025)

GGAGAAGCTAA(配列番号4026) GGAGAAGCTAA (SEQ ID NO: 4026)

AGGAGAAGCTAA(配列番号4027) AGGAGAAGCTAA (SEQ ID NO: 4027)

GAGGAGAAGCTAA(配列番号4028) GAGGAGAAGCTAA (SEQ ID NO: 4028)

GGAGGAGAAGCTAA(配列番号4029) GGAGGAGAAGCTAA (SEQ ID NO: 4029)

TGGAGGAGAAGCTAA(配列番号4030) TGGAGGAGAAGCTAA (SEQ ID NO: 4030)

CTGGAGGAGAAGCTAA(配列番号4031) CTGGAGGAGAAGCTAA (SEQ ID NO: 4031)

GCTGGAGGAGAAGCTAA(配列番号4032) GCTGGAGGAGAAGCTAA (sequence number 4032) .

RT鋳型は以下であってもよい(Cでは終われない): The RT template can be (but cannot end in C):

AGAATGT(配列番号4033) AGAATGT (SEQ ID NO:4033)

GAGAATGT(配列番号4034) GAGAATGT (SEQ ID NO:4034)

TGAGAATGT(配列番号4035) TGAGAATGT (SEQ ID NO: 4035)

TTGAGAATGT(配列番号4036) TTGAGAATGT (SEQ ID NO: 4036)

GTTGAGAATGT(配列番号4037) GTTGAGAATGT (SEQ ID NO: 4037)

TGTTGAGAATGT(配列番号4038) TGTTGAGAATGT (SEQ ID NO: 4038)

TTGTTGAGAATGT(配列番号4039) TTGTTGAGAATGT (SEQ ID NO: 4039)

ATTGTTGAGAATGT(配列番号4040) ATTGTTGAGAATGT (SEQ ID NO: 4040)

TATTGTTGAGAATGT(配列番号4041) TATTGTTGAGAATGT (SEQ ID NO: 4041)

TTATTGTTGAGAATGT(配列番号4042) TTATTGTTGAGAATGT (SEQ ID NO: 4042)

ATTATTGTTGAGAATGT(配列番号4043) ATTATTGTTGAGAATGT (SEQ ID NO: 4043)

AATTATTGTTGAGAATGT(配列番号4044) AATTATTGTTGAGAATGT (SEQ ID NO: 4044)

TAATTATTGTTGAGAATGT(配列番号4045) TAATTATTGTTGAGAATGT (SEQ ID NO: 4045)

ATAATTATTGTTGAGAATGT(配列番号4046) ATAATTATTGTTGAGAATGT (sequence number 4046) .

ニックを入れる鋳型は以下であってもよい: The template to be nicked may be:

CCTGTGGTCACAGTTCTTGG(配列番号4047) CCTGTGGTCACAGTTCTTGG (SEQ ID NO: 4047)

CCACAGGGCAGGGCAGCCAC(配列番号4048) CCACAGGGCAGGGCAGCCAC (sequence number 4048) .

PEgRNA 3 PEgRNA 3

APOL1アレルrs71785313のPEgRNAをデザインする。これは次のとおり挿入を表す:ATTCTCAACAA[挿入:TAATTA]TAAGATTC。 Design a PEgRNA for APOL1 allele rs71785313, which represents the insertion: ATTCTCAACAA [insertion: TAATTA] TAAGATTC.

プロトスペーサーは以下:TCTCAACAATAAGATTCTGCであり得る。 The protospacer can be: TCTCAACAATAAGATTCTGC.

PEはSaKKH-PE2を含む。 PE includes SaKKH-PE2.

プライマー結合部位は以下であってもよい: The primer binding site may be:

TTCTCAAC(配列番号4051) TTCTCAAC (SEQ ID NO: 4051)

ATTCTCAAC(配列番号4052) ATTCTCAAC (SEQ ID NO: 4052)

CATTCTCAAC(配列番号4053) CATTCTCAAC (SEQ ID NO: 4053)

ACATTCTCAAC(配列番号4054) ACATTCTCAAC (SEQ ID NO: 4054)

AACATTCTCAAC(配列番号4055) AACATTCTCAAC (SEQ ID NO: 4055)

AAACATTCTCAAC(配列番号4056) AAACATTCTCAAC (SEQ ID NO: 4056)

TAAACATTCTCAAC(配列番号4057) TAAACATTCTCAAC (SEQ ID NO: 4057)

CTAAACATTCTCAAC(配列番号4058) CTAAACATTCTCAAC (SEQ ID NO: 4058)

GCTAAACATTCTCAAC(配列番号4059) GCTAAACATTCTCAAC (SEQ ID NO: 4059)

AGCTAAACATTCTCAAC(配列番号4060) AGCTAAACATTCTCAAC (sequence number 4060) .

RT鋳型は以下であってもよい: The RT template may be:

AATCTTATAATTATT(配列番号4061) AATCTTATAATTATT (SEQ ID NO: 4061)

GAATCTTATAATTATT(配列番号4062) GAATCTTATAATTATT (SEQ ID NO: 4062)

AGAATCTTATAATTATT(配列番号4063) AGAATCTTATAATTATT (SEQ ID NO: 4063)

CAGAATCTTATAATTATT(配列番号4064) CAGAATCTTATAATTATT (SEQ ID NO: 4064)

GCAGAATCTTATAATTATT(配列番号4065) GCAGAATCTTATAATTATT (SEQ ID NO: 4065)

TGCAGAATCTTATAATTATT(配列番号4066) TGCAGAATCTTATAATTATT (SEQ ID NO: 4066)

CTGCAGAATCTTATAATTATT(配列番号4067) CTGCAGAATCTTATAATTATT (SEQ ID NO: 4067)

CCTGCAGAATCTTATAATTATT(配列番号4068) CCTGCAGAATCTTATAATTATT (SEQ ID NO: 4068)

GCCTGCAGAATCTTATAATTATT(配列番号4069) GCCTGCAGAATCTTATAATTATT (SEQ ID NO: 4069)

CGCCTGCAGAATCTTATAATTATT(配列番号4070) CGCCTGCAGAATCTTATAATTATT (SEQ ID NO: 4070)

CCGCCTGCAGAATCTTATAATTATT(配列番号4071) CCGCCTGCAGAATCTTATAATTATT (SEQ ID NO: 4071)

TCCGCCTGCAGAATCTTATAATTATT(配列番号4072) TCCGCCTGCAGAATCTTATAATTATT (SEQ ID NO: 4072)

GTCCGCCTGCAGAATCTTATAATTATT(配列番号4073) GTCCGCCTGCAGAATCTTATAATTATT (SEQ ID NO: 4073)

GGTCCGCCTGCAGAATCTTATAATTATT(配列番号4074) GGTCCGCCTGCAGAATCTTATAATTATT (sequence number 4074) .

ニックを入れる鋳型は以下であってもい: The nicking template may be:

CCTGTGGTCACAGTTCTTGG(配列番号4047) CCTGTGGTCACAGTTCTTGG (SEQ ID NO: 4047)

CCACAGGGCAGGGCAGCCAC(配列番号4048)
本開示を通して言及された他の参考文献
以下の参考文献は各々、これら全体が参照されることによって本明細書に組み込まれる。

Figure 2020191243000461

Figure 2020191243000462

Figure 2020191243000463

Figure 2020191243000464

Figure 2020191243000465

Figure 2020191243000466

Figure 2020191243000467

Figure 2020191243000468

Figure 2020191243000469

Figure 2020191243000470

Figure 2020191243000471

Figure 2020191243000472

Figure 2020191243000473

Figure 2020191243000474

Figure 2020191243000475

Figure 2020191243000476
CCACAGGGCAGGGCAGCCAC (sequence number 4048) .
Other References Mentioned Throughout This Disclosure
Each of the following references is incorporated herein by reference in its entirety.
Figure 2020191243000461

Figure 2020191243000462

Figure 2020191243000463

Figure 2020191243000464

Figure 2020191243000465

Figure 2020191243000466

Figure 2020191243000467

Figure 2020191243000468

Figure 2020191243000469

Figure 2020191243000470

Figure 2020191243000471

Figure 2020191243000472

Figure 2020191243000473

Figure 2020191243000474

Figure 2020191243000475

Figure 2020191243000476

態様
以下の態様は本開示の範囲内にある。しかも、本開示は、列挙された態様の1以上からの1以上の限定、要素、節、および記述用語(descriptive terms)が、本セクション中に列挙された別の態様中へ導入される、すべてのバリエーション、組み合わせ、および順列を包括する。例えば、列挙された別の態様に従属する、列挙されたいずれの態様も、同じ基本態様に従属する、本セクション中に列挙されたいずれか他の態様中に見出される1以上の限定を包含するように修飾され得る。要素が、例として、マーカッシュ群形式において列挙されたものとして提示されている場合、要素の各下位群もまた開示されており、いずれの要素(単数または複数)も群から除去され得る。一般に、本開示、または本開示の側面が、具体的な要素および/または特色を含むものとして見なされる場合、本発明のある態様または本発明の側面は、かかる要素および/または特色からなるか、あるいは実質的にそれらからなると理解されるはずである。用語「含むこと(comprising)」および「含有すること(containing)」が、オープンであることを意図し、追加の要素またはステップの包含を容認することにもまた留意する。範囲が与えられるとき、エンドポイントも包含される。しかも、別段の指示がないか、またはそれとは別に、文脈および当業者の理解から明らかでない場合に限り、範囲として表現された値は、いずれか具体的な値、または本発明の異なる態様において述べられた範囲内の部分範囲を、文脈が明確に別段の指図をしない限り範囲の下限の単位の10倍まで、想定し得る。
群1.態様1~212
1.融合タンパク質であって、核酸プログラム型DNA結合タンパク質(napDNAbp)および逆転写酵素を含む。
2.態様1の融合タンパク質であって、融合タンパク質が、伸長されたガイドRNAの存在下において、プライム標的にプライムされた逆転写によるゲノム編集を実行することができる。
3.態様1の融合タンパク質であって、napDNAbpがニッカーゼ活性を有する。
4.態様1の融合タンパク質であって、napDNAbpがCas9タンパク質またはそのバリアントである。
5.態様1の融合タンパク質であって、napDNAbpがヌクレアーゼ活性Cas9、ヌクレアーゼ不活性型Cas9(dCas9)、またはCas9ニッカーゼ(nCas9)である。
6.態様1の融合タンパク質であって、napDNAbpがCas9ニッカーゼ(nCas9)である。
7.態様1の融合タンパク質であって、napDNAbpが:Cas9、CasX、CasY、Cpf1、C2c1、C2c2、C2C3、およびアルゴノートからなる群から選択され、任意にニッカーゼ活性を有する。
8.態様1の融合タンパク質であって、融合タンパク質が伸長されたガイドRNAと複合体化したときに標的DNA配列に結合することができる。
9.態様8の融合タンパク質であって、標的DNA配列が標的鎖および相補的な非標的鎖を含む。
10.態様8の融合タンパク質であって、伸長されたガイドRNAと複合体化した融合タンパク質の結合がRループを形成する。
11.態様10の融合タンパク質であって、Rループが、(i)伸長されたガイドRNAと標的鎖とを含むRNA-DNAハイブリッド、および(ii)相補的な非標的鎖を含む。
12.態様11の融合タンパク質であって、相補的な非標的鎖がニッキングされて、遊離の3’端を有する逆転写酵素プライム配列を形成する。
13.態様2の融合タンパク質であって、伸長されたガイドRNAが(a)ガイドRNAおよび(b)ガイドRNAの5'もしくは3’端またはガイドRNAの分子内の位置付けにおけるRNA伸長を含む。
14.態様13の融合タンパク質であって、RNA伸長が(i)所望のヌクレオチド変化を含む逆転写鋳型配列、(ii)逆転写プライマー結合部位、および(iii)任意にリンカー配列を含む。
15.態様14の融合タンパク質であって、逆転写鋳型配列が、ニック部位に隣接する内生DNA配列に対して相補的である一本鎖DNAフラップをコードし、一本鎖DNAフラップが所望のヌクレオチド変化を含む。
16.態様13の融合タンパク質であって、RNA伸長が、長さが少なくとも5ヌクレオチド、少なくとも6ヌクレオチド、少なくとも7ヌクレオチド、少なくとも8ヌクレオチド、少なくとも9ヌクレオチド、少なくとも10ヌクレオチド、少なくとも11ヌクレオチド、少なくとも12ヌクレオチド、少なくとも13ヌクレオチド、少なくとも14ヌクレオチド、少なくとも15ヌクレオチド、少なくとも16ヌクレオチド、少なくとも17ヌクレオチド、少なくとも18ヌクレオチド、少なくとも19ヌクレオチド、少なくとも20ヌクレオチド、少なくとも21ヌクレオチド、少なくとも22ヌクレオチド、少なくとも23ヌクレオチド、少なくとも24ヌクレオチド、または少なくとも25ヌクレオチドである。
17.態様15の融合タンパク質であって、一本鎖DNAフラップがニック部位に隣接する内生DNA配列にハイブリダイズし、それによって所望のヌクレオチド変化を組み入れる。
18.態様15の融合タンパク質であって、一本鎖DNAフラップが、遊離の5'端を有しかつニック部位に隣接する内生DNA配列に取って代わる。
19.態様18の融合タンパク質であって、5'端を有する内生DNA配列が細胞によって切除される。
20.態様18の融合タンパク質であって、一本鎖DNAフラップの細胞性修復が所望のヌクレオチド変化の組み入れをもたらし、それによって所望の産物を形成する。
21.態様14の融合タンパク質であって、所望のヌクレオチド変化がPAM配列の約-4から+10の間もしくはPAM配列の約-10から+20の間もしくはPAM配列の約-20から+40の間もしくはPAM配列の約-30から+100の間である編集窓上に組み入れされるか、または所望のヌクレオチド変化がニック部位の少なくとも1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、もしくは100ヌクレオチド下流に組み入れされる。
22.態様1の融合タンパク質であって、napDNAbpが、配列番号18のアミノ酸配列、または配列番号18のアミノ酸配列と少なくとも80%、85%、90%、95%、98%、もしくは99%同一であるアミノ酸配列を含む。
23.態様1の融合タンパク質であって、napDNAbpが、配列番号18~88、126、130、137、141、147、153、157、445、460、467、および482~487のいずれか1つのアミノ酸配列と少なくとも80%、85%、90%、95%、98%、または99%同一であるアミノ酸配列を含む。
24.態様1の融合タンパク質であって、逆転写酵素が配列番号89~100、105~122、128~129、132、139、143、149、154、159、235、454、471、516、662、700、701~716、739~741、および766のアミノ酸配列のいずれか1つを含む。
25.態様1の融合タンパク質であって、逆転写酵素が、配列番号89~100、105~122、128~129、132、139、143、149、154、159、235、454、471、516、662、700、701~716、739~741、および766のいずれか1つのアミノ酸配列と少なくとも80%、85%、90%、95%、98%、または99%同一であるアミノ酸配列を含む。
26.態様1の融合タンパク質であって、逆転写酵素が、レトロウイルスまたはレトロトランスポゾンからの天然に存在する逆転写酵素である。
27.先の態様のいずれか1つの融合タンパク質であって、融合タンパク質が構造NH2-[napDNAbp]-[逆転写酵素]-COOH;またはNH2-[逆転写酵素]-[napDNAbp]-COOHを含み、「]-[」の夫々のものが任意のリンカー配列の存在を指示する。
28.態様27の融合タンパク質であって、リンカー配列が配列番号127、165~176、446、453、および767~769のアミノ酸配列を含む。
29.態様14の融合タンパク質であって、所望のヌクレオチド変化が、1ヌクレオチド変化、1つ以上のヌクレオチドの挿入、または1つ以上のヌクレオチドの欠失である。
30.態様29の融合タンパク質であって、挿入または欠失が少なくとも1、少なくとも2、少なくとも3、少なくとも4、少なくとも5、少なくとも6、少なくとも7、少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも16、少なくとも17、少なくとも18、少なくとも19、少なくとも20、少なくとも21、少なくとも22、少なくとも23、少なくとも24、少なくとも25、少なくとも26、少なくとも27、少なくとも28、少なくとも29、少なくとも30、少なくとも31、少なくとも32、少なくとも33、少なくとも34、少なくとも35、少なくとも36、少なくとも37、少なくとも38、少なくとも39、少なくとも40、少なくとも41、少なくとも42、少なくとも43、少なくとも44、少なくとも45、少なくとも46、少なくとも47、少なくとも48、少なくとも49、または少なくとも50である。
31.ガイドRNAと少なくとも1つのRNA伸長とを含む伸長されたガイドRNA。
32.態様1の伸長されたガイドRNAであって、RNA伸長が、ガイドRNAの3'もしくは5'端またはガイドRNAの分子内の位置の位置である。
33.態様31の伸長されたガイドRNAであって、伸長されたガイドRNAが、napDNAbpに結合することおよびnapDNAbpを標的DNA配列へと導くことができる。
34.態様33の伸長されたガイドRNAであって、標的DNA配列が標的鎖および相補的な非標的鎖を含み、ガイドRNAが標的鎖にハイブリダイズしてRNA-DNAハイブリッドおよびRループを形成する。
35.態様31の伸長されたガイドRNAであって、少なくとも1つのRNA伸長が、(i)逆転写鋳型配列、(ii)逆転写プライマー結合部位、および(iii)任意にリンカー配列を含む。
36.態様35の伸長されたガイドRNAであって、RNA伸長が、長さが少なくとも5ヌクレオチド、少なくとも6ヌクレオチド、少なくとも7ヌクレオチド、少なくとも8ヌクレオチド、少なくとも9ヌクレオチド、少なくとも10ヌクレオチド、少なくとも11ヌクレオチド、少なくとも12ヌクレオチド、少なくとも13ヌクレオチド、少なくとも14ヌクレオチド、少なくとも15ヌクレオチド、少なくとも16ヌクレオチド、少なくとも17ヌクレオチド、少なくとも18ヌクレオチド、少なくとも19ヌクレオチド、少なくとも20ヌクレオチド、少なくとも21ヌクレオチド、少なくとも22ヌクレオチド、少なくとも23ヌクレオチド、少なくとも24ヌクレオチド、または少なくとも25ヌクレオチドである。
37.態様35の伸長されたガイドRNAであって、逆転写鋳型配列が、長さが少なくとも3ヌクレオチド、少なくとも4ヌクレオチド、少なくとも5ヌクレオチド、少なくとも6ヌクレオチド、少なくとも7ヌクレオチド、少なくとも8ヌクレオチド、少なくとも9ヌクレオチド、少なくとも10ヌクレオチド、少なくとも11ヌクレオチド、少なくとも12ヌクレオチド、少なくとも13ヌクレオチド、少なくとも14ヌクレオチド、または少なくとも15ヌクレオチドである。
38.態様35の伸長されたガイドRNAであって、逆転写プライマー結合部位配列が、長さが少なくとも3ヌクレオチド、少なくとも4ヌクレオチド、少なくとも5ヌクレオチド、少なくとも6ヌクレオチド、少なくとも7ヌクレオチド、少なくとも8ヌクレオチド、少なくとも9ヌクレオチド、少なくとも10ヌクレオチド、少なくとも11ヌクレオチド、少なくとも12ヌクレオチド、少なくとも13ヌクレオチド、少なくとも14ヌクレオチド、または少なくとも15ヌクレオチドである。
39.態様35の伸長されたガイドRNAであって、任意のリンカー配列が、長さが少なくとも3ヌクレオチド、少なくとも4ヌクレオチド、少なくとも5ヌクレオチド、少なくとも6ヌクレオチド、少なくとも7ヌクレオチド、少なくとも8ヌクレオチド、少なくとも9ヌクレオチド、少なくとも10ヌクレオチド、少なくとも11ヌクレオチド、少なくとも12ヌクレオチド、少なくとも13ヌクレオチド、少なくとも14ヌクレオチド、または少なくとも15ヌクレオチドである。
40.態様35の伸長されたガイドRNAであって、逆転写鋳型配列が、ニック部位に隣接する内生DNA配列に対して相補的である一本鎖DNAフラップをコードし、一本鎖DNAフラップが所望のヌクレオチド変化を含む。
41.態様40の伸長されたガイドRNAであって、一本鎖DNAフラップが、ニッキングされた標的DNA配列上の5'端を有する内生一本鎖DNAを押し除け、内生一本鎖DNAがニック部位の下流において直ちに隣接する。
42.態様41の伸長されたガイドRNAであって、遊離の5'端を有する内生一本鎖DNAが細胞によって切除される。
43.態様41の伸長されたガイドRNAであって、一本鎖DNAフラップの細胞性修復が、所望のヌクレオチド変化の組み入れをもたらし、それによって所望の産物を形成する。
44.態様31の伸長されたガイドRNAであって、配列番号394、429~442、641~649、678~692、2997~3103、3113~3121、3305~3455、3479~3493、3522~3556、3628~3698、および3755~3810のヌクレオチド配列、または配列番号394、429~442、641~649、678~692、2997~3103、3113~3121、3305~3455、3479~3493、3522~3556、3628~3698、および3755~3810のいずれか1つとの少なくとも85%もしくは少なくとも90%もしくは少なくとも95%もしくは少なくとも98%もしくは少なくとも99%配列同一性を有するヌクレオチド配列を含む。
45.態様35の伸長されたガイドRNAであって、逆転写鋳型配列が、内生DNA標的と少なくとも80%または85%または90%または95%または99%同一であるヌクレオチド配列を含む。
46.態様35の伸長されたガイドRNAであって、逆転写プライマー結合部位が、カットされたDNAの遊離の3'端とハイブリダイズする。
47.態様35の伸長されたガイドRNAであって、任意のリンカー配列が、長さが少なくとも1ヌクレオチド、または少なくとも2、少なくとも3、少なくとも4、少なくとも5、少なくとも6、少なくとも7、少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、または少なくとも15ヌクレオチドである。
48.態様1~30のいずれか1つの融合タンパク質と伸長されたガイドRNAとを含むことを含む複合体。
49.態様48の複合体であって、伸長されたガイドRNAが、ガイドRNAと、ガイドRNAの3'もしくは5'端またはガイドRNAの分子内の位置におけるRNA伸長とを含む。
50.態様48の複合体であって、伸長されたガイドRNAが、napDNAbpに結合することおよびnapDNAbpを標的DNA配列へと導くことができる。
51.態様50の複合体であって、標的DNA配列が標的鎖および相補的な非標的鎖を含み、ガイドRNAが標的鎖にハイブリダイズして、RNA-DNAハイブリッドおよびRループを形成する。
52.態様49の複合体であって、少なくとも1つのRNA伸長が、(i)逆転写鋳型配列、(ii)逆転写プライマー結合部位、および(iii)任意にリンカー配列を含む。
53.態様48の複合体であって、伸長されたガイドRNAが、配列番号18-36のヌクレオチド配列、または配列番号18-36のいずれか1つとの少なくとも85%、もしくは少なくとも90%、もしくは少なくとも95%、もしくは少なくとも98%、もしくは少なくとも99%配列同一性を有するヌクレオチド配列を含む。
54.態様52の複合体であって、逆転写鋳型配列が、内生DNA標的との少なくとも80%または85%または90%または95%または99%配列同一性を有するヌクレオチド配列を含む。
55.態様52の複合体であって、逆転写プライマー結合部位が、カットされたDNAの遊離の3'端とハイブリダイズする。
56.napDNAbpおよび伸長されたガイドRNAを含むことを含む複合体。
57.態様56の複合体であって、napDNAbpがCas9ニッカーゼである。
58.態様56の複合体であって、napDNAbpが、配列番号18のアミノ酸配列、または配列番号18との少なくとも80%、85%、90%、95%、98%、もしくは99%配列同一性を有するアミノ酸配列を含む。
59.態様57の複合体であって、napDNAbpが、配列番号18~88、126、130、137、141、147、153、157、445、460、467、および482~487のいずれか1つのアミノ酸配列との少なくとも80%、85%、90%、95%、98%、または99%配列同一性を有するアミノ酸配列を含む。
60.態様57の複合体であって、伸長されたガイドRNAが、ガイドRNAと、ガイドRNAの3'もしくは5'端またはガイドRNAの分子内の位置におけるRNA伸長とを含む。
61.態様57の複合体であって、伸長されたガイドRNAがnapDNAbpを標的DNA配列へと導くことができる。
62.態様61の複合体であって、標的DNA配列が標的鎖および相補的な非標的鎖を含み、スペーサー配列が標的鎖にハイブリダイズして、RNA-DNAハイブリッドおよびRループを形成する。
63.態様61の複合体であって、RNA伸長が、(i)逆転写鋳型配列、(ii)逆転写プライマー結合部位、および(iii)任意にリンカー配列を含む。
64.態様57の複合体であって、伸長されたガイドRNAが、配列番号394、429~442、641~649、678~692、2997~3103、3113~3121、3305~3455、3479~3493、3522~3556、3628~3698、および3755~3810のヌクレオチド配列、または配列番号394、429~442、641~649、678~692、2997~3103、3113~3121、3305~3455、3479~3493、3522~3556、3628~3698、および3755~3810のいずれか1つとの少なくとも85%、もしくは少なくとも90%、もしくは少なくとも95%、もしくは少なくとも98%、もしくは少なくとも99%配列同一性を有するヌクレオチド配列を含む。
65.態様63の複合体であって、逆転写鋳型配列が、内生DNA標的と少なくとも80%または85%または90%または95%または99%同一であるヌクレオチド配列を含む。
66.態様63の複合体であって、逆転写プライマー結合部位が、カットされたDNAの遊離の3'端とハイブリダイズする。
67.態様63の複合体であって、任意のリンカー配列が、長さが少なくとも1ヌクレオチド、または少なくとも2、少なくとも3、少なくとも4、少なくとも5、少なくとも6、少なくとも7、少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、または少なくとも15ヌクレオチドである。
68.態様1~30のいずれかの融合タンパク質をコードするポリヌクレオチド。
69.態様68のポリヌクレオチドを含むベクター。
70.態様1~30のいずれかの融合タンパク質と融合タンパク質のnapDNAbpに結合した伸長されたガイドRNAとを含む細胞。
71.態様48~67のいずれか1つの複合体を含む細胞。
72.(i)態様1~30のいずれかの融合タンパク質、態様48-67の複合体、態様68のポリヌクレオチド、または態様69のベクター;および(ii)薬学的に許容される賦形剤を含む医薬組成物。
73.(i)態様48~67の複合体、(ii)トランスで提供される逆転写酵素;および(iii)薬学的に許容される賦形剤を含む医薬組成物。
74.キットであって:(i)態様1~30のいずれか1つの融合タンパク質をコードする核酸配列;および(ii)(i)の配列の発現を駆動するプロモーターを含む核酸構築物を含む。
75.所望のヌクレオチド変化を二本鎖DNA配列に組み入れるための方法であって、方法が:
(i)融合タンパク質および伸長されたガイドRNAを含む複合体と二本鎖DNA配列を接触させ、融合タンパク質がnapDNAbpおよび逆転写酵素を含み、伸長されたガイドRNAが所望のヌクレオチド変化を含む逆転写鋳型配列を含むこと;
(ii)非標的鎖上において二本鎖DNA配列にニッキングし、それによって3'端を有する遊離の一本鎖DNAを生成すること;
(iii)遊離の一本鎖DNAの3'端を逆転写鋳型配列にハイブリダイズさせ、それによって逆転写酵素ドメインをプライムすること;
(iv)3'端からDNAの鎖を重合し、それによって所望のヌクレオチド変化を含む一本鎖DNAフラップを生成すること;
(v)カットされた部位に隣接する内生DNA鎖を一本鎖DNAフラップによって置き換え、それによって所望のヌクレオチド変化を二本鎖DNA配列に組み入れること、
を含む。
76.態様75の方法であって、(v)置き換えるステップが:(i)一本鎖DNAフラップをカットされた部位に隣接する内生DNA鎖にハイブリダイズさせて、配列ミスマッチを生出すること;(ii)内生DNA鎖を切り出すこと;および(iii)ミスマッチを修復して、所望のヌクレオチド変化をDNAの両方の鎖に含む所望の産物を形成すること、を含む。
77.態様76の方法であって、所望のヌクレオチド変化が1ヌクレオチド置換、欠失、または挿入である。
78.態様77の方法であって、1ヌクレオチド置換がトランジションまたはトランスバージョンである。
79.態様76の方法であって、所望のヌクレオチド変化が、(1)GからTの置換、(2)GからAの置換、(3)GからCの置換、(4)TからGの置換、(5)TからAの置換、(6)TからCの置換、(7)CからGの置換、(8)CからTの置換、(9)CからAの置換、(10)AからTの置換、(11)AからGの置換、または(12)AからCの置換である。
80.態様76の方法であって、所望のヌクレオチド(nucleoid)変化が、(1)G:C塩基対をT:A塩基対に、(2)G:C塩基対をA:T塩基対に、(3)G:C塩基対をC:G塩基対に、(4)T:A塩基対をG:C塩基対に、(5)T:A塩基対をA:T塩基対に、(6)T:A塩基対をC:G塩基対に、(7)C:G塩基対をG:C塩基対に、(8)C:G塩基対をT:A塩基対に、(9)C:G塩基対をA:T塩基対に、(10)A:T塩基対をT:A塩基対に、(11)A:T塩基対をG:C塩基対に、または(12)A:T塩基対をC:G塩基対に変換する。
81.態様76の方法であって、所望のヌクレオチド変化が1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、または25ヌクレオチドの挿入または欠失である。
82.態様76の方法であって、所望のヌクレオチド変化が疾患関連遺伝子を修正する。
83.態様82の方法であって、疾患関連遺伝子が:アデノシンデアミナーゼ(ADA)欠損症;アルファ-1アンチトリプシン欠損症;嚢胞性線維症;デュシェンヌ型筋ジストロフィー;ガラクトース血症;ヘモクロマトーシス;ハンチントン病;メープルシロップ尿症;マルファン症候群;1型神経線維腫症;先天性爪肥厚症;フェニルケトン尿症;重症複合免疫不全;鎌状赤血球症;スミス・レムリ・オピッツ症候群;およびテイ・サックス病からなる群から選択される単一遺伝子障害に関連する。
84.態様82の方法であって、疾患関連遺伝子が:心臓病;高血圧;アルツハイマー病;関節炎;糖尿病;がん;および肥満からなる群から選択される多遺伝子性障害に関連する。
85.態様76の方法であって、napDNAbpが、ヌクレアーゼ不活性型Cas9(dCas9)、Cas9ニッカーゼ(nCas9)、またはヌクレアーゼ活性Cas9である。
86.態様76の方法であって、napDNAbpが配列番号18のアミノ酸配列を含む。
87.態様76の方法であって、napDNAbpが、配列番号18~88、126、130、137、141、147、153、157、445、460、467、および482~487のいずれか1つのアミノ酸配列との少なくとも80%、85%、90%、95%、98%、または99%配列同一性を有するアミノ酸配列を含む。
88.態様76の方法であって、逆転写酵素が配列番号89~100、105~122、128~129、132、139、143、149、154、159、235、454、471、516、662、700、701~716、739~741、および766のアミノ酸配列のいずれか1つを含む。
89.態様76の方法であって、逆転写酵素ドメインが、配列番号89~100、105~122、128~129、132、139、143、149、154、159、235、454、471、516、662、700、701~716、739~741、および766のいずれか1つのアミノ酸配列との少なくとも80%、85%、90%、95%、98%、または99%配列同一性を有するアミノ酸配列を含む。
90.態様76の方法であって、伸長されたガイドRNAが、ガイドRNAの5'もしくは3'端または分子内の位置付けにおけるRNA伸長を含み、RNA伸長が逆転写鋳型配列を含む。
91.態様90の方法であって、RNA伸長が、長さが少なくとも5ヌクレオチド、少なくとも6ヌクレオチド、少なくとも7ヌクレオチド、少なくとも8ヌクレオチド、少なくとも9ヌクレオチド、少なくとも10ヌクレオチド、少なくとも11ヌクレオチド、少なくとも12ヌクレオチド、少なくとも13ヌクレオチド、少なくとも14ヌクレオチド、少なくとも15ヌクレオチド、少なくとも16ヌクレオチド、少なくとも17ヌクレオチド、少なくとも18ヌクレオチド、少なくとも19ヌクレオチド、少なくとも20ヌクレオチド、少なくとも21ヌクレオチド、少なくとも22ヌクレオチド、少なくとも23ヌクレオチド、少なくとも24ヌクレオチド、または少なくとも25ヌクレオチドである。
92.態様76の方法であって、伸長されたガイドRNAが、配列番号394、429~442、641~649、678~692、2997~3103、3113~3121、3305~3455、3479~3493、3522~3556、3628~3698、および3755~3810からなる群から選択されるヌクレオチド配列を有する。
93.標的座位におけるDNA分子のヌクレオチド配列の1つ以上の変化を導入するための方法であって:
(i)核酸プログラム型DNA結合タンパク質(napDNAbp)およびnapDNAbpを標的座位へと標的化するガイドRNAとDNA分子を接触させ、ガイドRNAが少なくとも1つの所望のヌクレオチド変化を含む逆転写酵素(RT)鋳型配列を含むこと;
(ii)標的座位におけるDNA鎖の暴露された3’端を形成すること;
(iii)暴露された3'端をRT鋳型配列にハイブリダイズさせて逆転写をプライムすること;
(vi)逆転写酵素によって、RT鋳型配列に基づく少なくとも1つの所望のヌクレオチド変化を含む一本鎖DNAフラップを合成すること;および
(v)少なくとも1つの所望のヌクレオチド変化を対応する内生DNA上に組み込み、それによって、標的座位においてDNA分子のヌクレオチド配列の1つ以上の変化を導入すること、
を含む。
94.態様93の方法であって、ヌクレオチド配列の1つ以上の変化がトランジションを含む。
95.態様94の方法であって、トランジションが:(a)TからC;(b)AからG;(c)CからT;および(d)GからAからなる群から選択される。
96.態様93の方法であって、ヌクレオチド配列の1つ以上の変化がトランスバージョンを含む。
97.態様96の方法であって、トランスバージョンが、(a)TからA;(b)TからG;(c)CからG;(d)CからA;(e)AからT;(f)AからC;(g)GからC;および(h)GからTからなる群から選択される。
98.態様93の方法であって、ヌクレオチド配列の1つ以上の変化が、(1)G:C塩基対をT:A塩基対に、(2)G:C塩基対をA:T塩基対に、(3)G:C塩基対をC:G塩基対に、(4)T:A塩基対をG:C塩基対に、(5)T:A塩基対をA:T塩基対に、(6)T:A塩基対をC:G塩基対に、(7)C:G塩基対をG:C塩基対に、(8)C:G塩基対をT:A塩基対に、(9)C:G塩基対をA:T塩基対に、(10)A:T塩基対をT:A塩基対に、(11)A:T塩基対をG:C塩基対に、または(12)A:T塩基対をC:G塩基対に変化させることを含む。
99.態様93の方法であって、ヌクレオチド配列の1つ以上の変化が、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、または25ヌクレオチドの挿入または欠失を含む。
100.態様93の方法であって、ヌクレオチド配列の1つ以上の変化が疾患関連遺伝子の修正を含む。
101.態様100の方法であって、疾患関連遺伝子が:アデノシンデアミナーゼ(ADA)欠損症;アルファ-1アンチトリプシン欠損症;嚢胞性線維症;デュシェンヌ型筋ジストロフィー;ガラクトース血症;ヘモクロマトーシス;ハンチントン病;メープルシロップ尿症;マルファン症候群;1型神経線維腫症;先天性爪肥厚症;フェニルケトン尿症;重症複合免疫不全;鎌状赤血球症;スミス・レムリ・オピッツ症候群;およびテイ・サックス病からなる群から選択される単一遺伝子障害に関連する。
102.態様100の方法であって、疾患関連遺伝子が:心臓病;高血圧;アルツハイマー病;関節炎;糖尿病;がん;および肥満からなる群から選択される多遺伝子性障害に関連する。
103.態様93の方法であって、napDNAbpがヌクレアーゼ活性Cas9またはそのバリアントである。
104.態様93の方法であって、napDNAbpがヌクレアーゼ不活性型Cas9(dCas9)もしくはCas9ニッカーゼ(nCas9)またはそのバリアントである。
105.態様93の方法であって、napDNAbpが配列番号18のアミノ酸配列を含む。
106.態様93の方法であって、napDNAbpが、配列番号18~88、126、130、137、141、147、153、157、445、460、467、および482~487のいずれか1つのアミノ酸配列との少なくとも80%、85%、90%、95%、98%、または99%配列同一性を有するアミノ酸配列を含む。
107.態様93の方法であって、逆転写酵素がトランスで導入される。
108.態様93の方法であって、napDNAbpが逆転写酵素への融合体を含む。
109.態様93の方法であって、逆転写酵素が配列番号89~100、105~122、128~129、132、139、143、149、154、159、235、454、471、516、662、700、701~716、739~741、および766のアミノ酸配列のいずれか1つを含む。
110.態様93の方法であって、逆転写酵素が、配列番号89~100、105~122、128~129、132、139、143、149、154、159、235、454、471、516、662、700、701~716、739~741、および766のいずれか1つのアミノ酸配列との少なくとも80%、85%、90%、95%、98%、または99%配列同一性を有するアミノ酸配列を含む。
111.態様93の方法であって、標的座位におけるDNA鎖の暴露された3’端を形成するステップが、ヌクレアーゼによってDNA鎖へニックを入れることを含む。
112.態様111の方法であって、ヌクレアーゼがnapDNAbpであるか、napDNAbpの融合ドメインとして提供されるか、またはトランスで提供される。
113.態様93の方法であって、標的座位におけるDNA鎖の暴露された3’端を形成するステップが、DNA鎖を化学的薬剤と接触させることを含む。
114.態様93の方法であって、標的座位におけるDNA鎖の暴露された3’端を形成するステップが、複製エラーを導入することを含む。
115.態様93の方法であって、DNA分子をnapDNAbpおよびガイドRNAと接触させるステップがRループを形成する。
116.態様115の方法であって、暴露された3’端が形成されるDNA鎖がRループ上にある。
117.態様93の方法であって、ガイドRNAが、逆転写酵素(RT)鋳型配列を含む伸長された部分を含む。
118.態様117の方法であって、伸長された部分が、ガイドRNAの3’端、ガイドRNAの5'端、またはガイドRNAの分子内の位置にある。
119.態様93の方法であって、ガイドRNAがさらにプライマー結合部位を含む。
120.態様93の方法であって、ガイドRNAがさらにスペーサー配列を含む。
121.態様93の方法であって、RT鋳型配列が、対応する内生DNAに対して相同的である。
122.プライム標的にプライムされた逆転写によって標的座位におけるDNA分子のヌクレオチド配列の1つ以上の変化を導入するための方法であって、方法が:(a)標的座位におけるDNA分子を(i)核酸プログラム型DNA結合タンパク質(napDNAbp)および逆転写酵素を含む融合タンパク質ならびに(ii)所望のヌクレオチド変化を含むRT鋳型を含むガイドRNAと接触させること;(b)RT鋳型のプライム標的にプライムされた逆転写を行なって、所望のヌクレオチド変化を含む一本鎖DNAを生成すること;ならびに(c)DNA修復および/または複製プロセスによって標的座位におけるDNA分子上に所望のヌクレオチド変化を組み込むことを含む。
123.態様122の方法であって、RT鋳型が、ガイドRNAの3'端、ガイドRNAの5'端、またはガイドRNAの分子内の位置付けに位置付けられる。
124.態様122の方法であって、所望のヌクレオチド変化が、トランジション、トランスバージョン、挿入、もしくは欠失、またはそれらのいずれかの組み合わせを含む。
125.態様122の方法であって、所望のヌクレオチド変化が:(a)TからC;(b)AからG;(c)CからT;および(d)GからAからなる群から選択されるトランジションを含む。
126.態様122の方法であって、所望のヌクレオチド変化が:(a)TからA;(b)TからG;(c)CからG;(d)CからA;(e)AからT;(f)AからC;(g)GからC;および(h)GからTからなる群から選択されるトランスバージョンを含む。
127.態様122の方法であって、所望のヌクレオチド変化が、(1)G:C塩基対をT:A塩基対に、(2)G:C塩基対をA:T塩基対に、(3)G:C塩基対をC:G塩基対に、(4)T:A塩基対をG:C塩基対に、(5)T:A塩基対をA:T塩基対に、(6)T:A塩基対をC:G塩基対に、(7)C:G塩基対をG:C塩基対に、(8)C:G塩基対をT:A塩基対に、(9)C:G塩基対をA:T塩基対に、(10)A:T塩基対をT:A塩基対に、(11)A:T塩基対をG:C塩基対に、または(12)A:T塩基対をC:G塩基対に変化させることを含む。
128.態様31~47のいずれか1つの伸長されたガイドRNAをコードするポリヌクレオチド。
129.態様128のポリヌクレオチドを含むベクター。
130.態様129のベクターを含む細胞。
131.態様1-30のいずれかの融合タンパク質であって、逆転写酵素がエラーを起こしやすい逆転写酵素である。
132.プライム標的にプライムされた逆転写によって標的座位におけるDNA分子に変異導入するための方法であって、方法が:(a)標的座位におけるDNA分子を(i)核酸プログラム型DNA結合タンパク質(napDNAbp)およびエラーを起こしやすい逆転写酵素を含む融合タンパク質ならびに(ii)所望のヌクレオチド変化を含むRT鋳型を含むガイドRNAと接触させること;(b)RT鋳型のプライム標的にプライムされた逆転写を行なって、変異導入された一本鎖DNAを生成すること;ならびに(c)DNA修復および/または複製プロセスによって、変異導入された一本鎖DNAを標的座位におけるDNA分子上に組み込むことを含む。
133.態様132の方法であって、融合タンパク質がPE1、PE2、またはPE3のアミノ酸配列を含む。
134.態様132の方法であって、napDNAbpがCas9ニッカーゼ(nCas9)である。
135.態様132の方法であって、napDNAbpが配列番号18~88、126、130、137、141、147、153、157、445、460、467、および482~487のアミノ酸配列を含む。
136.態様132の方法であって、ガイドRNAが配列番号222を含む。
137.態様132の方法であって、(b)プライム標的にプライムされた逆転写を行うステップが、ガイドRNA上のプライマー結合部位へのアニーリングによって逆転写をプライムすることができる標的座位における3'端プライマー結合配列を生成することを含む。
138.健康な数の反復トリヌクレオチドを含む健康な配列によって標的DNA分子上のトリヌクレオチド反復拡大変異を置き換えるための方法であって、方法が:(a)標的座位におけるDNA分子を(i)核酸プログラム型DNA結合タンパク質(napDNAbp)および逆転写酵素を含む融合タンパク質ならびに(ii)置き換え配列を含むRT鋳型を含むガイドRNAと接触させ、前記融合タンパク質が導入すること;(b)RT鋳型のプライム標的にプライムされた逆転写を行なって、置き換え配列を含む一本鎖DNAを生成すること;ならびに(c)DNA修復および/または複製プロセスによって、標的座位におけるDNA分子上に一本鎖DNAを組み込むことを含む。
139.態様138の方法であって、融合タンパク質がPE1、PE2、またはPE3のアミノ酸配列を含む。
140.態様138の方法であって、napDNAbpがCas9ニッカーゼ(nCas9)である。
141.態様138の方法であって、napDNAbpが配列番号18~88、126、130、137、141、147、153、157、445、460、467、および482~487のアミノ酸配列を含む。
142.態様138の方法であって、ガイドRNAが配列番号222を含む。
143.態様138の方法であって、(b)プライム標的にプライムされた逆転写を行うステップが、ガイドRNA上のプライマー結合部位へのアニーリングによって逆転写をプライムすることができる標的座位における3’端プライマー結合配列を生成することを含む。
144.態様138の方法であって、トリヌクレオチド反復拡大変異がハンチントン病、脆弱X症候群、またはフリードライヒ運動失調症に関連する。
145.態様138の方法であって、トリヌクレオチド反復拡大変異がCAGトリプレットの繰り返し単位を含む。
146.態様138の方法であって、トリヌクレオチド反復拡大変異がGAAトリプレットの繰り返し単位を含む。
147.プライム編集によって標的ヌクレオチド配列によってコードされる目当てのタンパク質上に機能部分を組み入れる方法であって、方法が:(a)標的ヌクレオチド配列を(i)核酸プログラム型DNA結合タンパク質(napDNAbp)および逆転写酵素を含むプライム編集因子ならびに(ii)機能部分をコードする編集鋳型を含むPEgRNAと接触させること;(b)機能部分をコードする一本鎖DNA配列を重合すること;ならびに(c)DNA修復および/または複製プロセスによって、標的ヌクレオチド配列における対応する内生鎖の代わりに一本鎖DNA配列を組み込むことを含み、方法が、目当てのタンパク質と機能部分とを含む融合タンパク質をコードする組み換え標的ヌクレオチド配列を生ずる。
148.態様147の方法であって、機能部分がペプチドタグである。
149.態様148の方法であって、ペプチドタグがアフィニティータグ、可溶化タグ、クロマトグラフィータグ、エピトープタグ、または蛍光タグである。
150.態様148の方法であって、ペプチドタグが:AviTag(配列番号245);Cタグ(配列番号246);カルモジュリンタグ(配列番号247);ポリグルタミン酸タグ(配列番号248);Eタグ(配列番号249);FLAGタグ(配列番号2);HAタグ(配列番号5);Hisタグ(配列番号252~262);Mycタグ(配列番号6);NEタグ(配列番号264);Rho1D4タグ(配列番号265);Sタグ(配列番号266);SBPタグ(配列番号267);Softag-1(配列番号268);Softag-2(配列番号269);Spotタグ(配列番号270);Strepタグ(配列番号271);TCタグ(配列番号272);Tyタグ(配列番号273);V5タグ(配列番号3);VSVタグ(配列番号275);およびXpressタグ(配列番号276)からなる群から選択される。
151.態様148の方法であって、ペプチドタグが:AU1エピトープ(配列番号278);AU5エピトープ(配列番号279);バクテリオファージT7エピトープ(T7タグ)(配列番号280);ブルータングウイルスタグ(Bタグ)(配列番号281);E2エピトープ(配列番号282);ヒスチジンアフィニティータグ(HAT)(配列番号283);HSVエピトープ(配列番号284);ポリアルギニン(Argタグ)(配列番号285);ポリアスパラギン酸(Aspタグ)(配列番号286);ポリフェニルアラニン(Pheタグ)(配列番号287);S1タグ(配列番号288);Sタグ(配列番号266);およびVSVタグ(配列番号275)からなる群から選択される。
152.態様147の方法であって、機能部分が免疫エピトープである。
153.態様152の方法であって、免疫エピトープが:破傷風トキソイド(配列番号396);ジフテリア毒素変異体CRM197(配列番号398);ムンプス免疫エピトープ1(配列番号400);ムンプス免疫エピトープ2(配列番号402);ムンプス免疫エピトープ3(配列番号404);風疹ウイルス(配列番号406);ヘマグルチニン(配列番号408);ノイラミニダーゼ(配列番号410);TAP1(配列番号412);TAP2(配列番号414);クラスI HLAに対するヘマグルチニンエピトープ(配列番号416);クラス I HLAに対するノイラミニダーゼエピトープ(配列番号418);クラスII HLAに対するヘマグルチニンエピトープ(配列番号420);クラスII HLAに対するノイラミニダーゼエピトープ(配列番号422);ヘマグルチニンエピトープH5N1結合クラスIおよびクラスII HLA(配列番号424);ノイラミニダーゼエピトープH5N1結合クラスIおよびクラスII HLA(配列番号426)からなる群から選択される。
154.態様147の方法であって、機能部分が目当てのタンパク質の局在を変改する。
155.態様147の方法であって、機能部分が分解タグであり、その結果、目当てのタンパク質の分解速度が変改される。
156.態様155の方法であって、分解タグが、本明細書に開示の分解タグをコードするアミノ酸配列を含む
157.態様147の方法であって、機能部分が低分子結合ドメインである。
158.態様157の方法であって、低分子結合ドメインが配列番号488のFKBP12である。
159.態様157の方法であって、低分子結合ドメインが配列番号489のFKBP12-F36Vである。
160.態様157の方法であって、低分子結合ドメインが配列番号490および493~494のシクロフィリンである。
161.態様157の方法であって、低分子結合ドメインが目当ての2つ以上のタンパク質上に組み入れされる。
162.態様161の方法であって、目当ての2つ以上のタンパク質が低分子に接触することによって二量体化し得る。
163.態様157の方法であって、低分子が:

Figure 2020191243000477

Figure 2020191243000478

からなる群から選択される低分子の二量体である。
164.プライム編集によって、標的ヌクレオチド配列によってコードされる目当てのタンパク質に免疫エピトープを組み入れる方法であって、方法が:(a)標的ヌクレオチド配列を(i)核酸プログラム型DNA結合タンパク質(napDNAbp)および逆転写酵素を含むプライム編集因子ならびに(ii)機能部分をコードする編集鋳型を含むPEgRNAと接触させること;(b)免疫エピトープをコードする一本鎖DNA配列を重合すること;ならびに(c)DNA修復および/または複製プロセスによって、標的ヌクレオチド配列における対応する内生鎖の代わりに一本鎖DNA配列を組み込むことを含み、方法が、目当てのタンパク質と免疫エピトープとを含む融合タンパク質をコードする組み換え標的ヌクレオチド配列を生ずる。
165.態様164の方法であって、免疫エピトープが:破傷風トキソイド(配列番号396);ジフテリア毒素変異体CRM197(配列番号398);ムンプス免疫エピトープ1(配列番号400);ムンプス免疫エピトープ2(配列番号402);ムンプス免疫エピトープ3(配列番号404);風疹ウイルス(配列番号406);ヘマグルチニン(配列番号408);ノイラミニダーゼ(配列番号410);TAP1(配列番号412);TAP2(配列番号414);クラスI HLAに対するヘマグルチニンエピトープ(配列番号416);クラスI HLAに対するノイラミニダーゼエピトープ(配列番号418);クラスII HLAに対するヘマグルチニンエピトープ(配列番号420);クラスII HLAに対するノイラミニダーゼエピトープ(配列番号422);ヘマグルチニンエピトープH5N1結合クラスIおよびクラスII HLA(配列番号424);ノイラミニダーゼエピトープH5N1結合クラスIおよびクラスII HLA(配列番号426)からなる群から選択される。
166.態様164の方法であって、融合タンパク質がPE1、PE2、またはPE3のアミノ酸配列を含む。
167.態様164の方法であって、napDNAbpがCas9ニッカーゼ(nCas9)である。
168.態様164の方法であって、napDNAbpが配列番号18~88、126、130、137、141、147、153、157、445、460、467、および482~487のアミノ酸配列を含む。
169.態様164の方法であって、ガイドRNAが配列番号222を含む。
170.プライム編集によって、標的ヌクレオチド配列によってコードされる目当てのタンパク質上に低分子二量体化ドメインを組み入れる方法であって、方法が:(a)標的ヌクレオチド配列を(i)核酸プログラム型DNA結合タンパク質(napDNAbp)および逆転写酵素を含むプライム編集因子ならびに(ii)低分子二量体化ドメインをコードする編集鋳型を含むPEgRNAと接触させること;(b)免疫エピトープをコードする一本鎖DNA配列を重合すること;ならびに(c)DNA修復および/または複製プロセスによって、標的ヌクレオチド配列における対応する内生鎖の代わりに一本鎖DNA配列を組み込むことを含み、方法が、目当てのタンパク質と低分子二量体化ドメインとを含む融合タンパク質をコードする組み換え標的ヌクレオチド配列を生ずる。
171.態様170の方法であって、さらに、目当ての第2のタンパク質に対して方法を行うことを含む。
172.態様171の方法であって、目当ての第1のタンパク質および目当ての第2のタンパク質が、前記タンパク質の夫々の二量体化ドメインに結合する低分子の存在下において二量体化する。
173.態様170の方法であって、低分子結合ドメインが配列番号488のFKBP12である。
174.態様170の方法であって、低分子結合ドメインが配列番号489のFKBP12-F36Vである。
175.態様170の方法であって、低分子結合ドメインが配列番号490および493~494のシクロフィリンである。
176.態様170の方法であって、低分子が:
Figure 2020191243000479

Figure 2020191243000480

Figure 2020191243000481

からなる群から選択される低分子の二量体である。
177.態様170の方法であって、融合タンパク質がPE1、PE2、またはPE3のアミノ酸配列を含む。
178.態様170の方法であって、napDNAbpがCas9ニッカーゼ(nCas9)である。
179.態様170の方法であって、napDNAbpが配列番号18~88、126、130、137、141、147、153、157、445、460、467、および482~487のアミノ酸配列を含む。
180.態様170の方法であって、ガイドRNAが配列番号222を含む。
181.プライム編集を用いてタンパク質上にペプチドタグまたはエピトープを組み入れる方法であって:タンパク質をコードする標的ヌクレオチド配列を、ペプチドタグをコードする第2のヌクレオチド配列をそれに挿入するように構成されたプライム編集因子構築物と接触させて、組み換えヌクレオチド配列をもたらすことを含み、その結果、ペプチドタグおよびタンパク質が融合タンパク質として組み換えヌクレオチド配列から発現される。
182.態様181の方法であって、ペプチドタグがタンパク質の精製および/または検出に用いられる。
183.態様181の方法であって、ペプチドタグが、ポリヒスチジン(例えば、HHHHHH(配列番号257))、FLAG(例えば、DYKDDDDK(配列番号2))、V5(例えば、GKPIPNPLLGLDST(配列番号3))、GCN4、HA(例えば、YPYDVPDYA(配列番号5))、Myc(例えばEQKLISEED(配列番号6))、GSTなどである。
184.態様181の方法であって、ペプチドタグが、配列番号245-290からなる群から選択されるアミノ酸配列を有する。
185.態様181の方法であって、ペプチドタグがリンカーによってタンパク質に融合される。
186.態様181の方法であって、融合タンパク質が次の構造を有し:[タンパク質]-[ペプチドタグ]または[ペプチドタグ]-[タンパク質]、「]-[」が任意のリンカーを表す。
187.態様181の方法であって、リンカーが配列番号127、165-176、446、453、および767-769のアミノ酸配列を有する。
188.態様181の方法であって、プライム編集因子構築物が、配列番号101~104、181~183、223~234、237~244、277、324~330、332、334、336、338、340、342、344、346、348、350、352、354、356、358、360、362、364、366、368、394、429~442、499~505、641~649、678~692、735~736、757~761、776~777のヌクレオチド配列を含むPEgRNAを含む。
189.態様181の方法であって、PEgRNAがスペーサー、gRNAコア、および伸長アームを含み、スペーサーが標的ヌクレオチド配列に対して相補的であり、伸長アームがペプチドタグをコードする逆転写酵素鋳型を含む。
190.態様181の方法であって、PEgRNAがスペーサー、gRNAコア、および伸長アームを含み、スペーサーが標的ヌクレオチド配列に対して相補的であり、伸長アームがペプチドタグをコードする逆転写酵素鋳型を含む。
191.プライム編集によって標的ヌクレオチド配列によってコードされるPRNP上に1つ以上の防護性変異を組み入れることによって、プリオン病を防止またはその進行を停止させる方法であって、方法が:(a)標的ヌクレオチド配列を(i)核酸プログラム型DNA結合タンパク質(napDNAbp)および逆転写酵素を含むプライム編集因子ならびに(ii)機能部分をコードする編集鋳型を含むPEgRNAと接触させること;(b)防護性変異をコードする一本鎖DNA配列を重合すること;ならびに(c)DNA修復および/または複製プロセスによって、標的ヌクレオチド配列における対応する内生鎖の代わりに一本鎖DNA配列を組み込むことを含み、方法が、ミスフォールディングに対して耐性である防護性変異を含むPRNPをコードする組み換え標的ヌクレオチド配列を生ずる。
192.態様191の方法であって、プリオン病がヒトプリオン病である。
193.態様191の方法であって、プリオン病が動物プリオン病である。
194.態様192の方法であって、プリオン病がクロイツフェルト・ヤコブ病(CJD)、変異型クロイツフェルト・ヤコブ病(vCJD)、ゲルストマン・ストロイスラー・シャインカー症候群、致死性家族性不眠症、またはクールー病である。
195.態様193の方法であって、プリオン病が牛海綿状脳症(BSEまたは「狂牛病」)、慢性消耗病(CWD)、スクレイピー、伝達性ミンク脳症、ネコ海綿状脳症、および有蹄類海綿状脳症である。
196.態様191の方法であって、野生型PRNPアミノ酸配列が配列番号291-292である。
197.態様191の方法であって、方法が、配列番号293-323からなる群から選択される改変されたPRNPアミノ酸配列をもたらし、前記改変されたPRNPタンパク質がミスフォールディングに対して耐性である。
198.態様191の方法であって、融合タンパク質がPE1、PE2、またはPE3のアミノ酸配列を含む。
199.態様191の方法であって、napDNAbpがCas9ニッカーゼ(nCas9)である。
200.態様191の方法であって、napDNAbpが配列番号18~88、126、130、137、141、147、153、157、445、460、467、および482~487のアミノ酸配列を含む。
201.態様191の方法であって、ガイドRNAが配列番号222を含む。
202.プライム編集によって、標的ヌクレオチド配列によってコードされる目当てのRNA上にリボヌクレオチドモチーフまたはタグを組み入れる方法であって、方法が:(a)標的ヌクレオチド配列を(i)核酸プログラム型DNA結合タンパク質(napDNAbp)および逆転写酵素を含むプライム編集因子ならびに(ii)リボヌクレオチドモチーフまたはタグをコードする編集鋳型を含むPEgRNAと接触させること;(b)リボヌクレオチドモチーフまたはタグをコードする一本鎖DNA配列を重合すること;ならびに(c)DNA修復および/または複製プロセスによって、標的ヌクレオチド配列における対応する内生鎖の代わりに一本鎖DNA配列を組み込むことを含み、方法が、リボヌクレオチドモチーフまたはタグを含む目当ての修飾されたRNAをコードする組み換え標的ヌクレオチド配列を生ずる。
203.態様202の方法であって、リボヌクレオチドモチーフまたはタグが検出部分である。
204.態様202の方法であって、リボヌクレオチドモチーフまたはタグが目当てのRNAの発現レベルに影響する。
205.態様202の方法であって、リボヌクレオチドモチーフまたはタグが目当てのRNAの輸送または細胞下レベル位置付けに影響する。
206.態様202の方法であって、リボヌクレオチドモチーフまたはタグが、SV40 1型、SV40 2型、SV40 3型、hGH、BGH、rbGlob、TK、MALAT1 ENE-mascRNA、KSHV PAN ENE、Smbox/U1 snRNAボックス、U1 snRNA 3'ボックス、tRNA-リジン、broccoliアプタマー、spinachアプタマー、mangoアプタマー、HDVリボザイム、およびm6Aからなる群から選択される。
207.態様202の方法であって、PEgRNAが配列番号101~104、181~183、223~234、237~244、277、324~330、332、334、336、338、340、342、344、346、348、350、352、354、356、358、360、362、364、366、368、394、429~442、499~505、641~649、678~692、735~736、757~761、776~777、2997~3103、3113~3121、3305~3455、3479~3493、3522~3540、3549~3556、3628~3698、3755~3810、3874、3890~3901、3905~3911、3913~3929、3972~3989を含む。
208.態様202の方法であって、融合タンパク質がPE1、PE2、またはPE3のアミノ酸配列を含む。
209.態様202の方法であって、napDNAbpがCas9ニッカーゼ(nCas9)である。
210.態様202の方法であって、napDNAbpが配列番号18~88、126、130、137、141、147、153、157、445、460、467、および482~487のアミノ酸配列を含む。
211.プライム編集によって、標的ヌクレオチド配列によってコードされる目当てのタンパク質上の機能部分を組み入れまたは欠失する方法であって、方法が:(a)標的ヌクレオチド配列を(i)核酸プログラム型DNA結合タンパク質(napDNAbp)および逆転写酵素を含むプライム編集因子ならびに(ii)機能部分またはその欠失をコードする編集鋳型を含むPEgRNAと接触させること;(b)機能部分またはその欠失をコードする一本鎖DNA配列を重合すること;ならびに(c)DNA修復および/または複製プロセスによって、標的ヌクレオチド配列における対応する内生鎖の代わりに一本鎖DNA配列を組み込むことを含み、方法が、目当てのタンパク質および機能部分またはその除去を含む改変されたタンパク質をコードする組み換え標的ヌクレオチド配列を生じ、機能部分がタンパク質の修飾状態または局在状態を変改する。
212.態様211の方法であって、機能部分が、目当てのタンパク質のリン酸化、ユビキチン化、グリコシル化、脂質修飾、ヒドロキシル化、メチル化、アセチル化、クロトニル化、SUMO化状態を変改する。
群2.態様213~424
213.融合タンパク質であって、核酸プログラム型DNA結合タンパク質(napDNAbp)およびポリメラーゼを含む。
214.態様213の融合タンパク質であって、融合タンパク質が、プライム編集ガイドRNA(PEgRNA)の存在下においてプライム編集を実行することができる。
215.態様213の融合タンパク質であって、napDNAbpがニッカーゼ活性を有する。
216.態様213の融合タンパク質であって、napDNAbpがCas9タンパク質またはそのバリアントである。
217.態様213の融合タンパク質であって、napDNAbpがヌクレアーゼ活性Cas9、ヌクレアーゼ不活性型Cas9(dCas9)、またはCas9ニッカーゼ(nCas9)である。
218.態様213の融合タンパク質であって、napDNAbpがCas9ニッカーゼ(nCas9)である。
219.態様213の融合タンパク質であって、napDNAbpが:Cas9、Cas12e、Cas12d、Cas12a、Cas12b1、Cas13a、Cas12c、およびアルゴノートからなる群から選択され、任意にニッカーゼ活性を有する。
220.態様213の融合タンパク質であって、融合タンパク質がPEgRNAと複合体化したときに標的DNA配列に結合することができる。
221.態様220の融合タンパク質であって、標的DNA配列が標的鎖および相補的な非標的鎖を含む。
222.態様220の融合タンパク質であって、PEgRNAと複合体化した融合タンパク質の結合がRループを形成する。
223.態様222の融合タンパク質であって、Rループが、(i)PEgRNAと標的鎖とを含むRNA-DNAハイブリッドおよび(ii)相補的な非標的鎖を含む。
224.態様223の融合タンパク質であって、相補的な非標的鎖がニッキングされて、遊離の3’端を有するプライム配列を形成する。
225.態様214の融合タンパク質であって、PEgRNAが(a)ガイドRNAおよび(b)ガイドRNAの5'もしくは3’端またはガイドRNAの分子内の位置付けにおける伸長アームを含む。
226.態様225の融合タンパク質であって、伸長アームが(i)所望のヌクレオチド変化を含むDNA合成鋳型配列および(ii)プライマー結合部位を含む。
227.態様226の融合タンパク質であって、DNA合成鋳型配列が、ニック部位に隣接する内生DNA配列に対して相補的である一本鎖DNAフラップをコードし、一本鎖DNAフラップが所望のヌクレオチド変化を含む。
228.態様225の融合タンパク質であって、伸長アームが、長さが少なくとも5ヌクレオチド、少なくとも6ヌクレオチド、少なくとも7ヌクレオチド、少なくとも8ヌクレオチド、少なくとも9ヌクレオチド、少なくとも10ヌクレオチド、少なくとも11ヌクレオチド、少なくとも12ヌクレオチド、少なくとも13ヌクレオチド、少なくとも14ヌクレオチド、少なくとも15ヌクレオチド、少なくとも16ヌクレオチド、少なくとも17ヌクレオチド、少なくとも18ヌクレオチド、少なくとも19ヌクレオチド、少なくとも20ヌクレオチド、少なくとも21ヌクレオチド、少なくとも22ヌクレオチド、少なくとも23ヌクレオチド、少なくとも24ヌクレオチド、または少なくとも25ヌクレオチドである。
229.態様227の融合タンパク質であって、一本鎖DNAフラップが、ニック部位に隣接する内生DNA配列にハイブリダイズし、それによって所望のヌクレオチド変化を組み入れる。
230.態様227の融合タンパク質であって、一本鎖DNAフラップが、遊離の5'端を有しかつニック部位に隣接する内生DNA配列に取って代わる。
231.態様230の融合タンパク質であって、5'端を有する内生DNA配列が細胞によって切除される。
232.態様230の融合タンパク質であって、一本鎖DNAフラップの細胞性修復が所望のヌクレオチド変化の組み入れをもたらし、それによって所望の産物を形成する。
233.態様226の融合タンパク質であって、所望のヌクレオチド変化がPAM配列の約-4から+10の間もしくはPAM配列の約-10から+20の間もしくはPAM配列の約-20から+40の間もしくはPAM配列の約-30から+100の間である編集窓上に組み入れされるか、または所望のヌクレオチド変化がニック部位の少なくとも1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、もしくは100ヌクレオチド下流に組み入れされる。
234.態様213の融合タンパク質であって、napDNAbpが、配列番号18のアミノ酸配列、または配列番号18のアミノ酸配列との少なくとも80%、85%、90%、95%、98%、もしくは99%配列同一性を有するアミノ酸配列を含む。
235.態様213の融合タンパク質であって、napDNAbpが、配列番号18~88、126、130、137、141、147、153、157、445、460、467、および482~487のいずれか1つのアミノ酸配列との少なくとも80%、85%、90%、95%、98%、または99%配列同一性を有するアミノ酸配列を含む。
236.態様213の融合タンパク質であって、ポリメラーゼが逆転写酵素であり、配列番号89~100、105~122、128~129、132、139、143、149、154、159、235、454、471、516、662、700、701~716、739~741、および766のアミノ酸配列のいずれか1つを含む。
237.態様213の融合タンパク質であって、ポリメラーゼが逆転写酵素であり、配列番号89~100、105~122、128~129、132、139、143、149、154、159、235、454、471、516、662、700、701~716、739~741、および766のいずれか1つのアミノ酸配列との少なくとも80%、85%、90%、95%、98%、または99%配列同一性を有するアミノ酸配列を含む。
238.態様213の融合タンパク質であって、ポリメラーゼがレトロウイルスまたはレトロトランスポゾンからの天然に存在する逆転写酵素である。
239.先の態様のいずれか1つの融合タンパク質であって、融合タンパク質が構造NH2-[napDNAbp]-[ポリメラーゼ]-COOH;またはNH2-[ポリメラーゼ]-[napDNAbp]-COOHを含み、「]-[」の夫々のものが任意のリンカー配列の存在を指示する。
240.態様239の融合タンパク質であって、リンカー配列が配列番号127、165~176、446、453、および767~769のアミノ酸配列を含む。
241.態様226の融合タンパク質であって、所望のヌクレオチド変化が1ヌクレオチド変化、1つ以上のヌクレオチドの挿入、または1つ以上のヌクレオチドの欠失である。
242.態様241の融合タンパク質であって、挿入または欠失が、少なくとも1、少なくとも2、少なくとも3、少なくとも4、少なくとも5、少なくとも6、少なくとも7、少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも16、少なくとも17、少なくとも18、少なくとも19、少なくとも20、少なくとも21、少なくとも22、少なくとも23、少なくとも24、少なくとも25、少なくとも26、少なくとも27、少なくとも28、少なくとも29、少なくとも30、少なくとも31、少なくとも32、少なくとも33、少なくとも34、少なくとも35、少なくとも36、少なくとも37、少なくとも38、少なくとも39、少なくとも40、少なくとも41、少なくとも42、少なくとも43、少なくとも44、少なくとも45、少なくとも46、少なくとも47、少なくとも48、少なくとも49、または少なくとも50である。
243.ガイドRNAとDNA合成鋳型を含む少なくとも1つの核酸伸長アームとを含むPEgRNA。
244.態様241のPEgRNAであって、核酸伸長アームがガイドRNAの3'もしくは5'端またはガイドRNAの分子内の位置の位置であり、核酸伸長アームがDNAまたはRNAである。
245.態様242のPEgRNAであって、PEgRNAが、napDNAbpに結合することおよびnapDNAbpを標的DNA配列へと導くことができる。
246.態様245のPEgRNAであって、標的DNA配列が標的鎖および相補的な非標的鎖を含み、ガイドRNAが標的鎖にハイブリダイズしてRNA-DNAハイブリッドおよびRループを形成する。
247.態様243のPEgRNAであって、少なくとも1つの核酸伸長アームが(i)DNA合成鋳型および(ii)プライマー結合部位を含む。
248.態様247のPEgRNAであって、核酸伸長アームが、長さが少なくとも5ヌクレオチド、少なくとも6ヌクレオチド、少なくとも7ヌクレオチド、少なくとも8ヌクレオチド、少なくとも9ヌクレオチド、少なくとも10ヌクレオチド、少なくとも11ヌクレオチド、少なくとも12ヌクレオチド、少なくとも13ヌクレオチド、少なくとも14ヌクレオチド、少なくとも15ヌクレオチド、少なくとも16ヌクレオチド、少なくとも17ヌクレオチド、少なくとも18ヌクレオチド、少なくとも19ヌクレオチド、少なくとも20ヌクレオチド、少なくとも21ヌクレオチド、少なくとも22ヌクレオチド、少なくとも23ヌクレオチド、少なくとも24ヌクレオチド、または少なくとも25ヌクレオチドである。
249.態様247のPEgRNAであって、DNA合成鋳型が、長さが少なくとも3ヌクレオチド、少なくとも4ヌクレオチド、少なくとも5ヌクレオチド、少なくとも6ヌクレオチド、少なくとも7ヌクレオチド、少なくとも8ヌクレオチド、少なくとも9ヌクレオチド、少なくとも10ヌクレオチド、少なくとも11ヌクレオチド、少なくとも12ヌクレオチド、少なくとも13ヌクレオチド、少なくとも14ヌクレオチド、または少なくとも15ヌクレオチドである。
250.態様247のPEgRNAであって、プライマー結合部位が、長さが少なくとも3ヌクレオチド、少なくとも4ヌクレオチド、少なくとも5ヌクレオチド、少なくとも6ヌクレオチド、少なくとも7ヌクレオチド、少なくとも8ヌクレオチド、少なくとも9ヌクレオチド、少なくとも10ヌクレオチド、少なくとも11ヌクレオチド、少なくとも12ヌクレオチド、少なくとも13ヌクレオチド、少なくとも14ヌクレオチド、または少なくとも15ヌクレオチドである。
251.態様243のPEgRNAであって、さらに、リンカー、ステムループ、ヘアピン、トウループ、アプタマー、またはRNA-タンパク質動員ドメインからなる群から選択される少なくとも1つの追加の構造を含む。
252.態様247のPEgRNAであって、DNA合成鋳型が、ニック部位に隣接する内生DNA配列に対して相補的である一本鎖DNAフラップをコードし、一本鎖DNAフラップが所望のヌクレオチド変化を含む。
253.態様252のPEgRNAであって、一本鎖DNAフラップが、ニッキングされた標的DNA配列上の5'端を有する内生一本鎖DNAを押し除け、内生一本鎖DNAがニック部位の下流において直ちに隣接する。
254.態様253のPEgRNAであって、遊離の5'端を有する内生一本鎖DNAが細胞によって切除される。
255.態様253のPEgRNAであって、一本鎖DNAフラップの細胞性修復が所望のヌクレオチド変化の組み入れをもたらし、それによって所望の産物を形成する。
256.態様243のPEgRNAであって、配列番号101~104、181~183、223~234、237~244、277、324~330、332、334、336、338、340、342、344、346、348、350、352、354、356、358、360、362、364、366、368、394、429~442、499~505、641~649、678~692、735~736、757~761、776~777のヌクレオチド配列、または配列番号101~104、181~183、223~234、237~244、277、324~330、332、334、336、338、340、342、344、346、348、350、352、354、356、358、360、362、364、366、368、394、429~442、499~505、641~649、678~692、735~736、757~761、776~777のいずれか1つとの少なくとも85%、または少なくとも90%、または少なくとも95%、または少なくとも98%、または少なくとも99%配列同一性を有するヌクレオチド配列を含む。
257.態様247のPEgRNAであって、DNA合成鋳型が、内生DNA標的と少なくとも80%または85%または90%または95%または99%同一であるヌクレオチド配列を含む。
258.態様247のPEgRNAであって、プライマー結合部位が、カットされたDNAの遊離の3'端とハイブリダイズする。
259.態様251のPEgRNAであって、少なくとも1つの追加の構造がPEgRNAの3'または5'端に位置付けられる。
260.態様213-242のいずれか1つの融合タンパク質とPEgRNAとを含むことを含む複合体。
261.態様260の複合体であって、PEgRNAが、ガイドRNAと、ガイドRNAの3'もしくは5'端またはガイドRNAの分子内の位置における核酸伸長アームとを含む。
262.態様260の複合体であって、PEgRNAが、napDNAbpに結合することおよびnapDNAbpを標的DNA配列へと導くことができる。
263.態様262の複合体であって、標的DNA配列が標的鎖および相補的な非標的鎖を含み、ガイドRNAが標的鎖にハイブリダイズして、RNA-DNAハイブリッドおよびRループを形成する。
264.態様261の複合体であって、少なくとも1つの核酸伸長アームが(i)DNA合成鋳型および(ii)プライマー結合部位を含む。
265.態様260の複合体であって、PEgRNAが、配列番号101~104、181~183、223~234、237~244、277、324~330、332、334、336、338、340、342、344、346、348、350、352、354、356、358、360、362、364、366、368、394、429~442、499~505、641~649、678~692、735~736、757~761、776~777のヌクレオチド配列、または配列番号101~104、181~183、223~234、237~244、277、324~330、332、334、336、338、340、342、344、346、348、350、352、354、356、358、360、362、364、366、368、394、429~442、499~505、641~649、678~692、735~736、757~761、776~777のいずれか1つとの少なくとも85%、もしくは少なくとも90%、もしくは少なくとも95%、もしくは少なくとも98%、もしくは少なくとも99%配列同一性を有するヌクレオチド配列を含む。
266.態様264の複合体であって、DNA合成鋳型が、内生DNA標的と少なくとも80%または85%または90%または95%または99%同一であるヌクレオチド配列を含む。
267.態様264の複合体であって、プライマー結合部位が、カットされたDNAの遊離の3'端とハイブリダイズする。
268.napDNAbpおよびPEgRNAを含むことを含む複合体。
269.態様268の複合体であって、napDNAbpがCas9ニッカーゼである。
270.態様268の複合体であって、napDNAbpが配列番号18のアミノ酸配列を含む。
271.態様268の複合体であって、napDNAbpが、配列番号18~88、126、130、137、141、147、153、157、445、460、467、および482~487のいずれか1つのアミノ酸配列との少なくとも80%、85%、90%、95%、98%、または99%配列同一性を有するアミノ酸配列を含む。
272.態様268の複合体であって、PEgRNAが、ガイドRNAと、ガイドRNAの3'もしくは5'端またはガイドRNAの分子内の位置における核酸伸長アームとを含む。
273.態様268の複合体であって、PEgRNAがnapDNAbpを標的DNA配列へと導くことができる。
274.態様272の複合体であって、標的DNA配列が標的鎖および相補的な非標的鎖を含み、PEgRNAのスペーサー配列が標的鎖にハイブリダイズして、RNA-DNAハイブリッドおよびRループを形成する。
275.態様273の複合体であって、核酸伸長アームが(i)DNA合成鋳型および(ii)プライマー結合部位を含む。
276.態様269の複合体であって、PEgRNAが、配列番号101~104、181~183、223~234、237~244、277、324~330、332、334、336、338、340、342、344、346、348、350、352、354、356、358、360、362、364、366、368、394、429~442、499~505、641~649、678~692、735~736、757~761、776~777、2997~3103、3113~3121、3305~3455、3479~3493、3522~3540、3549~3556、3628~3698、3755~3810、3874、3890~3901、3905~3911、3913~3929、3972~3989のヌクレオチド配列、または配列番号101~104、181~183、223~234、237~244、277、324~330、332、334、336、338、340、342、344、346、348、350、352、354、356、358、360、362、364、366、368、394、429~442、499~505、641~649、678~692、735~736、757~761、776~777のいずれか1つとの少なくとも85%、もしくは少なくとも90%、もしくは少なくとも95%、もしくは少なくとも98%、もしくは少なくとも99%配列同一性を有するヌクレオチド配列を含む。
277.態様276の複合体であって、DNA合成鋳型が、内生DNA標的と少なくとも80%または85%または90%または95%または99%同一であるヌクレオチド配列を含む。
278.態様276の複合体であって、プライマー結合部位が、カットされたDNAの遊離の3'端とハイブリダイズする。
279.態様276の複合体であって、PEgRNAが、さらに、リンカー、ステムループ、ヘアピン、トウループ、アプタマー、またはRNA-タンパク質動員ドメインからなる群から選択される少なくとも1つの追加の構造を含む。
280.態様213~242のいずれかの融合タンパク質をコードするポリヌクレオチド。
281.態様280のポリヌクレオチドを含むベクター。
282.態様213~242のいずれかの融合タンパク質と融合タンパク質のnapDNAbpに結合したPEgRNAとを含む細胞。
283.態様260~279のいずれか1つの複合体を含む細胞。
284.医薬組成物であって:(i)態様213~242のいずれかの融合タンパク質、態様260~279の複合体、態様68のポリヌクレオチド、または態様69のベクター;および(ii)薬学的に許容される賦形剤を含む。
285.医薬組成物であって:(i)態様260~279の複合体、(ii)トランスで提供されるポリメラーゼ;および(iii)薬学的に許容される賦形剤を含む。
286.キットであって:(i)態様213~242のいずれか1つの融合タンパク質をコードする核酸配列;および(ii)(i)の配列の発現を駆動するプロモーターを含む核酸構築物を含む。
287.所望のヌクレオチド変化を二本鎖DNA配列に組み入れるための方法であって、方法が:
(i)融合タンパク質およびPEgRNAを含む複合体と二本鎖DNA配列を接触させ、融合タンパク質がnapDNAbpおよびポリメラーゼを含み、PEgRNAが所望のヌクレオチド変化を含むDNA合成鋳型とプライマー結合部位とを含むこと;
(ii)二本鎖DNA配列にニッキングし、それによって、3'端を有する遊離の一本鎖DNAを生成すること;
(iii)遊離の一本鎖DNAの3'端をプライマー結合部位にハイブリダイズさせ、それによってポリメラーゼをプライムすること;
(iv)プライマー結合部位にハイブリダイズした3'端からDNAの鎖を重合し、それによって、DNA合成鋳型に対して相補的であるかつ所望のヌクレオチド変化を含む一本鎖DNAフラップを生成すること;
(v)カットされた部位に隣接する内生DNA鎖を一本鎖DNAフラップによって置き換え、それによって所望のヌクレオチド変化を二本鎖DNA配列に組み入れること、
を含む。
288.態様287の方法であって、(v)置き換えるステップが:(i)一本鎖DNAフラップをカットされた部位に隣接する内生DNA鎖にハイブリダイズさせて、配列ミスマッチを生出すること;(ii)内生DNA鎖を切り出すこと;および(iii)ミスマッチを修復して、所望のヌクレオチド変化をDNAの両方の鎖に含む所望の産物を形成すること、を含む。
289.態様288の方法であって、所望のヌクレオチド変化が1ヌクレオチド置換、欠失、または挿入である。
290.態様289の方法であって、1ヌクレオチド置換がトランジションまたはトランスバージョンである。
291.態様288の方法であって、所望のヌクレオチド変化が、(1)GからTの置換、(2)GからAの置換、(3)GからCの置換、(4)TからGの置換、(5)TからAの置換、(6)TからCの置換、(7)CからGの置換、(8)CからTの置換、(9)CからAの置換、(10)AからTの置換、(11)AからGの置換、または(12)AからCの置換である。
292.態様288の方法であって、所望のヌクレオチド(nucleoid)変化が、(1)G:C塩基対をT:A塩基対に、(2)G:C塩基対をA:T塩基対に、(3)G:C塩基対をC:G塩基対に、(4)T:A塩基対をG:C塩基対に、(5)T:A塩基対をA:T塩基対に、(6)T:A塩基対をC:G塩基対に、(7)C:G塩基対をG:C塩基対に、(8)C:G塩基対をT:A塩基対に、C:G塩基対をA:T塩基対に、(10)A:T塩基対をT:A塩基対に、(11)A:T塩基対をG:C塩基対に、または(12)A:T塩基対をC:G塩基対に変換する。
293.態様288の方法であって、所望のヌクレオチド変化が、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、または25ヌクレオチドの挿入または欠失である。
294.態様288の方法であって、所望のヌクレオチド変化が疾患関連遺伝子を修正する。
295.態様294の方法であって、疾患関連遺伝子が:アデノシンデアミナーゼ(ADA)欠損症;アルファ-1アンチトリプシン欠損症;嚢胞性線維症;デュシェンヌ型筋ジストロフィー;ガラクトース血症;ヘモクロマトーシス;ハンチントン病;メープルシロップ尿症;マルファン症候群;1型神経線維腫症;先天性爪肥厚症;フェニルケトン尿症;重症複合免疫不全;鎌状赤血球症;スミス・レムリ・オピッツ症候群;トリヌクレオチド反復障害;プリオン病;およびテイ・サックス病からなる群から選択される単一遺伝子障害に関連する。
296.態様294の方法であって、疾患関連遺伝子が:心臓病;高血圧;アルツハイマー病;関節炎;糖尿病;がん;および肥満からなる群から選択される多遺伝子性障害に関連する。
297.態様287の方法であって、napDNAbpが、ヌクレアーゼ不活性型Cas9(dCas9)、Cas9ニッカーゼ(nCas9)、またはヌクレアーゼ活性Cas9である。
298.態様287の方法であって、napDNAbpが、配列番号18のアミノ酸配列、または配列番号18のアミノ酸配列との少なくとも80%、85%、90%、95%、98%、もしくは99%配列同一性を有するアミノ酸配列を含む。
299.態様287の方法であって、napDNAbpが、配列番号18~88、126、130、137、141、147、153、157、445、460、467、および482~487のいずれか1つのアミノ酸配列との少なくとも80%、85%、90%、95%、98%、または99%配列同一性を有するアミノ酸配列を含む。
300.態様287の方法であって、ポリメラーゼが逆転写酵素であり、配列番号89~100、105~122、128~129、132、139、143、149、154、159、235、454、471、516、662、700、701~716、739~741、および766のアミノ酸配列のいずれか1つを含む。
301.態様287の方法であって、ポリメラーゼが逆転写酵素であり、配列番号89~100、105~122、128~129、132、139、143、149、154、159、235、454、471、516、662、700、701~716、739~741、および766のいずれか1つのアミノ酸配列との少なくとも80%、85%、90%、95%、98%、または99%配列同一性を有するアミノ酸配列を含む。
302.態様287の方法であって、PEgRNAが核酸伸長アームをガイドRNAの3'もしくは5'端または分子内の位置付けに含み、伸長アームがDNA合成鋳型配列およびプライマー結合部位を含む。
303.態様302の方法であって、伸長アームが、長さが少なくとも5ヌクレオチド、少なくとも6ヌクレオチド、少なくとも7ヌクレオチド、少なくとも8ヌクレオチド、少なくとも9ヌクレオチド、少なくとも10ヌクレオチド、少なくとも11ヌクレオチド、少なくとも12ヌクレオチド、少なくとも13ヌクレオチド、少なくとも14ヌクレオチド、少なくとも15ヌクレオチド、少なくとも16ヌクレオチド、少なくとも17ヌクレオチド、少なくとも18ヌクレオチド、少なくとも19ヌクレオチド、少なくとも20ヌクレオチド、少なくとも21ヌクレオチド、少なくとも22ヌクレオチド、少なくとも23ヌクレオチド、少なくとも24ヌクレオチド、または少なくとも25ヌクレオチドである。
304.態様287の方法であって、PEgRNAが、配列番号101~104、181~183、223~234、237~244、277、324~330、332、334、336、338、340、342、344、346、348、350、352、354、356、358、360、362、364、366、368、394、429~442、499~505、641~649、678~692、735~736、757~761、776~777からなる群から選択されるヌクレオチド配列を有する。
305.標的座位におけるDNA分子のヌクレオチド配列の1つ以上の変化を導入するための方法であって:
(i)DNA分子を、核酸プログラム型DNA結合タンパク質(napDNAbp)およびnapDNAbpを標的座位へと標的化するPEgRNAと接触させ、PEgRNAが、少なくとも1つの所望のヌクレオチド変化を含む逆転写酵素(RT)鋳型配列とプライマー結合部位とを含むことと;
(ii)標的座位におけるDNA鎖の暴露された3'端を形成すること;
(iii)暴露された3'端をプライマー結合部位にハイブリダイズさせて逆転写をプライムすること;
(iv)逆転写酵素によって、RT鋳型配列に基づく少なくとも1つの所望のヌクレオチド変化を含む一本鎖DNAフラップを合成すること;および
(v)少なくとも1つの所望のヌクレオチド変化を対応する内生DNA上に組み込み、それによって、標的座位においてDNA分子のヌクレオチド配列の1つ以上の変化を導入すること、
を含む。
306.態様305の方法であって、ヌクレオチド配列の1つ以上の変化がトランジションを含む。
307.態様306の方法であって、トランジションが、(a)TからC;(b)AからG;(c)CからT;および(d)GからAからなる群から選択される。
308.態様305の方法であって、ヌクレオチド配列の1つ以上の変化がトランスバージョンを含む。
309.態様308の方法であって、トランスバージョンが、(a)TからA;(b)TからG;(c)CからG;(d)CからA;(e)AからT;(f)AからC;(g)GからC;および(h)GからTからなる群から選択される。
310.態様305の方法であって、ヌクレオチド配列の1つ以上の変化が、(1)G:C塩基対をT:A塩基対に、(2)G:C塩基対をA:T塩基対に、(3)G:C塩基対をC:G塩基対に、(4)T:A塩基対をG:C塩基対に、(5)T:A塩基対をA:T塩基対に、(6)T:A塩基対をC:G塩基対に、(7)C:G塩基対をG:C塩基対に、(8)C:G塩基対をT:A塩基対に、(9)C:G塩基対をA:T塩基対に、(9)A:T塩基対をT:A塩基対に、(11)A:T塩基対をG:C塩基対に、または(12)A:T塩基対をC:G塩基対に変化させることを含む。
311.態様305の方法であって、ヌクレオチド配列の1つ以上の変化が、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、または25ヌクレオチドの挿入または欠失を含む。
312.態様305の方法であって、ヌクレオチド配列の1つ以上の変化が疾患関連遺伝子の修正を含む。
313.態様312の方法であって、疾患関連遺伝子が:アデノシンデアミナーゼ(ADA)欠損症;アルファ-1アンチトリプシン欠損症;嚢胞性線維症;デュシェンヌ型筋ジストロフィー;ガラクトース血症;ヘモクロマトーシス;ハンチントン病;メープルシロップ尿症;マルファン症候群;1型神経線維腫症;先天性爪肥厚症;フェニルケトン尿症;重症複合免疫不全;鎌状赤血球症;スミス・レムリ・オピッツ症候群;トリヌクレオチド反復障害;プリオン病;およびテイ・サックス病からなる群から選択される単一遺伝子障害に関連する。
314.態様312の方法であって、疾患関連遺伝子が:心臓病;高血圧;アルツハイマー病;関節炎;糖尿病;がん;および肥満からなる群から選択される多遺伝子性障害に関連する。
315.態様305の方法であって、napDNAbpがヌクレアーゼ活性Cas9またはそのバリアントである。
316.態様305の方法であって、napDNAbpがヌクレアーゼ不活性型Cas9(dCas9)もしくはCas9ニッカーゼ(nCas9)またはそのバリアントである。
317.態様305の方法であって、napDNAbpが、配列番号2のアミノ酸配列、または配列番号2との少なくとも80%、85%、90%、95%、98%、もしくは99%配列同一性を有するアミノ酸配列を含む。
318.態様305の方法であって、napDNAbpが、配列番号18~88、126、130、137、141、147、153、157、445、460、467、および482~487のいずれか1つのアミノ酸配列との少なくとも80%、85%、90%、95%、98%、または99%配列同一性を有するアミノ酸配列を含む。
319.態様305の方法であって、逆転写酵素がトランスで導入される。
320.態様305の方法であって、napDNAbpが逆転写酵素への融合体を含む。
321.態様305の方法であって、逆転写酵素が配列番号89~100、105~122、128~129、132、139、143、149、154、159、235、454、471、516、662、700、701~716、739~741、および766のアミノ酸配列のいずれか1つを含む。
322.態様305の方法であって、逆転写酵素が、配列番号89~100、105~122、128~129、132、139、143、149、154、159、235、454、471、516、662、700、701~716、739~741、および766のいずれか1つのアミノ酸配列との少なくとも80%、85%、90%、95%、98%、または99%配列同一性を有するアミノ酸配列を含む。
323.態様305の方法であって、標的座位におけるDNA鎖の暴露された3’端を形成するステップが、ヌクレアーゼによってDNA鎖へニックを入れることを含む。
324.態様323の方法であって、ヌクレアーゼがトランスで提供される.
325.態様305の方法であって、標的座位におけるDNA鎖の暴露された3’端を形成するステップが、DNA鎖を化学的薬剤と接触させることを含む。
326.態様305の方法であって、標的座位におけるDNA鎖の暴露された3’端を形成するステップが、複製エラーを導入することを含む。
327.態様305の方法であって、DNA分子をnapDNAbpおよびガイドRNAと接触させるステップがRループを形成する。
328.態様327の方法であって、暴露された3’端が形成されるDNA鎖がRループ上にある。
329.態様315の方法であって、PEgRNAが、逆転写酵素(RT)鋳型配列とプライマー結合部位とを含む伸長アームを含む。
330.態様329の方法であって、伸長アームが、ガイドRNAの3'端、ガイドRNAの5'端、またはガイドRNAの分子内の位置にある。
331.態様305の方法であって、PEgRNAが、さらに、リンカー、ステムループ、ヘアピン、トウループ、アプタマー、またはRNA-タンパク質動員ドメインからなる群から選択される少なくとも1つの追加の構造を含む。
332.態様305の方法であって、PEgRNAがさらに相同アームを含む。
333.態様305の方法であって、RT鋳型配列が、対応する内生DNAに対して相同的である。
334.プライム標的にプライムされた逆転写によって標的座位におけるDNA分子のヌクレオチド配列の1つ以上の変化を導入するための方法であって、方法が:(a)標的座位におけるDNA分子を(i)核酸プログラム型DNA結合タンパク質(napDNAbp)および逆転写酵素を含む融合タンパク質ならびに(ii)所望のヌクレオチド変化を含むRT鋳型を含むガイドRNAと接触させること;(b)RT鋳型のプライム標的にプライムされた逆転写を行なって、所望のヌクレオチド変化を含む一本鎖DNAを生成すること;ならびに(c)DNA修復および/または複製プロセスによって標的座位におけるDNA分子上に所望のヌクレオチド変化を組み込むことを含む。
335.態様334の方法であって、RT鋳型が、ガイドRNAの3'端、ガイドRNAの5'端、またはガイドRNAの分子内の位置付けに位置付けられる。
336.態様334の方法であって、所望のヌクレオチド変化が、トランジション、トランスバージョン、挿入、もしくは欠失、またはそれらのいずれかの組み合わせを含む。
337.態様334の方法であって、所望のヌクレオチド変化が、(a)TからC;(b)AからG;(c)CからT;および(d)GからAからなる群から選択されるトランジションを含む。
338.請求項334の方法であって、所望のヌクレオチド変化が、(a)TからA;(b)TからG;(c)CからG;(d)CからA;(e)AからT;(f)AからC;(g)GからC;および(h)GからTからなる群から選択されるトランスバージョンを含む。
339.請求項334の方法であって、所望のヌクレオチド変化が、(1)G:C塩基対をT:A塩基対に、(2)G:C塩基対をA:T塩基対に、(3)G:C塩基対をC:G塩基対に、(4)T:A塩基対をG:C塩基対に、(5)T:A塩基対をA:T塩基対に、(6)T:A塩基対をC:G塩基対に、(7)C:G塩基対をG:C塩基対に、(8)C:G塩基対をT:A塩基対に、(9)C:G塩基対をA:T塩基対に、(10)A:T塩基対をT:A塩基対に、(11)A:T塩基対をG:C塩基対に、または(12)A:T塩基対をC:G塩基対に変化させることを含む。
340.態様243~259のいずれか1つのPEgRNAをコードするポリヌクレオチド。
341.態様340のポリヌクレオチドを含むベクター。
342.態様341のベクターを含む細胞。
343.態様213の融合タンパク質であって、ポリメラーゼがエラーを起こしやすい逆転写酵素である。
344.プライム標的にプライムされた逆転写によって標的座位におけるDNA分子に変異導入するための方法であって、方法が:(a)標的座位におけるDNA分子を(i)核酸プログラム型DNA結合タンパク質(napDNAbp)およびエラーを起こしやすい逆転写酵素を含む融合タンパク質ならびに(ii)所望のヌクレオチド変化を含むRT鋳型を含むガイドRNAと接触させること;(b)RT鋳型のプライム標的にプライムされた逆転写を行なって、変異導入された一本鎖DNAを生成すること;ならびに(c)DNA修復および/または複製プロセスによって、変異導入された一本鎖DNAを標的座位におけるDNA分子上に組み込むことを含む。
345.いずれかの先行する態様の方法であって、融合タンパク質がPE1、PE2、またはPE3のアミノ酸配列を含む。
346.いずれかの先行する態様の方法であって、napDNAbpがCas9ニッカーゼ(nCas9)である。
347.態様344の方法であって、napDNAbpが配列番号18~88、126、130、137、141、147、153、157、445、460、467、および482~487のアミノ酸配列を含む。
348.態様344の方法であって、ガイドRNAが配列番号222を含む。
349.態様344の方法であって、(b)プライム標的にプライムされた逆転写を行うステップが、ガイドRNA上のプライマー結合部位へのアニーリングによって逆転写をプライムすることができる標的座位における3'端プライマー結合配列を生成することを含む。
350.健康な数の反復トリヌクレオチドを含む健康な配列によって標的DNA分子上のトリヌクレオチド反復拡大変異を置き換えるための方法であって、方法が:(a)標的座位におけるDNA分子を(i)核酸プログラム型DNA結合タンパク質(napDNAbp)およびポリメラーゼを含む融合タンパク質ならびに(ii)置き換え配列を含むDNA合成鋳型とプライマー結合部位とを含むPEgRNAと接触させること;(b)プライム編集を行なって、置き換え配列を含む一本鎖DNAを生成すること;ならびに(c)DNA修復および/または複製プロセスによって、標的座位におけるDNA分子上に一本鎖DNAを組み込むことを含む。
351.態様350の方法であって、融合タンパク質がPE1、PE2、またはPE3のアミノ酸配列を含む。
352.態様350の方法であって、napDNAbpがCas9ニッカーゼ(nCas9)である。
353.態様350の方法であって、napDNAbpが配列番号18~88、126、130、137、141、147、153、157、445、460、467、および482~487のアミノ酸配列を含む。
354.態様350の方法であって、ガイドRNAが配列番号222を含む。
355.態様350の方法であって、(b)プライム編集を行うステップが、ガイドRNA上のプライマー結合部位へのアニーリングによってポリメラーゼをプライムすることができる標的座位における3'端プライマー結合配列を生成することを含む。
356.態様350の方法であって、トリヌクレオチド反復拡大変異がハンチントン病、脆弱X症候群、またはフリードライヒ運動失調症に関連する。
357.態様350の方法であって、トリヌクレオチド反復拡大変異がCAGトリプレットの繰り返し単位を含む。
358.態様350の方法であって、トリヌクレオチド反復拡大変異がGAAトリプレットの繰り返し単位を含む。
359.プライム編集によって標的ヌクレオチド配列によってコードされる目当てのタンパク質上に機能部分を組み入れる方法であって、方法が:(a)標的ヌクレオチド配列を(i)核酸プログラム型DNA結合タンパク質(napDNAbp)およびポリメラーゼを含むプライム編集因子ならびに(ii)機能部分をコードするDNA合成鋳型を含むPEgRNAと接触させること;(b)機能部分をコードする一本鎖DNA配列を重合すること;ならびに(c)DNA修復および/または複製プロセスによって、標的ヌクレオチド配列における対応する内生鎖の代わりに一本鎖DNA配列を組み込むことを含み、方法が、目当てのタンパク質と機能部分とを含む融合タンパク質をコードする組み換え標的ヌクレオチド配列を生ずる。
360.態様359の方法であって、機能部分がペプチドタグである。
361.態様360の方法であって、ペプチドタグがアフィニティータグ、可溶化タグ、クロマトグラフィータグ、エピトープもしくは免疫エピトープタグ、または蛍光タグである。
362.態様360の方法であって、ペプチドタグが:AviTag(配列番号245);Cタグ(配列番号246);カルモジュリンタグ(配列番号247);ポリグルタミン酸タグ(配列番号248);Eタグ(配列番号249);FLAGタグ(配列番号2);HAタグ(配列番号5);Hisタグ(配列番号252~262);Mycタグ(配列番号6);NEタグ(配列番号264);Rho1D4タグ(配列番号265);Sタグ(配列番号266);SBPタグ(配列番号267);Softag-1(配列番号268);Softag-2(配列番号269);Spotタグ(配列番号270);Strepタグ(配列番号271);TCタグ(配列番号272);Tyタグ(配列番号273);V5タグ(配列番号3);VSVタグ(配列番号275);およびXpressタグ(配列番号276)からなる群から選択される。
363.態様360の方法であって、ペプチドタグが:AU1エピトープ(配列番号278);AU5エピトープ(配列番号279);バクテリオファージT7エピトープ(T7タグ)(配列番号280);ブルータングウイルスタグ(Bタグ)(配列番号281);E2エピトープ(配列番号282);ヒスチジンアフィニティータグ(HAT)(配列番号283);HSVエピトープ(配列番号284);ポリアルギニン(Argタグ)(配列番号285);ポリアスパラギン酸(Aspタグ)(配列番号286);ポリフェニルアラニン(Pheタグ)(配列番号287);S1タグ(配列番号288);Sタグ(配列番号266);およびVSV-タグ(配列番号275)からなる群から選択される。
364.態様359の方法であって、機能部分が免疫エピトープである。
365.態様364の方法であって、免疫エピトープが:破傷風トキソイド(配列番号396);ジフテリア毒素変異体CRM197(配列番号398);ムンプス免疫エピトープ1(配列番号400);ムンプス免疫エピトープ2(配列番号402);ムンプス免疫エピトープ3(配列番号404);風疹ウイルス(配列番号406);ヘマグルチニン(配列番号408);ノイラミニダーゼ(配列番号410);TAP1(配列番号412);TAP2(配列番号414);クラスI HLAに対するヘマグルチニンエピトープ(配列番号416);クラスI HLAに対するノイラミニダーゼエピトープ(配列番号418);クラスII HLAに対するヘマグルチニンエピトープ(配列番号420);クラスII HLAに対するノイラミニダーゼエピトープ(配列番号422);ヘマグルチニンエピトープH5N1結合クラスIおよびクラスII HLA(配列番号424);ノイラミニダーゼエピトープH5N1結合クラスIおよびクラスII HLA(配列番号426)からなる群から選択される。
366.態様359の方法であって、機能部分が目当てのタンパク質の局在を変改する。
367.態様359の方法であって、機能部分が分解タグであり、その結果、目当てのタンパク質の分解速度が変改される。
368.態様367の方法であって、分解タグが、タグ付けされたタンパク質の消去をもたらす。
369.態様359の方法であって、機能部分が低分子結合ドメインである。
370.態様359の方法であって、低分子結合ドメインが配列番号488のFKBP12である。
371.態様359の方法であって、低分子結合ドメインが配列番号489のFKBP12-F36Vである。
372.態様359の方法であって、低分子結合ドメインが配列番号490および493~494のシクロフィリンである。
373.態様359の方法であって、低分子結合ドメインが目当ての2つ以上のタンパク質上に組み入れされる。
374.態様373の方法であって、目当ての2つ以上のタンパク質が低分子に接触することによって二量体化し得る。
375.態様369の方法であって、低分子が:
Figure 2020191243000482

Figure 2020191243000483

Figure 2020191243000484

からなる群から選択される低分子の二量体である。
376.プライム編集によって、標的ヌクレオチド配列によってコードされる目当てのタンパク質に免疫エピトープを組み入れる方法であって、方法が:(a)標的ヌクレオチド配列を(i)核酸プログラム型DNA結合タンパク質(napDNAbp)およびポリメラーゼを含むプライム編集因子ならびに(ii)機能部分をコードする編集鋳型を含むPEgRNAと接触させること;(b)免疫エピトープをコードする一本鎖DNA配列を重合すること;ならびに(c)DNA修復および/または複製プロセスによって、標的ヌクレオチド配列における対応する内生鎖の代わりに一本鎖DNA配列を組み込むことを含み、方法が、目当てのタンパク質と免疫エピトープとを含む融合タンパク質をコードする組み換え標的ヌクレオチド配列を生ずる。
377.態様376の方法であって、免疫エピトープが:破傷風トキソイド(配列番号396);ジフテリア毒素変異体CRM197(配列番号398);ムンプス免疫エピトープ1(配列番号400);ムンプス免疫エピトープ2(配列番号402);ムンプス免疫エピトープ3(配列番号404);風疹ウイルス(配列番号406);ヘマグルチニン(配列番号408);ノイラミニダーゼ(配列番号410);TAP1(配列番号412);TAP2(配列番号414);クラスI HLAに対するヘマグルチニンエピトープ(配列番号416);クラスI HLAに対するノイラミニダーゼエピトープ(配列番号418);クラスII HLAに対するヘマグルチニンエピトープ(配列番号420);クラスII HLAに対するノイラミニダーゼエピトープ(配列番号422);ヘマグルチニンエピトープH5N1結合クラスIおよびクラスII HLA(配列番号424);ノイラミニダーゼエピトープH5N1結合クラスIおよびクラスII HLA(配列番号426)からなる群から選択される。
378.態様376の方法であって、融合タンパク質がPE1、PE2、またはPE3のアミノ酸配列を含む。
379.態様376の方法であって、napDNAbpがCas9ニッカーゼ(nCas9)である。
380.態様376の方法であって、napDNAbpが配列番号18~88、126、130、137、141、147、153、157、445、460、467、および482~487のアミノ酸配列を含む。
381.態様376の方法であって、PEgRNAが配列番号101~104、181~183、223~234、237~244、277、324~330、332、334、336、338、340、342、344、346、348、350、352、354、356、358、360、362、364、366、368、394、429~442、499~505、641~649、678~692、735~736、757~761、776~777を含む。
382.プライム編集によって、標的ヌクレオチド配列によってコードされる目当てのタンパク質上に低分子二量体化ドメインを組み入れる方法であって、方法が:(a)標的ヌクレオチド配列を(i)核酸プログラム型DNA結合タンパク質(napDNAbp)およびポリメラーゼを含むプライム編集因子ならびに(ii)低分子二量体化ドメインをコードする編集鋳型を含むPEgRNAと接触させること;(b)免疫エピトープをコードする一本鎖DNA配列を重合すること;ならびに(c)DNA修復および/または複製プロセスによって、標的ヌクレオチド配列における対応する内生鎖の代わりに一本鎖DNA配列を組み込むことを含み、方法が、目当てのタンパク質と低分子二量体化ドメインとを含む融合タンパク質をコードする組み換え標的ヌクレオチド配列を生ずる。
383.態様382の方法であって、さらに、目当ての第2のタンパク質に対して方法を行うことを含む。
384.態様383の方法であって、目当ての第1のタンパク質および目当ての第2のタンパク質が、前記タンパク質の夫々の二量体化ドメインに結合する低分子の存在下において二量体化する。
385.態様382の方法であって、低分子結合ドメインが配列番号488のFKBP12である。
386.態様382の方法であって、低分子結合ドメインが配列番号489のFKBP12-F36Vである。
387.態様382の方法であって、低分子結合ドメインが配列番号490および493~494のシクロフィリンである。
388.態様382の方法であって、低分子が:
Figure 2020191243000485

Figure 2020191243000486

Figure 2020191243000487

からなる群から選択される低分子の二量体である。
389.態様382の方法であって、融合タンパク質がPE1、PE2、またはPE3のアミノ酸配列を含む。
390.態様382の方法であって、napDNAbpがCas9ニッカーゼ(nCas9)である。
391.態様382の方法であって、napDNAbpが配列番号18~88、126、130、137、141、147、153、157、445、460、467、および482~487のアミノ酸配列を含む。
392.態様382の方法であって、PEgRNAが配列番号101~104、181~183、223~234、237~244、277、324~330、332、334、336、338、340、342、344、346、348、350、352、354、356、358、360、362、364、366、368、394、429~442、499~505、641~649、678~692、735~736、757~761、776~777を含む。
393.プライム編集を用いてタンパク質上にペプチドタグまたはエピトープを組み入れる方法であって:タンパク質をコードする標的ヌクレオチド配列を、ペプチドタグをコードする第2のヌクレオチド配列をそれに挿入するように構成されたプライム編集因子構築物と接触させて、組み換えヌクレオチド配列をもたらすことを含み、その結果、ペプチドタグおよびタンパク質が融合タンパク質として組み換えヌクレオチド配列から発現される。
394.態様383の方法であって、ペプチドタグがタンパク質の精製および/または検出に用いられる。
395.態様383の方法であって、ペプチドタグが、ポリヒスチジン(例えば、HHHHHH(配列番号257))、FLAG(例えば、DYKDDDDK(配列番号2))、V5(例えば、GKPIPNPLLGLDST(配列番号3))、GCN4、HA(例えば、YPYDVPDYA(配列番号5))、Myc(例えばEQKLISEED(配列番号6))、またはGSTである。
396.態様383の方法であって、ペプチドタグが、配列番号245-290からなる群から選択されるアミノ酸配列を有する。
397.態様383の方法であって、ペプチドタグがリンカーによってタンパク質に融合される。
398.態様383の方法であって、融合タンパク質が次の構造を有し:[タンパク質]-[ペプチドタグ]または[ペプチドタグ]-[タンパク質]、「]-[」が任意のリンカーを表す。
399.態様383の方法であって、リンカーが配列番号127、165~176、446、453、および767~769のアミノ酸配列を有する。
400.態様383の方法であって、プライム編集因子構築物が、配列番号101~104、181~183、223~234、237~244、277、324~330、332、334、336、338、340、342、344、346、348、350、352、354、356、358、360、362、364、366、368、394、429~442、499~505、641~649、678~692、735~736、757~761、776~777のヌクレオチド配列を含むPEgRNAを含む。
401.態様383の方法であって、PEgRNAがスペーサー、gRNAコア、および伸長アームを含み、スペーサーが標的ヌクレオチド配列に対して相補的であり、伸長アームがペプチドタグをコードする逆転写酵素鋳型を含む。
402.態様383の方法であって、PEgRNAがスペーサー、gRNAコア、および伸長アームを含み、スペーサーが標的ヌクレオチド配列に対して相補的であり、伸長アームがペプチドタグをコードする逆転写酵素鋳型を含む。
403.プライム編集によって標的ヌクレオチド配列によってコードされるPRNP上に1つ以上の防護性変異を組み入れることによって、プリオン病を防止またはその進行を停止させる方法であって、方法が:(a)標的ヌクレオチド配列を(i)核酸プログラム型DNA結合タンパク質(napDNAbp)およびポリメラーゼを含むプライム編集因子ならびに(ii)機能部分をコードする編集鋳型を含むPEgRNAと接触させること;(b)防護性変異をコードする一本鎖DNA配列を重合すること;ならびに(c)DNA修復および/または複製プロセスによって、標的ヌクレオチド配列における対応する内生鎖の代わりに一本鎖DNA配列を組み込むことを含み、方法が、ミスフォールディングに対して耐性である防護性変異を含むPRNPをコードする組み換え標的ヌクレオチド配列を生ずる。
404.態様403の方法であって、プリオン病がヒトプリオン病である。
405.態様403の方法であって、プリオン病が動物プリオン病である。
406.態様404の方法であって、プリオン病がクロイツフェルト・ヤコブ病(CJD)、変異型クロイツフェルト・ヤコブ病(vCJD)、ゲルストマン・ストロイスラー・シャインカー症候群、致死性家族性不眠症、またはクールー病である。
407.態様403の方法であって、プリオン病が牛海綿状脳症(BSEまたは「狂牛病」)、慢性消耗病(CWD)、スクレイピー、伝達性ミンク脳症、ネコ海綿状脳症、および有蹄類海綿状脳症である。
408.態様403の方法であって、野生型PRNPアミノ酸配列が配列番号291~292である。
409.態様403の方法であって、方法が、配列番号293~323からなる群から選択される改変されたPRNPアミノ酸配列をもたらし、前記改変されたPRNPタンパク質がミスフォールディングに対して耐性である。
410.態様403の方法であって、融合タンパク質がPE1、PE2、またはPE3のアミノ酸配列を含む。
411.態様403の方法であって、napDNAbpがCas9ニッカーゼ(nCas9)である。
412.態様403の方法であって、napDNAbpが配列番号18~88、126、130、137、141、147、153、157、445、460、467、および482~487のアミノ酸配列を含む。
413.態様403の方法であって、PEgRNAが配列番号101~104、181~183、223~234、237~244、277、324~330、332、334、336、338、340、342、344、346、348、350、352、354、356、358、360、362、364、366、368、394、429~442、499~505、641~649、678~692、735~736、757~761、776~777を含む。
414.プライム編集によって、標的ヌクレオチド配列によってコードされる目当てのRNA上にリボヌクレオチドモチーフまたはタグを組み入れる方法であって、方法が:(a)標的ヌクレオチド配列を(i)核酸プログラム型DNA結合タンパク質(napDNAbp)およびポリメラーゼを含むプライム編集因子ならびに(ii)リボヌクレオチドモチーフまたはタグをコードする編集鋳型を含むPEgRNAと接触させること;(b)リボヌクレオチドモチーフまたはタグをコードする一本鎖DNA配列を重合すること;ならびに(c)DNA修復および/または複製プロセスによって、標的ヌクレオチド配列における対応する内生鎖の代わりに一本鎖DNA配列を組み込むことを含み、方法が、リボヌクレオチドモチーフまたはタグを含む目当ての修飾されたRNAをコードする組み換え標的ヌクレオチド配列を生ずる。
415.態様414の方法であって、リボヌクレオチドモチーフまたはタグが検出部分である。
416.態様414の方法であって、リボヌクレオチドモチーフまたはタグが目当てのRNAの発現レベルに影響する。
417.態様414の方法であって、リボヌクレオチドモチーフまたはタグが目当てのRNAの輸送または細胞下レベル位置付けに影響する。
418.態様414の方法であって、リボヌクレオチドモチーフまたはタグが、SV40 1型、SV40 2型、SV40 3型、hGH、BGH、rbGlob、TK、MALAT1 ENE-mascRNA、KSHV PAN ENE、Smbox/U1 snRNAボックス、U1 snRNA 3’ボックス、tRNA-リジン、broccoliアプタマー、spinachアプタマー、mangoアプタマー、HDVリボザイム、およびm6Aからなる群から選択される。
419.態様414の方法であって、PEgRNAが配列番号101~104、181~183、223~234、237~244、277、324~330、332、334、336、338、340、342、344、346、348、350、352、354、356、358、360、362、364、366、368、394、429~442、499~505、641~649、678~692、735~736、757~761、776~777を含む。
420.態様414の方法であって、融合タンパク質がPE1、PE2、またはPE3のアミノ酸配列を含む。
421.態様414の方法であって、napDNAbpがCas9ニッカーゼ(nCas9)である。
422.態様414の方法であって、napDNAbpが配列番号18~88、126、130、137、141、147、153、157、445、460、467、および482~487のアミノ酸配列を含む。
423.プライム編集によって、標的ヌクレオチド配列によってコードされる目当てのタンパク質上の機能部分を組み入れまたは欠失する方法であって、方法が:(a)標的ヌクレオチド配列を(i)核酸プログラム型DNA結合タンパク質(napDNAbp)およびポリメラーゼを含むプライム編集因子ならびに(ii)機能部分またはその欠失をコードする編集鋳型を含むPEgRNAと接触させること;(b)機能部分またはその欠失をコードする一本鎖DNA配列を重合すること;ならびに(c)DNA修復および/または複製プロセスによって、標的ヌクレオチド配列における対応する内生鎖の代わりに一本鎖DNA配列を組み込むことを含み、方法が、目当てのタンパク質および機能部分またはその除去を含む改変されたタンパク質をコードする組み換え標的ヌクレオチド配列を生じ、機能部分がタンパク質の修飾状態または局在状態を変改する。
424.態様423の方法であって、機能部分が、目当てのタンパク質のリン酸化、ユビキチン化、グリコシル化、脂質修飾、ヒドロキシル化、メチル化、アセチル化、クロトニル化、SUMO化状態を変改する。 Aspects
The following embodiments are within the scope of the present disclosure. Moreover, the present disclosure encompasses all variations, combinations, and permutations in which one or more limitations, elements, clauses, and descriptive terms from one or more of the enumerated embodiments are introduced into another embodiment enumerated in this section. For example, any enumerated embodiment that is dependent on another enumerated embodiment may be modified to include one or more limitations found in any other embodiment enumerated in this section that is dependent on the same basic embodiment. Where elements are presented as enumerated in Markush group format as examples, each subgroup of elements is also disclosed, and any element(s) may be removed from the group. In general, when the present disclosure, or aspects of the present disclosure, are viewed as including specific elements and/or features, it should be understood that an embodiment or aspect of the present invention consists of, or consists essentially of, such elements and/or features. It is also noted that the terms "comprising" and "containing" are intended to be open and permit the inclusion of additional elements or steps. When ranges are given, the endpoints are included. Moreover, unless otherwise indicated or otherwise clear from the context and the understanding of one of ordinary skill in the art, values expressed as ranges can assume any specific value, or subrange within the ranges set forth in different embodiments of the invention, up to ten times the unit of the lower limit of the range, unless the context clearly dictates otherwise.
Group 1. Aspects 1-212
1. A fusion protein comprising a nucleic acid programmable DNA binding protein (napDNAbp) and a reverse transcriptase.
2. A fusion protein of embodiment 1, wherein the fusion protein is capable of performing genome editing by reverse transcription primed to a prime target in the presence of an extended guide RNA.
3. A fusion protein of embodiment 1, wherein napDNAbp has nickase activity.
4. The fusion protein of embodiment 1, wherein napDNAbp is a Cas9 protein or a variant thereof.
5. The fusion protein of embodiment 1, wherein napDNAbp is a nuclease-active Cas9, a nuclease-inactive Cas9 (dCas9), or a Cas9 nickase (nCas9).
6. The fusion protein of embodiment 1, wherein napDNAbp is Cas9 nickase (nCas9).
7. The fusion protein of embodiment 1, wherein napDNAbp is selected from the group consisting of: Cas9, CasX, CasY, Cpf1, C2c1, C2c2, C2C3, and Argonaute, and optionally has nickase activity.
8. A fusion protein of embodiment 1, wherein the fusion protein is capable of binding to a target DNA sequence when complexed with an extended guide RNA.
9. The fusion protein of embodiment 8, wherein the target DNA sequence comprises a target strand and a complementary non-target strand.
10. The fusion protein of embodiment 8, wherein binding of the fusion protein complexed with the extended guide RNA forms an R-loop.
11. The fusion protein of embodiment 10, wherein the R-loop comprises (i) an RNA-DNA hybrid comprising an extended guide RNA and a target strand, and (ii) a complementary non-target strand.
12. The fusion protein of embodiment 11, wherein the complementary non-target strand is nicked to form a reverse transcriptase prime sequence having a free 3' end.
13. A fusion protein of embodiment 2, wherein the extended guide RNA comprises (a) a guide RNA and (b) an RNA extension at the 5' or 3' end of the guide RNA or at an intramolecular position of the guide RNA.
14. A fusion protein of embodiment 13, wherein the RNA extension comprises (i) a reverse transcription template sequence containing a desired nucleotide change, (ii) a reverse transcription primer binding site, and (iii) optionally a linker sequence.
15. A fusion protein of embodiment 14, wherein the reverse transcription template sequence encodes a single-stranded DNA flap that is complementary to the endogenous DNA sequence adjacent to the nick site, and the single-stranded DNA flap contains the desired nucleotide change.
16. The fusion protein of embodiment 13, wherein the RNA extension is at least 5 nucleotides, at least 6 nucleotides, at least 7 nucleotides, at least 8 nucleotides, at least 9 nucleotides, at least 10 nucleotides, at least 11 nucleotides, at least 12 nucleotides, at least 13 nucleotides, at least 14 nucleotides, at least 15 nucleotides, at least 16 nucleotides, at least 17 nucleotides, at least 18 nucleotides, at least 19 nucleotides, at least 20 nucleotides, at least 21 nucleotides, at least 22 nucleotides, at least 23 nucleotides, at least 24 nucleotides, or at least 25 nucleotides in length.
17. A fusion protein of embodiment 15, wherein the single-stranded DNA flap hybridizes to the endogenous DNA sequence adjacent to the nick site, thereby incorporating the desired nucleotide change.
18. A fusion protein of embodiment 15, wherein a single-stranded DNA flap has a free 5' end and replaces the endogenous DNA sequence adjacent to the nick site.
19. A fusion protein of embodiment 18, wherein the endogenous DNA sequence having the 5' end is excised by the cell.
20. A fusion protein of embodiment 18, wherein cellular repair of the single-stranded DNA flap results in incorporation of a desired nucleotide change, thereby forming a desired product.
21. The fusion protein of embodiment 14, wherein the desired nucleotide change is incorporated into an editing window that is between about -4 and +10 of the PAM sequence, or between about -10 and +20 of the PAM sequence, or between about -20 and +40 of the PAM sequence, or between about -30 and +100 of the PAM sequence, or the desired nucleotide change is incorporated into at least 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30 of the nick site. , 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99, or 100 nucleotides downstream.
22. The fusion protein of embodiment 1, wherein napDNAbp is represented by SEQ ID NO:18or SEQ ID NO:18The amino acid sequence of the present invention is at least 80%, 85%, 90%, 95%, 98%, or 99% identical to the amino acid sequence of
23. The fusion protein of embodiment 1, wherein napDNAbp is represented by SEQ ID NO:18-88, 126, 130, 137, 141, 147, 153, 157, 445, 460, 467, and 482-487.The amino acid sequence of any one of the above is at least 80%, 85%, 90%, 95%, 98%, or 99% identical to the amino acid sequence of any one of the above.
24. The fusion protein of embodiment 1, wherein the reverse transcriptase is represented by SEQ ID NO:89-100, 105-122, 128-129, 132, 139, 143, 149, 154, 159, 235, 454, 471, 516, 662, 700, 701-716, 739-741, and 766The amino acid sequence of any one of the following:
25. The fusion protein of embodiment 1, wherein the reverse transcriptase is selected from the group consisting of SEQ ID NO:89-100, 105-122, 128-129, 132, 139, 143, 149, 154, 159, 235, 454, 471, 516, 662, 700, 701-716, 739-741, and 766The amino acid sequence of any one of the above is at least 80%, 85%, 90%, 95%, 98%, or 99% identical to the amino acid sequence of any one of the above.
26. The fusion protein of embodiment 1, wherein the reverse transcriptase is a naturally occurring reverse transcriptase from a retrovirus or retrotransposon.
27. The fusion protein of any one of the preceding aspects, wherein the fusion protein has the structure NH2-[napDNAbp]-[reverse transcriptase]-COOH; or NH2-[reverse transcriptase]-[napDNAbp]-COOH, with each "]-[" indicating the presence of an optional linker sequence.
28. The fusion protein of embodiment 27, wherein the linker sequence is SEQ ID NO:127, 165-176, 446, 453, and 767-769The amino acid sequence of
29. The fusion protein of embodiment 14, wherein the desired nucleotide change is a single nucleotide change, an insertion of one or more nucleotides, or a deletion of one or more nucleotides.
30. The fusion protein of embodiment 29, wherein the insertion or deletion is at least 1, at least 2, at least 3, at least 4, at least 5, at least 6, at least 7, at least 8, at least 9, at least 10, at least 11, at least 12, at least 13, at least 14, at least 15, at least 16, at least 17, at least 18, at least 19, at least 20, at least 21, at least 22, at least 23, at least 24, at least 25, at least 26, at least 27, at least 28, at least 29, at least 30, at least 31, at least 32, at least 33, at least 34, at least 35, at least 36, at least 37, at least 38, at least 39, at least 40, at least 41, at least 42, at least 43, at least 44, at least 45, at least 46, at least 47, at least 48, at least 49, or at least 50.
31. An extended guide RNA comprising a guide RNA and at least one RNA extension.
32. An extended guide RNA of embodiment 1, wherein the RNA extension is at the 3' or 5' end of the guide RNA or at an intramolecular position of the guide RNA.
33. An extended guide RNA of embodiment 31, wherein the extended guide RNA is capable of binding to a napDNAbp and guiding the napDNAbp to a target DNA sequence.
34. The extended guide RNA of embodiment 33, wherein the target DNA sequence comprises a target strand and a complementary non-target strand, and the guide RNA hybridizes to the target strand to form an RNA-DNA hybrid and an R-loop.
35. The extended guide RNA of embodiment 31, wherein at least one RNA extension comprises (i) a reverse transcription template sequence, (ii) a reverse transcription primer binding site, and (iii) optionally a linker sequence.
36. The extended guide RNA of embodiment 35, wherein the RNA extension is at least 5 nucleotides, at least 6 nucleotides, at least 7 nucleotides, at least 8 nucleotides, at least 9 nucleotides, at least 10 nucleotides, at least 11 nucleotides, at least 12 nucleotides, at least 13 nucleotides, at least 14 nucleotides, at least 15 nucleotides, at least 16 nucleotides, at least 17 nucleotides, at least 18 nucleotides, at least 19 nucleotides, at least 20 nucleotides, at least 21 nucleotides, at least 22 nucleotides, at least 23 nucleotides, at least 24 nucleotides, or at least 25 nucleotides in length.
37. The extended guide RNA of embodiment 35, wherein the reverse transcription template sequence is at least 3 nucleotides, at least 4 nucleotides, at least 5 nucleotides, at least 6 nucleotides, at least 7 nucleotides, at least 8 nucleotides, at least 9 nucleotides, at least 10 nucleotides, at least 11 nucleotides, at least 12 nucleotides, at least 13 nucleotides, at least 14 nucleotides, or at least 15 nucleotides in length.
38. The extended guide RNA of embodiment 35, wherein the reverse transcription primer binding site sequence is at least 3 nucleotides, at least 4 nucleotides, at least 5 nucleotides, at least 6 nucleotides, at least 7 nucleotides, at least 8 nucleotides, at least 9 nucleotides, at least 10 nucleotides, at least 11 nucleotides, at least 12 nucleotides, at least 13 nucleotides, at least 14 nucleotides, or at least 15 nucleotides in length.
39. The extended guide RNA of embodiment 35, wherein the optional linker sequence is at least 3 nucleotides, at least 4 nucleotides, at least 5 nucleotides, at least 6 nucleotides, at least 7 nucleotides, at least 8 nucleotides, at least 9 nucleotides, at least 10 nucleotides, at least 11 nucleotides, at least 12 nucleotides, at least 13 nucleotides, at least 14 nucleotides, or at least 15 nucleotides in length.
40. The extended guide RNA of embodiment 35, wherein the reverse transcription template sequence encodes a single-stranded DNA flap that is complementary to the endogenous DNA sequence adjacent to the nick site, and the single-stranded DNA flap contains a desired nucleotide change.
41. The extended guide RNA of embodiment 40, wherein the single-stranded DNA flap displaces the endogenous single-stranded DNA having a 5' end on the nicked target DNA sequence, and the endogenous single-stranded DNA is immediately adjacent to and downstream of the nick site.
42. The extended guide RNA of embodiment 41, wherein the endogenous single-stranded DNA having a free 5' end is excised by the cell.
43. The extended guide RNA of embodiment 41, wherein cellular repair of the single-stranded DNA flap results in incorporation of a desired nucleotide change, thereby forming a desired product.
44. The extended guide RNA of embodiment 31, comprising:394, 429-442, 641-649, 678-692, 2997-3103, 3113-3121, 3305-3455, 3479-3493, 3522-3556, 3628-3698, and 3755-3810or SEQ ID NO:394, 429-442, 641-649, 678-692, 2997-3103, 3113-3121, 3305-3455, 3479-3493, 3522-3556, 3628-3698, and 3755-3810or at least 90% or at least 95% or at least 98% or at least 99% sequence identity with any one of the following:
45. The extended guide RNA of embodiment 35, wherein the reverse transcription template sequence comprises a nucleotide sequence that is at least 80%, or 85%, or 90%, or 95%, or 99% identical to the endogenous DNA target.
46. The extended guide RNA of embodiment 35, wherein the reverse transcription primer binding site hybridizes to the free 3' end of the cut DNA.
47. The extended guide RNA of embodiment 35, wherein the optional linker sequence is at least 1 nucleotide, or at least 2, at least 3, at least 4, at least 5, at least 6, at least 7, at least 8, at least 9, at least 10, at least 11, at least 12, at least 13, at least 14, or at least 15 nucleotides in length.
48. A complex comprising a fusion protein of any one of embodiments 1 to 30 and an extended guide RNA.
49. The complex of embodiment 48, wherein the extended guide RNA comprises a guide RNA and an RNA extension at the 3' or 5' end of the guide RNA or at an intramolecular position of the guide RNA.
50. A complex of embodiment 48, wherein the extended guide RNA is capable of binding to the napDNAbp and guiding the napDNAbp to a target DNA sequence.
51. A complex of embodiment 50, wherein the target DNA sequence comprises a target strand and a complementary non-target strand, and the guide RNA hybridizes to the target strand to form an RNA-DNA hybrid and an R-loop.
52. A complex of embodiment 49, wherein at least one RNA extension comprises (i) a reverse transcription template sequence, (ii) a reverse transcription primer binding site, and (iii) optionally a linker sequence.
53. The complex of embodiment 48, wherein the extended guide RNA comprises a nucleotide sequence of SEQ ID NO: 18-36, or a nucleotide sequence having at least 85%, or at least 90%, or at least 95%, or at least 98%, or at least 99% sequence identity to any one of SEQ ID NO: 18-36.
54. A complex of embodiment 52, wherein the reverse transcription template sequence comprises a nucleotide sequence having at least 80%, 85%, 90%, 95%, or 99% sequence identity with the endogenous DNA target.
55. A complex of embodiment 52, wherein the reverse transcription primer binding site hybridizes to the free 3' end of the cut DNA.
56. A complex containing napDNAbp and an extended guide RNA.
57. A complex of embodiment 56, wherein napDNAbp is Cas9 nickase.
58. The complex of embodiment 56, wherein napDNAbp is represented by SEQ ID NO:18or SEQ ID NO:18The amino acid sequence has at least 80%, 85%, 90%, 95%, 98%, or 99% sequence identity with the
59. The complex of embodiment 57, wherein napDNAbp is represented by SEQ ID NO:18-88, 126, 130, 137, 141, 147, 153, 157, 445, 460, 467, and 482-487.The amino acid sequence of any one of the above amino acid sequences has at least 80%, 85%, 90%, 95%, 98%, or 99% sequence identity with the amino acid sequence of any one of the above amino acid sequences.
60. The complex of embodiment 57, wherein the extended guide RNA comprises a guide RNA and an RNA extension at the 3' or 5' end of the guide RNA or at an intramolecular position of the guide RNA.
61. A complex of embodiment 57, wherein the extended guide RNA can guide the napDNAbp to a target DNA sequence.
62. A complex of embodiment 61, wherein the target DNA sequence comprises a target strand and a complementary non-target strand, and the spacer sequence hybridizes to the target strand to form an RNA-DNA hybrid and an R-loop.
63. The complex of embodiment 61, wherein the RNA extension comprises (i) a reverse transcription template sequence, (ii) a reverse transcription primer binding site, and (iii) optionally a linker sequence.
64. The complex of embodiment 57, wherein the extended guide RNA is394, 429-442, 641-649, 678-692, 2997-3103, 3113-3121, 3305-3455, 3479-3493, 3522-3556, 3628-3698, and 3755-3810or SEQ ID NO:394, 429-442, 641-649, 678-692, 2997-3103, 3113-3121, 3305-3455, 3479-3493, 3522-3556, 3628-3698, and 3755-3810In one embodiment, the present invention comprises a nucleotide sequence having at least 85%, or at least 90%, or at least 95%, or at least 98%, or at least 99% sequence identity with any one of the following:
65. A complex of embodiment 63, wherein the reverse transcription template sequence comprises a nucleotide sequence that is at least 80%, or 85%, or 90%, or 95%, or 99% identical to the endogenous DNA target.
66. A complex of embodiment 63, wherein the reverse transcription primer binding site hybridizes to the free 3' end of the cut DNA.
67. The conjugate of embodiment 63, wherein any linker sequence is at least 1 nucleotide, or at least 2, at least 3, at least 4, at least 5, at least 6, at least 7, at least 8, at least 9, at least 10, at least 11, at least 12, at least 13, at least 14, or at least 15 nucleotides in length.
68. A polynucleotide encoding a fusion protein of any one of embodiments 1 to 30.
69. A vector comprising the polynucleotide of embodiment 68.
70. A cell comprising a fusion protein of any one of embodiments 1 to 30 and an extended guide RNA bound to the napDNAbp of the fusion protein.
71. A cell comprising a complex of any one of embodiments 48 to 67.
72. A pharmaceutical composition comprising: (i) a fusion protein of any of embodiments 1 to 30, a complex of embodiment 48-67, a polynucleotide of embodiment 68, or a vector of embodiment 69; and (ii) a pharma- ceutically acceptable excipient.
73. A pharmaceutical composition comprising (i) a conjugate of any one of embodiments 48 to 67, (ii) a reverse transcriptase provided in trans; and (iii) a pharma- ceutically acceptable excipient.
74. A kit comprising: (i) a nucleic acid sequence encoding a fusion protein of any one of embodiments 1 to 30; and (ii) a nucleic acid construct comprising a promoter driving expression of the sequence of (i).
75. A method for incorporating a desired nucleotide change into a double-stranded DNA sequence, the method comprising:
(i) contacting a double-stranded DNA sequence with a complex comprising a fusion protein and an extended guide RNA, wherein the fusion protein comprises napDNAbp and a reverse transcriptase, and the extended guide RNA comprises a reverse transcription template sequence containing the desired nucleotide change;
(ii) nicking a double-stranded DNA sequence on the non-target strand, thereby generating a free single-stranded DNA having a 3' end;
(iii) hybridizing the 3' end of the free single-stranded DNA to the reverse transcription template sequence, thereby priming the reverse transcriptase domain;
(iv) polymerizing the DNA strand from the 3' end, thereby generating a single-stranded DNA flap containing the desired nucleotide change;
(v) replacing the endogenous DNA strand adjacent to the cut site with a single-stranded DNA flap, thereby incorporating the desired nucleotide change into the double-stranded DNA sequence;
including.
76. The method of embodiment 75, wherein (v) the replacing step comprises: (i) hybridizing a single-stranded DNA flap to the endogenous DNA strand adjacent to the cut site to create a sequence mismatch; (ii) excising the endogenous DNA strand; and (iii) repairing the mismatch to form a desired product containing the desired nucleotide change in both strands of DNA.
77. The method of embodiment 76, wherein the desired nucleotide change is a single nucleotide substitution, deletion, or insertion.
78. The method of embodiment 77, wherein the single nucleotide substitution is a transition or transversion.
79. The method of embodiment 76, wherein the desired nucleotide change is (1) a G to T substitution, (2) a G to A substitution, (3) a G to C substitution, (4) a T to G substitution, (5) a T to A substitution, (6) a T to C substitution, (7) a C to G substitution, (8) a C to T substitution, (9) a C to A substitution, (10) an A to T substitution, (11) an A to G substitution, or (12) an A to C substitution.
80. The method of embodiment 76, wherein the desired nucleotide change is (1) a G:C base pair to a T:A base pair, (2) a G:C base pair to an A:T base pair, (3) a G:C base pair to a C:G base pair, (4) a T:A base pair to a G:C base pair, (5) a T:A base pair to an A:T base pair, (6) a T:A base pair to a C:G base pair, (7) a C:G base pair to a G:C base pair, (8) a C:G base pair to a T:A base pair, (9) a C:G base pair to an A:T base pair, (10) an A:T base pair to a T:A base pair, (11) an A:T base pair to a G:C base pair, or (12) an A:T base pair to a C:G base pair.
81. The method of embodiment 76, wherein the desired nucleotide change is an insertion or deletion of 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, or 25 nucleotides.
82. The method of embodiment 76, wherein the desired nucleotide change corrects a disease-associated gene.
83. The method of embodiment 82, wherein the disease-associated gene is associated with a single-gene disorder selected from the group consisting of: adenosine deaminase (ADA) deficiency; alpha-1 antitrypsin deficiency; cystic fibrosis; Duchenne muscular dystrophy; galactosemia; hemochromatosis; Huntington's disease; maple syrup urine disease; Marfan syndrome; neurofibromatosis type 1; congenital pachyonychia; phenylketonuria; severe combined immunodeficiency; sickle cell disease; Smith-Lemli-Opitz syndrome; and Tay-Sachs disease.
84. The method of embodiment 82, wherein the disease-associated gene is associated with a polygenic disorder selected from the group consisting of: heart disease; high blood pressure; Alzheimer's disease; arthritis; diabetes; cancer; and obesity.
85. The method of embodiment 76, wherein the napDNAbp is a nuclease-inactive Cas9 (dCas9), a Cas9 nickase (nCas9), or a nuclease-active Cas9.
86. The method of embodiment 76, wherein napDNAbp is SEQ ID NO:18The amino acid sequence of
87. The method of embodiment 76, wherein napDNAbp is selected from the group consisting of SEQ ID NO:18-88, 126, 130, 137, 141, 147, 153, 157, 445, 460, 467, and 482-487.The amino acid sequence of any one of the above amino acid sequences has at least 80%, 85%, 90%, 95%, 98%, or 99% sequence identity with the amino acid sequence of any one of the above amino acid sequences.
88. The method of embodiment 76, wherein the reverse transcriptase is selected from the group consisting of SEQ ID NO:89-100, 105-122, 128-129, 132, 139, 143, 149, 154, 159, 235, 454, 471, 516, 662, 700, 701-716, 739-741, and 766The amino acid sequence of any one of the following:
89. The method of embodiment 76, wherein the reverse transcriptase domain is selected from the group consisting of SEQ ID NO:89-100, 105-122, 128-129, 132, 139, 143, 149, 154, 159, 235, 454, 471, 516, 662, 700, 701-716, 739-741, and 766The amino acid sequence of any one of the above amino acid sequences has at least 80%, 85%, 90%, 95%, 98%, or 99% sequence identity with the amino acid sequence of any one of the above amino acid sequences.
90. The method of embodiment 76, wherein the extended guide RNA comprises an RNA extension at the 5' or 3' end of the guide RNA or at an intramolecular location, and the RNA extension comprises a reverse transcription template sequence.
91. The method of embodiment 90, wherein the RNA extension is at least 5 nucleotides, at least 6 nucleotides, at least 7 nucleotides, at least 8 nucleotides, at least 9 nucleotides, at least 10 nucleotides, at least 11 nucleotides, at least 12 nucleotides, at least 13 nucleotides, at least 14 nucleotides, at least 15 nucleotides, at least 16 nucleotides, at least 17 nucleotides, at least 18 nucleotides, at least 19 nucleotides, at least 20 nucleotides, at least 21 nucleotides, at least 22 nucleotides, at least 23 nucleotides, at least 24 nucleotides, or at least 25 nucleotides in length.
92. The method of embodiment 76, wherein the extended guide RNA is394, 429-442, 641-649, 678-692, 2997-3103, 3113-3121, 3305-3455, 3479-3493, 3522-3556, 3628-3698, and 3755-3810The nucleic acid has a nucleotide sequence selected from the group consisting of:
93. A method for introducing one or more changes in the nucleotide sequence of a DNA molecule at a target locus, comprising:
(i) contacting a DNA molecule with a nucleic acid programmable DNA binding protein (napDNAbp) and a guide RNA that targets the napDNAbp to a target locus, the guide RNA comprising a reverse transcriptase (RT) template sequence containing at least one desired nucleotide change;
(ii) creating an exposed 3' end of the DNA strand at the target locus;
(iii) hybridization of the exposed 3' end to the RT template sequence to prime reverse transcription;
(vi) synthesizing, by reverse transcriptase, a single-stranded DNA flap containing at least one desired nucleotide change based on the RT template sequence; and
(v) incorporating at least one desired nucleotide change into the corresponding endogenous DNA, thereby introducing one or more changes in the nucleotide sequence of the DNA molecule at the target locus;
including.
94. The method of embodiment 93, wherein one or more changes in the nucleotide sequence include a transition.
95. The method of embodiment 94, wherein the transition is selected from the group consisting of: (a) T to C; (b) A to G; (c) C to T; and (d) G to A.
96. The method of embodiment 93, wherein one or more changes in the nucleotide sequence include a transversion.
97. The method of embodiment 96, wherein the transversion is selected from the group consisting of: (a) T to A; (b) T to G; (c) C to G; (d) C to A; (e) A to T; (f) A to C; (g) G to C; and (h) G to T.
98. The method of embodiment 93, wherein the one or more changes in the nucleotide sequence include changing (1) a G:C base pair to a T:A base pair, (2) a G:C base pair to an A:T base pair, (3) a G:C base pair to a C:G base pair, (4) a T:A base pair to a G:C base pair, (5) a T:A base pair to an A:T base pair, (6) a T:A base pair to a C:G base pair, (7) a C:G base pair to a G:C base pair, (8) a C:G base pair to a T:A base pair, (9) a C:G base pair to an A:T base pair, (10) an A:T base pair to a T:A base pair, (11) an A:T base pair to a G:C base pair, or (12) an A:T base pair to a C:G base pair.
99. The method of embodiment 93, wherein the one or more changes in the nucleotide sequence include an insertion or deletion of 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, or 25 nucleotides.
100. The method of embodiment 93, wherein the one or more changes in the nucleotide sequence include a correction of a disease-associated gene.
101. The method of embodiment 100, wherein the disease-associated gene is associated with a single-gene disorder selected from the group consisting of: adenosine deaminase (ADA) deficiency; alpha-1 antitrypsin deficiency; cystic fibrosis; Duchenne muscular dystrophy; galactosemia; hemochromatosis; Huntington's disease; maple syrup urine disease; Marfan syndrome; neurofibromatosis type 1; pachyonychia congenita; phenylketonuria; severe combined immunodeficiency; sickle cell disease; Smith-Lemli-Opitz syndrome; and Tay-Sachs disease.
102. The method of embodiment 100, wherein the disease-associated gene is associated with a polygenic disorder selected from the group consisting of: heart disease; high blood pressure; Alzheimer's disease; arthritis; diabetes; cancer; and obesity.
103. The method of embodiment 93, wherein napDNAbp is a nuclease-active Cas9 or a variant thereof.
104. The method of embodiment 93, wherein napDNAbp is a nuclease-inactivated Cas9 (dCas9) or Cas9 nickase (nCas9) or a variant thereof.
105. The method of embodiment 93, wherein napDNAbp is SEQ ID NO:18The amino acid sequence of
106. The method of embodiment 93, wherein napDNAbp is selected from the group consisting of SEQ ID NO:18-88, 126, 130, 137, 141, 147, 153, 157, 445, 460, 467, and 482-487.The amino acid sequence of any one of the above amino acid sequences has at least 80%, 85%, 90%, 95%, 98%, or 99% sequence identity with the amino acid sequence of any one of the above.
107. The method of embodiment 93, wherein the reverse transcriptase is introduced in trans.
108. The method of embodiment 93, wherein napDNAbp comprises a fusion to a reverse transcriptase.
109. The method of embodiment 93, wherein the reverse transcriptase is selected from the group consisting of SEQ ID NO:89-100, 105-122, 128-129, 132, 139, 143, 149, 154, 159, 235, 454, 471, 516, 662, 700, 701-716, 739-741, and 766The amino acid sequence of any one of the following:
110. The method of embodiment 93, wherein the reverse transcriptase is selected from the group consisting of SEQ ID NO:89-100, 105-122, 128-129, 132, 139, 143, 149, 154, 159, 235, 454, 471, 516, 662, 700, 701-716, 739-741, and 766The amino acid sequence of any one of the above amino acid sequences has at least 80%, 85%, 90%, 95%, 98%, or 99% sequence identity with the amino acid sequence of any one of the above amino acid sequences.
111. The method of embodiment 93, wherein the step of forming an exposed 3' end of the DNA strand at the target locus includes nicking the DNA strand with a nuclease.
112. The method of embodiment 111, wherein the nuclease is napDNAbp, is provided as a fusion domain of napDNAbp, or is provided in trans.
113. The method of embodiment 93, wherein the step of forming an exposed 3' end of the DNA strand at the target locus includes contacting the DNA strand with a chemical agent.
114. The method of embodiment 93, wherein the step of forming an exposed 3' end of the DNA strand at the target locus includes introducing a replication error.
115. The method of embodiment 93, wherein the step of contacting the DNA molecule with napDNAbp and the guide RNA forms an R-loop.
116. The method of embodiment 115, wherein the DNA strand on which the exposed 3' end is formed is on an R loop.
117. The method of embodiment 93, wherein the guide RNA comprises an extended portion comprising a reverse transcriptase (RT) template sequence.
118. The method of embodiment 117, wherein the extended portion is at the 3' end of the guide RNA, the 5' end of the guide RNA, or at an intramolecular position of the guide RNA.
119. The method of embodiment 93, wherein the guide RNA further comprises a primer binding site.
120. The method of embodiment 93, wherein the guide RNA further comprises a spacer sequence.
121. The method of embodiment 93, wherein the RT template sequence is homologous to the corresponding endogenous DNA.
122. A method for introducing one or more changes in a nucleotide sequence of a DNA molecule at a target locus by primed target reverse transcription, the method comprising: (a) contacting the DNA molecule at the target locus with (i) a fusion protein comprising a nucleic acid programmable DNA binding protein (napDNAbp) and a reverse transcriptase, and (ii) a guide RNA comprising an RT template containing a desired nucleotide change; (b) performing primed target reverse transcription of the RT template to generate a single-stranded DNA containing the desired nucleotide change; and (c) incorporating the desired nucleotide change on the DNA molecule at the target locus by DNA repair and/or replication processes.
123. The method of embodiment 122, wherein the RT template is positioned at the 3' end of the guide RNA, the 5' end of the guide RNA, or at an intramolecular position of the guide RNA.
124. The method of embodiment 122, wherein the desired nucleotide change comprises a transition, a transversion, an insertion, or a deletion, or any combination thereof.
125.Aspects122, wherein the desired nucleotide change comprises a transition selected from the group consisting of: (a) T to C; (b) A to G; (c) C to T; and (d) G to A.
126.Aspects122, wherein the desired nucleotide change comprises a transversion selected from the group consisting of: (a) T to A; (b) T to G; (c) C to G; (d) C to A; (e) A to T; (f) A to C; (g) G to C; and (h) G to T.
127. The method of embodiment 122, wherein the desired nucleotide change comprises changing (1) a G:C base pair to a T:A base pair, (2) a G:C base pair to an A:T base pair, (3) a G:C base pair to a C:G base pair, (4) a T:A base pair to a G:C base pair, (5) a T:A base pair to an A:T base pair, (6) a T:A base pair to a C:G base pair, (7) a C:G base pair to a G:C base pair, (8) a C:G base pair to a T:A base pair, (9) a C:G base pair to an A:T base pair, (10) an A:T base pair to a T:A base pair, (11) an A:T base pair to a G:C base pair, or (12) an A:T base pair to a C:G base pair.
128. A polynucleotide encoding an extended guide RNA of any one of embodiments 31 to 47.
129. A vector comprising the polynucleotide of embodiment 128.
130. A cell comprising the vector of embodiment 129.
131. The fusion protein of any of embodiments 1-30, wherein the reverse transcriptase is an error-prone reverse transcriptase.
132. A method for mutagenizing a DNA molecule at a target locus by primed target reverse transcription, the method comprising: (a) contacting the DNA molecule at the target locus with (i) a fusion protein comprising a nucleic acid programmable DNA binding protein (napDNAbp) and an error-prone reverse transcriptase, and (ii) a guide RNA comprising an RT template containing a desired nucleotide change; (b) performing primed target reverse transcription of the RT template to generate a mutated single-stranded DNA; and (c) incorporating the mutated single-stranded DNA onto the DNA molecule at the target locus by DNA repair and/or replication processes.
133. The method of embodiment 132, wherein the fusion protein comprises an amino acid sequence of PE1, PE2, or PE3.
134. The method of embodiment 132, wherein napDNAbp is Cas9 nickase (nCas9).
135. The method of embodiment 132, wherein napDNAbp is selected from SEQ ID NOs: 18 to 135.88, 126, 130, 137, 141, 147, 153, 157, 445, 460, 467, and 482-487.The amino acid sequence of
136. The method of embodiment 132, wherein the guide RNA comprises sequence number 222.
137. The method of embodiment 132, wherein (b) performing primed reverse transcription on a primed target comprises generating a 3' end primer binding sequence at the target locus that can prime reverse transcription by annealing to a primer binding site on the guide RNA.
138. A method for replacing a trinucleotide repeat expansion mutation on a target DNA molecule with a healthy sequence containing a healthy number of repeated trinucleotides, the method comprising: (a) contacting a DNA molecule at a target locus with (i) a fusion protein comprising a nucleic acid programmable DNA binding protein (napDNAbp) and a reverse transcriptase, and (ii) a guide RNA comprising an RT template comprising a replacement sequence, and introducing said fusion protein; (b) performing primed reverse transcription on the prime target of the RT template to generate a single-stranded DNA comprising the replacement sequence; and (c) incorporating the single-stranded DNA onto the DNA molecule at the target locus by DNA repair and/or replication processes.
139. The method of embodiment 138, wherein the fusion protein comprises an amino acid sequence of PE1, PE2, or PE3.
140. The method of embodiment 138, wherein napDNAbp is Cas9 nickase (nCas9).
141. The method of embodiment 138, wherein napDNAbp is selected from SEQ ID NOs: 18 to 19.88, 126, 130, 137, 141, 147, 153, 157, 445, 460, 467, and 482-487.The amino acid sequence of
142. The method of embodiment 138, wherein the guide RNA comprises sequence number 222.
143. The method of embodiment 138, wherein (b) performing primed reverse transcription on a primed target comprises generating a 3' end primer binding sequence at the target locus that can prime reverse transcription by annealing to a primer binding site on the guide RNA.
144. The method of embodiment 138, wherein the trinucleotide repeat expansion mutation is associated with Huntington's disease, Fragile X syndrome, or Friedreich's ataxia.
145. The method of embodiment 138, wherein the trinucleotide repeat expansion mutation comprises a repeat unit of a CAG triplet.
146. The method of embodiment 138, wherein the trinucleotide repeat expansion mutation comprises a repeat unit of a GAA triplet.
147. A method for incorporating a functional moiety onto a protein of interest encoded by a target nucleotide sequence by prime editing, the method comprising: (a) contacting the target nucleotide sequence with (i) a prime editing factor comprising a nucleic acid programmable DNA binding protein (napDNAbp) and a reverse transcriptase and (ii) a PEgRNA comprising an editing template encoding the functional moiety; (b) polymerizing a single-stranded DNA sequence encoding the functional moiety; and (c) incorporating the single-stranded DNA sequence in place of the corresponding endogenous strand in the target nucleotide sequence by DNA repair and/or replication processes, wherein the method produces a recombinant target nucleotide sequence encoding a fusion protein comprising the protein of interest and the functional moiety.
148. The method of embodiment 147, wherein the functional portion is a peptide tag.
149. The method of embodiment 148, wherein the peptide tag is an affinity tag, a solubilization tag, a chromatography tag, an epitope tag, or a fluorescent tag.
150. The method of embodiment 148, wherein the peptide tag is: AviTag (SEQ ID NO: 245); C-tag (SEQ ID NO: 246); calmodulin tag (SEQ ID NO: 247); polyglutamic acid tag (SEQ ID NO: 248); E-tag (SEQ ID NO: 249); FLAG tag (SEQ ID NO: 250);2); HA tag (SEQ ID NO:Five); His tag (SEQ ID NO: 252-262); Myc tag (SEQ ID NO:6; NE tag (SEQ ID NO: 264); Rho1D4 tag (SEQ ID NO: 265); S tag (SEQ ID NO: 266); SBP tag (SEQ ID NO: 267); Softag-1 (SEQ ID NO: 268); Softag-2 (SEQ ID NO: 269); Spot tag (SEQ ID NO: 270); Strep tag (SEQ ID NO: 271); TC tag (SEQ ID NO: 272); Ty tag (SEQ ID NO: 273); V5 tag (SEQ ID NO:3); VSV tag (SEQ ID NO:275); and Xpress tag (SEQ ID NO:276).
151. The method of embodiment 148, wherein the peptide tags are: AU1 epitope (SEQ ID NO: 278); AU5 epitope (SEQ ID NO: 279); bacteriophage T7 epitope (T7 tag) (SEQ ID NO: 280); bluetongue virus tag (B tag) (SEQ ID NO: 281); E2 epitope (SEQ ID NO: 282); histidine affinity tag (HAT) (SEQ ID NO: 283); HSV epitope (SEQ ID NO: 284); polyarginine (Arg tag) (SEQ ID NO: 285); polyaspartic acid (Asp tag) (SEQ ID NO: 286); polyphenylalanine (Phe tag) (SEQ ID NO: 287); S1 tag (SEQ ID NO: 288); S tag (SEQ ID NO: 266); and VSVtag(SEQ ID NO:275).
152. The method of embodiment 147, wherein the functional portion is an immune epitope.
153. The method of embodiment 152, wherein the immune epitope is selected from the group consisting of: tetanus toxoid (SEQ ID NO: 396); diphtheria toxin variant CRM197 (SEQ ID NO: 398); mumps immune epitope 1 (SEQ ID NO: 400); mumps immune epitope 2 (SEQ ID NO: 402); mumps immune epitope 3 (SEQ ID NO: 404); rubella virus (SEQ ID NO: 406); hemagglutinin (SEQ ID NO: 408); neuraminidase (SEQ ID NO: 410); TAP1 (SEQ ID NO: 412); TAP2 (SEQ ID NO: 414); hemagglutinin epitope for class I HLA (SEQ ID NO: 416); neuraminidase epitope for class I HLA (SEQ ID NO: 418); hemagglutinin epitope for class II HLA (SEQ ID NO: 420); neuraminidase epitope for class II HLA (SEQ ID NO: 422); hemagglutinin epitope H5N1 binding class I and class II HLA (SEQ ID NO: 424); neuraminidase epitope H5N1-binding class I and class II HLA (SEQ ID NO: 426).
154. A method of embodiment 147, wherein the functional moiety alters the localization of a target protein.
155. The method of embodiment 147, wherein the functional moiety is a degradation tag, thereby altering the degradation rate of the target protein.
156. The method of embodiment 155, further comprising:comprises an amino acid sequence encoding a degradation tag as disclosed herein..
157. The method of embodiment 147, wherein the functional portion is a small molecule binding domain.
158. The method of embodiment 157, wherein the small molecule binding domain is FKBP12 of sequence number 488.
159. The method of embodiment 157, wherein the small molecule binding domain is FKBP12-F36V of sequence number 489.
160. The method of embodiment 157, wherein the small molecule binding domain is SEQ ID NO: 490 and 493~494 cyclophilin.
161. The method of embodiment 157, wherein small molecule binding domains are incorporated onto two or more proteins of interest.
162. The method of embodiment 161, wherein two or more proteins of interest can be dimerized by contacting them with a small molecule.
163. The method of embodiment 157, wherein the small molecule is:
Figure 2020191243000477

Figure 2020191243000478

It is a dimer of a small molecule selected from the group consisting of:
164. A method for incorporating an immune epitope into a protein of interest encoded by a target nucleotide sequence by prime editing, the method comprising: (a) contacting the target nucleotide sequence with (i) a prime editing factor comprising a nucleic acid programmable DNA binding protein (napDNAbp) and a reverse transcriptase and (ii) a PEgRNA comprising an editing template encoding a functional moiety; (b) polymerizing a single-stranded DNA sequence encoding the immune epitope; and (c) incorporating the single-stranded DNA sequence in place of the corresponding endogenous strand in the target nucleotide sequence by DNA repair and/or replication processes, the method producing a recombinant target nucleotide sequence encoding a fusion protein comprising the protein of interest and the immune epitope.
165. The method of embodiment 164, wherein the immune epitope is selected from the group consisting of: tetanus toxoid (SEQ ID NO: 396); diphtheria toxin variant CRM197 (SEQ ID NO: 398); mumps immune epitope 1 (SEQ ID NO: 400); mumps immune epitope 2 (SEQ ID NO: 402); mumps immune epitope 3 (SEQ ID NO: 404); rubella virus (SEQ ID NO: 406); hemagglutinin (SEQ ID NO: 408); neuraminidase (SEQ ID NO: 410); TAP1 (SEQ ID NO: 412); TAP2 (SEQ ID NO: 414); hemagglutinin epitope for class I HLA (SEQ ID NO: 416); neuraminidase epitope for class I HLA (SEQ ID NO: 418); hemagglutinin epitope for class II HLA (SEQ ID NO: 420); neuraminidase epitope for class II HLA (SEQ ID NO: 422); hemagglutinin epitope H5N1 binding class I and class II HLA (SEQ ID NO: 424); selected from the group consisting of neuraminidase epitope H5N1-binding class I and class II HLA (SEQ ID NO: 426).
166. The method of embodiment 164, wherein the fusion protein comprises an amino acid sequence of PE1, PE2, or PE3.
167. The method of embodiment 164, wherein napDNAbp is Cas9 nickase (nCas9).
168. The method of embodiment 164, wherein napDNAbp is selected from SEQ ID NOs: 18 to 19.88, 126, 130, 137, 141, 147, 153, 157, 445, 460, 467, and 482-487.The amino acid sequence of
169. The method of embodiment 164, wherein the guide RNA comprises sequence number 222.
170. A method for incorporating a small dimerization domain onto a protein of interest encoded by a target nucleotide sequence by prime editing, the method comprising: (a) contacting the target nucleotide sequence with (i) a prime editing factor comprising a nucleic acid programmable DNA binding protein (napDNAbp) and a reverse transcriptase, and (ii) a PEgRNA comprising an editing template encoding the small dimerization domain; (b) polymerizing a single-stranded DNA sequence encoding an immune epitope; and (c) incorporating the single-stranded DNA sequence in place of the corresponding endogenous strand in the target nucleotide sequence by DNA repair and/or replication processes, the method producing a recombinant target nucleotide sequence encoding a fusion protein comprising the protein of interest and the small dimerization domain.
171. The method of embodiment 170, further comprising performing the method on a second protein of interest.
172. The method of embodiment 171, wherein a first protein of interest and a second protein of interest dimerize in the presence of a small molecule that binds to the dimerization domains of each of the proteins.
173. The method of embodiment 170, wherein the small molecule binding domain is FKBP12 of sequence number 488.
174. The method of embodiment 170, wherein the small molecule binding domain is FKBP12-F36V of sequence number 489.
175. The method of embodiment 170, wherein the small molecule binding domain is SEQ ID NO: 490 and 493~494 cyclophilin.
176. The method of embodiment 170, wherein the small molecule is:
Figure 2020191243000479

Figure 2020191243000480

Figure 2020191243000481

It is a dimer of a small molecule selected from the group consisting of:
177. The method of embodiment 170, wherein the fusion protein comprises an amino acid sequence of PE1, PE2, or PE3.
178. The method of embodiment 170, wherein napDNAbp is Cas9 nickase (nCas9).
179. The method of embodiment 170, wherein the napDNAbp is selected from SEQ ID NOs: 18 to 19.88, 126, 130, 137, 141, 147, 153, 157, 445, 460, 467, and 482-487.The amino acid sequence of
180. The method of embodiment 170, wherein the guide RNA comprises sequence number 222.
181. A method for incorporating a peptide tag or epitope onto a protein using prime editing, comprising: contacting a target nucleotide sequence encoding a protein with a prime editor construct configured to insert therein a second nucleotide sequence encoding a peptide tag, resulting in a recombinant nucleotide sequence, such that the peptide tag and the protein are expressed from the recombinant nucleotide sequence as a fusion protein.
182. The method of embodiment 181, wherein a peptide tag is used for purifying and/or detecting the protein.
183. The method of embodiment 181, wherein the peptide tag is a polyhistidine (e.g., HHHHHH(SEQ ID NO: 257)), FLAG (e.g., DYKDDDDK(SEQ ID NO:2)), V5 (for example, GKPIPNPLLGLDST(SEQ ID NO:3)), GCN4, HA (e.g., YPYDVPDYA(SEQ ID NO:5)), Myc (e.g., EQKLISEED(SEQ ID NO:6)), GST etc.
184. The method of embodiment 181, wherein the peptide tag has an amino acid sequence selected from the group consisting of SEQ ID NOs: 245-290.
185. The method of embodiment 181, wherein the peptide tag is fused to the protein by a linker.
186. The method of embodiment 181, wherein the fusion protein has the following structure: [protein]-[peptide tag] or [peptide tag]-[protein], where "]-[" represents an optional linker.
187. The method of embodiment 181, wherein the linker has the amino acid sequence of SEQ ID NO: 127, 165-176, 446, 453, and 767-769.
188. The method of embodiment 181, wherein the prime editor construct comprises a sequence represented by SEQ ID NO:101-104, 181-183, 223-234, 237-244, 277, 324-330, 332, 334, 336, 338, 340, 342, 344, 346, 348, 350, 352, 354, 356, 358, 360, 362, 364, 366, 368, 394, 429-442, 499-505, 641-649, 678-692, 735-736, 757-761, 776-777The pEGRNA comprises a nucleotide sequence of
189. The method of embodiment 181, wherein the PEGRNA comprises a spacer, a gRNA core, and an extension arm, the spacer being complementary to a target nucleotide sequence, and the extension arm comprising a reverse transcriptase template encoding a peptide tag.
190. The method of embodiment 181, wherein the PEGRNA comprises a spacer, a gRNA core, and an extension arm, the spacer being complementary to a target nucleotide sequence, and the extension arm comprising a reverse transcriptase template encoding a peptide tag.
191. A method for preventing or halting the progression of prion disease by incorporating one or more protective mutations into a PRNP encoded by a target nucleotide sequence by prime editing, the method comprising: (a) contacting the target nucleotide sequence with (i) a prime editing factor comprising a nucleic acid programmable DNA binding protein (napDNAbp) and a reverse transcriptase, and (ii) a PEgRNA comprising an editing template encoding a functional moiety; (b) polymerizing a single-stranded DNA sequence encoding the protective mutations; and (c) incorporating, by DNA repair and/or replication processes, the single-stranded DNA sequence in place of the corresponding endogenous strand in the target nucleotide sequence, wherein the method produces a recombinant target nucleotide sequence encoding a PRNP containing protective mutations that are resistant to misfolding.
192. The method of embodiment 191, wherein the prion disease is a human prion disease.
193. The method of embodiment 191, wherein the prion disease is an animal prion disease.
194. The method of embodiment 192, wherein the prion disease is Creutzfeldt-Jakob disease (CJD), variant Creutzfeldt-Jakob disease (vCJD), Gerstmann-Straussler-Scheinker syndrome, fatal familial insomnia, or kuru.
195. The method of embodiment 193, wherein the prion disease is bovine spongiform encephalopathy (BSE or "mad cow disease"), chronic wasting disease (CWD), scrapie, transmissible mink encephalopathy, feline spongiform encephalopathy, and ungulate spongiform encephalopathy.
196. The method of embodiment 191, wherein the wild-type PRNP amino acid sequence is SEQ ID NO: 291-292.
197. The method of embodiment 191, wherein the method results in a modified PRNP amino acid sequence selected from the group consisting of SEQ ID NOs: 293-323, and the modified PRNP protein is resistant to misfolding.
198. The method of embodiment 191, wherein the fusion protein comprises an amino acid sequence of PE1, PE2, or PE3.
199. The method of embodiment 191, wherein the napDNAbp is Cas9 nickase (nCas9).
200. The method of embodiment 191, wherein napDNAbp is selected from SEQ ID NOs: 18 to 19.88, 126, 130, 137, 141, 147, 153, 157, 445, 460, 467, and 482-487.The amino acid sequence of
201. The method of embodiment 191, wherein the guide RNA comprises sequence number 222.
202. A method for incorporating a ribonucleotide motif or tag onto a desired RNA encoded by a target nucleotide sequence by prime editing, the method comprising: (a) contacting the target nucleotide sequence with (i) a prime editing factor comprising a nucleic acid programmable DNA binding protein (napDNAbp) and a reverse transcriptase and (ii) a PEgRNA comprising an editing template encoding the ribonucleotide motif or tag; (b) polymerizing a single-stranded DNA sequence encoding the ribonucleotide motif or tag; and (c) incorporating the single-stranded DNA sequence in place of the corresponding endogenous strand in the target nucleotide sequence by DNA repair and/or replication processes, the method producing a recombinant target nucleotide sequence encoding a modified RNA of interest comprising the ribonucleotide motif or tag.
203. The method of embodiment 202, wherein the ribonucleotide motif or tag is the detection moiety.
204. A method of embodiment 202, wherein the ribonucleotide motif or tag affects the expression level of the RNA of interest.
205. The method of embodiment 202, wherein the ribonucleotide motif or tag affects transport or subcellular location of the desired RNA.
206. The method of embodiment 202, wherein the ribonucleotide motif or tag is selected from the group consisting of SV40 type 1, SV40 type 2, SV40 type 3, hGH, BGH, rbGlob, TK, MALAT1 ENE-mascRNA, KSHV PAN ENE, Smbox/U1 snRNA box, U1 snRNA 3' box, tRNA-lysine, broccoli aptamer, spinach aptamer, mango aptamer, HDV ribozyme, and m6A.
207. The method of embodiment 202, wherein the PEG RNA is selected from the group consisting of SEQ ID NO:101-104, 181-183, 223-234, 237-244, 277, 324-330, 332, 334, 336, 338, 340, 342, 344, 346, 348, 350, 352, 354, 356, 358, 360, 362, 364, 366, 368, 394, 429-442, 499-505, 641-649, 678- 692, 735-736, 757-761, 776-777, 2997-3103, 3113-3121, 3305-3455, 3479-3493, 3522-3540, 3549-3556, 3628-3698, 3755-3810, 3874, 3890-3901, 3905-3911, 3913-3929, 3972-3989including.
208. The method of embodiment 202, wherein the fusion protein comprises an amino acid sequence of PE1, PE2, or PE3.
209. The method of embodiment 202, wherein the napDNAbp is Cas9 nickase (nCas9).
210. The method of embodiment 202, wherein napDNAbp is selected from SEQ ID NOs: 18 to 19.88, 126, 130, 137, 141, 147, 153, 157, 445, 460, 467, and 482-487.The amino acid sequence of
211. A method for inserting or deleting a functional portion on a protein of interest encoded by a target nucleotide sequence by prime editing, the method comprising: (a) contacting the target nucleotide sequence with (i) a prime editing factor comprising a nucleic acid programmable DNA binding protein (napDNAbp) and a reverse transcriptase and (ii) a PEGRNA comprising an editing template encoding the functional portion or deletion; (b) polymerizing a single-stranded DNA sequence encoding the functional portion or deletion; and (c) incorporating the single-stranded DNA sequence in place of the corresponding endogenous strand in the target nucleotide sequence by DNA repair and/or replication processes, the method producing a recombinant target nucleotide sequence encoding the protein of interest and an altered protein comprising the functional portion or deletion, and the functional portion altering the modification or localization state of the protein.
212. The method of embodiment 211, wherein the functional portion alters the phosphorylation, ubiquitination, glycosylation, lipid modification, hydroxylation, methylation, acetylation, crotonylation, or sumoylation status of the target protein.
Group 2. Aspects 213-424
213. A fusion protein comprising a nucleic acid programmable DNA binding protein (napDNAbp) and a polymerase.
214. A fusion protein of embodiment 213, wherein the fusion protein is capable of performing prime editing in the presence of a prime editing guide RNA (PEgRNA).
215. A fusion protein of embodiment 213, wherein napDNAbp has nickase activity.
216. The fusion protein of embodiment 213, wherein napDNAbp is a Cas9 protein or a variant thereof.
217. The fusion protein of embodiment 213, wherein napDNAbp is a nuclease-active Cas9, a nuclease-inactive Cas9 (dCas9), or a Cas9 nickase (nCas9).
218. The fusion protein of embodiment 213, wherein napDNAbp is Cas9 nickase (nCas9).
219. The fusion protein of embodiment 213, wherein napDNAbp is selected from the group consisting of: Cas9, Cas12e, Cas12d, Cas12a, Cas12b1, Cas13a, Cas12c, and Argonaute, and optionally has nickase activity.
220. A fusion protein of embodiment 213, wherein the fusion protein is capable of binding to a target DNA sequence when complexed with PEgRNA.
221. The fusion protein of embodiment 220, wherein the target DNA sequence comprises a target strand and a complementary non-target strand.
222. A fusion protein of embodiment 220, wherein binding of the fusion protein complexed with PEgRNA forms an R-loop.
223. The fusion protein of embodiment 222, wherein the R-loop comprises (i) an RNA-DNA hybrid comprising the PEgRNA and a target strand and (ii) a complementary non-target strand.
224. A fusion protein of embodiment 223, wherein the complementary non-target strand is nicked to form a prime sequence having a free 3' end.
225. A fusion protein of embodiment 214, wherein the PEgRNA comprises (a) a guide RNA and (b) an extension arm at the 5' or 3' end of the guide RNA or positioned intramolecularly of the guide RNA.
226. A fusion protein of embodiment 225, wherein the extension arm comprises (i) a DNA synthesis template sequence containing a desired nucleotide change and (ii) a primer binding site.
227. The fusion protein of embodiment 226, wherein the DNA synthesis template sequence encodes a single-stranded DNA flap that is complementary to the endogenous DNA sequence adjacent to the nick site, and the single-stranded DNA flap contains the desired nucleotide change.
228. The fusion protein of embodiment 225, wherein the extension arm is at least 5 nucleotides, at least 6 nucleotides, at least 7 nucleotides, at least 8 nucleotides, at least 9 nucleotides, at least 10 nucleotides, at least 11 nucleotides, at least 12 nucleotides, at least 13 nucleotides, at least 14 nucleotides, at least 15 nucleotides, at least 16 nucleotides, at least 17 nucleotides, at least 18 nucleotides, at least 19 nucleotides, at least 20 nucleotides, at least 21 nucleotides, at least 22 nucleotides, at least 23 nucleotides, at least 24 nucleotides, or at least 25 nucleotides in length.
229. A fusion protein of embodiment 227, wherein a single-stranded DNA flap hybridizes to an endogenous DNA sequence adjacent to the nick site, thereby incorporating a desired nucleotide change.
230. The fusion protein of embodiment 227, wherein a single-stranded DNA flap has a free 5' end and replaces the endogenous DNA sequence adjacent to the nick site.
231. A fusion protein of embodiment 230, wherein an endogenous DNA sequence having a 5' end is excised by the cell.
232. A fusion protein of embodiment 230, wherein cellular repair of the single-stranded DNA flap results in incorporation of a desired nucleotide change, thereby forming a desired product.
233. The fusion protein of embodiment 226, wherein the desired nucleotide change is incorporated into an editing window that is between about -4 and +10 of the PAM sequence, or between about -10 and +20 of the PAM sequence, or between about -20 and +40 of the PAM sequence, or between about -30 and +100 of the PAM sequence, or the desired nucleotide change is incorporated into at least 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99, 100, 101, 102, 103, The sequence is integrated 0, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99, or 100 nucleotides downstream.
234. The fusion protein of embodiment 213, wherein napDNAbp is selected from the group consisting of SEQ ID NO:18or SEQ ID NO:18The amino acid sequence includes an amino acid sequence having at least 80%, 85%, 90%, 95%, 98%, or 99% sequence identity with the amino acid sequence of
235. The fusion protein of embodiment 213, wherein napDNAbp is selected from the group consisting of SEQ ID NO:18-88, 126, 130, 137, 141, 147, 153, 157, 445, 460, 467, and 482-487.The amino acid sequence of any one of the above amino acid sequences has at least 80%, 85%, 90%, 95%, 98%, or 99% sequence identity with the amino acid sequence of any one of the above amino acid sequences.
236. The fusion protein of embodiment 213, wherein the polymerase is a reverse transcriptase and the sequence represented by SEQ ID NO:89-100, 105-122, 128-129, 132, 139, 143, 149, 154, 159, 235, 454, 471, 516, 662, 700, 701-716, 739-741, and 766The amino acid sequence of any one of the following:
237. The fusion protein of embodiment 213, wherein the polymerase is a reverse transcriptase and the sequence represented by SEQ ID NO:89-100, 105-122, 128-129, 132, 139, 143, 149, 154, 159, 235, 454, 471, 516, 662, 700, 701-716, 739-741, and 766The amino acid sequence of any one of the above amino acid sequences has at least 80%, 85%, 90%, 95%, 98%, or 99% sequence identity with the amino acid sequence of any one of the above amino acid sequences.
238. The fusion protein of embodiment 213, wherein the polymerase is a naturally occurring reverse transcriptase from a retrovirus or retrotransposon.
239. The fusion protein of any one of the preceding aspects, wherein the fusion protein has the structure NH2-[napDNAbp]-[polymerase]-COOH; or NH2It contains -[polymerase]-[napDNAbp]-COOH, with each "]-[" indicating the presence of an optional linker sequence.
240. The fusion protein of embodiment 239, wherein the linker sequence is selected from the group consisting of SEQ ID NO:127, 165-176, 446, 453, and 767-769The amino acid sequence of
241. The fusion protein of embodiment 226, wherein the desired nucleotide change is a single nucleotide change, an insertion of one or more nucleotides, or a deletion of one or more nucleotides.
242. The fusion protein of embodiment 241, wherein the insertion or deletion is at least 1, at least 2, at least 3, at least 4, at least 5, at least 6, at least 7, at least 8, at least 9, at least 10, at least 11, at least 12, at least 13, at least 14, at least 15, at least 16, at least 17, at least 18, at least 19, at least 20, at least 21, at least 22, at least 23, at least 24, at least 25, at least 26, at least 27, at least 28, at least 29, at least 30, at least 31, at least 32, at least 33, at least 34, at least 35, at least 36, at least 37, at least 38, at least 39, at least 40, at least 41, at least 42, at least 43, at least 44, at least 45, at least 46, at least 47, at least 48, at least 49, or at least 50.
243. A PEgRNA comprising a guide RNA and at least one nucleic acid extension arm comprising a DNA synthesis template.
244. A PEgRNA of embodiment 241, wherein the nucleic acid extension arm is at the 3' or 5' end of the guide RNA or at an intramolecular position of the guide RNA, and the nucleic acid extension arm is DNA or RNA.
245. A PEgRNA of embodiment 242, wherein the PEgRNA is capable of binding to a napDNAbp and directing the napDNAbp to a target DNA sequence.
246. The PEgRNA of embodiment 245, wherein the target DNA sequence comprises a target strand and a complementary non-target strand, and the guide RNA hybridizes to the target strand to form an RNA-DNA hybrid and an R-loop.
247. A PEgRNA of embodiment 243, wherein at least one nucleic acid extension arm comprises (i) a DNA synthesis template and (ii) a primer binding site.
248. The PEGRNA of embodiment 247, wherein the nucleic acid extension arm is at least 5 nucleotides, at least 6 nucleotides, at least 7 nucleotides, at least 8 nucleotides, at least 9 nucleotides, at least 10 nucleotides, at least 11 nucleotides, at least 12 nucleotides, at least 13 nucleotides, at least 14 nucleotides, at least 15 nucleotides, at least 16 nucleotides, at least 17 nucleotides, at least 18 nucleotides, at least 19 nucleotides, at least 20 nucleotides, at least 21 nucleotides, at least 22 nucleotides, at least 23 nucleotides, at least 24 nucleotides, or at least 25 nucleotides in length.
249. The PEgRNA of embodiment 247, wherein the DNA synthesis template is at least 3 nucleotides, at least 4 nucleotides, at least 5 nucleotides, at least 6 nucleotides, at least 7 nucleotides, at least 8 nucleotides, at least 9 nucleotides, at least 10 nucleotides, at least 11 nucleotides, at least 12 nucleotides, at least 13 nucleotides, at least 14 nucleotides, or at least 15 nucleotides in length.
250. The PEGRNA of embodiment 247, wherein the primer binding site is at least 3 nucleotides, at least 4 nucleotides, at least 5 nucleotides, at least 6 nucleotides, at least 7 nucleotides, at least 8 nucleotides, at least 9 nucleotides, at least 10 nucleotides, at least 11 nucleotides, at least 12 nucleotides, at least 13 nucleotides, at least 14 nucleotides, or at least 15 nucleotides in length.
251. The PEgRNA of embodiment 243, further comprising at least one additional structure selected from the group consisting of a linker, a stem loop, a hairpin, a toe loop, an aptamer, or an RNA-protein recruitment domain.
252. The PEgRNA of embodiment 247, wherein the DNA synthesis template encodes a single-stranded DNA flap that is complementary to the endogenous DNA sequence adjacent to the nick site, and the single-stranded DNA flap contains the desired nucleotide change.
253. A PEGRNA of embodiment 252, wherein the single-stranded DNA flap displaces endogenous single-stranded DNA having a 5' end on the nicked target DNA sequence, and the endogenous single-stranded DNA is immediately adjacent to and downstream of the nick site.
254. A PEGRNA of embodiment 253, wherein the endogenous single-stranded DNA having a free 5' end is excised by the cell.
255. A PEgRNA of embodiment 253, wherein cellular repair of the single-stranded DNA flap results in incorporation of a desired nucleotide change, thereby forming a desired product.
256. The PEG RNA of embodiment 243, comprising:101-104, 181-183, 223-234, 237-244, 277, 324-330, 332, 334, 336, 338, 340, 342, 344, 346, 348, 350, 352, 354, 356, 358, 360, 362, 364, 366, 368, 394, 429-442, 499-505, 641-649, 678-692, 735-736, 757-761, 776-777or SEQ ID NO:101-104, 181-183, 223-234, 237-244, 277, 324-330, 332, 334, 336, 338, 340, 342, 344, 346, 348, 350, 352, 354, 356, 358, 360, 362, 364, 366, 368, 394, 429-442, 499-505, 641-649, 678-692, 735-736, 757-761, 776-777or at least 90%, or at least 95%, or at least 98%, or at least 99% sequence identity with any one of the following:
257. The PEgRNA of embodiment 247, wherein the DNA synthesis template comprises a nucleotide sequence that is at least 80%, or 85%, or 90%, or 95%, or 99% identical to the endogenous DNA target.
258. A PEGRNA of embodiment 247, wherein the primer binding site hybridizes to the free 3' end of the cut DNA.
259. A PEgRNA of embodiment 251, wherein at least one additional structure is positioned at the 3' or 5' end of the PEgRNA.
260. A complex comprising any one of the fusion proteins of embodiments 213-242 and PEgRNA.
261. A complex of embodiment 260, wherein the PEgRNA comprises a guide RNA and a nucleic acid extension arm at the 3' or 5' end of the guide RNA or at an intramolecular position of the guide RNA.
262. A complex of embodiment 260, wherein the PEgRNA is capable of binding to the napDNAbp and directing the napDNAbp to a target DNA sequence.
263. A complex of embodiment 262, wherein the target DNA sequence comprises a target strand and a complementary non-target strand, and the guide RNA hybridizes to the target strand to form an RNA-DNA hybrid and an R-loop.
264. A complex of embodiment 261, wherein at least one nucleic acid extension arm comprises (i) a DNA synthesis template and (ii) a primer binding site.
265. The complex of embodiment 260, wherein the PEGRNA is selected from the group consisting of SEQ ID NO:101-104, 181-183, 223-234, 237-244, 277, 324-330, 332, 334, 336, 338, 340, 342, 344, 346, 348, 350, 352, 354, 356, 358, 360, 362, 364, 366, 368, 394, 429-442, 499-505, 641-649, 678-692, 735-736, 757-761, 776-777or SEQ ID NO:101-104, 181-183, 223-234, 237-244, 277, 324-330, 332, 334, 336, 338, 340, 342, 344, 346, 348, 350, 352, 354, 356, 358, 360, 362, 364, 366, 368, 394, 429-442, 499-505, 641-649, 678-692, 735-736, 757-761, 776-777In one embodiment, the present invention comprises a nucleotide sequence having at least 85%, or at least 90%, or at least 95%, or at least 98%, or at least 99% sequence identity with any one of the following:
266. A complex of embodiment 264, wherein the DNA synthesis template comprises a nucleotide sequence that is at least 80%, or 85%, or 90%, or 95%, or 99% identical to the endogenous DNA target.
267. A complex of embodiment 264, wherein the primer binding site hybridizes to the free 3' end of the cut DNA.
268. A complex containing napDNAbp and PEgRNA.
269. The complex of embodiment 268, wherein napDNAbp is Cas9 nickase.
270. The complex of embodiment 268, wherein napDNAbp is selected from the group consisting of SEQ ID NO:18The amino acid sequence of
271. The complex of embodiment 268, wherein napDNAbp is selected from the group consisting of SEQ ID NO:18-88, 126, 130, 137, 141, 147, 153, 157, 445, 460, 467, and 482-487.The amino acid sequence of any one of the above amino acid sequences has at least 80%, 85%, 90%, 95%, 98%, or 99% sequence identity with the amino acid sequence of any one of the above amino acid sequences.
272. A complex of embodiment 268, wherein the PEgRNA comprises a guide RNA and a nucleic acid extension arm at the 3' or 5' end of the guide RNA or at an intramolecular position of the guide RNA.
273. A complex of embodiment 268, wherein the PEgRNA can guide the napDNAbp to a target DNA sequence.
274. A complex of embodiment 272, wherein the target DNA sequence comprises a target strand and a complementary non-target strand, and the spacer sequence of the PEgRNA hybridizes to the target strand to form an RNA-DNA hybrid and an R-loop.
275. A complex of embodiment 273, wherein the nucleic acid extension arm comprises (i) a DNA synthesis template and (ii) a primer binding site.
276. The conjugate of embodiment 269, wherein the PEGRNA is selected from the group consisting of SEQ ID NO:101-104, 181-183, 223-234, 237-244, 277, 324-330, 332, 334, 336, 338, 340, 342, 344, 346, 348, 350, 352, 354, 356, 358, 360, 362, 364, 366, 368, 394, 429-442, 499-505, 641-649, 678- 692, 735-736, 757-761, 776-777, 2997-3103, 3113-3121, 3305-3455, 3479-3493, 3522-3540, 3549-3556, 3628-3698, 3755-3810, 3874, 3890-3901, 3905-3911, 3913-3929, 3972-3989or SEQ ID NO:101-104, 181-183, 223-234, 237-244, 277, 324-330, 332, 334, 336, 338, 340, 342, 344, 346, 348, 350, 352, 354, 356, 358, 360, 362, 364, 366, 368, 394, 429-442, 499-505, 641-649, 678-692, 735-736, 757-761, 776-777In one embodiment, the present invention comprises a nucleotide sequence having at least 85%, or at least 90%, or at least 95%, or at least 98%, or at least 99% sequence identity with any one of the following:
277. The complex of embodiment 276, wherein the DNA synthesis template comprises a nucleotide sequence that is at least 80%, or 85%, or 90%, or 95%, or 99% identical to the endogenous DNA target.
278. A complex of embodiment 276, wherein the primer binding site hybridizes to the free 3' end of the cut DNA.
279. The complex of embodiment 276, wherein the PEgRNA further comprises at least one additional structure selected from the group consisting of a linker, a stem loop, a hairpin, a toe loop, an aptamer, or an RNA-protein recruitment domain.
280. A polynucleotide encoding a fusion protein of any one of embodiments 213 to 242.
281. A vector comprising a polynucleotide of embodiment 280.
282. A cell comprising a fusion protein of any of embodiments 213 to 242 and a PEgRNA bound to the napDNAbp of the fusion protein.
283. A cell comprising a complex of any one of embodiments 260 to 279.
284. A pharmaceutical composition comprising: (i) a fusion protein of any one of embodiments 213 to 242, a complex of embodiments 260 to 279, a polynucleotide of embodiment 68, or a vector of embodiment 69; and (ii) a pharma- ceutically acceptable excipient.
285. A pharmaceutical composition comprising: (i) a conjugate of any one of embodiments 260 to 279, (ii) a polymerase provided in trans; and (iii) a pharma- ceutically acceptable excipient.
286. A kit comprising: (i) a nucleic acid sequence encoding a fusion protein of any one of embodiments 213-242; and (ii) a nucleic acid construct comprising a promoter driving expression of the sequence of (i).
287. A method for incorporating a desired nucleotide change into a double-stranded DNA sequence, the method comprising:
(i) contacting a double-stranded DNA sequence with a complex comprising a fusion protein and a PEgRNA, wherein the fusion protein comprises napDNAbp and a polymerase, and the PEgRNA comprises a DNA synthesis template containing the desired nucleotide change and a primer binding site;
(ii) nicking the double-stranded DNA sequence, thereby generating a free single-stranded DNA having a 3' end;
(iii) hybridizing the 3' end of the free single-stranded DNA to the primer binding site, thereby priming the polymerase;
(iv) polymerizing a strand of DNA from the 3' end hybridized to the primer binding site, thereby generating a single-stranded DNA flap that is complementary to the DNA synthesis template and contains the desired nucleotide change;
(v) replacing the endogenous DNA strand adjacent to the cut site with a single-stranded DNA flap, thereby incorporating the desired nucleotide change into the double-stranded DNA sequence;
including.
288. The method of embodiment 287, wherein (v) the replacing step comprises: (i) hybridizing a single-stranded DNA flap to the endogenous DNA strand adjacent to the cut site to create a sequence mismatch; (ii) excising the endogenous DNA strand; and (iii) repairing the mismatch to form a desired product containing the desired nucleotide change in both strands of DNA.
289. The method of embodiment 288, wherein the desired nucleotide change is a single nucleotide substitution, deletion, or insertion.
290. The method of embodiment 289, wherein the single nucleotide substitution is a transition or transversion.
291. The method of embodiment 288, wherein the desired nucleotide change is (1) a G to T substitution, (2) a G to A substitution, (3) a G to C substitution, (4) a T to G substitution, (5) a T to A substitution, (6) a T to C substitution, (7) a C to G substitution, (8) a C to T substitution, (9) a C to A substitution, (10) an A to T substitution, (11) an A to G substitution, or (12) an A to C substitution.
292. The method of embodiment 288, wherein the desired nucleotide change is to convert (1) a G:C base pair to a T:A base pair, (2) a G:C base pair to an A:T base pair, (3) a G:C base pair to a C:G base pair, (4) a T:A base pair to a G:C base pair, (5) a T:A base pair to an A:T base pair, (6) a T:A base pair to a C:G base pair, (7) a C:G base pair to a G:C base pair, (8) a C:G base pair to a T:A base pair, a C:G base pair to an A:T base pair, (10) an A:T base pair to a T:A base pair, (11) an A:T base pair to a G:C base pair, or (12) an A:T base pair to a C:G base pair.
293. The method of embodiment 288, wherein the desired nucleotide change is an insertion or deletion of 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, or 25 nucleotides.
294. The method of embodiment 288, wherein the desired nucleotide change corrects a disease-associated gene.
295. The method of embodiment 294, wherein the disease-associated gene is associated with a single-gene disorder selected from the group consisting of: adenosine deaminase (ADA) deficiency; alpha-1 antitrypsin deficiency; cystic fibrosis; Duchenne muscular dystrophy; galactosemia; hemochromatosis; Huntington's disease; maple syrup urine disease; Marfan syndrome; neurofibromatosis type 1; congenital pachyonychia; phenylketonuria; severe combined immunodeficiency; sickle cell disease; Smith-Lemli-Opitz syndrome; trinucleotide repeat disorders; prion diseases; and Tay-Sachs disease.
296. The method of embodiment 294, wherein the disease-associated gene is associated with a polygenic disorder selected from the group consisting of: heart disease; high blood pressure; Alzheimer's disease; arthritis; diabetes; cancer; and obesity.
297. The method of embodiment 287, wherein napDNAbp is a nuclease-inactive Cas9 (dCas9), a Cas9 nickase (nCas9), or a nuclease-active Cas9.
298. The method of embodiment 287, wherein the napDNAbp is selected from the group consisting of SEQ ID NO:18or SEQ ID NO:18The amino acid sequence includes an amino acid sequence having at least 80%, 85%, 90%, 95%, 98%, or 99% sequence identity with the amino acid sequence of
299. The method of embodiment 287, wherein the napDNAbp is selected from the group consisting of SEQ ID NO:18-88, 126, 130, 137, 141, 147, 153, 157, 445, 460, 467, and 482-487.The amino acid sequence of any one of the above amino acid sequences has at least 80%, 85%, 90%, 95%, 98%, or 99% sequence identity with the amino acid sequence of any one of the above amino acid sequences.
300. The method of embodiment 287, wherein the polymerase is a reverse transcriptase and the sequence represented by SEQ ID NO:89-100, 105-122, 128-129, 132, 139, 143, 149, 154, 159, 235, 454, 471, 516, 662, 700, 701-716, 739-741, and 766The amino acid sequence of any one of the following:
301. The method of embodiment 287, wherein the polymerase is a reverse transcriptase and the sequence represented by SEQ ID NO:89-100, 105-122, 128-129, 132, 139, 143, 149, 154, 159, 235, 454, 471, 516, 662, 700, 701-716, 739-741, and 766The amino acid sequence of any one of the above amino acid sequences has at least 80%, 85%, 90%, 95%, 98%, or 99% sequence identity with the amino acid sequence of any one of the above amino acid sequences.
302. The method of embodiment 287, wherein the PEgRNA comprises a nucleic acid extension arm at the 3' or 5' end of the guide RNA or positioned within the molecule, the extension arm comprising a DNA synthesis template sequence and a primer binding site.
303. The method of embodiment 302, wherein the extension arm is at least 5 nucleotides, at least 6 nucleotides, at least 7 nucleotides, at least 8 nucleotides, at least 9 nucleotides, at least 10 nucleotides, at least 11 nucleotides, at least 12 nucleotides, at least 13 nucleotides, at least 14 nucleotides, at least 15 nucleotides, at least 16 nucleotides, at least 17 nucleotides, at least 18 nucleotides, at least 19 nucleotides, at least 20 nucleotides, at least 21 nucleotides, at least 22 nucleotides, at least 23 nucleotides, at least 24 nucleotides, or at least 25 nucleotides in length.
304. The method of embodiment 287, wherein the PEG RNA is selected from the group consisting of SEQ ID NO:101-104, 181-183, 223-234, 237-244, 277, 324-330, 332, 334, 336, 338, 340, 342, 344, 346, 348, 350, 352, 354, 356, 358, 360, 362, 364, 366, 368, 394, 429-442, 499-505, 641-649, 678-692, 735-736, 757-761, 776-777The nucleic acid has a nucleotide sequence selected from the group consisting of:
305. A method for introducing one or more changes in the nucleotide sequence of a DNA molecule at a target locus, comprising:
(i) contacting a DNA molecule with a nucleic acid programmable DNA binding protein (napDNAbp) and a PEgRNA that targets the napDNAbp to a target locus, the PEgRNA comprising a reverse transcriptase (RT) template sequence containing at least one desired nucleotide change and a primer binding site;
(ii) forming an exposed 3' end of the DNA strand at the target locus;
(iii) hybridizing the exposed 3' end to a primer binding site to prime reverse transcription;
(iv) synthesizing, by reverse transcriptase, a single-stranded DNA flap containing at least one desired nucleotide change based on the RT template sequence; and
(v) incorporating at least one desired nucleotide change into the corresponding endogenous DNA, thereby introducing one or more changes in the nucleotide sequence of the DNA molecule at the target locus;
including.
306. The method of embodiment 305, wherein one or more changes in the nucleotide sequence include a transition.
307. The method of embodiment 306, wherein the transition is selected from the group consisting of: (a) T to C; (b) A to G; (c) C to T; and (d) G to A.
308. The method of embodiment 305, wherein one or more changes in the nucleotide sequence include a transversion.
309. The method of embodiment 308, wherein the transversion is selected from the group consisting of: (a) T to A; (b) T to G; (c) C to G; (d) C to A; (e) A to T; (f) A to C; (g) G to C; and (h) G to T.
310. The method of embodiment 305, wherein the one or more changes in the nucleotide sequence include changing (1) a G:C base pair to a T:A base pair, (2) a G:C base pair to an A:T base pair, (3) a G:C base pair to a C:G base pair, (4) a T:A base pair to a G:C base pair, (5) a T:A base pair to an A:T base pair, (6) a T:A base pair to a C:G base pair, (7) a C:G base pair to a G:C base pair, (8) a C:G base pair to a T:A base pair, (9) a C:G base pair to an A:T base pair, (9) an A:T base pair to a T:A base pair, (11) an A:T base pair to a G:C base pair, or (12) an A:T base pair to a C:G base pair.
311. The method of embodiment 305, wherein the one or more changes in the nucleotide sequence include an insertion or deletion of 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, or 25 nucleotides.
312. The method of embodiment 305, wherein one or more changes in the nucleotide sequence include a correction of a disease-associated gene.
313. The method of embodiment 312, wherein the disease-associated gene is associated with a single-gene disorder selected from the group consisting of: adenosine deaminase (ADA) deficiency; alpha-1 antitrypsin deficiency; cystic fibrosis; Duchenne muscular dystrophy; galactosemia; hemochromatosis; Huntington's disease; maple syrup urine disease; Marfan syndrome; neurofibromatosis type 1; pachyonychia congenita; phenylketonuria; severe combined immunodeficiency; sickle cell disease; Smith-Lemli-Opitz syndrome; trinucleotide repeat disorders; prion diseases; and Tay-Sachs disease.
314. The method of embodiment 312, wherein the disease-associated gene is associated with a polygenic disorder selected from the group consisting of: heart disease; high blood pressure; Alzheimer's disease; arthritis; diabetes; cancer; and obesity.
315. The method of embodiment 305, wherein napDNAbp is a nuclease-active Cas9 or a variant thereof.
316. The method of embodiment 305, wherein napDNAbp is a nuclease-inactivated Cas9 (dCas9) or Cas9 nickase (nCas9) or a variant thereof.
317. The method of embodiment 305, wherein the napDNAbp comprises an amino acid sequence of SEQ ID NO:2 or an amino acid sequence having at least 80%, 85%, 90%, 95%, 98%, or 99% sequence identity to SEQ ID NO:2.
318. The method of embodiment 305, wherein napDNAbp is selected from the group consisting of SEQ ID NO:18-88, 126, 130, 137, 141, 147, 153, 157, 445, 460, 467, and 482-487.The amino acid sequence of any one of the above amino acid sequences has at least 80%, 85%, 90%, 95%, 98%, or 99% sequence identity with the amino acid sequence of any one of the above amino acid sequences.
319. The method of embodiment 305, wherein the reverse transcriptase is introduced in trans.
320. The method of embodiment 305, wherein the napDNAbp comprises a fusion to a reverse transcriptase.
321. The method of embodiment 305, wherein the reverse transcriptase is selected from the group consisting of SEQ ID NO:89-100, 105-122, 128-129, 132, 139, 143, 149, 154, 159, 235, 454, 471, 516, 662, 700, 701-716, 739-741, and 766The amino acid sequence of any one of the following:
322. The method of embodiment 305, wherein the reverse transcriptase is selected from the group consisting of SEQ ID NO:89-100, 105-122, 128-129, 132, 139, 143, 149, 154, 159, 235, 454, 471, 516, 662, 700, 701-716, 739-741, and 766The amino acid sequence of any one of the above amino acid sequences has at least 80%, 85%, 90%, 95%, 98%, or 99% sequence identity with the amino acid sequence of any one of the above amino acid sequences.
323. The method of embodiment 305, wherein the step of forming an exposed 3' end of the DNA strand at the target locus includes nicking the DNA strand with a nuclease.
324. The method of embodiment 323, wherein the nuclease is provided in trans.
325. In the method of embodiment 305, the step of forming an exposed 3' end of the DNA strand at the target locus includes contacting the DNA strand with a chemical agent.
326. The method of embodiment 305, wherein the step of forming an exposed 3' end of the DNA strand at the target locus includes introducing a replication error.
327. The method of embodiment 305, wherein contacting the DNA molecule with napDNAbp and the guide RNA forms an R-loop.
328. A method of embodiment 327, wherein the DNA strand on which the exposed 3' end is formed is on an R loop.
329. The method of embodiment 315, wherein the PEgRNA comprises an extension arm comprising a reverse transcriptase (RT) template sequence and a primer binding site.
330. The method of embodiment 329, wherein the extension arm is at the 3' end of the guide RNA, the 5' end of the guide RNA, or at an intramolecular position of the guide RNA.
331. The method of embodiment 305, wherein the PEgRNA further comprises at least one additional structure selected from the group consisting of a linker, a stem loop, a hairpin, a toe loop, an aptamer, or an RNA-protein recruitment domain.
332. The method of embodiment 305, wherein the PEgRNA further comprises a homology arm.
333. The method of embodiment 305, wherein the RT template sequence is homologous to the corresponding endogenous DNA.
334. A method for introducing one or more changes in a nucleotide sequence of a DNA molecule at a target locus by primed target reverse transcription, the method comprising: (a) contacting the DNA molecule at the target locus with (i) a fusion protein comprising a nucleic acid programmable DNA binding protein (napDNAbp) and a reverse transcriptase, and (ii) a guide RNA comprising an RT template containing a desired nucleotide change; (b) performing primed target reverse transcription of the RT template to generate a single-stranded DNA containing the desired nucleotide change; and (c) incorporating the desired nucleotide change on the DNA molecule at the target locus by DNA repair and/or replication processes.
335. The method of embodiment 334, wherein the RT template is positioned at the 3' end of the guide RNA, the 5' end of the guide RNA, or at an intramolecular position of the guide RNA.
336. The method of embodiment 334, wherein the desired nucleotide change comprises a transition, a transversion, an insertion, or a deletion, or any combination thereof.
337. The method of embodiment 334, wherein the desired nucleotide change comprises a transition selected from the group consisting of: (a) T to C; (b) A to G; (c) C to T; and (d) G to A.
338. The method of claim 334, wherein the desired nucleotide change comprises a transversion selected from the group consisting of: (a) T to A; (b) T to G; (c) C to G; (d) C to A; (e) A to T; (f) A to C; (g) G to C; and (h) G to T.
339. The method of claim 334, wherein the desired nucleotide change comprises changing (1) a G:C base pair to a T:A base pair, (2) a G:C base pair to an A:T base pair, (3) a G:C base pair to a C:G base pair, (4) a T:A base pair to a G:C base pair, (5) a T:A base pair to an A:T base pair, (6) a T:A base pair to a C:G base pair, (7) a C:G base pair to a G:C base pair, (8) a C:G base pair to a T:A base pair, (9) a C:G base pair to an A:T base pair, (10) an A:T base pair to a T:A base pair, (11) an A:T base pair to a G:C base pair, or (12) an A:T base pair to a C:G base pair.
340. A polynucleotide encoding a PEgRNA of any one of embodiments 243 to 259.
341. A vector comprising a polynucleotide of embodiment 340.
342. A cell comprising a vector of embodiment 341.
343. The fusion protein of embodiment 213, wherein the polymerase is an error-prone reverse transcriptase.
344. A method for mutagenizing a DNA molecule at a target locus by primed target reverse transcription, the method comprising: (a) contacting the DNA molecule at the target locus with (i) a fusion protein comprising a nucleic acid programmable DNA binding protein (napDNAbp) and an error-prone reverse transcriptase, and (ii) a guide RNA comprising an RT template containing a desired nucleotide change; (b) performing primed target reverse transcription of the RT template to generate a mutated single-stranded DNA; and (c) incorporating the mutated single-stranded DNA onto the DNA molecule at the target locus by DNA repair and/or replication processes.
345. A method of any preceding embodiment, wherein the fusion protein comprises an amino acid sequence of PE1, PE2, or PE3.
346. A method of any preceding embodiment, wherein the napDNAbp is Cas9 nickase (nCas9).
347. The method of embodiment 344, wherein napDNAbp is selected from SEQ ID NOs: 18 to 19.88, 126, 130, 137, 141, 147, 153, 157, 445, 460, 467, and 482-487.The amino acid sequence of
348. The method of embodiment 344, wherein the guide RNA is SEQ ID NO:222including.
349. The method of embodiment 344, wherein (b) performing primed reverse transcription on a prime target comprises generating a 3' end primer binding sequence at the target locus that can prime reverse transcription by annealing to a primer binding site on the guide RNA.
350. A method for replacing a trinucleotide repeat expansion mutation on a target DNA molecule with a healthy sequence containing a healthy number of repeated trinucleotides, the method comprising: (a) contacting a DNA molecule at a target locus with (i) a fusion protein comprising a nucleic acid programmable DNA binding protein (napDNAbp) and a polymerase and (ii) a DNA synthesis template comprising the replacement sequence and a PEgRNA comprising a primer binding site; (b) performing prime editing to generate a single-stranded DNA comprising the replacement sequence; and (c) incorporating the single-stranded DNA onto the DNA molecule at the target locus by DNA repair and/or replication processes.
351. The method of embodiment 350, wherein the fusion protein comprises an amino acid sequence of PE1, PE2, or PE3.
352. The method of embodiment 350, wherein napDNAbp is Cas9 nickase (nCas9).
353. The method of embodiment 350, wherein napDNAbp is selected from SEQ ID NOs: 18 to 19.88, 126, 130, 137, 141, 147, 153, 157, 445, 460, 467, and 482-487.The amino acid sequence of
354. The method of embodiment 350, wherein the guide RNA is222including.
355. The method of embodiment 350, wherein (b) the step of performing prime editing includes generating a 3' end primer binding sequence at the target locus that can prime a polymerase by annealing to a primer binding site on the guide RNA.
356. The method of embodiment 350, wherein the trinucleotide repeat expansion mutation is associated with Huntington's disease, Fragile X syndrome, or Friedreich's ataxia.
357. The method of embodiment 350, wherein the trinucleotide repeat expansion mutation comprises a repeat unit of a CAG triplet.
358. The method of embodiment 350, wherein the trinucleotide repeat expansion mutation comprises a repeat unit of a GAA triplet.
359. A method for incorporating a functional moiety onto a protein of interest encoded by a target nucleotide sequence by prime editing, the method comprising: (a) contacting the target nucleotide sequence with (i) a prime editing factor comprising a nucleic acid programmable DNA binding protein (napDNAbp) and a polymerase, and (ii) a PEgRNA comprising a DNA synthesis template encoding the functional moiety; (b) polymerizing a single-stranded DNA sequence encoding the functional moiety; and (c) incorporating the single-stranded DNA sequence in place of the corresponding endogenous strand in the target nucleotide sequence by DNA repair and/or replication processes, wherein the method produces a recombinant target nucleotide sequence encoding a fusion protein comprising the protein of interest and the functional moiety.
360. A method of embodiment 359, wherein the functional portion is a peptide tag.
361. The method of embodiment 360, wherein the peptide tag is an affinity tag, a solubilization tag, a chromatography tag, an epitope or immunoepitope tag, or a fluorescent tag.
362. The method of embodiment 360, wherein the peptide tag is: AviTag (SEQ ID NO: 245); C-tag (SEQ ID NO: 246); calmodulin tag (SEQ ID NO: 247); polyglutamic acid tag (SEQ ID NO: 248); E-tag (SEQ ID NO: 249); FLAG tag (SEQ ID NO: 250);2); HA tag (SEQ ID NO:Five); His tag (SEQ ID NO: 252-262); Myc tag (SEQ ID NO:6; NE tag (SEQ ID NO: 264); Rho1D4 tag (SEQ ID NO: 265); S tag (SEQ ID NO: 266); SBP tag (SEQ ID NO: 267); Softag-1 (SEQ ID NO: 268); Softag-2 (SEQ ID NO: 269); Spot tag (SEQ ID NO: 270); Strep tag (SEQ ID NO: 271); TC tag (SEQ ID NO: 272); Ty tag (SEQ ID NO: 273); V5 tag (SEQ ID NO:3); VSV tag (SEQ ID NO:275); and Xpress tag (SEQ ID NO:276).
363. The method of embodiment 360, wherein the peptide tag is: AU1 epitope (SEQ ID NO: 278); AU5 epitope (SEQ ID NO: 279); bacteriophage T7 epitope (T7 tag) (SEQ ID NO: 280); bluetongue virus tag (B tag) (SEQ ID NO: 281); E2 epitope (SEQ ID NO: 282); histidine affinity tag (HAT) (SEQ ID NO: 283); HSV epitope (SEQ ID NO: 284); polyarginine (Arg tag) (SEQ ID NO: 285); polyaspartic acid (Asp tag) (SEQ ID NO: 286); polyphenylalanine (Phe tag) (SEQ ID NO: 287); S1 tag (SEQ ID NO: 288); S tag (SEQ ID NO: 266); and VSV-tag(SEQ ID NO:275).
364. The method of embodiment 359, wherein the functional portion is an immune epitope.
365. The method of embodiment 364, wherein the immune epitope is selected from the group consisting of: tetanus toxoid (SEQ ID NO: 396); diphtheria toxin variant CRM197 (SEQ ID NO: 398); mumps immune epitope 1 (SEQ ID NO: 400); mumps immune epitope 2 (SEQ ID NO: 402); mumps immune epitope 3 (SEQ ID NO: 404); rubella virus (SEQ ID NO: 406); hemagglutinin (SEQ ID NO: 408); neuraminidase (SEQ ID NO: 410); TAP1 (SEQ ID NO: 412); TAP2 (SEQ ID NO: 414); hemagglutinin epitope for class I HLA (SEQ ID NO: 416); neuraminidase epitope for class I HLA (SEQ ID NO: 418); hemagglutinin epitope for class II HLA (SEQ ID NO: 420); neuraminidase epitope for class II HLA (SEQ ID NO: 422); hemagglutinin epitope H5N1 binding class I and class II HLA (SEQ ID NO: 424); neuraminidase epitope H5N1-binding class I and class II HLA (SEQ ID NO: 426).
366. A method of embodiment 359, wherein the functional moiety alters the localization of a protein of interest.
367. The method of embodiment 359, wherein the functional moiety is a degradation tag, thereby altering the degradation rate of the target protein.
368. The method of embodiment 367, wherein the degradation tag results in the elimination of the tagged protein.
369. The method of embodiment 359, wherein the functional portion is a small molecule binding domain.
370. The method of embodiment 359, wherein the small molecule binding domain is FKBP12 of sequence number 488.
371. The method of embodiment 359, wherein the small molecule binding domain is FKBP12-F36V of sequence number 489.
372. The method of embodiment 359, wherein the small molecule binding domain is SEQ ID NO: 490 and 493~494 cyclophilin.
373. The method of embodiment 359, wherein small molecule binding domains are incorporated onto two or more proteins of interest.
374. The method of embodiment 373, wherein two or more proteins of interest can be dimerized by contacting them with a small molecule.
375. The method of embodiment 369, wherein the small molecule is:
Figure 2020191243000482

Figure 2020191243000483

Figure 2020191243000484

It is a dimer of a small molecule selected from the group consisting of:
376. A method for incorporating an immune epitope into a protein of interest encoded by a target nucleotide sequence by prime editing, the method comprising: (a) contacting the target nucleotide sequence with (i) a prime editing factor comprising a nucleic acid programmable DNA binding protein (napDNAbp) and a polymerase and (ii) a PEgRNA comprising an editing template encoding a functional moiety; (b) polymerizing a single-stranded DNA sequence encoding the immune epitope; and (c) incorporating the single-stranded DNA sequence in place of the corresponding endogenous strand in the target nucleotide sequence by DNA repair and/or replication processes, the method producing a recombinant target nucleotide sequence encoding a fusion protein comprising the protein of interest and the immune epitope.
377. The method of embodiment 376, wherein the immune epitope is selected from the group consisting of: tetanus toxoid (SEQ ID NO: 396); diphtheria toxin variant CRM197 (SEQ ID NO: 398); mumps immune epitope 1 (SEQ ID NO: 400); mumps immune epitope 2 (SEQ ID NO: 402); mumps immune epitope 3 (SEQ ID NO: 404); rubella virus (SEQ ID NO: 406); hemagglutinin (SEQ ID NO: 408); neuraminidase (SEQ ID NO: 410); TAP1 (SEQ ID NO: 412); TAP2 (SEQ ID NO: 414); hemagglutinin epitope for class I HLA (SEQ ID NO: 416); neuraminidase epitope for class I HLA (SEQ ID NO: 418); hemagglutinin epitope for class II HLA (SEQ ID NO: 420); neuraminidase epitope for class II HLA (SEQ ID NO: 422); hemagglutinin epitope H5N1 binding class I and class II HLA (SEQ ID NO: 424); neuraminidase epitope H5N1-binding class I and class II HLA (SEQ ID NO: 426).
378. The method of embodiment 376, wherein the fusion protein comprises an amino acid sequence of PE1, PE2, or PE3.
379. The method of embodiment 376, wherein napDNAbp is Cas9 nickase (nCas9).
380. The method of embodiment 376, wherein napDNAbp is selected from SEQ ID NOs: 18 to 19.88, 126, 130, 137, 141, 147, 153, 157, 445, 460, 467, and 482-487.The amino acid sequence of
381. The method of embodiment 376, wherein the PEG RNA is selected from the group consisting of SEQ ID NO:101-104, 181-183, 223-234, 237-244, 277, 324-330, 332, 334, 336, 338, 340, 342, 344, 346, 348, 350, 352, 354, 356, 358, 360, 362, 364, 366, 368, 394, 429-442, 499-505, 641-649, 678-692, 735-736, 757-761, 776-777including.
382. A method for incorporating a small dimerization domain onto a protein of interest encoded by a target nucleotide sequence by prime editing, the method comprising: (a) contacting the target nucleotide sequence with (i) a prime editing factor comprising a nucleic acid programmable DNA binding protein (napDNAbp) and a polymerase, and (ii) a PEgRNA comprising an editing template encoding the small dimerization domain; (b) polymerizing a single-stranded DNA sequence encoding an immune epitope; and (c) incorporating the single-stranded DNA sequence in place of the corresponding endogenous strand in the target nucleotide sequence by DNA repair and/or replication processes, wherein the method produces a recombinant target nucleotide sequence encoding a fusion protein comprising the protein of interest and the small dimerization domain.
383. The method of embodiment 382, further comprising performing the method on a second protein of interest.
384. The method of embodiment 383, wherein the first protein of interest and the second protein of interest dimerize in the presence of a small molecule that binds to the dimerization domains of each of the proteins.
385. The method of embodiment 382, wherein the small molecule binding domain is FKBP12 of sequence number 488.
386. The method of embodiment 382, wherein the small molecule binding domain is FKBP12-F36V of sequence number 489.
387. The method of embodiment 382, wherein the small molecule binding domain is selected from the group consisting of SEQ ID NO: 490 and 493~494 cyclophilin.
388. The method of embodiment 382, wherein the small molecule is:
Figure 2020191243000485

Figure 2020191243000486

Figure 2020191243000487

It is a dimer of a small molecule selected from the group consisting of:
389. The method of embodiment 382, wherein the fusion protein comprises an amino acid sequence of PE1, PE2, or PE3.
390. The method of embodiment 382, wherein napDNAbp is Cas9 nickase (nCas9).
391. The method of embodiment 382, wherein napDNAbp is selected from SEQ ID NOs: 18 to 19.88, 126, 130, 137, 141, 147, 153, 157, 445, 460, 467, and 482-487.The amino acid sequence of
392. The method of embodiment 382, wherein the PEG RNA is selected from the group consisting of SEQ ID NO:101-104, 181-183, 223-234, 237-244, 277, 324-330, 332, 334, 336, 338, 340, 342, 344, 346, 348, 350, 352, 354, 356, 358, 360, 362, 364, 366, 368, 394, 429-442, 499-505, 641-649, 678-692, 735-736, 757-761, 776-777including.
393. A method for incorporating a peptide tag or epitope onto a protein using prime editing, comprising: contacting a target nucleotide sequence encoding a protein with a prime editor construct configured to insert therein a second nucleotide sequence encoding a peptide tag, resulting in a recombinant nucleotide sequence, such that the peptide tag and the protein are expressed from the recombinant nucleotide sequence as a fusion protein.
394. The method of embodiment 383, wherein a peptide tag is used for purifying and/or detecting the protein.
395. The method of embodiment 383, wherein the peptide tag is a polyhistidine (e.g., HHHHHH(SEQ ID NO: 257)), FLAG (e.g., DYKDDDDK(SEQ ID NO:2)), V5 (for example, GKPIPNPLLGLDST(SEQ ID NO:3)), GCN4, HA (e.g., YPYDVPDYA(SEQ ID NO:5)), Myc (e.g., EQKLISEED(SEQ ID NO:6)), or GST.
396. The method of embodiment 383, wherein the peptide tag has an amino acid sequence selected from the group consisting of SEQ ID NOs: 245-290.
397. The method of embodiment 383, wherein the peptide tag is fused to the protein by a linker.
398. The method of embodiment 383, wherein the fusion protein has the following structure: [protein]-[peptide tag] or [peptide tag]-[protein], where "]-[" represents an optional linker.
399. The method of embodiment 383, wherein the linker is SEQ ID NO:127, 165-176, 446, 453, and 767-769It has the amino acid sequence:
400. The method of embodiment 383, wherein the prime editor construct comprises a sequence represented by SEQ ID NO:101-104, 181-183, 223-234, 237-244, 277, 324-330, 332, 334, 336, 338, 340, 342, 344, 346, 348, 350, 352, 354, 356, 358, 360, 362, 364, 366, 368, 394, 429-442, 499-505, 641-649, 678-692, 735-736, 757-761, 776-777The pEGRNA comprises a nucleotide sequence of
401. The method of embodiment 383, wherein the PEGRNA comprises a spacer, a gRNA core, and an extension arm, the spacer being complementary to a target nucleotide sequence, and the extension arm comprising a reverse transcriptase template encoding a peptide tag.
402. The method of embodiment 383, wherein the PEGRNA comprises a spacer, a gRNA core, and an extension arm, the spacer being complementary to a target nucleotide sequence, and the extension arm comprising a reverse transcriptase template encoding a peptide tag.
403. A method for preventing or halting the progression of a prion disease by incorporating one or more protective mutations into a PRNP encoded by a target nucleotide sequence by prime editing, the method comprising: (a) contacting the target nucleotide sequence with (i) a prime editing factor comprising a nucleic acid programmable DNA binding protein (napDNAbp) and a polymerase, and (ii) a PEgRNA comprising an editing template encoding a functional moiety; (b) polymerizing a single-stranded DNA sequence encoding the protective mutations; and (c) incorporating, by DNA repair and/or replication processes, the single-stranded DNA sequence in place of the corresponding endogenous strand in the target nucleotide sequence, wherein the method produces a recombinant target nucleotide sequence encoding a PRNP containing protective mutations that are resistant to misfolding.
404. The method of embodiment 403, wherein the prion disease is a human prion disease.
405. The method of embodiment 403, wherein the prion disease is an animal prion disease.
406. The method of embodiment 404, wherein the prion disease is Creutzfeldt-Jakob disease (CJD), variant Creutzfeldt-Jakob disease (vCJD), Gerstmann-Straussler-Scheinker syndrome, fatal familial insomnia, or kuru.
407. The method of embodiment 403, wherein the prion disease is bovine spongiform encephalopathy (BSE or "mad cow disease"), chronic wasting disease (CWD), scrapie, transmissible mink encephalopathy, feline spongiform encephalopathy, and ungulate spongiform encephalopathy.
408. The method of embodiment 403, wherein the wild-type PRNP amino acid sequence is SEQ ID NO: 291-292.
409. The method of embodiment 403, wherein the method results in a modified PRNP amino acid sequence selected from the group consisting of SEQ ID NOs: 293-323, and the modified PRNP protein is resistant to misfolding.
410. The method of embodiment 403, wherein the fusion protein comprises an amino acid sequence of PE1, PE2, or PE3.
411. The method of embodiment 403, wherein the napDNAbp is Cas9 nickase (nCas9).
412. The method of embodiment 403, wherein napDNAbp is selected from SEQ ID NOs: 18 to 19.88, 126, 130, 137, 141, 147, 153, 157, 445, 460, 467, and 482-487.The amino acid sequence of
413The method of embodiment 403, wherein the PEG RNA has the sequence represented by SEQ ID NO:101-104, 181-183, 223-234, 237-244, 277, 324-330, 332, 334, 336, 338, 340, 342, 344, 346, 348, 350, 352, 354, 356, 358, 360, 362, 364, 366, 368, 394, 429-442, 499-505, 641-649, 678-692, 735-736, 757-761, 776-777including.
414. A method for incorporating a ribonucleotide motif or tag onto a desired RNA encoded by a target nucleotide sequence by prime editing, the method comprising: (a) contacting the target nucleotide sequence with (i) a prime editing factor comprising a nucleic acid programmable DNA binding protein (napDNAbp) and a polymerase and (ii) a PEgRNA comprising an editing template encoding the ribonucleotide motif or tag; (b) polymerizing a single-stranded DNA sequence encoding the ribonucleotide motif or tag; and (c) incorporating the single-stranded DNA sequence in place of the corresponding endogenous strand in the target nucleotide sequence by DNA repair and/or replication processes, wherein the method produces a recombinant target nucleotide sequence encoding a modified RNA of interest that includes the ribonucleotide motif or tag.
415. The method of embodiment 414, wherein the ribonucleotide motif or tag is the detection moiety.
416. The method of embodiment 414, wherein the ribonucleotide motif or tag affects the expression level of the RNA of interest.
417. The method of embodiment 414, wherein the ribonucleotide motif or tag affects transport or subcellular location of the desired RNA.
418. The method of embodiment 414, wherein the ribonucleotide motif or tag is selected from the group consisting of SV40 type 1, SV40 type 2, SV40 type 3, hGH, BGH, rbGlob, TK, MALAT1 ENE-mascRNA, KSHV PAN ENE, Smbox/U1 snRNA box, U1 snRNA 3' box, tRNA-lysine, broccoli aptamer, spinach aptamer, mango aptamer, HDV ribozyme, and m6A.
419. The method of embodiment 414, wherein the PEG RNA is selected from the group consisting of SEQ ID NO:101-104, 181-183, 223-234, 237-244, 277, 324-330, 332, 334, 336, 338, 340, 342, 344, 346, 348, 350, 352, 354, 356, 358, 360, 362, 364, 366, 368, 394, 429-442, 499-505, 641-649, 678-692, 735-736, 757-761, 776-777including.
420. The method of embodiment 414, wherein the fusion protein comprises an amino acid sequence of PE1, PE2, or PE3.
421. The method of embodiment 414, wherein napDNAbp is Cas9 nickase (nCas9).
422. The method of embodiment 414, wherein napDNAbp is selected from SEQ ID NOs: 18 to 19.88, 126, 130, 137, 141, 147, 153, 157, 445, 460, 467, and 482-487.The amino acid sequence of
423. A method for introducing or deleting a functional portion on a protein of interest encoded by a target nucleotide sequence by prime editing, the method comprising: (a) contacting the target nucleotide sequence with (i) a prime editing factor comprising a nucleic acid programmable DNA binding protein (napDNAbp) and a polymerase and (ii) a PEgRNA comprising an editing template encoding the functional portion or deletion; (b) polymerizing a single-stranded DNA sequence encoding the functional portion or deletion; and (c) incorporating the single-stranded DNA sequence in place of the corresponding endogenous strand in the target nucleotide sequence by DNA repair and/or replication processes, wherein the method produces a recombinant target nucleotide sequence encoding the protein of interest and an altered protein comprising the functional portion or deletion, and wherein the functional portion alters the modification or localization state of the protein.
424. The method of embodiment 423, wherein the functional moiety alters the phosphorylation, ubiquitination, glycosylation, lipid modification, hydroxylation, methylation, acetylation, crotonylation, or sumoylation status of the protein of interest.

群A.融合タンパク質、ガイド、および方法
態様1.融合タンパク質であって、核酸プログラム型DNA結合タンパク質(napDNAbp)および逆転写酵素を含む。
Group A. Fusion Proteins, Guides, and Methods Embodiment 1. A fusion protein comprising a nucleic acid programmable DNA binding protein (napDNAbp) and a reverse transcriptase.

態様2.態様1の融合タンパク質であって、融合タンパク質が、伸長されたガイドRNAの存在下において、プライム標的にプライムされた逆転写によるゲノム編集を実行することができる。 Aspect 2. The fusion protein of aspect 1, wherein the fusion protein is capable of performing genome editing by primed reverse transcription to a primed target in the presence of an extended guide RNA.

態様3.態様1の融合タンパク質であって、napDNAbpがニッカーゼ活性を有する。 Aspect 3. The fusion protein of aspect 1, wherein napDNAbp has nickase activity.

態様4.態様1の融合タンパク質であって、napDNAbpがCas9タンパク質またはそのバリアントである。 Embodiment 4. The fusion protein of embodiment 1, wherein napDNAbp is a Cas9 protein or a variant thereof.

態様5.態様1の融合タンパク質であって、napDNAbpがヌクレアーゼ活性Cas9、ヌクレアーゼ不活性型Cas9(dCas9)、またはCas9ニッカーゼ(nCas9)である。 Embodiment 5. The fusion protein of embodiment 1, wherein napDNAbp is a nuclease-active Cas9, a nuclease-inactive Cas9 (dCas9), or a Cas9 nickase (nCas9).

態様6.態様1の融合タンパク質であって、napDNAbpがCas9ニッカーゼ(nCas9)である。 Embodiment 6. The fusion protein of embodiment 1, wherein the napDNAbp is Cas9 nickase (nCas9).

態様7.態様1の融合タンパク質であって、napDNAbpが:Cas9、CasX、CasY、Cpf1、C2c1、C2c2、C2C3、およびアルゴノートからなる群から選択され、任意にニッカーゼ活性を有する。 Embodiment 7. The fusion protein of embodiment 1, wherein napDNAbp is selected from the group consisting of: Cas9, CasX, CasY, Cpf1, C2c1, C2c2, C2C3, and Argonaute, and optionally has nickase activity.

態様8.態様1の融合タンパク質であって、融合タンパク質が伸長されたガイドRNAと複合体化したときに標的DNA配列に結合することができる。 Embodiment 8. The fusion protein of embodiment 1, wherein the fusion protein is capable of binding to a target DNA sequence when complexed with an extended guide RNA.

態様9.態様8の融合タンパク質であって、標的DNA配列が標的鎖および相補的な非標的鎖を含む。 Embodiment 9. The fusion protein of embodiment 8, wherein the target DNA sequence comprises a target strand and a complementary non-target strand.

態様10.態様8の融合タンパク質であって、伸長されたガイドRNAと複合体化した融合タンパク質の結合がRループを形成する。 Embodiment 10. The fusion protein of embodiment 8, wherein binding of the fusion protein complexed with the extended guide RNA forms an R-loop.

態様11.態様10の融合タンパク質であって、Rループが、(i)伸長されたガイドRNAと標的鎖とを含むRNA-DNAハイブリッドおよび(ii)相補的な非標的鎖を含む。 Embodiment 11. The fusion protein of embodiment 10, wherein the R-loop comprises (i) an RNA-DNA hybrid comprising an extended guide RNA and a target strand, and (ii) a complementary non-target strand.

態様12.態様11の融合タンパク質であって、相補的な非標的鎖がニッキングされて、遊離の3’端を有する逆転写酵素プライム配列を形成する。 Embodiment 12. The fusion protein of embodiment 11, wherein the complementary non-target strand is nicked to form a reverse transcriptase prime sequence having a free 3' end.

態様13.態様2の融合タンパク質であって、伸長されたガイドRNAが、(a)ガイドRNA、および(b)ガイドRNAの5'もしくは3’端またはガイドRNAの分子内の位置付けにおけるRNA伸長を含む。 Embodiment 13. The fusion protein of embodiment 2, wherein the extended guide RNA comprises (a) a guide RNA and (b) an RNA extension at the 5' or 3' end of the guide RNA or at an intramolecular location of the guide RNA.

態様14.態様13の融合タンパク質であって、RNA伸長が、(i)所望のヌクレオチド変化を含む逆転写鋳型配列、(ii)逆転写プライマー結合部位、および(iii)任意にリンカー配列を含む。 Embodiment 14. The fusion protein of embodiment 13, wherein the RNA extension comprises (i) a reverse transcription template sequence containing a desired nucleotide change, (ii) a reverse transcription primer binding site, and (iii) optionally a linker sequence.

態様15.態様14の融合タンパク質であって、逆転写鋳型配列が、ニック部位に隣接する内生DNA配列に対して相補的である一本鎖DNAフラップをコードし、一本鎖DNAフラップが所望のヌクレオチド変化を含む。 Embodiment 15. The fusion protein of embodiment 14, wherein the reverse transcription template sequence encodes a single-stranded DNA flap that is complementary to the endogenous DNA sequence adjacent to the nick site, and the single-stranded DNA flap contains the desired nucleotide change.

態様16.態様13の融合タンパク質であって、RNA伸長が、長さが少なくとも5ヌクレオチド、少なくとも6ヌクレオチド、少なくとも7ヌクレオチド、少なくとも8ヌクレオチド、少なくとも9ヌクレオチド、少なくとも10ヌクレオチド、少なくとも11ヌクレオチド、少なくとも12ヌクレオチド、少なくとも13ヌクレオチド、少なくとも14ヌクレオチド、少なくとも15ヌクレオチド、少なくとも16ヌクレオチド、少なくとも17ヌクレオチド、少なくとも18ヌクレオチド、少なくとも19ヌクレオチド、少なくとも20ヌクレオチド、少なくとも21ヌクレオチド、少なくとも22ヌクレオチド、少なくとも23ヌクレオチド、少なくとも24ヌクレオチド、または少なくとも25ヌクレオチドである。 Embodiment 16. The fusion protein of embodiment 13, wherein the RNA extension is at least 5 nucleotides, at least 6 nucleotides, at least 7 nucleotides, at least 8 nucleotides, at least 9 nucleotides, at least 10 nucleotides, at least 11 nucleotides, at least 12 nucleotides, at least 13 nucleotides, at least 14 nucleotides, at least 15 nucleotides, at least 16 nucleotides, at least 17 nucleotides, at least 18 nucleotides, at least 19 nucleotides, at least 20 nucleotides, at least 21 nucleotides, at least 22 nucleotides, at least 23 nucleotides, at least 24 nucleotides, or at least 25 nucleotides in length.

態様17.態様15の融合タンパク質であって、一本鎖DNAフラップが、ニック部位に隣接する内生DNA配列にハイブリダイズし、それによって所望のヌクレオチド変化を組み入れる。 Embodiment 17. The fusion protein of embodiment 15, wherein the single-stranded DNA flap hybridizes to the endogenous DNA sequence adjacent to the nick site, thereby incorporating the desired nucleotide change.

態様18.態様15の融合タンパク質であって、一本鎖DNAフラップが、遊離の5'端を有しかつニック部位に隣接する内生DNA配列に取って代わる。 Embodiment 18. The fusion protein of embodiment 15, wherein the single-stranded DNA flap has a free 5' end and replaces the endogenous DNA sequence adjacent to the nick site.

態様19.態様18の融合タンパク質であって、5'端を有する内生DNA配列が細胞によって切除される。 Aspect 19. The fusion protein of aspect 18, wherein the endogenous DNA sequence having the 5' end is excised by the cell.

態様20.態様18の融合タンパク質であって、一本鎖DNAフラップの細胞性修復が所望のヌクレオチド変化の組み入れをもたらし、それによって所望の産物を形成する。 Embodiment 20. The fusion protein of embodiment 18, wherein cellular repair of the single-stranded DNA flap results in incorporation of a desired nucleotide change, thereby forming a desired product.

態様21.態様14の融合タンパク質であって、所望のヌクレオチド変化がPAM配列の約-4から+10の間もしくはPAM配列の約-10から+20の間もしくはPAM配列の約-20から+40の間もしくはPAM配列の約-30から+100の間である編集窓上に組み入れされるか、または所望のヌクレオチド変化がニック部位の少なくとも1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、もしくは100ヌクレオチド下流に組み入れされる。 21. The fusion protein of embodiment 14, wherein the desired nucleotide change is incorporated into an editing window that is between about -4 and +10 of the PAM sequence, or between about -10 and +20 of the PAM sequence, or between about -20 and +40 of the PAM sequence, or between about -30 and +100 of the PAM sequence, or the desired nucleotide change is incorporated into at least 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30 of the nick site. , 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99, or 100 nucleotides downstream.

態様22.態様1の融合タンパク質であって、napDNAbpが、配列番号18のアミノ酸配列、または配列番号18のアミノ酸配列と少なくとも80%、85%、90%、95%、98%、もしくは99%同一であるアミノ酸配列を含む。 Embodiment 22. The fusion protein of embodiment 1, wherein napDNAbp comprises an amino acid sequence of SEQ ID NO:18 or an amino acid sequence that is at least 80%, 85%, 90%, 95%, 98%, or 99% identical to the amino acid sequence of SEQ ID NO:18.

態様23.態様1の融合タンパク質であって、napDNAbpが、配列番号18-88、126、130、137、141、147、153、157、445、460、467、および482-487のいずれか1つのアミノ酸配列と少なくとも80%、85%、90%、95%、98%、または99%同一であるアミノ酸配列を含む。 Embodiment 23. The fusion protein of embodiment 1, wherein napDNAbp comprises an amino acid sequence that is at least 80%, 85%, 90%, 95%, 98%, or 99% identical to any one of the amino acid sequences of SEQ ID NOs: 18-88, 126, 130, 137, 141, 147, 153, 157, 445, 460, 467, and 482-487.

様1の融合タンパク質であって、逆転写酵素が配列番号89のアミノ酸配列のいずれか1つを含む。 The fusion protein of embodiment 1, wherein the reverse transcriptase comprises any one of the amino acid sequences in SEQ ID NO:89.

態様24.態様1の融合タンパク質であって、逆転写酵素が、配列番号89~100、105~122、128~129、132、139、143、149、154、159、235、454、471、516、662、700、701~716、739~741、および766のアミノ酸配列のいずれか1つを含む。 Embodiment 24. The fusion protein of embodiment 1, wherein the reverse transcriptase comprises any one of the amino acid sequences of SEQ ID NOs: 89-100, 105-122, 128-129, 132, 139, 143, 149, 154, 159, 235, 454, 471, 516, 662, 700, 701-716, 739-741, and 766.

様1の融合タンパク質であって、逆転写酵素が、配列番号89のいずれか1つのアミノ酸配列と少なくとも80%、85%、90%、95%、98%、または99%同一であるアミノ酸配列を含む。 The fusion protein of embodiment 1, wherein the reverse transcriptase comprises an amino acid sequence that is at least 80%, 85%, 90%, 95%, 98%, or 99% identical to the amino acid sequence of any one of SEQ ID NO:89.

態様25.態様1の融合タンパク質であって、逆転写酵素が、配列番号89~100、105~122、128~129、132、139、143、149、154、159、235、454、471、516、662、700、701~716、739~741、および766のいずれか1つのアミノ酸配列と少なくとも80%、85%、90%、95%、98%、または99%同一であるアミノ酸配列を含む。 Embodiment 25. The fusion protein of embodiment 1, wherein the reverse transcriptase comprises an amino acid sequence that is at least 80%, 85%, 90%, 95%, 98%, or 99% identical to any one of the amino acid sequences of SEQ ID NOs: 89-100, 105-122, 128-129, 132, 139, 143, 149, 154, 159, 235, 454, 471, 516, 662, 700, 701-716, 739-741, and 766.

態様26.態様1の融合タンパク質であって、逆転写酵素がレトロウイルスまたはレトロトランスポゾンからの天然に存在する逆転写酵素である。 Embodiment 26. The fusion protein of embodiment 1, wherein the reverse transcriptase is a naturally occurring reverse transcriptase from a retrovirus or retrotransposon.

態様27.先の態様のいずれか1つの融合タンパク質であって、融合タンパク質が構造NH2-[napDNAbp]-[逆転写酵素]-COOH;またはNH2-[逆転写酵素]-[napDNAbp]-COOHを含み、「]-[」の夫々のものが任意のリンカー配列の存在を指示する。 Embodiment 27. The fusion protein of any one of the preceding embodiments, wherein the fusion protein comprises the structure NH2-[napDNAbp]-[reverse transcriptase]-COOH; or NH2-[reverse transcriptase]-[napDNAbp]-COOH, each of the "]-[" indicates the presence of an optional linker sequence.

態様28.態様27の融合タンパク質であって、リンカー配列が配列番号127、165-176、446、453、および767-769のアミノ酸配列を含む。 Aspect 28. The fusion protein of aspect 27, wherein the linker sequence comprises the amino acid sequence of SEQ ID NOs: 127, 165-176, 446, 453, and 767-769.

態様29.態様14の融合タンパク質であって、所望のヌクレオチド変化が1ヌクレオチド変化、1つ以上のヌクレオチドの挿入、または1つ以上のヌクレオチドの欠失である。 Embodiment 29. The fusion protein of embodiment 14, wherein the desired nucleotide change is a single nucleotide change, an insertion of one or more nucleotides, or a deletion of one or more nucleotides.

態様30.態様29の融合タンパク質であって、挿入または欠失が、少なくとも1、少なくとも2、少なくとも3、少なくとも4、少なくとも5、少なくとも6、少なくとも7、少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも16、少なくとも17、少なくとも18、少なくとも19、少なくとも20、少なくとも21、少なくとも22、少なくとも23、少なくとも24、少なくとも25、少なくとも26、少なくとも27、少なくとも28、少なくとも29、少なくとも30、少なくとも31、少なくとも32、少なくとも33、少なくとも34、少なくとも35、少なくとも36、少なくとも37、少なくとも38、少なくとも39、少なくとも40、少なくとも41、少なくとも42、少なくとも43、少なくとも44、少なくとも45、少なくとも46、少なくとも47、少なくとも48、少なくとも49、または少なくとも50である。 Embodiment 30. The fusion protein of embodiment 29, wherein the insertion or deletion is at least 1, at least 2, at least 3, at least 4, at least 5, at least 6, at least 7, at least 8, at least 9, at least 10, at least 11, at least 12, at least 13, at least 14, at least 15, at least 16, at least 17, at least 18, at least 19, at least 20, at least 21, at least 22, at least 23, at least 24, at least 25, at least 26, at least 27, at least 28, at least 29, at least 30, at least 31, at least 32, at least 33, at least 34, at least 35, at least 36, at least 37, at least 38, at least 39, at least 40, at least 41, at least 42, at least 43, at least 44, at least 45, at least 46, at least 47, at least 48, at least 49, or at least 50.

態様31.ガイドRNAと少なくとも1つのRNA伸長とを含む伸長されたガイドRNA。 Embodiment 31. An extended guide RNA comprising a guide RNA and at least one RNA extension.

態様32.態様1の伸長されたガイドRNAであって、RNA伸長が、ガイドRNAの3'もしくは5'端またはガイドRNAの分子内の位置の位置である。 Embodiment 32. The extended guide RNA of embodiment 1, wherein the RNA extension is at the 3' or 5' end of the guide RNA or at an intramolecular position of the guide RNA.

態様33.態様31の伸長されたガイドRNAであって、伸長されたガイドRNAが、napDNAbpに結合することおよびnapDNAbpを標的DNA配列へと導くことができる。 Embodiment 33. The extended guide RNA of embodiment 31, wherein the extended guide RNA is capable of binding to the napDNAbp and guiding the napDNAbp to a target DNA sequence.

態様34.態様33の伸長されたガイドRNAであって、標的DNA配列が標的鎖および相補的な非標的鎖を含み、ガイドRNAが標的鎖にハイブリダイズして、RNA-DNAハイブリッドおよびRループを形成する。 Embodiment 34. The extended guide RNA of embodiment 33, wherein the target DNA sequence comprises a target strand and a complementary non-target strand, and the guide RNA hybridizes to the target strand to form an RNA-DNA hybrid and an R-loop.

態様35.態様31の伸長されたガイドRNAであって、少なくとも1つのRNA伸長が、(i)逆転写鋳型配列、(ii)逆転写プライマー結合部位、および(iii)任意にリンカー配列を含む。 Embodiment 35. The extended guide RNA of embodiment 31, wherein at least one RNA extension comprises (i) a reverse transcription template sequence, (ii) a reverse transcription primer binding site, and (iii) optionally a linker sequence.

態様36.態様35の伸長されたガイドRNAであって、RNA伸長が、長さが少なくとも5ヌクレオチド、少なくとも6ヌクレオチド、少なくとも7ヌクレオチド、少なくとも8ヌクレオチド、少なくとも9ヌクレオチド、少なくとも10ヌクレオチド、少なくとも11ヌクレオチド、少なくとも12ヌクレオチド、少なくとも13ヌクレオチド、少なくとも14ヌクレオチド、少なくとも15ヌクレオチド、少なくとも16ヌクレオチド、少なくとも17ヌクレオチド、少なくとも18ヌクレオチド、少なくとも19ヌクレオチド、少なくとも20ヌクレオチド、少なくとも21ヌクレオチド、少なくとも22ヌクレオチド、少なくとも23ヌクレオチド、少なくとも24ヌクレオチド、または少なくとも25ヌクレオチドである。 Embodiment 36. The extended guide RNA of embodiment 35, wherein the RNA extension is at least 5 nucleotides, at least 6 nucleotides, at least 7 nucleotides, at least 8 nucleotides, at least 9 nucleotides, at least 10 nucleotides, at least 11 nucleotides, at least 12 nucleotides, at least 13 nucleotides, at least 14 nucleotides, at least 15 nucleotides, at least 16 nucleotides, at least 17 nucleotides, at least 18 nucleotides, at least 19 nucleotides, at least 20 nucleotides, at least 21 nucleotides, at least 22 nucleotides, at least 23 nucleotides, at least 24 nucleotides, or at least 25 nucleotides in length.

態様37.態様35の伸長されたガイドRNAであって、逆転写鋳型配列が、長さが少なくとも3ヌクレオチド、少なくとも4ヌクレオチド、少なくとも5ヌクレオチド、少なくとも6ヌクレオチド、少なくとも7ヌクレオチド、少なくとも8ヌクレオチド、少なくとも9ヌクレオチド、少なくとも10ヌクレオチド、少なくとも11ヌクレオチド、少なくとも12ヌクレオチド、少なくとも13ヌクレオチド、少なくとも14ヌクレオチド、または少なくとも15ヌクレオチドである。 Embodiment 37. The extended guide RNA of embodiment 35, wherein the reverse transcription template sequence is at least 3 nucleotides, at least 4 nucleotides, at least 5 nucleotides, at least 6 nucleotides, at least 7 nucleotides, at least 8 nucleotides, at least 9 nucleotides, at least 10 nucleotides, at least 11 nucleotides, at least 12 nucleotides, at least 13 nucleotides, at least 14 nucleotides, or at least 15 nucleotides in length.

態様38.態様35の伸長されたガイドRNAであって、逆転写プライマー結合部位配列が、長さが少なくとも3ヌクレオチド、少なくとも4ヌクレオチド、少なくとも5ヌクレオチド、少なくとも6ヌクレオチド、少なくとも7ヌクレオチド、少なくとも8ヌクレオチド、少なくとも9ヌクレオチド、少なくとも10ヌクレオチド、少なくとも11ヌクレオチド、少なくとも12ヌクレオチド、少なくとも13ヌクレオチド、少なくとも14ヌクレオチド、または少なくとも15ヌクレオチドである。 Embodiment 38. The extended guide RNA of embodiment 35, wherein the reverse transcription primer binding site sequence is at least 3 nucleotides, at least 4 nucleotides, at least 5 nucleotides, at least 6 nucleotides, at least 7 nucleotides, at least 8 nucleotides, at least 9 nucleotides, at least 10 nucleotides, at least 11 nucleotides, at least 12 nucleotides, at least 13 nucleotides, at least 14 nucleotides, or at least 15 nucleotides in length.

態様39.態様35の伸長されたガイドRNAであって、任意のリンカー配列が、長さが少なくとも3ヌクレオチド、少なくとも4ヌクレオチド、少なくとも5ヌクレオチド、少なくとも6ヌクレオチド、少なくとも7ヌクレオチド、少なくとも8ヌクレオチド、少なくとも9ヌクレオチド、少なくとも10ヌクレオチド、少なくとも11ヌクレオチド、少なくとも12ヌクレオチド、少なくとも13ヌクレオチド、少なくとも14ヌクレオチド、または少なくとも15ヌクレオチドである。 Embodiment 39. The extended guide RNA of embodiment 35, wherein the optional linker sequence is at least 3 nucleotides, at least 4 nucleotides, at least 5 nucleotides, at least 6 nucleotides, at least 7 nucleotides, at least 8 nucleotides, at least 9 nucleotides, at least 10 nucleotides, at least 11 nucleotides, at least 12 nucleotides, at least 13 nucleotides, at least 14 nucleotides, or at least 15 nucleotides in length.

態様40.態様35の伸長されたガイドRNAであって、逆転写鋳型配列が、ニック部位に隣接する内生DNA配列に対して相補的である一本鎖DNAフラップをコードし、一本鎖DNAフラップが所望のヌクレオチド変化を含む。 Embodiment 40. The extended guide RNA of embodiment 35, wherein the reverse transcription template sequence encodes a single-stranded DNA flap that is complementary to the endogenous DNA sequence adjacent to the nick site, and the single-stranded DNA flap includes a desired nucleotide change.

態様41.態様40の伸長されたガイドRNAであって、一本鎖DNAフラップが、ニッキングされた標的DNA配列上の5'端を有する内生一本鎖DNAを押し除け、内生一本鎖DNAがニック部位の下流において直ちに隣接する。 Embodiment 41. The extended guide RNA of embodiment 40, wherein the single-stranded DNA flap displaces the endogenous single-stranded DNA having a 5' end on the nicked target DNA sequence, and the endogenous single-stranded DNA is immediately adjacent to and downstream of the nick site.

態様42.態様41の伸長されたガイドRNAであって、遊離の5'端を有する内生一本鎖DNAが細胞によって切除される。 Aspect 42. The extended guide RNA of aspect 41, wherein the endogenous single-stranded DNA having a free 5' end is excised by the cell.

態様43.態様41の伸長されたガイドRNAであって、一本鎖DNAフラップの細胞性修復が所望のヌクレオチド変化の組み入れをもたらし、それによって所望の産物を形成する。 Embodiment 43. The extended guide RNA of embodiment 41, wherein cellular repair of the single-stranded DNA flap results in incorporation of the desired nucleotide change, thereby forming the desired product.

態様44.態様31の伸長されたガイドRNAであって、配列番号394、429~442、641~649、678~692、2997~3103、3113~3121、3305~3455、3479~3493、3522~3556、3628~3698、および3755~3810のヌクレオチド配列、または配列番号394、429~442、641~649、678~692、2997~3103、3113~3121、3305~3455、3479~3493、3522~3556、3628~3698、および3755~3810のいずれか1つとの少なくとも85%もしくは少なくとも90%もしくは少なくとも95%もしくは少なくとも98%もしくは少なくとも99%配列同一性を有するヌクレオチド配列を含む。 Aspect 44. 32. The extended guide RNA of embodiment 31, comprising a nucleotide sequence of SEQ ID NOs : 394, 429-442, 641-649, 678-692, 2997-3103, 3113-3121, 3305-3455, 3479-3493, 3522-3556, 3628-3698, and 3755-3810, or a nucleotide sequence that has at least 85% or at least 90% or at least 95% or at least 98% or at least 99% sequence identity to any one of SEQ ID NOs: 394, 429-442, 641-649, 678-692, 2997-3103, 3113-3121, 3305-3455, 3479-3493, 3522-3556, 3628-3698, and 3755-3810.

態様45.態様35の伸長されたガイドRNAであって、逆転写鋳型配列が、内生DNA標的と少なくとも80%または85%または90%または95%または99%同一であるヌクレオチド配列を含む。 Embodiment 45. The extended guide RNA of embodiment 35, wherein the reverse transcription template sequence comprises a nucleotide sequence that is at least 80%, 85%, 90%, 95%, or 99% identical to the endogenous DNA target.

態様46.態様35の伸長されたガイドRNAであって、逆転写プライマー結合部位が、カットされたDNAの遊離の3’端とハイブリダイズする。 Embodiment 46. The extended guide RNA of embodiment 35, wherein the reverse transcription primer binding site hybridizes to the free 3' end of the cut DNA.

態様47.態様35の伸長されたガイドRNAであって、任意のリンカー配列が、長さが少なくとも1ヌクレオチド、または少なくとも2、少なくとも3、少なくとも4、少なくとも5、少なくとも6、少なくとも7、少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、または少なくとも15ヌクレオチドである。 Embodiment 47. The extended guide RNA of embodiment 35, wherein the optional linker sequence is at least 1 nucleotide, or at least 2, at least 3, at least 4, at least 5, at least 6, at least 7, at least 8, at least 9, at least 10, at least 11, at least 12, at least 13, at least 14, or at least 15 nucleotides in length.

態様48.態様1-30のいずれか1つの融合タンパク質と伸長されたガイドRNAとを含むことを含む複合体。 Aspect 48. A complex comprising a fusion protein of any one of aspects 1-30 and an extended guide RNA.

態様49.態様48の複合体であって、伸長されたガイドRNAが、ガイドRNAと、ガイドRNAの3'もしくは5'端またはガイドRNAの分子内の位置におけるRNA伸長とを含む。 Embodiment 49. The complex of embodiment 48, wherein the extended guide RNA comprises a guide RNA and an RNA extension at the 3' or 5' end of the guide RNA or at an intramolecular position of the guide RNA.

態様50.態様48の複合体であって、伸長されたガイドRNAが、napDNAbpに結合することおよびnapDNAbpを標的DNA配列へと導くことができる。 Embodiment 50. The complex of embodiment 48, wherein the extended guide RNA is capable of binding to the napDNAbp and guiding the napDNAbp to a target DNA sequence.

態様51.態様50の複合体であって、標的DNA配列が標的鎖および相補的な非標的鎖を含み、ガイドRNAが標的鎖にハイブリダイズして、RNA-DNAハイブリッドおよびRループを形成する。 Embodiment 51. The complex of embodiment 50, wherein the target DNA sequence comprises a target strand and a complementary non-target strand, and the guide RNA hybridizes to the target strand to form an RNA-DNA hybrid and an R-loop.

態様52.態様49の複合体であって、少なくとも1つのRNA伸長が、(i)逆転写鋳型配列、(ii)逆転写プライマー結合部位、および(iii)任意にリンカー配列を含む。 Embodiment 52. The complex of embodiment 49, wherein at least one RNA extension comprises (i) a reverse transcription template sequence, (ii) a reverse transcription primer binding site, and (iii) optionally a linker sequence.

態様53.態様48の複合体であって、伸長されたガイドRNAが、配列番号394、429~442、641~649、678~692、2997~3103、3113~3121、3305~3455、3479~3493、3522~3556、3628~3698、および3755~3810のヌクレオチド配列、または配列番号394、429~442、641~649、678~692、2997~3103、3113~3121、3305~3455、3479~3493、3522~3556、3628~3698、および3755~3810のいずれか1つとの少なくとも85%もしくは少なくとも90%もしくは少なくとも95%もしくは少なくとも98%もしくは少なくとも99%配列同一性を有するヌクレオチド配列を含む。 Embodiment 53. The complex of embodiment 48, wherein the extended guide RNA comprises a nucleotide sequence selected from the group consisting of SEQ ID NOs: 394, 429-442, 641-649, 678-692, 2997-3103, 3113-3121, 3305-3455, 3479-3493, 3522-3556, 3628-3698, and 3755-3810, or SEQ ID NOs: 394, 429-442, 641-649, The nucleotide sequence has at least 85%, at least 90%, at least 95%, at least 98%, or at least 99% sequence identity with any one of 678-692, 2997-3103, 3113-3121, 3305-3455, 3479-3493, 3522-3556, 3628-3698, and 3755-3810.

態様54.態様52の複合体であって、逆転写鋳型配列が、内生DNA標的との少なくとも80%または85%または90%または95%または99%配列同一性を有するヌクレオチド配列を含む。 Embodiment 54. The complex of embodiment 52, wherein the reverse transcription template sequence comprises a nucleotide sequence having at least 80%, 85%, 90%, 95%, or 99% sequence identity with the endogenous DNA target.

態様55.態様52の複合体であって、逆転写プライマー結合部位が、カットされたDNAの遊離の3'端とハイブリダイズする。 Embodiment 55. The complex of embodiment 52, wherein the reverse transcription primer binding site hybridizes to the free 3' end of the cut DNA.

態様56.napDNAbpおよび伸長されたガイドRNAを含むことを含む複合体。 Embodiment 56. A complex comprising napDNAbp and an extended guide RNA.

態様57.態様56の複合体であって、napDNAbpがCas9ニッカーゼである。 Aspect 57. The complex of aspect 56, wherein napDNAbp is a Cas9 nickase.

態様58.態様56の複合体であって、napDNAbpが、配列番号18のアミノ酸配列、または配列番号18との少なくとも80%、85%、90%、95%、98%、もしくは99%配列同一性を有するアミノ酸配列を含む。 Aspect 58. The complex of aspect 56, wherein napDNAbp comprises an amino acid sequence of SEQ ID NO:18 or an amino acid sequence having at least 80%, 85%, 90%, 95%, 98%, or 99% sequence identity to SEQ ID NO:18.

態様59.態様57の複合体であって、napDNAbpが、配列番号18~88、126、130、137、141、147、153、157、445、460、467、および482~487のいずれか1つのアミノ酸配列との少なくとも80%、85%、90%、95%、98%、または99%配列同一性を有するアミノ酸配列を含む。 Embodiment 59. The complex of embodiment 57, wherein napDNAbp comprises an amino acid sequence having at least 80%, 85%, 90%, 95%, 98%, or 99% sequence identity to any one of the amino acid sequences of SEQ ID NOs: 18-88, 126, 130, 137, 141, 147, 153, 157, 445, 460, 467, and 482-487.

態様60.態様57の複合体であって、伸長されたガイドRNAが、ガイドRNAと、ガイドRNAの3'もしくは5'端またはガイドRNAの分子内の位置におけるRNA伸長とを含む。 Embodiment 60. The complex of embodiment 57, wherein the extended guide RNA comprises a guide RNA and an RNA extension at the 3' or 5' end of the guide RNA or at an intramolecular position of the guide RNA.

態様61.態様57の複合体であって、伸長されたガイドRNAがnapDNAbpを標的DNA配列へと導くことができる。 Embodiment 61. The complex of embodiment 57, wherein the extended guide RNA is capable of directing the napDNAbp to a target DNA sequence.

態様62.態様61の複合体であって、標的DNA配列が標的鎖および相補的な非標的鎖を含み、スペーサー配列が標的鎖にハイブリダイズして、RNA-DNAハイブリッドおよびRループを形成する。 Embodiment 62. The complex of embodiment 61, wherein the target DNA sequence comprises a target strand and a complementary non-target strand, and the spacer sequence hybridizes to the target strand to form an RNA-DNA hybrid and an R-loop.

態様63.態様61の複合体であって、RNA伸長が、(i)逆転写鋳型配列、(ii)逆転写プライマー結合部位、および(iii)任意にリンカー配列を含む。 Embodiment 63. The complex of embodiment 61, wherein the RNA extension comprises (i) a reverse transcription template sequence, (ii) a reverse transcription primer binding site, and (iii) optionally a linker sequence.

態様64.態様57の複合体であって、伸長されたガイドRNAが、配列番号394、429~442、641~649、678~692、2997~3103、3113~3121、3305~3455、3479~3493、3522~3556、3628~3698、および3755~3810のヌクレオチド配列、または配列番号394、429~442、641~649、678~692、2997~3103、3113~3121、3305~3455、3479~3493、3522~3556、3628~3698、および3755~3810のいずれか1つとの少なくとも85%もしくは少なくとも90%もしくは少なくとも95%もしくは少なくとも98%もしくは少なくとも99%配列同一性を有するヌクレオチド配列を含む。 Embodiment 64. The complex of embodiment 57, wherein the extended guide RNA comprises a nucleotide sequence selected from the group consisting of SEQ ID NOs: 394, 429-442, 641-649, 678-692, 2997-3103, 3113-3121, 3305-3455, 3479-3493, 3522-3556, 3628-3698, and 3755-3810, or SEQ ID NOs: 394, 429-442, 641-649, The nucleotide sequence has at least 85%, at least 90%, at least 95%, at least 98%, or at least 99% sequence identity with any one of 678-692, 2997-3103, 3113-3121, 3305-3455, 3479-3493, 3522-3556, 3628-3698, and 3755-3810.

態様65.態様63の複合体であって、逆転写鋳型配列が、内生DNA標的と少なくとも80%または85%または90%または95%または99%同一であるヌクレオチド配列を含む。 Embodiment 65. The complex of embodiment 63, wherein the reverse transcription template sequence comprises a nucleotide sequence that is at least 80%, 85%, 90%, 95%, or 99% identical to the endogenous DNA target.

態様66.態様63の複合体であって、逆転写プライマー結合部位が、カットされたDNAの遊離の3'端とハイブリダイズする。 Embodiment 66. The complex of embodiment 63, wherein the reverse transcription primer binding site hybridizes to the free 3' end of the cut DNA.

態様67.態様63の複合体であって、任意のリンカー配列が、長さが少なくとも1ヌクレオチド、または少なくとも2、少なくとも3、少なくとも4、少なくとも5、少なくとも6、少なくとも7、少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、または少なくとも15ヌクレオチドである。 Embodiment 67. The conjugate of embodiment 63, wherein the optional linker sequence is at least 1 nucleotide, or at least 2, at least 3, at least 4, at least 5, at least 6, at least 7, at least 8, at least 9, at least 10, at least 11, at least 12, at least 13, at least 14, or at least 15 nucleotides in length.

態様68.態様1~30のいずれかの融合タンパク質をコードするポリヌクレオチド。 Aspect 68. A polynucleotide encoding a fusion protein according to any one of aspects 1 to 30.

態様69.態様68のポリヌクレオチドを含むベクター。 Aspect 69. A vector comprising the polynucleotide of aspect 68.

態様70.態様1~30のいずれかの融合タンパク質と融合タンパク質のnapDNAbpに結合した伸長されたガイドRNAとを含む細胞。 Embodiment 70. A cell comprising the fusion protein of any one of embodiments 1 to 30 and an extended guide RNA bound to the napDNAbp of the fusion protein.

態様71.態様48~67のいずれか1つの複合体を含む細胞。 Aspect 71. A cell comprising a complex according to any one of aspects 48 to 67.

態様72.医薬組成物であって:(i)態様1~30のいずれかの融合タンパク質、態様48~67の複合体、態様68のポリヌクレオチド、または態様69のベクターと;(ii)薬学的に許容される賦形剤とを含む。 Aspect 72. A pharmaceutical composition comprising: (i) a fusion protein of any one of aspects 1 to 30, a complex of aspects 48 to 67, a polynucleotide of aspect 68, or a vector of aspect 69; and (ii) a pharma- ceutically acceptable excipient.

態様73.医薬組成物であって:(i)態様48~67の複合体、(ii)トランスで提供される逆転写酵素;および(iii)薬学的に許容される賦形剤を含む。 Embodiment 73. A pharmaceutical composition comprising: (i) a conjugate of any one of embodiments 48 to 67; (ii) a reverse transcriptase provided in trans; and (iii) a pharma- ceutically acceptable excipient.

態様74.キットであって:(i)態様1~30のいずれか1つの融合タンパク質をコードする核酸配列;および(ii)(i)の配列の発現を駆動するプロモーターを含む核酸構築物を含む。 Embodiment 74. A kit comprising: (i) a nucleic acid sequence encoding a fusion protein of any one of embodiments 1 to 30; and (ii) a nucleic acid construct comprising a promoter driving expression of the sequence of (i).

態様75.所望のヌクレオチド変化を二本鎖DNA配列に組み入れるための方法であって、方法が: Embodiment 75. A method for incorporating a desired nucleotide change into a double-stranded DNA sequence, the method comprising:

(i)融合タンパク質および伸長されたガイドRNAを含む複合体と二本鎖DNA配列を接触させ、融合タンパク質がnapDNAbpおよび逆転写酵素を含み、伸長されたガイドRNAが所望のヌクレオチド変化を含む逆転写鋳型配列を含むこと; (i) contacting a double-stranded DNA sequence with a complex comprising a fusion protein and an extended guide RNA, the fusion protein comprising napDNAbp and a reverse transcriptase, and the extended guide RNA comprising a reverse transcription template sequence comprising the desired nucleotide change;

(ii)非標的鎖上において二本鎖DNA配列にニッキングし、それによって3’端を有する遊離の一本鎖DNAを生成すること; (ii) nicking a double-stranded DNA sequence on the non-target strand, thereby generating a free single-stranded DNA having a 3' end;

(iii)遊離の一本鎖DNAの3'端を逆転写鋳型配列にハイブリダイズさせ、それによって逆転写酵素ドメインをプライムすること; (iii) hybridizing the 3' end of the free single-stranded DNA to the reverse transcription template sequence, thereby priming the reverse transcriptase domain;

(iv)3'端からDNAの鎖を重合し、それによって所望のヌクレオチド変化を含む一本鎖DNAフラップを生成すること; (iv) polymerizing a strand of DNA from the 3' end, thereby generating a single-stranded DNA flap containing the desired nucleotide change;

(v)カットされた部位に隣接する内生DNA鎖を一本鎖DNAフラップによって置き換え、それによって所望のヌクレオチド変化を二本鎖DNA配列に組み入れること、
を含む。
(v) replacing the endogenous DNA strand adjacent to the cut site with a single-stranded DNA flap, thereby incorporating the desired nucleotide change into the double-stranded DNA sequence;
including.

態様76.態様75の方法であって、(v)置き換えるステップが:(i)一本鎖DNAフラップをカットされた部位に隣接する内生DNA鎖にハイブリダイズさせて、配列ミスマッチを生出すること;(ii)内生DNA鎖を切り出すこと;および(iii)ミスマッチを修復して、所望のヌクレオチド変化をDNAの両方の鎖に含む所望の産物を形成すること、を含む。 Embodiment 76. The method of embodiment 75, wherein (v) the replacing step comprises: (i) hybridizing a single-stranded DNA flap to the endogenous DNA strand adjacent to the cut site to generate a sequence mismatch; (ii) excising the endogenous DNA strand; and (iii) repairing the mismatch to form a desired product containing the desired nucleotide change in both strands of DNA.

態様77.態様76の方法であって、所望のヌクレオチド変化が1ヌクレオチド置換、欠失、または挿入である。 Embodiment 77. The method of embodiment 76, wherein the desired nucleotide change is a single nucleotide substitution, deletion, or insertion.

態様78.態様77の方法であって、1ヌクレオチド置換がトランジションまたはトランスバージョンである。 Embodiment 78. The method of embodiment 77, wherein the single nucleotide substitution is a transition or a transversion.

態様79.態様76の方法であって、所望のヌクレオチド変化が、(1)GからTの置換、(2)GからAの置換、(3)GからCの置換、(4)TからGの置換、(5)TからAの置換、(6)TからCの置換、(7)CからGの置換、(8)CからTの置換、(9)CからAの置換、(10)AからTの置換、(11)AからG置換、または(12)AからCの置換である。 Embodiment 79. The method of embodiment 76, wherein the desired nucleotide change is (1) a G to T substitution, (2) a G to A substitution, (3) a G to C substitution, (4) a T to G substitution, (5) a T to A substitution, (6) a T to C substitution, (7) a C to G substitution, (8) a C to T substitution, (9) a C to A substitution, (10) an A to T substitution, (11) an A to G substitution, or (12) an A to C substitution.

態様80.態様76の方法であって、所望のヌクレオチド(nucleoid)変化が、(1)G:C塩基対をT:A塩基対に、(2)G:C塩基対をA:T塩基対に、(3)G:C塩基対をC:G塩基対に、(4)T:A塩基対をG:C塩基対に、(5)T:A塩基対をA:T塩基対に、(6)T:A塩基対をC:G塩基対に、(7)C:G塩基対をG:C塩基対に、(8)C:G塩基対をT:A塩基対に、(9)C:G塩基対をA:T塩基対に、(10)A:T塩基対をT:A塩基対に、(11)A:T塩基対をG:C塩基対に、または(12)A:T塩基対をC:G塩基対に変換する。 Embodiment 80. The method of embodiment 76, wherein the desired nucleoid change is (1) a G:C base pair to a T:A base pair, (2) a G:C base pair to an A:T base pair, (3) a G:C base pair to a C:G base pair, (4) a T:A base pair to a G:C base pair, (5) a T:A base pair to an A:T base pair, (6) a T:A base pair to a C:G base pair, (7) a C:G base pair to a G:C base pair, (8) a C:G base pair to a T:A base pair, (9) a C:G base pair to an A:T base pair, (10) an A:T base pair to a T:A base pair, (11) an A:T base pair to a G:C base pair, or (12) a A:T base pair to a C:G base pair.

態様81.態様76の方法であって、所望のヌクレオチド変化が1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、または25ヌクレオチドの挿入または欠失である。 Embodiment 81. The method of embodiment 76, wherein the desired nucleotide change is an insertion or deletion of 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, or 25 nucleotides.

態様82.態様76の方法であって、所望のヌクレオチド変化が疾患関連遺伝子を修正する。 Embodiment 82. The method of embodiment 76, wherein the desired nucleotide change corrects a disease-associated gene.

態様83.態様82の方法であって、疾患関連遺伝子が:アデノシンデアミナーゼ(ADA)欠損症;アルファ-1アンチトリプシン欠損症;嚢胞性線維症;デュシェンヌ型筋ジストロフィー;ガラクトース血症;ヘモクロマトーシス;ハンチントン病;メープルシロップ尿症;マルファン症候群;1型神経線維腫症;先天性爪肥厚症;フェニルケトン尿症;重症複合免疫不全;鎌状赤血球症;スミス・レムリ・オピッツ症候群;およびテイ・サックス病からなる群から選択される単一遺伝子障害に関連する。 Embodiment 83. The method of embodiment 82, wherein the disease-associated gene is associated with a single-gene disorder selected from the group consisting of: adenosine deaminase (ADA) deficiency; alpha-1 antitrypsin deficiency; cystic fibrosis; Duchenne muscular dystrophy; galactosemia; hemochromatosis; Huntington's disease; maple syrup urine disease; Marfan syndrome; neurofibromatosis type 1; pachyonychia congenita; phenylketonuria; severe combined immunodeficiency; sickle cell disease; Smith-Lemli-Opitz syndrome; and Tay-Sachs disease.

態様84.態様82の方法であって、疾患関連遺伝子が:心臓病;高血圧;アルツハイマー病;関節炎;糖尿病;がん;および肥満からなる群から選択される多遺伝子性障害に関連する。 Embodiment 84. The method of embodiment 82, wherein the disease-associated gene is associated with a polygenic disorder selected from the group consisting of: heart disease; high blood pressure; Alzheimer's disease; arthritis; diabetes; cancer; and obesity.

態様85.態様76の方法であって、napDNAbpが、ヌクレアーゼ不活性型Cas9(dCas9)、Cas9ニッカーゼ(nCas9)、またはヌクレアーゼ活性Cas9である。 Embodiment 85. The method of embodiment 76, wherein the napDNAbp is a nuclease-inactive Cas9 (dCas9), a Cas9 nickase (nCas9), or a nuclease-active Cas9.

態様86.態様76の方法であって、napDNAbpが配列番号18のアミノ酸配列を含む。 Aspect 86. The method of aspect 76, wherein napDNAbp comprises the amino acid sequence of SEQ ID NO:18.

態様87.態様76の方法であって、napDNAbpが、配列番号18~88、126、130、137、141、147、153、157、445、460、467、および482~487のいずれか1つのアミノ酸配列との少なくとも80%、85%、90%、95%、98%、または99%配列同一性を有するアミノ酸配列を含む。 Embodiment 87. The method of embodiment 76, wherein the napDNAbp comprises an amino acid sequence having at least 80%, 85%, 90%, 95%, 98%, or 99% sequence identity to any one of the amino acid sequences of SEQ ID NOs: 18-88, 126, 130, 137, 141, 147, 153, 157, 445, 460, 467, and 482-487.

態様88.態様76の方法であって、逆転写酵素が、配列番号89~100、105~122、128~129、132、139、143、149、154、159、235、454、471、516、662、700、701~716、739~741、および766のアミノ酸配列のいずれか1つを含む。 Embodiment 88. The method of embodiment 76, wherein the reverse transcriptase comprises any one of the amino acid sequences of SEQ ID NOs: 89-100, 105-122, 128-129, 132, 139, 143, 149, 154, 159, 235, 454, 471, 516, 662, 700, 701-716, 739-741, and 766.

態様89.態様76の方法であって、逆転写酵素ドメインが、配列番号89~100、105~122、128~129、132、139、143、149、154、159、235、454、471、516、662、700、701~716、739~741、および766のいずれか1つのアミノ酸配列との少なくとも80%、85%、90%、95%、98%、または99%配列同一性を有するアミノ酸配列を含む。 Embodiment 89. The method of embodiment 76, wherein the reverse transcriptase domain comprises an amino acid sequence having at least 80%, 85%, 90%, 95%, 98%, or 99% sequence identity to any one of the amino acid sequences of SEQ ID NOs: 89-100, 105-122, 128-129, 132, 139, 143, 149, 154, 159, 235, 454, 471, 516, 662, 700, 701-716, 739-741, and 766.

態様90.態様76の方法であって、伸長されたガイドRNAが、RNA伸長をガイドRNAの3'もしくは5'端または分子内の位置付けに含み、RNA伸長が逆転写鋳型配列を含む。 Embodiment 90. The method of embodiment 76, wherein the extended guide RNA comprises an RNA extension at the 3' or 5' end of the guide RNA or positioned intramolecularly, the RNA extension comprising a reverse transcription template sequence.

態様91.態様90の方法であって、RNA伸長が、長さが少なくとも5ヌクレオチド、少なくとも6ヌクレオチド、少なくとも7ヌクレオチド、少なくとも8ヌクレオチド、少なくとも9ヌクレオチド、少なくとも10ヌクレオチド、少なくとも11ヌクレオチド、少なくとも12ヌクレオチド、少なくとも13ヌクレオチド、少なくとも14ヌクレオチド、少なくとも15ヌクレオチド、少なくとも16ヌクレオチド、少なくとも17ヌクレオチド、少なくとも18ヌクレオチド、少なくとも19ヌクレオチド、少なくとも20ヌクレオチド、少なくとも21ヌクレオチド、少なくとも22ヌクレオチド、少なくとも23ヌクレオチド、少なくとも24ヌクレオチド、または少なくとも25ヌクレオチドである。 Embodiment 91. The method of embodiment 90, wherein the RNA extension is at least 5 nucleotides, at least 6 nucleotides, at least 7 nucleotides, at least 8 nucleotides, at least 9 nucleotides, at least 10 nucleotides, at least 11 nucleotides, at least 12 nucleotides, at least 13 nucleotides, at least 14 nucleotides, at least 15 nucleotides, at least 16 nucleotides, at least 17 nucleotides, at least 18 nucleotides, at least 19 nucleotides, at least 20 nucleotides, at least 21 nucleotides, at least 22 nucleotides, at least 23 nucleotides, at least 24 nucleotides, or at least 25 nucleotides in length.

態様92.態様76の方法であって、伸長されたガイドRNAが、配列番号394、429~442、641~649、678~692、2997~3103、3113~3121、3305~3455、3479~3493、3522~3556、3628~3698、および3755~3810からなる群から選択されるヌクレオチド配列を有する。 Embodiment 92. The method of embodiment 76, wherein the extended guide RNA has a nucleotide sequence selected from the group consisting of SEQ ID NOs: 394, 429-442, 641-649, 678-692, 2997-3103, 3113-3121, 3305-3455, 3479-3493, 3522-3556, 3628-3698, and 3755-3810.

態様93.標的座位におけるDNA分子のヌクレオチド配列の1つ以上の変化を導入するための方法であって: Embodiment 93. A method for introducing one or more changes in the nucleotide sequence of a DNA molecule at a target locus, comprising:

(i)核酸プログラム型DNA結合タンパク質(napDNAbp)およびnapDNAbpを標的座位へと標的化するガイドRNAとDNA分子を接触させ、ガイドRNAが少なくとも1つの所望のヌクレオチド変化を含む逆転写酵素(RT)鋳型配列を含むこと; (i) contacting a DNA molecule with a nucleic acid programmable DNA binding protein (napDNAbp) and a guide RNA that targets the napDNAbp to a target locus, the guide RNA comprising a reverse transcriptase (RT) template sequence that contains at least one desired nucleotide change;

(ii)標的座位におけるDNA鎖の暴露された3’端を形成すること; (ii) creating an exposed 3' end of the DNA strand at the target locus;

(iii)暴露された3’端をRT鋳型配列にハイブリダイズさせて逆転写をプライムすること; (iii) hybridization of the exposed 3' end to the RT template sequence to prime reverse transcription;

(iv)逆転写酵素によって、RT鋳型配列に基づく少なくとも1つの所望のヌクレオチド変化を含む一本鎖DNAフラップを合成すること;および (iv) synthesizing a single-stranded DNA flap containing at least one desired nucleotide change based on the RT template sequence by reverse transcriptase; and

(v)少なくとも1つの所望のヌクレオチド変化を対応する内生DNA上に組み込み、それによって、標的座位においてDNA分子のヌクレオチド配列の1つ以上の変化を導入すること、
を含む。
(v) incorporating at least one desired nucleotide change into the corresponding endogenous DNA, thereby introducing one or more changes in the nucleotide sequence of the DNA molecule at the target locus;
including.

態様94.態様93の方法であって、ヌクレオチド配列の1つ以上の変化がトランジションを含む。 Embodiment 94. The method of embodiment 93, wherein the one or more changes in the nucleotide sequence include a transition.

態様95.態様94の方法であって、トランジションが、(a)TからC;(b)AからG;(c)CからT;および(d)GからAからなる群から選択される。 Embodiment 95. The method of embodiment 94, wherein the transition is selected from the group consisting of: (a) T to C; (b) A to G; (c) C to T; and (d) G to A.

態様96.態様93の方法であって、ヌクレオチド配列の1つ以上の変化がトランスバージョンを含む。 Embodiment 96. The method of embodiment 93, wherein the one or more changes in the nucleotide sequence include a transversion.

態様97.態様96の方法であって、トランスバージョンが、(a)TからA;(b)TからG;(c)CからG;(d)CからA;(e)AからT;(f)AからC;(g)GからC;および(h)GからTからなる群から選択される。 Embodiment 97. The method of embodiment 96, wherein the transversion is selected from the group consisting of: (a) T to A; (b) T to G; (c) C to G; (d) C to A; (e) A to T; (f) A to C; (g) G to C; and (h) G to T.

態様98.態様93の方法であって、ヌクレオチド配列の1つ以上の変化が、(1)G:C塩基対をT:A塩基対に、(2)G:C塩基対をA:T塩基対に、(3)G:C塩基対をC:G塩基対に、(4)T:A塩基対をG:C塩基対に、(5)T:A塩基対をA:T塩基対に、(6)T:A塩基対をC:G塩基対に、(7)C:G塩基対をG:C塩基対に、(8)C:G塩基対をT:A塩基対に、(9)C:G塩基対をA:T塩基対に、(10)A:T塩基対をT:A塩基対に、(11)A:T塩基対をG:C塩基対に、または(12)A:T塩基対をC:G塩基対に変化させることを含む。 Embodiment 98. The method of embodiment 93, wherein the one or more changes in the nucleotide sequence include changing (1) a G:C base pair to a T:A base pair, (2) a G:C base pair to an A:T base pair, (3) a G:C base pair to a C:G base pair, (4) a T:A base pair to a G:C base pair, (5) a T:A base pair to an A:T base pair, (6) a T:A base pair to a C:G base pair, (7) a C:G base pair to a G:C base pair, (8) a C:G base pair to a T:A base pair, (9) a C:G base pair to an A:T base pair, (10) an A:T base pair to a T:A base pair, (11) an A:T base pair to a G:C base pair, or (12) an A:T base pair to a C:G base pair.

態様99.態様93の方法であって、ヌクレオチド配列の1つ以上の変化が、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、または25ヌクレオチドの挿入または欠失を含む。 Embodiment 99. The method of embodiment 93, wherein the one or more changes in the nucleotide sequence include an insertion or deletion of 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, or 25 nucleotides.

態様100.態様93の方法であって、ヌクレオチド配列の1つ以上の変化が疾患関連遺伝子の修正を含む。 Embodiment 100. The method of embodiment 93, wherein the one or more changes in the nucleotide sequence include correction of a disease-associated gene.

態様101.態様100の方法であって、疾患関連遺伝子が:アデノシンデアミナーゼ(ADA)欠損症;アルファ-1アンチトリプシン欠損症;嚢胞性線維症;デュシェンヌ型筋ジストロフィー;ガラクトース血症;ヘモクロマトーシス;ハンチントン病;メープルシロップ尿症;マルファン症候群;1型神経線維腫症;先天性爪肥厚症;フェニルケトン尿症;重症複合免疫不全;鎌状赤血球症;スミス・レムリ・オピッツ症候群;およびテイ・サックス病からなる群から選択される単一遺伝子障害に関連する。 Embodiment 101. The method of embodiment 100, wherein the disease-associated gene is associated with a single-gene disorder selected from the group consisting of: adenosine deaminase (ADA) deficiency; alpha-1 antitrypsin deficiency; cystic fibrosis; Duchenne muscular dystrophy; galactosemia; hemochromatosis; Huntington's disease; maple syrup urine disease; Marfan syndrome; neurofibromatosis type 1; pachyonychia congenita; phenylketonuria; severe combined immunodeficiency; sickle cell disease; Smith-Lemli-Opitz syndrome; and Tay-Sachs disease.

態様102.態様100の方法であって、疾患関連遺伝子が:心臓病;高血圧;アルツハイマー病;関節炎;糖尿病;がん;および肥満からなる群から選択される多遺伝子性障害に関連する。 Embodiment 102. The method of embodiment 100, wherein the disease-associated gene is associated with a polygenic disorder selected from the group consisting of: heart disease; hypertension; Alzheimer's disease; arthritis; diabetes; cancer; and obesity.

態様103.態様93の方法であって、napDNAbpがヌクレアーゼ活性Cas9またはそのバリアントである。 Embodiment 103. The method of embodiment 93, wherein napDNAbp is a nuclease-active Cas9 or a variant thereof.

態様104.態様93の方法であって、napDNAbpがヌクレアーゼ不活性型Cas9(dCas9)もしくはCas9ニッカーゼ(nCas9)またはそのバリアントである。 Embodiment 104. The method of embodiment 93, wherein napDNAbp is a nuclease-inactivated Cas9 (dCas9) or Cas9 nickase (nCas9) or a variant thereof.

態様105.態様93の方法であって、napDNAbpが配列番号18のアミノ酸配列を含む。 Aspect 105. The method of aspect 93, wherein napDNAbp comprises the amino acid sequence of SEQ ID NO:18.

態様106.態様93の方法であって、napDNAbpが、配列番号18~88、126、130、137、141、147、153、157、445、460、467、および482~487のいずれか1つのアミノ酸配列との少なくとも80%、85%、90%、95%、98%、または99%配列同一性を有するアミノ酸配列を含む。 Embodiment 106. The method of embodiment 93, wherein the napDNAbp comprises an amino acid sequence having at least 80%, 85%, 90%, 95%, 98%, or 99% sequence identity to any one of the amino acid sequences of SEQ ID NOs: 18-88, 126, 130, 137, 141, 147, 153, 157, 445, 460, 467, and 482-487.

態様107.態様93の方法であって、逆転写酵素がトランスで導入される。 Embodiment 107. The method of embodiment 93, wherein the reverse transcriptase is introduced in trans.

態様108.態様93の方法であって、napDNAbpが逆転写酵素への融合体を含む。 Embodiment 108. The method of embodiment 93, wherein the napDNAbp comprises a fusion to a reverse transcriptase.

態様109.態様93の方法であって、逆転写酵素が、f配列番号89~100、105~122、128~129、132、139、143、149、154、159、235、454、471、516、662、700、701~716、739~741、および766のアミノ酸配列のいずれか1つを含む。 Embodiment 109. The method of embodiment 93, wherein the reverse transcriptase comprises any one of the amino acid sequences of SEQ ID NOs: 89-100, 105-122, 128-129, 132, 139, 143, 149, 154, 159, 235, 454, 471, 516, 662, 700, 701-716, 739-741, and 766.

態様110.態様93の方法であって、逆転写酵素が、配列番号89~100、105~122、128~129、132、139、143、149、154、159、235、454、471、516、662、700、701~716、739~741、および766のいずれか1つのアミノ酸配列との少なくとも80%、85%、90%、95%、98%、または99%配列同一性を有するアミノ酸配列を含む。 Embodiment 110. The method of embodiment 93, wherein the reverse transcriptase comprises an amino acid sequence having at least 80%, 85%, 90%, 95%, 98%, or 99% sequence identity to any one of the amino acid sequences of SEQ ID NOs: 89-100, 105-122, 128-129, 132, 139, 143, 149, 154, 159, 235, 454, 471, 516, 662, 700, 701-716, 739-741, and 766.

態様111.態様93の方法であって、標的座位におけるDNA鎖の暴露された3’端を形成するステップが、ヌクレアーゼによってDNA鎖へニックを入れることを含む。 Embodiment 111. The method of embodiment 93, wherein the step of forming an exposed 3' end of the DNA strand at the target locus comprises nicking the DNA strand with a nuclease.

態様112.態様111の方法であって、ヌクレアーゼがnapDNAbpであるか、napDNAbpの融合ドメインとして提供されるか、またはトランスで提供される。 Embodiment 112. The method of embodiment 111, wherein the nuclease is napDNAbp, is provided as a fusion domain of napDNAbp, or is provided in trans.

態様113.態様93の方法であって、標的座位におけるDNA鎖の暴露された3’端を形成するステップが、DNA鎖を化学的薬剤と接触させることを含む。 Embodiment 113. The method of embodiment 93, wherein the step of forming an exposed 3' end of the DNA strand at the target locus comprises contacting the DNA strand with a chemical agent.

態様114.態様93の方法であって、標的座位におけるDNA鎖の暴露された3’端を形成するステップが、複製エラーを導入することを含む。 Embodiment 114. The method of embodiment 93, wherein the step of forming an exposed 3' end of the DNA strand at the target locus includes introducing a replication error.

態様115.態様93の方法であって、DNA分子をnapDNAbpおよびガイドRNAと接触させるステップがRループを形成する。 Embodiment 115. The method of embodiment 93, wherein contacting the DNA molecule with napDNAbp and the guide RNA forms an R-loop.

態様116.態様115の方法であって、暴露された3’端が形成されるDNA鎖がRループ上にある。 Embodiment 116. The method of embodiment 115, wherein the DNA strand on which the exposed 3' end is formed is on an R-loop.

態様117.態様93の方法であって、ガイドRNAが、逆転写酵素(RT)鋳型配列を含む伸長された部分を含む。 Embodiment 117. The method of embodiment 93, wherein the guide RNA comprises an extended portion that includes a reverse transcriptase (RT) template sequence.

態様118.態様117の方法であって、伸長された部分が、ガイドRNAの3’端、ガイドRNAの5'端、またはガイドRNAの分子内の位置にある。 Embodiment 118. The method of embodiment 117, wherein the extended portion is at the 3' end of the guide RNA, the 5' end of the guide RNA, or at an intramolecular location of the guide RNA.

態様119.態様93の方法であって、ガイドRNAがさらにプライマー結合部位を含む。 Embodiment 119. The method of embodiment 93, wherein the guide RNA further comprises a primer binding site.

態様120.態様93の方法であって、ガイドRNAがさらにスペーサー配列を含む。 Embodiment 120. The method of embodiment 93, wherein the guide RNA further comprises a spacer sequence.

態様121.態様93の方法であって、RT鋳型配列が、対応する内生DNAに対して相同的である。 Embodiment 121. The method of embodiment 93, wherein the RT template sequence is homologous to the corresponding endogenous DNA.

態様122.プライム標的にプライムされた逆転写によって、標的座位におけるDNA分子のヌクレオチド配列の1つ以上の変化を導入するための方法であって、方法が:(a)標的座位におけるDNA分子を(i)核酸プログラム型DNA結合タンパク質(napDNAbp)および逆転写酵素を含む融合タンパク質ならびに(ii)所望のヌクレオチド変化を含むRT鋳型を含むガイドRNAと接触させること;(b)RT鋳型のプライム標的にプライムされた逆転写を行なって、所望のヌクレオチド変化を含む一本鎖DNAを生成すること;ならびに(c)DNA修復および/または複製プロセスによって標的座位におけるDNA分子上に所望のヌクレオチド変化を組み込むことを含む。 Embodiment 122. A method for introducing one or more changes in a nucleotide sequence of a DNA molecule at a target locus by primed reverse transcription, the method comprising: (a) contacting the DNA molecule at the target locus with (i) a fusion protein comprising a nucleic acid programmable DNA binding protein (napDNAbp) and a reverse transcriptase, and (ii) a guide RNA comprising an RT template comprising a desired nucleotide change; (b) performing primed reverse transcription of the RT template to generate a single-stranded DNA comprising the desired nucleotide change; and (c) incorporating the desired nucleotide change on the DNA molecule at the target locus by DNA repair and/or replication processes.

態様123.態様122の方法であって、RT鋳型が、ガイドRNAの3'端、ガイドRNAの5'端、またはガイドRNAの分子内の位置付けに位置付けられる。 Embodiment 123. The method of embodiment 122, wherein the RT template is located at the 3' end of the guide RNA, the 5' end of the guide RNA, or at an intramolecular location of the guide RNA.

態様124.態様122の方法であって、所望のヌクレオチド変化が、トランジション、トランスバージョン、挿入、もしくは欠失、またはそれらのいずれかの組み合わせを含む。 Embodiment 124. The method of embodiment 122, wherein the desired nucleotide change comprises a transition, a transversion, an insertion, or a deletion, or any combination thereof.

態様125.請求項122の方法であって、所望のヌクレオチド変化が、(a)TからC;(b)AからG;(c)CからT;および(d)GからAからなる群から選択されるトランジションを含む。 Embodiment 125. The method of claim 122, wherein the desired nucleotide change comprises a transition selected from the group consisting of: (a) T to C; (b) A to G; (c) C to T; and (d) G to A.

態様126.請求項122の方法であって、所望のヌクレオチド変化が、(a)TからA;(b)TからG;(c)CからG;(d)CからA;(e)AからT;(f)AからC;(g)GからC;および(h)GからTからなる群から選択されるトランスバージョンを含む。 Embodiment 126. The method of claim 122, wherein the desired nucleotide change comprises a transversion selected from the group consisting of: (a) T to A; (b) T to G; (c) C to G; (d) C to A; (e) A to T; (f) A to C; (g) G to C; and (h) G to T.

態様127.態様122の方法であって、所望のヌクレオチド変化が、(1)G:C塩基対をT:A塩基対に、(2)G:C塩基対をA:T塩基対に、(3)G:C塩基対をC:G塩基対に、(4)T:A塩基対をG:C塩基対に、(5)T:A塩基対をA:T塩基対に、(6)T:A塩基対をC:G塩基対に、(7)C:G塩基対をG:C塩基対に、(8)C:G塩基対をT:A塩基対に、(9)C:G塩基対をA:T塩基対に、(10)A:T塩基対をT:A塩基対に、(11)A:T塩基対をG:C塩基対に、または(12)A:T塩基対をC:G塩基対に変化させることを含む。 Embodiment 127. The method of embodiment 122, wherein the desired nucleotide change comprises changing (1) a G:C base pair to a T:A base pair, (2) a G:C base pair to an A:T base pair, (3) a G:C base pair to a C:G base pair, (4) a T:A base pair to a G:C base pair, (5) a T:A base pair to an A:T base pair, (6) a T:A base pair to a C:G base pair, (7) a C:G base pair to a G:C base pair, (8) a C:G base pair to a T:A base pair, (9) a C:G base pair to an A:T base pair, (10) an A:T base pair to a T:A base pair, (11) an A:T base pair to a G:C base pair, or (12) an A:T base pair to a C:G base pair.

態様128.態様31~47のいずれか1つの伸長されたガイドRNAをコードするポリヌクレオチド。 Embodiment 128. A polynucleotide encoding an extended guide RNA according to any one of embodiments 31 to 47.

態様129.態様128のポリヌクレオチドを含むベクター。 Aspect 129. A vector comprising the polynucleotide of aspect 128.

態様130.態様129のベクターを含む細胞。 Aspect 130. A cell comprising the vector of aspect 129.

態様131.態様1~30のいずれかの融合タンパク質であって、逆転写酵素がエラーを起こしやすい逆転写酵素である。 Embodiment 131. The fusion protein of any one of embodiments 1 to 30, wherein the reverse transcriptase is an error-prone reverse transcriptase.

態様132.プライム標的にプライムされた逆転写によって標的座位におけるDNA分子に変異導入するための方法であって、方法が:(a)標的座位におけるDNA分子を(i)核酸プログラム型DNA結合タンパク質(napDNAbp)およびエラーを起こしやすい逆転写酵素を含む融合タンパク質ならびに(ii)所望のヌクレオチド変化を含むRT鋳型を含むガイドRNAと接触させること;(b)RT鋳型のプライム標的にプライムされた逆転写を行なって、変異導入された一本鎖DNAを生成すること;ならびに(c)DNA修復および/または複製プロセスによって、変異導入された一本鎖DNAを標的座位におけるDNA分子上に組み込むことを含む。 Embodiment 132. A method for mutagenizing a DNA molecule at a target locus by primed reverse transcription, the method comprising: (a) contacting the DNA molecule at the target locus with (i) a fusion protein comprising a nucleic acid programmable DNA binding protein (napDNAbp) and an error-prone reverse transcriptase, and (ii) a guide RNA comprising an RT template comprising a desired nucleotide change; (b) performing primed reverse transcription of the RT template to generate a mutated single-stranded DNA; and (c) incorporating the mutated single-stranded DNA onto the DNA molecule at the target locus by DNA repair and/or replication processes.

態様133.態様132の方法であって、融合タンパク質がPE1、PE2、またはPE3のアミノ酸配列を含む。 Embodiment 133. The method of embodiment 132, wherein the fusion protein comprises an amino acid sequence of PE1, PE2, or PE3.

態様134.態様132の方法であって、napDNAbpがCas9ニッカーゼ(nCas9)である。 Embodiment 134. The method of embodiment 132, wherein the napDNAbp is Cas9 nickase (nCas9).

態様135.態様132の方法であって、napDNAbpが配列番号18~88、126、130、137、141、147、153、157、445、460、467、および482~487のアミノ酸配列を含む。 Embodiment 135. The method of embodiment 132, wherein the napDNAbp comprises the amino acid sequence of SEQ ID NOs: 18-88, 126, 130, 137, 141, 147, 153, 157, 445, 460, 467, and 482-487.

態様136.態様132の方法であって、ガイドRNAが配列番号222を含む。 Aspect 136. The method of aspect 132, wherein the guide RNA comprises SEQ ID NO: 222.

態様137.態様132の方法であって、(b)プライム標的にプライムされた逆転写を行うステップが、ガイドRNA上のプライマー結合部位へのアニーリングによって逆転写をプライムすることができる標的座位における3'端プライマー結合配列を生成することを含む。 Embodiment 137. The method of embodiment 132, wherein (b) performing primed reverse transcription on the primed target comprises generating a 3' end primer binding sequence at the target locus capable of priming reverse transcription by annealing to a primer binding site on the guide RNA.

態様138.健康な数の反復トリヌクレオチドを含む健康な配列によって標的DNA分子上のトリヌクレオチド反復拡大変異を置き換えるための方法であって、方法が:(a)標的座位におけるDNA分子を(i)核酸プログラム型DNA結合タンパク質(napDNAbp)および逆転写酵素を含む融合タンパク質ならびに(ii)置き換え配列を含むRT鋳型を含むガイドRNAと接触させ、前記融合タンパク質が導入すること(intr);(b)RT鋳型のプライム標的にプライムされた逆転写を行なって、置き換え配列を含む一本鎖DNAを生成すること;ならびに(c)DNA修復および/または複製プロセスによって、標的座位におけるDNA分子上に一本鎖DNAを組み込むことを含む。 Embodiment 138. A method for replacing a trinucleotide repeat expansion mutation on a target DNA molecule with a healthy sequence containing a healthy number of repeated trinucleotides, the method comprising: (a) contacting a DNA molecule at a target locus with (i) a fusion protein comprising a nucleic acid programmable DNA binding protein (napDNAbp) and a reverse transcriptase and (ii) a guide RNA comprising an RT template containing a replacement sequence, the fusion protein introducing (intr); (b) performing a primed reverse transcription on the primed target of the RT template to generate a single-stranded DNA containing the replacement sequence; and (c) incorporating the single-stranded DNA on the DNA molecule at the target locus by DNA repair and/or replication processes.

態様139.態様138の方法であって、融合タンパク質がPE1、PE2、またはPE3のアミノ酸配列を含む。 Embodiment 139. The method of embodiment 138, wherein the fusion protein comprises an amino acid sequence of PE1, PE2, or PE3.

態様140.態様138の方法であって、napDNAbpがCas9ニッカーゼ(nCas9)である。 Embodiment 140. The method of embodiment 138, wherein the napDNAbp is Cas9 nickase (nCas9).

態様141.態様138の方法であって、napDNAbpが、配列番号18~88、126、130、137、141、147、153、157、445、460、467、および482~487のアミノ酸配列を含む。 Embodiment 141. The method of embodiment 138, wherein the napDNAbp comprises the amino acid sequence of SEQ ID NOs: 18-88, 126, 130, 137, 141, 147, 153, 157, 445, 460, 467, and 482-487.

態様142.態様138の方法であって、ガイドRNAが配列番号222を含む。 Embodiment 142. The method of embodiment 138, wherein the guide RNA comprises SEQ ID NO: 222.

態様143.態様138の方法であって、(b)プライム標的にプライムされた逆転写を行うステップが、ガイドRNA上のプライマー結合部位へのアニーリングによって逆転写をプライムすることができる標的座位における3'端プライマー結合配列を生成することを含む。 Embodiment 143. The method of embodiment 138, wherein (b) performing primed reverse transcription on the primed target comprises generating a 3' end primer binding sequence at the target locus capable of priming reverse transcription by annealing to a primer binding site on the guide RNA.

態様144.態様138の方法であって、トリヌクレオチド反復拡大変異がハンチントン病、脆弱X症候群、またはフリードライヒ運動失調症に関連する。 Embodiment 144. The method of embodiment 138, wherein the trinucleotide repeat expansion mutation is associated with Huntington's disease, Fragile X syndrome, or Friedreich's ataxia.

態様145.態様138の方法であって、トリヌクレオチド反復拡大変異がCAGトリプレットの繰り返し単位を含む。 Embodiment 145. The method of embodiment 138, wherein the trinucleotide repeat expansion mutation comprises a repeat unit of a CAG triplet.

態様146.態様138の方法であって、トリヌクレオチド反復拡大変異がGAAトリプレットの繰り返し単位を含む。 Embodiment 146. The method of embodiment 138, wherein the trinucleotide repeat expansion mutation comprises a repeat unit of a GAA triplet.

態様147.プライム編集によって、標的ヌクレオチド配列によってコードされる目当てのタンパク質上に機能部分を組み入れる方法であって、方法が:(a)標的ヌクレオチド配列を(i)核酸プログラム型DNA結合タンパク質(napDNAbp)および逆転写酵素を含むプライム編集因子ならびに(ii)機能部分をコードする編集鋳型を含むPEgRNAと接触させること;(b)機能部分をコードする一本鎖DNA配列を重合すること;ならびに(c)DNA修復および/または複製プロセスによって、標的ヌクレオチド配列における対応する内生鎖の代わりに一本鎖DNA配列を組み込むことを含み、方法が、目当てのタンパク質と機能部分とを含む融合タンパク質をコードする組み換え標的ヌクレオチド配列を生ずる。 Embodiment 147. A method for incorporating a functional moiety on a protein of interest encoded by a target nucleotide sequence by prime editing, the method comprising: (a) contacting the target nucleotide sequence with (i) a prime editing factor comprising a nucleic acid programmable DNA binding protein (napDNAbp) and a reverse transcriptase, and (ii) a PEgRNA comprising an editing template encoding the functional moiety; (b) polymerizing a single-stranded DNA sequence encoding the functional moiety; and (c) incorporating the single-stranded DNA sequence in place of the corresponding endogenous strand in the target nucleotide sequence by DNA repair and/or replication processes, the method producing a recombinant target nucleotide sequence encoding a fusion protein comprising the protein of interest and the functional moiety.

態様148.態様147の方法であって、機能部分がペプチドタグである。 Aspect 148. The method of aspect 147, wherein the functional moiety is a peptide tag.

態様149.態様148の方法であって、ペプチドタグがアフィニティータグ、可溶化タグ、クロマトグラフィータグ、エピトープタグ、または蛍光タグである。 Embodiment 149. The method of embodiment 148, wherein the peptide tag is an affinity tag, a solubilization tag, a chromatography tag, an epitope tag, or a fluorescent tag.

態様150.態様148の方法であって、ペプチドタグが:AviTag(配列番号245);Cタグ(配列番号246);カルモジュリンタグ(配列番号247);ポリグルタミン酸タグ(配列番号248);Eタグ(配列番号249);FLAGタグ(配列番号2);HAタグ(配列番号5);Hisタグ(配列番号252-262);Mycタグ(配列番号6);NEタグ(配列番号264);Rho1D4タグ(配列番号265);Sタグ(配列番号266);SBPタグ(配列番号267);Softag-1(配列番号268);Softag-2(配列番号269);Spotタグ(配列番号270);Strepタグ(配列番号271);TCタグ(配列番号272);Tyタグ(配列番号273);V5タグ(配列番号3);VSVタグ(配列番号275);およびXpressタグ(配列番号276)からなる群から選択される。 Embodiment 150. The method of embodiment 148, wherein the peptide tag is selected from the group consisting of: AviTag (SEQ ID NO:245); C-tag (SEQ ID NO:246); Calmodulin tag (SEQ ID NO:247); Polyglutamic acid tag (SEQ ID NO:248); E-tag (SEQ ID NO:249); FLAG tag (SEQ ID NO:2); HA tag (SEQ ID NO:5); His tag (SEQ ID NO:252-262); Myc tag (SEQ ID NO:6); NE tag (SEQ ID NO:264); Rho1D4 tag (SEQ ID NO:265); S-tag (SEQ ID NO:266); SBP tag (SEQ ID NO:267); Softag-1 (SEQ ID NO:268); Softag-2 (SEQ ID NO:269); Spot tag (SEQ ID NO:270); Strep tag (SEQ ID NO:271); TC tag (SEQ ID NO:272); Ty tag (SEQ ID NO:273); V5 tag (SEQ ID NO:3); VSV tag (SEQ ID NO:275); and Xpress tag (SEQ ID NO:276).

態様151.態様148の方法であって、ペプチドタグが:AU1エピトープ(配列番号278);AU5エピトープ(配列番号279);バクテリオファージT7エピトープ(T7タグ)(配列番号280);ブルータングウイルスタグ(Bタグ)(配列番号281);E2エピトープ(配列番号282);ヒスチジンアフィニティータグ(HAT)(配列番号283);HSVエピトープ(配列番号284);ポリアルギニン(Argタグ)(配列番号285);ポリアスパラギン酸(Aspタグ)(配列番号286);ポリフェニルアラニン(Pheタグ)(配列番号287);S1タグ(配列番号288);Sタグ(配列番号266);およびVSV-G(配列番号275)からなる群から選択される。 Embodiment 151. The method of embodiment 148, wherein the peptide tag is selected from the group consisting of: AU1 epitope (SEQ ID NO:278); AU5 epitope (SEQ ID NO:279); bacteriophage T7 epitope (T7 tag) (SEQ ID NO:280); bluetongue virus tag (B tag) (SEQ ID NO:281); E2 epitope (SEQ ID NO:282); histidine affinity tag (HAT) (SEQ ID NO:283); HSV epitope (SEQ ID NO:284); polyarginine (Arg tag) (SEQ ID NO:285); polyaspartic acid (Asp tag) (SEQ ID NO:286); polyphenylalanine (Phe tag) (SEQ ID NO:287); S1 tag (SEQ ID NO:288); S tag (SEQ ID NO:266); and VSV-G (SEQ ID NO:275).

態様152.態様147の方法であって、機能部分が免疫エピトープである。 Aspect 152. The method of aspect 147, wherein the functional moiety is an immune epitope.

態様153.態様152の方法であって、免疫エピトープが:破傷風トキソイド(配列番号396);ジフテリア毒素変異体CRM197(配列番号398);ムンプス免疫エピトープ1(配列番号400);ムンプス免疫エピトープ2(配列番号402);ムンプス免疫エピトープ3(配列番号404);風疹ウイルス(配列番号406);ヘマグルチニン(配列番号408);ノイラミニダーゼ(配列番号410);TAP1(配列番号412);TAP2(配列番号414);クラスI HLAに対するヘマグルチニンエピトープ(配列番号416);クラスI HLAに対するノイラミニダーゼエピトープ(配列番号418);クラスII HLAに対するヘマグルチニンエピトープ(配列番号420);クラスII HLAに対するノイラミニダーゼエピトープ(配列番号422);ヘマグルチニンエピトープH5N1結合クラスIおよびクラスII HLA(配列番号424);ノイラミニダーゼエピトープH5N1結合クラスIおよびクラスII HLA(配列番号426)からなる群から選択される。 Embodiment 153. The method of embodiment 152, wherein the immune epitope is selected from the group consisting of: tetanus toxoid (SEQ ID NO: 396); diphtheria toxin variant CRM197 (SEQ ID NO: 398); mumps immune epitope 1 (SEQ ID NO: 400); mumps immune epitope 2 (SEQ ID NO: 402); mumps immune epitope 3 (SEQ ID NO: 404); rubella virus (SEQ ID NO: 406); hemagglutinin (SEQ ID NO: 408); neuraminidase (SEQ ID NO: 410); TAP1 (SEQ ID NO: 412); TAP2 (SEQ ID NO: 414); hemagglutinin epitope for class I HLA (SEQ ID NO: 416); neuraminidase epitope for class I HLA (SEQ ID NO: 418); hemagglutinin epitope for class II HLA (SEQ ID NO: 420); neuraminidase epitope for class II HLA (SEQ ID NO: 422); hemagglutinin epitope H5N1 binding class I and class II HLA (SEQ ID NO: 424); Selected from the group consisting of neuraminidase epitope H5N1-binding class I and class II HLA (SEQ ID NO: 426).

態様154.態様147の方法であって、機能部分が目当てのタンパク質の局在を変改する。 Embodiment 154. The method of embodiment 147, wherein the functional moiety alters the localization of the protein of interest.

態様155.態様147の方法であって、機能部分が分解タグであり、その結果、目当てのタンパク質の分解速度が変改される。 Embodiment 155. The method of embodiment 147, wherein the functional moiety is a degradation tag, thereby altering the degradation rate of the protein of interest.

態様156.態様155の方法であって、分解タグが、本明細書に開示の分解タグをコードするアミノ酸配列を含む。 Embodiment 156. The method of embodiment 155, wherein the degradation tag comprises an amino acid sequence encoding a degradation tag disclosed herein.

態様157.態様147の方法であって、機能部分が低分子結合ドメインである。 Embodiment 157. The method of embodiment 147, wherein the functional moiety is a small molecule binding domain.

態様158.態様157の方法であって、低分子結合ドメインが配列番号488のFKBP12である。 Embodiment 158. The method of embodiment 157, wherein the small molecule binding domain is FKBP12 of SEQ ID NO:488.

態様159.態様157の方法であって、低分子結合ドメインが配列番号489のFKBP12-F36Vである。 Aspect 159. The method of aspect 157, wherein the small molecule binding domain is FKBP12-F36V of SEQ ID NO: 489.

態様160.態様157の方法であって、低分子結合ドメインが配列番号490および493~494のシクロフィリンである。 Embodiment 160 The method of embodiment 157, wherein the small molecule binding domain is a cyclophilin of SEQ ID NOs : 490 and 493-494.

態様161.態様157の方法であって、低分子結合ドメインが目当ての2つ以上のタンパク質上に組み入れされる。 Embodiment 161. The method of embodiment 157, wherein the small molecule binding domains are incorporated onto two or more proteins of interest.

態様162.態様161の方法であって、目当ての2つ以上のタンパク質が低分子と接触することによって二量体化し得る。 Embodiment 162. The method of embodiment 161, wherein two or more proteins of interest can be dimerized by contact with a small molecule.

態様163.態様157の方法であって、低分子が、群1の態様163に開示される化合物からなる群から選択される低分子の二量体である。 Embodiment 163. The method of embodiment 157, wherein the small molecule is a dimer of a small molecule selected from the group consisting of the compounds disclosed in embodiment 163 of group 1.

態様164.プライム編集によって、標的ヌクレオチド配列によってコードされる目当てのタンパク質上に免疫エピトープを組み入れる方法であって、方法が:(a)標的ヌクレオチド配列を(i)核酸プログラム型DNA結合タンパク質(napDNAbp)および逆転写酵素を含むプライム編集因子ならびに(ii)機能部分をコードする編集鋳型を含むPEgRNAと接触させること;(b)免疫エピトープをコードする一本鎖DNA配列を重合すること;ならびに(c)DNA修復および/または複製プロセスによって、標的ヌクレオチド配列における対応する内生鎖の代わりに一本鎖DNA配列を組み込むことを含み、方法が、目当てのタンパク質と免疫エピトープとを含む融合タンパク質をコードする組み換え標的ヌクレオチド配列を生ずる。 Embodiment 164. A method for incorporating an immune epitope onto a protein of interest encoded by a target nucleotide sequence by prime editing, the method comprising: (a) contacting the target nucleotide sequence with (i) a prime editing factor comprising a nucleic acid programmable DNA binding protein (napDNAbp) and a reverse transcriptase, and (ii) a PEgRNA comprising an editing template encoding a functional moiety; (b) polymerizing a single-stranded DNA sequence encoding the immune epitope; and (c) incorporating the single-stranded DNA sequence in place of the corresponding endogenous strand in the target nucleotide sequence by DNA repair and/or replication processes, the method resulting in a recombinant target nucleotide sequence encoding a fusion protein comprising the protein of interest and the immune epitope.

態様165.態様164の方法であって、免疫エピトープが:破傷風トキソイド(配列番号396);ジフテリア毒素変異体CRM197(配列番号630);ムンプス免疫エピトープ1(配列番号400);ムンプス免疫エピトープ2(配列番号402);ムンプス免疫エピトープ3(配列番号404);風疹ウイルス(配列番号406);ヘマグルチニン(配列番号408);ノイラミニダーゼ(配列番号410);TAP1(配列番号412);TAP2(配列番号414);クラスI HLAに対するヘマグルチニンエピトープ(配列番号416);クラスI HLAに対するノイラミニダーゼエピトープ(配列番号418);クラスII HLAに対するヘマグルチニンエピトープ(配列番号420);クラスII HLAに対するノイラミニダーゼエピトープ(配列番号422);ヘマグルチニンエピトープH5N1結合クラスIおよびクラスII HLA(配列番号424);ノイラミニダーゼエピトープH5N1結合クラスIおよびクラスII HLA(配列番号426)からなる群から選択される。 Embodiment 165. The method of embodiment 164, wherein the immune epitope is: tetanus toxoid (SEQ ID NO: 396); diphtheria toxin variant CRM197 (SEQ ID NO: 630); mumps immune epitope 1 (SEQ ID NO: 400); mumps immune epitope 2 (SEQ ID NO: 402); mumps immune epitope 3 (SEQ ID NO: 404); rubella virus (SEQ ID NO: 406); hemagglutinin (SEQ ID NO: 408); neuraminidase (SEQ ID NO: 410); TAP1 (SEQ ID NO: 412); TAP2 (SEQ ID NO: 414); hemagglutinin epitope for class I HLA (SEQ ID NO: 416); neuraminidase epitope for class I HLA (SEQ ID NO: 418); hemagglutinin epitope for class II HLA (SEQ ID NO: 420); neuraminidase epitope for class II HLA (SEQ ID NO: 422); hemagglutinin epitope H5N1 binding class I and class II HLA (SEQ ID NO: 424); Selected from the group consisting of neuraminidase epitope H5N1-binding class I and class II HLA (SEQ ID NO: 426).

態様166.態様164の方法であって、融合タンパク質がPE1、PE2、またはPE3のアミノ酸配列を含む。 Embodiment 166. The method of embodiment 164, wherein the fusion protein comprises an amino acid sequence of PE1, PE2, or PE3.

態様167.態様164の方法であって、napDNAbpがCas9ニッカーゼ(nCas9)である。 Embodiment 167. The method of embodiment 164, wherein the napDNAbp is Cas9 nickase (nCas9).

態様168.態様164の方法であって、napDNAbpが、配列番号18~88、126、130、137、141、147、153、157、445、460、467、および482~487のアミノ酸配列を含む。 Embodiment 168. The method of embodiment 164, wherein the napDNAbp comprises the amino acid sequence of SEQ ID NOs: 18-88, 126, 130, 137, 141, 147, 153, 157, 445, 460, 467, and 482-487.

態様169.態様164の方法であって、ガイドRNAが配列番号222を含む。 Embodiment 169. The method of embodiment 164, wherein the guide RNA comprises SEQ ID NO: 222.

態様170.プライム編集によって、標的ヌクレオチド配列によってコードされる目当てのタンパク質上に低分子二量体化ドメインを組み入れる方法であって、方法が:(a)標的ヌクレオチド配列を(i)核酸プログラム型DNA結合タンパク質(napDNAbp)および逆転写酵素を含むプライム編集因子ならびに(ii)低分子二量体化ドメインをコードする編集鋳型を含むPEgRNAと接触させること;(b)免疫エピトープをコードする一本鎖DNA配列を重合すること;ならびに(c)DNA修復および/または複製プロセスによって、標的ヌクレオチド配列における対応する内生鎖の代わりに一本鎖DNA配列を組み込むことを含み、方法が、目当てのタンパク質と低分子二量体化ドメインとを含む融合タンパク質をコードする組み換え標的ヌクレオチド配列を生ずる。 Embodiment 170. A method for incorporating a small dimerization domain onto a protein of interest encoded by a target nucleotide sequence by prime editing, the method comprising: (a) contacting the target nucleotide sequence with (i) a prime editing factor comprising a nucleic acid programmable DNA binding protein (napDNAbp) and a reverse transcriptase, and (ii) a PEgRNA comprising an editing template encoding the small dimerization domain; (b) polymerizing a single-stranded DNA sequence encoding an immune epitope; and (c) incorporating the single-stranded DNA sequence in place of the corresponding endogenous strand in the target nucleotide sequence by DNA repair and/or replication processes, the method producing a recombinant target nucleotide sequence encoding a fusion protein comprising the protein of interest and the small dimerization domain.

態様171.態様170の方法であって、さらに、目当ての第2のタンパク質に対して方法を行うことを含む。 Embodiment 171. The method of embodiment 170, further comprising performing the method on a second protein of interest.

態様172.態様171の方法であって、目当ての第1のタンパク質および目当ての第2のタンパク質が、前記タンパク質の夫々の二量体化ドメインに結合する低分子の存在下において二量体化する。 Embodiment 172. The method of embodiment 171, wherein the first protein of interest and the second protein of interest dimerize in the presence of a small molecule that binds to the dimerization domains of each of the proteins.

態様173.態様170の方法であって、低分子結合ドメインが配列番号488のFKBP12である。 Embodiment 173. The method of embodiment 170, wherein the small molecule binding domain is FKBP12 of SEQ ID NO:488.

態様174.態様170の方法であって、低分子結合ドメインが配列番号489のFKBP12-F36Vである。 Embodiment 174. The method of embodiment 170, wherein the small molecule binding domain is FKBP12-F36V of SEQ ID NO:489.

態様175.態様170の方法であって、低分子結合ドメインが配列番号490および493-494のシクロフィリンである。 Embodiment 175. The method of embodiment 170, wherein the small molecule binding domain is a cyclophilin of SEQ ID NOs: 490 and 493-494.

態様176.態様170の方法であって、低分子が、群1の態様163に開示される化合物からなる群から選択される低分子の二量体である。 Embodiment 176. The method of embodiment 170, wherein the small molecule is a dimer of a small molecule selected from the group consisting of the compounds disclosed in embodiment 163 of group 1.

態様177.態様170の方法であって、融合タンパク質がPE1、PE2、またはPE3のアミノ酸配列を含む。 Embodiment 177. The method of embodiment 170, wherein the fusion protein comprises an amino acid sequence of PE1, PE2, or PE3.

態様178.態様170の方法であって、napDNAbpがCas9ニッカーゼ(nCas9)である。 Embodiment 178. The method of embodiment 170, wherein the napDNAbp is Cas9 nickase (nCas9).

態様179.態様170の方法であって、napDNAbpが配列番号18~88、126、130、137、141、147、153、157、445、460、467、および482~487のアミノ酸配列を含む。 Embodiment 179. The method of embodiment 170, wherein the napDNAbp comprises the amino acid sequence of SEQ ID NOs: 18-88, 126, 130, 137, 141, 147, 153, 157, 445, 460, 467, and 482-487.

態様180.態様170の方法であって、ガイドRNAが配列番号222を含む。 Embodiment 180. The method of embodiment 170, wherein the guide RNA comprises SEQ ID NO: 222.

態様181.プライム編集を用いてタンパク質上にペプチドタグまたはエピトープを組み入れる方法であって:タンパク質をコードする標的ヌクレオチド配列を、ペプチドタグをコードする第2のヌクレオチド配列をそれに挿入するように構成されたプライム編集因子構築物と接触させて、組み換えヌクレオチド配列をもたらすことを含み、その結果、ペプチドタグおよびタンパク質が融合タンパク質として組み換えヌクレオチド配列から発現される。 Embodiment 181. A method of incorporating a peptide tag or epitope onto a protein using prime editing, comprising: contacting a target nucleotide sequence encoding a protein with a prime editor construct configured to insert therein a second nucleotide sequence encoding a peptide tag, resulting in a recombinant nucleotide sequence, such that the peptide tag and the protein are expressed from the recombinant nucleotide sequence as a fusion protein.

態様182.態様181の方法であって、ペプチドタグがタンパク質の精製および/または検出に用いられる。 Embodiment 182. The method of embodiment 181, wherein the peptide tag is used for purifying and/or detecting the protein.

態様183.態様181の方法であって、ペプチドタグが、ポリヒスチジン(例えば、HHHHHH)(配列番号252~262)、FLAG(例えば、DYKDDDDK)(配列番号2)、V5(例えば、GKPIPNPLLGLDST)(配列番号3)、GCN4、HA(例えば、YPYDVPDYA)(配列番号5)、Myc(例えばEQKLISEED)(配列番号6)、GSTなどである。 Aspect 183. The method of aspect 181, wherein the peptide tag is polyhistidine (e.g., HHHHHH) (SEQ ID NOs: 252-262), FLAG (e.g., DYKDDDDK) (SEQ ID NO: 2), V5 (e.g., GKPIPNPLLGLDST) (SEQ ID NO: 3), GCN4, HA (e.g., YPYDVPDYA) (SEQ ID NO: 5), Myc (e.g., EQKLISEED) (SEQ ID NO: 6), GST, or the like.

態様184.態様181の方法であって、ペプチドタグが、配列番号1~6、245~249、252~262、264~273、275~276、281、278~288、および622からなる群から選択されるアミノ酸配列を有する。 Embodiment 184. The method of embodiment 181, wherein the peptide tag has an amino acid sequence selected from the group consisting of SEQ ID NOs: 1-6, 245-249, 252-262, 264-273, 275-276, 281, 278-288, and 622.

態様185.態様181の方法であって、ペプチドタグがリンカーによってタンパク質に融合される。 Embodiment 185. The method of embodiment 181, wherein the peptide tag is fused to the protein by a linker.

態様186.態様181の方法であって、融合タンパク質が次の構造を有し:[タンパク質]-[ペプチドタグ]または[ペプチドタグ]-[タンパク質]、「]-[」が任意のリンカーを表す。 Embodiment 186. The method of embodiment 181, wherein the fusion protein has the following structure: [protein]-[peptide tag] or [peptide tag]-[protein], where "]-[" represents an optional linker.

態様187.態様181の方法であって、リンカーが配列番号127、165~176、446、453、および767~769のアミノ酸配列を有する。 Embodiment 187. The method of embodiment 181, wherein the linker has an amino acid sequence of SEQ ID NOs: 127, 165-176, 446, 453, and 767-769.

態様188.態様181の方法であって、プライム編集因子構築物が、配列番号101~104、181~183、223~244、277、325~334、336、338、340、342、344、346、348、350、352、354、356、358、360、362、364、366、368、499~505、735~761、776~777のヌクレオチド配列を含むPEgRNAを含む。 Embodiment 188. The method of embodiment 181, wherein the prime editor construct comprises a PEgRNA comprising a nucleotide sequence of SEQ ID NOs: 101-104, 181-183, 223-244, 277, 325-334, 336, 338, 340, 342, 344, 346, 348, 350, 352, 354, 356, 358, 360, 362, 364, 366, 368, 499-505, 735-761, 776-777.

態様189.態様181の方法であって、PEgRNAがスペーサー、gRNAコア、および伸長アームを含み、スペーサーが標的ヌクレオチド配列に対して相補的であり、伸長アームがペプチドタグをコードする逆転写酵素鋳型を含む。 Embodiment 189. The method of embodiment 181, wherein the PEGRNA comprises a spacer, a gRNA core, and an extension arm, the spacer being complementary to a target nucleotide sequence, and the extension arm comprises a reverse transcriptase template encoding a peptide tag.

態様190.態様181の方法であって、PEgRNAがスペーサー、gRNAコア、および伸長アームを含み、スペーサーが標的ヌクレオチド配列に対して相補的であり、伸長アームがペプチドタグをコードする逆転写酵素鋳型を含む。 Embodiment 190. The method of embodiment 181, wherein the PEGRNA comprises a spacer, a gRNA core, and an extension arm, the spacer being complementary to a target nucleotide sequence, and the extension arm comprises a reverse transcriptase template encoding a peptide tag.

態様191.プライム編集によって標的ヌクレオチド配列によってコードされるPRNP上に1つ以上の防護性変異を組み入れることによって、プリオン病を防止またはその進行を停止させる方法であって、方法が:(a)標的ヌクレオチド配列を(i)核酸プログラム型DNA結合タンパク質(napDNAbp)および逆転写酵素を含むプライム編集因子ならびに(ii)機能部分をコードする編集鋳型を含むPEgRNAと接触させること;(b)防護性変異をコードする一本鎖DNA配列を重合すること;ならびに(c)DNA修復および/または複製プロセスによって、標的ヌクレオチド配列における対応する内生鎖の代わりに一本鎖DNA配列を組み込むことを含み、方法が、ミスフォールディングに対して耐性である防護性変異を含むPRNPをコードする組み換え標的ヌクレオチド配列を生ずる。 Embodiment 191. A method for preventing or halting the progression of prion disease by incorporating one or more protective mutations in a PRNP encoded by a target nucleotide sequence by prime editing, the method comprising: (a) contacting the target nucleotide sequence with (i) a prime editing factor comprising a nucleic acid programmable DNA binding protein (napDNAbp) and a reverse transcriptase, and (ii) a PEgRNA comprising an editing template encoding a functional moiety; (b) polymerizing a single-stranded DNA sequence encoding the protective mutation; and (c) incorporating the single-stranded DNA sequence in place of the corresponding endogenous strand in the target nucleotide sequence by DNA repair and/or replication processes, the method resulting in a recombinant target nucleotide sequence encoding a PRNP containing a protective mutation that is resistant to misfolding.

態様192.態様191の方法であって、プリオン病がヒトプリオン病である。 Aspect 192. The method of aspect 191, wherein the prion disease is a human prion disease.

態様193.態様191の方法であって、プリオン病が動物プリオン病である。 Aspect 193. The method of aspect 191, wherein the prion disease is an animal prion disease.

態様194.態様192の方法であって、プリオン病が、クロイツフェルト・ヤコブ病(CJD)、変異型クロイツフェルト・ヤコブ病(vCJD)、ゲルストマン・ストロイスラー・シャインカー症候群、致死性家族性不眠症、またはクールー病である。 Aspect 194. The method of aspect 192, wherein the prion disease is Creutzfeldt-Jakob disease (CJD), variant Creutzfeldt-Jakob disease (vCJD), Gerstmann-Straussler-Scheinker syndrome, fatal familial insomnia, or kuru.

態様195.態様193の方法であって、プリオン病が、牛海綿状脳症(BSEまたは「狂牛病」)、慢性消耗病(CWD)、スクレイピー、伝達性ミンク脳症、ネコ海綿状脳症、および有蹄類海綿状脳症である。 Aspect 195. The method of aspect 193, wherein the prion disease is bovine spongiform encephalopathy (BSE or "mad cow disease"), chronic wasting disease (CWD), scrapie, transmissible mink encephalopathy, feline spongiform encephalopathy, and ungulate spongiform encephalopathy.

態様196.態様191の方法であって、野生型PRNPアミノ酸配列が配列番号291~292である。 Aspect 196. The method of aspect 191, wherein the wild-type PRNP amino acid sequence is SEQ ID NOs: 291-292.

態様197.態様191の方法であって、方法が、配列番号293~309および311~323からなる群から選択される改変されたPRNPアミノ酸配列をもたらし、前記改変されたPRNPタンパク質がミスフォールディングに対して耐性である。 Embodiment 197. The method of embodiment 191, wherein the method results in a modified PRNP amino acid sequence selected from the group consisting of SEQ ID NOs: 293-309 and 311-323, and the modified PRNP protein is resistant to misfolding.

態様198.態様191の方法であって、融合タンパク質がPE1、PE2、またはPE3のアミノ酸配列を含む。 Embodiment 198. The method of embodiment 191, wherein the fusion protein comprises an amino acid sequence of PE1, PE2, or PE3.

態様199.態様191の方法であって、napDNAbpがCas9ニッカーゼ(nCas9)である。 Embodiment 199. The method of embodiment 191, wherein the napDNAbp is Cas9 nickase (nCas9).

態様200.態様191の方法であって、napDNAbpが、配列番号18~88、126、130、137、141、147、153、157、445、460、467、および482~487のアミノ酸配列を含む。 Embodiment 200. The method of embodiment 191, wherein the napDNAbp comprises the amino acid sequence of SEQ ID NOs: 18-88, 126, 130, 137, 141, 147, 153, 157, 445, 460, 467, and 482-487.

態様201.態様191の方法であって、ガイドRNAが配列番号222を含む。 Embodiment 201. The method of embodiment 191, wherein the guide RNA comprises SEQ ID NO: 222.

態様202.プライム編集によって、標的ヌクレオチド配列によってコードされる目当てのRNA上にリボヌクレオチドモチーフまたはタグを組み入れる方法であって、方法が:(a)標的ヌクレオチド配列を(i)核酸プログラム型DNA結合タンパク質(napDNAbp)および逆転写酵素を含むプライム編集因子ならびに(ii)リボヌクレオチドモチーフまたはタグをコードする編集鋳型を含むPEgRNAと接触させること;(b)リボヌクレオチドモチーフまたはタグをコードする一本鎖DNA配列を重合すること;ならびに(c)DNA修復および/または複製プロセスによって、標的ヌクレオチド配列における対応する内生鎖の代わりに一本鎖DNA配列を組み込むことを含み、方法が、リボヌクレオチドモチーフまたはタグを含む目当ての修飾されたRNAをコードする組み換え標的ヌクレオチド配列を生ずる。 Embodiment 202. A method for incorporating a ribonucleotide motif or tag on a desired RNA encoded by a target nucleotide sequence by prime editing, the method comprising: (a) contacting the target nucleotide sequence with (i) a prime editing factor comprising a nucleic acid programmable DNA binding protein (napDNAbp) and a reverse transcriptase, and (ii) a PEgRNA comprising an editing template encoding the ribonucleotide motif or tag; (b) polymerizing a single-stranded DNA sequence encoding the ribonucleotide motif or tag; and (c) incorporating the single-stranded DNA sequence in place of the corresponding endogenous strand in the target nucleotide sequence by DNA repair and/or replication processes, the method producing a recombinant target nucleotide sequence encoding a modified RNA of interest comprising the ribonucleotide motif or tag.

態様203.態様202の方法であって、リボヌクレオチドモチーフまたはタグが検出部分である。 Embodiment 203. The method of embodiment 202, wherein the ribonucleotide motif or tag is the detection moiety.

態様204.態様202の方法であって、リボヌクレオチドモチーフまたはタグが目当てのRNAの発現レベルに影響する。 Embodiment 204. The method of embodiment 202, wherein the ribonucleotide motif or tag affects the expression level of the RNA of interest.

態様205.態様202の方法であって、リボヌクレオチドモチーフまたはタグが目当てのRNAの輸送または細胞下レベル位置付けに影響する。 Embodiment 205. The method of embodiment 202, wherein the ribonucleotide motif or tag affects transport or subcellular location of the RNA of interest.

態様206.態様202の方法であって、リボヌクレオチドモチーフまたはタグが、SV40 1型、SV40 2型、SV40 3型、hGH、BGH、rbGlob、TK、MALAT1 ENE-mascRNA、KSHV PAN ENE、Smbox/U1 snRNAボックス、U1 snRNA 3'ボックス、tRNA-リジン、broccoliアプタマー、spinachアプタマー、mangoアプタマー、HDVリボザイム、およびm6Aからなる群から選択される。 Embodiment 206. The method of embodiment 202, wherein the ribonucleotide motif or tag is selected from the group consisting of SV40 type 1, SV40 type 2, SV40 type 3, hGH, BGH, rbGlob, TK, MALAT1 ENE-mascRNA, KSHV PAN ENE, Smbox/U1 snRNA box, U1 snRNA 3' box, tRNA-lysine, broccoli aptamer, spinach aptamer, mango aptamer, HDV ribozyme, and m6A.

態様207.態様202の方法であって、PEgRNAが、配列番号101~104、181~183、223~244、277、325~334、336、338、340、342、344、346、348、350、352、354、356、358、360、362、364、366、368、499~505、735~761、776~777を含む。 Embodiment 207. The method of embodiment 202, wherein the PEGRNA comprises SEQ ID NOs: 101-104, 181-183, 223-244, 277, 325-334, 336, 338, 340, 342, 344, 346, 348, 350, 352, 354, 356, 358, 360, 362, 364, 366, 368, 499-505, 735-761, 776-777.

態様208.態様202の方法であって、融合タンパク質がPE1、PE2、またはPE3のアミノ酸配列を含む。 Embodiment 208. The method of embodiment 202, wherein the fusion protein comprises an amino acid sequence of PE1, PE2, or PE3.

態様209.態様202の方法であって、napDNAbpがCas9ニッカーゼ(nCas9)である。 Embodiment 209. The method of embodiment 202, wherein the napDNAbp is Cas9 nickase (nCas9).

態様210.態様202の方法であって、napDNAbpが、配列番号18~88、126、130、137、141、147、153、157、445、460、467、および482~487のアミノ酸配列を含む。 Embodiment 210. The method of embodiment 202, wherein the napDNAbp comprises the amino acid sequence of SEQ ID NOs: 18-88, 126, 130, 137, 141, 147, 153, 157, 445, 460, 467, and 482-487.

態様211.プライム編集によって、標的ヌクレオチド配列によってコードされる目当てのタンパク質上の機能部分を組み入れまたは欠失する方法であって、方法が:(a)標的ヌクレオチド配列を(i)核酸プログラム型DNA結合タンパク質(napDNAbp)および逆転写酵素を含むプライム編集因子ならびに(ii)機能部分またはその欠失をコードする編集鋳型を含むPEgRNAと接触させること;(b)機能部分またはその欠失をコードする一本鎖DNA配列を重合すること;ならびに(c)DNA修復および/または複製プロセスによって、標的ヌクレオチド配列における対応する内生鎖の代わりに一本鎖DNA配列を組み込むことを含み、方法が、目当てのタンパク質および機能部分またはその除去を含む改変されたタンパク質をコードする組み換え標的ヌクレオチド配列を生じ、機能部分がタンパク質の修飾状態または局在状態を変改する。 Embodiment 211. A method for inserting or deleting a functional portion on a protein of interest encoded by a target nucleotide sequence by prime editing, the method comprising: (a) contacting the target nucleotide sequence with (i) a prime editing factor comprising a nucleic acid programmable DNA binding protein (napDNAbp) and a reverse transcriptase and (ii) a PEgRNA comprising an editing template encoding the functional portion or deletion; (b) polymerizing a single-stranded DNA sequence encoding the functional portion or deletion; and (c) incorporating the single-stranded DNA sequence in place of the corresponding endogenous strand in the target nucleotide sequence by DNA repair and/or replication processes, the method producing a recombinant target nucleotide sequence encoding the protein of interest and an altered protein comprising the functional portion or deletion, the functional portion altering the modification or localization state of the protein.

態様212.態様211の方法であって、機能部分が、目当てのタンパク質のリン酸化、ユビキチン化、グリコシル化、脂質修飾、ヒドロキシル化、メチル化、アセチル化、クロトニル化、SUMO化状態を変改する。 Embodiment 212. The method of embodiment 211, wherein the functional moiety alters the phosphorylation, ubiquitination, glycosylation, lipid modification, hydroxylation, methylation, acetylation, crotonylation, or sumoylation status of the protein of interest.

態様213.融合タンパク質であって、核酸プログラム型DNA結合タンパク質(napDNAbp)とポリメラーゼとを含む。 Embodiment 213. A fusion protein comprising a nucleic acid programmable DNA binding protein (napDNAbp) and a polymerase.

態様214.態様213の融合タンパク質であって、融合タンパク質が、プライム編集ガイドRNA(PEgRNA)の存在下においてプライム編集を実行することができる。 Embodiment 214. The fusion protein of embodiment 213, wherein the fusion protein is capable of performing prime editing in the presence of a prime editing guide RNA (PEgRNA).

態様215.態様213の融合タンパク質であって、napDNAbpがニッカーゼ活性を有する。 Aspect 215. The fusion protein of aspect 213, wherein napDNAbp has nickase activity.

態様216.態様213の融合タンパク質であって、napDNAbpがCas9タンパク質またはそのバリアントである。 Embodiment 216. The fusion protein of embodiment 213, wherein napDNAbp is a Cas9 protein or a variant thereof.

態様217.態様213の融合タンパク質であって、napDNAbpがヌクレアーゼ活性Cas9、ヌクレアーゼ不活性型Cas9(dCas9)、またはCas9ニッカーゼ(nCas9)である。 Embodiment 217. The fusion protein of embodiment 213, wherein napDNAbp is a nuclease-active Cas9, a nuclease-inactive Cas9 (dCas9), or a Cas9 nickase (nCas9).

態様218.態様213の融合タンパク質であって、napDNAbpがCas9ニッカーゼ(nCas9)である。 Embodiment 218. The fusion protein of embodiment 213, wherein the napDNAbp is Cas9 nickase (nCas9).

態様219.態様213の融合タンパク質であって、napDNAbpが:Cas9、Cas12e、Cas12d、Cas12a、Cas12b1、Cas13a、Cas12c、およびアルゴノートからなる群から選択され、任意にニッカーゼ活性を有する。 Embodiment 219. The fusion protein of embodiment 213, wherein napDNAbp is selected from the group consisting of: Cas9, Cas12e, Cas12d, Cas12a, Cas12b1, Cas13a, Cas12c, and Argonaute, and optionally has nickase activity.

態様220.態様213の融合タンパク質であって、融合タンパク質がPEgRNAと複合体化したときに標的DNA配列に結合することができる。 Embodiment 220. The fusion protein of embodiment 213, wherein the fusion protein is capable of binding to a target DNA sequence when complexed with the PEGRNA.

態様221.態様220の融合タンパク質であって、標的DNA配列が標的鎖および相補的な非標的鎖を含む。 Embodiment 221. The fusion protein of embodiment 220, wherein the target DNA sequence comprises a target strand and a complementary non-target strand.

態様222.態様220の融合タンパク質であって、PEgRNAと複合体化した融合タンパク質の結合がRループを形成する。 Embodiment 222. The fusion protein of embodiment 220, wherein binding of the fusion protein complexed with the PEGRNA forms an R-loop.

態様223.態様222の融合タンパク質であって、Rループが、(i)PEgRNAと標的鎖とを含むRNA-DNAハイブリッドおよび(ii)相補的な非標的鎖を含む。 Embodiment 223. The fusion protein of embodiment 222, wherein the R-loop comprises (i) an RNA-DNA hybrid comprising the PEgRNA and a target strand and (ii) a complementary non-target strand.

態様224.態様223の融合タンパク質であって、相補的な非標的鎖がニッキングされて、遊離の3'端を有するプライム配列を形成する。 Embodiment 224. The fusion protein of embodiment 223, wherein the complementary non-target strand is nicked to form a prime sequence having a free 3' end.

態様225.態様214の融合タンパク質であって、PEgRNAが、(a)ガイドRNAと、(b)ガイドRNAの5'もしくは3’端またはガイドRNAの分子内の位置付けにおける伸長アームとを含む。 Embodiment 225. The fusion protein of embodiment 214, wherein the PEGRNA comprises (a) a guide RNA and (b) an extension arm at the 5' or 3' end of the guide RNA or at an intramolecular position of the guide RNA.

態様226.態様225の融合タンパク質であって、伸長アームが(i)所望のヌクレオチド変化を含むDNA合成鋳型配列および(ii)プライマー結合部位を含む。 Embodiment 226. The fusion protein of embodiment 225, wherein the extension arm comprises (i) a DNA synthesis template sequence containing a desired nucleotide change and (ii) a primer binding site.

態様227.態様226の融合タンパク質であって、DNA合成鋳型配列が、ニック部位に隣接する内生DNA配列に対して相補的である一本鎖DNAフラップをコードし、一本鎖DNAフラップが所望のヌクレオチド変化を含む。 Embodiment 227. The fusion protein of embodiment 226, wherein the DNA synthesis template sequence encodes a single-stranded DNA flap that is complementary to the endogenous DNA sequence adjacent to the nick site, and the single-stranded DNA flap contains the desired nucleotide change.

態様228.態様225の融合タンパク質であって、伸長アームが、長さが少なくとも5ヌクレオチド、少なくとも6ヌクレオチド、少なくとも7ヌクレオチド、少なくとも8ヌクレオチド、少なくとも9ヌクレオチド、少なくとも10ヌクレオチド、少なくとも11ヌクレオチド、少なくとも12ヌクレオチド、少なくとも13ヌクレオチド、少なくとも14ヌクレオチド、少なくとも15ヌクレオチド、少なくとも16ヌクレオチド、少なくとも17ヌクレオチド、少なくとも18ヌクレオチド、少なくとも19ヌクレオチド、少なくとも20ヌクレオチド、少なくとも21ヌクレオチド、少なくとも22ヌクレオチド、少なくとも23ヌクレオチド、少なくとも24ヌクレオチド、または少なくとも25ヌクレオチドである。 Embodiment 228. The fusion protein of embodiment 225, wherein the extension arm is at least 5 nucleotides, at least 6 nucleotides, at least 7 nucleotides, at least 8 nucleotides, at least 9 nucleotides, at least 10 nucleotides, at least 11 nucleotides, at least 12 nucleotides, at least 13 nucleotides, at least 14 nucleotides, at least 15 nucleotides, at least 16 nucleotides, at least 17 nucleotides, at least 18 nucleotides, at least 19 nucleotides, at least 20 nucleotides, at least 21 nucleotides, at least 22 nucleotides, at least 23 nucleotides, at least 24 nucleotides, or at least 25 nucleotides in length.

態様229.態様227の融合タンパク質であって、一本鎖DNAフラップが、ニック部位に隣接する内生DNA配列にハイブリダイズし、それによって所望のヌクレオチド変化を組み入れる。 Embodiment 229. The fusion protein of embodiment 227, wherein the single-stranded DNA flap hybridizes to the endogenous DNA sequence adjacent to the nick site, thereby incorporating the desired nucleotide change.

態様230.態様227の融合タンパク質であって、一本鎖DNAフラップが、遊離の5'端を有しかつニック部位に隣接する内生DNA配列に取って代わる。 Embodiment 230. The fusion protein of embodiment 227, wherein the single-stranded DNA flap has a free 5' end and replaces the endogenous DNA sequence adjacent to the nick site.

態様231.態様230の融合タンパク質であって、5'端を有する内生DNA配列が細胞によって切除される。 Embodiment 231. The fusion protein of embodiment 230, wherein the endogenous DNA sequence having a 5' end is excised by the cell.

態様232.態様230の融合タンパク質であって、一本鎖DNAフラップの細胞性修復が所望のヌクレオチド変化の組み入れをもたらし、それによって所望の産物を形成する。 Embodiment 232. The fusion protein of embodiment 230, wherein cellular repair of the single-stranded DNA flap results in incorporation of a desired nucleotide change, thereby forming a desired product.

態様233.態様226の融合タンパク質であって、所望のヌクレオチド変化がPAM配列の約-4から+10の間もしくはPAM配列の約-10から+20の間もしくはPAM配列の約-20から+40の間もしくはPAM配列の約-30から+100の間である編集窓上に組み入れされるか、または所望のヌクレオチド変化がニック部位の少なくとも1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、もしくは100ヌクレオチド下流に組み入れされる。 233. The fusion protein of embodiment 226, wherein the desired nucleotide change is incorporated into an editing window that is between about -4 and +10 of the PAM sequence, or between about -10 and +20 of the PAM sequence, or between about -20 and +40 of the PAM sequence, or between about -30 and +100 of the PAM sequence, or the desired nucleotide change is incorporated into at least 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30 of the nick site. , 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99, or 100 nucleotides downstream.

態様234.態様213の融合タンパク質であって、napDNAbpが、配列番号18のアミノ酸配列、または配列番号18のアミノ酸配列との少なくとも80%、85%、90%、95%、98%、もしくは99%配列同一性を有するアミノ酸配列を含む。 Embodiment 234 The fusion protein of embodiment 213, wherein the napDNAbp comprises an amino acid sequence of SEQ ID NO: 18 , or an amino acid sequence having at least 80%, 85%, 90%, 95%, 98%, or 99% sequence identity to the amino acid sequence of SEQ ID NO: 18.

態様235.態様213の融合タンパク質であって、napDNAbpが、配列番号18~88、126、130、137、141、147、153、157、445、460、467、および482~487のいずれか1つのアミノ酸配列との少なくとも80%、85%、90%、95%、98%、または99%配列同一性を有するアミノ酸配列を含む。 Embodiment 235. The fusion protein of embodiment 213, wherein napDNAbp comprises an amino acid sequence having at least 80%, 85%, 90%, 95%, 98%, or 99% sequence identity to any one of the amino acid sequences of SEQ ID NOs: 18-88, 126, 130, 137, 141, 147, 153, 157, 445, 460, 467, and 482-487.

態様236.態様213の融合タンパク質であって、ポリメラーゼが逆転写酵素であり、配列番号89~100、105~122、128~129、132、139、143、149、154、159、235、454、471、516、662、700、701~716、739~741、および766のアミノ酸配列のいずれか1つを含む。 Embodiment 236. The fusion protein of embodiment 213, wherein the polymerase is a reverse transcriptase and comprises any one of the amino acid sequences of SEQ ID NOs: 89-100, 105-122, 128-129, 132, 139, 143, 149, 154, 159, 235, 454, 471, 516, 662, 700, 701-716, 739-741, and 766.

態様237.態様213の融合タンパク質であって、ポリメラーゼが逆転写酵素であり、配列番号89~100、105~122、128~129、132、139、143、149、154、159、235、454、471、516、662、700、701~716、739~741、および766のいずれか1つのアミノ酸配列との少なくとも80%、85%、90%、95%、98%、または99%配列同一性を有するアミノ酸配列を含む。 Embodiment 237. The fusion protein of embodiment 213, wherein the polymerase is a reverse transcriptase and comprises an amino acid sequence having at least 80%, 85%, 90%, 95%, 98%, or 99% sequence identity to any one of the amino acid sequences of SEQ ID NOs: 89-100, 105-122, 128-129, 132, 139, 143, 149, 154, 159, 235, 454, 471, 516, 662, 700, 701-716, 739-741, and 766.

態様238.態様213の融合タンパク質であって、ポリメラーゼがレトロウイルスまたはレトロトランスポゾンからの天然に存在する逆転写酵素である。 Embodiment 238. The fusion protein of embodiment 213, wherein the polymerase is a naturally occurring reverse transcriptase from a retrovirus or retrotransposon.

態様239.先の態様のいずれか1つの融合タンパク質であって、融合タンパク質が構造NH2-[napDNAbp]-[ポリメラーゼ]-COOH;またはNH2-[ポリメラーゼ]-[napDNAbp]-COOHを含み、「]-[」の夫々のものが任意のリンカー配列の存在を指示する。 Embodiment 239. The fusion protein of any one of the preceding embodiments, wherein the fusion protein comprises the structure NH2-[napDNAbp]-[polymerase]-COOH; or NH2-[polymerase]-[napDNAbp]-COOH, each of the "]-[" indicates the presence of an optional linker sequence.

態様240.態様239の融合タンパク質であって、リンカー配列が配列番号127、165~176、446、453、および767~769のアミノ酸配列を含む。 Embodiment 240. The fusion protein of embodiment 239, wherein the linker sequence comprises the amino acid sequence of SEQ ID NOs: 127, 165-176, 446, 453, and 767-769.

態様241.態様226の融合タンパク質であって、所望のヌクレオチド変化が1ヌクレオチド変化、1つ以上のヌクレオチドの挿入、または1つ以上のヌクレオチドの欠失である。 Embodiment 241. The fusion protein of embodiment 226, wherein the desired nucleotide change is a single nucleotide change, an insertion of one or more nucleotides, or a deletion of one or more nucleotides.

態様242.態様241の融合タンパク質であって、挿入または欠失が、少なくとも1、少なくとも2、少なくとも3、少なくとも4、少なくとも5、少なくとも6、少なくとも7、少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも16、少なくとも17、少なくとも18、少なくとも19、少なくとも20、少なくとも21、少なくとも22、少なくとも23、少なくとも24、少なくとも25、少なくとも26、少なくとも27、少なくとも28、少なくとも29、少なくとも30、少なくとも31、少なくとも32、少なくとも33、少なくとも34、少なくとも35、少なくとも36、少なくとも37、少なくとも38、少なくとも39、少なくとも40、少なくとも41、少なくとも42、少なくとも43、少なくとも44、少なくとも45、少なくとも46、少なくとも47、少なくとも48、少なくとも49、または少なくとも50である。 Embodiment 242. The fusion protein of embodiment 241, wherein the insertion or deletion is at least 1, at least 2, at least 3, at least 4, at least 5, at least 6, at least 7, at least 8, at least 9, at least 10, at least 11, at least 12, at least 13, at least 14, at least 15, at least 16, at least 17, at least 18, at least 19, at least 20, at least 21, at least 22, at least 23, at least 24, at least 25, at least 26, at least 27, at least 28, at least 29, at least 30, at least 31, at least 32, at least 33, at least 34, at least 35, at least 36, at least 37, at least 38, at least 39, at least 40, at least 41, at least 42, at least 43, at least 44, at least 45, at least 46, at least 47, at least 48, at least 49, or at least 50.

態様243.ガイドRNAとDNA合成鋳型を含む少なくとも1つの核酸伸長アームとを含むPEgRNA。 Embodiment 243. A PEgRNA comprising a guide RNA and at least one nucleic acid extension arm comprising a DNA synthesis template.

態様244.態様241のPEgRNAであって、核酸伸長アームがガイドRNAの3'もしくは5'端またはガイドRNAの分子内の位置の位置であり、核酸伸長アームがDNAまたはRNAである。 Embodiment 244. The PEGRNA of embodiment 241, wherein the nucleic acid extension arm is at the 3' or 5' end of the guide RNA or at an intramolecular position of the guide RNA, and the nucleic acid extension arm is DNA or RNA.

態様245.態様242のPEgRNAであって、PEgRNAが、napDNAbpに結合することおよびnapDNAbpを標的DNA配列へと導くことができる。 Embodiment 245. The PEgRNA of embodiment 242, wherein the PEgRNA is capable of binding to the napDNAbp and directing the napDNAbp to a target DNA sequence.

態様246.態様245のPEgRNAであって、標的DNA配列が標的鎖および相補的な非標的鎖を含み、ガイドRNAが標的鎖にハイブリダイズして、RNA-DNAハイブリッドおよびRループを形成する。 Embodiment 246. The PEgRNA of embodiment 245, wherein the target DNA sequence comprises a target strand and a complementary non-target strand, and the guide RNA hybridizes to the target strand to form an RNA-DNA hybrid and an R-loop.

態様247.態様243のPEgRNAであって、少なくとも1つの核酸伸長アームが(i)DNA合成鋳型および(ii)プライマー結合部位を含む。 Embodiment 247. The PEgRNA of embodiment 243, wherein at least one nucleic acid extension arm comprises (i) a DNA synthesis template and (ii) a primer binding site.

態様248.態様247のPEgRNAであって、核酸伸長アームが、長さが少なくとも5ヌクレオチド、少なくとも6ヌクレオチド、少なくとも7ヌクレオチド、少なくとも8ヌクレオチド、少なくとも9ヌクレオチド、少なくとも10ヌクレオチド、少なくとも11ヌクレオチド、少なくとも12ヌクレオチド、少なくとも13ヌクレオチド、少なくとも14ヌクレオチド、少なくとも15ヌクレオチド、少なくとも16ヌクレオチド、少なくとも17ヌクレオチド、少なくとも18ヌクレオチド、少なくとも19ヌクレオチド、少なくとも20ヌクレオチド、少なくとも21ヌクレオチド、少なくとも22ヌクレオチド、少なくとも23ヌクレオチド、少なくとも24ヌクレオチド、または少なくとも25ヌクレオチドである。 Embodiment 248. The PEGRNA of embodiment 247, wherein the nucleic acid extension arm is at least 5 nucleotides, at least 6 nucleotides, at least 7 nucleotides, at least 8 nucleotides, at least 9 nucleotides, at least 10 nucleotides, at least 11 nucleotides, at least 12 nucleotides, at least 13 nucleotides, at least 14 nucleotides, at least 15 nucleotides, at least 16 nucleotides, at least 17 nucleotides, at least 18 nucleotides, at least 19 nucleotides, at least 20 nucleotides, at least 21 nucleotides, at least 22 nucleotides, at least 23 nucleotides, at least 24 nucleotides, or at least 25 nucleotides in length.

態様249.態様247のPEgRNAであって、DNA合成鋳型が、長さが少なくとも3ヌクレオチド、少なくとも4ヌクレオチド、少なくとも5ヌクレオチド、少なくとも6ヌクレオチド、少なくとも7ヌクレオチド、少なくとも8ヌクレオチド、少なくとも9ヌクレオチド、少なくとも10ヌクレオチド、少なくとも11ヌクレオチド、少なくとも12ヌクレオチド、少なくとも13ヌクレオチド、少なくとも14ヌクレオチド、または少なくとも15ヌクレオチドである。 Embodiment 249. The PEGRNA of embodiment 247, wherein the DNA synthesis template is at least 3 nucleotides, at least 4 nucleotides, at least 5 nucleotides, at least 6 nucleotides, at least 7 nucleotides, at least 8 nucleotides, at least 9 nucleotides, at least 10 nucleotides, at least 11 nucleotides, at least 12 nucleotides, at least 13 nucleotides, at least 14 nucleotides, or at least 15 nucleotides in length.

態様250.態様247のPEgRNAであって、プライマー結合部位が、長さが少なくとも3ヌクレオチド、少なくとも4ヌクレオチド、少なくとも5ヌクレオチド、少なくとも6ヌクレオチド、少なくとも7ヌクレオチド、少なくとも8ヌクレオチド、少なくとも9ヌクレオチド、少なくとも10ヌクレオチド、少なくとも11ヌクレオチド、少なくとも12ヌクレオチド、少なくとも13ヌクレオチド、少なくとも14ヌクレオチド、または少なくとも15ヌクレオチドである。 Embodiment 250. The PEGRNA of embodiment 247, wherein the primer binding site is at least 3 nucleotides, at least 4 nucleotides, at least 5 nucleotides, at least 6 nucleotides, at least 7 nucleotides, at least 8 nucleotides, at least 9 nucleotides, at least 10 nucleotides, at least 11 nucleotides, at least 12 nucleotides, at least 13 nucleotides, at least 14 nucleotides, or at least 15 nucleotides in length.

態様251.態様243のPEgRNAであって、さらに、リンカー、ステムループ、ヘアピン、トウループ、アプタマー、またはRNA-タンパク質動員ドメインからなる群から選択される少なくとも1つの追加の構造を含む。 Embodiment 251. The PEGRNA of embodiment 243, further comprising at least one additional structure selected from the group consisting of a linker, a stem loop, a hairpin, a toe loop, an aptamer, or an RNA-protein recruitment domain.

態様252.態様247のPEgRNAであって、DNA合成鋳型が、ニック部位に隣接する内生DNA配列に対して相補的である一本鎖DNAフラップをコードし、一本鎖DNAフラップが所望のヌクレオチド変化を含む。 Embodiment 252. The PEGRNA of embodiment 247, wherein the DNA synthesis template encodes a single-stranded DNA flap that is complementary to the endogenous DNA sequence adjacent to the nick site, and the single-stranded DNA flap contains the desired nucleotide change.

態様253.態様252のPEgRNAであって、一本鎖DNAフラップが、ニッキングされた標的DNA配列上の5'端を有する内生一本鎖DNAを押し除け、内生一本鎖DNAがニック部位の下流において直ちに隣接する。 Embodiment 253. The PEGRNA of embodiment 252, wherein the single-stranded DNA flap displaces the endogenous single-stranded DNA having a 5' end on the nicked target DNA sequence, and the endogenous single-stranded DNA is immediately adjacent and downstream of the nick site.

態様254.態様253のPEgRNAであって、遊離の5'端を有する内生一本鎖DNAが細胞によって切除される。 Embodiment 254. The PEGRNA of embodiment 253, wherein the endogenous single-stranded DNA having a free 5' end is excised by the cell.

態様255.態様253のPEgRNAであって、一本鎖DNAフラップの細胞性修復が所望のヌクレオチド変化の組み入れをもたらし、それによって所望の産物を形成する。 Embodiment 255. The PEGRNA of embodiment 253, wherein cellular repair of the single-stranded DNA flap results in incorporation of the desired nucleotide change, thereby forming the desired product.

態様256.態様243のPEgRNAであって、配列番号101~104、181~183、223~244、277、325~334、336、338、340、342、344、346、348、350、352、354、356、358、360、362、364、366、368、499~505、735~761、776~777のヌクレオチド配列、または配列番号101~104、181~183、223~244、277、325~334、336、338、340、342、344、346、348、350、352、354、356、358、360、362、364、366、368、499~505、735~761、776~777のいずれか1つとの少なくとも85%もしくは少なくとも90%もしくは少なくとも95%もしくは少なくとも98%もしくは少なくとも99%配列同一性を有するヌクレオチド配列を含む。 Embodiment 256. The PEG RNA of embodiment 243, comprising a nucleotide sequence selected from the group consisting of SEQ ID NOs: 101-104, 181-183, 223-244, 277, 325-334, 336, 338, 340, 342, 344, 346, 348, 350, 352, 354, 356, 358, 360, 362, 364, 366, 368, 499-505, 735-761, 776-777, or SEQ ID NOs: 101-104, 181-183, 223-244, 277, 325-334, 336, 338, 340, 342, 344, 346, 348, 350, 352, 354, 356, 358, 360, 362, 364, 366, 368, 499-505, 735-761, 776-777.

態様257.態様247のPEgRNAであって、DNA合成鋳型が、内生DNA標的と少なくとも80%または85%または90%または95%または99%同一であるヌクレオチド配列を含む。 Embodiment 257. The PEGRNA of embodiment 247, wherein the DNA synthesis template comprises a nucleotide sequence that is at least 80%, or 85%, or 90%, or 95%, or 99% identical to the endogenous DNA target.

態様258.態様247のPEgRNAであって、プライマー結合部位が、カットされたDNAの遊離の3'端とハイブリダイズする。 Embodiment 258. The PEGRNA of embodiment 247, wherein the primer binding site hybridizes to the free 3' end of the cut DNA.

態様259.態様251のPEgRNAであって、少なくとも1つの追加の構造がPEgRNAの3'または5'端に位置付けられる。 Embodiment 259. The PEGRNA of embodiment 251, wherein at least one additional structure is located at the 3' or 5' end of the PEGRNA.

態様260.態様213-242のいずれか1つの融合タンパク質とPEgRNAとを含むことを含む複合体。 Aspect 260. A complex comprising any one of the fusion proteins of aspects 213-242 and PEgRNA.

態様261.態様260の複合体であって、PEgRNAが、ガイドRNAと、ガイドRNAの3'もしくは5'端またはガイドRNAの分子内の位置における核酸伸長アームとを含む。 Embodiment 261. The complex of embodiment 260, wherein the PEGRNA comprises a guide RNA and a nucleic acid extension arm at the 3' or 5' end of the guide RNA or at an intramolecular position of the guide RNA.

態様262.態様260の複合体であって、PEgRNAが、napDNAbpに結合することおよびnapDNAbpを標的DNA配列へと導くことができる。 Embodiment 262. The complex of embodiment 260, wherein the PEgRNA is capable of binding to the napDNAbp and directing the napDNAbp to a target DNA sequence.

態様263.態様262の複合体であって、標的DNA配列が標的鎖および相補的な非標的鎖を含み、ガイドRNAが標的鎖にハイブリダイズして、RNA-DNAハイブリッドおよびRループを形成する。 Embodiment 263. The complex of embodiment 262, wherein the target DNA sequence comprises a target strand and a complementary non-target strand, and the guide RNA hybridizes to the target strand to form an RNA-DNA hybrid and an R-loop.

態様264.態様261の複合体であって、少なくとも1つの核酸伸長アームが(i)DNA合成鋳型および(ii)プライマー結合部位を含む。 Embodiment 264. The complex of embodiment 261, wherein at least one nucleic acid extension arm comprises (i) a DNA synthesis template and (ii) a primer binding site.

態様265.態様260の複合体であって、PEgRNAが、配列番号101~104、181~183、223~244、277、325~334、336、338、340、342、344、346、348、350、352、354、356、358、360、362、364、366、368、499~505、735~761、776~777のヌクレオチド配列、または配列番号101~104、181~183、223~244、277、325~334、336、338、340、342、344、346、348、350、352、354、356、358、360、362、364、366、368、499~505、735~761、776~777のいずれか1つとの少なくとも85%もしくは少なくとも90%もしくは少なくとも95%もしくは少なくとも98%もしくは少なくとも99%配列同一性を有するヌクレオチド配列を含む。 Embodiment 265. The complex of embodiment 260, wherein the PEGRNA is selected from the group consisting of the nucleotide sequences of SEQ ID NOs: 101-104, 181-183, 223-244, 277, 325-334, 336, 338, 340, 342, 344, 346, 348, 350, 352, 354, 356, 358, 360, 362, 364, 366, 368, 499-505, 735-761, 776-777, or SEQ ID NOs: 101-104, 181-183, 223-24 4, 277, 325-334, 336, 338, 340, 342, 344, 346, 348, 350, 352, 354, 356, 358, 360, 362, 364, 366, 368, 499-505, 735-761, 776-777.

態様266.態様264の複合体であって、DNA合成鋳型が、内生DNA標的と少なくとも80%または85%または90%または95%または99%同一であるヌクレオチド配列を含む。 Embodiment 266. The complex of embodiment 264, wherein the DNA synthesis template comprises a nucleotide sequence that is at least 80%, 85%, 90%, 95%, or 99% identical to the endogenous DNA target.

態様267.態様264の複合体であって、プライマー結合部位が、カットされたDNAの遊離の3’端とハイブリダイズする。 Embodiment 267. The complex of embodiment 264, wherein the primer binding site hybridizes to the free 3' end of the cut DNA.

態様268.napDNAbpおよびPEgRNAを含むことを含む複合体。 Aspect 268. A complex comprising napDNAbp and PEgRNA.

態様269.態様268の複合体であって、napDNAbpがCas9ニッカーゼである。 Embodiment 269. The complex of embodiment 268, wherein napDNAbp is a Cas9 nickase.

態様270.態様268の複合体であって、napDNAbpが配列番号18のアミノ酸配列を含む。 Aspect 270. The complex of aspect 268, wherein napDNAbp comprises the amino acid sequence of SEQ ID NO:18.

態様271.態様268の複合体であって、napDNAbpが、配列番号18-88、126、130、137、141、147、153、157、445、460、467、および482-487のいずれか1つのアミノ酸配列との少なくとも80%、85%、90%、95%、98%、または99%配列同一性を有するアミノ酸配列を含む。 Embodiment 271. The complex of embodiment 268, wherein napDNAbp comprises an amino acid sequence having at least 80%, 85%, 90%, 95%, 98%, or 99% sequence identity to any one of the amino acid sequences of SEQ ID NOs: 18-88, 126, 130, 137, 141, 147, 153, 157, 445, 460, 467, and 482-487.

態様272.態様268の複合体であって、PEgRNAが、ガイドRNAと、ガイドRNAの3'もしくは5'端またはガイドRNAの分子内の位置における核酸伸長アームとを含む。 Embodiment 272. The complex of embodiment 268, wherein the PEGRNA comprises a guide RNA and a nucleic acid extension arm at the 3' or 5' end of the guide RNA or at an intramolecular position of the guide RNA.

態様273.態様268の複合体であって、PEgRNAがnapDNAbpを標的DNA配列へと導くことができる。 Embodiment 273. The complex of embodiment 268, wherein the PEgRNA is capable of directing the napDNAbp to a target DNA sequence.

態様274.態様272の複合体であって、標的DNA配列が標的鎖および相補的な非標的鎖を含み、PEgRNAのスペーサー配列が標的鎖にハイブリダイズしてRNA-DNAハイブリッドおよびRループを形成する。 Embodiment 274. The complex of embodiment 272, wherein the target DNA sequence comprises a target strand and a complementary non-target strand, and the spacer sequence of the PEgRNA hybridizes to the target strand to form an RNA-DNA hybrid and an R-loop.

態様275.態様273の複合体であって、核酸伸長アームが(i)DNA合成鋳型および(ii)プライマー結合部位を含む。 Embodiment 275. The complex of embodiment 273, wherein the nucleic acid extension arm comprises (i) a DNA synthesis template and (ii) a primer binding site.

態様276.態様269の複合体であって、PEgRNAが、配列番号101~104、181~183、223~244、277、325~334、336、338、340、342、344、346、348、350、352、354、356、358、360、362、364、366、368、499~505、735~761、776~777のヌクレオチド配列、または配列番号101~104、181~183、223~244、277、325~334、336、338、340、342、344、346、348、350、352、354、356、358、360、362、364、366、368、499~505、735~761、776~777のいずれか1つとの少なくとも85%もしくは少なくとも90%もしくは少なくとも95%もしくは少なくとも98%もしくは少なくとも99%配列同一性を有するヌクレオチド配列を含む。 Embodiment 276. The complex of embodiment 269, wherein the PEGRNA has a nucleotide sequence selected from the group consisting of SEQ ID NOs: 101-104, 181-183, 223-244, 277, 325-334, 336, 338, 340, 342, 344, 346, 348, 350, 352, 354, 356, 358, 360, 362, 364, 366, 368, 499-505, 735-761, 776-777, or SEQ ID NOs: 101-104, 181-183, 223-24 4, 277, 325-334, 336, 338, 340, 342, 344, 346, 348, 350, 352, 354, 356, 358, 360, 362, 364, 366, 368, 499-505, 735-761, 776-777.

態様277.態様276の複合体であって、DNA合成鋳型が、内生DNA標的と少なくとも80%または85%または90%または95%または99%同一であるヌクレオチド配列を含む。 Embodiment 277. The complex of embodiment 276, wherein the DNA synthesis template comprises a nucleotide sequence that is at least 80%, or 85%, or 90%, or 95%, or 99% identical to the endogenous DNA target.

態様278.態様276の複合体であって、プライマー結合部位が、カットされたDNAの遊離の3’端とハイブリダイズする。 Embodiment 278. The complex of embodiment 276, wherein the primer binding site hybridizes to the free 3' end of the cut DNA.

態様279.態様276の複合体であって、PEgRNAが、さらに、リンカー、ステムループ、ヘアピン、トウループ、アプタマー、またはRNA-タンパク質動員ドメインからなる群から選択される少なくとも1つの追加の構造を含む。 Embodiment 279. The complex of embodiment 276, wherein the PEGRNA further comprises at least one additional structure selected from the group consisting of a linker, a stem loop, a hairpin, a toe loop, an aptamer, or an RNA-protein recruitment domain.

態様280.態様213~242のいずれかの融合タンパク質をコードするポリヌクレオチド。 Aspect 280. A polynucleotide encoding a fusion protein according to any one of aspects 213 to 242.

態様281.態様280のポリヌクレオチドを含むベクター。 Aspect 281. A vector comprising the polynucleotide of aspect 280.

態様282.態様213~242のいずれかの融合タンパク質と融合タンパク質のnapDNAbpに結合したPEgRNAとを含む細胞。 Embodiment 282. A cell comprising the fusion protein of any one of embodiments 213 to 242 and a PEgRNA bound to the napDNAbp of the fusion protein.

態様283.態様260-279のいずれか1つの複合体を含む細胞。 Embodiment 283. A cell comprising any one of the complexes of embodiments 260-279.

態様284.医薬組成物であって:(i)態様213~242のいずれかの融合タンパク質、態様260~279の複合体、態様68のポリヌクレオチド、または態様69のベクター;および(ii)薬学的に許容される賦形剤を含む。 Embodiment 284. A pharmaceutical composition comprising: (i) a fusion protein of any one of embodiments 213 to 242, a complex of embodiments 260 to 279, a polynucleotide of embodiment 68, or a vector of embodiment 69; and (ii) a pharma- ceutically acceptable excipient.

態様285.医薬組成物であって:(i)態様260~279の複合体、(ii)トランスで提供されるポリメラーゼ;および(iii)薬学的に許容される賦形剤を含む。 Embodiment 285. A pharmaceutical composition comprising: (i) a conjugate of any one of embodiments 260 to 279; (ii) a polymerase provided in trans; and (iii) a pharma- ceutically acceptable excipient.

態様286.キットであって:(i)態様213-242のいずれか1つの融合タンパク質をコードする核酸配列(nuleic acid sequencing);および(ii)(i)の配列の発現を駆動するプロモーターを含む核酸構築物を含む。 Embodiment 286. A kit comprising: (i) a nucleic acid construct comprising a nucleic acid sequence encoding a fusion protein of any one of embodiments 213-242; and (ii) a promoter driving expression of the sequence of (i).

態様287.所望のヌクレオチド変化を二本鎖DNA配列に組み入れるための方法であって、方法が: Embodiment 287. A method for incorporating a desired nucleotide change into a double-stranded DNA sequence, the method comprising:

(i)融合タンパク質およびPEgRNAを含む複合体と二本鎖DNA配列を接触させ、融合タンパク質がnapDNAbpおよびポリメラーゼを含み、PEgRNAが所望のヌクレオチド変化を含むDNA合成鋳型とプライマー結合部位とを含むこと; (i) contacting a double-stranded DNA sequence with a complex comprising a fusion protein and a PEgRNA, the fusion protein comprising napDNAbp and a polymerase, and the PEgRNA comprising a DNA synthesis template containing the desired nucleotide change and a primer binding site;

(ii)二本鎖DNA配列にニッキングし、それによって、3'端を有する遊離の一本鎖DNAを生成すること; (ii) nicking the double-stranded DNA sequence, thereby generating a free single-stranded DNA having a 3' end;

(iii)遊離の一本鎖DNAの3'端をプライマー結合部位にハイブリダイズさせ、それによってポリメラーゼをプライムすること; (iii) hybridizing the 3' end of the free single-stranded DNA to the primer binding site, thereby priming the polymerase;

(iv)プライマー結合部位にハイブリダイズした3'端からDNAの鎖を重合し、それによって、DNA合成鋳型に対して相補的であるかつ所望のヌクレオチド変化を含む一本鎖DNAフラップを生成すること; (iv) polymerizing a strand of DNA from the 3' end hybridized to the primer binding site, thereby generating a single-stranded DNA flap that is complementary to the DNA synthesis template and contains the desired nucleotide change;

(v)カットされた部位に隣接する内生DNA鎖を一本鎖DNAフラップによって置き換え、それによって所望のヌクレオチド変化を二本鎖DNA配列に組み入れること、
を含む。
(v) replacing the endogenous DNA strand adjacent to the cut site with a single-stranded DNA flap, thereby incorporating the desired nucleotide change into the double-stranded DNA sequence;
including.

態様288.態様287の方法であって、(v)置き換えるステップが:(i)一本鎖DNAフラップをカットされた部位に隣接する内生DNA鎖にハイブリダイズさせて、配列ミスマッチを生出すること;(ii)内生DNA鎖を切り出すこと;および(iii)ミスマッチを修復して、所望のヌクレオチド変化をDNAの両方の鎖に含む所望の産物を形成すること、を含む。 Embodiment 288. The method of embodiment 287, wherein (v) the replacing step comprises: (i) hybridizing a single-stranded DNA flap to the endogenous DNA strand adjacent to the cut site to generate a sequence mismatch; (ii) excising the endogenous DNA strand; and (iii) repairing the mismatch to form a desired product containing the desired nucleotide change in both strands of DNA.

態様289.態様288の方法であって、所望のヌクレオチド変化が1ヌクレオチド置換、欠失、または挿入である。 Embodiment 289. The method of embodiment 288, wherein the desired nucleotide change is a single nucleotide substitution, deletion, or insertion.

態様290.態様289の方法であって、1ヌクレオチド置換がトランジションまたはトランスバージョンである。 Embodiment 290. The method of embodiment 289, wherein the single nucleotide substitution is a transition or a transversion.

態様291.態様288の方法であって、所望のヌクレオチド変化が、(1)GからTの置換、(2)GからAの置換、(3)GからCの置換、(4)TからGの置換、(5)TからAの置換、(6)TからCの置換、(7)CからGの置換、(8)CからTの置換、(9)CからAの置換、(10)AからTの置換、(11)AからGの置換、または(12)AからCの置換である。 Embodiment 291. The method of embodiment 288, wherein the desired nucleotide change is (1) a G to T substitution, (2) a G to A substitution, (3) a G to C substitution, (4) a T to G substitution, (5) a T to A substitution, (6) a T to C substitution, (7) a C to G substitution, (8) a C to T substitution, (9) a C to A substitution, (10) an A to T substitution, (11) an A to G substitution, or (12) an A to C substitution.

態様292.態様288の方法であって、所望のヌクレオチド変化が、(1)G:C塩基対をT:A塩基対に、(2)G:C塩基対をA:T塩基対に、(3)G:C塩基対をC:G塩基対に、(4)T:A塩基対をG:C塩基対に、(5)T:A塩基対をA:T塩基対に、(6)T:A塩基対をC:G塩基対に、(7)C:G塩基対をG:C塩基対に、(8)C:G塩基対をT:A塩基対に、C:G塩基対をA:T塩基対に、(10)A:T塩基対をT:A塩基対に、(11)A:T塩基対をG:C塩基対に、または(12)A:T塩基対をC:G塩基対に変換する。 Embodiment 292. The method of embodiment 288, wherein the desired nucleotide change is (1) a G:C base pair to a T:A base pair, (2) a G:C base pair to an A:T base pair, (3) a G:C base pair to a C:G base pair, (4) a T:A base pair to a G:C base pair, (5) a T:A base pair to an A:T base pair, (6) a T:A base pair to a C:G base pair, (7) a C:G base pair to a G:C base pair, (8) a C:G base pair to a T:A base pair, a C:G base pair to an A:T base pair, (10) an A:T base pair to a T:A base pair, (11) an A:T base pair to a G:C base pair, or (12) a A:T base pair to a C:G base pair.

態様293.態様288の方法であって、所望のヌクレオチド変化が1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、または25ヌクレオチドの挿入または欠失である。 Embodiment 293. The method of embodiment 288, wherein the desired nucleotide change is an insertion or deletion of 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, or 25 nucleotides.

態様294.態様288の方法であって、所望のヌクレオチド変化が疾患関連遺伝子を修正する。 Embodiment 294. The method of embodiment 288, wherein the desired nucleotide change corrects a disease-associated gene.

態様295.態様294の方法であって、疾患関連遺伝子が:アデノシンデアミナーゼ(ADA)欠損症;アルファ-1アンチトリプシン欠損症;嚢胞性線維症;デュシェンヌ型筋ジストロフィー;ガラクトース血症;ヘモクロマトーシス;ハンチントン病;メープルシロップ尿症;マルファン症候群;1型神経線維腫症;先天性爪肥厚症;フェニルケトン尿症;重症複合免疫不全;鎌状赤血球症;スミス・レムリ・オピッツ症候群;トリヌクレオチド反復障害;プリオン病;およびテイ・サックス病からなる群から選択される単一遺伝子障害に関連する。 Embodiment 295. The method of embodiment 294, wherein the disease-associated gene is associated with a single gene disorder selected from the group consisting of: adenosine deaminase (ADA) deficiency; alpha-1 antitrypsin deficiency; cystic fibrosis; Duchenne muscular dystrophy; galactosemia; hemochromatosis; Huntington's disease; maple syrup urine disease; Marfan syndrome; neurofibromatosis type 1; pachyonychia congenita; phenylketonuria; severe combined immunodeficiency; sickle cell disease; Smith-Lemli-Opitz syndrome; trinucleotide repeat disorders; prion diseases; and Tay-Sachs disease.

態様296.態様294の方法であって、疾患関連遺伝子が:心臓病;高血圧;アルツハイマー病;関節炎;糖尿病;がん;および肥満からなる群から選択される多遺伝子性障害に関連する。 Embodiment 296. The method of embodiment 294, wherein the disease-associated gene is associated with a polygenic disorder selected from the group consisting of: heart disease; hypertension; Alzheimer's disease; arthritis; diabetes; cancer; and obesity.

態様297.態様287の方法であって、napDNAbpがヌクレアーゼ不活性型Cas9(dCas9)、Cas9ニッカーゼ(nCas9)、またはヌクレアーゼ活性Cas9である。 Embodiment 297. The method of embodiment 287, wherein the napDNAbp is a nuclease-inactive Cas9 (dCas9), a Cas9 nickase (nCas9), or a nuclease-active Cas9.

態様298.態様287の方法であって、napDNAbpが、配列番号18のアミノ酸配列、または配列番号18のアミノ酸配列との少なくとも80%、85%、90%、95%、98%、もしくは99%配列同一性を有するアミノ酸配列を含む。 Embodiment 298. The method of embodiment 287, wherein napDNAbp comprises an amino acid sequence of SEQ ID NO:18 or an amino acid sequence having at least 80%, 85%, 90%, 95%, 98%, or 99% sequence identity to the amino acid sequence of SEQ ID NO:18.

態様299.態様287の方法であって、napDNAbpが、配列番号18~88、126、130、137、141、147、153、157、445、460、467、および482~487のいずれか1つのアミノ酸配列との少なくとも80%、85%、90%、95%、98%、または99%配列同一性を有するアミノ酸配列を含む。 Embodiment 299. The method of embodiment 287, wherein the napDNAbp comprises an amino acid sequence having at least 80%, 85%, 90%, 95%, 98%, or 99% sequence identity to any one of the amino acid sequences of SEQ ID NOs: 18-88, 126, 130, 137, 141, 147, 153, 157, 445, 460, 467, and 482-487.

態様300.態様287の方法であって、ポリメラーゼが逆転写酵素であり、配列番号89~100、105~122、128~129、132、139、143、149、154、159、235、454、471、516、662、700、701~716、739~741、および766のアミノ酸配列のいずれか1つを含む。 Embodiment 300. The method of embodiment 287, wherein the polymerase is a reverse transcriptase and comprises any one of the amino acid sequences of SEQ ID NOs: 89-100, 105-122, 128-129, 132, 139, 143, 149, 154, 159, 235, 454, 471, 516, 662, 700, 701-716, 739-741, and 766.

態様301.態様287の方法であって、ポリメラーゼが逆転写酵素であり、配列番号89~100、105~122、128~129、132、139、143、149、154、159、235、454、471、516、662、700、701~716、739~741、および766のいずれか1つのアミノ酸配列との少なくとも80%、85%、90%、95%、98%、または99%配列同一性を有するアミノ酸配列を含む。 Embodiment 301. The method of embodiment 287, wherein the polymerase is a reverse transcriptase and comprises an amino acid sequence having at least 80%, 85%, 90%, 95%, 98%, or 99% sequence identity to any one of the amino acid sequences of SEQ ID NOs: 89-100, 105-122, 128-129, 132, 139, 143, 149, 154, 159, 235, 454, 471, 516, 662, 700, 701-716, 739-741, and 766.

態様302.態様287の方法であって、PEgRNAが核酸伸長アームをガイドRNAの3'もしくは5'端または分子内の位置付けに含み、伸長アームがDNA合成鋳型配列およびプライマー結合部位を含む。 Embodiment 302. The method of embodiment 287, wherein the PEGRNA comprises a nucleic acid extension arm at the 3' or 5' end of the guide RNA or positioned intramolecularly, the extension arm comprising a DNA synthesis template sequence and a primer binding site.

態様303.態様302の方法であって、伸長アームが、長さが少なくとも5ヌクレオチド、少なくとも6ヌクレオチド、少なくとも7ヌクレオチド、少なくとも8ヌクレオチド、少なくとも9ヌクレオチド、少なくとも10ヌクレオチド、少なくとも11ヌクレオチド、少なくとも12ヌクレオチド、少なくとも13ヌクレオチド、少なくとも14ヌクレオチド、少なくとも15ヌクレオチド、少なくとも16ヌクレオチド、少なくとも17ヌクレオチド、少なくとも18ヌクレオチド、少なくとも19ヌクレオチド、少なくとも20ヌクレオチド、少なくとも21ヌクレオチド、少なくとも22ヌクレオチド、少なくとも23ヌクレオチド、少なくとも24ヌクレオチド、または少なくとも25ヌクレオチドである。 Embodiment 303. The method of embodiment 302, wherein the extension arm is at least 5 nucleotides, at least 6 nucleotides, at least 7 nucleotides, at least 8 nucleotides, at least 9 nucleotides, at least 10 nucleotides, at least 11 nucleotides, at least 12 nucleotides, at least 13 nucleotides, at least 14 nucleotides, at least 15 nucleotides, at least 16 nucleotides, at least 17 nucleotides, at least 18 nucleotides, at least 19 nucleotides, at least 20 nucleotides, at least 21 nucleotides, at least 22 nucleotides, at least 23 nucleotides, at least 24 nucleotides, or at least 25 nucleotides in length.

態様304.態様287の方法であって、PEgRNAが、配列番号101~104、181~183、223~244、277、325~334、336、338、340、342、344、346、348、350、352、354、356、358、360、362、364、366、368、499~505、735~761、776~777からなる群から選択されるヌクレオチド配列を有する。 Embodiment 304. The method of embodiment 287, wherein the PEGRNA has a nucleotide sequence selected from the group consisting of SEQ ID NOs: 101-104, 181-183, 223-244, 277, 325-334, 336, 338, 340, 342, 344, 346, 348, 350, 352, 354, 356, 358, 360, 362, 364, 366, 368, 499-505, 735-761, and 776-777.

態様305.標的座位におけるDNA分子のヌクレオチド配列の1つ以上の変化を導入するための方法であって: Embodiment 305. A method for introducing one or more changes in the nucleotide sequence of a DNA molecule at a target locus, comprising:

(i)DNA分子を、核酸プログラム型DNA結合タンパク質(napDNAbp)およびnapDNAbpを標的座位へと標的化するPEgRNAと接触させ、PEgRNAが少なくとも1つの所望のヌクレオチド変化を含む逆転写酵素(RT)鋳型配列とプライマー結合部位とを含むこと; (i) contacting a DNA molecule with a nucleic acid programmable DNA binding protein (napDNAbp) and a PEgRNA that targets the napDNAbp to a target locus, the PEgRNA comprising a reverse transcriptase (RT) template sequence containing at least one desired nucleotide change and a primer binding site;

(ii)標的座位におけるDNA鎖の暴露された3'端を形成すること; (ii) forming an exposed 3' end of the DNA strand at the target locus;

(iii)暴露された3'端をプライマー結合部位にハイブリダイズさせて逆転写をプライムすること; (iii) hybridizing the exposed 3' end to a primer binding site to prime reverse transcription;

(iv)逆転写酵素によって、RT鋳型配列に基づく少なくとも1つの所望のヌクレオチド変化を含む一本鎖DNAフラップを合成すること;および (iv) synthesizing a single-stranded DNA flap containing at least one desired nucleotide change based on the RT template sequence by reverse transcriptase; and

(v)少なくとも1つの所望のヌクレオチド変化を対応する内生DNA上に組み込み、それによって、標的座位においてDNA分子のヌクレオチド配列の1つ以上の変化を導入すること、
を含む。
(v) incorporating at least one desired nucleotide change into the corresponding endogenous DNA, thereby introducing one or more changes in the nucleotide sequence of the DNA molecule at the target locus;
including.

態様306.態様305の方法であって、ヌクレオチド配列の1つ以上の変化がトランジションを含む。 Embodiment 306. The method of embodiment 305, wherein the one or more changes in the nucleotide sequence include a transition.

態様307.態様306の方法であって、トランジションが、(a)TからC;(b)AからG;(c)CからT;および(d)GからAからなる群から選択される。 Embodiment 307. The method of embodiment 306, wherein the transition is selected from the group consisting of: (a) T to C; (b) A to G; (c) C to T; and (d) G to A.

態様308.態様305の方法であって、ヌクレオチド配列の1つ以上の変化がトランスバージョンを含む。 Embodiment 308. The method of embodiment 305, wherein the one or more changes in the nucleotide sequence include a transversion.

態様309.態様308の方法であって、トランスバージョンが、(a)TからA;(b)TからG;(c)CからG;(d)CからA;(e)AからT;(f)AからC;(g)GからC;および(h)GからTからなる群から選択される。 Embodiment 309. The method of embodiment 308, wherein the transversion is selected from the group consisting of: (a) T to A; (b) T to G; (c) C to G; (d) C to A; (e) A to T; (f) A to C; (g) G to C; and (h) G to T.

態様310.態様305の方法であって、ヌクレオチド配列の1つ以上の変化が、(1)G:C塩基対をT:A塩基対に、(2)G:C塩基対をA:T塩基対に、(3)G:C塩基対をC:G塩基対に、(4)T:A塩基対をG:C塩基対に、(5)T:A塩基対をA:T塩基対に、(6)T:A塩基対をC:G塩基対に、(7)C:G塩基対をG:C塩基対に、(8)C:G塩基対をT:A塩基対に、(9)C:G塩基対をA:T塩基対に、(9)A:T塩基対をT:A塩基対に、(11)A:T塩基対をG:C塩基対に、または(12)A:T塩基対をC:G塩基対に変化させることを含む。 Embodiment 310. The method of embodiment 305, wherein the one or more changes in the nucleotide sequence include changing (1) a G:C base pair to a T:A base pair, (2) a G:C base pair to an A:T base pair, (3) a G:C base pair to a C:G base pair, (4) a T:A base pair to a G:C base pair, (5) a T:A base pair to an A:T base pair, (6) a T:A base pair to a C:G base pair, (7) a C:G base pair to a G:C base pair, (8) a C:G base pair to a T:A base pair, (9) a C:G base pair to an A:T base pair, (9) an A:T base pair to a T:A base pair, (11) an A:T base pair to a G:C base pair, or (12) an A:T base pair to a C:G base pair.

態様311.態様305の方法であって、ヌクレオチド配列の1つ以上の変化が、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、または25ヌクレオチドの挿入または欠失を含む。 Embodiment 311. The method of embodiment 305, wherein the one or more changes in the nucleotide sequence include an insertion or deletion of 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, or 25 nucleotides.

態様312.態様305の方法であって、ヌクレオチド配列の1つ以上の変化が疾患関連遺伝子の修正を含む。 Embodiment 312. The method of embodiment 305, wherein the one or more changes in the nucleotide sequence include correction of a disease-associated gene.

態様313.態様312の方法であって、疾患関連遺伝子が:アデノシンデアミナーゼ(ADA)欠損症;アルファ-1アンチトリプシン欠損症;嚢胞性線維症;デュシェンヌ型筋ジストロフィー;ガラクトース血症;ヘモクロマトーシス;ハンチントン病;メープルシロップ尿症;マルファン症候群;1型神経線維腫症;先天性爪肥厚症;フェニルケトン尿症;重症複合免疫不全;鎌状赤血球症;スミス・レムリ・オピッツ症候群;トリヌクレオチド反復障害;プリオン病;およびテイ・サックス病からなる群から選択される単一遺伝子障害に関連する。 Embodiment 313. The method of embodiment 312, wherein the disease-associated gene is associated with a single gene disorder selected from the group consisting of: adenosine deaminase (ADA) deficiency; alpha-1 antitrypsin deficiency; cystic fibrosis; Duchenne muscular dystrophy; galactosemia; hemochromatosis; Huntington's disease; maple syrup urine disease; Marfan syndrome; neurofibromatosis type 1; pachyonychia congenita; phenylketonuria; severe combined immunodeficiency; sickle cell disease; Smith-Lemli-Opitz syndrome; trinucleotide repeat disorders; prion diseases; and Tay-Sachs disease.

態様314.態様312の方法であって、疾患関連遺伝子が:心臓病;高血圧;アルツハイマー病;関節炎;糖尿病;がん;および肥満からなる群から選択される多遺伝子性障害に関連する。 Embodiment 314. The method of embodiment 312, wherein the disease-associated gene is associated with a polygenic disorder selected from the group consisting of: heart disease; high blood pressure; Alzheimer's disease; arthritis; diabetes; cancer; and obesity.

態様315.態様305の方法であって、napDNAbpがヌクレアーゼ活性Cas9またはそのバリアントである。 Embodiment 315. The method of embodiment 305, wherein napDNAbp is a nuclease-active Cas9 or a variant thereof.

態様316.態様305の方法であって、napDNAbpがヌクレアーゼ不活性型Cas9(dCas9)もしくはCas9ニッカーゼ(nCas9)またはそのバリアントである。 Embodiment 316. The method of embodiment 305, wherein the napDNAbp is a nuclease-inactivated Cas9 (dCas9) or Cas9 nickase (nCas9) or a variant thereof.

態様317.態様305の方法であって、napDNAbpが、配列番号18のアミノ酸配列、または配列番号18との少なくとも80%、85%、90%、95%、98%、もしくは99%配列同一性を有するアミノ酸配列を含む。 Embodiment 317. The method of embodiment 305, wherein napDNAbp comprises an amino acid sequence of SEQ ID NO:18, or an amino acid sequence having at least 80%, 85%, 90%, 95%, 98%, or 99% sequence identity to SEQ ID NO:18.

態様318.態様305の方法であって、napDNAbpが、配列番号18~88、126、130、137、141、147、153、157、445、460、467、および482~487のいずれか1つのアミノ酸配列との少なくとも80%、85%、90%、95%、98%、または99%配列同一性を有するアミノ酸配列を含む。 Embodiment 318. The method of embodiment 305, wherein the napDNAbp comprises an amino acid sequence having at least 80%, 85%, 90%, 95%, 98%, or 99% sequence identity to any one of the amino acid sequences of SEQ ID NOs: 18-88, 126, 130, 137, 141, 147, 153, 157, 445, 460, 467, and 482-487.

態様319.態様305の方法であって、逆転写酵素がトランスで導入される。 Embodiment 319. The method of embodiment 305, wherein the reverse transcriptase is introduced in trans.

態様320.態様305の方法であって、napDNAbpが逆転写酵素への融合体を含む。 Embodiment 320. The method of embodiment 305, wherein the napDNAbp comprises a fusion to a reverse transcriptase.

態様321.態様305の方法であって、逆転写酵素が、配列番号89~100、105~122、128~129、132、139、143、149、154、159、235、454、471、516、662、700、701~716、739~741、および766のアミノ酸配列のいずれか1つを含む。 Embodiment 321. The method of embodiment 305, wherein the reverse transcriptase comprises any one of the amino acid sequences of SEQ ID NOs: 89-100, 105-122, 128-129, 132, 139, 143, 149, 154, 159, 235, 454, 471, 516, 662, 700, 701-716, 739-741, and 766.

態様322.態様305の方法であって、逆転写酵素が、配列番号89~100、105~122、128~129、132、139、143、149、154、159、235、454、471、516、662、700、701~716、739~741、および766のいずれか1つのアミノ酸配列との少なくとも80%、85%、90%、95%、98%、または99%配列同一性を有するアミノ酸配列を含む。 Embodiment 322. The method of embodiment 305, wherein the reverse transcriptase comprises an amino acid sequence having at least 80%, 85%, 90%, 95%, 98%, or 99% sequence identity to any one of the amino acid sequences of SEQ ID NOs: 89-100, 105-122, 128-129, 132, 139, 143, 149, 154, 159, 235, 454, 471, 516, 662, 700, 701-716, 739-741, and 766.

態様323.態様305の方法であって、標的座位におけるDNA鎖の暴露された3'端を形成するステップが、ヌクレアーゼによってDNA鎖へニックを入れることを含む。 Embodiment 323. The method of embodiment 305, wherein the step of forming an exposed 3' end of the DNA strand at the target locus comprises nicking the DNA strand with a nuclease.

態様324.態様323の方法であって、ヌクレアーゼがトランスで提供され、提供される。 Embodiment 324. The method of embodiment 323, wherein the nuclease is provided in trans.

態様325.態様305の方法であって、標的座位におけるDNA鎖の暴露された3'端を形成するステップが、DNA鎖を化学的薬剤と接触させることを含む。 Embodiment 325. The method of embodiment 305, wherein the step of forming an exposed 3' end of the DNA strand at the target locus comprises contacting the DNA strand with a chemical agent.

態様326.態様305の方法であって、標的座位におけるDNA鎖の暴露された3'端を形成するステップが、複製エラーを導入することを含む。 Embodiment 326. The method of embodiment 305, wherein forming an exposed 3' end of the DNA strand at the target locus includes introducing a replication error.

態様327.態様305の方法であって、DNA分子をnapDNAbpおよびガイドRNAと接触させるステップがRループを形成する。 Embodiment 327. The method of embodiment 305, wherein contacting the DNA molecule with the napDNAbp and the guide RNA forms an R-loop.

態様328.態様327の方法であって、暴露された3'端が形成されるDNA鎖がRループ上にある。 Embodiment 328. The method of embodiment 327, wherein the DNA strand on which the exposed 3' end is formed is on an R-loop.

態様329.態様315の方法であって、PEgRNAが、逆転写酵素(RT)鋳型配列とプライマー結合部位とを含む伸長アームを含む。 Embodiment 329. The method of embodiment 315, wherein the PEGRNA comprises an extension arm that comprises a reverse transcriptase (RT) template sequence and a primer binding site.

態様330.態様329の方法であって、伸長アームが、ガイドRNAの3'端、ガイドRNAの5'端、またはガイドRNAの分子内の位置にある。 Embodiment 330. The method of embodiment 329, wherein the extension arm is at the 3' end of the guide RNA, the 5' end of the guide RNA, or at an intramolecular location of the guide RNA.

態様331.態様305の方法であって、PEgRNAが、さらに、リンカー、ステムループ、ヘアピン、トウループ、アプタマー、またはRNA-タンパク質動員ドメインからなる群から選択される少なくとも1つの追加の構造を含む。 Embodiment 331. The method of embodiment 305, wherein the PEGRNA further comprises at least one additional structure selected from the group consisting of a linker, a stem loop, a hairpin, a toe loop, an aptamer, or an RNA-protein recruitment domain.

態様332.態様305の方法であって、PEgRNAがさらに相同アームを含む。 Embodiment 332. The method of embodiment 305, wherein the PEgRNA further comprises a homology arm.

態様333.態様305の方法であって、RT鋳型配列が、対応する内生DNAに対して相同的である。 Embodiment 333. The method of embodiment 305, wherein the RT template sequence is homologous to the corresponding endogenous DNA.

態様334.プライム標的にプライムされた逆転写によって、標的座位におけるDNA分子のヌクレオチド配列の1つ以上の変化を導入するための方法であって、方法が:(a)標的座位におけるDNA分子を(i)核酸プログラム型DNA結合タンパク質(napDNAbp)および逆転写酵素を含む融合タンパク質ならびに(ii)所望のヌクレオチド変化を含むRT鋳型を含むガイドRNAと接触させること;(b)RT鋳型のプライム標的にプライムされた逆転写を行なって、所望のヌクレオチド変化を含む一本鎖DNAを生成すること;ならびに(c)DNA修復および/または複製プロセスによって標的座位におけるDNA分子上に所望のヌクレオチド変化を組み込むことを含む。 Embodiment 334. A method for introducing one or more changes in a nucleotide sequence of a DNA molecule at a target locus by primed reverse transcription, the method comprising: (a) contacting the DNA molecule at the target locus with (i) a fusion protein comprising a nucleic acid programmable DNA binding protein (napDNAbp) and a reverse transcriptase, and (ii) a guide RNA comprising an RT template comprising a desired nucleotide change; (b) performing primed reverse transcription of the RT template to generate a single-stranded DNA comprising the desired nucleotide change; and (c) incorporating the desired nucleotide change on the DNA molecule at the target locus by DNA repair and/or replication processes.

態様335.態様334の方法であって、RT鋳型が、ガイドRNAの3'端、ガイドRNAの5'端、またはガイドRNAの分子内の位置付けに位置付けられる。 Embodiment 335. The method of embodiment 334, wherein the RT template is located at the 3' end of the guide RNA, the 5' end of the guide RNA, or at an intramolecular location of the guide RNA.

態様336.態様334の方法であって、所望のヌクレオチド変化が、トランジション、トランスバージョン、挿入、もしくは欠失、またはそれらのいずれかの組み合わせを含む。 Embodiment 336. The method of embodiment 334, wherein the desired nucleotide change comprises a transition, a transversion, an insertion, or a deletion, or any combination thereof.

態様337.態様334の方法であって、所望のヌクレオチド変化が、(a)TからC;(b)AからG;(c)CからT;および(d)GからAからなる群から選択されるトランジションを含む。 Embodiment 337. The method of embodiment 334, wherein the desired nucleotide change comprises a transition selected from the group consisting of: (a) T to C; (b) A to G; (c) C to T; and (d) G to A.

態様338.請求項334の方法であって、所望のヌクレオチド変化が、(a)TからA;(b)TからG;(c)CからG;(d)CからA;(e)AからT;(f)AからC;(g)GからC;および(h)GからTからなる群から選択されるトランスバージョンを含む。 Embodiment 338. The method of claim 334, wherein the desired nucleotide change comprises a transversion selected from the group consisting of: (a) T to A; (b) T to G; (c) C to G; (d) C to A; (e) A to T; (f) A to C; (g) G to C; and (h) G to T.

態様339.態様334の方法であって、所望のヌクレオチド変化が、(1)G:C塩基対をT:A塩基対に、(2)G:C塩基対をA:T塩基対に、(3)G:C塩基対をC:G塩基対に、(4)T:A塩基対をG:C塩基対に、(5)T:A塩基対をA:T塩基対に、(6)T:A塩基対をC:G塩基対に、(7)C:G塩基対をG:C塩基対に、(8)C:G塩基対をT:A塩基対に、(9)C:G塩基対をA:T塩基対に、(10)A:T塩基対をT:A塩基対に、(11)A:T塩基対をG:C塩基対に、または(12)A:T塩基対をC:G塩基対に変化させることを含む。 Embodiment 339. The method of embodiment 334, wherein the desired nucleotide change comprises changing (1) a G:C base pair to a T:A base pair, (2) a G:C base pair to an A:T base pair, (3) a G:C base pair to a C:G base pair, (4) a T:A base pair to a G:C base pair, (5) a T:A base pair to an A:T base pair, (6) a T:A base pair to a C:G base pair, (7) a C:G base pair to a G:C base pair, (8) a C:G base pair to a T:A base pair, (9) a C:G base pair to an A:T base pair, (10) an A:T base pair to a T:A base pair, (11) an A:T base pair to a G:C base pair, or (12) an A:T base pair to a C:G base pair.

態様340.態様243-259のいずれか1つのPEgRNAをコードするポリヌクレオチド。 Embodiment 340. A polynucleotide encoding any one of the PEgRNAs of embodiments 243-259.

態様341.態様340のポリヌクレオチドを含むベクター。 Aspect 341. A vector comprising the polynucleotide of aspect 340.

態様342.態様341のベクターを含む細胞。 Aspect 342. A cell comprising the vector of aspect 341.

態様343.態様213の融合タンパク質であって、ポリメラーゼがエラーを起こしやすい逆転写酵素である。 Embodiment 343. The fusion protein of embodiment 213, wherein the polymerase is an error-prone reverse transcriptase.

態様344.プライム標的にプライムされた逆転写によって標的座位におけるDNA分子に変異導入するための方法であって、方法が:(a)標的座位におけるDNA分子を(i)核酸プログラム型DNA結合タンパク質(napDNAbp)およびエラーを起こしやすい逆転写酵素を含む融合タンパク質ならびに(ii)所望のヌクレオチド変化を含むRT鋳型を含むガイドRNAと接触させること;(b)RT鋳型のプライム標的にプライムされた逆転写を行なって、変異導入された一本鎖DNAを生成すること;ならびに(c)DNA修復および/または複製プロセスによって、変異導入された一本鎖DNAを標的座位におけるDNA分子上に組み込むことを含む。 Embodiment 344. A method for mutagenizing a DNA molecule at a target locus by primed reverse transcription, the method comprising: (a) contacting the DNA molecule at the target locus with (i) a fusion protein comprising a nucleic acid programmable DNA binding protein (napDNAbp) and an error-prone reverse transcriptase, and (ii) a guide RNA comprising an RT template comprising a desired nucleotide change; (b) performing primed reverse transcription of the RT template to generate a mutated single-stranded DNA; and (c) incorporating the mutated single-stranded DNA onto the DNA molecule at the target locus by DNA repair and/or replication processes.

態様345.いずれかの先行する態様の方法であって、融合タンパク質がPE1、PE2、またはPE3のアミノ酸配列を含む。 Embodiment 345. The method of any preceding embodiment, wherein the fusion protein comprises an amino acid sequence of PE1, PE2, or PE3.

態様346.いずれかの先行する態様の方法であって、napDNAbpがCas9ニッカーゼ(nCas9)である。 Embodiment 346. The method of any preceding embodiment, wherein the napDNAbp is a Cas9 nickase (nCas9).

態様347.態様344の方法であって、napDNAbpが配列番号18~88、126、130、137、141、147、153、157、445、460、467、および482~487のアミノ酸配列を含む。 Embodiment 347 The method of embodiment 344, wherein the napDNAbp comprises the amino acid sequence of SEQ ID NOs : 18-88, 126, 130, 137, 141, 147, 153, 157, 445, 460, 467, and 482-487 .

態様348.態様344の方法であって、ガイドRNAが配列番号222を含む。 Embodiment 348. The method of embodiment 344, wherein the guide RNA comprises SEQ ID NO: 222.

態様349.態様344の方法であって、(b)プライム標的にプライムされた逆転写を行うステップが、ガイドRNA上のプライマー結合部位へのアニーリングによって逆転写をプライムすることができる標的座位における3'端プライマー結合配列を生成することを含む。 Embodiment 349. The method of embodiment 344, wherein (b) performing primed reverse transcription on the primed target comprises generating a 3' end primer binding sequence at the target locus capable of priming reverse transcription by annealing to a primer binding site on the guide RNA.

態様350.健康な数の反復トリヌクレオチドを含む健康な配列によって標的DNA分子上のトリヌクレオチド反復拡大変異を置き換えるための方法であって、方法が:(a)標的座位におけるDNA分子を(i)核酸プログラム型DNA結合タンパク質(napDNAbp)およびポリメラーゼを含む融合タンパク質ならびに(ii)置き換え配列を含むDNA合成鋳型とプライマー結合部位とを含むPEgRNAと接触させること;(b)プライム編集を行なって、置き換え配列を含む一本鎖DNAを生成すること;ならびに(c)DNA修復および/または複製プロセスによって、標的座位におけるDNA分子上に一本鎖DNAを組み込むことを含む。 Embodiment 350. A method for replacing a trinucleotide repeat expansion mutation on a target DNA molecule with a healthy sequence containing a healthy number of repeated trinucleotides, the method comprising: (a) contacting a DNA molecule at a target locus with (i) a fusion protein comprising a nucleic acid programmable DNA binding protein (napDNAbp) and a polymerase and (ii) a DNA synthesis template comprising the replacement sequence and a PEgRNA comprising a primer binding site; (b) performing prime editing to generate a single-stranded DNA comprising the replacement sequence; and (c) incorporating the single-stranded DNA onto the DNA molecule at the target locus by DNA repair and/or replication processes.

態様351.態様350の方法であって、融合タンパク質がPE1、PE2、またはPE3のアミノ酸配列を含む。 Embodiment 351. The method of embodiment 350, wherein the fusion protein comprises an amino acid sequence of PE1, PE2, or PE3.

態様352.態様350の方法であって、napDNAbpがCas9ニッカーゼ(nCas9)である。 Embodiment 352. The method of embodiment 350, wherein the napDNAbp is Cas9 nickase (nCas9).

態様353.態様350の方法であって、napDNAbpが、配列番号18~88、126、130、137、141、147、153、157、445、460、467、および482~487のアミノ酸配列を含む。 Embodiment 353. The method of embodiment 350, wherein the napDNAbp comprises the amino acid sequence of SEQ ID NOs: 18-88, 126, 130, 137, 141, 147, 153, 157, 445, 460, 467, and 482-487.

態様354.態様350の方法であって、ガイドRNAが配列番号222を含む。 Embodiment 354. The method of embodiment 350, wherein the guide RNA comprises SEQ ID NO: 222.

態様355.態様350の方法であって、(b)プライム編集を行うステップが、ガイドRNA上のプライマー結合部位へのアニーリングによってポリメラーゼをプライムすることができる標的座位における3’端プライマー結合配列を生成することを含む。 Embodiment 355. The method of embodiment 350, wherein (b) the step of performing prime editing comprises generating a 3' end primer binding sequence at the target locus that can prime a polymerase by annealing to a primer binding site on the guide RNA.

態様356.態様350の方法であって、トリヌクレオチド反復拡大変異がハンチントン病、脆弱X症候群、またはフリードライヒ運動失調症に関連する。 Embodiment 356. The method of embodiment 350, wherein the trinucleotide repeat expansion mutation is associated with Huntington's disease, fragile X syndrome, or Friedreich's ataxia.

態様357.態様350の方法であって、トリヌクレオチド反復拡大変異がCAGトリプレットの繰り返し単位を含む。 Embodiment 357. The method of embodiment 350, wherein the trinucleotide repeat expansion mutation comprises a repeat unit of a CAG triplet.

態様358.態様350の方法であって、トリヌクレオチド反復拡大変異がGAAトリプレットの繰り返し単位を含む。 Embodiment 358. The method of embodiment 350, wherein the trinucleotide repeat expansion mutation comprises a repeat unit of a GAA triplet.

態様359.プライム編集によって、標的ヌクレオチド配列によってコードされる目当てのタンパク質上に機能部分を組み入れる方法であって、方法が:(a)標的ヌクレオチド配列を(i)核酸プログラム型DNA結合タンパク質(napDNAbp)およびポリメラーゼを含むプライム編集因子ならびに(ii)機能部分をコードするDNA合成鋳型を含むPEgRNAと接触させること;(b)機能部分をコードする一本鎖DNA配列を重合すること;ならびに(c)DNA修復および/または複製プロセスによって、標的ヌクレオチド配列における対応する内生鎖の代わりに一本鎖DNA配列を組み込むことを含み、方法が、目当てのタンパク質と機能部分とを含む融合タンパク質をコードする組み換え標的ヌクレオチド配列を生ずる。 Embodiment 359. A method for incorporating a functional moiety on a protein of interest encoded by a target nucleotide sequence by prime editing, the method comprising: (a) contacting the target nucleotide sequence with (i) a prime editing factor comprising a nucleic acid programmable DNA binding protein (napDNAbp) and a polymerase, and (ii) a PEgRNA comprising a DNA synthesis template encoding the functional moiety; (b) polymerizing a single-stranded DNA sequence encoding the functional moiety; and (c) incorporating the single-stranded DNA sequence in place of the corresponding endogenous strand in the target nucleotide sequence by DNA repair and/or replication processes, the method resulting in a recombinant target nucleotide sequence encoding a fusion protein comprising the protein of interest and the functional moiety.

態様360.態様359の方法であって、機能部分がペプチドタグである。 Embodiment 360. The method of embodiment 359, wherein the functional moiety is a peptide tag.

態様361.態様360の方法であって、ペプチドタグがアフィニティータグ、可溶化タグ、クロマトグラフィータグ、エピトープもしくは免疫エピトープタグ、または蛍光タグである。 Embodiment 361. The method of embodiment 360, wherein the peptide tag is an affinity tag, a solubilization tag, a chromatography tag, an epitope or immunoepitope tag, or a fluorescent tag.

態様362.態様360の方法であって、ペプチドタグが:AviTag(配列番号245);Cタグ(配列番号246);カルモジュリンタグ(配列番号247);ポリグルタミン酸タグ(配列番号248);Eタグ(配列番号249);FLAGタグ(配列番号2);HAタグ(配列番号5);Hisタグ(配列番号252-262);Mycタグ(配列番号6);NEタグ(配列番号264);Rho1D4タグ(配列番号265);Sタグ(配列番号266);SBPタグ(配列番号267);Softag-1(配列番号268);Softag-2(配列番号269);Spotタグ(配列番号270);Strepタグ(配列番号271);TCタグ(配列番号272);Tyタグ(配列番号273);V5タグ(配列番号3);VSVタグ(配列番号275);およびXpressタグ(配列番号276)からなる群から選択される。 Embodiment 362. The method of embodiment 360, wherein the peptide tag is selected from the group consisting of: AviTag (SEQ ID NO:245); C-tag (SEQ ID NO:246); Calmodulin tag (SEQ ID NO:247); Polyglutamic acid tag (SEQ ID NO:248); E-tag (SEQ ID NO:249); FLAG-tag (SEQ ID NO:2); HA-tag (SEQ ID NO:5); His-tag (SEQ ID NO:252-262); Myc-tag (SEQ ID NO:6); NE-tag (SEQ ID NO:264); Rho1D4-tag (SEQ ID NO:265); S-tag (SEQ ID NO:266); SBP-tag (SEQ ID NO:267); Softag-1 (SEQ ID NO:268); Softag-2 (SEQ ID NO:269); Spot-tag (SEQ ID NO:270); Strep-tag (SEQ ID NO:271); TC-tag (SEQ ID NO:272); Ty-tag (SEQ ID NO:273); V5-tag (SEQ ID NO:3); VSV-tag (SEQ ID NO:275); and Xpress-tag (SEQ ID NO:276).

態様363.態様360の方法であって、ペプチドタグが:AU1エピトープ(配列番号278);AU5エピトープ(配列番号279);バクテリオファージT7エピトープ(T7タグ)(配列番号280);ブルータングウイルスタグ(Bタグ)(配列番号281);E2エピトープ(配列番号282);ヒスチジンアフィニティータグ(HAT)(配列番号283);HSVエピトープ(配列番号284);ポリアルギニン(Argタグ)(配列番号285);ポリアスパラギン酸(Aspタグ)(配列番号286);ポリフェニルアラニン(Pheタグ)(配列番号287);S1タグ(配列番号288);Sタグ(配列番号266);およびVSV-G(配列番号275)からなる群から選択される。 Embodiment 363. The method of embodiment 360, wherein the peptide tag is selected from the group consisting of: AU1 epitope (SEQ ID NO:278); AU5 epitope (SEQ ID NO:279); bacteriophage T7 epitope (T7 tag) (SEQ ID NO:280); bluetongue virus tag (B tag) (SEQ ID NO:281); E2 epitope (SEQ ID NO:282); histidine affinity tag (HAT) (SEQ ID NO:283); HSV epitope (SEQ ID NO:284); polyarginine (Arg tag) (SEQ ID NO:285); polyaspartic acid (Asp tag) (SEQ ID NO:286); polyphenylalanine (Phe tag) (SEQ ID NO:287); S1 tag (SEQ ID NO:288); S tag (SEQ ID NO:266); and VSV-G (SEQ ID NO:275).

態様364.態様359の方法であって、機能部分が免疫エピトープである。 Embodiment 364. The method of embodiment 359, wherein the functional moiety is an immune epitope.

態様365.態様364の方法であって、免疫エピトープが:破傷風トキソイド(配列番号396);ジフテリア毒素変異体CRM197(配列番号630);ムンプス免疫エピトープ1(配列番号400);ムンプス免疫エピトープ2(配列番号402);ムンプス免疫エピトープ3(配列番号404);風疹ウイルス(配列番号406);ヘマグルチニン(配列番号408);ノイラミニダーゼ(配列番号410);TAP1(配列番号412);TAP2(配列番号414);クラスI HLAに対するヘマグルチニンエピトープ(配列番号416);クラスI HLAに対するノイラミニダーゼエピトープ(配列番号418);クラスII HLAに対するヘマグルチニンエピトープ(配列番号420);クラスII HLAに対するノイラミニダーゼエピトープ(配列番号422);ヘマグルチニンエピトープH5N1結合クラスIおよびクラスII HLA(配列番号424);ノイラミニダーゼエピトープH5N1結合クラスIおよびクラスII HLA(配列番号426)からなる群から選択される。 365. The method of 364, wherein the immune epitope is selected from the group consisting of: tetanus toxoid (SEQ ID NO: 396); diphtheria toxin variant CRM197 (SEQ ID NO: 630); mumps immune epitope 1 (SEQ ID NO: 400); mumps immune epitope 2 (SEQ ID NO: 402); mumps immune epitope 3 (SEQ ID NO: 404); rubella virus (SEQ ID NO: 406); hemagglutinin (SEQ ID NO: 408); neuraminidase (SEQ ID NO: 410); TAP1 (SEQ ID NO: 412); TAP2 (SEQ ID NO: 414); hemagglutinin epitope for class I HLA (SEQ ID NO: 416); neuraminidase epitope for class I HLA (SEQ ID NO: 418); hemagglutinin epitope for class II HLA (SEQ ID NO: 420); neuraminidase epitope for class II HLA (SEQ ID NO: 422); hemagglutinin epitope H5N1 binding class I and class II HLA (SEQ ID NO: 424); Selected from the group consisting of neuraminidase epitope H5N1-binding class I and class II HLA (SEQ ID NO: 426).

態様366.態様359の方法であって、機能部分が目当てのタンパク質の局在を変改する。 Embodiment 366. The method of embodiment 359, wherein the functional moiety alters the localization of the protein of interest.

態様367.態様359の方法であって、機能部分が分解タグであり、その結果、目当てのタンパク質の分解速度が変改される。 Embodiment 367. The method of embodiment 359, wherein the functional moiety is a degradation tag, such that the degradation rate of the protein of interest is altered.

態様368.態様367の方法であって、分解タグが、タグ付けされたタンパク質の消去をもたらす。 Embodiment 368. The method of embodiment 367, wherein the degradation tag results in elimination of the tagged protein.

態様369.態様359の方法であって、機能部分が低分子結合ドメインである。 Embodiment 369. The method of embodiment 359, wherein the functional moiety is a small molecule binding domain.

態様370.態様359の方法であって、低分子結合ドメインが配列番号488のFKBP12である。 Embodiment 370. The method of embodiment 359, wherein the small molecule binding domain is FKBP12 of SEQ ID NO:488.

態様371.態様359の方法であって、低分子結合ドメインが配列番号489のFKBP12-F36Vである。 Embodiment 371. The method of embodiment 359, wherein the small molecule binding domain is FKBP12-F36V of SEQ ID NO:489.

態様372.態様359の方法であって、低分子結合ドメインが配列番号490および493~494のシクロフィリンである。 Embodiment 372. The method of embodiment 359, wherein the small molecule binding domain is a cyclophilin of SEQ ID NOs: 490 and 493-494.

態様373.態様359の方法であって、低分子結合ドメインが目当ての2つ以上のタンパク質上に組み入れされる。 Embodiment 373. The method of embodiment 359, wherein the small molecule binding domains are incorporated onto two or more proteins of interest.

態様374.態様373の方法であって、目当ての2つ以上のタンパク質が低分子と接触することによって二量体化し得る。 Embodiment 374. The method of embodiment 373, wherein two or more proteins of interest can be dimerized by contact with a small molecule.

態様375.態様369の方法であって、低分子が、群1の態様163に開示される化合物からなる群から選択される低分子の二量体である。 Embodiment 375. The method of embodiment 369, wherein the small molecule is a dimer of a small molecule selected from the group consisting of the compounds disclosed in embodiment 163 of group 1.

態様376.プライム編集によって、標的ヌクレオチド配列によってコードされる目当てのタンパク質上に免疫エピトープを組み入れる方法であって、方法が:(a)標的ヌクレオチド配列を(i)核酸プログラム型DNA結合タンパク質(napDNAbp)およびポリメラーゼを含むプライム編集因子ならびに(ii)機能部分をコードする編集鋳型を含むPEgRNAと接触させること;(b)免疫エピトープをコードする一本鎖DNA配列を重合すること;ならびに(c)DNA修復および/または複製プロセスによって、標的ヌクレオチド配列における対応する内生鎖の代わりに一本鎖DNA配列を組み込むことを含み、方法が、目当てのタンパク質と免疫エピトープとを含む融合タンパク質をコードする組み換え標的ヌクレオチド配列を生ずる。 Embodiment 376. A method for incorporating an immune epitope onto a protein of interest encoded by a target nucleotide sequence by prime editing, the method comprising: (a) contacting the target nucleotide sequence with (i) a prime editing factor comprising a nucleic acid programmable DNA binding protein (napDNAbp) and a polymerase, and (ii) a PEgRNA comprising an editing template encoding a functional moiety; (b) polymerizing a single-stranded DNA sequence encoding the immune epitope; and (c) incorporating the single-stranded DNA sequence in place of the corresponding endogenous strand in the target nucleotide sequence by DNA repair and/or replication processes, the method resulting in a recombinant target nucleotide sequence encoding a fusion protein comprising the protein of interest and the immune epitope.

態様377.態様376の方法であって、免疫エピトープが:破傷風トキソイド(配列番号396);ジフテリア毒素変異体CRM197(配列番号630);ムンプス免疫エピトープ1(配列番号400);ムンプス免疫エピトープ2(配列番号402);ムンプス免疫エピトープ3(配列番号404);風疹ウイルス(配列番号406);ヘマグルチニン(配列番号408);ノイラミニダーゼ(配列番号410);TAP1(配列番号412);TAP2(配列番号414);クラスI HLAに対するヘマグルチニンエピトープ(配列番号416);クラスI HLAに対するノイラミニダーゼエピトープ(配列番号418);クラスII HLAに対するヘマグルチニンエピトープ(配列番号420);クラスII HLAに対するノイラミニダーゼエピトープ(配列番号422);ヘマグルチニンエピトープH5N1結合クラスIおよびクラスII HLA(配列番号424);ノイラミニダーゼエピトープH5N1結合クラスIおよびクラスII HLA(配列番号426)からなる群から選択される。 377. The method of 376, wherein the immune epitope is selected from the group consisting of: tetanus toxoid (SEQ ID NO: 396); diphtheria toxin variant CRM197 (SEQ ID NO: 630); mumps immune epitope 1 (SEQ ID NO: 400); mumps immune epitope 2 (SEQ ID NO: 402); mumps immune epitope 3 (SEQ ID NO: 404); rubella virus (SEQ ID NO: 406); hemagglutinin (SEQ ID NO: 408); neuraminidase (SEQ ID NO: 410); TAP1 (SEQ ID NO: 412); TAP2 (SEQ ID NO: 414); hemagglutinin epitope for class I HLA (SEQ ID NO: 416); neuraminidase epitope for class I HLA (SEQ ID NO: 418); hemagglutinin epitope for class II HLA (SEQ ID NO: 420); neuraminidase epitope for class II HLA (SEQ ID NO: 422); hemagglutinin epitope H5N1 binding class I and class II HLA (SEQ ID NO: 424); Selected from the group consisting of neuraminidase epitope H5N1-binding class I and class II HLA (SEQ ID NO: 426).

態様378.態様376の方法であって、融合タンパク質がPE1、PE2、またはPE3のアミノ酸配列を含む。 Embodiment 378. The method of embodiment 376, wherein the fusion protein comprises an amino acid sequence of PE1, PE2, or PE3.

態様379.態様376の方法であって、napDNAbpがCas9ニッカーゼ(nCas9)である。 Embodiment 379. The method of embodiment 376, wherein the napDNAbp is Cas9 nickase (nCas9).

態様380.態様376の方法であって、napDNAbpが、配列番号18~88、126、130、137、141、147、153、157、445、460、467、および482~487のアミノ酸配列を含む。 Embodiment 380. The method of embodiment 376, wherein the napDNAbp comprises the amino acid sequence of SEQ ID NOs: 18-88, 126, 130, 137, 141, 147, 153, 157, 445, 460, 467, and 482-487.

態様381.態様376の方法であって、PEgRNAが、配列番号101~104、181~183、223~244、277、325~334、336、338、340、342、344、346、348、350、352、354、356、358、360、362、364、366、368、499~505、735~761、776~777を含む。 Embodiment 381. The method of embodiment 376, wherein the PEGRNA comprises SEQ ID NOs: 101-104, 181-183, 223-244, 277, 325-334, 336, 338, 340, 342, 344, 346, 348, 350, 352, 354, 356, 358, 360, 362, 364, 366, 368, 499-505, 735-761, 776-777.

態様382.プライム編集によって、標的ヌクレオチド配列によってコードされる目当てのタンパク質上に低分子二量体化ドメインを組み入れる方法であって、方法が:(a)標的ヌクレオチド配列を(i)核酸プログラム型DNA結合タンパク質(napDNAbp)およびポリメラーゼを含むプライム編集因子ならびに(ii)低分子二量体化ドメインをコードする編集鋳型を含むPEgRNAと接触させること;(b)免疫エピトープをコードする一本鎖DNA配列を重合すること;ならびに(c)DNA修復および/または複製プロセスによって、標的ヌクレオチド配列における対応する内生鎖の代わりに一本鎖DNA配列を組み込むことを含み、方法が、目当てのタンパク質と低分子二量体化ドメインとを含む融合タンパク質をコードする組み換え標的ヌクレオチド配列を生ずる。 Embodiment 382. A method for incorporating a small dimerization domain onto a protein of interest encoded by a target nucleotide sequence by prime editing, the method comprising: (a) contacting the target nucleotide sequence with (i) a prime editing factor comprising a nucleic acid programmable DNA binding protein (napDNAbp) and a polymerase, and (ii) a PEgRNA comprising an editing template encoding the small dimerization domain; (b) polymerizing a single-stranded DNA sequence encoding an immune epitope; and (c) incorporating the single-stranded DNA sequence in place of the corresponding endogenous strand in the target nucleotide sequence by DNA repair and/or replication processes, the method producing a recombinant target nucleotide sequence encoding a fusion protein comprising the protein of interest and the small dimerization domain.

態様383.態様382の方法であって、さらに、目当ての第2のタンパク質に対して方法を行うことを含む。 Embodiment 383. The method of embodiment 382, further comprising performing the method on a second protein of interest.

態様384.態様383の方法であって、目当ての第1のタンパク質および目当ての第2のタンパク質が、前記タンパク質の夫々の二量体化ドメインに結合する低分子の存在下において二量体化する。 Embodiment 384. The method of embodiment 383, wherein the first protein of interest and the second protein of interest dimerize in the presence of a small molecule that binds to the dimerization domains of each of the proteins.

態様385.態様382の方法であって、低分子結合ドメインが配列番号488のFKBP12である。 Embodiment 385. The method of embodiment 382, wherein the small molecule binding domain is FKBP12 of SEQ ID NO:488.

態様386.態様382の方法であって、低分子結合ドメインが配列番号489のFKBP12-F36Vである。 Embodiment 386. The method of embodiment 382, wherein the small molecule binding domain is FKBP12-F36V of SEQ ID NO:489.

態様387.態様382の方法であって、低分子結合ドメインが配列番号490および493~494のシクロフィリンである。 Embodiment 387. The method of embodiment 382, wherein the small molecule binding domain is a cyclophilin of SEQ ID NOs: 490 and 493-494.

態様388.態様382の方法であって、低分子が、群1の態様163に開示される化合物からなる群から選択される低分子の二量体である。 Embodiment 388. The method of embodiment 382, wherein the small molecule is a dimer of a small molecule selected from the group consisting of the compounds disclosed in embodiment 163 of group 1.

態様389.態様382の方法であって、融合タンパク質がPE1、PE2、またはPE3のアミノ酸配列を含む。 Embodiment 389. The method of embodiment 382, wherein the fusion protein comprises an amino acid sequence of PE1, PE2, or PE3.

態様390.態様382の方法であって、napDNAbpがCas9ニッカーゼ(nCas9)である。 Embodiment 390. The method of embodiment 382, wherein the napDNAbp is Cas9 nickase (nCas9).

態様391.態様382の方法であって、napDNAbpが、配列番号18~88、126、130、137、141、147、153、157、445、460、467、および482~487のアミノ酸配列を含む。 Embodiment 391. The method of embodiment 382, wherein the napDNAbp comprises the amino acid sequence of SEQ ID NOs: 18-88, 126, 130, 137, 141, 147, 153, 157, 445, 460, 467, and 482-487.

態様392.態様382の方法であって、PEgRNAが、配列番号101~104、181~183、223~244、277、325~334、336、338、340、342、344、346、348、350、352、354、356、358、360、362、364、366、368、499~505、735~761、776~777を含む。 Embodiment 392. The method of embodiment 382, wherein the PEGRNA comprises SEQ ID NOs: 101-104, 181-183, 223-244, 277, 325-334, 336, 338, 340, 342, 344, 346, 348, 350, 352, 354, 356, 358, 360, 362, 364, 366, 368, 499-505, 735-761, 776-777.

態様393.プライム編集を用いてタンパク質上にペプチドタグまたはエピトープを組み入れる方法であって:タンパク質をコードする標的ヌクレオチド配列を、ペプチドタグをコードする第2のヌクレオチド配列をそれに挿入するように構成されたプライム編集因子構築物と接触させて、組み換えヌクレオチド配列をもたらすことを含み、その結果、ペプチドタグおよびタンパク質が融合タンパク質として組み換えヌクレオチド配列から発現される。 Embodiment 393. A method of incorporating a peptide tag or epitope onto a protein using prime editing, comprising: contacting a target nucleotide sequence encoding a protein with a prime editor construct configured to insert therein a second nucleotide sequence encoding a peptide tag, resulting in a recombinant nucleotide sequence, such that the peptide tag and the protein are expressed from the recombinant nucleotide sequence as a fusion protein.

態様394.態様383の方法であって、ペプチドタグがタンパク質の精製および/または検出に用いられる。 Embodiment 394. The method of embodiment 383, wherein the peptide tag is used for purifying and/or detecting the protein.

態様395.態様383の方法であって、ペプチドタグが、ポリヒスチジン(例えば、HHHHHH)(配列番号252~262)、FLAG(例えば、DYKDDDDK)(配列番号2)、V5(例えば、GKPIPNPLLGLDST)(配列番号3)、GCN4、HA(例えば、YPYDVPDYA)(配列番号5)、Myc(例えばEQKLISEED)(配列番号6)、またはGSTである。 Embodiment 395. The method of embodiment 383, wherein the peptide tag is polyhistidine (e.g., HHHHHH) (SEQ ID NOs: 252-262), FLAG (e.g., DYKDDDDK) (SEQ ID NO: 2), V5 (e.g., GKPIPNPLLGLDST) (SEQ ID NO: 3), GCN4, HA (e.g., YPYDVPDYA) (SEQ ID NO: 5), Myc (e.g., EQKLISEED) (SEQ ID NO: 6), or GST.

態様396.態様383の方法であって、ペプチドタグが、配列番号1~6、245~249、252~262、264~273、275~276、281、278~288、および622からなる群から選択されるアミノ酸配列を有する。 Embodiment 396. The method of embodiment 383, wherein the peptide tag has an amino acid sequence selected from the group consisting of SEQ ID NOs: 1-6, 245-249, 252-262, 264-273, 275-276, 281, 278-288, and 622.

態様397.態様383の方法であって、ペプチドタグがリンカーによってタンパク質に融合される。 Embodiment 397. The method of embodiment 383, wherein the peptide tag is fused to the protein by a linker.

態様398.態様383の方法であって、融合タンパク質が次の構造を有し:[タンパク質]-[ペプチドタグ]または[ペプチドタグ]-[タンパク質]、「]-[」が任意のリンカーを表す。 Embodiment 398. The method of embodiment 383, wherein the fusion protein has the following structure: [protein]-[peptide tag] or [peptide tag]-[protein], where "]-[" represents an optional linker.

態様399.態様383の方法であって、リンカーが配列番号127、165~176、446、453、および767~769のアミノ酸配列を有する。 Embodiment 399. The method of embodiment 383, wherein the linker has an amino acid sequence of SEQ ID NOs: 127, 165-176, 446, 453, and 767-769.

態様400.態様383の方法であって、プライム編集因子構築物が、配列番号101~104、181~183、223~244、277、325~334、336、338、340、342、344、346、348、350、352、354、356、358、360、362、364、366、368、499~505、735-761、776-777のヌクレオチド配列を含むPEgRNAを含む。 Embodiment 400. The method of embodiment 383, wherein the prime editor construct comprises a PEgRNA comprising a nucleotide sequence of SEQ ID NOs: 101-104, 181-183, 223-244, 277, 325-334, 336, 338, 340, 342, 344, 346, 348, 350, 352, 354, 356, 358, 360, 362, 364, 366, 368, 499-505, 735-761, 776-777.

態様401.態様383の方法であって、PEgRNAがスペーサー、gRNAコア、および伸長アームを含み、スペーサーが標的ヌクレオチド配列に対して相補的であり、伸長アームがペプチドタグをコードする逆転写酵素鋳型を含む。 Embodiment 401. The method of embodiment 383, wherein the PEGRNA comprises a spacer, a gRNA core, and an extension arm, the spacer being complementary to a target nucleotide sequence, and the extension arm comprises a reverse transcriptase template encoding a peptide tag.

態様402.態様383の方法であって、PEgRNAがスペーサー、gRNAコア、および伸長アームを含み、スペーサーが標的ヌクレオチド配列に対して相補的であり、伸長アームがペプチドタグをコードする逆転写酵素鋳型を含む。 Embodiment 402. The method of embodiment 383, wherein the PEGRNA comprises a spacer, a gRNA core, and an extension arm, the spacer being complementary to a target nucleotide sequence, and the extension arm comprises a reverse transcriptase template encoding a peptide tag.

態様403.プライム編集によって標的ヌクレオチド配列によってコードされるPRNP上に1つ以上の防護性変異を組み入れることによって、プリオン病を防止またはその進行を停止させる方法であって、方法が:(a)標的ヌクレオチド配列を(i)核酸プログラム型DNA結合タンパク質(napDNAbp)およびポリメラーゼを含むプライム編集因子ならびに(ii)機能部分をコードする編集鋳型を含むPEgRNAと接触させること;(b)防護性変異をコードする一本鎖DNA配列を重合すること;ならびに(c)DNA修復および/または複製プロセスによって、標的ヌクレオチド配列における対応する内生鎖の代わりに一本鎖DNA配列を組み込むことを含み、方法が、ミスフォールディングに対して耐性である防護性変異を含むPRNPをコードする組み換え標的ヌクレオチド配列を生ずる。 Embodiment 403. A method for preventing or halting the progression of prion disease by incorporating one or more protective mutations in a PRNP encoded by a target nucleotide sequence by prime editing, the method comprising: (a) contacting the target nucleotide sequence with (i) a prime editing factor comprising a nucleic acid programmable DNA binding protein (napDNAbp) and a polymerase, and (ii) a PEgRNA comprising an editing template encoding a functional moiety; (b) polymerizing a single-stranded DNA sequence encoding the protective mutation; and (c) incorporating the single-stranded DNA sequence in place of the corresponding endogenous strand in the target nucleotide sequence by DNA repair and/or replication processes, the method resulting in a recombinant target nucleotide sequence encoding a PRNP containing a protective mutation that is resistant to misfolding.

態様404.態様403の方法であって、プリオン病がヒトプリオン病である。 Aspect 404. The method of aspect 403, wherein the prion disease is a human prion disease.

態様405.態様403の方法であって、プリオン病が動物プリオン病である。 Aspect 405. The method of aspect 403, wherein the prion disease is an animal prion disease.

態様406.態様404の方法であって、プリオン病がクロイツフェルト・ヤコブ病(CJD)、変異型クロイツフェルト・ヤコブ病(vCJD)、ゲルストマン・ストロイスラー・シャインカー症候群、致死性家族性不眠症、またはクールー病である。 Aspect 406. The method of aspect 404, wherein the prion disease is Creutzfeldt-Jakob disease (CJD), variant Creutzfeldt-Jakob disease (vCJD), Gerstmann-Straussler-Scheinker syndrome, fatal familial insomnia, or kuru.

態様407.態様403の方法であって、プリオン病が牛海綿状脳症(BSEまたは「狂牛病」)、慢性消耗病(CWD)、スクレイピー、伝達性ミンク脳症、ネコ海綿状脳症、および有蹄類海綿状脳症である。 Embodiment 407. The method of embodiment 403, wherein the prion disease is bovine spongiform encephalopathy (BSE or "mad cow disease"), chronic wasting disease (CWD), scrapie, transmissible mink encephalopathy, feline spongiform encephalopathy, and ungulate spongiform encephalopathy.

態様408.態様403の方法であって、野生型PRNPアミノ酸配列が配列番号291~292である。 Embodiment 408. The method of embodiment 403, wherein the wild-type PRNP amino acid sequence is SEQ ID NOs: 291-292.

態様409.態様403の方法であって、方法が、配列番号293~309、311~323からなる群から選択される改変されたPRNPアミノ酸配列をもたらし、前記改変されたPRNPタンパク質がミスフォールディングに対して耐性である。 Embodiment 409. The method of embodiment 403, wherein the method results in a modified PRNP amino acid sequence selected from the group consisting of SEQ ID NOs: 293-309, 311-323, and the modified PRNP protein is resistant to misfolding.

態様410.態様403の方法であって、融合タンパク質がPE1、PE2、またはPE3のアミノ酸配列を含む。 Embodiment 410. The method of embodiment 403, wherein the fusion protein comprises an amino acid sequence of PE1, PE2, or PE3.

態様411.態様403の方法であって、napDNAbpがCas9ニッカーゼ(nCas9)である。 Embodiment 411. The method of embodiment 403, wherein the napDNAbp is Cas9 nickase (nCas9).

態様412.態様403の方法であって、napDNAbpが、配列番号18~88、126、130、137、141、147、153、157、445、460、467、および482~487のアミノ酸配列を含む。 Embodiment 412. The method of embodiment 403, wherein the napDNAbp comprises the amino acid sequence of SEQ ID NOs: 18-88, 126, 130, 137, 141, 147, 153, 157, 445, 460, 467, and 482-487.

態様413.態様403の方法であって、PEgRNAが、配列番号101~104、181~183、223~244、277、325~334、336、338、340、342、344、346、348、350、352、354、356、358、360、362、364、366、368、499~505、735~761、776~777を含む。 Embodiment 413. The method of embodiment 403, wherein the PEGRNA comprises SEQ ID NOs: 101-104, 181-183, 223-244, 277, 325-334, 336, 338, 340, 342, 344, 346, 348, 350, 352, 354, 356, 358, 360, 362, 364, 366, 368, 499-505, 735-761, 776-777.

態様414.プライム編集によって、標的ヌクレオチド配列によってコードされる目当てのRNA上にリボヌクレオチドモチーフまたはタグを組み入れる方法であって、方法が:(a)標的ヌクレオチド配列を(i)核酸プログラム型DNA結合タンパク質(napDNAbp)およびポリメラーゼを含むプライム編集因子ならびに(ii)リボヌクレオチドモチーフまたはタグをコードする編集鋳型を含むPEgRNAと接触させること;(b)リボヌクレオチドモチーフまたはタグをコードする一本鎖DNA配列を重合すること;ならびに(c)DNA修復および/または複製プロセスによって、標的ヌクレオチド配列における対応する内生鎖の代わりに一本鎖DNA配列を組み込むことを含み、方法が、リボヌクレオチドモチーフまたはタグを含む目当ての修飾されたRNAをコードする組み換え標的ヌクレオチド配列を生ずる。 Embodiment 414. A method for incorporating a ribonucleotide motif or tag onto a desired RNA encoded by a target nucleotide sequence by prime editing, the method comprising: (a) contacting the target nucleotide sequence with (i) a prime editing factor comprising a nucleic acid programmable DNA binding protein (napDNAbp) and a polymerase, and (ii) a PEgRNA comprising an editing template encoding the ribonucleotide motif or tag; (b) polymerizing a single-stranded DNA sequence encoding the ribonucleotide motif or tag; and (c) incorporating the single-stranded DNA sequence in place of the corresponding endogenous strand in the target nucleotide sequence by DNA repair and/or replication processes, the method producing a recombinant target nucleotide sequence encoding a modified RNA of interest comprising the ribonucleotide motif or tag.

態様415.態様414の方法であって、リボヌクレオチドモチーフまたはタグが検出部分である。 Embodiment 415. The method of embodiment 414, wherein the ribonucleotide motif or tag is the detection moiety.

態様416.態様414の方法であって、リボヌクレオチドモチーフまたはタグが目当てのRNAの発現レベルに影響する。 Embodiment 416. The method of embodiment 414, wherein the ribonucleotide motif or tag affects the expression level of the RNA of interest.

態様417.態様414の方法であって、リボヌクレオチドモチーフまたはタグが目当てのRNAの輸送または細胞下レベル位置付けに影響する。 Embodiment 417. The method of embodiment 414, wherein the ribonucleotide motif or tag affects transport or subcellular location of the RNA of interest.

態様418.態様414の方法であって、リボヌクレオチドモチーフまたはタグが、SV40 1型、SV40 2型、SV40 3型、hGH、BGH、rbGlob、TK、MALAT1 ENE-mascRNA、KSHV PAN ENE、Smbox/U1 snRNAボックス、U1 snRNA 3’ボックス、tRNA-リジン、broccoliアプタマー、spinachアプタマー、mangoアプタマー、HDVリボザイム、およびm6Aからなる群から選択される。 Embodiment 418. The method of embodiment 414, wherein the ribonucleotide motif or tag is selected from the group consisting of SV40 type 1, SV40 type 2, SV40 type 3, hGH, BGH, rbGlob, TK, MALAT1 ENE-mascRNA, KSHV PAN ENE, Smbox/U1 snRNA box, U1 snRNA 3' box, tRNA-lysine, broccoli aptamer, spinach aptamer, mango aptamer, HDV ribozyme, and m6A.

態様419.態様414の方法であって、PEgRNAが、配列番号101~104、181~183、223~244、277、325~334、336、338、340、342、344、346、348、350、352、354、356、358、360、362、364、366、368、499~505、735~761、776~777を含む。 Embodiment 419. The method of embodiment 414, wherein the PEGRNA comprises SEQ ID NOs: 101-104, 181-183, 223-244, 277, 325-334, 336, 338, 340, 342, 344, 346, 348, 350, 352, 354, 356, 358, 360, 362, 364, 366, 368, 499-505, 735-761, 776-777.

態様420.態様414の方法であって、融合タンパク質がPE1、PE2、またはPE3のアミノ酸配列を含む。 Embodiment 420. The method of embodiment 414, wherein the fusion protein comprises an amino acid sequence of PE1, PE2, or PE3.

態様421.態様414の方法であって、napDNAbpがCas9ニッカーゼ(nCas9)である。 Embodiment 421. The method of embodiment 414, wherein the napDNAbp is Cas9 nickase (nCas9).

態様422.態様414の方法であって、napDNAbpが、配列番号18~88、126、130、137、141、147、153、157、445、460、467、および482~487のアミノ酸配列を含む。 Embodiment 422. The method of embodiment 414, wherein the napDNAbp comprises the amino acid sequence of SEQ ID NOs: 18-88, 126, 130, 137, 141, 147, 153, 157, 445, 460, 467, and 482-487.

態様423.プライム編集によって、標的ヌクレオチド配列によってコードされる目当てのタンパク質上の機能部分を組み入れまたは欠失する方法であって、方法が:(a)標的ヌクレオチド配列を(i)核酸プログラム型DNA結合タンパク質(napDNAbp)およびポリメラーゼを含むプライム編集因子ならびに(ii)機能部分またはその欠失をコードする編集鋳型を含むPEgRNAと接触させること;(b)機能部分またはその欠失をコードする一本鎖DNA配列を重合すること;ならびに(c)DNA修復および/または複製プロセスによって、標的ヌクレオチド配列における対応する内生鎖の代わりに一本鎖DNA配列を組み込むことを含み、方法が、目当てのタンパク質および機能部分またはその除去を含む改変されたタンパク質をコードする組み換え標的ヌクレオチド配列を生じ、機能部分がタンパク質の修飾状態または局在状態を変改する。 Embodiment 423. A method for introducing or deleting a functional portion on a protein of interest encoded by a target nucleotide sequence by prime editing, the method comprising: (a) contacting the target nucleotide sequence with (i) a prime editing factor comprising a nucleic acid programmable DNA binding protein (napDNAbp) and a polymerase and (ii) a PEgRNA comprising an editing template encoding the functional portion or deletion; (b) polymerizing a single-stranded DNA sequence encoding the functional portion or deletion; and (c) incorporating the single-stranded DNA sequence in place of the corresponding endogenous strand in the target nucleotide sequence by DNA repair and/or replication processes, the method producing a recombinant target nucleotide sequence encoding the protein of interest and an altered protein comprising the functional portion or deletion, the functional portion altering the modification or localization state of the protein.

態様424.態様423の方法であって、機能部分が、目当てのタンパク質のリン酸化、ユビキチン化、グリコシル化、脂質修飾、ヒドロキシル化、メチル化、アセチル化、クロトニル化、SUMO化状態を変改する。 Embodiment 424. The method of embodiment 423, wherein the functional moiety alters the phosphorylation, ubiquitination, glycosylation, lipid modification, hydroxylation, methylation, acetylation, crotonylation, or sumoylation status of the protein of interest.

態様425.融合タンパク質であって、核酸プログラム型DNA結合タンパク質(napDNAbp)ドメインとRNA依存性DNAポリメラーゼ活性を含むドメインとを含む。 Embodiment 425. A fusion protein comprising a nucleic acid programmable DNA binding protein (napDNAbp) domain and a domain comprising RNA-dependent DNA polymerase activity.

態様426.態様425の融合タンパク質であって、融合タンパク質が、プライム編集ガイドRNA(PEgRNA)の存在下においてプライム編集を実行して、所望のヌクレオチド変化を標的配列上に組み入れることができる。 Embodiment 426. The fusion protein of embodiment 425, wherein the fusion protein is capable of performing prime editing in the presence of a prime editing guide RNA (PEgRNA) to incorporate a desired nucleotide change into a target sequence.

態様427.態様425の融合タンパク質であって、napDNAbpドメインがニッカーゼ活性を有する。 Embodiment 427. The fusion protein of embodiment 425, wherein the napDNAbp domain has nickase activity.

態様428.態様425の融合タンパク質であって、napDNAbpドメインがCas9タンパク質またはそのバリアントである。 Embodiment 428. The fusion protein of embodiment 425, wherein the napDNAbp domain is a Cas9 protein or a variant thereof.

態様429.態様425の融合タンパク質であって、napDNAbpドメインが、ヌクレアーゼ活性Cas9、ヌクレアーゼ不活性型Cas9(dCas9)、またはCas9ニッカーゼ(nCas9)である。 Embodiment 429. The fusion protein of embodiment 425, wherein the napDNAbp domain is a nuclease-active Cas9, a nuclease-inactive Cas9 (dCas9), or a Cas9 nickase (nCas9).

態様430.態様425の融合タンパク質であって、napDNAbpドメインがCas9ニッカーゼ(nCas9)である。 Embodiment 430. The fusion protein of embodiment 425, wherein the napDNAbp domain is Cas9 nickase (nCas9).

態様431.態様425の融合タンパク質であって、napDNAbpドメインが:Cas9、Cas12e、Cas12d、Cas12a、Cas12b1、Cas13a、Cas12c、およびアルゴノートからなる群から選択され、任意にニッカーゼ活性を有する。 Embodiment 431. The fusion protein of embodiment 425, wherein the napDNAbp domain is selected from the group consisting of: Cas9, Cas12e, Cas12d, Cas12a, Cas12b1, Cas13a, Cas12c, and Argonaute, and optionally has nickase activity.

態様432.態様425の融合タンパク質であって、RNA依存性DNAポリメラーゼ活性を含むドメインが逆転写酵素であり、配列番号89~100、105~122、128~129、132、139、143、149、154、159、235、454、471、516、662、700、701~716、739~741、および766のアミノ酸配列のいずれか1つを含む。 Embodiment 432. The fusion protein of embodiment 425, wherein the domain comprising the RNA-dependent DNA polymerase activity is a reverse transcriptase and comprises any one of the amino acid sequences of SEQ ID NOs: 89-100, 105-122, 128-129, 132, 139, 143, 149, 154, 159, 235, 454, 471, 516, 662, 700, 701-716, 739-741, and 766.

態様433.態様425の融合タンパク質であって、RNA依存性DNAポリメラーゼ活性を含むドメインが逆転写酵素であり、配列番号89~100、105~122、128~129、132、139、143、149、154、159、235、454、471、516、662、700、701~716、739~741、および766のいずれか1つのアミノ酸配列との少なくとも80%、85%、90%、95%、98%、または99%配列同一性を有するアミノ酸配列を含み、任意に、RNA依存性DNAポリメラーゼを含むドメインがエラーを起こしやすいである。 Embodiment 433. The fusion protein of embodiment 425, wherein the domain comprising RNA-dependent DNA polymerase activity is a reverse transcriptase and comprises an amino acid sequence having at least 80%, 85%, 90%, 95%, 98%, or 99% sequence identity to any one of the amino acid sequences of SEQ ID NOs: 89-100, 105-122, 128-129, 132, 139, 143, 149, 154, 159, 235, 454, 471, 516, 662, 700, 701-716, 739-741, and 766, and optionally, the domain comprising RNA-dependent DNA polymerase is error-prone.

態様434.態様425の融合タンパク質であって、RNA依存性DNAポリメラーゼ活性を含むドメインが、レトロウイルスまたはレトロトランスポゾンからの天然に存在する逆転写酵素である。 Embodiment 434. The fusion protein of embodiment 425, wherein the domain containing the RNA-dependent DNA polymerase activity is a naturally occurring reverse transcriptase from a retrovirus or retrotransposon.

態様435.態様425の融合タンパク質であって、融合タンパク質がPEgRNAと複合体化したときに標的DNA配列に結合することができる。 Embodiment 435. The fusion protein of embodiment 425, wherein the fusion protein is capable of binding to a target DNA sequence when complexed with the PEgRNA.

態様436.態様435の融合タンパク質であって、標的DNA配列が標的鎖および相補的な非標的鎖を含む。 Embodiment 436. The fusion protein of embodiment 435, wherein the target DNA sequence comprises a target strand and a complementary non-target strand.

態様437.態様435の融合タンパク質であって、PEgRNAと複合体化した融合タンパク質の結合がRループを形成する。 Embodiment 437. The fusion protein of embodiment 435, wherein binding of the fusion protein complexed with the PEGRNA forms an R-loop.

態様438.態様437の融合タンパク質であって、Rループが、(i)PEgRNAと標的鎖とを含むRNA-DNAハイブリッドおよび(ii)相補的な非標的鎖を含む。 Embodiment 438. The fusion protein of embodiment 437, wherein the R-loop comprises (i) an RNA-DNA hybrid comprising the PEgRNA and a target strand and (ii) a complementary non-target strand.

態様439.態様437の融合タンパク質であって、標的または相補的な非標的鎖がニッキングされて、遊離の3’端を有するプライム配列を形成する。 Embodiment 439. The fusion protein of embodiment 437, wherein the target or complementary non-target strand is nicked to form a primed sequence having a free 3' end.

態様440.態様439の融合タンパク質であって、ニック部位が標的鎖上のPAM配列の上流にある。 Embodiment 440. The fusion protein of embodiment 439, wherein the nick site is upstream of the PAM sequence on the target strand.

態様441.態様439の融合タンパク質であって、ニック部位が非標的鎖上のPAM配列の上流にある。 Embodiment 441. The fusion protein of embodiment 439, wherein the nick site is upstream of the PAM sequence on the non-target strand.

態様442.態様439の融合タンパク質であって、ニック部位がPAM配列の5'端に対して相対的に-1、-2、-3、-4、-5、-6、-7、-8、または-9である。 Embodiment 442. The fusion protein of embodiment 439, wherein the nick site is -1, -2, -3, -4, -5, -6, -7, -8, or -9 relative to the 5' end of the PAM sequence.

態様443.態様426の融合タンパク質であって、PEgRNAがガイドRNAおよび少なくとも1つの核酸伸長アームを含む。 Embodiment 443. The fusion protein of embodiment 426, wherein the PEgRNA comprises a guide RNA and at least one nucleic acid extension arm.

態様444.態様443の融合タンパク質であって、伸長アームが、ガイドRNAの5'もしくは3'端またはガイドRNAの分子内の位置付けにある。 Embodiment 444. The fusion protein of embodiment 443, wherein the extension arm is at the 5' or 3' end of the guide RNA or positioned intramolecularly in the guide RNA.

態様445.態様443の融合タンパク質であって、伸長アームが(i)所望のヌクレオチド変化を含むDNA合成鋳型配列および(ii)プライマー結合部位を含む。 Embodiment 445. The fusion protein of embodiment 443, wherein the extension arm comprises (i) a DNA synthesis template sequence containing a desired nucleotide change and (ii) a primer binding site.

態様446.態様445の融合タンパク質であって、DNA合成鋳型配列が、ニック部位に隣接する内生DNA配列に対して相補的である一本鎖DNAフラップをコードし、一本鎖DNAフラップが所望のヌクレオチド変化を含む。 Embodiment 446. The fusion protein of embodiment 445, wherein the DNA synthesis template sequence encodes a single-stranded DNA flap that is complementary to the endogenous DNA sequence adjacent to the nick site, and the single-stranded DNA flap contains the desired nucleotide change.

態様447.態様443の融合タンパク質であって、伸長アームが、少なくとも5ヌクレオチド、少なくとも6ヌクレオチド、少なくとも7ヌクレオチド、少なくとも8ヌクレオチド、少なくとも9ヌクレオチド、少なくとも10ヌクレオチド、少なくとも11ヌクレオチド、少なくとも12ヌクレオチド、少なくとも13ヌクレオチド、少なくとも14ヌクレオチド、少なくとも15ヌクレオチド、少なくとも16ヌクレオチド、少なくとも17ヌクレオチド、少なくとも18ヌクレオチド、少なくとも19ヌクレオチド、少なくとも20ヌクレオチド、少なくとも21ヌクレオチド、少なくとも22ヌクレオチド、少なくとも23ヌクレオチド、少なくとも24ヌクレオチド、少なくとも25ヌクレオチド、少なくとも26ヌクレオチド、少なくとも27ヌクレオチド、少なくとも28ヌクレオチド、少なくとも29ヌクレオチド、少なくとも30ヌクレオチド、少なくとも31ヌクレオチド、少なくとも32ヌクレオチド、少なくとも33ヌクレオチド、少なくとも34ヌクレオチド、少なくとも35ヌクレオチド、少なくとも36ヌクレオチド、少なくとも37ヌクレオチド、少なくとも38ヌクレオチド、少なくとも39ヌクレオチド、少なくとも40ヌクレオチド、少なくとも41ヌクレオチド、少なくとも42ヌクレオチド、少なくとも43ヌクレオチド、少なくとも44ヌクレオチド、少なくとも45ヌクレオチド、少なくとも46ヌクレオチド、少なくとも47ヌクレオチド、少なくとも48ヌクレオチド、少なくとも49ヌクレオチド、または少なくとも50ヌクレオチドである。 Aspect 447. The fusion protein of embodiment 443, wherein the extension arm is at least 5 nucleotides, at least 6 nucleotides, at least 7 nucleotides, at least 8 nucleotides, at least 9 nucleotides, at least 10 nucleotides, at least 11 nucleotides, at least 12 nucleotides, at least 13 nucleotides, at least 14 nucleotides, at least 15 nucleotides, at least 16 nucleotides, at least 17 nucleotides, at least 18 nucleotides, at least 19 nucleotides, at least 20 nucleotides, at least 21 nucleotides, at least 22 nucleotides, at least 23 nucleotides, at least 24 nucleotides, at least 25 nucleotides, at least 26 nucleotides, at least 27 nucleotides, at least 28 nucleotides, at least 29 nucleotides, at least 30 nucleotides, at least 31 nucleotides, at least 32 nucleotides, at least 33 nucleotides, at least 34 nucleotides, at least 35 nucleotides, at least 36 nucleotides, at least 37 nucleotides, at least 38 nucleotides, at least 39 nucleotides, at least 40 nucleotides, at least 41 nucleotides, at least 42 nucleotides, at least 43 nucleotides, at least 44 nucleotides, at least 45 nucleotides, at least 46 nucleotides, at least 47 nucleotides, at least 48 nucleotides, at least 49 nucleotides, or at least 50 nucleotides.

態様448.態様443の融合タンパク質であって、一本鎖DNAフラップが、ニック部位に隣接する内生DNA配列にハイブリダイズし、それによって所望のヌクレオチド変化を標的鎖上に組み入れる。 Embodiment 448. The fusion protein of embodiment 443, wherein the single-stranded DNA flap hybridizes to an endogenous DNA sequence adjacent to the nick site, thereby incorporating a desired nucleotide change onto the target strand.

態様449.態様443の融合タンパク質であって、一本鎖DNAフラップが、遊離の5'端を有しかつニック部位に隣接する内生DNA配列に取って代わる。 Embodiment 449. The fusion protein of embodiment 443, wherein the single-stranded DNA flap has a free 5' end and replaces the endogenous DNA sequence adjacent to the nick site.

態様450.態様446の融合タンパク質であって、5'端を有する内生DNA配列が細胞によって切除される。 Embodiment 450. The fusion protein of embodiment 446, wherein the endogenous DNA sequence having a 5' end is excised by the cell.

態様451.態様446の融合タンパク質であって、5'端を有する内生DNA配列がフラップエンドヌクレアーゼによって切除される。 Embodiment 451. The fusion protein of embodiment 446, wherein the endogenous DNA sequence having the 5' end is excised by a flap endonuclease.

態様452.態様448の融合タンパク質であって、一本鎖DNAフラップの細胞性修復が、所望のヌクレオチド変化を非標的鎖上に組み込み、それによって所望の産物を形成する。 Embodiment 452. The fusion protein of embodiment 448, wherein cellular repair of the single-stranded DNA flap incorporates a desired nucleotide change onto the non-target strand, thereby forming a desired product.

態様453.態様449の融合タンパク質であって、所望のヌクレオチド変化が、PAM配列の約-4から+10の間、またはPAM配列の約-10から+20の間、またはPAM配列の約-20から+40の間、またはPAM配列の約-30から+100の間である編集窓上に組み入れされる。 Embodiment 453. The fusion protein of embodiment 449, wherein the desired nucleotide change is incorporated over an editing window that is between about -4 and +10 of the PAM sequence, or between about -10 and +20 of the PAM sequence, or between about -20 and +40 of the PAM sequence, or between about -30 and +100 of the PAM sequence.

態様454.態様449の融合タンパク質であって、所望のヌクレオチド変化が、ニック部位の少なくとも1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、または100ヌクレオチド下流に組み入れされる。 Embodiment 454. The fusion protein of embodiment 449, wherein the desired nucleotide change is at least 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, Incorporated 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99, or 100 nucleotides downstream.

態様455.態様425の融合タンパク質であって、napDNAbpが、配列番号18のアミノ酸配列、または配列番号18のアミノ酸配列との少なくとも80%、85%、90%、95%、98%、もしくは99%配列同一性を有するアミノ酸配列を含む。 Embodiment 455 The fusion protein of embodiment 425, wherein the napDNAbp comprises an amino acid sequence of SEQ ID NO: 18 or an amino acid sequence having at least 80%, 85%, 90%, 95%, 98%, or 99% sequence identity to the amino acid sequence of SEQ ID NO: 18.

態様456.態様425の融合タンパク質であって、napDNAbpが、配列番号18~88、126、130、137、141、147、153、157、445、460、467、および482~487のいずれか1つのアミノ酸配列との少なくとも80%、85%、90%、95%、98%、または99%配列同一性を有するアミノ酸配列を含む。 Embodiment 456. The fusion protein of embodiment 425, wherein napDNAbp comprises an amino acid sequence having at least 80%, 85%, 90%, 95%, 98%, or 99% sequence identity to any one of the amino acid sequences of SEQ ID NOs: 18-88, 126, 130, 137, 141, 147, 153, 157, 445, 460, 467, and 482-487.

態様457.先の態様のいずれか1つの融合タンパク質であって、融合タンパク質が構造NH2-[napDNAbp]-[RNA依存性DNAポリメラーゼ活性を含むドメイン]-COOH;またはNH2-[RNA依存性DNAポリメラーゼ活性を含むドメイン]-[napDNAbp]-COOHを含み、「]-[」の夫々のものが任意のリンカー配列の存在を指示する。 Embodiment 457. The fusion protein of any one of the preceding embodiments, wherein the fusion protein comprises the structure NH2-[napDNAbp]-[domain comprising RNA-dependent DNA polymerase activity]-COOH; or NH2-[domain comprising RNA-dependent DNA polymerase activity]-[napDNAbp]-COOH, each of the "]-[" indicates the presence of an optional linker sequence.

態様458.態様457の融合タンパク質であって、リンカー配列が配列番号127、165~176、446、453、および767~769のアミノ酸配列を含む。 Embodiment 458. The fusion protein of embodiment 457, wherein the linker sequence comprises the amino acid sequence of SEQ ID NOs: 127, 165-176, 446, 453, and 767-769.

態様459.態様425の融合タンパク質であって、所望のヌクレオチド変化が1ヌクレオチド変化、1つ以上のヌクレオチドの挿入、または1つ以上のヌクレオチドの欠失である。 Embodiment 459. The fusion protein of embodiment 425, wherein the desired nucleotide change is a single nucleotide change, an insertion of one or more nucleotides, or a deletion of one or more nucleotides.

態様460.態様459の融合タンパク質であって、挿入または欠失が、少なくとも1、少なくとも2、少なくとも3、少なくとも4、少なくとも5、少なくとも6、少なくとも7、少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも16、少なくとも17、少なくとも18、少なくとも19、少なくとも20、少なくとも21、少なくとも22、少なくとも23、少なくとも24、少なくとも25、少なくとも26、少なくとも27、少なくとも28、少なくとも29、少なくとも30、少なくとも31、少なくとも32、少なくとも33、少なくとも34、少なくとも35、少なくとも36、少なくとも37、少なくとも38、少なくとも39、少なくとも40、少なくとも41、少なくとも42、少なくとも43、少なくとも44、少なくとも45、少なくとも46、少なくとも47、少なくとも48、少なくとも49、または少なくとも50である。 Embodiment 460. The fusion protein of embodiment 459, wherein the insertion or deletion is at least 1, at least 2, at least 3, at least 4, at least 5, at least 6, at least 7, at least 8, at least 9, at least 10, at least 11, at least 12, at least 13, at least 14, at least 15, at least 16, at least 17, at least 18, at least 19, at least 20, at least 21, at least 22, at least 23, at least 24, at least 25, at least 26, at least 27, at least 28, at least 29, at least 30, at least 31, at least 32, at least 33, at least 34, at least 35, at least 36, at least 37, at least 38, at least 39, at least 40, at least 41, at least 42, at least 43, at least 44, at least 45, at least 46, at least 47, at least 48, at least 49, or at least 50.

態様461.態様425~460のいずれかの融合タンパク質とPEgRNAとを含む複合体であって、PEgRNAが融合タンパク質をプライム編集の標的DNA配列へと導く。 Embodiment 461. A complex comprising a fusion protein of any one of embodiments 425 to 460 and a PEgRNA, wherein the PEgRNA guides the fusion protein to a target DNA sequence for prime editing.

態様462.態様461の複合体であって、PEgRNAが、ガイドRNAと、ガイドRNAの3'もしくは5'端またはガイドRNAの分子内の位置における核酸伸長アームとを含む。 Embodiment 462. The complex of embodiment 461, wherein the PEgRNA comprises a guide RNA and a nucleic acid extension arm at the 3' or 5' end of the guide RNA or at an intramolecular position of the guide RNA.

態様463.態様462の複合体であって、PEgRNAが、napDNAbpに結合することおよびnapDNAbpを標的DNA配列へと導くことができる。 Embodiment 463. The complex of embodiment 462, wherein the PEgRNA is capable of binding to the napDNAbp and directing the napDNAbp to a target DNA sequence.

態様464.態様463の複合体であって、標的DNA配列が標的鎖および相補的な非標的鎖を含み、ガイドRNAが標的鎖にハイブリダイズして、RNA-DNAハイブリッドおよびRループを形成する。 Embodiment 464. The complex of embodiment 463, wherein the target DNA sequence comprises a target strand and a complementary non-target strand, and the guide RNA hybridizes to the target strand to form an RNA-DNA hybrid and an R-loop.

態様465.態様464の複合体であって、少なくとも1つの核酸伸長アームが(i)DNA合成鋳型および(ii)プライマー結合部位を含む。 Embodiment 465. The complex of embodiment 464, wherein at least one nucleic acid extension arm comprises (i) a DNA synthesis template and (ii) a primer binding site.

態様466.態様464の複合体であって、PEgRNAが、配列番号101~104、181~183、223~244、277、325~334、336、338、340、342、344、346、348、350、352、354、356、358、360、362、364、366、368、499~505、735~761、776~777のヌクレオチド配列、または配列番号101~104、181~183、223~244、277、325~334、336、338、340、342、344、346、348、350、352、354、356、358、360、362、364、366、368、499~505、735~761、776~777のいずれか1つとの少なくとも85%もしくは少なくとも90%もしくは少なくとも95%もしくは少なくとも98%もしくは少なくとも99%配列同一性を有するヌクレオチド配列を含む。 Embodiment 466. The complex of embodiment 464, wherein the PEGRNA has a nucleotide sequence selected from the group consisting of SEQ ID NOs: 101-104, 181-183, 223-244, 277, 325-334, 336, 338, 340, 342, 344, 346, 348, 350, 352, 354, 356, 358, 360, 362, 364, 366, 368, 499-505, 735-761, 776-777, or SEQ ID NOs: 101-104, 181-183, 223-24 4, 277, 325-334, 336, 338, 340, 342, 344, 346, 348, 350, 352, 354, 356, 358, 360, 362, 364, 366, 368, 499-505, 735-761, 776-777.

態様467.態様465の複合体であって、DNA合成鋳型が、内生DNA標的と少なくとも80%または85%または90%または95%または99%同一であるヌクレオチド配列を含む。 Embodiment 467. The complex of embodiment 465, wherein the DNA synthesis template comprises a nucleotide sequence that is at least 80%, 85%, 90%, 95%, or 99% identical to the endogenous DNA target.

態様468.態様465の複合体であって、プライマー結合部位が、カットされたDNAの遊離の3'端とハイブリダイズする。 Embodiment 468. The complex of embodiment 465, wherein the primer binding site hybridizes to the free 3' end of the cut DNA.

態様469.態様461の複合体であって、napDNAbpがCas9ニッカーゼである。 Aspect 469. The complex of aspect 461, wherein napDNAbp is a Cas9 nickase.

態様470.態様461の複合体であって、napDNAbpが、配列番号18のアミノ酸配列、または配列番号18との少なくとも80%、85%、90%、95%、98%、もしくは99%配列同一性を有するアミノ酸配列を含む。 Embodiment 470. The complex of embodiment 461, wherein napDNAbp comprises an amino acid sequence of SEQ ID NO:18 or an amino acid sequence having at least 80%, 85%, 90%, 95%, 98%, or 99% sequence identity to SEQ ID NO:18.

態様471.態様461の複合体であって、napDNAbpが、配列番号18~88、126、130、137、141、147、153、157、445、460、467、および482~487のいずれか1つのアミノ酸配列との少なくとも80%、85%、90%、95%、98%、または99%配列同一性を有するアミノ酸配列を含む。 Embodiment 471. The complex of embodiment 461, wherein napDNAbp comprises an amino acid sequence having at least 80%, 85%, 90%, 95%, 98%, or 99% sequence identity to any one of the amino acid sequences of SEQ ID NOs: 18-88, 126, 130, 137, 141, 147, 153, 157, 445, 460, 467, and 482-487.

態様472.態様461の複合体であって、PEgRNAが、ガイドRNAと、ガイドRNAの3'もしくは5'端またはガイドRNAの分子内の位置における核酸伸長アームとを含む。 Embodiment 472. The complex of embodiment 461, wherein the PEgRNA comprises a guide RNA and a nucleic acid extension arm at the 3' or 5' end of the guide RNA or at an intramolecular position of the guide RNA.

態様473.態様465の複合体であって、DNA合成鋳型が、内生DNA標的と少なくとも80%または85%または90%または95%または99%同一であるヌクレオチド配列を含む。 Embodiment 473. The complex of embodiment 465, wherein the DNA synthesis template comprises a nucleotide sequence that is at least 80%, 85%, 90%, 95%, or 99% identical to the endogenous DNA target.

態様474.態様465の複合体であって、プライマー結合部位が、カットされたDNAの遊離の3'端とハイブリダイズする。 Embodiment 474. The complex of embodiment 465, wherein the primer binding site hybridizes to the free 3' end of the cut DNA.

態様475.態様462の複合体であって、PEgRNAが、さらに、リンカー、ステムループ、ヘアピン、トウループ、アプタマー、またはRNA-タンパク質動員ドメインからなる群から選択される少なくとも1つの追加の構造を含む。 Embodiment 475. The complex of embodiment 462, wherein the PEGRNA further comprises at least one additional structure selected from the group consisting of a linker, a stem loop, a hairpin, a toe loop, an aptamer, or an RNA-protein recruitment domain.

態様476.態様425~461のいずれかの融合タンパク質をコードするポリヌクレオチド。 Aspect 476. A polynucleotide encoding a fusion protein of any one of aspects 425 to 461.

態様477.上の態様のいずれかのPEgRNAをコードするポリヌクレオチド。 Aspect 477. A polynucleotide encoding the PEgRNA of any of the above aspects.

態様478.態様476のポリヌクレオチドを含むベクターであって、融合タンパク質の発現がプロモーターのコントロール下にある。 Aspect 478. A vector comprising the polynucleotide of aspect 476, wherein expression of the fusion protein is under the control of a promoter.

態様479.態様477のポリヌクレオチドを含むベクターであって、PEgRNAの発現がプロモーターのコントロール下にある。 Aspect 479. A vector comprising the polynucleotide of aspect 477, wherein expression of the PEG RNA is under the control of a promoter.

態様480.態様479のベクターであって、プロモーターがU6プロモーターである。 Aspect 480. The vector of aspect 479, wherein the promoter is a U6 promoter.

態様481.態様479のベクターであって、プロモーターがCMVプロモーターである。 Embodiment 481. The vector of embodiment 479, wherein the promoter is a CMV promoter.

態様482.態様480のベクターであって、PEgRNAが、U6プロモーターによる転写効率を改善するために、伸長アーム上のTの1つ以上の繰り返しのクラスターを除去するように操作される。 Embodiment 482. The vector of embodiment 480, wherein the PEGRNA is engineered to remove one or more repeat clusters of T on the extension arm to improve transcription efficiency from the U6 promoter.

態様483.態様482のベクターであって、除去されるTの1つ以上の繰り返しのクラスターが、少なくとも3つのT、少なくとも4つのT、少なくとも5つのT、少なくとも6つのT、少なくとも7つのT、少なくとも8つのT、少なくとも9つのT、少なくとも10のT、少なくとも11のT、少なくとも12のT、少なくとも13のT、少なくとも14のT、少なくとも15のT、少なくとも16のT、少なくとも17のT、少なくとも18のT、少なくとも19のT、または少なくとも20のTを含む。 Embodiment 483. The vector of embodiment 482, wherein the one or more repeat clusters of T's that are removed include at least 3 T's, at least 4 T's, at least 5 T's, at least 6 T's, at least 7 T's, at least 8 T's, at least 9 T's, at least 10 T's, at least 11 T's, at least 12 T's, at least 13 T's, at least 14 T's, at least 15 T's, at least 16 T's, at least 17 T's, at least 18 T's, at least 19 T's, or at least 20 T's.

態様484.態様425~460のいずれかの融合タンパク質と融合タンパク質のnapDNAbpに結合したPEgRNAとを含む細胞。 Embodiment 484. A cell comprising a fusion protein of any one of embodiments 425 to 460 and a PEgRNA bound to the napDNAbp of the fusion protein.

態様485.態様461~475のいずれか1つの複合体を含む細胞。 Aspect 485. A cell comprising any one of the complexes of aspects 461 to 475.

態様486.医薬組成物であって:(i)態様425~460のいずれかの融合タンパク質、態様461~475の複合体、態様476~477のポリヌクレオチド、または態様478~483のベクター;および(ii)薬学的に許容される賦形剤を含む。 Embodiment 486. A pharmaceutical composition comprising: (i) a fusion protein of any of embodiments 425-460, a complex of embodiments 461-475, a polynucleotide of embodiments 476-477, or a vector of embodiments 478-483; and (ii) a pharma- ceutically acceptable excipient.

態様487.医薬組成物であって:(i)態様461~475の複合体、(ii)トランスで提供されるポリメラーゼ;および(iii)薬学的に許容される賦形剤を含む。 Embodiment 487. A pharmaceutical composition comprising: (i) a conjugate of any one of embodiments 461 to 475; (ii) a polymerase provided in trans; and (iii) a pharma- ceutically acceptable excipient.

態様488.プライム編集のためのキットであって:(i)態様425~460のいずれか1つの融合タンパク質をコードする核酸分子;および(ii)融合タンパク質を標的DNA部位へと導くことができるPEgRNAをコードする核酸分子を含み、(i)および(ii)の核酸分子が単一のDNA構築物または別個のDNA構築物上に含有され得る。 Embodiment 488. A kit for prime editing comprising: (i) a nucleic acid molecule encoding a fusion protein of any one of embodiments 425 to 460; and (ii) a nucleic acid molecule encoding a PEGRNA capable of directing the fusion protein to a target DNA site, wherein the nucleic acid molecules (i) and (ii) may be contained on a single DNA construct or on separate DNA constructs.

態様489.態様488のキットであって、(i)の核酸分子が、さらに、融合タンパク質の発現を駆動するプロモーターを含む。 Aspect 489. The kit of aspect 488, wherein the nucleic acid molecule of (i) further comprises a promoter that drives expression of the fusion protein.

態様490.態様488のキットであって、(ii)の核酸分子が、さらに、PEgRNAの発現を駆動するプロモーターを含む。 Aspect 490. The kit of aspect 488, wherein the nucleic acid molecule of (ii) further comprises a promoter driving expression of the PEgRNA.

態様491.態様490のキットであって、プロモーターがU6プロモーターである。 Aspect 491. The kit of aspect 490, wherein the promoter is a U6 promoter.

態様492.態様490のキットであって、プロモーターがCMVプロモーターである。 Aspect 492. The kit of aspect 490, wherein the promoter is a CMV promoter.

態様493.態様457の融合タンパク質であって、リンカー配列が配列番号174(1×SGGS)、446(2×SGGS)、3889(3×SGGS)、171(1×XTEN)、3968(1×EAAAK)、3969(2×EAAAK)、および3970(3×EAAAK)のアミノ酸配列を含む。 Embodiment 493. The fusion protein of embodiment 457, wherein the linker sequence comprises the amino acid sequences of SEQ ID NOs: 174 (1xSGGS), 446 (2xSGGS), 3889 (3xSGGS), 171 (1xXTEN), 3968 (1xEAAAK), 3969 (2xEAAAK), and 3970 (3xEAAAK).

群B.PEガイドおよびデザインの方法
態様1.ガイドRNAとDNA合成鋳型を含む少なくとも1つの核酸伸長アームとを含むPEgRNA。
Group B. PE Guide and Design Methods Embodiment 1. A PEgRNA comprising a guide RNA and at least one nucleic acid extension arm comprising a DNA synthesis template.

態様2.態様1のPEgRNAであって、核酸伸長アームがガイドRNAの3'もしくは5'端またはガイドRNAの分子内の位置の位置であり、核酸伸長アームがDNAまたはRNAである。 Aspect 2. The PEgRNA of aspect 1, wherein the nucleic acid extension arm is at the 3' or 5' end of the guide RNA or at an intramolecular position of the guide RNA, and the nucleic acid extension arm is DNA or RNA.

態様3.態様1のPEgRNAであって、PEgRNAが、napDNAbpに結合することおよびnapDNAbpを標的DNA配列へと導くことができる。 Embodiment 3. The PEgRNA of embodiment 1, wherein the PEgRNA is capable of binding to the napDNAbp and directing the napDNAbp to a target DNA sequence.

態様4.態様3のPEgRNAであって、標的DNA配列が標的鎖および相補的な非標的鎖を含む。 Aspect 4. The PEgRNA of aspect 3, wherein the target DNA sequence comprises a target strand and a complementary non-target strand.

態様5.態様3のPEgRNAであって、ガイドRNAが標的鎖にハイブリダイズして、RNA-DNAハイブリッドおよびRループを形成する。 Aspect 5. The PEgRNA of aspect 3, wherein the guide RNA hybridizes to the target strand to form an RNA-DNA hybrid and an R-loop.

態様6.態様1のPEgRNAであって、少なくとも1つの核酸伸長アームがさらにプライマー結合部位を含む。 Embodiment 6. The PEgRNA of embodiment 1, wherein at least one nucleic acid extension arm further comprises a primer binding site.

態様7.態様1のPEgRNAであって、核酸伸長アームが、少なくとも5ヌクレオチド、少なくとも6ヌクレオチド、少なくとも7ヌクレオチド、少なくとも8ヌクレオチド、少なくとも9ヌクレオチド、少なくとも10ヌクレオチド、少なくとも11ヌクレオチド、少なくとも12ヌクレオチド、少なくとも13ヌクレオチド、少なくとも14ヌクレオチド、少なくとも15ヌクレオチド、少なくとも16ヌクレオチド、少なくとも17ヌクレオチド、少なくとも18ヌクレオチド、少なくとも19ヌクレオチド、少なくとも20ヌクレオチド、少なくとも21ヌクレオチド、少なくとも22ヌクレオチド、少なくとも23ヌクレオチド、少なくとも24ヌクレオチド、少なくとも25ヌクレオチド、少なくとも26ヌクレオチド、少なくとも27ヌクレオチド、少なくとも28ヌクレオチド、少なくとも29ヌクレオチド、少なくとも30ヌクレオチド、少なくとも31ヌクレオチド、少なくとも32ヌクレオチド、少なくとも33ヌクレオチド、少なくとも34ヌクレオチド、少なくとも35ヌクレオチド、少なくとも36ヌクレオチド、少なくとも37ヌクレオチド、少なくとも38ヌクレオチド、少なくとも39ヌクレオチド、少なくとも40ヌクレオチド、少なくとも41ヌクレオチド、少なくとも42ヌクレオチド、少なくとも43ヌクレオチド、少なくとも44ヌクレオチド、少なくとも45ヌクレオチド、少なくとも46ヌクレオチド、少なくとも47ヌクレオチド、少なくとも48ヌクレオチド、少なくとも49ヌクレオチド、または少なくとも50ヌクレオチドである。 Embodiment 7. The PEGRNA of embodiment 1, wherein the nucleic acid extension arm is at least 5 nucleotides, at least 6 nucleotides, at least 7 nucleotides, at least 8 nucleotides, at least 9 nucleotides, at least 10 nucleotides, at least 11 nucleotides, at least 12 nucleotides, at least 13 nucleotides, at least 14 nucleotides, at least 15 nucleotides, at least 16 nucleotides, at least 17 nucleotides, at least 18 nucleotides, at least 19 nucleotides, at least 20 nucleotides, at least 21 nucleotides, at least 22 nucleotides, at least 23 nucleotides, at least 24 nucleotides, at least 25 nucleotides, at least 26 nucleotides, at least 27 nucleotides, at least 28 nucleotides, at least 29 nucleotides, at least 30 nucleotides, at least 31 nucleotides, at least 32 nucleotides, at least 33 nucleotides, at least 34 nucleotides, at least 35 nucleotides, at least 36 nucleotides, at least 37 nucleotides, at least 38 nucleotides, at least 39 nucleotides, at least 40 nucleotides, at least 41 nucleotides, at least 42 nucleotides, at least 43 nucleotides, at least 44 nucleotides, at least 45 nucleotides, at least 46 nucleotides, at least 47 nucleotides, at least 48 nucleotides, at least 49 nucleotides, or at least 50 nucleotides.

態様8.態様1のPEgRNAであって、DNA合成鋳型が、長さが少なくとも3ヌクレオチド、少なくとも4ヌクレオチド、少なくとも5ヌクレオチド、少なくとも6ヌクレオチド、少なくとも7ヌクレオチド、少なくとも8ヌクレオチド、少なくとも9ヌクレオチド、少なくとも10ヌクレオチド、少なくとも11ヌクレオチド、少なくとも12ヌクレオチド、少なくとも13ヌクレオチド、少なくとも14ヌクレオチド、または少なくとも15ヌクレオチドである。 Embodiment 8. The PEGRNA of embodiment 1, wherein the DNA synthesis template is at least 3 nucleotides, at least 4 nucleotides, at least 5 nucleotides, at least 6 nucleotides, at least 7 nucleotides, at least 8 nucleotides, at least 9 nucleotides, at least 10 nucleotides, at least 11 nucleotides, at least 12 nucleotides, at least 13 nucleotides, at least 14 nucleotides, or at least 15 nucleotides in length.

態様9.態様6のPEgRNAであって、プライマー結合部位が、長さが少なくとも3ヌクレオチド、少なくとも4ヌクレオチド、少なくとも5ヌクレオチド、少なくとも6ヌクレオチド、少なくとも7ヌクレオチド、少なくとも8ヌクレオチド、少なくとも9ヌクレオチド、少なくとも10ヌクレオチド、少なくとも11ヌクレオチド、少なくとも12ヌクレオチド、少なくとも13ヌクレオチド、少なくとも14ヌクレオチド、または少なくとも15ヌクレオチドである。 Embodiment 9. The PEGRNA of embodiment 6, wherein the primer binding site is at least 3 nucleotides, at least 4 nucleotides, at least 5 nucleotides, at least 6 nucleotides, at least 7 nucleotides, at least 8 nucleotides, at least 9 nucleotides, at least 10 nucleotides, at least 11 nucleotides, at least 12 nucleotides, at least 13 nucleotides, at least 14 nucleotides, or at least 15 nucleotides in length.

態様10.態様1のPEgRNAであって、さらに、tRNA、リンカー、ステムループ、ヘアピン、トウループ、アプタマー、またはRNA-タンパク質動員ドメインからなる群から選択される少なくとも1つの追加の構造を含む。 Embodiment 10. The PEgRNA of embodiment 1, further comprising at least one additional structure selected from the group consisting of a tRNA, a linker, a stem loop, a hairpin, a toe loop, an aptamer, or an RNA-protein recruitment domain.

態様11.態様1のPEgRNAであって、DNA合成鋳型が、ニック部位に隣接する内生DNA配列に対して相補的である一本鎖DNAフラップをコードし、一本鎖DNAフラップが所望のヌクレオチド変化を含む。 Embodiment 11. The PEGRNA of embodiment 1, wherein the DNA synthesis template encodes a single-stranded DNA flap that is complementary to the endogenous DNA sequence adjacent to the nick site, and the single-stranded DNA flap contains the desired nucleotide change.

態様12.態様11のPEgRNAであって、一本鎖DNAフラップが、ニッキングされた標的DNA配列上の5'端を有する内生一本鎖DNAを押し除け、内生一本鎖DNAがニック部位の下流において直ちに隣接する。 Embodiment 12. The PEGRNA of embodiment 11, wherein the single-stranded DNA flap displaces the endogenous single-stranded DNA having a 5' end on the nicked target DNA sequence, and the endogenous single-stranded DNA is immediately adjacent to and downstream of the nick site.

態様13.態様11のPEgRNAであって、遊離の5'端を有する内生一本鎖DNAが細胞によって切除される。 Aspect 13. The PEGRNA of aspect 11, wherein the endogenous single-stranded DNA having a free 5' end is excised by the cell.

態様14.態様13のPEgRNAであって、一本鎖DNAフラップの細胞性修復が所望のヌクレオチド変化の組み入れをもたらし、それによって所望の産物を形成する。 Embodiment 14. The PEGRNA of embodiment 13, wherein cellular repair of the single-stranded DNA flap results in incorporation of the desired nucleotide change, thereby forming the desired product.

態様15.態様1のPEgRNAであって、配列番号101~104、181~183、223~244、277、325~334、336、338、340、342、344、346、348、350、352、354、356、358、360、362、364、366、368、499~505、735~761、776~777のヌクレオチド配列、または配列番号101~104、181~183、223~244、277、325~334、336、338、340、342、344、346、348、350、352、354、356、358、360、362、364、366、368、499~505、735~761、776~777のいずれか1つとの少なくとも85%もしくは少なくとも90%もしくは少なくとも95%もしくは少なくとも98%もしくは少なくとも99%配列同一性を有するヌクレオチド配列を含む。 Embodiment 15. The PEG RNA of embodiment 1, comprising a nucleotide sequence of SEQ ID NOs: 101-104, 181-183, 223-244, 277, 325-334, 336, 338, 340, 342, 344, 346, 348, 350, 352, 354, 356, 358, 360, 362, 364, 366, 368, 499-505, 735-761, 776-777, or a nucleotide sequence of SEQ ID NOs: 101-104, 181-183, 223-244, 277, 325-334, 336, 338, 340, 342, 344, 346, 348, 350, 352, 354, 356, 358, 360, 362, 364, 366, 368, 499-505, 735-761, 776-777, 77, 325-334, 336, 338, 340, 342, 344, 346, 348, 350, 352, 354, 356, 358, 360, 362, 364, 366, 368, 499-505, 735-761, 776-777.

態様16.態様1のPEgRNAであって、DNA合成鋳型が、内生DNA標的と少なくとも80%または85%または90%または95%または99%同一であるヌクレオチド配列を含む。 Embodiment 16. The PEGRNA of embodiment 1, wherein the DNA synthesis template comprises a nucleotide sequence that is at least 80%, 85%, 90%, 95%, or 99% identical to the endogenous DNA target.

態様17.態様6のPEgRNAであって、プライマー結合部位が、カットされたDNAの遊離の3'端とハイブリダイズする。 Aspect 17. The PEGRNA of aspect 6, wherein the primer binding site hybridizes to the free 3' end of the cut DNA.

態様18.態様10のPEgRNAであって、少なくとも1つの追加の構造がPEgRNAの3'または5'端に位置付けられる。 Embodiment 18. The PEGRNA of embodiment 10, wherein at least one additional structure is located at the 3' or 5' end of the PEGRNA.

態様19.態様10のPEgRNAであって、リンカーが、配列番号127、165~176、446、453、および767~769からなる群から選択されるヌクレオチド配列を含む。 Embodiment 19. The PEGRNA of embodiment 10, wherein the linker comprises a nucleotide sequence selected from the group consisting of SEQ ID NOs: 127, 165-176, 446, 453, and 767-769.

態様20.態様10のPEgRNAであって、ステムループが本明細書に記載のステムループから選択されるヌクレオチド配列を含む。 Aspect 20. The PEgRNA of aspect 10, wherein the stem loop comprises a nucleotide sequence selected from the stem loops described herein.

態様21.態様10のPEgRNAであって、ヘアピンが本明細書に記載のヘアピンから選択されるヌクレオチド配列を含む。 Aspect 21. The PEGRNA of aspect 10, wherein the hairpin comprises a nucleotide sequence selected from the hairpins described herein.

態様22.態様10のPEgRNAであって、トウループが本明細書に記載のトウループから選択されるヌクレオチド配列を含む。 Aspect 22. The PEGRNA of aspect 10, wherein the toe loop comprises a nucleotide sequence selected from the toe loops described herein.

態様23.態様10のPEgRNAであって、アプタマーが、本明細書に記載のアプタマーから選択されるヌクレオチド配列を含む。 Aspect 23. The PEGRNA of aspect 10, wherein the aptamer comprises a nucleotide sequence selected from the aptamers described herein.

態様24.態様10のPEgRNAであって、RNA-タンパク質動員ドメインが、本明細書に記載のRNA-タンパク質動員ドメインから選択されるヌクレオチド配列を含む。 Embodiment 24. The PEgRNA of embodiment 10, wherein the RNA-protein recruitment domain comprises a nucleotide sequence selected from the RNA-protein recruitment domains described herein.

態様25.所望のヌクレオチド変化を標的ヌクレオチド配列上に組み入れるためのプライム編集への使用のためのPEgRNAをデザインするための方法であって、前記PEgRNAがスペーサー、gRNAコア、および伸長アームを含み、前記伸長アームがプライマー結合部位およびDNA合成鋳型を含み、前記方法が: Embodiment 25. A method for designing a PEgRNA for use in prime editing to incorporate a desired nucleotide change into a target nucleotide sequence, the PEgRNA comprising a spacer, a gRNA core, and an extension arm, the extension arm comprising a primer binding site and a DNA synthesis template, the method comprising:

(i)標的ヌクレオチド配列上の所望の標的編集部位を選択すること; (i) selecting a desired target editing site on a target nucleotide sequence;

(ii)標的編集部位の上流および下流のコンテキストヌクレオチド配列を得ること; (ii) obtaining context nucleotide sequences upstream and downstream of the target editing site;

(iii)所望の標的編集部位に対して近位であるコンテキストヌクレオチド配列上の推定プロトスペーサー隣接モチーフ(PAM)部位を位置付けること; (iii) locating a putative protospacer adjacent motif (PAM) site on the context nucleotide sequence that is proximal to the desired target editing site;

(iv)各推定PAM部位について対応するニック部位を同定すること; (iv) identifying the corresponding nick site for each putative PAM site;

(v)スペーサーをデザインすること; (v) designing the spacer;

(vi)gRNAコアをデザインすること; (vi) designing the gRNA core;

(vii)伸長アームをデザインすること;および (vii) designing the extension arm; and

(viii)スペーサー、gRNAコア、および伸長アームをコンカテネーションすることによって完全なPEgRNAを構築すること、
を含む。
(viii) constructing a complete PEGRNA by concatenating the spacer, gRNA core, and extension arm;
including.

態様26.態様25の方法であって、所望の標的編集部位を選択するステップ(i)が、疾患を引き起こす変異を選択することを含む。 Aspect 26. The method of aspect 25, wherein step (i) of selecting the desired target editing site comprises selecting a disease-causing mutation.

態様27.態様26の方法であって、疾患を引き起こす変異が:がん、自己免疫障害、神経学的障害、皮膚障害、呼吸疾患、および心臓疾患からなる群から選択される疾患に関連する。 Embodiment 27. The method of embodiment 26, wherein the disease-causing mutation is associated with a disease selected from the group consisting of: cancer, an autoimmune disorder, a neurological disorder, a skin disorder, a respiratory disease, and a cardiac disease.

態様28.態様25の方法であって、標的編集部位から上流および下流のコンテキストヌクレオチド配列を得るステップ(ii)が、所望の標的編集部位を含む領域の約50~55塩基対(bp)、約55~60bp、約60~65bp、約65~70bp、約70~75bp、約75~80bp、約80~85bp、約85~90bp、約90~95bp、約95~100bp、約100~105bp、約105~110bp、約110~125bp、約125~130bp、約130~135bp、約135~140bp、約140~145bp、約145~150bp、約150~155bp、約155~160bp、約160~165bp、約165~170bp、約170~175bp、約175~180bp、約180~185bp、約185~190bp、約190~195bp、約195~200bp、約200~205bp、約205~210bp、約210~215bp、約215~220bp、約220~225bp、約225~230bp、約230~235bp、約235~240bp、約240~245bp、または約245~250bpを得ることを含む。 Embodiment 28. The method of embodiment 25, wherein step (ii) of obtaining context nucleotide sequences upstream and downstream from the target editing site comprises obtaining from about 50-55 base pairs (bp), about 55-60 bp, about 60-65 bp, about 65-70 bp, about 70-75 bp, about 75-80 bp, about 80-85 bp, about 85-90 bp, about 90-95 bp, about 95-100 bp, about 100-105 bp, about 105-110 bp, about 110-125 bp, about 125-130 bp, about 130-135 bp, about 135-140 bp, about 140-145 bp, Including obtaining about 145-150bp, about 150-155bp, about 155-160bp, about 160-165bp, about 165-170bp, about 170-175bp, about 175-180bp, about 180-185bp, about 185-190bp, about 190-195bp, about 195-200bp, about 200-205bp, about 205-210bp, about 210-215bp, about 215-220bp, about 220-225bp, about 225-230bp, about 230-235bp, about 235-240bp, about 240-245bp, or about 245-250bp.

態様29.態様28の方法であって、所望の標的編集部位が、コンテキストヌクレオチド配列の各端からおよそ等距離に位置取る。 Embodiment 29. The method of embodiment 28, wherein the desired target editing sites are positioned approximately equidistant from each end of the context nucleotide sequence.

態様30.態様25の方法であって、ステップ(iii)において、推定PAM部位が所望の標的編集部位に対して近位である。 Embodiment 30. The method of embodiment 25, wherein in step (iii), the putative PAM site is proximal to the desired target editing site.

態様31.態様25の方法であって、ステップ(iii)において、推定PAM部位が、標的編集部位から30ヌクレオチド未満の、または標的編集部位から29、28、27、26、25、24、23、22、21、20、19、18、17、16、15、14、13、12、11、10、9、8、7、6、5、4、3、もしくは2ヌクレオチド未満の位置に位置付けられた関連するニック部位を有するものを含む。 Embodiment 31. The method of embodiment 25, wherein in step (iii), the putative PAM site has an associated nick site located less than 30 nucleotides from the target editing site, or less than 29, 28, 27, 26, 25, 24, 23, 22, 21, 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, or 2 nucleotides from the target editing site.

態様32.態様25の方法であって、ステップ(iii)において、推定PAM部位が、標的編集部位から30ヌクレオチド超の、または標的編集部位から31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、もしくは100ヌクレオチド超の位置に位置付けられた関連するニック部位を有するものを含む。 32. The method of claim 25, wherein in step (iii), the putative PAM site is located more than 30 nucleotides from the target editing site, or 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, These include those with associated nick sites located at positions 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99, or more than 100 nucleotides.

態様33.態様25の方法であって、ステップ(iii)において、推定PAM部位が、前記PAM部位に結合する1つのまたは対応するnapDNAbpに関連する。 Embodiment 33. The method of embodiment 25, wherein in step (iii), the putative PAM site is associated with one or a corresponding napDNAbp that binds to said PAM site.

態様34.態様33の方法であって、推定PAM部位およびそれらの対応するnapDNAbpが、次の群分けのいずれかから選択される:(a)配列番号18~25および87~88のSpCas9ならびにNGG;(b)Sp VQR nCas9;ならびに(c)NGAN。 Embodiment 34. The method of embodiment 33, wherein the putative PAM sites and their corresponding napDNAbp are selected from any of the following groupings: (a) SpCas9 and NGG of SEQ ID NOs: 18-25 and 87-88; (b) Sp VQR nCas9; and (c) NGAN.

態様35.態様25の方法であって、スペーサーをデザインするステップ(v)が、各推定PAMに関連するプロトスペーサー配列の相補ヌクレオチド配列を決定することを含む。 Embodiment 35. The method of embodiment 25, wherein the step (v) of designing the spacers comprises determining a complementary nucleotide sequence of a protospacer sequence associated with each putative PAM.

態様36.態様25の方法であって、gRNAコアをデザインするステップ(vi)が、各推定PAMという文脈において、前記推定PAMの夫々に関連するnapDNAbpに結合することができるgRNAコア配列を選択することを含む。 Embodiment 36. The method of embodiment 25, wherein step (vi) of designing the gRNA core comprises selecting a gRNA core sequence that can bind, in the context of each putative PAM, to a napDNAbp associated with each of the putative PAMs.

態様37.態様25の方法であって、伸長アームをデザインするステップ(vii)が、(a)目当ての編集を含むDNA合成鋳型および(b)プライマー結合部位をデザインすることを含む。 Embodiment 37. The method of embodiment 25, wherein step (vii) of designing the extension arm comprises (a) designing a DNA synthesis template containing the desired edit and (b) a primer binding site.

態様38.態様37の方法であって、プライマー結合部位をデザインすることが、(a)標的ヌクレオチド配列のPAM含有鎖上のDNAプライマーを同定し、DNAプライマーの3'端が、PAM部位に関連するニック部位の上流の最初のヌクレオチドであること、および(b)DNAプライマーの相補体をデザインし、前記相補体がプライマー結合部位を形成することを含む。 Embodiment 38. The method of embodiment 37, wherein designing the primer binding site comprises (a) identifying a DNA primer on the PAM-containing strand of the target nucleotide sequence, the 3' end of the DNA primer being the first nucleotide upstream of the nick site associated with the PAM site, and (b) designing a complement of the DNA primer, the complement forming the primer binding site.

態様39.態様38の方法であって、プライマー結合部位が長さが8から15ヌクレオチドである。 Aspect 39. The method of aspect 38, wherein the primer binding site is 8 to 15 nucleotides in length.

態様40.態様38の方法であって、DNAプライマーが約40~60%GC含量を含有する場合に、プライマー結合部位が12~13ヌクレオチドである。 Embodiment 40. The method of embodiment 38, wherein the primer binding site is 12-13 nucleotides when the DNA primer contains about 40-60% GC content.

態様41.態様38の方法であって、DNAプライマーが約40%未満のGC含量を含有する場合に、プライマー結合部位が14~15ヌクレオチドである。 Embodiment 41. The method of embodiment 38, wherein the primer binding site is 14-15 nucleotides when the DNA primer contains less than about 40% GC content.

態様42.態様38の方法であって、DNAプライマーが約60%よりも多大なGC含量を含有する場合に、プライマー結合部位が8~11ヌクレオチドである。 Embodiment 42. The method of embodiment 38, wherein the primer binding site is 8-11 nucleotides when the DNA primer contains a GC content greater than about 60%.

態様43.プライム編集の方法であって、標的DNA配列を、態様1~24のいずれかのPEgRNAならびにnapDNAbpおよびRNA依存性DNAポリメラーゼ活性を有するドメインを含むプライム編集因子融合タンパク質と接触させることを含む。 Embodiment 43. A method of prime editing comprising contacting a target DNA sequence with a prime editor fusion protein comprising a PEgRNA of any one of embodiments 1 to 24 and a napDNAbp and a domain having RNA-dependent DNA polymerase activity.

態様44.態様43の方法であって、napDNAbpがニッカーゼ活性を有する。 Aspect 44. The method of aspect 43, wherein the napDNAbp has nickase activity.

態様45.態様43の方法であって、napDNAbpがCas9タンパク質またはそのバリアントである。 Embodiment 45. The method of embodiment 43, wherein the napDNAbp is a Cas9 protein or a variant thereof.

態様46.態様43の方法であって、napDNAbpがヌクレアーゼ活性Cas9、ヌクレアーゼ不活性型Cas9(dCas9)、またはCas9ニッカーゼ(nCas9)である。 Embodiment 46. The method of embodiment 43, wherein napDNAbp is a nuclease-active Cas9, a nuclease-inactive Cas9 (dCas9), or a Cas9 nickase (nCas9).

態様47.態様43の方法であって、napDNAbpがCas9ニッカーゼ(nCas9)である。 Aspect 47. The method of aspect 43, wherein the napDNAbp is Cas9 nickase (nCas9).

態様48.態様43の方法であって、napDNAbpが:Cas9、Cas12e、Cas12d、Cas12a、Cas12b1、Cas13a、Cas12c、およびアルゴノートからなる群から選択され、任意にニッカーゼ活性を有する。 Embodiment 48. The method of embodiment 43, wherein the napDNAbp is selected from the group consisting of: Cas9, Cas12e, Cas12d, Cas12a, Cas12b1, Cas13a, Cas12c, and Argonaute, and optionally has nickase activity.

態様49.態様43の方法であって、RNA依存性DNAポリメラーゼ活性を含むドメインが逆転写酵素であり、配列番号89~100、105~122、128~129、132、139、143、149、154、159、235、454、471、516、662、700、701~716、739~741、および766のアミノ酸配列のいずれか1つを含む。 Embodiment 49. The method of embodiment 43, wherein the domain comprising RNA-dependent DNA polymerase activity is a reverse transcriptase and comprises any one of the amino acid sequences of SEQ ID NOs: 89-100, 105-122, 128-129, 132, 139, 143, 149, 154, 159, 235, 454, 471, 516, 662, 700, 701-716, 739-741, and 766.

態様50.態様43の方法であって、RNA依存性DNAポリメラーゼ活性を含むドメインが逆転写酵素であり、配列番号89~100、105~122、128~129、132、139、143、149、154、159、235、454、471、516、662、700、701~716、739~741、および766のいずれか1つのアミノ酸配列との少なくとも80%、85%、90%、95%、98%、または99%配列同一性を有するアミノ酸配列を含む。 Embodiment 50. The method of embodiment 43, wherein the domain comprising the RNA-dependent DNA polymerase activity is a reverse transcriptase and comprises an amino acid sequence having at least 80%, 85%, 90%, 95%, 98%, or 99% sequence identity to any one of the amino acid sequences of SEQ ID NOs: 89-100, 105-122, 128-129, 132, 139, 143, 149, 154, 159, 235, 454, 471, 516, 662, 700, 701-716, 739-741, and 766.

態様51.態様43の方法であって、RNA依存性DNAポリメラーゼ活性を含むドメインが、レトロウイルスまたはレトロトランスポゾンからの天然に存在する逆転写酵素である。 Embodiment 51. The method of embodiment 43, wherein the domain containing the RNA-dependent DNA polymerase activity is a naturally occurring reverse transcriptase from a retrovirus or retrotransposon.

群C.PE複合体
態様1.プライム編集のための複合体であって:
Group C. PE Conjugates Embodiment 1. A conjugate for prime editing comprising:

(i)核酸プログラム型DNA結合タンパク質(napDNAbp)とaRNA依存性DNAポリメラーゼ活性を含むドメインとを含む融合タンパク質;および (i) a fusion protein comprising a nucleic acid programmable DNA binding protein (napDNAbp) and a domain containing aRNA-dependent DNA polymerase activity; and

(ii)プライム編集ガイドRNA(PEgRNA)、
を含む。
(ii) a prime-edited guide RNA (PEgRNA),
including.

態様2.態様1の複合体であって、融合タンパク質が、プライム編集ガイドRNA(PEgRNA)の存在下においてプライム編集を実行して、所望のヌクレオチド変化を標的配列上に組み入れることができる。 Aspect 2. The complex of aspect 1, wherein the fusion protein is capable of performing prime editing in the presence of a prime editing guide RNA (PEgRNA) to incorporate a desired nucleotide change into a target sequence.

態様3.態様11の複合体であって、napDNAbpがニッカーゼ活性を有する。 Aspect 3. The complex of aspect 11, wherein napDNAbp has nickase activity.

態様4.態様1の複合体であって、napDNAbpがCas9タンパク質またはそのバリアントである。 Embodiment 4. The complex of embodiment 1, wherein napDNAbp is a Cas9 protein or a variant thereof.

態様5.態様1の複合体であって、napDNAbpがヌクレアーゼ活性Cas9、ヌクレアーゼ不活性型Cas9(dCas9)、またはCas9ニッカーゼ(nCas9)である。 Embodiment 5. The complex of embodiment 1, wherein napDNAbp is a nuclease-active Cas9, a nuclease-inactive Cas9 (dCas9), or a Cas9 nickase (nCas9).

態様6.態様1の複合体であって、napDNAbpがCas9ニッカーゼ(nCas9)である。 Aspect 6. The complex of aspect 1, wherein the napDNAbp is a Cas9 nickase (nCas9).

態様7.態様1の複合体であって、napDNAbpが:Cas9、Cas12e、Cas12d、Cas12a、Cas12b1、Cas13a、Cas12c、およびアルゴノートからなる群から選択され、任意にニッカーゼ活性を有する。 Embodiment 7. The complex of embodiment 1, wherein napDNAbp is selected from the group consisting of: Cas9, Cas12e, Cas12d, Cas12a, Cas12b1, Cas13a, Cas12c, and Argonaute, and optionally has nickase activity.

態様8.態様1の複合体であって、RNA依存性DNAポリメラーゼ活性を含むドメインが逆転写酵素であり、配列番号89~100、105~122、128~129、132、139、143、149、154、159、235、454、471、516、662、700、701~716、739~741、および766のアミノ酸配列のいずれか1つを含む。 Embodiment 8. The complex of embodiment 1, wherein the domain comprising the RNA-dependent DNA polymerase activity is a reverse transcriptase and comprises any one of the amino acid sequences of SEQ ID NOs: 89-100, 105-122, 128-129, 132, 139, 143, 149, 154, 159, 235, 454, 471, 516, 662, 700, 701-716, 739-741, and 766.

態様9.態様1の複合体であって、RNA依存性DNAポリメラーゼ活性を含むドメインが逆転写酵素であり、配列番号89~100、105~122、128~129、132、139、143、149、154、159、235、454、471、516、662、700、701~716、739~741、および766のいずれか1つのアミノ酸配列との少なくとも80%、85%、90%、95%、98%、または99%配列同一性を有するアミノ酸配列を含む。 Embodiment 9. The complex of embodiment 1, wherein the domain comprising the RNA-dependent DNA polymerase activity is a reverse transcriptase and comprises an amino acid sequence having at least 80%, 85%, 90%, 95%, 98%, or 99% sequence identity to any one of the amino acid sequences of SEQ ID NOs: 89-100, 105-122, 128-129, 132, 139, 143, 149, 154, 159, 235, 454, 471, 516, 662, 700, 701-716, 739-741, and 766.

態様10.態様1の複合体であって、RNA依存性DNAポリメラーゼ活性を含むドメインが、レトロウイルスまたはレトロトランスポゾンからの天然に存在する逆転写酵素である。 Embodiment 10. The complex of embodiment 1, wherein the domain containing the RNA-dependent DNA polymerase activity is a naturally occurring reverse transcriptase from a retrovirus or retrotransposon.

態様11.態様1の複合体であって、融合タンパク質がPEgRNAと複合体化したときに標的DNA配列に結合することができる。 Embodiment 11. The complex of embodiment 1, wherein the fusion protein is capable of binding to a target DNA sequence when complexed with the PEgRNA.

態様12.態様1の複合体であって、PEgRNAが、ガイドRNAとDNA合成鋳型を含む少なくとも1つの核酸伸長アームとを含む。 Embodiment 12. The complex of embodiment 1, wherein the PEGRNA comprises a guide RNA and at least one nucleic acid extension arm comprising a DNA synthesis template.

態様13.態様12の複合体であって、核酸伸長アームがガイドRNAの3'もしくは5'端またはガイドRNAの分子内の位置の位置であり、核酸伸長アームがDNAまたはRNAである。 Aspect 13. The complex of aspect 12, wherein the nucleic acid extension arm is at the 3' or 5' end of the guide RNA or at an intramolecular position of the guide RNA, and the nucleic acid extension arm is DNA or RNA.

態様14.態様12の複合体であって、PEgRNAが、napDNAbpに結合することおよびnapDNAbpを標的DNA配列へと導くことができる。 Embodiment 14. The complex of embodiment 12, wherein the PEgRNA is capable of binding to the napDNAbp and directing the napDNAbp to a target DNA sequence.

態様15.態様14の複合体であって、標的DNA配列が標的鎖および相補的な非標的鎖を含む。 Embodiment 15. The complex of embodiment 14, wherein the target DNA sequence comprises a target strand and a complementary non-target strand.

態様16.態様12の複合体であって、ガイドRNAが標的鎖にハイブリダイズして、RNA-DNAハイブリッドおよびRループを形成する。 Embodiment 16. The complex of embodiment 12, wherein the guide RNA hybridizes to the target strand to form an RNA-DNA hybrid and an R-loop.

態様17.態様12の複合体であって、少なくとも1つの核酸伸長アームがさらにプライマー結合部位を含む。 Aspect 17. The complex of aspect 12, wherein at least one nucleic acid extension arm further comprises a primer binding site.

態様18.態様12の複合体であって、核酸伸長アームが、少なくとも5ヌクレオチド、少なくとも6ヌクレオチド、少なくとも7ヌクレオチド、少なくとも8ヌクレオチド、少なくとも9ヌクレオチド、少なくとも10ヌクレオチド、少なくとも11ヌクレオチド、少なくとも12ヌクレオチド、少なくとも13ヌクレオチド、少なくとも14ヌクレオチド、少なくとも15ヌクレオチド、少なくとも16ヌクレオチド、少なくとも17ヌクレオチド、少なくとも18ヌクレオチド、少なくとも19ヌクレオチド、少なくとも20ヌクレオチド、少なくとも21ヌクレオチド、少なくとも22ヌクレオチド、少なくとも23ヌクレオチド、少なくとも24ヌクレオチド、少なくとも25ヌクレオチド、少なくとも26ヌクレオチド、少なくとも27ヌクレオチド、少なくとも28ヌクレオチド、少なくとも29ヌクレオチド、少なくとも30ヌクレオチド、少なくとも31ヌクレオチド、少なくとも32ヌクレオチド、少なくとも33ヌクレオチド、少なくとも34ヌクレオチド、少なくとも35ヌクレオチド、少なくとも36ヌクレオチド、少なくとも37ヌクレオチド、少なくとも38ヌクレオチド、少なくとも39ヌクレオチド、少なくとも40ヌクレオチド、少なくとも41ヌクレオチド、少なくとも42ヌクレオチド、少なくとも43ヌクレオチド、少なくとも44ヌクレオチド、少なくとも45ヌクレオチド、少なくとも46ヌクレオチド、少なくとも47ヌクレオチド、少なくとも48ヌクレオチド、少なくとも49ヌクレオチド、または少なくとも50ヌクレオチドである。 Embodiment 18. The complex of embodiment 12, wherein the nucleic acid extension arm is at least 5 nucleotides, at least 6 nucleotides, at least 7 nucleotides, at least 8 nucleotides, at least 9 nucleotides, at least 10 nucleotides, at least 11 nucleotides, at least 12 nucleotides, at least 13 nucleotides, at least 14 nucleotides, at least 15 nucleotides, at least 16 nucleotides, at least 17 nucleotides, at least 18 nucleotides, at least 19 nucleotides, at least 20 nucleotides, at least 21 nucleotides, at least 22 nucleotides, at least 23 nucleotides, at least 24 nucleotides, at least 25 nucleotides, at least 26 nucleotides, at least 27 nucleotides, at least 28 nucleotides, at least 29 nucleotides, at least 30 nucleotides, at least 31 nucleotides, at least 32 nucleotides, at least 33 nucleotides, at least 34 nucleotides, at least 35 nucleotides, at least 36 nucleotides, at least 37 nucleotides, at least 38 nucleotides, at least 39 nucleotides, at least 40 nucleotides, at least 41 nucleotides, at least 42 nucleotides, at least 43 nucleotides, at least 44 nucleotides, at least 45 nucleotides, at least 46 nucleotides, at least 47 nucleotides, at least 48 nucleotides, at least 49 nucleotides, or at least 50 nucleotides.

態様19.態様12の複合体であって、DNA合成鋳型が、長さが少なくとも3ヌクレオチド、少なくとも4ヌクレオチド、少なくとも5ヌクレオチド、少なくとも6ヌクレオチド、少なくとも7ヌクレオチド、少なくとも8ヌクレオチド、少なくとも9ヌクレオチド、少なくとも10ヌクレオチド、少なくとも11ヌクレオチド、少なくとも12ヌクレオチド、少なくとも13ヌクレオチド、少なくとも14ヌクレオチド、または少なくとも15ヌクレオチドである。 Embodiment 19. The complex of embodiment 12, wherein the DNA synthesis template is at least 3 nucleotides, at least 4 nucleotides, at least 5 nucleotides, at least 6 nucleotides, at least 7 nucleotides, at least 8 nucleotides, at least 9 nucleotides, at least 10 nucleotides, at least 11 nucleotides, at least 12 nucleotides, at least 13 nucleotides, at least 14 nucleotides, or at least 15 nucleotides in length.

態様20.態様17の複合体であって、プライマー結合部位が、長さが少なくとも3ヌクレオチド、少なくとも4ヌクレオチド、少なくとも5ヌクレオチド、少なくとも6ヌクレオチド、少なくとも7ヌクレオチド、少なくとも8ヌクレオチド、少なくとも9ヌクレオチド、少なくとも10ヌクレオチド、少なくとも11ヌクレオチド、少なくとも12ヌクレオチド、少なくとも13ヌクレオチド、少なくとも14ヌクレオチド、または少なくとも15ヌクレオチドである。 Embodiment 20. The complex of embodiment 17, wherein the primer binding site is at least 3 nucleotides, at least 4 nucleotides, at least 5 nucleotides, at least 6 nucleotides, at least 7 nucleotides, at least 8 nucleotides, at least 9 nucleotides, at least 10 nucleotides, at least 11 nucleotides, at least 12 nucleotides, at least 13 nucleotides, at least 14 nucleotides, or at least 15 nucleotides in length.

態様21.態様12の複合体であって、PEgRNAが、さらに、リンカー、ステムループ、ヘアピン、トウループ、アプタマー、またはRNA-タンパク質動員ドメインからなる群から選択される少なくとも1つの追加の構造を含む。 Embodiment 21. The complex of embodiment 12, wherein the PEGRNA further comprises at least one additional structure selected from the group consisting of a linker, a stem loop, a hairpin, a toe loop, an aptamer, or an RNA-protein recruitment domain.

態様22.態様12の複合体であって、DNA合成鋳型が、ニック部位に隣接する内生DNA配列に対して相補的である一本鎖DNAフラップをコードし、一本鎖DNAフラップが所望のヌクレオチド変化を含む。 Embodiment 22. The complex of embodiment 12, wherein the DNA synthesis template encodes a single-stranded DNA flap that is complementary to the endogenous DNA sequence adjacent to the nick site, and the single-stranded DNA flap contains the desired nucleotide change.

態様23.態様22の複合体であって、一本鎖DNAフラップが、ニッキングされた標的DNA配列上の5'端を有する内生一本鎖DNAを押し除け、内生一本鎖DNAがニック部位の下流において直ちに隣接する。 Embodiment 23. The complex of embodiment 22, wherein the single-stranded DNA flap displaces the endogenous single-stranded DNA having a 5' end on the nicked target DNA sequence, and the endogenous single-stranded DNA is immediately adjacent to and downstream of the nick site.

態様24.態様23の複合体であって、遊離の5'端を有する内生一本鎖DNAが細胞によって切除される。 Aspect 24. The complex of aspect 23, wherein endogenous single-stranded DNA having a free 5' end is excised by the cell.

態様25.態様23の複合体であって、一本鎖DNAフラップの細胞性修復が所望のヌクレオチド変化の組み入れをもたらし、それによって所望の産物を形成する。 Embodiment 25. The complex of embodiment 23, wherein cellular repair of the single-stranded DNA flap results in incorporation of a desired nucleotide change, thereby forming a desired product.

態様26.態様12の複合体であって、PEgRNAが、配列番号101~104、181~183、223~244、277、325~334、336、338、340、342、344、346、348、350、352、354、356、358、360、362、364、366、368、499~505、735~761、776~777のヌクレオチド配列、または配列番号101~104、181~183、223~244、277、325~334、336、338、340、342、344、346、348、350、352、354、356、358、360、362、364、366、368、499~505、735~761、776~777のいずれか1つとの少なくとも85%もしくは少なくとも90%もしくは少なくとも95%もしくは少なくとも98%もしくは少なくとも99%配列同一性を有するヌクレオチド配列を含む。 Embodiment 26 The conjugate of embodiment 12, wherein the PEGRNA is selected from the group consisting of the nucleotide sequences of SEQ ID NOs: 101-104, 181-183, 223-244, 277, 325-334, 336, 338, 340, 342, 344, 346, 348, 350, 352, 354, 356, 358, 360, 362, 364, 366, 368, 499-505, 735-761, 776-777 , or SEQ ID NOs: 101-104, 181-183, 223-24 4, 277, 325-334, 336, 338, 340, 342, 344, 346, 348, 350, 352, 354, 356, 358, 360, 362, 364, 366, 368, 499-505, 735-761, 776-777.

態様27.態様12の複合体であって、DNA合成鋳型が、内生DNA標的と少なくとも80%または85%または90%または95%または99%同一であるヌクレオチド配列を含む。 Embodiment 27. The complex of embodiment 12, wherein the DNA synthesis template comprises a nucleotide sequence that is at least 80%, 85%, 90%, 95%, or 99% identical to the endogenous DNA target.

態様28.態様17の複合体であって、プライマー結合部位が、カットされたDNAの遊離の3'端とハイブリダイズする。 Embodiment 28. The complex of embodiment 17, wherein the primer binding site hybridizes to the free 3' end of the cut DNA.

態様29.態様21の複合体であって、少なくとも1つの追加の構造がPEgRNAの3'または5'端に位置付けられる。 Embodiment 29. The complex of embodiment 21, wherein at least one additional structure is located at the 3' or 5' end of the PEGRNA.

態様30.態様29の複合体であって、リンカーが、配列番号127、165~176、446、453、および767~769からなる群から選択されるヌクレオチド配列を含む。 Embodiment 30. The conjugate of embodiment 29, wherein the linker comprises a nucleotide sequence selected from the group consisting of SEQ ID NOs: 127, 165-176, 446, 453, and 767-769.

態様31.態様29の複合体であって、ステムループが、本明細書に記載のステムループから選択されるヌクレオチド配列を含む。 Aspect 31. The complex of aspect 29, wherein the stem loop comprises a nucleotide sequence selected from the stem loops described herein.

態様32.態様29の複合体であって、ヘアピンが、本明細書に記載のヘアピンから選択されるヌクレオチド配列を含む。 Embodiment 32. The complex of embodiment 29, wherein the hairpin comprises a nucleotide sequence selected from the hairpins described herein.

態様33.態様29の複合体であって、トウループが、本明細書に記載のトウループから選択されるヌクレオチド配列を含む。 Aspect 33. The complex of aspect 29, wherein the toe loop comprises a nucleotide sequence selected from the toe loops described herein.

態様34.態様29の複合体であって、アプタマーが、本明細書に記載のアプタマーから選択されるヌクレオチド配列を含む。 Aspect 34. The complex of aspect 29, wherein the aptamer comprises a nucleotide sequence selected from the aptamers described herein.

態様35.態様29の複合体であって、RNA-タンパク質動員ドメインが、本明細書に記載のRNA-タンパク質動員ドメインから選択されるヌクレオチド配列を含む。 Embodiment 35. The complex of embodiment 29, wherein the RNA-protein recruitment domain comprises a nucleotide sequence selected from the RNA-protein recruitment domains described herein.

態様36.態様1の複合体であって、標的DNA配列が標的鎖および相補的な非標的鎖を含む。 Embodiment 36. The complex of embodiment 1, wherein the target DNA sequence comprises a target strand and a complementary non-target strand.

態様37.態様36の複合体であって、Rループが、(i)PEgRNAと標的鎖とを含むRNA-DNAハイブリッドおよび(ii)相補的な非標的鎖を含む。 Embodiment 37. The complex of embodiment 36, wherein the R-loop comprises (i) an RNA-DNA hybrid comprising the PEgRNA and a target strand and (ii) a complementary non-target strand.

態様38.態様37の複合体であって、標的または相補的な非標的鎖がニッキングされて、遊離の3’端を有するプライム配列を形成する。 Embodiment 38. The complex of embodiment 37, wherein the target or complementary non-target strand is nicked to form a primed sequence having a free 3' end.

態様39.態様38の複合体であって、ニック部位が標的鎖上のPAM配列の上流にある。 Embodiment 39. The conjugate of embodiment 38, wherein the nick site is upstream of the PAM sequence on the target strand.

態様40.態様38の複合体であって、ニック部位が非標的鎖上のPAM配列の上流にある。 Embodiment 40. The complex of embodiment 38, wherein the nick site is upstream of the PAM sequence on the non-target strand.

態様41.態様38の複合体であって、ニック部位がPAM配列の5'端に対して相対的に-1、-2、-3、-4、-5、-6、-7、-8、または-9である。 Embodiment 41. The conjugate of embodiment 38, wherein the nick site is -1, -2, -3, -4, -5, -6, -7, -8, or -9 relative to the 5' end of the PAM sequence.

態様42.態様22の複合体であって、一本鎖DNAフラップが、ニック部位に隣接する内生DNA配列にハイブリダイズし、それによって所望のヌクレオチド変化を標的鎖上に組み入れる。 Embodiment 42. The complex of embodiment 22, wherein the single-stranded DNA flap hybridizes to an endogenous DNA sequence adjacent to the nick site, thereby incorporating a desired nucleotide change onto the target strand.

態様43.態様22の複合体であって、一本鎖DNAフラップが、遊離の5'端を有しかつニック部位に隣接する内生DNA配列に取って代わる。 Embodiment 43. The complex of embodiment 22, wherein the single-stranded DNA flap has a free 5' end and replaces the endogenous DNA sequence adjacent to the nick site.

態様44.態様22の複合体であって、5'端を有する内生DNA配列が細胞によって切除される。 Aspect 44. The complex of aspect 22, wherein the endogenous DNA sequence having a 5' end is excised by the cell.

態様45.態様44の複合体であって、5'端を有する内生DNA配列がフラップエンドヌクレアーゼによって切除される。 Aspect 45. The complex of aspect 44, wherein the endogenous DNA sequence having a 5' end is excised by a flap endonuclease.

態様46.態様43の複合体であって、一本鎖DNAフラップの細胞性修復が、所望のヌクレオチド変化を非標的鎖上に組み込み、それによって所望の産物を形成する。 Embodiment 46. The complex of embodiment 43, wherein cellular repair of the single-stranded DNA flap incorporates a desired nucleotide change onto the non-target strand, thereby forming a desired product.

態様47.態様46の複合体であって、所望のヌクレオチド変化が、PAM配列の約-4から+10の間、またはPAM配列の約-10から+20の間、またはPAM配列の約-20から+40の間、またはPAM配列の約-30から+100の間である編集窓上に組み入れされる。 Embodiment 47. The conjugate of embodiment 46, wherein the desired nucleotide change is incorporated over an editing window that is between about -4 and +10 of the PAM sequence, or between about -10 and +20 of the PAM sequence, or between about -20 and +40 of the PAM sequence, or between about -30 and +100 of the PAM sequence.

態様48.態様47の複合体であって、所望のヌクレオチド変化が、ニック部位の少なくとも1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、または100ヌクレオチド下流に組み入れされる。 EMBODIMENT 48. The complex of embodiment 47, wherein the desired nucleotide change is at least 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49 , 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99, or 100 nucleotides downstream.

態様49.先の態様のいずれか1つの複合体であって、融合タンパク質が構造NH2-[napDNAbp]-[RNA依存性DNAポリメラーゼ活性を含むドメイン]-COOH;またはNH2-[RNA依存性DNAポリメラーゼ活性を含むドメイン]-[napDNAbp]-COOHを含み、「]-[」の夫々のものが任意のリンカー配列の存在を指示する。 Embodiment 49. The conjugate of any one of the preceding embodiments, wherein the fusion protein comprises the structure NH2-[napDNAbp]-[domain containing RNA-dependent DNA polymerase activity]-COOH; or NH2-[domain containing RNA-dependent DNA polymerase activity]-[napDNAbp]-COOH, each of the "]-[" indicates the presence of an optional linker sequence.

態様50.態様49の複合体であって、リンカー配列が配列番号127、165~176、446、453、および767~769のアミノ酸配列を含む。 Embodiment 50. The conjugate of embodiment 49, wherein the linker sequence comprises the amino acid sequence of SEQ ID NOs: 127, 165-176, 446, 453, and 767-769.

態様51.態様1の複合体であって、融合タンパク質が、さらに、napDNAbpとRNA依存性DNAポリメラーゼ活性を含むドメインとを連結するリンカーを含む。 Embodiment 51. The complex of embodiment 1, wherein the fusion protein further comprises a linker connecting the napDNAbp and the domain comprising the RNA-dependent DNA polymerase activity.

態様52.態様51の複合体であって、リンカー配列が配列番号174(1×SGGS)、446(2×SGGS)、3889(3×SGGS)、171(1×XTEN)、3968(1×EAAAK)、3969(2×EAAAK)、および3970(3×EAAAK)のアミノ酸配列を含む。
群D.変異を修正するためのPE法
Embodiment 52. The conjugate of embodiment 51, wherein the linker sequence comprises the amino acid sequences of SEQ ID NOs: 174 (1xSGGS), 446 (2xSGGS), 3889 (3xSGGS), 171 (1xXTEN), 3968 (1xEAAAK), 3969 (2xEAAAK), and 3970 (3xEAAAK).
Group D. PE methods for correcting mutations

態様1.所望のヌクレオチド変化を二本鎖DNA配列に組み入れるための方法であって、方法が:
融合タンパク質およびPEgRNAを含む複合体と二本鎖DNA配列を接触させ、融合タンパク質がnapDNAbpおよびポリメラーゼを含み、PEgRNAが所望のヌクレオチド変化を含むDNA合成鋳型とプライマー結合部位とを含むこと;
Embodiment 1. A method for incorporating a desired nucleotide change into a double stranded DNA sequence, the method comprising:
contacting a double-stranded DNA sequence with a complex comprising a fusion protein and a PEgRNA, wherein the fusion protein comprises napDNAbp and a polymerase, and the PEgRNA comprises a DNA synthesis template containing the desired nucleotide change and a primer binding site;

それによって、二本鎖DNA配列にニッキングし、それによって3’端を有する遊離の一本鎖DNAを生成すること; thereby nicking the double-stranded DNA sequence, thereby generating a free single-stranded DNA having a 3' end;

それによって、遊離の一本鎖DNAの3’端をプライマー結合部位にハイブリダイズさせ、それによってポリメラーゼをプライムすること; thereby hybridizing the 3' end of the free single-stranded DNA to the primer binding site, thereby priming the polymerase;

それによって、プライマー結合部位にハイブリダイズした3’端からDNAの鎖を重合し、それによって、DNA合成鋳型に対して相補的であるかつ所望のヌクレオチド変化を含む一本鎖DNAフラップを生成すること; thereby polymerizing a strand of DNA from the 3' end hybridized to the primer binding site, thereby generating a single-stranded DNA flap that is complementary to the DNA synthesis template and contains the desired nucleotide change;

それによって、カットされた部位に隣接する内生DNA鎖を一本鎖DNAフラップによって置き換え、それによって所望のヌクレオチド変化を二本鎖DNA配列に組み入れること、
を含む。
thereby replacing the endogenous DNA strand adjacent to the cut site with a single-stranded DNA flap, thereby incorporating the desired nucleotide change into the double-stranded DNA sequence;
including.

態様2.態様1の方法であって、内生DNA鎖を置き換えることが:(i)一本鎖DNAフラップをカットされた部位に隣接する内生DNA鎖にハイブリダイズさせて、配列ミスマッチを生出すること;(ii)内生DNA鎖を切り出すこと;および(iii)ミスマッチを修復して、所望のヌクレオチド変化をDNAの両方の鎖に含む所望の産物を形成することを含む。 Embodiment 2. The method of embodiment 1, wherein replacing the endogenous DNA strand comprises: (i) hybridizing a single-stranded DNA flap to the endogenous DNA strand adjacent to the cut site to create a sequence mismatch; (ii) excising the endogenous DNA strand; and (iii) repairing the mismatch to form a desired product containing the desired nucleotide change in both strands of DNA.

態様3.態様1の方法であって、所望のヌクレオチド変化が1ヌクレオチド置換、欠失、または挿入である。 Aspect 3. The method of aspect 1, wherein the desired nucleotide change is a single nucleotide substitution, deletion, or insertion.

態様4.態様3の方法であって、1ヌクレオチド置換がトランジションまたはトランスバージョンである。 Aspect 4. The method of aspect 3, wherein the single nucleotide substitution is a transition or a transversion.

態様5.態様1の方法であって、所望のヌクレオチド変化が、(1)GからTの置換、(2)GからAの置換、(3)GからCの置換、(4)TからGの置換、(5)TからAの置換、(6)TからCの置換、(7)CからGの置換、(8)CからTの置換、(9)CからAの置換、(10)AからTの置換、(11)AからGの置換、または(12)AからCの置換である。 Embodiment 5. The method of embodiment 1, wherein the desired nucleotide change is (1) a G to T substitution, (2) a G to A substitution, (3) a G to C substitution, (4) a T to G substitution, (5) a T to A substitution, (6) a T to C substitution, (7) a C to G substitution, (8) a C to T substitution, (9) a C to A substitution, (10) an A to T substitution, (11) an A to G substitution, or (12) an A to C substitution.

態様6.態様1の方法であって、所望のヌクレオチド変化が、(1)G:C塩基対をT:A塩基対に、(2)G:C塩基対をA:T塩基対に、(3)G:C塩基対をC:G塩基対に、(4)T:A塩基対をG:C塩基対に、(5)T:A塩基対をA:T塩基対に、(6)T:A塩基対をC:G塩基対に、(7)C:G塩基対をG:C塩基対に、(8)C:G塩基対をT:A塩基対に、C:G塩基対をA:T塩基対に、(10)A:T塩基対をT:A塩基対に、(11)A:T塩基対をG:C塩基対に、または(12)A:T塩基対をC:G塩基対に変換する。 Embodiment 6. The method of embodiment 1, wherein the desired nucleotide change is to convert (1) a G:C base pair to a T:A base pair, (2) a G:C base pair to an A:T base pair, (3) a G:C base pair to a C:G base pair, (4) a T:A base pair to a G:C base pair, (5) a T:A base pair to an A:T base pair, (6) a T:A base pair to a C:G base pair, (7) a C:G base pair to a G:C base pair, (8) a C:G base pair to a T:A base pair, a C:G base pair to an A:T base pair, (10) an A:T base pair to a T:A base pair, (11) an A:T base pair to a G:C base pair, or (12) an A:T base pair to a C:G base pair.

態様7.態様1の方法であって、所望のヌクレオチド変化が、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、または25ヌクレオチドの挿入または欠失である。 Aspect 7. The method of aspect 1, wherein the desired nucleotide change is an insertion or deletion of 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, or 25 nucleotides.

態様8.態様1の方法であって、所望のヌクレオチド変化が疾患関連遺伝子を修正する。 Embodiment 8. The method of embodiment 1, wherein the desired nucleotide change corrects a disease-associated gene.

態様9.態様8の方法であって、疾患関連遺伝子が:アデノシンデアミナーゼ(ADA)欠損症;アルファ-1アンチトリプシン欠損症;嚢胞性線維症;デュシェンヌ型筋ジストロフィー;ガラクトース血症;ヘモクロマトーシス;ハンチントン病;メープルシロップ尿症;マルファン症候群;1型神経線維腫症;先天性爪肥厚症;フェニルケトン尿症;重症複合免疫不全;鎌状赤血球症;スミス・レムリ・オピッツ症候群;トリヌクレオチド反復障害;プリオン病;およびテイ・サックス病からなる群から選択される単一遺伝子障害に関連する。 Embodiment 9. The method of embodiment 8, wherein the disease-associated gene is associated with a single gene disorder selected from the group consisting of: adenosine deaminase (ADA) deficiency; alpha-1 antitrypsin deficiency; cystic fibrosis; Duchenne muscular dystrophy; galactosemia; hemochromatosis; Huntington's disease; maple syrup urine disease; Marfan syndrome; neurofibromatosis type 1; pachyonychia congenita; phenylketonuria; severe combined immunodeficiency; sickle cell disease; Smith-Lemli-Opitz syndrome; trinucleotide repeat disorders; prion diseases; and Tay-Sachs disease.

態様10.態様8の方法であって、疾患関連遺伝子が:心臓病;高血圧;アルツハイマー病;関節炎;糖尿病;がん;および肥満からなる群から選択される多遺伝子性障害に関連する。 Embodiment 10. The method of embodiment 8, wherein the disease-associated gene is associated with a polygenic disorder selected from the group consisting of: heart disease; hypertension; Alzheimer's disease; arthritis; diabetes; cancer; and obesity.

態様11.態様1の方法であって、napDNAbpが、ヌクレアーゼ不活性型Cas9(dCas9)、Cas9ニッカーゼ(nCas9)、またはヌクレアーゼ活性Cas9である。 Embodiment 11. The method of embodiment 1, wherein the napDNAbp is a nuclease-inactive Cas9 (dCas9), a Cas9 nickase (nCas9), or a nuclease-active Cas9.

態様12.態様1の方法であって、napDNAbpが配列番号18のアミノ酸配列を含む。 Aspect 12. The method of aspect 1, wherein napDNAbp comprises the amino acid sequence of SEQ ID NO:18.

態様13.態様1の方法であって、napDNAbpが、配列番号18~88、126、130、137、141、147、153、157、445、460、467、および482~487のいずれか1つのアミノ酸配列との少なくとも80%、85%、90%、95%、98%、または99%配列同一性を有するアミノ酸配列を含む。 Embodiment 13. The method of embodiment 1, wherein napDNAbp comprises an amino acid sequence having at least 80%, 85%, 90%, 95%, 98%, or 99% sequence identity to any one of the amino acid sequences of SEQ ID NOs: 18-88, 126, 130, 137, 141, 147, 153, 157, 445, 460, 467, and 482-487.

態様14.態様1の方法であって、ポリメラーゼが逆転写酵素であり、配列番号89~100、105~122、128~129、132、139、143、149、154、159、235、454、471、516、662、700、701~716、739~741、および766のアミノ酸配列のいずれか1つを含む。 Embodiment 14. The method of embodiment 1, wherein the polymerase is a reverse transcriptase and comprises any one of the amino acid sequences of SEQ ID NOs: 89-100, 105-122, 128-129, 132, 139, 143, 149, 154, 159, 235, 454, 471, 516, 662, 700, 701-716, 739-741, and 766.

態様15.態様1の方法であって、ポリメラーゼが逆転写酵素であり、配列番号89~100、105~122、128~129、132、139、143、149、154、159、235、454、471、516、662、700、701~716、739~741、および766のいずれか1つのアミノ酸配列との少なくとも80%、85%、90%、95%、98%、または99%配列同一性を有するアミノ酸配列を含む。 Embodiment 15. The method of embodiment 1, wherein the polymerase is a reverse transcriptase and comprises an amino acid sequence having at least 80%, 85%, 90%, 95%, 98%, or 99% sequence identity to any one of the amino acid sequences of SEQ ID NOs: 89-100, 105-122, 128-129, 132, 139, 143, 149, 154, 159, 235, 454, 471, 516, 662, 700, 701-716, 739-741, and 766.

態様16.態様1の方法であって、PEgRNAが核酸伸長アームをガイドRNAの3'もしくは5'端または分子内の位置付けに含み、伸長アームがDNA合成鋳型配列およびプライマー結合部位を含む。 Embodiment 16. The method of embodiment 1, wherein the PEGRNA comprises a nucleic acid extension arm at the 3' or 5' end of the guide RNA or positioned intramolecularly, the extension arm comprising a DNA synthesis template sequence and a primer binding site.

態様17.態様16の方法であって、伸長アームが、長さが少なくとも5ヌクレオチド、少なくとも6ヌクレオチド、少なくとも7ヌクレオチド、少なくとも8ヌクレオチド、少なくとも9ヌクレオチド、少なくとも10ヌクレオチド、少なくとも11ヌクレオチド、少なくとも12ヌクレオチド、少なくとも13ヌクレオチド、少なくとも14ヌクレオチド、少なくとも15ヌクレオチド、少なくとも16ヌクレオチド、少なくとも17ヌクレオチド、少なくとも18ヌクレオチド、少なくとも19ヌクレオチド、少なくとも20ヌクレオチド、少なくとも21ヌクレオチド、少なくとも22ヌクレオチド、少なくとも23ヌクレオチド、少なくとも24ヌクレオチド、または少なくとも25ヌクレオチドである。 Embodiment 17. The method of embodiment 16, wherein the extension arm is at least 5 nucleotides, at least 6 nucleotides, at least 7 nucleotides, at least 8 nucleotides, at least 9 nucleotides, at least 10 nucleotides, at least 11 nucleotides, at least 12 nucleotides, at least 13 nucleotides, at least 14 nucleotides, at least 15 nucleotides, at least 16 nucleotides, at least 17 nucleotides, at least 18 nucleotides, at least 19 nucleotides, at least 20 nucleotides, at least 21 nucleotides, at least 22 nucleotides, at least 23 nucleotides, at least 24 nucleotides, or at least 25 nucleotides in length.

態様18.態様1の方法であって、PEgRNAが、配列番号101~104、181~183、223~244、277、325~334、336、338、340、342、344、346、348、350、352、354、356、358、360、362、364、366、368、499~505、735~761、776~777からなる群から選択されるヌクレオチド配列を有する。 Embodiment 18. The method of embodiment 1, wherein the PEGRNA has a nucleotide sequence selected from the group consisting of SEQ ID NOs: 101-104, 181-183, 223-244, 277, 325-334, 336, 338, 340, 342, 344, 346, 348, 350, 352, 354, 356, 358, 360, 362, 364, 366, 368, 499-505, 735-761, and 776-777.

態様19.標的座位におけるDNA分子のヌクレオチド配列の1つ以上の変化を導入するための方法であって:
DNA分子を、核酸プログラム型DNA結合タンパク質(napDNAbp)およびnapDNAbpを標的座位へと標的化するPEgRNAと接触させ、PEgRNAが少なくとも1つの所望のヌクレオチド変化を含む逆転写酵素(RT)鋳型配列とプライマー結合部位とを含むこと;
Embodiment 19. A method for introducing one or more changes in a nucleotide sequence of a DNA molecule at a target locus, comprising:
contacting the DNA molecule with a nucleic acid programmable DNA binding protein (napDNAbp) and a PEgRNA that targets the napDNAbp to a target locus, the PEgRNA comprising a reverse transcriptase (RT) template sequence containing at least one desired nucleotide change and a primer binding site;

それによって、標的座位におけるDNA鎖の暴露された3'端を形成すること; Thereby creating an exposed 3' end of the DNA strand at the target locus;

それによって、暴露された3'端をプライマー結合部位にハイブリダイズさせて逆転写をプライムすること; thereby priming reverse transcription by hybridizing the exposed 3' end to the primer binding site;

それによって、逆転写酵素によって、RT鋳型配列に基づく少なくとも1つの所望のヌクレオチド変化を含む一本鎖DNAフラップを合成すること; thereby synthesizing, by reverse transcriptase, a single-stranded DNA flap containing at least one desired nucleotide change based on the RT template sequence;

それによって、少なくとも1つの所望のヌクレオチド変化を対応する内生DNA上に組み込み、それによって、標的座位においてDNA分子のヌクレオチド配列の1つ以上の変化を導入すること、
を含む。
thereby incorporating at least one desired nucleotide change into the corresponding endogenous DNA, thereby introducing one or more changes in the nucleotide sequence of the DNA molecule at the target locus;
including.

態様20.態様19の方法であって、ヌクレオチド配列の1つ以上の変化がトランジションを含む。 Embodiment 20. The method of embodiment 19, wherein the one or more changes in the nucleotide sequence include a transition.

態様21.態様19の方法であって、トランジションが、(a)TからC;(b)AからG;(c)CからT;および(d)GからAからなる群から選択される。 Embodiment 21. The method of embodiment 19, wherein the transition is selected from the group consisting of: (a) T to C; (b) A to G; (c) C to T; and (d) G to A.

態様22.態様19の方法であって、ヌクレオチド配列の1つ以上の変化がトランスバージョンを含む。 Embodiment 22. The method of embodiment 19, wherein the one or more changes in the nucleotide sequence include a transversion.

態様23.態様22の方法であって、トランスバージョンが、(a)TからA;(b)TからG;(c)CからG;(d)CからA;(e)AからT;(f)AからC;(g)GからC;および(h)GからTからなる群から選択される。 Embodiment 23. The method of embodiment 22, wherein the transversion is selected from the group consisting of: (a) T to A; (b) T to G; (c) C to G; (d) C to A; (e) A to T; (f) A to C; (g) G to C; and (h) G to T.

態様24.態様19の方法であって、ヌクレオチド配列の1つ以上の変化が、(1)G:C塩基対をT:A塩基対に、(2)G:C塩基対をA:T塩基対に、(3)G:C塩基対をC:G塩基対に、(4)T:A塩基対をG:C塩基対に、(5)T:A塩基対をA:T塩基対に、(6)T:A塩基対をC:G塩基対に、(7)C:G塩基対をG:C塩基対に、(8)C:G塩基対をT:A塩基対に、(9)C:G塩基対をA:T塩基対に、(9)A:T塩基対をT:A塩基対に、(11)A:T塩基対をG:C塩基対に、または(12)A:T塩基対をC:G塩基対に変化させることを含む。 Embodiment 24. The method of embodiment 19, wherein the one or more changes in the nucleotide sequence include changing (1) a G:C base pair to a T:A base pair, (2) a G:C base pair to an A:T base pair, (3) a G:C base pair to a C:G base pair, (4) a T:A base pair to a G:C base pair, (5) a T:A base pair to an A:T base pair, (6) a T:A base pair to a C:G base pair, (7) a C:G base pair to a G:C base pair, (8) a C:G base pair to a T:A base pair, (9) a C:G base pair to an A:T base pair, (9) an A:T base pair to a T:A base pair, (11) an A:T base pair to a G:C base pair, or (12) an A:T base pair to a C:G base pair.

態様25.態様19の方法であって、ヌクレオチド配列の1つ以上の変化が、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、または25ヌクレオチドの挿入または欠失を含む。 Embodiment 25. The method of embodiment 19, wherein the one or more changes in the nucleotide sequence include an insertion or deletion of 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, or 25 nucleotides.

態様26.態様19の方法であって、ヌクレオチド配列の1つ以上の変化が疾患関連遺伝子の修正を含む。 Embodiment 26. The method of embodiment 19, wherein the one or more changes in the nucleotide sequence include correction of a disease-associated gene.

態様27.態様26の方法であって、疾患関連遺伝子が:アデノシンデアミナーゼ(ADA)欠損症;アルファ-1アンチトリプシン欠損症;嚢胞性線維症;デュシェンヌ型筋ジストロフィー;ガラクトース血症;ヘモクロマトーシス;ハンチントン病;メープルシロップ尿症;マルファン症候群;1型神経線維腫症;先天性爪肥厚症;フェニルケトン尿症;重症複合免疫不全;鎌状赤血球症;スミス・レムリ・オピッツ症候群;トリヌクレオチド反復障害;プリオン病;およびテイ・サックス病からなる群から選択される単一遺伝子障害に関連する。 Embodiment 27. The method of embodiment 26, wherein the disease-associated gene is associated with a single gene disorder selected from the group consisting of: adenosine deaminase (ADA) deficiency; alpha-1 antitrypsin deficiency; cystic fibrosis; Duchenne muscular dystrophy; galactosemia; hemochromatosis; Huntington's disease; maple syrup urine disease; Marfan syndrome; neurofibromatosis type 1; pachyonychia congenita; phenylketonuria; severe combined immunodeficiency; sickle cell disease; Smith-Lemli-Opitz syndrome; trinucleotide repeat disorders; prion diseases; and Tay-Sachs disease.

態様28.態様26の方法であって、疾患関連遺伝子が:心臓病;高血圧;アルツハイマー病;関節炎;糖尿病;がん;および肥満からなる群から選択される多遺伝子性障害に関連する。 Embodiment 28. The method of embodiment 26, wherein the disease-associated gene is associated with a polygenic disorder selected from the group consisting of: heart disease; hypertension; Alzheimer's disease; arthritis; diabetes; cancer; and obesity.

態様29.態様19の方法であって、napDNAbpがヌクレアーゼ活性Cas9またはそのバリアントである。 Embodiment 29. The method of embodiment 19, wherein napDNAbp is a nuclease-active Cas9 or a variant thereof.

態様30.態様19の方法であって、napDNAbpがヌクレアーゼ不活性型Cas9(dCas9)もしくはCas9ニッカーゼ(nCas9)またはそのバリアントである。 Aspect 30. The method of aspect 19, wherein napDNAbp is a nuclease-inactivated Cas9 (dCas9) or Cas9 nickase (nCas9) or a variant thereof.

態様31.態様19の方法であって、napDNAbpが配列番号18のアミノ酸配列を含む。 Aspect 31. The method of aspect 19, wherein napDNAbp comprises the amino acid sequence of SEQ ID NO:18.

態様32.態様19の方法であって、napDNAbpが、配列番号18~88、126、130、137、141、147、153、157、445、460、467、および482~487のいずれか1つのアミノ酸配列との少なくとも80%、85%、90%、95%、98%、または99%配列同一性を有するアミノ酸配列を含む。 Embodiment 32. The method of embodiment 19, wherein napDNAbp comprises an amino acid sequence having at least 80%, 85%, 90%, 95%, 98%, or 99% sequence identity to any one of the amino acid sequences of SEQ ID NOs: 18-88, 126, 130, 137, 141, 147, 153, 157, 445, 460, 467, and 482-487.

態様33.態様19の方法であって、逆転写酵素がトランスで導入される。 Embodiment 33. The method of embodiment 19, wherein the reverse transcriptase is introduced in trans.

態様34.態様19の方法であって、napDNAbpが逆転写酵素への融合体を含む。 Embodiment 34. The method of embodiment 19, wherein the napDNAbp comprises a fusion to a reverse transcriptase.

態様35.態様19の方法であって、逆転写酵素が、配列番号89~100、105~122、128~129、132、139、143、149、154、159、235、454、471、516、662、700、701~716、739~741、および766のアミノ酸配列のいずれか1つを含む。 Embodiment 35. The method of embodiment 19, wherein the reverse transcriptase comprises any one of the amino acid sequences of SEQ ID NOs: 89-100, 105-122, 128-129, 132, 139, 143, 149, 154, 159, 235, 454, 471, 516, 662, 700, 701-716, 739-741, and 766.

態様36.態様19の方法であって、逆転写酵素が、配列番号89~100、105~122、128~129、132、139、143、149、154、159、235、454、471、516、662、700、701~716、739~741、および766のいずれか1つのアミノ酸配列との少なくとも80%、85%、90%、95%、98%、または99%配列同一性を有するアミノ酸配列を含む。 Embodiment 36. The method of embodiment 19, wherein the reverse transcriptase comprises an amino acid sequence having at least 80%, 85%, 90%, 95%, 98%, or 99% sequence identity to any one of the amino acid sequences of SEQ ID NOs: 89-100, 105-122, 128-129, 132, 139, 143, 149, 154, 159, 235, 454, 471, 516, 662, 700, 701-716, 739-741, and 766.

態様37.態様19の方法であって、標的座位におけるDNA鎖の暴露された3’端を形成するステップが、ヌクレアーゼによってDNA鎖へニックを入れることを含む。 Embodiment 37. The method of embodiment 19, wherein the step of forming an exposed 3' end of the DNA strand at the target locus comprises nicking the DNA strand with a nuclease.

態様38.態様37の方法であって、ヌクレアーゼがnapDNAbpであるか、napDNAbpの融合ドメインとして提供されるか、またはトランスで提供される。 Embodiment 38. The method of embodiment 37, wherein the nuclease is napDNAbp, is provided as a fusion domain of napDNAbp, or is provided in trans.

態様39.態様19の方法であって、標的座位におけるDNA鎖の暴露された3'端を形成するステップが、DNA鎖を化学的薬剤と接触させることを含む。 Aspect 39. The method of aspect 19, wherein the step of forming an exposed 3' end of the DNA strand at the target locus comprises contacting the DNA strand with a chemical agent.

態様40.態様19の方法であって、標的座位におけるDNA鎖の暴露された3'端を形成するステップが、複製エラーを導入することを含む。 Aspect 40. The method of aspect 19, wherein the step of forming an exposed 3' end of the DNA strand at the target locus includes introducing a replication error.

態様41.態様19の方法であって、DNA分子をnapDNAbpおよびガイドRNAと接触させるステップがRループを形成する。 Embodiment 41. The method of embodiment 19, wherein contacting the DNA molecule with napDNAbp and the guide RNA forms an R-loop.

態様42.態様41の方法であって、暴露された3'端が形成されるDNA鎖がRループ上にある。 Embodiment 42. The method of embodiment 41, wherein the DNA strand on which the exposed 3' end is formed is on an R-loop.

態様43.態様19の方法であって、PEgRNAが、逆転写酵素(RT)鋳型配列とプライマー結合部位とを含む伸長アームを含む。 Embodiment 43. The method of embodiment 19, wherein the PEGRNA comprises an extension arm that comprises a reverse transcriptase (RT) template sequence and a primer binding site.

態様44.態様43の方法であって、伸長アームが、ガイドRNAの3'端、ガイドRNAの5'端、またはガイドRNAの分子内の位置にある。 Embodiment 44. The method of embodiment 43, wherein the extension arm is at the 3' end of the guide RNA, the 5' end of the guide RNA, or at an intramolecular position of the guide RNA.

態様45.態様19の方法であって、PEgRNAが、さらに、リンカー、ステムループ、ヘアピン、トウループ、アプタマー、またはRNA-タンパク質動員ドメインからなる群から選択される少なくとも1つの追加の構造を含む。 Embodiment 45. The method of embodiment 19, wherein the PEGRNA further comprises at least one additional structure selected from the group consisting of a linker, a stem loop, a hairpin, a toe loop, an aptamer, or an RNA-protein recruitment domain.

態様46.態様19の方法であって、PEgRNAがさらに相同アームを含む。 Aspect 46. The method of aspect 19, wherein the PEGRNA further comprises a homology arm.

態様47.態様19の方法であって、RT鋳型配列が、対応する内生DNAに対して相同的である。 Embodiment 47. The method of embodiment 19, wherein the RT template sequence is homologous to the corresponding endogenous DNA.

態様48.プライム標的にプライムされた逆転写によって、標的座位におけるDNA分子のヌクレオチド配列の1つ以上の変化を導入するための方法であって、方法が:(a)標的座位におけるDNA分子を(i)核酸プログラム型DNA結合タンパク質(napDNAbp)および逆転写酵素を含む融合タンパク質ならびに(ii)所望のヌクレオチド変化を含むRT鋳型を含むガイドRNAと接触させること; Embodiment 48. A method for introducing one or more changes in a nucleotide sequence of a DNA molecule at a target locus by primed reverse transcription, the method comprising: (a) contacting a DNA molecule at a target locus with (i) a fusion protein comprising a nucleic acid programmable DNA binding protein (napDNAbp) and a reverse transcriptase, and (ii) a guide RNA comprising an RT template containing a desired nucleotide change;

それによって、RT鋳型のプライム標的にプライムされた逆転写を行なって、所望のヌクレオチド変化を含む一本鎖DNAを生成すること; thereby performing primed reverse transcription on the RT template primed target to generate single-stranded DNA containing the desired nucleotide change;

それによって、DNA修復および/または複製プロセスによって標的座位におけるDNA分子上に所望のヌクレオチド変化を組み込むこと、
を含む。
thereby incorporating a desired nucleotide change onto the DNA molecule at the target locus by DNA repair and/or replication processes;
including.

態様49.態様48の方法であって、RT鋳型が、ガイドRNAの3'端、ガイドRNAの5'端、またはガイドRNAの分子内の位置付けに位置付けられる。 Embodiment 49. The method of embodiment 48, wherein the RT template is located at the 3' end of the guide RNA, the 5' end of the guide RNA, or at an intramolecular location of the guide RNA.

態様50.態様48の方法であって、所望のヌクレオチド変化が、トランジション、トランスバージョン、挿入、もしくは欠失、またはそれらのいずれかの組み合わせを含む。 Embodiment 50. The method of embodiment 48, wherein the desired nucleotide change comprises a transition, a transversion, an insertion, or a deletion, or any combination thereof.

態様51.態様48の方法であって、所望のヌクレオチド変化が、(a)TからC;(b)AからG;(c)CからT;および(d)GからAからなる群から選択されるトランジションを含む。 Embodiment 51. The method of embodiment 48, wherein the desired nucleotide change comprises a transition selected from the group consisting of: (a) T to C; (b) A to G; (c) C to T; and (d) G to A.

態様52.態様48の方法であって、所望のヌクレオチド変化が、(a)TからA;(b)TからG;(c)CからG;(d)CからA;(e)AからT;(f)AからC;(g)GからC;および(h)GからTからなる群から選択されるトランスバージョンを含む。 Embodiment 52. The method of embodiment 48, wherein the desired nucleotide change comprises a transversion selected from the group consisting of: (a) T to A; (b) T to G; (c) C to G; (d) C to A; (e) A to T; (f) A to C; (g) G to C; and (h) G to T.

態様53.態様48の方法であって、所望のヌクレオチド変化が、(1)G:C塩基対をT:A塩基対に、(2)G:C塩基対をA:T塩基対に、(3)G:C塩基対をC:G塩基対に、(4)T:A塩基対をG:C塩基対に、(5)T:A塩基対をA:T塩基対に、(6)T:A塩基対をC:G塩基対に、(7)C:G塩基対をG:C塩基対に、(8)C:G塩基対をT:A塩基対に、(9)C:G塩基対をA:T塩基対に、(10)A:T塩基対をT:A塩基対に、(11)A:T塩基対をG:C塩基対に、または(12)A:T塩基対をC:G塩基対に変化させることを含む。 Embodiment 53. The method of embodiment 48, wherein the desired nucleotide change comprises changing (1) a G:C base pair to a T:A base pair, (2) a G:C base pair to an A:T base pair, (3) a G:C base pair to a C:G base pair, (4) a T:A base pair to a G:C base pair, (5) a T:A base pair to an A:T base pair, (6) a T:A base pair to a C:G base pair, (7) a C:G base pair to a G:C base pair, (8) a C:G base pair to a T:A base pair, (9) a C:G base pair to an A:T base pair, (10) an A:T base pair to a T:A base pair, (11) an A:T base pair to a G:C base pair, or (12) an A:T base pair to a C:G base pair.

態様54.健康な数の反復トリヌクレオチドを含む健康な配列によって標的DNA分子上のトリヌクレオチド反復拡大変異を置き換えるための方法であって、方法が:(a)標的座位におけるDNA分子を(i)核酸プログラム型DNA結合タンパク質(napDNAbp)およびポリメラーゼを含む融合タンパク質ならびに(ii)置き換え配列を含むDNA合成鋳型とプライマー結合部位とを含むPEgRNAと接触させること;(b)プライム編集を行なって、置き換え配列を含む一本鎖DNAを生成すること;ならびに(c)DNA修復および/または複製プロセスによって、標的座位におけるDNA分子上に一本鎖DNAを組み込むことを含む。 Embodiment 54. A method for replacing a trinucleotide repeat expansion mutation on a target DNA molecule with a healthy sequence containing a healthy number of repeated trinucleotides, the method comprising: (a) contacting a DNA molecule at a target locus with (i) a fusion protein comprising a nucleic acid programmable DNA binding protein (napDNAbp) and a polymerase and (ii) a DNA synthesis template comprising the replacement sequence and a PEgRNA comprising a primer binding site; (b) performing prime editing to generate a single-stranded DNA comprising the replacement sequence; and (c) incorporating the single-stranded DNA onto the DNA molecule at the target locus by DNA repair and/or replication processes.

態様55.態様54の方法であって、融合タンパク質がPE1、PE2、またはPE3のアミノ酸配列を含む。 Embodiment 55. The method of embodiment 54, wherein the fusion protein comprises an amino acid sequence of PE1, PE2, or PE3.

態様56.態様54の方法であって、napDNAbpがCas9ニッカーゼ(nCas9)である。 Embodiment 56. The method of embodiment 54, wherein the napDNAbp is Cas9 nickase (nCas9).

態様57.態様54の方法であって、napDNAbpが、配列番号18~88、126、130、137、141、147、153、157、445、460、467、および482~487のアミノ酸配列を含む。 Embodiment 57. The method of embodiment 54, wherein the napDNAbp comprises the amino acid sequences of SEQ ID NOs: 18-88, 126, 130, 137, 141, 147, 153, 157, 445, 460, 467, and 482-487.

態様58.態様54の方法であって、ガイドRNAが配列番号222を含む。 Embodiment 58. The method of embodiment 54, wherein the guide RNA comprises SEQ ID NO: 222.

態様59.態様54の方法であって、(b)プライム編集を行うステップが、ガイドRNA上のプライマー結合部位へのアニーリングによってポリメラーゼをプライムすることができる標的座位における3’端プライマー結合配列を生成することを含む。 Embodiment 59. The method of embodiment 54, wherein (b) the step of performing prime editing comprises generating a 3' end primer binding sequence at the target locus that can prime a polymerase by annealing to a primer binding site on the guide RNA.

態様60.態様54の方法であって、トリヌクレオチド反復拡大変異がハンチントン病、脆弱X症候群、またはフリードライヒ運動失調症に関連する。 Embodiment 60. The method of embodiment 54, wherein the trinucleotide repeat expansion mutation is associated with Huntington's disease, Fragile X syndrome, or Friedreich's ataxia.

態様61.態様54の方法であって、トリヌクレオチド反復拡大変異がCAGトリプレットの繰り返し単位を含む。 Embodiment 61. The method of embodiment 54, wherein the trinucleotide repeat expansion mutation comprises a repeat unit of a CAG triplet.

態様62.態様54の方法であって、トリヌクレオチド反復拡大変異がGAAトリプレットの繰り返し単位を含む。 Embodiment 62. The method of embodiment 54, wherein the trinucleotide repeat expansion mutation comprises a repeat unit of a GAA triplet.

態様63.プライム標的にプライムされた逆転写によって、標的座位におけるDNA分子のヌクレオチド配列の1つ以上の変化を導入するための方法であって、方法が:
(a)標的座位におけるDNA分子を(i)核酸プログラム型DNA結合タンパク質(napDNAbp)および逆転写酵素を含む融合タンパク質ならびに(ii)所望のヌクレオチド変化を含むRT鋳型を含むガイドRNAと接触させること;
63. A method for introducing one or more changes in a nucleotide sequence of a DNA molecule at a target locus by primed target-primed reverse transcription, the method comprising:
(a) contacting a DNA molecule at a target locus with (i) a fusion protein comprising a nucleic acid programmable DNA binding protein (napDNAbp) and a reverse transcriptase, and (ii) a guide RNA comprising an RT template containing a desired nucleotide change;

それによって、RT鋳型のプライム標的にプライムされた逆転写を行なって、所望のヌクレオチド変化を含む一本鎖DNAを生成すること; thereby performing primed reverse transcription on the RT template primed target to generate single-stranded DNA containing the desired nucleotide change;

それによって、DNA修復および/または複製プロセスによって標的座位におけるDNA分子上に所望のヌクレオチド変化を組み込むこと、
を含む。
thereby incorporating a desired nucleotide change onto the DNA molecule at the target locus by DNA repair and/or replication processes;
including.

態様64.態様63の方法であって、RT鋳型が、ガイドRNAの3'端、ガイドRNAの5'端、またはガイドRNAの分子内の位置付けに位置付けられる。 Embodiment 64. The method of embodiment 63, wherein the RT template is located at the 3' end of the guide RNA, the 5' end of the guide RNA, or at an intramolecular location of the guide RNA.

態様65.態様63の方法であって、所望のヌクレオチド変化が、トランジション、トランスバージョン、挿入、もしくは欠失、またはそれらのいずれかの組み合わせを含む。 Embodiment 65. The method of embodiment 63, wherein the desired nucleotide change comprises a transition, a transversion, an insertion, or a deletion, or any combination thereof.

態様66.態様63の方法であって、所望のヌクレオチド変化が、(a)TからC;(b)AからG;(c)CからT;および(d)GからAからなる群から選択されるトランジションを含む。 Embodiment 66. The method of embodiment 63, wherein the desired nucleotide change comprises a transition selected from the group consisting of: (a) T to C; (b) A to G; (c) C to T; and (d) G to A.

態様67.態様63の方法であって、所望のヌクレオチド変化が:(a)TからA;(b)TからG;(c)CからG;(d)CからA;(e)AからT;(f)AからC;(g)GからC;および(h)GからTからなる群から選択されるトランスバージョンを含む。 Embodiment 67. The method of embodiment 63, wherein the desired nucleotide change comprises a transversion selected from the group consisting of: (a) T to A; (b) T to G; (c) C to G; (d) C to A; (e) A to T; (f) A to C; (g) G to C; and (h) G to T.

態様68.態様63の方法であって、所望のヌクレオチド変化が、(1)G:C塩基対をT:A塩基対に、(2)G:C塩基対をA:T塩基対に、(3)G:C塩基対をC:G塩基対に、(4)T:A塩基対をG:C塩基対に、(5)T:A塩基対をA:T塩基対に、(6)T:A塩基対をC:G塩基対に、(7)C:G塩基対をG:C塩基対に、(8)C:G塩基対をT:A塩基対に、(9)C:G塩基対をA:T塩基対に、(10)A:T塩基対をT:A塩基対に、(11)A:T塩基対をG:C塩基対に、または(12)A:T塩基対をC:G塩基対に変化させることを含む。 Embodiment 68. The method of embodiment 63, wherein the desired nucleotide change comprises changing (1) a G:C base pair to a T:A base pair, (2) a G:C base pair to an A:T base pair, (3) a G:C base pair to a C:G base pair, (4) a T:A base pair to a G:C base pair, (5) a T:A base pair to an A:T base pair, (6) a T:A base pair to a C:G base pair, (7) a C:G base pair to a G:C base pair, (8) a C:G base pair to a T:A base pair, (9) a C:G base pair to an A:T base pair, (10) an A:T base pair to a T:A base pair, (11) an A:T base pair to a G:C base pair, or (12) an A:T base pair to a C:G base pair.

態様69.プライム編集によって標的ヌクレオチド配列によってコードされるPRNP上に1つ以上の防護性変異を組み入れることによって、プリオン病を防止またはその進行を停止させる方法であって、方法が:(a)標的ヌクレオチド配列を(i)核酸プログラム型DNA結合タンパク質(napDNAbp)およびポリメラーゼを含むプライム編集因子ならびに(ii)機能部分をコードする編集鋳型を含むPEgRNAと接触させること; Embodiment 69. A method for preventing or halting the progression of a prion disease by incorporating one or more protective mutations in a PRNP encoded by a target nucleotide sequence by prime editing, the method comprising: (a) contacting the target nucleotide sequence with (i) a prime editing factor comprising a nucleic acid programmable DNA binding protein (napDNAbp) and a polymerase, and (ii) a PEgRNA comprising an editing template encoding a functional moiety;

それによって、防護性変異をコードする一本鎖DNA配列を重合すること; thereby polymerizing a single-stranded DNA sequence that codes for a protective mutation;

それによって、DNA修復および/または複製プロセスによって、標的ヌクレオチド配列における対応する内生鎖の代わりに一本鎖DNA配列を組み込むこと、
を含み;
thereby incorporating the single-stranded DNA sequence in place of the corresponding endogenous strand at the target nucleotide sequence by DNA repair and/or replication processes;
Includes;

方法が、ミスフォールディングに対して耐性である防護性変異を含むPRNPをコードする組み換え標的ヌクレオチド配列を生ずる。 The method produces a recombinant target nucleotide sequence encoding a PRNP that contains a protective mutation that is resistant to misfolding.

態様70.態様69の方法であって、プリオン病がヒトプリオン病である。 Aspect 70. The method of aspect 69, wherein the prion disease is a human prion disease.

態様71.態様69の方法であって、プリオン病が動物プリオン病である。 Aspect 71. The method of aspect 69, wherein the prion disease is an animal prion disease.

態様72.態様69の方法であって、プリオン病がクロイツフェルト・ヤコブ病(CJD)、変異型クロイツフェルト・ヤコブ病(vCJD)、ゲルストマン・ストロイスラー・シャインカー症候群、致死性家族性不眠症、またはクールー病である。 Aspect 72. The method of aspect 69, wherein the prion disease is Creutzfeldt-Jakob disease (CJD), variant Creutzfeldt-Jakob disease (vCJD), Gerstmann-Straussler-Scheinker syndrome, fatal familial insomnia, or kuru.

態様73.態様69の方法であって、プリオン病が牛海綿状脳症(BSEまたは「狂牛病」)、慢性消耗病(CWD)、スクレイピー、伝達性ミンク脳症、ネコ海綿状脳症、および有蹄類海綿状脳症である。 Embodiment 73. The method of embodiment 69, wherein the prion disease is bovine spongiform encephalopathy (BSE or "mad cow disease"), chronic wasting disease (CWD), scrapie, transmissible mink encephalopathy, feline spongiform encephalopathy, and ungulate spongiform encephalopathy.

態様74.態様69の方法であって、野生型PRNPアミノ酸配列が配列番号291~292である。 Aspect 74. The method of aspect 69, wherein the wild-type PRNP amino acid sequence is SEQ ID NOs: 291-292.

態様75.態様69の方法であって、方法が、配列番号293~309、311~323からなる群から選択される改変されたPRNPアミノ酸配列をもたらし、前記改変されたPRNPタンパク質がミスフォールディングに対して耐性である。 Embodiment 75. The method of embodiment 69, wherein the method results in a modified PRNP amino acid sequence selected from the group consisting of SEQ ID NOs: 293-309, 311-323, and the modified PRNP protein is resistant to misfolding.

態様76.態様69の方法であって、融合タンパク質がPE1、PE2、またはPE3のアミノ酸配列を含む。 Aspect 76. The method of aspect 69, wherein the fusion protein comprises an amino acid sequence of PE1, PE2, or PE3.

態様77.態様69の方法であって、napDNAbpがCas9ニッカーゼ(nCas9)である。 Aspect 77. The method of aspect 69, wherein the napDNAbp is Cas9 nickase (nCas9).

態様78.態様69の方法であって、napDNAbpが、配列番号18~88、126、130、137、141、147、153、157、445、460、467、および482~487のアミノ酸配列を含む。 Embodiment 78. The method of embodiment 69, wherein the napDNAbp comprises the amino acid sequences of SEQ ID NOs: 18-88, 126, 130, 137, 141, 147, 153, 157, 445, 460, 467, and 482-487.

態様79.態様69の方法であって、PEgRNAが、配列番号101~104、181~183、223~244、277、325~334、336、338、340、342、344、346、348、350、352、354、356、358、360、362、364、366、368、499~505、735~761、776~777を含む。 Embodiment 79. The method of embodiment 69, wherein the PEGRNA comprises SEQ ID NOs: 101-104, 181-183, 223-244, 277, 325-334, 336, 338, 340, 342, 344, 346, 348, 350, 352, 354, 356, 358, 360, 362, 364, 366, 368, 499-505, 735-761, 776-777.

態様80.プライム編集によって標的ヌクレオチド配列上のサイクリン依存性キナーゼ様5遺伝子(CDKL5)の変異を修正することによって、CDKL5欠損症障害を処置する方法であって、方法が:(a)標的ヌクレオチド配列を(i)核酸プログラム型DNA結合タンパク質(napDNAbp)およびポリメラーゼを含むプライム編集因子ならびに(ii)CDKL5の変異を修正する編集鋳型を含むPEgRNAと接触させること; Embodiment 80. A method for treating a CDKL5 deficiency disorder by correcting a mutation in a cyclin-dependent kinase-like 5 gene (CDKL5) on a target nucleotide sequence by prime editing, the method comprising: (a) contacting the target nucleotide sequence with (i) a prime editing factor comprising a nucleic acid programmable DNA binding protein (napDNAbp) and a polymerase, and (ii) a PEgRNA comprising an editing template that corrects the mutation in CDKL5;

それによって、編集をコードする一本鎖DNA配列を重合すること; Thereby polymerizing a single-stranded DNA sequence that codes for the edit;

それによって、DNA修復および/または複製プロセスによって、標的ヌクレオチド配列における対応する内生鎖の代わりに一本鎖DNA配列を組み込むこと、
を含み;
thereby incorporating the single-stranded DNA sequence in place of the corresponding endogenous strand at the target nucleotide sequence by DNA repair and/or replication processes;
Includes;

方法が、修復されたCDKL5遺伝子をコードする組み換え標的ヌクレオチド配列を生ずる。 The method produces a recombinant target nucleotide sequence encoding a repaired CDKL5 gene.

態様81.態様D80の方法であって、CDKL5の変異が1412delAである。 Embodiment 81. The method of embodiment D80, wherein the CDKL5 mutation is 1412delA.

群E.タンパク質構造/機能を改変することおよび/または変異導入のためのPE法
態様1.プライム編集によって標的座位におけるDNA分子に変異導入する方法であって、方法が:(a)標的座位におけるDNA分子を(i)核酸プログラム型DNA結合タンパク質(napDNAbp)およびエラーを起こしやすいポリメラーゼ(polymer)(例えば、エラーを起こしやすい逆転写酵素)を含む融合タンパク質ならびに(ii)所望のヌクレオチド変化を含む編集鋳型を含むガイドRNAと接触させること;それによって、編集鋳型を鋳型とする一本鎖DNAを重合すること、ならびにDNA修復および/または複製プロセスによって、標的座位におけるDNA分子上に一本鎖DNAを組み込むことを含む。
Group E. PE Methods for Modifying and/or Mutating Protein Structure/FunctionEmbodiment 1. A method for mutating a DNA molecule at a target locus by prime editing, comprising: (a) contacting the DNA molecule at the target locus with (i) a fusion protein comprising a nucleic acid programmable DNA binding protein (napDNAbp) and an error-prone polymerase (e.g., an error-prone reverse transcriptase) and (ii) a guide RNA comprising an editing template comprising a desired nucleotide change; thereby polymerizing single-stranded DNA templated by the editing template, and incorporating the single-stranded DNA onto the DNA molecule at the target locus by DNA repair and/or replication processes.

態様2.いずれかの先行する態様の方法であって、融合タンパク質がPE1、PE2、またはPE3のアミノ酸配列を含む。 Aspect 2. The method of any preceding aspect, wherein the fusion protein comprises an amino acid sequence of PE1, PE2, or PE3.

態様3.いずれかの先行する態様の方法であって、napDNAbpがCas9ニッカーゼ(nCas9)である。 Aspect 3. The method of any preceding aspect, wherein the napDNAbp is Cas9 nickase (nCas9).

態様4.態様1の方法であって、napDNAbpが、配列番号18~88、126、130、137、141、147、153、157、445、460、467、および482~487のアミノ酸配列を含む。 Embodiment 4. The method of embodiment 1, wherein napDNAbp comprises the amino acid sequences of SEQ ID NOs: 18-88, 126, 130, 137, 141, 147, 153, 157, 445, 460, 467, and 482-487.

態様5.態様1の方法であって、ガイドRNAが配列番号222を含む。 Aspect 5. The method of aspect 1, wherein the guide RNA comprises SEQ ID NO: 222.

態様6.プライム編集によって、標的ヌクレオチド配列によってコードされる目当てのタンパク質上に免疫エピトープを組み入れる方法であって、方法が:(a)標的ヌクレオチド配列を(i)核酸プログラム型DNA結合タンパク質(napDNAbp)およびポリメラーゼを含むプライム編集因子ならびに(ii)機能部分をコードする編集鋳型を含むPEgRNAと接触させること; Embodiment 6. A method for incorporating an immune epitope onto a protein of interest encoded by a target nucleotide sequence by prime editing, the method comprising: (a) contacting the target nucleotide sequence with (i) a prime editing factor comprising a nucleic acid programmable DNA binding protein (napDNAbp) and a polymerase, and (ii) a PEgRNA comprising an editing template encoding a functional moiety;

それによって、免疫エピトープをコードする一本鎖DNA配列を重合すること; Thereby polymerizing a single-stranded DNA sequence encoding an immune epitope;

それによって、DNA修復および/または複製プロセスによって、標的ヌクレオチド配列における対応する内生鎖の代わりに一本鎖DNA配列を組み込むこと、
を含み;
thereby incorporating the single-stranded DNA sequence in place of the corresponding endogenous strand at the target nucleotide sequence by DNA repair and/or replication processes;
Includes;

方法が、目当てのタンパク質と免疫エピトープとを含む融合タンパク質をコードする組み換え標的ヌクレオチド配列を生ずる。 The method produces a recombinant target nucleotide sequence that encodes a fusion protein containing the protein of interest and an immune epitope.

態様7.態様6の方法であって、免疫エピトープが:破傷風トキソイド(配列番号396);ジフテリア毒素変異体CRM197(配列番号630);ムンプス免疫エピトープ1(配列番号400);ムンプス免疫エピトープ2(配列番号402);ムンプス免疫エピトープ3(配列番号404);風疹ウイルス(配列番号406);ヘマグルチニン(配列番号408);ノイラミニダーゼ(配列番号410);TAP1(配列番号412);TAP2(配列番号414);クラスI HLAに対するヘマグルチニンエピトープ(配列番号416);クラスI HLAに対するノイラミニダーゼエピトープ(配列番号418);クラスII HLAに対するヘマグルチニンエピトープ(配列番号420);クラスII HLAに対するノイラミニダーゼエピトープ(配列番号422);ヘマグルチニンエピトープH5N1結合クラスIおよびクラスII HLA(配列番号424);ならびにノイラミニダーゼエピトープH5N1結合クラスIおよびクラスII HLA(配列番号426)からなる群から選択される。 Embodiment 7. The method of embodiment 6, wherein the immune epitope is: tetanus toxoid (SEQ ID NO: 396); diphtheria toxin variant CRM197 (SEQ ID NO: 630); mumps immune epitope 1 (SEQ ID NO: 400); mumps immune epitope 2 (SEQ ID NO: 402); mumps immune epitope 3 (SEQ ID NO: 404); rubella virus (SEQ ID NO: 406); hemagglutinin (SEQ ID NO: 408); neuraminidase (SEQ ID NO: 410); TAP1 (SEQ ID NO: 412); TAP2 (SEQ ID NO: 414); hemagglutinin epitope for class I HLA (SEQ ID NO: 416); neuraminidase epitope for class I HLA (SEQ ID NO: 418); hemagglutinin epitope for class II HLA (SEQ ID NO: 420); neuraminidase epitope for class II HLA (SEQ ID NO: 422); hemagglutinin epitope H5N1 binding class I and class II HLA (SEQ ID NO: 424); and neuraminidase epitope H5N1-binding class I and class II HLA (SEQ ID NO: 426).

態様8.態様6の方法であって、融合タンパク質がPE1、PE2、またはPE3のアミノ酸配列を含む。 Aspect 8. The method of aspect 6, wherein the fusion protein comprises an amino acid sequence of PE1, PE2, or PE3.

態様9.態様6の方法であって、napDNAbpがCas9ニッカーゼ(nCas9)である。 Embodiment 9. The method of embodiment 6, wherein the napDNAbp is Cas9 nickase (nCas9).

態様10.態様6の方法であって、napDNAbpが、配列番号18~88、126、130、137、141、147、153、157、445、460、467、および482~487のアミノ酸配列を含む。 Embodiment 10. The method of embodiment 6, wherein napDNAbp comprises the amino acid sequences of SEQ ID NOs: 18-88, 126, 130, 137, 141, 147, 153, 157, 445, 460, 467, and 482-487.

態様11.態様6の方法であって、PEgRNAが、配列番号101~104、181~183、223~244、277、325~334、336、338、340、342、344、346、348、350、352、354、356、358、360、362、364、366、368、499~505、735~761、776~777を含む。 Embodiment 11. The method of embodiment 6, wherein the PEGRNA comprises SEQ ID NOs: 101-104, 181-183, 223-244, 277, 325-334, 336, 338, 340, 342, 344, 346, 348, 350, 352, 354, 356, 358, 360, 362, 364, 366, 368, 499-505, 735-761, 776-777.

態様12.プライム編集によって、標的ヌクレオチド配列によってコードされる目当てのタンパク質上に低分子二量体化ドメインを組み入れる方法であって、方法が:(a)標的ヌクレオチド配列を(i)核酸プログラム型DNA結合タンパク質(napDNAbp)およびポリメラーゼを含むプライム編集因子ならびに(ii)低分子二量体化ドメインをコードする編集鋳型を含むPEgRNAと接触させること; Embodiment 12. A method for incorporating a small dimerization domain onto a protein of interest encoded by a target nucleotide sequence by prime editing, the method comprising: (a) contacting the target nucleotide sequence with (i) a prime editing factor comprising a nucleic acid programmable DNA binding protein (napDNAbp) and a polymerase, and (ii) a PEgRNA comprising an editing template encoding the small dimerization domain;

それによって、免疫エピトープをコードする一本鎖DNA配列を重合すること; Thereby polymerizing a single-stranded DNA sequence encoding an immune epitope;

それによって、DNA修復および/または複製プロセスによって、標的ヌクレオチド配列における対応する内生鎖の代わりに一本鎖DNA配列を組み込むこと、
を含み;
thereby incorporating the single-stranded DNA sequence in place of the corresponding endogenous strand at the target nucleotide sequence by DNA repair and/or replication processes;
Includes;

方法が、目当てのタンパク質と低分子二量体化ドメインとを含む融合タンパク質をコードする改変された標的ヌクレオチド配列を生ずる。 The method produces a modified target nucleotide sequence that encodes a fusion protein comprising the protein of interest and a small dimerization domain.

態様13.態様12の方法であって、さらに、目当ての第2のタンパク質に対して方法を行うことを含む。 Aspect 13. The method of aspect 12, further comprising performing the method on a second protein of interest.

態様14.態様13の方法であって、目当ての第1のタンパク質および目当ての第2のタンパク質が、前記タンパク質の夫々の二量体化ドメインに結合する低分子の存在下において二量体化する。 Embodiment 14. The method of embodiment 13, wherein the first protein of interest and the second protein of interest dimerize in the presence of a small molecule that binds to the dimerization domains of each of the proteins.

態様15.態様12の方法であって、低分子結合ドメインが配列番号488のFKBP12である。 Aspect 15. The method of aspect 12, wherein the small molecule binding domain is FKBP12 of SEQ ID NO:488.

態様16.態様12の方法であって、低分子結合ドメインが配列番号489のFKBP12-F36Vである。 Aspect 16. The method of aspect 12, wherein the small molecule binding domain is FKBP12-F36V of SEQ ID NO:489.

態様17.態様12の方法であって、低分子結合ドメインが配列番号490および493~494のシクロフィリンである。 Embodiment 17. The method of embodiment 12, wherein the small molecule binding domain is a cyclophilin of SEQ ID NOs: 490 and 493-494.

態様18.態様12の方法であって、低分子が本明細書に記載の低分子の二量体である。 Aspect 18. The method of aspect 12, wherein the small molecule is a dimer of a small molecule described herein.

態様19.態様12の方法であって、融合タンパク質がPE1、PE2、またはPE3のアミノ酸配列を含む。 Aspect 19. The method of aspect 12, wherein the fusion protein comprises an amino acid sequence of PE1, PE2, or PE3.

態様20.態様12の方法であって、napDNAbpがCas9ニッカーゼ(nCas9)である。 Aspect 20. The method of aspect 12, wherein the napDNAbp is Cas9 nickase (nCas9).

態様21.態様12の方法であって、napDNAbpが、配列番号18~88、126、130、137、141、147、153、157、445、460、467、および482~487のアミノ酸配列を含む。 Embodiment 21. The method of embodiment 12, wherein the napDNAbp comprises the amino acid sequences of SEQ ID NOs: 18-88, 126, 130, 137, 141, 147, 153, 157, 445, 460, 467, and 482-487.

態様22.態様12の方法であって、PEgRNAが、配列番号101~104、181~183、223~244、277、325-334、336、338、340、342、344、346、348、350、352、354、356、358、360、362、364、366、368、499~505、735~761、776~777を含む。 Embodiment 22. The method of embodiment 12, wherein the PEGRNA comprises SEQ ID NOs: 101-104, 181-183, 223-244, 277, 325-334, 336, 338, 340, 342, 344, 346, 348, 350, 352, 354, 356, 358, 360, 362, 364, 366, 368, 499-505, 735-761, 776-777.

態様23.プライム編集を用いてタンパク質上にペプチドタグまたはエピトープを組み入れる方法であって:タンパク質をコードする標的ヌクレオチド配列を、ペプチドタグをコードする第2のヌクレオチド配列をそれに挿入するように構成されたプライム編集因子構築物と接触させて、組み換えヌクレオチド配列をもたらすことを含み、その結果、ペプチドタグおよびタンパク質が融合タンパク質として組み換えヌクレオチド配列から発現される。 Embodiment 23. A method of incorporating a peptide tag or epitope onto a protein using prime editing, comprising: contacting a target nucleotide sequence encoding a protein with a prime editor construct configured to insert therein a second nucleotide sequence encoding a peptide tag, resulting in a recombinant nucleotide sequence, such that the peptide tag and the protein are expressed from the recombinant nucleotide sequence as a fusion protein.

態様24.態様23の方法であって、ペプチドタグがタンパク質の精製および/または検出に用いられる。 Embodiment 24. The method of embodiment 23, wherein the peptide tag is used for purifying and/or detecting the protein.

態様25.態様23の方法であって、ペプチドタグが、ポリヒスチジン(例えば、HHHHHH配列番号252~262)、FLAG(例えば、DYKDDDDK)(配列番号2)、V5(例えば、GKPIPNPLLGLDST)(配列番号3)、GCN4、HA(例えば、YPYDVPDYA)(配列番号5)、Myc(例えばEQKLISEED)(配列番号6)、またはGSTである。 Embodiment 25 The method of embodiment 23, wherein the peptide tag is polyhistidine (e.g., HHHHHH , SEQ ID NOs:252-262), FLAG (e.g., DYKDDDDK) (SEQ ID NO:2), V5 (e.g., GKPIPNPLLGLDST) (SEQ ID NO:3), GCN4, HA (e.g., YPYDVPDYA) (SEQ ID NO:5), Myc (e.g., EQKLISEED) (SEQ ID NO:6), or GST.

態様26.態様23の方法であって、ペプチドタグが、配列番号1~6、245~249、252~262、264~273、275~276、281、278~288、および622からなる群から選択されるアミノ酸配列を有する。 Embodiment 26. The method of embodiment 23, wherein the peptide tag has an amino acid sequence selected from the group consisting of SEQ ID NOs: 1-6, 245-249, 252-262, 264-273, 275-276, 281, 278-288, and 622.

態様27.態様23の方法であって、ペプチドタグがリンカーによってタンパク質に融合される。 Embodiment 27. The method of embodiment 23, wherein the peptide tag is fused to the protein by a linker.

態様28.態様23の方法であって、融合タンパク質が次の構造を有し:[タンパク質]-[ペプチドタグ]または[ペプチドタグ]-[タンパク質]、「]-[」が任意のリンカーを表す。 Embodiment 28. The method of embodiment 23, wherein the fusion protein has the following structure: [protein]-[peptide tag] or [peptide tag]-[protein], where "]-[" represents an optional linker.

態様29.態様23の方法であって、リンカーが配列番号127、165~176、446、453、および767~769のアミノ酸配列を有する。 Embodiment 29. The method of embodiment 23, wherein the linker has an amino acid sequence of SEQ ID NOs: 127, 165-176, 446, 453, and 767-769.

態様30.態様23の方法であって、プライム編集因子構築物が、配列番号101~104、181~183、223~244、277、325~334、336、338、340、342、344、346、348、350、352、354、356、358、360、362、364、366、368、499~505、735~761、776~777のヌクレオチド配列を含むPEgRNAを含む。 Embodiment 30. The method of embodiment 23, wherein the prime editor construct comprises a PEgRNA comprising a nucleotide sequence of SEQ ID NOs: 101-104, 181-183, 223-244, 277, 325-334, 336, 338, 340, 342, 344, 346, 348, 350, 352, 354, 356, 358, 360, 362, 364, 366, 368, 499-505, 735-761, 776-777.

態様31.態様23の方法であって、PEgRNAがスペーサー、gRNAコア、および伸長アームを含み、スペーサーが標的ヌクレオチド配列に対して相補的であり、伸長アームがペプチドタグをコードする逆転写酵素鋳型を含む。 Embodiment 31. The method of embodiment 23, wherein the PEGRNA comprises a spacer, a gRNA core, and an extension arm, the spacer being complementary to a target nucleotide sequence, and the extension arm comprises a reverse transcriptase template encoding a peptide tag.

態様32.態様23の方法であって、PEgRNAがスペーサー、gRNAコア、および伸長アームを含み、スペーサーが標的ヌクレオチド配列に対して相補的であり、伸長アームがペプチドタグをコードする逆転写酵素鋳型を含む。 Embodiment 32. The method of embodiment 23, wherein the PEGRNA comprises a spacer, a gRNA core, and an extension arm, the spacer being complementary to a target nucleotide sequence, and the extension arm comprises a reverse transcriptase template encoding a peptide tag.

態様33.プライム編集によって、標的ヌクレオチド配列によってコードされる目当てのタンパク質上の機能部分を組み入れまたは欠失する方法であって、方法が:(a)標的ヌクレオチド配列を(i)核酸プログラム型DNA結合タンパク質(napDNAbp)およびポリメラーゼを含むプライム編集因子ならびに(ii)機能部分またはその欠失をコードする編集鋳型を含むPEgRNAと接触させること;(b)機能部分またはその欠失をコードする一本鎖DNA配列を重合すること;ならびに(c)DNA修復および/または複製プロセスによって、標的ヌクレオチド配列における対応する内生鎖の代わりに一本鎖DNA配列を組み込むことを含み、方法が、目当てのタンパク質および機能部分またはその除去を含む改変されたタンパク質をコードする組み換え標的ヌクレオチド配列を生じ、機能部分がタンパク質の修飾状態または局在状態を変改する。 Embodiment 33. A method for inserting or deleting a functional portion on a protein of interest encoded by a target nucleotide sequence by prime editing, the method comprising: (a) contacting the target nucleotide sequence with (i) a prime editing factor comprising a nucleic acid programmable DNA binding protein (napDNAbp) and a polymerase and (ii) a PEgRNA comprising an editing template encoding the functional portion or deletion; (b) polymerizing a single-stranded DNA sequence encoding the functional portion or deletion; and (c) incorporating the single-stranded DNA sequence in place of the corresponding endogenous strand in the target nucleotide sequence by DNA repair and/or replication processes, the method producing a recombinant target nucleotide sequence encoding the protein of interest and an altered protein comprising the functional portion or deletion, the functional portion altering the modification or localization state of the protein.

態様34.態様33の方法であって、機能部分が、目当てのタンパク質のリン酸化、ユビキチン化、グリコシル化、脂質修飾、ヒドロキシル化、メチル化、アセチル化、クロトニル化、またはSUMO化状態を変改する。 Embodiment 34. The method of embodiment 33, wherein the functional moiety alters the phosphorylation, ubiquitination, glycosylation, lipid modification, hydroxylation, methylation, acetylation, crotonylation, or sumoylation status of the protein of interest.

群F.PE送達方法および組成物
態様1.ポリペプチドであって、プライム編集因子融合タンパク質のN末端半分またはC末端半分を含む。
Group F. PE Delivery Methods and Compositions Embodiment 1. A polypeptide comprising the N-terminal or C-terminal half of a prime editor fusion protein.

態様2.態様1のポリペプチドであって、プライム編集因子融合タンパク質が、核酸プログラム型DNA結合タンパク質(napDNAbp)ドメインとポリメラーゼドメインとを含む。 Aspect 2. The polypeptide of aspect 1, wherein the prime editor fusion protein comprises a nucleic acid programmable DNA binding protein (napDNAbp) domain and a polymerase domain.

態様3.態様1のポリペプチドであって、プライム編集因子融合タンパク質が、プライム編集ガイドRNA(PEgRNA)の存在下においてプライム編集を実行することができる。 Aspect 3. The polypeptide of aspect 1, wherein the prime editor fusion protein is capable of performing prime editing in the presence of a prime editing guide RNA (PEgRNA).

態様4.態様2のポリペプチドであって、napDNAbpがCas9タンパク質またはそのバリアントである。 Aspect 4. The polypeptide of aspect 2, wherein napDNAbp is a Cas9 protein or a variant thereof.

態様5.態様2のポリペプチドであって、napDNAbpがニッカーゼ活性を有するヌクレアーゼである。 Aspect 5. The polypeptide of aspect 2, wherein napDNAbp is a nuclease having nickase activity.

態様6.態様2のポリペプチドであって、napDNAbpがヌクレアーゼ活性Cas9、ヌクレアーゼ不活性型Cas9(dCas9)、またはCas9ニッカーゼ(nCas9)である。 Aspect 6. The polypeptide of aspect 2, wherein napDNAbp is a nuclease-active Cas9, a nuclease-inactive Cas9 (dCas9), or a Cas9 nickase (nCas9).

態様7.態様2のポリペプチドであって、napDNAbpが:Cas9、Cas12e、Cas12d、Cas12a、Cas12b1、Cas13a、Cas12c、およびアルゴノートからなる群から選択され、任意にニッカーゼ活性を有する。 Aspect 7. The polypeptide of aspect 2, wherein napDNAbp is selected from the group consisting of: Cas9, Cas12e, Cas12d, Cas12a, Cas12b1, Cas13a, Cas12c, and Argonaute, and optionally has nickase activity.

態様8.態様1のポリペプチドであって、ポリペプチドが、プライム編集因子融合タンパク質を分裂部位において分裂することによって形成される。 Aspect 8. The polypeptide of aspect 1, wherein the polypeptide is formed by cleaving a prime editor fusion protein at a cleavage site.

態様9.態様8のポリペプチドであって、分裂部位がnapDNAbpドメイン上のペプチド結合である。 Aspect 9. The polypeptide of aspect 8, wherein the cleavage site is a peptide bond on the napDNAbp domain.

態様10.態様8のポリペプチドであって、分裂部位がポリメラーゼドメイン上のペプチド結合である。 Aspect 10. The polypeptide of aspect 8, wherein the cleavage site is a peptide bond on the polymerase domain.

態様11.態様8のポリペプチドであって、分裂部位がnapDNAbpドメインとポリメラーゼドメインとの間のリンカー上のペプチド結合である。 Embodiment 11. The polypeptide of embodiment 8, wherein the cleavage site is a peptide bond on the linker between the napDNAbp domain and the polymerase domain.

態様12.態様9のポリペプチドであって、分裂部位が、配列番号18(標準的なSpCas9)の残基1および2、2および3、3および4、4および5、5および6、6および7、7および8、8および9、9および10、10および11、11および12、12および13、13および14、14および15、16および17、17および18、18および19、19および20、20および21、21および22、22および23、23および24、24および25、25および26、26および27、27および(ad)28、28および29、29および30、30および31、31および32、32および33、33および34、34および35、35および36、36および37、37および38、38および39、39および40、40および41、41および42、42および43、43および44、44および45、45および46、46および47、47および48、48および49、49および50の間、または残基50~100、100~150、150~200、200~250、250~300、300~350、350~400、400~450、450~500、500~600、600~700、700~800、800~900、900~1000、1000~1100、1100~1200、1200~1300、もしくは1300~1368の間のいずれか2つの残基の間、あるいは配列番号18のSpCas9ホモログまたは等価物のいずれか2つの同等アミノ酸残基の間のペプチド結合である。 12. The polypeptide of claim 9, wherein the division site is selected from residues 1 and 2, 2 and 3, 3 and 4, 4 and 5, 5 and 6, 6 and 7, 7 and 8, 8 and 9, 9 and 10, 10 and 11, 11 and 12, 12 and 13, 13 and 14, 14 and 15, 16 and 17, 17 and 18, 18 and 19, 19 and 20, 20 and 21, 21 and 22, 22 and 23, 23 and 24, 24 and 25, 25 and 26, 26 and 27, 27 and (ad)28, 28 and 29, 29 and 30, 30 and 31, 31 and 32, 32 and 33, 33 and 34, 34 and 35, 35 and 36, 36 and 37, 37 and 38, 38 and 39 of SEQ ID NO: 18 (standard SpCas9). 9, 39 and 40, 40 and 41, 41 and 42, 42 and 43, 43 and 44, 44 and 45, 45 and 46, 46 and 47, 47 and 48, 48 and 49, 49 and 50, or between residues 50-100, 100-150, 150-200, 200-250, 250-300, 300-350, 350-400, 400-450, 45 A peptide bond between any two residues between 0-500, 500-600, 600-700, 700-800, 800-900, 900-1000, 1000-1100, 1100-1200, 1200-1300, or 1300-1368, or between any two equivalent amino acid residues of an SpCas9 homolog or equivalent of SEQ ID NO:18.

態様13.態様9のポリペプチドであって、分裂部位が、配列番号89(標準的な逆転写酵素、M-MLV RT)の残基1および2、2および3、3および4、4および5、5および6、6および7、7および8、8および9、9および10、10および11、11および12、12および13、13および14、14および15、16および17、17および18、18および19、19および20、20および21、21および22、22および23、23および24、24および25、25および26、26および27、27および(ad)28、28および29、29および30、30および31、31および32、32および33、33および34、34および35、35および36、36および37、37および38、38および39、39および40、40および41、41および42、42および43、43および44、44および45、45および46、46および47、47および48、48および49、49および50の間、または残基50~100、100~150、150~200、200~250、250~300、300~350、350~400、400~450、450~500、500~600、もしくは600~667の間のいずれか2つの残基の間、あるいは配列番号89の逆転写酵素ホモログまたは等価物のいずれか2つの同等アミノ酸残基の間のペプチド結合である。 13. The polypeptide of embodiment 9, wherein the cleavage site is selected from residues 1 and 2, 2 and 3, 3 and 4, 4 and 5, 5 and 6, 6 and 7, 7 and 8, 8 and 9, 9 and 10, 10 and 11, 11 and 12, 12 and 13, 13 and 14, 14 and 15, 16 and 17, 17 and 18, 18 and 19, 19 and 20, 20 and 21, 21 and 22, 22 and 23, 23 and 24, 24 and 25, 25 and 26, 26 and 27, 27 and (ad)28, 28 and 29, 29 and 30, 30 and 31, 31 and 32, 32 and 33, 33 and 34, 34 and 35, 35 and 36, 36 and 37 of SEQ ID NO: 89 (standard reverse transcriptase, M-MLV RT). , 37 and 38, 38 and 39, 39 and 40, 40 and 41, 41 and 42, 42 and 43, 43 and 44, 44 and 45, 45 and 46, 46 and 47, 47 and 48, 48 and 49, 49 and 50, or between any two residues between residues 50-100, 100-150, 150-200, 200-250, 250-300, 300-350, 350-400, 400-450, 450-500, 500-600, or 600-667, or between any two equivalent amino acid residues of a reverse transcriptase homolog or equivalent of SEQ ID NO:89.

態様14.態様1のポリペプチドであって、ポリペプチドがプライム編集因子融合タンパク質のN末端半分である。 Embodiment 14. The polypeptide of embodiment 1, wherein the polypeptide is the N-terminal half of a prime editor fusion protein.

態様15.態様1のポリペプチドであって、ポリペプチドがプライム編集因子融合タンパク質のC末端半分である。 Embodiment 15. The polypeptide of embodiment 1, wherein the polypeptide is the C-terminal half of a prime editor fusion protein.

態様16.態様1~15のいずれかのポリペプチドと任意にPEgRNAとをコードするヌクレオチド配列。 Aspect 16. A nucleotide sequence encoding a polypeptide of any one of aspects 1 to 15 and optionally a PEG RNA.

態様17.ウイルスゲノムであって、態様1~15のいずれかのポリペプチドと任意にPEgRNAとをコードするヌクレオチド配列を含む。 Aspect 17. A viral genome comprising a nucleotide sequence encoding a polypeptide of any one of aspects 1 to 15 and optionally a PEgRNA.

態様18.態様17のウイルスゲノムであって、ヌクレオチド配列が、さらに、態様1-15のいずれかのポリペプチドを発現することにとって好適なプロモーター配列を含む。 Aspect 18. The viral genome of aspect 17, wherein the nucleotide sequence further comprises a promoter sequence suitable for expressing the polypeptide of any of aspects 1-15.

態様19.態様17のウイルスゲノムであって、ヌクレオチド配列が、さらに、PEgRNAをコードする配列を含む。 Aspect 19. The viral genome of aspect 17, wherein the nucleotide sequence further comprises a sequence encoding a PEgRNA.

態様20.ウイルス粒子であって、態様1~15のいずれかのポリペプチドと任意にPEgRNAとをコードするヌクレオチド配列を含むゲノムを含む。 Embodiment 20. A viral particle comprising a genome comprising a nucleotide sequence encoding a polypeptide of any one of embodiments 1 to 15 and optionally a PEgRNA.

態様21.態様20のウイルス粒子であって、ウイルス粒子がアデノウイルス粒子、アデノ随伴ウイルス粒子、またはレンチウイルス粒子である。 Embodiment 21. The viral particle of embodiment 20, wherein the viral particle is an adenovirus particle, an adeno-associated virus particle, or a lentivirus particle.

態様22.態様20のウイルス粒子であって、ゲノムによってコードされるポリペプチドがプライム編集因子融合タンパク質のN末端半分である。 Embodiment 22. The viral particle of embodiment 20, wherein the polypeptide encoded by the genome is the N-terminal half of a prime editor fusion protein.

態様23.態様20のウイルス粒子であって、ゲノムによってコードされるポリペプチドがプライム編集因子融合タンパク質のC末端半分である。 Embodiment 23. The viral particle of embodiment 20, wherein the polypeptide encoded by the genome is the C-terminal half of a prime editor fusion protein.

態様24.医薬組成物であって、態様20~23のいずれかのウイルス粒子および医薬賦形剤を含む。 Aspect 24. A pharmaceutical composition comprising a virus particle according to any one of aspects 20 to 23 and a pharmaceutical excipient.

態様25.医薬組成物であって、態様22のウイルス粒子(N末端半分をコードする)および医薬賦形剤を含む。 Aspect 25. A pharmaceutical composition comprising a viral particle of aspect 22 (encoding the N-terminal half) and a pharmaceutical excipient.

態様26.医薬組成物であって、態様23のウイルス粒子(C末端半分をコードする)および医薬賦形剤を含む。 Aspect 26. A pharmaceutical composition comprising a viral particle of aspect 23 (encoding the C-terminal half) and a pharmaceutical excipient.

態様27.リボヌクレオタンパク質(RNP)複合体であって、態様1~15のいずれかのポリペプチドと任意にPEgRNAとをコードするヌクレオチド配列を含む。 Embodiment 27. A ribonucleoprotein (RNP) complex comprising a nucleotide sequence encoding a polypeptide of any one of embodiments 1 to 15 and, optionally, a PEgRNA.

態様28.態様27のリボヌクレオタンパク質(RNP)複合体であって、ゲノムによってコードされるポリペプチドがプライム編集因子融合タンパク質のN末端半分である。 Embodiment 28. The ribonucleoprotein (RNP) complex of embodiment 27, wherein the polypeptide encoded by the genome is the N-terminal half of a prime editor fusion protein.

態様29.態様27のリボヌクレオタンパク質(RNP)複合体であって、ゲノムによってコードされるポリペプチドがプライム編集因子融合タンパク質のC末端半分である。 Embodiment 29. The ribonucleoprotein (RNP) complex of embodiment 27, wherein the polypeptide encoded by the genome is the C-terminal half of a prime editor fusion protein.

態様30.医薬組成物であって、態様27~29のいずれかのリボヌクレオタンパク質(RNP)複合体および医薬賦形剤を含む。 Aspect 30. A pharmaceutical composition comprising a ribonucleoprotein (RNP) complex of any one of aspects 27 to 29 and a pharmaceutical excipient.

態様31.医薬組成物であって、態様28のリボヌクレオタンパク質(RNP)複合体(N末端半分をコードする)および医薬賦形剤を含む。 Aspect 31. A pharmaceutical composition comprising a ribonucleoprotein (RNP) complex (encoding the N-terminal half) of aspect 28 and a pharmaceutical excipient.

態様32.医薬組成物であって、態様29のリボヌクレオタンパク質(RNP)複合体(C末端半分をコードする)および医薬賦形剤を含む。 Aspect 32. A pharmaceutical composition comprising a ribonucleoprotein (RNP) complex (encoding the C-terminal half) of aspect 29 and a pharmaceutical excipient.

態様33.医薬組成物であって、第1のAAV粒子および第2のAAV粒子を含み、第1のAAVベクターがプライム編集因子融合タンパク質のN末端半分を発現し、第2のAAVベクターがプライム編集因子融合タンパク質のC末端半分を発現し、N末端半分およびC末端半分が細胞内で組み合わせられてプライム編集因子を再構成する。 Aspect 33. A pharmaceutical composition comprising a first AAV particle and a second AAV particle, the first AAV vector expressing an N-terminal half of a prime editor fusion protein and the second AAV vector expressing a C-terminal half of the prime editor fusion protein, the N-terminal half and the C-terminal half combining in a cell to reconstitute the prime editor.

態様34.態様33の医薬組成物であって、第1または第2のAAV粒子がPEgRNAをもまた発現し、これが再構成されたプライム編集因子を標的DNA部位へと標的化する。 Embodiment 34. The pharmaceutical composition of embodiment 33, wherein the first or second AAV particle also expresses a PEgRNA, which targets the reconstituted primed editing element to the target DNA site.

態様35.態様33の医薬組成物であって、プライム編集因子融合タンパク質が核酸プログラム型DNA結合タンパク質(napDNAbp)ドメインとポリメラーゼドメインとを含む。 Aspect 35. The pharmaceutical composition of aspect 33, wherein the prime editor fusion protein comprises a nucleic acid programmable DNA binding protein (napDNAbp) domain and a polymerase domain.

態様36.態様33の医薬組成物であって、プライム編集因子融合タンパク質が、プライム編集ガイドRNA(PEgRNA)の存在下においてプライム編集を実行することができる。 Aspect 36. The pharmaceutical composition of aspect 33, wherein the prime editor fusion protein is capable of performing prime editing in the presence of a prime editing guide RNA (PEgRNA).

態様37.態様35の医薬組成物であって、napDNAbpがCas9タンパク質またはそのバリアントである。 Aspect 37. The pharmaceutical composition of aspect 35, wherein napDNAbp is a Cas9 protein or a variant thereof.

態様38.態様35の医薬組成物であって、napDNAbpがニッカーゼ活性を有するヌクレアーゼである。 Aspect 38. The pharmaceutical composition of aspect 35, wherein napDNAbp is a nuclease having nickase activity.

態様39.態様35の医薬組成物であって、napDNAbpがヌクレアーゼ活性Cas9、ヌクレアーゼ不活性型Cas9(dCas9)、またはCas9ニッカーゼ(nCas9)である。 Aspect 39. The pharmaceutical composition of aspect 35, wherein napDNAbp is a nuclease-active Cas9, a nuclease-inactive Cas9 (dCas9), or a Cas9 nickase (nCas9).

態様40.態様35の医薬組成物であって、napDNAbpが:Cas9、Cas12e、Cas12d、Cas12a、Cas12b1、Cas13a、Cas12c、およびアルゴノートからなる群から選択され、任意にニッカーゼ活性を有する。 Aspect 40. The pharmaceutical composition of aspect 35, wherein the napDNAbp is selected from the group consisting of: Cas9, Cas12e, Cas12d, Cas12a, Cas12b1, Cas13a, Cas12c, and Argonaute, and optionally has nickase activity.

態様41.態様33の医薬組成物であって、N末端およびC末端半分がプライム編集因子融合タンパク質を分裂部位において分裂することによって形成される。 Embodiment 41. The pharmaceutical composition of embodiment 33, wherein the N-terminal and C-terminal halves are formed by cleaving the prime editor fusion protein at a cleavage site.

態様42.態様41の医薬組成物であって、分裂部位がnapDNAbpドメイン上のペプチド結合である。 Aspect 42. The pharmaceutical composition of aspect 41, wherein the cleavage site is a peptide bond on the napDNAbp domain.

態様43.態様41の医薬組成物であって、分裂部位がポリメラーゼドメイン上のペプチド結合である。 Aspect 43. The pharmaceutical composition of aspect 41, wherein the cleavage site is a peptide bond on the polymerase domain.

態様44.態様41の医薬組成物であって、分裂部位がリンカー上のペプチド結合である。 Aspect 44. The pharmaceutical composition of aspect 41, wherein the cleavage site is a peptide bond on the linker.

態様45.態様41の医薬組成物であって、分裂部位が、配列番号18(標準的なSpCas9)の残基1および2、2および3、3および4、4および5、5および6、6および7、7および8、8および9、9および10、10および11、11および12、12および13、13および14、14および15、16および17、17および18、18および19、19および20、20および21、21および22、22および23、23および24、24および25、25および26、26および27、27および(ad)28、28および29、29および30、30および31、31および32、32および33、33および34、34および35、35および36、36および37、37および38、38および39、39および40、40および41、41および42、42および43、43および44、44および45、45および46、46および47、47および48、48および49、49および50の間、または残基50~100、100~150、150~200、200~250、250~300、300~350、350~400、400~450、450~500、500~600、600~700、700~800、800~900、900~1000、1000~1100、1100~1200、1200~1300、もしくは1300~1368の間のいずれか2つの残基の間、あるいは配列番号18のSpCas9ホモログまたは等価物のいずれか2つの同等アミノ酸残基の間のペプチド結合である。 Embodiment 45. The pharmaceutical composition of embodiment 41, wherein the cleavage site is selected from residues 1 and 2, 2 and 3, 3 and 4, 4 and 5, 5 and 6, 6 and 7, 7 and 8, 8 and 9, 9 and 10, 10 and 11, 11 and 12, 12 and 13, 13 and 14, 14 and 15, 16 and 17, 17 and 18, 18 and 19, 19 and 20, 20 and 21, 21 and 22, 22 and 23, 23 and 24, 24 and 25, 25 and 26, 26 and 27, 27 and (ad)28, 28 and 29, 29 and 30, 30 and 31, 31 and 32, 32 and 33, 33 and 34, 34 and 35, 35 and 36, 36 and 37, 37 and 38, 38 and 39 of SEQ ID NO: 18 (standard SpCas9). 9, 39 and 40, 40 and 41, 41 and 42, 42 and 43, 43 and 44, 44 and 45, 45 and 46, 46 and 47, 47 and 48, 48 and 49, 49 and 50, or between residues 50-100, 100-150, 150-200, 200-250, 250-300, 300-350, 350-400, 400-450, 45 A peptide bond between any two residues between 0-500, 500-600, 600-700, 700-800, 800-900, 900-1000, 1000-1100, 1100-1200, 1200-1300, or 1300-1368, or between any two equivalent amino acid residues of an SpCas9 homolog or equivalent of SEQ ID NO:18.

態様46.態様41の医薬組成物であって、分裂部位が、配列番号89(標準的な逆転写酵素、M-MLV RT)の残基1および2、2および3、3および4、4および5、5および6、6および7、7および8、8および9、9および10、10および11、11および12、12および13、13および14、14および15、16および17、17および18、18および19、19および20、20および21、21および22、22および23、23および24、24および25、25および26、26および27、27および(ad)28、28および29、29および30、30および31、31および32、32および33、33および34、34および35、35および36、36および37、37および38、38および39、39および40、40および41、41および42、42および43、43および44、44および45、45および46、46および47、47および48、48および49、49および50の間、または残基50~100、100~150、150~200、200~250、250~300、300~350、350~400、400~450、450~500、500~600、もしくは600~667の間のいずれか2つの残基の間、あるいは配列番号89の逆転写酵素ホモログまたは等価物のいずれか2つの同等アミノ酸残基の間のペプチド結合である。 Embodiment 46. The pharmaceutical composition of embodiment 41, wherein the cleavage site is selected from residues 1 and 2, 2 and 3, 3 and 4, 4 and 5, 5 and 6, 6 and 7, 7 and 8, 8 and 9, 9 and 10, 10 and 11, 11 and 12, 12 and 13, 13 and 14, 14 and 15, 16 and 17, 17 and 18, 18 and 19, 19 and 20, 20 and 21, 21 and 22, 22 and 23, 23 and 24, 24 and 25, 25 and 26, 26 and 27, 27 and (ad)28, 28 and 29, 29 and 30, 30 and 31, 31 and 32, 32 and 33, 33 and 34, 34 and 35, 35 and 36, 36 and 37 of SEQ ID NO: 89 (standard reverse transcriptase, M-MLV RT). , 37 and 38, 38 and 39, 39 and 40, 40 and 41, 41 and 42, 42 and 43, 43 and 44, 44 and 45, 45 and 46, 46 and 47, 47 and 48, 48 and 49, 49 and 50, or between any two residues between residues 50-100, 100-150, 150-200, 200-250, 250-300, 300-350, 350-400, 400-450, 450-500, 500-600, or 600-667, or between any two equivalent amino acid residues of a reverse transcriptase homolog or equivalent of SEQ ID NO:89.

態様47.態様33の医薬組成物であって、プライム編集因子融合タンパク質のN末端半分が、本明細書に記載のN末端プライム編集因子融合タンパク質をコードするアミノ酸配列を有する。 Aspect 47. The pharmaceutical composition of aspect 33, wherein the N-terminal half of the prime editor fusion protein has an amino acid sequence encoding an N-terminal prime editor fusion protein described herein.

態様48.態様33の医薬組成物であって、プライム編集因子融合タンパク質のC末端半分が、本明細書に記載のN末端プライム編集因子融合タンパク質をコードするアミノ酸配列を有する。 Aspect 48. The pharmaceutical composition of aspect 33, wherein the C-terminal half of the prime editor fusion protein has an amino acid sequence encoding an N-terminal prime editor fusion protein described herein.

態様49.プライム編集因子融合タンパク質を細胞に送達する方法であって、細胞を第1のAAV粒子および第2のAAV粒子によってトランスフェクションすることを含み、第1のAAVベクターがプライム編集因子融合タンパク質のN末端半分を発現し、第2のAAVベクターがプライム編集因子融合タンパク質のC末端半分を発現し、N末端半分およびC末端半分が細胞内で組み合わせられてプライム編集因子融合タンパク質を再構成する。 Embodiment 49. A method of delivering a prime editor fusion protein to a cell, comprising transfecting the cell with a first AAV particle and a second AAV particle, wherein the first AAV vector expresses the N-terminal half of the prime editor fusion protein and the second AAV vector expresses the C-terminal half of the prime editor fusion protein, and wherein the N-terminal and C-terminal halves combine in the cell to reconstitute the prime editor fusion protein.

態様50.態様49の方法であって、第1または第2のAAV粒子がPEgRNAをもまた発現し、これが再構成されたプライム編集因子を標的DNA部位へと標的化する。 Embodiment 50. The method of embodiment 49, wherein the first or second AAV particle also expresses a PEgRNA, which targets the reconstituted primed editing element to the target DNA site.

態様51.態様49の方法であって、プライム編集因子融合タンパク質が核酸プログラム型DNA結合タンパク質(napDNAbp)ドメインとポリメラーゼドメインとを含む。 Embodiment 51. The method of embodiment 49, wherein the prime editor fusion protein comprises a nucleic acid programmable DNA binding protein (napDNAbp) domain and a polymerase domain.

態様52.態様49の方法であって、プライム編集因子融合タンパク質が、プライム編集ガイドRNA(PEgRNA)の存在下においてプライム編集を実行することができる。 Embodiment 52. The method of embodiment 49, wherein the prime editor fusion protein is capable of performing prime editing in the presence of a prime editing guide RNA (PEgRNA).

態様53.態様51の方法であって、napDNAbpがCas9タンパク質またはそのバリアントである。 Embodiment 53. The method of embodiment 51, wherein the napDNAbp is a Cas9 protein or a variant thereof.

態様54.態様53の方法であって、napDNAbpがニッカーゼ活性を有するヌクレアーゼである。 Embodiment 54. The method of embodiment 53, wherein napDNAbp is a nuclease having nickase activity.

態様55.態様53の方法であって、napDNAbpがヌクレアーゼ活性Cas9、ヌクレアーゼ不活性型Cas9(dCas9)、またはCas9ニッカーゼ(nCas9)である。 Embodiment 55. The method of embodiment 53, wherein napDNAbp is a nuclease-active Cas9, a nuclease-inactive Cas9 (dCas9), or a Cas9 nickase (nCas9).

態様56.態様53の方法であって、napDNAbpが:Cas9、Cas12e、Cas12d、Cas12a、Cas12b1、Cas13a、Cas12c、およびアルゴノートからなる群から選択され、任意にニッカーゼ活性を有する。 Embodiment 56. The method of embodiment 53, wherein the napDNAbp is selected from the group consisting of: Cas9, Cas12e, Cas12d, Cas12a, Cas12b1, Cas13a, Cas12c, and Argonaute, and optionally has nickase activity.

態様57.態様49の方法であって、N末端およびC末端半分がプライム編集因子融合タンパク質を分裂部位において分裂することによって形成される。 Embodiment 57. The method of embodiment 49, wherein the N-terminal and C-terminal halves are formed by cleaving the prime editor fusion protein at a cleavage site.

態様58.態様57の方法であって、分裂部位がnapDNAbpドメイン上のペプチド結合である。 Embodiment 58. The method of embodiment 57, wherein the cleavage site is a peptide bond on the napDNAbp domain.

態様59.態様57の方法であって、分裂部位がポリメラーゼドメイン上のペプチド結合である。 Embodiment 59. The method of embodiment 57, wherein the cleavage site is a peptide bond on the polymerase domain.

態様60.態様57の方法であって、分裂部位がリンカー上のペプチド結合である。 Embodiment 60. The method of embodiment 57, wherein the cleavage site is a peptide bond on the linker.

態様61.態様57の方法であって、分裂部位が、配列番号18(標準的なSpCas9)の残基1および2、2および3、3および4、4および5、5および6、6および7、7および8、8および9、9および10、10および11、11および12、12および13、13および14、14および15、16および17、17および18、18および19、19および20、20および21、21および22、22および23、23および24、24および25、25および26、26および27、27および(ad)28、28および29、29および30、30および31、31および32、32および33、33および34、34および35、35および36、36および37、37および38、38および39、39および40、40および41、41および42、42および43、43および44、44および45、45および46、46および47、47および48、48および49、49および50の間、または残基50~100、100~150、150~200、200~250、250~300、300~350、350~400、400~450、450~500、500~600、600~700、700~800、800~900、900~1000、1000~1100、1100~1200、1200~1300、もしくは1300~1368の間のいずれか2つの残基の間、あるいは配列番号18のSpCas9ホモログまたは等価物のいずれか2つの同等アミノ酸残基の間のペプチド結合である。 Embodiment 61. The method of embodiment 57, wherein the division site is selected from residues 1 and 2, 2 and 3, 3 and 4, 4 and 5, 5 and 6, 6 and 7, 7 and 8, 8 and 9, 9 and 10, 10 and 11, 11 and 12, 12 and 13, 13 and 14, 14 and 15, 16 and 17, 17 and 18, 18 and 19, 19 and 20, 20 and 21, 21 and 22, 22 and 23, 23 and 24, 24 and 25, 25 and 26, 26 and 27, 27 and (ad)28, 28 and 29, 29 and 30, 30 and 31, 31 and 32, 32 and 33, 33 and 34, 34 and 35, 35 and 36, 36 and 37, 37 and 38, 38 and 39, Between residues 39 and 40, 40 and 41, 41 and 42, 42 and 43, 43 and 44, 44 and 45, 45 and 46, 46 and 47, 47 and 48, 48 and 49, 49 and 50, or between residues 50-100, 100-150, 150-200, 200-250, 250-300, 300-350, 350-400, 400-450, 450 A peptide bond between any two residues between 500, 500-600, 600-700, 700-800, 800-900, 900-1000, 1000-1100, 1100-1200, 1200-1300, or 1300-1368, or between any two equivalent amino acid residues of an SpCas9 homolog or equivalent of SEQ ID NO:18.

態様62.態様57の方法であって、分裂部位が、配列番号89(標準的な逆転写酵素、M-MLV RT)の残基1および2、2および3、3および4、4および5、5および6、6および7、7および8、8および9、9および10、10および11、11および12、12および13、13および14、14および15、16および17、17および18、18および19、19および20、20および21、21および22、22および23、23および24、24および25、25および26、26および27、27および(ad)28、28および29、29および30、30および31、31および32、32および33、33および34、34および35、35および36、36および37、37および38、38および39、39および40、40および41、41および42、42および43、43および44、44および45、45および46、46および47、47および48、48および49、49および50の間、または残基50~100、100~150、150~200、200~250、250~300、300~350、350~400、400~450、450~500、500~600、もしくは600~667の間のいずれか2つの残基の間、あるいは配列番号89の逆転写酵素ホモログまたは等価物のいずれか2つの同等アミノ酸残基の間のペプチド結合である。 Embodiment 62. The method of embodiment 57, wherein the cleavage site is selected from residues 1 and 2, 2 and 3, 3 and 4, 4 and 5, 5 and 6, 6 and 7, 7 and 8, 8 and 9, 9 and 10, 10 and 11, 11 and 12, 12 and 13, 13 and 14, 14 and 15, 16 and 17, 17 and 18, 18 and 19, 19 and 20, 20 and 21, 21 and 22, 22 and 23, 23 and 24, 24 and 25, 25 and 26, 26 and 27, 27 and (ad)28, 28 and 29, 29 and 30, 30 and 31, 31 and 32, 32 and 33, 33 and 34, 34 and 35, 35 and 36, 36 and 37 of SEQ ID NO:89 (standard reverse transcriptase, M-MLV RT). , 37 and 38, 38 and 39, 39 and 40, 40 and 41, 41 and 42, 42 and 43, 43 and 44, 44 and 45, 45 and 46, 46 and 47, 47 and 48, 48 and 49, 49 and 50, or between any two residues between residues 50-100, 100-150, 150-200, 200-250, 250-300, 300-350, 350-400, 400-450, 450-500, 500-600, or 600-667, or between any two equivalent amino acid residues of a reverse transcriptase homolog or equivalent of SEQ ID NO:89.

態様63.態様49の方法であって、プライム編集因子融合タンパク質のN末端半分が、本明細書に記載のN末端プライム編集因子融合タンパク質をコードするアミノ酸配列を有する。 Embodiment 63. The method of embodiment 49, wherein the N-terminal half of the prime editor fusion protein has an amino acid sequence encoding an N-terminal prime editor fusion protein described herein.

態様64.態様49の方法であって、プライム編集因子融合タンパク質のC末端半分が、本明細書に記載のC末端プライム編集因子融合タンパク質をコードするアミノ酸配列を有する。 Embodiment 64. The method of embodiment 49, wherein the C-terminal half of the prime editor fusion protein has an amino acid sequence encoding a C-terminal prime editor fusion protein described herein.

態様65.態様49の方法であって、第1のAAV粒子が、第1のプライム編集因子構成要素をコードするヌクレオチド配列を含む組み換えAAVゲノムを含む。 Embodiment 65. The method of embodiment 49, wherein the first AAV particle comprises a recombinant AAV genome that includes a nucleotide sequence encoding a first prime editor component.

態様66.態様49の方法であって、第2のAAV粒子が、第2のプライム編集因子構成要素をコードするヌクレオチド配列を含む組み換えAAVゲノムを含む。 Embodiment 66. The method of embodiment 49, wherein the second AAV particle comprises a recombinant AAV genome that includes a nucleotide sequence encoding a second prime editing factor component.

態様67.態様49の方法であって、トランスフェクションステップがインビボで行われる。 Aspect 67. The method of aspect 49, wherein the transfection step is performed in vivo.

態様68.態様49の方法であって、トランスフェクションステップがエクスビボで行われる。 Aspect 68. The method of aspect 49, wherein the transfection step is performed ex vivo.

態様69.態様50の方法であって、標的DNA部位が疾患関連遺伝子である。 Aspect 69. The method of aspect 50, wherein the target DNA site is a disease-associated gene.

態様70.態様69の方法であって、疾患関連遺伝子が:アデノシンデアミナーゼ(ADA)欠損症;アルファ-1アンチトリプシン欠損症;嚢胞性線維症;デュシェンヌ型筋ジストロフィー;ガラクトース血症;ヘモクロマトーシス;ハンチントン病;メープルシロップ尿症;マルファン症候群;1型神経線維腫症;先天性爪肥厚症;フェニルケトン尿症;重症複合免疫不全;鎌状赤血球症;スミス・レムリ・オピッツ症候群;トリヌクレオチド反復障害;プリオン病;およびテイ・サックス病からなる群から選択される単一遺伝子障害に関連する。 Embodiment 70. The method of embodiment 69, wherein the disease-associated gene is associated with a single gene disorder selected from the group consisting of: adenosine deaminase (ADA) deficiency; alpha-1 antitrypsin deficiency; cystic fibrosis; Duchenne muscular dystrophy; galactosemia; hemochromatosis; Huntington's disease; maple syrup urine disease; Marfan syndrome; neurofibromatosis type 1; pachyonychia congenita; phenylketonuria; severe combined immunodeficiency; sickle cell disease; Smith-Lemli-Opitz syndrome; trinucleotide repeat disorders; prion diseases; and Tay-Sachs disease.

態様71.態様69の方法であって、疾患関連遺伝子が:心臓病;高血圧;アルツハイマー病;関節炎;糖尿病;がん;および肥満からなる群から選択される多遺伝子性障害に関連する。 Embodiment 71. The method of embodiment 69, wherein the disease-associated gene is associated with a polygenic disorder selected from the group consisting of: heart disease; hypertension; Alzheimer's disease; arthritis; diabetes; cancer; and obesity.

態様72.態様51の方法であって、プログラム可能なDNA結合タンパク質(napDNAbp)ドメイン。 Embodiment 72. The method of embodiment 51, comprising a programmable DNA binding protein (napDNAbp) domain.

態様73.態様51の方法であって、ポリメラーゼドメインが逆転写酵素である。 Embodiment 73. The method of embodiment 51, wherein the polymerase domain is a reverse transcriptase.

態様74.態様73の方法であって、逆転写酵素が、配列番号89~100、105~122、128~129、132、139、143、149、154、159、235、454、471、516、662、700、701~716、739~741、および766のアミノ酸配列のいずれか1つを含む。 Embodiment 74. The method of embodiment 73, wherein the reverse transcriptase comprises any one of the amino acid sequences of SEQ ID NOs: 89-100, 105-122, 128-129, 132, 139, 143, 149, 154, 159, 235, 454, 471, 516, 662, 700, 701-716, 739-741, and 766.

態様75.態様73の方法であって、逆転写酵素が、配列番号89~100、105~122、128~129、132、139、143、149、154、159、235、454、471、516、662、700、701~716、739~741、および766のいずれか1つのアミノ酸配列との少なくとも80%、85%、90%、95%、98%、または99%配列同一性を有するアミノ酸配列を含む。 Embodiment 75. The method of embodiment 73, wherein the reverse transcriptase comprises an amino acid sequence having at least 80%, 85%, 90%, 95%, 98%, or 99% sequence identity to any one of the amino acid sequences of SEQ ID NOs: 89-100, 105-122, 128-129, 132, 139, 143, 149, 154, 159, 235, 454, 471, 516, 662, 700, 701-716, 739-741, and 766.

態様76.態様73の方法であって、napDNAbpが配列番号18のアミノ酸配列を含む。 Aspect 76. The method of aspect 73, wherein napDNAbp comprises the amino acid sequence of SEQ ID NO:18.

態様77.態様73の方法であって、napDNAbpが、配列番号18~88、126、130、137、141、147、153、157、445、460、467、および482~487のいずれか1つのアミノ酸配列との少なくとも80%、85%、90%、95%、98%、または99%配列同一性を有するアミノ酸配列を含む。
態様78.態様8のポリペプチドであって、分裂部位が、配列番号18の1023および1024の間、または配列番号18との少なくとも85%、少なくとも90%、少なくとも95%、少なくとも99%、もしくは少なくとも99.5%配列同一性を有するアミノ酸配列上の対応する位置である。
Embodiment 77 The method of embodiment 73, wherein the napDNAbp comprises an amino acid sequence having at least 80%, 85%, 90%, 95%, 98%, or 99% sequence identity to an amino acid sequence of any one of SEQ ID NOs: 18-88, 126, 130, 137, 141, 147, 153, 157, 445, 460, 467, and 482-487.
Embodiment 78. The polypeptide of embodiment 8, wherein the division site is between 1023 and 1024 of SEQ ID NO: 18, or a corresponding position on an amino acid sequence having at least 85%, at least 90%, at least 95%, at least 99%, or at least 99.5% sequence identity with SEQ ID NO: 18.

群G.RNA構造/機能を改変するためのPE法
態様1.プライム編集によって、標的ヌクレオチド配列によってコードされる目当てのRNA上にリボヌクレオチドモチーフまたはタグを組み入れる方法であって、方法が:(a)標的ヌクレオチド配列を(i)核酸プログラム型DNA結合タンパク質(napDNAbp)およびポリメラーゼを含むプライム編集因子ならびに(ii)リボヌクレオチドモチーフまたはタグをコードする編集鋳型を含むPEgRNAと接触させること;それによって、リボヌクレオチドモチーフまたはタグをコードする一本鎖DNA配列を重合すること;ならびにDNA修復および/または複製プロセスによって、標的ヌクレオチド配列における対応する内生鎖の代わりに一本鎖DNA配列を組み込むことを含み、方法が、リボヌクレオチドモチーフまたはタグを含む目当ての修飾されたRNAをコードする標的ヌクレオチド配列を生ずる。
Group G. PE Methods for Modifying RNA Structure/Function Embodiment 1. A method for incorporating a ribonucleotide motif or tag on a desired RNA encoded by a target nucleotide sequence by prime editing, the method comprising: (a) contacting the target nucleotide sequence with (i) a prime editing factor comprising a nucleic acid programmable DNA binding protein (napDNAbp) and a polymerase, and (ii) a PEgRNA comprising an editing template encoding the ribonucleotide motif or tag; thereby polymerizing a single-stranded DNA sequence encoding the ribonucleotide motif or tag; and incorporating the single-stranded DNA sequence in place of the corresponding endogenous strand in the target nucleotide sequence by DNA repair and/or replication processes, the method resulting in a target nucleotide sequence encoding a modified RNA of interest that includes the ribonucleotide motif or tag.

態様2.態様1の方法であって、リボヌクレオチドモチーフまたはタグが検出部分である。 Embodiment 2. The method of embodiment 1, wherein the ribonucleotide motif or tag is the detection moiety.

態様3.態様1の方法であって、リボヌクレオチドモチーフまたはタグが目当てのRNAの発現レベルに影響する。 Embodiment 3. The method of embodiment 1, wherein the ribonucleotide motif or tag affects the expression level of the RNA of interest.

態様4.態様1の方法であって、リボヌクレオチドモチーフまたはタグが目当てのRNAの輸送または細胞下レベル位置付けに影響する。 Embodiment 4. The method of embodiment 1, wherein the ribonucleotide motif or tag affects transport or subcellular location of the RNA of interest.

態様5.態様1の方法であって、リボヌクレオチドモチーフまたはタグが、SV40 1型、SV40 2型、SV40 3型、hGH、BGH、rbGlob、TK、MALAT1 ENE-mascRNA、KSHV PAN ENE、Smbox/U1 snRNAボックス、U1 snRNA 3'ボックス、tRNA-リジン、broccoliアプタマー、spinachアプタマー、mangoアプタマー、HDVリボザイム、およびm6Aからなる群から選択される。 Embodiment 5. The method of embodiment 1, wherein the ribonucleotide motif or tag is selected from the group consisting of SV40 type 1, SV40 type 2, SV40 type 3, hGH, BGH, rbGlob, TK, MALAT1 ENE-mascRNA, KSHV PAN ENE, Smbox/U1 snRNA box, U1 snRNA 3' box, tRNA-lysine, broccoli aptamer, spinach aptamer, mango aptamer, HDV ribozyme, and m6A.

態様6.態様1の方法であって、PEgRNAが、配列番号101~104、181~183、223~244、277、325~334、336、338、340、342、344、346、348、350、352、354、356、358、360、362、364、366、368、499~505、735~761、776~777を含む(表を見よ)。 Embodiment 6. The method of embodiment 1, wherein the PEG RNA comprises SEQ ID NOs: 101-104, 181-183, 223-244, 277, 325-334, 336, 338, 340, 342, 344, 346, 348, 350, 352, 354, 356, 358, 360, 362, 364, 366, 368, 499-505, 735-761, 776-777 (see table).

態様7.態様1の方法であって、融合タンパク質がPE1、PE2、またはPE3のアミノ酸配列を含む。 Aspect 7. The method of aspect 1, wherein the fusion protein comprises an amino acid sequence of PE1, PE2, or PE3.

態様8.態様1の方法であって、napDNAbpがCas9ニッカーゼ(nCas9)である。 Embodiment 8. The method of embodiment 1, wherein the napDNAbp is Cas9 nickase (nCas9).

態様9.態様1の方法であって、napDNAbpが、配列番号18~88、126、130、137、141、147、153、157、445、460、467、および482~487のアミノ酸配列を含む。 Embodiment 9. The method of embodiment 1, wherein napDNAbp comprises the amino acid sequences of SEQ ID NOs: 18-88, 126, 130, 137, 141, 147, 153, 157, 445, 460, 467, and 482-487.

群H.遺伝子ライブラリを作るためのPE法
態様1.プライム編集によって、プログラムされた変異体遺伝子ライブラリを構築する方法であって、方法が:
Group H. PE Methods for Making Gene Libraries Embodiment 1. A method for constructing a programmed mutant gene library by prime editing, the method comprising:

(a)1つ以上の標的遺伝子座位を夫々が含む標的ヌクレオチド配列のライブラリを(i)核酸プログラム型DNA結合タンパク質(napDNAbp)およびポリメラーゼを含むプライム編集因子ならびに(ii)1つ以上の標的遺伝子座位に対して相対的に少なくとも1つの遺伝子変化を有する配列を含む編集鋳型を含むPEgRNAと接触させること; (a) contacting a library of target nucleotide sequences, each of which comprises one or more target gene loci, with (i) a primed editing factor comprising a nucleic acid programmable DNA binding protein (napDNAbp) and a polymerase, and (ii) a PEgRNA comprising an editing template comprising a sequence having at least one genetic change relative to one or more target gene loci;

それによって、編集鋳型を鋳型とする一本鎖DNA配列を重合すること;ならびに thereby polymerizing a single-stranded DNA sequence using the editing template as a template; and

DNA修復および/または複製プロセスによって、1つ以上の標的遺伝子座位の代わりに一本鎖DNA配列を組み込み、それによって、少なくとも1つの遺伝子変化を前記ライブラリの標的ヌクレオチド配列の標的遺伝子座位上に組み込むこと、
を含む。
incorporating a single stranded DNA sequence in place of one or more target gene loci by DNA repair and/or replication processes, thereby incorporating at least one genetic alteration onto the target gene loci of the target nucleotide sequences of said library;
including.

態様2.態様1の方法であって、ライブラリがプラスミドライブラリである。 Aspect 2. The method of aspect 1, wherein the library is a plasmid library.

態様3.態様1の方法であって、ライブラリがファージライブラリである。 Aspect 3. The method of aspect 1, wherein the library is a phage library.

態様4.態様1の方法であって、1つ以上の標的遺伝子座位がタンパク質をコードする領域を含む。 Embodiment 4. The method of embodiment 1, wherein one or more target gene loci include a protein-coding region.

態様5.態様1の方法であって、1つ以上の標的遺伝子座位がタンパク質の二次構造モチーフをコードする領域を含む。 Embodiment 5. The method of embodiment 1, wherein one or more target gene loci include regions encoding protein secondary structure motifs.

態様6.態様5の方法であって、二次構造モチーフがアルファヘリックスである。 Aspect 6. The method of aspect 5, wherein the secondary structure motif is an alpha helix.

態様7.態様5の方法であって、二次構造モチーフがベータシートである。 Aspect 7. The method of aspect 5, wherein the secondary structure motif is a beta sheet.

態様8.態様1の方法であって、napDNAbpがCas9タンパク質またはそのバリアントである。 Embodiment 8. The method of embodiment 1, wherein napDNAbp is a Cas9 protein or a variant thereof.

態様9.態様1の方法であって、napDNAbpがニッカーゼ活性を有するヌクレアーゼである。 Aspect 9. The method of aspect 1, wherein napDNAbp is a nuclease having nickase activity.

態様10.態様1の方法であって、napDNAbpがヌクレアーゼ活性Cas9、ヌクレアーゼ不活性型Cas9(dCas9)、またはCas9ニッカーゼ(nCas9)である。 Embodiment 10. The method of embodiment 1, wherein napDNAbp is a nuclease-active Cas9, a nuclease-inactive Cas9 (dCas9), or a Cas9 nickase (nCas9).

態様11.態様1の方法であって、napDNAbpが配列番号18のアミノ酸配列を含む。 Aspect 11. The method of aspect 1, wherein napDNAbp comprises the amino acid sequence of SEQ ID NO:18.

態様12.態様1の方法であって、napDNAbpが、配列番号18~88、126、130、137、141、147、153、157、445、460、467、および482~487のいずれか1つのアミノ酸配列との少なくとも80%、85%、90%、95%、98%、または99%配列同一性を有するアミノ酸配列を含む。 Embodiment 12. The method of embodiment 1, wherein napDNAbp comprises an amino acid sequence having at least 80%, 85%, 90%, 95%, 98%, or 99% sequence identity to any one of the amino acid sequences of SEQ ID NOs: 18-88, 126, 130, 137, 141, 147, 153, 157, 445, 460, 467, and 482-487.

態様13.態様1の方法であって、ポリメラーゼドメインが逆転写酵素である。 Aspect 13. The method of aspect 1, wherein the polymerase domain is a reverse transcriptase.

態様14.態様13の方法であって、逆転写酵素が、配列番号89~100、105~122、128~129、132、139、143、149、154、159、235、454、471、516、662、700、701~716、739~741、および766のアミノ酸配列のいずれか1つを含む。 Embodiment 14. The method of embodiment 13, wherein the reverse transcriptase comprises any one of the amino acid sequences of SEQ ID NOs: 89-100, 105-122, 128-129, 132, 139, 143, 149, 154, 159, 235, 454, 471, 516, 662, 700, 701-716, 739-741, and 766.

態様15.態様14の方法であって、逆転写酵素が、配列番号89~100、105~122、128~129、132、139、143、149、154、159、235、454、471、516、662、700、701~716、739~741、および766のいずれか1つのアミノ酸配列との少なくとも80%、85%、90%、95%、98%、または99%配列同一性を有するアミノ酸配列を含む。 Embodiment 15. The method of embodiment 14, wherein the reverse transcriptase comprises an amino acid sequence having at least 80%, 85%, 90%, 95%, 98%, or 99% sequence identity to any one of the amino acid sequences of SEQ ID NOs: 89-100, 105-122, 128-129, 132, 139, 143, 149, 154, 159, 235, 454, 471, 516, 662, 700, 701-716, 739-741, and 766.

態様16.態様1の方法であって、編集鋳型の少なくとも1つの遺伝子変化が挿入である。 Embodiment 16. The method of embodiment 1, wherein at least one genetic change in the editing template is an insertion.

態様17.態様1の方法であって、編集鋳型の少なくとも1つの遺伝子変化が欠失である。 Embodiment 17. The method of embodiment 1, wherein at least one genetic alteration in the editing template is a deletion.

態様18.態様1の方法であって、編集鋳型の少なくとも1つの遺伝子変化が置換である。 Embodiment 18. The method of embodiment 1, wherein at least one genetic change in the editing template is a substitution.

態様19.態様1の方法であって、少なくとも1つの遺伝子変化が1つ以上のコドンの挿入である。 Aspect 19. The method of aspect 1, wherein at least one genetic change is an insertion of one or more codons.

態様20.態様1の方法であって、少なくとも1つの遺伝子変化が1つ以上のコドンの欠失である。 Aspect 20. The method of aspect 1, wherein at least one genetic alteration is a deletion of one or more codons.

態様21.態様1の方法であって、少なくとも1つの遺伝子変化が停止コドンの挿入である。 Embodiment 21. The method of embodiment 1, wherein at least one genetic alteration is the insertion of a stop codon.

態様22.態様1の方法であって、少なくとも1つの遺伝子変化が非停止コドンから停止コドンへの変換である。 Embodiment 22. The method of embodiment 1, wherein at least one genetic change is a conversion of a non-stop codon to a stop codon.

態様23.態様1の方法であって、方法が、同時に、少なくとも2、または3、または4、または5、または6、または7、または8、または9、または10、または10~100の間、または100~200の間、または200~300の間、または300~400の間、または400~500の間の標的遺伝子座位に対して、ライブラリの標的ヌクレオチド配列の夫々について行われる。 Embodiment 23. The method of embodiment 1, wherein the method is performed simultaneously for at least 2, or 3, or 4, or 5, or 6, or 7, or 8, or 9, or 10, or between 10 and 100, or between 100 and 200, or between 200 and 300, or between 300 and 400, or between 400 and 500 target loci for each of the target nucleotide sequences of the library.

態様24.態様1の方法であって、方法がPACEまたはPANCE進化の間に行われ、少なくとも1つの遺伝子変化を前記ライブラリの標的ヌクレオチド配列の標的遺伝子座位に組み込むことの夫々のものが、新たな標的配列をもまた組み入れる。 Embodiment 24. The method of embodiment 1, wherein the method is performed during PACE or PANCE evolution, and each of the incorporating at least one genetic change into a target locus of a target nucleotide sequence of the library also incorporates a new target sequence.

群I.オフターゲット検出のためのPE法
態様1.プライム編集因子によるオフターゲット編集を評価する方法であって、方法が:
Group I. PE Methods for Off-Target Detection Embodiment 1. A method for assessing off-target editing by a primed editor, the method comprising:

(a)編集部位を有する標的ヌクレオチド配列を(i)核酸プログラム型DNA結合タンパク質(napDNAbp)およびポリメラーゼを含むプライム編集因子融合タンパク質ならびに(ii)検出可能な配列をコードするDNA合成鋳型を含むPEgRNAと接触させ; (a) contacting a target nucleotide sequence having an editing site with (i) a primed editor fusion protein comprising a nucleic acid programmable DNA binding protein (napDNAbp) and a polymerase, and (ii) a PEgRNA comprising a DNA synthesis template encoding a detectable sequence;

PEgRNAが融合タンパク質と複合体化し、前記融合タンパク質を編集部位へと、および存在する場合には1つ以上のオフターゲット部位へとガイドし; The PEgRNA complexes with the fusion protein and guides the fusion protein to the editing site and, if present, to one or more off-target sites;

プライム編集因子融合タンパク質が、検出可能な配列を編集部位に、および存在する場合には1つ以上のオフターゲット部位に組み入れること; The prime editor fusion protein incorporates a detectable sequence at the editing site and, if present, at one or more off-target sites;

(b)編集部位および1つ以上のオフターゲット部位のヌクレオチド配列を決定すること、
を含む。
(b) determining the nucleotide sequence of the editing site and one or more off-target sites;
including.

態様2.態様1の方法であって、標的ヌクレオチド配列がゲノムである。 Aspect 2. The method of aspect 1, wherein the target nucleotide sequence is a genome.

態様3.態様1の方法であって、接触させるステップがin vitroである。 Aspect 3. The method of aspect 1, wherein the contacting step is in vitro.

態様4.態様1の方法であって、接触させるステップがインビボである。 Aspect 4. The method of aspect 1, wherein the contacting step is in vivo.

態様5.態様1の方法であって、編集部位が疾患関連遺伝子の変異である。 Aspect 5. The method of aspect 1, wherein the editing site is a mutation in a disease-associated gene.

態様6.態様5の方法であって、変異が1塩基置換、挿入、欠失、または逆位である。 Aspect 6. The method of aspect 5, wherein the mutation is a single base substitution, an insertion, a deletion, or an inversion.

態様7.態様1の方法であって、疾患関連遺伝子が:アデノシンデアミナーゼ(ADA)欠損症;アルファ-1アンチトリプシン欠損症;嚢胞性線維症;デュシェンヌ型筋ジストロフィー;ガラクトース血症;ヘモクロマトーシス;ハンチントン病;メープルシロップ尿症;マルファン症候群;1型神経線維腫症;先天性爪肥厚症;フェニルケトン尿症;重症複合免疫不全;鎌状赤血球症;スミス・レムリ・オピッツ症候群;およびテイ・サックス病からなる群から選択される単一遺伝子障害に関連する。 Embodiment 7. The method of embodiment 1, wherein the disease-associated gene is associated with a single-gene disorder selected from the group consisting of: adenosine deaminase (ADA) deficiency; alpha-1 antitrypsin deficiency; cystic fibrosis; Duchenne muscular dystrophy; galactosemia; hemochromatosis; Huntington's disease; maple syrup urine disease; Marfan syndrome; neurofibromatosis type 1; pachyonychia congenita; phenylketonuria; severe combined immunodeficiency; sickle cell disease; Smith-Lemli-Opitz syndrome; and Tay-Sachs disease.

態様8.態様1の方法であって、疾患関連遺伝子が:心臓病;高血圧;アルツハイマー病;関節炎;糖尿病;がん;および肥満からなる群から選択される多遺伝子性障害に関連する。 Embodiment 8. The method of embodiment 1, wherein the disease-associated gene is associated with a polygenic disorder selected from the group consisting of: heart disease; hypertension; Alzheimer's disease; arthritis; diabetes; cancer; and obesity.

態様9.態様1の方法であって、融合タンパク質が、配列番号101~104、181~183、223~244、277、325~334、336、338、340、342、344、346、348、350、352、354、356、358、360、362、364、366、368、499~505、735~761、776~777のアミノ酸配列、または配列番号101~104、181~183、223~244、277、325~334、336、338、340、342、344、346、348、350、352、354、356、358、360、362、364、366、368、499~505、735~761、776~777との少なくとも80%、85%、90%、95%、98%、もしくは99%配列同一性を有するアミノ酸配列を有する。 Embodiment 9. The method of embodiment 1, wherein the fusion protein comprises an amino acid sequence selected from the group consisting of SEQ ID NOs: 101-104, 181-183, 223-244, 277, 325-334, 336, 338, 340, 342, 344, 346, 348, 350, 352, 354, 356, 358, 360, 362, 364, 366, 368, 499-505, 735-761, 776-777, or SEQ ID NOs: 101-104, It has an amino acid sequence that has at least 80%, 85%, 90%, 95%, 98%, or 99% sequence identity with 181-183, 223-244, 277, 325-334, 336, 338, 340, 342, 344, 346, 348, 350, 352, 354, 356, 358, 360, 362, 364, 366, 368, 499-505, 735-761, and 776-777.

態様10.態様1の方法であって、napDNAbpがCas9、Cas12e、Cas12d、Cas12a、Cas12b1、Cas13a、Cas12c、もしくはアルゴノート、またはCas9、Cas12e、Cas12d、Cas12a、Cas12b1、Cas13a、Cas12c、もしくはアルゴノートのバリアントである。 Embodiment 10. The method of embodiment 1, wherein napDNAbp is Cas9, Cas12e, Cas12d, Cas12a, Cas12b1, Cas13a, Cas12c, or Argonaute, or a variant of Cas9, Cas12e, Cas12d, Cas12a, Cas12b1, Cas13a, Cas12c, or Argonaute.

態様11.態様1の方法であって、napDNAbpがCas9またはそのバリアントである。 Embodiment 11. The method of embodiment 1, wherein napDNAbp is Cas9 or a variant thereof.

態様12.態様1の方法であって、napDNAbpがヌクレアーゼ活性Cas9、ヌクレアーゼ不活性型Cas9(dCas9)、またはCas9ニッカーゼ(nCas9)である。 Embodiment 12. The method of embodiment 1, wherein napDNAbp is a nuclease-active Cas9, a nuclease-inactive Cas9 (dCas9), or a Cas9 nickase (nCas9).

態様13.態様1の方法であって、napDNAbpがCas9ニッカーゼ(nCas9)である。 Embodiment 13. The method of embodiment 1, wherein the napDNAbp is Cas9 nickase (nCas9).

態様14.態様1の方法であって、napDNAbpが、配列番号18のアミノ酸配列、または配列番号18との少なくとも80%、85%、90%、95%、98%、もしくは99%配列同一性を有するアミノ酸配列を含む。 Embodiment 14. The method of embodiment 1, wherein napDNAbp comprises an amino acid sequence of SEQ ID NO:18, or an amino acid sequence having at least 80%, 85%, 90%, 95%, 98%, or 99% sequence identity to SEQ ID NO:18.

態様15.態様1の方法であって、napDNAbpが、SpCas9野生型、あるいは配列番号18~88、126、130、137、141、147、153、157、445、460、467、および482~487のいずれか1つのアミノ酸、または配列番号18~88、126、130、137、141、147、153、157、445、460、467、および482~487のいずれかとの少なくとも80%、85%、90%、95%、98%、もしくは99%配列同一性を有するアミノ酸配列のそのバリアントである。 Embodiment 15. The method of embodiment 1, wherein the napDNAbp is SpCas9 wild type or a variant thereof of any one of the amino acids of SEQ ID NOs : 18-88, 126, 130, 137, 141, 147, 153, 157, 445, 460, 467, and 482-487, or an amino acid sequence having at least 80%, 85%, 90%, 95%, 98%, or 99% sequence identity to any of SEQ ID NOs: 18-88, 126, 130, 137, 141, 147, 153, 157, 445, 460, 467, and 482-487.

態様16.態様1の方法であって、napDNAbpがSpCas9オーソログである。 Embodiment 16. The method of embodiment 1, wherein napDNAbp is an SpCas9 orthologue.

態様17.態様1の方法であって、napDNAbpが、アミノ酸配列18~88、126、130、137、141、147、153、157、445、460、467、および482~487のいずれか1つ、または配列番号18~88、126、130、137、141、147、153、157、445、460、467、および482~487のいずれかとの少なくとも80%、85%、90%、95%、98%、もしくは99%配列同一性を有するアミノ酸配列である。 Embodiment 17. The method of embodiment 1, wherein napDNAbp is any one of amino acid sequences 18-88, 126, 130, 137, 141, 147, 153, 157, 445, 460, 467, and 482-487, or an amino acid sequence having at least 80%, 85%, 90%, 95%, 98%, or 99% sequence identity to any one of SEQ ID NOs: 18-88, 126, 130, 137, 141, 147, 153, 157, 445, 460, 467, and 482-487.

態様18.態様1の方法であって、napDNAbpが、配列番号18~88、126、130、137、141、147、153、157、445、460、467、および482~487のいずれか1つのアミノ酸配列との少なくとも80%、85%、90%、95%、98%、または99%配列同一性を有するアミノ酸配列を含む。 Embodiment 18. The method of embodiment 1, wherein napDNAbp comprises an amino acid sequence having at least 80%, 85%, 90%, 95%, 98%, or 99% sequence identity to any one of the amino acid sequences of SEQ ID NOs: 18-88, 126, 130, 137, 141, 147, 153, 157, 445, 460, 467, and 482-487.

態様19.態様1の方法であって、ポリメラーゼがRNA依存性DNAポリメラーゼ活性を含む。 Embodiment 19. The method of embodiment 1, wherein the polymerase comprises RNA-dependent DNA polymerase activity.

態様20.態様1の方法であって、ポリメラーゼが逆転写酵素である。 Aspect 20. The method of aspect 1, wherein the polymerase is a reverse transcriptase.

態様21.態様1の方法であって、逆転写酵素が天然に存在する野生型逆転写酵素であり、配列番号89のいずれか1つのアミノ酸配列、または配列番号89のいずれかとの少なくとも80%、85%、90%、95%、98%、もしくは99%配列同一性を有するアミノ酸配列を有する。 Embodiment 21. The method of embodiment 1, wherein the reverse transcriptase is a naturally occurring wild-type reverse transcriptase having an amino acid sequence of any one of SEQ ID NO:89, or an amino acid sequence having at least 80%, 85%, 90%, 95%, 98%, or 99% sequence identity to any one of SEQ ID NO:89.

態様22.態様1の方法であって、逆転写酵素がバリアント逆転写酵素であり、配列番号89~100、105~122、128~129、132、139、143、149、154、159、235、454、471、516、662、700、701~716、739~741、および766のいずれか1つのアミノ酸配列、または配列番号89~100、105~122、128~129、132、139、143、149、154、159、235、454、471、516、662、700、701~716、739~741、および766のいずれかとの少なくとも80%、85%、90%、95%、98%、もしくは99%配列同一性を有するアミノ酸配列を有する。 Aspect 22. The method of embodiment 1, wherein the reverse transcriptase is a variant reverse transcriptase and has an amino acid sequence of any one of SEQ ID NOs: 89-100, 105-122, 128-129, 132, 139, 143, 149, 154, 159, 235, 454, 471, 516, 662, 700, 701-716, 739-741, and 766, or an amino acid sequence having at least 80%, 85%, 90%, 95%, 98%, or 99% sequence identity to any one of SEQ ID NOs: 89-100, 105-122, 128-129, 132, 139, 143, 149, 154, 159, 235, 454, 471, 516, 662, 700, 701-716, 739-741, and 766.

態様23.態様1の方法であって、逆転写酵素が、配列番号89~100、105~122、128~129、132、139、143、149、154、159、235、454、471、516、662、700、701~716、739~741、および766のアミノ酸配列のいずれか1つを含む。 Embodiment 23. The method of embodiment 1, wherein the reverse transcriptase comprises any one of the amino acid sequences of SEQ ID NOs: 89-100, 105-122, 128-129, 132, 139, 143, 149, 154, 159, 235, 454, 471, 516, 662, 700, 701-716, 739-741, and 766.

態様24.態様1の方法であって、逆転写酵素が、配列番号89~100、105~122、128~129、132、139、143、149、154、159、235、454、471、516、662、700、701~716、739~741、および766のいずれか1つのアミノ酸配列との少なくとも80%、85%、90%、95%、98%、または99%配列同一性を有するアミノ酸配列を含む。 Embodiment 24. The method of embodiment 1, wherein the reverse transcriptase comprises an amino acid sequence having at least 80%, 85%, 90%, 95%, 98%, or 99% sequence identity to any one of the amino acid sequences of SEQ ID NOs: 89-100, 105-122, 128-129, 132, 139, 143, 149, 154, 159, 235, 454, 471, 516, 662, 700, 701-716, 739-741, and 766.

態様25.態様1の方法であって、検出可能な配列が、少なくとも1、または少なくとも2、または少なくとも3、または少なくとも4、または少なくとも5、または少なくとも6、または少なくとも7、または少なくとも8、または少なくとも9、または少なくとも10、または少なくとも11、または少なくとも12、または少なくとも13、または少なくとも14、または少なくとも15、または少なくとも16、または少なくとも17、または少なくとも18、または少なくとも19、または少なくとも20、または少なくとも21、または少なくとも22、または少なくとも23、または少なくとも24、または少なくとも25、または少なくとも26、または少なくとも27、または少なくとも28、または少なくとも29、または少なくとも30、または少なくとも31、または少なくとも32、または少なくとも33、または少なくとも34、または少なくとも35、または少なくとも40、または少なくとも50、または少なくとも60、または少なくとも70、または少なくとも80、または少なくとも90、または少なくとも100核酸塩基の挿入である。 Embodiment 25. The method of embodiment 1, wherein the detectable sequence is an insertion of at least 1, or at least 2, or at least 3, or at least 4, or at least 5, or at least 6, or at least 7, or at least 8, or at least 9, or at least 10, or at least 11, or at least 12, or at least 13, or at least 14, or at least 15, or at least 16, or at least 17, or at least 18, or at least 19, or at least 20, or at least 21, or at least 22, or at least 23, or at least 24, or at least 25, or at least 26, or at least 27, or at least 28, or at least 29, or at least 30, or at least 31, or at least 32, or at least 33, or at least 34, or at least 35, or at least 40, or at least 50, or at least 60, or at least 70, or at least 80, or at least 90, or at least 100 nucleobases.

態様26.態様1の方法であって、検出可能な配列が、少なくとも1、または少なくとも2、または少なくとも3、または少なくとも4、または少なくとも5、または少なくとも6、または少なくとも7、または少なくとも8、または少なくとも9、または少なくとも10、または少なくとも11、または少なくとも12、または少なくとも13、または少なくとも14、または少なくとも15、または少なくとも16、または少なくとも17、または少なくとも18、または少なくとも19、または少なくとも20、または少なくとも21、または少なくとも22、または少なくとも23、または少なくとも24、または少なくとも25、または少なくとも26、または少なくとも27、または少なくとも28、または少なくとも29、または少なくとも30、または少なくとも31、または少なくとも32、または少なくとも33、または少なくとも34、または少なくとも35、または少なくとも40、または少なくとも50、または少なくとも60、または少なくとも70、または少なくとも80、または少なくとも90、または少なくとも100核酸塩基の欠失である。 Embodiment 26. The method of embodiment 1, wherein the detectable sequence is a deletion of at least 1, or at least 2, or at least 3, or at least 4, or at least 5, or at least 6, or at least 7, or at least 8, or at least 9, or at least 10, or at least 11, or at least 12, or at least 13, or at least 14, or at least 15, or at least 16, or at least 17, or at least 18, or at least 19, or at least 20, or at least 21, or at least 22, or at least 23, or at least 24, or at least 25, or at least 26, or at least 27, or at least 28, or at least 29, or at least 30, or at least 31, or at least 32, or at least 33, or at least 34, or at least 35, or at least 40, or at least 50, or at least 60, or at least 70, or at least 80, or at least 90, or at least 100 nucleobases.

態様27.態様1の方法であって、検出可能な配列が核酸塩基置換である。 Embodiment 27. The method of embodiment 1, wherein the detectable sequence is a nucleobase substitution.

態様28.態様1の方法であって、検出可能な配列がトランジション変異である。 Embodiment 28. The method of embodiment 1, wherein the detectable sequence is a transition mutation.

態様29.態様1の方法であって、検出可能な配列がトランスバージョン変異である。 Embodiment 29. The method of embodiment 1, wherein the detectable sequence is a transversion mutation.

態様30.態様1の方法であって、検出可能な配列が1ヌクレオチド置換であり:(1)GからTの置換、(2)GからAの置換、(3)GからCの置換、(4)TからGの置換、(5)TからAの置換、(6)TからCの置換、(7)CからGの置換、(8)CからTの置換、(9)CからAの置換、(10)AからTの置換、(11)AからGの置換、および(12)AからCの置換からなる群から選択される。 Embodiment 30. The method of embodiment 1, wherein the detectable sequence is a single nucleotide substitution selected from the group consisting of: (1) a G to T substitution, (2) a G to A substitution, (3) a G to C substitution, (4) a T to G substitution, (5) a T to A substitution, (6) a T to C substitution, (7) a C to G substitution, (8) a C to T substitution, (9) a C to A substitution, (10) an A to T substitution, (11) an A to G substitution, and (12) an A to C substitution.

態様31.態様1の方法であって、検出可能な配列が1ヌクレオチド置換であり、これが、(1)G:C塩基対をT:A塩基対に、(2)G:C塩基対をA:T塩基対に、(3)G:C塩基対をC:G塩基対に、(4)T:A塩基対をG:C塩基対に、(5)T:A塩基対をA:T塩基対に、(6)T:A塩基対をC:G塩基対に、(7)C:G塩基対をG:C塩基対に、(8)C:G塩基対をT:A塩基対に、(9)C:G塩基対をA:T塩基対に、(10)A:T塩基対をT:A塩基対に、(11)A:T塩基対をG:C塩基対に、または(12)A:T塩基対をC:G塩基対に変換する。 Embodiment 31. The method of embodiment 1, wherein the detectable sequence is a single nucleotide substitution that converts (1) a G:C base pair to a T:A base pair, (2) a G:C base pair to an A:T base pair, (3) a G:C base pair to a C:G base pair, (4) a T:A base pair to a G:C base pair, (5) a T:A base pair to an A:T base pair, (6) a T:A base pair to a C:G base pair, (7) a C:G base pair to a G:C base pair, (8) a C:G base pair to a T:A base pair, (9) a C:G base pair to an A:T base pair, (10) an A:T base pair to a T:A base pair, (11) an A:T base pair to a G:C base pair, or (12) an A:T base pair to a C:G base pair.

態様32.態様1の方法であって、検出可能な配列がバーコード配列である。 Embodiment 32. The method of embodiment 1, wherein the detectable sequence is a barcode sequence.

態様33.態様1の方法であって、オンターゲットおよびオフターゲット部位におけるヌクレオチド配列を決定するステップ(d)が、(i)標的ヌクレオチド配列をフラグメント化してフラグメントを形成すること、(ii)アダプター配列をフラグメントの端に取り付けること、(iii)プライマーのペアを用いてアンプリコンをPCR増幅し、1つのプライマーが、フラグメントの1つの端に取り付けられたアダプター配列にアニーリング、別のプライマー、それがフラグメント上に位置付けられたプライム編集によって挿入されたアダプター配列にアニールすること、および(iv)アンプリコンを配列決定して編集の位置付けを決定することを含む。 Embodiment 33. The method of embodiment 1, wherein step (d) of determining the nucleotide sequence at the on-target and off-target sites comprises: (i) fragmenting the target nucleotide sequence to form fragments; (ii) attaching adapter sequences to the ends of the fragments; (iii) PCR amplifying the amplicon using a pair of primers, one primer annealing to the adapter sequence attached to one end of the fragment and another primer annealing to the adapter sequence inserted by the primed edit located on the fragment; and (iv) sequencing the amplicon to determine the location of the edit.

群J.細胞データ記録のためのPE法
態様1.プライム編集によって細胞性のイベントを記録する方法であって、方法が:(A)細胞に(i)napDNAbpおよびRNA依存性DNAポリメラーゼを含むプライム編集因子融合タンパク質と(ii)PEgRNAとをコードする1つ以上の構築物を導入し、融合タンパク質および/またはPEgRNAの発現が、細胞性のイベントの生起によって誘導され、融合タンパク質および/またはPEgRNAの発現によって、細胞のゲノム上の標的編集部位のプライム編集をもたらして、検出可能な配列を導入すること、ならびに(B)検出可能な配列を同定し、それによって細胞性のイベントの生起を同定することを含む。
Group J. PE Methods for Cellular Data Recording Embodiment 1. A method for recording a cellular event by prime editing, the method comprising: (A) introducing into a cell one or more constructs encoding (i) a prime editor fusion protein comprising napDNAbp and an RNA-dependent DNA polymerase and (ii) a PEgRNA, wherein expression of the fusion protein and/or the PEgRNA is induced by the occurrence of a cellular event, and expression of the fusion protein and/or the PEgRNA results in prime editing of a target editing site on the genome of the cell to introduce a detectable sequence, and (B) identifying the detectable sequence, thereby identifying the occurrence of the cellular event.

態様2.態様1の方法であって、ステップ(A)のプライム編集が新たな標的編集部位を同時に導入し、その結果、細胞性のイベントの記録が反復的に生起し得る。 Aspect 2. The method of aspect 1, wherein the prime editing of step (A) simultaneously introduces new target editing sites, such that recording of cellular events can occur repetitively.

態様3.態様1の方法であって、PEgRNAが、検出可能な配列をコードする編集鋳型を含む。 Embodiment 3. The method of embodiment 1, wherein the PEgRNA comprises an editing template that encodes a detectable sequence.

態様4.態様3の方法であって、編集鋳型がさらに新たな標的編集部位をコードする。 Embodiment 4. The method of embodiment 3, wherein the editing template further encodes a new target editing site.

態様5.態様1の方法であって、検出可能な配列が、少なくとも1、または少なくとも2、または少なくとも3、または少なくとも4、または少なくとも5、または少なくとも6、または少なくとも7、または少なくとも8、または少なくとも9、または少なくとも10、または少なくとも11、または少なくとも12、または少なくとも13、または少なくとも14、または少なくとも15、または少なくとも16、または少なくとも17、または少なくとも18、または少なくとも19、または少なくとも20、または少なくとも21、または少なくとも22、または少なくとも23、または少なくとも24、または少なくとも25、または少なくとも26、または少なくとも27、または少なくとも28、または少なくとも29、または少なくとも30、または少なくとも31、または少なくとも32、または少なくとも33、または少なくとも34、または少なくとも35、または少なくとも40、または少なくとも50、または少なくとも60、または少なくとも70、または少なくとも80、または少なくとも90、または少なくとも100核酸塩基の挿入である。 Embodiment 5. The method of embodiment 1, wherein the detectable sequence is an insertion of at least 1, or at least 2, or at least 3, or at least 4, or at least 5, or at least 6, or at least 7, or at least 8, or at least 9, or at least 10, or at least 11, or at least 12, or at least 13, or at least 14, or at least 15, or at least 16, or at least 17, or at least 18, or at least 19, or at least 20, or at least 21, or at least 22, or at least 23, or at least 24, or at least 25, or at least 26, or at least 27, or at least 28, or at least 29, or at least 30, or at least 31, or at least 32, or at least 33, or at least 34, or at least 35, or at least 40, or at least 50, or at least 60, or at least 70, or at least 80, or at least 90, or at least 100 nucleobases.

態様6.態様1の方法であって、検出可能な配列が、少なくとも1、または少なくとも2、または少なくとも3、または少なくとも4、または少なくとも5、または少なくとも6、または少なくとも7、または少なくとも8、または少なくとも9、または少なくとも10、または少なくとも11、または少なくとも12、または少なくとも13、または少なくとも14、または少なくとも15、または少なくとも16、または少なくとも17、または少なくとも18、または少なくとも19、または少なくとも20、または少なくとも21、または少なくとも22、または少なくとも23、または少なくとも24、または少なくとも25、または少なくとも26、または少なくとも27、または少なくとも28、または少なくとも29、または少なくとも30、または少なくとも31、または少なくとも32、または少なくとも33、または少なくとも34、または少なくとも35、または少なくとも40、または少なくとも50、または少なくとも60、または少なくとも70、または少なくとも80、または少なくとも90、または少なくとも100核酸塩基の欠失である。 Embodiment 6. The method of embodiment 1, wherein the detectable sequence is a deletion of at least 1, or at least 2, or at least 3, or at least 4, or at least 5, or at least 6, or at least 7, or at least 8, or at least 9, or at least 10, or at least 11, or at least 12, or at least 13, or at least 14, or at least 15, or at least 16, or at least 17, or at least 18, or at least 19, or at least 20, or at least 21, or at least 22, or at least 23, or at least 24, or at least 25, or at least 26, or at least 27, or at least 28, or at least 29, or at least 30, or at least 31, or at least 32, or at least 33, or at least 34, or at least 35, or at least 40, or at least 50, or at least 60, or at least 70, or at least 80, or at least 90, or at least 100 nucleobases.

態様7.態様1の方法であって、検出可能な配列が核酸塩基置換である。 Aspect 7. The method of aspect 1, wherein the detectable sequence is a nucleobase substitution.

態様8.態様1の方法であって、検出可能な配列がトランジション変異である。 Embodiment 8. The method of embodiment 1, wherein the detectable sequence is a transition mutation.

態様9.態様1の方法であって、検出可能な配列がトランスバージョン変異である。 Embodiment 9. The method of embodiment 1, wherein the detectable sequence is a transversion mutation.

態様10.態様1の方法であって、検出可能な配列が1ヌクレオチド置換であり、そこについて、1ヌクレオチド置換が(1)GからTの置換、(2)GからAの置換、(3)GからCの置換、(4)TからGの置換、(5)TからAの置換、(6)TからCの置換、(7)CからGの置換、(8)CからTの置換、(9)CからAの置換、(10)AからTの置換、(11)AからGの置換、または(12)AからCの置換である。 Embodiment 10. The method of embodiment 1, wherein the detectable sequence is a single nucleotide substitution, wherein the single nucleotide substitution is (1) a G to T substitution, (2) a G to A substitution, (3) a G to C substitution, (4) a T to G substitution, (5) a T to A substitution, (6) a T to C substitution, (7) a C to G substitution, (8) a C to T substitution, (9) a C to A substitution, (10) an A to T substitution, (11) an A to G substitution, or (12) an A to C substitution.

態様11.態様1の方法であって、検出可能な配列が1ヌクレオチド置換であり、これが、(1)G:C塩基対をT:A塩基対に、(2)G:C塩基対をA:T塩基対に、(3)G:C塩基対をC:G塩基対に、(4)T:A塩基対をG:C塩基対に、(5)T:A塩基対をA:T塩基対に、(6)T:A塩基対をC:G塩基対に、(7)C:G塩基対をG:C塩基対に、(8)C:G塩基対をT:A塩基対に、(9)C:G塩基対をA:T塩基対に、(10)A:T塩基対をT:A塩基対に、(11)A:T塩基対をG:C塩基対に、または(12)A:T塩基対をC:G塩基対に変換する。 Embodiment 11. The method of embodiment 1, wherein the detectable sequence is a single nucleotide substitution that converts (1) a G:C base pair to a T:A base pair, (2) a G:C base pair to an A:T base pair, (3) a G:C base pair to a C:G base pair, (4) a T:A base pair to a G:C base pair, (5) a T:A base pair to an A:T base pair, (6) a T:A base pair to a C:G base pair, (7) a C:G base pair to a G:C base pair, (8) a C:G base pair to a T:A base pair, (9) a C:G base pair to an A:T base pair, (10) an A:T base pair to a T:A base pair, (11) an A:T base pair to a G:C base pair, or (12) an A:T base pair to a C:G base pair.

態様12.態様1の方法であって、検出可能な配列がバーコード配列である。 Embodiment 12. The method of embodiment 1, wherein the detectable sequence is a barcode sequence.

態様13.態様1の方法であって、検出可能な配列が、細胞性のイベントの各生起について、検出可能な配列の反復的な挿入の結果として、長さが経時的に増大する。 Embodiment 13. The method of embodiment 1, wherein the detectable sequence increases in length over time as a result of repeated insertions of the detectable sequence for each occurrence of the cellular event.

態様14.態様1の方法であって、検出ステップが、編集された標的部位、または編集された標的部位のアンプリコンを配列決定することを含む。 Embodiment 14. The method of embodiment 1, wherein the detecting step comprises sequencing the edited target site or an amplicon of the edited target site.

態様15.態様1の方法であって、napDNAbpが、Cas9、Cas12e、Cas12d、Cas12a、Cas12b1、Cas13a、Cas12c、もしくはアルゴノート、またはCas9、Cas12e、Cas12d、Cas12a、Cas12b1、Cas13a、Cas12c、もしくはアルゴノートのバリアントである。 Embodiment 15. The method of embodiment 1, wherein napDNAbp is Cas9, Cas12e, Cas12d, Cas12a, Cas12b1, Cas13a, Cas12c, or Argonaute, or a variant of Cas9, Cas12e, Cas12d, Cas12a, Cas12b1, Cas13a, Cas12c, or Argonaute.

態様16.態様1の方法であって、napDNAbpがCas9またはそのバリアントである。 Embodiment 16. The method of embodiment 1, wherein napDNAbp is Cas9 or a variant thereof.

態様17.態様1の方法であって、napDNAbpがヌクレアーゼ活性Cas9、ヌクレアーゼ不活性型Cas9(dCas9)、またはCas9ニッカーゼ(nCas9)である。 Embodiment 17. The method of embodiment 1, wherein napDNAbp is a nuclease-active Cas9, a nuclease-inactive Cas9 (dCas9), or a Cas9 nickase (nCas9).

態様18.態様1の方法であって、napDNAbpがCas9ニッカーゼ(nCas9)である。 Embodiment 18. The method of embodiment 1, wherein the napDNAbp is Cas9 nickase (nCas9).

態様19.態様1の方法であって、napDNAbpが、配列番号18のアミノ酸配列、または配列番号18との少なくとも80%、85%、90%、95%、98%、もしくは99%配列同一性を有するアミノ酸配列を含む。 Embodiment 19 The method of embodiment 1, wherein the napDNAbp comprises an amino acid sequence of SEQ ID NO: 18 , or an amino acid sequence having at least 80%, 85%, 90%, 95%, 98%, or 99% sequence identity to SEQ ID NO:18.

態様20.態様1の方法であって、napDNAbpが、SpCas9野生型、あるいは配列番号18~88、126、130、137、141、147、153、157、445、460、467、および482~487のいずれか1つのアミノ酸配列、または配列番号18~88、126、130、137、141、147、153、157、445、460、467、および482~487のいずれかとの少なくとも80%、85%、90%、95%、98%、もしくは99%配列同一性を有するアミノ酸配列のそのバリアントである。 Embodiment 20. The method of embodiment 1, wherein the napDNAbp is SpCas9 wild type or a variant thereof of an amino acid sequence of any one of SEQ ID NOs : 18-88, 126, 130, 137, 141, 147, 153, 157, 445, 460, 467, and 482-487, or an amino acid sequence having at least 80%, 85%, 90%, 95%, 98%, or 99% sequence identity to any of SEQ ID NOs: 18-88, 126, 130, 137, 141, 147, 153, 157, 445, 460, 467, and 482-487.

態様21.態様1の方法であって、napDNAbpがSpCas9オーソログである。 Embodiment 21. The method of embodiment 1, wherein napDNAbp is an SpCas9 orthologue.

態様22.態様1の方法であって、napDNAbpが、配列番号18~88、126、130、137、141、147、153、157、445、460、467、および482~487のいずれか1つのアミノ酸配列、または配列番号18~88、126、130、137、141、147、153、157、445、460、467、および482~487のいずれかとの少なくとも80%、85%、90%、95%、98%、もしくは99%配列同一性を有するアミノ酸配列である。 Embodiment 22 The method of embodiment 1, wherein the napDNAbp is an amino acid sequence of any one of SEQ ID NOs : 18-88, 126, 130, 137, 141, 147, 153, 157, 445, 460, 467, and 482-487, or an amino acid sequence having at least 80%, 85%, 90%, 95%, 98%, or 99% sequence identity to any one of SEQ ID NOs: 18-88, 126, 130, 137, 141, 147, 153, 157, 445, 460, 467, and 482-487.

態様23.態様1の方法であって、RNA依存性DNAポリメラーゼが逆転写酵素である。 Aspect 23. The method of aspect 1, wherein the RNA-dependent DNA polymerase is a reverse transcriptase.

態様24.態様23の方法であって、逆転写酵素が天然に存在する野生型逆転写酵素であり、配列番号89のいずれか1つのアミノ酸配列、または配列番号89のいずれかとの少なくとも80%、85%、90%、95%、98%、もしくは99%配列同一性を有するアミノ酸配列を有する。 Embodiment 24. The method of embodiment 23, wherein the reverse transcriptase is a naturally occurring wild-type reverse transcriptase having an amino acid sequence of any one of SEQ ID NO:89, or an amino acid sequence having at least 80%, 85%, 90%, 95%, 98%, or 99% sequence identity to any one of SEQ ID NO:89.

態様25.態様23の方法であって、逆転写酵素がバリアント逆転写酵素であり、配列番号89~100、105~122、128~129、132、139、143、149、154、159、235、454、471、516、662、700、701~716、739~741、および766のいずれか1つのアミノ酸配列、または配列番号89~100、105~122、128~129、132、139、143、149、154、159、235、454、471、516、662、700、701~716、739~741、および766のいずれかとの少なくとも80%、85%、90%、95%、98%、もしくは99%配列同一性を有するアミノ酸配列を有する。 Aspect 25. The method of embodiment 23, wherein the reverse transcriptase is a variant reverse transcriptase and has an amino acid sequence of any one of SEQ ID NOs: 89-100, 105-122, 128-129, 132, 139, 143, 149, 154, 159, 235, 454, 471, 516, 662, 700, 701-716, 739-741, and 766, or an amino acid sequence having at least 80%, 85%, 90%, 95%, 98%, or 99% sequence identity to any one of SEQ ID NOs: 89-100, 105-122, 128-129, 132, 139, 143, 149, 154, 159, 235, 454, 471, 516, 662, 700, 701-716, 739-741, and 766.

態様26.態様1の方法であって、融合タンパク質が、配列番号123および134(PE1、PE2)のいずれか1つのアミノ酸配列、または配列番号123および134(PE1、PE2)のいずれかとの少なくとも80%、85%、90%、95%、98%、もしくは99%配列同一性を有するアミノ酸配列を含む。 Embodiment 26. The method of embodiment 1, wherein the fusion protein comprises an amino acid sequence of any one of SEQ ID NOs: 123 and 134 (PE1, PE2), or an amino acid sequence having at least 80%, 85%, 90%, 95%, 98%, or 99% sequence identity to any one of SEQ ID NOs: 123 and 134 (PE1, PE2).

態様27.態様1の方法であって、プライム編集因子融合タンパク質および/またはPEgRNAをコードする1つ以上の構築物が、さらに、細胞性のイベントが生起するときに誘導可能である1つ以上のプロモーターを含む。 Embodiment 27. The method of embodiment 1, wherein the one or more constructs encoding the prime editor fusion protein and/or the PEgRNA further comprise one or more promoters that are inducible when a cellular event occurs.

態様28.態様1の方法であって、細胞性のイベントが、細胞によって受容される刺激によってマークされる。 Embodiment 28. The method of embodiment 1, wherein the cellular event is marked by a stimulus received by the cell.

態様29.態様28の方法であって、刺激が、低分子、タンパク質、ペプチド、アミノ酸、代謝物質、無機分子、有機金属分子、有機分子、薬物もしくは薬物候補、糖、脂質、金属、核酸、内生もしくは外因的なシグナルカスケードの活性化の間に生ずる分子、光、熱、音、圧力、機械的ストレス、剪断ストレス、またはウイルスもしくは他の微生物、pHの変化、または酸化還元状態の変化である。 Embodiment 29. The method of embodiment 28, wherein the stimulus is a small molecule, a protein, a peptide, an amino acid, a metabolite, an inorganic molecule, an organometallic molecule, an organic molecule, a drug or drug candidate, a sugar, a lipid, a metal, a nucleic acid, a molecule that occurs during activation of an endogenous or exogenous signaling cascade, light, heat, sound, pressure, mechanical stress, shear stress, or a virus or other microorganism, a change in pH, or a change in redox state.

態様30.プライム編集を用いて細胞性のイベントを記録するための細胞データ記録プラスミドであって: Embodiment 30. A cellular data recording plasmid for recording cellular events using prime editing, comprising:

i.(a)核酸プログラム型DNA結合タンパク質(napDNAbp)をコードする核酸配列および(b)RNA依存性DNAポリメラーゼを含む融合タンパク質(前記融合タンパク質は第1のプロモーターに作動可能に連結される); i. a fusion protein comprising (a) a nucleic acid sequence encoding a nucleic acid programmable DNA binding protein (napDNAbp) and (b) an RNA-dependent DNA polymerase, the fusion protein being operably linked to a first promoter;

ii.第2のプロモーターに作動可能に連結されたプライム編集因子ガイドRNA(PEgRNA)をコードする核酸配列(PEgRNAは標的配列に対して相補的である);ならびに ii. a nucleic acid sequence encoding a prime editor guide RNA (PEgRNA) operably linked to a second promoter, the PEgRNA being complementary to a target sequence; and

iii.複製起点;
を含み、
iii. Replication origin;
Including,

プロモーターの少なくとも1つが誘導性プロモーターであり、PEgRNAが、検出可能な配列を標的編集部位において組み入れるために十分にPEgRNAの発現およびnapDNAbpの発現を誘導する条件下において、napDNAbpと会合する。 At least one of the promoters is an inducible promoter, and the PEgRNA associates with the napDNAbp under conditions that induce expression of the PEgRNA and expression of the napDNAbp sufficient to incorporate a detectable sequence at the target editing site.

態様31.態様30の細胞データ記録プラスミドであって、誘導性プロモーターが細胞性のイベントによって誘導される。 Aspect 31. The cell data recording plasmid of aspect 30, wherein the inducible promoter is induced by a cellular event.

態様32.態様30の細胞データ記録プラスミドであって、細胞性のイベントが、細胞によって受容される刺激によってマークされる。 Aspect 32. The cell data recording plasmid of aspect 30, wherein the cellular event is marked by a stimulus received by the cell.

態様33.態様32の細胞データ記録プラスミドであって、刺激が、低分子、タンパク質、ペプチド、アミノ酸、代謝物質、無機分子、有機金属分子、有機分子、薬物もしくは薬物候補、糖、脂質、金属、核酸、内生もしくは外因的なシグナルカスケードの活性化の間に生ずる分子、光、熱、音、圧力、機械的ストレス、剪断ストレス、またはウイルスもしくは他の微生物、pHの変化、または酸化還元状態の変化である。 Embodiment 33. The cell data recording plasmid of embodiment 32, wherein the stimulus is a small molecule, a protein, a peptide, an amino acid, a metabolite, an inorganic molecule, an organometallic molecule, an organic molecule, a drug or drug candidate, a sugar, a lipid, a metal, a nucleic acid, a molecule that occurs during activation of an endogenous or exogenous signaling cascade, light, heat, sound, pressure, mechanical stress, shear stress, or a virus or other microorganism, a change in pH, or a change in redox state.

態様34.態様30の細胞データ記録プラスミドであって、第1および第2のプロモーターが同じである。 Aspect 34. The cell data recording plasmid of aspect 30, wherein the first and second promoters are the same.

態様35.態様30の細胞データ記録プラスミドであって、第1および第2のプロモーターが異なる。 Aspect 35. The cell data recording plasmid of aspect 30, wherein the first and second promoters are different.

態様36.態様30の細胞データ記録プラスミドであって、少なくとも1つの誘導性プロモーターがアンヒドロテトラサイクリン誘導性プロモーター、IPTG誘導性プロモーター、ラムノース誘導性プロモーター、またはアラビノース誘導性プロモーターである。 Aspect 36. The cell data recording plasmid of aspect 30, wherein at least one inducible promoter is an anhydrotetracycline-inducible promoter, an IPTG-inducible promoter, a rhamnose-inducible promoter, or an arabinose-inducible promoter.

態様37.態様30の細胞データ記録プラスミドであって、第1または第2のプロモーターが恒常的プロモーターである。 Aspect 37. The cell data recording plasmid of aspect 30, wherein the first or second promoter is a constitutive promoter.

態様38.態様37の細胞データ記録プラスミドであって、恒常的プロモーターがLacプロモーター、サイトメガロウイルス(CMV)プロモーター、恒常的RNAポリメラーゼIIIプロモーター、またはUBCプロモーターである。 Aspect 38. The cell data recording plasmid of aspect 37, wherein the constitutive promoter is a Lac promoter, a cytomegalovirus (CMV) promoter, a constitutive RNA polymerase III promoter, or a UBC promoter.

態様39.態様30の細胞データ記録プラスミドであって、複製起点がpSC101、pMB1、pBR322、ColE1、またはp15A複製起点配列を含む。 Aspect 39. The cell data recording plasmid of aspect 30, wherein the origin of replication comprises a pSC101, pMB1, pBR322, ColE1, or p15A origin of replication sequence.

態様40.態様30の細胞データ記録プラスミドであって、PEgRNAが、検出可能な配列をコードする編集鋳型を含む。 Aspect 40. The cell data recording plasmid of aspect 30, wherein the PEgRNA comprises an editing template that encodes a detectable sequence.

態様41.態様40の細胞データ記録プラスミドであって、編集鋳型がさらに新たな標的編集部位をコードする。 Aspect 41. The cell data recording plasmid of aspect 40, wherein the editing template further encodes a new target editing site.

態様42.態様30の細胞データ記録プラスミドであって、検出可能な配列が、少なくとも1、または少なくとも2、または少なくとも3、または少なくとも4、または少なくとも5、または少なくとも6、または少なくとも7、または少なくとも8、または少なくとも9、または少なくとも10、または少なくとも11、または少なくとも12、または少なくとも13、または少なくとも14、または少なくとも15、または少なくとも16、または少なくとも17、または少なくとも18、または少なくとも19、または少なくとも20、または少なくとも21、または少なくとも22、または少なくとも23、または少なくとも24、または少なくとも25、または少なくとも26、または少なくとも27、または少なくとも28、または少なくとも29、または少なくとも30、または少なくとも31、または少なくとも32、または少なくとも33、または少なくとも34、または少なくとも35、または少なくとも40、または少なくとも50、または少なくとも60、または少なくとも70、または少なくとも80、または少なくとも90、または少なくとも100核酸塩基の挿入である。 Embodiment 42. The cell data recording plasmid of embodiment 30, wherein the detectable sequence is an insertion of at least 1, or at least 2, or at least 3, or at least 4, or at least 5, or at least 6, or at least 7, or at least 8, or at least 9, or at least 10, or at least 11, or at least 12, or at least 13, or at least 14, or at least 15, or at least 16, or at least 17, or at least 18, or at least 19, or at least 20, or at least 21, or at least 22, or at least 23, or at least 24, or at least 25, or at least 26, or at least 27, or at least 28, or at least 29, or at least 30, or at least 31, or at least 32, or at least 33, or at least 34, or at least 35, or at least 40, or at least 50, or at least 60, or at least 70, or at least 80, or at least 90, or at least 100 nucleobases.

態様43.態様30の細胞データ記録プラスミドであって、検出可能な配列が、少なくとも1、または少なくとも2、または少なくとも3、または少なくとも4、または少なくとも5、または少なくとも6、または少なくとも7、または少なくとも8、または少なくとも9、または少なくとも10、または少なくとも11、または少なくとも12、または少なくとも13、または少なくとも14、または少なくとも15、または少なくとも16、または少なくとも17、または少なくとも18、または少なくとも19、または少なくとも20、または少なくとも21、または少なくとも22、または少なくとも23、または少なくとも24、または少なくとも25、または少なくとも26、または少なくとも27、または少なくとも28、または少なくとも29、または少なくとも30、または少なくとも31、または少なくとも32、または少なくとも33、または少なくとも34、または少なくとも35、または少なくとも40、または少なくとも50、または少なくとも60、または少なくとも70、または少なくとも80、または少なくとも90、または少なくとも100核酸塩基の欠失である。 Embodiment 43. The cell data recording plasmid of embodiment 30, wherein the detectable sequence is a deletion of at least 1, or at least 2, or at least 3, or at least 4, or at least 5, or at least 6, or at least 7, or at least 8, or at least 9, or at least 10, or at least 11, or at least 12, or at least 13, or at least 14, or at least 15, or at least 16, or at least 17, or at least 18, or at least 19, or at least 20, or at least 21, or at least 22, or at least 23, or at least 24, or at least 25, or at least 26, or at least 27, or at least 28, or at least 29, or at least 30, or at least 31, or at least 32, or at least 33, or at least 34, or at least 35, or at least 40, or at least 50, or at least 60, or at least 70, or at least 80, or at least 90, or at least 100 nucleobases.

態様44.態様30の細胞データ記録プラスミドであって、検出可能な配列が核酸塩基置換である。 Aspect 44. The cell data recording plasmid of aspect 30, wherein the detectable sequence is a nucleic acid base substitution.

態様45.態様30の細胞データ記録プラスミドであって、検出可能な配列がトランジション変異である。 Aspect 45. The cell data recording plasmid of aspect 30, wherein the detectable sequence is a transition mutation.

態様46.態様30の細胞データ記録プラスミドであって、検出可能な配列がトランスバージョン変異である。 Aspect 46. The cell data recording plasmid of aspect 30, wherein the detectable sequence is a transversion mutation.

態様47.態様30の細胞データ記録プラスミドであって、検出可能な配列が1ヌクレオチド置換であり、そこから、1ヌクレオチド置換が、(1)GからTの置換、(2)GからAの置換、(3)GからCの置換、(4)TからGの置換、(5)TからAの置換、(6)TからCの置換、(7)CからGの置換、(8)CからTの置換、(9)CからAの置換、(10)AからTの置換、(11)AからGの置換、または(12)AからCの置換である。 Aspect 47. The cell data recording plasmid of aspect 30, wherein the detectable sequence is a single nucleotide substitution, wherein the single nucleotide substitution is (1) a G to T substitution, (2) a G to A substitution, (3) a G to C substitution, (4) a T to G substitution, (5) a T to A substitution, (6) a T to C substitution, (7) a C to G substitution, (8) a C to T substitution, (9) a C to A substitution, (10) an A to T substitution, (11) an A to G substitution, or (12) an A to C substitution.

態様48.態様30の細胞データ記録プラスミドであって、検出可能な配列が1ヌクレオチド置換であり、これが、(1)G:C塩基対をT:A塩基対に、(2)G:C塩基対をA:T塩基対に、(3)G:C塩基対をC:G塩基対に、(4)T:A塩基対をG:C塩基対に、(5)T:A塩基対をA:T塩基対に、(6)T:A塩基対をC:G塩基対に、(7)C:G塩基対をG:C塩基対に、(8)C:G塩基対をT:A塩基対に、(9)C:G塩基対をA:T塩基対に、(10)A:T塩基対をT:A塩基対に、(11)A:T塩基対をG:C塩基対に、または(12)A:T塩基対をC:G塩基対に変換する。 Embodiment 48. The cell data recording plasmid of embodiment 30, wherein the detectable sequence is a single nucleotide substitution that converts (1) a G:C base pair to a T:A base pair, (2) a G:C base pair to an A:T base pair, (3) a G:C base pair to a C:G base pair, (4) a T:A base pair to a G:C base pair, (5) a T:A base pair to an A:T base pair, (6) a T:A base pair to a C:G base pair, (7) a C:G base pair to a G:C base pair, (8) a C:G base pair to a T:A base pair, (9) a C:G base pair to an A:T base pair, (10) an A:T base pair to a T:A base pair, (11) an A:T base pair to a G:C base pair, or (12) an A:T base pair to a C:G base pair.

態様49.態様30の細胞データ記録プラスミドであって、検出可能な配列がバーコード配列である。 Aspect 49. The cell data recording plasmid of aspect 30, wherein the detectable sequence is a barcode sequence.

態様50.態様30の細胞データ記録プラスミドであって、検出可能な配列が、細胞性のイベントの各生起について、検出可能な配列の反復的な挿入の結果として、長さが経時的に増大する。 Aspect 50. The cellular data recording plasmid of aspect 30, wherein the detectable sequence increases in length over time as a result of repeated insertions of the detectable sequence for each occurrence of a cellular event.

態様51.態様30の細胞データ記録プラスミドであって、検出ステップが、編集された標的部位、または編集された標的部位のアンプリコンを配列決定することを含む。 Aspect 51. The cell data recording plasmid of aspect 30, wherein the detecting step comprises sequencing the edited target site or an amplicon of the edited target site.

態様52.態様30の細胞データ記録プラスミドであって、napDNAbpが、Cas9、Cas12e、Cas12d、Cas12a、Cas12b1、Cas13a、Cas12c、もしくはアルゴノート、またはCas9、Cas12e、Cas12d、Cas12a、Cas12b1、Cas13a、Cas12c、もしくはアルゴノートのバリアントである。 Aspect 52. The cell data recording plasmid of aspect 30, wherein napDNAbp is Cas9, Cas12e, Cas12d, Cas12a, Cas12b1, Cas13a, Cas12c, or Argonaute, or a variant of Cas9, Cas12e, Cas12d, Cas12a, Cas12b1, Cas13a, Cas12c, or Argonaute.

態様53.態様30の細胞データ記録プラスミドであって、napDNAbpがCas9またはそのバリアントである。 Aspect 53. The cell data recording plasmid of aspect 30, wherein napDNAbp is Cas9 or a variant thereof.

態様54.態様30の細胞データ記録プラスミドであって、napDNAbpがヌクレアーゼ活性Cas9、ヌクレアーゼ不活性型Cas9(dCas9)、またはCas9ニッカーゼ(nCas9)である。 Embodiment 54. The cell data recording plasmid of embodiment 30, wherein napDNAbp is a nuclease-active Cas9, a nuclease-inactive Cas9 (dCas9), or a Cas9 nickase (nCas9).

態様55.態様30の細胞データ記録プラスミドであって、napDNAbpがCas9ニッカーゼ(nCas9)である。 Aspect 55. The cell data recording plasmid of aspect 30, wherein the napDNAbp is Cas9 nickase (nCas9).

態様56.態様30の細胞データ記録プラスミドであって、napDNAbpが、配列番号18のアミノ酸配列、または配列番号18との少なくとも80%、85%、90%、95%、98%、もしくは99%配列同一性を有するアミノ酸配列を含む。 Aspect 56. The cell data recording plasmid of aspect 30, wherein napDNAbp comprises an amino acid sequence of SEQ ID NO:18, or an amino acid sequence having at least 80%, 85%, 90%, 95%, 98%, or 99% sequence identity to SEQ ID NO:18.

態様57.態様30の細胞データ記録プラスミドであって、napDNAbpが、SpCas9野生型、あるいは配列番号18~88、126、130、137、141、147、153、157、445、460、467、および482~487のいずれか1つのアミノ酸配列、または配列番号18~88、126、130、137、141、147、153、157、445、460、467、および482~487のいずれかとの少なくとも80%、85%、90%、95%、98%、もしくは99%配列同一性を有するアミノ酸配列のそのバリアントである。 Embodiment 57. The cell data recording plasmid of embodiment 30, wherein the napDNAbp is an SpCas9 wild type or a variant thereof of an amino acid sequence of any one of SEQ ID NOs : 18-88, 126, 130, 137, 141, 147, 153, 157, 445, 460, 467, and 482-487, or an amino acid sequence having at least 80%, 85%, 90%, 95%, 98%, or 99% sequence identity to any of SEQ ID NOs: 18-88, 126, 130, 137, 141, 147, 153, 157, 445, 460, 467, and 482-487.

態様58.態様30の細胞データ記録プラスミドであって、napDNAbpがSpCas9オーソログである。 Aspect 58. The cell data recording plasmid of aspect 30, wherein napDNAbp is an SpCas9 orthologue.

態様59.態様30の細胞データ記録プラスミドであって、napDNAbpが、配列番号18~88、126、130、137、141、147、153、157、445、460、467、および482~487のいずれか1つのアミノ酸配列、または配列番号18~88、126、130、137、141、147、153、157、445、460、467、および482~487のいずれかとの少なくとも80%、85%、90%、95%、98%、もしくは99%配列同一性を有するアミノ酸配列である。 Embodiment 59 The cell data recording plasmid of embodiment 30, wherein napDNAbp is an amino acid sequence of any one of SEQ ID NOs : 18-88, 126, 130, 137, 141, 147, 153, 157, 445, 460, 467, and 482-487, or an amino acid sequence having at least 80%, 85%, 90%, 95%, 98%, or 99% sequence identity to any one of SEQ ID NOs: 18-88, 126, 130, 137, 141, 147, 153, 157, 445, 460, 467, and 482-487.

態様60.態様30の細胞データ記録プラスミドであって、RNA依存性DNAポリメラーゼが逆転写酵素である。 Aspect 60. The cell data recording plasmid of aspect 30, wherein the RNA-dependent DNA polymerase is a reverse transcriptase.

態様61.態様30の細胞データ記録プラスミドであって、逆転写酵素が天然に存在する野生型逆転写酵素であり、配列番号89のいずれか1つのアミノ酸配列、または配列番号89のいずれかとの少なくとも80%、85%、90%、95%、98%、もしくは99%配列同一性を有するアミノ酸配列を有する。 Aspect 61. The cell data recording plasmid of aspect 30, wherein the reverse transcriptase is a naturally occurring wild-type reverse transcriptase having an amino acid sequence of any one of SEQ ID NO:89, or an amino acid sequence having at least 80%, 85%, 90%, 95%, 98%, or 99% sequence identity to any one of SEQ ID NO:89.

態様62.態様30の細胞データ記録プラスミドであって、逆転写酵素がバリアント逆転写酵素であり、配列番号89~100、105~122、128~129、132、139、143、149、154、159、235、454、471、516、662、700、701~716、739~741、および766のいずれか1つのアミノ酸配列、または配列番号89~100、105~122、128~129、132、139、143、149、154、159、235、454、471、516、662、700、701~716、739~741、および766のいずれかとの少なくとも80%、85%、90%、95%、98%、もしくは99%配列同一性を有するアミノ酸配列を有する。 Aspect 62. The cell data recording plasmid of embodiment 30, wherein the reverse transcriptase is a variant reverse transcriptase and has an amino acid sequence of any one of SEQ ID NOs: 89-100, 105-122, 128-129, 132, 139, 143, 149, 154, 159, 235, 454, 471, 516, 662, 700, 701-716, 739-741, and 766, or an amino acid sequence having at least 80%, 85%, 90%, 95%, 98%, or 99% sequence identity to any one of SEQ ID NOs: 89-100, 105-122, 128-129, 132, 139, 143, 149, 154, 159, 235, 454, 471, 516, 662, 700, 701-716, 739-741, and 766.

態様63.態様30の細胞データ記録プラスミドであって、融合タンパク質が、配列番号123および134(PE1、PE2)のいずれか1つのアミノ酸配列、または配列番号123および134(PE1、PE2)のいずれかと少なくとも80%、85%、90%、95%、98%、もしくは99%配列同一性を有するアミノ酸配列を含む。 Aspect 63. The cell data recording plasmid of aspect 30, wherein the fusion protein comprises an amino acid sequence of any one of SEQ ID NOs: 123 and 134 (PE1, PE2), or an amino acid sequence having at least 80%, 85%, 90%, 95%, 98%, or 99% sequence identity to any one of SEQ ID NOs: 123 and 134 (PE1, PE2).

態様64.態様30-63のいずれか1つの細胞データレコーダプラスミドを含む細胞への使用のためのキット。 Aspect 64. A kit for use with a cell comprising the cell data recorder plasmid of any one of aspects 30-63.

態様65.態様64のキットであって、細胞が原核細胞である。 Aspect 65. The kit of aspect 64, wherein the cell is a prokaryotic cell.

態様66.態様64のキットであって、細胞が真核細胞である。 Aspect 66. The kit of aspect 64, wherein the cell is a eukaryotic cell.

態様67.態様30-63のいずれか1つの細胞データ記録プラスミドを含む細胞。 Aspect 67. A cell comprising a cell data recording plasmid according to any one of aspects 30-63.

態様68.態様67の細胞であって、細胞が原核細胞である。 Aspect 68. The cell of aspect 67, wherein the cell is a prokaryotic cell.

態様69.態様67の細胞であって、細胞が真核細胞である。 Aspect 69. The cell of aspect 67, wherein the cell is a eukaryotic cell.

態様70.態様69の細胞であって、真核細胞が哺乳類細胞である。 Aspect 70. The cell of aspect 69, wherein the eukaryotic cell is a mammalian cell.

態様71.態様70の細胞であって、哺乳類細胞がヒト細胞である。 Aspect 71. The cell of aspect 70, wherein the mammalian cell is a human cell.

態様72.プライム編集によって細胞性のイベントを記録する方法であって、方法が:(A)態様30~63のいずれかの細胞データ記録プラスミドを細胞に導入し、融合タンパク質および/またはPEgRNAが細胞性のイベントの生起によって誘導され、融合タンパク質および/またはPEgRNAの発現が、検出可能な配列を導入するための細胞のゲノム上の標的編集部位のプライム編集をもたらすことと、(B)検出可能な配列を同定し、それによって細胞性のイベントの生起を同定することとを含む。 Embodiment 72. A method for recording a cellular event by prime editing, the method comprising: (A) introducing into a cell a cellular data recording plasmid of any of embodiments 30-63, wherein a fusion protein and/or a PEgRNA is induced by the occurrence of a cellular event, and expression of the fusion protein and/or the PEgRNA results in prime editing of a target editing site in the genome of the cell to introduce a detectable sequence; and (B) identifying the detectable sequence, thereby identifying the occurrence of the cellular event.

態様73.態様72の方法であって、(A)導入するステップが、トランスフェクションまたはエレクトロポレーションによってである。 Aspect 73. The method of aspect 72, wherein (A) the introducing step is by transfection or electroporation.

均等物および範囲
クレームにおいて、「a」、「an」、および「the」などの冠詞は、1または1より多いことを意味してもよいが、それと反する指示がないか、またはそれとは別に、文脈から明らかでない場合に限る。ある群の1以上のメンバー間に「または」を包含するクレームまたは記載は、その群のメンバーのうち、1つ、1つより多いか、または、すべてが、所定の生成物またはプロセスに存在するか、それに採用されるか、またはそれとは別に、それに関係があるか、を満たすと考えるが、それと反する指示がないか、またはそれとは別に、文脈から明らかでない場合に限る。本発明は、その群のうち、正確に1つのメンバーが、所定の生成物またはプロセスに存在するか、それに採用されるか、またはそれとは別に、それに関係がある態様を包含する。本発明は、その群のメンバーのうち、1つより多いかまたはすべてが、所定の生成物またはプロセスに存在するか、それに採用されるか、またはそれとは別に、それに関係がある態様を包含する。
Equivalents and Scope In the claims, articles such as "a,""an," and "the" may mean one or more than one, unless otherwise indicated to the contrary or otherwise clear from the context. A claim or description including "or" between one or more members of a group is considered to satisfy that one, more than one, or all of the members of the group are present in, employed in, or otherwise relevant to a given product or process, unless otherwise indicated to the contrary or otherwise clear from the context. The invention includes embodiments in which exactly one member of the group is present in, employed in, or otherwise relevant to a given product or process. The invention includes embodiments in which more than one or all of the members of the group are present in, employed in, or otherwise relevant to a given product or process.

しかも、本発明は、列挙されたクレームの1以上からの1以上の限定、要素、節、および記述用語(descriptive terms)が、別のクレーム中へ導入される、すべての変動、組み合わせ、および順列を包括する。例えば、別のクレームに従属するいずれのクレームも、同じ基本クレームに従属するいずれか他のクレーム中に見出される1以上の限定を包含するように修飾され得る。要素が、例として、マーカッシュ群形式において列挙されたものとして提示されている場合、要素の各下位群もまた開示されており、いずれの要素(単数または複数)も群から除去され得る。一般に、本発明、または本発明の側面が、特定の要素および/または特長を含むとして見なされる場合、本発明のある態様または本発明のある側面は、かかる要素および/または特長からなるか、または実質的にそれからなると理解されるべきである。簡潔さを目的として、それらの態様は、本明細書中、in haec verbaで具体的に表明されていない。用語「含むこと(comprising)」および「含有すること(containing)」が、オープンであることを意図し、追加の要素またはステップの包含を容認することにもまた留意する。範囲が与えられるとき、エンドポイントも包含される。しかも、別段の指示がないか、またはそれとは別に、文脈および当業者の理解から明らかでない場合に限り、範囲として表現された値は、いずれか具体的な値、または本発明の異なる態様において述べられた範囲内の部分範囲を、文脈が明確に別段の指図をしない限り範囲の下限の単位の10倍まで、想定し得る。 Moreover, the present invention encompasses all variations, combinations, and permutations in which one or more limitations, elements, clauses, and descriptive terms from one or more of the enumerated claims are introduced into another claim. For example, any claim that is dependent on another claim may be modified to include one or more limitations found in any other claim that is dependent on the same base claim. Where elements are presented as being enumerated in Markush group format, as an example, each subgroup of elements is also disclosed, and any element or elements may be removed from the group. In general, when the invention, or aspects of the invention, are described as including certain elements and/or features, it should be understood that an embodiment of the invention or an aspect of the invention consists of, or consists essentially of, such elements and/or features. For purposes of brevity, those embodiments have not been specifically recited in haec verba herein. It is also noted that the terms "comprising" and "containing" are intended to be open and permit the inclusion of additional elements or steps. When ranges are given, the endpoints are also included. Moreover, unless otherwise indicated or otherwise clear from the context and the understanding of one of ordinary skill in the art, values expressed as ranges may assume any specific value or subrange within the ranges set forth in different aspects of the invention, up to 10 times the unit of the lower limit of the range, unless the context clearly dictates otherwise.

本出願は、種々の発行済み特許、公開特許出願、雑誌記事、および他の公刊物を参照し、これらのすべては参照によって本明細書に組み込まれる。組み込まれる参照のいずれかと本明細書との間に矛盾がある場合、本明細書がコントロールする(control)ものとする。加えて、先行技術に属する本発明のいずれか特定の態様は、クレームのいずれかの1以上からはっきりと除外され得る。かかる態様は当業者に知られていると思われるので、それらは、除外が本明細書においてはっきりと表明されていない場合であっても、除外され得る。本発明のいずれか特定の態様は、先行技術の存在に関するか否かにかかわらず、いずれかのクレームから、いずれかの理由で除外され得る。 This application makes reference to various issued patents, published patent applications, journal articles, and other publications, all of which are incorporated herein by reference. In the event of a conflict between any of the incorporated references and this specification, this specification shall control. In addition, any particular aspect of the present invention that is within the prior art may be expressly excluded from any one or more of the claims. Because such aspects would be known to those of skill in the art, they may be excluded even if the exclusion is not expressly stated herein. Any particular aspect of the present invention may be excluded from any claim for any reason, whether or not related to the existence of prior art.

当業者は、本明細書に記載の具体的な態様の多くの均等物を認識するか、またはせいぜいルーチンな実験法を使用して確かめる能力があるであろう。本明細書に記載の本態様の範囲は、上の記載に限定されることを意図せず、むしろ添付のクレームに表明されているとおりである。当業者は、以下のクレームにおいて定義されるとおり、本発明の精神または範囲から逸脱せずに、この記載への種々の変化および修飾がなされてもよいことを解するであろう。 Those of ordinary skill in the art will recognize, or be able to ascertain, at most using routine experimentation, many equivalents to the specific embodiments described herein. The scope of the embodiments described herein is not intended to be limited to the above description, but rather is as set forth in the appended claims. Those of ordinary skill in the art will appreciate that various changes and modifications to this description may be made without departing from the spirit or scope of the invention, as defined in the following claims.

Claims (24)

(i)プライム編集因子融合タンパク質のN末端フラグメントおよびNインテインを含むN末端エクステイン、またはN末端エクステインをコードするポリヌクレオチド;ならびに
(ii)プライム編集因子融合タンパク質のC末端フラグメントおよびC-インテインを含むC末端エクステイン、またはC末端エクステインをコードするポリヌクレオチド
を含むプライム編集系であって、
ここでN末端エクステインおよびC末端エクステインのN-インテインおよびC-インテインが、N末端フラグメントとC末端フラグメントとを連結してプライム編集因子融合タンパク質を形成するための自己切除が可能であり、ならびに
ここでプライム編集因子融合タンパク質が、核酸プログラム型DNA結合タンパク質(napDNAbp)ドメインおよび逆転写酵素(RT)ドメインを含む、前記プライム編集系。
(i) an N-terminal fragment of a prime editor fusion protein and an N-terminal extein comprising an N-intein, or a polynucleotide encoding an N-terminal extein; and
(ii) a C-terminal fragment of a primed editor fusion protein and a C-terminal extein comprising a C-intein, or a prime editing system comprising a polynucleotide encoding the C-terminal extein,
wherein the N-terminal extein and the C-terminal extein N-intein and C-intein are capable of self excision to join the N-terminal and C-terminal fragments to form a prime editor fusion protein; and said prime editing system, wherein the prime editor fusion protein comprises a nucleic acid-programmed DNA binding protein (napDNAbp) domain and a reverse transcriptase (RT) domain.
napDNAbpが、Cas9もしくはそのバリアント、Cas12a、Cas12b1、Cas12e、Cas12d、Cas13a、Cas12c、およびアルゴノートからなる群から選択されるか、および/またはニッカーゼ活性を有する、請求項1に記載のプライム編集系。 2. The prime editing system of claim 1, wherein napDNAbp is selected from the group consisting of Cas9 or variants thereof, Cas12a, Cas12b1, Cas12e, Cas12d, Cas13a, Cas12c, and Argonaute, and/or has nickase activity. Cas9が、配列番号18のアミノ酸2~1368と少なくとも80%の同一性を有するアミノ酸配列を含む、請求項2に記載のプライム編集系。 3. The prime editing system of claim 2, wherein Cas9 comprises an amino acid sequence having at least 80% identity with amino acids 2-1368 of SEQ ID NO:18. Cas9が、配列番号18と比較したとき、H840Aアミノ酸置換を含む、請求項3に記載のプライム編集系。 4. The prime editing system of Claim 3, wherein Cas9 comprises an H840A amino acid substitution when compared to SEQ ID NO:18. Cas9が、配列番号18と比較したとき、S1025C、E1026F、および/またはQ1027Nのアミノ酸置換をさらに含む、請求項4に記載のプライム編集系。 5. The prime editing system of claim 4, wherein Cas9 further comprises S1025C, E1026F, and/or Q1027N amino acid substitutions when compared to SEQ ID NO:18. RTが、トリ骨髄芽球症(myoblastosis)ウイルス(AMV)RT、モロニーマウス白血病ウイルス(M-MLV)RT、ヒト免疫不全ウイルス(HIV)鎖a RT、ヒト免疫不全ウイルス(HIV)鎖b RT、トリ肉腫・白血病ウイルス(ASLV)RT、ラウス肉腫ウイルス(RSV)RT、トリ骨髄芽球症(Myeloblastosis)ウイルス(AMV)RT、トリ赤芽球症ウイルス(AEV)ヘルパーウイルスMCAV RT、トリ骨髄球腫症ウイルスMC29ヘルパーウイルスMCAV RT、トリ細網内皮症ウイルス(REV-T)ヘルパーウイルスREV-A RT、トリ肉腫ウイルスUR2ヘルパーウイルスUR2AV RT、トリ肉腫ウイルスY73ヘルパーウイルスYAV RT、ラウス随伴ウイルス(RAV)RT、骨髄芽球症関連ウイルス(MAV)RT、ネコ白血病RT、カリフラワーモザイクウイルスRT、クレブシエラ肺炎RT、Escheria coli RT、Bacillus subtilis RT、Eubacterium rectaleサブグループIIイントロンRT、Geobacillus stearothermophillus RT、またはそのバリアントである、請求項1~5のいずれか一項に記載のプライム編集系。 RT is avian myoblastosis virus (AMV) RT, Moloney murine leukemia virus (M-MLV) RT, human immunodeficiency virus (HIV) chain a RT, human immunodeficiency virus (HIV) chain b RT, Avian sarcoma and leukemia virus (ASLV) RT, Rous sarcoma virus (RSV) RT, Avian Myeloblastosis virus (AMV) RT, Avian erythroblastosis virus (AEV) helper virus MCAV RT, Avian myelocytoma virus MC29 helper virus MCAV RT, avian reticuloendotheliosis virus (REV-T) helper virus REV-A RT, avian sarcoma virus UR2 helper virus UR2AV RT, avian sarcoma virus Y73 helper virus YAV RT, Rous-associated virus (RAV) RT, myeloblastosis-associated virus (MAV) RT, feline leukemia RT, cauliflower mosaic virus RT, Klebsiella pneumoniae RT, Escheria coli RT, Bacillus subtilis RT, Eubacterium rectale subgroup II intron RT, Geobacillus stearothermophillus RT, or variants thereof A prime editing system according to any one of claims 1 to 5, wherein the prime editing system is (i)バリアントM-MLV RTが、配列番号89と比較したとき、以下の突然変異:P51X、S67X、E69X、L139X、T197X、D200X、H204X、F209X、E302X、T306X、F309X、W313X、T330X、L345X、L435X、N454X、D524X、E562X、D583X、H594X、L603X、E607X、およびD653Xの1以上を含み、ここでXは、いずれかの他のアミノ酸の置換である;または
(ii)バリアントM-MLV RTが、配列番号89と比較したとき、以下の突然変異:P51L、S67K、E69K、L139P、T197A、D200N、H204R、F209N、E302K、E302R、T306K、F309N、W313F、T330P、L345G、L435G、N454K、D524G、E562Q、D583N、H594Q、L603W、E607K、およびD653Nの1以上を含む;または
(iii)バリアントM-MLV RTが、配列番号89と比較したとき、アミノ酸置換D200N、T330P、および/もしくはL603Wを含む;または
(iv)バリアントM-MLV RTが、配列番号89と比較したとき、アミノ酸置換D200N、T306K、W313F、T330P、およびL603Wを含む、請求項6に記載のプライム編集系。
(i) Variant M-MLV RT has the following mutations when compared to SEQ ID NO:89: P51X, S67X, E69X, L139X, T197X, D200X, H204X, F209X, E302X, T306X, F309X, W313X, T330X, L345X , L435X, N454X, D524X, E562X, D583X, H594X, L603X, E607X, and D653X, where X is a substitution of any other amino acid; or
(ii) variant M-MLV RT has the following mutations when compared to SEQ ID NO:89: P51L, S67K, E69K, L139P, T197A, D200N, H204R, F209N, E302K, E302R, T306K, F309N, W313F, T330P , L345G, L435G, N454K, D524G, E562Q, D583N, H594Q, L603W, E607K, and D653N; or
(iii) the variant M-MLV RT contains the amino acid substitutions D200N, T330P, and/or L603W when compared to SEQ ID NO:89; or
7. The prime editing system of claim 6, wherein (iv) variant M-MLV RT comprises amino acid substitutions D200N, T306K, W313F, T330P, and L603W when compared to SEQ ID NO:89.
逆転写酵素が、配列番号89もしくは配列番号122のアミノ酸配列と、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、または少なくとも99%の配列同一性を有するアミノ酸配列を含むか、あるいは
逆転写酵素が、配列番号122の配列を有する、請求項1~7のいずれか一項に記載のプライム編集系。
the reverse transcriptase comprises an amino acid sequence having at least 80%, at least 85%, at least 90%, at least 95%, or at least 99% sequence identity with the amino acid sequence of SEQ ID NO:89 or SEQ ID NO:122; or The prime editing system of any one of claims 1-7, wherein the reverse transcriptase has the sequence of SEQ ID NO:122.
逆転写酵素が、配列番号89と比較したときトランケートされているM-MLV RTのバリアントである、請求項1~8のいずれか一項に記載のプライム編集系。 9. The prime editing system of any one of claims 1-8, wherein the reverse transcriptase is a variant of M-MLV RT that is truncated when compared to SEQ ID NO:89. トランケートされているバリアントM-MLV RTが、
(i)C末端にてトランケートされており、かつ配列番号89のアミノ酸配列と比べたときD200N、T306K、W313F、および/もしくはT330Pの突然変異を含有する;または
(ii)配列番号766の配列を含む、請求項9に記載のプライム編集系。
The truncated variant M-MLV RT is
(i) is truncated at the C-terminus and contains the D200N, T306K, W313F, and/or T330P mutations when compared to the amino acid sequence of SEQ ID NO:89; or
10. The prime editing system of claim 9, comprising (ii) the sequence of SEQ ID NO:766.
N-インテインが、配列番号447と少なくとも80%の同一性を有するアミノ酸配列を含む、請求項1~10のいずれか一項に記載のプライム編集系。 11. The prime editing system of any one of claims 1-10, wherein the N-intein comprises an amino acid sequence having at least 80% identity with SEQ ID NO:447. Cインテインが、配列番号452と少なくとも80%の同一性を有するアミノ酸配列を含む、請求項1~11のいずれか一項に記載のプライム編集系。 12. The prime editing system of any one of claims 1-11, wherein the C-intein comprises an amino acid sequence having at least 80% identity to SEQ ID NO:452. 融合タンパク質が、構造NH2-[napDNAbp]-[逆転写酵素]-COOHを含み、ここで「]-[」の各場合が、任意のリンカー配列の存在を指し示している、請求項1~12のいずれか一項に記載のプライム編集系。 Claims 1-12, wherein the fusion protein comprises the structure NH2- [napDNAbp]-[reverse transcriptase]-COOH, wherein each occurrence of "]-[" indicates the presence of an optional linker sequence. A prime editing system according to any one of Claims 1 to 3. (i)プライム編集因子融合タンパク質のN末端フラグメントが、napDNAbpドメインの一部を含み、かつプライム編集因子融合タンパク質のC末端フラグメントが、napDNAbpドメインの一部とRTドメインとを含む;または
(ii)プライム編集因子融合タンパク質のN末端フラグメントが、napDNAbpドメインとRTドメインの一部とを含み、かつプライム編集因子融合タンパク質のC末端フラグメントが、RTドメインの一部を含む;または
(iii)プライム編集因子融合タンパク質のN末端フラグメントが、napDNAbpドメインとリンカー配列の一部とを含み、かつプライム編集因子融合タンパク質のC末端フラグメントが、リンカー配列の一部とRTドメインとを含む;または
(iv)プライム編集因子融合タンパク質のN末端フラグメントが、配列番号18のアミノ酸2~1024と少なくとも80%の同一性を有するアミノ酸配列を含み、ここでC末端フラグメントが、配列番号18のアミノ酸1025~1368と少なくとも80%の同一性を有するアミノ酸配列を含む、請求項13に記載のプライム編集系。
(i) the N-terminal fragment of the prime editor fusion protein comprises a portion of the napDNAbp domain and the C-terminal fragment of the prime editor fusion protein comprises a portion of the napDNAbp domain and the RT domain; or
(ii) the N-terminal fragment of the prime editor fusion protein comprises the napDNAbp domain and part of the RT domain, and the C-terminal fragment of the prime editor fusion protein comprises part of the RT domain; or
(iii) the N-terminal fragment of the prime editor fusion protein comprises the napDNAbp domain and part of the linker sequence, and the C-terminal fragment of the prime editor fusion protein comprises part of the linker sequence and the RT domain; or
(iv) the N-terminal fragment of the prime editor fusion protein comprises an amino acid sequence having at least 80% identity with amino acids 2-1024 of SEQ ID NO:18, wherein the C-terminal fragment comprises amino acids 1025-1025 of SEQ ID NO:18; 14. The prime editing system of claim 13, comprising an amino acid sequence having at least 80% identity with 1368.
(a)N末端エクステインが、配列番号3875で表されるアミノ酸配列と、少なくとも80%、85%、90%、95%、98%、または99%同一のアミノ酸配列を含む;および
(b)C末端エクステインが、配列番号3876で表されるアミノ酸配列と、少なくとも80%、85%、90%、95%、98%、または99%同一のアミノ酸配列を含む、請求項1~14のいずれか一項に記載のプライム編集系。
(a) the N-terminal extein comprises an amino acid sequence that is at least 80%, 85%, 90%, 95%, 98%, or 99% identical to the amino acid sequence represented by SEQ ID NO:3875; and
(b) the C-terminal extein comprises an amino acid sequence that is at least 80%, 85%, 90%, 95%, 98%, or 99% identical to the amino acid sequence represented by SEQ ID NO:3876, claims 1- 15. The prime editing system of any one of 14.
napDNAbpが、ニッカーゼ活性を有し、および
プライム編集系が、プライム編集ガイドRNA(PEgRNA)またはPEgRNAをコードするポリヌクレオチドをさらに含み、
ここでPEgRNAが、二本鎖標的DNA配列の第1鎖に対して相補領域を含むスペーサー配列、DNA合成鋳型とプライマー結合部位とを5'→3'配向に含む伸長アーム、およびnapDNAbpに結び付くgRNAコアを含み、
ここでプライマー結合部位が、二本鎖標的DNA配列の第2鎖中ニック部位の上流にある領域に対して相補領域を含み、
ここでDNA合成鋳型が、二本鎖標的DNA配列の第2鎖中ニック部位の下流にある領域に対して相補領域を含み、かつ二本鎖標的DNA配列と比較して1以上のヌクレオチド変化を含む、請求項1~15のいずれか一項に記載のプライム編集系。
the napDNAbp has nickase activity, and the prime editing system further comprises a prime editing guide RNA (PEgRNA) or a polynucleotide encoding the PEgRNA;
wherein the PE gRNA binds to a spacer sequence containing a region complementary to the first strand of a double-stranded target DNA sequence, an extension arm containing a DNA synthesis template and a primer binding site in a 5′→3′ orientation, and a napDNAbp. including the core,
wherein the primer binding site comprises a region complementary to a region upstream of the nick site in the second strand of the double-stranded target DNA sequence;
wherein the DNA synthesis template comprises a region complementary to a region downstream of the nick site in the second strand of the double-stranded target DNA sequence and has one or more nucleotide changes compared to the double-stranded target DNA sequence. A prime editing system according to any one of claims 1 to 15, comprising:
(i)スペーサー、伸長アーム、およびgRNAコアが、単一のRNA分子中にある;および/または
(ii)DNA合成鋳型が、長さが3ヌクレオチドから500ヌクレオチドまでであるか、もしくはDNA合成鋳型が、長さが8ヌクレオチドから31ヌクレオチドまでである;および/または
(iii)プライマー結合部位が、長さが8ヌクレオチドから15ヌクレオチドまでである;もしくは、プライマー結合部位が、長さが8ヌクレオチドから11ヌクレオチドまでであり、かつ約60%超のGC含量を含有する;もしくはプライマー結合部位が、長さが12ヌクレオチドから13ヌクレオチドまでであり、かつ約40~60%のGC含量を含む;もしくは、プライマー結合部位が、長さが14ヌクレオチドから15ヌクレオチドまでであり、かつ約40%未満のGC含量を含有する;もしくは、プライマー結合部位が、長さが3ヌクレオチドから20ヌクレオチドまでである;もしくは、プライマー結合部位が、長さが7ヌクレオチドから17ヌクレオチドまでである、請求項16に記載のプライム編集系。
(i) the spacer, extension arms, and gRNA core are in a single RNA molecule; and/or
(ii) the DNA synthesis template is from 3 nucleotides to 500 nucleotides in length, or the DNA synthesis template is from 8 nucleotides to 31 nucleotides in length; and/or
(iii) the primer binding site is from 8 to 15 nucleotides in length; or the primer binding site is from 8 to 11 nucleotides in length and contains a GC content of greater than about 60%; or the primer binding site is 12 to 13 nucleotides in length and contains a GC content of about 40-60%; or the primer binding site is 14 to 15 nucleotides in length; and contains less than about 40% GC content; or the primer binding site is from 3 to 20 nucleotides in length; or the primer binding site is from 7 to 17 nucleotides in length. 17. The prime editing system of claim 16.
N末端エクステインをコードするポリヌクレオチドが、第1ベクターの一部であり、および
C末端エクステインをコードするポリヌクレオチドが、第2ベクターの一部である、請求項1~17のいずれか一項に記載のプライム編集系
a polynucleotide encoding the N-terminal extein is part of the first vector, and
A primed editing system according to any one of claims 1 to 17, wherein the polynucleotide encoding the C-terminal extein is part of a second vector.
第1ベクターおよび/または第2ベクターが、ウイルスベクターである、請求項18に記載のプライム編集系。 19. The primed editing system of claim 18, wherein the first vector and/or the second vector are viral vectors. ウイルスベクターが、アデノウイルスベクター、アデノ随伴ウイルス(AAV)ベクター、レンチウイルス、および単純ヘルペスウイルスからなる群から選択されるか、および/または
第1ベクターもしくは第2ベクターが、プライム編集ガイドRNA(PEgRNA)をコードするポリヌクレオチドをさらに含む、請求項19に記載のプライム編集系。
The viral vector is selected from the group consisting of adenoviral vectors, adeno-associated viral (AAV) vectors, lentiviruses, and herpes simplex viruses; and/or the first vector or the second vector comprises prime editing guide RNA (PEgRNA 20. The primed editing system of claim 19, further comprising a polynucleotide encoding ).
請求項1~20のいずれか一項に記載のプライム編集系を含む、医薬組成物。 A pharmaceutical composition comprising a prime editing system according to any one of claims 1-20. 第1アデノ随伴ウイルス(AAV)ベクターおよび第2AAVベクターを含む医薬組成物であって、
ここで第1AAVベクターが、プライム編集因子融合タンパク質のN末端フラグメントとN-インテインとを含むN末端エクステインをコードする;
ここで第2AAVベクターが、プライム編集因子融合タンパク質のC末端フラグメントとC-インテインとを含むC末端エクステインをコードする;
ここでN末エクステインおよびC末端エクステインのN-インテインおよびC-インテインが、N末端フラグメントとC末端フラグメントとを連結してプライム編集因子融合タンパク質を形成するための自己切除が可能であり、ならびに
ここでプライム編集因子融合タンパク質が、核酸プログラム型DNA結合タンパク質 (napDNAbp)ドメインおよびポリメラーゼドメインを含む、前記医薬組成物。
A pharmaceutical composition comprising a first adeno-associated viral (AAV) vector and a second AAV vector,
wherein the first AAV vector encodes an N-terminal extein comprising an N-terminal fragment of the primed editor fusion protein and an N-intein;
wherein the second AAV vector encodes a C-terminal extein comprising a C-terminal fragment of the primed editor fusion protein and a C-intein;
wherein the N-terminal extein and the C-terminal extein N-intein and C-intein are capable of self excision to join the N-terminal and C-terminal fragments to form a prime editor fusion protein; and said pharmaceutical composition, wherein the primed editor fusion protein comprises a nucleic acid-programmed DNA binding protein (napDNAbp) domain and a polymerase domain.
第1AAVベクターまたは第2AAVベクターが、プライム編集ガイドRNA(PEgRNA)をコードするポリヌクレオチドをさらに含む、請求項22に記載の医薬組成物。 23. The pharmaceutical composition of claim 22, wherein the first AAV vector or the second AAV vector further comprises a polynucleotide encoding prime editing guide RNA (PEgRNA). 細胞中の二本鎖標的DNA配列を編集するための方法であって、方法が、細胞を、
第1分裂インテイン配列と融合したプライム編集因子融合タンパク質のN末端フラグメントをコードする第1発現ベクター;および
第2分裂インテイン配列と融合したプライム編集因子融合タンパク質のC末端フラグメントをコードする第2発現ベクター
と接触させることを含む;
ここで第1分裂インテイン配列および第2分裂インテイン配列が、N末端フラグメントとC末端フラグメントとを連結してプライム編集因子融合タンパク質を形成するための自己切除が可能であり、
ここでプライム編集因子融合タンパク質が、ニッカーゼ活性を有する核酸プログラム型DNA結合タンパク質(napDNAbp)ドメインおよび逆転写酵素ドメインを含み、ならびに
ここで第1発現ベクターまたは第2発現ベクターが、プライム編集因子ガイドRNA(PEgRNA)をコードするポリヌクレオチドをさらに含み、
ここでPEgRNAが、
(i)二本鎖標的DNA配列の第1鎖に対する相補領域を含むスペーサー配列;
(ii)DNA合成鋳型およびプライマー結合部位を5'→3'配向に含む伸長アーム(ここでプライマー結合部位が、二本鎖標的DNA配列の第2鎖中ニック部位の上流にある領域に対する相補領域を含み、およびここでDNA合成鋳型が、二本鎖標的DNA配列の第2鎖中のニック部位の下流にある領域と比較したとき、1以上のヌクレオチド変化をコードしている);および
(iii)napDNAbpと相互作用するgRNAコア
を含む;
ここで接触させることが、以下をもたらす:
二本鎖標的DNA配列の第2鎖にニックを入れて、ニック部位にて遊離の3'末端を形成する;
二本鎖標的DNA配列の第2鎖のニック部位の上流にある領域とアニーリングする;
DNA合成鋳型によってコードされるDNAの単一鎖を、二本鎖標的DNA配列の第2鎖の遊離の3'末端から合成する;および
二本鎖標的DNA配列の第2鎖中ニック部位の下流にある領域を、DNAの単一鎖と置き換え、それによって二本鎖標的DNA配列が編集される、前記方法。
A method for editing a double-stranded target DNA sequence in a cell, the method comprising:
a first expression vector encoding the N-terminal fragment of the prime editor fusion protein fused to the first division intein sequence; and a second expression vector encoding the C-terminal fragment of the prime editor fusion protein fused to the second division intein sequence including contact with;
wherein the first split intein sequence and the second split intein sequence are capable of self excision to join the N-terminal and C-terminal fragments to form a prime editor fusion protein;
wherein the prime editor fusion protein comprises a nucleic acid-programmed DNA binding protein (napDNAbp) domain with nickase activity and a reverse transcriptase domain, and wherein the first expression vector or the second expression vector comprises the prime editor guide RNA further comprising a polynucleotide encoding (PEgRNA);
where PEgRNA is
(i) a spacer sequence containing a complementary region to the first strand of a double-stranded target DNA sequence;
(ii) an extension arm containing a DNA synthesis template and a primer binding site in a 5' to 3' orientation, where the primer binding site is complementary to the region upstream of the nick site in the second strand of the double-stranded target DNA sequence; and wherein the DNA synthesis template encodes one or more nucleotide changes when compared to the region downstream of the nick site in the second strand of the double-stranded target DNA sequence); and
(iii) contains a gRNA core that interacts with napDNAbp;
Contact here results in:
nicking the second strand of a double-stranded target DNA sequence to form a free 3' end at the nick site;
anneal to the region upstream of the nick site of the second strand of the double-stranded target DNA sequence;
A single strand of DNA encoded by a DNA synthesis template is synthesized from the free 3' end of the second strand of a double-stranded target DNA sequence; and downstream of a nick site in the second strand of a double-stranded target DNA sequence. is replaced with a single strand of DNA, whereby a double-stranded target DNA sequence is edited.
JP2021556876A 2019-03-19 2020-03-19 Editing Methods and Compositions for Editing Nucleotide Sequences Pending JP2022527740A (en)

Applications Claiming Priority (23)

Application Number Priority Date Filing Date Title
US201962820813P 2019-03-19 2019-03-19
US62/820,813 2019-03-19
US201962858958P 2019-06-07 2019-06-07
US62/858,958 2019-06-07
US201962922654P 2019-08-21 2019-08-21
US201962889996P 2019-08-21 2019-08-21
US62/889,996 2019-08-21
US62/922,654 2019-08-21
US201962973558P 2019-10-10 2019-10-10
US201962913553P 2019-10-10 2019-10-10
US62/973,558 2019-10-10
US62/913,553 2019-10-10
US201962931195P 2019-11-05 2019-11-05
US62/931,195 2019-11-05
US201962944231P 2019-12-05 2019-12-05
US201962974537P 2019-12-05 2019-12-05
US62/944,231 2019-12-05
US62/974,537 2019-12-05
US202062991069P 2020-03-17 2020-03-17
US202063100548P 2020-03-17 2020-03-17
US63/100,548 2020-03-17
US62/991,069 2020-03-17
PCT/US2020/023725 WO2020191243A1 (en) 2019-03-19 2020-03-19 Methods and compositions for editing nucleotide sequences

Publications (2)

Publication Number Publication Date
JP2022527740A JP2022527740A (en) 2022-06-06
JPWO2020191243A5 true JPWO2020191243A5 (en) 2024-04-08

Family

ID=72519164

Family Applications (4)

Application Number Title Priority Date Filing Date
JP2021556876A Pending JP2022527740A (en) 2019-03-19 2020-03-19 Editing Methods and Compositions for Editing Nucleotide Sequences
JP2021556862A Pending JP2022526908A (en) 2019-03-19 2020-03-19 Editing Methods and Compositions for Editing Nucleotide Sequences
JP2021556865A Pending JP2022531539A (en) 2019-03-19 2020-03-19 Editing Methods and Compositions for Editing Nucleotide Sequences
JP2021556867A Pending JP2022532470A (en) 2019-03-19 2020-03-19 Editing Methods and Compositions for Editing Nucleotide Sequences

Family Applications After (3)

Application Number Title Priority Date Filing Date
JP2021556862A Pending JP2022526908A (en) 2019-03-19 2020-03-19 Editing Methods and Compositions for Editing Nucleotide Sequences
JP2021556865A Pending JP2022531539A (en) 2019-03-19 2020-03-19 Editing Methods and Compositions for Editing Nucleotide Sequences
JP2021556867A Pending JP2022532470A (en) 2019-03-19 2020-03-19 Editing Methods and Compositions for Editing Nucleotide Sequences

Country Status (13)

Country Link
US (9) US20230078265A1 (en)
EP (4) EP3942041A1 (en)
JP (4) JP2022527740A (en)
KR (2) KR20210142210A (en)
CN (4) CN113891936A (en)
AU (2) AU2020240109A1 (en)
CA (2) CA3130488A1 (en)
DE (3) DE112020001339T5 (en)
GB (3) GB2601618A (en)
IL (2) IL286324A (en)
MX (2) MX2021011426A (en)
SG (2) SG11202109679VA (en)
WO (12) WO2020191249A1 (en)

Families Citing this family (151)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150044192A1 (en) 2013-08-09 2015-02-12 President And Fellows Of Harvard College Methods for identifying a target site of a cas9 nuclease
US9340799B2 (en) 2013-09-06 2016-05-17 President And Fellows Of Harvard College MRNA-sensing switchable gRNAs
US9840699B2 (en) 2013-12-12 2017-12-12 President And Fellows Of Harvard College Methods for nucleic acid editing
WO2016022363A2 (en) 2014-07-30 2016-02-11 President And Fellows Of Harvard College Cas9 proteins including ligand-dependent inteins
US20190225955A1 (en) 2015-10-23 2019-07-25 President And Fellows Of Harvard College Evolved cas9 proteins for gene editing
KR102547316B1 (en) 2016-08-03 2023-06-23 프레지던트 앤드 펠로우즈 오브 하바드 칼리지 Adenosine nucleobase editing agents and uses thereof
AU2017308889B2 (en) 2016-08-09 2023-11-09 President And Fellows Of Harvard College Programmable Cas9-recombinase fusion proteins and uses thereof
US11542509B2 (en) 2016-08-24 2023-01-03 President And Fellows Of Harvard College Incorporation of unnatural amino acids into proteins using base editing
KR20240007715A (en) 2016-10-14 2024-01-16 프레지던트 앤드 펠로우즈 오브 하바드 칼리지 Aav delivery of nucleobase editors
US10745677B2 (en) 2016-12-23 2020-08-18 President And Fellows Of Harvard College Editing of CCR5 receptor gene to protect against HIV infection
US11898179B2 (en) 2017-03-09 2024-02-13 President And Fellows Of Harvard College Suppression of pain by gene editing
EP3592777A1 (en) 2017-03-10 2020-01-15 President and Fellows of Harvard College Cytosine to guanine base editor
US11268082B2 (en) 2017-03-23 2022-03-08 President And Fellows Of Harvard College Nucleobase editors comprising nucleic acid programmable DNA binding proteins
US11560566B2 (en) 2017-05-12 2023-01-24 President And Fellows Of Harvard College Aptazyme-embedded guide RNAs for use with CRISPR-Cas9 in genome editing and transcriptional activation
US9982279B1 (en) 2017-06-23 2018-05-29 Inscripta, Inc. Nucleic acid-guided nucleases
US20190002874A1 (en) 2017-06-30 2019-01-03 Inscripta, Inc. Cell libraries created using rationally designed nucleic acids
US20220177957A1 (en) * 2020-12-07 2022-06-09 Inscripta, Inc. gRNA STABILIZATION IN NUCLEIC ACID-GUIDED NICKASE EDITING
WO2019023680A1 (en) 2017-07-28 2019-01-31 President And Fellows Of Harvard College Methods and compositions for evolving base editors using phage-assisted continuous evolution (pace)
WO2019139645A2 (en) 2017-08-30 2019-07-18 President And Fellows Of Harvard College High efficiency base editors comprising gam
WO2019051097A1 (en) 2017-09-08 2019-03-14 The Regents Of The University Of California Rna-guided endonuclease fusion polypeptides and methods of use thereof
US11795443B2 (en) 2017-10-16 2023-10-24 The Broad Institute, Inc. Uses of adenosine base editors
US10557216B2 (en) 2018-04-24 2020-02-11 Inscripta, Inc. Automated instrumentation for production of T-cell receptor peptide libraries
US10858761B2 (en) 2018-04-24 2020-12-08 Inscripta, Inc. Nucleic acid-guided editing of exogenous polynucleotides in heterologous cells
CA3130488A1 (en) 2019-03-19 2020-09-24 David R. Liu Methods and compositions for editing nucleotide sequences
CN109913485A (en) * 2019-03-25 2019-06-21 南京农业大学 A method of it prepares, purify HOPS complex proteins
US11001831B2 (en) 2019-03-25 2021-05-11 Inscripta, Inc. Simultaneous multiplex genome editing in yeast
WO2020247587A1 (en) 2019-06-06 2020-12-10 Inscripta, Inc. Curing for recursive nucleic acid-guided cell editing
WO2021072328A1 (en) 2019-10-10 2021-04-15 The Broad Institute, Inc. Methods and compositions for prime editing rna
US20220411768A1 (en) * 2019-10-21 2022-12-29 The Trustees Of Columbia University In The City Of New York Methods of performing rna templated genome editing
AU2020369599A1 (en) * 2019-10-23 2022-05-12 Monsanto Technology Llc Compositions and methods for RNA-templated editing in plants
WO2021082830A1 (en) * 2019-11-01 2021-05-06 中国科学院遗传与发育生物学研究所 Method for targeted modification of sequence of plant genome
WO2021092204A1 (en) * 2019-11-05 2021-05-14 Spotlight Therapeutics Methods and compositions for nucleic acid-guided nuclease cell targeting screen
MX2022005328A (en) * 2019-11-05 2022-07-21 Pairwise Plants Services Inc Compositions and methods for rna-encoded dna-replacement of alleles.
WO2021102059A1 (en) 2019-11-19 2021-05-27 Inscripta, Inc. Methods for increasing observed editing in bacteria
AU2020407048A1 (en) 2019-12-18 2022-06-09 Inscripta, Inc. Cascade/dCas3 complementation assays for in vivo detection of nucleic acid-guided nuclease edited cells
WO2021138469A1 (en) * 2019-12-30 2021-07-08 The Broad Institute, Inc. Genome editing using reverse transcriptase enabled and fully active crispr complexes
WO2021188840A1 (en) * 2020-03-19 2021-09-23 Rewrite Therapeutics, Inc. Methods and compositions for directed genome editing
US20210332388A1 (en) 2020-04-24 2021-10-28 Inscripta, Inc. Compositions, methods, modules and instruments for automated nucleic acid-guided nuclease editing in mammalian cells
GB2614813A (en) 2020-05-08 2023-07-19 Harvard College Methods and compositions for simultaneous editing of both strands of a target double-stranded nucleotide sequence
WO2022006042A1 (en) * 2020-06-29 2022-01-06 President And Fellows Of Harvard College Methods, compositions, and kits for nucleic acid barcoding of biomolecules
EP4180460A1 (en) * 2020-07-10 2023-05-17 Institute Of Zoology, Chinese Academy Of Sciences System and method for editing nucleic acid
US20220033855A1 (en) * 2020-07-30 2022-02-03 Inscripta, Inc. Arrayed nucleic acid-guided nuclease or nickase fusion editing
EP4176058A1 (en) * 2020-08-07 2023-05-10 The Jackson Laboratory Targeted sequence insertion compositions and methods
IL300516A (en) 2020-08-13 2023-04-01 Sana Biotechnology Inc Methods of treating sensitized patients with hypoimmunogenic cells, and associated methods and compositions
EP4214314A1 (en) 2020-09-15 2023-07-26 Inscripta, Inc. Crispr editing to embed nucleic acid landing pads into genomes of live cells
JP2023543803A (en) * 2020-09-24 2023-10-18 ザ ブロード インスティテュート,インコーポレーテッド Prime Editing Guide RNA, its composition, and its uses
KR20230075420A (en) * 2020-09-29 2023-05-31 기초과학연구원 Prime editing using HIV reverse transcriptase and CAS9 or variants thereof
JP2023543602A (en) * 2020-10-06 2023-10-17 キージーン ナムローゼ フェンノートシャップ Targeted sequence addition
JP2023545850A (en) * 2020-10-15 2023-10-31 アヴォサイト, インコーポレイテッド Recombinant adeno-associated virus vector with CD14 promoter and its use
US20220145293A1 (en) 2020-10-21 2022-05-12 Massachusetts Institute Of Technology Systems, methods, and compositions for site-specific genetic engineering using programmable addition via site-specific targeting elements (paste)
KR20230111189A (en) * 2020-10-23 2023-07-25 더 브로드 인스티튜트, 인코퍼레이티드 Reprogrammable ISCB nuclease and uses thereof
WO2022098765A1 (en) * 2020-11-03 2022-05-12 The Board Of Trustees Of The University Of Illinois Split prime editing platforms
EP4240840A1 (en) * 2020-11-05 2023-09-13 University of Washington Precise genome deletion and replacement method based on prime editing
WO2022098993A2 (en) * 2020-11-06 2022-05-12 Pairwise Plants Services, Inc. Compositions and methods for rna-encoded dna-replacement of alleles
CN117120621A (en) * 2020-11-12 2023-11-24 上海科技大学 Efficiency and accuracy-enhanced genome editing
CN114480330A (en) * 2020-11-13 2022-05-13 广州达安基因股份有限公司 Reverse transcriptase mutant with multiple mutation sites
CN112626049B (en) * 2020-12-14 2022-04-01 安徽省农业科学院水稻研究所 SpCas9-NRRH mutant for recognizing specific sites in rice gene targeting and application thereof
JP2024503437A (en) * 2021-01-11 2024-01-25 ザ ブロード インスティテュート,インコーポレーテッド Prime editing factor variants, constructs, and methods to improve prime editing efficiency and accuracy
CN112708605A (en) * 2021-01-14 2021-04-27 中山大学 Proteome obtained by splitting Cas9 protein and application thereof
EP4277986A1 (en) * 2021-01-15 2023-11-22 4M Genomics Inc. Polypeptide fusions or conjugates for gene editing
KR20220106079A (en) * 2021-01-21 2022-07-28 한국생명공학연구원 Genome replacement and insertion technology using reverse transcriptase based on Francisella novicida Cas9 module
WO2022170058A1 (en) * 2021-02-05 2022-08-11 University Of Massachusetts Prime editor system for in vivo genome editing
EP4291202A1 (en) * 2021-02-09 2023-12-20 The Broad Institute Inc. Nuclease-guided non-ltr retrotransposons and uses thereof
US11884924B2 (en) * 2021-02-16 2024-01-30 Inscripta, Inc. Dual strand nucleic acid-guided nickase editing
WO2022182786A1 (en) * 2021-02-23 2022-09-01 University Of Massachusetts Genome editing for treating muscular dystrophy
WO2022204476A1 (en) 2021-03-26 2022-09-29 The Board Of Regents Of The University Of Texas System Nucleotide editing to reframe dmd transcripts by base editing and prime editing
EP4314257A1 (en) * 2021-04-01 2024-02-07 Prime Medicine, Inc. Methods and compositions for editing nucleotide sequences
CN115161316A (en) * 2021-04-02 2022-10-11 上海科技大学 Guide editing tool, fusion RNA and application thereof
WO2022214522A2 (en) * 2021-04-07 2022-10-13 Astrazeneca Ab Compositions and methods for site-specific modification
WO2022234051A1 (en) * 2021-05-06 2022-11-10 Universität Zürich Split prime editing enzyme
WO2022242660A1 (en) * 2021-05-17 2022-11-24 Wuhan University System and methods for insertion and editing of large nucleic acid fragments
EP4349979A1 (en) 2021-05-27 2024-04-10 Institute Of Zoology, Chinese Academy Of Sciences Engineered cas12i nuclease, effector protein and use thereof
EP4347805A1 (en) 2021-05-27 2024-04-10 Astrazeneca AB Cas9 effector proteins with enhanced stability
CA3219487A1 (en) 2021-05-28 2022-12-01 Richard C. Mulligan Lipid particles containing a truncated baboon endogenous retrovirus (baev) envelope glycoprotein and related methods and uses
TW202313971A (en) * 2021-06-01 2023-04-01 美商喬木生物技術公司 Gene editing systems comprising a crispr nuclease and uses thereof
AU2022283964A1 (en) * 2021-06-03 2023-12-21 Prime Medicine, Inc. Genome editing compositions and methods for treatment of wilson's disease
WO2022261509A1 (en) 2021-06-11 2022-12-15 The Broad Institute, Inc. Improved cytosine to guanine base editors
WO2022265965A1 (en) * 2021-06-14 2022-12-22 10X Genomics, Inc. Reverse transcriptase variants for improved performance
WO2023283092A1 (en) * 2021-07-06 2023-01-12 Prime Medicine, Inc. Compositions and methods for efficient genome editing
US20230167487A2 (en) 2021-07-12 2023-06-01 Labsimply, Inc. Crispr cascade assay
WO2023288332A2 (en) * 2021-07-16 2023-01-19 Prime Medicine, Inc. Genome editing compositions and methods for treatment of wilson's disease
WO2023004439A2 (en) * 2021-07-23 2023-01-26 Prime Medicine, Inc. Genome editing compositions and methods for treatment of chronic granulomatous disease
WO2023015318A2 (en) * 2021-08-05 2023-02-09 Prime Medicine, Inc. Genome editing compositions and methods for treatment of cystic fibrosis
AU2022325166A1 (en) * 2021-08-06 2024-02-08 President And Fellows Of Harvard College Improved prime editors and methods of use
AU2022325955A1 (en) 2021-08-11 2024-02-08 Sana Biotechnology, Inc. Genetically modified cells for allogeneic cell therapy to reduce instant blood mediated inflammatory reactions
WO2023019229A1 (en) 2021-08-11 2023-02-16 Sana Biotechnology, Inc. Genetically modified primary cells for allogeneic cell therapy
WO2023019226A1 (en) 2021-08-11 2023-02-16 Sana Biotechnology, Inc. Genetically modified cells for allogeneic cell therapy
WO2023019227A1 (en) 2021-08-11 2023-02-16 Sana Biotechnology, Inc. Genetically modified cells for allogeneic cell therapy to reduce complement-mediated inflammatory reactions
WO2023028180A2 (en) * 2021-08-24 2023-03-02 Prime Medicine, Inc. Genome editing compositions and methods for treatment of retinopathy
CA3231677A1 (en) * 2021-09-08 2023-03-16 Flagship Pioneering Innovations Vi, Llc Methods and compositions for modulating a genome
WO2023039435A2 (en) * 2021-09-08 2023-03-16 Flagship Pioneering Innovations Vi, Llc Pah-modulating compositions and methods
AU2022343300A1 (en) * 2021-09-10 2024-04-18 Agilent Technologies, Inc. Guide rnas with chemical modification for prime editing
WO2023049931A1 (en) * 2021-09-27 2023-03-30 The Trustees Of Columbia University In The City Of New York Methods and systems for modifying the crumbs homologue-1 (crb1) gene
WO2023044545A1 (en) * 2021-09-27 2023-03-30 The Florey Institute Of Neuroscience And Mental Health Compositions and methods for the treatment of pcdh19 related disorders
GB202113933D0 (en) * 2021-09-29 2021-11-10 Genome Res Ltd Methods for gene editing
WO2023070110A2 (en) * 2021-10-21 2023-04-27 Prime Medicine, Inc. Genome editing compositions and methods for treatment of retinitis pigmentosa
WO2023070062A2 (en) * 2021-10-21 2023-04-27 Prime Medicine, Inc. Genome editing compositions and methods for treatment of usher syndrome type 3
WO2023069790A1 (en) 2021-10-22 2023-04-27 Sana Biotechnology, Inc. Methods of engineering allogeneic t cells with a transgene in a tcr locus and associated compositions and methods
WO2023076898A1 (en) * 2021-10-25 2023-05-04 The Broad Institute, Inc. Methods and compositions for editing a genome with prime editing and a recombinase
WO2023077148A1 (en) 2021-11-01 2023-05-04 Tome Biosciences, Inc. Single construct platform for simultaneous delivery of gene editing machinery and nucleic acid cargo
WO2023081787A2 (en) * 2021-11-04 2023-05-11 Prime Medicine, Inc. Genome editing compositions and methods for treatment of fanconi anemia
WO2023086805A2 (en) * 2021-11-09 2023-05-19 Sri International Platform using ipsc-derived cardiomyocytes carrying gene variants as models of cardiac disease and drug-response
WO2023097224A1 (en) * 2021-11-23 2023-06-01 The Broad Institute, Inc. Reprogrammable isrb nucleases and uses thereof
WO2023102550A2 (en) 2021-12-03 2023-06-08 The Broad Institute, Inc. Compositions and methods for efficient in vivo delivery
WO2023102538A1 (en) * 2021-12-03 2023-06-08 The Broad Institute, Inc. Self-assembling virus-like particles for delivery of prime editors and methods of making and using same
WO2023114090A2 (en) 2021-12-13 2023-06-22 Labsimply, Inc. Signal boost cascade assay
WO2023114052A1 (en) 2021-12-13 2023-06-22 Labsimply, Inc. Tuning cascade assay kinetics via molecular design
WO2023114473A2 (en) * 2021-12-16 2023-06-22 10X Genomics, Inc. Recombinant reverse transcriptase variants for improved performance
US20230287441A1 (en) 2021-12-17 2023-09-14 Massachusetts Institute Of Technology Programmable insertion approaches via reverse transcriptase recruitment
WO2023115041A1 (en) 2021-12-17 2023-06-22 Sana Biotechnology, Inc. Modified paramyxoviridae attachment glycoproteins
TW202342498A (en) 2021-12-17 2023-11-01 美商薩那生物科技公司 Modified paramyxoviridae fusion glycoproteins
WO2023122764A1 (en) 2021-12-22 2023-06-29 Tome Biosciences, Inc. Co-delivery of a gene editor construct and a donor template
WO2023133595A2 (en) 2022-01-10 2023-07-13 Sana Biotechnology, Inc. Methods of ex vivo dosing and administration of lipid particles or viral vectors and related systems and uses
WO2023141602A2 (en) 2022-01-21 2023-07-27 Renagade Therapeutics Management Inc. Engineered retrons and methods of use
WO2023150518A1 (en) 2022-02-01 2023-08-10 Sana Biotechnology, Inc. Cd3-targeted lentiviral vectors and uses thereof
WO2023150647A1 (en) 2022-02-02 2023-08-10 Sana Biotechnology, Inc. Methods of repeat dosing and administration of lipid particles or viral vectors and related systems and uses
WO2023150637A1 (en) * 2022-02-02 2023-08-10 Inscripta, Inc. Nucleic acid-guided nickase fusion proteins
WO2023150802A1 (en) * 2022-02-07 2023-08-10 Travin Bio, Inc. Methods and compositions for targeted delivery of intracellular biologics
KR20230121565A (en) * 2022-02-08 2023-08-18 주식회사 툴젠 A method for predicting off-targets which are cappable of occuring in process of genome editing by prime editing system
WO2023158836A1 (en) 2022-02-17 2023-08-24 Sana Biotechnology, Inc. Engineered cd47 proteins and uses thereof
WO2023166032A1 (en) * 2022-03-01 2023-09-07 Wageningen Universiteit Cas12a nickases
WO2023200406A2 (en) * 2022-04-14 2023-10-19 National University Of Singapore Method of detecting a polynucleotide analyte
WO2023205708A1 (en) * 2022-04-20 2023-10-26 Massachusetts Institute Of Technology SITE SPECIFIC GENETIC ENGINEERING UTILIZING TRANS-TEMPLATE RNAs
WO2023205687A1 (en) * 2022-04-20 2023-10-26 The Broad Institute, Inc. Improved prime editing methods and compositions
WO2023205744A1 (en) 2022-04-20 2023-10-26 Tome Biosciences, Inc. Programmable gene insertion compositions
WO2023212594A2 (en) * 2022-04-26 2023-11-02 University Of Massachusetts SINGLE pegRNA-MEDIATED LARGE INSERTIONS
WO2023205844A1 (en) * 2022-04-26 2023-11-02 Peter Maccallum Cancer Institute Nucleic acids and uses thereof
WO2023215831A1 (en) 2022-05-04 2023-11-09 Tome Biosciences, Inc. Guide rna compositions for programmable gene insertion
WO2023225670A2 (en) 2022-05-20 2023-11-23 Tome Biosciences, Inc. Ex vivo programmable gene insertion
WO2023232024A1 (en) * 2022-05-30 2023-12-07 Wuhan University System and methods for duplicating target fragments
KR102472344B1 (en) * 2022-05-31 2022-11-30 주식회사 엠케이바이오텍 Composition for treating alleviated hip dysplasia of dog using prime editors
CN114958767B (en) * 2022-06-02 2022-12-27 健颐生物科技发展(山东)有限公司 Preparation method of neural stem cell preparation constructed based on hiPSC cells
WO2023250174A1 (en) * 2022-06-23 2023-12-28 Prime Medicine, Inc. Split prime editors
CN115058451A (en) * 2022-06-23 2022-09-16 五邑大学 Double-reporting plasmid for homologous recombination and single base editing and construction method and application thereof
WO2024006762A1 (en) * 2022-06-27 2024-01-04 The Uab Research Foundation Nucleic acid probes and their uses for the detection of prevotella bivia
CN115148281B (en) * 2022-06-29 2023-07-14 广州源井生物科技有限公司 Automatic design method and system for gene editing point mutation scheme
CN115093470B (en) * 2022-06-30 2023-03-24 广州市乾相生物科技有限公司 Intein Mtu RecA mutant and application thereof in production of glutathione GSH
WO2024020346A2 (en) 2022-07-18 2024-01-25 Renagade Therapeutics Management Inc. Gene editing components, systems, and methods of use
WO2024020111A1 (en) * 2022-07-20 2024-01-25 Syntax Bio, Inc. Systems for cell programming and methods thereof
CN115331736B (en) * 2022-07-20 2023-07-25 佛山科学技术学院 Splicing method for extending high-throughput sequencing genes based on text matching
WO2024020587A2 (en) 2022-07-22 2024-01-25 Tome Biosciences, Inc. Pleiopluripotent stem cell programmable gene insertion
CN116064517A (en) * 2022-07-29 2023-05-05 之江实验室 Production mode of pilot editing gRNA and application thereof
WO2024038003A1 (en) * 2022-08-15 2024-02-22 Institut Pasteur Methods and systems for generating nucleic acid diversity in crispr-associated genes
WO2024044655A1 (en) 2022-08-24 2024-02-29 Sana Biotechnology, Inc. Delivery of heterologous proteins
WO2024044723A1 (en) 2022-08-25 2024-02-29 Renagade Therapeutics Management Inc. Engineered retrons and methods of use
WO2024042489A1 (en) 2022-08-25 2024-02-29 LifeEDIT Therapeutics, Inc. Chemical modification of guide rnas with locked nucleic acid for rna guided nuclease-mediated gene editing
WO2024064838A1 (en) 2022-09-21 2024-03-28 Sana Biotechnology, Inc. Lipid particles comprising variant paramyxovirus attachment glycoproteins and uses thereof
WO2024077267A1 (en) 2022-10-07 2024-04-11 The Broad Institute, Inc. Prime editing methods and compositions for treating triplet repeat disorders
CN116286738B (en) * 2023-02-03 2023-11-24 珠海舒桐医疗科技有限公司 DSB-PE gene editing system and application thereof
CN117363588A (en) * 2023-02-15 2024-01-09 中国农业科学院兰州兽医研究所 Preparation method and application of recombinant bluetongue virus expressing tetracysteine tag
CN116501703B (en) * 2023-06-27 2023-09-01 江铃汽车股份有限公司 Method and equipment for carrying out data merging processing on ADAMS analysis result

Family Cites Families (1834)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US381A (en) 1837-09-12 Samuel nicolsonj of bo
US13738A (en) 1855-10-30 eaton
US4217344A (en) 1976-06-23 1980-08-12 L'oreal Compositions containing aqueous dispersions of lipid spheres
US4235871A (en) 1978-02-24 1980-11-25 Papahadjopoulos Demetrios P Method of encapsulating biologically active materials in lipid vesicles
US4186183A (en) 1978-03-29 1980-01-29 The United States Of America As Represented By The Secretary Of The Army Liposome carriers in chemotherapy of leishmaniasis
US4182449A (en) 1978-04-18 1980-01-08 Kozlow William J Adhesive bandage and package
US4261975A (en) 1979-09-19 1981-04-14 Merck & Co., Inc. Viral liposome particle
US4663290A (en) 1982-01-21 1987-05-05 Molecular Genetics, Inc. Production of reverse transcriptase
US4485054A (en) 1982-10-04 1984-11-27 Lipoderm Pharmaceuticals Limited Method of encapsulating biologically active materials in multilamellar lipid vesicles (MLV)
US4501728A (en) 1983-01-06 1985-02-26 Technology Unlimited, Inc. Masking of liposomes from RES recognition
US4880635B1 (en) 1984-08-08 1996-07-02 Liposome Company Dehydrated liposomes
US4897355A (en) 1985-01-07 1990-01-30 Syntex (U.S.A.) Inc. N[ω,(ω-1)-dialkyloxy]- and N-[ω,(ω-1)-dialkenyloxy]-alk-1-yl-N,N,N-tetrasubstituted ammonium lipids and uses therefor
US5049386A (en) 1985-01-07 1991-09-17 Syntex (U.S.A.) Inc. N-ω,(ω-1)-dialkyloxy)- and N-(ω,(ω-1)-dialkenyloxy)Alk-1-YL-N,N,N-tetrasubstituted ammonium lipids and uses therefor
US4946787A (en) 1985-01-07 1990-08-07 Syntex (U.S.A.) Inc. N-(ω,(ω-1)-dialkyloxy)- and N-(ω,(ω-1)-dialkenyloxy)-alk-1-yl-N,N,N-tetrasubstituted ammonium lipids and uses therefor
US4797368A (en) 1985-03-15 1989-01-10 The United States Of America As Represented By The Department Of Health And Human Services Adeno-associated virus as eukaryotic expression vector
US4921757A (en) 1985-04-26 1990-05-01 Massachusetts Institute Of Technology System for delayed and pulsed release of biologically active substances
US4774085A (en) 1985-07-09 1988-09-27 501 Board of Regents, Univ. of Texas Pharmaceutical administration systems containing a mixture of immunomodulators
US5139941A (en) 1985-10-31 1992-08-18 University Of Florida Research Foundation, Inc. AAV transduction vectors
US4737323A (en) 1986-02-13 1988-04-12 Liposome Technology, Inc. Liposome extrusion method
US5017492A (en) 1986-02-27 1991-05-21 Life Technologies, Inc. Reverse transcriptase and method for its production
DE122007000007I1 (en) 1986-04-09 2007-05-16 Genzyme Corp Genetically transformed animals secreting a desired protein in milk
US5374553A (en) 1986-08-22 1994-12-20 Hoffmann-La Roche Inc. DNA encoding a thermostable nucleic acid polymerase enzyme from thermotoga maritima
US5079352A (en) 1986-08-22 1992-01-07 Cetus Corporation Purified thermostable enzyme
US4889818A (en) 1986-08-22 1989-12-26 Cetus Corporation Purified thermostable enzyme
US4837028A (en) 1986-12-24 1989-06-06 Liposome Technology, Inc. Liposomes with enhanced circulation time
US4920016A (en) 1986-12-24 1990-04-24 Linear Technology, Inc. Liposomes with enhanced circulation time
JPH0825869B2 (en) 1987-02-09 1996-03-13 株式会社ビタミン研究所 Antitumor agent-embedded liposome preparation
US4917951A (en) 1987-07-28 1990-04-17 Micro-Pak, Inc. Lipid vesicles formed of surfactants and steroids
US4911928A (en) 1987-03-13 1990-03-27 Micro-Pak, Inc. Paucilamellar lipid vesicles
JPH068256B2 (en) 1987-04-23 1994-02-02 エフ エム シー コーポレーション Insecticidal cyclopropyl-substituted di (aryl) compounds
US4873316A (en) 1987-06-23 1989-10-10 Biogen, Inc. Isolation of exogenous recombinant proteins from the milk of transgenic mammals
ES2065919T5 (en) 1987-12-15 2005-06-16 Gene Shears Pty Limited RIBOZIMAS.
US5244797B1 (en) 1988-01-13 1998-08-25 Life Technologies Inc Cloned genes encoding reverse transcriptase lacking rnase h activity
US4965185A (en) 1988-06-22 1990-10-23 Grischenko Valentin I Method for low-temperature preservation of embryos
US5223409A (en) 1988-09-02 1993-06-29 Protein Engineering Corp. Directed evolution of novel binding proteins
JP3771253B2 (en) 1988-09-02 2006-04-26 ダイアックス コープ. Generation and selection of novel binding proteins
US5047342A (en) 1989-08-10 1991-09-10 Life Technologies, Inc. Cloning and expression of T5 DNA polymerase
US5270179A (en) 1989-08-10 1993-12-14 Life Technologies, Inc. Cloning and expression of T5 DNA polymerase reduced in 3'- to-5' exonuclease activity
JP3058686B2 (en) 1989-08-31 2000-07-04 シティ・オブ・ホープ Chimeric DNA-RNA catalytically active sequence
US5264618A (en) 1990-04-19 1993-11-23 Vical, Inc. Cationic lipids for intracellular delivery of biologically active molecules
US5427908A (en) 1990-05-01 1995-06-27 Affymax Technologies N.V. Recombinant library screening methods
AU7979491A (en) 1990-05-03 1991-11-27 Vical, Inc. Intracellular delivery of biologically active substances by means of self-assembling lipid complexes
US5580737A (en) 1990-06-11 1996-12-03 Nexstar Pharmaceuticals, Inc. High-affinity nucleic acid ligands that discriminate between theophylline and caffeine
US5637459A (en) 1990-06-11 1997-06-10 Nexstar Pharmaceuticals, Inc. Systematic evolution of ligands by exponential enrichment: chimeric selex
DE69131321T2 (en) 1990-09-28 1999-12-16 Hoffmann La Roche MUTATIONS IN 5'-3'-EXONUCLEASE ACTIVITY OF THERMOSTABLE DNA POLYMERASES
AU8906091A (en) 1990-10-05 1992-04-28 Wayne M. Barnes Thermostable dna polymerase
ES2061416T3 (en) 1990-10-12 1997-03-01 Max Planck Gesellschaft MODIFIED RIBOZYMES.
US5173414A (en) 1990-10-30 1992-12-22 Applied Immune Sciences, Inc. Production of recombinant adeno-associated virus vectors
NZ241310A (en) 1991-01-17 1995-03-28 Gen Hospital Corp Trans-splicing ribozymes
NZ241311A (en) 1991-01-17 1995-03-28 Gen Hospital Corp Rna sequence having trans-splicing activity, plant strains
AU662148B2 (en) 1991-04-10 1995-08-24 Scripps Research Institute, The Heterodimeric receptor libraries using phagemids
DE4216134A1 (en) 1991-06-20 1992-12-24 Europ Lab Molekularbiolog SYNTHETIC CATALYTIC OLIGONUCLEOTIDE STRUCTURES
US6872816B1 (en) 1996-01-24 2005-03-29 Third Wave Technologies, Inc. Nucleic acid detection kits
US5652094A (en) 1992-01-31 1997-07-29 University Of Montreal Nucleozymes
JPH05274181A (en) 1992-03-25 1993-10-22 Nec Corp Setting/canceling system for break point
US5587308A (en) 1992-06-02 1996-12-24 The United States Of America As Represented By The Department Of Health & Human Services Modified adeno-associated virus vector capable of expression from a novel promoter
US5496714A (en) 1992-12-09 1996-03-05 New England Biolabs, Inc. Modification of protein by use of a controllable interveining protein sequence
US5834247A (en) 1992-12-09 1998-11-10 New England Biolabs, Inc. Modified proteins comprising controllable intervening protein sequences or their elements methods of producing same and methods for purification of a target protein comprised by a modified protein
US5434058A (en) 1993-02-09 1995-07-18 Arch Development Corporation Apolipoprotein B MRNA editing protein compositions and methods
US5436149A (en) 1993-02-19 1995-07-25 Barnes; Wayne M. Thermostable DNA polymerase with enhanced thermostability and enhanced length and efficiency of primer extension
KR960702518A (en) 1993-05-17 1996-04-27 린다 에스, 스티븐슨 RIBOZYME GENE THERAPY FOR HIV INFECTION AND AIDS
US5512462A (en) 1994-02-25 1996-04-30 Hoffmann-La Roche Inc. Methods and reagents for the polymerase chain reaction amplification of long DNA sequences
US5651981A (en) 1994-03-29 1997-07-29 Northwestern University Cationic phospholipids for transfection
US5912155A (en) 1994-09-30 1999-06-15 Life Technologies, Inc. Cloned DNA polymerases from Thermotoga neapolitana
US5614365A (en) 1994-10-17 1997-03-25 President & Fellow Of Harvard College DNA polymerase having modified nucleotide binding site for DNA sequencing
US5449639A (en) 1994-10-24 1995-09-12 Taiwan Semiconductor Manufacturing Company Ltd. Disposable metal anti-reflection coating process used together with metal dry/wet etch
US5767099A (en) 1994-12-09 1998-06-16 Genzyme Corporation Cationic amphiphiles containing amino acid or dervatized amino acid groups for intracellular delivery of therapeutic molecules
US6057153A (en) 1995-01-13 2000-05-02 Yale University Stabilized external guide sequences
US5795587A (en) 1995-01-23 1998-08-18 University Of Pittsburgh Stable lipid-comprising drug delivery complexes and methods for their production
US5830430A (en) 1995-02-21 1998-11-03 Imarx Pharmaceutical Corp. Cationic lipids and the use thereof
US5851548A (en) 1995-06-07 1998-12-22 Gen-Probe Incorporated Liposomes containing cationic lipids and vitamin D
US5773258A (en) 1995-08-25 1998-06-30 Roche Molecular Systems, Inc. Nucleic acid amplification using a reversibly inactivated thermostable enzyme
NO953680D0 (en) 1995-09-18 1995-09-18 Hans Prydz Cell cycle Enzymes
US5962313A (en) 1996-01-18 1999-10-05 Avigen, Inc. Adeno-associated virus vectors comprising a gene encoding a lyosomal enzyme
US6077705A (en) 1996-05-17 2000-06-20 Thomas Jefferson University Ribozyme-mediated gene replacement
US6887707B2 (en) 1996-10-28 2005-05-03 University Of Washington Induction of viral mutation by incorporation of miscoding ribonucleoside analogs into viral RNA
GB9701425D0 (en) 1997-01-24 1997-03-12 Bioinvent Int Ab A method for in vitro molecular evolution of protein function
US5981182A (en) 1997-03-13 1999-11-09 Albert Einstein College Of Medicine Of Yeshiva University Vector constructs for the selection and identification of open reading frames
US20040203109A1 (en) 1997-06-06 2004-10-14 Incyte Corporation Human regulatory proteins
US5849528A (en) 1997-08-21 1998-12-15 Incyte Pharmaceuticals, Inc.. Polynucleotides encoding a human S100 protein
US6355415B1 (en) 1997-09-29 2002-03-12 Ohio University Compositions and methods for the use of ribozymes to determine gene function
US6156509A (en) 1997-11-12 2000-12-05 Genencor International, Inc. Method of increasing efficiency of directed evolution of a gene using phagemid
US6429301B1 (en) 1998-04-17 2002-08-06 Whitehead Institute For Biomedical Research Use of a ribozyme to join nucleic acids and peptides
US6183998B1 (en) 1998-05-29 2001-02-06 Qiagen Gmbh Max-Volmer-Strasse 4 Method for reversible modification of thermostable enzymes
US8097648B2 (en) 1998-06-17 2012-01-17 Eisai R&D Management Co., Ltd. Methods and compositions for use in treating cancer
US6429298B1 (en) 1998-10-13 2002-08-06 Board Of Regents, The University Of Texas System Assays for identifying functional alterations in the p53 tumor suppressor
EP1829856A3 (en) 1998-11-12 2009-02-25 Invitrogen Corporation Transfection reagents
US6534261B1 (en) 1999-01-12 2003-03-18 Sangamo Biosciences, Inc. Regulation of endogenous gene expression in cells using zinc finger proteins
US7013219B2 (en) 1999-01-12 2006-03-14 Sangamo Biosciences, Inc. Regulation of endogenous gene expression in cells using zinc finger proteins
US6599692B1 (en) 1999-09-14 2003-07-29 Sangamo Bioscience, Inc. Functional genomics using zinc finger proteins
US6453242B1 (en) 1999-01-12 2002-09-17 Sangamo Biosciences, Inc. Selection of sites for targeting by zinc finger proteins and methods of designing zinc finger proteins to bind to preselected sites
US20090130718A1 (en) 1999-02-04 2009-05-21 Diversa Corporation Gene site saturation mutagenesis
WO2000058480A1 (en) 1999-03-29 2000-10-05 Kansai Technology Licensing Organization Co., Ltd. Novel cytidine deaminase
US6365410B1 (en) 1999-05-19 2002-04-02 Genencor International, Inc. Directed evolution of microorganisms
GB9920194D0 (en) 1999-08-27 1999-10-27 Advanced Biotech Ltd A heat-stable thermostable DNA polymerase for use in nucleic acid amplification
EP1230268B1 (en) 1999-11-18 2009-10-14 Pharmexa Inc. Heteroclitic analogs of class i epitopes
AU785007B2 (en) 1999-11-24 2006-08-24 Mcs Micro Carrier Systems Gmbh Polypeptides comprising multimers of nuclear localization signals or of protein transduction domains and their use for transferring molecules into cells
EP1236045B1 (en) 1999-12-06 2005-11-09 Sangamo Biosciences Inc. Methods of using randomized libraries of zinc finger proteins for the identification of gene function
ATE483970T1 (en) 2000-02-08 2010-10-15 Sangamo Biosciences Inc CELLS FOR DRUG DISCOVERY
US7378248B2 (en) 2000-03-06 2008-05-27 Rigel Pharmaceuticals, Inc. In vivo production of cyclic peptides for inhibiting protein-protein interaction
US7078208B2 (en) 2000-05-26 2006-07-18 Invitrogen Corporation Thermostable reverse transcriptases and uses thereof
US6573092B1 (en) 2000-10-10 2003-06-03 Genvec, Inc. Method of preparing a eukaryotic viral vector
CA2881568C (en) 2000-10-27 2019-09-24 Novartis Vaccines And Diagnostics, Inc. Nucleic acids and proteins from streptococcus groups a & b
KR100968128B1 (en) 2000-10-30 2010-07-06 유로-셀티크 소시에떼 아노뉨 Controlled release hydrocodone formulations
US20040003420A1 (en) 2000-11-10 2004-01-01 Ralf Kuhn Modified recombinase
US7067650B1 (en) 2000-11-22 2006-06-27 National Institute Of Advanced Industrial Science And Technology Ribozymes targeting bradeion transcripts and use thereof
AU2002227882B2 (en) 2001-01-25 2007-06-28 Evolva Ltd Concatemers of differentially expressed multiple genes
US20050222030A1 (en) 2001-02-21 2005-10-06 Anthony Allison Modified annexin proteins and methods for preventing thrombosis
ATE398180T1 (en) 2001-02-27 2008-07-15 Univ Rochester METHODS AND COMPOSITIONS FOR MODIFYING THE EDITING OF APOLIPOPROTEIN B MRNA
ES2271306T5 (en) 2001-03-19 2013-10-16 President And Fellows Of Harvard College Evolution of a new molecular function
US7678554B2 (en) 2001-03-19 2010-03-16 President And Fellows Of Harvard College Nucleic acid shuffling
US7476500B1 (en) 2001-03-19 2009-01-13 President And Fellows Of Harvard College In vivo selection system for enzyme activity
US7807408B2 (en) 2001-03-19 2010-10-05 President & Fellows Of Harvard College Directed evolution of proteins
DK2128246T3 (en) 2001-04-19 2014-05-12 Univ California Methods and compositions for the preparation of orthogonal tRNA-aminoacyl-tRNA synthetase pairs.
WO2002103028A2 (en) 2001-05-30 2002-12-27 Biomedical Center In silico screening for phenotype-associated expressed sequences
ATE432981T1 (en) 2001-07-26 2009-06-15 Stratagene California MULTI-SITE MUTAGENesis
US20030167533A1 (en) 2002-02-04 2003-09-04 Yadav Narendra S. Intein-mediated protein splicing
ES2421596T3 (en) 2002-05-10 2013-09-04 Medical Res Council Activation-induced deaminase (AID)
AU2003274397A1 (en) 2002-06-05 2003-12-22 University Of Florida Production of pseudotyped recombinant aav virions
US9388459B2 (en) 2002-06-17 2016-07-12 Affymetrix, Inc. Methods for genotyping
EP1578932A4 (en) 2002-07-12 2006-08-30 Affymetrix Inc Synthetic tag genes
WO2004016767A2 (en) 2002-08-19 2004-02-26 The President And Fellows Of Harvard College Evolving new molecular function
JP2006500030A (en) 2002-09-20 2006-01-05 イェール ユニバーシティ Riboswitch, method of using the same, and composition for use with riboswitch
US8017323B2 (en) 2003-03-26 2011-09-13 President And Fellows Of Harvard College Free reactant use in nucleic acid-templated synthesis
EP1613962B1 (en) 2003-04-14 2008-10-29 Caliper Life Sciences, Inc. Reduction of migration shift assay interference
US8017755B2 (en) 2003-05-23 2011-09-13 President And Fellows Of Harvard College RNA-based transcriptional regulators
US20050136429A1 (en) 2003-07-03 2005-06-23 Massachusetts Institute Of Technology SIRT1 modulation of adipogenesis and adipose function
AU2004267359B2 (en) 2003-07-07 2010-09-09 The Scripps Research Institute Compositions of orthogonal lysyl-tRNA and aminoacyl-tRNA synthetase pairs and uses thereof
EP1651660B1 (en) 2003-08-08 2018-01-24 Sangamo Therapeutics, Inc. Methods and compositions for targeted cleavage and recombination
US7670807B2 (en) 2004-03-10 2010-03-02 East Tennessee State Univ. Research Foundation RNA-dependent DNA polymerase from Geobacillus stearothermophilus
WO2005098043A2 (en) 2004-03-30 2005-10-20 The President And Fellows Of Harvard College Ligand-dependent protein splicing
US7595179B2 (en) 2004-04-19 2009-09-29 Applied Biosystems, Llc Recombinant reverse transcriptases
US7919277B2 (en) 2004-04-28 2011-04-05 Danisco A/S Detection and typing of bacterial strains
US7476734B2 (en) 2005-12-06 2009-01-13 Helicos Biosciences Corporation Nucleotide analogs
WO2006002547A1 (en) 2004-07-06 2006-01-12 UNIVERSITé DE SHERBROOKE A target-dependent nucleic acid adapter
US7851658B2 (en) 2004-08-17 2010-12-14 President And Fellows Of Harvard College Palladium-catalyzed carbon-carbon bond forming reactions
US8728526B2 (en) 2004-08-19 2014-05-20 The United States of America, Represented by Secretary of Department of Health and Human Services, NIH Coacervate microparticles useful for the sustained release administration of therapeutic agents
WO2006042112A2 (en) 2004-10-05 2006-04-20 California Institute Of Technology Aptamer regulated nucleic acids and uses thereof
US8178291B2 (en) 2005-02-18 2012-05-15 Monogram Biosciences, Inc. Methods and compositions for determining hypersusceptibility of HIV-1 to non-nucleoside reverse transcriptase inhibitors
JP2006248978A (en) 2005-03-10 2006-09-21 Mebiopharm Co Ltd New liposome preparation
DE602006013134D1 (en) 2005-06-17 2010-05-06 Harvard College ITERATED ADDRESSING REACTION TRANSACTIONS OF NUCLEIC ACID-MEDIATED CHEMISTRY
WO2007011722A2 (en) 2005-07-15 2007-01-25 President And Fellows Of Harvard College Reaction discovery system
US9783791B2 (en) 2005-08-10 2017-10-10 Agilent Technologies, Inc. Mutant reverse transcriptase and methods of use
AU2012244264B2 (en) 2005-08-26 2015-08-06 Dupont Nutrition Biosciences Aps Use
NZ597299A (en) 2005-08-26 2013-03-28 Dupont Nutrition Biosci Aps Use of a cas gene in combination with CRISPR repeats for modulating resistance in a cell
AU2015252023B2 (en) 2005-08-26 2017-06-29 Dupont Nutrition Biosciences Aps Use
US20080241917A1 (en) 2005-09-30 2008-10-02 Hidetaka Akita Vector For Delivering Target Substance Into Nucleus or Cell
KR100784478B1 (en) 2005-12-05 2007-12-11 한국과학기술원 A Prepartion method for a protein with new function through simultaneous incorporation of functional elements
US20080051317A1 (en) 2005-12-15 2008-02-28 George Church Polypeptides comprising unnatural amino acids, methods for their production and uses therefor
CA2960570C (en) 2006-05-05 2018-05-08 Molecular Transfer, Inc. Lipids for transfection of eukaryotic cells
ES2373586T3 (en) 2006-05-19 2012-02-06 Danisco A/S MARKED MICROORGANISMS AND METHODS TO MARK.
EP3045532A1 (en) 2006-06-02 2016-07-20 President and Fellows of Harvard College Protein surface remodeling
WO2007142202A1 (en) 2006-06-06 2007-12-13 Panasonic Corporation Method of modifying nucleotide chain
US7572618B2 (en) 2006-06-30 2009-08-11 Bristol-Myers Squibb Company Polynucleotides encoding novel PCSK9 variants
WO2008005529A2 (en) 2006-07-07 2008-01-10 The Trustees Columbia University In The City Of New York Cell-mediated directed evolution
US20120322861A1 (en) 2007-02-23 2012-12-20 Barry John Byrne Compositions and Methods for Treating Diseases
CN104531672B (en) 2007-03-02 2020-01-10 杜邦营养生物科学有限公司 Cultures with improved phage resistance
EP2137300B1 (en) 2007-04-26 2011-10-26 Ramot at Tel-Aviv University Ltd. Pluripotent autologous stem cells from oral or gastrointestinal mucosa
FI7694U1 (en) 2007-05-30 2007-11-30 Matti Koskinen Lure
WO2009002418A2 (en) 2007-06-21 2008-12-31 Merck & Co., Inc. T-cell peptide epitopes from carcinoembryonic antigen, immunogenic analogs, and uses thereof
FR2919804B1 (en) 2007-08-08 2010-08-27 Erytech Pharma COMPOSITION AND ANTI-TUMOR THERAPEUTIC VACCINE
US8307035B2 (en) 2007-08-31 2012-11-06 Lava Two, Llc Virtual Aggregation Processor for incorporating reverse path feedback into content delivered on a forward path
US8183221B2 (en) 2007-09-05 2012-05-22 Medtronic, Inc. Suppression of SCN9A gene expression and/or function for the treatment of pain
WO2009042163A2 (en) 2007-09-27 2009-04-02 Sangamo Biosciences, Inc. Rapid in vivo identification of biologically active nucleases
KR100949310B1 (en) 2007-11-21 2010-03-23 한국과학기술연구원 Method for detection of the interaction HBV capsid and surface proteins using cellular imaging, and screening method of inhibitory agent of HBV proliferation using thereof
US9029524B2 (en) 2007-12-10 2015-05-12 California Institute Of Technology Signal activated RNA interference
EP2087789A1 (en) 2008-02-06 2009-08-12 Heinrich-Heine-Universität Düsseldorf Fto-modified non-human mammal
CA2714378A1 (en) 2008-02-08 2009-08-13 Sangamo Biosciences, Inc. Treatment of chronic pain with zinc finger proteins
GB0806562D0 (en) 2008-04-10 2008-05-14 Fermentas Uab Production of nucleic acid
WO2009146179A1 (en) 2008-04-15 2009-12-03 University Of Iowa Research Foundation Zinc finger nuclease for the cftr gene and methods of use thereof
WO2009134808A2 (en) 2008-04-28 2009-11-05 President And Fellows Of Harvard College Supercharged proteins for cell penetration
US8394604B2 (en) 2008-04-30 2013-03-12 Paul Xiang-Qin Liu Protein splicing using short terminal split inteins
US8546553B2 (en) 2008-07-25 2013-10-01 University Of Georgia Research Foundation, Inc. Prokaryotic RNAi-like system and methods of use
FR2934346B1 (en) 2008-07-28 2010-09-03 Claude Benit VALVE FOR SANITARY INSTALLATION AND MULTIFUNCTION DEVICE FOR SANITARY APPARATUS COMPRISING SUCH A VALVE
JP2010033344A (en) 2008-07-29 2010-02-12 Azabu Jui Gakuen Method for expressing uneven distribution of nucleic acid constituent base
EP2159286A1 (en) 2008-09-01 2010-03-03 Consiglio Nazionale Delle Ricerche Method for obtaining oligonucleotide aptamers and uses thereof
CA3073384A1 (en) 2008-09-05 2010-03-11 President And Fellows Of Harvard College Continuous directed evolution of proteins and nucleic acids
EP2331071A1 (en) 2008-09-05 2011-06-15 Institut National De La Sante Et De La Recherche Medicale Novel multimodular assembly useful for intracellular delivery
US8636884B2 (en) 2008-09-15 2014-01-28 Abbott Diabetes Care Inc. Cationic polymer based wired enzyme formulations for use in analyte sensors
US20100076057A1 (en) 2008-09-23 2010-03-25 Northwestern University TARGET DNA INTERFERENCE WITH crRNA
WO2010054108A2 (en) 2008-11-06 2010-05-14 University Of Georgia Research Foundation, Inc. Cas6 polypeptides and methods of use
WO2010054154A2 (en) 2008-11-07 2010-05-14 Danisco A/S Bifidobacteria crispr sequences
US20110016540A1 (en) 2008-12-04 2011-01-20 Sigma-Aldrich Co. Genome editing of genes associated with trinucleotide repeat expansion disorders in animals
US9175338B2 (en) 2008-12-11 2015-11-03 Pacific Biosciences Of California, Inc. Methods for identifying nucleic acid modifications
CA2746632C (en) 2008-12-11 2020-06-30 Pacific Biosciences Of California, Inc. Characterization of modified nucleic acids
WO2010075424A2 (en) 2008-12-22 2010-07-01 The Regents Of University Of California Compositions and methods for downregulating prokaryotic genes
WO2010091203A2 (en) * 2009-02-04 2010-08-12 Lucigen Corporation Rna-and dna-copying enzymes
US20100305197A1 (en) 2009-02-05 2010-12-02 Massachusetts Institute Of Technology Conditionally Active Ribozymes And Uses Thereof
US8389679B2 (en) 2009-02-05 2013-03-05 The Regents Of The University Of California Targeted antimicrobial moieties
AU2010221284B2 (en) 2009-03-04 2015-10-01 Board Of Regents, The University Of Texas System Stabilized reverse transcriptase fusion proteins
DK2403944T3 (en) 2009-03-06 2019-05-27 Synthetic Genomics Inc METHODS FOR CLONING AND MANIPULATING GENOMES
US8501405B2 (en) 2009-04-27 2013-08-06 Pacific Biosciences Of California, Inc. Real-time sequencing methods and systems
JP2012525146A (en) 2009-04-28 2012-10-22 プレジデント アンド フェロウズ オブ ハーバード カレッジ Overcharged protein for cell penetration
WO2010132092A2 (en) 2009-05-12 2010-11-18 The Scripps Research Institute Cytidine deaminase fusions and related methods
US9063156B2 (en) 2009-06-12 2015-06-23 Pacific Biosciences Of California, Inc. Real-time analytical methods and systems
JP5798116B2 (en) 2009-06-30 2015-10-21 サンガモ バイオサイエンシーズ, インコーポレイテッド Rapid screening of biologically active nucleases and isolation of nuclease modified cells
WO2011000106A1 (en) 2009-07-01 2011-01-06 Protiva Biotherapeutics, Inc. Improved cationic lipids and methods for the delivery of therapeutic agents
EP2462230B1 (en) 2009-08-03 2015-07-15 Recombinetics, Inc. Methods and compositions for targeted gene modification
US20120178647A1 (en) 2009-08-03 2012-07-12 The General Hospital Corporation Engineering of zinc finger arrays by context-dependent assembly
GB0913681D0 (en) 2009-08-05 2009-09-16 Glaxosmithkline Biolog Sa Immunogenic composition
US8889394B2 (en) 2009-09-07 2014-11-18 Empire Technology Development Llc Multiple domain proteins
US8529326B2 (en) 2009-10-23 2013-09-10 California Institute Of Technology Games having biotechnological content
MX2012005069A (en) 2009-10-30 2012-07-17 Synthetic Genomics Inc Encoding text into nucleic acid sequences.
LT3460056T (en) 2009-11-02 2020-12-28 University Of Washington Therapeutic nuclease compositions and methods
US9175340B2 (en) 2009-11-04 2015-11-03 President And Fellows Of Harvard College Reactivity-dependent and interaction-dependent PCR
US20110104787A1 (en) 2009-11-05 2011-05-05 President And Fellows Of Harvard College Fusion Peptides That Bind to and Modify Target Nucleic Acid Sequences
ME03327B (en) 2009-12-01 2019-10-20 Translate Bio Inc Steroid derivative for the delivery of mrna in human genetic diseases
WO2011068916A1 (en) 2009-12-01 2011-06-09 Intezyne Technologies, Incorporated Pegylated polyplexes for polynucleotide delivery
BR112012014080A2 (en) 2009-12-10 2015-10-27 Univ Iowa State Res Found method for modifying genetic material, method for generating a nucleic acid, effector endonuclease monomer such, method for generating an aninal, method for generating a plant, method for directed genetic recombination, nucleic acid, expression cassette, and host cell
US20130011380A1 (en) 2009-12-18 2013-01-10 Blau Helen M Use of Cytidine Deaminase-Related Agents to Promote Demethylation and Cell Reprogramming
AU2011207769B2 (en) 2010-01-22 2015-05-28 Corteva Agriscience Llc Targeted genomic alteration
UA113493C2 (en) 2010-01-22 2017-02-10 METHOD OF REMOVAL OF A DNA SECTION IN A PLANT
US9198983B2 (en) 2010-01-25 2015-12-01 Alnylam Pharmaceuticals, Inc. Compositions and methods for inhibiting expression of Mylip/Idol gene
EP2542676A1 (en) 2010-03-05 2013-01-09 Synthetic Genomics, Inc. Methods for cloning and manipulating genomes
GB201004575D0 (en) 2010-03-19 2010-05-05 Immatics Biotechnologies Gmbh Composition of tumor associated peptides and related anti cancer vaccine for the treatment of gastric cancer and other cancers
WO2011123830A2 (en) 2010-04-02 2011-10-06 Amunix Operating Inc. Alpha 1-antitrypsin compositions and methods of making and using same
CN103038338B (en) 2010-05-10 2017-03-08 加利福尼亚大学董事会 Endoribonuclease compositionss and its using method
WO2011146121A1 (en) 2010-05-17 2011-11-24 Sangamo Biosciences, Inc. Novel dna-binding proteins and uses thereof
GB201008267D0 (en) 2010-05-18 2010-06-30 Univ Edinburgh Cationic lipids
WO2011147590A2 (en) 2010-05-27 2011-12-01 Heinrich-Pette-Institut Tailored recombinase for recombining asymmetric target sites in a plurality of retrovirus strains
WO2011153120A1 (en) 2010-06-04 2011-12-08 Merck Sharp & Dohme Corp. Novel low molecular weight cationic lipids for oligonucleotide delivery
EP2392208B1 (en) 2010-06-07 2016-05-04 Helmholtz Zentrum München Deutsches Forschungszentrum für Gesundheit und Umwelt (GmbH) Fusion proteins comprising a DNA-binding domain of a Tal effector protein and a non-specific cleavage domain of a restriction nuclease and their use
WO2011159369A1 (en) 2010-06-14 2011-12-22 Iowa State University Research Foundation, Inc. Nuclease activity of tal effector and foki fusion protein
WO2012016186A1 (en) 2010-07-29 2012-02-02 President And Fellows Of Harvard College Macrocyclic kinase inhibitors and uses thereof
US8822663B2 (en) 2010-08-06 2014-09-02 Moderna Therapeutics, Inc. Engineered nucleic acids and methods of use thereof
US8900814B2 (en) 2010-08-13 2014-12-02 Kyoto University Variant reverse transcriptase
CN103619514B (en) 2010-09-20 2016-09-28 Spi制药公司 Microcyst method and goods
KR20130110171A (en) 2010-09-29 2013-10-08 싸운드 써지컬 테크놀로지스 엘엘씨 Power assisted lipoplasty
WO2012054726A1 (en) 2010-10-20 2012-04-26 Danisco A/S Lactococcus crispr-cas sequences
WO2012054727A1 (en) 2010-10-22 2012-04-26 Bio-Rad Laboratories, Inc. Reverse transcriptase mixtures with improved storage stability
US9405700B2 (en) 2010-11-04 2016-08-02 Sonics, Inc. Methods and apparatus for virtualization in an integrated circuit
US20140005269A1 (en) 2010-11-26 2014-01-02 University Of The Witwatersrand, Johannesburg Polymeric matrix of polymer-lipid nanoparticles as a pharmaceutical dosage form
KR101255338B1 (en) 2010-12-15 2013-04-16 포항공과대학교 산학협력단 Polynucleotide delivering complex for a targeting cell
ES2753198T5 (en) 2010-12-16 2023-05-31 Amgen Europe Gmbh Oral pharmaceutical forms of controlled release of poorly soluble drugs and their uses
US9394537B2 (en) 2010-12-22 2016-07-19 President And Fellows Of Harvard College Continuous directed evolution
US9499592B2 (en) 2011-01-26 2016-11-22 President And Fellows Of Harvard College Transcription activator-like effectors
KR101818126B1 (en) 2011-02-09 2018-01-15 (주)바이오니아 Reverse Transcriptase Having Improved Thermostability
US9528124B2 (en) 2013-08-27 2016-12-27 Recombinetics, Inc. Efficient non-meiotic allele introgression
US9200045B2 (en) 2011-03-11 2015-12-01 President And Fellows Of Harvard College Small molecule-dependent inteins and uses thereof
US9164079B2 (en) 2011-03-17 2015-10-20 Greyledge Technologies Llc Systems for autologous biological therapeutics
US20120244601A1 (en) 2011-03-22 2012-09-27 Bertozzi Carolyn R Riboswitch based inducible gene expression platform
JP2012210172A (en) 2011-03-30 2012-11-01 Japan Science & Technology Agency Liposome varying inner material composition responding to external environment
US8709466B2 (en) 2011-03-31 2014-04-29 International Business Machines Corporation Cationic polymers for antimicrobial applications and delivery of bioactive materials
US20140115726A1 (en) 2011-04-05 2014-04-24 Cellectis New tale-protein scaffolds and uses thereof
US10092660B2 (en) 2011-04-25 2018-10-09 Stc.Unm Solid compositions for pharmaceutical use
JP6158170B2 (en) 2011-04-27 2017-07-12 アミリス, インコーポレイテッド Methods for genome modification
WO2012158985A2 (en) 2011-05-17 2012-11-22 Transposagen Biopharmaceuticals, Inc. Methods for site-specific genetic modification in spermatogonial stem cells using zinc finger nuclease (zfn) for the creation of model organisms
US8691750B2 (en) 2011-05-17 2014-04-08 Axolabs Gmbh Lipids and compositions for intracellular delivery of biologically active compounds
WO2012158986A2 (en) 2011-05-17 2012-11-22 Transposagen Biopharmaceuticals, Inc. Methods for site-specific genetic modification in stem cells using xanthomonas tal nucleases (xtn) for the creation of model organisms
WO2012164565A1 (en) 2011-06-01 2012-12-06 Yeda Research And Development Co. Ltd. Compositions and methods for downregulating prokaryotic genes
BR112013031553A2 (en) 2011-06-08 2020-11-10 Shire Human Genetic Therapies, Inc. compositions, mrna encoding a gland and its use, use of at least one mrna molecule and a vehicle for transfer and use of an mrna encoding for exogenous protein
WO2013006451A2 (en) 2011-07-01 2013-01-10 President And Fellows Of Harvard College Macrocyclic insulin-degrading enzyme (ide) inhibitors and uses thereof
WO2013012674A1 (en) 2011-07-15 2013-01-24 The General Hospital Corporation Methods of transcription activator like effector assembly
WO2013013105A2 (en) 2011-07-19 2013-01-24 Vivoscript,Inc. Compositions and methods for re-programming cells without genetic modification for repairing cartilage damage
JP6261500B2 (en) 2011-07-22 2018-01-17 プレジデント アンド フェローズ オブ ハーバード カレッジ Evaluation and improvement of nuclease cleavage specificity
EP2755986A4 (en) 2011-09-12 2015-05-20 Moderna Therapeutics Inc Engineered nucleic acids and methods of use thereof
EP2755693A4 (en) 2011-09-12 2015-05-20 Moderna Therapeutics Inc Engineered nucleic acids and methods of use thereof
CN104053779B (en) 2011-09-28 2017-05-24 时代生物技术股份公司 Split inteins and uses thereof
AU2012317323B2 (en) 2011-09-28 2017-10-05 Fujimoto Pharmaceutical Corporation NGF aptamer and application thereof
GB2496687A (en) 2011-11-21 2013-05-22 Gw Pharma Ltd Tetrahydrocannabivarin (THCV) in the protection of pancreatic islet cells
US9228201B2 (en) 2011-11-25 2016-01-05 Rijk Zwaan Zaadteelt En Zaadhandel B.V. Lettuce variety 45-89 RZ, “caledonas”
PT2788487T (en) 2011-12-08 2018-07-03 Sarepta Therapeutics Inc Oligonucleotide analogues targeting human lmna
JP2015500648A (en) 2011-12-16 2015-01-08 ターゲットジーン バイオテクノロジーズ リミテッド Compositions and methods for modifying a given target nucleic acid sequence
AU2012352180A1 (en) 2011-12-16 2014-07-31 Moderna Therapeutics, Inc. Modified nucleoside, nucleotide, and nucleic acid compositions
GB201122458D0 (en) 2011-12-30 2012-02-08 Univ Wageningen Modified cascade ribonucleoproteins and uses thereof
WO2013119602A1 (en) 2012-02-06 2013-08-15 President And Fellows Of Harvard College Arrdc1-mediated microvesicles (armms) and uses thereof
KR101833589B1 (en) 2012-02-24 2018-03-02 프레드 헛친슨 켄서 리서치 센터 Compositions and methods for the treatment of hemoglobinopathies
MX359327B (en) 2012-02-29 2018-09-25 Sangamo Biosciences Inc Methods and compositions for treating huntington's disease.
CN104364394B (en) 2012-03-17 2019-02-22 加州大学评议会 The quick diagnosis and individualized treatment of acne
US9637739B2 (en) 2012-03-20 2017-05-02 Vilnius University RNA-directed DNA cleavage by the Cas9-crRNA complex
WO2013141680A1 (en) 2012-03-20 2013-09-26 Vilnius University RNA-DIRECTED DNA CLEAVAGE BY THE Cas9-crRNA COMPLEX
WO2013152359A1 (en) 2012-04-06 2013-10-10 The Regents Of The University Of California Novel tetrazines and method of synthesizing the same
WO2013160230A1 (en) 2012-04-23 2013-10-31 Bayer Cropscience Nv Targeted genome engineering in plants
KR102091298B1 (en) 2012-05-02 2020-03-19 다우 아그로사이언시즈 엘엘씨 Targeted modification of malate dehydrogenase
EP2847338B1 (en) 2012-05-07 2018-09-19 Sangamo Therapeutics, Inc. Methods and compositions for nuclease-mediated targeted integration of transgenes
US11120889B2 (en) 2012-05-09 2021-09-14 Georgia Tech Research Corporation Method for synthesizing a nuclease with reduced off-site cleavage
PE20190844A1 (en) * 2012-05-25 2019-06-17 Emmanuelle Charpentier MODULATION OF TRANSCRIPTION WITH ADDRESSING RNA TO GENERIC DNA
US20150017136A1 (en) 2013-07-15 2015-01-15 Cellectis Methods for engineering allogeneic and highly active t cell for immunotherapy
EP2855667B1 (en) 2012-05-25 2023-08-09 Cellectis Methods for engineering allogeneic and immunosuppressive resistant t cell for immunotherapy
MX2014014650A (en) 2012-05-30 2015-10-14 Univ Washington Supercoiled minivectors as a tool for dna repair, alteration and replacement.
US9102936B2 (en) 2012-06-11 2015-08-11 Agilent Technologies, Inc. Method of adaptor-dimer subtraction using a CRISPR CAS6 protein
EP2858486A4 (en) * 2012-06-12 2016-04-13 Hoffmann La Roche Methods and compositions for generating conditional knock-out alleles
EP2674501A1 (en) 2012-06-14 2013-12-18 Agence nationale de sécurité sanitaire de l'alimentation,de l'environnement et du travail Method for detecting and identifying enterohemorrhagic Escherichia coli
US9688971B2 (en) 2012-06-15 2017-06-27 The Regents Of The University Of California Endoribonuclease and methods of use thereof
WO2013192278A1 (en) 2012-06-19 2013-12-27 Regents Of The University Of Minnesota Gene targeting in plants using dna viruses
US9267127B2 (en) 2012-06-21 2016-02-23 President And Fellows Of Harvard College Evolution of bond-forming enzymes
JP2015522020A (en) 2012-06-27 2015-08-03 ザ・トラスティーズ・オブ・プリンストン・ユニバーシティThe Trustees Of Princeton University Split inteins, complexes and their use
ES2663424T3 (en) 2012-06-29 2018-04-12 Massachusetts Institute Of Technology Massively parallel combinatorial genetics
US9125508B2 (en) 2012-06-30 2015-09-08 Seasons 4, Inc. Collapsible tree system
HUE051612T2 (en) 2012-07-11 2021-03-01 Sangamo Therapeutics Inc Methods and compositions for the treatment of lysosomal storage diseases
EP2872154B1 (en) 2012-07-11 2017-05-31 Sangamo BioSciences, Inc. Methods and compositions for delivery of biologics
KR20230065381A (en) 2012-07-25 2023-05-11 더 브로드 인스티튜트, 인코퍼레이티드 Inducible dna binding proteins and genome perturbation tools and applications thereof
US10058078B2 (en) 2012-07-31 2018-08-28 Recombinetics, Inc. Production of FMDV-resistant livestock by allele substitution
WO2014020608A1 (en) 2012-07-31 2014-02-06 Yeda Research And Development Co. Ltd. Methods of diagnosing and treating motor neuron diseases
WO2014022702A2 (en) 2012-08-03 2014-02-06 The Regents Of The University Of California Methods and compositions for controlling gene expression by rna processing
IN2015DN01480A (en) 2012-08-29 2015-07-03 Sangamo Biosciences Inc
DK2893022T3 (en) 2012-09-04 2020-07-27 Scripps Research Inst CHIMERIC POLYPEPTIDES WITH TARGETED BINDING SPECIFICITY
US9937205B2 (en) 2012-09-04 2018-04-10 The Trustees Of The University Of Pennsylvania Inhibition of diacylglycerol kinase to augment adoptive T cell transfer
PT2893004T (en) 2012-09-04 2019-01-21 Cellectis Multi-chain chimeric antigen receptor and uses thereof
UA118090C2 (en) 2012-09-07 2018-11-26 ДАУ АГРОСАЙЄНСІЗ ЕлЕлСі Fad2 performance loci and corresponding target site specific binding proteins capable of inducing targeted breaks
UA119135C2 (en) 2012-09-07 2019-05-10 ДАУ АГРОСАЙЄНСІЗ ЕлЕлСі Engineered transgene integration platform (etip) for gene targeting and trait stacking
AR092482A1 (en) 2012-09-07 2015-04-22 Dow Agrosciences Llc ENRICHMENT OF THE CLASSIFICATION OF FLUORESCENCE ACTIVATED CELLS (FACS) TO GENERATE PLANTS
CN105264067B (en) 2012-09-07 2020-11-10 美国陶氏益农公司 FAD3 performance loci and corresponding target site specific binding proteins capable of inducing targeted breaks
WO2014043143A1 (en) 2012-09-11 2014-03-20 Life Technologies Corporation Nucleic acid amplification
GB201216564D0 (en) 2012-09-17 2012-10-31 Univ Edinburgh Genetically edited animal
US10612053B2 (en) 2012-09-18 2020-04-07 The Translational Genomics Research Institute Isolated genes and transgenic organisms for producing biofuels
US9181535B2 (en) 2012-09-24 2015-11-10 The Chinese University Of Hong Kong Transcription activator-like effector nucleases (TALENs)
CA2885931C (en) 2012-10-03 2023-01-10 Agrivida, Inc. Intein-modified proteases, their production and industrial applications
JO3470B1 (en) 2012-10-08 2020-07-05 Merck Sharp & Dohme 5-phenoxy-3h-pyrimidin-4-one derivatives and their use as hiv reverse transcriptase inhibitors
AU2013329186B2 (en) 2012-10-10 2019-02-14 Sangamo Therapeutics, Inc. T cell modifying compounds and uses thereof
WO2014059255A1 (en) 2012-10-12 2014-04-17 The General Hospital Corporation Transcription activator-like effector (tale) - lysine-specific demethylase 1 (lsd1) fusion proteins
KR101706085B1 (en) 2012-10-23 2017-02-14 주식회사 툴젠 Composition for cleaving a target DNA comprising a guide RNA specific for the target DNA and Cas protein-encoding nucleic acid or Cas protein, and use thereof
US20140115728A1 (en) 2012-10-24 2014-04-24 A. Joseph Tector Double knockout (gt/cmah-ko) pigs, organs and tissues
BR112015009589A2 (en) 2012-10-30 2017-11-14 Recombinetics Inc Production processes of a non-human production animal, non-human genetically modified production animal, non-human in vitro organism chosen from the group consisting of a cell or a blastocyst animal, the in vitro organism, production process of an animal cell non-human genetically modified production animal, non-human production animal and method of production of a non-human genetically modified production animal
US11041165B2 (en) 2012-10-31 2021-06-22 Two Blades Foundation Identification of a Xanthomonas euvesicatoria resistance gene from pepper (Capsicum annuum) and method for generating plants with resistance
CA2890160A1 (en) 2012-10-31 2014-05-08 Cellectis Coupling herbicide resistance with targeted insertion of transgenes in plants
CA2890110C (en) 2012-11-01 2023-05-02 Factor Bioscience Inc. Methods and products for expressing proteins in cells
WO2014071235A1 (en) 2012-11-01 2014-05-08 Massachusetts Institute Of Technology Genetic device for the controlled destruction of dna
US20140127752A1 (en) 2012-11-07 2014-05-08 Zhaohui Zhou Method, composition, and reagent kit for targeted genomic enrichment
CA2890824A1 (en) 2012-11-09 2014-05-15 Marco Archetti Diffusible factors and cancer cells
EP2922960A4 (en) 2012-11-20 2016-06-29 Cold Spring Harbor Lab Mutations in solanaceae plants that modulate shoot architecture and enhance yield-related phenotypes
US20140140969A1 (en) 2012-11-20 2014-05-22 Sangamo Biosciences, Inc. Methods and compositions for muscular dystrophies
AU2013348113A1 (en) 2012-11-20 2015-06-11 J.R. Simplot Company TAL-mediated transfer DNA insertion
SG11201504038XA (en) 2012-11-27 2015-06-29 Childrens Medical Center Targeting bcl11a distal regulatory elements for fetal hemoglobin reinduction
WO2014085261A1 (en) 2012-11-29 2014-06-05 North Carolina State University Synthetic pathway for biological carbon dioxide sequestration
WO2014082644A1 (en) 2012-11-30 2014-06-05 WULFF, Peter, Samuel Circular rna for inhibition of microrna
US20160010154A1 (en) 2012-11-30 2016-01-14 The Parkinson's Institute Screening assays for therapeutics for parkinson's disease
EP2928912A1 (en) 2012-12-05 2015-10-14 Merz Pharma GmbH & Co. KGaA Novel recombinant clostridial neurotoxins with enhanced membrane localization
JP2016500254A (en) 2012-12-05 2016-01-12 サンガモ バイオサイエンシーズ, インコーポレイテッド Methods and compositions for the regulation of metabolic diseases
US9447422B2 (en) 2012-12-06 2016-09-20 Synthetic Genomics, Inc. Autonomous replication sequences and episomal DNA molecules
KR102145760B1 (en) 2012-12-06 2020-08-19 시그마-알드리치 컴퍼니., 엘엘씨 Crispr-based genome modification and regulation
CA3144049A1 (en) 2012-12-06 2014-06-12 Synthetic Genomics, Inc. Algal mutants having a locked-in high light acclimated phenotype
US9914931B2 (en) 2012-12-07 2018-03-13 Synthetic Genomics, Inc. Nannochloropsis spliced leader sequences and uses therefor
EP2928303A4 (en) 2012-12-07 2016-07-13 Haplomics Inc Factor viii mutation repair and tolerance induction
WO2014093479A1 (en) 2012-12-11 2014-06-19 Montana State University Crispr (clustered regularly interspaced short palindromic repeats) rna-guided control of gene regulation
CN114634950A (en) 2012-12-12 2022-06-17 布罗德研究所有限公司 CRISPR-CAS component systems, methods, and compositions for sequence manipulation
US8697359B1 (en) 2012-12-12 2014-04-15 The Broad Institute, Inc. CRISPR-Cas systems and methods for altering expression of gene products
EP3045537A1 (en) 2012-12-12 2016-07-20 The Broad Institute, Inc. Engineering and optimization of systems, methods and compositions for sequence manipulation with functional domains
ES2701749T3 (en) 2012-12-12 2019-02-25 Broad Inst Inc Methods, models, systems and apparatus to identify target sequences for Cas enzymes or CRISPR-Cas systems for target sequences and transmit results thereof
WO2014093694A1 (en) 2012-12-12 2014-06-19 The Broad Institute, Inc. Crispr-cas nickase systems, methods and compositions for sequence manipulation in eukaryotes
CN113528577A (en) 2012-12-12 2021-10-22 布罗德研究所有限公司 Engineering of systems, methods and optimized guide compositions for sequence manipulation
RU2701662C9 (en) 2012-12-12 2019-10-31 Те Брод Инститьют, Инк. Crispr-cas system components, methods and compositions for sequence manipulation
WO2014093635A1 (en) 2012-12-12 2014-06-19 The Broad Institute, Inc. Engineering and optimization of improved systems, methods and enzyme compositions for sequence manipulation
EP4299741A3 (en) 2012-12-12 2024-02-28 The Broad Institute, Inc. Delivery, engineering and optimization of systems, methods and compositions for sequence manipulation and therapeutic applications
EP2931898B1 (en) 2012-12-12 2016-03-09 The Broad Institute, Inc. Engineering and optimization of systems, methods and compositions for sequence manipulation with functional domains
EP2931899A1 (en) 2012-12-12 2015-10-21 The Broad Institute, Inc. Functional genomics using crispr-cas systems, compositions, methods, knock out libraries and applications thereof
JP2016500268A (en) 2012-12-13 2016-01-12 ダウ アグロサイエンシィズ エルエルシー Precise gene targeting for specific loci in maize
JP6473419B2 (en) 2012-12-13 2019-02-20 ダウ アグロサイエンシィズ エルエルシー DNA detection method for site-specific nuclease activity
AU2013358998B2 (en) 2012-12-13 2019-04-18 Massachusetts Institute Of Technology Recombinase-based logic and memory systems
KR20150095861A (en) 2012-12-17 2015-08-21 프레지던트 앤드 펠로우즈 오브 하바드 칼리지 Rna-guided human genome engineering
US9708589B2 (en) 2012-12-18 2017-07-18 Monsanto Technology Llc Compositions and methods for custom site-specific DNA recombinases
TR201808715T4 (en) 2012-12-21 2018-07-23 Cellectis Potatoes with low cold induced sweetening.
DK2938184T3 (en) 2012-12-27 2018-12-17 Keygene Nv Method of removing a genetic linkage in a plant
EP2943579B1 (en) 2013-01-10 2018-09-12 Dharmacon, Inc. Libraries and methods for generating molecules
CN105142396A (en) 2013-01-14 2015-12-09 重组股份有限公司 Hornless livestock
CA2898184A1 (en) 2013-01-16 2014-07-24 Emory University Cas9-nucleic acid complexes and uses related thereto
CN103233028B (en) 2013-01-25 2015-05-13 南京徇齐生物技术有限公司 Specie limitation-free eucaryote gene targeting method having no bio-safety influence and helical-structure DNA sequence
AU2014215025B2 (en) 2013-02-05 2018-08-30 The United States Of America, As Represented By The Secretary, Department Of Health And Human Services Cell lines for virus production and methods of use
US10660943B2 (en) 2013-02-07 2020-05-26 The Rockefeller University Sequence specific antimicrobials
WO2014125668A1 (en) 2013-02-14 2014-08-21 国立大学法人大阪大学 Method for isolating specific genomic region using molecule binding specifically to endogenous dna sequence
WO2014127287A1 (en) 2013-02-14 2014-08-21 Massachusetts Institute Of Technology Method for in vivo tergated mutagenesis
CA2900992C (en) 2013-02-20 2023-02-28 Regeneron Pharmaceuticals, Inc. Genetic modification of rats
US20150353885A1 (en) 2013-02-21 2015-12-10 Cellectis Method to counter-select cells or organisms by linking loci to nuclease components
ES2522765B2 (en) 2013-02-22 2015-03-18 Universidad De Alicante Method to detect spacer insertions in CRISPR structures
JP6491113B2 (en) 2013-02-25 2019-03-27 サンガモ セラピューティクス, インコーポレイテッド Methods and compositions for enhancing nuclease-mediated gene disruption
JP2016507244A (en) 2013-02-27 2016-03-10 ヘルムホルツ・ツェントルム・ミュンヒェン・ドイチェス・フォルシュンクスツェントルム・フューア・ゲズントハイト・ウント・ウムベルト(ゲーエムベーハー)Helmholtz Zentrum MuenchenDeutsches Forschungszentrum fuer Gesundheit und Umwelt (GmbH) Gene editing in oocytes by Cas9 nuclease
US10047366B2 (en) 2013-03-06 2018-08-14 The Johns Hopkins University Telomerator-a tool for chromosome engineering
US10612043B2 (en) 2013-03-09 2020-04-07 Agilent Technologies, Inc. Methods of in vivo engineering of large sequences using multiple CRISPR/cas selections of recombineering events
CN105283539A (en) 2013-03-12 2016-01-27 桑格摩生物科学股份有限公司 Methods and compositions for modification of HLA
US10329574B2 (en) 2013-03-12 2019-06-25 E I Du Pont De Nemours And Company Methods for the identification of variant recognition sites for rare-cutting engineered double-strand-break-inducing agents and compositions and uses thereof
WO2014158593A1 (en) 2013-03-13 2014-10-02 President And Fellows Of Harvard College Mutants of cre recombinase
US20160184458A1 (en) 2013-03-14 2016-06-30 Shire Human Genetic Therapies, Inc. Mrna therapeutic compositions and use to treat diseases and disorders
DK3620534T3 (en) 2013-03-14 2021-12-06 Caribou Biosciences Inc CRISPR-CAS NUCLEIC ACID COMPOSITIONS-TARGETING NUCLEIC ACIDS
US20140283156A1 (en) 2013-03-14 2014-09-18 Cold Spring Harbor Laboratory Trans-splicing ribozymes and silent recombinases
US20160138027A1 (en) 2013-03-14 2016-05-19 The Board Of Trustees Of The Leland Stanford Junior University Treatment of diseases and conditions associated with dysregulation of mammalian target of rapamycin complex 1 (mtorc1)
US11332719B2 (en) 2013-03-15 2022-05-17 The Broad Institute, Inc. Recombinant virus and preparations thereof
US20140349400A1 (en) * 2013-03-15 2014-11-27 Massachusetts Institute Of Technology Programmable Modification of DNA
US10760064B2 (en) 2013-03-15 2020-09-01 The General Hospital Corporation RNA-guided targeting of genetic and epigenomic regulatory proteins to specific genomic loci
EP2971006A4 (en) 2013-03-15 2017-02-08 Transposagen Biopharmaceuticals, Inc. Reproducible method for testis-mediated genetic modification (tgm) and sperm-mediated genetic modification (sgm)
US9234213B2 (en) 2013-03-15 2016-01-12 System Biosciences, Llc Compositions and methods directed to CRISPR/Cas genomic engineering systems
EP3741868A1 (en) 2013-03-15 2020-11-25 The General Hospital Corporation Rna-guided targeting of genetic and epigenomic regulatory proteins to specific genomic loci
WO2014204578A1 (en) 2013-06-21 2014-12-24 The General Hospital Corporation Using rna-guided foki nucleases (rfns) to increase specificity for rna-guided genome editing
US20140363561A1 (en) 2013-03-15 2014-12-11 J.R. Simplot Company Tal-mediated transfer dna insertion
UA120033C2 (en) 2013-03-15 2019-09-25 Сібас Юс Ллс Methods and compositions for increasing efficiency of increased efficiency of targeted gene modification using oligonucleotide-mediated gene repair
EP2970997A1 (en) 2013-03-15 2016-01-20 Regents of the University of Minnesota Engineering plant genomes using crispr/cas systems
US20140273230A1 (en) 2013-03-15 2014-09-18 Sigma-Aldrich Co., Llc Crispr-based genome modification and regulation
AU2014235968B2 (en) 2013-03-21 2018-05-24 Ospedale San Raffaele Srl Targeted disruption of T cell receptor genes using engineered zinc finger protein nucleases
CN105121650A (en) 2013-04-02 2015-12-02 拜尔作物科学公司 Targeted genome engineering in eukaryotes
CA3185368A1 (en) 2013-04-03 2014-10-09 Memorial Sloan-Kettering Cancer Center Effective generation of tumor-targeted t cells derived from pluripotent stem cells
JP2016522679A (en) 2013-04-04 2016-08-04 プレジデント アンド フェローズ オブ ハーバード カレッジ Therapeutic use of genome editing with the CRISPR / Cas system
US11274305B2 (en) 2013-04-04 2022-03-15 Trustees Of Dartmouth College Compositions and methods for in vivo excision of HIV-1 proviral DNA
RU2723130C2 (en) 2013-04-05 2020-06-08 ДАУ АГРОСАЙЕНСИЗ ЭлЭлСи Methods and compositions for embedding an exogenous sequence into a plant genome
US20150056629A1 (en) 2013-04-14 2015-02-26 Katriona Guthrie-Honea Compositions, systems, and methods for detecting a DNA sequence
US20160040155A1 (en) 2013-04-16 2016-02-11 University Of Washington Through Its Center For Commercialization Activating an alternative pathway for homology-directed repair to stimulate targeted gene correction and genome engineering
WO2014172470A2 (en) 2013-04-16 2014-10-23 Whitehead Institute For Biomedical Research Methods of mutating, modifying or modulating nucleic acid in a cell or nonhuman mammal
SG11201508028QA (en) 2013-04-16 2015-10-29 Regeneron Pharma Targeted modification of rat genome
EP2796558A1 (en) 2013-04-23 2014-10-29 Rheinische Friedrich-Wilhelms-Universität Bonn Improved gene targeting and nucleic acid carrier molecule, in particular for use in plants
EP2989214A4 (en) 2013-04-23 2016-12-28 Harvard College In situ interaction determination
CN103224947B (en) 2013-04-28 2015-06-10 陕西师范大学 Gene targeting system
AU2014262474B2 (en) 2013-05-10 2019-10-31 Whitehead Institute For Biomedical Research In vitro production of red blood cells with sortaggable proteins
US10604771B2 (en) 2013-05-10 2020-03-31 Sangamo Therapeutics, Inc. Delivery methods and compositions for nuclease-mediated genome engineering
TWI636992B (en) 2013-05-13 2018-10-01 瑟勒提斯公司 Cd19 specific chimeric antigen receptor and uses thereof
WO2014184744A1 (en) 2013-05-13 2014-11-20 Cellectis Methods for engineering highly active t cell for immunotherapy
JP2016521975A (en) 2013-05-15 2016-07-28 サンガモ バイオサイエンシーズ, インコーポレイテッド Methods and compositions for the treatment of genetic conditions
WO2014186686A2 (en) 2013-05-17 2014-11-20 Two Blades Foundation Targeted mutagenesis and genome engineering in plants using rna-guided cas nucleases
EP3778899A1 (en) 2013-05-22 2021-02-17 Northwestern University Rna-directed dna cleavage and gene editing by cas9 enzyme from neisseria meningitidis
CA2913869C (en) 2013-05-29 2023-01-24 Cellectis New compact scaffold of cas9 in the type ii crispr system
US9873907B2 (en) 2013-05-29 2018-01-23 Agilent Technologies, Inc. Method for fragmenting genomic DNA using CAS9
AU2014273490B2 (en) 2013-05-29 2019-05-09 Cellectis Methods for engineering T cells for immunotherapy by using RNA-guided Cas nuclease system
DK3004349T3 (en) 2013-05-29 2018-06-06 Cellectis Sa A method for producing precise DNA cleavage using CAS9 nickase activity
WO2014194190A1 (en) 2013-05-30 2014-12-04 The Penn State Research Foundation Gene targeting and genetic modification of plants via rna-guided genome editing
ES2716867T3 (en) 2013-05-31 2019-06-17 Cellectis Sa LAGLIDADG settlement endonuclease that cleaves the alpha T cell receptor gene and uses thereof
JP6488283B2 (en) 2013-05-31 2019-03-20 セレクティスCellectis LAGLIDADG homing endonuclease that cleaves CC chemokine receptor type 5 (CCR5) gene and its use
US20140359796A1 (en) 2013-05-31 2014-12-04 Recombinetics, Inc. Genetically sterile animals
KR20230042154A (en) 2013-06-04 2023-03-27 프레지던트 앤드 펠로우즈 오브 하바드 칼리지 Rna-guideded transcriptional regulation
US9267135B2 (en) 2013-06-04 2016-02-23 President And Fellows Of Harvard College RNA-guided transcriptional regulation
EP3417880A1 (en) 2013-06-05 2018-12-26 Duke University Rna-guided gene editing and gene regulation
US20150315252A1 (en) 2013-06-11 2015-11-05 Clontech Laboratories, Inc. Protein enriched microvesicles and methods of making and using the same
EP3008192B1 (en) 2013-06-11 2019-07-17 Takara Bio USA, Inc. Protein enriched microvesicles and methods of making and using the same
WO2014201015A2 (en) 2013-06-11 2014-12-18 The Regents Of The University Of California Methods and compositions for target dna modification
US20160145631A1 (en) 2013-06-14 2016-05-26 Cellectis Methods for non-transgenic genome editing in plants
WO2014204723A1 (en) 2013-06-17 2014-12-24 The Broad Institute Inc. Oncogenic models based on delivery and use of the crispr-cas systems, vectors and compositions
DK3011029T3 (en) 2013-06-17 2020-03-16 Broad Inst Inc ADMINISTRATION, MODIFICATION AND OPTIMIZATION OF TANDEM GUIDE SYSTEMS, PROCEDURES AND COMPOSITIONS FOR SEQUENCE MANIPULATION
MX2015017313A (en) 2013-06-17 2016-11-25 Broad Inst Inc Delivery, use and therapeutic applications of the crispr-cas systems and compositions for targeting disorders and diseases using viral components.
EP3011031B1 (en) 2013-06-17 2020-09-30 The Broad Institute Inc. Delivery and use of the crispr-cas systems, vectors and compositions for hepatic targeting and therapy
WO2014204727A1 (en) 2013-06-17 2014-12-24 The Broad Institute Inc. Functional genomics using crispr-cas systems, compositions methods, screens and applications thereof
BR112015031611A2 (en) 2013-06-17 2017-12-12 Massachusetts Inst Technology application, manipulation and optimization of systems, methods and compositions for targeting and modeling post-mitotic cell diseases and disorders
EP4245853A3 (en) 2013-06-17 2023-10-18 The Broad Institute, Inc. Optimized crispr-cas double nickase systems, methods and compositions for sequence manipulation
RU2016101246A (en) 2013-06-19 2017-07-24 СИГМА-ЭЛДРИЧ КО. ЭлЭлСи DIRECTED INTEGRATION
EP3013939A1 (en) 2013-06-25 2016-05-04 Cellectis Modified diatoms for biofuel production
WO2015002780A1 (en) 2013-07-01 2015-01-08 The Board Of Regents Of The University Of Texas System Transcription activator-like effector (tale) libraries and methods of synthesis and use
AU2014287393B2 (en) 2013-07-09 2020-10-22 President And Fellows Of Harvard College Multiplex RNA-guided genome engineering
JP2016528890A (en) 2013-07-09 2016-09-23 プレジデント アンド フェローズ オブ ハーバード カレッジ Therapeutic use of genome editing using the CRISPR / Cas system
WO2015006437A1 (en) 2013-07-10 2015-01-15 Majzoub Joseph A Mrap2 knockouts
WO2015004241A2 (en) 2013-07-10 2015-01-15 Novartis Ag Multiple proteases deficient filamentous fungal cells and methods of use thereof
CA2917639C (en) 2013-07-10 2024-01-02 President And Fellows Of Harvard College Orthogonal cas9 proteins for rna-guided gene regulation and editing
HUE056760T2 (en) 2013-07-11 2022-03-28 Modernatx Inc Compositions comprising synthetic polynucleotides encoding crispr related proteins and synthetic sgrnas and methods of use
WO2015007194A1 (en) 2013-07-16 2015-01-22 中国科学院上海生命科学研究院 Method for plant genome site-directed modification
CN105392885B (en) 2013-07-19 2020-11-03 赖瑞克斯生物科技公司 Methods and compositions for generating double allele knockouts
GB201313235D0 (en) 2013-07-24 2013-09-04 Univ Edinburgh Antiviral Compositions Methods and Animals
US11306328B2 (en) 2013-07-26 2022-04-19 President And Fellows Of Harvard College Genome engineering
CN103388006B (en) 2013-07-26 2015-10-28 华东师范大学 A kind of construction process of site-directed point mutation
US10421957B2 (en) 2013-07-29 2019-09-24 Agilent Technologies, Inc. DNA assembly using an RNA-programmable nickase
CA2920253A1 (en) 2013-08-02 2015-02-05 Enevolv, Inc. Processes and host cells for genome, pathway, and biomolecular engineering
ITTO20130669A1 (en) 2013-08-05 2015-02-06 Consiglio Nazionale Ricerche ADENO-ASSOCIATED MOMCULAR-SPECIFIC VECTOR AND ITS EMPLOYMENT IN THE TREATMENT OF MUSCLE PATHOLOGIES
WO2015021426A1 (en) 2013-08-09 2015-02-12 Sage Labs, Inc. A crispr/cas system-based novel fusion protein and its application in genome editing
US20150044192A1 (en) 2013-08-09 2015-02-12 President And Fellows Of Harvard College Methods for identifying a target site of a cas9 nuclease
WO2015024017A2 (en) 2013-08-16 2015-02-19 President And Fellows Of Harvard College Rna polymerase, methods of purification and methods of use
WO2015021990A1 (en) 2013-08-16 2015-02-19 University Of Copenhagen Rna probing method and reagents
CA2921778A1 (en) 2013-08-20 2015-02-26 Universiteit Gent Inhibition of a lncrna for treatment of melanoma
US9359599B2 (en) 2013-08-22 2016-06-07 President And Fellows Of Harvard College Engineered transcription activator-like effector (TALE) domains and uses thereof
EP3611268A1 (en) 2013-08-22 2020-02-19 E. I. du Pont de Nemours and Company Plant genome modification using guide rna/cas endonuclease systems and methods of use
GB201315321D0 (en) 2013-08-28 2013-10-09 Koninklijke Nederlandse Akademie Van Wetenschappen Transduction Buffer
US9567609B2 (en) 2013-08-28 2017-02-14 Sangamo Biosciences, Inc. Compositions for linking DNA-binding domains and cleavage domains
WO2015031775A1 (en) 2013-08-29 2015-03-05 Temple University Of The Commonwealth System Of Higher Education Methods and compositions for rna-guided treatment of hiv infection
EP4353078A2 (en) 2013-09-04 2024-04-17 KWS SAAT SE & Co. KGaA Helminthorium turcicum-resistant plant
CA2922823C (en) 2013-09-04 2023-01-17 Dow Agrosciences Llc Rapid targeting analysis in crops for determining donor insertion
AU2014316676B2 (en) 2013-09-04 2020-07-23 Csir Site-specific nuclease single-cell assay targeting gene regulatory elements to silence gene expression
EP4074330A1 (en) 2013-09-05 2022-10-19 Massachusetts Institute of Technology Tuning microbial populations with programmable nucleases
US9388430B2 (en) 2013-09-06 2016-07-12 President And Fellows Of Harvard College Cas9-recombinase fusion proteins and uses thereof
US9526784B2 (en) 2013-09-06 2016-12-27 President And Fellows Of Harvard College Delivery system for functional nucleases
WO2016070129A1 (en) 2014-10-30 2016-05-06 President And Fellows Of Harvard College Delivery of negatively charged proteins using cationic lipids
US9340799B2 (en) 2013-09-06 2016-05-17 President And Fellows Of Harvard College MRNA-sensing switchable gRNAs
WO2015040075A1 (en) 2013-09-18 2015-03-26 Genome Research Limited Genomic screening methods using rna-guided endonucleases
ES2844174T3 (en) 2013-09-18 2021-07-21 Kymab Ltd Methods, cells and organisms
US10202593B2 (en) 2013-09-20 2019-02-12 President And Fellows Of Harvard College Evolved sortases and uses thereof
EP3049116B1 (en) 2013-09-23 2019-01-02 Rensselaer Polytechnic Institute Nanoparticle-mediated gene delivery, genomic editing and ligand-targeted modification in various cell populations
WO2015048690A1 (en) 2013-09-27 2015-04-02 The Regents Of The University Of California Optimized small guide rnas and methods of use
US20160237455A1 (en) 2013-09-27 2016-08-18 Editas Medicine, Inc. Crispr-related methods and compositions
MX2016004032A (en) 2013-09-30 2016-06-02 Univ California Identification of cxcr8, a novel chemokine receptor.
US20160237451A1 (en) 2013-09-30 2016-08-18 Regents Of The University Of Minnesota Conferring resistance to geminiviruses in plants using crispr/cas systems
US20160208214A1 (en) 2013-10-02 2016-07-21 Northeastern University Methods and compositions for generation of developmentally-incompetent eggs in recipients of nuclear genetic transfer
JP5774657B2 (en) 2013-10-04 2015-09-09 国立大学法人京都大学 Method for genetic modification of mammals using electroporation
CN105916977A (en) 2013-10-07 2016-08-31 东北大学 Methods and compositions for ex vivo generation of developmentally competent eggs from germ line cells using autologous cell systems
JP2015076485A (en) 2013-10-08 2015-04-20 株式会社ジャパンディスプレイ Display device
WO2015052231A2 (en) 2013-10-08 2015-04-16 Technical University Of Denmark Multiplex editing system
US20150098954A1 (en) 2013-10-08 2015-04-09 Elwha Llc Compositions and Methods Related to CRISPR Targeting
DE102013111099B4 (en) 2013-10-08 2023-11-30 Eberhard Karls Universität Tübingen Medizinische Fakultät Permanent gene correction using nucleotide-modified messenger RNA
US20160355875A1 (en) 2013-10-11 2016-12-08 Cellectis Methods and kits for detecting nucleic acid sequences of interest using dna-binding protein domain
WO2015057671A1 (en) 2013-10-14 2015-04-23 The Broad Institute, Inc. Artificial transcription factors comprising a sliding domain and uses thereof
WO2015057834A1 (en) 2013-10-15 2015-04-23 The California Institute For Biomedical Research Peptidic chimeric antigen receptor t cell switches and uses thereof
CN105814083A (en) 2013-10-15 2016-07-27 加州生物医学研究所 Chimeric antigen receptor T cell switches and uses thereof
EP3058072B1 (en) 2013-10-17 2021-05-19 Sangamo Therapeutics, Inc. Delivery methods and compositions for nuclease-mediated genome engineering
US10117899B2 (en) 2013-10-17 2018-11-06 Sangamo Therapeutics, Inc. Delivery methods and compositions for nuclease-mediated genome engineering in hematopoietic stem cells
WO2015058047A2 (en) 2013-10-18 2015-04-23 President And Fellows Of Harvard College Fluorination of organic compounds
AU2014338910B2 (en) 2013-10-25 2020-12-10 Cellectis Design of rare-cutting endonucleases for efficient and specific targeting DNA sequences comprising highly repetitive motives
WO2015065964A1 (en) 2013-10-28 2015-05-07 The Broad Institute Inc. Functional genomics using crispr-cas systems, compositions, methods, screens and applications thereof
US10584358B2 (en) 2013-10-30 2020-03-10 North Carolina State University Compositions and methods related to a type-II CRISPR-Cas system in Lactobacillus buchneri
UY35814A (en) 2013-11-04 2015-05-29 Dow Agrosciences Llc ? OPTIMAL PLACES FOR SOYBEAN ?.
WO2015066637A1 (en) 2013-11-04 2015-05-07 Dow Agrosciences Llc A universal donor system for gene targeting
RU2709734C2 (en) 2013-11-04 2019-12-19 ДАУ АГРОСАЙЕНСИЗ ЭлЭлСи Optimum maize loci
AU2014341934B2 (en) 2013-11-04 2017-12-07 Corteva Agriscience Llc Optimal soybean loci
NZ719494A (en) 2013-11-04 2017-09-29 Dow Agrosciences Llc Optimal maize loci
WO2015069682A2 (en) 2013-11-05 2015-05-14 President And Fellows Of Harvard College Precise microbiota engineering at the cellular level
LT3066201T (en) 2013-11-07 2018-08-10 Editas Medicine, Inc. Crispr-related methods and compositions with governing grnas
WO2015077058A2 (en) 2013-11-08 2015-05-28 The Broad Institute, Inc. Compositions and methods for selecting a treatment for b-cell neoplasias
WO2015070193A1 (en) 2013-11-11 2015-05-14 Liu Oliver Compositions and methods for targeted gene disruption in prokaryotes
MX2016006106A (en) 2013-11-11 2016-12-09 Sangamo Biosciences Inc Methods and compositions for treating huntington's disease.
EP3068881B1 (en) 2013-11-13 2019-02-27 Children's Medical Center Corporation Nuclease-mediated regulation of gene expression
WO2015073867A1 (en) 2013-11-15 2015-05-21 The United States Of America, As Represented By The Secretary, Department Of Health & Human Services Engineering neural stem cells using homologous recombination
EP3071695A2 (en) 2013-11-18 2016-09-28 Crispr Therapeutics AG Crispr-cas system materials and methods
CN106103703A (en) 2013-11-18 2016-11-09 耶鲁大学 Use compositions and the method for transposon
WO2015075056A1 (en) 2013-11-19 2015-05-28 Thermo Fisher Scientific Baltics Uab Programmable enzymes for isolation of specific dna fragments
US10787684B2 (en) 2013-11-19 2020-09-29 President And Fellows Of Harvard College Large gene excision and insertion
US9074199B1 (en) 2013-11-19 2015-07-07 President And Fellows Of Harvard College Mutant Cas9 proteins
US11098094B2 (en) 2013-11-20 2021-08-24 Fondazione Telethon Artificial DNA-binding proteins and uses thereof
CA2930784C (en) 2013-11-22 2023-01-31 Cellectis Method for generating batches of allogeneic t cells with averaged potency
JP6976058B2 (en) 2013-11-22 2021-12-01 セレクティスCellectis How to Engineering Chemotherapy Drug-Resistant T Cells for Immunotherapy
CA2930973A1 (en) 2013-11-22 2015-05-28 Pal SAERTROM C/ebp alpha short activating rna compositions and methods of use
CN103642836A (en) 2013-11-26 2014-03-19 苏州同善生物科技有限公司 Method for establishing fragile X-syndrome non-human primate model on basis of CRISPR gene knockout technology
CN103614415A (en) 2013-11-27 2014-03-05 苏州同善生物科技有限公司 Method for establishing obese rat animal model based on CRISPR (clustered regularly interspaced short palindromic repeat) gene knockout technology
US10450586B2 (en) 2013-11-28 2019-10-22 Horizon Discovery Limited Somatic haploid human cell line
AU2014364051B2 (en) 2013-12-09 2018-12-20 Sangamo Therapeutics, Inc. Methods and compositions for treating hemophilia
JP6174811B2 (en) 2013-12-11 2017-08-02 リジェネロン・ファーマシューティカルズ・インコーポレイテッドRegeneron Pharmaceuticals, Inc. Methods and compositions for targeted genomic modification
EP4219699A1 (en) 2013-12-12 2023-08-02 The Broad Institute, Inc. Engineering of systems, methods and optimized guide compositions with new architectures for sequence manipulation
JP2017501149A (en) 2013-12-12 2017-01-12 ザ・ブロード・インスティテュート・インコーポレイテッド Delivery, use and therapeutic applications of CRISPR-CAS systems and compositions for targeting disorders and diseases using particle delivery components
US9840699B2 (en) 2013-12-12 2017-12-12 President And Fellows Of Harvard College Methods for nucleic acid editing
WO2015089364A1 (en) 2013-12-12 2015-06-18 The Broad Institute Inc. Crystal structure of a crispr-cas system, and uses thereof
BR112016013547A2 (en) 2013-12-12 2017-10-03 Broad Inst Inc COMPOSITIONS AND METHODS OF USE OF CRISPR-CAS SYSTEMS IN NUCLEOTIDE REPEAT DISORDERS
JP6793547B2 (en) 2013-12-12 2020-12-02 ザ・ブロード・インスティテュート・インコーポレイテッド Optimization Function Systems, methods and compositions for sequence manipulation with the CRISPR-Cas system
ES2765481T3 (en) 2013-12-12 2020-06-09 Broad Inst Inc Administration, use and therapeutic applications of crisp systems and compositions for genomic editing
US9994831B2 (en) 2013-12-12 2018-06-12 The Regents Of The University Of California Methods and compositions for modifying a single stranded target nucleic acid
KR20160097327A (en) 2013-12-12 2016-08-17 더 브로드 인스티튜트, 인코퍼레이티드 Crispr-cas systems and methods for altering expression of gene products, structural information and inducible modular cas enzymes
JP2017527256A (en) 2013-12-12 2017-09-21 ザ・ブロード・インスティテュート・インコーポレイテッド Delivery, use and therapeutic applications of CRISPR-Cas systems and compositions for HBV and viral diseases and disorders
EP3080275B1 (en) 2013-12-13 2020-01-15 Cellectis Method of selection of transformed diatoms using nuclease
EP3080256B1 (en) 2013-12-13 2018-06-13 Cellectis Cas9 nuclease platform for microalgae genome engineering
US20150191744A1 (en) 2013-12-17 2015-07-09 University Of Massachusetts Cas9 effector-mediated regulation of transcription, differentiation and gene editing/labeling
KR102274445B1 (en) 2013-12-19 2021-07-08 아미리스 인코퍼레이티드 Methods for genomic integration
JP6721508B2 (en) 2013-12-26 2020-07-15 ザ ジェネラル ホスピタル コーポレイション Multiple guide RNA
DK3090062T3 (en) 2013-12-30 2020-09-21 Univ Pittsburgh Commonwealth Sys Higher Education FUSION GENES ASSOCIATED WITH ADVANCED PROSTATE CANCER
WO2015103153A1 (en) 2013-12-31 2015-07-09 The Regents Of The University Of California Cas9 crystals and methods of use thereof
CN103668472B (en) 2013-12-31 2014-12-24 北京大学 Method for constructing eukaryon gene knockout library by using CRISPR (Clustered Regularly Interspaced Short Palindromic Repeats)/Cas9 system
JP6747974B2 (en) 2014-01-08 2020-08-26 プレジデント アンド フェローズ オブ ハーバード カレッジ RNA-induced gene drive
WO2015108993A1 (en) 2014-01-14 2015-07-23 Lam Therapeutics, Inc. Mutagenesis methods
US10774338B2 (en) 2014-01-16 2020-09-15 The Regents Of The University Of California Generation of heritable chimeric plant traits
WO2015134121A2 (en) 2014-01-20 2015-09-11 President And Fellows Of Harvard College Negative selection and stringency modulation in continuous evolution systems
GB201400962D0 (en) 2014-01-21 2014-03-05 Kloehn Peter C Screening for target-specific affinity binders using RNA interference
US10557146B2 (en) 2014-01-21 2020-02-11 The Institute Of Genetics And Developmental Biology, Chinese Academy Of Sciences Modified plants
CN106164261A (en) * 2014-01-22 2016-11-23 生命技术公司 It is applicable to the novel reverse transcriptase of high temperature nucleic acid synthesis
US10034463B2 (en) 2014-01-24 2018-07-31 Children's Medical Center Corporation High-throughput mouse model for optimizing antibody affinities
JP2017503514A (en) 2014-01-24 2017-02-02 ノースカロライナ ステート ユニバーシティーNorth Carolina State University Methods and compositions relating to sequences that guide CAS9 targeting
US10354746B2 (en) 2014-01-27 2019-07-16 Georgia Tech Research Corporation Methods and systems for identifying CRISPR/Cas off-target sites
CN104805078A (en) 2014-01-28 2015-07-29 北京大学 Design, synthesis and use of RNA molecule for high-efficiency genome editing
WO2015116686A1 (en) 2014-01-29 2015-08-06 Agilent Technologies, Inc. Cas9-based isothermal method of detection of specific dna sequence
US10233456B2 (en) 2014-01-30 2019-03-19 The Board Of Trustees Of The University Of Arkansas Method, vectors, cells, seeds and kits for stacking genes into a single genomic site
US20150291969A1 (en) 2014-01-30 2015-10-15 Chromatin, Inc. Compositions for reduced lignin content in sorghum and improving cell wall digestibility, and methods of making the same
KR102415811B1 (en) 2014-01-31 2022-07-04 팩터 바이오사이언스 인크. Methods and products for nucleic acid production and delivery
GB201401707D0 (en) 2014-01-31 2014-03-19 Sec Dep For Health The Adeno-associated viral vectors
US10072066B2 (en) 2014-02-03 2018-09-11 Sangamo Therapeutics, Inc. Methods and compositions for treatment of a beta thalessemia
WO2015115903A1 (en) 2014-02-03 2015-08-06 Academisch Ziekenhuis Leiden H.O.D.N. Lumc Site-specific dna break-induced genome editing using engineered nucleases
PL3102722T3 (en) 2014-02-04 2021-03-08 Jumpcode Genomics, Inc. Genome fractioning
USRE48856E1 (en) 2014-02-07 2021-12-21 Vib Vzw Inhibition of NEAT1 for treatment of solid tumors
CA3075047C (en) 2014-02-11 2022-02-01 The Regents Of The University Of Colorado, A Body Corporate Crispr enable method for multiplex genome editing
EP3105325B1 (en) 2014-02-13 2019-12-04 Takara Bio USA, Inc. Methods of depleting a target molecule from an initial collection of nucleic acids, and compositions and kits for practicing the same
BR112016017806B1 (en) 2014-02-14 2023-05-02 Cellectis USE OF ENGINEERED T CELLS FOR IMMUNOTHERAPY AGAINST PATHOLOGICAL CELLS, AND EX VIVO METHOD FOR PREPARING THEM
US10286084B2 (en) 2014-02-18 2019-05-14 Duke University Compositions for the inactivation of virus replication and methods of making and using the same
DK3116994T3 (en) 2014-02-20 2019-10-21 Dsm Ip Assets Bv PHAGE-SENSITIVE STREPTOCOCCUS THERMOPHILUS
EP3107552B1 (en) 2014-02-21 2018-03-28 Cellectis Method for in situ inhibition of regulatory t cells
WO2015127428A1 (en) 2014-02-24 2015-08-27 Massachusetts Institute Of Technology Methods for in vivo genome editing
WO2015127439A1 (en) 2014-02-24 2015-08-27 Sangamo Biosciences, Inc. Methods and compositions for nuclease-mediated targeted integration
JP6521669B2 (en) 2014-02-25 2019-05-29 国立研究開発法人農業・食品産業技術総合研究機構 Plant cell in which mutation is introduced into target DNA, and method for producing the same
EP3971283A1 (en) 2014-02-27 2022-03-23 Monsanto Technology LLC Compositions and methods for site directed genomic modification
CN103820441B (en) 2014-03-04 2017-05-17 黄行许 Method for human CTLA4 gene specific knockout through CRISPR-Cas9 (clustered regularly interspaced short palindromic repeat) and sgRNA(single guide RNA)for specially targeting CTLA4 gene
CN103820454B (en) 2014-03-04 2016-03-30 上海金卫生物技术有限公司 The method of CRISPR-Cas9 specific knockdown people PD1 gene and the sgRNA for selectively targeted PD1 gene
WO2015134812A1 (en) 2014-03-05 2015-09-11 Editas Medicine, Inc. Crispr/cas-related methods and compositions for treating usher syndrome and retinitis pigmentosa
ES2752175T3 (en) 2014-03-05 2020-04-03 Univ Kobe Nat Univ Corp Genomic sequence modification method to specifically convert nucleic acid bases of a target DNA sequence, and molecular complex for use therein
EP3553176A1 (en) 2014-03-10 2019-10-16 Editas Medicine, Inc. Crispr/cas-related methods and compositions for treating leber's congenital amaurosis 10 (lca10)
WO2015136001A1 (en) 2014-03-11 2015-09-17 Cellectis Method for generating t-cells compatible for allogenic transplantation
ES2821149T3 (en) 2014-03-12 2021-04-23 Prec Biosciences Inc Deletion of the exon of the dystrophin gene by genetically modified nucleases
WO2015138870A2 (en) 2014-03-13 2015-09-17 The Trustees Of The University Of Pennsylvania Compositions and methods for targeted epigenetic modification
EP4357452A2 (en) 2014-03-14 2024-04-24 Cibus US LLC Methods and compositions for increasing efficiency of targeted gene modification using oligonucleotide-mediated gene repair
US20170088845A1 (en) 2014-03-14 2017-03-30 The Regents Of The University Of California Vectors and methods for fungal genome engineering by crispr-cas9
JP6594891B2 (en) 2014-03-18 2019-10-23 サンガモ セラピューティクス, インコーポレイテッド Methods and compositions for modulating zinc finger protein expression
EP3126498A4 (en) 2014-03-20 2017-08-23 Université Laval Crispr-based methods and products for increasing frataxin levels and uses thereof
CN106460009A (en) 2014-03-21 2017-02-22 小利兰·斯坦福大学托管委员会 Genome editing without nucleases
SI3122878T1 (en) 2014-03-24 2019-05-31 Translate Bio, Inc. Mrna therapy for the treatment of ocular diseases
PT3122766T (en) 2014-03-24 2021-05-19 Immco Diagnostics Inc Improved anti-nuclear antibody detection and diagnostics for systemic and non-systemic autoimmune disorders
CA2943622A1 (en) 2014-03-25 2015-10-01 Editas Medicine Inc. Crispr/cas-related methods and compositions for treating hiv infection and aids
AU2015236045B2 (en) 2014-03-25 2021-09-23 Ginkgo Bioworks, Inc. Methods and genetic systems for cell engineering
CN106459951A (en) 2014-03-26 2017-02-22 马里兰大学派克分院 Targeted genome editing in zygotes of domestic large animals
US11242525B2 (en) 2014-03-26 2022-02-08 Editas Medicine, Inc. CRISPR/CAS-related methods and compositions for treating sickle cell disease
US9609415B2 (en) 2014-03-26 2017-03-28 Bose Corporation Headphones with cable management
WO2015148860A1 (en) 2014-03-26 2015-10-01 Editas Medicine, Inc. Crispr/cas-related methods and compositions for treating beta-thalassemia
US9993563B2 (en) 2014-03-28 2018-06-12 Aposense Ltd. Compounds and methods for trans-membrane delivery of molecules
KR20160138210A (en) 2014-03-28 2016-12-02 아포센스 엘티디. Compounds and methods for trans-membrane delivery of molecules
WO2015153760A2 (en) 2014-04-01 2015-10-08 Sangamo Biosciences, Inc. Methods and compositions for prevention or treatment of a nervous system disorder
EP3126497B1 (en) 2014-04-01 2018-12-12 Editas Medicine, Inc. Crispr/cas-related methods and compositions for treating herpes simplex virus type 1 (hsv-1)
WO2015153791A1 (en) 2014-04-01 2015-10-08 Editas Medicine, Inc. Crispr/cas-related methods and compositions for treating herpes simplex virus type 2 (hsv-2)
WO2015153889A2 (en) 2014-04-02 2015-10-08 University Of Florida Research Foundation, Incorporated Materials and methods for the treatment of latent viral infection
EP3126495A1 (en) 2014-04-02 2017-02-08 Editas Medicine, Inc. Crispr/cas-related methods and compositions for treating primary open angle glaucoma
CN103911376B (en) 2014-04-03 2017-02-15 黄行许 CRISPR-Cas9 targeted knockout hepatitis b virus cccDNA and specific sgRNA thereof
US20170022499A1 (en) 2014-04-03 2017-01-26 Massachusetts Institute Of Techology Methods and compositions for the production of guide rna
JP2017512481A (en) 2014-04-08 2017-05-25 ノースカロライナ ステート ユニバーシティーNorth Carolina State University Methods and compositions for RNA-dependent transcriptional repression using CRISPR-related genes
EP3556858A3 (en) 2014-04-09 2020-01-22 Editas Medicine, Inc. Crispr/cas-related methods and compositions for treating cystic fibrosis
EP3129488B1 (en) 2014-04-10 2019-06-12 The Regents of The University of California Methods and compositions for using argonaute to modify a single stranded target nucleic acid
EP3129473B8 (en) 2014-04-11 2020-12-23 Cellectis Method for generating immune cells resistant to arginine and/or tryptophan depleted microenvironment
ES2962509T3 (en) 2014-04-14 2024-03-19 Maxcyte Inc Methods and compositions to modify genomic DNA
CN103923911B (en) 2014-04-14 2016-06-08 上海金卫生物技术有限公司 The method of CRISPR-Cas9 specific knockdown CCR5 gene and the sgRNA for selectively targeted CCR5 gene
PL3132034T3 (en) 2014-04-14 2021-04-06 Nemesis Bioscience Ltd. Therapeutic
GB201406968D0 (en) 2014-04-17 2014-06-04 Green Biologics Ltd Deletion mutants
GB201406970D0 (en) 2014-04-17 2014-06-04 Green Biologics Ltd Targeted mutations
SG10201809157VA (en) 2014-04-18 2018-11-29 Editas Medicine Inc Crispr-cas-related methods, compositions and components for cancer immunotherapy
CN105039399A (en) 2014-04-23 2015-11-11 复旦大学 Pluripotent stem cell-hereditary cardiomyopathy cardiac muscle cell and preparation method thereof
AU2015249371B2 (en) 2014-04-24 2020-04-30 Board Of Regents, The University Of Texas System Application of induced pluripotent stem cells to generate adoptive cell therapy products
KR101823661B1 (en) 2014-04-24 2018-01-30 기초과학연구원 A method of selecting a nuclease target sequence for gene knockout based on microhomology
WO2015164748A1 (en) 2014-04-24 2015-10-29 Sangamo Biosciences, Inc. Engineered transcription activator like effector (tale) proteins
CA2946987A1 (en) 2014-04-28 2015-11-05 Joseph F. Petolino Haploid maize transformation
WO2015168158A1 (en) 2014-04-28 2015-11-05 Fredy Altpeter Targeted genome editing to modify lignin biosynthesis and cell wall composition
CN106535630B (en) 2014-04-28 2020-04-24 重组股份有限公司 Multiple gene editing
US10494422B2 (en) 2014-04-29 2019-12-03 Seattle Children's Hospital CCR5 disruption of cells expressing anti-HIV chimeric antigen receptor (CAR) derived from broadly neutralizing antibodies
WO2015165275A1 (en) 2014-04-30 2015-11-05 清华大学 Use of tale transcriptional repressor for modular construction of synthetic gene line in mammalian cell
CN104178506B (en) 2014-04-30 2017-03-01 清华大学 TALER albumen is by sterically hindered performance transcripting suppressioning action and its application
WO2015165276A1 (en) 2014-04-30 2015-11-05 清华大学 Reagent kit using tale transcriptional repressor for modular construction of synthetic gene line in mammalian cell
WO2015168404A1 (en) 2014-04-30 2015-11-05 Massachusetts Institute Of Technology Toehold-gated guide rna for programmable cas9 circuitry with rna input
US20170037431A1 (en) 2014-05-01 2017-02-09 University Of Washington In vivo Gene Engineering with Adenoviral Vectors
GB201407852D0 (en) 2014-05-02 2014-06-18 Iontas Ltd Preparation of libraries od protein variants expressed in eukaryotic cells and use for selecting binding molecules
WO2015171603A1 (en) 2014-05-06 2015-11-12 Two Blades Foundation Methods for producing plants with enhanced resistance to oomycete pathogens
MX2016014565A (en) 2014-05-08 2017-05-23 Sangamo Biosciences Inc Methods and compositions for treating huntington's disease.
WO2015171894A1 (en) 2014-05-09 2015-11-12 The Regents Of The University Of California Methods for selecting plants after genome editing
US10280419B2 (en) 2014-05-09 2019-05-07 UNIVERSITé LAVAL Reduction of amyloid beta peptide production via modification of the APP gene using the CRISPR/Cas system
AU2015255656A1 (en) 2014-05-09 2016-11-10 Assembly Biosciences, Inc. Methods and compositions for treating hepatitis B virus infections
AU2015259191B2 (en) 2014-05-13 2019-03-21 Sangamo Therapeutics, Inc. Methods and compositions for prevention or treatment of a disease
CN103981212B (en) 2014-05-16 2016-06-01 安徽省农业科学院水稻研究所 The clever shell color of the rice varieties of yellow grain husk shell is changed into the breeding method of brown
CN104004782B (en) 2014-05-16 2016-06-08 安徽省农业科学院水稻研究所 A kind of breeding method extending paddy rice breeding time
CN103981211B (en) 2014-05-16 2016-07-06 安徽省农业科学院水稻研究所 A kind of breeding method formulating cleistogamous rice material
CN104017821B (en) 2014-05-16 2016-07-06 安徽省农业科学院水稻研究所 Directed editor's grain husk shell color determines the gene OsCHI method formulating brown shell rice material
WO2015173436A1 (en) 2014-05-16 2015-11-19 Vrije Universiteit Brussel Genetic correction of myotonic dystrophy type 1
JP2017517256A (en) 2014-05-20 2017-06-29 リージェンツ オブ ザ ユニバーシティ オブ ミネソタ How to edit gene sequences
CA2852593A1 (en) 2014-05-23 2015-11-23 Universite Laval Methods for producing dopaminergic neurons and uses thereof
WO2015183885A1 (en) 2014-05-27 2015-12-03 Dana-Farber Cancer Institute, Inc. Methods and compositions for perturbing gene expression in hematopoietic stem cell lineages in vivo
KR101886381B1 (en) 2014-05-28 2018-08-10 기초과학연구원 A method for isolating target DNA using inactivated site-specific nuclease
WO2015184268A1 (en) 2014-05-30 2015-12-03 The Board Of Trustees Of The Leland Stanford Junior University Compositions and methods of delivering treatments for latent viral infections
WO2015188065A1 (en) 2014-06-05 2015-12-10 Sangamo Biosciences, Inc. Methods and compositions for nuclease design
EP3155018A4 (en) 2014-06-06 2018-01-10 The California Institute for Biomedical Research Constant region antibody fusion proteins and compositions thereof
CN104004778B (en) 2014-06-06 2016-03-02 重庆高圣生物医药有限责任公司 Targeting knockout carrier containing CRISPR/Cas9 system and adenovirus thereof and application
EP3708671A1 (en) 2014-06-06 2020-09-16 Regeneron Pharmaceuticals, Inc. Methods and compositions for modifying a targeted locus
WO2015188094A1 (en) 2014-06-06 2015-12-10 President And Fellows Of Harvard College Methods for targeted modification of genomic dna
WO2015188132A1 (en) 2014-06-06 2015-12-10 The California Institute For Biomedical Research Methods of constructing amino terminal immunoglobulin fusion proteins and compositions thereof
WO2015188191A1 (en) 2014-06-06 2015-12-10 Wong Wilson W Dna recombinase circuits for logical control of gene expression
EP3155116A4 (en) 2014-06-10 2017-12-27 Massachusetts Institute Of Technology Method for gene editing
US11274302B2 (en) 2016-08-17 2022-03-15 Diacarta Ltd Specific synthetic chimeric Xenonucleic acid guide RNA; s(XNA-gRNA) for enhancing CRISPR mediated genome editing efficiency
EP3155098A4 (en) 2014-06-11 2018-01-03 Howard, Tom E. FACTOR VIII MUTATION REPAIR AND TOLERANCE INDUCTION AND RELATED CDNAs, COMPOSITIONS, METHODS AND SYSTEMS
WO2016053397A2 (en) 2014-06-11 2016-04-07 Duke University Compositions and methods for rapid and dynamic flux control using synthetic metabolic valves
WO2015189693A1 (en) 2014-06-12 2015-12-17 King Abdullah University Of Science And Technology Targeted viral-mediated plant genome editing using crispr/cas9
WO2015191911A2 (en) 2014-06-12 2015-12-17 Clontech Laboratories, Inc. Protein enriched microvesicles and methods of making and using the same
BR112016029178A2 (en) 2014-06-16 2017-10-17 Univ Johns Hopkins compositions and methods for the expression of crispr guide rs using the h1 promoter
WO2015195547A1 (en) 2014-06-16 2015-12-23 University Of Washington Methods for controlling stem cell potential and for gene editing in stem cells
CA2952613A1 (en) 2014-06-17 2015-12-23 Poseida Therapeutics, Inc. A method for directing proteins to specific loci in the genome and uses thereof
CA2952906A1 (en) 2014-06-20 2015-12-23 Cellectis Potatoes with reduced granule-bound starch synthase
PL3155099T3 (en) 2014-06-23 2018-08-31 Regeneron Pharmaceuticals, Inc. Nuclease-mediated dna assembly
ES2888976T3 (en) 2014-06-23 2022-01-10 Massachusetts Gen Hospital Pan-genomic unbiased identification of DSBs assessed by sequencing (GUIDE-Seq.)
WO2015200555A2 (en) 2014-06-25 2015-12-30 Caribou Biosciences, Inc. Rna modification to engineer cas9 activity
PL3161128T3 (en) 2014-06-26 2019-02-28 Regeneron Pharmaceuticals, Inc. Methods and compositions for targeted genetic modifications and methods of use
GB201411344D0 (en) 2014-06-26 2014-08-13 Univ Leicester Cloning
CN106662033B (en) 2014-06-30 2019-01-18 日产自动车株式会社 Internal combustion engine
WO2016001978A1 (en) 2014-06-30 2016-01-07 花王株式会社 Adhesive sheet for cooling
US20180187172A1 (en) 2014-07-01 2018-07-05 Board Of Regents, The University Of Texas System Regulated gene expression from viral vectors
BR112016030852A2 (en) 2014-07-02 2018-01-16 Shire Human Genetic Therapies rna messenger encapsulation
WO2016007604A1 (en) 2014-07-09 2016-01-14 Gen9, Inc. Compositions and methods for site-directed dna nicking and cleaving
EP2966170A1 (en) 2014-07-10 2016-01-13 Heinrich-Pette-Institut Leibniz-Institut für experimentelle Virologie-Stiftung bürgerlichen Rechts - HBV inactivation
CA2954626A1 (en) 2014-07-11 2016-01-14 E. I. Du Pont De Nemours And Company Compositions and methods for producing plants resistant to glyphosate herbicide
US20170183677A1 (en) 2014-07-11 2017-06-29 Pioneer Hi-Bred International, Inc. Agronomic trait modification using guide rna/cas endonuclease systems and methods of use
CN104109687A (en) 2014-07-14 2014-10-22 四川大学 Construction and application of Zymomonas mobilis CRISPR (clustered regularly interspaced short palindromic repeats)-Cas (CRISPR-association proteins)9 system
CA2954791A1 (en) 2014-07-14 2016-01-21 The Regents Of The University Of California Crispr/cas transcriptional modulation
MA40253A (en) 2014-07-15 2017-05-24 Juno Therapeutics Inc Engineered cells for adoptive cell therapy
WO2016011428A1 (en) 2014-07-17 2016-01-21 University Of Pittsburgh - Of The Commonwealth System Of Higher Education Methods of treating cells containing fusion genes
US9944933B2 (en) 2014-07-17 2018-04-17 Georgia Tech Research Corporation Aptamer-guided gene targeting
US20160053304A1 (en) 2014-07-18 2016-02-25 Whitehead Institute For Biomedical Research Methods Of Depleting Target Sequences Using CRISPR
US20160053272A1 (en) 2014-07-18 2016-02-25 Whitehead Institute For Biomedical Research Methods Of Modifying A Sequence Using CRISPR
US10975406B2 (en) 2014-07-18 2021-04-13 Massachusetts Institute Of Technology Directed endonucleases for repeatable nucleic acid cleavage
EP3172237A2 (en) 2014-07-21 2017-05-31 Novartis AG Treatment of cancer using humanized anti-bcma chimeric antigen receptor
CA2955382C (en) 2014-07-21 2023-07-18 Illumina, Inc. Polynucleotide enrichment using crispr-cas systems
CN106415742B (en) 2014-07-22 2019-07-26 松下知识产权经营株式会社 Composite magnetic, using its coil component and composite magnetic manufacturing method
KR102234266B1 (en) 2014-07-23 2021-04-02 삼성전자주식회사 Semiconductor device and method for fabricating the same
DK3172315T3 (en) 2014-07-24 2020-12-21 Dsm Ip Assets Bv PROFESSIONALLY RESISTANT LACTIC ACID BACTERIA
CA2956108A1 (en) 2014-07-25 2016-01-28 Boehringer Ingelheim International Gmbh Enhanced reprogramming to ips cells
WO2016014794A1 (en) 2014-07-25 2016-01-28 Sangamo Biosciences, Inc. Methods and compositions for modulating nuclease-mediated genome engineering in hematopoietic stem cells
US9757420B2 (en) 2014-07-25 2017-09-12 Sangamo Therapeutics, Inc. Gene editing for HIV gene therapy
WO2016016119A1 (en) 2014-07-26 2016-02-04 Consiglio Nazionale Delle Ricerche Compositions and methods for treatment of muscular dystrophy
FR3024464A1 (en) 2014-07-30 2016-02-05 Centre Nat Rech Scient TARGETING NON-VIRAL INTEGRATIVE VECTORS IN NUCLEOLAR DNA SEQUENCES IN EUKARYOTES
US9616090B2 (en) 2014-07-30 2017-04-11 Sangamo Biosciences, Inc. Gene correction of SCID-related genes in hematopoietic stem and progenitor cells
WO2016022363A2 (en) 2014-07-30 2016-02-11 President And Fellows Of Harvard College Cas9 proteins including ligand-dependent inteins
US9850521B2 (en) 2014-08-01 2017-12-26 Agilent Technologies, Inc. In vitro assay buffer for Cas9
EP2982758A1 (en) 2014-08-04 2016-02-10 Centre Hospitalier Universitaire Vaudois (CHUV) Genome editing for the treatment of huntington's disease
US20160076093A1 (en) 2014-08-04 2016-03-17 University Of Washington Multiplex homology-directed repair
KR20180015731A (en) 2014-08-06 2018-02-13 주식회사 툴젠 Genome editing using campylobacter jejuni crispr/cas system-derived rgen
US10280402B2 (en) 2014-08-06 2019-05-07 College Of Medicine Pochon Cha University Industry-Academic Cooperation Foundation Immune-compatible cells created by nuclease-mediated editing of genes encoding HLA
US9932566B2 (en) 2014-08-07 2018-04-03 Agilent Technologies, Inc. CIS-blocked guide RNA
WO2016022931A1 (en) 2014-08-07 2016-02-11 The Rockefeller University Compositions and methods for transcription-based crispr-cas dna editing
EP3180034B1 (en) 2014-08-11 2022-04-20 The Board of Regents of The University of Texas System Prevention of muscular dystrophy by crispr/cas9-mediated gene editing
US10513711B2 (en) 2014-08-13 2019-12-24 Dupont Us Holding, Llc Genetic targeting in non-conventional yeast using an RNA-guided endonuclease
CN104178461B (en) 2014-08-14 2017-02-01 北京蛋白质组研究中心 CAS9-carrying recombinant adenovirus and application thereof
CN107429241A (en) 2014-08-14 2017-12-01 北京百奥赛图基因生物技术有限公司 DNA knocks in system
US9879270B2 (en) 2014-08-15 2018-01-30 Wisconsin Alumni Research Foundation Constructs and methods for genome editing and genetic engineering of fungi and protists
EP3686279B1 (en) 2014-08-17 2023-01-04 The Broad Institute, Inc. Genome editing using cas9 nickases
WO2016028887A1 (en) 2014-08-19 2016-02-25 Pacific Biosciences Of California, Inc. Compositions and methods for enrichment of nucleic acids
AU2015305570C1 (en) * 2014-08-19 2020-07-23 President And Fellows Of Harvard College RNA-guided systems for probing and mapping of nucleic acids
WO2016026444A1 (en) 2014-08-20 2016-02-25 Shanghai Institutes For Biological Sciences, Chinese Academy Of Sciences Biomarker and therapeutic target for triple negative breast cancer
TW201614073A (en) 2014-08-25 2016-04-16 Geneweave Biosciences Inc Non-replicative transduction particles and transduction particle-based reporter systems
CN107207573A (en) 2014-08-26 2017-09-26 加利福尼亚大学董事会 Super quick ABA acceptors
CA2959070C (en) 2014-08-27 2020-11-10 Caribou Biosciences, Inc. Methods for increasing cas9-mediated engineering efficiency
EP3633032A3 (en) 2014-08-28 2020-07-29 North Carolina State University Novel cas9 proteins and guiding features for dna targeting and genome editing
US10570418B2 (en) 2014-09-02 2020-02-25 The Regents Of The University Of California Methods and compositions for RNA-directed target DNA modification
EP3189140B1 (en) 2014-09-05 2019-10-23 Vilnius University Programmable rna shredding by the type iii-a crispr-cas system of streptococcus thermophilus
EP3188746A4 (en) 2014-09-05 2018-05-02 The Johns Hopkins University Targeting capn9/capns2 activity as a therapeutic strategy for the treatment of myofibroblast differentiation and associated pathologies
US20170298450A1 (en) 2014-09-10 2017-10-19 The Regents Of The University Of California Reconstruction of ancestral cells by enzymatic recording
US11560568B2 (en) 2014-09-12 2023-01-24 E. I. Du Pont De Nemours And Company Generation of site-specific-integration sites for complex trait loci in corn and soybean, and methods of use
CN106795488B (en) 2014-09-16 2021-03-30 桑格摩治疗股份有限公司 Methods and compositions for nuclease-mediated genome engineering and correction in hematopoietic stem cells
KR20190125537A (en) 2014-09-16 2019-11-06 길리애드 사이언시즈, 인코포레이티드 Solid forms of a toll-like receptor modulator
WO2016049163A2 (en) 2014-09-24 2016-03-31 The Broad Institute Inc. Use and production of chd8+/- transgenic animals with behavioral phenotypes characteristic of autism spectrum disorder
WO2016049251A1 (en) 2014-09-24 2016-03-31 The Broad Institute Inc. Delivery, use and therapeutic applications of the crispr-cas systems and compositions for modeling mutations in leukocytes
EP3800260A1 (en) 2014-09-24 2021-04-07 City of Hope Adeno-associated virus vector variants for high efficiency genome editing and methods thereof
WO2016049024A2 (en) 2014-09-24 2016-03-31 The Broad Institute Inc. Delivery, use and therapeutic applications of the crispr-cas systems and compositions for modeling competition of multiple cancer mutations in vivo
WO2016046635A1 (en) 2014-09-25 2016-03-31 Institut Pasteur Methods for characterizing human papillomavirus associated cervical lesions
WO2016049258A2 (en) 2014-09-25 2016-03-31 The Broad Institute Inc. Functional screening with optimized functional crispr-cas systems
WO2016054225A1 (en) 2014-09-30 2016-04-07 Stc.Unm Plasmid delivery in the treatment of cancer and other disease states
KR102630014B1 (en) 2014-10-01 2024-01-25 더 제너럴 하스피탈 코포레이션 Methods for increasing efficiency of nuclease-induced homology-directed repair
EP3998344A1 (en) 2014-10-09 2022-05-18 Life Technologies Corporation Crispr oligonucleotides and gene editing
US9943612B2 (en) 2014-10-09 2018-04-17 Seattle Children's Hospital Long poly(A) plasmids and methods for introduction of long poly(A) sequences into the plasmid
CN107530399B (en) 2014-10-10 2022-03-18 马萨诸塞眼科耳科诊所 Effective delivery of therapeutic molecules in vitro and in vivo
CA2963693A1 (en) 2014-10-10 2016-04-14 Editas Medicine, Inc. Compositions and methods for promoting homology directed repair
WO2016061073A1 (en) 2014-10-14 2016-04-21 Memorial Sloan-Kettering Cancer Center Composition and method for in vivo engineering of chromosomal rearrangements
RU2706965C2 (en) 2014-10-15 2019-11-21 Регенерон Фармасьютикалз, Инк. Methods and compositions for producing or maintaining pluripotent cells
CN107027313B (en) 2014-10-17 2021-09-07 宾州研究基金会 Methods and compositions for multiplex RNA-guided genome editing and other RNA techniques
CN104342457A (en) 2014-10-17 2015-02-11 杭州师范大学 Method for targetedly integrating exogenous gene into target gene
CN107208086A (en) 2014-10-17 2017-09-26 霍华德休斯医学研究所 genomic probe
US10793922B2 (en) 2014-10-20 2020-10-06 Envirologix Inc. Compositions and methods for detecting an RNA virus
WO2016077052A2 (en) 2014-10-22 2016-05-19 President And Fellows Of Harvard College Evolution of proteases
US20170306306A1 (en) 2014-10-24 2017-10-26 Life Technologies Corporation Compositions and Methods for Enhancing Homologous Recombination
US20170247762A1 (en) 2014-10-27 2017-08-31 The Board Institute Inc. Compositions, methods and use of synthetic lethal screening
EP3212778B1 (en) 2014-10-28 2019-08-28 Agrivida, Inc. Methods and compositions for stabilizing trans-splicing intein modified proteases
WO2016069912A1 (en) 2014-10-29 2016-05-06 Massachusetts Eye And Ear Infirmary Efficient delivery of therapeutic molecules in vitro and in vivo
MA40880A (en) 2014-10-30 2017-09-05 Temple Univ Of The Commonwealth RNA-GUIDED ERADICATION OF HUMAN JC VIRUS AND OTHER POLYOMAVIRUSES
US9816080B2 (en) 2014-10-31 2017-11-14 President And Fellows Of Harvard College Delivery of CAS9 via ARRDC1-mediated microvesicles (ARMMs)
KR20230098910A (en) 2014-10-31 2023-07-04 더 트러스티스 오브 더 유니버시티 오브 펜실베니아 Altering gene expression in modified t cells and uses thereof
EP3708155A1 (en) 2014-10-31 2020-09-16 Massachusetts Institute Of Technology Massively parallel combinatorial genetics for crispr
CN104404036B (en) 2014-11-03 2017-12-01 赛业(苏州)生物科技有限公司 Conditional gene knockout method based on CRISPR/Cas9 technologies
CN104504304B (en) 2014-11-03 2017-08-25 深圳先进技术研究院 A kind of short palindrome repetitive sequence recognition methods of regular intervals of cluster and device
WO2016072936A1 (en) 2014-11-03 2016-05-12 Nanyang Technological University Novel recombinant expression systems
DK3216867T3 (en) 2014-11-04 2020-06-22 Univ Kobe Nat Univ Corp PROCEDURE FOR MODIFYING GENE SEQUENCE TO INTRODUCE SPECIFIC MUTATION IN INTENDED DNA SEQUENCE BY BASE REMOVAL REACTION AND MOLECULE COMPLEX USED THEREOF
WO2016073559A1 (en) 2014-11-05 2016-05-12 The Regents Of The University Of California Methods for autocatalytic genome editing and neutralizing autocatalytic genome editing
EP3215611B1 (en) 2014-11-06 2019-08-21 E. I. du Pont de Nemours and Company Peptide-mediated delivery of rna-guided endonuclease into cells
CA2963820A1 (en) 2014-11-07 2016-05-12 Editas Medicine, Inc. Methods for improving crispr/cas-mediated genome-editing
CN107532142A (en) 2014-11-11 2018-01-02 应用干细胞有限公司 Mescenchymal stem cell is transformed using homologous recombination
ES2706531T3 (en) 2014-11-11 2019-03-29 Illumina Inc Amplification of polynucleotides using CRISPR-Cas systems
JP6621820B2 (en) 2014-11-14 2019-12-18 インスティチュート フォー ベーシック サイエンスInstitute For Basic Science Method for detecting non-target positions of programmable nucleases in the genome
EP3467110A1 (en) 2014-11-15 2019-04-10 Zumutor Biologics Inc. Dna-binding domain, non-fucosylated and partially fucosylated proteins, and methods thereof
WO2016080097A1 (en) 2014-11-17 2016-05-26 国立大学法人東京医科歯科大学 Method for easily and highly efficiently creating genetically modified nonhuman mammal
EP3222728B1 (en) 2014-11-19 2021-07-14 Institute for Basic Science Method for regulating gene expression using cas9 protein expressed from two vectors
US11319555B2 (en) 2014-11-20 2022-05-03 Duke University Compositions, systems and methods for cell therapy
RU2734770C2 (en) 2014-11-21 2020-10-23 Регенерон Фармасьютикалз, Инк. Methods and compositions for targeted genetic modification using paired guide rnas
US10227661B2 (en) 2014-11-21 2019-03-12 GeneWeave Biosciences, Inc. Sequence-specific detection and phenotype determination
WO2016086177A2 (en) 2014-11-25 2016-06-02 Drexel University Compositions and methods for hiv quasi-species excision from hiv-1-infected patients
WO2016084088A1 (en) 2014-11-26 2016-06-02 Ramot At Tel-Aviv University Ltd. Targeted elimination of bacterial genes
US20180105834A1 (en) 2014-11-27 2018-04-19 Institute Of Animal Sciences, Chinese Academy Of Agrigultural Sciences A method of site-directed insertion to h11 locus in pigs by using site-directed cutting system
EP3224363B1 (en) 2014-11-27 2021-11-03 Yissum Research Development Company of the Hebrew University of Jerusalem Ltd. Nucleic acid constructs for genome editing
GB201421096D0 (en) 2014-11-27 2015-01-14 Imp Innovations Ltd Genome editing methods
CN105695485B (en) 2014-11-27 2020-02-21 中国科学院上海生命科学研究院 Cas9 encoding gene for filamentous fungus Crispr-Cas system and application thereof
US20170266320A1 (en) 2014-12-01 2017-09-21 President And Fellows Of Harvard College RNA-Guided Systems for In Vivo Gene Editing
US10479997B2 (en) 2014-12-01 2019-11-19 Novartis Ag Compositions and methods for diagnosis and treatment of prostate cancer
WO2016089433A1 (en) 2014-12-03 2016-06-09 Agilent Technologies, Inc. Guide rna with chemical modifications
CN104450774A (en) 2014-12-04 2015-03-25 中国农业科学院作物科学研究所 Construction of soybean CRISPR/Cas9 system and application of soybean CRISPR/Cas9 system in soybean gene modification
US10975392B2 (en) 2014-12-05 2021-04-13 Abcam Plc Site-directed CRISPR/recombinase compositions and methods of integrating transgenes
CN104531705A (en) 2014-12-09 2015-04-22 中国农业大学 Method for knocking off animal myostatin gene by using CRISPR-Cas9 system
CN104531704B (en) 2014-12-09 2019-05-21 中国农业大学 Utilize the method for CRISPR-Cas9 system knock-out animal FGF5 gene
CA2969847A1 (en) 2014-12-10 2016-06-16 Regents Of The University Of Minnesota Genetically modified cells, tissues, and organs for treating disease
WO2016094874A1 (en) 2014-12-12 2016-06-16 The Broad Institute Inc. Escorted and functionalized guides for crispr-cas systems
EP3985115A1 (en) 2014-12-12 2022-04-20 The Broad Institute, Inc. Protected guide rnas (pgrnas)
CN107249645A (en) 2014-12-12 2017-10-13 朱坚 The method and composition of cell of interest is eliminated for selectivity
WO2016094872A1 (en) 2014-12-12 2016-06-16 The Broad Institute Inc. Dead guides for crispr transcription factors
WO2016094880A1 (en) 2014-12-12 2016-06-16 The Broad Institute Inc. Delivery, use and therapeutic applications of crispr systems and compositions for genome editing as to hematopoietic stem cells (hscs)
CN104480144B (en) 2014-12-12 2017-04-12 武汉大学 CRISPR/Cas9 recombinant lentiviral vector for human immunodeficiency virus gene therapy and lentivirus of CRISPR/Cas9 recombinant lentiviral vector
EP3230445B1 (en) 2014-12-12 2024-01-24 Tod M. Woolf Compositions and methods for editing nucleic acids in cells utilizing oligonucleotides
US11427829B2 (en) 2014-12-16 2022-08-30 Danisco Us Inc Fungal genome modification systems and methods of use
US10221398B2 (en) 2014-12-16 2019-03-05 C3J Therapeutics, Inc. Compositions of and methods for in vitro viral genome engineering
EP3233095A2 (en) 2014-12-17 2017-10-25 Cellectis INHIBITORY CHIMERIC ANTIGEN RECEPTOR (iCAR OR N-CAR) EXPRESSING NON-T CELL TRANSDUCTION DOMAIN
EP3712269A1 (en) 2014-12-17 2020-09-23 ProQR Therapeutics II B.V. Targeted rna editing
US20170369866A1 (en) 2014-12-17 2017-12-28 E I Du Pont De Nemours And Company Compositions and methods for efficient gene editing in e. coli using guide rna/cas endonuclease systems in combination with circular polynucleotide modification templates
US9840702B2 (en) 2014-12-18 2017-12-12 Integrated Dna Technologies, Inc. CRISPR-based compositions and methods of use
WO2016097751A1 (en) 2014-12-18 2016-06-23 The University Of Bath Method of cas9 mediated genome engineering
CN104745626B (en) 2014-12-19 2018-05-01 中国航天员科研训练中心 A kind of fast construction method of conditional gene knockout animal model and application
WO2016100974A1 (en) 2014-12-19 2016-06-23 The Broad Institute Inc. Unbiased identification of double-strand breaks and genomic rearrangement by genome-wide insert capture sequencing
JP6947638B2 (en) 2014-12-20 2021-10-13 アーク バイオ, エルエルシー Compositions and Methods for Targeted Depletion, Enrichment and Division of Nucleic Acids Using CRISPR / CAS Proteins
CN104560864B (en) 2014-12-22 2017-08-11 中国科学院微生物研究所 Utilize the 293T cell lines of the knockout IFN β genes of CRISPR Cas9 system constructings
US10190106B2 (en) 2014-12-22 2019-01-29 Univesity Of Massachusetts Cas9-DNA targeting unit chimeras
US11053271B2 (en) 2014-12-23 2021-07-06 The Regents Of The University Of California Methods and compositions for nucleic acid integration
WO2016106236A1 (en) 2014-12-23 2016-06-30 The Broad Institute Inc. Rna-targeting system
WO2016103233A2 (en) 2014-12-24 2016-06-30 Dana-Farber Cancer Institute, Inc. Systems and methods for genome modification and regulation
CN104651398A (en) 2014-12-24 2015-05-27 杭州师范大学 Method for knocking out microRNA gene family by utilizing CRISPR-Cas9 specificity
AU2015369725A1 (en) 2014-12-24 2017-06-29 Massachusetts Institute Of Technology CRISPR having or associated with destabilization domains
AU2015101792A4 (en) 2014-12-24 2016-01-28 Massachusetts Institute Of Technology Engineering of systems, methods and optimized enzyme and guide scaffolds for sequence manipulation
WO2016104716A1 (en) 2014-12-26 2016-06-30 国立研究開発法人理化学研究所 Gene knockout method
WO2016109255A1 (en) 2014-12-30 2016-07-07 University Of South Florida Methods and compositions for cloning into large vectors
CN104498493B (en) 2014-12-30 2017-12-26 武汉大学 The method of CRISPR/Cas9 specific knockdown hepatitis type B viruses and the gRNA for selectively targeted HBV DNA
WO2016108926A1 (en) 2014-12-30 2016-07-07 The Broad Institute Inc. Crispr mediated in vivo modeling and genetic screening of tumor growth and metastasis
EP3240889A4 (en) 2014-12-31 2018-06-20 Synthetic Genomics, Inc. Compositions and methods for high efficiency in vivo genome editing
CN104651399B (en) 2014-12-31 2018-11-16 广西大学 A method of gene knockout being realized in Pig embryos cell using CRISPR/Cas system
DK3242949T3 (en) 2015-01-06 2022-01-24 Dsm Ip Assets Bv CRISPR-CAS SYSTEM FOR A HOST HOST CELL
CN108064280B (en) 2015-01-06 2021-10-29 延世大学校产学协力团 Composition for treating hemophilia A using endonuclease with coagulation factor VIII gene as target
CN104651392B (en) 2015-01-06 2018-07-31 华南农业大学 A method of obtaining temp-sensing sterile line using CRISPR/Cas9 system rite-directed mutagenesis P/TMS12-1
DK3242948T3 (en) 2015-01-06 2022-03-07 Dsm Ip Assets Bv CRISPR CAS SYSTEM FOR A YARROWIA HOST CELL
DK3242950T3 (en) 2015-01-06 2021-12-20 Dsm Ip Assets Bv CRISPR-CAS SYSTEM FOR A WIRED MUSHROOM MUSHROOM HOST CELL
WO2016112242A1 (en) * 2015-01-08 2016-07-14 President And Fellows Of Harvard College Split cas9 proteins
CN104593422A (en) 2015-01-08 2015-05-06 中国农业大学 Method of cloning reproductive and respiratory syndrome resisting pig
WO2016112351A1 (en) 2015-01-09 2016-07-14 Bio-Rad Laboratories, Inc. Detection of genome editing
CN107250373A (en) 2015-01-12 2017-10-13 麻省理工学院 The gene editing realized is delivered by microfluid
US11208638B2 (en) 2015-01-12 2021-12-28 The Regents Of The University Of California Heterodimeric Cas9 and methods of use thereof
WO2016112963A1 (en) 2015-01-13 2016-07-21 Riboxx Gmbh Delivery of biomolecules into cells
CA2972740A1 (en) 2015-01-14 2016-07-21 Universite D'aix-Marseille Proteasome inhibitors for treating a disorder related to an accumulation of non-degraded abnormal protein or a cancer
MA41349A (en) 2015-01-14 2017-11-21 Univ Temple RNA-GUIDED ERADICATION OF HERPES SIMPLEX TYPE I AND OTHER ASSOCIATED HERPES VIRUSES
WO2016115326A1 (en) 2015-01-15 2016-07-21 The Board Of Trustees Of The Leland Stanford Junior University Methods for modulating genome editing
CN104611370A (en) 2015-01-16 2015-05-13 深圳市科晖瑞生物医药有限公司 Method for rejecting B2M (beta 2-microglobulin) gene segment
KR102085189B1 (en) 2015-01-19 2020-04-28 인스티튜트 오브 제네틱스 앤드 디벨롭멘털 바이오롤지, 차이니즈 아카데미 오브 사이언시스 Sophisticated plant modification method through temporary gene expression
CN104725626B (en) 2015-01-22 2016-06-29 漳州亚邦化学有限公司 A kind of preparation method of the unsaturated-resin suitable in artificial quartz in lump
CN105821072A (en) 2015-01-23 2016-08-03 深圳华大基因研究院 CRISPR-Cas9 system used for assembling DNA and DNA assembly method
WO2016123071A1 (en) 2015-01-26 2016-08-04 Cold Spring Harbor Laboratory Methods of identifying essential protein domains
CN104561095B (en) 2015-01-27 2017-08-22 深圳市国创纳米抗体技术有限公司 A kind of preparation method for the transgenic mice that can produce growth factor of human nerve
US10059940B2 (en) 2015-01-27 2018-08-28 Minghong Zhong Chemically ligated RNAs for CRISPR/Cas9-lgRNA complexes as antiviral therapeutic agents
WO2016123243A1 (en) 2015-01-28 2016-08-04 The Regents Of The University Of California Methods and compositions for labeling a single-stranded target nucleic acid
JP6835726B2 (en) 2015-01-28 2021-02-24 パイオニア ハイ−ブレッド インターナショナル, インコーポレイテッド CRISPR hybrid DNA / RNA polynucleotide and usage
EP3798302A1 (en) 2015-01-29 2021-03-31 Meiogenix Method for inducing targeted meiotic recombinations
CN107429254B (en) 2015-01-30 2021-10-15 加利福尼亚大学董事会 Protein delivery in primary hematopoietic cells
CN107849563B (en) 2015-02-02 2021-10-19 梅里特斯英国第二有限公司 Gene expression regulation by aptamer-mediated regulation of alternative splicing
CN104593418A (en) 2015-02-06 2015-05-06 中国医学科学院医学实验动物研究所 Method for establishing humanized rat drug evaluation animal model
WO2016130600A2 (en) 2015-02-09 2016-08-18 Duke University Compositions and methods for epigenome editing
KR101584933B1 (en) 2015-02-10 2016-01-13 성균관대학교산학협력단 Recombinant vector for inhibiting antibiotic resistance and uses thereof
WO2016130697A1 (en) 2015-02-11 2016-08-18 Memorial Sloan Kettering Cancer Center Methods and kits for generating vectors that co-express multiple target molecules
CN104928321B (en) 2015-02-12 2018-06-01 中国科学院西北高原生物研究所 A kind of scale loss zebra fish pattern and method for building up by Crispr/Cas9 inductions
CN104726494B (en) 2015-02-12 2018-10-23 中国人民解放军第二军医大学 The method that CRISPR-Cas9 technologies build chromosome translocation stem cell and animal model
US10584321B2 (en) 2015-02-13 2020-03-10 University Of Massachusetts Compositions and methods for transient delivery of nucleases
US20160244784A1 (en) 2015-02-15 2016-08-25 Massachusetts Institute Of Technology Population-Hastened Assembly Genetic Engineering
WO2016132122A1 (en) 2015-02-17 2016-08-25 University Of Edinburgh Assay construct
WO2016133165A1 (en) 2015-02-19 2016-08-25 国立大学法人徳島大学 METHOD FOR TRANSFERRING Cas9 mRNA INTO MAMMALIAN FERTILIZED EGG BY ELECTROPORATION
EP3262162A4 (en) 2015-02-23 2018-08-08 Voyager Therapeutics, Inc. Regulatable expression using adeno-associated virus (aav)
CN107532168A (en) 2015-02-23 2018-01-02 克里斯珀医疗股份公司 Treat the material and method of hemoglobinopathy
EP3262173A2 (en) 2015-02-23 2018-01-03 Crispr Therapeutics AG Materials and methods for treatment of human genetic diseases including hemoglobinopathies
US20180002715A1 (en) 2015-02-25 2018-01-04 Pioneer Hi-Bred International, Inc. Composition and methods for regulated expression of a guide rna/cas endonuclease complex
KR20160103953A (en) 2015-02-25 2016-09-02 연세대학교 산학협력단 Method for target DNA enrichment using CRISPR system
WO2016135507A1 (en) 2015-02-27 2016-09-01 University Of Edinburgh Nucleic acid editing systems
CN104805099B (en) 2015-03-02 2018-04-13 中国人民解放军第二军医大学 A kind of nucleic acid molecules and its expression vector of safe coding Cas9 albumen
AU2016226077B2 (en) 2015-03-03 2021-12-23 The General Hospital Corporation Engineered CRISPR-Cas9 nucleases with altered PAM specificity
CN104651401B (en) 2015-03-05 2019-03-08 东华大学 A kind of method that mir-505 diallele knocks out
CN104673816A (en) 2015-03-05 2015-06-03 广东医学院 PCr-NHEJ (non-homologous end joining) carrier as well as construction method of pCr-NHEJ carrier and application of pCr-NHEJ carrier in site-specific knockout of bacterial genes
US20160264934A1 (en) 2015-03-11 2016-09-15 The General Hospital Corporation METHODS FOR MODULATING AND ASSAYING m6A IN STEM CELL POPULATIONS
WO2016145150A2 (en) 2015-03-11 2016-09-15 The Broad Institute Inc. Selective treatment of prmt5 dependent cancer
GB201504223D0 (en) 2015-03-12 2015-04-29 Genome Res Ltd Biallelic genetic modification
WO2016141893A1 (en) 2015-03-12 2016-09-15 中国科学院遗传与发育生物学研究所 Method for increasing ability of plant to resist invading dna virus
CA3091771A1 (en) 2015-03-13 2016-09-22 The Jackson Laboratory A three-component crispr/cas complex system and uses thereof
EP3279321A4 (en) 2015-03-16 2018-10-31 Institute Of Genetics And Developmental Biology, Chinese Academy Of Sciences Method of applying non-genetic substance to perform site-directed reform of plant genome
CN106032540B (en) 2015-03-16 2019-10-25 中国科学院上海生命科学研究院 Gland relevant viral vector building of CRISPR/Cas9 endonuclease enzyme system and application thereof
WO2016149547A1 (en) 2015-03-17 2016-09-22 Bio-Rad Laboratories, Inc. Detection of genome editing
WO2016149484A2 (en) 2015-03-17 2016-09-22 Temple University Of The Commonwealth System Of Higher Education Compositions and methods for specific reactivation of hiv latent reservoir
MA41382A (en) 2015-03-20 2017-11-28 Univ Temple GENE EDITING BASED ON THE TAT-INDUCED CRISPR / ENDONUCLEASE SYSTEM
EP3271461A1 (en) 2015-03-20 2018-01-24 Danmarks Tekniske Universitet Crispr/cas9 based engineering of actinomycetal genomes
CN104726449A (en) 2015-03-23 2015-06-24 国家纳米科学中心 CRISPR-Cas9 system for preventing and/or treating HIV, as well as preparation method and application thereof
CN106148416B (en) 2015-03-24 2019-12-17 华东师范大学 Method for breeding Cyp gene knockout rat and method for preparing liver microsome thereof
US20180112213A1 (en) 2015-03-25 2018-04-26 Editas Medicine, Inc. Crispr/cas-related methods, compositions and components
WO2016154579A2 (en) 2015-03-26 2016-09-29 Editas Medicine, Inc. Crispr/cas-mediated gene conversion
CA2981509A1 (en) 2015-03-30 2016-10-06 The Board Of Regents Of The Nevada System Of Higher Educ. On Behalf Of The University Of Nevada, La Compositions comprising talens and methods of treating hiv
KR20180029953A (en) 2015-03-31 2018-03-21 엑셀리겐 사이언티픽, 인코포레이티드 The Cas 9 retrovirus integrase system and the Cas 9 recombinant enzyme system for targeting incorporation of DNA sequences into the genome of cells or organisms
AU2016244033A1 (en) 2015-04-01 2017-10-19 Editas Medicine, Inc. CRISPR/CAS-related methods and compositions for treating Duchenne Muscular Dystrophy and Becker Muscular Dystrophy
WO2016161260A1 (en) 2015-04-02 2016-10-06 Agenovir Corporation Gene delivery methods and compositions
CN106167810A (en) 2015-04-03 2016-11-30 内蒙古中科正标生物科技有限责任公司 Monocot genes knockout carrier based on CRISPR/Cas9 technology and application thereof
AU2016243052C1 (en) 2015-04-03 2022-11-24 Dana-Farber Cancer Institute, Inc. Composition and methods of genome editing of B-cells
US20170166928A1 (en) 2015-04-03 2017-06-15 Whitehead Institute For Biomedical Research Compositions And Methods For Genetically Modifying Yeast
EP3280803B1 (en) 2015-04-06 2021-05-26 The Board of Trustees of the Leland Stanford Junior University Chemically modified guide rnas for crispr/cas-mediated gene regulation
US11214779B2 (en) 2015-04-08 2022-01-04 University of Pittsburgh—of the Commonwealth System of Higher Education Activatable CRISPR/CAS9 for spatial and temporal control of genome editing
US11390860B2 (en) 2015-04-13 2022-07-19 The University Of Tokyo Set of polypeptides exhibiting nuclease activity or nickase activity with dependence on light or in presence of drug or suppressing or activating expression of target gene
US10155938B2 (en) 2015-04-14 2018-12-18 City Of Hope Coexpression of CAS9 and TREX2 for targeted mutagenesis
GB201506509D0 (en) 2015-04-16 2015-06-03 Univ Wageningen Nuclease-mediated genome editing
US11299729B2 (en) 2015-04-17 2022-04-12 President And Fellows Of Harvard College Vector-based mutagenesis system
US10738290B2 (en) 2015-04-21 2020-08-11 Novartis Ag RNA-guided gene editing system and uses thereof
CN104762321A (en) 2015-04-22 2015-07-08 东北林业大学 Knockout vector construction method based on CRISPR/Cas9 system target knockout KHV gene and crNRA prototype thereof
CN104805118A (en) 2015-04-22 2015-07-29 扬州大学 Method for targeted knockout of specific gene of Suqin yellow chicken embryonic stem cell
US11268158B2 (en) 2015-04-24 2022-03-08 St. Jude Children's Research Hospital, Inc. Assay for safety assessment of therapeutic genetic manipulations, gene therapy vectors and compounds
CN107614012A (en) 2015-04-24 2018-01-19 加利福尼亚大学董事会 Using the cell detection of engineering, monitoring or treatment disease or the system of the patient's condition and preparation and use their method
AU2016253150B2 (en) 2015-04-24 2022-04-21 Editas Medicine, Inc. Evaluation of Cas9 molecule/guide RNA molecule complexes
EP3288594B1 (en) 2015-04-27 2022-06-29 The Trustees of The University of Pennsylvania Dual aav vector system for crispr/cas9 mediated correction of human disease
EP3289081B1 (en) 2015-04-27 2019-03-27 Genethon Compositions and methods for the treatment of nucleotide repeat expansion disorders
EP3087974A1 (en) 2015-04-29 2016-11-02 Rodos BioTarget GmbH Targeted nanocarriers for targeted drug delivery of gene therapeutics
WO2016176404A1 (en) 2015-04-30 2016-11-03 The Brigham And Women's Hospital, Inc. Methods and kits for cloning-free genome editing
WO2016176690A2 (en) 2015-04-30 2016-11-03 The Trustees Of Columbia University In The City Of New York Gene therapy for autosomal dominant diseases
DK3289076T3 (en) 2015-05-01 2022-01-17 Prec Biosciences Inc PRECISE DELETION OF CHROMOSOMAL SEQUENCES IN VIVO
US20160346359A1 (en) 2015-05-01 2016-12-01 Spark Therapeutics, Inc. Adeno-associated Virus-Mediated CRISPR-Cas9 Treatment of Ocular Disease
CN108026566A (en) 2015-05-04 2018-05-11 特拉维夫大学拉莫特有限公司 For making the method and kit of DNA fragmentation
CN104894068A (en) 2015-05-04 2015-09-09 南京凯地生物科技有限公司 Method for preparing CAR-T cell by CRISPR/Cas9
GB2531454A (en) 2016-01-10 2016-04-20 Snipr Technologies Ltd Recombinogenic nucleic acid strands in situ
KR20200091499A (en) 2015-05-06 2020-07-30 스니프르 테크놀로지스 리미티드 Altering microbial populations & modifying microbiota
WO2016182893A1 (en) 2015-05-08 2016-11-17 Teh Broad Institute Inc. Functional genomics using crispr-cas systems for saturating mutagenesis of non-coding elements, compositions, methods, libraries and applications thereof
EP3294873B1 (en) 2015-05-08 2020-08-19 The Children's Medical Center Corporation Targeting bcl11a enhancer functional regions for fetal hemoglobin reinduction
EP3294896A1 (en) 2015-05-11 2018-03-21 Editas Medicine, Inc. Optimized crispr/cas9 systems and methods for gene editing in stem cells
CA2985615A1 (en) 2015-05-11 2016-11-17 Editas Medicine, Inc. Crispr/cas-related methods and compositions for treating hiv infection and aids
KR101785847B1 (en) 2015-05-12 2017-10-17 연세대학교 산학협력단 Targeted genome editing based on CRISPR/Cas9 system using short linearized double-stranded DNA
IL284707B2 (en) 2015-05-12 2024-01-01 Sangamo Therapeutics Inc Nuclease-mediated regulation of gene expression
EP3294343A4 (en) 2015-05-13 2018-09-26 Seattle Children's Hospital, dba Seattle Children's Research Institute Enhancing endonuclease based gene editing in primary cells
CN105886498A (en) 2015-05-13 2016-08-24 沈志荣 Method for specifically knocking out human PCSK9 gene by virtue of CRISPR-Cas9 and sgRNA for specifically targeting PCSK9 gene
WO2016183402A2 (en) 2015-05-13 2016-11-17 President And Fellows Of Harvard College Methods of making and using guide rna for use with cas9 systems
US11267899B2 (en) 2015-05-13 2022-03-08 Zumutor Biologics Inc. Afucosylated protein, cell expressing said protein and associated methods
US11535871B2 (en) 2015-05-14 2022-12-27 University Of Southern California Optimized gene editing utilizing a recombinant endonuclease system
US20180291372A1 (en) 2015-05-14 2018-10-11 Massachusetts Institute Of Technology Self-targeting genome editing system
MX2017014560A (en) 2015-05-15 2018-03-01 Pioneer Hi Bred Int Rapid characterization of cas endonuclease systems, pam sequences and guide rna elements.
JP2018515142A (en) 2015-05-15 2018-06-14 ダーマコン,インコーポレイテッド. Synthetic single guide RNA for CAS9-mediated gene editing
PT3298134T (en) 2015-05-16 2023-08-18 Genzyme Corp Gene editing of deep intronic mutations
EP3298149A1 (en) 2015-05-18 2018-03-28 King Abdullah University Of Science And Technology Method of inhibiting plant virus pathogen infections by crispr/cas9-mediated interference
CN104846010B (en) 2015-05-18 2018-07-06 安徽省农业科学院水稻研究所 A kind of method for deleting transgenic paddy rice riddled basins
EP3095870A1 (en) 2015-05-19 2016-11-23 Kws Saat Se Methods for the in planta transformation of plants and manufacturing processes and products based and obtainable therefrom
CN106011104B (en) 2015-05-21 2019-09-27 清华大学 Gene editing and expression regulation method are carried out using Cas system is split
US20160340622A1 (en) 2015-05-22 2016-11-24 Nabil Radi Abdou Bar Soap Anchoring Core
CN105518135B (en) 2015-05-22 2020-11-24 深圳市第二人民医院 Method for specifically knocking out pig CMAH gene by CRISPR-Cas9 and sgRNA for specifically targeting CMAH gene
WO2016187904A1 (en) 2015-05-22 2016-12-01 深圳市第二人民医院 Method for pig cmah gene specific knockout by means of crispr-cas9 and sgrna for specially targeting cmah gene
WO2016187717A1 (en) 2015-05-26 2016-12-01 Exerkine Corporation Exosomes useful for genome editing
WO2016191684A1 (en) 2015-05-28 2016-12-01 Finer Mitchell H Genome editing vectors
CN105624146B (en) 2015-05-28 2019-02-15 中国科学院微生物研究所 Molecular cloning method based on CRISPR/Cas9 and brewing yeast cell endogenous homologous recombination
CN104894075B (en) 2015-05-28 2019-08-06 华中农业大学 CRISPR/Cas9 and Cre/lox system editor's Pseudorabies virus genome prepares vaccine approach and application
WO2016196282A1 (en) 2015-05-29 2016-12-08 Agenovir Corporation Compositions and methods for cell targeted hpv treatment
EP3302556A4 (en) 2015-05-29 2018-12-05 Clark Atlanta University Human cell lines mutant for zic2
EP3303607A4 (en) 2015-05-29 2018-10-10 North Carolina State University Methods for screening bacteria, archaea, algae, and yeast using crispr nucleic acids
US20160350476A1 (en) 2015-05-29 2016-12-01 Agenovir Corporation Antiviral methods and compositions
US10117911B2 (en) 2015-05-29 2018-11-06 Agenovir Corporation Compositions and methods to treat herpes simplex virus infections
US20160346362A1 (en) 2015-05-29 2016-12-01 Agenovir Corporation Methods and compositions for treating cytomegalovirus infections
US20160348074A1 (en) 2015-05-29 2016-12-01 Agenovir Corporation Methods and compositions for treating cells for transplant
WO2016196273A1 (en) 2015-05-29 2016-12-08 Agenovir Corporation Compositions and methods to treat viral infections
KR102553518B1 (en) 2015-06-01 2023-07-07 템플 유니버시티-오브 더 커먼웰쓰 시스템 오브 하이어 에듀케이션 Methods and compositions for RNA-guided treatment of HIV infection
WO2016191869A1 (en) 2015-06-01 2016-12-08 The Hospital For Sick Children Delivery of structurally diverse polypeptide cargo into mammalian cells by a bacterial toxin
CN105112445B (en) 2015-06-02 2018-08-10 广州辉园苑医药科技有限公司 A kind of miR-205 gene knockout kits based on CRISPR-Cas9 gene Knockouts
EP3303585A4 (en) 2015-06-03 2018-10-31 Board of Regents of the University of Nebraska Dna editing using single-stranded dna
EP3303634B1 (en) 2015-06-03 2023-08-30 The Regents of The University of California Cas9 variants and methods of use thereof
US20180245074A1 (en) 2015-06-04 2018-08-30 Protiva Biotherapeutics, Inc. Treating hepatitis b virus infection using crispr
WO2016197133A1 (en) 2015-06-04 2016-12-08 Protiva Biotherapeutics, Inc. Delivering crispr therapeutics with lipid nanoparticles
CN105039339B (en) 2015-06-05 2017-12-19 新疆畜牧科学院生物技术研究所 A kind of method of specific knockdown sheep FecB genes with RNA mediations and its special sgRNA
EP3334823A4 (en) 2015-06-05 2019-05-22 The Regents of The University of California Methods and compositions for generating crispr/cas guide rnas
WO2016201047A1 (en) * 2015-06-09 2016-12-15 Editas Medicine, Inc. Crispr/cas-related methods and compositions for improving transplantation
CN107820516B (en) 2015-06-10 2022-03-04 弗门尼舍有限公司 Method for identifying musk compounds
WO2016198500A1 (en) 2015-06-10 2016-12-15 INSERM (Institut National de la Santé et de la Recherche Médicale) Methods and compositions for rna-guided treatment of human cytomegalovirus (hcmv) infection
ES2961258T3 (en) 2015-06-10 2024-03-11 Firmenich & Cie Cell lines for screening aroma and odor receptors
US20160362667A1 (en) 2015-06-10 2016-12-15 Caribou Biosciences, Inc. CRISPR-Cas Compositions and Methods
WO2016197361A1 (en) 2015-06-11 2016-12-15 深圳市第二人民医院 Method for specific knockout of swine ggta1 gene using crispr-cas9 specificity, and sgrna used for specifically targeting ggta1 gene
CN105518138B (en) 2015-06-11 2021-07-27 深圳市第二人民医院 Method for specifically knocking out pig GFRA1 gene by CRISPR-Cas9 and sgRNA for specifically targeting GFRA1 gene
WO2016197359A1 (en) 2015-06-11 2016-12-15 深圳市第二人民医院 Method for specific knockout of swine sla-1 gene using crispr-cas9 specificity, and sgrna used for specifically targeting sla-1 gene
WO2016197354A1 (en) 2015-06-11 2016-12-15 深圳市第二人民医院 Crispr-cas9 method for specific knockout of swine pdx1 gene and sgrna for use in targeting specifically pdx1 gene
CN105518139B (en) 2015-06-11 2021-02-02 深圳市第二人民医院 Method for specifically knocking out pig FGL2 gene by CRISPR-Cas9 and sgRNA for specifically targeting FGL2 gene
WO2016197356A1 (en) 2015-06-11 2016-12-15 深圳市第二人民医院 Method for knockout of swine sla-2 gene using crispr-cas9 specificity, and sgrna used for specifically targeting sla-2 gene
CN105518137B (en) 2015-06-11 2021-04-30 深圳市第二人民医院 Method for specifically knocking out pig SALL1 gene by CRISPR-Cas9 and sgRNA for specifically targeting SALL1 gene
WO2016197362A1 (en) 2015-06-11 2016-12-15 深圳市第二人民医院 Method for specific knockout of swine vwf gene using crispr-cas9 specificity, and sgrna used for specifically targeting vwf gene
CN106414740A (en) 2015-06-11 2017-02-15 深圳市第二人民医院 Method for specific knockout of swine SLA-3 gene using CRISPR-Cas9 specificity, and sgRNA used for specifically targeting sla-3 gene
WO2016201138A1 (en) 2015-06-12 2016-12-15 The Regents Of The University Of California Reporter cas9 variants and methods of use thereof
EP3307888A1 (en) 2015-06-12 2018-04-18 Erasmus University Medical Center Rotterdam New crispr assays
GB201510296D0 (en) 2015-06-12 2015-07-29 Univ Wageningen Thermostable CAS9 nucleases
JP7051438B2 (en) 2015-06-15 2022-04-11 ノース カロライナ ステート ユニバーシティ Methods and Compositions for Efficient Delivery of Nucleic Acid and RNA-Based Antibacterial Agents
WO2016205728A1 (en) 2015-06-17 2016-12-22 Massachusetts Institute Of Technology Crispr mediated recording of cellular events
JP2018518182A (en) 2015-06-17 2018-07-12 ザ ユーエービー リサーチ ファンデーション CRISPR / CAS9 complex for genome editing
WO2016205623A1 (en) 2015-06-17 2016-12-22 North Carolina State University Methods and compositions for genome editing in bacteria using crispr-cas9 systems
US11555207B2 (en) 2015-06-17 2023-01-17 The Uab Research Foundation CRISPR/Cas9 complex for introducing a functional polypeptide into cells of blood cell lineage
US10954513B2 (en) 2015-06-18 2021-03-23 University Of Utah Research Foundation RNA-guided transcriptional regulation and methods of using the same for the treatment of back pain
CA3012607A1 (en) 2015-06-18 2016-12-22 The Broad Institute Inc. Crispr enzymes and systems
RU2752834C2 (en) 2015-06-18 2021-08-09 Те Брод Инститьют, Инк. Crispr enzyme mutations reducing non-targeted effects
WO2016205745A2 (en) 2015-06-18 2016-12-22 The Broad Institute Inc. Cell sorting
CA3012631A1 (en) 2015-06-18 2016-12-22 The Broad Institute Inc. Novel crispr enzymes and systems
US9790490B2 (en) 2015-06-18 2017-10-17 The Broad Institute Inc. CRISPR enzymes and systems
WO2016205759A1 (en) 2015-06-18 2016-12-22 The Broad Institute Inc. Engineering and optimization of systems, methods, enzymes and guide scaffolds of cas9 orthologs and variants for sequence manipulation
US9957501B2 (en) 2015-06-18 2018-05-01 Sangamo Therapeutics, Inc. Nuclease-mediated regulation of gene expression
GB201511376D0 (en) 2015-06-29 2015-08-12 Ecolab Usa Inc Process for the treatment of produced water from chemical enhanced oil recovery
US11279928B2 (en) 2015-06-29 2022-03-22 Massachusetts Institute Of Technology Compositions comprising nucleic acids and methods of using the same
WO2017004261A1 (en) 2015-06-29 2017-01-05 Ionis Pharmaceuticals, Inc. Modified crispr rna and modified single crispr rna and uses thereof
WO2017001572A1 (en) 2015-06-30 2017-01-05 Cellectis Methods for improving functionality in nk cell by gene inactivation using specific endonuclease
KR20180041120A (en) 2015-07-02 2018-04-23 더 존스 홉킨스 유니버시티 CPRISPR / CAS9-based therapy
CN108026523B (en) 2015-07-06 2021-11-30 帝斯曼知识产权资产管理有限公司 Guide RNA assembly vector
US20170009242A1 (en) 2015-07-06 2017-01-12 Whitehead Institute For Biomedical Research CRISPR-Mediated Genome Engineering for Protein Depletion
CN105132451B (en) 2015-07-08 2019-07-23 电子科技大学 A kind of single transcriptional units directed modification skeleton carrier of CRISPR/Cas9 and its application
US10450585B2 (en) 2015-07-13 2019-10-22 Sangamo Therapeutics, Inc. Delivery methods and compositions for nuclease-mediated genome engineering
US20170014449A1 (en) 2015-07-13 2017-01-19 Elwha LLC, a limited liability company of the State of Delaware Site-specific epigenetic editing
WO2017009399A1 (en) 2015-07-13 2017-01-19 Institut Pasteur Improving sequence-specific antimicrobials by blocking dna repair
US11390865B2 (en) 2015-07-14 2022-07-19 Fukuoka University Method for introducing site-directed RNA mutation, target editing guide RNA used in the method and target RNA-target editing guide RNA complex
MA42895A (en) 2015-07-15 2018-05-23 Juno Therapeutics Inc MODIFIED CELLS FOR ADOPTIVE CELL THERAPY
WO2017011721A1 (en) 2015-07-15 2017-01-19 Rutgers, The State University Of New Jersey Nuclease-independent targeted gene editing platform and uses thereof
US20170020922A1 (en) 2015-07-16 2017-01-26 Batu Biologics Inc. Gene editing for immunological destruction of neoplasia
WO2017015015A1 (en) 2015-07-17 2017-01-26 Emory University Crispr-associated protein from francisella and uses related thereto
WO2017015101A1 (en) 2015-07-17 2017-01-26 University Of Washington Methods for maximizing the efficiency of targeted gene correction
EP3325018A4 (en) 2015-07-22 2019-04-24 Duke University High-throughput screening of regulatory element function with epigenome editing technologies
US10392674B2 (en) 2015-07-22 2019-08-27 President And Fellows Of Harvard College Evolution of site-specific recombinases
AU2016297167A1 (en) 2015-07-23 2018-02-22 Mayo Foundation For Medical Education And Research Editing mitochondrial DNA
CN108025074A (en) 2015-07-25 2018-05-11 哈比卜·弗罗斯特 For providing treatment or the systems, devices and methods cured for cancer and other pathological states
CN106399360A (en) 2015-07-27 2017-02-15 上海药明生物技术有限公司 FUT8 gene knockout method based on CRISPR technology
CN105063061B (en) 2015-07-28 2018-10-30 华南农业大学 A kind of rice mass of 1000 kernel gene tgw6 mutant and the preparation method and application thereof
WO2017019867A1 (en) 2015-07-28 2017-02-02 Danisco Us Inc Genome editing systems and methods of use
CN106701808A (en) 2015-07-29 2017-05-24 深圳华大基因研究院 DNA polymerase I defective strain and construction method thereof
US10612011B2 (en) 2015-07-30 2020-04-07 President And Fellows Of Harvard College Evolution of TALENs
WO2017069829A2 (en) 2015-07-31 2017-04-27 The Trustees Of Columbia University In The City Of New York High-throughput strategy for dissecting mammalian genetic interactions
EP3328399B1 (en) 2015-07-31 2023-12-27 Regents of the University of Minnesota Modified cells and methods of therapy
US20180230450A1 (en) 2015-08-03 2018-08-16 President And Fellows Of Harvard College Cas9 Genome Editing and Transcriptional Regulation
WO2017024047A1 (en) 2015-08-03 2017-02-09 Emendobio Inc. Compositions and methods for increasing nuclease induced recombination rate in cells
EP3331906A1 (en) 2015-08-06 2018-06-13 Dana-Farber Cancer Institute, Inc. Tunable endogenous protein degradation
CN104962523B (en) 2015-08-07 2018-05-25 苏州大学 A kind of method for measuring non-homologous end joining repairing activity
US11606940B2 (en) 2015-08-07 2023-03-21 Commonwealth Scientific And Industrial Research Organisation Method for producing an animal comprising a germline genetic modification
US9580727B1 (en) 2015-08-07 2017-02-28 Caribou Biosciences, Inc. Compositions and methods of engineered CRISPR-Cas9 systems using split-nexus Cas9-associated polynucleotides
KR20180041152A (en) 2015-08-11 2018-04-23 셀렉티스 Cells for immunotherapy engineered for CD38 antigen targeting and CD38 gene inactivation
CN105255937A (en) 2015-08-14 2016-01-20 西北农林科技大学 Method for expression of CRISPR sgRNA by eukaryotic cell III-type promoter and use thereof
WO2017028768A1 (en) 2015-08-14 2017-02-23 Institute Of Genetics And Developmental Biology, Chinese Academy Of Sciences Method for obtaining glyphosate-resistant rice by site-directed nucleotide substitution
EP3337898B1 (en) 2015-08-19 2021-07-28 Arc Bio, LLC Capture of nucleic acids using a nucleic acid-guided nuclease-based system
CN105112519A (en) 2015-08-20 2015-12-02 郑州大学 CRISPR-based Escherichia coli O157:H7 strain detection reagent box and detection method
WO2017031483A1 (en) 2015-08-20 2017-02-23 Applied Stemcell, Inc. Nuclease with enhanced efficiency of genome editing
CN105177126B (en) 2015-08-21 2018-12-04 东华大学 It is a kind of using Fluorescence PCR assay to the Classification Identification method of mouse
EP3341727B1 (en) 2015-08-25 2022-08-10 Duke University Compositions and methods of improving specificity in genomic engineering using rna-guided endonucleases
CN106480083B (en) 2015-08-26 2021-12-14 中国科学院分子植物科学卓越创新中心 CRISPR/Cas 9-mediated large-fragment DNA splicing method
US9512446B1 (en) 2015-08-28 2016-12-06 The General Hospital Corporation Engineered CRISPR-Cas9 nucleases
AU2016316845B2 (en) 2015-08-28 2022-03-10 The General Hospital Corporation Engineered CRISPR-Cas9 nucleases
US9926546B2 (en) 2015-08-28 2018-03-27 The General Hospital Corporation Engineered CRISPR-Cas9 nucleases
US20170058272A1 (en) 2015-08-31 2017-03-02 Caribou Biosciences, Inc. Directed nucleic acid repair
CN105087620B (en) 2015-08-31 2017-12-29 中国农业大学 One kind is overexpressed the 1BB carriers of pig costimulation acceptor 4 and its application
US10526590B2 (en) 2015-08-31 2020-01-07 Agilent Technologies, Inc. Compounds and methods for CRISPR/Cas-based genome editing by homologous recombination
WO2017040793A1 (en) 2015-09-01 2017-03-09 Dana-Farber Cancer Institute Inc. Systems and methods for selection of grna targeting strands for cas9 localization
EP3344756A4 (en) 2015-09-02 2019-09-04 University of Massachusetts Detection of gene loci with crispr arrayed repeats and/or polychromatic single guide ribonucleic acids
US20180251789A1 (en) 2015-09-04 2018-09-06 Massachusetts Institute Of Technology Multilayer genetic safety kill circuits based on single cas9 protein and multiple engineered grna in mammalian cells
CN105400810B (en) 2015-09-06 2019-05-07 吉林大学 The method that phosphopenic rickets model is established using knockout technology
EP3347464B1 (en) 2015-09-08 2024-01-24 University of Massachusetts Dnase h activity of neisseria meningitidis cas9
US10767173B2 (en) 2015-09-09 2020-09-08 National University Corporation Kobe University Method for converting genome sequence of gram-positive bacterium by specifically converting nucleic acid base of targeted DNA sequence, and molecular complex used in same
ES2902338T3 (en) 2015-09-09 2022-03-28 Univ Kobe Nat Univ Corp Method for modifying a genomic sequence that specifically converts a nucleobase of a target DNA sequence, and molecular complex used in said method
WO2017044776A1 (en) 2015-09-10 2017-03-16 Texas Tech University System Single-guide rna (sgrna) with improved knockout efficiency
CN108291224A (en) 2015-09-10 2018-07-17 优美佳生物技术有限公司 Method and composition for treating glaucoma
CN105274144A (en) 2015-09-14 2016-01-27 徐又佳 Preparation method of zebrafish with hepcidin gene knocked out by use of CRISPR / Cas9 technology
US10301613B2 (en) 2015-09-15 2019-05-28 Arizona Board Of Regents On Behalf Of Arizona State University Targeted remodeling of prokaryotic genomes using CRISPR-nickases
US10109551B2 (en) 2015-09-15 2018-10-23 Intel Corporation Methods and apparatuses for determining a parameter of a die
CN105210981B (en) 2015-09-15 2018-09-28 中国科学院生物物理研究所 Establish the method and its application for the ferret model that can be applied to human diseases research
CN105112422B (en) 2015-09-16 2019-11-08 中山大学 Gene miR408 and UCL is cultivating the application in high-yield rice
WO2017049129A2 (en) 2015-09-18 2017-03-23 President And Fellows Of Harvard College Methods of making guide rna
US20180237800A1 (en) 2015-09-21 2018-08-23 The Regents Of The University Of California Compositions and methods for target nucleic acid modification
CN108350454B (en) 2015-09-21 2022-05-10 阿克丘勒斯治疗公司 Allele-selective gene editing and uses thereof
CN105132427B (en) 2015-09-21 2019-01-08 新疆畜牧科学院生物技术研究所 A kind of dual-gene method for obtaining gene editing sheep of specific knockdown mediated with RNA and its dedicated sgRNA
US10435441B2 (en) 2015-09-23 2019-10-08 Sangamo Therapeutics, Inc. HTT repressors and uses thereof
WO2017053879A1 (en) 2015-09-24 2017-03-30 Editas Medicine, Inc. Use of exonucleases to improve crispr/cas-mediated genome editing
WO2017064546A1 (en) 2015-09-24 2017-04-20 Crispr Therapeutics Ag Novel family of rna-programmable endonucleases and their uses in genome editing and other applications
CN108350489B (en) 2015-09-24 2022-04-29 西格马-奥尔德里奇有限责任公司 Methods and reagents for molecular proximity detection using RNA-guided nucleic acid binding proteins
KR101795999B1 (en) 2015-09-25 2017-11-09 전남대학교산학협력단 Primer for Beta2-Microglobulin gene remove using CRISPR/CAS9 system
US20180258411A1 (en) 2015-09-25 2018-09-13 Tarveda Therapeutics, Inc. Compositions and methods for genome editing
WO2017053729A1 (en) 2015-09-25 2017-03-30 The Board Of Trustees Of The Leland Stanford Junior University Nuclease-mediated genome editing of primary cells and enrichment thereof
KR101745863B1 (en) 2015-09-25 2017-06-12 전남대학교산학협력단 Primer for prohibitin2 gene remove using CRISPR/CAS9 system
EP3147363B1 (en) 2015-09-26 2019-10-16 B.R.A.I.N. Ag Activation of taste receptor genes in mammalian cells using crispr-cas-9
CA2999912A1 (en) 2015-09-28 2017-04-06 Temple University - Of The Commonwealth System Of Higher Education Methods and compositions for rna-guided treatment of hiv infection
CN105177038B (en) 2015-09-29 2018-08-24 中国科学院遗传与发育生物学研究所 A kind of CRISPR/Cas9 systems of efficient fixed point editor Plant Genome
JP2018534258A (en) 2015-09-29 2018-11-22 アジェノビア コーポレーション Compositions and methods for transcriptional control of latent viruses
US20170088587A1 (en) 2015-09-29 2017-03-30 Agenovir Corporation Antiviral fusion proteins and genes
US20170088828A1 (en) 2015-09-29 2017-03-30 Agenovir Corporation Compositions and methods for treatment of latent viral infections
EP3355954A4 (en) 2015-09-29 2020-01-08 Agenovir Corporation Delivery methods and compositions
CN105331627B (en) 2015-09-30 2019-04-02 华中农业大学 A method of prokaryotic gene group editor is carried out using endogenous CRISPR-Cas system
EP3356520B1 (en) 2015-10-02 2022-03-23 The U.S.A. as represented by the Secretary, Department of Health and Human Services Lentiviral protein delivery system for rna-guided genome editing
CA3004710A1 (en) 2015-10-06 2017-04-13 The Children's Hospital Of Philadelphia Compositions and methods for treating fragile x syndrome and related syndromes
US10760081B2 (en) 2015-10-07 2020-09-01 New York University Compositions and methods for enhancing CRISPR activity by POLQ inhibition
WO2017062886A1 (en) 2015-10-08 2017-04-13 Cellink Corporation Battery interconnects
BR112018007177A2 (en) 2015-10-08 2018-10-16 President And Fellows Of Harvard College multiplexed genome editing
US11692182B2 (en) 2015-10-09 2023-07-04 Monsanto Technology Llc RNA-guided DNA nucleases and uses thereof
CA3004713A1 (en) 2015-10-09 2017-04-13 The Children's Hospital Of Philadelphia Compositions and methods for treating huntington's disease and related disorders
EP3362560B1 (en) 2015-10-12 2022-08-10 DuPont US Holding, LLC Protected dna templates for gene modification and increased homologous recombination in cells and methods of use
WO2017066497A2 (en) 2015-10-13 2017-04-20 Duke University Genome engineering with type i crispr systems in eukaryotic cells
CN108367081A (en) 2015-10-14 2018-08-03 生命技术公司 Ribonucleoprotein transfection agents
CN105400779A (en) 2015-10-15 2016-03-16 芜湖医诺生物技术有限公司 Target sequence, recognized by streptococcus thermophilus CRISPR-Cas9 system, of human CCR5 gene, sgRNA and application of CRISPR-Cas9 system
WO2017066781A1 (en) 2015-10-16 2017-04-20 Modernatx, Inc. Mrna cap analogs with modified phosphate linkage
WO2017066588A2 (en) 2015-10-16 2017-04-20 Temple University - Of The Commonwealth System Of Higher Education Methods and compositions utilizing cpf1 for rna-guided gene editing
US10947559B2 (en) 2015-10-16 2021-03-16 Astrazeneca Ab Inducible modification of a cell genome
FR3042506B1 (en) 2015-10-16 2018-11-30 IFP Energies Nouvelles GENETIC TOOL FOR PROCESSING BACTERIA CLOSTRIDIUM
WO2017070169A1 (en) 2015-10-19 2017-04-27 The Methodist Hospital Crispr-cas9 delivery to hard-to-transfect cells via membrane deformation
CN105331607A (en) 2015-10-19 2016-02-17 芜湖医诺生物技术有限公司 Human CCR5 gene target sequence recognized by streptococcus thermophilus CRISPR (clustered regularly interspaced short palindromic repeat)-Cas9 (CRISPR-associated protein 9) system, sgRNA (single guide ribonucleic acid) and application
CN105331608A (en) 2015-10-20 2016-02-17 芜湖医诺生物技术有限公司 Human CXCR4 gene target sequence identified by neisseria meningitidis CRISPR-Cas9 system, sgRNA and application of target sequence and sgRNA
CN105316337A (en) 2015-10-20 2016-02-10 芜湖医诺生物技术有限公司 Streptococcus thermophilus derived human CXCR3 gene target sequence recognizable by CRISPR (clustered regularly interspaced short palindromic repeat)-Cas9 (CRISPR associated 9) system and sgRNA (single guide ribonucleic acid) and application thereof
CN105331609A (en) 2015-10-20 2016-02-17 芜湖医诺生物技术有限公司 Human CCR5 gene target sequence identified by neisseria meningitidis CRISPR-Cas9 system, sgRNA and application of target sequence and sgRNA
US20180282763A1 (en) 2015-10-20 2018-10-04 Pioneer Hi-Bred International, Inc. Restoring function to a non-functional gene product via guided cas systems and methods of use
JP7059179B2 (en) 2015-10-20 2022-04-25 アンスティチュ ナショナル ドゥ ラ サンテ エ ドゥ ラ ルシェルシュ メディカル Methods and products for genetic engineering
CN105316324A (en) 2015-10-20 2016-02-10 芜湖医诺生物技术有限公司 Streptococcus thermophilus derived human CXCR3 gene target sequence recognizable by CRISPR (clustered regularly interspaced short palindromic repeat)-Cas9 (CRISPR associated 9) system and sgRNA (single guide ribonucleic acid) and application thereof
EP3365447A1 (en) 2015-10-21 2018-08-29 Editas Medicine, Inc. Crispr/cas-related methods and compositions for treating hepatitis b virus
CN105219799A (en) 2015-10-22 2016-01-06 天津吉诺沃生物科技有限公司 The breeding method of a kind of English ryegrass based on CRISPR/Cas system
US20170211142A1 (en) 2015-10-22 2017-07-27 The Broad Institute, Inc. Novel crispr enzymes and systems
US20190225955A1 (en) 2015-10-23 2019-07-25 President And Fellows Of Harvard College Evolved cas9 proteins for gene editing
EP3159407A1 (en) 2015-10-23 2017-04-26 Silence Therapeutics (London) Ltd Guide rnas, methods and uses
ES2699848T3 (en) 2015-10-23 2019-02-13 Caribou Biosciences Inc Cross-type modified CRISPR class 2 nucleic acid that targets nucleic acids
US9988637B2 (en) 2015-10-26 2018-06-05 National Tsing Hua Univeristy Cas9 plasmid, genome editing system and method of Escherichia coli
TW201715041A (en) 2015-10-26 2017-05-01 國立清華大學 Method for bacterial genome editing
US10280411B2 (en) 2015-10-27 2019-05-07 Pacific Biosciences of California, In.c Methods, systems, and reagents for direct RNA sequencing
US20170152526A1 (en) 2015-10-27 2017-06-01 Recombinetics, Inc. Engineering of humanized car t-cell and platelets by genetic complementation
CA3002524A1 (en) 2015-10-28 2017-05-04 Sangamo Therapeutics, Inc. Liver-specific constructs, factor viii expression cassettes and methods of use thereof
WO2017075335A1 (en) 2015-10-28 2017-05-04 Voyager Therapeutics, Inc. Regulatable expression using adeno-associated virus (aav)
EP3368063B1 (en) 2015-10-28 2023-09-06 Vertex Pharmaceuticals Inc. Materials and methods for treatment of duchenne muscular dystrophy
EP3368670A1 (en) 2015-10-30 2018-09-05 Editas Medicine, Inc. Crispr/cas-related methods and compositions for treating herpes simplex virus
US11111508B2 (en) 2015-10-30 2021-09-07 Brandeis University Modified CAS9 compositions and methods of use
CN105238806B (en) 2015-11-02 2018-11-27 中国科学院天津工业生物技术研究所 A kind of building and its application of the CRISPR/Cas9 gene editing carrier for microorganism
CN105316327B (en) 2015-11-03 2019-01-29 中国农业科学院作物科学研究所 Wheat TaAGO4a gene C RISPR/Cas9 carrier and its application
SG11201803701YA (en) 2015-11-04 2018-06-28 Univ Pennsylvania Methods and compositions for gene editing in hematopoietic stem cells
WO2017079428A1 (en) 2015-11-04 2017-05-11 President And Fellows Of Harvard College Site specific germline modification
KR20180066262A (en) 2015-11-04 2018-06-18 페이트 세러퓨틱스, 인코포레이티드 Genetic manipulation of pluripotent cells
GB2544270A (en) 2015-11-05 2017-05-17 Fundació Centre De Regulació Genòmica Nucleic acids, peptides and methods
JP2018533376A (en) 2015-11-05 2018-11-15 セントロ デ インベスティガシオン ビオメディカ エン レッド Method of genetic editing of cells isolated from a subject suffering from a metabolic disease affecting erythroid lineage, cells obtained by the above method, and their use
AU2016349738A1 (en) 2015-11-06 2018-05-24 The Jackson Laboratory Large genomic DNA knock-in and uses thereof
WO2017078751A1 (en) 2015-11-06 2017-05-11 The Methodist Hospital Micoluidic cell deomailiy assay for enabling rapid and efficient kinase screening via the crispr-cas9 system
WO2017081097A1 (en) 2015-11-09 2017-05-18 Ifom Fondazione Istituto Firc Di Oncologia Molecolare Crispr-cas sgrna library
WO2017081288A1 (en) 2015-11-11 2017-05-18 Lonza Ltd Crispr-associated (cas) proteins with reduced immunogenicity
WO2017083722A1 (en) 2015-11-11 2017-05-18 Greenberg Kenneth P Crispr compositions and methods of using the same for gene therapy
CA2947904A1 (en) 2015-11-12 2017-05-12 Pfizer Inc. Tissue-specific genome engineering using crispr-cas9
US20170191047A1 (en) 2015-11-13 2017-07-06 University Of Georgia Research Foundation, Inc. Adenosine-specific rnase and methods of use
US11306308B2 (en) 2015-11-13 2022-04-19 Massachusetts Institute Of Technology High-throughput CRISPR-based library screening
KR101885901B1 (en) 2015-11-13 2018-08-07 기초과학연구원 RGEN RNP delivery method using 5'-phosphate removed RNA
IL259441B2 (en) 2015-11-16 2024-01-01 Res Inst Nationwide Childrens Hospital Materials and methods for treatment of titin-based myopathies and other titinopaties
US11905521B2 (en) 2015-11-17 2024-02-20 The Chinese University Of Hong Kong Methods and systems for targeted gene manipulation
PT3380613T (en) 2015-11-23 2022-12-02 Univ California Tracking and manipulating cellular rna via nuclear delivery of crispr/cas9
CN105602987A (en) 2015-11-23 2016-05-25 深圳市默赛尔生物医学科技发展有限公司 High-efficiency knockout method for XBP1 gene in DC cell
US20170145438A1 (en) 2015-11-24 2017-05-25 University Of South Carolina Viral Vectors for Gene Editing
EP3382018B1 (en) 2015-11-25 2022-03-30 National University Corporation Gunma University Dna methylation editing kit and dna methylation editing method
US10240145B2 (en) 2015-11-25 2019-03-26 The Board Of Trustees Of The Leland Stanford Junior University CRISPR/Cas-mediated genome editing to treat EGFR-mutant lung cancer
WO2017091510A1 (en) 2015-11-27 2017-06-01 The Regents Of The University Of California Compositions and methods for the production of hydrocarbons, hydrogen and carbon monoxide using engineered azotobacter strains
CN105505979A (en) 2015-11-28 2016-04-20 湖北大学 Method for acquiring aromatic rice strain by targeting Badh2 gene via CRISPR/Cas9 gene editing technology
WO2017095111A1 (en) 2015-11-30 2017-06-08 기초과학연구원 Composition for genome editing, containing cas9 derived from f. novicida
CN106811479B (en) 2015-11-30 2019-10-25 中国农业科学院作物科学研究所 The system and its application of Herbicide Resistant Rice are obtained using CRISPR/Cas9 system pointed decoration als gene
CN105296518A (en) 2015-12-01 2016-02-03 中国农业大学 Homologous arm vector construction method used for CRISPR/Cas 9 technology
RU2634395C1 (en) 2015-12-01 2017-10-26 Федеральное государственное автономное образовательное учреждение высшего профессионального образования "Балтийский Федеральный Университет имени Иммануила Канта" (БФУ им. И. Канта) GENETIC CONSTRUCT BASED ON CRISPR/Cas9 GENOME SYSTEM EDITING, CODING Cas9 NUCLEASE, SPECIFICALLY IMPORTED IN HUMAN CELLS MITOCHONDRIA
US11118189B2 (en) 2015-12-02 2021-09-14 Ceres, Inc. Methods for genetic modification of plants
WO2017096041A1 (en) 2015-12-02 2017-06-08 The Regents Of The University Of California Compositions and methods for modifying a target nucleic acid
WO2017093370A1 (en) 2015-12-03 2017-06-08 Technische Universität München T-cell specific genome editing
CN105779448B (en) 2015-12-04 2018-11-27 新疆农业大学 A kind of cotton promoters GbU6-7PS and application
EP3384027A1 (en) 2015-12-04 2018-10-10 Novartis AG Compositions and methods for immunooncology
CN105779449B (en) 2015-12-04 2018-11-27 新疆农业大学 A kind of cotton promoters GbU6-5PS and application
CN105462968B (en) 2015-12-07 2018-10-16 北京信生元生物医学科技有限公司 It is a kind of targeting apoC III CRISPR-Cas9 systems and its application
CN106845151B (en) 2015-12-07 2019-03-26 中国农业大学 The screening technique and device of CRISPR-Cas9 system sgRNA action target spot
CN108473527A (en) 2015-12-09 2018-08-31 切除生物治疗公司 Gene editing method and composition for JC activated virals during eliminating immunosuppressive therapy and PML (progressive multifocal leukoencephalopathy) risk
DK3387134T3 (en) 2015-12-11 2020-12-21 Danisco Us Inc PROCEDURES AND COMPOSITIONS FOR INCREASED NUCLEASE MEDIATED GENERAL MODIFICATION AND REDUCED EFFECTS OUTSIDE THE OBJECTIVE
CN105463003A (en) 2015-12-11 2016-04-06 扬州大学 Recombinant vector for eliminating activity of kanamycin drug resistance gene and building method of recombinant vector
CN105296537A (en) 2015-12-12 2016-02-03 西南大学 Fixed-point gene editing method based on intratestis injection
CN105400773B (en) 2015-12-14 2018-06-26 同济大学 CRISPR/Cas9 applied to Large-scale Screening cancer gene is enriched with sequencing approach
WO2017105350A1 (en) 2015-12-14 2017-06-22 Cellresearch Corporation Pte Ltd A method of generating a mammalian stem cell carrying a transgene, a mammalian stem cell generated by the method and pharmaceuticals uses of the mammalian stem cell
WO2017106616A1 (en) 2015-12-17 2017-06-22 The Regents Of The University Of Colorado, A Body Corporate Varicella zoster virus encoding regulatable cas9 nuclease
CN105463027A (en) 2015-12-17 2016-04-06 中国农业大学 Method for preparing high muscle content and hypertrophic cardiomyopathy model cloned pig
NO343153B1 (en) 2015-12-17 2018-11-19 Hydra Systems As A method of assessing the integrity status of a barrier plug
CA3008382A1 (en) 2015-12-18 2017-06-22 Sangamo Therapeutics, Inc. Targeted disruption of the mhc cell receptor
MX2018007290A (en) 2015-12-18 2019-01-10 Danisco Us Inc Methods and compositions for polymerase ii (pol-ii) based guide rna expression.
US20190233814A1 (en) 2015-12-18 2019-08-01 The Broad Institute, Inc. Novel crispr enzymes and systems
WO2017105991A1 (en) 2015-12-18 2017-06-22 Danisco Us Inc. Methods and compositions for t-rna based guide rna expression
WO2017104404A1 (en) 2015-12-18 2017-06-22 国立研究開発法人科学技術振興機構 Genetic modification non-human organism, egg cells, fertilized eggs, and method for modifying target genes
WO2017106767A1 (en) 2015-12-18 2017-06-22 The Scripps Research Institute Production of unnatural nucleotides using a crispr/cas9 system
CN108778297B (en) 2015-12-18 2024-02-09 桑格摩生物治疗股份有限公司 Targeted disruption of T cell receptors
WO2017106569A1 (en) 2015-12-18 2017-06-22 The Regents Of The University Of California Modified site-directed modifying polypeptides and methods of use thereof
US11542466B2 (en) 2015-12-22 2023-01-03 North Carolina State University Methods and compositions for delivery of CRISPR based antimicrobials
KR20180107109A (en) 2015-12-22 2018-10-01 큐어백 아게 Method for producing RNA molecular composition
JP6947729B2 (en) 2015-12-23 2021-10-13 クリスパー セラピューティクス アクチェンゲゼルシャフト Materials and methods for the treatment of amyotrophic lateral sclerosis and / or frontotemporal lobar degeneration
CN105543270A (en) 2015-12-24 2016-05-04 中国农业科学院作物科学研究所 Double resistance CRISPR/Cas9 carrier and application
CN105543266A (en) 2015-12-25 2016-05-04 安徽大学 CRISPR (Clustered Regularly Interspaced Short Palindromic Repeat sequences)-Cas (CRISPR-associated proteins) system in Streptomyces virginiae IBL14 and method for carrying out gene editing by using CRISPR-Cas system
CN105505976A (en) 2015-12-25 2016-04-20 安徽大学 Construction method of penicillin-producing recombined strain of streptomyces virginiae IBL14
WO2017115268A1 (en) 2015-12-28 2017-07-06 Novartis Ag Compositions and methods for the treatment of hemoglobinopathies
EP3397757A4 (en) 2015-12-29 2019-08-28 Monsanto Technology LLC Novel crispr-associated transposases and uses thereof
CN105441451B (en) 2015-12-31 2019-03-22 暨南大学 A kind of sgRNA targeting sequencing of special target people ABCB1 gene and application
CN105567735A (en) 2016-01-05 2016-05-11 华东师范大学 Site specific repairing carrier system and method of blood coagulation factor genetic mutation
CN108473986A (en) 2016-01-08 2018-08-31 诺维信公司 The genome editor of Bacillus host cell
US11441146B2 (en) 2016-01-11 2022-09-13 Christiana Care Health Services, Inc. Compositions and methods for improving homogeneity of DNA generated using a CRISPR/Cas9 cleavage system
CN105647922A (en) 2016-01-11 2016-06-08 中国人民解放军疾病预防控制所 Application of CRISPR-Cas9 system based on new gRNA (guide ribonucleic acid) sequence in preparing drugs for treating hepatitis B
US11427837B2 (en) 2016-01-12 2022-08-30 The Regents Of The University Of California Compositions and methods for enhanced genome editing
US20190010496A1 (en) 2016-01-14 2019-01-10 The Brigham And Women`S Hospital, Inc. Genome Editing for Treating Glioblastoma
KR20180134847A (en) 2016-01-14 2018-12-19 멤피스 미츠 인코포레이티드 Methods of increasing the replication capacity of somatic cells during in vitro culture
EP3402327A1 (en) 2016-01-15 2018-11-21 The Jackson Laboratory Genetically modified non-human mammals by multi-cycle electroporation of cas9 protein
CN105567734A (en) 2016-01-18 2016-05-11 丹弥优生物技术(湖北)有限公司 Method for precisely editing genome DNA sequence
WO2017126987A1 (en) 2016-01-18 2017-07-27 Анатолий Викторович ЗАЗУЛЯ Red blood cells for targeted drug delivery
CN105567738A (en) 2016-01-18 2016-05-11 南开大学 Method for inducing CCR5-delta32 deletion with genome editing technology CRISPR-Cas9
EP3405570A1 (en) 2016-01-22 2018-11-28 The Broad Institute, Inc. Crystal structure of crispr cpf1
AU2017371665A1 (en) 2016-01-25 2018-07-19 Excision Biotherapeutics RNA guided eradication of human JC virus and other polyomaviruses
CN105567689B (en) 2016-01-25 2019-04-09 重庆威斯腾生物医药科技有限责任公司 CRISPR/Cas9 targeting knockout people TCAB1 gene and its specificity gRNA
CN105543228A (en) 2016-01-25 2016-05-04 宁夏农林科学院 Method for transforming rice into fragrant rice rapidly
US20190032057A1 (en) 2016-01-25 2019-01-31 Excision Biotherapeutics, Inc. Methods and compositions for rna-guided treatment of hiv infection
EP3199632A1 (en) 2016-01-26 2017-08-02 ACIB GmbH Temperature-inducible crispr/cas system
CN105567688A (en) 2016-01-27 2016-05-11 武汉大学 CRISPR/SaCas9 system for gene therapy of AIDS
FI3408292T3 (en) 2016-01-29 2023-06-30 Univ Princeton Split inteins with exceptional splicing activity
CA3013179A1 (en) 2016-01-30 2017-08-03 Bonac Corporation Artificial single guide rna and use thereof
CN107022562B (en) 2016-02-02 2020-07-17 中国种子集团有限公司 Method for site-directed mutagenesis of maize gene by using CRISPR/Cas9 system
CN105647968B (en) 2016-02-02 2019-07-23 浙江大学 A kind of CRISPR/Cas9 working efficiency fast testing system and its application
US11845933B2 (en) 2016-02-03 2023-12-19 Massachusetts Institute Of Technology Structure-guided chemical modification of guide RNA and its applications
CN105671083B (en) 2016-02-03 2017-09-29 安徽柯顿生物科技有限公司 The gene recombined virus plasmids of PD 1 and structure, the Puro of recombinant retrovirus Lenti PD 1 and packaging and application
WO2017136520A1 (en) 2016-02-04 2017-08-10 President And Fellows Of Harvard College Mitochondrial genome editing and regulation
US20190038780A1 (en) 2016-02-05 2019-02-07 Regents Of The University Of Minnesota Vectors and system for modulating gene expression
WO2017139264A1 (en) 2016-02-09 2017-08-17 President And Fellows Of Harvard College Dna-guided gene editing and regulation
RU2016104674A (en) 2016-02-11 2017-08-16 Анатолий Викторович Зазуля ERYTHROCYT MODIFICATION DEVICE WITH DIRECTED MEDICINAL TRANSPORT MECHANISM FOR CRISPR / CAS9 GENE THERAPY FUNCTIONS
US11666666B2 (en) 2016-02-11 2023-06-06 The Regents Of The University Of California Methods and compositions for modifying a mutant dystrophin gene in a cell's genome
CN105647962A (en) 2016-02-15 2016-06-08 浙江大学 Gene editing method for knocking out rice MIRNA393b stem-loop sequences with application of CRISPR(clustered regulatory interspersed short palindromic repeat)-Cas9 system
US9896696B2 (en) 2016-02-15 2018-02-20 Benson Hill Biosystems, Inc. Compositions and methods for modifying genomes
AU2017219605B2 (en) 2016-02-15 2023-04-13 Temple University - Of The Commonwealth System Of Higher Education Excision of retroviral nucleic acid sequences
AU2017221405A1 (en) 2016-02-16 2018-09-20 Carnegie Mellon University Compositions for enhancing targeted gene editing and methods of use thereof
CN105594664B (en) 2016-02-16 2018-10-02 湖南师范大学 A kind of method of gene knockout selection and breeding stat1a Gene Deletion zebra fish
CN105647969B (en) 2016-02-16 2020-12-15 湖南师范大学 Method for breeding zebra fish with stat1a gene deletion by gene knockout
CN105624187A (en) 2016-02-17 2016-06-01 天津大学 Site-directed mutation method for genomes of saccharomyces cerevisiae
CN109072243A (en) 2016-02-18 2018-12-21 哈佛学院董事及会员团体 Pass through the method and system for the molecule record that CRISPR-CAS system carries out
DK3653709T3 (en) 2016-02-22 2021-03-08 Caribou Biosciences Inc METHODS FOR MODULATING DNA REPAIR RESULTS
CN105646719B (en) 2016-02-24 2019-12-20 无锡市妇幼保健院 Efficient fixed-point transgenic tool and application thereof
US20170275665A1 (en) 2016-02-24 2017-09-28 Board Of Regents, The University Of Texas System Direct crispr spacer acquisition from rna by a reverse-transcriptase-cas1 fusion protein
WO2017147278A1 (en) 2016-02-25 2017-08-31 The Children's Medical Center Corporation Customized class switch of immunoglobulin genes in lymphoma and hybridoma by crispr/cas9 technology
US20170246260A1 (en) 2016-02-25 2017-08-31 Agenovir Corporation Modified antiviral nuclease
US20170247703A1 (en) 2016-02-25 2017-08-31 Agenovir Corporation Antiviral nuclease methods
CA3015353A1 (en) 2016-02-25 2017-08-31 Agenovir Corporation Viral and oncoviral nuclease treatment
CN114908093A (en) 2016-02-26 2022-08-16 朗泽科技新西兰有限公司 CRISPR/CAS system for C1 immobilized bacteria
US10538750B2 (en) 2016-02-29 2020-01-21 Agilent Technologies, Inc. Methods and compositions for blocking off-target nucleic acids from cleavage by CRISPR proteins
US11447768B2 (en) 2016-03-01 2022-09-20 University Of Florida Research Foundation, Incorporated Molecular cell diary system
CN105671070B (en) 2016-03-03 2019-03-19 江南大学 A kind of CRISPRCas9 system and its construction method for Bacillus subtilis genes group editor
KR102438360B1 (en) 2016-03-04 2022-08-31 에디타스 메디신, 인코포레이티드 CRISPR-CPF1-related methods, compositions and components for cancer immunotherapy
CN105821039B (en) 2016-03-09 2020-02-07 李旭 Specific sgRNA combined with immune gene to inhibit HBV replication, expression vector and application of specific sgRNA
CN105821040B (en) 2016-03-09 2018-12-14 李旭 Combined immunization gene inhibits sgRNA, gene knockout carrier and its application of high-risk HPV expression
CN107177591A (en) 2016-03-09 2017-09-19 北京大学 SgRNA sequences using CRISPR technical editor's CCR5 genes and application thereof
CN105861547A (en) 2016-03-10 2016-08-17 黄捷 Method for permanently embedding identity card number into genome
EP3426778A1 (en) 2016-03-11 2019-01-16 Pioneer Hi-Bred International, Inc. Novel cas9 systems and methods of use
AU2017235333B2 (en) 2016-03-14 2023-08-24 Editas Medicine, Inc. CRISPR/CAS-related methods and compositions for treating beta hemoglobinopathies
WO2017160752A1 (en) 2016-03-14 2017-09-21 Intellia Therapeutics, Inc. Methods and compositions for gene editing
WO2017160689A1 (en) 2016-03-15 2017-09-21 University Of Massachusetts Anti-crispr compounds and methods of use
EP3430332B1 (en) 2016-03-15 2020-01-01 Carrier Corporation Refrigerated sales cabinet
EP3219799A1 (en) 2016-03-17 2017-09-20 IMBA-Institut für Molekulare Biotechnologie GmbH Conditional crispr sgrna expression
US20200291370A1 (en) 2016-03-18 2020-09-17 President And Fellows Of Harvard College Mutant Cas Proteins
EP3433363A1 (en) 2016-03-25 2019-01-30 Editas Medicine, Inc. Genome editing systems comprising repair-modulating enzyme molecules and methods of their use
EP3433364A1 (en) 2016-03-25 2019-01-30 Editas Medicine, Inc. Systems and methods for treating alpha 1-antitrypsin (a1at) deficiency
US10815535B2 (en) 2016-03-28 2020-10-27 The Charles Stark Draper Laboratory, Inc. Bacteriophage engineering methods
CN106047803A (en) 2016-03-28 2016-10-26 青岛市胶州中心医院 Cell model obtained after targeted knockout of rabbit bone morphogenetic protein-2 (BMP2) gene based on CRISPR/Cas9 and application thereof
WO2017173004A1 (en) 2016-03-30 2017-10-05 Mikuni Takayasu A method for in vivo precise genome editing
WO2017173054A1 (en) 2016-03-30 2017-10-05 Intellia Therapeutics, Inc. Lipid nanoparticle formulations for crispr/cas components
CN109072212B (en) 2016-03-30 2022-10-04 豪夫迈·罗氏有限公司 Improved sortase
WO2017172860A1 (en) 2016-03-31 2017-10-05 President And Fellows Of Harvard College Methods and compositions for the single tube preparation of sequencing libraries using cas9
WO2017171942A1 (en) 2016-03-31 2017-10-05 Exxonmobil Chemical Patent Inc. Burner, furnace, and steam cracking processes using the same
US20190093128A1 (en) 2016-03-31 2019-03-28 The Regents Of The University Of California Methods for genome editing in zygotes
CN106167525B (en) 2016-04-01 2019-03-19 北京康明百奥新药研发有限公司 Screen the methods and applications of ultralow fucose cell line
US10301619B2 (en) 2016-04-01 2019-05-28 New England Biolabs, Inc. Compositions and methods relating to synthetic RNA polynucleotides created from synthetic DNA oligonucleotides
CN109072191B (en) 2016-04-04 2024-03-22 苏黎世联邦理工学院 Mammalian cell lines for protein production and library generation
US20190093091A1 (en) 2016-04-06 2019-03-28 Temple University - Of The Commonwealth System Of Higher Education Compositions for eradicating flavivirus infections in subjects
CN105802980A (en) 2016-04-08 2016-07-27 北京大学 CRISPR/Cas9 system with Gateway compatibility and application of CRISPR/Cas9 system
CN106399306B (en) 2016-04-12 2019-11-05 西安交通大学第一附属医院 Target sgRNA, genophore and its application that people lncRNA-UCA1 inhibits bladder cancer
WO2017180711A1 (en) * 2016-04-13 2017-10-19 Editas Medicine, Inc. Grna fusion molecules, gene editing systems, and methods of use thereof
EP3443081A4 (en) 2016-04-13 2019-10-30 Duke University Crispr/cas9-based repressors for silencing gene targets in vivo and methods of use
EP3443086B1 (en) 2016-04-13 2021-11-24 Editas Medicine, Inc. Cas9 fusion molecules, gene editing systems, and methods of use thereof
EP3442596A1 (en) 2016-04-14 2019-02-20 Université de Lausanne Treatment and/or prevention of dna-triplet repeat diseases or disorders
JP7197363B2 (en) 2016-04-14 2022-12-27 ボコ シリコン バレー, インコーポレイテッド Genome editing of human neural stem cells using nucleases
CN105821116A (en) 2016-04-15 2016-08-03 扬州大学 Directional knockout on sheep MSTN gene and detection method for influence thereof on myogenic differentiation
WO2017181107A2 (en) 2016-04-16 2017-10-19 Ohio State Innovation Foundation Modified cpf1 mrna, modified guide rna, and uses thereof
WO2017184334A1 (en) 2016-04-18 2017-10-26 The Board Of Regents Of The University Of Texas System Generation of genetically engineered animals by crispr/cas9 genome editing in spermatogonial stem cells
WO2017182468A1 (en) 2016-04-18 2017-10-26 Ruprecht-Karls-Universität Heidelberg Means and methods for inactivating therapeutic dna in a cell
SG10202010311SA (en) 2016-04-19 2020-11-27 Broad Inst Inc Novel Crispr Enzymes and Systems
EP3445853A1 (en) 2016-04-19 2019-02-27 The Broad Institute, Inc. Cpf1 complexes with reduced indel activity
CA3026110A1 (en) 2016-04-19 2017-11-02 The Broad Institute, Inc. Novel crispr enzymes and systems
CN106086062A (en) 2016-04-19 2016-11-09 上海市农业科学院 A kind of tomato dna group that obtains pinpoints the method knocking out mutant
CN105886616B (en) 2016-04-20 2020-08-07 广东省农业科学院农业生物基因研究中心 Efficient specific sgRNA recognition site guide sequence for pig gene editing and screening method thereof
CN107304435A (en) 2016-04-22 2017-10-31 中国科学院青岛生物能源与过程研究所 A kind of Cas9/RNA systems and its application
CN105821075B (en) 2016-04-22 2017-09-12 湖南农业大学 A kind of construction method of tea tree CaMTL5 CRISPR/Cas9 genome editor's carriers
CN105861552B (en) 2016-04-25 2019-10-11 西北农林科技大学 A kind of construction method for the CRISPR/Cas9 gene editing system that T7 RNA polymerase mediates
US11248216B2 (en) 2016-04-25 2022-02-15 The Regents Of The University Of California Methods and compositions for genomic editing
CN107326046A (en) 2016-04-28 2017-11-07 上海邦耀生物科技有限公司 A kind of method for improving foreign gene homologous recombination efficiency
SG11201809468XA (en) 2016-04-29 2018-11-29 Sarepta Therapeutics Inc Oligonucleotide analogues targeting human lmna
CN105886534A (en) 2016-04-29 2016-08-24 苏州溯源精微生物科技有限公司 Tumor metastasis inhibition method
CN109072207A (en) 2016-04-29 2018-12-21 巴斯夫植物科学有限公司 Improved method for modifying target nucleic acid
CN105821049B (en) 2016-04-29 2019-06-04 中国农业大学 A kind of preparation method of Fbxo40 gene knock-out pig
GB201819504D0 (en) 2016-05-01 2019-01-16 Neemo Inc Harnessing heterologous and endogenous crispr-cas machineries for efficient markerless genome editing in clostridium
WO2017192573A1 (en) 2016-05-02 2017-11-09 Massachusetts Institute Of Technology Nanoparticle conjugates of highly potent toxins and intraperitoneal administration of nanoparticles for treating or imaging cancer
EP3452101A2 (en) 2016-05-04 2019-03-13 CureVac AG Rna encoding a therapeutic protein
WO2017191210A1 (en) 2016-05-04 2017-11-09 Novozymes A/S Genome editing by crispr-cas9 in filamentous fungal host cells
CN105950639A (en) 2016-05-04 2016-09-21 广州美格生物科技有限公司 Preparation method of staphylococcus aureus CRISPR/Cas9 system and application of system in constructing mouse model
WO2017192172A1 (en) 2016-05-05 2017-11-09 Temple University - Of The Commonwealth System Of Higher Education Rna guided eradication of varicella zoster virus
CN105907785B (en) 2016-05-05 2020-02-07 苏州吉玛基因股份有限公司 Application of chemically synthesized crRNA in CRISPR/Cpf1 system in gene editing
EP3452498B1 (en) 2016-05-05 2023-07-05 Duke University Crispr/cas-related compositions for treating duchenne muscular dystrophy
WO2017190664A1 (en) 2016-05-05 2017-11-09 苏州吉玛基因股份有限公司 Use of chemosynthetic crrna and modified crrna in crispr/cpf1 gene editing systems
CN106244591A (en) 2016-08-23 2016-12-21 苏州吉玛基因股份有限公司 Modify crRNA application in CRISPR/Cpf1 gene editing system
CN105985985B (en) 2016-05-06 2019-12-31 苏州大学 Preparation method of allogeneic mesenchymal stem cells edited by CRISPR technology and optimized by IGF (insulin-like growth factor) and application of allogeneic mesenchymal stem cells in treatment of myocardial infarction
EP4023228A1 (en) 2016-05-06 2022-07-06 Tod M. Woolf Genome editing oligonucleotide without programmable nucleases
WO2017196768A1 (en) 2016-05-09 2017-11-16 President And Fellows Of Harvard College Self-targeting guide rnas in crispr system
EP3455347A4 (en) 2016-05-10 2019-10-02 United States Government as Represented by The Department of Veterans Affairs Lentiviral delivery of crispr/cas constructs that cleave genes essential for hiv-1 infection and replication
CN105861554B (en) 2016-05-10 2020-01-31 华南农业大学 method for realizing animal sex control based on editing Rbmy gene and application
US20190345483A1 (en) * 2016-05-12 2019-11-14 President And Fellows Of Harvard College AAV Split Cas9 Genome Editing and Transcriptional Regulation
WO2017197301A1 (en) 2016-05-12 2017-11-16 Hanley Brian P Safe delivery of crispr and other gene therapies to large fractions of somatic cells in humans and animals
CN107365786A (en) 2016-05-12 2017-11-21 中国科学院微生物研究所 A kind of method and its application being cloned into spacer sequences in CRISPR-Cas9 systems
KR101922989B1 (en) 2016-05-13 2018-11-28 연세대학교 산학협력단 Generation and tracking of substitution mutations in the genome using a CRISPR/Retron system
CN105907758B (en) 2016-05-18 2020-06-05 世翱(上海)生物医药科技有限公司 CRISPR-Cas9 guide sequence and primer thereof, transgenic expression vector and construction method thereof
CN105838733A (en) 2016-05-18 2016-08-10 云南省农业科学院花卉研究所 Cas9 mediated carnation gene editing carrier and application
CN106011171B (en) 2016-05-18 2019-10-11 西北农林科技大学 A kind of gene seamless edit method repaired using CRISPR/Cas9 technology based on SSA
CN106446600B (en) 2016-05-20 2019-10-18 同济大学 A kind of design method of the sgRNA based on CRISPR/Cas9
SG11201809552SA (en) 2016-05-20 2018-11-29 Regeneron Pharma Methods for breaking immunological tolerance using multiple guide rnas
US20190201551A1 (en) 2016-05-23 2019-07-04 Washington University Pulmonary targeted cas9/crispr for in vivo editing of disease genes
WO2017205290A1 (en) 2016-05-23 2017-11-30 The Trustees Of Columbia University In The City Of New York Bypassing the pam requirement of the crispr-cas system
CN105950560B (en) 2016-05-24 2019-07-23 苏州系统医学研究所 Humanization PD-L1 tumor cell line and animal model and application with the cell line
CN106011167B (en) 2016-05-27 2019-11-01 上海交通大学 The method of the application and rice fertility restorer of male sterility gene OsDPW2
JP2019517261A (en) 2016-06-01 2019-06-24 カーヴェーエス ザート ソシエタス・ヨーロピアKws Saat Se Hybrid nucleic acid sequences for genome manipulation
IL289989B (en) 2016-06-02 2022-09-01 Sigma Aldrich Co Llc Using programmable dna binding proteins to enhance targeted genome modification
WO2017208247A1 (en) 2016-06-02 2017-12-07 Yissum Research Development Company Of The Hebrew University Of Jerusalem Ltd. Assay for the removal of methyl-cytosine residues from dna
US11140883B2 (en) 2016-06-03 2021-10-12 Auburn University Gene editing of reproductive hormones to sterilize aquatic animals
AU2017277810A1 (en) 2016-06-03 2018-12-06 Temple University - Of The Commonwealth System Of Higher Education Negative feedback regulation of HIV-1 by gene editing strategy
US20190256844A1 (en) 2016-06-07 2019-08-22 Temple University - Of The Commonwealth System Of Higher Education Rna guided compositions for preventing and treating hepatitis b virus infections
CN106119275A (en) 2016-06-07 2016-11-16 湖北大学 Based on CRISPR/Cas9 technology, nonglutinous rice strain is transformed into targeting vector and the method for waxy strain
US10767175B2 (en) 2016-06-08 2020-09-08 Agilent Technologies, Inc. High specificity genome editing using chemically modified guide RNAs
CN106086008B (en) 2016-06-10 2019-03-12 中国农业科学院植物保护研究所 The CRISPR/cas9 system and its application of hidden kind of TRP gene of Bemisia tabaci MED
WO2017222834A1 (en) 2016-06-10 2017-12-28 City Of Hope Compositions and methods for mitochondrial genome editing
US20200332305A1 (en) 2016-06-14 2020-10-22 Pioneer Hi-Bred International, Inc. Use of cpfi endonuclease for plant genome modifications
CN106434752A (en) 2016-06-14 2017-02-22 南通大学附属医院 Process of knocking out Wnt3a gene and verification method thereof
CN106167808A (en) 2016-06-16 2016-11-30 郑州大学 A kind of method eliminating mecA plasmid based on CRISPR/Cas9 technology
CN105950633B (en) 2016-06-16 2019-05-03 复旦大学 Application of the gene OsARF4 in control rice grain length and mass of 1000 kernel
CN106167821A (en) 2016-06-16 2016-11-30 郑州大学 A kind of staphylococcus aureus CRISPR site detection kit and detection method
EP3472321A2 (en) 2016-06-17 2019-04-24 Genesis Technologies Limited Crispr-cas system, materials and methods
CN105950626B (en) 2016-06-17 2018-09-28 新疆畜牧科学院生物技术研究所 The method of different hair color sheep is obtained based on CRISPR/Cas9 and targets the sgRNA of ASIP genes
US20190323038A1 (en) 2016-06-17 2019-10-24 Montana State Univesity Bidirectional targeting for genome editing
US11788083B2 (en) 2016-06-17 2023-10-17 The Broad Institute, Inc. Type VI CRISPR orthologs and systems
WO2017222773A1 (en) 2016-06-20 2017-12-28 Pioneer Hi-Bred International, Inc. Novel cas systems and methods of use
WO2017223107A1 (en) 2016-06-20 2017-12-28 Unity Biotechnology, Inc. Genome modifying enzyme therapy for diseases modulated by senescent cells
AU2017282623B2 (en) 2016-06-20 2023-09-21 Keygene N.V. Method for targeted DNA alteration in plant cells
US20170362635A1 (en) 2016-06-20 2017-12-21 University Of Washington Muscle-specific crispr/cas9 editing of genes
CN106148370A (en) 2016-06-21 2016-11-23 苏州瑞奇生物医药科技有限公司 Fat rats animal model and construction method
WO2017220751A1 (en) 2016-06-22 2017-12-28 Proqr Therapeutics Ii B.V. Single-stranded rna-editing oligonucleotides
US10988779B2 (en) 2016-06-22 2021-04-27 Icahn School Of Medicine At Mount Sinai Viral delivery of RNA utilizing self-cleaving ribozymes and CRISPR-based applications thereof
CN106047877B (en) 2016-06-24 2019-01-11 中山大学附属第一医院 A kind of sgRNA and CRISPR/Cas9 slow virus system of targeting knockout FTO gene and application
CN105925608A (en) 2016-06-24 2016-09-07 广西壮族自治区水牛研究所 Method for targeted knockout of gene ALK6 by using CRISPR-Cas9
CN106119283A (en) 2016-06-24 2016-11-16 广西壮族自治区水牛研究所 A kind of method that the CRISPR of utilization Cas9 targeting knocks out MSTN gene
CA3029121A1 (en) 2016-06-29 2018-01-04 Crispr Therapeutics Ag Compositions and methods for gene editing
US11913017B2 (en) 2016-06-29 2024-02-27 The Regents Of The University Of California Efficient genetic screening method
WO2018005873A1 (en) 2016-06-29 2018-01-04 The Broad Institute Inc. Crispr-cas systems having destabilization domain
CN106148286B (en) 2016-06-29 2019-10-29 牛刚 A kind of construction method and cell model and pyrogen test kit for detecting the cell model of pyrogen
US10927383B2 (en) 2016-06-30 2021-02-23 Ethris Gmbh Cas9 mRNAs
ES2817973T3 (en) 2016-07-01 2021-04-08 Microsoft Technology Licensing Llc Storage through iterative DNA editing
US20180004537A1 (en) 2016-07-01 2018-01-04 Microsoft Technology Licensing, Llc Molecular State Machines
US10892034B2 (en) 2016-07-01 2021-01-12 Microsoft Technology Licensing, Llc Use of homology direct repair to record timing of a molecular event
KR20190039703A (en) 2016-07-05 2019-04-15 더 존스 홉킨스 유니버시티 CRISPR / CAS9-based compositions and methods for treating retinal degeneration
CN106191057B (en) 2016-07-06 2018-12-25 中山大学 A kind of sgRNA sequence for knocking out people's CYP2E1 gene, the construction method of CYP2E1 gene deleted cell strains and its application
US20190185847A1 (en) 2016-07-06 2019-06-20 Novozymes A/S Improving a Microorganism by CRISPR-Inhibition
CN106051058A (en) 2016-07-07 2016-10-26 上海格昆机电科技有限公司 Rotating rack used for spaceflight storage tank and particle treatment instrument and transmission mechanism of rotation rack
WO2018009822A1 (en) 2016-07-08 2018-01-11 Ohio State Innovation Foundation Modified nucleic acids, hybrid guide rnas, and uses thereof
CN107586777A (en) 2016-07-08 2018-01-16 上海吉倍生物技术有限公司 People's PDCD1 genes sgRNA purposes and its related drugs
CN106047930B (en) 2016-07-12 2020-05-19 北京百奥赛图基因生物技术有限公司 Preparation method of Flox rat with conditional knockout of PS1 gene
WO2018013821A1 (en) 2016-07-13 2018-01-18 Dsm Ip Assets B.V. A crispr-cas system for an algal host cell
EP3485023B1 (en) 2016-07-15 2023-11-15 Salk Institute for Biological Studies Methods and compositions for genome editing in non-dividing cells
WO2018013990A1 (en) 2016-07-15 2018-01-18 Zymergen Inc. Scarless dna assembly and genome editing using crispr/cpf1 and dna ligase
CN106190903B (en) 2016-07-18 2019-04-02 华中农业大学 Riemerlla anatipestifer Cas9 gene deletion mutants and its application
CN106191062B (en) 2016-07-18 2019-06-14 广东华南疫苗股份有限公司 A kind of TCR-/PD-1- double negative t cells and its construction method
CN106191061B (en) 2016-07-18 2019-06-18 暨南大学 A kind of sgRNA targeting sequencing of special target people ABCG2 gene and its application
EP4275747A3 (en) 2016-07-19 2024-01-24 Duke University Therapeutic applications of cpf1-based genome editing
CN106434651B (en) 2016-07-19 2021-05-18 广西大学 Agrobacterium tumefaciens and CRISPR-Cas9 mediated gene site-directed insertion inactivation method and application thereof
JP2019520844A (en) 2016-07-21 2019-07-25 マックスサイト インコーポレーティッド Methods and compositions for modifying genomic DNA
WO2018015444A1 (en) 2016-07-22 2018-01-25 Novozymes A/S Crispr-cas9 genome editing with multiple guide rnas in filamentous fungi
CN106191107B (en) 2016-07-22 2020-03-20 湖南农业大学 Molecular improvement method for reducing rice grain falling property
CN106191064B (en) 2016-07-22 2019-06-07 中国农业大学 A method of preparing MC4R gene knock-out pig
WO2018022480A1 (en) 2016-07-25 2018-02-01 Mayo Foundation For Medical Education And Research Treating cancer
CA3031414A1 (en) 2016-07-26 2018-02-01 The General Hospital Corporation Variants of crispr from prevotella and francisella 1 (cpf1)
WO2018018979A1 (en) 2016-07-26 2018-02-01 浙江大学 Recombinant plant vector and method for screening non-transgenic gene-edited strain
CN106222193B (en) 2016-07-26 2019-09-20 浙江大学 A kind of recombinant vector and the screening technique without transgene gene editor plant
CN106191099A (en) 2016-07-27 2016-12-07 苏州泓迅生物科技有限公司 A kind of parallel multiple editor's carrier of genes of brewing yeast group based on CRISPR Cas9 system and application thereof
CN106086061A (en) 2016-07-27 2016-11-09 苏州泓迅生物科技有限公司 A kind of genes of brewing yeast group editor's carrier based on CRISPR Cas9 system and application thereof
KR101828958B1 (en) 2016-07-28 2018-02-13 주식회사 비엠티 Heating jacket for outdoor pipe
CN106191113B (en) 2016-07-29 2020-01-14 中国农业大学 Preparation method of MC3R gene knockout pig
GB201613135D0 (en) 2016-07-29 2016-09-14 Medical Res Council Genome editing
CN106434748A (en) 2016-07-29 2017-02-22 中国科学院重庆绿色智能技术研究院 Development and applications of heat shock induced Cas9 enzyme transgene danio rerio
CN106191124B (en) 2016-07-29 2019-10-11 中国科学院重庆绿色智能技术研究院 It is a kind of to save the fish breeding method that liquid improves CRISPR-Cas9 gene editing and passaging efficiency using fish-egg
CN106191114B (en) 2016-07-29 2020-02-11 中国科学院重庆绿色智能技术研究院 Breeding method for knocking out fish MC4R gene by using CRISPR-Cas9 system
CN106434688A (en) 2016-08-01 2017-02-22 云南纳博生物科技有限公司 Artificial fixed-point rice dense and erect panicle (DEP1) gene mutant body and application thereof
CN106011150A (en) 2016-08-01 2016-10-12 云南纳博生物科技有限公司 Rice grain number per ear Gn1a gene artificial site-directed mutant and application thereof
US11866733B2 (en) 2016-08-01 2024-01-09 University of Pittsburgh—of the Commonwealth System of Higher Education Human induced pluripotent stem cells for high efficiency genetic engineering
US11566263B2 (en) 2016-08-02 2023-01-31 Editas Medicine, Inc. Compositions and methods for treating CEP290 associated disease
JP7184364B2 (en) 2016-08-02 2022-12-06 国立大学法人京都大学 Methods for genome editing
KR102547316B1 (en) * 2016-08-03 2023-06-23 프레지던트 앤드 펠로우즈 오브 하바드 칼리지 Adenosine nucleobase editing agents and uses thereof
CN106282241A (en) 2016-08-05 2017-01-04 无锡市第二人民医院 The method obtaining knocking out the Brachydanio rerio of bmp2a gene by CRISPR/Cas9
AU2017308889B2 (en) 2016-08-09 2023-11-09 President And Fellows Of Harvard College Programmable Cas9-recombinase fusion proteins and uses thereof
CN106222203A (en) 2016-08-10 2016-12-14 云南纳博生物科技有限公司 CRISPR/Cas technology is utilized to obtain bombyx mori silk fibroin heavy chain gene mutant and mutation method and application
KR101710026B1 (en) 2016-08-10 2017-02-27 주식회사 무진메디 Composition comprising delivery carrier of nano-liposome having Cas9 protein and guide RNA
CN106172238B (en) 2016-08-12 2019-01-22 中南大学 The construction method of miR-124 knock out mice animal model and application
CN106222177B (en) 2016-08-13 2018-06-26 江苏集萃药康生物科技有限公司 A kind of CRISPR-Cas9 systems for targeting people STAT6 and its application for treating anaphylactia
US20210000091A1 (en) 2016-08-17 2021-01-07 The Regents Of The University Of California Split Trans-Complementing Gene-Drive System for Suppressing Aedes Aegypti Mosquitos
WO2018035250A1 (en) 2016-08-17 2018-02-22 The Broad Institute, Inc. Methods for identifying class 2 crispr-cas systems
US11810649B2 (en) 2016-08-17 2023-11-07 The Broad Institute, Inc. Methods for identifying novel gene editing elements
KR20190065251A (en) 2016-08-18 2019-06-11 더 리젠츠 오브 더 유니버시티 오브 캘리포니아 CRISPR-Cas Genome Processing with Modular AAV Delivery System
JP2019528691A (en) 2016-08-19 2019-10-17 ブルーバード バイオ, インコーポレイテッド Genome editing enhancer
EP3500677A4 (en) 2016-08-20 2020-04-01 Avellino Lab USA, Inc. Single guide rna, crispr/cas9 systems, and methods of use thereof
CN106191071B (en) 2016-08-22 2018-09-04 广州资生生物科技有限公司 A kind of CRISPR-Cas9 systems and its application for treating breast cancer disease
CN106191116B (en) 2016-08-22 2019-10-08 西北农林科技大学 Foreign gene based on CRISPR/Cas9 knocks in integration system and its method for building up and application
CN106244555A (en) 2016-08-23 2016-12-21 广州医科大学附属第三医院 A kind of method of efficiency improving gene targeting and the base in-situ remediation method in beta globin gene site
CN106086028B (en) 2016-08-23 2019-04-23 中国农业科学院作物科学研究所 A kind of method by genome editor raising rice resistance starch content and its dedicated sgRNA
CN106109417A (en) 2016-08-24 2016-11-16 李因传 A kind of bionical lipidosome drug carrier of liver plasma membrane, manufacture method and application thereof
KR101856345B1 (en) 2016-08-24 2018-06-20 경상대학교산학협력단 Method for generation of APOBEC3H and APOBEC3CH double-knocked out cat using CRISPR/Cas9 system
CN106244609A (en) 2016-08-24 2016-12-21 浙江理工大学 The screening system of a kind of Noncoding gene regulating PI3K AKT signal path and screening technique
US11542509B2 (en) 2016-08-24 2023-01-03 President And Fellows Of Harvard College Incorporation of unnatural amino acids into proteins using base editing
SG11201901364VA (en) 2016-08-24 2019-03-28 Sangamo Therapeutics Inc Engineered target specific nucleases
PL3504229T3 (en) 2016-08-24 2022-04-19 Sangamo Therapeutics, Inc. Regulation of gene expression using engineered nucleases
CN106544357B (en) 2016-08-25 2018-08-21 湖南杂交水稻研究中心 A method of cultivating low cadmium-accumulation rice variety
CN107784200B (en) 2016-08-26 2020-11-06 深圳华大生命科学研究院 Method and device for screening novel CRISPR-Cas system
CN106318973B (en) 2016-08-26 2019-09-13 深圳市第二人民医院 A kind of gene regulation device and gene regulation method based on CRISPR-Cas9
CN106350540A (en) 2016-08-26 2017-01-25 苏州系统医学研究所 High-efficient inducible type CRISPR/Cas9 gene knockout carrier mediated by lentivirus and application thereof
CN106244557B (en) 2016-08-29 2019-10-25 中国农业科学院北京畜牧兽医研究所 The method of rite-directed mutagenesis ApoE gene and LDLR gene
CN106399367A (en) 2016-08-31 2017-02-15 深圳市卫光生物制品股份有限公司 Method for improving efficiency of CRISPR mediated homologous recombination
CN106480097A (en) 2016-10-13 2017-03-08 南京凯地生物科技有限公司 Knocking out that people PD 1 is gene constructed using CRISPR/Cas9 technology can the method for targeting MSLN novel C AR T cell and its application
CN106399375A (en) 2016-08-31 2017-02-15 南京凯地生物科技有限公司 Method for constructing CD19 targeting CAR-T (chimeric antigen receptor-T) cells by knocking out PD-1 (programmed death 1) genes by virtue of CRISPR/Cas9
CN107794272B (en) 2016-09-06 2021-10-12 中国科学院上海营养与健康研究所 High-specificity CRISPR genome editing system
US20180105806A1 (en) 2016-09-07 2018-04-19 Massachusetts Institute Of Technology Method for rna-guided endonuclease-based dna assembly
CN106399311A (en) 2016-09-07 2017-02-15 同济大学 Endogenous protein marking method used for Chip-seq genome-wide binding spectrum
CN106399377A (en) 2016-09-07 2017-02-15 同济大学 Method for screening drug target genes based on CRISPR/Cas9 high-throughput technology
CN106367435B (en) 2016-09-07 2019-11-08 电子科技大学 A kind of method that rice miRNA orientation knocks out
US20190255106A1 (en) 2016-09-07 2019-08-22 Flagship Pioneering Inc. Methods and compositions for modulating gene expression
EP3510151A4 (en) 2016-09-09 2020-04-15 The Board of Trustees of the Leland Stanford Junior University High-throughput precision genome editing
CN107574179B (en) 2016-09-09 2018-07-10 康码(上海)生物科技有限公司 A kind of CRISPR/Cas9 high efficiency gene editing systems for kluyveromyces optimization
EP3512943B1 (en) 2016-09-14 2023-04-12 Yeda Research and Development Co. Ltd. Crisp-seq, an integrated method for massively parallel single cell rna-seq and crispr pooled screens
CN106318934B (en) 2016-09-21 2020-06-05 上海交通大学 Gene complete sequence of carrot β (1,2) xylose transferase and plasmid construction of CRISPR/CAS9 for transfecting dicotyledonous plants
EP3516056A1 (en) 2016-09-23 2019-07-31 DSM IP Assets B.V. A guide-rna expression system for a host cell
CN106957858A (en) 2016-09-23 2017-07-18 西北农林科技大学 A kind of method that utilization CRISPR/Cas9 systems knock out sheep MSTN, ASIP, BCO2 gene jointly
WO2018058064A1 (en) 2016-09-23 2018-03-29 Casebia Therapeutics Limited Liability Partnership Compositions and methods for gene editing
US9580698B1 (en) 2016-09-23 2017-02-28 New England Biolabs, Inc. Mutant reverse transcriptase
US11319546B2 (en) 2016-09-28 2022-05-03 Cellivery Therapeutics, Inc. Cell-permeable (CP)-Cas9 recombinant protein and uses thereof
CN110023494A (en) 2016-09-30 2019-07-16 加利福尼亚大学董事会 The nucleic acid modifying enzyme and its application method of RNA guidance
CN107881184B (en) 2016-09-30 2021-08-27 中国科学院分子植物科学卓越创新中心 Cpf 1-based DNA in-vitro splicing method
US11371062B2 (en) 2016-09-30 2022-06-28 The Regents Of The University Of California RNA-guided nucleic acid modifying enzymes and methods of use thereof
EP3518656A4 (en) 2016-09-30 2020-09-30 Monsanto Technology LLC Method for selecting target sites for site-specific genome modification in plants
CN106480027A (en) 2016-09-30 2017-03-08 重庆高圣生物医药有限责任公司 CRISPR/Cas9 targeting knock out people PD 1 gene and its specificity gRNA
CN107880132B (en) 2016-09-30 2022-06-17 北京大学 Fusion protein and method for carrying out homologous recombination by using same
US11730823B2 (en) 2016-10-03 2023-08-22 President And Fellows Of Harvard College Delivery of therapeutic RNAs via ARRDC1-mediated microvesicles
WO2018067846A1 (en) 2016-10-05 2018-04-12 President And Fellows Of Harvard College Methods of crispr mediated genome modulation in v. natriegens
US10669539B2 (en) 2016-10-06 2020-06-02 Pioneer Biolabs, Llc Methods and compositions for generating CRISPR guide RNA libraries
CA3039409A1 (en) 2016-10-07 2018-04-12 Integrated Dna Technologies, Inc. S. pyogenes cas9 mutant genes and polypeptides encoded by same
CN106479985A (en) 2016-10-09 2017-03-08 上海吉玛制药技术有限公司 Application of the virus-mediated Cpf1 albumen in CRISPR/Cpf1 gene editing system
IT201600102542A1 (en) 2016-10-12 2018-04-12 Univ Degli Studi Di Trento Plasmid and lentiviral system containing a self-limiting Cas9 circuit that increases its safety.
US20190365862A1 (en) 2016-10-12 2019-12-05 Temple University - Of The Commonwealth System Of Higher Education Combination therapies for eradicating flavivirus infections in subjects
CN106434663A (en) 2016-10-12 2017-02-22 遵义医学院 Method for CRISPR/Cas9 targeted knockout of human ezrin gene enhancer key region and specific gRNA thereof
WO2018071663A1 (en) 2016-10-14 2018-04-19 Emendobio Inc. Rna compositions for genome editing
WO2018071892A1 (en) 2016-10-14 2018-04-19 Joung J Keith Epigenetically regulated site-specific nucleases
KR20240007715A (en) 2016-10-14 2024-01-16 프레지던트 앤드 펠로우즈 오브 하바드 칼리지 Aav delivery of nucleobase editors
CN106434782B (en) 2016-10-14 2020-01-10 南京工业大学 Method for producing cis-4-hydroxyproline
WO2018074979A1 (en) 2016-10-17 2018-04-26 Nanyang Technological University Truncated crispr-cas proteins for dna targeting
US10640810B2 (en) 2016-10-19 2020-05-05 Drexel University Methods of specifically labeling nucleic acids using CRISPR/Cas
WO2018081534A1 (en) 2016-10-28 2018-05-03 President And Fellows Of Harvard College Assay for exo-site binding molecules
US20180119141A1 (en) 2016-10-28 2018-05-03 Massachusetts Institute Of Technology Crispr/cas global regulator screening platform
US20180127759A1 (en) 2016-10-28 2018-05-10 Massachusetts Institute Of Technology Dynamic genome engineering
EP3532616A1 (en) 2016-10-28 2019-09-04 Editas Medicine, Inc. Crispr/cas-related methods and compositions for treating herpes simplex virus
KR20190026828A (en) 2016-10-31 2019-03-13 가부시키가이샤 에구치 고오슈우하 Reactor
WO2018081728A1 (en) 2016-10-31 2018-05-03 Emendobio Inc. Compositions for genome editing
US11787795B2 (en) 2016-11-01 2023-10-17 President And Fellows Of Harvard College Inhibitors of RNA guided nucleases and uses thereof
US20180245065A1 (en) 2016-11-01 2018-08-30 Novartis Ag Methods and compositions for enhancing gene editing
GB201618507D0 (en) 2016-11-02 2016-12-14 Stichting Voor De Technische Wetenschappen And Wageningen Univ Microbial genome editing
US11732258B2 (en) 2016-11-02 2023-08-22 President And Fellows Of Harvard College Engineered guide RNA sequences for in situ detection and sequencing
CN106544353A (en) 2016-11-08 2017-03-29 宁夏医科大学总医院 A kind of method that utilization CRISPR Cas9 remove Acinetobacter bauamnnii drug resistance gene
EP3538561A4 (en) 2016-11-11 2020-10-21 The Regents of The University of California Variant rna-guided polypeptides and methods of use
CN106755088A (en) 2016-11-11 2017-05-31 广东万海细胞生物科技有限公司 A kind of autologous CAR T cells preparation method and application
CA3043774A1 (en) 2016-11-14 2018-05-17 Caixia Gao A method for base editing in plants
CN106566838B (en) 2016-11-14 2019-11-01 上海伯豪生物技术有限公司 A kind of miR-126 full-length gene knockout kit and its application based on CRISPR-Cas9 technology
CN106554969A (en) 2016-11-15 2017-04-05 陕西理工学院 Mutiple Targets CRISPR/Cas9 expression vectors based on bacteriostasis and sterilization
US11485760B2 (en) 2016-11-16 2022-11-01 The Regents Of The University Of California Inhibitors of CRISPR-Cas9
CN106754912B (en) 2016-11-16 2019-11-08 上海交通大学 One kind orientation removes the plasmid and preparation of HBVcccDNA in liver cell
CN106480067A (en) 2016-11-21 2017-03-08 中国农业科学院烟草研究所 The old and feeble application of Nicotiana tabacum L. NtNAC096 Gene Handling Nicotiana tabacum L.
US20180282722A1 (en) 2016-11-21 2018-10-04 Massachusetts Institute Of Technology Chimeric DNA:RNA Guide for High Accuracy Cas9 Genome Editing
EP4321617A3 (en) 2016-11-22 2024-04-24 Integrated DNA Technologies Inc. Crispr/cpf1 systems and methods
US20200046854A1 (en) 2016-11-28 2020-02-13 The Board Of Regents Of The University Of Texas System Prevention of muscular dystrophy by crispr/cpf1-mediated gene editing
CN106755091A (en) 2016-11-28 2017-05-31 中国人民解放军第三军医大学第附属医院 Gene knockout carrier, MH7A cell NLRP1 gene knockout methods
CN106480036B (en) 2016-11-30 2019-04-09 华南理工大学 A kind of DNA fragmentation and its application with promoter function
CN107043779B (en) 2016-12-01 2020-05-12 中国农业科学院作物科学研究所 Application of CRISPR/nCas 9-mediated site-specific base substitution in plants
WO2018098587A1 (en) 2016-12-01 2018-06-07 UNIVERSITé LAVAL Crispr-based treatment of friedreich ataxia
CN106834323A (en) 2016-12-01 2017-06-13 安徽大学 A kind of gene editing method based on Virginia streptomycete IBL14 genes cas7 53
US9816093B1 (en) 2016-12-06 2017-11-14 Caribou Biosciences, Inc. Engineered nucleic acid-targeting nucleic acids
CN106701830B (en) 2016-12-07 2020-01-03 湖南人文科技学院 Pig embryo p66 knock-outshcMethod for gene
WO2018103686A1 (en) 2016-12-07 2018-06-14 中国科学院上海生命科学研究院 Chloroplast genome editing method
WO2018107028A1 (en) 2016-12-08 2018-06-14 Intellia Therapeutics, Inc. Modified guide rnas
US11192929B2 (en) 2016-12-08 2021-12-07 Regents Of The University Of Minnesota Site-specific DNA base editing using modified APOBEC enzymes
CN106544351B (en) 2016-12-08 2019-09-10 江苏省农业科学院 CRISPR-Cas9 knock out in vitro drug resistant gene mcr-1 method and its dedicated cell-penetrating peptides
PL3551753T3 (en) 2016-12-09 2022-10-31 The Broad Institute, Inc. Crispr effector system based diagnostics
WO2018107103A1 (en) 2016-12-09 2018-06-14 The Broad Institute, Inc. Crispr-systems for modifying a trait of interest in a plant
WO2018111947A1 (en) 2016-12-12 2018-06-21 Integrated Dna Technologies, Inc. Genome editing enhancement
US20190032131A1 (en) 2016-12-12 2019-01-31 Integrated Dna Technologies, Inc. Genome editing detection
CN107893074A (en) 2016-12-13 2018-04-10 广东赤萌医疗科技有限公司 A kind of gRNA, expression vector, knockout system, kit for being used to knock out CXCR4 genes
BR112019012155A2 (en) 2016-12-14 2019-11-12 Stichting Technische Wetenschappen use of at least one rna guide molecule and cas protein, method of binding, cleaving, labeling or modifying a double-stranded target polynucleotide, transformed cell, and nucleoprotein complex
WO2018109101A1 (en) 2016-12-14 2018-06-21 Wageningen Universiteit Thermostable cas9 nucleases
WO2018112336A1 (en) 2016-12-16 2018-06-21 Ohio State Innovation Foundation Systems and methods for dna-guided rna cleavage
KR101748575B1 (en) 2016-12-16 2017-06-20 주식회사 엠젠플러스 INSulin gene knockout diabetes mellitus or diabetic complications animal model and a method for producing the same
WO2018112446A2 (en) 2016-12-18 2018-06-21 Selonterra, Inc. Use of apoe4 motif-mediated genes for diagnosis and treatment of alzheimer's disease
CN106755026A (en) 2016-12-18 2017-05-31 吉林大学 The foundation of the structure and enamel hypocalcification model of sgRNA expression vectors
KR20230125856A (en) 2016-12-23 2023-08-29 프레지던트 앤드 펠로우즈 오브 하바드 칼리지 Gene editing of pcsk9
US10745677B2 (en) 2016-12-23 2020-08-18 President And Fellows Of Harvard College Editing of CCR5 receptor gene to protect against HIV infection
CN106755424B (en) 2016-12-26 2020-11-06 郑州大学 Escherichia coli ST131 strain detection primer, kit and detection method based on CRISPR
CN107354173A (en) 2016-12-26 2017-11-17 浙江省医学科学院 The method that liver specificity knock-out mice model is established based on CRISPR technologies and hydrodynamic force tail vein injection
CN106834347A (en) 2016-12-27 2017-06-13 安徽省农业科学院畜牧兽医研究所 A kind of goat CDK2 gene knockout carriers and its construction method
CN106755097A (en) 2016-12-27 2017-05-31 安徽省农业科学院畜牧兽医研究所 A kind of goat TLR4 gene knockout carriers and its construction method
CN106597260B (en) 2016-12-29 2020-04-03 合肥工业大学 Analog circuit fault diagnosis method based on continuous wavelet analysis and ELM network
CN106755077A (en) 2016-12-30 2017-05-31 华智水稻生物技术有限公司 Using CRISPR CAS9 technologies to the method for paddy rice CENH3 site-directed point mutations
CN106834341B (en) 2016-12-30 2020-06-16 中国农业大学 Gene site-directed mutagenesis vector and construction method and application thereof
CN106868008A (en) 2016-12-30 2017-06-20 重庆高圣生物医药有限责任公司 CRISPR/Cas9 targeting knock outs people Lin28A genes and its specificity gRNA
CN106701763B (en) 2016-12-30 2019-07-19 重庆高圣生物医药有限责任公司 CRISPR/Cas9 targeting knockout human hepatitis B virus P gene and its specificity gRNA
CN106701818B (en) 2017-01-09 2020-04-24 湖南杂交水稻研究中心 Method for cultivating common genic male sterile line of rice
US20190352634A1 (en) 2017-01-11 2019-11-21 Oxford University Innovation Limited Crispr rna
CN107012164B (en) 2017-01-11 2023-03-03 电子科技大学 CRISPR/Cpf1 plant genome directed modification functional unit, vector containing functional unit and application of functional unit
KR102084186B1 (en) 2017-01-17 2020-03-03 기초과학연구원 Method of identifying genome-wide off-target sites of base editors by detecting single strand breaks in genomic DNA
CN106701823A (en) 2017-01-18 2017-05-24 上海交通大学 Establishment and application of CHO cell line for producing fucose-free monoclonal antibody
CN107058372A (en) 2017-01-18 2017-08-18 四川农业大学 A kind of construction method of CRISPR/Cas9 carriers applied on plant
JP2020513783A (en) 2017-01-18 2020-05-21 エクシジョン バイオセラピューティクス インコーポレイテッド CRISPR
CN106801056A (en) 2017-01-24 2017-06-06 中国科学院广州生物医药与健康研究院 The slow virus carrier and application of a kind of sgRNA and its structure
AU2018212624A1 (en) 2017-01-30 2019-08-22 KWS SAAT SE & Co. KGaA Repair template linkage to endonucleases for genome engineering
TWI608100B (en) 2017-02-03 2017-12-11 國立清華大學 Cas9 expression plasmid, gene editing system of escherichia coli and method thereof
WO2018145068A1 (en) 2017-02-06 2018-08-09 Trustees Of Boston University An integrated system for programmable dna methylation
TW201839136A (en) 2017-02-06 2018-11-01 瑞士商諾華公司 Compositions and methods for the treatment of hemoglobinopathies
JP2020506948A (en) 2017-02-07 2020-03-05 ザ リージェンツ オブ ザ ユニバーシティ オブ カリフォルニア Gene therapy for haploinsufficiency
US20190345501A1 (en) 2017-02-07 2019-11-14 Massachusetts Institute Of Technology Methods and compositions for rna-guided genetic circuits
WO2018148647A2 (en) 2017-02-10 2018-08-16 Lajoie Marc Joseph Genome editing reagents and their use
IT201700016321A1 (en) 2017-02-14 2018-08-14 Univ Degli Studi Di Trento HIGH-SPECIFICITY CAS9 MUTANTS AND THEIR APPLICATIONS.
WO2018149915A1 (en) 2017-02-15 2018-08-23 Keygene N.V. Methods of targeted genetic alteration in plant cells
WO2018152197A1 (en) * 2017-02-15 2018-08-23 Massachusetts Institute Of Technology Dna writers, molecular recorders and uses thereof
CN106957855B (en) 2017-02-16 2020-04-17 上海市农业科学院 Method for targeted knockout of rice dwarf gene SD1 by using CRISPR/Cas9 technology
US20190367924A1 (en) 2017-02-17 2019-12-05 Temple University - Of The Commonwealth System Of Higher Education Gene editing therapy for hiv infection via dual targeting of hiv genome and ccr5
CA3053861A1 (en) 2017-02-20 2018-08-23 Institute Of Genetics And Developmental Biology, Chinese Academy Of Sciences Genome editing method
EP3585898A1 (en) 2017-02-22 2020-01-01 CRISPR Therapeutics AG Materials and methods for treatment of spinocerebellar ataxia type 1 (sca1) and other spinocerebellar ataxia type 1 protein (atxn1) gene related conditions or disorders
WO2018156372A1 (en) 2017-02-22 2018-08-30 The Regents Of The University Of California Genetically modified non-human animals and products thereof
EP3585897A1 (en) 2017-02-22 2020-01-01 CRISPR Therapeutics AG Materials and methods for treatment of dystrophic epidermolysis bullosa (deb) and other collagen type vii alpha 1 chain (col7a1) gene related conditions or disorders
WO2018154459A1 (en) 2017-02-22 2018-08-30 Crispr Therapeutics Ag Materials and methods for treatment of primary hyperoxaluria type 1 (ph1) and other alanine-glyoxylate aminotransferase (agxt) gene related conditions or disorders
WO2018154418A1 (en) 2017-02-22 2018-08-30 Crispr Therapeutics Ag Materials and methods for treatment of early onset parkinson's disease (park1) and other synuclein, alpha (snca) gene related conditions or disorders
WO2018154462A2 (en) 2017-02-22 2018-08-30 Crispr Therapeutics Ag Materials and methods for treatment of spinocerebellar ataxia type 2 (sca2) and other spinocerebellar ataxia type 2 protein (atxn2) gene related conditions or disorders
US20200248168A1 (en) 2017-02-22 2020-08-06 Crispr Therapeutics Ag Compositions and methods for treatment of proprotein convertase subtilisin/kexin type 9 (pcsk9)-related disorders
US20200095579A1 (en) 2017-02-22 2020-03-26 Crispr Therapeutics Ag Materials and methods for treatment of merosin-deficient cogenital muscular dystrophy (mdcmd) and other laminin, alpha 2 (lama2) gene related conditions or disorders
CA3054031A1 (en) 2017-02-22 2018-08-30 Crispr Therapeutics Ag Compositions and methods for gene editing
US20190380314A1 (en) 2017-02-23 2019-12-19 President And Fellows Of Harvard College Methods of Genetic Modification of a Cell
CN106868031A (en) 2017-02-24 2017-06-20 北京大学 A kind of cloning process of multiple sgRNA series parallels expression based on classification assembling and application
WO2018161009A1 (en) 2017-03-03 2018-09-07 Yale University Aav-mediated direct in vivo crispr screen in glioblastoma
US11111492B2 (en) 2017-03-06 2021-09-07 Florida State University Research Foundation, Inc. Genome engineering methods using a cytosine-specific Cas9
WO2018165631A1 (en) 2017-03-09 2018-09-13 President And Fellows Of Harvard College Cancer vaccine
US11898179B2 (en) 2017-03-09 2024-02-13 President And Fellows Of Harvard College Suppression of pain by gene editing
EP3592777A1 (en) * 2017-03-10 2020-01-15 President and Fellows of Harvard College Cytosine to guanine base editor
JP2020513814A (en) 2017-03-14 2020-05-21 ザ リージェンツ オブ ザ ユニバーシティ オブ カリフォルニア Operation of CRISPR CAS9 Immune Stealth
CN106978428A (en) 2017-03-15 2017-07-25 上海吐露港生物科技有限公司 A kind of Cas albumen specific bond target DNA, the method for regulation and control target gene transcription and kit
AU2018234832A1 (en) 2017-03-15 2019-10-10 Massachusetts Institute Of Technology CRISPR effector system based diagnostics for virus detection
CN106906242A (en) 2017-03-16 2017-06-30 重庆高圣生物医药有限责任公司 A kind of method that raising CRIPSR/Cas9 targeting knock outs gene produces nonhomologous end joint efficiency
WO2018175502A2 (en) 2017-03-21 2018-09-27 Shuber Anthony P Treating cancer with cas endonuclease complexes
US11268082B2 (en) * 2017-03-23 2022-03-08 President And Fellows Of Harvard College Nucleobase editors comprising nucleic acid programmable DNA binding proteins
CN107012213A (en) 2017-03-24 2017-08-04 南开大学 The biomarker of colorectal cancer
PT3526324T (en) 2017-03-28 2021-10-20 Locanabio Inc Crispr-associated (cas) protein
CN106947780A (en) 2017-03-28 2017-07-14 扬州大学 A kind of edit methods of rabbit MSTN genes
CN106906240A (en) 2017-03-29 2017-06-30 浙江大学 The method that the key gene HPT in barley VE synthesis paths is knocked out with CRISPR Cas9 systems
KR20190134673A (en) 2017-03-30 2019-12-04 고쿠리츠 다이가쿠 호진 교토 다이가쿠 Exon skipping induction method by genome editing
CN108660161B (en) 2017-03-31 2023-05-09 中国科学院脑科学与智能技术卓越创新中心 Method for preparing chimeric gene-free knockout animal based on CRISPR/Cas9 technology
CN107058358B (en) 2017-04-01 2020-06-09 中国科学院微生物研究所 Construction of double-spacer sequence recognition and cleavage CRISPR-Cas9 vector and application of vector in Verticillium daemonii
CN106967726B (en) 2017-04-05 2020-12-29 华南农业大学 Method for creating interspecific hybrid compatible line of Asian cultivated rice and African cultivated rice and application
US9938288B1 (en) 2017-04-05 2018-04-10 President And Fellows Of Harvard College Macrocyclic compound and uses thereof
CN107142282A (en) 2017-04-06 2017-09-08 中山大学 A kind of method that utilization CRISPR/Cas9 realizes large fragment DNA site-directed integration in mammalian cell
CN107034229A (en) 2017-04-07 2017-08-11 江苏贝瑞利生物科技有限公司 High frequency zone CRISPR/CAS9 gene editings system candidate sgRNA systems and application in a kind of plant
ES2880366T3 (en) 2017-04-11 2021-11-24 Hoffmann La Roche Mutant reverse transcriptase with an increase in thermal stability as well as products, procedures and uses that involve the same
CN110799645A (en) 2017-04-12 2020-02-14 博德研究所 Novel type VI CRISPR orthologs and systems
CN107058320B (en) 2017-04-12 2019-08-02 南开大学 The preparation and its application of IL7R gene delection zebra fish mutant
CN106916852B (en) 2017-04-13 2020-12-04 上海科技大学 Base editing system and construction and application method thereof
CN108728476A (en) 2017-04-14 2018-11-02 复旦大学 A method of generating diversity antibody library using CRISPR systems
CN107298701B (en) 2017-04-18 2020-10-30 上海大学 Corn transcription factor ZmbZIP22 and application thereof
CN106957844A (en) 2017-04-20 2017-07-18 华侨大学 It is a kind of effectively to knock out the virus genomic CRISPR/Cas9 of HTLV 1 gRNA sequences
CN116732106A (en) 2017-04-20 2023-09-12 E开创生物技术股份有限公司 Method for producing genetically modified animals
US11591589B2 (en) 2017-04-21 2023-02-28 The General Hospital Corporation Variants of Cpf1 (Cas12a) with altered PAM specificity
US11773409B2 (en) 2017-04-21 2023-10-03 The Board Of Trustees Of The Leland Stanford Junior University CRISPR/Cas 9-mediated integration of polynucleotides by sequential homologous recombination of AAV donor vectors
CN107043775B (en) 2017-04-24 2020-06-16 中国农业科学院生物技术研究所 sgRNA capable of promoting development of cotton lateral roots and application thereof
WO2018197495A1 (en) 2017-04-24 2018-11-01 Dupont Nutrition Biosciences Aps Novel anti-crispr genes and proteins and methods of use
CN206970581U (en) 2017-04-26 2018-02-06 重庆威斯腾生物医药科技有限责任公司 A kind of kit for being used to aid in CRISPR/cas9 gene knockouts
US20180312822A1 (en) 2017-04-26 2018-11-01 10X Genomics, Inc. Mmlv reverse transcriptase variants
WO2018197020A1 (en) 2017-04-27 2018-11-01 Novozymes A/S Genome editing by crispr-cas9 using short donor oligonucleotides
CN110832074A (en) 2017-05-03 2020-02-21 科沃施种子欧洲股份两合公司 Application of CRISPR-Cas endonuclease in plant genome engineering
CN107012174A (en) 2017-05-04 2017-08-04 昆明理工大学 Application of the CRISPR/Cas9 technologies in silkworm zinc finger protein gene mutant is obtained
EP3619302A4 (en) 2017-05-04 2021-01-20 The Trustees of The University of Pennsylvania Compositions and methods for gene editing in t cells using crispr/cpf1
CN107254485A (en) 2017-05-08 2017-10-17 南京农业大学 A kind of new reaction system for being capable of rapid build plant gene fixed point knockout carrier
CN107129999A (en) 2017-05-09 2017-09-05 福建省农业科学院畜牧兽医研究所 Using surely turn CRISPR/Cas9 systems to viral genome carry out target editor method
WO2018208755A1 (en) 2017-05-09 2018-11-15 The Regents Of The University Of California Compositions and methods for tagging target proteins in proximity to a nucleotide sequence of interest
WO2018208998A1 (en) 2017-05-10 2018-11-15 The Regents Of The University Of California Directed editing of cellular rna via nuclear delivery of crispr/cas9
WO2018209158A2 (en) 2017-05-10 2018-11-15 Editas Medicine, Inc. Crispr/rna-guided nuclease systems and methods
CN107130000B (en) 2017-05-12 2019-12-17 浙江卫未生物医药科技有限公司 CRISPR-Cas9 system for simultaneously knocking out KRAS gene and EGFR gene and application thereof
US11560566B2 (en) 2017-05-12 2023-01-24 President And Fellows Of Harvard College Aptazyme-embedded guide RNAs for use with CRISPR-Cas9 in genome editing and transcriptional activation
CN106947750B (en) 2017-05-16 2020-12-08 上海交通大学 Cas9 nuclease Q920P and application thereof
CN106957831B (en) 2017-05-16 2021-03-12 上海交通大学 Cas9 nuclease K918A and application thereof
CN106939303B (en) 2017-05-16 2021-02-23 上海交通大学 Cas9 nuclease R919P and application thereof
CN107012250B (en) 2017-05-16 2021-01-29 上海交通大学 Analysis method and application of genome DNA fragment editing accuracy suitable for CRISPR/Cas9 system
CN106967697B (en) 2017-05-16 2021-03-26 上海交通大学 Cas9 nuclease G915F and application thereof
US11692184B2 (en) 2017-05-16 2023-07-04 The Regents Of The University Of California Thermostable RNA-guided endonucleases and methods of use thereof
CN106916820B (en) 2017-05-16 2019-09-27 吉林大学 SgRNA and its application of porcine ROSA 26 gene can effectively be edited
CN107326042A (en) 2017-05-16 2017-11-07 上海交通大学 The fixed point of paddy rice TMS10 genes knocks out system and its application
CN106957830B (en) 2017-05-16 2020-12-25 上海交通大学 Cas9 nuclease delta F916 and application thereof
CN106987570A (en) 2017-05-16 2017-07-28 上海交通大学 A kind of Cas9 Nuclease Rs 780A and application thereof
EP3625340A4 (en) 2017-05-18 2021-02-24 Cargill, Incorporated Genome editing system
US20200181623A1 (en) 2017-05-18 2020-06-11 The Broad Institute, Inc. Systems, methods, and compositions for targeted nucleic acid editing
KR20200026804A (en) 2017-05-18 2020-03-11 더 브로드 인스티튜트, 인코퍼레이티드 Systems, Methods, and Compositions for Targeted Nucleic Acid Editing
US20200171068A1 (en) 2017-05-18 2020-06-04 Children's National Medical Center Compositions comprising aptamers and nucleic acid payloads and methods of using the same
CN107236737A (en) 2017-05-19 2017-10-10 上海交通大学 The sgRNA sequences of special target arabidopsis ILK2 genes and its application
CN107043787B (en) 2017-05-19 2017-12-26 南京医科大学 A kind of construction method and application that MARF1 rite-directed mutagenesis mouse models are obtained based on CRISPR/Cas9
WO2018217852A1 (en) 2017-05-23 2018-11-29 Gettysburg College Crispr based tool for characterizing bacterial serovar diversity
CN107034188B (en) 2017-05-24 2018-07-24 中山大学附属口腔医院 A kind of excretion body carrier, CRISPR/Cas9 gene editings system and the application of targeting bone
AU2018273968A1 (en) * 2017-05-25 2019-11-28 The General Hospital Corporation Using split deaminases to limit unwanted off-target base editor deamination
CN107177625B (en) 2017-05-26 2021-05-25 中国农业科学院植物保护研究所 Artificial vector system for site-directed mutagenesis and site-directed mutagenesis method
WO2018217981A1 (en) 2017-05-26 2018-11-29 North Carolina State University Altered guide rnas for modulating cas9 activity and methods of use
CN107287245B (en) 2017-05-27 2020-03-17 南京农业大学 Construction method of Glrx1 gene knockout animal model based on CRISPR/Cas9 technology
CN107142272A (en) 2017-06-05 2017-09-08 南京金斯瑞生物科技有限公司 A kind of method for controlling plasmid replication in Escherichia coli
WO2018226855A1 (en) 2017-06-06 2018-12-13 The General Hospital Corporation Engineered crispr-cas9 nucleases
CN107119071A (en) 2017-06-07 2017-09-01 江苏三黍生物科技有限公司 A kind of method for reducing plant amylose content and application
CN107177595A (en) 2017-06-07 2017-09-19 浙江大学 Targeting sgRNA, modification carrier for pig CD163 gene editings and its preparation method and application
CN107034218A (en) 2017-06-07 2017-08-11 浙江大学 Targeting sgRNA, modification carrier for pig APN gene editings and its preparation method and application
CN106987757A (en) 2017-06-12 2017-07-28 苏州双金实业有限公司 A kind of corrosion resistant type austenitic based alloy
CN107236739A (en) 2017-06-12 2017-10-10 上海捷易生物科技有限公司 The method of CRISPR/SaCas9 specific knockdown people's CXCR4 genes
CN107227352A (en) 2017-06-13 2017-10-03 西安医学院 The detection method of GPR120 gene expressions based on eGFP and application
CN107083392B (en) 2017-06-13 2020-09-08 中国医学科学院病原生物学研究所 CRISPR/Cpf1 gene editing system and application thereof in mycobacteria
CN107245502B (en) 2017-06-14 2020-11-03 中国科学院武汉病毒研究所 CD 2-binding protein (CD2AP) and its interacting protein
CN107312798B (en) 2017-06-16 2020-06-23 武汉大学 CRISPR/Cas9 recombinant lentiviral vector containing gRNA sequence of specific targeting CCR5 gene and application
CN107099850B (en) 2017-06-19 2018-05-04 东北农业大学 A kind of method that CRISPR/Cas9 genomic knockouts library is built by digestion genome
CN107266541B (en) 2017-06-20 2021-06-04 上海大学 Corn transcription factor ZmbHLH167 and application thereof
CN107446951B (en) 2017-06-20 2021-01-08 温氏食品集团股份有限公司 Method for rapidly screening recombinant fowlpox virus through CRISPR/Cas9 system and application thereof
CN107058328A (en) 2017-06-22 2017-08-18 江苏三黍生物科技有限公司 A kind of method for improving plant amylose content and application
CN107227307A (en) 2017-06-23 2017-10-03 东北农业大学 A kind of sgRNA targeting sequencings of special target pig IRS1 genes and its application
CN107119053A (en) 2017-06-23 2017-09-01 东北农业大学 A kind of sgRNA targeting sequencings of special target pig MC4R genes and its application
CN107099533A (en) 2017-06-23 2017-08-29 东北农业大学 A kind of sgRNA targeting sequencings of special target pig IGFBP3 genes and application
US10011849B1 (en) 2017-06-23 2018-07-03 Inscripta, Inc. Nucleic acid-guided nucleases
US9982279B1 (en) 2017-06-23 2018-05-29 Inscripta, Inc. Nucleic acid-guided nucleases
WO2019005884A1 (en) 2017-06-26 2019-01-03 The Broad Institute, Inc. Crispr/cas-adenine deaminase based compositions, systems, and methods for targeted nucleic acid editing
US20200248169A1 (en) 2017-06-26 2020-08-06 The Broad Institute, Inc. Crispr/cas-cytidine deaminase based compositions, systems, and methods for targeted nucleic acid editing
CN107177631B (en) 2017-06-26 2020-11-24 中国农业大学 Method for knocking out NRK cell Slc22a2 gene by using CRISPR-CAS9 technology
CN107217075B (en) 2017-06-28 2021-07-02 西安交通大学医学院第一附属医院 Method for constructing EPO gene knockout zebra fish animal model, primer, plasmid and preparation method
CN107356793A (en) 2017-07-01 2017-11-17 合肥东玖电气有限公司 A kind of fire-proof ammeter box
CN107312793A (en) 2017-07-05 2017-11-03 新疆农业科学院园艺作物研究所 The tomato dna editor carrier of Cas9 mediations and its application
CN107190006A (en) 2017-07-07 2017-09-22 南通大学附属医院 A kind of sgRNA of targeting IGF IR genes and its application
WO2019010384A1 (en) * 2017-07-07 2019-01-10 The Broad Institute, Inc. Methods for designing guide sequences for guided nucleases
CN107400677B (en) 2017-07-19 2020-05-22 江南大学 Bacillus licheniformis genome editing vector based on CRISPR-Cas9 system and preparation method thereof
CN107236741A (en) 2017-07-19 2017-10-10 广州医科大学附属第五医院 A kind of gRNA and method for knocking out wild-type T cells TCR alpha chains
CN107190008A (en) 2017-07-19 2017-09-22 苏州吉赛基因测序科技有限公司 A kind of method of capture genome target sequence based on Crispr/cas9 and its application in high-flux sequence
CN107354156B (en) 2017-07-19 2021-02-09 广州医科大学附属第五医院 gRNA for knocking out TCR beta chain of wild T cell and method
WO2019023680A1 (en) * 2017-07-28 2019-01-31 President And Fellows Of Harvard College Methods and compositions for evolving base editors using phage-assisted continuous evolution (pace)
CN107435069A (en) 2017-07-28 2017-12-05 新乡医学院 A kind of quick determination method of cell line CRISPR/Cas9 gene knockouts
CN107267515B (en) 2017-07-28 2020-08-25 重庆医科大学附属儿童医院 CRISPR/Cas9 targeted knockout human CNE10 gene and specific gRNA thereof
CN107435051B (en) 2017-07-28 2020-06-02 新乡医学院 Cell line gene knockout method for rapidly obtaining large fragment deletion through CRISPR/Cas9 system
CN107446954A (en) 2017-07-28 2017-12-08 新乡医学院 A kind of preparation method of SD rat T cells deleting genetic model
CN107418974A (en) 2017-07-28 2017-12-01 新乡医学院 It is a kind of to sort the quick method for obtaining CRISPR/Cas9 gene knockout stable cell lines using monoclonal cell
CN107384922A (en) 2017-07-28 2017-11-24 重庆医科大学附属儿童医院 CRISPR/Cas9 targeting knock outs people CNE9 genes and its specific gRNA
CN107217042B (en) 2017-07-31 2020-03-06 江苏东抗生物医药科技有限公司 Genetic engineering cell line for producing afucosylated protein and establishing method thereof
CN107446922A (en) 2017-08-03 2017-12-08 无锡市第二人民医院 A kind of gRNA sequences and its application method for knocking out hepcidin gene in human osteoblast cell's strain
CN107502618B (en) 2017-08-08 2021-03-12 中国科学院微生物研究所 Controllable vector elimination method and easy-to-use CRISPR-Cas9 tool
CN107312785B (en) 2017-08-09 2019-12-06 四川农业大学 Application of OsKTN80b gene in reducing plant height of rice
CN107365804B (en) 2017-08-13 2019-12-20 中国人民解放军疾病预防控制所 Method for packaging CRISPR-Cas9 system by using temperate phage vector
CN107446923B (en) 2017-08-13 2019-12-31 中国人民解放军疾病预防控制所 rAAV8-CRISPR-SaCas9 system and application thereof in preparation of hepatitis B treatment drug
CN107384926B (en) 2017-08-13 2020-06-26 中国人民解放军疾病预防控制所 CRISPR-Cas9 system for targeted removal of bacterial drug-resistant plasmids and application
CN107815463A (en) 2017-08-15 2018-03-20 西南大学 CRISPR/Cas9 technologies mediate the method for building up of miR167 precursor sequence editor's systems
CN107446924B (en) 2017-08-16 2020-01-14 中国科学院华南植物园 Kiwi fruit gene AcPDS editing vector based on CRISPR-Cas9 and construction method and application thereof
CN108034656A (en) 2017-08-16 2018-05-15 四川省农业科学院生物技术核技术研究所 SgRNA, CRISPR/Cas9 carrier related with rice bronzing glume character, vector construction, application
CN107384894B (en) 2017-08-21 2019-10-22 华南师范大学 Functional graphene oxide efficiently delivers method of the CRISPR/Cas9 for gene editing
CN107557393B (en) 2017-08-23 2020-05-08 中国科学院上海应用物理研究所 Magnetic nanomaterial-mediated CRISPR/Cas 9T cell internal delivery system and preparation method and application thereof
CN107299114B (en) 2017-08-23 2021-08-27 中国科学院分子植物科学卓越创新中心 Efficient yeast chromosome fusion method
CN107312795A (en) 2017-08-24 2017-11-03 浙江省农业科学院 The gene editing method of pink colour fruit tomato is formulated with CRISPR/Cas9 systems
CN107488649A (en) 2017-08-25 2017-12-19 南方医科大学 A kind of fusion protein of Cpf1 and p300 Core domains, corresponding DNA target are to activation system and application
EP3673059A4 (en) 2017-08-25 2021-09-01 President And Fellows Of Harvard College Evolution of bont peptidases
CN107460196A (en) 2017-08-25 2017-12-12 同济大学 A kind of construction method of immunodeficient mouse animal model and application
CN107541525B (en) 2017-08-26 2021-12-10 内蒙古大学 Method for mediating goat Tbeta 4 gene fixed-point knock-in based on CRISPR/Cas9 technology
CN107446932B (en) 2017-08-29 2020-02-21 江西省农业科学院 Gene for controlling male reproductive development of rice and application thereof
WO2019139645A2 (en) 2017-08-30 2019-07-18 President And Fellows Of Harvard College High efficiency base editors comprising gam
CN107519492B (en) 2017-09-06 2019-01-25 武汉迈特维尔生物科技有限公司 Application of the miR-3187-3p in coronary atherosclerotic heart disease is knocked out using CRISPR technology
CN107641631A (en) 2017-09-07 2018-01-30 浙江工业大学 A kind of method that bacillus coli gene is knocked out based on CRISPR/Cas9 systems by chemical conversion mediation
CN107362372B (en) 2017-09-07 2019-01-11 佛山波若恩生物科技有限公司 Use application of the CRISPR technology in coronary atherosclerotic heart disease
WO2019051097A1 (en) * 2017-09-08 2019-03-14 The Regents Of The University Of California Rna-guided endonuclease fusion polypeptides and methods of use thereof
CN107502608B (en) 2017-09-08 2020-10-16 中山大学 Construction method and application of sgRNA and ALDH2 gene-deleted cell strain for knocking out human ALDH2 gene
CN107557455A (en) 2017-09-15 2018-01-09 国家纳米科学中心 A kind of detection method of the nucleic acid specific fragment based on CRISPR Cas13a
CN107475300B (en) 2017-09-18 2020-04-21 上海市同济医院 Construction method and application of Ifit3-eKO1 gene knockout mouse animal model
WO2019056002A1 (en) 2017-09-18 2019-03-21 President And Fellows Of Harvard College Continuous evolution for stabilized proteins
CN107557390A (en) 2017-09-18 2018-01-09 江南大学 A kind of method for screening the high expression sites of Chinese hamster ovary celI system
CN107523583A (en) 2017-09-19 2017-12-29 安徽大学 A kind of prokaryotic gene edit methods for coming from gene cas5 3 in I type CRISPR Cas systems
CN107557378A (en) 2017-09-19 2018-01-09 安徽大学 Gene cas7 3 eukaryotic gene edit methods in a kind of type CRISPR Cas systems based on I
CN107630041A (en) 2017-09-19 2018-01-26 安徽大学 A kind of eukaryotic gene edit methods based on Virginia streptomycete IBL14 I Type B Cas systems
CN107557373A (en) 2017-09-19 2018-01-09 安徽大学 A kind of gene editing method based on I Type B CRISPR Cas system genes cas3
CN107630042A (en) 2017-09-19 2018-01-26 安徽大学 A kind of prokaryotic gene edit methods for coming from I type Cas 4 cas genes of system
CN107619837A (en) 2017-09-20 2018-01-23 西北农林科技大学 The method that nuclease-mediated Ipr1 fixed points insertion acquisition transgenic cow fetal fibroblast is cut using Cas9
CN107513531B (en) 2017-09-21 2020-02-21 无锡市妇幼保健院 gRNA target sequence for endogenously over-expressing lncRNA-XIST and application thereof
CN107686848A (en) 2017-09-26 2018-02-13 中山大学孙逸仙纪念医院 The stable of transposons collaboration CRISPR/Cas9 systems knocks out single plasmid vector and its application
CN107760652A (en) 2017-09-29 2018-03-06 华南理工大学 The cell models of caco 2 and its method that CRISPR/CAS9 mediate drugs transporter target knocks out
CN107557394A (en) 2017-09-29 2018-01-09 南京鼓楼医院 The method for reducing embryonic gene editor's miss rate of CRISPR/Cas9 mediations
CN107630006B (en) 2017-09-30 2020-09-11 山东兴瑞生物科技有限公司 Method for preparing T cell with double knockout genes of TCR and HLA
CN107828794A (en) 2017-09-30 2018-03-23 上海市农业生物基因中心 A kind of method for creating of Rice Salt gene OsRR22 mutant, its amino acid sequence encoded, plant and the mutant
CN107760663A (en) 2017-09-30 2018-03-06 新疆大学 The clone of chufa pepc genes and structure and the application of expression vector
CN107604003A (en) 2017-10-10 2018-01-19 南方医科大学 One kind knocks out kit and its application based on linearisation CRISPR CAS9 lentiviral vector genomes
CN108102940B (en) 2017-10-12 2021-07-13 中石化上海工程有限公司 Industrial saccharomyces cerevisiae strain with XKS1 gene knocked out by CRISPR/Cas9 system and construction method
CN107557381A (en) 2017-10-12 2018-01-09 南京农业大学 A kind of foundation and its application of Chinese cabbage CRISPR Cas9 gene editing systems
CN107474129B (en) 2017-10-12 2018-10-19 江西汉氏联合干细胞科技有限公司 The method of specificity enhancing CRISPR-CAS system gene editorial efficiencies
CN108103586A (en) 2017-10-13 2018-06-01 上海科技大学 A kind of CRISPR/Cas9 random libraries and its structure and application
CN107586779B (en) 2017-10-14 2018-08-28 天津金匙生物科技有限公司 The method that CASP3 gene knockouts are carried out to mescenchymal stem cell using CRISPR-CAS systems
CN107619829B (en) 2017-10-14 2018-08-24 南京平港生物技术有限公司 The method that GINS2 gene knockouts are carried out to mescenchymal stem cell using CRISPR-CAS systems
CN107523567A (en) 2017-10-16 2017-12-29 遵义医学院 A kind of construction method for the esophageal cancer cell strain for knocking out people's ezrin genetic enhancers
US11795443B2 (en) 2017-10-16 2023-10-24 The Broad Institute, Inc. Uses of adenosine base editors
CN107760715B (en) 2017-10-17 2021-12-10 张业胜 Transgenic vector and construction method and application thereof
CN107937427A (en) 2017-10-20 2018-04-20 广东石油化工学院 A kind of homologous repair vector construction method based on CRISPR/Cas9 systems
US20210130800A1 (en) 2017-10-23 2021-05-06 The Broad Institute, Inc. Systems, methods, and compositions for targeted nucleic acid editing
CN107893086B (en) 2017-10-24 2021-09-03 中国科学院武汉植物园 Method for rapidly constructing Cas9 binary expression vector library of paired sgRNAs
CN107760684B (en) 2017-11-03 2018-09-25 上海拉德钫斯生物科技有限公司 The method that RBM17 gene knockouts are carried out to mescenchymal stem cell using CRISPR-CAS systems
US20200239379A1 (en) 2017-11-05 2020-07-30 Aveterra Corp Method and Apparatus for Automated Composting of Organic Wastes
CN107858346B (en) 2017-11-06 2020-06-16 天津大学 Method for knocking out saccharomyces cerevisiae chromosome
CN107794276A (en) 2017-11-08 2018-03-13 中国农业科学院作物科学研究所 Fast and effectively crops pinpoint genetic fragment or allele replacement method and system for a kind of CRISPR mediations
US20200318086A1 (en) 2017-11-10 2020-10-08 Novozymes A/S Temperature-sensitive cas9 protein
CN107630043A (en) 2017-11-14 2018-01-26 吉林大学 The method that Gadd45a knockout rabbit models are established using knockout technology
CN108441519A (en) 2017-11-15 2018-08-24 中国农业大学 The method that homologous remediation efficiency is improved in CRISPR/CAS9 gene editings
CN107858373B (en) 2017-11-16 2020-03-17 山东省千佛山医院 Construction method of endothelial cell conditional knockout CCR5 gene mouse model
CN108192956B (en) 2017-11-17 2021-06-01 东南大学 Cas9 nuclease-based DNA detection and analysis method and application thereof
CN107893075A (en) 2017-11-17 2018-04-10 和元生物技术(上海)股份有限公司 CRISPR Cas9 targeting knock out people colon-cancer cell RITA genes and its specific sgRNA
CN107828874B (en) 2017-11-20 2020-10-16 东南大学 DNA detection and typing method based on CRISPR and application thereof
CN107904261A (en) 2017-11-21 2018-04-13 福州大学 The preparation of CRISPR/Cas9 nano gene systems and its application in terms of transfection
CN107653256A (en) 2017-11-21 2018-02-02 云南省烟草农业科学研究院 A kind of Polyphenol Oxidase in Tobacco gene NtPPO1 and its directed mutagenesis method and application
CN107893076A (en) 2017-11-23 2018-04-10 和元生物技术(上海)股份有限公司 CRISPR Cas9 targeting knock outs human breast cancer cell RASSF2 genes and its specific sgRNA
CN107937501A (en) 2017-11-24 2018-04-20 安徽师范大学 A kind of method of fast and convenient screening CRISPR/Cas gene editing positive objects
CN107937432B (en) 2017-11-24 2020-05-01 华中农业大学 Genome editing method based on CRISPR system and application thereof
CN107828738A (en) 2017-11-28 2018-03-23 新乡医学院 A kind of dnmt rna deficiency Chinese hamster ovary celI system and preparation method and application
CN107988256B (en) 2017-12-01 2020-07-28 暨南大学 Recombinant vector for knocking-in human Huntington gene, construction method thereof and application thereof in construction of model pig
CN108148873A (en) 2017-12-06 2018-06-12 南方医科大学 A kind of CAV-1 gene delections zebra fish and preparation method thereof
CN108570479B (en) 2017-12-06 2020-04-03 内蒙古大学 Method for mediating down producing goat VEGF gene fixed-point knock-in based on CRISPR/Cas9 technology
CN108251423B (en) 2017-12-07 2020-11-06 嘉兴市第一医院 sgRNA of CRISPR-Cas9 system specific targeting human RSPO2 gene, activation method and application
CN108315330B (en) 2017-12-07 2020-05-19 嘉兴市第一医院 sgRNA of CRISPR-Cas9 system specific targeting human RSPO2 gene, knockout method and application
CN108148835A (en) 2017-12-07 2018-06-12 和元生物技术(上海)股份有限公司 The sgRNA of CRISPR-Cas9 targeting knock out SLC30A1 genes and its specificity
CN107974466B (en) 2017-12-07 2020-09-29 中国科学院水生生物研究所 Sturgeon CRISPR/Cas9 gene editing method
CN108103090B (en) 2017-12-12 2021-06-15 中山大学附属第一医院 RNA Cas9-m6A modified vector system for targeting RNA methylation, and construction method and application thereof
CN107828826A (en) 2017-12-12 2018-03-23 南开大学 A kind of external method for efficiently obtaining NSC
CA3084825A1 (en) 2017-12-14 2019-06-20 Crispr Therapeutics Ag Novel rna-programmable endonuclease systems and their use in genome editing and other applications
CN108103098B (en) 2017-12-14 2020-07-28 华南理工大学 Compound skin sensitization in-vitro evaluation cell model and construction method thereof
WO2019118949A1 (en) 2017-12-15 2019-06-20 The Broad Institute, Inc. Systems and methods for predicting repair outcomes in genetic engineering
CN107988268A (en) 2017-12-18 2018-05-04 湖南师范大学 A kind of method of gene knockout selection and breeding tcf25 Gene Deletion zebra fish
CN108018316A (en) 2017-12-20 2018-05-11 湖南师范大学 A kind of method of gene knockout selection and breeding rmnd5b Gene Deletion zebra fish
CN108048466B (en) 2017-12-21 2020-02-07 嘉兴市第一医院 CRRNA of CRISPR-Cas13a system specific targeting human RSPO2 gene, system and application
CA3084633A1 (en) 2017-12-21 2019-06-27 Crispr Therapeutics Ag Materials and methods for treatment of usher syndrome type 2a and/or non-syndromic autosomal recessive retinitis pigmentosa (arrp)
RU2652899C1 (en) 2017-12-28 2018-05-03 Федеральное бюджетное учреждение науки "Центральный научно-исследовательский институт эпидемиологии" Федеральной службы по надзору в сфере защиты прав потребителей и благополучия человека (ФБУН ЦНИИ Эпидемиологии Роспотребнадзора) Rna-conductors to suppress the replication of hepatitis b virus and for the elimination of hepatitis b virus from host cell
CN107893080A (en) 2017-12-29 2018-04-10 江苏省农业科学院 A kind of sgRNA for targetting rat Inhba genes and its application
CN107988246A (en) 2018-01-05 2018-05-04 汕头大学医学院 A kind of gene knockout carrier and its zebra fish Glioma Model
CN107988229B (en) 2018-01-05 2020-01-07 中国农业科学院作物科学研究所 Method for obtaining tillering-changed rice by modifying OsTAC1 gene through CRISPR-Cas
CN108103092B (en) 2018-01-05 2021-02-12 中国农业科学院作物科学研究所 System for modifying OsHPH gene by using CRISPR-Cas system to obtain dwarf rice and application thereof
CN108559760A (en) 2018-01-09 2018-09-21 陕西师范大学 The method for establishing luciferase knock-in cell lines based on CRISPR targeted genomic modification technologies
WO2019139951A1 (en) 2018-01-09 2019-07-18 The United States Of America As Represented By The Secretary Of The Department Of Health And Human Services Detecting protein interaction sites in nucleic acids
CN108148837A (en) 2018-01-12 2018-06-12 南京医科大学 ApoE-CRISPR/Cas9 carriers and its application in ApoE genes are knocked out
US11268092B2 (en) 2018-01-12 2022-03-08 GenEdit, Inc. Structure-engineered guide RNA
CN108559730B (en) 2018-01-12 2021-09-24 中国人民解放军第四军医大学 Experimental method for constructing Hutat2 Fc gene knock-in monocyte by CRISPR/Cas9 technology
CN108251451A (en) 2018-01-16 2018-07-06 西南大学 CRISPR/Cas9-gRNA target practices sequence pair, plasmid and its application of HTT
CN108251452A (en) 2018-01-17 2018-07-06 扬州大学 A kind of transgenic zebrafish for expressing Cas9 genes and its construction method and application
WO2019147014A1 (en) 2018-01-23 2019-08-01 기초과학연구원 Extended single guide rna and use thereof
CN208034188U (en) 2018-02-09 2018-11-02 衡阳市振洋汽车配件有限公司 A kind of processing hole fixture quickly positioned
CN108359712B (en) 2018-02-09 2020-06-26 广东省农业科学院农业生物基因研究中心 Method for rapidly and efficiently screening SgRNA target DNA sequence
CN108559745A (en) 2018-02-10 2018-09-21 和元生物技术(上海)股份有限公司 The method for improving B16F10 cell transfecting efficiencies based on CRISPR-Cas9 technologies
CN108486145A (en) 2018-02-12 2018-09-04 中国科学院遗传与发育生物学研究所 Plant efficient methods of homologous recombination based on CRISPR/Cas9
CN108359691B (en) 2018-02-12 2021-09-28 中国科学院重庆绿色智能技术研究院 Kit and method for knocking out abnormal mitochondrial DNA by mito-CRISPR/Cas9 system
WO2019161251A1 (en) 2018-02-15 2019-08-22 The Broad Institute, Inc. Cell data recorders and uses thereof
CN109021111B (en) 2018-02-23 2021-12-07 上海科技大学 Gene base editor
CN108396027A (en) 2018-02-27 2018-08-14 和元生物技术(上海)股份有限公司 The sgRNA of CRISPR-Cas9 targeting knock out people colon-cancer cell DEAF1 genes and its specificity
US20220307001A1 (en) 2018-02-27 2022-09-29 President And Fellows Of Harvard College Evolved cas9 variants and uses thereof
CN108486159B (en) 2018-03-01 2021-10-22 南通大学附属医院 CRISPR-Cas9 system for knocking out GRIN2D gene and application thereof
CN108410906A (en) 2018-03-05 2018-08-17 淮海工学院 A kind of CRISPR/Cpf1 gene editing methods being applicable in Yu Haiyang shell-fish mitochondrial genomes
CN108342480B (en) 2018-03-05 2022-03-01 北京医院 Gene variation detection quality control substance and preparation method thereof
CN108410907B (en) 2018-03-08 2021-08-27 湖南农业大学 Method for realizing HMGCR gene knockout based on CRISPR/Cas9 technology
CN108410911B (en) 2018-03-09 2021-08-20 广西医科大学 LMNA gene knockout cell line constructed based on CRISPR/Cas9 technology
CN108486108B (en) 2018-03-16 2020-10-09 华南农业大学 Cell strain for knocking out human HMGB1 gene and application thereof
CN108486146B (en) 2018-03-16 2021-02-19 中国农业科学院作物科学研究所 Application of LbCpf1-RR mutant in CRISPR/Cpf1 system in plant gene editing
WO2019183641A1 (en) 2018-03-23 2019-09-26 Massachusetts Eye And Ear Infirmary Crispr/cas9-mediated exon-skipping approach for ush2a-associated usher syndrome
CN108384784A (en) 2018-03-23 2018-08-10 广西医科大学 A method of knocking out Endoglin genes using CRISPR/Cas9 technologies
CN108504685A (en) 2018-03-27 2018-09-07 宜明细胞生物科技有限公司 A method of utilizing CRISPR/Cas9 system homologous recombination repair IL-2RG dcc genes
CN108410877A (en) 2018-03-27 2018-08-17 和元生物技术(上海)股份有限公司 The sgRNA of CRISPR-Cas9 targeting knock outs people's cell SANIL1 genes and its specificity
CN108424931A (en) 2018-03-29 2018-08-21 内蒙古大学 The method that CRISPR/Cas9 technologies mediate goat VEGF Gene targetings
CN108486234B (en) 2018-03-29 2022-02-11 东南大学 CRISPR (clustered regularly interspaced short palindromic repeats) typing PCR (polymerase chain reaction) method and application thereof
CN108504693A (en) 2018-04-04 2018-09-07 首都医科大学附属北京朝阳医院 The O-type that T synthase genes structure is knocked out using Crispr technologies glycosylates abnormal colon carcinoma cell line
CN108441520B (en) 2018-04-04 2020-07-31 苏州大学 Gene conditional knockout method constructed by using CRISPR/Cas9 system
CN108486111A (en) 2018-04-04 2018-09-04 山西医科大学 The method and its specificity sgRNA of CRISPR-Cas9 targeting knock out people's SMYD3 genes
CN108486154A (en) 2018-04-04 2018-09-04 福州大学 A kind of construction method of sialidase gene knock-out mice model and its application
CN108753772B (en) 2018-04-04 2020-10-30 南华大学 Construction method of human neuroblastoma cell line with CAPNS1 gene knocked out based on CRISPR/Cas technology
CN108504657B (en) 2018-04-12 2019-06-14 中南民族大学 The method for knocking out HEK293T cell KDM2A gene using CRISPR-CAS9 technology
CN108588182A (en) 2018-04-13 2018-09-28 中国科学院深圳先进技术研究院 Isothermal duplication and detection technique based on the substitution of CRISPR- chains
CN108753817A (en) 2018-04-13 2018-11-06 北京华伟康信生物科技有限公司 The enhanced cell for enhancing the method for the anti-cancer ability of cell and being obtained using this method
CN108753832A (en) 2018-04-20 2018-11-06 中山大学 A method of editing Large White CD163 genes using CRISPR/Cas9
CN108823248A (en) 2018-04-20 2018-11-16 中山大学 A method of Luchuan pigs CD163 gene is edited using CRISPR/Cas9
CN108588071A (en) 2018-04-25 2018-09-28 和元生物技术(上海)股份有限公司 The sgRNA of CRISPR-Cas9 targeting knock out people colon-cancer cell CNR1 genes and its specificity
CN108546712B (en) 2018-04-26 2020-08-07 中国农业科学院作物科学研究所 Method for realizing homologous recombination of target gene in plant by using CRISPR/L bcPf1 system
CN108707621B (en) 2018-04-26 2021-02-12 中国农业科学院作物科学研究所 CRISPR/Cpf1 system-mediated homologous recombination method taking RNA transcript as repair template
CN108588128A (en) 2018-04-26 2018-09-28 南昌大学 A kind of construction method of high efficiency soybean CRISPR/Cas9 systems and application
CN108642053A (en) 2018-04-28 2018-10-12 和元生物技术(上海)股份有限公司 The sgRNA of CRISPR-Cas9 targeting knock out people colon-cancer cell PPP1R1C genes and its specificity
CN108611364A (en) 2018-05-03 2018-10-02 南京农业大学 A kind of preparation method of non-transgenic CRISPR mutant
CN108588123A (en) 2018-05-07 2018-09-28 南京医科大学 CRISPR/Cas9 carriers combine the application in the blood product for preparing gene knock-out pig
CA3100019A1 (en) 2018-05-11 2019-11-14 Beam Therapeutics Inc. Methods of substituting pathogenic amino acids using programmable base editor systems
CN108610399B (en) 2018-05-14 2019-09-27 河北万玛生物医药有限公司 The method that specificity enhancing CRISPR-CAS system carries out gene editing efficiency in epidermal stem cells
CN108546717A (en) 2018-05-15 2018-09-18 吉林大学 The method that antisense lncRNA mediates cis regulatory inhibition expression of target gene
CN108546718B (en) 2018-05-16 2021-07-09 康春生 Application of crRNA-mediated CRISPR/Cas13a gene editing system in tumor cells
CN108624622A (en) 2018-05-16 2018-10-09 湖南艾佳生物科技股份有限公司 A kind of genetically engineered cell strain that can secrete mouse interleukin -6 based on CRISPR-Cas9 systems structure
CN108642055B (en) 2018-05-17 2021-12-03 吉林大学 sgRNA capable of effectively editing pig miR-17-92 gene cluster
CN108642090A (en) 2018-05-18 2018-10-12 中国人民解放军总医院 Method and the application that Nogo-B knocks out pattern mouse are obtained based on CRISPR/Cas9 technologies
CN108642077A (en) 2018-05-18 2018-10-12 江苏省农业科学院 Method based on CRISPR/Cas9 gene editing technology selection and breeding mung bean sterile mutants and special gRNA
CN108642078A (en) 2018-05-18 2018-10-12 江苏省农业科学院 Method based on CRISPR/Cas9 gene editing technology selection and breeding Mung Bean Bloomings pollination mutant and special gRNA
CN108559732A (en) 2018-05-21 2018-09-21 陕西师范大学 The method for establishing KI-T2A-luciferase cell lines based on CRISPR/Cas9 targeted genomic modification technologies
CN108707620A (en) 2018-05-22 2018-10-26 西北农林科技大学 A kind of Gene drive carriers and construction method
EP3797160A1 (en) 2018-05-23 2021-03-31 The Broad Institute Inc. Base editors and uses thereof
US11117812B2 (en) 2018-05-24 2021-09-14 Aqua-Aerobic Systems, Inc. System and method of solids conditioning in a filtration system
CN108690844B (en) 2018-05-25 2021-10-15 西南大学 CRISPR/Cas9-gRNA targeting sequence pair of HTT, plasmid and HD cell model
CN108707629A (en) 2018-05-28 2018-10-26 上海海洋大学 The preparation method of zebra fish notch1b gene mutation bodies
CN108707628B (en) 2018-05-28 2021-11-23 上海海洋大学 Preparation method of zebra fish notch2 gene mutant
CN108823249A (en) 2018-05-28 2018-11-16 上海海洋大学 The method of CRISPR/Cas9 building notch1a mutant zebra fish
CN108707604B (en) 2018-05-30 2019-07-23 江西汉氏联合干细胞科技有限公司 CNE10 gene knockout is carried out using CRISPR-Cas system in epidermal stem cells
CN108753835A (en) 2018-05-30 2018-11-06 中山大学 A method of editing pig BMP15 genes using CRISPR/Cas9
CN108753836B (en) 2018-06-04 2021-10-12 北京大学 Gene regulation or editing system utilizing RNA interference mechanism
WO2019236566A1 (en) 2018-06-05 2019-12-12 Lifeedit, Inc. Rna-guided nucleases and active fragments and variants thereof and methods of use
CN108715850B (en) 2018-06-05 2020-10-23 艾一生命科技(广东)有限公司 GING2 gene knockout in epidermal stem cells by using CRISPR-Cas system
CN108753813B (en) 2018-06-08 2021-08-24 中国水稻研究所 Method for obtaining marker-free transgenic plants
CN108753783A (en) 2018-06-13 2018-11-06 上海市同济医院 The construction method of Sqstm1 full genome knock-out mice animal models and application
US11913044B2 (en) 2018-06-14 2024-02-27 President And Fellows Of Harvard College Evolution of cytidine deaminases
CN108728486A (en) 2018-06-20 2018-11-02 江苏省农业科学院 A kind of construction method of eggplant CRISPR/Cas9 gene knockout carriers and application
CN108841845A (en) 2018-06-21 2018-11-20 广东石油化工学院 A kind of CRISPR/Cas9 carrier and its construction method with selection markers
CN108893529A (en) 2018-06-25 2018-11-27 武汉博杰生物医学科技有限公司 A kind of crRNA being mutated based on CRISPR technology specific detection people KRAS gene 2 and 3 exons
CN108866093B (en) 2018-07-04 2021-07-09 广东三杰牧草生物科技有限公司 Method for performing site-directed mutagenesis on alfalfa gene by using CRISPR/Cas9 system
CN108795902A (en) 2018-07-05 2018-11-13 深圳三智医学科技有限公司 A kind of safe and efficient CRISPR/Cas9 gene editings technology
CN108913714A (en) 2018-07-05 2018-11-30 江西省超级水稻研究发展中心 A method of BADH2 gene, which is knocked out, using CRISPR/Cas9 system formulates fragrant rice
WO2020014261A1 (en) 2018-07-09 2020-01-16 The Broad Institute, Inc. Rna programmable epigenetic rna modifiers and uses thereof
CN108913691B (en) 2018-07-16 2020-09-01 山东华御生物科技有限公司 Card3 gene knockout in epidermal stem cells by using CRISPR-Cas system
CN108913664B (en) 2018-07-20 2020-09-04 嘉兴学院 Method for knocking out CFP1 gene in ovarian cancer cell by CRISPR/Cas9 gene editing method
CN108853133A (en) 2018-07-25 2018-11-23 福州大学 A kind of preparation method of PAMAM and CRISPR/Cas9 System reorganization plasmid delivery nanoparticle
CN108823291B (en) 2018-07-25 2022-04-12 领航医学科技(深圳)有限公司 Specific nucleic acid fragment quantitative detection method based on CRISPR technology
KR20210053898A (en) 2018-07-31 2021-05-12 더 브로드 인스티튜트, 인코퍼레이티드 New CRISPR enzyme and system
CN108913717A (en) 2018-08-01 2018-11-30 河南农业大学 A method of using CRISPR/Cas9 system to rice PHYB site-directed point mutation
KR20210041008A (en) 2018-08-03 2021-04-14 빔 테라퓨틱스, 인크. Multi-effector nucleobase editor for modifying nucleic acid target sequences and methods of using the same
WO2020041751A1 (en) 2018-08-23 2020-02-27 The Broad Institute, Inc. Cas9 variants having non-canonical pam specificities and uses thereof
EP3844272A1 (en) 2018-08-28 2021-07-07 Flagship Pioneering Innovations VI, LLC Methods and compositions for modulating a genome
WO2020051360A1 (en) 2018-09-05 2020-03-12 The Broad Institute, Inc. Base editing for treating hutchinson-gilford progeria syndrome
US20220380740A1 (en) 2018-10-24 2022-12-01 The Broad Institute, Inc. Constructs for improved hdr-dependent genomic editing
WO2020092453A1 (en) 2018-10-29 2020-05-07 The Broad Institute, Inc. Nucleobase editors comprising geocas9 and uses thereof
WO2020102659A1 (en) 2018-11-15 2020-05-22 The Broad Institute, Inc. G-to-t base editors and uses thereof
CN109517841B (en) 2018-12-05 2020-10-30 华东师范大学 Composition, method and application for nucleotide sequence modification
US20230002745A1 (en) 2019-01-23 2023-01-05 The Broad Institute, Inc. Supernegatively charged proteins and uses thereof
JP2022523302A (en) 2019-01-28 2022-04-22 プロキューアール セラピューティクス ツー ベスローテン フェンノートシャップ RNA editing oligonucleotides for the treatment of Usher syndrome
KR20210121092A (en) 2019-01-29 2021-10-07 유니버시티 오브 워싱턴 Gene editing methods
EP3918077A4 (en) 2019-01-31 2023-03-29 Beam Therapeutics, Inc. Nucleobase editors having reduced off-target deamination and methods of using same to modify a nucleobase target sequence
US20220177877A1 (en) 2019-03-04 2022-06-09 President And Fellows Of Harvard College Highly multiplexed base editing
WO2020181178A1 (en) 2019-03-06 2020-09-10 The Broad Institute, Inc. T:a to a:t base editing through thymine alkylation
WO2020181180A1 (en) 2019-03-06 2020-09-10 The Broad Institute, Inc. A:t to c:g base editors and uses thereof
WO2020181202A1 (en) 2019-03-06 2020-09-10 The Broad Institute, Inc. A:t to t:a base editing through adenine deamination and oxidation
WO2020181195A1 (en) 2019-03-06 2020-09-10 The Broad Institute, Inc. T:a to a:t base editing through adenine excision
US20220170013A1 (en) 2019-03-06 2022-06-02 The Broad Institute, Inc. T:a to a:t base editing through adenosine methylation
CA3130488A1 (en) 2019-03-19 2020-09-24 David R. Liu Methods and compositions for editing nucleotide sequences
WO2020210751A1 (en) 2019-04-12 2020-10-15 The Broad Institute, Inc. System for genome editing
WO2020214842A1 (en) 2019-04-17 2020-10-22 The Broad Institute, Inc. Adenine base editors with reduced off-target effects
US20220249697A1 (en) 2019-05-20 2022-08-11 The Broad Institute, Inc. Aav delivery of nucleobase editors
WO2020247587A1 (en) 2019-06-06 2020-12-10 Inscripta, Inc. Curing for recursive nucleic acid-guided cell editing
US20220259617A1 (en) 2019-06-13 2022-08-18 The General Hospital Corporation Engineered human-endogenous virus-like particles and methods of use thereof for delivery to cells
US20220259609A1 (en) 2019-07-30 2022-08-18 Pairwise Plants Services, Inc. Morphogenic regulators and methods of using the same
US20220315906A1 (en) 2019-08-08 2022-10-06 The Broad Institute, Inc. Base editors with diversified targeting scope
WO2021030666A1 (en) 2019-08-15 2021-02-18 The Broad Institute, Inc. Base editing by transglycosylation
EP4021945A4 (en) 2019-08-30 2023-11-15 The General Hospital Corporation Combinatorial adenine and cytosine dna base editors
WO2021042047A1 (en) 2019-08-30 2021-03-04 The General Hospital Corporation C-to-g transversion dna base editors
WO2021072328A1 (en) 2019-10-10 2021-04-15 The Broad Institute, Inc. Methods and compositions for prime editing rna
US20220411768A1 (en) 2019-10-21 2022-12-29 The Trustees Of Columbia University In The City Of New York Methods of performing rna templated genome editing
WO2021081264A1 (en) 2019-10-24 2021-04-29 Pairwise Plants Services, Inc. Optimized crispr-cas nucleases and base editors and methods of use thereof
JP2023501223A (en) 2019-10-30 2023-01-18 ペアーワイズ プランツ サービシズ, インコーポレイテッド Type V CRISPR-CAS base editor and method of use
US20230086199A1 (en) 2019-11-26 2023-03-23 The Broad Institute, Inc. Systems and methods for evaluating cas9-independent off-target editing of nucleic acids
WO2021138469A1 (en) 2019-12-30 2021-07-08 The Broad Institute, Inc. Genome editing using reverse transcriptase enabled and fully active crispr complexes
EP4097124A1 (en) 2020-01-28 2022-12-07 The Broad Institute Inc. Base editors, compositions, and methods for modifying the mitochondrial genome
WO2021158995A1 (en) 2020-02-05 2021-08-12 The Broad Institute, Inc. Base editor predictive algorithm and method of use
WO2021158921A2 (en) 2020-02-05 2021-08-12 The Broad Institute, Inc. Adenine base editors and uses thereof
WO2021158999A1 (en) 2020-02-05 2021-08-12 The Broad Institute, Inc. Gene editing methods for treating spinal muscular atrophy
CA3174537A1 (en) 2020-03-04 2021-09-10 Flagship Pioneering Innovations Vi, Llc Methods and compositions for modulating a genome
KR20230053735A (en) 2020-03-04 2023-04-21 플래그쉽 파이어니어링 이노베이션스 브이아이, 엘엘씨 Improved methods and compositions for manipulation of genomes
CN116209756A (en) 2020-03-04 2023-06-02 旗舰先锋创新Vi有限责任公司 Methods and compositions for modulating genome
EP4114928A1 (en) 2020-03-05 2023-01-11 Flagship Pioneering Innovations VI, LLC Host defense suppressing methods and compositions for modulating a genome
US20230159913A1 (en) 2020-04-28 2023-05-25 The Broad Institute, Inc. Targeted base editing of the ush2a gene
GB2614813A (en) 2020-05-08 2023-07-19 Harvard College Methods and compositions for simultaneous editing of both strands of a target double-stranded nucleotide sequence
EP4314257A1 (en) 2021-04-01 2024-02-07 Prime Medicine, Inc. Methods and compositions for editing nucleotide sequences
AU2022283964A1 (en) 2021-06-03 2023-12-21 Prime Medicine, Inc. Genome editing compositions and methods for treatment of wilson's disease
WO2023283092A1 (en) 2021-07-06 2023-01-12 Prime Medicine, Inc. Compositions and methods for efficient genome editing
WO2023288332A2 (en) 2021-07-16 2023-01-19 Prime Medicine, Inc. Genome editing compositions and methods for treatment of wilson's disease
WO2023004439A2 (en) 2021-07-23 2023-01-26 Prime Medicine, Inc. Genome editing compositions and methods for treatment of chronic granulomatous disease

Similar Documents

Publication Publication Date Title
US11643652B2 (en) Methods and compositions for prime editing nucleotide sequences
US11912985B2 (en) Methods and compositions for simultaneous editing of both strands of a target double-stranded nucleotide sequence
JPWO2020191243A5 (en)
WO2022067130A2 (en) Prime editing guide rnas, compositions thereof, and methods of using the same
JPWO2020191234A5 (en)
JPWO2020191233A5 (en)