JPWO2020191234A5 - - Google Patents

Download PDF

Info

Publication number
JPWO2020191234A5
JPWO2020191234A5 JP2021556862A JP2021556862A JPWO2020191234A5 JP WO2020191234 A5 JPWO2020191234 A5 JP WO2020191234A5 JP 2021556862 A JP2021556862 A JP 2021556862A JP 2021556862 A JP2021556862 A JP 2021556862A JP WO2020191234 A5 JPWO2020191234 A5 JP WO2020191234A5
Authority
JP
Japan
Prior art keywords
dna
nucleotides
sequence
strand
pegrna
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2021556862A
Other languages
Japanese (ja)
Other versions
JP2022526908A (en
Publication date
Application filed filed Critical
Priority claimed from PCT/US2020/023713 external-priority patent/WO2020191234A1/en
Publication of JP2022526908A publication Critical patent/JP2022526908A/en
Publication of JPWO2020191234A5 publication Critical patent/JPWO2020191234A5/ja
Pending legal-status Critical Current

Links

Images

Description

政府の支援
本発明は、国立衛生研究所によって授与された助成金第U01AI142756号、第RM1HG009490号、第R01EB022376号、および第R35GM118062号の下、政府の支援によりなされた。政府は本発明において一定の権利を有する。
GOVERNMENT SUPPORT This invention was made with government support under Grants No. U01AI142756, RM1HG009490, R01EB022376, and R35GM118062 awarded by the National Institutes of Health. The Government has certain rights in this invention.

関連出願および参照による組み込み
この米国仮出願は、以下の出願、つまり、2019年3月19日出願の米国仮出願第62/820,813号(代理人整理番号B1195.70074US00)、2019年6月7日出願の米国仮出願第62/858,958号(代理人整理番号B1195.70074US01)、2019年8月21日出願の米国仮出願第62/889,996号(代理人整理番号B1195.70074US02)、2019年8月21日出願の米国仮出願第62/922,654号(代理人整理番号B1195.70083US00)、2019年10月10日出願の米国仮出願第62/913,553号(代理人整理番号B1195.70074US03)、2019年10月10日出願の米国仮出願第62/973,558号(代理人整理番号B1195.70083US01)、2019年11月5日出願の米国仮出願第62/931,195号(代理人整理番号B1195.70074US04)、2019年12月5日出願の米国仮出願第62/944,231号(代理人整理番号B1195.70074US05)、2019年12月5日出願の米国仮出願第62/974,537号(代理人整理番号B1195.70083US02)、2020年3月17日出願の米国仮出願第62/991,069号(代理人整理番号B1195.70074US06)、および2020年3月17日出願の米国仮出願(これを出願する時点で連番は入手不可能)(代理人整理番号B1195.70083US03)を指し、参照により組み込む。
RELATED APPLICATIONS AND INCORPORATION BY REFERENCE This U.S. Provisional Application is incorporated by reference : U.S. Provisional Application No. 62/820,813 (Attorney Docket No. B1195.70074US00) filed March 19, 2019, June 7, 2019; U.S. Provisional Application No. 62/858,958 (Attorney Docket No. B1195.70074US01), filed August 21, 2019, U.S. Provisional Application No. 62/889,996 (Attorney Docket No. B1195.70074US02), August 2019 U.S. Provisional Application No. 62/922,654 (Attorney Docket No. B1195.70083US00) filed on October 21, 2019, U.S. Provisional Application No. 62/913,553 (Attorney Docket No. B1195.70074US03) filed October 10, 2019. U.S. Provisional Application No. 62/973,558 (Attorney Docket No. B1195.70083US01) filed on October 10, U.S. Provisional Application No. 62/931,195 (Attorney Docket No. B1195.70074US04) filed on November 5, 2019; U.S. Provisional Application No. 62/944,231 (Attorney Docket No. B1195.70074US05) filed December 5, 2019; U.S. Provisional Application No. 62/974,537 (Attorney Docket No. B1195.70083US02) filed December 5, 2019 ), U.S. Provisional Application No. 62/991,069 (Attorney Docket No. B1195.70074US06) filed on March 17, 2020, and U.S. Provisional Application No. 62/991,069 (Attorney Docket No. B1195.70074US06) filed on March 17, 2020 (at the time of filing, the serial number is Unavailable) (Agent Docket No. B1195.70083US03), incorporated by reference.

本発明の背景
病原性のある単一ヌクレオチド突然変異は、ある推計によれば遺伝的要素が存在するヒト疾患のおよそ50%に寄与する7。残念ながら、これら遺伝性障害をもつ患者にとっての処置の選択肢は、数十年に及ぶ遺伝子治療探索に関わらず、依然として極度に限定的である8。おそらく、この治療上の課題への最も簡素な解決策は患者ゲノム中の単一ヌクレオチド突然変異の直接的な修正であって、これは疾患の根本的原因に対処し、かつ永続する恩恵を提供するかもしれない。かかるストラテジーはこれまでに考えられないことであったが、CRISRP/Cas系9の到来によってもたらされたゲノム編集性能における近年の改善は今や、この治療的アプローチを射程圏内に入れる。標的DNA配列に相補的な~20ヌクレオチドを含有するガイドRNA(gRNA)配列の簡単なデザインによって、想定されるほぼ全てのゲノム部位は、CRISPR関連(Cas)ヌクレアーゼによって特異的にアクセスされ得る1,2。今日まで、数種の単量体細菌性Casヌクレアーゼ系が同定されており、ゲノム編集用途に適応された10。このCasヌクレアーゼの天然の多様性は、増え続ける改変バリアントの一群と併せて11~14、新しいゲノム編集技術を開発するための肥沃な土壌を用意する。
Background of the Invention Pathogenic single nucleotide mutations contribute by some estimates to approximately 50% of human diseases that have a genetic component7. Unfortunately, treatment options for patients with these genetic disorders remain extremely limited despite decades of gene therapy exploration. Perhaps the simplest solution to this therapeutic challenge is the direct correction of single nucleotide mutations in the patient's genome, which addresses the root cause of the disease and provides lasting benefit. I might. Although such a strategy was previously unthinkable, recent improvements in genome editing performance brought about by the arrival of the CRISRP/Cas system 9 now bring this therapeutic approach within reach. By the simple design of guide RNA (gRNA) sequences containing ~20 nucleotides complementary to the target DNA sequence, almost any conceivable genomic site can be specifically accessed by CRISPR-associated (Cas) nucleases . 2 . To date, several monomeric bacterial Cas nuclease systems have been identified and adapted for genome editing applications . This natural diversity of Cas nucleases, together with the ever-growing array of engineered variants, 11-14 provides fertile ground for the development of new genome editing technologies.

CRISPRでの遺伝子破壊は今や成熟した技法であるとはいえ、ヒトゲノム中の単一塩基対の高精度編集は依然として大きな課題である3。相同組み換え修復(Homology directed repair)(HDR)は長い間、ヒト細胞および他の生物において、所望の編集をコードするドナーDNA修復鋳型を使用しDNA配列を二本鎖切断(double strand break)(DSB)の部位にて挿入、修正、または交換(exchange)するために使用されてきた15。しかしながら、既存のHDRは、ほとんどのヒト細胞型において、具体的に非分裂細胞において、極めて低い効率を有し、両立しない非相同末端結合(non-homologous end joining)(NHEJ)は、主として挿入-欠失(インデル(indel))副産物に繋がる16。他の問題点はDSBの生成に関するが、これは標的遺伝子座にて大きな染色体再配置および欠失を生じさせ得るか17、または成長停止(growth arrest)およびアポトーシスに繋がるp53軸を活性化する18,19 Although CRISPR gene disruption is now a mature technique, precision editing of single base pairs in the human genome remains a major challenge . Homology directed repair (HDR) has long been used in human cells and other organisms to generate double strand breaks (DSBs) in DNA sequences using a donor DNA repair template that encodes the desired edits. ) have been used for insertion, modification, or exchange at sites15 . However, existing HDRs have very low efficiency in most human cell types, specifically in non-dividing cells, and incompatible non-homologous end joining (NHEJ) are mainly used for insert- Deletion (indel) leads to by-products16 . Other issues concern the generation of DSBs, which can result in large chromosomal rearrangements and deletions at targeted loci17 or activate the p53 axis leading to growth arrest and apoptosis18 ,19 .

数種のアプローチがHDRのこれら欠点に対処するために探索されてきた。例えば、単鎖DNA破壊(ニック)のオリゴヌクレオチドドナーでの修復は、インデル形成を低減することが示されたが、所望の修復産物の収率は依然として低い20。他のストラテジーは、小分子および生物学的試薬を使用して修復をNHEJよりHDRへ向かうよう偏らせることを試みている21~23。しかしながら、これらの方法の有効性は細胞型に依存し得、正常な細胞状態の撹乱は、望ましくなくかつ予測不可能な効果へ繋がり得る。 Several approaches have been explored to address these shortcomings of HDR. For example, repair of single-stranded DNA breaks (nicks) with oligonucleotide donors has been shown to reduce indel formation, but the yield of the desired repair product remains low20 . Other strategies use small molecules and biological reagents to attempt to bias repair toward HDR over NHEJ 21 - 23 . However, the effectiveness of these methods can depend on the cell type, and perturbation of normal cellular conditions can lead to undesirable and unpredictable effects.

近年、Devid Liu教授らが率いる本発明者らは、DSBを創出することもHDRに頼ることもなく標的ヌクレオチドを編集する技術として塩基編集を開発した4~6,24~27。Cas融合デアミナーゼによるDNA塩基の直接修飾は、極めて高効率の短い標的窓(short target window)(~5~7塩基)におけるC・G→T・AまたはA・T→G・C塩基対変換を可能にさせる。結果として、塩基編集因子(base editors)は科学界によって迅速に採用された。しかしながら、以下の因子は、高精度ゲノム編集のためのそれらの一般性を限定する:(1)標的窓上の非標的CまたはA塩基の「バイスタンダー(bystander)編集」が観察され;(2)標的ヌクレオチド産物混合物が観察され;(3)標的塩基はPAM配列の15±2ヌクレオチド上流に位置付けられなければならず;(5)小さい挿入および欠失変異の修復は可能ではない。 Recently, the present inventors, led by Professor David Liu and colleagues, developed base editing as a technique to edit target nucleotides without creating DSBs or relying on HDR4-6,24-27 . Direct modification of DNA bases by Cas-fusion deaminase allows C・G→T・A or A・T→G・C base pair conversion in a short target window (~5-7 bases) with extremely high efficiency. make it possible. As a result, base editors were quickly adopted by the scientific community. However, the following factors limit their generality for precision genome editing: (1) “bystander editing” of non-target C or A bases on the target window is observed; (2) ) a target nucleotide product mixture is observed; (3) the target base must be located 15±2 nucleotides upstream of the PAM sequence; (5) repair of small insertion and deletion mutations is not possible.

したがって、所望されるいずれの単一ヌクレオチドの変化も柔軟に導入することが可能であるか、および/または塩基対の挿入または欠失(例として、少なくとも1、2、3、4、5、6、8、9、10、11、12、13、14、15、16、17、18、19、20、30、40、50、60、70、80、90、100、もしくはそれより多くの塩基対の挿入または欠失)を組み入れ得るか、および/または標的部位にてヌクレオチド配列を高い特異性および効率で変更もしくは修飾し得る、プログラム型編集因子の開発は、CRISPRに基づくゲノム編集技術の範囲(scope)および治療可能性を実質的に拡大するであろう。 It is therefore possible to flexibly introduce any desired single nucleotide changes and/or base pair insertions or deletions (for example, at least 1, 2, 3, 4, 5, 6 , 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 30, 40, 50, 60, 70, 80, 90, 100 or more base pairs The development of programmed editing elements that can incorporate (insertions or deletions of scope) and therapeutic possibilities.

本発明の概要
本発明は、「プライム編集」と呼ばれるゲノム編集のための全く新しいプラットホームを記載する。プライム編集は、ポリメラーゼ(すなわち、融合タンパク質の形態であるか、または別様にnapDNAbpとはtransで提供される)と共働する核酸プログラム型DNA結合タンパク質(「napDNAbp」)を使用して、新しい遺伝情報を特定DNA部位中へ直接書き込む多目的かつ正確なゲノム編集方法であるが、プライム編集系は、ガイドRNA上へ(例として、ガイドRNAの5'末もしくは3'末にて、または内部にて)改変される伸長(extension)(DNAまたはRNAのいずれか)を経由する置き換えDNA鎖の形態での所望の編集の合成のための標的部位と鋳型との両方を特定するプライム編集(PE)ガイドRNA(「PEgRNA」)でプログラムされる。所望の編集(例として、単一核酸塩基の置換)を含有する置き換え鎖は、編集されるべき標的部位(それが所望の編集を包含するのは例外として)の内生鎖と同じ配列を共有する。DNA修復および/または複製機構を通して、標的部位の内生鎖は、所望の編集を含有する新しく合成された置き換え鎖によって置き換えられる。いくつかのケースにおいて、本明細書に記載のとおりのプライム編集因子は、編集されるべき所望の標的部位を探査し位置付けるのみならず、同時に、内生DNA鎖の対応する標的部位の代わりに組み入れられる所望の編集を含有する置き換え鎖をコードするところ、プライム編集は「探査-と-置き換え(search-and-replace)」ゲノム編集技術であると考えられることもある。
Overview of the Invention The present invention describes an entirely new platform for genome editing, called "prime editing". Prime editing is a versatile and precise genome editing method that uses a nucleic acid programmable DNA binding protein ("napDNAbp") in cooperation with a polymerase (i.e., in the form of a fusion protein or otherwise provided in trans with napDNAbp) to write new genetic information directly into a specific DNA site, whereas the prime editing system is programmed with a prime editing (PE) guide RNA ("PEgRNA") that specifies both the target site and a template for the synthesis of the desired edit in the form of a replacement DNA strand via an extension (either DNA or RNA) that is engineered onto the guide RNA (e.g., at the 5' or 3' end of the guide RNA, or internally). The replacement strand, which contains the desired edit (e.g., a single nucleobase substitution), shares the same sequence as the endogenous strand of the target site to be edited (with the exception that it encompasses the desired edit). Through DNA repair and/or replication mechanisms, the endogenous strand of the target site is replaced by the newly synthesized replacement strand, which contains the desired edit. In some cases, prime editing may be considered a "search-and-replace" genome editing technique, where prime editing elements as described herein not only search for and locate the desired target site to be edited, but also simultaneously encode a replacement strand containing the desired edit that is incorporated in place of the corresponding target site in the endogenous DNA strand.

本開示のプライム編集因子は、標的にプライムされた(target-primed)逆転写(TPRT)または「プライム編集」の機序が、効率および遺伝子の融通性(genetic flexibility)が高い高精度CRISPR/Casベースのゲノム編集を(例として、図1A~1Fの様々な態様において描かれているとおり)行うために活用または採用され得るという発見に、一部関する。TPRTは天然には、哺乳動物の非LTRレトロトランスポゾンおよび細菌のグループIIイントロンなどの可動DNA因子(mobile DNA elements)によって使用される28,29。本発明者らは本明細書中、特定のDNA配列をガイドRNAで標的にし、標的部位にて単鎖ニックを生成し、およびニック入りDNAを、ガイドRNAで取り入れられた改変逆転写酵素鋳型の逆転写のためのプライマーとして使用する、Casタンパク質-逆転写酵素の融合体または関連する系を使用している。しかしながら、この概念は逆転写酵素をDNAポリメラーゼの構成要素として使用するプライム編集因子から始まったものの、本明細書に記載のプライム編集因子は逆転写酵素に限定されず、事実上はDNAポリメラーゼの使用を包含していてもよい。実際に本出願は全体を通し「逆転写酵素」をもつプライム編集因子に言及することもあるが、逆転写酵素は、プライム編集で働き得る唯一のタイプのDNAポリメラーゼであることが本明細書に説明されている。よって、本明細書のどこで「逆転写酵素」に言及しようとも、当業者は、いずれの好適なDNAポリメラーゼも逆転写酵素の代わりに使用されてもよいことを解するはずである。よって、一側面において、プライム編集因子は、標的DNA中の相補的なプロトスペーサーとアニールするスペーサー配列を含有する特化されたガイドRNA(すなわち、PEgRNA)とDNA配列を結び付けることによってDNA配列を標的にするようプログラムされているCas9(または等価なnapDNAbp)を含んでいてもよい。特化されたガイドRNAはまた、対応する内生DNA鎖を標的部位にて置き換えるために使用される所望の遺伝子変更を含有するDNAの置き換え鎖をコードする伸長という形態で、新しい遺伝情報も含有する。情報をPEgRNAから標的DNAへ伝達するため、プライム編集の機序は、3'ヒドロキシル基を晒すDNAの一方の鎖中の標的部位にニックを入れることを伴う。晒される3'ヒドロキシル基は次いで、PEgRNA上の、編集をコードする伸長の、標的部位中への直接的なDNA重合をプライムするのに使用され得る。様々な態様において、伸長-これは編集を含有する置き換え鎖の重合のための鋳型を提供する-は、RNAまたはDNAから形成され得る。RNA伸長のケースにおいて、プライム編集因子のポリメラーゼは、RNA依存性DNAポリメラーゼ(逆転写酵素など)であり得る。DNA伸長のケースにおいて、プライム編集因子のポリメラーゼは、DNA依存性DNAポリメラーゼであってもよい。 The prime editing factors of the present disclosure utilize a target-primed reverse transcription (TPRT) or "prime editing" mechanism that is highly efficient and highly genetically flexible, such as CRISPR/CRISPR/Cast. In part, the present invention relates in part to the discovery that the present invention can be exploited or employed to perform genome-based editing (eg, as depicted in the various embodiments of FIGS. 1A-1F). TPRT is naturally used by mobile DNA elements such as non-LTR retrotransposons in mammals and group II introns in bacteria28,29 . We herein target a specific DNA sequence with a guide RNA, generate a single-stranded nick at the target site, and transfer the nicked DNA to a modified reverse transcriptase template incorporated with the guide RNA. A Cas protein-reverse transcriptase fusion or related system is used as a primer for reverse transcription. However, although this concept began with prime editing agents that use reverse transcriptase as a component of DNA polymerase, the prime editing agents described herein are not limited to reverse transcriptase, and in fact, the use of DNA polymerase may include. Indeed, although this application may refer throughout this application to a prime editing agent having "reverse transcriptase," it is hereby established that reverse transcriptase is the only type of DNA polymerase that can act in prime editing. explained. Thus, wherever "reverse transcriptase" is referred to herein, one of ordinary skill in the art should understand that any suitable DNA polymerase may be used in place of reverse transcriptase. Thus, in one aspect, the prime editing factor targets a DNA sequence by associating the DNA sequence with a specialized guide RNA (i.e., PEgRNA) that contains a spacer sequence that anneals to a complementary protospacer in the target DNA. It may contain Cas9 (or equivalent napDNAbp) that is programmed to do so. The specialized guide RNA also contains new genetic information in the form of an extension encoding a replacement strand of DNA containing the desired genetic modification that is used to replace the corresponding endogenous DNA strand at the target site. do. To transfer information from PEgRNA to target DNA, the prime editing mechanism involves nicking the target site in one strand of the DNA exposing the 3' hydroxyl group. The exposed 3' hydroxyl group can then be used to prime DNA polymerization of the editing-encoding extension onto the PEgRNA directly into the target site. In various embodiments, the extension - which provides a template for polymerization of the replacement strand containing the edit - can be formed from RNA or DNA. In the case of RNA elongation, the prime editing agent polymerase can be an RNA-dependent DNA polymerase (such as reverse transcriptase). In the case of DNA extension, the prime editor polymerase may be a DNA-dependent DNA polymerase.

本明細書に開示のプライム編集因子によって形成された、新しく合成された鎖(すなわち、所望の編集を含有する置き換えDNA鎖)は、所望のヌクレオチド変化(例として、単一ヌクレオチドの変化、欠失、もしくは挿入、またはそれらの組み合わせ)を包含することを除けば、ゲノムの標的配列と相同である(すなわち、これと同じ配列を有する)であろう。新しく合成された(または置き換え)DNAの鎖はまた、単鎖DNAフラップと称されることもあるが、これはハイブリダイゼーションを相補的な相同の内生DNA鎖と競合し、これによって対応する内生鎖に取って代わる。ある態様において、系は、エラーを起こしやすい(error-prone)逆転写酵素(例として、Cas9ドメインとの融合タンパク質として提供されるか、またはCas9ドメインとはtransで提供される)の使用と組み合わせられ得る。エラーを起こしやすい逆転写酵素は、単鎖DNAフラップ合成の最中に変更を導入し得る。よって、ある態様において、エラーを起こしやすい逆転写酵素は、ヌクレオチド変化を標的DNAへ導入するために利用され得る。系とともに使用される、エラーを起こしやすい逆転写酵素に応じて、変化はランダムまたは非ランダムであり得る。 The newly synthesized strand (i.e., the replacement DNA strand containing the desired edits) formed by the prime editing agents disclosed herein contains the desired nucleotide changes (e.g., single nucleotide changes, deletions). , or insertions, or combinations thereof) will be homologous to (ie, have the same sequence as) the target sequence of the genome. The newly synthesized (or replaced) strand of DNA, sometimes referred to as a single-stranded DNA flap, competes for hybridization with the complementary homologous endogenous DNA strand, thereby Replaces raw chains. In certain embodiments, the system combines the use of an error-prone reverse transcriptase (e.g., provided as a fusion protein with a Cas9 domain or provided in trans with a Cas9 domain). can be Error-prone reverse transcriptases can introduce changes during single-stranded DNA flap synthesis. Thus, in certain embodiments, error-prone reverse transcriptase can be utilized to introduce nucleotide changes into target DNA. Depending on the error-prone reverse transcriptase used with the system, changes can be random or non-random.

ハイブリダイズされた中間体(内生DNA鎖とハイブリダイズされた逆転写酵素によって合成された単鎖DNAフラップを含む)の分解は、その結果得られる内生DNAの、取って代わられたフラップの(例として、5'末DNAフラップエンドヌクレアーゼ、FEN1での)除去、合成された単鎖DNAフラップの標的DNAへのライゲーション、ならびに細胞のDNA修復および/または複製プロセスの結果としての所望のヌクレオチド変化の同化を包含し得る。鋳型化(templated)DNA合成が、単一ヌクレオチドという高精度を、挿入および欠失を包含する、いずれのヌクレオチドの修飾にも付与することから、このアプローチの幅は極めて広く、基礎科学および治療法における無数の用途に使用され得ることが予見できる。 Degradation of the hybridized intermediate (including the single-stranded DNA flap synthesized by reverse transcriptase that is hybridized with the endogenous DNA strand) causes the resulting endogenous DNA to displace the replaced flap. removal (for example, with the 5'-end DNA flap endonuclease, FEN1), ligation of the synthesized single-stranded DNA flap to the target DNA, and desired nucleotide changes as a result of cellular DNA repair and/or replication processes. can include the assimilation of Because templated DNA synthesis imparts high single-nucleotide precision to any nucleotide modification, including insertions and deletions, the breadth of this approach is extremely broad and has applications in both basic science and therapeutics. It is foreseeable that it could be used for a myriad of applications in the field.

一側面において、本明細書は、核酸プログラム型DNA結合タンパク質(napDNAbp)と逆転写酵素とを含む融合タンパク質を提供する。種々の態様において、融合タンパク質は、伸長されたガイドRNAの存在下においてプライム標的にプライムされた逆転写によるゲノム編集を実行することができる。 In one aspect, the present specification provides a fusion protein comprising a nucleic acid programmed DNA binding protein (napDNAbp) and a reverse transcriptase. In various embodiments, the fusion protein is capable of performing genome editing by reverse transcription primed to a primed target in the presence of an elongated guide RNA.

ある態様において、napDNAbpはニッカーゼ活性を有する。napDNAbpは、Cas9タンパク質またはその機能的等価物、例えばヌクレアーゼ活性Cas9、ヌクレアーゼ不活性型Cas9(dCas9)、またはCas9ニッカーゼ(nCas9)でもまたあり得る。 In some embodiments, the napDNAbp has nickase activity. The napDNAbp can also be a Cas9 protein or a functional equivalent thereof, such as a nuclease-active Cas9, a nuclease-inactive Cas9 (dCas9), or a Cas9 nickase (nCas9).

ある態様において、napDNAbpは:Cas9、Cas12e、Cas12d、Cas12a、Cas12b1、Cas13a、Cas12c、およびアルゴノートからなる群から選択され、任意にニッカーゼ活性を有する。 In certain embodiments, the napDNAbp is selected from the group consisting of: Cas9, Cas12e, Cas12d, Cas12a, Cas12b1, Cas13a, Cas12c, and Argonaute, and optionally has nickase activity.

他の態様において、融合タンパク質は、伸長されたガイドRNAと複合体化したときに標的DNA配列に結合することができる。 In other embodiments, the fusion protein is capable of binding to a target DNA sequence when complexed with an elongated guide RNA.

なお他の態様において、標的DNA配列は標的鎖および相補的な非標的鎖を含む。 In still other embodiments, the target DNA sequence includes a target strand and a complementary non-target strand.

他の態様において、伸長されたガイドRNAに対する複合体化した融合タンパク質の結合はRループを形成する。Rループは(i)伸長されたガイドRNAと標的鎖とを含むRNA-DNAハイブリッドおよび(ii)相補的な非標的鎖を含み得る。 In other embodiments, binding of the complexed fusion protein to the elongated guide RNA forms an R-loop. The R-loop can include (i) an RNA-DNA hybrid comprising an elongated guide RNA and a target strand and (ii) a complementary non-target strand.

なお他の態様において、相補的な非標的鎖はニッキングされて、遊離の3'端を有する逆転写酵素プライム配列を形成する。 In yet other embodiments, the complementary non-target strand is nicked to form a reverse transcriptase prime sequence with a free 3' end.

種々の態様において、伸長されたガイドRNAは、(a)ガイドRNAと、(b)ガイドRNAの5'もしくは3'端またはガイドRNAの分子内の位置付けにおけるRNA伸長とを含む。RNA伸長は、(i)所望のヌクレオチド変化を含む逆転写鋳型配列と、(ii)逆転写プライマー結合部位と、(iii)任意にリンカー配列とを含み得る。種々の態様において、逆転写鋳型配列は、ニック部位に隣接する内生DNA配列に対して相補的である一本鎖DNAフラップをコードし得、一本鎖DNAフラップは所望のヌクレオチド変化を含む。 In various embodiments, the elongated guide RNA comprises (a) a guide RNA and (b) RNA extension at the 5' or 3' end of the guide RNA or at an intramolecular location of the guide RNA. RNA extension can include (i) a reverse transcription template sequence containing the desired nucleotide changes, (ii) a reverse transcription primer binding site, and (iii) an optional linker sequence. In various embodiments, the reverse transcription template sequence can encode a single-stranded DNA flap that is complementary to the endogenous DNA sequence adjacent to the nick site, and the single-stranded DNA flap includes the desired nucleotide changes.

様々な態様において、RNA伸長は、長さが少なくとも5ヌクレオチド、少なくとも6ヌクレオチド、少なくとも7ヌクレオチド、少なくとも8ヌクレオチド、少なくとも9ヌクレオチド、少なくとも10ヌクレオチド、少なくとも11ヌクレオチド、少なくとも12ヌクレオチド、少なくとも13ヌクレオチド、少なくとも14ヌクレオチド、少なくとも15ヌクレオチド、少なくとも16ヌクレオチド、少なくとも17ヌクレオチド、少なくとも18ヌクレオチド、少なくとも19ヌクレオチド、少なくとも20ヌクレオチド、少なくとも21ヌクレオチド、少なくとも22ヌクレオチド、少なくとも23ヌクレオチド、少なくとも24ヌクレオチド、または少なくとも25ヌクレオチドである。 In various embodiments, the RNA elongation is at least 5 nucleotides, at least 6 nucleotides, at least 7 nucleotides, at least 8 nucleotides, at least 9 nucleotides, at least 10 nucleotides, at least 11 nucleotides, at least 12 nucleotides, at least 13 nucleotides, at least 14 nucleotides in length. nucleotides, at least 15 nucleotides, at least 16 nucleotides, at least 17 nucleotides, at least 18 nucleotides, at least 19 nucleotides, at least 20 nucleotides, at least 21 nucleotides, at least 22 nucleotides, at least 23 nucleotides, at least 24 nucleotides, or at least 25 nucleotides.

なお他の態様において、一本鎖DNAフラップは、ニック部位に隣接する内生DNA配列にハイブリダイズし、それによって所望のヌクレオチド変化を組み入れ得る。なお他の態様において、一本鎖DNAフラップは、遊離の5'端を有しかつニック部位に隣接する内生DNA配列に取って代わる。ある態様において、5'端を有する取って代わられた内生DNAは細胞によって切除される。 In still other embodiments, single-stranded DNA flaps can hybridize to endogenous DNA sequences adjacent to the nick site, thereby incorporating desired nucleotide changes. In still other embodiments, a single-stranded DNA flap has a free 5' end and replaces the endogenous DNA sequence adjacent to the nick site. In certain embodiments, the displaced endogenous DNA with a 5' end is excised by the cell.

種々の態様において、一本鎖DNAフラップの細胞性修復は所望のヌクレオチド変化の組み入れをもたらし、それによって所望の産物を形成する。 In various embodiments, cellular repair of the single-stranded DNA flap results in the incorporation of the desired nucleotide changes, thereby forming the desired product.

種々の他の態様において、所望のヌクレオチド変化は、PAM配列の約-4~+10の間にある編集窓上に組み入れされる。 In various other embodiments, the desired nucleotide changes are incorporated over an editing window that lies between about -4 and +10 of the PAM sequence.

なお他の態様において、所望のヌクレオチド変化は、ニック部位の約-5~+5の間、またはニック部位の約-10~+10の間、またはニック部位の約-20~+20の間、またはニック部位の約-30~+30の間、またはニック部位の約-40~+40の間、またはニック部位の約-50~+50の間、またはニック部位の約-60~+60の間、またはニック部位の約-70~+70の間、またはニック部位の約-80~+80の間、またはニック部位の約-90~+90の間、またはニック部位の約-100~+100の間、またはニック部位の約-200~+200の間である編集窓上に組み入れされる。 In still other embodiments, the desired nucleotide change is between about -5 and +5 of the nick site, or between about -10 and +10 of the nick site, or between about -20 and +20 of the nick site, or between about -30 and +30 of the nick site, or between about -40 and +40 of the nick site, or between about -50 and +50 of the nick site, or between about -60 and +60 of the nick site. or between about -70 and +70 of the nick site, or between about -80 and +80 of the nick site, or between about -90 and +90 of the nick site, or between about -100 and + of the nick site. 100, or on an editing window that is between about -200 and +200 of the nick site.

種々の態様において、napDNAbpは配列番号18のアミノ酸配列を含む。種々の他の態様において、napDNAbpは、配列番号26~39、42~61、75~76、126、130、137、141、147、153、157、445、460、467、および482~487(Cas9);(SpCas9);配列番号77~86(CP-Cas9);配列番号18~25および87~88(SpCas9);および配列番号62~72(Cas12)のいずれか1つのアミノ酸配列と少なくとも80%、85%、90%、95%、98%、または99%同一であるアミノ酸配列を含む。 In various embodiments, napDNAbp comprises the amino acid sequence of SEQ ID NO: 18. In various other embodiments, napDNAbp is SEQ ID NO. ); (SpCas9); SEQ ID NO: 77-86 (CP-Cas9); SEQ ID NO: 18-25 and 87-88 (SpCas9); and at least 80% of the amino acid sequence of any one of SEQ ID NO: 62-72 (Cas12) , 85%, 90%, 95%, 98%, or 99% identical.

他の態様において、開示される融合タンパク質および/または組成物の逆転写酵素は、配列番号89~100、105~122、128~129、132、139、143、149、154、159、235、454、471、516、662、700~716、739~742、および766のアミノ酸配列のいずれか1つを含み得る。なお他の態様において、逆転写酵素は、配列番号89~100、105~122、128~129、132、139、143、149、154、159、235、454、471、516、662、700~716、739~742、および766のいずれか1つのアミノ酸配列と少なくとも80%、85%、90%、95%、98%、または99%同一であるアミノ酸配列を含み得る。これらの配列は例えばレトロウイルスもしくはレトロトランスポゾンからの天然に存在する逆転写酵素配列であり得るか、または配列は組み換えであり得る。 In other embodiments, the reverse transcriptase of the disclosed fusion proteins and/or compositions is SEQ ID NO: 89-100, 105-122, 128-129, 132, 139, 143, 149, 154, 159, 235, 454 , 471, 516, 662, 700-716, 739-742, and 766. In still other embodiments, the reverse transcriptase is SEQ ID NO: 89-100, 105-122, 128-129, 132, 139, 143, 149, 154, 159, 235, 454, 471, 516, 662, 700-716 , 739-742, and 766. These sequences may be naturally occurring reverse transcriptase sequences, for example from retroviruses or retrotransposons, or the sequences may be recombinant.

種々の他の態様において、本明細書に開示の融合タンパク質は種々の構造的構成を含み得る。例えば、融合タンパク質は構造NH2-[napDNAbp]-[逆転写酵素]-COOH;またはNH2-[逆転写酵素]-[napDNAbp]-COOHを含み得、「]-[」の夫々のものは任意のリンカー配列の存在を指示する。 In various other embodiments, the fusion proteins disclosed herein can include various structural configurations. For example, a fusion protein can include the structure NH 2 -[napDNAbp]-[reverse transcriptase]-COOH; or NH 2 -[reverse transcriptase]-[napDNAbp]-COOH, where each of "]-[" Indicates the presence of any linker sequences.

種々の態様において、リンカー配列は、配列番号127、165~176、446、453、および767~769のアミノ酸配列、または配列番号127、165~176、446、453、および767~769のリンカーアミノ酸配列のいずれか1つと少なくとも80%、85%、もしくは90%、もしくは95%、もしくは99%同一であるアミノ酸配列を含む。 In various embodiments, the linker sequence is the amino acid sequence of SEQ ID NO: 127, 165-176, 446, 453, and 767-769, or the linker amino acid sequence of SEQ ID NO: 127, 165-176, 446, 453, and 767-769. an amino acid sequence that is at least 80%, 85%, or 90%, or 95%, or 99% identical to any one of

種々の態様において、標的DNA上に組み込まれる所望のヌクレオチド変化は、1ヌクレオチド変化(例えば、トランジションまたはトランスバージョン)、1つ以上のヌクレオチドの挿入、または1つ以上のヌクレオチドの欠失であり得る。 In various embodiments, the desired nucleotide change incorporated onto the target DNA can be a single nucleotide change (eg, a transition or transversion), an insertion of one or more nucleotides, or a deletion of one or more nucleotides.

ある種のケースでは、挿入は、長さが少なくとも1、少なくとも2、少なくとも3、少なくとも4、少なくとも5、少なくとも6、少なくとも7、少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも16、少なくとも17、少なくとも18、少なくとも19、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90、少なくとも100、少なくとも200、少なくとも300、少なくとも400、または少なくとも500ヌクレオチドである。 In certain cases, the insertion has a length of at least 1, at least 2, at least 3, at least 4, at least 5, at least 6, at least 7, at least 8, at least 9, at least 10, at least 11, at least 12, at least 13 , at least 14, at least 15, at least 16, at least 17, at least 18, at least 19, at least 20, at least 30, at least 40, at least 50, at least 60, at least 70, at least 80, at least 90, at least 100, at least 200, at least 300, at least 400, or at least 500 nucleotides.

ある種の他のケースでは、欠失は、長さが少なくとも1、少なくとも2、少なくとも3、少なくとも4、少なくとも5、少なくとも6、少なくとも7、少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも16、少なくとも17、少なくとも18、少なくとも19、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90、少なくとも100、少なくとも200、少なくとも300、少なくとも400、または少なくとも500ヌクレオチドである。 In certain other cases, the deletion is at least 1, at least 2, at least 3, at least 4, at least 5, at least 6, at least 7, at least 8, at least 9, at least 10, at least 11, at least 12 in length. , at least 13, at least 14, at least 15, at least 16, at least 17, at least 18, at least 19, at least 20, at least 30, at least 40, at least 50, at least 60, at least 70, at least 80, at least 90, at least 100, at least 200, at least 300, at least 400, or at least 500 nucleotides.

別の側面において、本開示はガイドRNAと少なくとも1つのRNA伸長とを含む伸長されたガイドRNAを提供する。RNA伸長はガイドRNAの3'端に位置取り得る。他の態様において、RNA伸長はガイドRNAの5'に位置取り得る。なお他の態様において、RNA伸長はガイドRNA上の分子内位置に位置取り得る。しかしながら、好ましくは、伸長された部分の分子内の位置取りはプロトスペーサーの機能を遮断しない。 In another aspect, the disclosure provides an extended guide RNA comprising a guide RNA and at least one RNA extension. The RNA extension can be located at the 3' end of the guide RNA. In other embodiments, the RNA extension can be located 5' to the guide RNA. In still other embodiments, RNA extension can be located at an intramolecular location on the guide RNA. However, preferably the intramolecular positioning of the extended portion does not block the function of the protospacer.

様々な態様において、プライム編集因子ガイドRNA(PEgRNA)は、napDNAbpへ結合すること、およびnapDNAbpを標的DNA配列へ向かわせることが可能である。標的DNA配列は、標的鎖および相補的な非標的鎖を含み得るが、ここでガイドRNAは、標的鎖とハイブリダイズすることでRNA-DNAハイブリッドおよびRループを形成する。 In various embodiments, a prime editing factor guide RNA (PEgRNA) is capable of binding to and directing napDNAbp to a target DNA sequence. The target DNA sequence may include a target strand and a complementary non-target strand, where the guide RNA hybridizes with the target strand to form an RNA-DNA hybrid and an R-loop.

プライム編集因子ガイドRNAの様々な態様において、少なくとも1のRNA伸長は、DNA合成鋳型を含む。様々な他の態様において、RNA伸長は、逆転写プライマー結合部位をさらに含む。更なる他の態様において、RNA伸長は、RNA伸長をガイドRNAへ結び合わせるリンカーまたはスペーサーを含む。 In various embodiments of the prime editing factor guide RNA, at least one RNA extension comprises a DNA synthesis template. In various other embodiments, the RNA extension further includes a reverse transcription primer binding site. In yet other embodiments, the RNA extension includes a linker or spacer that joins the RNA extension to the guide RNA.

様々な態様において、RNA伸長は、長さが少なくとも5ヌクレオチド、少なくとも6ヌクレオチド、少なくとも7ヌクレオチド、少なくとも8ヌクレオチド、少なくとも9ヌクレオチド、少なくとも10ヌクレオチド、少なくとも11ヌクレオチド、少なくとも12ヌクレオチド、少なくとも13ヌクレオチド、少なくとも14ヌクレオチド、少なくとも15ヌクレオチド、少なくとも16ヌクレオチド、少なくとも17ヌクレオチド、少なくとも18ヌクレオチド、少なくとも19ヌクレオチド、少なくとも20ヌクレオチド、少なくとも21ヌクレオチド、少なくとも22ヌクレオチド、少なくとも23ヌクレオチド、少なくとも24ヌクレオチド、少なくとも25ヌクレオチド、少なくとも30ヌクレオチド、少なくとも40ヌクレオチド、少なくとも50ヌクレオチド、少なくとも60ヌクレオチド、少なくとも70ヌクレオチド、少なくとも80ヌクレオチド、少なくとも90ヌクレオチド、少なくとも100ヌクレオチド、少なくとも150ヌクレオチド、少なくとも200ヌクレオチド、少なくとも300ヌクレオチド、少なくとも400ヌクレオチド、または少なくとも500ヌクレオチドであり得る。 In various embodiments, the RNA elongation is at least 5 nucleotides, at least 6 nucleotides, at least 7 nucleotides, at least 8 nucleotides, at least 9 nucleotides, at least 10 nucleotides, at least 11 nucleotides, at least 12 nucleotides, at least 13 nucleotides, at least 14 nucleotides in length. nucleotides, at least 15 nucleotides, at least 16 nucleotides, at least 17 nucleotides, at least 18 nucleotides, at least 19 nucleotides, at least 20 nucleotides, at least 21 nucleotides, at least 22 nucleotides, at least 23 nucleotides, at least 24 nucleotides, at least 25 nucleotides, at least 30 nucleotides, at least 40 nucleotides, at least 50 nucleotides, at least 60 nucleotides, at least 70 nucleotides, at least 80 nucleotides, at least 90 nucleotides, at least 100 nucleotides, at least 150 nucleotides, at least 200 nucleotides, at least 300 nucleotides, at least 400 nucleotides, or at least 500 nucleotides obtain.

他の態様において、DNA合成鋳型(すなわち、図27につき、編集鋳型)は、長さが少なくとも3ヌクレオチド、少なくとも4ヌクレオチド、少なくとも5ヌクレオチド、少なくとも6ヌクレオチド、少なくとも7ヌクレオチド、少なくとも8ヌクレオチド、少なくとも9ヌクレオチド、少なくとも10ヌクレオチド、少なくとも11ヌクレオチド、少なくとも12ヌクレオチド、少なくとも13ヌクレオチド、少なくとも14ヌクレオチド、少なくとも15ヌクレオチド、少なくとも16ヌクレオチド、少なくとも17ヌクレオチド、少なくとも18ヌクレオチド、少なくとも19ヌクレオチド、少なくとも20ヌクレオチド、少なくとも30ヌクレオチド、少なくとも40ヌクレオチド、少なくとも50ヌクレオチド、少なくとも60ヌクレオチド、少なくとも70ヌクレオチド、少なくとも80ヌクレオチド、少なくとも90ヌクレオチド、少なくとも100ヌクレオチド、少なくとも200ヌクレオチド、少なくとも300ヌクレオチド、少なくとも400ヌクレオチド、または少なくとも500ヌクレオチドである。 In other embodiments, the DNA synthesis template (i.e., with respect to FIG. 27, the editing template) is at least 3 nucleotides, at least 4 nucleotides, at least 5 nucleotides, at least 6 nucleotides, at least 7 nucleotides, at least 8 nucleotides, at least 9 nucleotides, at least 10 nucleotides, at least 11 nucleotides, at least 12 nucleotides, at least 13 nucleotides, at least 14 nucleotides, at least 15 nucleotides, at least 16 nucleotides, at least 17 nucleotides, at least 18 nucleotides, at least 19 nucleotides, at least 20 nucleotides, at least 30 nucleotides, at least 40 nucleotides, at least 50 nucleotides, at least 60 nucleotides, at least 70 nucleotides, at least 80 nucleotides, at least 90 nucleotides, at least 100 nucleotides, at least 200 nucleotides, at least 300 nucleotides, at least 400 nucleotides, or at least 500 nucleotides in length.

更なる他の態様において、逆転写プライマー結合部位配列(すなわち、図27につき、プライマー結合部位)は、長さが少なくとも3ヌクレオチド、少なくとも4ヌクレオチド、少なくとも5ヌクレオチド、少なくとも6ヌクレオチド、少なくとも7ヌクレオチド、少なくとも8ヌクレオチド、少なくとも9ヌクレオチド、少なくとも10ヌクレオチド、少なくとも11ヌクレオチド、少なくとも12ヌクレオチド、少なくとも13ヌクレオチド、少なくとも14ヌクレオチド、少なくとも15ヌクレオチド、少なくとも16ヌクレオチド、少なくとも17ヌクレオチド、少なくとも18ヌクレオチド、少なくとも19ヌクレオチド、少なくとも20ヌクレオチド、少なくとも30ヌクレオチド、少なくとも40ヌクレオチド、少なくとも50ヌクレオチド、少なくとも60ヌクレオチド、少なくとも70ヌクレオチド、少なくとも80ヌクレオチド、少なくとも90ヌクレオチド、少なくとも100ヌクレオチド、少なくとも200ヌクレオチド、少なくとも300ヌクレオチド、少なくとも400ヌクレオチド、または少なくとも500ヌクレオチドである。 In still other embodiments, the reverse transcription primer binding site sequence (i.e., with respect to FIG. 27, the primer binding site) is at least 3 nucleotides, at least 4 nucleotides, at least 5 nucleotides, at least 6 nucleotides, at least 7 nucleotides, at least 8 nucleotides, at least 9 nucleotides, at least 10 nucleotides, at least 11 nucleotides, at least 12 nucleotides, at least 13 nucleotides, at least 14 nucleotides, at least 15 nucleotides, at least 16 nucleotides, at least 17 nucleotides, at least 18 nucleotides, at least 19 nucleotides, at least 20 nucleotides, at least 30 nucleotides, at least 40 nucleotides, at least 50 nucleotides, at least 60 nucleotides, at least 70 nucleotides, at least 80 nucleotides, at least 90 nucleotides, at least 100 nucleotides, at least 200 nucleotides, at least 300 nucleotides, at least 400 nucleotides, or at least 500 nucleotides in length.

他の態様において、任意のリンカーまたはスペーサーは、長さが少なくとも3ヌクレオチド、少なくとも4ヌクレオチド、少なくとも5ヌクレオチド、少なくとも6ヌクレオチド、少なくとも7ヌクレオチド、少なくとも8ヌクレオチド、少なくとも9ヌクレオチド、少なくとも10ヌクレオチド、少なくとも11ヌクレオチド、少なくとも12ヌクレオチド、少なくとも13ヌクレオチド、少なくとも14ヌクレオチド、少なくとも15ヌクレオチド、少なくとも16ヌクレオチド、少なくとも17ヌクレオチド、少なくとも18ヌクレオチド、少なくとも19ヌクレオチド、少なくとも20ヌクレオチド、少なくとも30ヌクレオチド、少なくとも40ヌクレオチド、少なくとも50ヌクレオチド、少なくとも60ヌクレオチド、少なくとも70ヌクレオチド、少なくとも80ヌクレオチド、少なくとも90ヌクレオチド、少なくとも100ヌクレオチド、少なくとも200ヌクレオチド、少なくとも300ヌクレオチド、少なくとも400ヌクレオチド、または少なくとも500ヌクレオチドである。 In other embodiments, any linker or spacer is at least 3 nucleotides, at least 4 nucleotides, at least 5 nucleotides, at least 6 nucleotides, at least 7 nucleotides, at least 8 nucleotides, at least 9 nucleotides, at least 10 nucleotides, at least 11 nucleotides in length. , at least 12 nucleotides, at least 13 nucleotides, at least 14 nucleotides, at least 15 nucleotides, at least 16 nucleotides, at least 17 nucleotides, at least 18 nucleotides, at least 19 nucleotides, at least 20 nucleotides, at least 30 nucleotides, at least 40 nucleotides, at least 50 nucleotides, at least 60 nucleotides, at least 70 nucleotides, at least 80 nucleotides, at least 90 nucleotides, at least 100 nucleotides, at least 200 nucleotides, at least 300 nucleotides, at least 400 nucleotides, or at least 500 nucleotides.

伸長されたガイドRNAの種々の態様では、逆転写鋳型配列は、ニック部位に隣接する内生DNA配列に対して相補的である一本鎖DNAフラップをコードし得、一本鎖DNAフラップは所望のヌクレオチド変化を含む。一本鎖DNAフラップは内生一本鎖DNAをニック部位において取って代わられ得る。ニック部位における取って代わられた内生一本鎖DNAは5'端を有し得、内生フラップを形成し得、これは細胞によって切除され得る。種々の態様において、5'端の内生フラップの切除は産物形成を駆動し得る。なぜなら、5'端の内生フラップを除去することは、対応する相補的なDNA鎖に対する一本鎖3'DNAフラップのハイブリダイゼーションと、標的DNAへの一本鎖3'DNAフラップによって持たれる所望のヌクレオチド変化の組み込みまたは同化とを促すからである。 In various embodiments of the elongated guide RNA, the reverse transcribed template sequence can encode a single-stranded DNA flap that is complementary to the endogenous DNA sequence adjacent to the nick site, and the single-stranded DNA flap is Contains nucleotide changes. A single-stranded DNA flap can replace endogenous single-stranded DNA at the nick site. The displaced endogenous single-stranded DNA at the nick site may have a 5' end and form an endogenous flap, which may be excised by the cell. In various embodiments, excision of the endogenous flap at the 5' end can drive product formation. This is because removing the endogenous flap at the 5' end reduces the hybridization of the single-stranded 3' DNA flap to the corresponding complementary DNA strand and the desired This is because it facilitates the incorporation or assimilation of nucleotide changes.

伸長されたガイドRNAの種々の態様では、一本鎖DNAフラップの細胞性修復は所望のヌクレオチド変化の組み入れをもたらし、それによって所望の産物を形成する。 In various embodiments of the elongated guide RNA, cellular repair of the single-stranded DNA flap results in the incorporation of the desired nucleotide changes, thereby forming the desired product.

ある態様において、PEgRNAは、配列番号101~104、131、181~183、222~234、237~244、277、324~330、332、334、336、338、340、342、344、346、348、350、352、354、356、358、360、362、364、366、368、394、429~442、499~505、641~649、678~692、735~736、738、757~761、776~777、2997~3103、3113~3121、3305~3455、3479~3493、3522~3540、3549~3556、3628~3698、3755~3810、3874、3890~3901、3905~3911、3913~3929、および3972~3989のヌクレオチド配列、または配列番号101~104、181~183、223~234、237~244、277、324~330、332、334、336、338、340、342、344、346、348、350、352、354、356、358、360、362、364、366、368、394、429~442、499~505、641~649、678~692、735~736、757~761、776~777、2997~3103、3113~3121、3305~3455、3479~3493、3522~3540、3549~3556、3628~3698、3755~3810、3874、3890~3901、3905~3911、3913~3929、および3972~3989のいずれか1つと少なくとも85%、もしくは少なくとも90%、もしくは少なくとも95%、もしくは少なくとも98%、もしくは少なくとも99%の配列同一性を有するヌクレオチド配列を含む。 In certain embodiments, the PEgRNA is SEQ ID NO : 101-104, 131, 181-183, 222-234, 237-244, 277, 324-330, 332, 334, 336, 338, 340, 342, 344, 346, 348 , 350, 352, 354, 356, 358, 360, 362, 364, 366, 368, 394, 429-442, 499-505, 641-649, 678-692, 735-736, 738, 757-761, 776 ~777, 2997-3103, 3113-3121, 3305-3455, 3479-3493, 3522-3540, 3549-3556, 3628-3698, 3755-3810, 3874, 3890-3901, 3905-3911, 3913-3929, and 3972-3989 nucleotide sequence, or SEQ ID NO : 101-104, 181-183, 223-234, 237-244, 277, 324-330, 332, 334, 336, 338, 340, 342, 344, 346, 348, 350, 352, 354, 356, 358, 360, 362, 364, 366, 368, 394, 429-442, 499-505, 641-649, 678-692, 735-736, 757-761, 776-777, 2997-3103, 3113-3121, 3305-3455, 3479-3493, 3522-3540, 3549-3556, 3628-3698, 3755-3810, 3874, 3890-3901, 3905-3911, 3913-3929, and 3972-39 89 nucleotide sequences having at least 85%, or at least 90%, or at least 95%, or at least 98%, or at least 99% sequence identity with any one of the following.

本発明のもう1つの側面において、本明細書は、本明細書に記載の融合タンパク質および上に記載のいずれかの伸長されたガイドRNAを含む複合体を提供する。 In another aspect of the invention, herein provides a complex comprising a fusion protein described herein and any extended guide RNA described above.

本発明の更なる他の側面において、本明細書は、napDNAbpおよび伸長されたガイドRNAを含む複合体を提供する。napDNAbpは、Cas9ニッカーゼであり得るか、あるいは配列番号42~57(Cas9ニッカーゼ)および65(AsCas12aニッカーゼ)のアミノ酸配列、または配列番号42~57(Cas9ニッカーゼ)および65(AsCas12aニッカーゼ)のいずれか1つのアミノ酸配列と少なくとも80%、85%、90%、95%、98%、もしくは99%同一のアミノ酸配列であり得る。 In yet other aspects of the invention, herein provides complexes comprising napDNAbp and extended guide RNA. napDNAbp can be a Cas9 nickase, or one of the amino acid sequences of SEQ ID NOs: 42-57 (Cas9 nickase) and 65 (AsCas12a nickase), or one of SEQ ID NOs: 42-57 (Cas9 nickase) and 65 (AsCas12a nickase). The amino acid sequence can be at least 80%, 85%, 90%, 95%, 98%, or 99% identical to one amino acid sequence.

複合体を伴う様々な態様において、伸長されたガイドRNAは、napDNAbpを標的DNA配列へ向かわせることが可能である。様々な態様において、逆転写酵素はtransで提供されてもよい、すなわち、複合体自体とは異なる供給源から提供されてもよい。例えば、逆転写酵素は、逆転写酵素を個別にコードする別々のベクターを導入することによって、複合体を有する同じ細胞へ提供され得る。 In various embodiments involving the complex, the extended guide RNA can direct the napDNAbp to the target DNA sequence. In various embodiments, the reverse transcriptase can be provided in trans, i.e., from a source different from the complex itself. For example, the reverse transcriptase can be provided to the same cell that has the complex by introducing a separate vector that individually encodes the reverse transcriptase.

さらに別の側面において、本明細書はポリヌクレオチドを提供する。ある態様において、ポリヌクレオチドは本明細書に開示の融合タンパク質のいずれかをコードし得る。ある種の他の態様において、ポリヌクレオチドは本明細書に開示のnapDNAbpのいずれかをコードし得る。なおさらなる態様では、ポリヌクレオチドは本明細書に開示の逆転写酵素のいずれかをコードし得る。さらに他の態様において、ポリヌクレオチドは、本明細書に開示の伸長されたガイドRNAのいずれか、逆転写鋳型配列のいずれか、または逆転写プライマー部位のいずれか、または任意のリンカー配列のいずれかをコードし得る。 In yet another aspect, the present invention provides polynucleotides. In certain embodiments, the polynucleotide may encode any of the fusion proteins disclosed herein. In certain other embodiments, the polynucleotide may encode any of the napDNAbp disclosed herein. In still further embodiments, the polynucleotide may encode any of the reverse transcriptases disclosed herein. In still other embodiments, the polynucleotide comprises any of the extended guide RNAs disclosed herein, any of the reverse transcription template sequences, or any of the reverse transcription primer sites, or any of the linker sequences disclosed herein. can be coded.

なお他の側面では、本明細書は、本明細書に記載のポリヌクレオチドを含むベクターを提供する。それゆえに、ある態様において、ベクターは、napDNAbpと逆転写酵素とを含む融合タンパク質をコードするポリヌクレオチドを含む。他の態様において、ベクターは、napDNAbpと逆転写酵素とを別個にコードするポリヌクレオチドを含む。なお他の態様において、ベクターは、伸長されたガイドRNAをコードするポリヌクレオチドを含み得る。種々の態様において、ベクターは、napDNAbpと逆転写酵素と伸長されたガイドRNAとをコードする1つ以上のポリヌクレオチドを同じかまたは別個のベクター上に含み得る。 In yet other aspects, the specification provides vectors comprising the polynucleotides described herein. Therefore, in certain embodiments, the vector comprises a polynucleotide encoding a fusion protein comprising napDNAbp and reverse transcriptase. In other embodiments, the vector comprises polynucleotides that separately encode napDNAbp and reverse transcriptase. In still other embodiments, the vector may include a polynucleotide encoding an extended guide RNA. In various embodiments, a vector can include one or more polynucleotides encoding napDNAbp, reverse transcriptase, and extended guide RNA on the same or separate vectors.

なお他の側面では、本明細書は、本明細書に記載の融合タンパク質と伸長されたガイドRNAとを含む細胞を提供する。細胞は融合タンパク質とnapDNAbpと逆転写酵素と伸長されたガイドRNAとを含むベクターによって形質転換され得る。これらの遺伝子要素は同じベクター上にまたは異なるベクター上に含まれ得る。 In yet other aspects, the present specification provides cells comprising a fusion protein described herein and an elongated guide RNA. Cells can be transformed with a vector containing the fusion protein, napDNAbp, reverse transcriptase, and extended guide RNA. These genetic elements may be contained on the same vector or on different vectors.

もう1つの側面において、本明細書は、医薬組成物を提供する。ある態様において、医薬組成物は、napDNAbp、融合タンパク質、逆転写酵素、および伸長されたガイドRNAのうち1以上を含む。ある態様において、本明細書に記載の融合タンパク質および薬学的に許容し得る賦形剤。他の態様において、医薬組成物は、本明細書に記載のいずれの伸長ガイドRNAおよび薬学的に許容し得る賦形剤を含む。更なる他の態様において、医薬組成物は、本明細書に記載のいずれの伸長ガイドRNAを、本明細書に記載のいずれの融合タンパク質および薬学的に許容し得る賦形剤と組み合わせて含む。もう1つの他の態様において、医薬組成物は、napDNAbp、融合タンパク質、逆転写酵素、および伸長されたガイドRNAのうち1以上をコードするいずれのポリヌクレオチド配列も含む。更なる他の態様において、本明細書に開示の様々な構成要素は、1以上の医薬組成物中へ分離されていてもよい。例えば、第1医薬組成物は、融合タンパク質またはnapDNAbpを含んでいてもよく、第2医薬組成物は、逆転写酵素を含んでいてもよく、および第3医薬組成物は、伸長されたガイドRNAを含んでいてもよい。 In another aspect, the present specification provides pharmaceutical compositions. In certain embodiments, the pharmaceutical composition comprises one or more of napDNAbp, fusion protein, reverse transcriptase, and extended guide RNA. In certain embodiments, a fusion protein described herein and a pharmaceutically acceptable excipient. In other embodiments, the pharmaceutical composition comprises any extension guide RNA described herein and a pharmaceutically acceptable excipient. In yet other embodiments, the pharmaceutical composition comprises any extension guide RNA described herein in combination with any fusion protein described herein and a pharmaceutically acceptable excipient. In another other embodiment, the pharmaceutical composition comprises any polynucleotide sequence encoding one or more of napDNAbp, a fusion protein, a reverse transcriptase, and an extended guide RNA. In yet other embodiments, the various components disclosed herein may be separated into one or more pharmaceutical compositions. For example, the first pharmaceutical composition may include the fusion protein or napDNAbp, the second pharmaceutical composition may include reverse transcriptase, and the third pharmaceutical composition may include the elongated guide RNA. May contain.

またさらなる側面において、本開示は、キットを提供する。一態様において、キットは、融合タンパク質、napDNAbp、逆転写酵素、および伸長されたガイドRNAを包含する1以上の構成要素をコードする1以上のポリヌクレオチドを含む。キットはまた、本明細書に開示のいずれの融合タンパク質、napDNAbp、または逆転写酵素を包含する、ベクター、細胞、およびポリペプチドの単離された調製物も含んでいてよい。 In yet a further aspect, the present disclosure provides a kit. In one embodiment, the kit includes one or more polynucleotides encoding one or more components including the fusion protein, napDNAbp, reverse transcriptase, and extended guide RNA. Kits may also include vectors, cells, and isolated preparations of polypeptides, including any of the fusion proteins disclosed herein, napDNAbp, or reverse transcriptase.

もう1つの側面において、本開示は、開示された組成物(compositions of matter)を使用する方法を提供する。 In another aspect, the disclosure provides methods of using the disclosed compositions of matter.

1つの態様では、方法は、所望のヌクレオチド変化を二本鎖DNA配列上に組み入れるための方法に関する。方法は、第1に、二本鎖DNA配列を融合タンパク質と伸長されたガイドRNAとを含む複合体と接触させることを含み、融合タンパク質はnapDNAbpおよび逆転写酵素を含み、伸長されたガイドRNAは、所望のヌクレオチド変化を含む逆転写鋳型配列を含む。次に、方法には、非標的鎖上で二本鎖DNA配列へニックを入れることが関わり、それによって3'端を有する遊離の一本鎖DNAを生成する。それから、方法には、遊離の一本鎖DNAの3'端を逆転写鋳型配列にハイブリダイズさせることが関わり、それによって逆転写酵素ドメインをプライムする。それから、方法には、DNAの鎖を3'端から重合することが関わり、それによって所望のヌクレオチド変化を含む一本鎖DNAフラップを生成する。それから、方法には、カットされた部位に隣接する内生DNA鎖を一本鎖DNAフラップによって置き換えることが関わり、それによって所望のヌクレオチド変化を二本鎖DNA配列上に組み入れる。 In one embodiment, the method relates to a method for incorporating desired nucleotide changes onto a double-stranded DNA sequence. The method includes first contacting a double-stranded DNA sequence with a complex comprising a fusion protein and an elongated guide RNA, the fusion protein comprising napDNAbp and reverse transcriptase, and the elongated guide RNA , containing the reverse transcription template sequence containing the desired nucleotide changes. The method then involves nicking the double-stranded DNA sequence on the non-target strand, thereby generating free single-stranded DNA with a 3' end. The method then involves hybridizing the 3' end of the free single-stranded DNA to a reverse transcription template sequence, thereby priming the reverse transcriptase domain. The method then involves polymerizing the strands of DNA from the 3' end, thereby producing a single-stranded DNA flap containing the desired nucleotide changes. The method then involves replacing the endogenous DNA strand adjacent to the cut site with a single-stranded DNA flap, thereby incorporating the desired nucleotide change onto the double-stranded DNA sequence.

他の態様において、本開示は、標的遺伝子座にてDNA分子のヌクレオチド配列中に1以上の変化を導入するための方法を提供するが、DNA分子を、核酸プログラム型DNA結合タンパク質(napDNAbp)とnapDNAbpに標的遺伝子座を標的にさせるガイドRNAとに接触させることを含み、ここでガイドRNAは、少なくとも1の所望のヌクレオチド変化を含む逆転写酵素(RT)鋳型配列を含む。次に、方法は、標的遺伝子座にてDNA鎖中に、晒された3'末を形成すること、次いで、晒された3'末をRT鋳型配列とハイブリダイズさせることで逆転写をプライムすることを伴う。次に、RT鋳型配列に基づき少なくとも1の所望のヌクレオチド変化を含む単鎖DNAフラップは、逆転写酵素によって合成または重合される。最後に、少なくとも1の所望のヌクレオチド変化は、対応する内生DNA中へ組み込まれ、これによって標的遺伝子座にてDNA分子のヌクレオチド配列中に1以上の変化が導入される。 In other embodiments, the present disclosure provides methods for introducing one or more changes in the nucleotide sequence of a DNA molecule at a target locus, wherein the DNA molecule is combined with a nucleic acid programmed DNA binding protein (napDNAbp). contacting the napDNAbp with a guide RNA that targets the target locus, where the guide RNA includes a reverse transcriptase (RT) template sequence containing at least one desired nucleotide change. The method then primes reverse transcription by forming an exposed 3' end in the DNA strand at the target locus and then hybridizing the exposed 3' end with an RT template sequence. accompanied by something. A single-stranded DNA flap containing at least one desired nucleotide change based on the RT template sequence is then synthesized or polymerized by reverse transcriptase. Finally, at least one desired nucleotide change is incorporated into the corresponding endogenous DNA, thereby introducing one or more changes in the nucleotide sequence of the DNA molecule at the target locus.

更なる他の態様において、本開示は、標的にプライムされた逆転写によって、標的遺伝子座にてDNA分子のヌクレオチド配列中に1以上の変化を導入するための方法を提供するが、方法は、以下:(a)標的遺伝子座にてDNA分子を、i)核酸プログラム型DNA結合タンパク質(napDNAbp)と逆転写酵素とを含む融合タンパク質、および(ii)所望のヌクレオチド変化を含むRT鋳型を含むガイドRNAに接触させること;(b)RT鋳型の標的にプライムされた逆転写に、所望のヌクレオチド変化を含む単鎖DNAを生成させること;(c)DNA修復および/または複製プロセスを通して標的遺伝子座にてDNA分子中への所望のヌクレオチド変化を組み込むこと、を含む。 In yet other embodiments, the present disclosure provides a method for introducing one or more changes in the nucleotide sequence of a DNA molecule at a target locus by target-primed reverse transcription, the method comprising: A guide comprising: (a) a DNA molecule at the target locus with i) a fusion protein comprising a nucleic acid programmed DNA binding protein (napDNAbp) and a reverse transcriptase; and (ii) an RT template comprising the desired nucleotide changes. (b) causing target-primed reverse transcription of the RT template to generate single-stranded DNA containing the desired nucleotide changes; (c) accessing the target locus through DNA repair and/or replication processes; nucleotide changes into the DNA molecule.

ある態様において、内生DNA鎖を置き換えるステップは以下を含む:(i)単鎖DNAフラップを切断部位に隣接する内生DNA鎖とハイブリダイズさせることで、配列ミスマッチを創出すること;(ii)内生DNA鎖を切除すること;および(iii)ミスマッチを修復することで、DNAの両鎖中に所望のヌクレオチド変化を含む所望の産物を形成すること。 In certain embodiments, replacing the endogenous DNA strand includes: (i) hybridizing a single-stranded DNA flap with the endogenous DNA strand adjacent to the cleavage site, thereby creating a sequence mismatch; (ii) excision of the endogenous DNA strand; and (iii) repair of mismatches to form the desired product containing the desired nucleotide changes in both strands of DNA.

種々の態様において、所望のヌクレオチド変化は1ヌクレオチド置換(例えば、トランジションまたはトランスバージョン変化)、欠失、または挿入であり得る。例えば、所望のヌクレオチド変化は、(1)GからTの置換、(2)GからAの置換、(3)GからCの置換、(4)TからGの置換、(5)TからAの置換、(6)TからCの置換、(7)CからGの置換、(8)CからTの置換、(9)CからAの置換、(10)AからTの置換、(11)AからGの置換、または(12)AからCの置換であり得る。 In various embodiments, the desired nucleotide change can be a single nucleotide substitution (e.g., a transition or transversion change), a deletion, or an insertion. For example, the desired nucleotide change can be (1) a G to T substitution, (2) a G to A substitution, (3) a G to C substitution, (4) a T to G substitution, (5) a T to A substitution, (6) a T to C substitution, (7) a C to G substitution, (8) a C to T substitution, (9) a C to A substitution, (10) an A to T substitution, (11) an A to G substitution, or (12) an A to C substitution.

他の態様において、所望のヌクレオチド変化は、(1)G:C塩基対をT:A塩基対に、(2)G:C塩基対をA:T塩基対に、(3)G:C塩基対をC:G塩基対に、(4)T:A塩基対をG:C塩基対に、(5)T:A塩基対をA:T塩基対に、(6)T:A塩基対をC:G塩基対に、(7)C:G塩基対をG:C塩基対に、(8)C:G塩基対をT:A塩基対に、(9)C:G塩基対をA:T塩基対に、(10)A:T塩基対をT:A塩基対に、(11)A:T塩基対をG:C塩基対に、または(12)A:T塩基対をC:G塩基対に変換し得る。 In other embodiments, the desired nucleotide changes are (1) G:C base pairs to T:A base pairs, (2) G:C base pairs to A:T base pairs, (3) G:C base pairs. pair into C:G base pair, (4) T:A base pair into G:C base pair, (5) T:A base pair into A:T base pair, (6) T:A base pair. (7) C:G base pair to G:C base pair, (8) C:G base pair to T:A base pair, (9) C:G base pair to A: T base pair, (10) A:T base pair to T:A base pair, (11) A:T base pair to G:C base pair, or (12) A:T base pair to C:G. Can be converted into base pairs.

なお他の態様において、方法は、挿入である所望のヌクレオチド変化を導入する。ある種のケースでは、挿入は長さが少なくとも1、少なくとも2、少なくとも3、少なくとも4、少なくとも5、少なくとも6、少なくとも7、少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも16、少なくとも17、少なくとも18、少なくとも19、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90、少なくとも100、少なくとも200、少なくとも300、少なくとも400、または少なくとも500ヌクレオチドである。 In still other embodiments, the method introduces the desired nucleotide change that is an insertion. In certain cases, the insertion has a length of at least 1, at least 2, at least 3, at least 4, at least 5, at least 6, at least 7, at least 8, at least 9, at least 10, at least 11, at least 12, at least 13, At least 14, at least 15, at least 16, at least 17, at least 18, at least 19, at least 20, at least 30, at least 40, at least 50, at least 60, at least 70, at least 80, at least 90, at least 100, at least 200, at least 300 , at least 400, or at least 500 nucleotides.

他の態様において、方法は、欠失である所望のヌクレオチド変化を導入する。ある種の他のケースでは、欠失は長さが少なくとも1、少なくとも2、少なくとも3、少なくとも4、少なくとも5、少なくとも6、少なくとも7、少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも16、少なくとも17、少なくとも18、少なくとも19、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90、少なくとも100、少なくとも200、少なくとも300、少なくとも400、または少なくとも500ヌクレオチドである。 In other embodiments, the method introduces the desired nucleotide change that is a deletion. In certain other cases, the deletion is at least 1 in length, at least 2, at least 3, at least 4, at least 5, at least 6, at least 7, at least 8, at least 9, at least 10, at least 11, at least 12, At least 13, at least 14, at least 15, at least 16, at least 17, at least 18, at least 19, at least 20, at least 30, at least 40, at least 50, at least 60, at least 70, at least 80, at least 90, at least 100, at least 200 , at least 300, at least 400, or at least 500 nucleotides.

種々の態様において、所望のヌクレオチド変化は疾患関連遺伝子を修正する。疾患関連遺伝子は:アデノシンデアミナーゼ(ADA)欠損症;アルファ-1アンチトリプシン欠損症;嚢胞性線維症;デュシェンヌ型筋ジストロフィー;ガラクトース血症;ヘモクロマトーシス;ハンチントン病;メープルシロップ尿症;マルファン症候群;1型神経線維腫症;先天性爪肥厚症;フェニルケトン尿症;重症複合免疫不全;鎌状赤血球症;スミス・レムリ・オピッツ症候群;およびテイ・サックス病からなる群から選択される単一遺伝子障害に関連し得る。他の態様において、疾患関連遺伝子は:心臓病;高血圧;アルツハイマー病;関節炎;糖尿病;がん;および肥満からなる群から選択される多遺伝子性障害に関連し得る。 In various embodiments, the desired nucleotide change modifies a disease-associated gene. Disease-associated genes are: adenosine deaminase (ADA) deficiency; alpha-1 antitrypsin deficiency; cystic fibrosis; Duchenne muscular dystrophy; galactosemia; hemochromatosis; Huntington's disease; maple syrup urine disease; Marfan syndrome; A single gene selected from the group consisting of neurofibromatosis type 1; congenital nail hypertrophy; phenylketonuria; severe combined immunodeficiency; sickle cell disease; Smith-Lemmli-Opitz syndrome; and Tay-Sachs disease May be related to disability. In other embodiments, the disease-associated gene may be associated with a polygenic disorder selected from the group consisting of: heart disease; hypertension; Alzheimer's disease; arthritis; diabetes; cancer; and obesity.

本明細書に開示の方法は、ヌクレアーゼ不活性型(dead)Cas9(dCas9)、Cas9ニッカーゼ(nCas9)、またはヌクレアーゼ活性Cas9であるnapDNAbpを有する融合タンパク質を伴っていてもよい。他の態様において、napDNAbpおよび逆転写酵素は、単一の融合タンパク質としてはコードされていないが、むしろ別々の構築物中に提供され得る。よって、いくつかの態様において、逆転写酵素は(融合タンパク質としてよりむしろ)、napDNAbpに対しtransで提供され得る。 The methods disclosed herein may involve fusion proteins having napDNAbp that is nuclease dead Cas9 (dCas9), Cas9 nickase (nCas9), or nuclease active Cas9. In other embodiments, napDNAbp and reverse transcriptase are not encoded as a single fusion protein, but rather may be provided in separate constructs. Thus, in some embodiments, reverse transcriptase can be provided in trans to napDNAbp (rather than as a fusion protein).

方法を伴う様々な態様において、napDNAbpは、配列番号26~61、75~76、126、130、137、141、147、153、157、445、460、467および482~487(Cas9);(SpCas9);配列番号77~86(CP-Cas9);配列番号18~25および87~88(SpCas9);ならびに配列番号62~72(Cas12)のアミノ酸配列を含んでいてもよい。napDNAbpはまた、配列番号26~61、75~76、126、130、137、141、147、153、157、445、460、467および482~487(Cas9);(SpCas9);配列番号77~86(CP-Cas9);配列番号18~25および87~88(SpCas9);ならびに配列番号62~72(Cas12)のいずれ1つのアミノ酸配列と少なくとも80%、85%、90%、95%、98%、または99%同一のアミノ酸配列も含んでいてもよい。 In various embodiments involving the methods, napDNAbp is SEQ ID NO: 26-61, 75-76, 126, 130, 137, 141, 147, 153, 157, 445, 460, 467 and 482-487 (Cas9); ); SEQ ID NO: 77-86 (CP-Cas9); SEQ ID NO: 18-25 and 87-88 (SpCas9); and SEQ ID NO: 62-72 (Cas12). napDNAbp is also SEQ ID NO: 26-61, 75-76, 126, 130, 137, 141, 147, 153, 157, 445, 460, 467 and 482-487 (Cas9); (SpCas9); SEQ ID NO: 77-86 (CP-Cas9); SEQ ID NO: 18-25 and 87-88 (SpCas9); and any one amino acid sequence of SEQ ID NO: 62-72 (Cas12) and at least 80%, 85%, 90%, 95%, 98% , or 99% identical amino acid sequences.

方法を伴う様々な態様において、逆転写酵素は、配列番号89~100、105~122、128~129、132、139、143、149、154、159、235、454、471、516、662、700~716、739~742および766のアミノ酸配列のいずれか1つを含んでいてもよい。逆転写酵素はまた、配列番号89~100、105~122、128~129、132、139、143、149、154、159、235、454、471、516、662、700~716、739~742および766のいずれか1つのアミノ酸配列と少なくとも80%、85%、90%、95%、98%、または99%同一のアミノ酸配列も含んでいてよい。 In various embodiments involving the methods, the reverse transcriptase is SEQ ID NO: 89-100, 105-122, 128-129, 132, 139, 143, 149, 154, 159, 235, 454, 471, 516, 662, 700 -716, 739-742 and 766. Reverse transcriptase also has SEQ ID NOs: 89-100, 105-122, 128-129, 132, 139, 143, 149, 154, 159, 235, 454, 471, 516, 662, 700-716, 739-742 and 766 at least 80%, 85%, 90%, 95%, 98%, or 99% identical.

方法は、配列番号101~104、131、181~183、222~234、237~244、277、324~330、332、334、336、338、340、342、344、346、348、350、352、354、356、358、360、362、364、366、368、394、429442、499~505、641649、678692、735~736、738、757~761、776~777、29973103、31133121、33053455、34793493、35223540、35493556、36283698、3755~3810、3874、3890~3901、3905~3911、3913~3929、および3972~3989のヌクレオチド配列、またはこれらと少なくとも80%、もしくは少なくとも85%、もしくは少なくとも90%、もしくは少なくとも95%、もしくは少なくとも99%の配列同一性を有するヌクレオチド配列を含むPEgRNAの使用を伴っていてもよい。方法は、RNA伸長を3'末にて含む伸長されたガイドRNAの使用を含んでいてもよく、RNA伸長は逆転写酵素鋳型配列を含む。 The method is as follows : , 354, 356, 358 , 360, 362 , 364, 366 , 368, 394, 429-442, 499-505, 641-649 , 678-692, 735-736 , 738, 757-761, 776-777, 2997 ~ 3103 , 3113-3121, 3305-3455 , 3479-3493 , 3522-3540 , 3549-3556 , 3628-3698, 3755-3810 , 3874, 3890-3901, 3905-3911, 3913-3929, and 3972 ~3989 or at least 80%, or at least 85%, or at least 90%, or at least 95%, or at least 99% sequence identity thereto. The method may include the use of an extended guide RNA that includes an RNA extension at its 3' end, the RNA extension including a reverse transcriptase template sequence.

方法は、5'端にRNA伸長を含む伸長されたガイドRNAの使用を含み得、RNA伸長は逆転写鋳型配列を含む。 The method can include the use of an extended guide RNA that includes an RNA extension at the 5' end, the RNA extension including a reverse transcription template sequence.

方法は、ガイドRNAの分子内の位置付けにRNA伸長を含む伸長されたガイドRNAの使用を含み得、RNA伸長は逆転写鋳型配列を含む。 The method can include the use of an elongated guide RNA that includes RNA extension in intramolecular positioning of the guide RNA, where the RNA extension includes a reverse transcription template sequence.

方法は、長さが少なくとも1、少なくとも2、少なくとも3、少なくとも4、少なくとも5、少なくとも6、少なくとも7、少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも16、少なくとも17、少なくとも18、少なくとも19、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90、少なくとも100、少なくとも200、少なくとも300、少なくとも400、または少なくとも500ヌクレオチドである1以上のRNA伸長を有する伸長されたガイドRNAの使用を含んでもよい。 The method has a length of at least 1, at least 2, at least 3, at least 4, at least 5, at least 6, at least 7, at least 8, at least 9, at least 10, at least 11, at least 12, at least 13, at least 14, at least 15 , at least 16, at least 17, at least 18, at least 19, at least 20, at least 30, at least 40, at least 50, at least 60, at least 70, at least 80, at least 90, at least 100, at least 200, at least 300, at least 400, or It may also include the use of an extended guide RNA having one or more RNA extensions that are at least 500 nucleotides.

上記の概念、および下に考察される追加の概念は、いずれの好適な組み合わせでも並べられ得ることが解されるはずである(ただし、本開示はこの点において限定されない)。さらに、本開示の他の利点および新規特色は、添付の図と併せて考慮すれば、以下の様々な非限定的態様の詳細な記載から明らかであろう。 It should be understood that the above concepts, and the additional concepts discussed below, may be arranged in any suitable combination (although this disclosure is not limited in this respect). Additionally, other advantages and novel features of the present disclosure will become apparent from the following detailed description of various non-limiting aspects when considered in conjunction with the accompanying figures.

図面の簡単な記載
以下の図面は本明細書の一部を形成するものであって、これらの図面の1以上を、本明細書に提示される特定の態様の詳細な記載と組み合わせて参照することによってより良好に理解され得る、ある本開示の側面をさらに実証するために包含される。
BRIEF DESCRIPTION OF THE DRAWINGS The following drawings form a part of this specification, and reference may be made to one or more of these drawings in combination with a detailed description of particular embodiments presented herein. are included to further demonstrate certain aspects of the disclosure that may be better understood by.

図1Aは、伸長されたガイドRNA分子と複合したCas9タンパク質と融合した逆転写酵素を含む融合タンパク質を使用して、単一ヌクレオチドの変化、および/または挿入、および/または欠失をDNA分子(例として、ゲノム)中へ導入するための例示のプロセスの概略図を提供する。この態様において、ガイドRNAは、3'末にて伸長されていることで、逆転写酵素鋳型配列を包含する。概略図は、Cas9ニッカーゼと融合してガイドRNA(gRNA)と複合した逆転写酵素(RT)が、どのようにDNA標的部位に結合し、標的ヌクレオチドに隣接するPAM含有DNA鎖にニックを入れるのかを示す。RT酵素は、ニック入りDNAを、所望の編集をコードする新しいDNA鎖の合成のための鋳型として使用されるgRNAからのDNA合成のためのプライマーとして使用する。示される編集プロセスは、標的にプライムされた逆転写編集(TRT編集)、即ち「プライム編集」と称されてもよい。Figure 1A shows the use of a fusion protein containing reverse transcriptase fused to a Cas9 protein complexed with an elongated guide RNA molecule to create single nucleotide changes and/or insertions and/or deletions in a DNA molecule ( As an example, a schematic diagram of an exemplary process for introduction into a genome is provided. In this embodiment, the guide RNA is extended at the 3' end to include a reverse transcriptase template sequence. Schematic diagram shows how reverse transcriptase (RT) fused to Cas9 nickase and complexed with guide RNA (gRNA) binds to a DNA target site and nicks the PAM-containing DNA strand adjacent to the target nucleotide. shows. The RT enzyme uses the nicked DNA as a primer for DNA synthesis from gRNA, which is used as a template for the synthesis of a new DNA strand encoding the desired edit. The illustrated editing process may be referred to as target-primed reverse transcription editing (TRT editing), or "prime editing."

図1Bは、プライム編集因子複合体がより一般的に[napDNAbp]-[P]:PEgRNAまたは[P]-[napDNAbp]:PEgRNAとして表されているということを例外として、図1Aと同じ図表を提供している。式中、「P」はいずれかのポリメラーゼ(例えば逆転写酵素)を言い、「napDNAbp」は核酸プログラム型DNA結合タンパク質(例えばSpCas9)を言い、「PEgRNA」はプライム編集ガイドRNAを言い、「]-[」は任意のリンカーを言う。他所、例えば図3A-3Gに記載されているとおり、PEgRNAはプライマー結合部位とDNA合成鋳型とを含む5'伸長アームを含む。示されてはいないが、PEgRNAの伸長アーム(すなわち、これはプライマー結合部位およびDNA合成鋳型を含む)はDNAまたはRNAであり得るということが企図される。この構成で企図される具体的なポリメラーゼはDNA合成鋳型の性質に依存するであろう。例えば、DNA合成鋳型がRNAである場合には、ポリメラーゼはRNA依存性DNAポリメラーゼ(例えば、逆転写酵素)であり得る。DNA合成鋳型がDNAである場合には、ポリメラーゼはDNA依存性DNAポリメラーゼであり得る。Figure 1B shows the same diagram as Figure 1A, with the exception that the prime editing factor complex is more commonly represented as [napDNAbp]-[P]:PEgRNA or [P]-[napDNAbp]:PEgRNA. providing. Where "P" refers to any polymerase (e.g. reverse transcriptase), "napDNAbp" refers to a nucleic acid programmed DNA binding protein (e.g. SpCas9), "PEgRNA" refers to prime editing guide RNA, and "] -['' says any linker. As described elsewhere, eg, in Figures 3A-3G, PEgRNA includes a 5' extending arm that includes a primer binding site and a DNA synthesis template. Although not shown, it is contemplated that the extended arm of PEgRNA (ie, it contains the primer binding site and DNA synthesis template) can be DNA or RNA. The specific polymerase contemplated in this configuration will depend on the nature of the DNA synthesis template. For example, if the DNA synthesis template is RNA, the polymerase can be an RNA-dependent DNA polymerase (eg, reverse transcriptase). When the DNA synthesis template is DNA, the polymerase can be a DNA-dependent DNA polymerase.

図1Cは、1ヌクレオチド変化および/または挿入および/または欠失をDNA分子(例えばゲノム)上に導入するための例示的プロセスの模式図を提供し、伸長されたガイドRNA分子との複合体としてCas9タンパク質に融合された逆転写酵素を含む融合タンパク質を用いる。この態様では、ガイドRNAは、逆転写酵素鋳型配列を包含するように5'端が伸長されている。模式図は、Cas9ニッカーゼに融合された逆転写酵素(RT)が、ガイドRNA(gRNA)との複合体として、どのようにしてDNA標的部位に結合し、標的ヌクレオチドに隣接するPAM含有DNA鎖へニックを入れるかを示している。RT酵素は、所望の編集をコードする新たなDNA鎖の合成のための鋳型として用いられるgRNAからのDNA合成のプライマーとして、ニッキングされたDNAを用いる。示されている編集プロセスは、プライム標的にプライムされた逆転写編集(TRT編集)または同等に「プライム編集」と言われ得る。Figure 1C provides a schematic illustration of an exemplary process for introducing single nucleotide changes and/or insertions and/or deletions onto a DNA molecule (e.g., a genome), as a complex with an elongated guide RNA molecule. A fusion protein containing reverse transcriptase fused to a Cas9 protein is used. In this embodiment, the guide RNA is extended at the 5' end to include the reverse transcriptase template sequence. Schematic diagram shows how reverse transcriptase (RT) fused to Cas9 nickase, as a complex with guide RNA (gRNA), binds to a DNA target site and transfers to a PAM-containing DNA strand adjacent to the target nucleotide. It shows whether to put a nick. The RT enzyme uses the nicked DNA as a primer for DNA synthesis from gRNA, which is used as a template for the synthesis of a new DNA strand encoding the desired edit. The illustrated editing process may be referred to as primed target-primed reverse transcription editing (TRT editing) or equivalently "primed editing."

図1Dは、プライム編集因子複合体がより一般に、[napDNAbp]-[P]:PEgRNAまたは[P]-[napDNAbp]:PEgRNAPEgRNAとして表されることを除いて、図1Cと同じ描写を提供するが、ここで「P」は、いずれのポリメラーゼ(例として、逆転写酵素)を指し、「napDNAbp」は、核酸プログラム型DNA結合タンパク質(例として、SpCas9)を指し、および「PEgRNA」は、プライム編集ガイドRNAを指し、および「]-[」は、任意のリンカーを指す。他のどこか、例として図3A~3Gに記載のとおり、PEgRNAは、プライマー結合部位およびDNA合成鋳型を含む3'伸長アームを含む。示されてはいないが、PEgRNAの伸長アーム(すなわち、プライマー結合部位およびDNA合成鋳型を含む)はDNAまたはRNAであり得ることが企図される。この立体配置において企図される具体的なポリメラーゼは、DNA合成鋳型の性質に依存するであろう。実例として、DNA合成鋳型がRNAであると、ポリメラーゼはRNA依存性DNAポリメラーゼ(例として、逆転写酵素)になり得る。DNA合成鋳型がDNAであると、ポリメラーゼはDNA依存性DNAポリメラーゼになり得る。様々な態様において、PEgRNAは、DNAベースのDNA合成鋳型を組み込むように改変または合成され得る。Figure 1D provides the same depiction as Figure 1C, except that the prime editing factor complex is more commonly represented as [napDNAbp]-[P]:PEgRNA or [P]-[napDNAbp]:PEgRNAPEgRNA. , where "P" refers to any polymerase (e.g., reverse transcriptase), "napDNAbp" refers to a nucleic acid programmed DNA binding protein (e.g., SpCas9), and "PEgRNA" refers to a prime editing refers to the guide RNA, and "]-[" refers to the optional linker. As described elsewhere, for example in Figures 3A-3G, PEgRNA includes a 3' extending arm that contains a primer binding site and a DNA synthesis template. Although not shown, it is contemplated that the extended arm of PEgRNA (ie, containing the primer binding site and DNA synthesis template) can be DNA or RNA. The specific polymerase contemplated in this configuration will depend on the nature of the DNA synthesis template. As an illustration, if the DNA synthesis template is RNA, the polymerase can be an RNA-dependent DNA polymerase (eg, reverse transcriptase). When the DNA synthesis template is DNA, the polymerase can be a DNA-dependent DNA polymerase. In various embodiments, PEgRNA can be modified or synthesized to incorporate DNA-based DNA synthesis templates.

図1Eは、合成された単DNAの鎖(所望のヌクレオチド変化を含む)が、所望のヌクレオチド変化がDNA中へ組み込まれるように、どのように分解されるのかという例示のプロセスを描く概略図である。示されるとおり、編集済鎖(または「変異誘発鎖」)の次の合成、内生鎖との平衡、内生鎖のフラップ切断、およびライゲーションは、内生DNA修復および/または複製プロセスの作用を通して、ミスマッチDNA二重鎖の分解後のDNA編集の組み込みに繋がる。IE is a schematic diagram depicting an exemplary process of how a synthesized single strand of DNA (containing a desired nucleotide change) is degraded such that the desired nucleotide change is incorporated into the DNA. As shown, subsequent synthesis of an edited strand (or "mutagenized strand"), equilibration with the endogenous strand, flap cleavage of the endogenous strand, and ligation leads to the incorporation of the DNA edit following degradation of the mismatched DNA duplex through the action of endogenous DNA repair and/or replication processes.

図1Fは、「反対鎖(opposite strand)へのニック入れ」が図1Eの分解方法の中へ組み込まれることで、所望の産物・対・復元産物の形成を推進するのに役立ち得ることを示す概略図である。反対鎖のニック入れにおいて、第2のCas9/gRNA複合体は、最初にニックが入った鎖の反対鎖上に第2ニックを導入するのに使用される。これは、未編集鎖(すなわち、第2ニック部位を含有する鎖)を優先的に置き換えるために、内生細胞のDNA修復および/または複製プロセスを誘導する。Figure IF is a schematic diagram showing that "opposite strand nicking" can be incorporated into the degradation method of Figure IE to help drive the formation of the desired product versus the restored product. In opposite strand nicking, a second Cas9/gRNA complex is used to introduce a second nick on the strand opposite the first nicked strand. This induces the endogenous cell's DNA repair and/or replication processes to preferentially replace the unedited strand (i.e., the strand containing the second nick site).

図1Gは、伸長されたガイドRNAと複合体化された核酸プログラム型DNA結合タンパク質(napDNAbp)を使用して、標的遺伝子座のDNA分子(例として、ゲノム)中へ単一ヌクレオチドの変化、および/または挿入、および/または欠失を導入するための例示のプロセスの別の概略図を提供する。このプロセスはプライム編集という態様として称されることもある。伸長されたガイドRNAは、ガイドRNAの3'末もしくは5'末にて、またはガイドRNA中の分子内のある場所にて伸長を含む。ステップ(a)において、napDNAbp/gRNA複合体はDNA分子に接触し、gRNAは標的遺伝子座へ結合するようにnapDNAbpをガイドする。ステップ(b)において、標的遺伝子座のDNA(Rループ鎖、またはPAM含有鎖、または非標的DNA鎖、またはプロトスペーサー鎖)の鎖の一方へニックが導入され(例として、ヌクレアーゼまたは化学剤によって)、これによって標的遺伝子座の鎖の一方に利用可能な3'末が創出される。ある態様において、ニックは、Rループ鎖に対応するDNAの鎖、すなわち、ガイドRNA配列とはハイブリダイズされない鎖に創出される。ステップ(c)において、3'末DNA鎖は、逆転写をプライムするためにガイドRNAの伸長された部分と相互作用する。いくつかの態様において、3'末DNA鎖は、ガイドRNAの伸長された部分上の特定のRTプライム配列とハイブリダイズする。ステップ(d)において、逆転写酵素が導入されて、プライムされた部位の3'末からガイドRNAの3'末へDNAの単鎖を合成する。これは、所望のヌクレオチド変化(例として、単一の塩基変化、挿入、欠失、またはそれらの組み合わせ)を含む単鎖DNAフラップを形成する。ステップ(e)において、napDNAbpおよびガイドRNAは放出される。ステップ(f)および(g)は、所望のヌクレオチド変化が標的遺伝子座中へ組み込まれるように、単鎖DNAフラップの分解に関する。このプロセスは、一旦3'単鎖DNAフラップが侵入して他の鎖上の相補的な配列とハイブリダイズすると、形成された対応の5'内生DNAフラップを除去することによって、所望の産物形成が推進され得る。プロセスはまた、図1Fに例示されるとおり、第2鎖へニックが入れられた産物の形成へも推進され得る。このプロセスは、以下の遺伝子変化:トランスバージョン、トランジション、欠失、および挿入のうち少なくとも1またはそれ以上を導入してもよい。Figure 1G shows the use of a nucleic acid-programmed DNA binding protein (napDNAbp) complexed with an elongated guide RNA to introduce single nucleotide changes into a DNA molecule (e.g., genome) at a target locus, and Figure 3 provides another schematic illustration of an exemplary process for introducing insertions and/or deletions. This process is sometimes referred to as a form of prime editing. An extended guide RNA comprises an extension at the 3' or 5' end of the guide RNA, or at some point within the molecule within the guide RNA. In step (a), the napDNAbp/gRNA complex contacts the DNA molecule and the gRNA guides the napDNAbp to bind to the target locus. In step (b), a nick is introduced into one of the strands of DNA (the R-loop strand, or the PAM-containing strand, or the non-target DNA strand, or the protospacer strand) at the target locus (e.g., by a nuclease or a chemical agent). ), which creates an available 3' end on one strand of the target locus. In certain embodiments, a nick is created in the strand of DNA that corresponds to the R-loop strand, ie, the strand that does not hybridize to the guide RNA sequence. In step (c), the 3' terminal DNA strand interacts with the extended portion of the guide RNA to prime reverse transcription. In some embodiments, the 3' terminal DNA strand hybridizes to a specific RT prime sequence on the extended portion of the guide RNA. In step (d), reverse transcriptase is introduced to synthesize a single strand of DNA from the 3' end of the primed site to the 3' end of the guide RNA. This forms a single-stranded DNA flap containing the desired nucleotide changes (eg, single base changes, insertions, deletions, or combinations thereof). In step (e) napDNAbp and guide RNA are released. Steps (f) and (g) involve disassembling the single-stranded DNA flap so that the desired nucleotide changes are incorporated into the target locus. This process, once a 3' single-stranded DNA flap enters and hybridizes with a complementary sequence on the other strand, removes the corresponding 5' endogenous DNA flap that is formed, thereby allowing desired product formation. can be promoted. The process can also be driven to form a product with a nick in the second strand, as illustrated in Figure IF. This process may introduce at least one or more of the following genetic changes: transversions, transitions, deletions, and insertions.

図1Hは、本明細書に記載の、プライム編集プロセスに起こり得る遺伝子変化の型を描く概略図である。プライム編集によって達成され得るヌクレオチド変化の型は、欠失(短いおよび長い欠失を包含する)、単一のヌクレオチド変化(トランジションおよびトランスバージョンを包含する)、ならびに挿入(短いおよび長いものを包含する)を包含する。FIG. 1H is a schematic diagram depicting the types of genetic changes that can occur during the prime editing process described herein. The types of nucleotide changes that can be achieved by prime editing include deletions (including short and long deletions), single nucleotide changes (including transitions and transversions), and insertions (including short and long ones). ).

図1Iは、PE3b(PE3b=PE2プライム編集因子融合タンパク質+PEgRNA+第2鎖へニックを入れるガイドRNA)によって例示される、一時的な(temporal)第2鎖へのニック入れを描く概略図である。一時的な第2鎖へのニック入れは、所望の編集済産物の形成を容易にするための、第2鎖へのニック入れのバリアントである。「一時的な」という用語は、未編集鎖への第2鎖ニックが、所望の編集が編集済鎖に組み入れられた後にしか生じないという事実を指す。これは、二本鎖DNA切断へ繋がる両鎖上の同時のニックを回避する。FIG. 1I is a schematic depicting temporal second strand nicking, exemplified by PE3b (PE3b=PE2 prime editor fusion protein+PEgRNA+guide RNA that nicks the second strand). Temporal second strand nicking is a variant of second strand nicking to facilitate the formation of the desired edited product. The term "temporary" refers to the fact that second strand nicking into the unedited strand occurs only after the desired edit has been incorporated into the edited strand. This avoids simultaneous nicking on both strands leading to double-stranded DNA breaks.

図1J~1Kは、napDNAbp(例として、SpCas9ニッカーゼ)を、ジンクフィンガーヌクレアーゼ(ZFN)または転写活性化因子様エフェクターヌクレアーゼ(TALEN)などのいずれのプログラム型ヌクレアーゼドメインにも置き換える、本明細書に企図されるプライム編集のバリエーションを描く。そのため、好適なヌクレアーゼは核酸標的分子(ガイドRNAなど)によって必ずしも「プログラムされる(programmed)」必要はないが、むしろ、とりわけヌクレアーゼなどのDNA結合ドメインの特異性を定義することによってプログラムされてもよいことが企図される。ちょうどnapDNAbp部分とのプライム編集と同じように、代替プログラム型ヌクレアーゼは、標的DNAの一方の鎖のみが切られるように修飾されることが好ましい。換言すれば、プログラム型ヌクレアーゼは、好ましくは、ニッカーゼとして機能するはずである。一旦プログラム型ヌクレアーゼが選択されると(例として、ZFNまたはTALEN)、追加の機能は改変されて、それがプライム編集様機序に従って作動することができる系になってもよい。例えば、プログラム型ヌクレアーゼは、これとRNAまたはDNAの伸長アームとを(例として、化学的リンカーを介して)カップリングすることによって修飾されてもよく、ここで伸長アームは、プライマー結合部位(PBS)およびDNA合成鋳型を含む。プログラム型ヌクレアーゼはまた、ポリメラーゼとも(例として、化学的リンカーまたはアミノ酸リンカーを介して)カップリングされてもよいが、前記ポリメラーゼの性質は、伸長アームがDNAまたはRNAであるかに依存するであろう。RNA伸長アームのケースにおいて、ポリメラーゼはRNA依存性DNAポリメラーゼ(例として、逆転写酵素)であり得る。DNA伸長アームのケースにおいて、ポリメラーゼは、DNA依存性DNAポリメラーゼ(例として、Pol I、Pol II、もしくはPol IIIを包含する原核生物のポリメラーゼ、またはPol a、Pol b、Pol g、Pol d、Pol e、もしくはPol zを包含する真核生物のポリメラーゼ)であり得る。系はまた、プログラム型ヌクレアーゼとの融合体として加えられるか、または反応全体を容易にするためにtransで加えられた他の機能も包含していてもよい(例として、(a)DNAを切断部位にて巻き戻すことで、プライマーとして利用可能な3'末をもつ切断鎖を作製する、ヘリカーゼ、(b)切断鎖上の内生鎖を除去することで、内生鎖の合成された鎖との置き換えへの反応を推進するのに役立つ、フラップエンドヌクレアーゼ(例として、FEN1)、または(c)反対鎖上に第2部位ニックを創出する、nCas9:gRNA複合体(これは非編集鎖の好ましい細胞修復を通した合成修復の取り入れを推進するのに役立つこともある))。napDNAbpで編集をプライムする類似したやり方において、別様なプログラム型ヌクレアーゼとのかかる複合体は、合成し、次いで、着目した編集を持つ新しく合成されたDNAの置き換え鎖をDNAの標的部位中へ永続的に組み入れるのに使用され得る。Figures 1J -1K are contemplated herein to replace napDNAbp (eg, SpCas9 nickase) with any programmed nuclease domain, such as a zinc finger nuclease (ZFN) or a transcription activator-like effector nuclease (TALEN). Draw a variation of the prime editing that will be done. As such, a suitable nuclease need not necessarily be "programmed" by a nucleic acid target molecule (such as a guide RNA), but rather by defining the specificity of the DNA binding domain of the nuclease, among other things. Good things are planned. Just like prime editing with the napDNAbp moiety, the alternative programmed nuclease is preferably modified so that only one strand of the target DNA is cut. In other words, the programmed nuclease should preferably function as a nickase. Once a programmed nuclease is selected (eg, ZFN or TALEN), additional functions may be modified such that it is a system that can operate according to a prime editing-like mechanism. For example, a programmed nuclease may be modified by coupling it to an extended arm of RNA or DNA (eg, via a chemical linker), where the extended arm is a primer binding site (PBS ) and DNA synthesis templates. The programmed nuclease may also be coupled to a polymerase (eg, via a chemical or amino acid linker), although the nature of the polymerase may depend on whether the extending arm is DNA or RNA. Dew. In the case of RNA extension arms, the polymerase can be an RNA-dependent DNA polymerase (eg, reverse transcriptase). In the case of DNA extension arms, the polymerase is a DNA-dependent DNA polymerase (e.g., prokaryotic polymerases including Pol I, Pol II, or Pol III, or Pol a, Pol b, Pol g, Pol d, Pol e, or eukaryotic polymerases including Pol z). The system may also include other functions added as fusions with programmed nucleases or in trans to facilitate the overall reaction (for example, (a) cleaving the DNA Helicase, by unwinding at a site, creates a cleaved strand with a 3' end that can be used as a primer, (b) removes the endogenous strand on the cleaved strand, (c) a flap endonuclease (e.g., FEN1) that helps drive the reaction toward replacement with the nCas9:gRNA complex, which creates a second site nick on the opposite strand (this is may also help promote the uptake of synthetic repair through favorable cellular repair)). In a similar manner to prime editing with napDNAbp, such a complex with a different programmed nuclease synthesizes and then persists the newly synthesized DNA replacement strand with the targeted edit into the target site of DNA. It can be used to incorporate

図1は、一態様において、プライム編集によって編集されてもよい標的DNAの解剖学的な特色(anatomical features)を描く。標的DNAは「非標的鎖」および「標的鎖」を含む。標的鎖は、PAM部位(このケースにおいては、標準的なSpCas9ベースのプライム編集因子によって認識されるNGG)を認識するプライム編集因子複合体のPEgRNAのスペーサーとアニールされるようになる鎖である。標的鎖はまた、「非PAM鎖」または「非編集鎖」とも称されることがある。これに反して、非標的鎖(すなわち、プロトスペーサーおよびNGGのPAM配列を含有する鎖)は、「PAM鎖」または「編集鎖」と称されることもある。様々な態様において、PE複合体(例として、SpCas9ベースのPEでの)のニック部位は、PAM鎖上のプロトスペーサー中にあるであろう。ニックの場所は、PEを形成する具体的なCas9の特徴であろう。例えば、SpCas9ベースのPEであると、ニック部位は、塩基3(PAM配列の位置1と比べて「-3」位置)と4(PAM配列の位置1と比べて「-4」位置)との間のホスホジエステル結合中にある。プロトスペーサー中のニック部位は、以下の図に見られるとおりPEgRNAの伸長アームのプライマー結合部位と複合体化する遊離の3'ヒドロキシル基を形成し、PEgRNAの伸長アームのDNA合成鋳型をコードするDNAの単鎖の重合を始める基質を提供する。この重合反応は5'→3'方向に、PE融合タンパク質のポリメラーゼ(例として、逆転写酵素)によって触媒される。重合は、gRNAコアに達する前に(例として、PEの重合活性を終止するよう機能する重合終止シグナルまたは2次構造の包含によって)終止し、ニック入りのPAM鎖の元の3'ヒドロキシル基から伸長される単鎖DNAフラップを産生する。DNA合成鋳型は、PAM鎖上のニック部位のすぐ後に続く内生DNAの5'末の単鎖と相同な単鎖DNAをコードしており、所望のヌクレオチド変化(例として、単一塩基の置換、挿入、欠失、逆位)を組み入れる。所望の編集の位置は、PAM鎖上のニック部位の下流に続くいずれの位置にもあり得、位置+1、+2、+3、+4(PAM部位の開始)、+5(PAM部位の位置2)、+6(PAM部位の位置3)、+7、+8、+9、+10、+11、+12、+13、+14、+15、+16、+17、+18、+19、+20、+21、+22、+23、+24、+25、+26、+27、+28、+29、+30、+31、+32、+33、+34、+35、+36、+37、+38、+39、+40、+41、+42、+43、+44、+45、+46、+47、+48、+49、+50、+51、+52、+53、+54、+55、+56、+57、+58、+59、+60、+61、+62、+63、+64、+65、+66、+67、+68、+69、+70、+71、+72、+73、+74、+75、+76、+77、+78、+79、+80、+81、+82、+83、+84、+85、+86、+87、+88、+89、+90、+91、+92、+93、+94、+95、+96、+97、+98、+99、+100、+101、+102、+103、+104、+105、+106、+107、+108、+109、+110、+111、+112、+113、+114、+115、+116、+117、+118、+119、+120、+ 121、+122、+123、+124、+125、+126、+127、+128、+129、+130、+131、+132、+133、+134、+135、+136、+137、+138、+139、+140、+141、+142、+143、+144、+145、+146、+147、+148、+149、もしくは+150、またはこれ以上(ニック部位の下流位置に対して)を包含し得る。一旦3'末単鎖DNA(着目する編集を含有する)が内生5'末単鎖DNAを置き換えると、DNA修復および複製プロセスは、PAM鎖上の編集部位の永続的な組み入れを、次いで編集部位に存在する非PAM鎖上のミスマッチの修正をもたらすであろう。このように、編集は、標的DNA部位上のDNAの両鎖へ広がるであろう。「編集済鎖」および「非編集済」鎖への言及が単に、PE機序に関与するDNAの鎖を正確に記述する(delineate)ことを意図するに過ぎないことは解されるであろう。「編集済鎖」は、ニック部位のすぐ下流での5'末の単鎖DNAの、所望の編集を含有する合成された3'末の単鎖DNAとの置き換えによって初めて編集されるようになる鎖である。「非編集済」鎖は編集済鎖との対の鎖であるが、これ自身もまた、修復および/または複製を通して、編集済鎖に相補的になるよう編集(とりわけ、着目する編集)がなされるようになる。FIG. 1L depicts, in one embodiment, anatomical features of target DNA that may be edited by prime editing. Target DNA includes a "non-target strand" and a "target strand." The target strand is the strand that becomes annealed to the spacer of the PEgRNA of the prime editor complex, which recognizes the PAM site (in this case the NGG recognized by the standard SpCas9-based prime editor). The target strand may also be referred to as the "non-PAM strand" or the "unedited strand." In contrast, the non-target strand (ie, the strand containing the protospacer and NGG PAM sequences) is sometimes referred to as the "PAM strand" or the "edited strand." In various embodiments, the nick site of the PE complex (eg, in SpCas9-based PE) will be in the protospacer on the PAM strand. The location of the nick would be a feature of the specific Cas9 that forms the PE. For example, in a SpCas9-based PE, the nick sites are between bases 3 (position ``-3'' compared to position 1 of the PAM sequence) and 4 (position ``-4'' compared to position 1 of the PAM sequence). in the phosphodiester bond between. The nick site in the protospacer forms a free 3' hydroxyl group that complexes with the primer binding site on the extended arm of PEgRNA, as seen in the figure below, and the DNA encoding the DNA synthesis template on the extended arm of PEgRNA. provides a substrate for initiating single-chain polymerization. This polymerization reaction is catalyzed in the 5'→3' direction by the polymerase (eg, reverse transcriptase) of the PE fusion protein. Polymerization is terminated before reaching the gRNA core (e.g., by the inclusion of a polymerization termination signal or secondary structure that functions to terminate the polymerization activity of the PE) and is removed from the original 3' hydroxyl group of the nicked PAM strand. Generates a single-stranded DNA flap that is extended. The DNA synthesis template encodes a single-stranded DNA homologous to the 5'-end single strand of endogenous DNA that immediately follows the nick site on the PAM strand and makes the desired nucleotide changes (e.g., single base substitutions). , insertions, deletions, inversions). The position of the desired edit can be any position following the nick site on the PAM strand, including positions +1, +2, +3, +4 (start of PAM site), +5 (start of PAM site), Position 2), +6 (PAM site position 3), +7, +8, +9, +10, +11, +12, +13, +14, +15, +16, +17, +18, +19, +20, +21, +22, +23, +24, +25, +26, +27, +28, +29, +30, +31, +32, +33, +34, +35 , +36, +37, +38, +39, +40, +41, +42, +43, +44, +45, +46, +47, +48, +49, +50, +51, + 52, +53, +54, +55, +56, +57, +58, +59, +60, +61, +62, +63, +64, +65, +66, +67, +68, +69, +70, +71, +72, +73, +74, +75, +76, +77, +78, +79, +80, +81, +82, +83, +84, +85 , +86, +87, +88, +89, +90, +91, +92, +93, +94, +95, +96, +97, +98, +99, +100, +101, + 102, +103, +104, +105, +106, +107, +108, +109, +110, +111, +112, +113, +114, +115, +116, +117, +118, +119, +120, +121, +122, +123, +124, +125, +126, +127, +128, +129, +130, +131, +132, +133, +134, +135 , +136, +137, +138, +139, +140, +141, +142, +143, +144, +145, +146, +147, +148, +149, or +150, or more (relative to a position downstream of the nick site). Once the 3'-end single-stranded DNA (containing the edit of interest) replaces the endogenous 5'-end single-stranded DNA, DNA repair and replication processes lead to permanent incorporation of the editing site on the PAM strand, which then will result in correction of mismatches on non-PAM strands present at the site. In this way, the edit will spread to both strands of DNA on the target DNA site. It will be appreciated that references to "edited strand" and "unedited" strand are merely intended to delineate the strands of DNA involved in the PE mechanism. . The "edited strand" only becomes edited by replacing the 5'-end single-stranded DNA immediately downstream of the nick site with a synthesized 3'-end single-stranded DNA containing the desired edit. It's a chain. The "unedited" strand is the companion strand to the edited strand, but has also been edited (in particular, the editing of interest) to be complementary to the edited strand through repair and/or replication. Become so.

図1は、標的DNA、プライム編集因子複合体、およびPEgRNAと標的DNAとの間の相互作用の解剖学的な特色を示すプライム編集の機序を描く。第1に、ポリメラーゼ(例として、逆転写酵素)およびnapDNAbp(例として、SpCas9ニッカーゼ、例として、HNHヌクレアーゼドメイン中の不活性化突然変異(例として、H840A)またはRuvCヌクレアーゼドメイン中の活性化突然変異(D10A)を有するSpCas9)を有する融合タンパク質を含むプライム編集因子は、PEgRNAおよび編集されるべき標的DNAを有するDNAと複合体化されている。PEgRNAは、スペーサー、gRNAコア(またgRNA骨格もしくはgRNA主鎖としても知られている)(これはnapDNAbpへ結合する)、および伸長アームを含む。伸長アームは、3'末、5'末に、またはPEgRNA分子内のどこかにあり得る。示されるとおり、伸長アームは、PEgRNAの3'末にある。伸長アームは、3'→5'方向において、PAM鎖上のニック部位のすぐ後に続く5'末の単鎖DNAと相同である、プライマー結合部位およびDNA合成鋳型(着目する編集と相同領域(すなわち、相同アーム)との両方を含む)を含む。示されるとおり、一旦ニックが導入され、これによってニック部位のすぐ上流に遊離の3'ヒドロキシル基が産生されると、PAM鎖上のニック部位のすぐ上流の領域は、「プライマー結合部位」と称される伸長アームの3'末にて相補的な配列とアニールし、利用可能な3'ヒドロキシル末をもつ短い二本鎖の領域を創出するが、これによってプライム編集因子複合体のポリメラーゼのための基質が形成される。次いで、ポリメラーゼ(例として、逆転写酵素)は、DNAの鎖として、3'ヒドロキシル末から伸長アームの末まで重合する。単鎖DNAの配列はDNA合成鋳型によってコードされており、これは、新しいDNAを合成するポリメラーゼによって「読まれる」伸長アームの一部(すなわち、プライマー結合部位を排除する)である。この重合は、最初のニック部位の元の3'ヒドロキシル末の配列まで有効に伸長する。DNA合成鋳型は、所望の編集のみならず、PAM鎖上のニック部位のすぐ下流の内生DNAの単鎖に相同の領域もまた含むDNAの単鎖をコードする。次に、コードされる3'末のDNAの単鎖(すなわち、3'単鎖DNAフラップ)は、PAM鎖上のニック部位のすぐ下流の、対応する相同の内生5'末のDNAの単鎖に取って代わり、5'末の単鎖DNAフラップを有するDNA中間体を形成するが、これは細胞によって(例として、フラップエンドヌクレアーゼによって)除去される。内生5'末の単鎖DNAフラップの相補体とアニールする3'末の単鎖DNAフラップは、5'DNAフラップが除去された後、内生鎖とライゲーションされる。3'末の単鎖DNAフラップ中の所望の編集は、たった今アニールされてライゲーションされたが、相補鎖とのミスマッチを形成し、DNA修復および/または一連の複製を経て、これによって両鎖上に所望の編集が永続的に組み入れられる。Figure 1M depicts the mechanism of prime editing showing the anatomical features of the target DNA, the prime editing factor complex, and the interaction between PEgRNA and target DNA. First, polymerases (e.g. reverse transcriptase) and napDNAbp (e.g. SpCas9 nickase, e.g. inactivating mutations in the HNH nuclease domain (e.g. H840A) or activating mutations in the RuvC nuclease domain) A prime editing factor comprising a fusion protein with a mutation (SpCas9) with a mutation (D10A) is complexed with PEgRNA and DNA with the target DNA to be edited. PEgRNA includes a spacer, a gRNA core (also known as gRNA backbone or gRNA backbone), which binds to napDNAbp, and an extended arm. The extended arm can be at the 3' end, 5' end, or anywhere within the PEgRNA molecule. As shown, the extended arm is at the 3' end of the PEgRNA. The extending arm contains a primer binding site and a DNA synthesis template (a region homologous to the edit of interest (i.e. , homologous arms)). As shown, once a nick has been introduced, thereby producing a free 3' hydroxyl group immediately upstream of the nick site, the region immediately upstream of the nick site on the PAM strand is termed the "primer binding site." anneal to a complementary sequence at the 3' end of the extended arm, creating a short double-stranded region with an available 3' hydroxyl end for the polymerase of the prime editing factor complex. A matrix is formed. A polymerase (eg, reverse transcriptase) then polymerizes the DNA as a strand from the 3' hydroxyl end to the end of the extending arm. The sequence of single-stranded DNA is encoded by the DNA synthesis template, which is part of the extending arm (ie, eliminates the primer binding site) that is "read" by the polymerase that synthesizes new DNA. This polymerization effectively extends up to the original 3' hydroxyl terminal sequence of the initial nick site. The DNA synthesis template encodes a single strand of DNA that includes not only the desired edit, but also a region homologous to the single strand of endogenous DNA immediately downstream of the nick site on the PAM strand. The encoded single strand of 3'-end DNA (i.e., the 3' single-stranded DNA flap) is then encoded by the corresponding homologous endogenous 5'-end DNA strand immediately downstream of the nick site on the PAM strand. The strands are replaced, forming a DNA intermediate with a single-stranded DNA flap at the 5' end, which is removed by the cell (eg, by a flap endonuclease). The 3'-terminal single-stranded DNA flap, which anneals with the complement of the endogenous 5'-terminal single-stranded DNA flap, is ligated with the endogenous strand after the 5' DNA flap is removed. The desired edit in the single-stranded DNA flap at the 3' end, which has just been annealed and ligated, forms a mismatch with the complementary strand and undergoes DNA repair and/or a series of replications, thereby making the edit on both strands. The desired edits are permanently incorporated.

図2は、本明細書に記載のプライム編集因子に用いられ得る3つのCas複合体(SpCas9、SaCas9、およびLbCas12a)と、それらのPAM、gRNA、およびDNA切断特色とを示している。図はSpCas9、SaCas9、およびLbCas12aが関わる複合体のデザインを示している。Figure 2 shows three Cas complexes (SpCas9, SaCas9, and LbCas12a) that can be used in the prime editing factors described herein and their PAM, gRNA, and DNA cleavage features. The figure shows the design of a complex involving SpCas9, SaCas9, and LbCas12a.

図3A~3Fは、操作された5'プライム編集因子gRNA(図3A)、3'プライム編集因子gRNA(図3B)、および分子内の伸長(図3C)のデザインを示している。伸長されたガイドRNA(または伸長されたgRNA)は本願においてはPEgRNAまたは「プライム編集ガイドRNA」ともまた言われ得る。図3Dおよび図3Eは夫々3'および5'プライム編集因子gRNA(PEgRNA)の追加の態様を提供する。図3Fは標的DNA配列との3'端プライム編集因子ガイドRNAの間の相互作用を例解している。図3A~3Cの態様は、3'、5'、および分子内のバージョンの伸長された部分における逆転写鋳型配列(すなわち、または指示されているとおりより幅広くDNA合成鋳型と言われる。なぜなら、RTはプライム編集因子という文脈において用いられ得るポリメラーゼの唯一の型であるからである)、プライマー結合部位、および任意のリンカー配列の例示の配置、ならびにスペーサーおよびコア領域の一般的な配置を図示する。開示されるプライム編集プロセスは、伸長されたガイドRNAのこれらの構成に限定されない。図3Dの態様は、本願において企図される例示のPEgRNAの構造を提供する。PEgRNAは、5'から3'の方向で順序付けられた3つの主な構成要素構成要素、つまり:スペーサー、gRNAコア、および3'端の伸長アームを含む。伸長アームは、さらに、5'から3'方向に次の構造要素、つまり:プライマー結合部位(A)、編集鋳型(B)、および相同アーム(C)に分けられ得る。加えて、PEgRNAは任意の3'端修飾領域(e1)および任意の5'端修飾領域(e2)を含み得る。なお、さらに、PEgRNAは転写終結シグナルをPEgRNAの3'端に含み得る(図示されていない)。これらの構造要素はさらに本願において定められる。PEgRNAの構造の図示は限定することを意味されず、要素の配置のバリエーションを包摂する。例えば、任意の配列修飾(e1)および(e2)は、示されている他の領域のいずれかの内にまたは間に位置取り得る。3'および5'端に位置付けられることに限定されない。PEgRNAは、ある態様において、ヘアピン、ステムループ、トウループ、RNA結合タンパク質動員ドメイン(例えば、MS2cpタンパク質を動員および結合するMS2アプタマー)などだがこれらに限定されない二次RNA構造を含み得る。例えば、かかる二次構造は、スペーサー、gRNAコア、または伸長アーム内に、特にe1および/またはe2修飾領域内に位置し得る。二次RNA構造に加えて、PEgRNAは(例えばe1および/またはe2修飾領域内に)化学的リンカーまたはポリ(N)リンカーもしくはテールを含み得る。ここで、「N」はいずれかの核酸塩基であり得る。いくつかの態様では(例えば、図72(c)に示されているとおり)、化学的リンカーはsgRNA骨格またはコアの逆転写を防止するように機能し得る。加えて、ある種の態様では(例えば図72(c)を見よ)、伸長アーム(3)はRNAまたはDNAから構成され得、および/または1つ以上の核酸塩基アナログを包含し得る(例えば、これは温度レジリエンスなどの機能性を追加し得る)。なお、さらに、伸長アーム(3)の向きは、天然の5'から3'の方向であり得るか、または対向する向きで3'から5'の方向に(総体的なPEgRNA分子の向きに対して相対的に)合成され得る。当業者は、伸長アームの核酸材料の性質(すなわちDNAまたはRNA)に依存して、プライム編集への使用のための適当なDNAポリメラーゼを選択する能力があるであろうということもまた注意される。これは、所望の編集を包含する所望の鋳型によってコードされる3'一本鎖DNAフラップを合成するために、napDNAbpとの融合体として、または別個の部分としてトランスで提供されて、どちらかで実装され得る。例えば、伸長アームがRNAである場合には、DNAポリメラーゼは、逆転写酵素またはいずれかの他の好適なRNA依存性DNAポリメラーゼであり得る。しかしながら、伸長アームがDNAである場合には、DNAポリメラーゼはDNA依存性DNAポリメラーゼであり得る。種々の態様において、DNAポリメラーゼの提供はトランスであり得、例えばRNA-タンパク質動員ドメイン(例えば、PEgRNA上に組み入れされたMS2ヘアピン(例えば、e1もしくはe2領域にまたは他所に)およびDNAポリメラーゼに融合されたMS2cpタンパク質。それによってDNAポリメラーゼをPEgRNAに共局在させる)の使用による。プライマー結合部位は、一般的には、所望の編集を包含するもたらされる3'一本鎖DNAフラップをコードするためのDNAポリメラーゼ(例えば、逆転写酵素)によって用いられる鋳型の一部を形成しないということもまた注意される。それゆえに、「DNA合成鋳型」という指定は、編集とプライム編集DNA合成の3’一本鎖DNA鎖産物によって置き換えられる5’の内生一本鎖DNAフラップに対する相同領域とを含有する所望の3'一本鎖DNAフラップをコードするための、DNAポリメラーゼによって鋳型として用いられる伸長アーム(3)の領域または部分を言う。いくつかの態様では、DNA合成鋳型は「編集鋳型」および「相同アーム」または1つ以上の相同アームを例えば編集鋳型の前および後に包含する。編集鋳型は1ヌクレオチド置換ほども小さくあり得るか、またはそれはDNAの挿入もしくは逆位であり得る。加えて、編集鋳型は欠失をもまた包含し得、これは所望の欠失を含有する相同アームをコードすることによって操作され得る。他の態様において、DNA合成鋳型はe2領域またはその部分をもまた包含し得る。例えば、e2領域がDNAポリメラーゼ活性の終結を引き起こす二次構造を含む場合には、e2領域のいずれかの部分が実際にDNA上にコードされる前に、DNAポリメラーゼ機能が終結するであろうということが可能である。e2領域のいくつかまたはさらには全てがDNA上にコードされるであろうということもまた可能である。e2のどれくらい多くが実際に鋳型として用いられるのかは、その構成とその構成がDNAポリメラーゼ機能を分断するかどうかとに依存するであろう。Figures 3A-3F show the design of engineered 5' prime editing factor gRNA (Figure 3A), 3' prime editing factor gRNA (Figure 3B), and intramolecular extension (Figure 3C). Elongated guide RNA (or elongated gRNA) may also be referred to herein as PEgRNA or "primed editing guide RNA." Figures 3D and 3E provide additional embodiments of 3' and 5' prime editing factor gRNAs (PEgRNAs), respectively. Figure 3F illustrates the interaction between the 3' prime editor guide RNA and the target DNA sequence. Embodiments of FIGS. 3A-3C represent reverse transcription template sequences in the extended portions of the 3', 5', and intramolecular versions (i.e., or more broadly referred to as DNA synthesis templates as indicated. Because RT Figure 2 illustrates an exemplary arrangement of a primer binding site, and an optional linker sequence, as well as a general arrangement of a spacer and core region (as this is the only type of polymerase that can be used in the context of a prime editing agent), a primer binding site, and an optional linker sequence. The disclosed prime editing process is not limited to these configurations of elongated guide RNA. The embodiment of FIG. 3D provides the structure of an exemplary PEgRNA contemplated herein. PEgRNA contains three main component components ordered in the 5' to 3' direction: a spacer, a gRNA core, and an extended arm at the 3' end. The elongated arm can be further divided in the 5' to 3' direction into the following structural elements: primer binding site (A), editing template (B), and homology arm (C). In addition, PEgRNA can include an optional 3' end modified region (e1) and an optional 5' end modified region (e2). Furthermore, PEgRNA may further include a transcription termination signal at the 3' end of PEgRNA (not shown). These structural elements are further defined in this application. The illustration of the structure of PEgRNA is not meant to be limiting and encompasses variations in the arrangement of the elements. For example, any sequence modifications (e1) and (e2) may be located within or between any of the other regions shown. It is not limited to being located at the 3' and 5' ends. PEgRNA, in certain embodiments, can include secondary RNA structures such as, but not limited to, hairpins, stem loops, toe loops, RNA binding protein recruitment domains (eg, MS2 aptamers that recruit and bind MS2cp protein). For example, such secondary structures may be located within the spacer, gRNA core, or elongated arms, particularly within the e1 and/or e2 modified regions. In addition to the secondary RNA structure, PEgRNAs may include chemical linkers or poly(N) linkers or tails (eg, within the e1 and/or e2 modified regions). Here, "N" can be any nucleobase. In some embodiments (eg, as shown in Figure 72(c)), the chemical linker can function to prevent reverse transcription of the sgRNA backbone or core. Additionally, in certain embodiments (see, e.g., FIG. 72(c)), the extended arm (3) may be composed of RNA or DNA, and/or may include one or more nucleobase analogs (e.g., This may add functionality such as temperature resilience). Additionally, the orientation of the extended arm (3) can be in the native 5' to 3' direction or in the 3' to 5' direction (with respect to the overall PEgRNA molecule orientation) in an opposing orientation. can be synthesized (relatively). It is also noted that one skilled in the art will be able to select the appropriate DNA polymerase for use in prime editing, depending on the nature of the nucleic acid material of the extended arm (i.e. DNA or RNA). . This can be provided in trans, either as a fusion with napDNAbp or as a separate part, to synthesize a 3' single-stranded DNA flap encoded by the desired template that encompasses the desired edits. Can be implemented. For example, if the extending arm is RNA, the DNA polymerase can be reverse transcriptase or any other suitable RNA-dependent DNA polymerase. However, if the extending arm is DNA, the DNA polymerase may be a DNA-dependent DNA polymerase. In various embodiments, the provision of the DNA polymerase can be in trans, for example, an RNA-protein recruitment domain (e.g., an MS2 hairpin incorporated on PEgRNA (e.g., in the e1 or e2 region or elsewhere) and fused to the DNA polymerase). MS2cp protein, which colocalizes DNA polymerase with PEgRNA). The primer binding site generally does not form part of the template used by a DNA polymerase (e.g., reverse transcriptase) to encode the resulting 3' single-stranded DNA flap that encompasses the desired edit. It is also noted that. Therefore, the designation "DNA synthesis template" refers to the desired 3 'Refers to the region or portion of the extended arm (3) that is used as a template by a DNA polymerase to encode a single-stranded DNA flap. In some embodiments, the DNA synthesis template includes an "editing template" and a "homologous arm" or one or more homologous arms, eg, before and after the editing template. The editing template can be as small as a single nucleotide substitution, or it can be an insertion or inversion of DNA. In addition, editing templates can also include deletions, which can be manipulated by encoding homology arms containing the desired deletions. In other embodiments, the DNA synthesis template may also include the e2 region or portions thereof. For example, if the e2 region contains secondary structures that cause termination of DNA polymerase activity, then DNA polymerase function would be terminated before any part of the e2 region is actually encoded on the DNA. Is possible. It is also possible that some or even all of the e2 region will be encoded on the DNA. How much of e2 is actually used as template will depend on its composition and whether it disrupts DNA polymerase function.

図3Eの態様は本願において企図される別のPEgRNAの構造を提供する。PEgRNAは、5'から3'の方向で順序付けられた3つの主な構成要素構成要素、つまり:スペーサー、gRNAコア、および3'端の伸長アームを含む。伸長アームは、さらに、5'から3'の方向で次の構造要素、つまり:プライマー結合部位(A)、編集鋳型(B)、および相同アーム(C)に分けられ得る。加えて、PEgRNAは任意の3'端修飾領域(e1)および任意の5'端修飾領域(e2)を含み得る。なお、さらに、PEgRNAはPEgRNAの3'端に転写終結シグナルを含み得る(図示されていない)。これらの構造要素はさらに本願において定められる。PEgRNAの構造の図示は限定することを意味されず、要素の配置のバリエーションを包摂する。例えば、任意の配列修飾(e1)および(e2)は示されている他の領域のいずれかの内にまたは間に位置取り得る。3'および5'端に位置付けられることに限定されない。PEgRNAは、ある態様において、ヘアピン、ステムループ、トウループ、RNA結合タンパク質動員ドメイン(例えば、MS2cpタンパク質を動員および結合するMS2アプタマー)などだがこれらに限定されない二次RNA構造を含み得る。これらの二次構造はPEgRNA分子上のどこかに位置取り得る。例えば、かかる二次構造は、スペーサー、gRNAコア、または伸長アーム内に、特にe1および/またはe2修飾領域内に位置し得る。二次RNA構造に加えて、PEgRNAは(例えば、e1および/またはe2修飾領域内に)化学的リンカーまたはポリ(N)リンカーもしくはテールを含み得る。ここで、「N」はいずれかの核酸塩基であり得る。いくつかの態様では(例えば、図72(c)に示されているとおり)、化学的リンカーはsgRNA骨格またはコアの逆転写を防止するように機能し得る。加えて、ある種の態様では(例えば、図72(c)を見よ)、伸長アーム(3)はRNAもしくはDNAからなり得、および/または1つ以上の核酸塩基アナログを包含し得る(例えば、これは温度レジリエンスなどの機能性を追加し得る)。なお、さらに、伸長アーム(3)の向きは天然の5'から3'の方向であり得るか、または対向する向きで3'から5'の方向に(総体的なPEgRNA分子の向きに対して相対的に)合成され得る。当業者は、伸長アームの核酸材料の性質(すなわちDNAまたはRNA)に依存して、プライム編集への使用のための適当なDNAポリメラーゼを選択する能力があるであろうということもまた注意される。これは、所望の編集を包含する所望の鋳型によってコードされる3'一本鎖DNAフラップを合成するために、napDNAbpとの融合体として、または別個の部分としてトランスで提供されて、どちらかで実装され得る。例えば、伸長アームがRNAである場合には、DNAポリメラーゼは、逆転写酵素またはいずれかの他の好適なRNA依存性DNAポリメラーゼであり得る。しかしながら、伸長アームがDNAである場合には、DNAポリメラーゼはDNA依存性DNAポリメラーゼであり得る。種々の態様において、DNAポリメラーゼの提供はトランスであり得、例えばRNA-タンパク質動員ドメイン(例えば、PEgRNA上に組み入れされたMS2ヘアピン(例えば、e1もしくはe2領域にまたは他所に)およびDNAポリメラーゼに融合されたMS2cpタンパク質。それによってDNAポリメラーゼをPEgRNAに共局在させる)の使用による。プライマー結合部位は、一般的には、所望の編集を包含するもたらされる3'一本鎖DNAフラップをコードするためのDNAポリメラーゼ(例えば、逆転写酵素)によって用いられる鋳型の一部を形成しないということもまた注意される。それゆえに、「DNA合成鋳型」という指定は、編集とプライム編集DNA合成の3’一本鎖DNA鎖産物によって置き換えられる5’の内生一本鎖DNAフラップに対する相同領域とを含有する所望の3'一本鎖DNAフラップをコードするための、DNAポリメラーゼによって鋳型として用いられる伸長アーム(3)の領域または部分を言う。いくつかの態様では、DNA合成鋳型は「編集鋳型」および「相同アーム」または1つ以上の相同アームを例えば編集鋳型の前および後に包含する。編集鋳型は1ヌクレオチド置換ほども小さくあり得るか、またはそれはDNAの挿入もしくは逆位であり得る。加えて、編集鋳型は欠失をもまた包含し得、これは所望の欠失を含有する相同アームをコードすることによって操作され得る。他の態様において、DNA合成鋳型はe2領域またはその部分をもまた包含し得る。例えば、e2領域がDNAポリメラーゼ活性の終結を引き起こす二次構造を含む場合には、e2領域のいずれかの部分が実際にDNA上にコードされる前に、DNAポリメラーゼ機能が終結するであろうということが可能である。e2領域のいくつかまたはさらには全てがDNA上にコードされるであろうということもまた可能である。e2のどれくらい多くが実際に鋳型として用いられるのかは、その構成とその構成がDNAポリメラーゼ機能を分断するかどうかとに依存するであろう。The embodiment of FIG. 3E provides the structure of another PEgRNA contemplated herein. PEgRNA contains three main component components ordered in the 5' to 3' direction: a spacer, a gRNA core, and an extended arm at the 3' end. The elongated arm can be further divided into the following structural elements in the 5' to 3' direction: primer binding site (A), editing template (B), and homology arm (C). In addition, PEgRNA can include an optional 3' end modified region (e1) and an optional 5' end modified region (e2). Furthermore, PEgRNA may further include a transcription termination signal at the 3' end of PEgRNA (not shown). These structural elements are further defined in this application. The illustration of the structure of PEgRNA is not meant to be limiting and encompasses variations in the arrangement of the elements. For example, any sequence modifications (e1) and (e2) may be located within or between any of the other regions shown. It is not limited to being located at the 3' and 5' ends. PEgRNA, in certain embodiments, can include secondary RNA structures such as, but not limited to, hairpins, stem loops, toe loops, RNA binding protein recruitment domains (eg, MS2 aptamers that recruit and bind MS2cp protein). These secondary structures can be located anywhere on the PEgRNA molecule. For example, such secondary structures may be located within the spacer, gRNA core, or elongated arms, particularly within the e1 and/or e2 modified regions. In addition to secondary RNA structure, PEgRNAs may include chemical linkers or poly(N) linkers or tails (eg, within the e1 and/or e2 modified regions). Here, "N" can be any nucleobase. In some embodiments (eg, as shown in Figure 72(c)), the chemical linker can function to prevent reverse transcription of the sgRNA backbone or core. Additionally, in certain embodiments (see, e.g., FIG. 72(c)), the extended arm (3) may be comprised of RNA or DNA, and/or may include one or more nucleobase analogs (e.g., This may add functionality such as temperature resilience). Additionally, the orientation of the elongated arm (3) can be in the native 5' to 3' direction, or in the 3' to 5' direction (with respect to the overall PEgRNA molecule orientation) in an opposing orientation. (relatively) can be synthesized. It is also noted that one skilled in the art will be able to select the appropriate DNA polymerase for use in prime editing, depending on the nature of the nucleic acid material of the extended arm (i.e. DNA or RNA). . This can be provided in trans, either as a fusion with napDNAbp or as a separate part, to synthesize a 3' single-stranded DNA flap encoded by the desired template that encompasses the desired edits. Can be implemented. For example, if the extending arm is RNA, the DNA polymerase can be reverse transcriptase or any other suitable RNA-dependent DNA polymerase. However, if the extending arm is DNA, the DNA polymerase may be a DNA-dependent DNA polymerase. In various embodiments, the provision of the DNA polymerase can be in trans, e.g., an RNA-protein recruitment domain (e.g., an MS2 hairpin incorporated on PEgRNA (e.g., in the e1 or e2 region or elsewhere) and fused to the DNA polymerase). MS2cp protein, which colocalizes DNA polymerase with PEgRNA). The primer binding site generally does not form part of the template used by a DNA polymerase (e.g., reverse transcriptase) to encode the resulting 3' single-stranded DNA flap that encompasses the desired edit. It is also noted that. Therefore, the designation "DNA synthesis template" refers to the desired 3 'Refers to the region or portion of the extended arm (3) that is used as a template by a DNA polymerase to encode a single-stranded DNA flap. In some embodiments, the DNA synthesis template includes an "editing template" and a "homologous arm" or one or more homologous arms, eg, before and after the editing template. The editing template can be as small as a single nucleotide substitution, or it can be an insertion or inversion of DNA. In addition, editing templates can also include deletions, which can be manipulated by encoding homology arms containing the desired deletions. In other embodiments, the DNA synthesis template may also include the e2 region or portions thereof. For example, if the e2 region contains secondary structures that cause termination of DNA polymerase activity, then DNA polymerase function would be terminated before any part of the e2 region is actually encoded on the DNA. Is possible. It is also possible that some or even all of the e2 region will be encoded on the DNA. How much of e2 is actually used as template will depend on its composition and whether it disrupts DNA polymerase function.

図3Fの模式図は、二本鎖DNAの標的部位との典型的なPEgRNAの相互作用と、目当ての遺伝子変化を含有する3'一本鎖DNAフラップの付随的生成とを図示する。二本鎖DNAは3'から5'の向きの上側鎖(すなわち、標的鎖)と5'から3'方向の下方の鎖(すなわち、PAM鎖または非標的鎖)とによって示されている。上側の鎖は「プロトスペーサー」の相補体およびPAM配列の相補体を含み、「標的鎖」と言われる。なぜなら、それは、PEgRNAのスペーサーによる標的であるかつそれにアニールする鎖であるからである。それはPAM配列(例えばNGG)およびプロトスペーサーを含有するので、相補的な下方の鎖は、「非標的鎖」または「PAM鎖」または「プロトスペーサー鎖」と言われる。示されてはいないが、図示されているPEgRNAはプライム編集因子融合タンパク質のCas9または同等のドメインと複合体化するであろう。模式図に示されているとおり、PEgRNAのスペーサーは標的鎖上のプロトスペーサーの相補領域にアニールする。この相互作用はスペーサーRNAとプロトスペーサーDNAの相補体との間のDNA/RNAハイブリッドを形成し、プロトスペーサー上のRループの形成を誘導する。本願の他所において教示されるとおり、Cas9タンパク質(示されていない)は、それから、示されているとおり非標的鎖上にニックを誘導する。これは、それから、ニック部位の直ちに上流において3'ssDNAフラップ領域の形成に至り、これは、*z*に従ってプライマー結合部位においてPEgRNAの3'端と相互作用する。ssDNAフラップの3'端(すなわち、逆転写酵素プライマー配列)はPEgRNA上のプライマー結合部位(A)にアニーリングし、それによって逆転写酵素をプライムする。次に、逆転写酵素(例えば、トランスで提供されるか、またはCas9構築物に取り付けられた融合タンパク質としてシスで提供される)は、それから、DNA合成鋳型(編集鋳型(B)および相同アーム(C)を包含する)によってコードされるDNAの一本鎖を重合する。重合は伸長アームの5'端の方へ連続する。ssDNAの重合した鎖はssDNA 3'端フラップを形成し、これは他所に記載するとおり(例えば、図1Gに示されているとおり)内生DNAに侵入し、対応する内生鎖を押し除け(これは内生DNAの5'端のDNAフラップとして除去される)、所望のヌクレオチド編集(1ヌクレオチド塩基対変化、欠失、挿入(遺伝子丸ごとを包含する)を天然に存在するDNA修復/複製ラウンドによって組み入れる。The schematic diagram in Figure 3F illustrates a typical PEgRNA interaction with a double-stranded DNA target site and the concomitant generation of a 3' single-stranded DNA flap containing the genetic change of interest. Double-stranded DNA is represented by an upper strand (ie, the target strand) in a 3' to 5' orientation and a lower strand (ie, the PAM strand or non-target strand) in a 5' to 3' orientation. The upper strand contains the complement of the "protospacer" and the complement of the PAM sequence and is referred to as the "target strand." This is because it is the strand that is targeted by and anneals to the spacer of PEgRNA. Because it contains a PAM sequence (eg, NGG) and a protospacer, the complementary lower strand is referred to as the "non-target strand" or "PAM strand" or "protospacer strand." Although not shown, the illustrated PEgRNA will be complexed with the Cas9 or equivalent domain of the prime editor fusion protein. As shown in the schematic, the PEgRNA spacer anneals to the complementary region of the protospacer on the target strand. This interaction forms a DNA/RNA hybrid between the spacer RNA and the complement of the protospacer DNA and induces the formation of an R-loop on the protospacer. As taught elsewhere in this application, the Cas9 protein (not shown) then induces a nick on the non-target strand as shown. This then leads to the formation of a 3'ssDNA flap region immediately upstream of the nick site, which interacts with the 3' end of PEgRNA at the primer binding site according to *z*. The 3' end of the ssDNA flap (i.e., the reverse transcriptase primer sequence) anneals to the primer binding site (A) on the PEgRNA, thereby priming the reverse transcriptase. Next, reverse transcriptase (e.g., provided in trans or in cis as a fusion protein attached to a Cas9 construct) is then added to the DNA synthesis template (editing template (B) and homology arm (C)). ) is encoded by a single strand of DNA. Polymerization continues towards the 5' end of the extended arm. The polymerized strands of ssDNA form the ssDNA 3' end flap, which invades the endogenous DNA and displaces the corresponding endogenous strand (as described elsewhere (e.g., as shown in Figure 1G)). This is removed as a DNA flap at the 5' end of the endogenous DNA), performs the desired nucleotide edits (single nucleotide base pair changes, deletions, insertions (encompassing entire genes) in naturally occurring DNA repair/replication rounds. Incorporate by.

図3Gは、本願において企図されるプライム編集のさらに別の態様を図示する。特に、上側の模式図はプライム編集因子(PE)の1つの態様を図示する。これはnapDNAbp(例えば、SpCas9)およびポリメラーゼ(例えば、逆転写酵素)の融合タンパク質を含み、これらはリンカーによって連結されている。PEは、PEgRNAのgRNAコアに結合することによってPEgRNAとの複合体を形成する。示されている態様では、PEgRNAは3'伸長アームを備え、これは、3'端に始まって、プライマー結合部位(PBS)、次にDNA合成鋳型を含む。下側の模式図は、「トランスプライム編集因子(tPE)」と言われるプライム編集因子のバリアントを図示する。この態様では、DNA合成鋳型およびPBSはPEgRNAからデカップリングされ、トランスプライム編集因子RNA鋳型(「tPERT」)と言われる別個の分子によって提示される。これはRNA-タンパク質動員ドメイン(例えば、MS2ヘアピン)を含む。PEそれ自体は、rPERT動員タンパク質(「RP」)への融合体を含むようにさらに改変される。これはRNA-タンパク質動員ドメインを特異的に認識および結合するタンパク質である。RNA-タンパク質動員ドメインがMS2ヘアピンである例では、対応するrPERT動員タンパク質はMS2タグ付けシステムのMS2cpであり得る。MS2タグ付けシステムは、ファージのゲノム上に存在するステムループまたはヘアピン構造、すなわち「MS2ヘアピン」または「MS2アプタマー」とのMS2バクテリオファージコートタンパク質(「MCP」または「MS2cp」)の天然の相互作用に基づく。トランスプライム編集のケースでは、RP-PE:gRNA複合体は、PE:gRNA複合体と共局在するように適当なRNA-タンパク質動員ドメインを有するtPERTを「動員」し、それによって、図3Hに図示されている例に示されているとおりプライム編集への使用のためのPBSおよびDNA合成鋳型をトランスで提供する。FIG. 3G illustrates yet another embodiment of the prime editing contemplated in the present application. In particular, the upper schematic illustrates one embodiment of a prime editor (PE), which includes a fusion protein of napDNAbp (e.g., SpCas9) and a polymerase (e.g., reverse transcriptase), which are linked by a linker. PE forms a complex with the PEgRNA by binding to the gRNA core of the PEgRNA. In the embodiment shown, the PEgRNA is equipped with a 3' extension arm, which, starting at the 3' end, includes a primer binding site (PBS) and then a DNA synthesis template. The lower schematic illustrates a variant of the prime editor, referred to as "trans-prime editor (tPE)". In this embodiment, the DNA synthesis template and the PBS are decoupled from the PEgRNA and presented by a separate molecule, referred to as the trans-prime editor RNA template ("tPERT"). It includes an RNA-protein recruitment domain (e.g., an MS2 hairpin). PE itself is further modified to include a fusion to the rPERT recruitment protein ("RP"). This is a protein that specifically recognizes and binds the RNA-protein recruitment domain. In an example where the RNA-protein recruitment domain is an MS2 hairpin, the corresponding rPERT recruitment protein can be MS2cp of the MS2 tagging system. The MS2 tagging system is based on the natural interaction of the MS2 bacteriophage coat protein ("MCP" or "MS2cp") with a stem-loop or hairpin structure present on the genome of the phage, i.e., the "MS2 hairpin" or "MS2 aptamer". In the case of trans prime editing, the RP-PE:gRNA complex "recruits" tPERT with the appropriate RNA-protein recruitment domain to co-localize with the PE:gRNA complex, thereby providing PBS and DNA synthesis template in trans for use in prime editing as shown in the example illustrated in Figure 3H.

図3Hはトランスプライム編集のプロセスを図示する。この態様では、トランスプライム編集因子は、MS2cpタンパク質(すなわち、MS2アプタマーを認識および結合する型の動員タンパク質)に融合されているかつsgRNA(すなわち、PEgRNAと対比して標準ガイドRNA)と複合体化されている「PE2」プライム編集因子(すなわち、Cas9(H840A)およびバリアントMMLV RTの融合体)を含む。トランスプライム編集因子は標的DNAに結合し、非標的鎖へニックを入れる。MS2cpタンパク質はtPERT分子上のRNA-タンパク質動員ドメインとの特異的相互作用によってトランスでtPERTを動員する。tPERTはトランスプライム編集因子と共局在するようになり、それによって、逆転写酵素ポリメラーゼによる使用のためのPBSおよびDNA合成鋳型機能をトランスで提供して、3'端を有するかつDNA合成鋳型によってコードされる所望の遺伝子情報を含有する一本鎖DNAフラップを合成する。Figure 3H illustrates the process of transprime editing. In this embodiment, the transprime editing factor is fused to the MS2cp protein (i.e., a type of recruitment protein that recognizes and binds the MS2 aptamer) and complexed with sgRNA (i.e., standard guide RNA as opposed to PEgRNA). contains the "PE2" prime editing factor (i.e., a fusion of Cas9(H840A) and variant MMLV RT). Transprime editing factors bind to target DNA and nick non-target strands. The MS2cp protein recruits tPERT in trans by specific interaction with the RNA-protein recruitment domain on the tPERT molecule. tPERT becomes co-localized with the trans-prime editing factor, thereby providing PBS and DNA synthesis template functions in trans for use by reverse transcriptase polymerase, with a 3' end and by the DNA synthesis template. A single-stranded DNA flap containing the desired encoded genetic information is synthesized.

図4A~4Eは、in vitroでのTPRTアッセイ(すなわち、プライム編集アッセイ)を実証する。図4Aは、蛍光標識DNA基質、RT酵素によるgRNA鋳型の伸長、PAGEの概略図である。Figures 4A-4E demonstrate an in vitro TPRT assay (ie, prime editing assay). Figure 4A is a schematic diagram of fluorescently labeled DNA substrate, elongation of gRNA template with RT enzyme, and PAGE. 図4Bは、予めニックが入った(pre-nicked)基質、dCas9、および異なる合成鋳型長の5'伸長gRNAでのTPRT(すなわち、プライム編集)を示す。図4Cは、Cas9不在下の、予めニックが入ったDNA基質とのRT反応を示す。Figure 4B shows TPRT (ie, prime editing) with pre-nicked substrates, dCas9, and 5' extended gRNAs of different synthetic template lengths. Figure 4C shows RT reactions with pre-nicked DNA substrates in the absence of Cas9. 図4Dは、Cas9(H840A)および5'伸長gRNAとの、全長dsDNA基質に対するTPRT(すなわち、プライム編集)を示す。図4Eは、予めニックが入った全長dsDNA基質との3'伸長gRNA鋳型を示す。すべての反応にはM-MLV RTが存在する。Figure 4D shows TPRT (ie, prime editing) on full-length dsDNA substrates with Cas9(H840A) and 5' extended gRNA. Figure 4E shows a 3' extended gRNA template with a pre-nicked full-length dsDNA substrate. M-MLV RT is present in all reactions.

図5は、合成鋳型長を変動させた5'伸長gRNAを使用する、in vitroでの検証結果(validations)を示す。蛍光標識(Cy5)DNA標的を基質として使用し、この実験一式において予めニックを入れた。これらの実験において使用されたCas9は触媒不活性型Cas9(dCas9)であり、使用されたRTは、モロニーマウス白血病ウイルス(M-MLV)に由来する商用RTであるSuperscript IIIである。dCas9:gRNA複合体を、精製された構成要素から形成した。次いで、蛍光標識DNA基質をdNTPsおよびRT酵素とともに加えた。37℃での1時間のインキュベーション後、反応産物を変性尿素ポリアクリルアミドゲル電気泳動(PAGE)によって分析した。ゲル画像は、元のDNA鎖~逆転写鋳型長と一致する長さの伸長を示す。Figure 5 shows in vitro validations using 5' extended gRNAs with varying synthetic template lengths. Fluorescently labeled (Cy5) DNA targets were used as substrates and were pre-nicked in this set of experiments. The Cas9 used in these experiments was catalytically inactive Cas9 (dCas9) and the RT used was Superscript III, a commercial RT derived from Moloney murine leukemia virus (M-MLV). A dCas9:gRNA complex was formed from the purified components. Fluorescently labeled DNA substrate was then added along with dNTPs and RT enzyme. After 1 hour incubation at 37°C, reaction products were analyzed by denaturing urea polyacrylamide gel electrophoresis (PAGE). The gel image shows an extension of the original DNA strand to a length that matches the reverse transcription template length.

図6は、合成鋳型長を変動させた5'伸長gRNAを使用する、in vitroでの検証結果を示すが、これは図5に示されるものと酷似している。しかしながら、DNA基質は、この実験一式においてニックは予め入っていない。これらの実験に使用されたCas9はCas9ニッカーゼ(SpyCas9 H840A突然変異体)であり、使用されたRTは、モロニーマウス白血病ウイルス(M-MLV)に由来する商用RTであるSuperscript IIIである。反応産物を変性尿素ポリアクリルアミドゲル電気泳動(PAGE)によって分析した。ゲルに示されるとおり、ニッカーゼは、標準gRNAが使用されたとき、DNA鎖を効率的に切断する(gRNA_0、レーン3)。Figure 6 shows in vitro validation results using 5' extended gRNAs with varying synthetic template lengths, which are very similar to those shown in Figure 5. However, the DNA substrate is not pre-nicked in this set of experiments. The Cas9 used in these experiments was Cas9 nickase (SpyCas9 H840A mutant) and the RT used was Superscript III, a commercial RT derived from Moloney murine leukemia virus (M-MLV). The reaction products were analyzed by denaturing urea polyacrylamide gel electrophoresis (PAGE). As shown in the gel, nickase efficiently cuts the DNA strand when standard gRNA is used (gRNA_0, lane 3).

図7は、3'伸長がDNA合成を裏付け有意にCas9ニッカーゼ活性を生じさせないことを実証する。予めニックが入った基質(黒色矢印)は、dCas9またはCas9ニッカーゼのいずれかが使用されたとき、ほぼ定量的にRT産物へ変換される(レーン4および5)。50%超のRT産物への変換(赤色矢印)が全長基質で観察される(レーン3)。Cas9ニッカーゼ(SpyCas9 H840A突然変異体)、触媒不活性型Cas9(dCas9)、およびSuperscript III(モロニーマウス白血病ウイルス(M-MLV)に由来する商用RT)を使用する。Figure 7 demonstrates that 3' extension supports DNA synthesis and does not result in significant Cas9 nickase activity. Pre-nicked substrates (black arrows) are nearly quantitatively converted to RT products when either dCas9 or Cas9 nickase are used (lanes 4 and 5). More than 50% conversion to RT products (red arrows) is observed for the full-length substrate (lane 3). Cas9 nickase (SpyCas9 H840A mutant), catalytically inactive Cas9 (dCas9), and Superscript III, a commercial RT derived from Moloney Murine Leukemia Virus (M-MLV), are used.

図8は、RT反応が優先してgRNAにcisで生じる(同じ複合体中で結合される)かを決定するために使用された二色(dual color)実験を実証する。2つ別々の実験を5'伸長gRNAおよび3'伸長gRNAについて行った。産物をPAGEによって分析した。産物比率は(Cy3cis/Cy3trans)/(Cy5trans/Cy5cis)として算出した。Figure 8 demonstrates a dual color experiment that was used to determine whether the RT reaction preferentially occurs in cis on gRNA (bound in the same complex). Two separate experiments were performed with 5' and 3' extended gRNAs. Products were analyzed by PAGE. The product ratio was calculated as (Cy3cis/Cy3trans)/(Cy5trans/Cy5cis).

図9A~9Dは、フラップモデル基質を実証する。図9Aは、フラップ特異的(-directed)変異誘発のための二重FPレポーターを示す。図9Bは、HEK細胞中の停止コドン修復を示す。Figures 9A-9D demonstrate flap model substrates. Figure 9A shows a dual FP reporter for flap-directed mutagenesis. Figure 9B shows stop codon repair in HEK cells. 図9Cは、フラップ修復後に配列決定された(sequenced)酵母クローンを示す。図9Dは、ヒト細胞中の異なるフラップ特色の試験を示す。Figure 9C shows yeast clones sequenced after flap repair. Figure 9D shows examination of different flap features in human cells.

図10は、プラスミド基質上のプライム編集を実証する。二重蛍光レポータープラスミドを酵母(S.cerevisiae)発現のために構築した。酵母中のこの構築物の発現は、GFPのみを産生する。in vitroでのプライム編集反応は点突然変異を誘導し、親プラスミド、またはin vitroでCas9(H840A)によってニックが入れられたプラスミドを酵母中へ形質転換する。コロニーは蛍光画像化によって可視化される。酵母二重FPプラスミド形質転換体が示されている。親プラスミドまたはin vitroでCas9(H840A)にニックが入ったプラスミドを形質展開することは、緑色GFP発現コロニーのみをもたらす。5'伸長gRNAまたは3'伸長gRNAでのプライム編集反応は、緑色および黄色の混合コロニーを産生する。後者はGFPとmCherryとの両方を発現する。より多くの黄色コロニーは3'伸長gRNAで観察される。停止コドンを含有しない陽性対照も示されていない。Figure 10 demonstrates prime editing on plasmid substrates. A dual fluorescent reporter plasmid was constructed for yeast (S. cerevisiae) expression. Expression of this construct in yeast produces only GFP. An in vitro prime editing reaction induces point mutations and the parental plasmid, or a plasmid nicked in vitro with Cas9(H840A), is transformed into yeast. Colonies are visualized by fluorescence imaging. A yeast double FP plasmid transformant is shown. Transforming the parental plasmid or the Cas9(H840A) nicked plasmid in vitro results in only green GFP expressing colonies. Prime editing reactions with 5' extended gRNA or 3' extended gRNA produce mixed green and yellow colonies. The latter expresses both GFP and mCherry. More yellow colonies are observed with 3' extended gRNA. A positive control that does not contain a stop codon is also not shown.

図11は、図10の実験と同様のプラスミド基質上のプライム編集を示すが、停止コドン中に点突然変異を組み入れる代わりに、プライム編集は、フレームシフト突然変異を修復して下流のmCherryの合成を可能にさせる単一ヌクレオチドの挿入(左)または欠失(右)を組み入れる。両実験ともに3'伸長gRNAsを使用した。Figure 11 shows prime editing on a plasmid substrate similar to the experiment in Figure 10, but instead of incorporating a point mutation in the stop codon, prime editing repairs the frameshift mutation and synthesizes downstream mCherry. Incorporate single nucleotide insertions (left) or deletions (right) that allow for. Both experiments used 3' extended gRNAs.

図12は、サンガー(Sanger)配列決定によって特徴付けられる、プラスミド基質上のプライム編集の編集産物を示す。TRT形質転換からのコロニーを個々に選択し、サンガー配列決定によって分析した。正確な編集が選択コロニーを配列決定することによって観察された。緑色コロニーは元のDNA配列をもつプラスミドを含有していたのに対し、黄色コロニーはプライム編集gRNAによってデザインされた正確な突然変異を含有していた。他の点突然変異またはインデルは一切観察されなかった。Figure 12 shows the editing products of prime editing on the plasmid substrate characterized by Sanger sequencing. Colonies from the TRT transformation were individually selected and analyzed by Sanger sequencing. Precise editing was observed by sequencing the selected colonies. The green colonies contained the plasmid with the original DNA sequence, whereas the yellow colonies contained the correct mutations designed by the prime editing gRNA. No other point mutations or indels were observed.

図13は、新しいプライム編集技術の潜在的な範囲を示し、デアミナーゼ媒介塩基編集技術との比較を示す。Figure 13 illustrates the potential scope of the new prime editing technology and shows a comparison with deaminase-mediated base editing technology.

図14は、ヒト細胞における編集の概略図を示す。Figure 14 shows a schematic diagram of editing in human cells.

図15は、gRNA中のプライマー結合部位の伸長を実証する。Figure 15 demonstrates the extension of primer binding sites in gRNA.

図16は、隣接標的化(adjacent targeting)のためにトランケートされたgRNAを示す。Figure 16 shows gRNAs truncated for adjacent targeting.

図17A~17Cは、ヒト胚腎臓(HEK)細胞における構成要素のトランスフェクション後の標的ヌクレオチドでの%T→A変換を表示するグラフである。図17Aは、野生型MLV逆転写酵素のCas9(H840A)ニッカーゼ(32アミノ酸リンカー)へのN末融合を使用した結果を提示するデータを示す。図17Bは、RT酵素のC末融合を別にすれば図17Aと同様である。図17Cは、図17Aと同様であるが、MLV RTとCas9との間のリンカーが32アミノ酸の代わりに60アミノ酸長である。Figures 17A-17C are graphs displaying % T→A conversion at the target nucleotide following transfection of the constructs in human embryonic kidney (HEK) cells. Figure 17A shows data presenting the results using an N-terminal fusion of wild-type MLV reverse transcriptase to Cas9 (H840A) nickase (32 amino acid linker). Figure 17B is similar to Figure 17A except for the C-terminal fusion of the RT enzyme. Figure 17C is similar to Figure 17A except that the linker between the MLV RT and Cas9 is 60 amino acids long instead of 32 amino acids.

図18は、ハイスループットアンプリコン配列決定によるHEK3部位での高純度T→A編集を示す。配列決定分析の出力は、編集済細胞の最も豊富な遺伝子型を表示する。Figure 18 shows high purity T→A editing at the HEK3 site by high-throughput amplicon sequencing. The output of the sequencing analysis displays the most abundant genotype of the edited cells.

図19は、インデル比率(青色バー)と並んで標的ヌクレオチドでの編集効率(オレンジ色バー)を示す。WTは野生型MLV RT酵素を指す。突然変異酵素(M1~M4)は、右へ列挙された突然変異を含有する。編集比率をゲノムDNAアンプリコンのハイスループット配列決定によって定量化した。Figure 19 shows the editing efficiency at the target nucleotide (orange bar) alongside the indel ratio (blue bar). WT refers to wild type MLV RT enzyme. The mutant enzymes (M1-M4) contain the mutations listed to the right. Editing rates were quantified by high-throughput sequencing of genomic DNA amplicons.

図20は、単鎖ニックが標的ヌクレオチドに近接する相補的なDNA鎖中に導入されたときの標的ヌクレオチドの編集効率を示す。標的ヌクレオチドから様々な間隔にてニックを入れるのを試験した(三角形)。標的塩基対(青色バー)での編集効率が、インデル形成比率と並んで示される(オレンジ色バー)。「なし」の例は、相補鎖へニックを入れるガイドRNAを含有しない。編集比率をゲノムDNAアンプリコンのハイスループット配列決定によって定量化した。Figure 20 shows the editing efficiency of target nucleotides when a single-stranded nick is introduced into the complementary DNA strand in close proximity to the target nucleotide. Nicking at various distances from the target nucleotide was tested (triangles). Editing efficiency at the target base pair (blue bar) is shown alongside the indel formation rate (orange bar). An example of "none" does not contain a guide RNA that nicks the complementary strand. Editing rates were quantified by high-throughput sequencing of genomic DNA amplicons.

図21は、所望のT→Aトランスバージョン突然変異および他の主なゲノム編集副産物の全般的な非存在を示す、処理されたハイスループット配列決定データを実証する。Figure 21 demonstrates processed high-throughput sequencing data showing the general absence of desired T→A transversion mutations and other major genome editing byproducts.

図22は、伸長されたガイドRNAと複合体化された核酸プログラム型DNA結合タンパク質(napDNAbp)を使用し、エラーを起こしやすい逆転写酵素で、標的変異誘発(targeted mutagenesis)を標的遺伝子座上に行う(すなわち、エラーを起こしやすいRTでプライム編集する)ための例示のプロセスの概略図を提供する。このプロセスは、標的変異誘発のためのプライム編集の態様と称されることもある。伸長されたガイドRNAは、ガイドRNAの3'末もしくは5'末での、またはガイドRNA中の分子内のある場所での伸長を含む。ステップ(a)において、napDNAbp/gRNA複合体はDNA分子に接触し、gRNAがnapDNAbpを、変異誘発されるべき標的遺伝子座へ結合するようにガイドする。ステップ(b)において、標的遺伝子座のDNAの鎖の一方にニックが導入され(例として、ヌクレアーゼまたは化学剤によって)、これによって標的遺伝子座の鎖の一方に利用可能な3'末が創出される。ある態様において、ニックは、Rループ鎖に対応するDNAの鎖、すなわち、ガイドRNA配列とはハイブリダイズされない鎖中に創出される。ステップ(c)において、3'末DNA鎖は、逆転写をプライムするために、ガイドRNAの伸長部分と相互作用する。ある態様において、3'末のDNA鎖は、ガイドRNAの伸長部分上の特定のRTプライム配列とハイブリダイズする。ステップ(d)において、エラーを起こしやすい逆転写酵素が導入されるが、これは変異誘発されたDNAの単鎖を、プライムされた部位の3'末からガイドRNAの3'末へ合成する。例示の突然変異は星印「*」で示される。これは、所望の変異誘発領域を含む単鎖DNAフラップを形成する。ステップ(e)において、napDNAbpおよびガイドRNAは放出される。ステップ(f)および(g)は、所望の変異誘発領域が標的遺伝子座中へ組み込まれるように、単鎖DNAフラップ(変異誘発領域を含む)の分解に関する。このプロセスは、一旦3'単鎖DNAフラップが侵入して他の鎖上の相補的な配列とハイブリダイズすると、形成された対応の5'内生DNAフラップを除去することによって、所望の産物形成へ推進され得る。プロセスはまた、図1Fに例示されるとおり、第2鎖にニックが入れられた産物の形成へも推進され得る。内生DNA修復および/または複製プロセスに続き、変異誘発領域は、DNA遺伝子座のDNAの両鎖中へ組み込まれるようになる。Figure 22 shows that targeted mutagenesis is performed on a target locus using a nucleic acid-programmed DNA binding protein (napDNAbp) complexed with an elongated guide RNA and an error-prone reverse transcriptase. Provides a schematic diagram of an exemplary process for performing (i.e., prime editing with error-prone RT). This process is sometimes referred to as a form of prime editing for targeted mutagenesis. An extended guide RNA comprises an extension at the 3' or 5' end of the guide RNA or at some point within the molecule within the guide RNA. In step (a), the napDNAbp/gRNA complex contacts the DNA molecule and the gRNA guides the napDNAbp to bind to the target locus to be mutagenized. In step (b), a nick is introduced (eg, by a nuclease or chemical agent) into one of the strands of the DNA at the target locus, thereby creating an available 3' end on one of the strands at the target locus. Ru. In certain embodiments, a nick is created in the strand of DNA that corresponds to the R-loop strand, ie, the strand that is not hybridized to the guide RNA sequence. In step (c), the 3' terminal DNA strand interacts with the guide RNA extension to prime reverse transcription. In certain embodiments, the 3' terminal DNA strand hybridizes to a specific RT prime sequence on the guide RNA extension. In step (d), an error-prone reverse transcriptase is introduced, which synthesizes a single strand of mutagenized DNA from the 3' end of the primed site to the 3' end of the guide RNA. Exemplary mutations are indicated with an asterisk "*". This forms a single-stranded DNA flap containing the desired mutagenic region. In step (e) napDNAbp and guide RNA are released. Steps (f) and (g) involve disassembling the single-stranded DNA flap (containing the mutagenic region) so that the desired mutagenic region is incorporated into the target locus. This process, once a 3' single-stranded DNA flap enters and hybridizes with a complementary sequence on the other strand, removes the corresponding 5' endogenous DNA flap that is formed, thereby allowing desired product formation. can be promoted to The process can also be driven to form a product with a nick in the second strand, as illustrated in Figure IF. Following endogenous DNA repair and/or replication processes, the mutagenic region becomes integrated into both strands of DNA at the DNA locus.

図23は、トリヌクレオチド反復(repeat)配列を縮小するためのgRNAデザインおよびTPRTゲノム編集(すなわち、プライム編集)でのトリヌクレオチド反復の縮小の概略図である。トリヌクレオチド反復拡大は、ハンチントン病、脆弱X症候群、およびフリートライヒ運動失調症を包含する、数多のヒト疾患に関連する。最も一般的なトリヌクレオチド反復はCAGトリプレットを含有するが、GAAトリプレット(フリートライヒ運動失調症)およびCGGトリプレット(脆弱X症候群)もまた生じる。拡大する素因を遺伝するか、または既に拡大された親のアレルを獲得すること(acquiring)は、疾患に罹る(acquiring)可能性を増大させる。トリヌクレオチド反復の病原性の拡大は仮説上、プライム編集を使用して修正され得る。反復領域上流の領域は、RNAにガイドされる(-guided)ヌクレアーゼによってニックが入れられ、次いで、健常な数の反復(これは具体的な遺伝子および疾患に依存する)を含有する新しいDNA鎖の合成をプライムするのに使用され得る。反復配列の後に、反復の他端に隣接する配列の同一性にマッチする、一続きの短い相同(short stretch of homology)が加えられる(赤色鎖)。新しく合成された鎖の侵入、これに続く内生DNAの、新しく合成されたフラップとの置き換えが、縮小された反復アレルへ繋がる。Figure 23 is a schematic diagram of gRNA design to reduce trinucleotide repeat sequences and trinucleotide repeat reduction with TPRT genome editing (ie, prime editing). Trinucleotide repeat expansions are associated with numerous human diseases, including Huntington's disease, Fragile X syndrome, and Friedreich's ataxia. The most common trinucleotide repeat contains the CAG triplet, but the GAA triplet (Friedreich's ataxia) and CGG triplet (Fragile X syndrome) also occur. Inheriting a predisposition to expansion or acquiring an already expanded parental allele increases the likelihood of acquiring the disease. Pathogenic expansion of trinucleotide repeats could hypothetically be corrected using prime editing. The region upstream of the repeat region is nicked by an RNA-guided nuclease, and then a new DNA strand containing a healthy number of repeats (this depends on the specific gene and disease) is generated. Can be used to prime synthesis. After the repeat sequence, a short stretch of homology is added (red strand) that matches the identity of the sequence adjacent to the other end of the repeat. Invasion of the newly synthesized strand, followed by replacement of the endogenous DNA with the newly synthesized flap, leads to a reduced repeat allele.

図24は、プライム編集での正確な10ヌクレオチド欠失を示す概略図である。HEK3遺伝子座が標的にするガイドRNAを、ニック部位の後に10ヌクレオチド欠失をコードする逆転写鋳型でデザインした。トランスフェクトされたHEK細胞における編集効率を、アンプリコン配列決定を使用して査定した。Figure 24 is a schematic diagram showing a precise 10 nucleotide deletion in prime editing. A guide RNA targeted by the HEK3 locus was designed with a reverse transcription template encoding a 10 nucleotide deletion after the nick site. Editing efficiency in transfected HEK cells was assessed using amplicon sequencing.

図25は、内生ゲノム遺伝子座にて遺伝子をペプチドタグ付けする(peptide tagging)ためのgRNAデザインおよびTPRTゲノム編集(すなわち、プライム編集)でのペプチドタグ付けを示す概略図である。FlAsHおよびReAsHのタグ付け系は、2つの部分:(1)フルオロフォア-二ヒ素(biarsenical)プローブ、および(2)テトラシステインモチーフを含有する、遺伝子学的にコードされたペプチドを含み、配列FLNCCPGCCMEP(配列番号1)によって例示される。細胞内で発現されたとき、テトラシステインモチーフ含有タンパク質は、フルオロフォア-ヒ素プローブで蛍光標識され得る(参考文献:J.Am.Chem.Soc.,2002,124(21),pp6063-6076を参照。DOI:10.1021/ja017687n)。「ソルタグ付け(sortagging)」系は、標識ペプチドプローブを、好適なペプチド基質を含有するタンパク質へ共有結合的に抱合させる細菌ソルターゼ酵素を採用する(参考文献:Nat.Chem.Biol.2007 Nov;3(11):707-8を参照。DOI:10.1038/nchembio.2007.31)。FLAGタグ(DYKDDDDK(配列番号2))、V5タグ(GKPIPNPLLGLDST(配列番号3))、GCN4タグ(EELLSKNYHLENEVARLKK(配列番号4))、HAタグ(YPYDVPDYA(配列番号5))、およびMycタグ(EQKLISEEDL(配列番号6))は一般的に、免疫アッセイのためのエピトープタグとして採用される。パイクランプ(pi-clamp)は、ペンタフルオロ-芳香族基質で標識され得るペプチド配列(FCPF(配列番号622))をコードする(参考文献:Nat.Chem.2016 Feb;8(2):120-8。doi:10.1038/nchem.2413)。FIG. 25 is a schematic diagram showing gRNA design for peptide tagging genes at endogenous genomic loci and peptide tagging with TPRT genome editing (ie, prime editing). The FlAsH and ReAsH tagging systems contain two parts: (1) a fluorophore-biarsenical probe, and (2) a genetically encoded peptide containing a tetracysteine motif, with the sequence FLNCCPGCCMEP. (SEQ ID NO: 1). When expressed intracellularly, tetracysteine motif-containing proteins can be fluorescently labeled with fluorophore-arsenic probes (see reference: J.Am.Chem.Soc., 2002, 124(21), pp6063-6076) .DOI:10.1021/ja017687n). The "sortagging" system employs a bacterial sortase enzyme to covalently conjugate a labeled peptide probe to a protein containing a suitable peptide substrate (Reference: Nat.Chem.Biol.2007 Nov;3 (11):707-8. DOI:10.1038/nchembio.2007.31). FLAG tag (DYKDDDDK (SEQ ID NO: 2)), V5 tag (GKPIPNPLLGLDST (SEQ ID NO: 3)), GCN4 tag (EELLSKNYHLENEVARLKK (SEQ ID NO: 4)), HA tag (YPYDVPDYA (SEQ ID NO: 5)), and Myc tag (EQKLISEEDL( SEQ ID NO: 6)) is commonly employed as an epitope tag for immunoassays. Pi-clamp encodes a peptide sequence (FCPF (SEQ ID NO: 622) ) that can be labeled with pentafluoro-aromatic substrates (Reference: Nat.Chem.2016 Feb;8(2):120- 8. doi:10.1038/nchem.2413).

図26Aは、ゲノムDNA中へのHis6タグおよびFLAGタグの正確な組み入れを示す。HEK3遺伝子座を標的にするガイドRNAを、18nt Hisタグ挿入または24nt FLAGタグ挿入のいずれかをコードする逆転写鋳型でデザインした。トランスフェクトされたHEK細胞における編集効率を、アンプリコン配列決定を使用して査定した。FLAGタグの全長24nt配列はフレームから見切れている点に留意する(配列決定によって全長の正確な挿入が確認された)。Figure 26A shows the correct incorporation of His 6 and FLAG tags into genomic DNA. Guide RNAs targeting the HEK3 locus were designed with reverse transcription templates encoding either 18nt His tag insertions or 24nt FLAG tag insertions. Editing efficiency in transfected HEK cells was assessed using amplicon sequencing. Note that the full length 24 nt sequence of the FLAG tag is cut out of frame (sequencing confirmed correct insertion of the full length). 図26Bは、(a)タンパク質を可溶化または不溶化させること、(b)タンパク質の細胞内局在化を変化させるかまたはこれを追跡すること、(c)タンパク質の半減期を延長すること、(d)タンパク質精製を容易にさせること、および(e)タンパク質の検出を容易にさせることを包含する、タンパク質/ペプチドのタグ付けを伴う様々な用途をまとめる概略図を示す。Figure 26B shows that (a) solubilizing or insolubilizing a protein; (b) altering or tracking the subcellular localization of a protein; (c) extending the half-life of a protein; Figure 2 shows a schematic summarizing various applications involving protein/peptide tagging, including d) facilitating protein purification; and (e) facilitating protein detection.

図27は、プリオン病を防止またはその進行を停止させる防護性変異をPRNPに組み入れることによるプライム編集の概観を示す。PEgRNA配列は左において配列番号4082(すなわち、sgRNA骨格の5')、右において配列番号4083(すなわち、sgRNA骨格の3')に対応する。Figure 27 provides an overview of prime editing by incorporating protective mutations into PRNP that prevent prion disease or halt its progression. The PEgRNA sequences correspond to SEQ ID NO: 4082 (ie, 5' of the sgRNA backbone) on the left and SEQ ID NO: 4083 (ie, 3' of the sgRNA backbone) on the right.

図28Aは、RNAモチーフをコードする配列のPEに基づく挿入の模式図である。Figure 28A is a schematic diagram of PE-based insertion of sequences encoding RNA motifs. 図28Bは、潜在的に挿入され得るいくつかの例のモチーフの列挙(網羅的ではない)、およびそれらの機能である。FIG. 28B is a non-exhaustive list of some example motifs that could potentially be inserted, and their functions.

図29Aはプライム編集因子の図示である。図29BはPEによって導かれるゲノム、プラスミド、またはウイルスDNAへの可能な改変を示す。図29Cは、PEgRNAのライブラリによる規定されたタンパク質(このケースではGFP)上へのペプチドループのライブラリの挿入のための例のスキームを示す。図29Dは、異なるPEgRNAを用いるタンパク質のコドンの可能なプログラム可能な欠失またはNもしくはC末端短縮の例を示す。欠失はフレームシフト変異の最小限の生成でもって生起することが予測されるであろう。Figure 29A is a diagram of prime editing factors. Figure 29B shows possible modifications to genomic, plasmid, or viral DNA induced by PE. Figure 29C shows an example scheme for insertion of a library of peptide loops onto a defined protein (in this case GFP) with a library of PEgRNAs. Figure 29D shows an example of possible programmable deletion or N- or C-terminal truncation of protein codons using different PEgRNAs. Deletions would be expected to occur with minimal generation of frameshift mutations.

図30は、PACEなどの連続的進化系におけるコドンの反復的挿入のための可能なスキームを示す。FIG. 30 shows a possible scheme for the recursive insertion of codons in a continuous evolution system such as PACE.

図31は操作されたgRNAの説明である。gRNAコア、標的遺伝子の配列にマッチする~20ntスペーサー、免疫原性のエピトープヌクレオチド配列を有する逆転写鋳型、および標的遺伝子の配列にマッチするプライマー結合部位を示す。Figure 31 is an illustration of engineered gRNA. Shown is a gRNA core, a ~20nt spacer that matches the sequence of the target gene, a reverse transcription template with an immunogenic epitope nucleotide sequence, and a primer binding site that matches the sequence of the target gene.

図32は、公知の免疫原性エピトープを内生または外生のゲノムDNA上に挿入するための手段としてプライム編集を用いることの模式図であり、対応するタンパク質の改変をもたらす。FIG. 32 is a schematic diagram of using prime editing as a means to insert known immunogenic epitopes onto endogenous or exogenous genomic DNA, resulting in the modification of the corresponding protein.

図33は、プライマー結合配列挿入のためのPEgRNAデザインと、オフターゲット編集を決定するためのプライム編集を用いるゲノムDNA上へのプライマー結合挿入とを示す模式図である。この態様では、プライム編集が生細胞、組織、または動物モデル内において行われる。第1のステップとして、適当なPEgRNAがデザインされる。上側の模式図は、この側面に用いられ得る例示のPEgRNAを示す。PEgRNA上のスペーサー(「プロトスペーサー」と標識されている)はゲノム標的の鎖の1つに対して相補的である。PE:PEgRNA複合体(すなわちPE複合体)は一本鎖3'端フラップをニック部位に組み入れし、これは、コードされるプライマー結合配列と、カットされた部位のちょうど下流の領域に対して相補的である相同領域(PEgRNAの相同アームによってコードされる)とを含有する(赤色による)。フラップ侵入およびDNA修復/複製プロセスによって、合成された鎖はDNA上に組み込まれるようになり、それによってプライマー結合部位を組み入れる。このプロセスは、所望のゲノム標的においてのみならず、オフターゲットの様式でPEgRNAと相互作用し得る他のゲノム部位においてもまた生起し得る(すなわち、意図されるゲノム部位ではない他のゲノム部位に対するスペーサー領域の相補性を原因として、PEgRNAはPE複合体を他のオフターゲット部位へとガイドする)。それゆえに、プライマー結合配列は、所望のゲノム標的においてのみならず、ゲノム上の他所のオフターゲットゲノム部位において組み入れられ得る。意図されるゲノム標的部位およびオフターゲットゲノム部位両方のこれらのプライマー結合部位の挿入を検出するためには、ゲノムDNA(PE後)が単離、フラグメント化、およびアダプターヌクレオチドにライゲーションされ得る(赤色で示されている)。次に、アダプターおよび挿入されたプライマー結合配列にアニールするPCRオリゴヌクレオチドによって、PCRが実行されて、プライマー結合部位がPEによって挿入されたオンターゲットおよびオフターゲットゲノムDNA領域を増幅し得る。それから、高スループット配列決定および配列アラインメントが行われて、オンターゲット部位またはオフターゲット部位どちらかにおけるPEによって挿入されたプライマー結合配列の挿入点を同定し得る。Figure 33 is a schematic diagram showing PEgRNA design for primer binding sequence insertion and primer binding insertion onto genomic DNA using prime editing to determine off-target editing. In this embodiment, prime editing is performed in living cells, tissues, or animal models. As a first step, a suitable PEgRNA is designed. The top schematic shows exemplary PEgRNAs that can be used in this aspect. A spacer on PEgRNA (labeled "protospacer") is complementary to one of the strands of the genomic target. The PE:PEgRNA complex (i.e., the PE complex) incorporates a single-stranded 3' end flap at the nick site, which is complementary to the encoded primer binding sequence and the region just downstream of the cut site. (in red color) and a homologous region (encoded by the homologous arms of PEgRNA). Through flap invasion and DNA repair/replication processes, the synthesized strand becomes incorporated onto the DNA, thereby incorporating a primer binding site. This process can occur not only at the desired genomic target, but also at other genomic sites that may interact with PEgRNA in an off-target manner (i.e., spacers for other genomic sites that are not the intended genomic site). Due to region complementarity, PEgRNA guides the PE complex to other off-target sites). Therefore, primer binding sequences can be incorporated not only at the desired genomic target, but also at off-target genomic sites elsewhere on the genome. To detect the insertion of these primer binding sites at both intended and off-target genomic sites, genomic DNA (after PE) can be isolated, fragmented, and ligated to adapter nucleotides (indicated in red). It is shown). PCR can then be performed with PCR oligonucleotides that anneal to the adapter and the inserted primer binding sequences to amplify on-target and off-target genomic DNA regions where primer binding sites were inserted by PE. High-throughput sequencing and sequence alignment can then be performed to identify the insertion point of the primer binding sequence inserted by PE at either on-target or off-target sites.

図34は、PEによる遺伝子の精密な挿入を示す模式図である。FIG. 34 is a schematic diagram showing precise insertion of a gene by PE.

図35Aは、天然のインスリンシグナル経路を示す模式図である。図35Bは、FK1012によってコントロールされるFKBP12タグ付けされたインスリン受容体活性化を示す模式図である。Figure 35A is a schematic diagram showing the natural insulin signaling pathway. FIG. 35B is a schematic diagram showing FKBP12-tagged insulin receptor activation controlled by FK1012.

図36は、低分子モノマーを示す。参照:バンプFK506ミミック(2)107Figure 36 shows low molecular weight monomers. Reference: Bump FK506 Mimic (2) 107 .

図37A~37Bは、低分子二量体を示す。参照:FK1012 495,96;FK1012 5108;FK1012 6107;AP1903 7107;シクロスポリンA二量体898;FK506-シクロスポリンA二量体(FkCsA)9100Figures 37A -37B show small molecule dimers. References: FK1012 4 95,96 ; FK1012 5 108 ; FK1012 6 107 ; AP1903 7 107 ; Cyclosporin A dimer 8 98 ; FK506-Cyclosporin A dimer (FkCsA) 9 100 .

図38A~38Fは、プライム編集、ならびにin vitroおよび酵母細胞における実現可能性研究の概観を提供する。図38Aは、ClinVar(2019年7月アクセス)の75,122の公知の病原性のヒト遺伝子バリアントを示し、型によって分類されている。図38Bは、プライム編集複合体が、操作された逆転写酵素ドメインに融合されたRNAによってガイドされるDNAニッキングドメイン、例えばCas9ニッカーゼを含有するかつプライム編集ガイドRNA(PEgRNA)と複合体化したプライム編集因子(PE)タンパク質からなるということを示す。PE:PEgRNA複合体は標的DNA部位に結合し、標的部位のプロトスペーサー隣接モチーフ(PAM)の前および後の広い範囲のDNA位置における大きい種々の精密なDNA編集を可能化する。図38Cは、DNA標的結合によって、PE:PEgRNA複合体がPAM含有DNA鎖へニックを入れるということを示す。もたらされる遊離の3'端はPEgRNAのプライマー結合部位にハイブリダイズする。逆転写酵素ドメインはPEgRNAのRT鋳型を用いるプライマー伸長を触媒し、所望の編集を含有する新たに合成されたDNA鎖(3'フラップ)をもたらす。編集された3'フラップと元々のDNAを含有する編集されない5'フラップとの間の平衡化、次に細胞性の5'フラップ切断およびライゲーション、ならびにヘテロ二重鎖DNAを分解するためのDNA修復または複製が、安定に編集されたDNAをもたらす。図38Dは、5'Cy5標識されたPAM鎖を含有する予めニックが入ったdsDNA基質、dCas9、および市販のM-MLV RTバリアント(RT、Superscript III)による、in vitroの5'伸長されたPEgRNAプライマー伸長アッセイを示す。dCas9が様々な長さのRT鋳型を含有するPEgRNAと複合体化させられ、それから、指示されている構成要素と併せてDNA基質に追加された。反応は37℃で1時間に渡ってインキュベートされ、それから変性尿素PAGEによって分析され、Cy5蛍光について視覚化された。図38Eは、dCas9またはCas9 H840Aニッカーゼと予め複合体化した3'伸長されたPEgRNAおよび予めニックが入ったまたはニッキングされていない5'Cy5標識dsDNA基質を用いて、図38Dのとおり行われたプライマー伸長を示す。図38Fは、PEgRNA、Cas9ニッカーゼ、およびRTによってin vitroで編集されたGFP-mCherry融合レポータープラスミドによって形質転換された酵母コロニーを示す。GFPおよびmCherryの間にナンセンスまたはフレームシフト変異を含有するプラスミドが、トランスバージョン変異、1bp挿入、または1bp欠失によってmCherry翻訳を復元する5'伸長または3'伸長されたPEgRNAによって編集された。GFPおよびmCherry二重陽性の細胞は(黄色)首尾良い編集を反映する。Figures 38A-38F provide an overview of prime editing and feasibility studies in vitro and in yeast cells. Figure 38A shows the 75,122 known pathogenic human gene variants in ClinVar (accessed July 2019), categorized by type. Figure 38B shows that the prime editing complex is guided by an RNA fused to an engineered reverse transcriptase domain, such as a prime containing a DNA nicking domain, such as a Cas9 nickase and complexed with a prime editing guide RNA (PEgRNA). This indicates that it consists of the editing factor (PE) protein. PE:PEgRNA complexes bind to target DNA sites and enable a large variety of precise DNA editing at a wide range of DNA positions before and after the protospacer adjacent motif (PAM) of the target site. Figure 38C shows that upon DNA target binding, the PE:PEgRNA complex nicks the PAM-containing DNA strand. The resulting free 3' end hybridizes to the primer binding site of PEgRNA. The reverse transcriptase domain catalyzes primer extension using the PEgRNA RT template, resulting in a newly synthesized DNA strand (3' flap) containing the desired edit. Equilibration between the edited 3' flap and the unedited 5' flap containing the original DNA, followed by cellular 5' flap cleavage and ligation, and DNA repair to degrade the heteroduplex DNA. or replication results in stably edited DNA. Figure 38D shows in vitro 5' extended PEgRNA with a pre-nicked dsDNA substrate containing a 5'Cy5 labeled PAM strand, dCas9, and a commercially available M-MLV RT variant (RT, Superscript III). Primer extension assay is shown. dCas9 was complexed with PEgRNA containing RT templates of various lengths and then added to the DNA substrate along with the indicated components. Reactions were incubated for 1 hour at 37°C and then analyzed by denaturing urea PAGE and visualized for Cy5 fluorescence. Figure 38E shows primers performed as in Figure 38D using 3'-extended PEgRNA pre-complexed with dCas9 or Cas9 H840A nickase and 5'Cy5-labeled dsDNA substrate, pre-nicked or unnicked. Shows elongation. Figure 38F shows a yeast colony transformed with a GFP-mCherry fusion reporter plasmid edited in vitro with PEgRNA, Cas9 nickase, and RT. Plasmids containing nonsense or frameshift mutations between GFP and mCherry were edited with 5'- or 3'-extended PEgRNAs that restored mCherry translation by transversion mutations, 1bp insertions, or 1bp deletions. GFP and mCherry double positive cells (yellow) reflect successful editing.

図39A~39DはPE1およびPE2によるヒト細胞のゲノムDNAのプライム編集を示す。図39Aは、PEgRNAが、スペーサー配列、sgRNA骨格、ならびにプライマー結合部位(緑色)および編集される塩基(単数または複数)(赤色)を含有する逆転写(RT)鋳型(紫色)を含有する3'伸長を含有するということを示す。プライマー結合部位はニッキングの部位の直ちに上流のPAM含有DNA鎖にハイブリダイズする。コードされる編集を例外として、RT鋳型はニックの下流のDNA配列に対して相同的である。図39Bは、野生型M-MLV逆転写酵素に融合されたCas9 H840Aニッカーゼ(PE1)と様々なプライマー結合部位長さのPEgRNAとを用いるHEK293T細胞のHEK3部位におけるT・AからA・Tのトランスバージョン編集の組み入れを示す。図39Cは、PE2への操作された五重変異体M-MLV逆転写酵素(D200N,L603W,T306K,W313F,T330P)の使用が、HEK293T細胞の5つのゲノム部位におけるプライム編集トランスバージョン効率とHEK3における小さい挿入および小さい欠失編集とを実質的に改善するということを示す。図39Dは、HEK293T細胞の5つのゲノム部位における様々なRT鋳型長さによるPE2編集効率の比較である。値およびエラーバーは3つの独立した生物学的レプリケートの平均およびs.d.を反映する。Figures 39A-39D show prime editing of genomic DNA of human cells by PE1 and PE2. Figure 39A shows the 3' PEgRNA contains a spacer sequence, an sgRNA backbone, and a reverse transcription (RT) template (purple) containing a primer binding site (green) and the base(s) to be edited (red). Indicates that it contains elongation. The primer binding site hybridizes to the PAM-containing DNA strand immediately upstream of the site of nicking. With the exception of encoded edits, the RT template is homologous to the DNA sequence downstream of the nick. Figure 39B shows T.A. to A.T. Indicates the inclusion of version editing. Figure 39C shows that the use of an engineered quintuple mutant M-MLV reverse transcriptase (D200N,L603W,T306K,W313F,T330P) to PE2 significantly increases prime editing transversion efficiency at five genomic sites in HEK293T cells. small insertions and small deletion edits. Figure 39D is a comparison of PE2 editing efficiency with various RT template lengths at five genomic sites in HEK293T cells. Values and error bars reflect the mean and s.d. of three independent biological replicates.

図40A~40Cは、PE3およびPE3bシステムが非編集鎖へニックを入れてプライム編集効率を増大させるということを示す。図40AはPE3によるプライム編集の概観である。編集された鎖の当初の合成後に、DNA修復が、編集を含有する新たに合成された鎖(3'フラップ切除)または元々のゲノムDNA鎖(5'フラップ切除)どちらかを除去するであろう。5'フラップ切除は、1つの編集された鎖および1つの非編集鎖を含有するDNAヘテロ二重鎖を後に残す。ミスマッチ修復機構またはDNA複製がヘテロ二重鎖を分解して、編集されたまたは非編集の産物どちらかを与え得る。非編集鎖へニックを入れることは、その鎖の修復を好み、所望の編集を含有する安定な二重鎖DNAの選好的生成をもたらす。図40Bは、PE3によって媒介されるプライム編集効率およびインデル形成に対する相補鎖ニッキングの効果を示す。「なし」は相補鎖にニッキングしないPE2対照を言う。図40Cは、PE2(相補鎖ニックなし)、PE3(一般的な相補鎖ニック)、およびPE3b(編集特異的な相補鎖ニック)による編集効率の比較である。全ての編集収量は、ソーティングなしの全ての処置された細胞のうち、意図される編集を含有するかつインデルを含有しない配列決定総読取のパーセンテージを反映する。値およびエラーバーは3つの独立した生物学的レプリケートの平均およびs.d.を反映する。Figures 40A-40C show that the PE3 and PE3b systems nick the non-edited strand to increase prime editing efficiency. Figure 40A is an overview of prime editing with PE3. After initial synthesis of the edited strand, DNA repair will remove either the newly synthesized strand containing the edit (3' flap excision) or the original genomic DNA strand (5' flap excision). . 5' flap excision leaves behind a DNA heteroduplex containing one edited and one unedited strand. Mismatch repair mechanisms or DNA replication can degrade the heteroduplex to give either edited or unedited products. Nicking the non-edited strand favors repair of that strand, resulting in the preferential production of stable double-stranded DNA containing the desired edits. Figure 40B shows the effect of complementary strand nicking on prime editing efficiency and indel formation mediated by PE3. "None" refers to a PE2 control that does not nick the complementary strand. FIG. 40C is a comparison of editing efficiency with PE2 (no complementary strand nick), PE3 (general complementary strand nick), and PE3b (editing-specific complementary strand nick). All editing yields reflect the percentage of total sequencing reads containing the intended edit and no indels out of all treated cells without sorting. Values and error bars reflect the mean and s.d. of three independent biological replicates.

図41A~41Kは、HEK293T細胞の7つの内生ヒトゲノム座位におけるPE3による標的化された挿入、欠失、および全ての12の型の点変異を示す。図41Aは、10nt RT鋳型を用いるHEK3部位の位置+1から+8(PEgRNAによって誘導されるニックの位置付けを位置+1および-1の間としてカウントする)の全ての12の型の1ヌクレオチドトランジションおよびトランスバージョン編集を示すグラフである。図41Bは、34nt RT鋳型を用いるHEK3部位におけるロングレンジPE3トランスバージョン編集を示すグラフである。図41C-41Hは、プライム編集窓上の種々の位置における全ての12の型のトランジションおよびトランスバージョン編集を、(図41C)RNF2、(図41D)FANCF、(図41E)EMX1、(図41F)RUNX1、(図41G)VEGFA、および(図41H)DNMT1について示すグラフである。図41Iは、7つの内生ゲノム座位におけるPE3による標的化された1および3bp挿入ならびに1および3bp欠失を示すグラフである。図41Jは、HEK3標的部位における5から80bpの標的化された精密な欠失を示すグラフである。図41Kは、挿入および欠失、挿入および点変異、欠失および点変異、ならびに二重点変異の組み合わせ編集を、3つの内生ゲノム座位において示すグラフである。全ての編集収量は、ソーティングなしの全ての処置された細胞のうち、意図される編集を含有するかつインデルを含有しない配列決定総読取のパーセンテージを反映する。値およびエラーバーは3つの独立した生物学的レプリケートの平均およびs.d.を反映する。Figures 41A-41K show targeted insertions, deletions, and point mutations of all 12 types by PE3 at 7 endogenous human genomic loci in HEK293T cells. Figure 41A shows all 12 types of one-nucleotide transitions from position +1 to +8 (counting PEgRNA-induced nick positioning as between positions +1 and -1) of the HEK3 site using a 10nt RT template. and a graph showing transversion editing. Figure 41B is a graph showing long range PE3 transversion editing at the HEK3 site using a 34nt RT template. Figures 41C-41H show all 12 types of transition and transversion edits at various positions on the prime edit window: (Figure 41C) RNF2, (Figure 41D) FANCF, (Figure 41E) EMX1, (Figure 41F) FIG. 41 is a graph showing RUNX1, (FIG. 41G) VEGFA, and (FIG. 41H) DNMT1. FIG. 41I is a graph showing targeted 1 and 3 bp insertions and 1 and 3 bp deletions by PE3 at seven endogenous genomic loci. Figure 41J is a graph showing targeted precision deletions from 5 to 80 bp in the HEK3 target site. FIG. 41K is a graph showing combinatorial editing of insertions and deletions, insertions and point mutations, deletions and point mutations, and double point mutations at three endogenous genomic loci. All editing yields reflect the percentage of total sequencing reads containing the intended edit and no indels out of all treated cells without sorting. Values and error bars reflect the mean and s.d. of three independent biological replicates.

図42A~42Hは、公知のCas9オフターゲット部位におけるCas9ならびにPE3によるプライム編集および塩基編集ならびにオフターゲット編集の比較を示す。図42Aは、HEK293T細胞の内生HEK3、FANCF、およびEMX1部位において、PE2、PE3、BE2max、およびBE4maxについて、同じ標的ヌクレオチドにおけるトータルのC・GからT・Aの編集効率を示す。図42Bは図42Aの処置からのインデル度数を示す。図42Cは、精密なC・GからT・Aの編集(バイスタンダー編集またはインデルなし)の編集効率をPE2、PE3、BE2max、およびBE4maxについてHEK3、FANCF、およびEMX1において示す。EMX1では、3つの標的ヌクレオチドにおけるC・GからT・Aの変換の全ての可能な組み合わせの精密なPE組み合わせ編集もまた示されている。図42Dは、トータルのA・TからG・C編集効率をPE2、PE3、ABEdmax、およびABEmaxについてHEK3およびFANCFにおいて示す。図42Eは、バイスタンダー編集またはインデルなしの精密なA・TからG・C編集効率をHEK3およびFANCFについて示す。図42Fは図42Dの処置からのインデル度数を示す。図42Gは、HEK293T細胞における平均トリプリケート編集効率(インデルを有するパーセンテージ配列決定読取)を、Cas9ヌクレアーゼについて、4つのオンターゲットおよび16の公知のオフターゲット部位において示す。検分された16のオフターゲット部位は、4つのオンターゲット部位の夫々について上位4つの先に報告されたオフターゲット部位118,159であった。各オンターゲット部位について、Cas9はsgRNAとまたは同じプロトスペーサーを認識する4つのPEgRNAの夫々とペアリングされた。図42Hは、平均トリプリケートオンターゲットおよびオフターゲット編集効率ならびにインデル効率(下の括弧内)を、HEK293T細胞において、(図42G)の各PEgRNAとペアリングされたPE2またはPE3について示す。オンターゲット編集収量は、ソーティングなしの全ての処置された細胞のうち、意図される編集を含有するかつインデルを含有しない配列決定総読取のパーセンテージを反映する。オフターゲット編集収量はプライム編集と整合するオフターゲット座位改変を反映する。値およびエラーバーは3つの独立した生物学的レプリケートの平均およびs.d.を反映する。Figures 42A-42H show a comparison of prime editing and base editing and off-target editing by Cas9 and PE3 at known Cas9 off-target sites. Figure 42A shows the total C·G to T·A editing efficiency at the same target nucleotide for PE2, PE3, BE2max, and BE4max at endogenous HEK3, FANCF, and EMX1 sites in HEK293T cells. Figure 42B shows the indel frequencies from the treatment of Figure 42A. Figure 42C shows the editing efficiency of precise C.G to T.A. edits (no bystander edits or indels) in HEK3, FANCF, and EMX1 for PE2, PE3, BE2max, and BE4max. In EMX1, precise PE combinatorial editing of all possible combinations of C·G to T·A conversions at the three target nucleotides is also demonstrated. Figure 42D shows the total A·T to G·C editing efficiency for PE2, PE3, ABEdmax, and ABEmax in HEK3 and FANCF. Figure 42E shows precise A·T to G·C editing efficiency for HEK3 and FANCF without bystander editing or indels. Figure 42F shows the indel frequencies from the treatment of Figure 42D. Figure 42G shows average triplicate editing efficiency (percentage sequencing reads with indels) in HEK293T cells at 4 on-target and 16 known off-target sites for Cas9 nuclease. The 16 off-target sites examined were the top four previously reported off-target sites 118,159 for each of the four on-target sites. For each on-target site, Cas9 was paired with an sgRNA or with each of the four PEgRNAs that recognize the same protospacer. Figure 42H shows the average triplicate on-target and off-target editing efficiencies and indel efficiencies (in brackets below) for PE2 or PE3 paired with each PEgRNA in (Figure 42G) in HEK293T cells. On-target editing yield reflects the percentage of total sequencing reads containing the intended edit and no indels out of all treated cells without sorting. Off-target editing yield reflects off-target locus modifications consistent with prime editing. Values and error bars reflect the mean and SD of three independent biological replicates.

図43A~43Iは、種々のヒト細胞株および初代マウス皮質ニューロンにおけるプライム編集、病原性のトランスバージョン、挿入、または欠失変異の組み入れおよび修正、ならびにプライム編集およびHDRの比較を示す。図43Aは、HEK293T細胞のHBBにおける病原性のE6V変異の組み入れ(T・AからA・Tのトランスバージョンによる)および修正(A・TからT・Aのトランスバージョンによる)を示すグラフである。野生型HBBへのまたはPEgRNA PAMを遮断するサイレントな変異を含有するHBBどちらかへの修正が示されている。図43Bは、HEK293T細胞における病原性のHEXA 1278+TATCアレルの組み入れ(4bp挿入による)および修正(4bp欠失による)を示すグラフである。野生型HEXAまたはPEgRNA PAMを遮断するサイレントな変異を含有するHEXAどちらかへの修正が示されている。図43Cは、G・CからT・AのトランスバージョンによるHEK293T細胞におけるPRNPの防護性のG127Vバリアントの組み入れを示すグラフである。図43Dは、K562(白血病骨髄細胞)、U2OS(骨肉腫細胞)、およびHeLa(子宮頸がん細胞)を包含する他のヒト細胞株におけるプライム編集を示すグラフである。図43Eは、マウス初代皮質ニューロンのDNMT1におけるG・CからT・Aのトランスバージョン変異の組み入れを示すグラフであり、二元的な分裂インテインPE3レンチウイルスシステムを用いている。これにおいては、N末端の半分は、NインテインにかつP2A自己切断ペプチドを介してGFP-KASHに融合されたCas9(1-573)であり、C末端の半分は、PE2の残りに融合されたCインテインである。PE2の半分同士は、成熟ニューロンに高度に特異的であるヒトシナプシンプロモーターから発現される。ソーティングされた値はGFP陽性の核からの編集またはインデルを反映し、未ソーティングの値は全ての核からである。図43Fは、HEK293T細胞の内生ゲノム座位におけるPE3およびCas9によって媒介されるHDR編集効率の比較である。図43Gは、K562、U2OS、およびHeLa細胞の内生ゲノム座位におけるPE3およびCas9によって媒介されるHDR編集効率の比較である。図43Hは、HEK293T、K562、U2OS、およびHeLa細胞におけるPE3およびCas9によって媒介されるHDRインデル副産物生成の比較である。図43Iは、PE3によるHEK293T細胞におけるHis6タグ(18bp)、FLAGエピトープタグ(24bp)、または伸長されたLoxP部位(44bp)の標的化された挿入を示す。全ての編集収量は、全ての処置された細胞のうち、意図される編集を含有するかつインデルを含有しない配列決定総読取のパーセンテージを反映する。値およびエラーバーは3つの独立した生物学的レプリケートの平均およびs.d.を反映する。Figures 43A-43I show a comparison of prime editing, incorporation and correction of pathogenic transversion, insertion, or deletion mutations, and prime editing and HDR in various human cell lines and primary mouse cortical neurons. Figure 43A is a graph showing the incorporation (by T.A to A.T transversion) and correction (by A.T to T.A transversion) of pathogenic E6V mutations in the HBB of HEK293T cells. Modifications to either wild-type HBB or to HBB containing silent mutations that block PEgRNA PAM are shown. Figure 43B is a graph showing the integration (by 4bp insertion) and correction (by 4bp deletion) of the pathogenic HEXA 1278+TATC allele in HEK293T cells. Modifications to either wild-type HEXA or HEXA containing a silent mutation that blocks PEgRNA PAM are shown. Figure 43C is a graph showing incorporation of the protective G127V variant of PRNP in HEK293T cells by G.C to T.A transversion. Figure 43D is a graph showing prime editing in other human cell lines including K562 (leukemia bone marrow cells), U2OS (osteosarcoma cells), and HeLa (cervical cancer cells). FIG. 43E is a graph showing the incorporation of a G.C to T.A transversion mutation in DNMT1 of mouse primary cortical neurons using a dual split intein PE3 lentiviral system. In this, the N-terminal half was Cas9(1-573) fused to the N-intein and to GFP-KASH via the P2A self-cleaving peptide, and the C-terminal half was fused to the rest of PE2. It is C intein. The two halves of PE2 are expressed from the human synapsin promoter, which is highly specific for mature neurons. Sorted values reflect edits or indels from GFP-positive nuclei, unsorted values are from all nuclei. Figure 43F is a comparison of HDR editing efficiency mediated by PE3 and Cas9 at endogenous genomic loci in HEK293T cells. Figure 43G is a comparison of HDR editing efficiency mediated by PE3 and Cas9 at endogenous genomic loci in K562, U2OS, and HeLa cells. Figure 43H is a comparison of HDR indel byproduct production mediated by PE3 and Cas9 in HEK293T, K562, U2OS, and HeLa cells. Figure 43I shows targeted insertion of His6 tag (18 bp), FLAG epitope tag (24 bp), or extended LoxP site (44 bp) in HEK293T cells by PE3. All editing yields reflect the percentage of total sequencing reads that contain the intended edit and do not contain indels out of all treated cells. Values and error bars reflect the mean and s.d. of three independent biological replicates.

図44A~44Gは、蛍光標識されたDNA基質によるin vitroのプライム編集検証研究を示す。図44Aは、dCas9、5'伸長されたPEgRNA、および5'-Cy5標識DNA基質による電気泳動移動度シフトアッセイを示す。PEgRNA 1から5は、スペーサーおよびPBSの間の15ntリンカー配列(PEgRNA 1ではリンカーA、PEgRNA 2から5ではリンカーB)、5nt PBS配列、ならびに7nt(PEgRNA 1および2)、8nt(PEgRNA 3)、15nt(PEgRNA 4)、および22nt(PEgRNA 5)のRT鋳型を含有する。PEgRNAは、図44Eおよび44Fに用いられるものである;完全な配列は表2A~2Cに列記される。図44Bは、5'伸長されたおよび3'伸長されたPEgRNAを用いるCas9 H840Aのin vitroニッキングアッセイを示す。図44Cは、5'伸長されたおよび3'伸長されたPEgRNAを用いるHEK3におけるHEK293T細胞のCas9によって媒介されるインデル形成を示す。図44Dはプライム編集in vitro生化学アッセイの概観を示す。5'-Cy5標識された予めニックが入ったおよびニッキングされていないdsDNA基質が試験された。sgRNA、5'伸長されたPEgRNA、または3'伸長されたPEgRNAがdCas9またはCas9 H840Aニッカーゼと予め複合体化され、それから、dsDNA基質、M-MLV RT、およびdNTPと組み合わせられた。変性尿素PAGEによる分離およびCy5蛍光による視覚化に先行して、反応が37℃で1時間に渡って進むことを許された。図44Eは、5'伸長されたPEgRNA、予めニックが入ったDNA基質、およびdCas9を用いるプライマー伸長反応が、RT産物への有意な変換に至るということを示す。図44Fは、ニッキングされていないDNA基質およびCas9 H840Aニッカーゼと図44Bのとおり5'伸長されたPEgRNAを用いるプライマー伸長反応を示す。産物収量は予めニックが入った基質と比較して多大に縮減される。図44Gは、3'-PEgRNAを用いるin vitroプライマー伸長反応が単一の明らかな産物を生成するということを変性尿素PAGEによって示す。RT産物バンドが切り出され、ゲルから溶出され、それから、dGTPまたはdATPどちらかを用いるターミナルトランスフェラーゼ(TdT)によるホモポリマーテーリングに付された。テーリングされた産物はポリTまたはポリCプライマーによって伸長され、もたらされたDNAが配列決定された。Sangerトレースは、gRNA骨格に由来する3ヌクレオチドが逆転写された(最後の3'ヌクレオチドとしてDNA産物に追加された)ということを指示する。哺乳類細胞プライム編集実験では、PEgRNA骨格挿入はin vitroよりもかなり稀であるということに注意せよ(図56A~56D)。可能性としては、テザリングされた逆転写酵素がCas9に結合したガイドRNA骨格にアクセスすることの不能、および/またはPEgRNA骨格配列を含有する3'フラップのミスマッチの3'端の細胞性の切除を原因とする。Figures 44A-44G show in vitro prime editing validation studies with fluorescently labeled DNA substrates. Figure 44A shows electrophoretic mobility shift assay with dCas9, 5' extended PEgRNA, and 5'-Cy5 labeled DNA substrate. PEgRNA 1 to 5 have a 15nt linker sequence between the spacer and PBS (linker A for PEgRNA 1, linker B for PEgRNA 2 to 5), a 5nt PBS sequence, and 7nt (PEgRNA 1 and 2), 8nt (PEgRNA 3), Contains 15nt (PEgRNA 4) and 22nt (PEgRNA 5) RT templates. PEgRNA is that used in Figures 44E and 44F; complete sequences are listed in Tables 2A-2C. Figure 44B shows in vitro nicking assay of Cas9 H840A using 5' extended and 3' extended PEgRNA. Figure 44C shows Cas9-mediated indel formation in HEK293T cells in HEK3 with 5' extended and 3' extended PEgRNAs. Figure 44D shows an overview of the prime editing in vitro biochemical assay. 5'-Cy5 labeled prenicked and unnicked dsDNA substrates were tested. sgRNA, 5'-extended PEgRNA, or 3'-extended PEgRNA was pre-complexed with dCas9 or Cas9 H840A nickase and then combined with dsDNA substrate, M-MLV RT, and dNTPs. Reactions were allowed to proceed for 1 hour at 37°C prior to separation by denaturing urea PAGE and visualization by Cy5 fluorescence. Figure 44E shows that primer extension reactions using 5'-extended PEgRNA, pre-nicked DNA substrates, and dCas9 lead to significant conversion to RT products. Figure 44F shows a primer extension reaction using unnicked DNA substrate and Cas9 H840A nickase and PEgRNA 5' extended as in Figure 44B. Product yield is greatly reduced compared to pre-nicked substrates. Figure 44G shows by denaturing urea PAGE that in vitro primer extension reactions using 3'-PEgRNA generate a single distinct product. The RT product band was excised, eluted from the gel, and then subjected to homopolymer tailing with terminal transferase (TdT) using either dGTP or dATP. The tailed products were extended with polyT or polyC primers and the resulting DNA was sequenced. The Sanger trace indicates that the 3 nucleotides from the gRNA backbone were reverse transcribed (added to the DNA product as the last 3' nucleotide). Note that in mammalian cell prime editing experiments, PEgRNA backbone insertions are much rarer than in vitro (Figures 56A-56D). Possible explanations include the inability of the tethered reverse transcriptase to access the Cas9-bound guide RNA scaffold and/or cellular excision of the mismatched 3' end of the 3' flap containing the PEgRNA scaffold sequence. Cause.

図45A~45Gはin vitroプライム編集反応からの3'DNAフラップの酵母における細胞性修復を示す。図45Aは、二元的蛍光タンパク質レポータープラスミドが、インフレームの停止コドン、+1フレームシフト、または-1フレームシフトをコードする標的部位によって分離されたGFPおよびmCherryオープンリーディングフレームを含有するということを示す。プライム編集反応がCas9 H840Aニッカーゼ、PEgRNA、dNTP、およびM-MLV逆転写酵素によってin vitroで実行され、それから酵母に形質転換された。編集されないプラスミドを含有するコロニーはGFPを生ずるが、mCherryを生じない。編集されたプラスミドを含有する酵母コロニーはGFPおよびmCherry両方を融合タンパク質として生ずる。図45Bは、停止コドンをGFPおよびmCherryの間に含有する(編集されない負の対照。上側)または停止コドンもしくはフレームシフトをGFPおよびmCherryの間に含有しない(予め編集された正の対照。下側)レポータープラスミドによって形質転換された酵母コロニーのGFPおよびmCherry蛍光の重ね合わせを示す。図45C-45Fは、in vitroプライム編集反応産物によって形質転換された酵母コロニーからのmCherryおよびGFP蛍光の視覚化を示す。図45Cは、図45Dに示されているとおり、3'伸長されたPEgRNAまたは5'伸長されたPEgRNAを用いるT・AからA・Tのトランスバージョンによる停止コドン修正を示す。図45Eは、3'伸長されたPEgRNAを用いる1bp欠失の+1フレームシフト修正を示す。図45Fは、3'伸長されたPEgRNAを用いる1bp挿入による-1フレームシフト修正を示す。図45Gは、図45BのGFPのみコロニーならびに図45CのGFPおよびmCherry二重陽性コロニーから単離されたプラスミドからのSanger DNA配列決定トレースを示す。Figures 45A-45G show cellular repair in yeast of 3' DNA flaps from in vitro prime editing reactions. Figure 45A shows that the dual fluorescent protein reporter plasmid contains GFP and mCherry open reading frames separated by a target site encoding an in-frame stop codon, +1 frameshift, or -1 frameshift. show. Prime editing reactions were performed in vitro with Cas9 H840A nickase, PEgRNA, dNTPs, and M-MLV reverse transcriptase and then transformed into yeast. Colonies containing the unedited plasmid produce GFP but not mCherry. Yeast colonies containing the edited plasmid will generate both GFP and mCherry as fusion proteins. Figure 45B contains a stop codon between GFP and mCherry (non-edited negative control, top) or no stop codon or frameshift between GFP and mCherry (pre-edited positive control, bottom) ) Shows an overlay of GFP and mCherry fluorescence of yeast colonies transformed by the reporter plasmid. Figures 45C-45F show visualization of mCherry and GFP fluorescence from yeast colonies transformed with in vitro prime editing reaction products. Figure 45C shows stop codon modification by T.A to A.T transversion using 3' extended PEgRNA or 5' extended PEgRNA as shown in Figure 45D. Figure 45E shows +1 frameshift correction of a 1 bp deletion using 3' extended PEgRNA. Figure 45F shows -1 frameshift correction with a 1 bp insertion using 3' extended PEgRNA. Figure 45G shows Sanger DNA sequencing traces from plasmids isolated from GFP-only colonies in Figure 45B and GFP and mCherry double positive colonies in Figure 45C.

図46A~46FはPE1による正しい編集対インデル生成を示す。図46AはHEK3の+1位置におけるPE1によるT・AからA・Tのトランスバージョン編集効率およびインデル生成を示し、10nt RT鋳型と8-17ntの範囲であるPBS配列とを含有するPEgRNAを用いる。図46Bは、EMX1の+5位置におけるPE1によるG・CからT・Aのトランスバージョン編集効率およびインデル生成を示し、13nt RT鋳型と9-17ntの範囲であるPBS配列とを含有するPEgRNAを用いる。図46Cは、FANCFの+5位置におけるPE1によるG・CからT・Aのトランスバージョン編集効率およびインデル生成を示し、17nt RT鋳型と8-17ntの範囲であるPBS配列とを含有するPEgRNAを用いる。図46Dは、RNF2の+1位置におけるPE1によるC・GからA・Tのトランスバージョン編集効率およびインデル生成を示し、11nt RT鋳型と9-17ntの範囲であるPBS配列とを含有するPEgRNAを用いる。図46EはHEK4の+2位置におけるPE1によるG・CからT・Aのトランスバージョン編集効率およびインデル生成を示し、13nt RT鋳型と7-15ntの範囲であるPBS配列とを含有するPEgRNAを用いる。図46FはHEK3部位におけるPE1によって媒介される+1T欠失、+1A挿入、および+1CTT挿入を示し、13nt PBSおよび10nt RT鋳型を用いる。PEgRNAの配列は図39Cに用いられるものである(表3A-3Rを見よ)。値およびエラーバーは3つの独立した生物学的レプリケートの平均およびs.d.を反映する。Figures 46A-46F show correct edits versus indel generation by PE1. Figure 46A shows T·A to A·T transversion editing efficiency and indel generation by PE1 at the +1 position of HEK3, using PEgRNA containing a 10nt RT template and PBS sequences ranging from 8-17nt. Figure 46B shows G·C to T·A transversion editing efficiency and indel generation by PE1 at position +5 of EMX1 using PEgRNA containing a 13nt RT template and PBS sequences ranging from 9-17nt. . Figure 46C shows G·C to T·A transversion editing efficiency and indel generation by PE1 at position +5 of FANCF using PEgRNA containing a 17nt RT template and a PBS sequence ranging from 8-17nt. . Figure 46D shows C·G to A·T transversion editing efficiency and indel generation by PE1 at the +1 position of RNF2 using PEgRNA containing an 11nt RT template and PBS sequences ranging from 9-17nt. . Figure 46E shows the G·C to T·A transversion editing efficiency and indel generation by PE1 at the +2 position of HEK4, using PEgRNA containing a 13nt RT template and a PBS sequence ranging from 7-15nt. Figure 46F shows a +1T deletion, +1A insertion, and +1CTT insertion mediated by PE1 in the HEK3 site, using a 13nt PBS and 10nt RT template. The sequence of PEgRNA is that used in Figure 39C (see Tables 3A-3R). Values and error bars reflect the mean and s.d. of three independent biological replicates.

図47A~47Sはプライム編集のためのM-MLV RTバリアントの評価を示す。図47Aは、この図に用いられるプライム編集因子バリアントの略語を示す。図47BはHEK3座位におけるPE1による標的化された挿入および欠失編集を示す。図47C~47Hは、図47Cに示されているとおりHEK3における+2G・CからC・Gのトランスバージョン編集、図47Dに示されているとおりHEK3における24bp FLAG挿入、図47Eに示されているとおりRNF2における+1C・GからA・Tのトランスバージョン編集、図47Fに示されているとおりEMX1における+1G・CからC・Gのトランスバージョン編集、図47Gに示されているとおりHBBにおける+2T・AからA・Tのトランスバージョン編集、および図47Hに示されているとおりFANCFにおける+1G・CからC・Gのトランスバージョン編集を組み入れるそれらの能力について、M-MLV RTバリアントを含有する18のプライム編集因子構築物の比較を示す。図47I~47Nは、独立した実験の第2ラウンドにおいて図47C-47Hに示されている編集を組み入れるそれらの能力について、M-MLVバリアントを含有する4つのプライム編集因子構築物の比較を示す。図47O~47Sは、様々なPBS長さによる5つのゲノム座位におけるPE2編集効率を示す。図47OはHEK3における+1T・AからA・Tのバリエーションを示す。図47PはEMX1における+5G・CからT・Aのバリエーションを示す。図47QはFANCFにおける+5G・CからT・Aのバリエーションを示す。図47RはRNF2における+1C・GからA・Tのバリエーションを示す。図47SはHEK4における+2G・CからT・Aバリエーションを示す。値およびエラーバーは3つの独立した生物学的レプリケートの平均およびs.d.を反映する。Figures 47A-47S show evaluation of M-MLV RT variants for prime editing. Figure 47A shows the abbreviations of prime editing factor variants used in this figure. Figure 47B shows targeted insertion and deletion editing by PE1 at the HEK3 locus. Figures 47C-47H show +2G C to C G transversion edit in HEK3 as shown in Figure 47C, 24bp FLAG insertion in HEK3 as shown in Figure 47D, and Figure 47E. +1C G to A T transversion edit in RNF2, +1G C to C G transversion edit in EMX1 as shown in Figure 47F, + in HBB as shown in Figure 47G Containing M-MLV RT variants for their ability to incorporate the 2T A to A T transversion edit and the +1G C to C G transversion edit in FANCF as shown in Figure 47H. A comparison of 18 prime editing factor constructs is shown. Figures 47I-47N show a comparison of four prime editor constructs containing M-MLV variants for their ability to incorporate the edits shown in Figures 47C-47H in a second round of independent experiments. Figures 47O-47S show PE2 editing efficiency at five genomic loci with various PBS lengths. Figure 47O shows the variation from +1T・A to A・T in HEK3. Figure 47P shows variations from +5G・C to T・A in EMX1. Figure 47Q shows variations from +5G・C to T・A in FANCF. Figure 47R shows variations from +1C・G to A・T in RNF2. Figure 47S shows +2G・C to T・A variations in HEK4. Values and error bars reflect the mean and s.d. of three independent biological replicates.

図48A~48CはPEgRNA PBSおよびRT鋳型配列のデザイン特色を示す。図48Aは、RT鋳型長さの関数としてHEK293T細胞のVEGFAにおけるPE2によって媒介される+5G・CからT・Aのトランスバージョン編集効率(青色線)を示す。インデル(灰色線)が比較のためにプロットされている。グラフの下の配列は、PEgRNAによる合成のための鋳型とする編集のための最後のヌクレオチドを示す。Gヌクレオチド(PEgRNA上のCを鋳型とする)が強調されている;プライム編集効率を最大化するために、Cで終わるRT鋳型はPEgRNAのデザインの間に回避されるべきである。図48Bは、図48AのとおりDNMT1の+5G・CからT・Aのトランスバージョン編集およびインデルを示す。図48Cは、図48AのとおりRUNX1の+5G・CからT・Aのトランスバージョン編集およびインデルを示す。値およびエラーバーは3つの独立した生物学的レプリケートの平均およびs.d.を反映する。Figures 48A-48C show design features of PEgRNA PBS and RT template sequences. Figure 48A shows PE2-mediated +5G•C to T•A transversion editing efficiency (blue line) in VEGFA of HEK293T cells as a function of RT template length. Indels (gray lines) are plotted for comparison. The sequence below the graph shows the final nucleotide for editing as a template for synthesis with PEgRNA. G nucleotides (templated by C on PEgRNA) are highlighted; to maximize prime editing efficiency, RT templates ending in C should be avoided during PEgRNA design. Figure 48B shows transversion edits and indels from +5G.C to T.A of DNMT1 as shown in Figure 48A. FIG. 48C shows the transversion edit and indel from +5G.C to T.A of RUNX1 as shown in FIG. 48A. Values and error bars reflect the mean and s.d. of three independent biological replicates.

図49A~49Bは、細胞生存性に対するPE2、PE2 R110S K103L、Cas9 H840Aニッカーゼ、およびdCas9の効果を示す。HEK293T細胞が、HEK3標的化PEgRNAプラスミドと一緒にPE2、PE2 R110S K103L、Cas9 H840Aニッカーゼ、またはdCas9をコードするプラスミドによってトランスフェクションされた。細胞生存性が、24時間毎に、トランスフェクション後に3日に渡ってCellTiter-Glo2.0アッセイ(Promega)を用いて測定された。図49Aは、トランスフェクション後の1、2、または3日にルミネセンスによって測定された生存性を示す。値およびエラーバーは、夫々が技術的トリプリケートで行われた3つの独立した生物学的レプリケートの平均およびs.e.m.を反映する。図49Bは、+5GからAの編集をコードするHEK3標的化PEgRNAプラスミドと一緒に、PE2、PE2 R110S K103L、Cas9 H840Aニッカーゼ、またはdCas9について、パーセントの編集およびインデルを示す。編集効率が、トランスフェクション後の第3日に、図49Aの生存性をアッセイするために用いられたものと並べて、処置された細胞から測定された。値およびエラーバーは3つの独立した生物学的レプリケートの平均およびs.d.を反映する。Figures 49A-49B show the effects of PE2, PE2 R110S K103L, Cas9 H840A nickase, and dCas9 on cell viability. HEK293T cells were transfected with plasmids encoding PE2, PE2 R110S K103L, Cas9 H840A nickase, or dCas9 together with HEK3-targeting PEgRNA plasmids. Cell viability was measured every 24 hours for 3 days after transfection using the CellTiter-Glo2.0 assay (Promega). Figure 49A shows viability measured by luminescence 1, 2, or 3 days after transfection. Values and error bars reflect the mean and s.e.m. of three independent biological replicates, each performed in technical triplicate. Figure 49B shows percent editing and indels for PE2, PE2 R110S K103L, Cas9 H840A nickase, or dCas9, along with a HEK3-targeted PEgRNA plasmid encoding a +5G to A edit. Editing efficiency was measured from treated cells on day 3 post-transfection, alongside that used to assay viability in Figure 49A. Values and error bars reflect the mean and s.d. of three independent biological replicates.

図50A~50Bは、種々のPEgRNAによるPE3によって媒介されるHBB E6V修正およびHEXA 1278+TATC修正を示す。図50Aは、PE3によるHEK293T細胞のHBB E6Vアレルの修正のための14のPEgRNAのスクリーンを示す。評価された全てのPEgRNAは、いずれかのサイレントなPAM変異の導入なしに、HBB E6Vアレルを再び野生型HBBに変換する。図50Bは、PE3またはPE3bによるHEK293T細胞のHEXA 1278+TATCアレルの修正のための41のPEgRNAのスクリーンを示す。HEXAと標識されたPEgRNAは、PAMを遮断しかつサイレントな変異を残すシフトした4bp欠失によって病原性のアレルを修正する。HEXAと標識されたPEgRNAは病原性のアレルを再び野生型へと修正する。「b」で終わるエントリーは編集特異的なニッキングsgRNAをPEgRNAとの組み合わせで用いる(PE3bシステム)。値およびエラーバーは3つの独立した生物学的レプリケートの平均およびs.d.を反映する。Figures 50A-50B show PE3-mediated HBB E6V and HEXA 1278+TATC modification by various PEgRNAs. Figure 50A shows a screen of 14 PEgRNAs for correction of HBB E6V allele in HEK293T cells by PE3. All PEgRNAs evaluated convert the HBB E6V allele back to wild-type HBB without introducing any silent PAM mutations. Figure 50B shows a screen of 41 PEgRNAs for correction of the HEXA 1278+TATC allele in HEK293T cells with PE3 or PE3b. PEgRNA labeled HEXA corrects the pathogenic allele by a shifted 4bp deletion that blocks PAM and leaves a silent mutation. PEgRNA labeled HEXA corrects the pathogenic allele back to the wild type. Entries ending in "b" use an editing-specific nicking sgRNA in combination with PEgRNA (PE3b system). Values and error bars reflect the mean and s.d. of three independent biological replicates.

図51A~51Gは、ヒト細胞株におけるPE3活性とPE3およびCas9によって開始されるHDRの比較とを示す。図51Aに示されているとおりHEK293T細胞、図51Bに示されているとおりK562細胞、図51Cに示されているとおりU2OS細胞、および図51Dに示されているとおりHeLa細胞において、PE3およびCas9によって開始されるHDRについて、正しい編集(インデルなし)およびインデル度数を生成する効率。各ひとくくりされた編集の比較は、PE3およびCas9によって開始されるHDRによって同一の編集を組み入れる。非標的化対照はPE3および非標的座位を標的化するPEgRNAである。図51Eは、野生型Cas9 HDR実験と比較した非標的化PEgRNA+PE3およびdCas9+sgRNAによる対照実験を示す。見かけ上のHDR効率を偽性的に上昇させる普通のコンタミナントのssDNAドナーHDR鋳型が図51A~51DのHDR測定に寄与しないということを確認している。図51F~51Gは、PE3またはCas9によって開始されるHDRによる編集後にK562細胞から単離されたゲノムDNAサンプルからの例のHEK3部位アレル表を示す。アレルがIllumina MiSeqによって配列決定され、CRISPResso2によって分析された178。この領域からの参照HEK3配列は上側にある。アレル表が、非標的化PEgRNAの負の対照、PE3を用いるHEK3における+1CTT挿入、およびCas9によって開始されるHDRを用いるHEK3における+1CTT挿入について示されている。アレル度数および対応するIllumina配列決定読取カウントが各アレルについて示されている。度数≧0.20%で観察された全てのアレルが示されている。値およびエラーバーは3つの独立した生物学的レプリケートの平均およびs.d.を反映する。Figures 51A- 51G show a comparison of PE3 activity and HDR initiated by PE3 and Cas9 in human cell lines. PE3 and Cas9 in HEK293T cells as shown in Figure 51A, K562 cells as shown in Figure 51B, U2OS cells as shown in Figure 51C, and HeLa cells as shown in Figure 51D. Efficiency in producing correct edits (no indels) and indel frequencies for HDR initiated. Comparison of each lumped edit incorporates identical edits by HDR initiated by PE3 and Cas9. Non-targeting controls are PEgRNA targeting PE3 and non-target loci. Figure 51E shows control experiments with non-targeted PEgRNA+PE3 and dCas9+sgRNA compared to wild type Cas9 HDR experiments. We confirm that the common contaminant ssDNA donor HDR template, which pseudo-increases the apparent HDR efficiency, does not contribute to the HDR measurements in Figures 51A-51D. Figures 51F -51G show example HEK3 site allele tables from genomic DNA samples isolated from K562 cells after editing by PE3 or Cas9-initiated HDR. Alleles were sequenced by Illumina MiSeq and analyzed by CRISPResso2 178 . Reference HEK3 sequences from this region are on the top. Allele tables are shown for the non-targeting PEgRNA negative control, +1CTT insertion in HEK3 with PE3, and +1CTT insertion in HEK3 with Cas9-initiated HDR. Allele frequencies and corresponding Illumina sequencing read counts are shown for each allele. All alleles observed at frequency ≧0.20% are shown. Values and error bars reflect the mean and SD of three independent biological replicates.

図52A~52Dは、ClinVarデータベース上の病原性の挿入、重複、欠失、およびインデルの長さの分布を示す。ClinVarバリアントサマリーが2019年7月15日にNCBIからダウンロードされた。報告された挿入、欠失、および重複の長さが、参照および代替対立遺伝子、バリアントスタートおよびストップ位置、またはバリアント名称の適当な識別情報を用いて計算された。上の情報のいずれかを報告しなかったバリアントは分析から排除された。報告されたインデル(参照ゲノムに対して相対的に挿入および欠失両方を包含する単一のバリアント)の長さは、参照および代替対立遺伝子の間の最も良好なペアワイズアラインメントにおけるミスマッチまたはギャップの数を決定することによって計算された。Figures 52A-52D show the length distribution of pathogenic insertions, duplications, deletions, and indels on the ClinVar database. ClinVar variant summary downloaded from NCBI on July 15, 2019. The lengths of reported insertions, deletions, and duplications were calculated using appropriate identification of reference and alternative alleles, variant start and stop positions, or variant names. Variants that did not report any of the above information were excluded from the analysis. The reported length of an indel (a single variant encompassing both insertions and deletions relative to the reference genome) is the number of mismatches or gaps in the best pairwise alignment between the reference and alternative alleles. Calculated by determining .

図53A~53Eは、GFP陽性の細胞ソーティングについてFACSゲーティング例を示す。下は元々のバッチ分析ファイルの例であり、HEXA 1278+TATCおよびHBB E6V HEK293T細胞株を生成するために用いられたソーティング戦略を概説する。イメージデータはCell Sorterソフトウェアv.3.0.5を用いてSony LE-MA900サイトメーターによって生成された。グラフィック1は、GFPを発現しない細胞のゲーティングプロットを示す。グラフィック2は、HBB E6V HEK293T細胞株を単離するために用いられたP2A-GFP発現細胞の例のソーティングを示す。HEK293T細胞は、当初にはFSC-A/BSC-A(ゲートA)を用いて集団でゲーティングされ、それからFSC-A/FSC-H(ゲートB)を用いてシングレットについてソーティングされた。生細胞はDAPI陰性細胞(ゲートC)をゲーティングすることによってソーティングされた。負の対照の細胞のものよりも上であるGFP蛍光レベルを有する細胞は、フルオロクロームとしてEGFPを用いてソーティングされた(ゲートD)。図53AはHEK293T細胞(GFP陰性)を示す。図53Bは、PE2-P2A-GFPを発現する細胞についてのFACSゲーティングの代表的なプロットを示す。図53Cは、HEXA 1278+TATCホモ接合体HEK293T細胞の遺伝子型を示す。図53D~5EはHBB E6Vホモ接合体HEK293T細胞株のアレル表を示す。Figures 53A- 53E show examples of FACS gating for GFP positive cell sorting. Below is an example of the original batch analysis file, outlining the sorting strategy used to generate the HEXA 1278+TATC and HBB E6V HEK293T cell lines. Image data was generated by a Sony LE-MA900 cytometer using Cell Sorter software v.3.0.5. Graphic 1 shows a gating plot for cells that do not express GFP. Graphic 2 shows example sorting of P2A-GFP expressing cells used to isolate the HBB E6V HEK293T cell line. HEK293T cells were initially population gated using FSC-A/BSC-A (Gate A) and then sorted for singlets using FSC-A/FSC-H (Gate B). Live cells were sorted by gating on DAPI negative cells (gate C). Cells with GFP fluorescence levels above those of negative control cells were sorted using EGFP as the fluorochrome (Gate D). Figure 53A shows HEK293T cells (GFP negative). Figure 53B shows a representative plot of FACS gating for cells expressing PE2-P2A-GFP. Figure 53C shows the genotype of HEXA 1278+TATC homozygous HEK293T cells. Figures 53D -5E show allele tables for the HBB E6V homozygous HEK293T cell line.

図54はPEgRNAクローニング手続きをまとめる模式図である。Figure 54 is a schematic diagram summarizing the PEgRNA cloning procedure.

図55A~55GはPEgRNAデザインの模式図である。図55Aは、ドメインが標識された(左)およびゲノム部位においてnCas9に結合された(右)PEgRNAの単純なダイアグラムを示す。図55Bは、活性を増大させることが予期されるPEgRNAの種々の型の修飾を示す。図55Cは、プロモーター選択肢ならびに5'、3'プロセシングおよび終結によってより長いRNAの転写を増大させるためのPEgRNAの修飾を示す。図55DはP1システムの長大化を示す。これは骨格修飾の例である。図55Eは、鋳型領域上におけるまたはPEgRNA上の他所における合成的修飾の組み込みが活性を増大させ得るということを示す。図55Fは、鋳型上の最小限の二次構造のデザインされた組み込みが、より長いより阻害性の二次構造の形成を防止し得るということを示す。図55Gは、PEgRNAの3'端においてRNAエレメントによってアンカー固定された第2の鋳型配列を有する分裂PEgRNAを示す(左)。PEgRNAの5'または3'端におけるエレメントの組み込みはRT結合を増強し得る。Figures 55A-55G are schematic diagrams of PEgRNA designs. Figure 55A shows a simple diagram of PEgRNA with labeled domains (left) and bound to nCas9 at a genomic site (right). Figure 55B shows various types of modifications of PEgRNA that are expected to increase activity. Figure 55C shows promoter options and modification of PEgRNA to increase transcription of longer RNAs through 5', 3' processing and termination. Figure 55D shows the elongation of the P1 system. This is an example of backbone modification. Figure 55E shows that incorporation of synthetic modifications on the template region or elsewhere on PEgRNA can increase activity. Figure 55F shows that designed incorporation of minimal secondary structure on the template can prevent the formation of longer, more inhibitory secondary structures. Figure 55G shows a split PEgRNA with a second template sequence anchored by an RNA element at the 3' end of the PEgRNA (left). Incorporation of elements at the 5' or 3' end of PEgRNA can enhance RT binding.

図56A~56Dは標的座位へのPEgRNA骨格配列の組み込みを示す。HTSデータが図60A~60Bに記載されているとおりPEgRNA骨格配列挿入について分析された。図56AはEMX1座位の分析を示す。RT鋳型に隣接する挿入上に1つ以上のPEgRNA骨格配列ヌクレオチドを含有する配列決定総読取の%(左);規定された長さのPEgRNA骨格配列挿入を含有する配列決定総読取のパーセンテージ(中央);および最高でX軸上に規定された長さを包含するPEgRNA挿入の累積のトータルパーセンテージが示されている。図56Bは図56Aと同じことをFANCFについて示す。図56Cは図56Aと同じことをHEK3について示す。図56Dは図56Aと同じことをRNF2について示す。値およびエラーバーは3つの独立した生物学的レプリケートの平均およびs.d.を反映する。Figures 56A-56D show integration of PEgRNA backbone sequences into target loci. HTS data was analyzed for PEgRNA backbone sequence insertions as described in Figures 60A-60B. Figure 56A shows analysis of the EMX1 locus. % of total sequenced reads containing one or more PEgRNA backbone sequence nucleotides on an insert adjacent to the RT template (left); % of total sequenced reads containing a PEgRNA backbone sequence insert of a defined length (middle ); and the cumulative total percentage of PEgRNA insertions encompassing up to the defined length on the X-axis is shown. Figure 56B shows the same thing as Figure 56A for FANCF. Figure 56C shows the same thing as Figure 56A for HEK3. Figure 56D shows the same thing as Figure 56A for RNF2. Values and error bars reflect the mean and s.d. of three independent biological replicates.

図57A~57Iは、トランスクリプトームワイドなRNA存在量に対するPE2、PE2-dRT、およびCas9 H840Aニッカーゼの効果を示す。PE2、PE2-dRT、またはCas9 H840AニッカーゼとPRNP標的化またはHEXA標的化PEgRNAとを発現するHEK293T細胞から単離された、リボソームRNAを枯渇させられた細胞RNAの分析。14,410遺伝子および14,368遺伝子に対応するRNAが夫々PRNPおよびHEXAサンプルにおいて検出された。図57A~57Fは、-log10 FDR調整されたp値対log2転写物存在量の~倍の変化を各(Aeach)RNAについて呈示するボルケーノプロットを示す。(図57A)PRNP標的化PEgRNAによるPE2対PE2-dRT、(図57B)PRNP標的化PEgRNAによるPE2対Cas9 H840A、(図57C)PRNP標的化PEgRNAによるPE2-dRT対Cas9 H840A、(図57D)HEXA標的化PEgRNAによるPE2対PE2-dRT、(図57E)HEXA標的化PEgRNAによるPE2対Cas9 H840A、(図57F)HEXA標的化PEgRNAによるPE2-dRT対Cas9 H840Aを比較している。赤色のドットは、統計的に有意である相対存在量の≧2倍の変化を示す遺伝子を指示する(FDR調整されたp<0.05)。図57G-57Iは、上方制御および下方制御される転写物(≧2倍変化)のベン図であり、PRNPおよびHEXAサンプルを(図57G)PE2対PE2-dRT、(図57H)PE2対Cas9 H840A、および(図57I)PE2-dRT対Cas9 H840Aについて比較している。Figures 57A-57I show the effects of PE2, PE2-dRT, and Cas9 H840A nickase on transcriptome-wide RNA abundance. Analysis of ribosomal RNA-depleted cellular RNA isolated from HEK293T cells expressing PE2, PE2-dRT, or Cas9 H840A nickase and PRNP-targeted or HEXA-targeted PEgRNA. RNA corresponding to 14,410 genes and 14,368 genes were detected in PRNP and HEXA samples, respectively. Figures 57A-57F show volcano plots presenting -log10 FDR-adjusted p-values versus ~fold change in log2 transcript abundance for each (Aeach) RNA. (Figure 57A) PE2 vs. PE2-dRT with PRNP-targeting PEgRNA, (Figure 57B) PE2 vs. Cas9 H840A with PRNP-targeting PEgRNA, (Figure 57C) PE2-dRT vs. Cas9 H840A with PRNP-targeting PEgRNA, (Figure 57D) HEXA Comparing PE2 vs. PE2-dRT with targeting PEgRNA, (FIG. 57E) PE2 vs. Cas9 H840A with HEXA-targeting PEgRNA, (FIG. 57F) PE2-dRT vs. Cas9 H840A with HEXA-targeting PEgRNA. Red dots indicate genes showing a ≧2-fold change in relative abundance that is statistically significant (FDR adjusted p<0.05). Figures 57G-57I are Venn diagrams of upregulated and downregulated transcripts (≥2-fold change), comparing PRNP and HEXA samples to (Figure 57G) PE2 vs. PE2-dRT, (Figure 57H) PE2 vs. Cas9 H840A, and (FIG. 57I) comparing PE2-dRT vs. Cas9 H840A.

図58A~58Bはニューロン核ソーティングのための代表的なFACSゲーティングを示す。核が、DyeCycle Rubyシグナル、FSC/SSC比、SSC幅/SSC高さ比、およびGFP/DyeCycle比に基づいて逐次的にゲーティングされた。Figures 58A -58B show representative FACS gating for neuron nucleus sorting. Nuclei were gated sequentially based on DyeCycle Ruby signal, FSC/SSC ratio, SSC width/SSC height ratio, and GFP/DyeCycle ratio.

図59A~59Gは、3'伸長されたPEgRNAをゴールデンゲートアセンブリによって哺乳類U6発現ベクター上にクローニングするためのプロトコールを示す。図59Aはクローニングの概観を示す。図59Bは「ステップ1:pU6-PEgRNA-GG-ベクタープラスミドを消化(構成要素1)」を示す。図59Cは「ステップ2および3:オリゴヌクレオチドパーツを順序付けおよびアニーリング(構成要素2、3、および4)」を示す。図59Dは「ステップ2.b.ii.:sgRNA骨格リン酸化(オリゴヌクレオチドがリン酸化されて購入された場合には不必要)」を示す。図59Eは「ステップ4:PEgRNAアセンブリ」を示す。図59Fは「ステップ5および6:アセンブリされたプラスミドの形質転換」を示す。図59GはPEgRNAクローニングプロトコールをまとめるダイアグラムを示す。Figures 59A- 59G show a protocol for cloning 3' extended PEgRNA onto a mammalian U6 expression vector by Golden Gate assembly. Figure 59A shows an overview of cloning. Figure 59B shows "Step 1: Digest pU6-PEgRNA-GG-vector plasmid (Component 1)". Figure 59C shows "Steps 2 and 3: Ordering and Annealing Oligonucleotide Parts (Components 2, 3, and 4)." Figure 59D shows "Step 2.b.ii.: sgRNA backbone phosphorylation (not required if oligonucleotide was purchased phosphorylated)". Figure 59E shows "Step 4: PEgRNA Assembly". Figure 59F shows "Steps 5 and 6: Transformation of assembled plasmids." Figure 59G shows a diagram summarizing the PEgRNA cloning protocol.

図60A~60Bは、PEgRNA骨格取り入れを定量するためのPythonスクリプトを示す。標的ゲノム座位におけるPEgRNA挿入を特徴付けおよび定量するために、カスタムのpythonスクリプトが生成された。スクリプトは、参照配列(ガイドRNA骨格配列)から取られた増大していく長さのテキストストリングをfastqファイル内の配列決定読取と反復的にマッチさせ、検索クエリにマッチする配列決定読取の数をカウントする。各順次のテキストストリングは、ガイドRNA骨格配列の追加のヌクレオチドに対応する。厳密な長さ取り入れおよび最高で規定された長さの累積の取り入れが、この様式で計算された。sgRNAの短いスライスのアラインメントおよび正確なカウントを保証するために、参照配列のスタートにおいては、逆転写酵素によって合成される新たなDNA鎖の3'端の5から6塩基が包含される。Figures 60A-60B show Python scripts for quantifying PEgRNA backbone incorporation. A custom python script was generated to characterize and quantify PEgRNA insertions at targeted genomic loci. The script iteratively matches increasing lengths of text strings taken from a reference sequence (guide RNA backbone sequence) to sequencing reads in a fastq file and calculates the number of sequencing reads that match the search query. Count. Each sequential text string corresponds to additional nucleotides of the guide RNA backbone sequence. Exact length intake and maximum specified length cumulative intake were calculated in this manner. To ensure alignment and accurate counting of short slices of sgRNA, the 3'-end 5 to 6 bases of the new DNA strand synthesized by reverse transcriptase are included at the start of the reference sequence.

図61は、SaCas9(N580A)-MMLV RT HEK3 +6C>Aについて、規定された編集を有する配列決定総読取のパーセントを示すグラフである。正しい編集およびインデルの値が示されている。Figure 61 is a graph showing the percentage of total sequencing reads with defined edits for SaCas9(N580A)-MMLV RT HEK3 +6C>A. Correct edit and indel values are shown.

図62A~62Bは、プライム編集による精密な位置付けにおける所望の編集の効率的な組み入れにとってのプロトスペーサーの重要性を示す。図62Aは、種々のHEK3座位について、標的T・A塩基対がA・Tに変換された配列決定総読取のパーセントを示すグラフである。図62Bはそれを示す配列分析である。Figures 62A-62B show the importance of protospacers for efficient incorporation of desired edits at precise positioning by prime editing. Figure 62A is a graph showing the percent of total sequencing reads in which the targeted T-A base pair was converted to A-T for various HEK3 loci. Figure 62B shows the sequence analysis.

図63はPAM編集のSpCas9 PAMバリアントを示すグラフである(N=3)。標的化されたPAM編集を有する配列決定総読取のパーセントが、NGA>NTAであるSpCas9(H840A)-VRQR-MMLV RTについて、およびNGCG>NTCGであるSpCas9(H840A)-VRER-MMLV RTについて示されている。用いられたPEgRNAプライマー結合部位(PBS)長さ、RT鋳型(RT)長さ、およびPEシステムが列記される。Figure 63 is a graph showing SpCas9 PAM variants of PAM editing (N=3). Percentage of total sequencing reads with targeted PAM editing is shown for SpCas9(H840A)-VRQR-MMLV RT with NGA > NTA and for SpCas9(H840A)-VRER-MMLV RT with NGCG > NTCG. ing. The PEgRNA primer binding site (PBS) length, RT template (RT) length, and PE system used are listed.

図64A~64Fは、PEを用いるゲノム上への種々の部位特異的リコンビナーゼ(SSR)標的の導入を示す模式図である。図64Aは、プライム編集因子によるリコンビナーゼ標的配列の挿入の一般的な模式図を提供する。図64Bは、どのようにしてPEによって挿入される単一のSSR標的がDNAドナー鋳型のゲノム取り入れのための部位として用いられ得るかを示す。図64Cは、どのようにしてSSR標的部位のタンデム挿入がゲノムの部分を欠失させるために用いられ得るかを示す。図64Dは、どのようにしてSSR標的部位のタンデム挿入がゲノムの部分を逆位させるために用いられ得るかを示す。図64Eは、どのようにして2つの遠位の染色体領域における2つのSSR標的部位の挿入が染色体転座をもたらし得るかを示す。図64Fは、どのようにしてゲノム上の2つの異なるSSR標的部位の挿入がDNAドナー鋳型からのカセットを交換するために用いられ得るかを示す。さらなる詳細は例17を見よ。Figures 64A -64F are schematic diagrams showing the introduction of various site-specific recombinase (SSR) targets onto a genome using PE. Figure 64A provides a general schematic diagram of the insertion of a recombinase target sequence by a primed editor. Figure 64B shows how a single SSR target inserted by PE can be used as a site for genomic incorporation of a DNA donor template. Figure 64C shows how tandem insertion of SSR target sites can be used to delete a portion of a genome. Figure 64D shows how tandem insertion of SSR target sites can be used to invert a portion of a genome. Figure 64E shows how insertion of two SSR target sites at two distal chromosomal regions can result in a chromosomal translocation. Figure 64F shows how insertion of two different SSR target sites on a genome can be used to exchange a cassette from a DNA donor template. See Example 17 for further details.

図65は、1)ヒト細胞ゲノム上のSSR標的部位のPEによって媒介される合成および2)GFP発現マーカーを含むDNAドナー鋳型を取り入れするためのそのSSR標的部位の使用を示す。ひとたび首尾良く取り入れられると、GFPは細胞が蛍光発光することを引き起こす。さらなる詳細は例17を見よ。Figure 65 shows 1) PE-mediated synthesis of an SSR target site on a human cell genome and 2) use of that SSR target site to incorporate a DNA donor template containing a GFP expression marker. Once successfully incorporated, GFP causes cells to fluoresce. See Example 17 for further details.

図66は、2つのPEの半分のタンパク質として提供されているプライム編集因子の1つの態様を図示する。これらは、プライム編集因子の半分のタンパク質の夫々の終わりまたは始まりに位置付けられた分裂インテインの半分同士の自己スプライシング作用によって、丸ごとのプライム編集因子を再生する。Figure 66 illustrates one embodiment of a prime editing factor provided as two PE half proteins. These regenerate the entire prime editing factor by the self-splicing action of the split intein halves positioned at the end or beginning of each protein half of the prime editing factor.

図67は、N末端およびC末端エクステイン配列の間におけるポリペプチド配列からのインテイン除去およびペプチド結合の再形成の機序を図示する。(a)は、夫々がインテイン配列の半分を含有する2つの半分のタンパク質の一般的な機序を図示する。これらは、細胞内で接触するときに、完全に機能的なインテインをもたらす。これは、それから、自己スプライシングおよび切除を経過する。切除のプロセスはN末端のタンパク質の半分(または「Nエクステイン」)およびC末端のタンパク質の半分(または「Cエクステイン」)の間におけるペプチド結合の形成をもたらして、NエクステインおよびCエクステイン部分を含む丸ごとの単一ポリペプチドを形成する。種々の態様において、Nエクステインは分裂されたプライム編集因子融合タンパク質のN末端の半分に対応し得、Cエクステインは分裂されたプライム編集因子のC末端の半分に対応し得る。(b)は、インテイン切除とNエクステインの半分(赤色をした半分)およびCエクステインの半分(青色をした半分)を連結するペプチド結合の再形成との化学的機序を示す。それにはトランスで提供される2つの別個の構成要素のスプライシング作用が関わるので、分裂インテイン(すなわち、分裂インテイン構成でのNインテインおよびCインテイン)の切除は「トランススプライシング」ともまた言われ得る。Figure 67 illustrates the mechanism of intein removal from a polypeptide sequence and reformation of peptide bonds between N-terminal and C-terminal extein sequences. (a) illustrates the general mechanism of two halves of the protein, each containing half of the intein sequence. When these come into contact within a cell, they result in a fully functional intein. This then undergoes self-splicing and excision. The process of excision results in the formation of a peptide bond between the N-terminal half of the protein (or "N extein") and the C-terminal half of the protein (or "C extein"), resulting in the formation of N- and C-exteins. form a whole single polypeptide containing the in moiety. In various embodiments, the N extein can correspond to the N-terminal half of the split prime editing factor fusion protein and the C extein can correspond to the C-terminal half of the split prime editing factor fusion protein. (b) shows the chemical mechanism of intein excision and reformation of the peptide bond connecting half of the N extein (half colored red) and half of the C extein (half colored blue). Excision of a split intein (ie, N-intein and C-intein in a split-intein configuration) can also be referred to as "trans-splicing" since it involves the splicing action of two separate components provided in trans.

図68Aは、HEK293T細胞にコトランスフェクションされるときに、リンカーにおけるSpPE(配列番号762)の分裂インテインの半分同士両方の送達が3つの試験座位において活性を維持するということを実証する。Figure 68A demonstrates that delivery of both split-intein halves of SpPE (SEQ ID NO: 762) in a linker maintains activity at the three test loci when co-transfected into HEK293T cells.

図68Bは、HEK293T細胞にコトランスフェクションされるときに、SaPE2(例えば、配列番号443および配列番号450)の分裂インテインの半分同士両方の送達が全長SaPE2(配列番号134)の活性を再現するということを実証する Figure 68B shows that delivery of both halves of the split intein of SaPE2 (e.g., SEQ ID NO: 443 and SEQ ID NO: 450) recapitulates the activity of full-length SaPE2 (SEQ ID NO: 134) when co-transfected into HEK293T cells. prove that .

用符で指示されている残基はSaCas 9のアミノ酸741-743(C末端エクステインの最初の残基)の配列であり、これらはインテイントランススプライシング反応にとって重要である。「SMP」はネイティブな残基である。我々はこれらを「CFN」コンセンサススプライシング配列へもまた変異させた。プライム編集パーセンテージによって測定されるとおり、コンセンサス配列は最も高い再構成を生むことが示されている。 The residues indicated in quotation marks are the sequence of amino acids 741-743 of SaCa s 9 (the first residue of the C-terminal extein), which are important for the intein trans-splicing reaction. "SMP" is the native residue. We also mutated these to the "CFN" consensus splicing sequence. Consensus sequences have been shown to yield the highest rearrangements as measured by prime editing percentage.

図68Cは、種々の開示されるPEリボヌクレオタンパク質複合体(高濃度のPE2、高濃度のPE3、および低濃度のPE3)がこの様式で送達され得るということを示すデータを提供する。Figure 68C provides data showing that various disclosed PE ribonucleoprotein complexes (high concentration of PE2, high concentration of PE3, and low concentration of PE3) can be delivered in this manner.

図69は、PANCEにおけるPE有効性を決定するためのバクテリオファージプラークアッセイを示す。プラーク(暗色の円)は首尾良くE.coliに感染する能力があるファージを指示する。L-ラムノースの濃度を増大させることは、PEの増大した発現およびプラーク形成の増大をもたらす。プラークの配列決定は、PEによって組み入れされるゲノム編集の存在を明らかにした。Figure 69 shows bacteriophage plaque assay to determine PE efficacy in PANCE. Plaques (dark circles) indicate phages capable of successfully infecting E. coli. Increasing the concentration of L-rhamnose results in increased expression of PE and increased plaque formation. Plaque sequencing revealed the presence of genome edits incorporated by PE.

図70A~70Iは、プライム編集のためのPEgRNAおよびニッキングsgRNAをデザインするためのステップバイステップの説明書の例解として、編集された標的配列の例を提供する。図70A:ステップ1.標的配列および編集を定める。所望の編集(点変異、挿入、欠失、またはそれらの組み合わせ)の位置付けを中心にした標的DNA領域(~200bp)の配列をリトリーブする。図70B:ステップ2.標的PAMを位置付ける。編集位置付けに対して近位のPAMを同定する。両鎖上のPAMを探すように気をつける。編集位置に近接するPAMが好ましいが、編集位置から≧30ntにニックを置くプロトスペーサーおよびPAMを用いて編集を組み入れることが可能である。図70C:ステップ3.ニック部位を位置付ける。考慮されようとする各PAMについて、対応するニック部位を同定する。Sp Cas9 H840Aニッカーゼでは、切断はPAM含有鎖上においてNGG PAMの5'の第3および第4の塩基の間で生起する。全ての編集されるヌクレオチドはニック部位の3'に存在しなければならない。そのため、適当なPAMがPAM含有鎖上の標的編集の5'にニックを置かなければならない。下で示されている例では、2つの可能なPAMがある。単純のために、残りのステップはPAM 1のみを用いるPEgRNAのデザインを実証する。図70D:ステップ4.スペーサー配列をデザインする。Sp Cas9のプロトスペーサーは、PAM含有鎖上のNGG PAMの5'の20ヌクレオチドに対応する。効率的なPol III転写開始はGが第1の転写されるヌクレオチドであることを要求する。プロトスペーサーの第1のヌクレオチドがGである場合には、PEgRNAのスペーサー配列は単純にプロトスペーサー配列である。プロトスペーサーの第1のヌクレオチドがGではない場合には、PEgRNAのスペーサー配列は、G、次にプロトスペーサー配列である。図70E:ステップ5.プライマー結合部位(PBS)をデザインする。出発アレル配列を用いて、PAM含有鎖上のDNAプライマーを同定する。DNAプライマーの3'端はニック部位のちょうど上流のヌクレオチドである(すなわち、Sp Cas9ではNGG PAMの5'の第4の塩基)。PE2およびPE3への使用のための一般的なデザイン原理としては、DNAプライマーに対する相補性の12から13ヌクレオチドを含有するPEgRNAプライマー結合部位(PBS)が、~40-60%のGC含量を含有する配列に用いられ得る。低いGC含量を有する配列では、より長い(14から15nt)PBSが試験されるべきである。より高いGC含量を有する配列では、より短い(8から11nt)PBSが試験されるべきである。GC含量にかかわらず、最適なPBS配列は経験的に決定されるはずである。長さpのPBS配列をデザインするためには、出発アレル配列を用いて、PAM含有鎖上のニック部位の5'の最初のpヌクレオチドの逆相補体を取る。図70F:ステップ6.RT鋳型をデザインする。RT鋳型は、デザインされた編集と編集に隣接する配列に対する相同性とをコードする。最適なRT鋳型長さは標的部位に基づいて変わる。ショートレンジ編集(位置+1から+6)では、短い(9から12nt)、中程度の(13から16nt)、および長い(17から20nt)RT鋳型を試験することが推奨される。ロングレンジ編集(位置+7以降)では、十分な3'DNAフラップ相同性を許すために、編集の位置を越えて少なくとも5nt(好ましくは10nt以上)伸長するRT鋳型を用いることが推奨される。ロングレンジ編集では、機能的なデザインを同定するためには、いくつかのRT鋳型がスクリーニングされるべきである。より大きい挿入および欠失(≧5nt)では、RT鋳型上へのより多大な3'相同性(~20nt以上)の組み込みが推奨される。RT鋳型が、逆転写されるDNA産物上の最後のヌクレオチドとしてG(PEgRNAのRT鋳型ではCに対応する)の合成をコードするときには、編集効率は典型的には損なわれる。多くのRT鋳型が効率的なプライム編集を支持するので、RT鋳型をデザインするときには、最後の合成されるヌクレオチドとしてのGの回避が推奨される。長さrのRT鋳型配列をデザインするためには、所望のアレル配列を用い、元々はPAMを含有した鎖上のニック部位の3'の最初のrヌクレオチドの逆相補体を取る。SNP編集と比較して、同じ長さのRT鋳型を用いる挿入または欠失編集は同一の相同性を含有しないであろうということに注意。図70G:ステップ7.完全なPEgRNA配列をアセンブリする。PEgRNA構成要素を次の順序でコンカテネーションする(5'から3'):スペーサー、骨格、RT鋳型、およびPBS。図70H:ステップ8.PE3のためのニッキングsgRNAをデザインする。編集の上流および下流の非編集鎖上のPAMを同定する。最適なニッキング位置は高度に座位依存性であり、経験的に決定されるはずである。一般的に、PEgRNAによって誘導されるニックの向かいの位置の40から90ヌクレオチド5'に置かれたニックは、より高い編集収量およびより少数のインデルに至る。ニッキングsgRNAは、出発アレル上の20ntプロトスペーサーにマッチするスペーサー配列を有する。プロトスペーサーがGで始まらない場合には5'Gの追加を有する。図70I:ステップ9.PE3bニッキングsgRNAをデザインする。PAMが相補鎖上に存在し、かつその対応するプロトスペーサーが編集のために標的化される配列とオーバーラップする場合には、この編集はPE3bシステムの候補であり得る。PE3bシステムでは、ニッキングsgRNAのスペーサー配列は出発アレルではなく所望の編集されるアレルの配列にマッチする。編集されるヌクレオチド(単数または複数)がニッキングsgRNAプロトスペーサーのシード領域(PAMに隣接する~10nt)内に収まるときには、PE3bシステムは効率的に作動する。これは、編集された鎖の組み入れ後まで相補鎖のニッキングを防止し、標的DNAに結合することについてのPEgRNAおよびsgRNAの間の競合を防止する。PE3bは、両方の鎖上の同時のニックの生成をもまた回避し、それゆえに、高い編集効率を維持しながらインデル形成を有意に縮減する。PE3b sgRNAは、所望のアレルの20ntプロトスペーサーにマッチするスペーサー配列を有するはずである。必要とされる場合には5'Gの追加を有する。Figures 70A-70I provide examples of edited target sequences as illustrations of step-by-step instructions for designing PEgRNA and nicking sgRNA for prime editing. Figure 70A: Step 1. Define target sequence and edits. Retrieve the sequence of the target DNA region (~200 bp) centered around the location of the desired edit (point mutation, insertion, deletion, or combination thereof). Figure 70B: Step 2. Position the target PAM. Identify PAMs that are proximal to the edit position. Be careful to look for PAM on both strands. Edits can be incorporated using protospacers and PAMs that place nicks ≧30 nt from the edit location, although PAMs that are close to the edit location are preferred. Figure 70C: Step 3. Position the nick site. For each PAM to be considered, the corresponding nick site is identified. For Sp Cas9 H840A nickase, cleavage occurs between the 5' third and fourth bases of the NGG PAM on the PAM-containing strand. All edited nucleotides must be 3' to the nick site. Therefore, a suitable PAM must be nicked 5' of the target edit on the PAM-containing strand. In the example shown below, there are two possible PAMs. For simplicity, the remaining steps demonstrate the design of PEgRNA using PAM 1 only. Figure 70D: Step 4. Design the spacer array. The protospacer of Sp Cas9 corresponds to the 5' 20 nucleotides of the NGG PAM on the PAM-containing strand. Efficient Pol III transcription initiation requires G to be the first transcribed nucleotide. If the first nucleotide of the protospacer is G, the spacer sequence of PEgRNA is simply a protospacer sequence. If the first nucleotide of the protospacer is not a G, the spacer sequence of the PEgRNA is G followed by the protospacer sequence. Figure 70E: Step 5. Design the primer binding site (PBS). The starting allele sequence is used to identify DNA primers on the PAM-containing strand. The 3' end of the DNA primer is the nucleotide just upstream of the nick site (ie, the 4th base 5' of the NGG PAM for Sp Cas9). The general design principle for use with PE2 and PE3 is that the PEgRNA primer binding site (PBS) contains 12 to 13 nucleotides of complementarity to the DNA primer and contains ~40-60% GC content. It can be used for arrays. For sequences with low GC content, longer (14 to 15 nt) PBSs should be tested. For sequences with higher GC content, shorter (8 to 11 nt) PBSs should be tested. Regardless of GC content, the optimal PBS sequence should be determined empirically. To design a PBS sequence of length p, the starting allele sequence is used to take the reverse complement of the first p nucleotides 5' of the nick site on the PAM-containing strand. Figure 70F: Step 6. Design the RT mold. The RT template encodes the designed edit and homology to the sequences flanking the edit. Optimal RT template length will vary based on the target site. For short range editing (positions +1 to +6), it is recommended to test short (9 to 12 nt), medium (13 to 16 nt), and long (17 to 20 nt) RT templates. For long range editing (position +7 and beyond), it is recommended to use RT templates that extend at least 5 nt (preferably 10 nt or more) beyond the location of the edit to allow sufficient 3' DNA flap homology. For long range editing, several RT templates should be screened to identify a functional design. For larger insertions and deletions (≧5nt), incorporation of more 3' homology (~20nt or more) onto the RT template is recommended. Editing efficiency is typically compromised when the RT template encodes the synthesis of a G (corresponding to C in the PEgRNA RT template) as the last nucleotide on the reverse transcribed DNA product. Avoiding G as the last synthesized nucleotide is recommended when designing RT templates, as many RT templates support efficient prime editing. To design an RT template sequence of length r, use the desired allele sequence and take the reverse complement of the first r nucleotides 3' of the nick site on the strand that originally contained the PAM. Note that compared to SNP editing, insertion or deletion editing using RT templates of the same length will not contain the same homology. Figure 70G: Step 7. Assemble the complete PEgRNA sequence. Concatenate the PEgRNA components in the following order (5' to 3'): spacer, backbone, RT template, and PBS. Figure 70H: Step 8. Design a nicking sgRNA for PE3. Identify PAMs on the unedited strands upstream and downstream of the edit. The optimal nicking position is highly locus dependent and should be determined empirically. Generally, nicks placed 40 to 90 nucleotides 5' across from the nick induced by PEgRNA lead to higher editing yields and fewer indels. The nicking sgRNA has a spacer sequence that matches the 20nt protospacer on the starting allele. If the protospacer does not start with a G, it has an addition of 5'G. Figure 70I: Step 9. Design PE3b nicking sgRNA. If the PAM is present on the complementary strand and its corresponding protospacer overlaps the sequence targeted for editing, then this editing may be a candidate for the PE3b system. In the PE3b system, the spacer sequence of the nicking sgRNA matches the sequence of the desired edited allele rather than the starting allele. The PE3b system operates efficiently when the nucleotide(s) to be edited fall within the seed region (~10 nt adjacent to the PAM) of the nicking sgRNA protospacer. This prevents nicking of the complementary strand until after incorporation of the edited strand and prevents competition between PEgRNA and sgRNA for binding to target DNA. PE3b also avoids simultaneous nick generation on both strands, thus significantly reducing indel formation while maintaining high editing efficiency. The PE3b sgRNA should have a spacer sequence that matches the 20nt protospacer of the desired allele. With addition of 5'G if required.

図71AはSpCas9 PEgRNA分子(上側)のヌクレオチド配列を示す。これは3'端において「UUU」で終結し、トウループエレメントを含有しない。図の下方の部分は同じSpCas9 PEgRNA分子を図示するが、「UUU」3'端の直ちに前に挿入された配列5'-「GAAANNNNN」-3'を有するトウループエレメントを含有するようにさらに改変される。「N」はいずれかの核酸塩基であり得る。Figure 71A shows the nucleotide sequence of the SpCas9 PEgRNA molecule (top). It terminates with "UUU" at the 3' end and contains no toe loop element. The lower part of the figure illustrates the same SpCas9 PEgRNA molecule, but further modified to contain a toe loop element with the sequence 5'-'GAAANNNNN'-3' inserted immediately before the 'UUU' 3' end. Ru. "N" can be any nucleobase.

図71Bは例18の結果を示す。これは、HEK細胞またはEMX細胞におけるプライム編集の効率がトウループエレメントを含有するPEgRNAを用いて増大させられるが、インデル形成のパーセントは大きくは変化なしであるということを実証する。FIG. 71B shows the results of Example 18. This demonstrates that the efficiency of prime editing in HEK or EMX cells is increased using PEgRNA containing toe loop elements, but the percentage of indel formation is not significantly changed.

図72A~72Cはプライム編集に用いられ得る代替的なPEgRNA構成を図示する。図72Aはプライム編集のPE2:PEgRNA態様を図示する。この態様には、PEgRNAと複合体化したPE2(Cas9および逆転写酵素を含む融合タンパク質)が関わる(図1A-1Iおよび/または図3A-3Eにもまた記載されているとおり)。この態様では、逆転写の鋳型がsgRNAの3’伸長アーム上に組み込まれてPEgRNAを作り、DNAポリメラーゼ酵素はCas9に直接的に融合された逆転写酵素(RT)である。図72BはMS2cp-PE2:sgRNA+tPERT態様を図示する。この態様は、PE2融合体(Cas9+逆転写酵素)を含み、これがさらにMS2バクテリオファージコートタンパク質(MS2cp)に融合されてMS2cp-PE2融合タンパク質を形成する。プライム編集を達成するためには、MS2cp-PE2融合タンパク質はsgRNAと複合体化させられ、これは複合体をDNA上の特異的な標的部位へと標的化する。それから、態様には、トランスプライム編集RNA鋳型(「tPERT」)の導入が関わり、これは、プライマー結合部位(PBS)およびDNA合成鋳型を別個の分子、すなわちtPERTによって提供することによって、PEgRNAの代わりに作動する。これはMS2アプタマー(ステムループ)をもまた備える。MS2cpタンパク質は分子のMS2アプタマーに結合することによってtPERTを動員する。図72Cは、核酸分子の化学合成のための公知の方法によって達成され得るPEgRNAの代替的なデザインを図示する。例えば、プライム編集への使用のためのハイブリッドRNA/DNA PEgRNA分子を合成するために、化学合成が用いられ得、ハイブリッドPEgRNAの伸長アームはRNAの代わりにDNAである。かかる態様では、プライム編集によって形成される所望の遺伝子変化を含む3'DNAフラップを合成するために、DNA依存性DNAポリメラーゼが逆転写酵素の代わりに用いられ得る。別の態様では、伸長アームは、化学的リンカーを包含するように合成され得、これは、DNAポリメラーゼ(例えば逆転写酵素)がsgRNA骨格またはバックボーンを鋳型として用いることを防止する。なお別の態様では、伸長アームは、PEgRNA分子の総体的な向きに対して相対的に逆の向きを有するDNA合成鋳型を含み得る。例えば、sgRNA骨格の3'端に取り付けられた伸長を有するかつ5'から3'の向きのPEgRNAについて示されるとおりでは、DNA合成鋳型は、対向する方向、すなわち3'から5'の方向を向く。この態様は、gRNAの3’端に位置取った伸長アームを有するPEgRNA態様にとって有利であり得る。伸長アームの向きを逆にすることによって、ひとたびそれが伸長アームの新たな向きの5’に達すると、ポリメラーゼ(例えば逆転写酵素)によるDNA合成は終結し、それゆえに、鋳型としてgRNAコアを用いるリスクがないであろう。Figures 72A -72C illustrate alternative PEgRNA constructs that can be used for prime editing. Figure 72A illustrates the PE2:PEgRNA aspect of prime editing. This embodiment involves PE2 (a fusion protein comprising Cas9 and reverse transcriptase) complexed with PEgRNA (as also described in Figures 1A-1I and/or Figures 3A-3E). In this embodiment, the reverse transcription template is incorporated onto the 3' extending arm of the sgRNA to create PEgRNA, and the DNA polymerase enzyme is reverse transcriptase (RT) fused directly to Cas9. Figure 72B illustrates the MS2cp-PE2:sgRNA+tPERT embodiment. This embodiment includes a PE2 fusion (Cas9+reverse transcriptase), which is further fused to MS2 bacteriophage coat protein (MS2cp) to form an MS2cp-PE2 fusion protein. To achieve prime editing, the MS2cp-PE2 fusion protein is complexed with sgRNA, which targets the complex to a specific target site on the DNA. Embodiments then involve the introduction of trans-primed editing RNA templates ("tPERT"), which replace PEgRNA by providing the primer binding site (PBS) and DNA synthesis template by separate molecules, i.e., tPERT. It operates. It also contains the MS2 aptamer (stem-loop). The MS2cp protein recruits tPERT by binding to the MS2 aptamer molecule. Figure 72C illustrates an alternative design of PEgRNA that can be achieved by known methods for chemical synthesis of nucleic acid molecules. For example, chemical synthesis can be used to synthesize hybrid RNA/DNA PEgRNA molecules for use in prime editing, where the extended arms of the hybrid PEgRNA are DNA instead of RNA. In such embodiments, a DNA-dependent DNA polymerase can be used in place of reverse transcriptase to synthesize the 3' DNA flap containing the desired genetic change formed by prime editing. In another embodiment, the extension arm can be synthesized to include a chemical linker, which prevents DNA polymerases (eg, reverse transcriptase) from using the sgRNA scaffold or backbone as a template. In yet another embodiment, the elongated arm can include a DNA synthesis template that has an opposite orientation relative to the overall orientation of the PEgRNA molecule. For example, as shown for PEgRNA with an extension attached to the 3' end of the sgRNA backbone and oriented 5' to 3', the DNA synthesis template is oriented in the opposite direction, i.e. 3' to 5'. . This embodiment may be advantageous for PEgRNA embodiments with an extended arm positioned at the 3' end of the gRNA. By reversing the orientation of the elongated arm, DNA synthesis by the polymerase (e.g. reverse transcriptase) is terminated once it reaches the new orientation 5' of the elongated arm, thus using the gRNA core as a template. There would be no risk.

図73はtPERTおよびMS2動員システム(MS2タグ付け技術としてもまた公知)によるプライム編集を実証する。プライム編集因子タンパク質(PE2)を標的座位へと標的化するsgRNAが、プライマー結合部位(13ntまたは17nt PBS)、His6タグ挿入および相同アームをコードするRT鋳型、ならびにMS2アプタマー(tPERT分子の5'または3'端に位置付けられる)を含有するtPERTとの組み合わせで発現される。プライム編集因子タンパク質(PE2)、またはPE2のN末端へのMS2cpの融合体どちらかが用いられた。先に開発されたPE3システムのとおり、相補鎖ニッキングsgRNAありまたはなしで、編集が実行された(夫々標識「PE2+ニック」または「PE2」としてx軸上に指定されている)。これは「第2鎖ニッキング」ともまた言われ、本願において定められる。Figure 73 demonstrates prime editing with tPERT and the MS2 recruitment system (also known as MS2 tagging technology). The sgRNA that targets the prime editing factor protein (PE2) to the target locus contains an RT template encoding a primer binding site (13nt or 17nt PBS), a His6 tag insertion and a homology arm, and an MS2 aptamer (5' or 5' of the tPERT molecule). (located at the 3' end) in combination with tPERT. Either prime editing factor protein (PE2) or a fusion of MS2cp to the N-terminus of PE2 was used. As in the previously developed PE3 system, editing was performed with or without complementary strand nicking sgRNA (designated on the x-axis as labeled “PE2+nick” or “PE2”, respectively). This is also referred to as "second strand nicking" and is defined herein.

図74は、トランスでの逆転写酵素のMS2アプタマー発現とMS2アプタマーシステムによるその動員とを実証する。PEgRNAのPEgRNAは2つのsgRNA骨格ヘアピンのどちらか1つに挿入されたMS2 RNAアプタマーを含有する。野生型M-MLV逆転写酵素はMS2コートタンパク質(MCP)へのN末端またはC末端融合体として発現される。編集はHEK293T細胞のHEK3部位においてである。Figure 74 demonstrates MS2 aptamer expression of reverse transcriptase in trans and its recruitment by the MS2 aptamer system. PEgRNA PEgRNA contains an MS2 RNA aptamer inserted into either one of the two sgRNA backbone hairpins. Wild-type M-MLV reverse transcriptase is expressed as an N-terminal or C-terminal fusion to MS2 coat protein (MCP). The editing is at the HEK3 site in HEK293T cells.

図75は、PE2、PE2-trunc、PE3、およびPE3-truncの効率(すなわち「規定された編集またはインデルを有する配列決定総読取の%」)を種々の細胞株の異なる標的部位について比較する棒グラフを提供する。データは、短縮されたRTバリアントを含むプライム編集因子が短縮されていないRTタンパク質を含むプライム編集因子と約同じくらい効率的であったということを示す。Figure 75 provides a bar graph comparing the efficiency (i.e., "% of total sequencing reads with a defined edit or indel") of PE2, PE2-trunc, PE3, and PE3-trunc for different target sites in various cell lines. The data show that prime editors containing truncated RT variants were about as efficient as prime editors containing the untruncated RT protein.

図76は例20のインテイン分裂プライム編集因子の編集効率を実証する。HEK239T細胞が、全長PE2またはインテイン分裂PE2、PEgRNA、およびニッキングガイドRNAをコードするプラスミドによってトランスフェクションされた。コンセンサス配列(C末端エクステインのほとんどのアミノ末端残基)が指示されている。2つの部位におけるパーセント編集が示されている:HEK3 +1CTT挿入およびPRNP +6GからT。レプリケートn=3つの独立したトランスフェクション。例20を見よ。Figure 76 demonstrates the editing efficiency of the intein split prime editor of Example 20. HEK239T cells were transfected with plasmids encoding full-length PE2 or intein-split PE2, PEgRNA, and nicking guide RNA. The consensus sequence (most amino-terminal residues of the C-terminal extein) is indicated. Percent editing at two sites is shown: HEK3 +1CTT insertion and PRNP +6G to T. Replicates n = 3 independent transfections. See Example 20.

図77は例20のインテイン分裂プライム編集因子の編集効率を実証する。編集は、ICV注射によるP0マウスへのSpPE3半分当たり5E10vgおよび小量1E10の核局在GFP:KASHの送達によって、バルクの皮質およびGFP+亜集団の標的化されたディープ配列決定によって評価された。編集因子およびGFPがEFSプロモーターを有するAAV9にパッケージングされた。マウスが注射の3週間後に収穫され、GFP+核がフローサイトメトリーによって単離された。個々のデータポイントは、分析された条件当たり1-2マウスで示されている。例20を見よ。Figure 77 demonstrates the editing efficiency of the intein split prime editor of Example 20. Editing was assessed by targeted deep sequencing of the bulk cortex and GFP+ subpopulation by delivery of 5E10vg per half of SpPE3 and a small amount of 1E10 of nuclear-localized GFP:KASH to P0 mice by ICV injection. Editing factors and GFP were packaged into AAV9 with an EFS promoter. Mice were harvested 3 weeks after injection and GFP+ nuclei were isolated by flow cytometry. Individual data points are shown for 1-2 mice per condition analyzed. See Example 20.

図78は例20のインテイン分裂プライム編集因子の編集効率を実証する。具体的には、図は例20に用いるAV分裂SpPE3構築物を図示する。SpPE3-NおよびSpPE3-Cを別個に発現するAAV粒子による共形質導入はPE3活性を再現する。N末端ゲノムはニッキングsgRNAを発現するU6-sgRNAカセットを含有し、C末端ゲノムはPEgRNAを発現するU6-PEgRNAカセットを含有するということに注意せよ。例20を見よ。Figure 78 demonstrates the editing efficiency of the intein split prime editor of Example 20. Specifically, the figure illustrates the AV-split SpPE3 construct used in Example 20. Co-transduction with AAV particles expressing SpPE3-N and SpPE3-C separately recapitulates PE3 activity. Note that the N-terminal genome contains a U6-sgRNA cassette that expresses nicking sgRNA, and the C-terminal genome contains a U6-PEgRNA cassette that expresses PEgRNA. See Example 20.

図79は、例21で論じられるある種の最適化されたリンカーの編集効率を示す。特に、データは、リンカーが指示されている配列によって置き換えられた種々のバージョンと比較して、現行のリンカーを有するPE2構築物の編集効率(PE2と記される。白色のボックス)を、HEK3、EMX1、FANCF、RNF2座位において、トランジション、トランスバージョン、挿入、および欠失編集の代表的なPEgRNAについて示す。置き換えリンカーは「1×SGGS」(配列番号174)、「2×SGGS」(配列番号446)、「3×SGGS」(配列番号3889)、「1×XTEN」(配列番号171)、「リンカーなし」、「1×Gly」、「1×Pro」、「1×EAAAK」(配列番号3968)、「2×EAAAK」(配列番号3969)、および「3×EAAAK」(配列番号3970)と言われる。編集効率はPE2の「対照」編集効率に対して相対的に棒グラフフォーマットで測定される。PE2のリンカーはSGGSSGGSSGSETPGTSESATPESSGGSSGGSS(配列番号127)である。全ての編集はPE3システムという文脈でされた。すなわち、これはPE2編集構築物プラス最適な二次sgRNAニッキングガイドの追加を言う。例21を見よ。FIG. 79 shows the editing efficiency of certain optimized linkers discussed in Example 21. In particular, the data show the editing efficiency of the PE2 construct with the current linker (marked as PE2; white box) compared to various versions in which the linker was replaced by the indicated sequence, HEK3, EMX1 , FANCF, and RNF2 loci, representative PEgRNAs undergoing transition, transversion, insertion, and deletion editing are shown. Replacement linkers are “1×SGGS” (SEQ ID NO: 174) , “2×SGGS” (SEQ ID NO: 446) , “3×SGGS” (SEQ ID NO: 3889) , “1×XTEN” (SEQ ID NO: 171) , “No linker ”, “1×Gly”, “1×Pro”, “1×EAAAK” (SEQ ID NO: 3968) , “2×EAAAK” (SEQ ID NO: 3969) , and “3×EAAAK” (SEQ ID NO: 3970) . Editing efficiency is measured in bar graph format relative to the PE2 "control" editing efficiency. The linker for PE2 is SGGSSGGSSGSETPGTSESATPESSGGSSGGSS (SEQ ID NO: 127). All editing was done in the context of the PE3 system. Namely, this refers to the PE2 editing construct plus the addition of an optimal secondary sgRNA nicking guide. See Example 21.

PE2に対して相対的に平均の~倍の効力を取ることは、示されているグラフを生み、1×XTEN(配列番号171)リンカー配列の使用が編集効率を平均で1.14倍改善するということを指示する(n=15)。例21を見よ。Taking the average fold potency relative to PE2 produces the graph shown, indicating that use of the 1×XTEN (SEQ ID NO: 171) linker sequence improves editing efficiency by an average of 1.14-fold (n=15). See Example 21.

図81は、例22に記載されているとおり、異なるプロモーターからのPEgRNAの転写レベルを図示する。FIG. 81 illustrates the transcription levels of PEgRNA from different promoters as described in Example 22.

例22に図示されているとおり、未改変のPEgRNAに対して相対的な編集効率に対するPEgRNA構造上の異なる型の修飾のインパクト。Impact of different types of modifications on PEgRNA structure on editing efficiency relative to unmodified PEgRNA, as illustrated in Example 22.

図83は、HEK3遺伝子の編集を標的化したPE実験を図示する。ニック部位に対して相対的に位置+1における10nt挿入の挿入を特異的に標的化し、PE3を用いた。例22を見よ。Figure 83 illustrates a PE experiment targeting editing of the HEK3 gene. PE3 was used to specifically target the insertion of a 10 nt insert at position +1 relative to the nick site. See Example 22.

図84Aは、スペーサー、gRNAコア、および伸長アーム(RT鋳型+プライマー結合部位)を有する例示のPEgRNAを図示する。これは、UCUリンカーを介してカップリングされたtRNA分子によってPEgRNAの3'端を修飾されている。tRNAは種々の転写後修飾を包含する。しかしながら、前記修飾は要求されない。Figure 84A illustrates an exemplary PEgRNA with a spacer, gRNA core, and extended arm (RT template + primer binding site). It is modified at the 3' end of PEgRNA by a tRNA molecule coupled via a UCU linker. tRNA encompasses a variety of post-transcriptional modifications. However, said modification is not required.

図84Bは、PEgRNA構造を改変するために用いられ得るtRNAの構造を図示する。例22を見よ。P1は長さが可変であり得る。P1は、PEgRNA-tRNA融合体のRNAsePプロセシングを防止することを助けるように伸長され得る。Figure 84B illustrates the structure of tRNA that can be used to modify PEgRNA structure. See Example 22. P1 can be variable in length. P1 can be extended to help prevent RNAseP processing of PEgRNA-tRNA fusions.

図85はFANCF遺伝子の編集を標的化したPE実験を図示する。ニック部位に対して相対的に位置+5におけるGからTの変換を特異的に標的化し、PE3構築物を用いた。例22を見よ。Figure 85 illustrates a PE experiment targeting editing of the FANCF gene. The PE3 construct was used to specifically target the G to T conversion at position +5 relative to the nick site. See Example 22.

図86はHEK3遺伝子の編集を標的化したPE実験を図示する。ニック部位に対して相対的に位置+1における71nt FLAGタグ挿入の挿入を特異的に標的化し、PE3構築物を用いた。例22を見よ。Figure 86 illustrates a PE experiment targeting editing of the HEK3 gene. The PE3 construct was used to specifically target the insertion of a 71 nt FLAG tag insert at position +1 relative to the nick site. See Example 22.

pegRNAが1412Adelを組み入れるN2A細胞のスクリーニングからの結果と、プライマー結合部位(PBS)長さおよび逆転写酵素(RT)鋳型長さの詳細(インデルありおよびなしで示されている)。例23を見よ。Results from a screen of N2A cells where pegRNA incorporates 1412Adel and details of primer binding site (PBS) length and reverse transcriptase (RT) template length (shown with and without indel). See Example 23.

pegRNAが1412Adelを組み入れるN2A細胞のスクリーニングからの結果と、プライマー結合部位(PBS)長さおよび逆転写酵素(RT)鋳型長さの詳細(インデルありおよびなしで示されている)。例23を見よ。Results from a screen of N2A cells where pegRNA incorporates 1412Adel and details of primer binding site (PBS) length and reverse transcriptase (RT) template length (shown with and without indel). See Example 23.

図89は、健康なHSCのβ-グロビン遺伝子の近位(proxy)座位におけるおよびHEK3における編集の結果を図示する。編集因子対pegRNAおよびニッキングgRNAの濃度を変えている。例23を見よ。Figure 89 illustrates the results of editing at the proxy locus of the β-globin gene in healthy HSCs and in HEK3. Varying the concentrations of editing factors versus pegRNA and nicking gRNA. See Example 23.

定義
別様に定められない限り、本願において用いられる全ての技術的および科学的用語は、本発明が属する分野の業者によって普通に理解される意味を有する。次の参照は、本発明に用いられる用語の多くの一般的な定義を当業者に提供する:Singleton et al.,Dictionary of Microbiology and Molecular Biology(2nd ed.1994);The Cambridge Dictionary of Science and Technology(Walker ed.,1988);The Glossary of Genetics,5th Ed.,R.Rieger et al.(eds.),Springer Verlag(1991);およびHale & Marham,The Harper Collins Dictionary of Biology(1991)。別様に規定されない限り、本願において用いられる次の用語はそれらに帰せられる意味を有する。
Definitions Unless defined otherwise, all technical and scientific terms used in this application have the meanings commonly understood by one of ordinary skill in the art to which this invention belongs. The following references provide those skilled in the art with general definitions of many of the terms used in this invention: Singleton et al., Dictionary of Microbiology and Molecular Biology (2nd ed. 1994); The Cambridge Dictionary of Science and Technology (Walker ed., 1988); The Glossary of Genetics, 5th Ed., R. Rieger et al. (eds.), Springer Verlag (1991); and Hale & Marham, The Harper Collins Dictionary of Biology (1991). Unless otherwise defined, the following terms used in this application have the meanings ascribed to them.

アンチセンス鎖
遺伝学において、二本鎖のDNA内のセグメントの「アンチセンス」鎖は、鋳型鎖であって、3'→5'配向に伸びる(runs)と考えられる。これに反して、「センス」鎖は、5'から3'へ伸びる二本鎖のDNA内のセグメントであって、3'から5'へ伸びるDNAのアンチセンス鎖または鋳型鎖に相補的である。タンパク質をコードするDNAセグメントのケースにおいて、センス鎖は、転写の最中にその鋳型としてアンチセンス鎖を取り結局(典型的には、常にではない)翻訳を経てタンパク質になるmRNAと同じ配列を有するDNAの鎖である。よって、アンチセンス鎖は、後にタンパク質へ翻訳されるRNAを担い、一方センス鎖は、mRNAとほぼ同一の組成(makeup)を保有する。dsDNAの各セグメントについて、一方がどの方向から読まれるかに応じて、おそらく(センスおよびアンチセンスは視点に相対するから)センスおよびアンチセンスが2組存在するであろう点に留意する。遺伝子産物またはmRNAは結局、dsDNAの一方のセグメントのどちらかの鎖がセンスまたはアンチセンスと称されることを示す。
Antisense strand In genetics, the "antisense" strand of a segment of double-stranded DNA is considered to be the template strand, running in a 3'→5' direction. In contrast, the "sense" strand is the segment of double-stranded DNA running 5' to 3' and is complementary to the antisense or template strand of the 3' to 5' DNA. In the case of a DNA segment coding for a protein, the sense strand is the strand of DNA with the same sequence as the mRNA that takes the antisense strand as its template during transcription and ends up (typically, but not always) being translated into a protein. Thus, the antisense strand carries the RNA that is subsequently translated into a protein, while the sense strand possesses nearly identical makeup to the mRNA. Note that for each segment of dsDNA, there will likely be two sets of sense and antisense (since sense and antisense are relative viewpoints), depending on which direction one is read from. The gene product or mRNA ultimately refers to either strand of a segment of dsDNA, which is referred to as sense or antisense.

二重特異性リガンド
本願において用いられる用語「二重特異性リガンド」または「二重特異性部分」は、2つの異なるリガンド結合ドメインに結合するリガンドを言う。ある態様において、リガンドは低分子化合物またはペプチドまたはポリペプチドである。他の態様において、リガンド結合ドメインは「二量体化ドメイン」であり、これがペプチドタグとしてタンパク質上に組み入れられ得る。種々の態様では、同じかまたは異なる二量体化ドメインを夫々が含む2つのタンパク質が、二重特異性リガンドに対する各二量体化ドメインの結合によって二量体化するように誘導され得る。本願において用いられる「二重特異性リガンド」は同等に「二量体化の化学的誘導因子」または「CID」と言われ得る。
Dual Specific Ligands The term “bispecific ligand” or “bispecific moiety” as used herein refers to a ligand that binds to two different ligand binding domains. In certain embodiments, the ligand is a small molecule compound or a peptide or polypeptide. In other embodiments, the ligand binding domain is a "dimerization domain," which can be incorporated onto the protein as a peptide tag. In various embodiments, two proteins each containing the same or different dimerization domains can be induced to dimerize by binding of each dimerization domain to a bispecific ligand. As used herein, a "bispecific ligand" can equivalently be referred to as a "chemical inducer of dimerization" or "CID."

Cas9
用語「Cas9」または「Cas9ヌクレアーゼ」は、Cas9ドメインまたはそのフラグメントを含む、RNAにガイドされるヌクレアーゼ(例として、Cas9の活性もしくは不活性なDNA切断ドメインおよび/またはCas9のgRNA結合ドメインを含むタンパク質)を指す。「Cas9ドメイン」は、本明細書に使用されるとき、Cas9の活性もしくは不活性な切断ドメインおよび/またはCas9のgRNA結合ドメインを含むタンパク質フラグメントである。「Cas9タンパク質」は、全長Cas9タンパク質である。Cas9ヌクレアーゼはまた、ときにcasn1ヌクレアーゼまたはCRISPR(クラスター化して規則的な配置の短い回文配列反復(Clustered Regularly Interspaced Short Palindromic Repeat))関連ヌクレアーゼとしても言及される。CRISPRは、可動遺伝因子(ウイルス、転移因子、および接合性プラスミド)に対して保護を提供する適応免疫系である。CRISPRクラスターは、スペーサー、先行する可動因子に相補的な配列、および標的化侵入核酸を含有する。CRISPRクラスターは転写され、プロセスを受けて(processed)CRISPR RNA(crRNA)になる。II型CRISPR系において、pre-crRNAの修正プロセシングは、transでコードされた低分子(small)RNA(tracrRNA)、内生リボヌクレアーゼ3(rnc)、およびCas9ドメインを要する。tracrRNAは、pre-crRNAの、リボヌクレアーゼ3に補助された(-aided)プロセシングのためのガイドとして働く。続いて、Cas9/crRNA/tracrRNAは、スペーサーに相補的な線状または環状のdsDNA標的をエンドヌクレアーゼ的に切断する。crRNAに相補的ではない標的鎖は、最初にエンドヌクレアーゼ的に切られ、次いで3'-5'エキソヌクレアーゼ的に切り取られる。本来、DNAの結合および切断は、典型的には、タンパク質および両RNAを要する。しかしながら、単一ガイドRNA(「sgRNA」、または単に「gNRA」)は、crRNAとtracrRNAとの両方の側面を単一RNA種中へ組み込むために、改変され得る。例として、Jinek M.,Chylinski K.,Fonfara I.,Hauer M.,Doudna J.A.,Charpentier E.Science 337:816-821(2012)を参照(この内容全体は参照により本明細書に組み込まれる)。Cas9は、CRISPR反復配列(PAMまたはプロトスペーサー隣接モチーフ)中の短いモチーフを認識することで、自己・対・非自己を区別するのに役立つ。Cas9ヌクレアーゼ配列および構造は当業者に周知である(例として、“Complete genome sequence of an M1 strain of Streptococcus pyogenes.”Ferretti et al.,J.J.,McShan W.M.,Ajdic D.J.,Savic D.J.,Savic G.,Lyon K.,Primeaux C.,Sezate S.,Suvorov A.N.,Kenton S.,Lai H.S.,Lin S.P.,Qian Y.,Jia H.G.,Najar F.Z.,Ren Q.,Zhu H.,Song L.,White J.,Yuan X.,Clifton S.W.,Roe B.A.,McLaughlin R.E.,Proc.Natl.Acad.Sci.U.S.A.98:4658-4663(2001);“CRISPR RNA maturation by trans-encoded small RNA and host factor RNase III.”Deltcheva E.,Chylinski K.,Sharma C.M.,Gonzales K.,Chao Y.,Pirzada Z.A.,Eckert M.R.,Vogel J.,Charpentier E.,Nature 471:602-607(2011);および“A programmable dual-RNA-guided DNA endonuclease in adaptive bacterial immunity.”Jinek M.,Chylinski K.,Fonfara I.,Hauer M.,Doudna J.A.,Charpentier E.Science 337:816-821(2012)を参照(これら各々の内容全体は参照により本明細書に組み込まれる))。Cas9オルソログは、これらに限定されないが、S.pyogenesおよびS.thermophilusを包含する様々な種において記載されている。追加の好適なCas9ヌクレアーゼおよび配列は、本開示に基づき当業者に明らかであろう。またかかるCas9ヌクレアーゼおよび配列は、Chylinski, Rhun, and Charpentier,“The tracrRNA and Cas9 families of type II CRISPR-Cas immunity systems”(2013)RNA Biology 10:5,726-737(この内容全体は参照により本明細書に組み込まれる)に開示された生物および遺伝子座からのCas9配列を包含する。いくつかの態様において、Cas9ヌクレアーゼは、DNA切断ドメインを部分的に損なうかまたは不活性化させる1以上の突然変異を含む。
Cas9
The term "Cas9" or "Cas9 nuclease" refers to an RNA-guided nuclease that contains a Cas9 domain or fragment thereof (e.g., a protein that contains an active or inactive DNA cleavage domain of Cas9 and/or a gRNA binding domain of Cas9). ). A "Cas9 domain" as used herein is a protein fragment that includes an active or inactive cleavage domain of Cas9 and/or a gRNA binding domain of Cas9. "Cas9 protein" is full length Cas9 protein. Cas9 nuclease is also sometimes referred to as casn1 nuclease or CRISPR ( Clustered Regularly Interspaced Short Palindromic Repeat)-related nuclease . CRISPR is an adaptive immune system that provides protection against mobile genetic elements (viruses, transposable elements, and conjugative plasmids). A CRISPR cluster contains a spacer, a sequence complementary to the preceding mobile element, and a targeting invading nucleic acid. CRISPR clusters are transcribed and processed into CRISPR RNA (crRNA). In type II CRISPR systems, corrective processing of pre-crRNA requires trans-encoded small RNA (tracrRNA), endogenous ribonuclease 3 (rnc), and a Cas9 domain. tracrRNA serves as a guide for ribonuclease 3-aided processing of pre-crRNA. Cas9/crRNA/tracrRNA then endonucleolytically cleaves the linear or circular dsDNA target complementary to the spacer. Target strands that are not complementary to the crRNA are first endonucleolytically excised and then 3'-5' exonucleolytically excised. In nature, DNA binding and cleavage typically requires proteins and both RNA. However, a single guide RNA ("sgRNA", or simply "gNRA") can be modified to incorporate aspects of both crRNA and tracrRNA into a single RNA species. See, e.g., Jinek M., Chylinski K., Fonfara I., Hauer M., Doudna JA, Charpentier E. Science 337:816-821 (2012), the entire contents of which are incorporated herein by reference. . Cas9 helps distinguish between self versus non-self by recognizing short motifs in CRISPR repeats (PAM or protospacer-adjacent motifs). Cas9 nuclease sequences and structures are well known to those skilled in the art (e.g., “Complete genome sequence of an M1 strain of Streptococcus pyogenes.” Ferretti et al., JJ, McShan WM, Ajdic DJ, Savic DJ, Savic G., Lyon K., Primeaux C., Sezate S., Suvorov AN, Kenton S., Lai HS, Lin SP, Qian Y., Jia HG, Najar FZ, Ren Q., Zhu H., Song L., White J., Yuan X.,Clifton SW,Roe BA,McLaughlin RE,Proc.Natl.Acad.Sci.USA98:4658-4663(2001);“CRISPR RNA maturation by trans-encoded small RNA and host factor RNase III.”Deltcheva E. , Chylinski K., Sharma CM, Gonzales K., Chao Y., Pirzada ZA, Eckert MR, Vogel J., Charpentier E., Nature 471:602-607(2011); Endonuclease in adaptive bacterial immunity.” Jinek M., Chylinski K., Fonfara I., Hauer M., Doudna JA, Charpentier E. Science 337:816-821 (2012) (the entire content of each of which is incorporated herein by reference). (incorporated into the specification)). Cas9 orthologs have been described in various species including, but not limited to, S. pyogenes and S. thermophilus. Additional suitable Cas9 nucleases and sequences will be apparent to those skilled in the art based on this disclosure. Such Cas9 nucleases and sequences are also described in Chylinski, Rhun, and Charpentier, “The tracrRNA and Cas9 families of type II CRISPR-Cas immunity systems” (2013) RNA Biology 10:5,726-737, the entire contents of which are incorporated herein by reference. Cas9 sequences from the organisms and loci disclosed in (incorporated into). In some embodiments, the Cas9 nuclease contains one or more mutations that partially impair or inactivate the DNA cleavage domain.

ヌクレアーゼが不活性化されたCas9ドメインは、互換的に「dCas9」タンパク質(ヌクレアーゼが「不活性型」のCas9を表す)と称されてもよい。不活性なDNA切断ドメインを有するCas9ドメイン(またはそのフラグメント)を生成するための方法は知られている(例として、Jinek et al.,Science.337:816-821(2012);Qi et al.,“Repurposing CRISPR as an RNA-Guided Platform for Sequence-Specific Control of Gene Expression”(2013)Cell.28;152(5):1173-83を参照(これら各々の内容全体は参照により本明細書に組み込まれる))。例えば、Cas9のDNA切断ドメインは、2つのサブドメイン、HNHヌクレアーゼサブドメインおよびRuvC1サブドメインを包含することが知られている。HNHサブドメインはgRNAに相補的な鎖を切断するのに対し、RuvC1サブドメインは非相補鎖を切断する。これらのサブドメイン内の突然変異は、Cas9のヌクレアーゼ活性をサイレンシングさせ(silence)得る。例えば、突然変異D10AおよびH840Aは、S.pyogenes Cas9のヌクレアーゼ活性を完全に不活性化する(Jinek et al.,Science.337:816-821(2012);Qi et al.,Cell.28;152(5):1173-83(2013))。いくつかの態様において、Cas9のフラグメントを含むタンパク質が提供される。例えば、いくつかの態様において、タンパク質は、2つのCas9ドメイン:(1)Cas9のgRNA結合ドメイン;または(2)Cas9のDNA切断ドメインのうち一方を含む。いくつかの態様において、Cas9を含むタンパク質またはそのフラグメントは、「Cas9バリアント」と称される。Cas9バリアントは、Cas9またはそのフラグメントとの相同性を共有する。例えば、Cas9バリアントは、野生型Cas9(例として、配列番号18のSpCas9)と、少なくとも約70%同一、少なくとも約80%同一、少なくとも約90%同一、少なくとも約95%同一、少なくとも約96%同一、少なくとも約97%同一、少なくとも約98%同一、少なくとも約99%同一、少なくとも約99.5%同一、少なくとも約99.8%同一、または少なくとも約99.9%同一である。いくつかの態様において、Cas9バリアントは、野生型Cas9(例として、配列番号18のSpCas9)と比較して、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、21、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、またはそれ以上のアミノ酸変化を有していてもよい。いくつかの態様において、Cas9バリアントは、そのフラグメントが、野生型Cas9(例として、配列番号18のSpCas9)の対応するフラグメントと、少なくとも約70%同一、少なくとも約80%同一、少なくとも約90%同一、少なくとも約95%同一、少なくとも約96%同一、少なくとも約97%同一、少なくとも約98%同一、少なくとも約99%同一、少なくとも約99.5%同一、または少なくとも約99.9%同一となるように、配列番号X Cas9のフラグメント(例として、gRNA結合ドメインまたはDNA切断ドメイン)を含む。いくつかの態様において、フラグメントは、対応する野生型Cas9(例として、配列番号18のSpCas9)のアミノ酸の長さの、少なくとも30%、少なくとも35%、少なくとも40%、少なくとも45%、少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%同一の、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも99.5%である。 A Cas9 domain with nuclease inactivation may be interchangeably referred to as a "dCas9" protein (representing the nuclease "inactive" form of Cas9). Methods for generating Cas9 domains (or fragments thereof) with inactive DNA cleavage domains are known (see, for example, Jinek et al., Science. 337:816-821 (2012); Qi et al. , “Repurposing CRISPR as an RNA-Guided Platform for Sequence-Specific Control of Gene Expression” (2013) Cell.28;152(5):1173-83, the entire contents of each of which are incorporated herein by reference. )). For example, the DNA cleavage domain of Cas9 is known to include two subdomains, the HNH nuclease subdomain and the RuvC1 subdomain. The HNH subdomain cleaves the complementary strand to gRNA, whereas the RuvC1 subdomain cleaves the non-complementary strand. Mutations within these subdomains can silence the nuclease activity of Cas9. For example, mutations D10A and H840A completely inactivate the nuclease activity of S.pyogenes Cas9 (Jinek et al.,Science.337:816-821(2012);Qi et al.,Cell.28;152 (5):1173-83(2013)). In some embodiments, proteins are provided that include fragments of Cas9. For example, in some embodiments, the protein comprises one of two Cas9 domains: (1) the gRNA binding domain of Cas9; or (2) the DNA cleavage domain of Cas9. In some embodiments, a Cas9-comprising protein or fragment thereof is referred to as a "Cas9 variant." Cas9 variants share homology with Cas9 or fragments thereof. For example, the Cas9 variant is at least about 70% identical, at least about 80% identical, at least about 90% identical, at least about 95% identical, at least about 96% identical to wild-type Cas9 (e.g., SpCas9 of SEQ ID NO: 18). , at least about 97% identical, at least about 98% identical, at least about 99% identical, at least about 99.5% identical, at least about 99.8% identical, or at least about 99.9% identical. In some embodiments, the Cas9 variant is 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 21, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, May have 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, or more amino acid changes. In some embodiments, the Cas9 variant has a fragment thereof that is at least about 70% identical, at least about 80% identical, at least about 90% identical to the corresponding fragment of wild-type Cas9 (e.g., SpCas9 of SEQ ID NO: 18). , at least about 95% identical, at least about 96% identical, at least about 97% identical, at least about 98% identical, at least about 99% identical, at least about 99.5% identical, or at least about 99.9% identical, Contains a fragment of X Cas9 (eg, gRNA binding domain or DNA cleavage domain). In some embodiments, the fragment is at least 30%, at least 35%, at least 40%, at least 45%, at least 50% of the amino acid length of the corresponding wild-type Cas9 (e.g., SpCas9 of SEQ ID NO: 18). , at least 55%, at least 60%, at least 65%, at least 70%, at least 75%, at least 80%, at least 85%, at least 90%, at least 95% identical, at least 96%, at least 97%, at least 98% , at least 99%, or at least 99.5%.

cDNA
用語「cDNA」は、RNA鋳型からコピーされたDNAの鎖を指す。cDNAは、RNA鋳型に相補的である。
cDNA
The term "cDNA" refers to a strand of DNA copied from an RNA template. cDNA is complementary to the RNA template.

循環置換体
本明細書に使用されるとき、用語「循環置換体(circular permutant)」は、タンパク質のアミノ酸配列中に現れるアミノ酸の順序の変化を伴うタンパク質の構造上の立体配置における変化である循環置換(circular permutation)を含むタンパク質またはポリペプチド(例として、Cas9)を指す。換言すれば、循環置換体は、野生型対応物と比較してN末端およびC末端が変更されたタンパク質であり、例として、野生型タンパク質のC末端半分が新しいN末端半分になっている。循環置換(またはCP)は本質的に、そのN末端およびC末端が接続され、しばしばペプチドリンカーをもつ、タンパク質1次配列の形態上の再配置であるが、同時にその配列を異なる位置にて分裂させることで、隣接していた新しいN末端およびC末端が創出される。その結果は、接続が異なるが、しばしば同じか全体的には同様の3次元の(3D)形状を有し得るタンパク質構造であって、おそらく、改善または変更された特徴(タンパク分解への低減された感受性、改善された触媒活性、変更された基質結合もしくはリガンド結合、および/または改善された熱安定性を包含する)を包含する。循環置換タンパク質は天然に存在し得る(例として、コンカナバリンAおよびレクチン)。加えて、循環置換は、翻訳後修飾の結果として生じ得るか、または組換え技法を使用して改変されてもよい。
Circular permutant As used herein, the term "circular permutant" refers to a circular permutant that is a change in the structural configuration of a protein that involves a change in the order of the amino acids that occur in the protein's amino acid sequence. Refers to a protein or polypeptide (eg, Cas9) that contains a circular permutation. In other words, a circular permutant is a protein that has an altered N-terminus and C-terminus compared to its wild-type counterpart, eg, the C-terminal half of the wild-type protein has become a new N-terminal half. Circular permutation (or CP) is essentially a morphological rearrangement of a protein's primary sequence, with its N-terminus and C-terminus connected, often with a peptide linker, but at the same time splitting the sequence at a different position. This creates new adjacent N- and C-termini. The result is a protein structure that may have different connections but often the same or overall similar three-dimensional (3D) shape, perhaps with improved or altered features (reduced susceptibility to proteolysis). improved catalytic activity, altered substrate or ligand binding, and/or improved thermal stability). Circularly permuted proteins may occur in nature (eg, concanavalin A and lectins). Additionally, circular substitutions may occur as a result of post-translational modifications or may be modified using recombinant techniques.

循環置換されたCas9
用語「循環置換されたCas9」は、循環置換体として生じたものであり、これによってそのN末端およびC末端が局所的に再配置された、いずれのCas9タンパク質またはそのバリアントも指す。循環置換されたかかるCas9タンパク質(「CP-Cas9」)、またはそれらのバリアントは、ガイドRNA(gRNA)と複合体化されたときのDNAへの結合能を保持している。Oakes et al.,“Protein Engineering of Cas9 for enhanced function,”Methods Enzymol,2014,546:491-511およびOakes et al.,“CRISPR-Cas9 Circular Permutants as Programmable Scaffolds for Genome Modification,”Cell,January10,2019,176:254-267を参照(これらの各々は参照により本明細書に組み込まれる)。本開示は、これまでに知られているいずれのCP-Cas9も企図するか、または新しいCP-Cas9を、その結果得られた循環置換タンパク質がガイドRNA(gRNA)と複合体化されたときのDNAへの結合能を保持している限り、使用する。例示のCP-Cas9タンパク質は、配列番号77~86である。
Circularly permuted Cas9
The term "circularly permuted Cas9" refers to any Cas9 protein or variant thereof that has arisen as a circular permutant, whereby its N-terminus and C-terminus have been locally rearranged. Such circularly permuted Cas9 proteins (“CP-Cas9”), or variants thereof, retain the ability to bind to DNA when complexed with guide RNA (gRNA). Oakes et al., “Protein Engineering of Cas9 for enhanced function,” Methods Enzymol, 2014, 546: 491-511 and Oakes et al., “CRISPR-Cas9 Circular Permutants as Programmable Scaffolds for Genome Modification,” Cell, January 10, 2019 , 176:254-267, each of which is incorporated herein by reference. The present disclosure contemplates any previously known CP-Cas9 or a new CP-Cas9 when the resulting circularly permuted protein is complexed with a guide RNA (gRNA). Use as long as it retains the ability to bind to DNA. Exemplary CP-Cas9 proteins are SEQ ID NOs: 77-86.

CRISPR
CRISPRは、原核生物に侵入したウイルスによる先行する感染のスニペットを表す細菌および古細菌におけるDNA配列(すなわちCRISPRクラスター)のファミリーである。DNAのスニペットは、類似のウイルスによる爾後の攻撃からのDNAを検出および破壊するために原核細胞によって用いられ、CRISPR関連タンパク質(Cas9およびそのホモログを包含する)およびCRISPR関連RNAのアレイと併せて、有効に原核生物免疫防御システムを成す。天然では、CRISPRクラスターはCRISPR RNA(crRNA)へと転写およびプロセシングされる。ある種の型のCRISPRシステム(例えば、II型CRISPRシステム)では、プレcrRNAの正しいプロセシングは、トランスにコードされる低分子RNA(tracrRNA)、内生リボヌクレアーゼ3(rnc)、およびCas9タンパク質を要求する。tracrRNAはプレcrRNAのリボヌクレアーゼ3によって支援されるプロセシングのためのガイドとしての用をなす。爾後に、Cas9/crRNA/tracrRNAはRNAに対して相補的な直線状または環状dsDNA標的をエンド的に切断する。具体的には、crRNAに対して相補的でない標的鎖が第1にエンド的にカットされ、それから3'-5'エキソ的にトリミングされる。天然では、DNA結合および切断は典型的にはタンパク質および両方のRNAを要求する。しかしながら、シングルガイドRNA(「sgRNA」または単純に「gNRA」)が、crRNAおよびtracrRNA両方の側面を単一のRNA種のガイドRNAに組み込むようにして操作され得る。例えば、Jinek M., Chylinski K., Fonfara I., Hauer M., Doudna J.A., Charpentier E. Science 337:816-821(2012)を見よ。これの内容全体は参照によってここに組み込まれる。Cas9はCRISPR反復配列上の短いモチーフ(PAMまたはプロトスペーサー隣接モチーフ)を認識して、自己対非自己を見分けることを助ける。CRISPR生物学ならびにCas9ヌクレアーゼ配列および構造は当業者には周知である(例えば、“Complete genome sequence of an M1 strain of Streptococcus pyogenes.”Ferretti et al.,J.J.,McShan W.M.,Ajdic D.J.,Savic D.J.,Savic G.,Lyon K.,Primeaux C.,Sezate S.,Suvorov A.N.,Kenton S.,Lai H.S.,Lin S.P.,Qian Y.,Jia H.G.,Najar F.Z.,Ren Q.,Zhu H.,Song L.,White J.,Yuan X.,Clifton S.W.,Roe B.A.,McLaughlin R.E.,Proc.Natl.Acad.Sci.U.S.A.98:4658-4663(2001);“CRISPR RNA maturation by trans-encoded small RNA and host factor RNase III.”Deltcheva E.,Chylinski K.,Sharma C.M.,Gonzales K.,Chao Y.,Pirzada Z.A.,Eckert M.R.,Vogel J.,Charpentier E.,Nature 471:602-607(2011);および“A programmable dual-RNA-guided DNA endonuclease in adaptive bacterial immunity.”Jinek M.,Chylinski K.,Fonfara I.,Hauer M.,Doudna J.A.,Charpentier E.Science 337:816-821(2012)を見よ。これらの夫々の内容全体は参照によって本願に組み込まれる)。Cas9オーソログはS. pyogenesおよびS. thermophilusを包含するがこれらに限定されない種々の種において記載されている。追加の好適なCas9ヌクレアーゼおよび配列は本開示に基づいて当業者には明らかであろう。かかるCas9ヌクレアーゼおよび配列は、Chylinski,Rhun,and Charpentier,“The tracrRNA and Cas9 families of type II CRISPR-Cas immunity systems”(2013)RNA Biology 10:5,726-737に開示されている生物および座位からのCas9配列を包含する;これの内容全体は参照によって本願に組み込まれる。
CRISPR
CRISPR is a family of DNA sequences (i.e., CRISPR clusters) in bacteria and archaea that represent a snippet of a previous infection by a virus that invaded prokaryotes. Snippets of DNA are used by prokaryotic cells to detect and destroy DNA from subsequent attacks by similar viruses, and together with an array of CRISPR-associated proteins (including Cas9 and its homologs) and CRISPR-associated RNAs. It effectively constitutes a prokaryotic immune defense system. In nature, CRISPR clusters are transcribed and processed into CRISPR RNA (crRNA). In some types of CRISPR systems (e.g., type II CRISPR systems), correct processing of pre-crRNA requires trans-encoded small RNA (tracrRNA), endogenous ribonuclease 3 (rnc), and the Cas9 protein. . tracrRNA serves as a guide for pre-crRNA ribonuclease 3-assisted processing. Cas9/crRNA/tracrRNA then endo-cleaves linear or circular dsDNA targets that are complementary to the RNA. Specifically, target strands that are not complementary to the crRNA are first cut endo-wise and then trimmed 3'-5' exo-wise. In nature, DNA binding and cleavage typically requires proteins and both RNA. However, single guide RNAs ("sgRNAs" or simply "gNRAs") can be engineered to incorporate aspects of both crRNA and tracrRNA into a single RNA species guide RNA. See, e.g., Jinek M., Chylinski K., Fonfara I., Hauer M., Doudna JA, Charpentier E. Science 337:816-821 (2012). The entire contents of this are incorporated herein by reference. Cas9 recognizes short motifs on CRISPR repeats (PAM or protospacer-adjacent motifs) to help distinguish self from non-self. CRISPR biology and Cas9 nuclease sequence and structure are well known to those skilled in the art (e.g., “Complete genome sequence of an M1 strain of Streptococcus pyogenes.” Ferretti et al., JJ, McShan WM, Ajdic DJ, Savic DJ, Savic G., Lyon K., Primeaux C., Sezate S., Suvorov AN, Kenton S., Lai HS, Lin SP, Qian Y., Jia HG, Najar FZ, Ren Q., Zhu H., Song L., White J.,Yuan X.,Clifton SW,Roe BA,McLaughlin RE,Proc.Natl.Acad.Sci.USA98:4658-4663(2001);“CRISPR RNA maturation by trans-encoded small RNA and host factor RNase III. “Deltcheva E., Chylinski K., Sharma CM, Gonzales K., Chao Y., Pirzada ZA, Eckert MR, Vogel J., Charpentier E., Nature 471:602-607(2011); and “A programmable dual- RNA-guided DNA endonuclease in adaptive bacterial immunity.”Jinek M., Chylinski K., Fonfara I., Hauer M., Doudna JA, Charpentier E. Science 337:816-821 (2012). (Incorporated herein by reference in its entirety). Cas9 orthologs have been described in various species including, but not limited to, S. pyogenes and S. thermophilus. Additional suitable Cas9 nucleases and sequences will be apparent to those skilled in the art based on this disclosure. Such Cas9 nucleases and sequences include Cas9 nucleases from the organisms and loci disclosed in Chylinski, Rhun, and Charpentier, “The tracrRNA and Cas9 families of type II CRISPR-Cas immunity systems” (2013) RNA Biology 10:5,726-737. the entire contents of which are incorporated herein by reference.

ある種の型のCRISPRシステム(例えば、II型CRISPRシステム)では、プレcrRNAの正しいプロセシングは、トランスにコードされる低分子RNA(tracrRNA)、内生リボヌクレアーゼ3(rnc)、およびCas9タンパク質を要求する。tracrRNAは、プレcrRNAのリボヌクレアーゼ3によって支援されるプロセシングのためのガイドとしての用をなす。爾後に、Cas9/crRNA/tracrRNAはRNAに対して相補的な直線状または環状核酸標的をエンド的に切断する。具体的には、crRNAに対して相補的でない標的鎖が第1にエンド的にカットされ、それから3'-5'エキソ的にトリミングされる。天然では、DNA結合および切断は典型的にはタンパク質および両方のRNAを要求する。しかしながら、シングルガイドRNA(「sgRNA」または単純に「gRNA」)が、crRNAおよびtracrRNA両方の態様を単一のRNA種のガイドRNAに組み込むようにして操作され得る。 In some types of CRISPR systems (e.g., type II CRISPR systems), correct processing of pre-crRNA requires trans-encoded small RNA (tracrRNA), endogenous ribonuclease 3 (rnc), and the Cas9 protein. . tracrRNA serves as a guide for ribonuclease 3-assisted processing of pre-crRNA. Cas9/crRNA/tracrRNA then endo-cleaves linear or circular nucleic acid targets complementary to the RNA. Specifically, target strands that are not complementary to the crRNA are first cut endo-wise and then trimmed 3'-5' exo-wise. In nature, DNA binding and cleavage typically requires proteins and both RNA. However, single guide RNAs ("sgRNAs" or simply "gRNAs") can be engineered to incorporate aspects of both crRNA and tracrRNA into the guide RNA of a single RNA species.

一般的に、「CRISPRシステム」は、集合的に、CRISPR関連(「Cas」)遺伝子の発現に関わるかまたはそれの活性を導く転写物および他のエレメントを言い、Cas遺伝子、tracr(トランス活性化CRISPR)配列(例えばtracrRNAまたは活性な部分的なtracrRNA)、tracr mate配列(内生CRISPRシステムという文脈において、「ダイレクト反復」およびtracrRNAによってプロセシングされる部分的なダイレクト反復を包摂する)、ガイド配列(内生CRISPRシステムという文脈において「スペーサー」ともまた言われる)、またはCRISPR座位からの他の配列および転写物をコードする配列を包含する。システムのtracrRNAはガイドRNA上に存在するtracr mate配列に対して(完全にまたは部分的に)相補的である。 In general, "CRISPR system" refers collectively to the transcripts and other elements involved in the expression or directing the activity of CRISPR-associated ("Cas") genes, including Cas genes, tracr (transactivation CRISPR) sequences (e.g. tracrRNA or active partial tracrRNA), tracr mate sequences (in the context of endogenous CRISPR systems, encompassing "direct repeats" and partial direct repeats processed by tracrRNA), guide sequences ( (also referred to as a "spacer" in the context of an endogenous CRISPR system), or other sequences from the CRISPR locus and sequences encoding transcripts. The tracrRNA of the system is complementary (fully or partially) to the tracr mate sequence present on the guide RNA.

DNA合成鋳型
本明細書に使用されるとき、用語「DNA合成鋳型」は、プライム編集因子のポリメラーゼによって鋳型鎖(所望の編集を含有しており、次いでプライム編集の機序を通して、対応する内生DNAの鎖を標的部位にて置き換える、3'単鎖DNAフラップをコードする)として利用される、PEgRNAの伸長アームの領域または部分を指す。様々な態様において、DNA合成鋳型は、図3A(5'伸長アームを含むPEgRNAの文脈(context)において)、図3B(3'伸長アームを含むPEgRNAの文脈において)、図3C(内部伸長アームの文脈において)、図3D(3'伸長アームの文脈において)、および図3E(5'伸長アームの文脈において)に示される。伸長アームは、DNA合成鋳型を包含しており、DNAまたはRNAから構成されていてもよい。RNAのケースにおいて、プライム編集因子のポリメラーゼは、RNA依存性DNAポリメラーゼ(例として、逆転写酵素)であり得る。DNAのケースにおいて、プライム編集因子のポリメラーゼは、DNA依存性DNAポリメラーゼであり得る。様々な(例として、図3D~3Eに描かれるとおりの)態様において、DNA合成鋳型(4)は、「編集鋳型」および「相同アーム」、ならびに任意の5'末修飾領域e2の全部または一部を含んでいてもよい。つまり、e2領域の性質に応じて(例として、これが、ヘアピン、トウループ、またはステム/ループの2次構造を包含するかどうかに関わらず)、ポリメラーゼは、e2領域を何もコードしていなくても、またはその一部もしくは全部をコードしていてもよい。別の言い方をすれば、3'伸長アームのケースにおいて、DNA合成鋳型(3)は、ポリメラーゼ(例として、逆転写酵素)によるDNAの単鎖の合成のための鋳型として動作してもよい、プライマー結合部位(PBS)の5'末からgRNAコアの3'末までに及ぶ伸長アーム(3)の部分を包含し得る。5'伸長アームのケースにおいて、DNA合成鋳型(3)は、PEgRNA分子の5'末から編集鋳型の3'末までに及ぶ伸長アーム(3)の部分を包含し得る。好ましくは、DNA合成鋳型は、3'伸長アームまたは5'伸長アームのいずれかを有するPEgRNAsのプライマー結合部位(PBS)を排除する。本明細書に記載のある態様(例として、図71A)は、編集鋳型および相同アーム、すなわち、DNA合成の最中に鋳型として実際に使用されるPEgRNA伸長アームの配列を包含する「RT鋳型」を指す。用語「RT鋳型」は、用語「DNA合成鋳型」と等価である。
DNA Synthesis Template As used herein, the term "DNA synthesis template" refers to a template strand (containing the desired edits) by the polymerase of a prime editing factor, and then through the mechanism of prime editing, the corresponding endogenous Refers to the region or portion of the extended arm of PEgRNA that is utilized as a 3' single-stranded DNA flap (encoding a 3' single-stranded DNA flap that displaces a strand of DNA at the target site). In various embodiments, the DNA synthesis template is configured in the form of Figure 3A (in the context of a PEgRNA containing a 5' extension arm), Figure 3B (in the context of a PEgRNA containing a 3' extension arm), Figure 3C (in the context of a PEgRNA containing an internal extension arm), Figure 3B (in the context of a PEgRNA containing a 3' extension arm), 3D (in the context of the 3′ extended arm), and FIG. 3E (in the context of the 5′ extended arm). The extension arm contains the DNA synthesis template and may be composed of DNA or RNA. In the case of RNA, the prime editor polymerase can be an RNA-dependent DNA polymerase (eg, reverse transcriptase). In the case of DNA, the prime editor polymerase can be a DNA-dependent DNA polymerase. In various embodiments (as depicted in Figures 3D-3E, for example), the DNA synthesis template (4) includes an "editing template" and a "homologous arm" as well as all or part of the optional 5' end modification region e2. May contain parts. That is, depending on the nature of the e2 region (e.g., whether this includes hairpin, toe-loop, or stem/loop secondary structures), the polymerase may encode the e2 region without any or part or all of it may be coded. Stated differently, in the case of the 3' extension arm, the DNA synthesis template (3) may act as a template for the synthesis of a single strand of DNA by a polymerase (e.g. reverse transcriptase). It may include the portion of the extended arm (3) that extends from the 5' end of the primer binding site (PBS) to the 3' end of the gRNA core. In the case of a 5' extending arm, the DNA synthesis template (3) may include the portion of the extending arm (3) that extends from the 5' end of the PEgRNA molecule to the 3' end of the editing template. Preferably, the DNA synthesis template excludes the primer binding site (PBS) of PEgRNAs with either a 3' or 5' extending arm. Certain embodiments described herein (for example, FIG. 71A) provide an "RT template" that includes the editing template and the sequence of the homology arm, i.e., the PEgRNA extension arm that is actually used as a template during DNA synthesis. refers to The term "RT template" is equivalent to the term "DNA synthesis template."

トランスプライム編集のケースでは(例えば、図3Gおよび図3H)、プライマー結合部位(PBS)およびDNA合成鋳型は、トランスプライム編集因子RNA鋳型(tPERT)と言われる別個の分子へと操作され得る。 In the case of transprime editing (e.g., Figures 3G and 3H), the primer binding site (PBS) and DNA synthesis template can be engineered into a separate molecule called the transprime editing factor RNA template (tPERT).

二量体化ドメイン
用語「二量体化ドメイン」は、二重特異性リガンドの結合ドメインに結合するリガンド結合ドメインを言う。「第1の」二量体化ドメインは二重特異性リガンドの第1の結合部分に結合し、「第2の」二量体化ドメインは同じ二重特異性リガンドの第2の結合部分に結合する。第1の二量体化ドメインが(例えば、本願において論じられるとおりPEを介して)第1のタンパク質に融合され、第2の二量体化ドメインが(例えば、本願において論じられるとおりPEを介して)第2のタンパク質に融合されるときには、第1および第2のタンパク質は二重特異性リガンドの存在下において二量体化し、二重特異性リガンドは、第1の二量体化ドメインに結合する少なくとも1つの部分と第2の二量体化ドメインに結合する少なくとも別の部分とを有する。
Dimerization Domain The term "dimerization domain" refers to a ligand binding domain that binds to the binding domain of a bispecific ligand. The "first" dimerization domain binds to the first binding moiety of the bispecific ligand, and the "second" dimerization domain binds to the second binding moiety of the same bispecific ligand. Join. A first dimerization domain is fused to a first protein (e.g., via a PE as discussed in this application) and a second dimerization domain is fused to a first protein (e.g., via a PE as discussed in this application). when fused to a second protein, the first and second proteins dimerize in the presence of the bispecific ligand, and the bispecific ligand is fused to the first dimerization domain. at least one moiety that binds and at least another moiety that binds to the second dimerization domain.

下流
本明細書に使用されるとき、用語「上流」および「下流」は、5'→3'方向に配向された核酸分子(単鎖または二本鎖であるかに関わらず)中に位置付けられた少なくとも2つの要素の線状の位置を定義する相対的な用語である。とりわけ、第1要素が第2要素に対して5'のどこかに位置付けられている場合、第1要素は、核酸分子中、第2要素の上流にある。例えば、SNPがニック部位の5'側にある場合、SNPは、Cas9に誘導されたニック部位の上流にある。逆に言うと、第1要素が第2要素に対して3'のどこかに位置付けられている場合、第1要素は、核酸分子中、第2要素の下流にある。例えば、SNPがニック部位の3'側にある場合、SNPは、Cas9に誘導されたニック部位の下流にある。核酸分子は、DNA(二本鎖もしくは単鎖)、RNA(二本鎖もしくは単鎖)、またはDNAとRNAとのハイブリッドであり得る。二本鎖分子のどちらの鎖を考慮するのか選択する必要がある場合を除き、上流および下流という用語が核酸分子の単鎖にのみ言及するところ、分析は単鎖核酸分子および二本鎖分子について同じである。しばしば、少なくとも2つの要素の相対的な位置を決定するのに使用され得る二本鎖のDNAの鎖は、「センス」鎖または「コード」鎖である。遺伝学において、「センス」鎖は、5'から3'へ伸びる二本鎖DNA内セグメントであって、3'から5'へ伸びるDNAのアンチセンス鎖または鋳型鎖に相補的である。よって、例として、SNP核酸塩基がセンス鎖またはコード鎖上のプロモーターの3'側にある場合、SNP核酸塩基はゲノムDNA(二本鎖である)中のプロモーター配列の「下流」にある。
Downstream As used herein, the terms "upstream" and "downstream" refer to positions in a nucleic acid molecule (whether single-stranded or double-stranded) oriented in the 5'→3' direction. is a relative term that defines the linear position of at least two elements. In particular, a first element is upstream of a second element in the nucleic acid molecule if the first element is positioned somewhere 5' to the second element. For example, if the SNP is 5' to the nick site, the SNP is upstream of the Cas9-induced nick site. Conversely, if the first element is positioned somewhere 3' to the second element, then the first element is downstream of the second element in the nucleic acid molecule. For example, if the SNP is 3' to the nick site, the SNP is downstream of the Cas9-induced nick site. Nucleic acid molecules can be DNA (double-stranded or single-stranded), RNA (double-stranded or single-stranded), or a hybrid of DNA and RNA. Where the terms upstream and downstream refer only to a single strand of a nucleic acid molecule, the analysis applies to single-stranded and double-stranded molecules, unless one needs to choose which strand of a double-stranded molecule to consider. It's the same. Often, the strand of double-stranded DNA that can be used to determine the relative position of at least two elements is the "sense" or "coding" strand. In genetics, the "sense" strand is a 5' to 3' extending segment within double-stranded DNA that is complementary to the 3' to 5' antisense or template strand of the DNA. Thus, by way of example, a SNP nucleobase is "downstream" of a promoter sequence in genomic DNA (which is double-stranded) if the SNP nucleobase is 3' to a promoter on the sense or coding strand.

編集鋳型
用語「編集鋳型」は、ポリメラーゼ、例えばDNA依存性DNAポリメラーゼ、RNA依存性DNAポリメラーゼ(例えば逆転写酵素)によって合成される一本鎖3'DNAフラップ上に所望の編集をコードする伸長アームの部分を言う。本明細書に記載のある態様(例として、図71A)は、編集鋳型と相同アームとの両方一緒、すなわち、DNA合成の最中に鋳型として実際に使用されるPEgRNA伸長アームの配列を指す「RT鋳型」を指す。用語「RT編集鋳型」はまた、用語「DNA合成鋳型」とも等価であるが、ここでRT編集鋳型は、逆転写酵素であるポリメラーゼを有するプライム編集因子の使用を反映し、DNA合成鋳型は、いずれのポリメラーゼも有するプライム編集因子の使用をより広く反映する。
Editing template The term "editing template" refers to an extended arm encoding the desired edit on a single-stranded 3' DNA flap synthesized by a polymerase, e.g., DNA-dependent DNA polymerase, RNA-dependent DNA polymerase (e.g., reverse transcriptase). Say the part. Certain embodiments described herein (as an example, FIG. 71A) refer to both the editing template and the homology arm together, i.e., the sequence of the PEgRNA extension arm that is actually used as a template during DNA synthesis. "RT mold". The term "RT editing template" is also equivalent to the term "DNA synthesis template," where the RT editing template reflects the use of a prime editing factor with a polymerase, a reverse transcriptase, and the DNA synthesis template is More broadly reflects the use of prime editing factors with either polymerase.

有効量
本願において用いられる用語「有効量」は、所望の生物学的応答を誘起するために十分である生物活性薬剤の量を言う。例えば、いくつかの態様では、プライム編集因子(PE)の有効量は、標的部位ヌクレオチド配列、例えばゲノムを編集するために十分である編集因子の量を言い得る。いくつかの態様では、本願において提供されるプライム編集因子(PE)の、例えばニッカーゼCas9ドメインおよび逆転写酵素を含む融合タンパク質の有効量は、融合タンパク質によって特異的に結合および編集される標的部位の編集を誘導するために十分である融合タンパク質の量を言い得る。当業者には了解されるであろうとおり、薬剤、例えば融合タンパク質、ヌクレアーゼ、ハイブリッドタンパク質、タンパク質二量体、タンパク質(またはタンパク質二量体)およびポリヌクレオチドの複合体、またはポリヌクレオチドの有効量は、例えば、所望の生物学的反応、例えば編集されるべき特定のアレル、ゲノム、または標的部位、標的化されようとする細胞または組織、および用いられようとする薬剤のような種々の因子に依存して変わり得る。
Effective Amount The term "effective amount" as used herein refers to an amount of bioactive agent that is sufficient to elicit a desired biological response. For example, in some embodiments, an effective amount of prime editing agent (PE) can refer to an amount of editing agent that is sufficient to edit the target site nucleotide sequence, eg, the genome. In some embodiments, an effective amount of a prime editing factor (PE) provided herein, e.g., a fusion protein comprising a nickase Cas9 domain and a reverse transcriptase, is sufficient to target a target site that is specifically bound and edited by the fusion protein. One can state the amount of fusion protein that is sufficient to induce editing. As will be understood by those skilled in the art, an effective amount of an agent, such as a fusion protein, a nuclease, a hybrid protein, a protein dimer, a complex of a protein (or protein dimer) and a polynucleotide, or a polynucleotide , depending on various factors such as the desired biological response, e.g. the particular allele, genome, or target site to be edited, the cell or tissue to be targeted, and the drug to be used. can change.

エラーを起こしやすい逆転写酵素
本明細書に使用されるとき、用語「エラーを起こしやすい」逆転写酵素(またはより広くは、いずれのポリメラーゼ)は、天然に存在するか、または野生型M-MLV逆転写酵素の誤差率未満の誤差率を有する別の逆転写酵素(例として、野生型M-MLV逆転写酵素)に由来する逆転写酵素(またはより広くは、いずれのポリメラーゼ)を指す。野生型M-MLV逆転写酵素の誤差率は、1誤差の範囲が15,000(より高い)~27,000(より低い)にあると報告されている。15,000中の1の誤差率は6.7×10-5の誤差率に相当する。27,000中の1の誤差率は3.7×10-5の誤差率に相当する。Boutabout et al.(2001)“DNA synthesis fidelity by the reverse transcriptase of the yeast retrotransposon Ty1,”Nucleic Acids Res 29(11):2217-2222を参照(これは参照により本明細書に組み込まれる)。よって、本出願の目的において、用語「エラーを起こしやすい」は、15,000核酸塩基の組み込み中1より大きい誤差(6.7×10-5またはこれより高い)、例として、14,000核酸塩基中1誤差(7.14×10-5もしくはこれより高い)、13,000核酸塩基またはこれより少ない中で1誤差(7.7×10-5もしくはこれより高い)、12,000核酸塩基またはこれより少ない中で1誤差(7.7×10-5もしくはこれより高い)、11,000核酸塩基またはこれより少ない中で1誤差(9.1×10-5もしくはこれより高い)、10,000核酸塩基またはこれより少ない中で1誤差(1×10-4または0.0001もしくはこれより高い)、9,000核酸塩基またはこれより少ない中で1誤差(0.00011もしくはこれより高い)、8,000核酸塩基またはこれより少ない中で1誤差(0.00013もしくはこれより高い)、7,000核酸塩基またはこれより少ない中で1誤差(0.00014もしくはこれより高い)、6,000核酸塩基またはこれより少ない中で1誤差(0.00016もしくはこれより高い)、5,000核酸塩基またはこれより少ない中で1誤差(0.0002もしくはこれより高い)、4,000核酸塩基またはこれより少ない中で1誤差(0.00025もしくはこれより高い)、3,000核酸塩基またはこれより少ない中で1誤差(0.00033もしくはこれより高い)、2,000核酸塩基またはこれより少ない中で1誤差(0.00050もしくはこれより高い)、あるいは1,000核酸塩基またはこれより少ない中で1誤差(0.001もしくはこれより高い)、あるいは500核酸塩基またはこれより少ない中で1誤差(0.002もしくはこれより高い)、あるいは250核酸塩基またはこれより少ない中で1誤差(0.004もしくはこれより高い)である誤差率を有する、それらRTを指す。
Error-Prone Reverse Transcriptase As used herein, the term "error-prone" reverse transcriptase (or more broadly, any polymerase) refers to naturally occurring or wild-type M-MLV Refers to a reverse transcriptase (or more broadly, any polymerase) that is derived from another reverse transcriptase (eg, wild-type M-MLV reverse transcriptase) that has an error rate less than that of reverse transcriptase. The error rate for wild-type M-MLV reverse transcriptase is reported to range from 15,000 (higher) to 27,000 (lower) per error. An error rate of 1 in 15,000 corresponds to an error rate of 6.7×10 -5 . An error rate of 1 in 27,000 corresponds to an error rate of 3.7×10 -5 . See Boutabout et al. (2001) “DNA synthesis fidelity by the reverse transcriptase of the yeast retrotransposon Ty1,” Nucleic Acids Res 29(11):2217-2222, which is incorporated herein by reference. Thus, for the purposes of this application, the term "error-prone" means an error greater than 1 in 15,000 nucleobases (6.7 x 10 -5 or higher), e.g. 1 error in 14,000 nucleobases (7.14 ×10 -5 or higher), 1 error in 13,000 nucleobases or less (7.7 × 10 -5 or higher), 1 error in 12,000 nucleobases or less (7.7 × 10 -5 or higher), 1 error in 11,000 nucleobases or less (9.1 × 10 -5 or higher), 1 error in 10,000 nucleobases or less (1 × 10 -4 or 0.0001 or higher), 1 error (0.00011 or higher) in 9,000 nucleobases or less; 1 error (0.00013 or higher) in 8,000 nucleobases or less; 1 error (0.00013 or higher) in 8,000 nucleobases or less; 1 error in 6,000 nucleobases or less (0.00016 or higher), 1 error in 5,000 nucleobases or less (0.0002 or higher), 4,000 1 error in 3,000 nucleobases or less (0.00025 or higher); 1 error in 3,000 nucleobases or less (0.00033 or higher); 1 error in 2,000 nucleobases or less (0.00050) or higher), or 1 error in 1,000 nucleobases or less (0.001 or higher), or 1 error in 500 nucleobases or less (0.002 or higher), or 250 nucleobases. or less, with an error rate of 1 error (0.004 or higher).

エクステイン
本願において用いられる用語「エクステイン」は、インテインによってフランキングされ、タンパク質スプライシングのプロセスの間に別のエクステインにライゲーションされて成熟したスプライシングされたタンパク質を形成するポリペプチド配列を言う。典型的には、インテインは2つのエクステイン配列によってフランキングされ、これらはインテインがそれ自体の切除を触媒するときに一緒にライゲーションされる。エクステインは、従って、mRNA上に見出されるエキソンに対するタンパク質アナログである。例えば、インテインを含むポリペプチドは構造エクステイン(N)-インテイン-エクステイン(C)であり得る。インテインの切除および2つのエクステインのスプライシング後に、もたらされる構造はエクステイン(N)-エクステイン(C)および遊離のインテインである。種々の構成では、エクステインは、夫々が分裂インテインに融合された別個のタンパク質(例えば、Cas9またはPE融合タンパク質の半分)であり得、分裂インテインの切除はエクステイン配列のスプライシングを一緒に引き起こす。
Extein The term "extein" as used herein refers to a polypeptide sequence that is flanked by inteins and ligated to another extein during the process of protein splicing to form the mature spliced protein. Typically, an intein is flanked by two extein sequences, which are ligated together when the intein catalyzes its own excision. Exteins are therefore protein analogs to exons found on mRNA. For example, a polypeptide containing an intein can have the structure extein (N)-intein-extein (C). After excision of an intein and splicing of two exteins, the resulting structure is extein (N)-extein (C) and free intein. In various configurations, the exteins can be separate proteins (eg, half of a Cas9 or PE fusion protein) each fused to a split intein, with excision of the split intein causing splicing of the extein sequences together.

伸長アーム
用語「伸長アーム」は、数種の機能(逆転写酵素のためのプライマー結合部位および編集鋳型を包含する)を提供するPEgRNAのヌクレオチド配列構成要素を指す。いくつかの態様、例として、図3Dにおいて、伸長アームは、ガイドRNAの3'末にて位置付けられる。他の態様、例として、図3Eにおいて、伸長アームは、ガイドRNAの5’末にて位置付けられる。いくつかの態様において、伸長アームはまた、相同アームも包含する。様々な態様において、伸長アームは、5'→3'方向に以下の構成要素:相同アーム、編集鋳型、およびプライマー結合部位を含む。逆転写酵素の重合活性が5'→3'方向であるから、相同アーム、編集鋳型、およびプライマー結合部位の好ましい配置は、逆転写酵素が、アニールされたプライマー配列によって一旦プライムされると、編集鋳型を相補的な鋳型鎖として使用して単鎖DNAを重合する(polymerases)ように、5'→3'方向にある。伸長アームの長さなどのさらなる詳細は、本明細書に記載の他のどこかに記載されている。
Extended arm The term "extended arm" refers to the nucleotide sequence component of PEgRNA that provides several functions, including a primer binding site for reverse transcriptase and an editing template. In some embodiments, for example in FIG. 3D, the extension arm is positioned at the 3' end of the guide RNA. In other embodiments, as an example, in FIG. 3E, the extension arm is positioned at the 5' end of the guide RNA. In some embodiments, extended arms also include homologous arms. In various embodiments, the elongated arm includes the following components in the 5'→3' direction: a homology arm, an editing template, and a primer binding site. Since the polymerization activity of reverse transcriptase is in the 5'→3' direction, the preferred arrangement of the homologous arm, editing template, and primer binding site means that once the reverse transcriptase is primed by the annealed primer sequence, the editing in the 5'→3' direction so that the template is used as a complementary template strand to polymerases single-stranded DNA. Further details, such as the length of the extension arms, are described elsewhere herein.

伸長アームはまた、図3G(最上列)に実例として示されるとおり、一般に2つの領域:プライマー結合部位(PBS)およびDNA合成鋳型を含むものとしても記載されていてもよい。プライマー結合部位は、プライム編集因子複合体によってニックが入れられるようになり、これによってニックが入った内生鎖上に3'末が晒されたとき、標的部位の内生DNA鎖から形成されるプライマー配列へ結合する。本明細書に説明されるとおり、プライマー配列の、PEgRNAの伸長アーム上のプライマー結合部位への結合は、晒された3'末(すなわち、プライマー配列の3')をもつ二重鎖領域を創出し、これは次いで、晒された3'末からDNA合成鋳型の長さに沿ってDNAの単鎖を重合し始めるポリメラーゼのための基質を提供する。単鎖DNA産物の配列は、DNA合成鋳型の相補体である。重合は、重合が終止するまでDNA合成鋳型(または伸長アーム)の5'へ続く。よって、DNA合成鋳型は、プライム編集因子複合体のポリメラーゼによって単鎖DNA産物(すなわち、所望の遺伝子編集情報を含有する3'単鎖DNAフラップ)中へコードされる伸長アームの部分を表し、前記単鎖DNA産物は、PEに誘導されたニック部位のすぐ下流にある標的部位の対応する内生DNA鎖に置き換える。理論に拘泥されないが、DNA合成鋳型の重合は、終止という事象まで、伸長アームの5'末へ続く。重合は、これらに限定されないが、(a)PEgRNAの5'末端に達すること(例として、5'伸長アームのケースにおいて、DNAポリメラーゼが単に鋳型を使い果たす)、(b)とおり抜けられないRNA2次構造(例として、ヘアピンもしくはステム/ループ)に達すること、あるいは(c)複製終止シグナル、例として、ポリメラーゼを遮断もしくは阻害する特定のヌクレオチド配列、またはスーパーコイル状のDNAもしくはRNAなどの核酸形態上のシグナルに達すること、を包含する様々な形で終止することもある。 The extended arm may also be described as generally containing two regions: a primer binding site (PBS) and a DNA synthesis template, as illustrated in Figure 3G (top row). A primer binding site is formed from the endogenous DNA strand of the target site when it becomes nicked by the prime editing factor complex, thereby exposing the 3' end onto the nicked endogenous strand. Binds to the primer sequence. As described herein, binding of the primer sequence to the primer binding site on the extended arm of PEgRNA creates a duplex region with an exposed 3' end (i.e., 3' of the primer sequence). This, in turn, provides a substrate for the polymerase to begin polymerizing a single strand of DNA along the length of the DNA synthesis template from the exposed 3' end. The sequence of the single-stranded DNA product is the complement of the DNA synthesis template. Polymerization continues 5' of the DNA synthesis template (or extending arm) until polymerization is terminated. Thus, the DNA synthesis template represents the portion of the elongated arm that is encoded into a single-stranded DNA product (i.e., a 3' single-stranded DNA flap containing the desired gene-editing information) by the polymerase of the prime editing factor complex; The single-stranded DNA product replaces the corresponding endogenous DNA strand at the target site immediately downstream of the PE-induced nick site. Without wishing to be bound by theory, polymerization of the DNA synthesis template continues to the 5' end of the elongated arm until the event of termination. Polymerization may include, but is not limited to: (a) reaching the 5' end of the PEgRNA (for example, in the case of a 5' extended arm, the DNA polymerase simply runs out of template); (c) replication termination signals, e.g. specific nucleotide sequences that block or inhibit polymerases, or on nucleic acid forms such as supercoiled DNA or RNA; Termination can occur in a variety of ways, including reaching a signal.

フラップエンドヌクレアーゼ(例として、FEN1)
本明細書に使用されるとき、用語「フラップエンドヌクレアーゼ」は、5'単鎖DNAフラップの除去を触媒する酵素を指す。これらは、細胞プロセス(DNA複製を包含する)の最中に形成された5'フラップの除去を処理する、天然に存在する酵素である。本明細書に記載のプライム編集方法は、内生で供給されるフラップエンドヌクレアーゼ、またはプライム編集の最中に標的部位にて形成される内生DNAの5'フラップを除去するのにtransで提供されるものを利用してもよい。フラップエンドヌクレアーゼは、当該技術分野において知られており、Patel et al.,“Flap endonucleases pass 5'-flaps through a flexible arch using a disorder-thread-order mechanism to confer specificity for free 5'-ends,”Nucleic Acids Research,2012,40(10):4507-4519およびTsutakawa et al.,Human flap endonuclease structures,DNA double-base flipping, and a unified understanding of the FEN1 superfamily,”Cell,2011,145(2):198-211、およびBalakrishnan et al.,“Flap Endonuclease 1,”Annu Rev Biochem,2013,Vol 82:119-138(これらの各々は参照により本明細書に組み込まれる)の記載から見出され得る。例示のフラップエンドヌクレアーゼは、以下のアミノ酸配列によって表され得るFEN1である:

Figure 2020191234000001
flap endonuclease (for example, FEN1)
As used herein, the term "flap endonuclease" refers to an enzyme that catalyzes the removal of a 5' single-stranded DNA flap. These are naturally occurring enzymes that handle the removal of 5' flaps formed during cellular processes, including DNA replication. The prime editing methods described herein utilize an endogenously supplied flap endonuclease, or a flap endonuclease provided in trans to remove the 5' flap of endogenous DNA that is formed at the target site during prime editing. You may use what is provided. Flap endonucleases are known in the art and are described by Patel et al., “Flap endonucleases pass 5'-flaps through a flexible arch using a disorder-thread-order mechanism to confer specificity for free 5'-ends,” Nucleic Acids Research,2012,40(10):4507-4519 and Tsutakawa et al.,Human flap endonuclease structures, DNA double-base flipping, and a unified understanding of the FEN1 superfamily,”Cell,2011,145(2): 198-211, and Balakrishnan et al., “Flap Endonuclease 1,” Annu Rev Biochem, 2013, Vol 82:119-138, each of which is incorporated herein by reference. An exemplary flap endonuclease is FEN1, which can be represented by the following amino acid sequence:
Figure 2020191234000001

機能的等価物
用語「機能的等価物」は、機能は等価であるが構造は第1生体分子と必ずしも等価ではない第2生体分子を指す。例えば、「Cas9等価物」は、Cas9と同じかまたは実質的に同じ機能を有するが、必ずしも同じアミノ酸配列は有さないタンパク質を指す。本開示の文脈において、本明細書は通してずっと「タンパク質X、またはその機能的等価物」を指す。これに関連して、タンパク質Xの「機能的等価物」は、タンパク質Xの等価機能を担持する、いずれのホモログ、パラログ、フラグメント、天然に存在するバージョン、改変バージョン、突然変異バージョン、または合成バージョンを受け入れる。
Functional Equivalent The term "functional equivalent" refers to a second biomolecule that is functionally equivalent but not necessarily structurally equivalent to a first biomolecule. For example, "Cas9 equivalent" refers to a protein that has the same or substantially the same function as Cas9, but does not necessarily have the same amino acid sequence. In the context of this disclosure, the specification refers throughout to "Protein X, or a functional equivalent thereof." In this context, a "functional equivalent" of protein accept.

融合タンパク質
用語「融合タンパク質」は、本明細書に使用されるとき、少なくとも2つの異なるタンパク質からタンパク質ドメインを含むハイブリッドポリペプチドを指す。あるタンパク質は、融合タンパク質のアミノ末端(N末端)部分にて、またはカルボキシ末端(C末端)タンパク質にて位置付けられ、よって「アミノ末端の融合タンパク質」または「カルボキシ末端の融合タンパク質」の夫々を形成してもよい。タンパク質は、異なるドメイン、例えば、核酸結合ドメイン(例として、タンパク質を標的部位への結合へ向かわせる、Cas9のgRNA結合ドメイン)と、核酸編集タンパク質の核酸切断ドメインまたは触媒ドメインとを含んでいてもよい。別の例は、逆転写酵素と融合したCas9またはその等価物を包含する。本明細書に提供されるタンパク質のいずれも、当該技術分野において知られているいずれの方法によって産生されてもよい。例えば、本明細書に提供されるタンパク質は、ペプチドリンカーを含む融合タンパク質にとくに適した、組換えタンパク質の発現および精製を介して産生されてもよい。組換えタンパク質の発現および精製のための方法は周知であり、Green and Sambrook, Molecular Cloning:A Laboratory Manual(4th ed.,Cold Spring Harbor Laboratory Press,Cold Spring Harbor,N.Y.(2012)(これらの内容全体は参照により本明細書に組み込まれる))によって記載されるものを包含する。
Fusion protein The term "fusion protein" as used herein refers to a hybrid polypeptide that includes protein domains from at least two different proteins. A protein may be located at the amino-terminal (N-terminal) portion of the fusion protein or at the carboxy-terminal (C-terminal) portion of the fusion protein, thus forming an "amino-terminal fusion protein" or a "carboxy-terminal fusion protein," respectively. You may. A protein may contain different domains, such as a nucleic acid binding domain (e.g., the gRNA binding domain of Cas9, which directs the protein to bind to a target site) and a nucleic acid cleavage domain or a catalytic domain of a nucleic acid editing protein. good. Another example includes Cas9 or its equivalent fused to reverse transcriptase. Any of the proteins provided herein may be produced by any method known in the art. For example, the proteins provided herein may be produced through recombinant protein expression and purification, which is particularly suitable for fusion proteins that include peptide linkers. Methods for the expression and purification of recombinant proteins are well known and can be found in Green and Sambrook, Molecular Cloning: A Laboratory Manual (4th ed., Cold Spring Harbor Laboratory Press, Cold Spring Harbor, NY (2012)). includes those described by )), which is incorporated herein by reference.

着目した遺伝子(Gene of interest)(GOI)
用語「着目した遺伝子」または「GOI」は、着目した生体分子(例として、タンパク質またはRNA分子)をコードする遺伝子を指す。着目したタンパク質は、いずれの細胞内タンパク質、膜タンパク質、または細胞外タンパク質、例として、核内タンパク質、転写因子、核膜輸送体、細胞内オルガネラ関連タンパク質、膜受容体、触媒タンパク質、および酵素、治療用タンパク質、膜タンパク質、膜輸送タンパク質、シグナル伝達タンパク質、または免疫学的タンパク質(例として、IgGまたは他の抗体タンパク質)、等々を包含し得る。着目した遺伝子はまた、これらに限定されないが、メッセンジャーRNA(mRNA)、トランスファーRNA(tRNA)、リボソームRNA(rRNA)、低分子核内RNA(snRNA)、アンチセンスRNA、ガイドRNA、マイクロRNA(miRNA)、低分子干渉RNA(siRNA)、および無細胞RNA(cfRNA)を包含するRNA分子もコードしていてもよい。
Gene of interest (GOI)
The term "gene of interest" or "GOI" refers to a gene encoding a biomolecule of interest (eg, a protein or RNA molecule). The proteins of interest are any intracellular proteins, membrane proteins, or extracellular proteins, such as nuclear proteins, transcription factors, nuclear membrane transporters, intracellular organelle-related proteins, membrane receptors, catalytic proteins, and enzymes. It may include therapeutic proteins, membrane proteins, membrane transport proteins, signal transduction proteins, or immunological proteins (eg, IgG or other antibody proteins), and the like. The genes of interest also include, but are not limited to, messenger RNA (mRNA), transfer RNA (tRNA), ribosomal RNA (rRNA), small nuclear RNA (snRNA), antisense RNA, guide RNA, and microRNA (miRNA). ), small interfering RNA (siRNA), and cell-free RNA (cfRNA).

ガイドRNA(「gRNA」)
本明細書に使用されるとき、用語「ガイドRNA」は、大部分が一般的にCRISPR-Cas9のCasタンパク質に関連する具体的な型のガイド核酸であって、Cas9に結び付いて、Cas9タンパク質をDNA分子中の特定の配列(ガイドRNAのプロトスペース配列との相補性を包含する)へ向かわせる。しかしながら、この用語はまた、天然に存在するかもしくは天然には存在しない(例として、改変または組換え)かに関わらず、Cas9等価物、ホモログ、オルソログ、またはパラログに結び付き、またCas9等価物を特定の標的ヌクレオチド配列へ局在化するよう別にプログラムする、等価なガイド核酸分子も受け入れる。Cas9等価物は、Cpf1(V型CRISPR-Cas系)、C2c1(V型CRISPR-Cas系)、C2c2(VI型CRISPR-Cas系)およびC2c3(V型CRISPR-Cas系)を包含する、いずれの型のCRISPR系(例として、II型、V型、VI型)からの他のnapDNAbpも包含していてもよい。さらなるCas等価物は、Makarova et al.,“C2c2 is a single-component programmable RNA-guided RNA-targeting CRISPR effector,”Science 2016;353(6299)(この内容は参照により本明細書に組み込まれる)に記載されている。ガイドRNAの例示の配列および構造は本明細書に提供されている。加えて、適切なガイドRNA配列をデザインするための方法も、本明細書に提供されている。本明細書に使用されるとき、「ガイドRNA」はまた、本明細書に開示のプライム編集方法および組成物のために発明された「プライム編集ガイドRNA」(または「PEgRNA」)と呼ばれる修飾形態のガイドRNAと対比させるために「既存のガイドRNA」とも称されてもよい。
Guide RNA (“gRNA”)
As used herein, the term "guide RNA" refers to a specific type of guide nucleic acid, most commonly associated with the Cas protein of CRISPR-Cas9, that binds to Cas9 and directs the Cas9 protein. targeting specific sequences in the DNA molecule, including complementarity with protospace sequences in the guide RNA. However, the term also refers to Cas9 equivalents, homologs, orthologs, or paralogs, whether naturally occurring or non-naturally occurring (e.g., modified or recombinant); Equivalent guide nucleic acid molecules that are otherwise programmed to localize to specific target nucleotide sequences are also accepted. Cas9 equivalents are any of the following, including Cpf1 (V-type CRISPR-Cas system), C2c1 (V-type CRISPR-Cas system), C2c2 (Type VI CRISPR-Cas system) and C2c3 (V-type CRISPR-Cas system). Other napDNAbps from other types of CRISPR systems (eg, type II, type V, type VI) may also be included. Additional Cas equivalents can be found in Makarova et al., “C2c2 is a single-component programmable RNA-guided RNA-targeting CRISPR effector,” Science 2016;353(6299), the contents of which are incorporated herein by reference. Are listed. Exemplary sequences and structures of guide RNAs are provided herein. Additionally, methods for designing suitable guide RNA sequences are also provided herein. As used herein, "guide RNA" also refers to the modified form referred to as "primed editing guide RNA" (or "PEgRNA") invented for the prime editing methods and compositions disclosed herein. It may also be referred to as "existing guide RNA" in order to contrast with the guide RNA of.

ガイドRNAまたはPEgRNAは、これらに限定されないが、以下を包含する様々な構造要素を含んでいてもよい: Guide RNA or PEgRNA may contain a variety of structural elements including, but not limited to:

スペーサー配列-標的DNA中のプロトスペーサーへ結合するガイドRNAまたはPEgRNA(長さが約20ntを有する)中の配列。 Spacer sequence - A sequence in a guide RNA or PEgRNA (having approximately 20 nt in length) that binds to the protospacer in the target DNA.

gRNAコア(またはgRNA骨格もしくは主鎖配列)-は、Cas9結合を担うgRNA内の配列を指し、これは、Cas9を標的DNAへガイドするのに使用されるスペーサー/標的化配列を包含していない。 gRNA core (or gRNA backbone or backbone sequence) - refers to the sequence within the gRNA responsible for Cas9 binding, which does not include the spacer/targeting sequence used to guide Cas9 to the target DNA. .

伸長アーム-PEgRNAの3'端または5'端の一本鎖伸長。これは、プライマー結合部位とポリメラーゼ(例えば逆転写酵素)によって目当ての遺伝子変化を含有する一本鎖DNAフラップをコードするDNA合成鋳型配列とを含む。これが、それから、対応する内生鎖を置き換えることによって内生DNA上に取り入れし、それによって所望の遺伝子変化を組み入れる。 Extended Arm - Single-stranded extension of the 3' or 5' end of PEgRNA. This includes a primer binding site and a DNA synthesis template sequence that encodes a single-stranded DNA flap containing the desired genetic change by a polymerase (eg, reverse transcriptase). This is then incorporated onto the endogenous DNA by replacing the corresponding endogenous strand, thereby incorporating the desired genetic change.

転写ターミネーター-ガイドRNAまたはPEgRNAは分子の3'に転写終結配列を含み得る。 Transcription Terminator - A guide RNA or PEgRNA may contain a transcription termination sequence at the 3' end of the molecule.

相同アーム
用語「相同アーム」は、結果として得られる、逆転写酵素にコードされた単鎖DNAフラップ(内生鎖を置き換えることによって標的DNA部位中へ取り入れられる)の部分をコードする伸長アームの部分(単数または複数)を指す。相同アームによってコードされる単鎖DNAフラップの部分は、標的DNA配列の非編集済鎖に相補的であって、内生鎖に取って代わることおよびその場所において単鎖DNAフラップとアニールすることを容易にし、これによって編集が組み入れられる。この構成要素は他のどこかでさらに定義される。定義上、それは本明細書に記載のプライム編集因子のポリメラーゼによってコードされるので、相同アームはDNA合成鋳型の一部である。
Homologous arm The term "homologous arm" refers to the portion of the extended arm that encodes the portion of the resulting reverse transcriptase-encoded single-stranded DNA flap that is incorporated into the target DNA site by replacing the endogenous strand. Refers to (singular or plural). The portion of the single-stranded DNA flap encoded by the homologous arm is complementary to the unedited strand of the target DNA sequence and is capable of displacing the endogenous strand and annealing with the single-stranded DNA flap at that location. This facilitates editing. This component is further defined elsewhere. By definition, the homology arm is part of the DNA synthesis template because it is encoded by the prime editing factor polymerase described herein.

宿主細胞
用語「宿主細胞」は、本明細書に使用されるとき、本明細書に記載のベクター、例として、Cas9もしくはCas9等価物と逆転写酵素とを含む融合タンパク質をコードする核酸分子を含むベクターの宿主となり(host)複製してこれを発現し得る細胞を指す。
Host Cell The term "host cell" as used herein includes a vector described herein, such as a nucleic acid molecule encoding a fusion protein comprising Cas9 or a Cas9 equivalent and a reverse transcriptase. Refers to cells that host a vector and can replicate and express it.

インテイン
本願において用いられる用語「インテイン」は、生命の全てのドメインからの生物に見出される自己プロセシングポリペプチドドメインを言う。インテイン(介在タンパク質)は、タンパク質スプライシングとして公知の固有の自己プロセシングイベントを実行する。これにおいては、それは、2つのペプチド結合の切断によってより大きい前駆体ポリペプチドからそれ自体を切除、プロセスにおいて、新たなペプチド結合の形成によってフランキングするエクステイン(外部タンパク質)配列同士をライゲーションする。インテイン遺伝子は他のタンパク質コード遺伝子とインフレームで埋め込まれて見出されるので、この再構成は翻訳後に(または共翻訳的に)生起する。さらにその上、インテインによって媒介されるタンパク質スプライシングは自発的である;それは、外部の因子またはエネルギー源ではなくインテインドメインのフォールディングのみを要求する。このプロセスは、「分裂インテイン」によるトランスタンパク質スプライシングの天然のプロセスと対比して、シスタンパク質スプライシングとしてもまた公知である。インテインは自己スプライシングRNAイントロンのタンパク質等価物であり(Perler et al.,Nucleic Acids Res.22:1125-1127(1994)を見よ)、これらは前駆体タンパク質からのそれら自体の切除を触媒し、エクステインとして公知のフランキングするタンパク質配列の付随的融合を有する(Perler et al.,Curr.Opin.Chem.Biol.1:292-299(1997);Perler,F.B.Cell 92(1):1-4(1998);Xu et al.,EMBO J.15(19):5146-5153(1996)において総説されている)。
Intein The term "intein" as used herein refers to a self-processing polypeptide domain found in organisms from all domains of life. Inteins (intervening proteins) carry out a unique self-processing event known as protein splicing. In this, it excises itself from a larger precursor polypeptide by cleaving two peptide bonds, and in the process ligates the flanking extein (external protein) sequences together by forming a new peptide bond. This rearrangement occurs post-translationally (or co-translationally) since intein genes are found embedded in-frame with other protein-coding genes. Furthermore, protein splicing mediated by inteins is spontaneous; it requires only folding of the intein domain and not external factors or energy sources. This process is also known as cis-protein splicing, in contrast to the natural process of trans-protein splicing by "split inteins." Inteins are the protein equivalents of self-splicing RNA introns (see Perler et al., Nucleic Acids Res. 22:1125-1127 (1994)), and they catalyze their own excision from precursor proteins and with a concomitant fusion of flanking protein sequences known as ins (Perler et al., Curr. Opin. Chem. Biol. 1:292-299(1997); Perler, FBCell 92(1):1-4( 1998); reviewed in Xu et al., EMBO J.15(19):5146-5153 (1996)).

本願において用いられる用語「タンパク質スプライシング」は、前駆体タンパク質の内側領域(インテイン)が切り出され、タンパク質のフランキング領域(エクステイン)同士がライゲーションされて、成熟したタンパク質を形成するプロセスを言う。この天然のプロセスは、原核生物および真核生物両方からの数々のタンパク質で観察されている(Perler,F.B.,Xu,M.Q.,Paulus,H.Current Opinion in Chemical Biology 1997,1,292-299;Perler,F.B.Nucleic Acids Research 1999,27,346-347)。インテイン単位は、タンパク質スプライシングを触媒するために必要とされる必要な構成要素を含有し、多くの場合には、インテイン可動性に関与するエンドヌクレアーゼドメインを含有する(Perler,F.B.,Davis,E.O.,Dean,G.E.,Gimble,F.S.,Jack,W.E.,Neff,N.,Noren,C.J.,Thomer,J.,Belfort,M.Nucleic Acids Research 1994,22,1127-1127)。しかしながら、もたらされるタンパク質は連結されており、別個のタンパク質としては発現されない。タンパク質スプライシングは、別個のポリペプチド上で発現される分裂インテインによって、トランスでもまた行われ得る。これらは自発的に組み合わさって単一のインテインを形成し、これがそれからタンパク質スプライシングプロセスを経過して別個のタンパク質に連結する。 The term "protein splicing" as used in this application refers to a process in which the inner region (intein) of a precursor protein is excised and the flanking regions (extein) of the protein are ligated together to form the mature protein. This natural process has been observed in numerous proteins from both prokaryotes and eukaryotes (Perler, F.B., Xu, M.Q., Paulus, H. Current Opinion in Chemical Biology 1997, 1, 292-299; Perler, F.B. Nucleic Acids Research 1999,27,346-347). The intein unit contains the necessary components needed to catalyze protein splicing and often contains an endonuclease domain responsible for intein mobility (Perler, F.B., Davis, E.O., Dean, G.E., Gimble, F.S., Jack, W.E., Neff, N., Noren, C.J., Thomer, J., Belfort, M. Nucleic Acids Research 1994, 22, 1127-1127). However, the resulting proteins are linked and are not expressed as separate proteins. Protein splicing can also be performed in trans by split inteins expressed on separate polypeptides. These combine spontaneously to form a single intein, which then undergoes a protein splicing process to link into separate proteins.

タンパク質スプライシングの機序の解明は、インテインに基づく数多の用途へ繋がっている(Comb,et al.,米国特許第5,496,714号; Comb,et al.,米国特許第5,834,247号;Camarero and Muir,J.Amer.Chem.Soc.,121:5597-5598(1999);Chong,et al.,Gene,192:271-281(1997),Chong,et al.,Nucleic Acids Res.,26:5109-5115(1998);Chong,et al.,J.Biol.Chem.,273:10567-10577(1998);Cotton,et al.J.Am.Chem.Soc.,121:1100-1101(1999);Evans,et al.,J.Biol.Chem.,274:18359-18363(1999);Evans,et al.,J.Biol.Chem.,274:3923-3926(1999);Evans,et al.,Protein Sci.,7:2256-2264(1998);Evans,et al.,J.Biol.Chem.,275:9091-9094(2000);Iwai and Pluckthun,FEBS Lett.459:166-172(1999);Mathys,et al.,Gene,231:1-13(1999);Mills,et al.,Proc.Natl.Acad.Sci.USA 95:3543-3548(1998);Muir,et al.,Proc.Natl.Acad.Sci.USA 95:6705-6710(1998);Otomo,et al.,Biochemistry 38:16040-16044(1999);Otomo,et al.,J.Biolmol.NMR 14:105-114(1999);Scott,et al.,Proc.Natl.Acad.Sci.USA 96:13638-13643(1999);Severinov and Muir,J.Biol.Chem.,273:16205-16209(1998);Shingledecker,et al.,Gene,207:187-195(1998);Southworth,et al.,EMBO J.17:918-926(1998);Southworth,et al.,Biotechniques,27:110-120(1999);Wood,et al.,Nat.Biotechnol.,17:889-892(1999);Wu,et al.,Proc.Natl.Acad.Sci.USA 95:9226-9231(1998a);Wu,et al.,Biochim Biophys Acta 1387:422-432(1998b);Xu,et al.,Proc.Natl.Acad.Sci.USA 96:388-393(1999);Yamazaki,et al.,J.Am.Chem.Soc.,120:5591-5592(1998))。各参照文献は参照により本明細書に組み込まれる。 Elucidation of the mechanisms of protein splicing has led to numerous intein-based applications (Comb, et al., U.S. Pat. No. 5,496,714; Comb, et al., U.S. Pat. No. 5,834,247; Camarero and Muir, J. .Amer.Chem.Soc.,121:5597-5598(1999);Chong,et al.,Gene,192:271-281(1997),Chong,et al.,Nucleic Acids Res.,26:5109-5115 (1998);Chong,et al.,J.Biol.Chem.,273:10567-10577(1998);Cotton,et al.J.Am.Chem.Soc.,121:1100-1101(1999);Evans ,et al.,J.Biol.Chem.,274:18359-18363(1999);Evans,et al.,J.Biol.Chem.,274:3923-3926(1999);Evans,et al.,Protein Sci.,7:2256-2264(1998);Evans,et al.,J.Biol.Chem.,275:9091-9094(2000);Iwai and Pluckthun,FEBS Lett.459:166-172(1999); Mathys,et al.,Gene,231:1-13(1999);Mills,et al.,Proc.Natl.Acad.Sci.USA 95:3543-3548(1998);Muir,et al.,Proc.Natl .Acad.Sci.USA 95:6705-6710(1998);Otomo,et al.,Biochemistry 38:16040-16044(1999);Otomo,et al.,J.Biolmol.NMR 14:105-114(1999) ;Scott,et al.,Proc.Natl.Acad.Sci.USA 96:13638-13643(1999);Severinov and Muir,J.Biol.Chem.,273:16205-16209(1998);Shingledecker,et al. ,Gene,207:187-195(1998);Southworth,et al.,EMBO J.17:918-926(1998);Southworth,et al.,Biotechniques,27:110-120(1999);Wood,et al. al.,Nat.Biotechnol.,17:889-892(1999);Wu,et al.,Proc.Natl.Acad.Sci.USA 95:9226-9231(1998a);Wu,et al.,Biochim Biophys Acta 1387:422-432(1998b);Xu,et al.,Proc. Natl.Acad.Sci.USA 96:388-393(1999);Yamazaki,et al.,J.Am.Chem.Soc.,120: 5591-5592(1998)). Each reference is incorporated herein by reference.

リガンド依存性インテイン
本願において用いられる用語「リガンド依存性インテイン」は、リガンド結合ドメインを含むインテインを言う。典型的には、リガンド結合ドメインはインテインのアミノ酸配列上に挿入され、構造インテイン(N)-リガンド結合ドメイン-インテイン(C)をもたらす。典型的には、リガンド依存性インテインは、適当なリガンドの不在下においてはタンパク質スプライシング活性を発揮しないかまたは最小限のみ発揮し、リガンドの存在下においてはタンパク質スプライシング活性の顕著な増大を発揮する。いくつかの態様では、リガンド依存性インテインはリガンドの不在下においては観察可能なスプライシング活性を発揮しないが、リガンドの存在下においてはスプライシング活性を発揮する。いくつかの態様では、リガンド依存性インテインはリガンドの不在下においては観察可能なタンパク質スプライシング活性を、適当なリガンド存在下においては、リガンドの不在下において観察される活性よりも少なくとも5倍、少なくとも10倍、少なくとも50倍、少なくとも100倍、少なくとも150倍、少なくとも200倍、少なくとも250倍、少なくとも500倍、少なくとも1000倍、少なくとも1500倍、少なくとも2000倍、少なくとも2500倍、少なくとも5000倍、少なくとも10000倍、少なくとも20000倍、少なくとも25000倍、少なくとも50000倍、少なくとも100000倍、少なくとも500000倍、または少なくとも1000000倍多大であるタンパク質スプライシング活性を発揮する。いくつかの態様では、活性の増大は少なくとも1桁、少なくとも2桁、少なくとも3桁、少なくとも4桁、または少なくとも5桁に渡って用量依存的であり、リガンドの濃度を調整することによってインテイン活性の微調整を許す。好適なリガンド依存性インテインは当該技術分野において知られており、下で提供されるものおよび公開米国特許出願第U.S.2014/0065711A1号;Mootz et al.,“Protein splicng triggered by a small molecule.”J.Am.Chem.Soc.2002;124,9044-9045;Mootz et al.,“Conditional protein splicng: a new tool to control protein structure and function in vitro and in vivo.”J.Am.Chem.Soc.2003;125,10561-10569;Buskirk et al.,Proc.Natl.Acad.Sci.USA. 2004;101,10505-10510);Skretas & Wood,“Regulation of protein activity with small-molecule-controlled inteins.”Protein Sci.2005;14,523-532;Schwartz,et al.,“Post-translational enzyme activation in an animal via optimized conditional protein splicing.”Nat.Chem.Biol.2007;3,50-54;Peck et al.,Chem.Biol.2011;18(5),619-630に記載されているものを包含する;夫々の内容全体は参照によってここに組み込まれる。例示の配列は次のとおりである:

Figure 2020191234000002
Figure 2020191234000003
Ligand-dependent inteins As used herein, the term "ligand-dependent inteins" refers to inteins that include a ligand binding domain. Typically, the ligand binding domain is inserted onto the amino acid sequence of an intein, resulting in the structure intein (N)-ligand binding domain-intein (C). Typically, ligand-dependent inteins exhibit no or only minimal protein splicing activity in the absence of a suitable ligand, and a significant increase in protein splicing activity in the presence of the ligand. In some embodiments, a ligand-dependent intein does not exhibit observable splicing activity in the absence of ligand, but does exhibit splicing activity in the presence of ligand. In some embodiments, the ligand-dependent intein exhibits an observable protein splicing activity in the absence of ligand that, in the presence of a suitable ligand, is at least 5 times greater than that observed in the absence of ligand, and at least 10 times greater than that observed in the absence of ligand. at least 50 times, at least 100 times, at least 150 times, at least 200 times, at least 250 times, at least 500 times, at least 1000 times, at least 1500 times, at least 2000 times, at least 2500 times, at least 5000 times, at least 10000 times, exerts a protein splicing activity that is at least 20,000 times, at least 25,000 times, at least 50,000 times, at least 100,000 times, at least 500,000 times, or at least 1,000,000 times greater. In some embodiments, the increase in activity is dose-dependent by at least 1 order of magnitude, at least 2 orders of magnitude, at least 3 orders of magnitude, at least 4 orders of magnitude, or at least 5 orders of magnitude, and the increase in intein activity is increased by adjusting the concentration of the ligand. Allows for minor adjustments. Suitable ligand-gated inteins are known in the art, and those provided below and published US Patent Application No. US2014/0065711A1; Mootz et al., “Protein splicng triggered by a small molecule.”J. Am.Chem.Soc.2002;124,9044-9045;Mootz et al., “Conditional protein splicng: a new tool to control protein structure and function in vitro and in vivo.”J.Am.Chem.Soc.2003; 125,10561-10569;Buskirk et al.,Proc.Natl.Acad.Sci.USA. 2004;101,10505-10510);Skretas & Wood,“Regulation of protein activity with small-molecule-controlled inteins.”Protein Sci .2005;14,523-532;Schwartz, et al.,“Post-translational enzyme activation in an animal via optimized conditional protein splicing.”Nat.Chem.Biol.2007;3,50-54;Peck et al.,Chem. Biol. 2011;18(5), 619-630; the entire contents of each are incorporated herein by reference. An example array is:
Figure 2020191234000002
Figure 2020191234000003

リンカー
本願において用いられる用語「リンカー」は、2つの他の分子または部分を連結するある分子を言う。リンカーは、2つの融合タンパク質を連結するリンカーのケースではアミノ酸配列であり得る。例えば、Cas9はアミノ酸リンカー配列によって逆転写酵素に融合され得る。リンカーは、2つのヌクレオチド配列を一緒に連結するケースではヌクレオチド配列でもまたあり得る。例えば、本ケースでは、従来のガイドRNAは、スペーサーまたはリンカーヌクレオチド配列を介して、RT鋳型配列とRTプライマー結合部位とを含み得るプライム編集ガイドRNAのRNA伸長に連結される。他の態様において、リンカーは有機分子、基、ポリマー、または化学的部分である。いくつかの態様では、リンカーは、長さが5-100アミノ酸、例えば長さが5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、30~35、35~40、40~45、45~50、50~60、60~70、70~80、80~90、90~100、100~150、または150~200アミノ酸である。より長いまたはより短いリンカーもまた企図される。
Linker The term "linker" as used herein refers to a molecule that joins two other molecules or moieties. A linker can be an amino acid sequence in the case of a linker joining two fusion proteins. For example, Cas9 can be fused to reverse transcriptase through an amino acid linker sequence. A linker can also be a nucleotide sequence in the case of joining two nucleotide sequences together. For example, in this case, a conventional guide RNA is linked via a spacer or linker nucleotide sequence to an RNA stretch of prime editing guide RNA, which may include an RT template sequence and an RT primer binding site. In other embodiments, the linker is an organic molecule, group, polymer, or chemical moiety. In some embodiments, the linker is 5-100 amino acids in length, such as 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19 in length. , 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 30-35, 35-40, 40-45, 45-50, 50-60, 60-70, 70-80 , 80-90, 90-100, 100-150, or 150-200 amino acids. Longer or shorter linkers are also contemplated.

単離された
「単離された」は、自然状態から変更または除去されることを意味する。例えば、生きている動物中に天然に存在する核20酸またはペプチドは「単離され」ていないが、共存材料のその自然状態から部分的または完全に分離された同じ核酸またはペプチドは、「単離され」ている。単離された核酸またはタンパク質は、実質的に精製された形態で存在し得るか、または非ネイティブ(non-native)的環境(例えば、宿主細胞など)で存在し得る。
" Isolated " means altered or removed from its natural state. For example, a nucleic acid or peptide that occurs naturally in a living animal is not "isolated," but the same nucleic acid or peptide that is partially or completely separated from its natural state in coexisting materials is "single." “separated”. An isolated nucleic acid or protein may exist in substantially purified form or may exist in a non-native environment (eg, a host cell, etc.).

いくつかの態様において、着目する遺伝子は、単離された核酸によってコードされる。本明細書に使用されるとき、用語「単離された」は、その元のまたはネイティブ(native)の環境(例として、天然に存在する場合は自然環境)から除去されている、本明細書に提供されるとおりの材料の特徴を指す。したがって、生きている動物中に存在する、天然に存在するポリヌクレオチドまたはタンパク質もしくはポリペプチドは単離されていないが、ヒトの介入によって自然系中の共存材料のいくつかまたはすべてから分離されている同じポリヌクレオチドまたはポリペプチドは、単離されている。人工材料または改変材料、例えば、本明細書に記載の発現コンストラクトおよびベクターなどの、天然には存在しない核酸構築物はまた、結果的に、単離されたとも称される。材料は、単離されるために精製される必要はない。結果的に、材料はベクターの一部および/または組成物の一部であってもよく、かかるベクターまたは組成物が、材料が自然界から見出される環境の一部にない点で、依然単離されている。 In some embodiments, the gene of interest is encoded by an isolated nucleic acid. As used herein, the term "isolated" refers to a specification that has been removed from its original or native environment (e.g., the natural environment, if naturally occurring). Refers to the characteristics of the material as provided. Therefore, naturally occurring polynucleotides or proteins or polypeptides present in living animals are not isolated, but have been separated from some or all of the coexisting materials in natural systems by human intervention. The same polynucleotide or polypeptide has been isolated. Artificial or modified materials, such as non-naturally occurring nucleic acid constructs, such as the expression constructs and vectors described herein, are accordingly also referred to as isolated. Material does not need to be purified in order to be isolated. Consequently, the material may be part of a vector and/or part of a composition, such that such vector or composition is not yet isolated in that it is not part of the environment in which the material is found in nature. ing.

MS2タグ付け技術
種々の態様では(例えば、図72~73および例19の態様に図示されているとおり)、用語「MS2タグ付け技術」は、RNA-タンパク質相互作用ドメイン、例えば特定のヘアピン構造を特異的に認識および結合するRNA結合タンパク質とペアリングされた「RNA-タンパク質相互作用ドメイン」(「RNA-タンパク質動員ドメインまたはタンパク質」としてもまた公知)の組み合わせを言う。これらの型のシステムは、標的部位に結合されているプライム編集因子複合体に種々の機能性を動員するように活用され得る。MS2タグ付け技術は、ファージのゲノム上に存在するステムループまたはヘアピン構造、すなわち「MS2ヘアピン」とのMS2バクテリオファージコートタンパク質(「MCP」または「MS2cp」)の天然の相互作用に基づく。プライム編集のケースでは、MS2タグ付け技術は、プライム編集に関わる所望のRNA分子(例えば、PEgRNAまたはtPERT)上にMS2ヘアピンを導入することを含む。これは、それから、その構造を認識および結合するRNA結合タンパク質にとっての特異的な相互作用可能な結合標的を構成する。MS2ヘアピンのケースでは、それはMS2バクテリオファージコートタンパク質(MCP)によって認識および結合される。そして、MCPが別のタンパク質(例えば、逆転写酵素または他のDNAポリメラーゼ)に融合される場合には、MS2ヘアピンが、プライム編集複合体によって占有される標的部位にその他のタンパク質をトランスで「動員」するために用いられ得る。
MS2 Tagging Techniques In various embodiments (e.g., as illustrated in FIGS. 72-73 and the embodiment of Example 19), the term "MS2 tagging techniques" refers to RNA-protein interaction domains, e.g., specific hairpin structures. Refers to a combination of an "RNA-protein interaction domain" (also known as an "RNA-protein recruitment domain or protein") paired with an RNA-binding protein that specifically recognizes and binds. These types of systems can be exploited to recruit various functionalities to the prime editor complex bound to the target site. MS2 tagging technology is based on the natural interaction of the MS2 bacteriophage coat protein ("MCP" or "MS2cp") with a stem-loop or hairpin structure, or "MS2 hairpin," present on the genome of the phage. In the case of prime editing, the MS2 tagging technique involves introducing an MS2 hairpin onto the desired RNA molecule (e.g., PEgRNA or tPERT) involved in prime editing. This in turn constitutes a specific interactable binding target for RNA binding proteins that recognize and bind to that structure. In the case of the MS2 hairpin, it is recognized and bound by the MS2 bacteriophage coat protein (MCP). Then, when MCP is fused to another protein (e.g., reverse transcriptase or other DNA polymerase), the MS2 hairpin "recruits" the other protein in trans to the target site occupied by the prime editing complex. ” can be used to

本明細書に記載のプライム編集因子は、側面として、目当ての特定の機能をプライム編集因子複合体に動員または「共局在」させるためにいずれかの公知のRNA-タンパク質相互作用ドメインを組み込み得る。RNA-タンパク質相互作用の他のモジュールドメインの総説は、当該技術分野において、例えば、Johansson et al.,“RNA recognition by the MS2 phage coat protein,”Sem Virol.,1997,Vol.8(3):176-185;Delebecque et al.,“Organization of intracellular reactions with rationally designed RNA assemblies,”Science,2011,Vol.333:470-474;Mali et al.,“Cas9 transcriptional activators for target specificity screening and paired nickases for cooperative genome engineering,”Nat. Biotechnol.,2013,Vol.31:833-838;およびZalatan et al.,“Engineering complex synthetic transcriptional programs with CRISPR RNA scaffolds,”Cell,2015,Vol.160:339-350(これら各々はその全体が参照されることによって本明細書に組み込まれる)において記載されている。他の系も、PCPタンパク質を特異的に動員するPP7ヘアピン、およびComタンパク質を特異的に動員する「com」ヘアピンを包含する。Zalatan et al.を参照。 The prime editors described herein may, in aspect, incorporate any known RNA-protein interaction domain to recruit or "co-localize" the specific function of interest to the prime editor complex. . Reviews of other modular domains of RNA-protein interactions are available in the art, eg, Johansson et al., “RNA recognition by the MS2 phage coat protein,” Sem Virol., 1997, Vol. 8(3): 176-185;Delebecque et al.,“Organization of intracellular reactions with rationally designed RNA assemblies,”Science,2011,Vol.333:470-474;Mali et al.,“Cas9 transcriptional activators for target specificity screening and paired nickases for cooperative genome engineering,” Nat. Biotechnol.,2013,Vol.31:833-838; and Zalatan et al., “Engineering complex transcription synthetic programs with CRISPR RNA scaffolds,” Cell,2015,Vol.160:339-350( each of which is incorporated herein by reference in its entirety. Other systems also include the PP7 hairpin, which specifically recruits PCP proteins, and the "com" hairpin, which specifically recruits Com proteins. See Zalatan et al.

MS2ヘアピン(即ち、「MS2アプタマー」と称される)のヌクレオチド配列は以下:GCCAACATGAGGATCACCCATGTCTGCAGGGCC(配列番号763)である。 The nucleotide sequence of the MS2 hairpin (i.e., referred to as the "MS2 aptamer") is: GCCAACATGAGGATCACCCATGTCTGCAGGGCC (SEQ ID NO: 763).

MCPまたはMS2cpのアミノ酸配列は以下:GSASNFTQFVLVDNGGTGDVTVAPSNFANGVAEWISSNSRSQAYKVTCSVRQSSAQNRKYTIKVEVPKVATQTVGGEELPVAGWRSYLNMELTIPIFATNSDCELIVKAMQGLLKDGNPIPSAIAANSGIY(配列番号764)である。 The amino acid sequence of MCP or MS2cp is: GSASNFTQFVLVDNGGTGDVTVAPSNFANGVAEWISSNSRSQAYKVTCSVRQSSAQNRKYTIKVEVPKVATQTVGGEELPVAGWRSYLNMELTIPIFATNSDCELIVKAMQGLLKDGNPIPSAIAANSGIY (SEQ ID NO: 764).

MS2ヘアピン(または「MS2アプタマー」)は、ある型の「RNAエフェクター動員ドメイン」(または同等に「RNA結合タンパク質動員ドメイン」もしくは単純に「動員ドメイン」)ともまた言われ得る。なぜなら、それは、PEgRNAまたはtPERT上に組み入れされる物理的構造(例えばヘアピン)であり、これはそのように改変されたPEgRNAまたはrPERTに他のエフェクター機能(例えば、種々の機能を有するRNA結合タンパク質、例えばDNAポリメラーゼ、または他のDNA修飾酵素)を有効に動員し、それゆえにプライム編集機構にエフェクター機能をトランスで共局在させるからである。この適用は、いずれかの具体的なRNAエフェクター動員ドメインに限定されることを決して意図されず、MS2ヘアピンを包含するいずれかの利用可能なかかるドメインを包含し得る。例19および図72(b)は、標的DNA部位に結合したプライム編集因子複合体(MS2cp-PE2:sgRNA複合体)とtPERT分子のDNA合成ドメインとの共局在が成就することを引き起こすための、DNA合成ドメイン(すなわちtPERT分子)に連結されたMS2アプタマーとPE2に融合されたMS2cpタンパク質を含むプライム編集因子との使用を図示する。 The MS2 hairpin (or "MS2 aptamer") may also be referred to as a type of "RNA effector recruitment domain" (or equivalently, "RNA binding protein recruitment domain" or simply "recruitment domain") because it is a physical structure (e.g., a hairpin) that is incorporated onto the PEgRNA or tPERT that effectively recruits other effector functions (e.g., RNA binding proteins with various functions, such as DNA polymerases, or other DNA-modifying enzymes) to the so modified PEgRNA or rPERT, thus colocalizing the effector functions in trans to the prime editing machinery. This application is in no way intended to be limited to any particular RNA effector recruitment domain, but may include any available such domain, including the MS2 hairpin. Example 19 and FIG. 72(b) illustrate the use of a prime editor that includes an MS2 aptamer linked to a DNA synthesis domain (i.e., a tPERT molecule) and an MS2cp protein fused to PE2 to induce colocalization of a prime editor complex (MS2cp-PE2:sgRNA complex) bound to a target DNA site with the DNA synthesis domain of the tPERT molecule.

napDNAbp
本明細書に使用されるとき、用語「核酸プログラム型DNA結合タンパク質」または「napDNAbp」(そのCas9が一例である)は、DNA分子中の特定の配列を標的にし結合するためにRNA:DNAハイブリダイゼーションを使用するタンパク質を指す。各napDNAbpは、ガイド核酸またはこの一部(例として、ガイドRNAのプロトスペーサー)に相補的なDNA鎖(すなわち、標的鎖)を含むDNA配列へnapDNAbpを局在化する、少なくとも1のガイド核酸(例として、ガイドRNA)に結び付けられている。換言すれば、ガイド核酸は、相補的な配列へ局在化し結合するようnapDNAbp(例として、Cas9または等価物)を「プログラム」する。
napDNAbp
As used herein, the term "nucleic acid programmed DNA binding protein" or "napDNAbp" (of which Cas9 is an example) refers to a protein that targets and binds to a specific sequence in a DNA molecule. Refers to proteins that use hybridization. Each napDNAbp includes at least one guide nucleic acid ( For example, a guide RNA). In other words, the guide nucleic acid "programs" the napDNAbp (eg, Cas9 or equivalent) to localize and bind to a complementary sequence.

理論に拘泥されないが、napDNAbp-ガイドRNA複合体の結合機序は、一般に、napDNAbpが二本鎖DNA標的の巻き戻しを誘導するRループを形成する(これによってnapDNAbpによって結合された領域中の鎖が分離される)ステップを包含する。ガイドRNAプロトスペーサーは次いで「標的鎖」とハイブリダイズする。これは、標的鎖に相補的な「非標的鎖」に取って代わり、このことによってRループの単鎖領域が形成される。いくつかの態様において、napDNAbpは1以上のヌクレアーゼ活性を包含しており、次いでDNAを切ることで、様々な型の病変がなくなる。例えば、napDNAbpは、非標的鎖を第1の場所にて切るか、および/または標的鎖を第2の場所にて切る、ヌクレアーゼ活性を含んでいてもよい。ヌクレアーゼ活性に応じて標的DNAが切られることで、両鎖とも切られた「二本鎖切断」が形成され得る。他の態様において、標的DNAは単一の部位でしか切られ得ない、すなわち、DNAは一方の鎖上に「ニックが入れられる(nicked)」。種々のヌクレアーゼ活性をもつ例示のnapDNAbpは、「Cas9ニッカーゼ」(「nCas9」)、およびヌクレアーゼ活性を一切有さない不活性化Cas9(「不活性型Cas9」または「dCas9」)を包含する。これらのおよび他のnapDNAbpへの例示の配列は、本明細書に提供されている。 Without being bound by theory, the binding mechanism of the napDNAbp-guide RNA complex is generally that napDNAbp forms an R-loop that induces unwinding of the double-stranded DNA target (thereby causing the strands in the region bound by napDNAbp to (separated) step. The guide RNA protospacer then hybridizes to the "target strand." This replaces the "non-target strand" that is complementary to the target strand, thereby forming the single-stranded region of the R-loop. In some embodiments, the napDNAbp contains one or more nuclease activities and then cutting the DNA eliminates various types of lesions. For example, napDNAbp may contain nuclease activity that cuts the non-target strand at a first location and/or cuts the target strand at a second location. By cutting the target DNA in response to nuclease activity, a "double-strand break" in which both strands are cut can be formed. In other embodiments, the target DNA can only be cut at a single site, ie, the DNA is "nicked" on one strand. Exemplary napDNAbps with various nuclease activities include "Cas9 nickase" ("nCas9") and inactivated Cas9 without any nuclease activity ("inactive Cas9" or "dCas9"). Exemplary sequences for these and other napDNAbps are provided herein.

ニッカーゼ
用語「ニッカーゼ」は、不活性化された2つのヌクレアーゼドメインのうち1つをもつCas9を指す。この酵素は、標的DNAの一方の鎖のみを切断することが可能である。
Nickase The term "nickase" refers to Cas9 with one of the two nuclease domains inactivated. This enzyme is capable of cutting only one strand of target DNA.

核局在化配列(NLS)
用語「核局在化配列」または「NLS」は、タンパク質の細胞核中への、例えば核輸送による、輸入(import)を促進するアミノ酸配列を指す。核局在化配列は当該技術分野において知られており、当業者に明らかであろう。例えば、NLS配列は、2000年11月23日に出願され、2001年5月31日にWO/2001/038547として公開された、Plankらの国際PCT出願PCT/EP2000/011690に記載されている(この内容は、例示の核局在化配列のその開示について参照により本明細書に組み込まれる)。いくつかの態様において、NLSは、アミノ酸配列PKKKRKV(配列番号16)またはMDSLLMNRRKFLYQFKNVRWAKGRRETYLC(配列番号17)を含む。
Nuclear localization sequence (NLS)
The term "nuclear localization sequence" or "NLS" refers to an amino acid sequence that facilitates the import of a protein into the cell nucleus, eg, by nuclear transport. Nuclear localization sequences are known in the art and will be apparent to those skilled in the art. For example, NLS sequences are described in the international PCT application PCT/EP2000/011690 of Plank et al., filed on November 23, 2000 and published as WO/2001/038547 on May 31, 2001 ( (This content is incorporated herein by reference for its disclosure of exemplary nuclear localization sequences). In some embodiments, the NLS comprises the amino acid sequence PKKKRKV (SEQ ID NO: 16) or MDSLLMNRRKFLYQFKNVRWAKGRRETYLC (SEQ ID NO: 17).

核酸分子
用語「核酸」は、本明細書に使用されるとき、ヌクレオチドのポリマーを指す。ポリマーは、天然のヌクレオシド(すなわち、アデノシン、チミジン、グアノシン、シチジン、ウリジン、デオキシアデノシン、デオキシチミジン、デオキシグアノシン、およびデオキシシチジン)、ヌクレオシド類似体(例として、2-アミノアデノシン、2-チオチミジン、イノシン、ピロロ-ピリミジン、3-メチルアデノシン、5-メチルシチジン、C5ブロモウリジン、C5フルオロウリジン、C5ヨードウリジン、C5プロピニルウリジン、C5プロピニルシチジン、C5メチルシチジン、7デアザアデノシン、7デアザグアノシン、8オキソアデノシン、8オキソグアノシン、O(6)メチルグアニン、4-アセチルシチジン、5-(カルボキシヒドロキシメチル)ウリジン、ジヒドロウリジン、メチルシュードウリジン、1-メチルアデノシン、1-メチルグアノシン、N6-メチルアデノシン、および2-チオシチジン)、化学修飾された塩基、生物学的に修飾された塩基(例として、メチル化された塩基)、インターカレートされた(intercalated)塩基、修飾された糖(例として、2'-フルオロリボース、リボース、2'-デオキシリボース、2'-O-メチルシチジン、アラビノース、およびヘキソース)、または修飾されたホスファート基(例として、ホスホロチオアートおよび5'-Nホスホラミダイト連結)を包含していてもよい。
Nucleic acid molecules The term "nucleic acid" as used herein refers to a polymer of nucleotides. The polymers include natural nucleosides (i.e., adenosine, thymidine, guanosine, cytidine, uridine, deoxyadenosine, deoxythymidine, deoxyguanosine, and deoxycytidine), nucleoside analogs (for example, 2-aminoadenosine, 2-thiothymidine, inosine) , pyrrolo-pyrimidine, 3-methyladenosine, 5-methylcytidine, C5 bromouridine, C5 fluorouridine, C5 iodouridine, C5 propynyluridine, C5 propynylcytidine, C5 methylcytidine, 7 deazaadenosine, 7 deazaguanosine, 8 Oxoadenosine, 8oxoguanosine, O(6)methylguanine, 4-acetylcytidine, 5-(carboxyhydroxymethyl)uridine, dihydrouridine, methylpseudouridine, 1-methyladenosine, 1-methylguanosine, N6-methyladenosine, and 2-thiocytidine), chemically modified bases, biologically modified bases (e.g. methylated bases), intercalated bases, modified sugars (e.g. '-fluororibose, ribose, 2'-deoxyribose, 2'-O-methylcytidine, arabinose, and hexose), or modified phosphate groups (e.g., phosphorothioate and 5'-N phosphoramidite linkages). It may be included.

PEgRNA
本明細書に使用されるとき、用語「プライム編集ガイドRNA」または「PEgRNA」または「伸長されたガイドRNA」は、本明細書に記載のプライム編集方法および組成物を実践するための1以上の追加の配列を包含するよう修飾されたガイドRNAの特化された形態を指す。本明細書に記載のとおり、プライム編集ガイドRNAは、核酸配列の1以上の「伸長された領域」を含む。伸長された領域は、これらに限定されないが、単鎖のRNAまたはDNAを含んでいてもよい。さらに、伸長された領域は、既存のガイドRNAの3'末にて生じていてもよい。他の配置において、伸長された領域は、既存のガイドRNAの5’末にて生じていてもよい。また他の配置において、伸長された領域は、既存のガイドRNAの末端の分子内のある領域にて(例えば、napDNAbpへ結び付きおよび/または結合するgRNAコア領域中)生じていてもよい。伸長された領域は、単鎖DNAを(プライム編集因子のポリメラーゼによって)コードする「DNA合成鋳型」を含むが、前記分子は次に(a)編集されるべき内生標的DNAと相同であるようデザインされており、および(b)内生標的DNA中へ誘導または取り入れられるべき少なくとも1の所望のヌクレオチド変化(例として、トランジション、トランスバージョン、欠失、もしくは挿入)を含んでいる。伸長された領域はまた、他の機能的配列要素(これらに限定されないが、「プライマー結合部位」および「スペーサーもしくはリンカー」配列など)、または他の構造的要素(これらに限定されないが、アプタマー、ステムループ、ヘアピン、トウループ(例として、3'トウループ)、もしくはRNA-タンパク質動員ドメイン(例として、MS2ヘアピン))も含んでいてもよい。本明細書に使用されるとき「プライマー結合部位」は、Rループのニック入りDNAから生成された3'末を有する単鎖DNA配列とハイブリダイズする配列を含む。
PEgRNA
As used herein, the term "primed editing guide RNA" or "PEgRNA" or "elongated guide RNA" refers to one or more prime editing guide RNAs for practicing the prime editing methods and compositions described herein. Refers to a specialized form of guide RNA that has been modified to include additional sequences. As described herein, the prime editing guide RNA includes one or more "extended regions" of the nucleic acid sequence. The extended region may include, but is not limited to, single-stranded RNA or DNA. Additionally, the extended region may occur at the 3' end of an existing guide RNA. In other arrangements, the extended region may occur at the 5' end of the existing guide RNA. In yet other arrangements, the extended region may occur at some region within the molecule at the end of an existing guide RNA (eg, in the gRNA core region that joins and/or binds to napDNAbp). The elongated region contains a "DNA synthesis template" that encodes (by the prime editing factor polymerase) a single-stranded DNA, which is then (a) homologous to the endogenous target DNA to be edited; and (b) contain at least one desired nucleotide change (eg, a transition, transversion, deletion, or insertion) to be induced or incorporated into the endogenous target DNA. The extended region may also contain other functional sequence elements (such as, but not limited to, "primer binding site" and "spacer or linker" sequences), or other structural elements (including, but not limited to, aptamers, It may also contain a stem-loop, hairpin, toe-loop (eg, 3' toe-loop), or RNA-protein recruitment domain (eg, MS2 hairpin). As used herein, a "primer binding site" includes a sequence that hybridizes to a single-stranded DNA sequence having a 3' end generated from R-loop nicked DNA.

ある態様において、PEgRNAは、5'伸長アーム、スペーサー、およびgRNAコアを有するPEgRNAを示す図3Aによって表されている。5'伸長は、5'→3'方向に逆転写酵素鋳型、プライマー結合部位、およびリンカーをさらに含む。示されているとおり、逆転写酵素鋳型はより幅広く「DNA合成鋳型」ともまた言われ得、ここで、本明細書に記載のプライム編集因子のポリメラーゼはRTではなく別の型のポリメラーゼである。 In certain embodiments, the PEgRNA is represented by Figure 3A, which shows a PEgRNA with a 5' extended arm, a spacer, and a gRNA core. The 5' extension further includes a reverse transcriptase template, a primer binding site, and a linker in the 5'→3' direction. As indicated, the reverse transcriptase template can also be referred to more broadly as a "DNA synthesis template," where the polymerase of the prime editing factor described herein is another type of polymerase rather than RT.

ある他の態様において、PEgRNAは、3'伸長アーム、スペーサー、およびgRNAコアを有するPEgRNAを示す図3Bによって表されている。3'伸長は、5'→3'方向に逆転写酵素鋳型、プライマー結合部位をさらに含む。示されているとおり、逆転写酵素鋳型はより幅広く「DNA合成鋳型」ともまた言われ得、ここで、本明細書に記載のプライム編集因子のポリメラーゼはRTではなく別の型のポリメラーゼである。 In certain other embodiments, the PEgRNA is represented by Figure 3B, which shows a PEgRNA with a 3' extended arm, a spacer, and a gRNA core. The 3' extension further includes a reverse transcriptase template, primer binding site in the 5'→3' direction. As indicated, the reverse transcriptase template can also be referred to more broadly as a "DNA synthesis template," where the polymerase of the prime editing factor described herein is another type of polymerase rather than RT.

更なる他の態様において、PEgRNAは、5'→3'方向にスペーサー(1)、gRNAコア(2)、および伸長アーム(3)を有するPEgRNAを示す図3Dによって表されている。伸長アーム(3)は、PEgRNAの3'末にある。伸長アーム(3)は、5'→3'方向に「プライマー結合部位」(A)、「編集鋳型」(B)、および「相同アーム」(C)をさらに含む。伸長アーム(3)はまた、3'末および5'末にて、同じ配列であってもまたは異なる配列であってもよい任意の修飾領域も含んでいてもよい。加えて、PEgRNAの3'末は、転写ターミネータ配列を含んでいてもよい。PEgRNAのこれらの配列要素はさらに、本明細書に記載、定義される。 In yet other embodiments, the PEgRNA is represented by Figure 3D, which shows the PEgRNA with a spacer (1), a gRNA core (2), and an extended arm (3) in the 5'→3' direction. The extended arm (3) is at the 3' end of PEgRNA. The elongated arm (3) further includes a "primer binding site" (A), an "editing template" (B), and a "homologous arm" (C) in the 5'→3' direction. The extended arm (3) may also contain any modified regions at the 3' and 5' ends, which may be of the same or different sequence. Additionally, the 3' end of PEgRNA may include a transcription terminator sequence. These sequence elements of PEgRNA are further described and defined herein.

なお他の態様において、PEgRNAは図3Eによって表され、これは5'から3'方向に伸長アーム(3)、スペーサー(1)、およびgRNAコア(2)を有するPEgRNAを示す。伸長アーム(3)はPEgRNAの5'端にある。伸長アーム(3)はさらに3'から5'方向に「プライマー結合部位」(A)、「編集鋳型」(B)、および「相同アーム」(C)を含む。伸長アーム(3)は任意の修飾領域をもまた3'および5'端に含み得、これらは同じ配列または異なる配列であり得る。PEgRNAの3'末は、転写ターミネータ配列を含んでいてもよい。PEgRNAのこれらの配列要素はさらに、本明細書に記載、定義される。 In yet other embodiments, the PEgRNA is represented by FIG. 3E, which shows a PEgRNA having, in a 5' to 3' direction, an extension arm (3), a spacer (1), and a gRNA core (2). The extension arm (3) is at the 5' end of the PEgRNA. The extension arm (3) further comprises, in a 3' to 5' direction, a "primer binding site" (A), an "editing template" (B), and a "homology arm" (C). The extension arm (3) may also comprise optional modification regions at the 3' and 5' ends, which may be the same or different sequences. The 3' end of the PEgRNA may comprise a transcription terminator sequence. These sequence elements of the PEgRNA are further described and defined herein.

PE1
本願において用いられる「PE1」は、次の構造を有するCas9(H840A)と野生型MMLV RTとを含む融合タンパク質を含むPE複合体を言う:[NLS]-[Cas9(H840A)]-[リンカー]-[MMLV_RT(wt)]+所望のPEgRNA。PE融合体は配列番号123のアミノ酸配列を有し、これは次のとおり示される;

Figure 2020191234000004
Figure 2020191234000005
PE1
"PE1" as used in this application refers to a PE complex comprising a fusion protein containing Cas9(H840A) and wild-type MMLV RT with the following structure: [NLS]-[Cas9(H840A)]-[linker] -[MMLV_RT(wt)]+desired PEgRNA. The PE fusion has the amino acid sequence of SEQ ID NO: 123, which is shown below;
Figure 2020191234000004
Figure 2020191234000005

PE2
本願において用いられる「PE2」は、次の構造を有するCas9(H840A)とバリアントMMLV RTとを含む融合タンパク質を含むPE複合体を言う:[NLS]-[Cas9(H840A)]-[リンカー]-[MMLV_RT(D200N)(T330P)(L603W)(T306K)(W313F)]+所望のPEgRNA。PE融合体は配列番号134のアミノ酸配列を有し、これは次のとおり示される:

Figure 2020191234000006
Figure 2020191234000007
PE2
"PE2" as used in this application refers to a PE complex comprising a fusion protein containing Cas9(H840A) and variant MMLV RT with the following structure: [NLS]-[Cas9(H840A)]-[linker]- [MMLV_RT(D200N)(T330P)(L603W)(T306K)(W313F)]+desired PEgRNA. The PE fusion has the amino acid sequence of SEQ ID NO: 134, which is shown below:
Figure 2020191234000006
Figure 2020191234000007

PE3
本願において用いられる「PE3」は、PE2、プラスPE2と複合体化する第2鎖ニッキングガイドRNAを言い、編集される鎖の選好的置き換えを誘導するために非編集DNA鎖上にニックを導入する。
PE3b
PE3
As used herein, "PE3" refers to PE2, plus a second strand nicking guide RNA that complexes with PE2 and introduces a nick on the non-edited DNA strand to induce preferential replacement of the edited strand. .
PE3b

本願において用いられる「PE3b」はPE3を言うが、第2鎖ニッキングガイドRNAは、所望の編集の組み入れ後までは第2鎖ニックが導入されないようにして時間的コントロールのためにデザインされる。これは、元々のアレルではなく編集された鎖のみにマッチするスペーサー配列を有するgRNAをデザインすることによって達成される。以降ではPE3bと言われるこの戦略を用いると、プロトスペーサーと編集されないアレルとの間のミスマッチは、PAM鎖上の編集イベントが生起する後までは、sgRNAによるニッキングを好まないはずである。 As used herein, "PE3b" refers to PE3, where a second strand nicking guide RNA is designed for temporal control such that a second strand nick is not introduced until after incorporation of the desired edit. This is accomplished by designing a gRNA with a spacer sequence that matches only the edited strand and not the original allele. Using this strategy, hereafter referred to as PE3b, mismatches between the protospacer and the non-edited allele should not favor nicking by the sgRNA until after the editing event on the PAM strand has occurred.

短いPE(PE-short)
本願において用いられる「短いPE」は、C末端短縮逆転写酵素に融合されているPE構築物を言い、次のアミノ酸配列を有する:

Figure 2020191234000008
Figure 2020191234000009
Short PE (PE-short)
" Short PE " as used herein refers to a PE construct that is fused to a C-terminally truncated reverse transcriptase and has the following amino acid sequence:
Figure 2020191234000008
Figure 2020191234000009

ペプチドタグ
用語「ペプチドタグ」は、遺伝子学的にタンパク質配列と融合してタンパク質上へ1以上の機能を付与するペプチドアミノ酸配列を指し、これによって可視化、精製、可溶化、分離等々などの様々な目的でのタンパク質の操作が容易になる。ペプチドタグは、目的または機能によって分類される様々な型のタグを包含し得、これは、「親和性タグ」(タンパク質精製を容易にするための)、「可溶化タグ」(タンパク質の正しい折り畳みを補助するための)、「クロマトグラフィータグ」(タンパク質のクロマトグラフ特性を変更するための)、「エピトープタグ」(高親和性抗体へ結合するための)、「蛍光タグ」(細胞中またはin vitroでのタンパク質の可視化を容易にするための)を包含していてもよい。
Peptide tag The term "peptide tag" refers to a peptide amino acid sequence that is genetically fused to a protein sequence to confer one or more functions on the protein, thereby allowing for various functions such as visualization, purification, solubilization, separation, etc. Easily manipulate proteins for purposes. Peptide tags can encompass various types of tags categorized by purpose or function, such as "affinity tags" (to facilitate protein purification), "solubilization tags" (to facilitate correct folding of proteins), ``chromatographic tags'' (to alter the chromatographic properties of a protein), ``epitope tags'' (for binding to high-affinity antibodies), and ``fluorescent tags'' (to assist in binding to high-affinity antibodies) ) to facilitate visualization of the protein in vitro.

ポリメラーゼ
本願において用いられる用語「ポリメラーゼ」は、本明細書に記載のプライム編集因子システムに関して用いられ得るヌクレオチド鎖を合成する酵素を言う。ポリメラーゼは「鋳型依存性」ポリメラーゼであり得る(すなわち、鋳型鎖のヌクレオチド塩基の順序に基づいてヌクレオチド鎖を合成するポリメラーゼ)。ポリメラーゼは「鋳型非依存性」ポリメラーゼでもまたあり得る(すなわち、鋳型鎖の要件なしにヌクレオチド鎖を合成するポリメラーゼ)。ポリメラーゼはさらに「DNAポリメラーゼ」または「RNAポリメラーゼ」としてもまた類別され得る。種々の態様において、プライム編集因子システムはDNAポリメラーゼを含む。種々の態様において、DNAポリメラーゼは「DNA依存性DNAポリメラーゼ」であり得る(すなわち、それによると、鋳型分子はDNAの鎖である)。かかるケースでは、DNA鋳型分子はPEgRNAであり得、伸長アームはDNAの鎖を含む。かかるケースでは、PEgRNAはキメラまたはハイブリッドPEgRNAと言われ得、これはRNA部分(すなわち、スペーサーおよびgRNAコアを包含するガイドRNA構成要素)とDNA部分(すなわち伸長アーム)とを含む。種々の他の態様において、DNAポリメラーゼは「RNA依存性DNAポリメラーゼ」であり得る(すなわち、それによると、鋳型分子はRNAの鎖である)。かかるケースでは、PEgRNAはRNAであり、すなわちRNA伸長を包含する。用語「ポリメラーゼ」は、ヌクレオチドの重合を触媒する酵素をもまた言い得る(すなわちポリメラーゼ活性)。一般的に、酵素は、ポリヌクレオチド鋳型配列にアニーリングしたプライマー(例えば、例えばPEgRNAのプライマー結合部位にアニーリングしたプライマー配列)の3'端において合成を開始し、鋳型鎖の5'端の方へ進むであろう。「DNAポリメラーゼ」はデオキシヌクレオチドの重合を触媒する。DNAポリメラーゼを参照して本願において用いられる用語DNAポリメラーゼは、「その機能的フラグメント」を包含する。「その機能的フラグメント」は、少なくとも1つのセットの条件下においてはポリヌクレオチドの重合を触媒する能力を保持する、ポリメラーゼのアミノ酸配列全体未満を包摂する野生型または変異体DNAポリメラーゼのいずれかの部分を言う。かかる機能的フラグメントは別個の実態として存在し得るか、またはそれは融合タンパク質などのより大きいポリペプチドの構成成分であり得る。
Polymerase The term "polymerase" as used herein refers to an enzyme that synthesizes a nucleotide chain that can be used in connection with the prime editor system described herein. The polymerase can be a "template-dependent" polymerase (ie, a polymerase that synthesizes a nucleotide strand based on the order of the nucleotide bases in a template strand). A polymerase can also be a "template-independent" polymerase (ie, a polymerase that synthesizes a nucleotide strand without the requirement of a template strand). Polymerases can also be further classified as "DNA polymerases" or "RNA polymerases." In various embodiments, the prime editor system includes a DNA polymerase. In various embodiments, the DNA polymerase can be a "DNA-dependent DNA polymerase" (ie, according to which the template molecule is a strand of DNA). In such cases, the DNA template molecule may be PEgRNA and the extending arm comprises a strand of DNA. In such cases, the PEgRNA may be referred to as a chimeric or hybrid PEgRNA, which includes an RNA portion (ie, a guide RNA component that includes a spacer and a gRNA core) and a DNA portion (ie, an extended arm). In various other embodiments, the DNA polymerase can be an "RNA-dependent DNA polymerase" (ie, according to which the template molecule is a strand of RNA). In such cases, PEgRNA is RNA, ie, includes RNA extension. The term "polymerase" can also refer to an enzyme that catalyzes the polymerization of nucleotides (ie, polymerase activity). Generally, the enzyme initiates synthesis at the 3' end of a primer annealed to a polynucleotide template sequence (e.g., a primer sequence annealed to the primer binding site of, e.g., PEgRNA) and proceeds toward the 5' end of the template strand. Will. "DNA polymerase" catalyzes the polymerization of deoxynucleotides. The term DNA polymerase, as used herein with reference to DNA polymerase, encompasses "functional fragments thereof.""Functional fragment thereof" means any portion of a wild-type or mutant DNA polymerase that encompasses less than the entire amino acid sequence of the polymerase that retains the ability to catalyze the polymerization of polynucleotides under at least one set of conditions. say. Such a functional fragment may exist as a separate entity or it may be a component of a larger polypeptide such as a fusion protein.

プライム編集
本願において用いられる用語「プライム編集」は、遺伝子編集のための新規のアプローチを言い、napDNAbp、ポリメラーゼ(例えば逆転写酵素)、およびそれから標的DNA配列上に組み込まれる所望の新たな遺伝情報をコードする(または遺伝情報を欠失する)ためのDNA合成鋳型を包含する特殊化したガイドRNAを用いる。プライム編集のある種の態様は他の図の中でも図1A-1Hおよび図72(a)-72(c)の態様に記載される。
Prime Editing The term "prime editing" as used herein refers to a novel approach for gene editing, in which napDNAbp, a polymerase (e.g. reverse transcriptase), and the desired new genetic information are then incorporated onto the target DNA sequence. A specialized guide RNA is used that contains the DNA synthesis template to encode (or delete genetic information). Certain embodiments of prime editing are described in the embodiments of FIGS. 1A-1H and 72(a)-72(c), among other figures.

プライム編集は、規定されたDNA部位に新たな遺伝情報を直接的に書き込む汎用的なかつ精密なゲノム編集法であるゲノム編集のための全く新たなプラットフォームを表し、ポリメラーゼ(すなわち、融合タンパク質の形態で、またはさもなければnapDNAbpとトランスで提供されて)と共同で働く核酸プログラム型DNA結合タンパク質(「napDNAbp」)を用いる。プライム編集システムはプライム編集(PE)ガイドRNA(「PEgRNA」)によってプログラムされ、これは、標的部位を規定すると共に、ガイドRNA上に(例えば、ガイドRNAの5'もしくは3'端にまたは内部の部分に)操作された伸長(DNAまたはRNAどちらか)によって置き換えDNA鎖の形態での所望の編集の合成の鋳型となる。所望の編集(例えば、1核酸塩基置換)を含有する置き換え鎖は、編集されるべき標的部位の(ニック部位の直ちに下流の)内生鎖と同じ配列を共有する(またはそれに対して相同的である)(それが所望の編集を包含するということを例外とする)。DNA修復および/または複製機構によって、ニック部位の下流の内生鎖は、所望の編集を含有する新たに合成された置き換え鎖によって置き換えられる。いくつかのケースでは、プライム編集は「検索置換」ゲノム編集テクノロジーと考えられ得る。なぜなら、本明細書に記載のプライム編集因子は、編集されるべき所望の標的部位を検索し位置付けるのみならず、同時に、対応する標的部位の内生DNA鎖の代わりに組み入れされる所望の編集を含有する置き換え鎖をコードするからである。本開示のプライム編集因子は、部分的には、プライム標的にプライムされた逆転写(TPRT)または「プライム編集」の機序が、高い効率および遺伝子フレキシビリティーを有する精密なCRISPR/Casに基づくゲノム編集を行うために活用または適合され得るという発見に関する(例えば、図1A-1Fの種々の態様に図示されているとおり)。天然には、TPRTは、可動DNAエレメント、例えば哺乳類非LTRレトロトランスポゾンおよび細菌グループIIイントロンによって用いられる28,29。本発明者は、本願において、Casタンパク質-逆転写酵素融合体または関係するシステムを用いて、ガイドRNAによって特定のDNA配列を標的化し、標的部位に一本鎖ニックを生成し、ガイドRNAに取り入れされた操作された逆転写酵素鋳型の逆転写のためのプライマーとして、ニッキングされたDNAを用いた。しかしながら、概念はDNAポリメラーゼ構成要素として逆転写酵素を用いるプライム編集因子から始まるが、本明細書に記載のプライム編集因子は逆転写酵素に限定されず、実質的にいずれかのDNAポリメラーゼの使用を包含し得る。実に、本願は、至る所で、「逆転写酵素」を有するプライム編集因子を言い得るが、逆転写酵素は、プライム編集で働き得るDNAポリメラーゼの1つの型であるのみであるということがここで明示される。それゆえに、本明細書が「逆転写酵素」に言及するところではいつも、当業者は、いずれかの好適なDNAポリメラーゼが逆転写酵素の代わりに用いられ得るということを了解するべきである。それゆえに、一側面において、プライム編集因子はCas9(または同等のnapDNAbp)を含み得、これは、標的DNA上の相補的なプロトスペーサーにアニールするスペーサー配列を含有する特殊化したガイドRNA(すなわちPEgRNA)とそれを会合させることによって、DNA配列を標的化するようにプログラムされる。特殊化したガイドRNAは、所望の遺伝子変改を含有するDNAの置き換え鎖をコードする伸長の形態の新たな遺伝情報をもまた含有し、これは、標的部位における対応する内生DNA鎖を置き換えるために用いられる。PEgRNAからの情報を標的DNAに移入するために、プライム編集の機序には、DNAの1つの鎖上の標的部位へニックを入れて3'ヒドロキシル基を暴露することが関わる。それから、暴露された3'ヒドロキシル基は、直接的に標的部位へのPEgRNA上の編集をコードする伸長のDNA重合をプライムするために用いられ得る。種々の態様において、編集を含有する置き換え鎖の重合のための鋳型を提供する伸長は、RNAまたはDNAから形成され得る。RNA伸長のケースでは、プライム編集因子のポリメラーゼはRNA依存性DNAポリメラーゼ(例えば逆転写酵素)であり得る。DNA伸長のケースでは、プライム編集因子のポリメラーゼはDNA依存性DNAポリメラーゼであり得る。本明細書に開示のプライム編集因子によって形成される新たに合成された鎖(すなわち、所望の編集を含有する置き換えDNA鎖)は、所望のヌクレオチド変化(例えば、1ヌクレオチド変化、欠失、もしくは挿入、またはそれらの組み合わせ)の包含を例外として、ゲノム標的配列に対して相同的である(すなわち、それと同じ配列を有する)であろう。DNAの新たに合成された(または置き換え)鎖は一本鎖DNAフラップともまた言われ得る。これは相補的な相同的な内生DNA鎖とのハイブリダイゼーションについて競合し、それによって対応する内生鎖に取って代わるであろう。ある態様において、システムは、エラーを起こしやすい逆転写酵素酵素の使用と組み合わせられ得る(例えば、Cas9ドメインとの融合タンパク質として提供されるか、またはCas9ドメインに対してトランスで提供される)。エラーを起こしやすい逆転写酵素酵素は一本鎖DNAフラップの合成の間に変改を導入し得る。それゆえに、ある態様において、エラーを起こしやすい逆転写酵素は、標的DNAへのヌクレオチド変化を導入するために利用され得る。システムに用いられるエラーを起こしやすい逆転写酵素に依存して、変化はランダムまたは非ランダムであり得る。ハイブリダイズした中間体(内生DNA鎖にハイブリダイズした逆転写酵素によって合成される一本鎖DNAフラップを含む)の分解は、内生DNAのもたらされる取って代わられたフラップの除去(例えば、5'端DNAフラップエンドヌクレアーゼFEN1による)、標的DNAに対する合成された一本鎖DNAフラップのライゲーション、ならびに細胞性のDNA修復および/または複製プロセスの結果としての所望のヌクレオチド変化の同化を包含し得る。鋳型によるDNA合成は挿入および欠失を包含するいずれかのヌクレオチドの改変について1ヌクレオチド精度をオファーするので、このアプローチの範囲は非常に幅広く、予見可能には、基礎研究および治療学において無数の適用に用いられ得る。 Prime editing represents a completely new platform for genome editing, a versatile and precise genome editing method that directly writes new genetic information into defined DNA sites, using a polymerase (i.e., in the form of a fusion protein). , or otherwise provided in trans with napDNAbp). The prime editing system is programmed by a prime editing (PE) guide RNA (“PEgRNA”), which defines the target site and which is located on the guide RNA (e.g., at the 5' or 3' end of the guide RNA or internally). (in part) serves as a template for the synthesis of the desired edit in the form of a DNA strand replaced by an engineered extension (either DNA or RNA). The replacement strand containing the desired edit (e.g., a single nucleobase substitution) shares the same sequence as (or is homologous to) the endogenous strand (immediately downstream of the nick site) of the target site to be edited. ) (with the exception that it includes the desired edits). Through DNA repair and/or replication machinery, the endogenous strand downstream of the nick site is replaced by a newly synthesized replacement strand containing the desired edit. In some cases, prime editing can be considered a "search and replace" genome editing technology. This is because the prime editing factors described herein not only locate and locate the desired target site to be edited, but also simultaneously generate the desired edit to be incorporated in place of the endogenous DNA strand of the corresponding target site. This is because it encodes the contained replacement strand. The prime editing factors of the present disclosure provide, in part, that the target-primed reverse transcription (TPRT) or "prime editing" mechanism is based on precision CRISPR/Cas with high efficiency and genetic flexibility. Relating to the discovery that it can be exploited or adapted to perform genome editing (eg, as illustrated in the various embodiments of FIGS. 1A-1F). In nature, TPRT is used by mobile DNA elements such as mammalian non-LTR retrotransposons and bacterial group II introns28,29 . In this application, we use Cas protein-reverse transcriptase fusions or related systems to target specific DNA sequences by guide RNA, generate single-stranded nicks at the target site, and incorporate them into the guide RNA. The nicked DNA was used as a primer for reverse transcription of the engineered reverse transcriptase template. However, although the concept begins with prime editing agents that use reverse transcriptase as the DNA polymerase component, the prime editing agents described herein are not limited to reverse transcriptase, and may include the use of virtually any DNA polymerase. can be included. Indeed, although this application may refer to a prime editing agent with "reverse transcriptase" throughout, it is hereby acknowledged that reverse transcriptase is only one type of DNA polymerase that can act in prime editing. be made explicit. Therefore, wherever this specification refers to "reverse transcriptase," one of ordinary skill in the art should understand that any suitable DNA polymerase can be used in place of reverse transcriptase. Therefore, in one aspect, the prime editing factor may include Cas9 (or equivalent napDNAbp), which is a specialized guide RNA containing a spacer sequence that anneals to a complementary protospacer on the target DNA (i.e., PEgRNA ) is programmed to target a DNA sequence. The specialized guide RNA also contains new genetic information in the form of an extension encoding a replacement strand of DNA containing the desired genetic modification, which replaces the corresponding endogenous DNA strand at the target site. used for To transfer information from PEgRNA to target DNA, the prime editing mechanism involves nicking the target site on one strand of DNA to expose a 3' hydroxyl group. The exposed 3' hydroxyl group can then be used to prime DNA polymerization of the editing encoding extension on PEgRNA directly to the target site. In various embodiments, the extension that provides the template for polymerization of the replacement strand containing the edit can be formed from RNA or DNA. In the case of RNA elongation, the prime editor polymerase can be an RNA-dependent DNA polymerase (eg, reverse transcriptase). In the case of DNA elongation, the prime editor polymerase can be a DNA-dependent DNA polymerase. The newly synthesized strand formed by the prime editing agents disclosed herein (i.e., the replacement DNA strand containing the desired edit) contains the desired nucleotide change (e.g., a single nucleotide change, deletion, or insertion). , or a combination thereof) will be homologous to (ie, have the same sequence as) the genomic target sequence. The newly synthesized (or replaced) strand of DNA can also be referred to as a single-stranded DNA flap. This will compete for hybridization with the complementary homologous endogenous DNA strand, thereby displacing the corresponding endogenous strand. In certain embodiments, the system may be combined with the use of error-prone reverse transcriptase enzymes (eg, provided as a fusion protein with or in trans to a Cas9 domain). The error-prone reverse transcriptase enzyme can introduce alterations during the synthesis of single-stranded DNA flaps. Therefore, in certain embodiments, error-prone reverse transcriptase can be utilized to introduce nucleotide changes to target DNA. Depending on the error-prone reverse transcriptase used in the system, changes can be random or non-random. Degradation of hybridized intermediates (including single-stranded DNA flaps synthesized by reverse transcriptase hybridized to endogenous DNA strands) results in removal of the displaced flap of endogenous DNA (e.g., 5'-end DNA flap endonuclease FEN1), ligation of the synthesized single-stranded DNA flap to the target DNA, and assimilation of desired nucleotide changes as a result of cellular DNA repair and/or replication processes. . Because template-directed DNA synthesis offers single nucleotide precision for any nucleotide modification, including insertions and deletions, the scope of this approach is very broad and foreseeably has countless applications in basic research and therapeutics. It can be used for.

種々の態様において、プライム編集は、プライム編集ガイドRNA(PEgRNA)と複合体化した核酸プログラム型DNA結合タンパク質(napDNAbp)と標的DNA分子(これについて、ヌクレオチド配列の変化が導入されることが望まれる)を接触させることによって作動する。図1Gを参照すると、プライム編集ガイドRNA(PEgRNA)は、ガイドRNAの3'もしくは5'端にまたはガイドRNAの分子内の位置付けに伸長を含み、所望のヌクレオチド変化(例えば、1ヌクレオチド変化、挿入、または欠失)をコードする。ステップ(a)では、napDNAbp/伸長されたgRNA複合体がDNA分子に接触し、伸長されたgRNAが、標的座位に結合するようにnapDNAbpをガイドする。ステップ(b)では、標的座位のDNAの鎖の1つにニックが導入され(例えば、ヌクレアーゼまたは化学的薬剤による)、それによって利用可能な3'端を標的座位の鎖の1つに生出する。ある態様において、ニックは、Rループ鎖に対応するDNAの鎖、すなわちガイドRNA配列にハイブリダイズされない鎖、すなわち「非標的鎖」上に生出される。しかしながら、ニックは鎖のどちらかに導入され得る。つまり、ニックはRループ「標的鎖」(すなわち、伸長されたgRNAのプロトスペーサーにハイブリダイズされる鎖)または「非標的鎖」(すなわち、標的鎖に対して相補的であるRループの一本鎖部分を形成する鎖)に導入され得る。ステップ(c)では、DNA鎖の3'端(ニックによって形成される)は、逆転写をプライムするためにガイドRNAの伸長された部分と相互作用する(すなわち、「プライム標的にプライムされたRT」)。ある態様において、3'端DNA鎖は、ガイドRNAの伸長された部分の特異的なRTプライム配列、すなわちPEgRNA上の「逆転写酵素プライム配列」または「プライマー結合部位」にハイブリダイズする。ステップ(d)では、逆転写酵素(または他の好適なDNAポリメラーゼ)が導入される。これは、プライムされた部位の3'端からプライム編集ガイドRNAの5'端の方へDNAの一本鎖を合成する。DNAポリメラーゼ(例えば逆転写酵素)はnapDNAbpに融合され得るか、または代替的にはnapDNAbpに対してトランスで提供され得る。これは、ニック部位のまたはそれに隣接する内生DNAに対してさもなければ相同的である所望のヌクレオチド変化(例えば、1塩基変化、挿入、もしくは欠失、またはそれらの組み合わせ)を含む一本鎖DNAフラップを形成する。ステップ(e)では、napDNAbpおよびガイドRNAがリリースされる。ステップ(f)および(g)は一本鎖DNAフラップの分解に関し、その結果、所望のヌクレオチド変化が標的座位に組み込まれるようになる。このプロセスは、ひとたび3'一本鎖DNAフラップが内生DNA配列に侵入およびハイブリダイズすると形成する対応する5'内生DNAフラップを除去することによって、所望の産物形成の方へ駆動され得る。理論によって拘束されることなしに、細胞の内生DNA修復および複製プロセスは、ミスマッチのDNAを分解して、ヌクレオチド変化(単数または複数)を組み込んで、所望の変改された産物を形成する。プロセスは、図1Fに例示されているとおり「第2鎖ニッキング」によってもまた産物形成の方へ駆動され得る。このプロセスは次の遺伝子変化の少なくとも1つ以上を導入し得る:トランスバージョン、トランジション、欠失、および挿入。 In various embodiments, prime editing involves the use of a nucleic acid programmed DNA binding protein (napDNAbp) complexed with a prime editing guide RNA (PEgRNA) and a target DNA molecule (for which it is desired to introduce a nucleotide sequence change). ) is activated by touching. Referring to Figure 1G, a prime editing guide RNA (PEgRNA) contains an extension at the 3' or 5' end of the guide RNA or at an intramolecular position of the guide RNA to accommodate the desired nucleotide change (e.g., single nucleotide change, insertion , or deletion). In step (a), the napDNAbp/extended gRNA complex contacts the DNA molecule and the extended gRNA guides the napDNAbp to bind to the target locus. In step (b), a nick is introduced (e.g., by a nuclease or chemical agent) into one of the strands of the DNA at the target locus, thereby creating an available 3' end on one of the strands at the target locus. . In certain embodiments, the nick is created on the strand of DNA that corresponds to the R-loop strand, ie, the strand that is not hybridized to the guide RNA sequence, ie, the "non-target strand." However, nicks can be introduced into either of the strands. That is, the nick is either the R-loop "target strand" (i.e., the strand that hybridizes to the protospacer of the elongated gRNA) or the "non-target strand" (i.e., one of the R-loops that is complementary to the target strand). (the chain forming the chain part). In step (c), the 3' end of the DNA strand (formed by the nick) interacts with the extended portion of the guide RNA to prime reverse transcription (i.e., 'primed RT ”). In certain embodiments, the 3' end DNA strand hybridizes to a specific RT prime sequence of the extended portion of the guide RNA, ie, a "reverse transcriptase prime sequence" or "primer binding site" on the PEgRNA. In step (d), reverse transcriptase (or other suitable DNA polymerase) is introduced. This synthesizes a single strand of DNA from the 3' end of the primed site towards the 5' end of the prime editing guide RNA. A DNA polymerase (eg, reverse transcriptase) can be fused to napDNAbp or alternatively provided in trans to napDNAbp. This is a single strand containing the desired nucleotide changes (e.g., single base changes, insertions, or deletions, or combinations thereof) that are otherwise homologous to the endogenous DNA at or adjacent to the nick site. Form a DNA flap. In step (e) napDNAbp and guide RNA are released. Steps (f) and (g) involve disassembly of the single-stranded DNA flap so that the desired nucleotide change is incorporated at the target locus. This process can be driven toward desired product formation by removing the corresponding 5' endogenous DNA flap that forms once the 3' single-stranded DNA flap invades and hybridizes to the endogenous DNA sequence. Without being bound by theory, the cell's endogenous DNA repair and replication processes degrade mismatched DNA and incorporate nucleotide change(s) to form the desired modified product. The process can also be driven towards product formation by "second strand nicking" as illustrated in FIG. 1F. This process may introduce at least one or more of the following genetic changes: transversions, transitions, deletions, and insertions.

用語「プライム編集因子(PE)システム」または「プライム編集因子(PE)」または「PEシステム」または「PE編集システム」は、本明細書に記載の(describe)プライム標的にプライムされた逆転写(TPRT)を用いるゲノム編集の方法に関わる組成物を言い、napDNAbp、逆転写酵素、融合タンパク質(例えば、napDNAbpおよび逆転写酵素を含む)、プライム編集ガイドRNA、ならびに融合タンパク質およびプライム編集ガイドRNAを含む複合体、ならびに補助的な要素、例えば、プライム編集プロセスを編集された産物形成の方へ駆動することを助けるための第2鎖ニッキング構成要素(例えば、第2鎖sgRNA)および5'内生DNAフラップ除去エンドヌクレアーゼ(例えばFEN1)を包含するが、これらに限定されない。 The term "primed editing element (PE) system" or "primed editing factor (PE)" or "PE system" or "PE editing system" refers to the primed reverse transcription ( TPRT) and includes napDNAbp, reverse transcriptase, a fusion protein (e.g., including napDNAbp and reverse transcriptase), prime editing guide RNA, and fusion protein and prime editing guide RNA. complex, as well as auxiliary elements, such as a second strand nicking component (e.g., second strand sgRNA) and 5' endogenous DNA to help drive the prime editing process toward edited product formation. Including, but not limited to, flap removal endonucleases (eg, FEN1).

ここまで記載された態様では、PEgRNAは、ガイドRNA(これは、それ自体が、スペーサー配列およびgRNAコアまたは骨格を含む)とプライマー結合部位およびDNA合成鋳型を含む5'または3'伸長アームとを含む単一分子を構成するが(例えば図3Dを見よ)、PEgRNAは2つの個々の分子の形態をもまた取り得、ガイドRNAと、トランスプライム編集因子RNA鋳型(tPERT)とからなる。これは、本質的に、伸長アーム(特に、プライマー結合部位およびDNA合成ドメインを包含する)およびRNA-タンパク質動員ドメイン(例えば、MS2アプタマーまたはヘアピン)を同じ分子上に収容する。これは、tPERT動員タンパク質(例えば、MS2アプタマーに結合するMS2cpタンパク質)を含む改変されたプライム編集因子複合体へと共局在または動員されるようになる。プライム編集に用いられ得るtPERTの例としては図3Gおよび図3Hを見よ。 In the embodiments described so far, the PEgRNA comprises a guide RNA (which itself includes a spacer sequence and a gRNA core or backbone) and a 5' or 3' extending arm that contains a primer binding site and a DNA synthesis template. PEgRNA can also take the form of two individual molecules, consisting of a guide RNA and a transprime editing factor RNA template (tPERT). This essentially accommodates an elongated arm (including, inter alia, a primer binding site and a DNA synthesis domain) and an RNA-protein recruitment domain (eg, an MS2 aptamer or hairpin) on the same molecule. It becomes colocalized or recruited to a modified prime editor complex that includes tPERT recruitment proteins (eg, MS2cp protein that binds the MS2 aptamer). See Figures 3G and 3H for examples of tPERT that can be used for prime editing.

プライム編集因子
用語「プライム編集因子」は、napDNAbp(例として、Cas9ニッカーゼ)および逆転写酵素を含む本明細書に記載の融合構築物を指し、PEgRNA(または「伸長されたガイドRNA」)の存在下で標的ヌクレオチド配列上にプライム編集を遂行することが可能である。用語「プライム編集因子」は、融合タンパク質、またはPEgRNAと複合体化された融合タンパク質、および/または第2鎖へニックを入れるsgRNAとさらに複合体化された融合タンパク質を指してもよい。いくつかの態様において、プライム編集因子はまた、本明細書に記載のとおりの非編集済鎖の第2部位へのニック入れステップへ向かうことが可能な、融合タンパク質(napDNAbpと融合した逆転写酵素)、PEgRNA、および定例の(regular)ガイドRNAを含む複合体も指してもよい。他の態様において、「プライマー編集因子」の逆転写酵素構成要素は、transで提供されてもよい。
Prime editing factor The term "primed editing factor" refers to a fusion construct described herein comprising napDNAbp (e.g., Cas9 nickase) and reverse transcriptase in the presence of PEgRNA (or "elongated guide RNA"). It is possible to perform prime editing on a target nucleotide sequence with The term "prime editor" may refer to a fusion protein, or a fusion protein complexed with a PEgRNA, and/or a fusion protein further complexed with an sgRNA that nicks the second strand. In some embodiments, the prime editing factor is also a fusion protein (reverse transcriptase fused to napDNAbp) capable of directing the nicking step to the second site of the unedited strand as described herein. ), PEgRNA, and a regular guide RNA. In other embodiments, the reverse transcriptase component of the "primer editor" may be provided in trans.

プライマー結合部位
用語「プライマー結合部位」または「PBS」は、伸長アームの構成要素としてPEgRNA上に位置付けられ(典型的には伸長アームの3'末にある)ヌクレオチド配列であって、プライム編集因子による標的配列のCas9ニック入れ後に形成されるプライマー配列へ結合するのに役立つヌクレオチド配列を指す。他のどこかで詳述されるとおり、プライム編集因子のCas9ニッカーゼ構成要素が標的DNA配列の鎖の一方にニックを入れたとき、3'末のssDNAフラップが形成され、これはPEgRNA上のプライマー結合部位とアニールして逆転写をプライムするプライマー配列として働く。図27および28は、3'および5'伸長アーム上夫々に位置付けられるプライマー結合部位の態様を示す。
Primer Binding Site The term "primer binding site" or "PBS" refers to the nucleotide sequence located on PEgRNA as a component of the elongating arm (typically at the 3' end of the elongating arm) and that is Refers to the nucleotide sequence that helps bind to the primer sequence formed after Cas9 nicking of the target sequence. As detailed elsewhere, when the Cas9 nickase component of the prime editing factor nicks one strand of the target DNA sequence, a 3'-terminal ssDNA flap is formed, which is connected to the primer on the PEgRNA. It acts as a primer sequence that anneals to the binding site and primes reverse transcription. Figures 27 and 28 show embodiments of primer binding sites located on the 3' and 5' extension arms, respectively.

プロモーター
用語「プロモーター」は当該技術分野において認識されており、細胞性の転写機構によって認識され、下流遺伝子の転写を開始する能力がある配列を有する核酸分子を言う。プロモーターは、プロモーターが所与の細胞性という文脈において常に活性であるということを意味する恒常的に活性、またはプロモーターが特定の条件の存在下においてのみ活性であるということを意味する条件付きで活性であり得る。例えば、条件付きプロモーターは、プロモーター上の制御エレメントと会合したタンパク質を基本的な転写機構に接続する特定のタンパク質の存在下においてのみ、または阻害分子の不在下においてのみ活性であり得る。条件付きで活性なプロモーターのサブクラスは、活性のために低分子「誘導因子」の存在を要求する誘導性プロモーターである。誘導性プロモーターの例は、アラビノース誘導性プロモーター、Tet-onプロモーター、およびタモキシフェン誘導性プロモーターを包含するが、これらに限定されない。種々の恒常的、条件付き、および誘導性プロモーターが当業者に周知であり、当業者は本発明を実行することに有用な種々のかかるプロモーターを確かめる能力があるであろう。これはこの点について限定されない。
Promoter The term "promoter" is art-recognized and refers to a nucleic acid molecule having a sequence capable of being recognized by the cellular transcriptional machinery and initiating transcription of a downstream gene. A promoter can be either constitutively active, meaning that the promoter is always active in a given cellular context, or conditionally active, meaning that the promoter is only active in the presence of specific conditions. It can be. For example, a conditional promoter may be active only in the presence of a specific protein that connects the protein associated with regulatory elements on the promoter to the basic transcriptional machinery, or in the absence of an inhibitory molecule. A subclass of conditionally active promoters are inducible promoters that require the presence of small molecule "inducers" for activity. Examples of inducible promoters include, but are not limited to, arabinose-inducible promoters, Tet-on promoters, and tamoxifen-inducible promoters. A variety of constitutive, conditional, and inducible promoters are well known to those skilled in the art, and one of skill in the art will be able to ascertain a variety of such promoters that are useful in carrying out the present invention. It is not limited in this respect.

プロトスペーサー
本願において用いられる用語「プロトスペーサー」はPAM(プロトスペーサー隣接モチーフ)配列に隣接するDNA上の配列(~20bp)を言う。プロトスペーサーはガイドRNAのスペーサー配列と同じ配列を共有する。ガイドRNAは標的DNA上のプロトスペーサー配列の相補体(具体的には、それの1つの鎖、すなわち標的DNA配列の「非標的鎖」に対する「標的鎖」)にアニールする。Cas9が機能するためには、それは特定のプロトスペーサー隣接モチーフ(PAM)をもまた要求し、これはCas9遺伝子の細菌種に依存して変わる。S.pyogenesに由来する最も普通に用いられるCas9ヌクレアーゼは、ゲノムDNA上の標的配列の直接的に下流に見出される非標的鎖上のNGGというPAM配列を認識する。当業者は、現況技術の文献が、場合によっては、それを「スペーサー」と言うよりもむしろ、ガイドRNAそれ自体の上の~20nt標的特異的ガイド配列として「プロトスペーサー」を言うということを了解するであろう。それゆえに、いくつかのケースでは、本願において用いられる用語「プロトスペーサー」は用語「スペーサー」と交換可能に用いられ得る。「プロトスペーサー」または「スペーサー」どちらかの出現の周囲の記載という文脈は、用語がgRNAまたはDNA標的を参照しているかどうかについて読み手に情報提供することを助けるであろう。
Protospacer : The term "protospacer" as used herein refers to a sequence (~20bp) on DNA adjacent to a PAM (protospacer adjacent motif) sequence. The protospacer shares the same sequence as the spacer sequence of the guide RNA. The guide RNA anneals to the complement of the protospacer sequence on the target DNA (specifically, to one strand of it, the "target strand" versus the "non-target strand" of the target DNA sequence). For Cas9 to function, it also requires a specific protospacer adjacent motif (PAM), which varies depending on the bacterial species of the Cas9 gene. The most commonly used Cas9 nuclease from S. pyogenes recognizes the PAM sequence NGG on the non-target strand found directly downstream of the target sequence on genomic DNA. Those skilled in the art will appreciate that the state of the art literature sometimes refers to the "protospacer" as the ~20nt target-specific guide sequence on the guide RNA itself, rather than referring to it as a "spacer". Therefore, in some cases, the term "protospacer" as used herein may be used interchangeably with the term "spacer." The context of the description surrounding the appearance of either "protospacer" or "spacer" will help inform the reader as to whether the term refers to a gRNA or DNA target.

プロトスペーサー隣接モチーフ(PAM)
本願において用いられる用語「プロトスペーサー隣接配列」または「PAM」は、Cas9ヌクレアーゼの重要な標的化構成要素であるおよそ2-6塩基対のDNA配列を言う。典型的には、PAM配列はどちらかの鎖上にあり、Cas9によってカットされる部位の5'から3'方向においては下流である。標準的なPAM配列(すなわち、Streptococcus pyogenesのCas9ヌクレアーゼまたはSpCas9に関連するPAM配列)は5'-NGG-3'であり、「N」は2つのグアニン(「G」)核酸塩基によって後続されるいずれかの核酸塩基である。異なるPAM配列が異なる生物からの異なるCas9ヌクレアーゼまたは同等タンパク質と関連し得る。加えて、いずれかの所与のCas9ヌクレアーゼ、例えばSpCas9は、ヌクレアーゼが代替的なPAM配列を認識するようにしてヌクレアーゼのPAM特異性を変改するように改変され得る。
Protospacer adjacent motif (PAM)
The term "protospacer adjacent sequence" or "PAM" as used herein refers to a DNA sequence of approximately 2-6 base pairs that is an important targeting component of the Cas9 nuclease. Typically, the PAM sequence is on either strand, downstream in the 5' to 3' direction of the site cut by Cas9. The standard PAM sequence (i.e., the PAM sequence associated with Streptococcus pyogenes Cas9 nuclease or SpCas9) is 5'-NGG-3', where the "N" is followed by two guanine ("G") nucleobases Any nucleobase. Different PAM sequences may be associated with different Cas9 nucleases or equivalent proteins from different organisms. In addition, any given Cas9 nuclease, such as SpCas9, can be modified so that the nuclease recognizes alternative PAM sequences, altering the PAM specificity of the nuclease.

例えば、配列番号18の(is)標準的なSpCas9アミノ酸配列を参照して、PAM配列は1つ以上の変異を導入することによって改変され得る。(a)PAM特異性をNGANまたはNGNGへと変改するD1135V、R1335Q、およびT1337R「VQRバリアント」、(b)PAM特異性をNGAGへと変改するD1135E、R1335Q、およびT1337R「EQRバリアント」、ならびに(c)PAM特異性をNGCGへと変改するD1135V、G1218R、R1335E、およびT1337R「VRERバリアント」を包含する。加えて、標準的なSpCas9のD1135EバリアントはなおNGGを認識するが、それは野生型SpCas9タンパク質と比較して選択的である。 For example, with reference to the standard SpCas9 amino acid sequence of SEQ ID NO: 18, the PAM sequence can be modified by introducing one or more mutations, including (a) the D1135V, R1335Q, and T1337R "VQR variants" that change the PAM specificity to NGAN or NGNG, (b) the D1135E, R1335Q, and T1337R "EQR variants" that change the PAM specificity to NGAG, and (c) the D1135V, G1218R, R1335E, and T1337R "VRER variants" that change the PAM specificity to NGCG. In addition, the D1135E variant of standard SpCas9 still recognizes NGG, but more selectively than the wild-type SpCas9 protein.

異なる細菌種からのCas9酵素(すなわち、Cas9オーソログ)は様々なPAM特異性を有し得るということもまた了解されるであろう。例えば、Staphylococcus aureusからのCas9(SaCas9)はNGRRTまたはNGRRNを認識する。加えて、Neisseria meningitisからのCas9(NmCas)はNNNNGATTを認識する。別の例では、Streptococcus thermophilisからのCas9(StCas9)はNNAGAAWを認識する。なお別の例では、Treponema denticolaからのCas9(TdCas)はNAAAACを認識する。これらは例であり、限定することを意味されない。さらに、非SpCas9が種々のPAM配列に結合するということは了解されるであろう。これは、好適なSpCas9 PAM配列が所望の標的のカットされる部位に存在しないときにそれらを有用にする。さらにその上、非SpCas9は、それらをSpCas9よりも有用にする他の特徴を有し得る。例えば、Staphylococcus aureusからのCas9(SaCas9)はSpCas9よりも約1キロベース小さい。そのため、それはアデノ随伴ウイルス(AAV)にパッケージングされ得る。Shah et al.,“Protospacer recognition motifs:mixed identities and functional diversity,”RNA Biology,10(5):891-899のさらなる参照がなされ得る(これは参照によって本願に組み込まれる)。
リコンビナーゼ
It will also be appreciated that Cas9 enzymes (ie, Cas9 orthologs) from different bacterial species may have varying PAM specificities. For example, Cas9 from Staphylococcus aureus (SaCas9) recognizes NGRRT or NGRRN. In addition, Cas9 from Neisseria meningitis (NmCas) recognizes NNNNGATT. In another example, Cas9 from Streptococcus thermophilis (StCas9) recognizes NNAGAAW. In yet another example, Cas9 (TdCas) from Treponema denticola recognizes NAAAAC. These are examples and are not meant to be limiting. Additionally, it will be appreciated that non-SpCas9 binds to a variety of PAM sequences. This makes them useful when a suitable SpCas9 PAM sequence is not present at the site of the desired target to be cut. Furthermore, non-SpCas9s may have other characteristics that make them more useful than SpCas9s. For example, Cas9 from Staphylococcus aureus (SaCas9) is approximately 1 kilobase smaller than SpCas9. Therefore, it can be packaged into an adeno-associated virus (AAV). Further reference may be made to Shah et al., “Protospacer recognition motifs: mixed identities and functional diversity,” RNA Biology, 10(5):891-899, which is incorporated herein by reference.
Recombinase

本願において用いられる用語「リコンビナーゼ」は、リコンビナーゼ認識配列間のDNAの組み換えを媒介する部位特異的な酵素を言い、これはリコンビナーゼ認識配列間のDNAフラグメントの切除、取り入れ、逆位、または交換(例えば転座)をもたらす。リコンビナーゼは2つの別物のファミリーに分類され得る:セリンリコンビナーゼ(例えばリゾルバーゼおよびインベルターゼ)およびチロシンリコンビナーゼ(例えばインテグラーゼ)である。セリンリコンビナーゼの例は、限定なしに、Hin、Gin、Tn3、β-six、CinH、ParA、γδ、Bxb1、φC31、TP901、TG1、φBT1、R4、φRV1、φFC1、MR11、A118、U153、およびgp29を包含する。チロシンリコンビナーゼの例は、限定なしに、Cre、FLP、R、Lambda、HK101、HK022、およびpSAM2を包含する。セリンおよびチロシンリコンビナーゼの名称は、リコンビナーゼがDNAを攻撃するために用い、鎖交換の間にDNAに共有結合的に連結されるようになる保存された求核性アミノ酸残基から派生する。リコンビナーゼは、遺伝子ノックアウト/ノックインの生出および遺伝子治療適用を包含する数々の適用を有する。例として、Brown et al.,“Serine recombinases as tools for genome engineering.”Methods.2011;53(4):372-9;Hirano et al.,“Site-specific recombinases as tools for heterologous gene integration.”Appl.Microbiol.Biotechnol.2011;92(2):227-39;Chavez and Calos,“Therapeutic applications of the ΦC31 integrase system.”Curr.Gene Ther.2011;11(5):375-81;Turan and Bode,“Site-specific recombinases:from tag-and-target- to tag-and-exchange-based genomic modifications.”FASEB J.2011;25(12):4088-107;Venken and Bellen,“Genome-wide manipulations of Drosophila melanogaster with transposons, Flp recombinase, and ΦC31 integrase.”Methods Mol.Biol.2012;859:203-28;Murphy,“Phage recombinases and their applications.”Adv.Virus Res.2012;83:367-414;Zhang et al.,“Conditional gene manipulation: Cre-ating a new biological era.”J.Zhejiang Univ.Sci.B.2012;13(7):511-24;Karpenshif and Bernstein,“From yeast to mammals:recent advances in genetic control of homologous recombination.”DNA Repair(Amst).2012;1;11(10):781-8(各々の全内容は、それら全体が参照されることによって本明細書に組み込まれる)を参照。本願において提供されるリコンビナーゼは、本発明の態様に用いられ得るリコンビナーゼの専らの例であることを意味されない。本発明の方法および組成物は、新たな直交的なリコンビナーゼについてデータベースをマイニングすることまたは定められたDNA特異性を有する合成リコンビナーゼをデザインすることによって拡張され得る(例として、Groth et al.,“Phage integrases:biology and applications.”J.Mol.Biol.2004;335,667-678;Gordley et al.,“Synthesis of programmable integrases.”Proc.Natl.Acad.Sci.U S A.2009;106,5053-5058(各々の全内容は、それらの全体が参照されることによって本明細書に組み込まれる)を参照)。本明細書に記載の方法および組成物に有用であるリコンビナーゼの他の例は当業者には知られており、発見または生成されるいずれかの新たなリコンビナーゼは、本発明の異なる態様に用いられる能力があることが予想される。いくつかの態様では、リコンビナーゼの触媒ドメインは、ヌクレアーゼを不活性化されたRNAによってプログラム可能なヌクレアーゼ(例えば、dCas9またはそのフラグメント)に融合され、その結果、リコンビナーゼドメインは核酸結合ドメインを含まないかまたは標的核酸に結合する能力がない(例えば、リコンビナーゼドメインはそれが特異的なDNA結合活性を有さないようにして操作される)。DNA結合活性を欠くリコンビナーゼおよび改変するための方法は知られており、Klippel et al.,“Isolation and characterisation of unusual gin mutants.”EMBO J.1988;7:3983-3989:Burke et al.,“Activating mutations of Tn3 resolvase marking interfaces important in recombination catalysis and its regulation.Mol Microbiol.2004;51:937-948;Olorunniji et al.,“Synapsis and catalysis by activated Tn3 resolvase mutants.”Nucleic Acids Res. 2008;36:7181-7191;Rowland et al.,“Regulatory mutations in Sin recombinase support a structure-based model of the synaptosome.”Mol Microbiol.2009;74:282-298;Akopian et al.,“Chimeric recombinases with designed DNA sequence recognition.”Proc Natl Acad Sci USA.2003;100:8688-8691;Gordley et al.,“Evolution of programmable zinc finger-recombinases with activity in human cells.J Mol Biol.2007;367:802-813;Gordley et al.,“Synthesis of programmable integrases.”Proc Natl Acad Sci USA.2009;106:5053-5058;Arnold et al.,“Mutants of Tn3 resolvase which do not require accessory binding sites for recombination activity.”EMBO J.1999;18:1407-1414;Gaj et al.,“Structure-guided reprogramming of serine recombinase DNA sequence specificity.”Proc Natl Acad Sci USA.2011;108(2):498-503;およびProudfoot et al.,“Zinc finger recombinases with adaptable DNA sequence specificity.”PLoS One.2011;6(4):e19537(各々の全内容は、それらの全体が参照されることによって本明細書に組み込まれる)によって記載されるものを包含する。例えば、リゾルバーゼ-インベルターゼ群のセリンリコンビナーゼ、例えばTn3およびγδリゾルバーゼならびにHinおよびGinインベルターゼは、自律的な触媒およびDNA結合ドメインを有する分子構造を有する(例として、Grindley et al.,“Mechanism of site-specific recombination.”Ann Rev Biochem.2006;75:567-605(その全内容は参照により組み込まれる)を参照)。それゆえに、例えばいずれかの補助的な因子(例えばDNA結合活性)を要求しない「活性化された」リコンビナーゼ変異体の単離後に、これらのリコンビナーゼの触媒ドメインは、本明細書に記載のとおりヌクレアーゼを不活性化されたRNAによってプログラム可能なヌクレアーゼ(例えば、dCas9またはそのフラグメント)と組み換えられることに対して従順である(例として、Klippel et al.,“Isolation and characterisation of unusual gin mutants.”EMBO J.1988;7:3983-3989:Burke et al.,“Activating mutations of Tn3 resolvase marking interfaces important in recombination catalysis and its regulation. Mol Microbiol.2004;51:937-948;Olorunniji et al.,“Synapsis and catalysis by activated Tn3 resolvase mutants.”Nucleic Acids Res.2008;36:7181-7191;Rowland et al.,“Regulatory mutations in Sin recombinase support a structure-based model of the synaptosome.”Mol Microbiol.2009;74:282-298;Akopian et al.,“Chimeric recombinases with designed DNA sequence recognition.”Proc Natl Acad Sci USA.2003;100:8688-8691を参照)。加えて、N末端触媒ドメインおよびC末端DNA結合ドメインを有する多くの他の天然のセリンリコンビナーゼが知られており(例えば、ファイC31インテグラーゼ、TnpXトランスポゼース、IS607トランスポゼース)、それらの触媒ドメインは、本明細書に記載のとおりプログラム可能な部位特異的なリコンビナーゼを操作するために選出され得る(例として、Smith et al.,“Diversity in the serine recombinases.”Mol Microbiol.2002;44:299-307(その全内容は参照により組み込まれる)を参照)。類似に、チロシンリコンビナーゼ(例えば、Cre、λインテグラーゼ)のコア触媒ドメインは知られており、本明細書に記載のとおりプログラム可能な部位特異的リコンビナーゼを操作するために類似に選出され得る(例として、Guo et al.,“Structure of Cre recombinase complexed with DNA in a site-specific recombination synapse.”Nature.1997;389:40-46;Hartung et al.,“Cre mutants with altered DNA binding properties.”J Biol Chem 1998;273:22884-22891;Shaikh et al.,“Chimeras of the Flp and Cre recombinases:Tests of the mode of cleavage by Flp and Cre.J Mol Biol.2000;302:27-48;Rongrong et al.,“Effect of deletion mutation on the recombination activity of Cre recombinase.”Acta Biochim Pol.2005;52:541-544;Kilbride et al.,“Determinants of product topology in a hybrid Cre-Tn3 resolvase site-specific recombination system.”J Mol Biol.2006;355:185-195;Warren et al.,“A chimeric cre recombinase with regulated directionality.”Proc Natl Acad Sci USA.2008 105:18278-18283;Van Duyne,“Teaching Cre to follow directions.”Proc Natl Acad Sci USA.2009 Jan 6;106(1):4-5;Numrych et al.,“A comparison of the effects of single-base and triple-base changes in the integrase arm-type binding sites on the site-specific recombination of bacteriophage λ.”Nucleic Acids Res.1990;18:3953-3959;Tirumalai et al.,“The recognition of core-type DNA sites by λ integrase.”J Mol Biol.1998;279:513-527;Aihara et al.,“A conformational switch controls the DNA cleavage activity of λ integrase.”Mol Cell.2003;12:187-198;Biswas et al.,“A structural basis for allosteric control of DNA recombination by λ integrase.”Nature.2005;435:1059-1066;およびWarren et al.,“Mutations in the amino-terminal domain of λ-integrase have differential effects on integrative and excisive recombination.”Mol Microbiol.2005;55:1104-1112(各々の全内容は参照により組み込まれる)を参照)。 The term "recombinase" as used herein refers to a site-specific enzyme that mediates the recombination of DNA between recombinase recognition sequences, which involves excision, incorporation, inversion, or exchange of DNA fragments between recombinase recognition sequences (e.g. translocation). Recombinases can be classified into two distinct families: serine recombinases (eg resolvases and invertases) and tyrosine recombinases (eg integrases). Examples of serine recombinases include, without limitation, Hin, Gin, Tn3, β-six, CinH, ParA, γδ, Bxb1, φC31, TP901, TG1, φBT1, R4, φRV1, φFC1, MR11, A118, U153, and gp29. includes. Examples of tyrosine recombinases include, without limitation, Cre, FLP, R, Lambda, HK101, HK022, and pSAM2. The name serine and tyrosine recombinases is derived from the conserved nucleophilic amino acid residues that recombinases use to attack DNA and become covalently linked to DNA during strand exchange. Recombinases have numerous applications including generating gene knockouts/knockins and gene therapy applications. For example, Brown et al., “Serine recombinases as tools for genome engineering.”Methods.2011;53(4):372-9;Hirano et al., “Site-specific recombinases as tools for heterologous gene integration.”Appl. .Microbiol.Biotechnol.2011;92(2):227-39;Chavez and Calos,“Therapeutic applications of the ΦC31 integrase system.”Curr.Gene Ther.2011;11(5):375-81;Turan and Bode, “Site-specific recombinases:from tag-and-target- to tag-and-exchange-based genomic modifications.”FASEB J.2011;25(12):4088-107;Venken and Bellen,“Genome-wide manipulations of Drosophila melanogaster with transposons, Flp recombinase, and ΦC31 integrase.”Methods Mol.Biol.2012;859:203-28;Murphy,“Phage recombinases and their applications.”Adv.Virus Res.2012;83:367-414;Zhang et al.,“Conditional gene manipulation: Cre-ating a new biological era.”J.Zhejiang Univ.Sci.B.2012;13(7):511-24;Karpenshif and Bernstein,“From yeast to mammals:recent advances in Genetic control of homologous recombination.” DNA Repair (Amst). 2012;1;11(10):781-8, the entire contents of each of which are incorporated herein by reference in their entirety. The recombinases provided in this application are not meant to be the exclusive examples of recombinases that can be used in embodiments of the invention. The methods and compositions of the invention can be extended by mining databases for new orthogonal recombinases or by designing synthetic recombinases with defined DNA specificity (see, e.g., Groth et al., “ Phage integrases: biology and applications.”J.Mol.Biol.2004;335,667-678;Gordley et al.,“Synthesis of programmable integrases.”Proc.Natl.Acad.Sci.U S A.2009;106,5053-5058 (The entire contents of each are incorporated herein by reference in their entirety). Other examples of recombinases that are useful in the methods and compositions described herein will be known to those skilled in the art, and any new recombinases that are discovered or generated may be used in different aspects of the invention. expected to be capable. In some embodiments, the catalytic domain of the recombinase is fused to an RNA-programmable nuclease (e.g., dCas9 or a fragment thereof) that has been nuclease-inactivated, such that the recombinase domain does not include a nucleic acid binding domain or or is incapable of binding the target nucleic acid (eg, the recombinase domain is engineered such that it does not have specific DNA binding activity). Recombinases lacking DNA-binding activity and methods for modifying them are known and are described in Klippel et al., “Isolation and characterization of unusual gin mutants.”EMBO J.1988;7:3983-3989:Burke et al.,“ Activating mutations of Tn3 resolvase marking interfaces important in recombination catalysis and its regulation.Mol Microbiol.2004;51:937-948;Olorunniji et al.,“Synapsis and catalysis by activated Tn3 resolvase mutants.”Nucleic Acids Res. 2008;36: 7181-7191;Rowland et al.,“Regulatory mutations in Sin recombinase support a structure-based model of the synaptosome.”Mol Microbiol.2009;74:282-298;Akopian et al.,“Chimeric recombinases with designed DNA sequence recognition .”Proc Natl Acad Sci USA.2003;100:8688-8691;Gordley et al.,“Evolution of programmable zinc finger-recombinases with activity in human cells.J Mol Biol.2007;367:802-813;Gordley et al .,“Synthesis of programmable integrases.”Proc Natl Acad Sci USA.2009;106:5053-5058;Arnold et al.,“Mutants of Tn3 resolvase which do not require accessory binding sites for recombination activity.”EMBO J.1999; 18:1407-1414; Gaj et al., “Structure-guided reprogramming of serine recombinase DNA sequence specificity.” Proc Natl Acad Sci USA.2011;108(2):498-503; and Proudfoot et al., “Zinc finger recombinases with adaptable DNA sequence specificity.”PLoS One.2011;6(4):e19537, the entire contents of each of which is incorporated herein by reference in its entirety. . For example, serine recombinases of the resolvase-invertase group, such as Tn3 and γδ resolvases and Hin and Gin invertases, have molecular structures with autonomous catalytic and DNA-binding domains (e.g., Grindley et al., “Mechanism of site- specific recombination.” Ann Rev Biochem. 2006;75:567-605, the entire contents of which are incorporated by reference). Therefore, for example, after isolation of "activated" recombinase variants that do not require any auxiliary factors (e.g. DNA binding activity), the catalytic domains of these recombinases can be used as nucleases as described herein. amenable to being recombined with a programmable nuclease (e.g., dCas9 or a fragment thereof) by inactivated RNA (e.g., Klippel et al., “Isolation and characterization of unusual gin mutants.” EMBO J.1988;7:3983-3989:Burke et al.,“Activating mutations of Tn3 resolvase marking interfaces important in recombination catalysis and its regulation. Mol Microbiol.2004;51:937-948;Olorunniji et al.,“Synapsis and catalysis by activated Tn3 resolvase mutants.”Nucleic Acids Res.2008;36:7181-7191;Rowland et al.,“Regulatory mutations in Sin recombinase support a structure-based model of the synaptosome.”Mol Microbiol.2009;74:282 -298;See Akopian et al., “Chimeric recombinases with designed DNA sequence recognition.” Proc Natl Acad Sci USA.2003;100:8688-8691).In addition, it has an N-terminal catalytic domain and a C-terminal DNA binding domain. Many other naturally occurring serine recombinases are known (e.g., PhiC31 integrase, TnpX transposase, IS607 transposase), and their catalytic domains can be used as programmable site-specific recombinases as described herein. (see, e.g., Smith et al., “Diversity in the serine recombinases.” Mol Microbiol. 2002;44:299-307, the entire contents of which are incorporated by reference). Similarly, the core catalytic domains of tyrosine recombinases (e.g., Cre, λ integrase) are known and can be similarly selected to engineer programmable site-specific recombinases as described herein (e.g. As Guo et al., “Structure of Cre recombinase complexed with DNA in a site-specific recombination synapse.”Nature.1997;389:40-46;Hartung et al., “Cre mutants with altered DNA binding properties.”J Biol Chem 1998;273:22884-22891;Shaikh et al.,“Chimeras of the Flp and Cre recombinases:Tests of the mode of cleavage by Flp and Cre.J Mol Biol.2000;302:27-48;Rongrong et al .,“Effect of deletion mutation on the recombination activity of Cre recombinase.”Acta Biochim Pol.2005;52:541-544;Kilbride et al.,“Determinants of product topology in a hybrid Cre-Tn3 resolvase site-specific recombination system .”J Mol Biol.2006;355:185-195;Warren et al.,“A chimeric cre recombinase with regulated directionality.”Proc Natl Acad Sci USA.2008 105:18278-18283;Van Duyne,“Teaching Cre to follow directions.”Proc Natl Acad Sci USA.2009 Jan 6;106(1):4-5;Numrych et al.,“A comparison of the effects of single-base and triple-base changes in the integrase arm-type binding sites on the site-specific recombination of bacteriophage λ.”Nucleic Acids Res.1990;18:3953-3959;Tirumalai et al.,“The recognition of core-type DNA sites by λ integrase.”J Mol Biol.1998;279: 513-527;Aihara et al.,“A conformational switch controls the DNA cleavage activity of λ integrase.”Mol Cell.2003;12:187-198;Biswas et al.,“A structural basis for allosteric control of DNA recombination by λ integrase.”Nature.2005;435:1059-1066; and Warren et al., “Mutations in the amino-terminal domain of λ-integrase have differential effects on integrative and excisive recombination.”Mol Microbiol.2005;55:1104 -1112 (the entire contents of each of which are incorporated by reference).

リコンビナーゼ認識配列
本願において用いられる用語「リコンビナーゼ認識配列」または同等に「RRS」または「リコンビナーゼ標的配列」は、リコンビナーゼによって認識され、RRSを有する別のDNA分子との鎖交換を経過するヌクレオチド配列標的を言う。これはリコンビナーゼ認識配列間のDNAフラグメントの切除、取り入れ、逆位、または交換をもたらす。
Recombinase recognition sequence As used herein, the term "recombinase recognition sequence" or equivalently "RRS" or "recombinase target sequence" refers to a nucleotide sequence target that is recognized by a recombinase and undergoes strand exchange with another DNA molecule that has an RRS. To tell. This results in excision, incorporation, inversion, or exchange of DNA fragments between recombinase recognition sequences.

組み換えるまたは組み換え
用語「組み換える」または「組み換え」は、核酸改変(例えばゲノム改変)という文脈において、2つ以上の核酸分子または単一の核酸分子の2つ以上の領域がリコンビナーゼタンパク質(例えば、本願において提供される本発明のリコンビナーゼ融合タンパク質)の作用によって改変されるプロセスを言うために用いられる。組み換えは、例えば1つ以上の核酸分子上または間において、核酸のとりわけ挿入、逆位、切除、または転座をもたらし得る。リコンビナーゼ認識配列
Recombine or Recombinant The term "recombinant" or "recombinant" in the context of nucleic acid modification (e.g. genome modification) means that two or more nucleic acid molecules or two or more regions of a single nucleic acid molecule are combined with a recombinase protein (e.g. used to refer to processes that are modified by the action of the recombinase fusion proteins of the invention provided herein. Recombination can result in inter alia insertions, inversions, excisions, or translocations of nucleic acids, eg, on or between one or more nucleic acid molecules. Recombinase recognition sequence

逆転写酵素
用語「逆転写酵素」はRNA依存性DNAポリメラーゼとして特徴付けられるポリメラーゼのあるクラスを記述する。全ての公知の逆転写酵素はRNA鋳型からDNA転写物を合成するためにはプライマーを要求する。歴史的には、逆転写酵素は主としてmRNAをcDNAに転写するために用いられている。これはそれからさらなる操作のためにベクター上にクローニングされ得る。トリ骨髄芽球症(myoblastosis)ウイルス(AMV)逆転写酵素は最初の広く用いられるRNA依存性DNAポリメラーゼであった(Verma, Biochim. Biophys. Acta 473:1(1977))。酵素は、5'-3'RNA指令型DNAポリメラーゼ活性、5'-3'DNA指令型DNAポリメラーゼ活性、およびRNase H活性を有する。RNase HはRNA-DNAハイブリッドのRNA鎖に特異的なプロセッシブな5'および3'リボヌクレアーゼである(Perbal, A Practical Guide to Molecular Cloning, New York: Wiley & Sons(1984))。公知のウイルス逆転写酵素はプルーフリーディングにとって必要な3'-5'エキソヌクレアーゼ活性を欠くので、転写のエラーは逆転写酵素によって修正され得ない(Saunders and Saunders, Microbial Genetics Applied to Biotechnology, London: Croom Helm(1987))。AMV逆転写酵素の活性およびその関連するRNase H活性の詳細な研究は、Berger et al., Biochemistry 22:2365-2372(1983)によって提示されている。分子生物学に鋭意用いられる別の逆転写酵素はモロニーマウス白血病ウイルス(M-MLV)を起源とする逆転写酵素である。例えば、Gerard, G. R., DNA 5:271-279(1986)およびKotewicz, M. L., et al., Gene 35:249-258(1985)を見よ。RNase H活性を実質的に欠くM-MLV逆転写酵素もまた記載されている。例えばU.S.Pat.No.5,244,797を見よ。本発明はいずれかのかかる逆転写酵素またはそれらのバリアントもしくは変異体の使用を企図する。
Reverse TranscriptaseThe term "reverse transcriptase" describes a class of polymerases characterized as RNA-dependent DNA polymerases. All known reverse transcriptases require a primer to synthesize a DNA transcript from an RNA template. Historically, reverse transcriptases have been used primarily to transcribe mRNA into cDNA, which can then be cloned onto a vector for further manipulation. Avian myoblastosis virus (AMV) reverse transcriptase was the first widely used RNA-dependent DNA polymerase (Verma, Biochim. Biophys. Acta 473:1 (1977)). The enzyme possesses 5'-3' RNA-directed DNA polymerase activity, 5'-3' DNA-directed DNA polymerase activity, and RNase H activity. RNase H is a processive 5' and 3' ribonuclease specific for the RNA strand of an RNA-DNA hybrid (Perbal, A Practical Guide to Molecular Cloning, New York: Wiley & Sons (1984)). Known viral reverse transcriptases lack the 3'-5' exonuclease activity necessary for proofreading, so transcription errors cannot be corrected by the reverse transcriptase (Saunders and Saunders, Microbial Genetics Applied to Biotechnology, London: Croom Helm (1987)). A detailed study of the activity of AMV reverse transcriptase and its associated RNase H activity is presented by Berger et al., Biochemistry 22:2365-2372 (1983). Another reverse transcriptase that is extensively used in molecular biology is the reverse transcriptase originating from Moloney murine leukemia virus (M-MLV). See, for example, Gerard, GR, DNA 5:271-279 (1986) and Kotewicz, ML, et al., Gene 35:249-258 (1985). M-MLV reverse transcriptase, which is substantially devoid of RNase H activity, has also been described. See, for example, US Pat. No. 5,244, 797. The present invention contemplates the use of any such reverse transcriptase or variants or mutants thereof.

加えて、本発明は、エラーを起こしやすい、すなわちエラーを起こしやすい逆転写酵素と言われ得る逆転写酵素、または重合の間にヌクレオチドの高忠実性組み込みを支持しない逆転写酵素の使用を企図する。ガイドRNAと取り入れされたRT鋳型に基づく一本鎖DNAフラップの合成の間に、エラーを起こしやすい逆転写酵素は、RT鋳型配列とミスマッチである1つ以上のヌクレオチドを導入し得、それによって、一本鎖DNAフラップの誤りがちな重合によってヌクレオチド配列に変化を導入する。それから、一本鎖DNAフラップの合成の間に導入されるこれらのエラーは、対応する内生標的鎖に対するハイブリダイゼーション、取って代わられた内生鎖の除去、ライゲーション、ならびにそれから内生DNA修復および/または配列決定プロセスのもう1つのラウンドによって、二本鎖分子上に取り入れられるようになる。 In addition, the present invention contemplates the use of reverse transcriptases that are error-prone, i.e. may be referred to as error-prone reverse transcriptases, or reverse transcriptases that do not support high fidelity incorporation of nucleotides during polymerization. During synthesis of the single-stranded DNA flap based on the guide RNA and the incorporated RT template, the error-prone reverse transcriptase may introduce one or more nucleotides that are mismatched with the RT template sequence, thereby introducing changes in the nucleotide sequence by error-prone polymerization of the single-stranded DNA flap. These errors introduced during synthesis of the single-stranded DNA flap then become incorporated onto the double-stranded molecule by hybridization to the corresponding endogenous target strand, removal of the displaced endogenous strand, ligation, and then another round of endogenous DNA repair and/or sequencing processes.

逆転写
本願において用いられる用語「逆転写」は、酵素がRNAを鋳型として用いてDNA鎖(つまり、相補的なDNAまたはcDNA)を合成する能力を指示する。いくつかの態様では、逆転写は「エラーを起こしやすい逆転写」であり得る。これは、それらのDNA重合活性がエラーを起こしやすい、ある種の逆転写酵素の特性を言う。
Reverse Transcription The term "reverse transcription" as used herein refers to the ability of an enzyme to synthesize a DNA strand (ie, complementary DNA or cDNA) using RNA as a template. In some embodiments, reverse transcription can be "error-prone reverse transcription." This refers to the property of certain reverse transcriptases that their DNA polymerization activity is error-prone.

PACE
本願において用いられる用語「ファージによって補助される連続的進化(PACE)」は、ウイルスベクターとしてファージを使用する連続的進化を言う。PACE技術の一般概念は、例えば、2009年9月8日出願の国際PCT出願PCT/US2009/056194、2010年3月11日にWO 2010/028347として公開;2011年12月22日出願の国際PCT出願PCT/US2011/066747、2012年6月28日にWO 2012/088381として公開;米国出願、2015年5月5日に発行された米国特許第9,023,594号;2015年1月20日出願の国際PCT出願PCT/US2015/012022、2015年9月11日にWO 2015/134121として公開;および2016年4月15日出願の国際PCT出願PCT/US2016/027795、2016年10月20日にWO 2016/168631として公開(これら全体の各内容は参照により本明細書に組み込まれる)に記載されている。
PACE
The term "phage-assisted continuous evolution (PACE)" as used herein refers to continuous evolution using phages as viral vectors. The general concept of PACE technology is described, for example, in International PCT Application PCT/US2009/056194, filed September 8, 2009, published March 11, 2010 as WO 2010/028347; International PCT Application PCT/US2011/066747, filed December 22, 2011, published June 28, 2012 as WO 2012/088381; U.S. Patent Application, U.S. Patent No. 9,023,594, issued May 5, 2015; International PCT Application PCT/US2015/012022, filed January 20, 2015, published September 11, 2015 as WO 2012/088381; and in International PCT application PCT/US2016/027795, filed April 15, 2016, published as WO 2016/168631, the entire contents of each of which are incorporated herein by reference.

ファージ
本願において用語「バクテリオファージ」と交換可能に用いられる用語「ファージ」は、細菌細胞に感染するウイルスを言う。典型的には、ファージは遺伝物質を内包する外側タンパク質カプシドからなる。遺伝物質は直線状または環状形態どちらかのssRNA、dsRNA、ssDNA、またはdsDNAであり得る。ファージおよびファージベクターは当業者には周知であり、本願において提供されるPACE法を実行するために有用であるファージの限定しない例は、λ(溶原体)、T2、T4、T7、T12、R17、M13、MS2、G4、P1、P2、P4、ファイX174、N4、Φ6、およびΦ29である。ある態様において、本発明に利用されるファージはM13である。追加の好適なファージおよびホスト細胞は当業者には明らかであろう。本発明はこの側面において限定されない。追加の好適なファージおよびホスト細胞の例示の記載は、Elizabeth Kutter and Alexander Sulakvelidze:Bacteriophages: Biology and Applications.CRC Press;1st edition(December 2004),ISBN:0849313368;Martha R.J.Clokie and Andrew M.Kropinski:Bacteriophages:Methods and Protocols,Volume 1:Isolation,Characterization,and Interactions(Methods in Molecular Biology)Humana Press;1st edition(December,2008),ISBN:1588296822;Martha R.J.Clokie and Andrew M.Kropinski:Bacteriophages:Methods and Protocols,Volume 2:Molecular and Applied Aspects(Methods in Molecular Biology)Humana Press;1st edition(December 2008),ISBN:1603275649を見よ;これらの全ては、好適なファージおよびホスト細胞、ならびにかかるファージの単離、培養、および操作のための方法およびプロトコールの開示について、それらの全体が参照によって本願に組み込まれる)。
Phage The term "phage", used interchangeably with the term "bacteriophage" herein, refers to a virus that infects bacterial cells. Typically, phages consist of an outer protein capsid that encloses genetic material. The genetic material can be ssRNA, dsRNA, ssDNA, or dsDNA in either linear or circular form. Phages and phage vectors are well known to those skilled in the art, and non-limiting examples of phages that are useful for carrying out the PACE methods provided herein include λ (lysogen), T2, T4, T7, T12, They are R17, M13, MS2, G4, P1, P2, P4, PhiX174, N4, Φ6, and Φ29. In certain embodiments, the phage utilized in the invention is M13. Additional suitable phages and host cells will be apparent to those skilled in the art. The invention is not limited in this aspect. Illustrative descriptions of additional suitable phages and host cells can be found in Elizabeth Kutter and Alexander Sulakvelidze: Bacteriophages: Biology and Applications.CRC Press;1st edition (December 2004), ISBN:0849313368;Martha RJClokie and Andrew M.Kropinski:Bacteriophages: Methods and Protocols,Volume 1:Isolation,Characterization,and Interactions(Methods in Molecular Biology)Humana Press;1st edition(December,2008),ISBN:1588296822;Martha RJClokie and Andrew M.Kropinski:Bacteriophages:Methods and Protocols,Volume 2 See: Molecular and Applied Aspects (Methods in Molecular Biology) Humana Press; 1st edition (December 2008), ISBN: 1603275649; all of which describe suitable phages and host cells, and the isolation, culture, and manipulation of such phages. (incorporated herein by reference in its entirety for disclosure of methods and protocols for).

タンパク質、ペプチド、およびポリペプチド
用語「タンパク質」、「ペプチド」、および「ポリペプチド」は本明細書中、互換的に使用され、ペプチド(アミド)結合によって一緒に連結されたアミノ酸残基の重合体を指す。用語は、いずれのサイズ、構造、もしくは機能の、タンパク質、ペプチド、またはポリペプチドを指す。典型的には、タンパク質、ペプチド、またはポリペプチドは、少なくとも3アミノ酸長であろう。タンパク質、ペプチド、またはポリペプチドは、個々のタンパク質またはタンパク質の一群を指してもよい。タンパク質、ペプチド、またはポリペプチド中のアミノ酸の1以上は、例えば、炭水化物基、ヒドロキシル基、ホスファート基、ファルネシル基、イソファルネシル基、脂肪酸基、抱合のためのリンカー、官能基化、または他の修飾等々などの化学的実体(chemical entity)の付加によって修飾されていてもよい。タンパク質、ペプチド、またはポリペプチドはまた、単一分子であってもよく、または多分子複合体であってもよい。タンパク質、ペプチド、またはポリペプチドは、天然に存在するタンパク質またはペプチドのただのフラグメントであってもよい。タンパク質、ペプチド、またはポリペプチドは、天然に存在するもの、組換え体、または合成物、またはいずれのそれらの組み合わせであってもよい。本明細書に提供されるタンパク質のいずれも、当該技術分野において知られているいずれの方法によって産生されてもよい。例えば、本明細書に提供されるタンパク質は、ペプチドリンカーを含む融合タンパク質にとくに適した、組換えタンパク質の発現および精製を介して産生されてもよい。組換えタンパク質の発現および精製のための方法は周知であり、Green and Sambrook,Molecular Cloning:A Laboratory Manual(4th ed.,Cold Spring Harbor Laboratory Press,Cold Spring Harbor,N.Y.(2012)(これらの内容全体は参照により本明細書に組み込まれる))によって記載されるものを包含する。
Protein, Peptide, and Polypeptide The terms "protein,""peptide," and "polypeptide" are used interchangeably herein and refer to a polymer of amino acid residues linked together by peptide (amide) bonds. refers to The term refers to a protein, peptide, or polypeptide of any size, structure, or function. Typically a protein, peptide or polypeptide will be at least 3 amino acids long. A protein, peptide, or polypeptide may refer to an individual protein or a group of proteins. One or more of the amino acids in a protein, peptide, or polypeptide may be modified, for example, by a carbohydrate group, a hydroxyl group, a phosphate group, a farnesyl group, an isofarnesyl group, a fatty acid group, a linker for conjugation, functionalization, or other modification. It may also be modified by the addition of chemical entities such as. A protein, peptide, or polypeptide may also be a single molecule or a multimolecular complex. A protein, peptide, or polypeptide may be just a fragment of a naturally occurring protein or peptide. The protein, peptide, or polypeptide may be naturally occurring, recombinant, or synthetic, or any combination thereof. Any of the proteins provided herein may be produced by any method known in the art. For example, the proteins provided herein may be produced through recombinant protein expression and purification, which is particularly suitable for fusion proteins that include peptide linkers. Methods for the expression and purification of recombinant proteins are well known and can be found in Green and Sambrook, Molecular Cloning: A Laboratory Manual (4th ed., Cold Spring Harbor Laboratory Press, Cold Spring Harbor, NY (2012)). includes those described by )), which is incorporated herein by reference.

タンパク質スプライシング
本願において用いられる用語「タンパク質スプライシング」は、インテイン(または場合に応じて分裂インテイン)の配列がアミノ酸配列内から切り出され、アミノ酸配列の残りのフラグメントのエクステインがアミド結合によってライゲーションされて連続的なアミノ酸配列を形成するプロセスを言う。用語「トランス」タンパク質スプライシングは、インテインが分裂インテインであり、それらが異なるタンパク質上に位置付けられる特定のケースを言う。
Protein splicing The term "protein splicing" as used in this application refers to the sequence of an intein (or split intein, as the case may be) being excised from within the amino acid sequence, and the remaining fragments of the amino acid sequence extein being ligated together by amide bonds. refers to the process of forming a specific amino acid sequence. The term "trans" protein splicing refers to the particular case where the inteins are split inteins and are located on different proteins.

第2鎖ニッキング
プライム編集の結果として形成されるヘテロ二重鎖DNA(すなわち、1つの編集されたおよび1つの非編集の鎖を含有する)の分解は、長期的な編集アウトカムを決定する。言葉にすると、プライム編集のゴールは、相補的な内生鎖上に編集された鎖を永久的に取り入れすることによって、PEの中間体として形成されるヘテロ二重鎖DNA(内生非編集鎖と対形成した編集された鎖)を分解することである。DNA分子上への編集された鎖の永久的な取り入れに有利にヘテロ二重鎖DNAの分解を駆動することを助けるために、「第2鎖ニッキング」のアプローチが本願において用いられ得る。本願において用いられる「第2鎖ニッキング」の概念は、第1のニック(すなわち、ガイドRNAの伸長された部分上の逆転写酵素のプライムへの使用のための遊離の3'端を提供する当初のニック部位)の下流の位置付けにおける、好ましくは編集されない鎖上の第2のニックの導入を言う。ある態様において、第1のニックおよび第2のニックは対向する鎖上にある。他の態様において、第1のニックおよび第2のニックは対向する鎖上にある。さらに別の態様では、第1のニックは非標的鎖(すなわち、Rループの一本鎖部分を形成する鎖)上にあり、第2のニックは標的鎖上にある。なお他の態様において、第1のニックは編集される鎖上にあり、第2のニックは編集されない鎖上にある。第2のニックは、第1のニックの少なくとも5ヌクレオチド下流に、あるいは第1のニックの少なくとも6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、40、50、60、70、80、90、100、110、120、130、140、もしくは150ヌクレオチド、またはより多く下流に位置取り得る。第2のニックは、ある態様において、編集されない鎖上において、PEgRNAによって誘導されるニックの部位から約5-150ヌクレオチドの間、または約5-140の間、もしくは約5-130の間、もしくは約5-120の間、もしくは約5-110の間、もしくは約5-100の間、もしくは約5-90の間、もしくは約5-80の間、もしくは約5-70の間、もしくは約5-60の間、もしくは約5-50の間、もしくは約5-40の間、もしくは約5-30の間、もしくは約5-20の間、もしくは約5-10の間離れて導入され得る。1つの態様では、第2のニックは、PEgRNAによって誘導されるニックから14-116ヌクレオチドの間離れて導入される。理論によって拘束されることなしに、第2のニックは細胞の内生DNA修復および複製プロセスを編集されない鎖の置き換えまたは編集の方へ誘導し、それによって、両方の鎖上に編集された配列を永久的に組み入れし、PEの結果として形成されるヘテロ二重鎖を分解する。いくつかの態様では、編集される鎖は非標的鎖であり、編集されない鎖は標的鎖である。他の態様において、編集される鎖は標的鎖であり、編集されない鎖は非標的鎖である。
The degradation of the heteroduplex DNA (i.e., containing one edited and one unedited strand) formed as a result of second-strand nicking prime editing determines the long-term editing outcome. In words, the goal of prime editing is to permanently incorporate the edited strand onto the complementary endogenous strand, thereby reducing the heteroduplex DNA (endogenous non-edited strand) formed as an intermediate to PE. (edited strands paired with). The approach of "second strand nicking" can be used herein to help drive degradation of heteroduplex DNA in favor of permanent incorporation of the edited strand onto the DNA molecule. The concept of "second strand nicking" as used in this application refers to the initial nick (i.e., the initial nick) that provides a free 3' end for use in priming reverse transcriptase on the extended portion of the guide RNA. Refers to the introduction of a second nick, preferably on the non-edited strand, in a position downstream of the nick site (nick site). In certain embodiments, the first nick and the second nick are on opposite strands. In other embodiments, the first nick and the second nick are on opposite strands. In yet another embodiment, the first nick is on the non-target strand (ie, the strand that forms the single-stranded portion of the R-loop) and the second nick is on the target strand. In still other embodiments, the first nick is on the edited strand and the second nick is on the non-edited strand. The second nick is at least 5 nucleotides downstream of the first nick, or at least 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 40, 50, 60, 70, 80, 90, 100, 110, 120, 130, 140, or 150 nucleotides, or more downstream. The second nick is, in some embodiments, between about 5-150 nucleotides, or between about 5-140, or between about 5-130 nucleotides from the site of the PEgRNA-induced nick on the non-edited strand, or between about 5-120, or between about 5-110, or between about 5-100, or between about 5-90, or between about 5-80, or between about 5-70, or about 5 -60, or about 5-50, or about 5-40, or about 5-30, or about 5-20, or about 5-10. In one embodiment, the second nick is introduced between 14-116 nucleotides away from the PEgRNA-induced nick. Without being bound by theory, the second nick directs the cell's endogenous DNA repair and replication processes towards replacing or editing the unedited strand, thereby leaving the edited sequence on both strands. Permanently incorporates and degrades heteroduplexes formed as a result of PE. In some embodiments, the edited strand is the non-target strand and the non-edited strand is the target strand. In other embodiments, the edited strand is the target strand and the non-edited strand is the non-target strand.

センス鎖
遺伝学において、「センス」鎖は、5'から3'へ伸びる二本鎖のDNA内のセグメントであって、3'から5'へ伸びるDNAのアンチセンス鎖または鋳型鎖に相補的である。タンパク質をコードするDNAセグメントのケースにおいて、センス鎖は、転写の最中にその鋳型としてアンチセンス鎖を取り結局(典型的には、常にではない)翻訳を経てタンパク質になるmRNAと同じ配列を有するDNAの鎖である。よって、アンチセンス鎖は、後にタンパク質へ翻訳されるRNAを担い、一方センス鎖は、mRNAとほぼ同一の組成(makeup)を保有する。dsDNAの各セグメントについて、一方がどの方向から読まれるかに応じて、おそらく(センスおよびアンチセンスは視点に相対するから)センスおよびアンチセンスが2組存在するであろう点に留意する。遺伝子産物またはmRNAは結局、dsDNAの一方のセグメントのどちらかの鎖がセンスまたはアンチセンスと称されることを示す。
Sense Strand In genetics, the "sense" strand is a segment within double-stranded DNA that extends 5' to 3' and is complementary to the antisense or template strand of DNA that extends 3' to 5'. be. In the case of a DNA segment that encodes a protein, the sense strand has the same sequence as the mRNA that takes the antisense strand as its template during transcription and eventually (typically, but not always) undergoes translation to become a protein. It is a strand of DNA. Thus, the antisense strand carries the RNA that is later translated into protein, while the sense strand has nearly the same makeup as the mRNA. Note that for each segment of dsDNA, there will probably be two sets of sense and antisense (as sense and antisense are relative to the viewpoint), depending on which direction one is read. The gene product or mRNA ultimately indicates that either strand of one segment of dsDNA is referred to as sense or antisense.

PEgRNAの文脈において、第1ステップは、5'→3'方向に配向される単鎖相補DNA(すなわち、組み込まれることになる3'ssDNAフラップ)の合成であるが、前記合成鎖はPEgRNA伸長アームの鋳型から外れる。3'ssDNAフラップがセンス鎖と見なされるべきかまたはアンチセンス鎖と見なされるべきかについては、DNAの両鎖が転写のための鋳型として働き得る(が同時ではない)ことが十分に許容されているところ、転写の方向に依存する。よって、いくつかの態様において、3'ssDNAフラップ(全体的に5'→3'方向に伸びる)は、コード鎖であることから、センス鎖として働くであろう。他の態様において、3'ssDNAフラップ(全体的に5'→3'方向に伸びる)はアンチセンス鎖として働き、よって転写の鋳型であろう。 In the context of PEgRNA, the first step is the synthesis of a single-stranded complementary DNA (i.e., the 3'ssDNA flap that is to be incorporated) that is oriented in the 5'→3' direction, while the synthetic strand is attached to the PEgRNA extension arm. comes out of the mold. As to whether the 3'ssDNA flap should be considered the sense or antisense strand, it is well accepted that both strands of DNA can serve as templates for transcription (but not simultaneously). Where it is depends on the direction of transcription. Thus, in some embodiments, the 3'ssDNA flap (extending generally in the 5'→3' direction) will serve as the sense strand since it is the coding strand. In other embodiments, the 3'ssDNA flap (extending generally in the 5'→3' direction) may serve as the antisense strand and thus be the template for transcription.

スペーサー配列
本明細書に使用されるとき、ガイドRNAまたはPEgRNAと関係のある用語「スペーサー配列」は、標的DNA配列中のプロトスペーサー配列に相補的なヌクレオチド配列を含有する、約20ヌクレオチドのガイドRNAまたはPEgRNAの部分を指す。スペーサー配列はプロトスペーサー配列とアニールすることで、標的部位にてssRNA/ssDNAハイブリッド構造が、およびプロトスペーサー配列に相補的な内生DNA鎖の対応するRループssDNA構造が形成される。
Spacer sequence As used herein, the term "spacer sequence" in relation to guide RNA or PEgRNA refers to a guide RNA of approximately 20 nucleotides containing a nucleotide sequence complementary to a protospacer sequence in a target DNA sequence. Or refers to the PEgRNA part. The spacer sequence anneals with the protospacer sequence to form an ssRNA/ssDNA hybrid structure at the target site and a corresponding R-loop ssDNA structure of the endogenous DNA strand that is complementary to the protospacer sequence.

対象
用語「対象」は、本明細書に使用されるとき、個々の生物、例えば、個々の哺乳動物を指す。いくつかの態様において、対象は、ヒトである。いくつかの態様において、対象は、非ヒト哺乳動物である。いくつかの態様において、対象は、霊長目の非ヒト動物である。いくつかの態様において、対象は、齧歯類の動物である。いくつかの態様において、対象は、ヒツジ、ヤギ、畜牛、ネコ、またはイヌである。いくつかの態様において、対象は、脊椎動物、両生類、爬虫類、魚類、昆虫、飛ぶ昆虫(fly)、または線虫である。いくつかの態様において、対象は、研究動物である。いくつかの態様において、対象は、遺伝子学的に改変されており、例として、遺伝子学的に改変された非ヒト対象である。対象は、いずれの性であってもよく、いずれの発生段階にあってもよい。
The subject term "subject" as used herein refers to an individual organism, such as an individual mammal. In some embodiments, the subject is a human. In some embodiments, the subject is a non-human mammal. In some embodiments, the subject is a non-human animal of the order Primate. In some embodiments, the subject is a rodent. In some embodiments, the subject is a sheep, goat, cattle, cat, or dog. In some embodiments, the subject is a vertebrate, amphibian, reptile, fish, insect, fly, or nematode. In some embodiments, the subject is a research animal. In some embodiments, the subject is genetically modified, such as a genetically modified non-human subject. The subject may be of either sex and at any stage of development.

分裂インテイン
インテインは最も頻繁には一続きのドメインとして見出されるが、いくつかは天然に分裂された形態で存在する。このケースでは、2つのフラグメントは別個のポリペプチドとして発現され、スプライシングが生起する、いわゆるタンパク質トランススプライシング前に会合しなければならない。
Split Inteins Inteins are most often found as continuous domains, but some exist in naturally split forms. In this case, the two fragments are expressed as separate polypeptides and must come together before splicing can occur, so-called protein trans-splicing.

例示の分裂インテインはSsp DnaEインテインであり、これは2つのサブユニット、つまりDnaE-NおよびDnaE-Cを含む。2つの異なるサブユニットは別個の遺伝子、つまりdnaE-nおよびdnaE-cによってコードされ、これらは夫々DnaE-NおよびDnaE-Cサブユニットをコードする。DnaEはSynechocytis sp. PCC6803の天然に存在する分裂インテインであり、夫々がDnaE-NまたはDnaE-Cどちらかとの融合体を含む2つの別個のタンパク質のトランススプライシングを導くことができる。 An exemplary fission intein is the Ssp DnaE intein, which contains two subunits, DnaE-N and DnaE-C. The two different subunits are encoded by separate genes, dnaE-n and dnaE-c, which encode the DnaE-N and DnaE-C subunits, respectively. DnaE is a naturally occurring fission intein of Synechocytis sp. PCC6803 that can direct the trans-splicing of two separate proteins, each containing a fusion with either DnaE-N or DnaE-C.

追加の天然に存在するまたは操作された分裂インテイン配列は公知であるか、または本明細書に記載の丸ごとのインテイン配列もしくは当該技術分野で利用可能なものから作られ得る。分裂インテイン配列の例は、Stevens et al.,“A promiscuous split intein with expanded protein engineering applications,”PNAS,2017,Vol.114:8538-8543;Iwai et al.,“Highly efficient protein trans-splicing by a naturally split DnaE intein from Nostc punctiforme,FEBS Lett,580:1853-1858に見出され得る。これらの夫々は参照によって本願に組み込まれる。追加の分裂インテイン配列は例えばWO2013/045632、WO2014/055782、WO2016/069774、およびEP2877490に見出され得る。これらの夫々の内容は参照によって本願に組み込まれる。 Additional naturally occurring or engineered split intein sequences are known or can be made from whole intein sequences described herein or available in the art. Examples of split intein sequences are Stevens et al., “A promiscuous split intein with expanded protein engineering applications,” PNAS,2017,Vol.114:8538-8543;Iwai et al., “Highly efficient protein trans-splicing by a naturally split DnaE intein from Nostc punctiforme, FEBS Lett, 580:1853-1858, each of which is incorporated herein by reference. Additional split intein sequences can be found in, for example, WO2013/045632, WO2014/055782, WO2016/ 069774, and EP2877490, the contents of each of which are incorporated herein by reference.

加えて、トランスのタンパク質スプライシングがインビボおよびin vitroで記載されており(Shingledecker,et al.,[0076]Gene 207:187(1998)、Southworth,et al.,EMBO J.17:918(1998);Mills,et al.,Proc.Natl.Acad.Sci.USA,95:3543-3548(1998);Lew,et al.,J.Biol.Chem.,273:15887-15890(1998);Wu,et al.,Biochim.Biophys.Acta 35732:1(1998b),Yamazaki,et al.,J.Am.Chem.Soc.120:5591(1998),Evans,et al.,J.Biol.Chem.275:9091(2000);Otomo,et al.,Biochemistry 38:16040-16044(1999);Otomo,et al.,J.Biolmol.NMR 14:105-114(1999);Scott,et al.,Proc.Natl.Acad.Sci.USA 96:13638-13643(1999))、爾後にライゲーションを経過して機能的な産物を形成する2つの不活性なフラグメントとして、あるタンパク質を発現する機会を提供する。例えば、2つの別個に発現された半分からの完全なPE融合タンパク質の形成について、図66および67に示されているとおりである。 In addition, protein splicing in trans has been described in vivo and in vitro (Shingledecker, et al., Gene 207:187 (1998); Southworth, et al., EMBO J. 17:918 (1998); Mills, et al., Proc. Natl. Acad. Sci. USA, 95:3543-3548 (1998); Lew, et al., J. Biol. Chem., 273:15887-15890 (1998); Wu, et al., Biochim. Biophys. Acta 35732:1 (1998b); Yamazaki, et al., J. Am. Chem. Soc. 120:5591 (1998); Evans, et al. al., J. Biol. Chem. 275:9091 (2000); Otomo, et al., Biochemistry 38:16040-16044 (1999); Otomo, et al., J. Biomol. NMR 14:105-114 (1999); Scott, et al., Proc. Natl. Acad. Sci. USA 96:13638-13643 (1999)), providing the opportunity to express a protein as two inactive fragments that subsequently undergo ligation to form a functional product, as shown, for example, in Figures 66 and 67 for the formation of a complete PE fusion protein from two separately expressed halves.

標的部位
用語「標的部位」は、本明細書に開示のプライム編集因子(PE)によって編集される核酸分子上の配列を言う。さらに、標的部位は、プライム編集因子(PE)およびgRNAの複合体が結合する核酸分子上の配列を言う。
Target site The term "target site" refers to a sequence on a nucleic acid molecule that is edited by a prime editor (PE) disclosed herein. Furthermore, target site refers to a sequence on a nucleic acid molecule to which a complex of prime editing factor (PE) and gRNA binds.

tPERT
「transプライム編集因子「RNA型(tPERT)」に係る定義を参照。
tPERT
See the definition of "trans prime editing factor 'RNA type (tPERT)'".

一時的な第2鎖へのニック入れ
本明細書に使用されるとき、用語「一時的な第2鎖へのニック入れ」は、未編集鎖中の第2ニックの組み入れが、所望の編集が編集済鎖に組み入れられた後でしか生じない、第2鎖へのニック入れのバリアントを指す。これによって、二本鎖DNA切断へ繋がり得る両鎖上の同時ニックが回避される。第2鎖にニックを入れるガイドRNAは、第2鎖ニックが所望の編集の組み入れ後まで導入されないように、一時的制御のためにデザインされている。これは、編集済鎖のみにマッチするが元のアレルにはマッチしないスペーサー配列をもつgRNAをデザインすることによって達成される。このストラテジーを使用すると、プロトスペーサーと未編集アレルとの間のミスマッチによって、PAM鎖上の編集事象が起きた後まで、sgRNAによるニック入れが疎まれるはずである。
Temporary Second Strand Nicking As used herein, the term "temporary second strand nicking" means that the incorporation of a second nick in the unedited strand causes the desired edit to occur. Refers to a variant of nicking the second strand that occurs only after it has been incorporated into the edited strand. This avoids simultaneous nicks on both strands that could lead to double-stranded DNA breaks. The guide RNA that nicks the second strand is designed for temporal control so that the second strand nick is not introduced until after the desired edit has been incorporated. This is accomplished by designing gRNAs with spacer sequences that match only the edited strand, but not the original allele. Using this strategy, mismatches between the protospacer and the unedited allele should prevent nicking by the sgRNA until after the editing event on the PAM strand has occurred.

Transプライム編集
本明細書に使用されるとき、用語「transプライム編集」は、分裂PEgRNAを利用するプライム編集の修飾形態を指すが、すなわち、ここでPEgRNAは、2つ別々の分子:sgRNAおよびtransプライム編集RNA鋳型(tPERT)に分離される。sgRNAが、所望のゲノムの標的部位へ、プライム編集因子を標的化させる(またはより一般に、プライム編集因子のnapDNAbp構成要素を標的化させる)よう働く一方で、一旦tPERTが、プライム編集因子上およびtPERT上に位置付けられた結合ドメインの相互作用によって、プライム編集因子へtransに動員されると、tPERTはポリメラーゼ(例として、逆転写酵素)によって使用されて新しいDNA配列を標的遺伝子座中へ書き込む。一態様において、結合ドメインは、tPERT上に位置付けられたMS2アプタマーおよびプライム編集因子と融合したMS2cpタンパク質などの、RNA-タンパク質動員部分を包含し得る。transプライム編集の利点は、DNA合成鋳型をガイドRNAから分離させることによって、潜在的により長い長さの鋳型を使用できる点である。
Trans prime editing As used herein, the term "trans prime editing" refers to a modified form of prime editing that utilizes split PEgRNA, i.e., where PEgRNA is divided into two separate molecules: sgRNA and trans Isolated into prime editing RNA template (tPERT). While the sgRNA acts to target the prime editing factor (or more generally, targets the napDNAbp component of the prime editing factor) to the desired genomic target site, once tPERT is on the prime editing factor and tPERT Once recruited in trans to the prime editing factor by interaction of the overlying binding domain, tPERT is used by a polymerase (eg, reverse transcriptase) to write a new DNA sequence into the target locus. In one embodiment, the binding domain can include an RNA-protein recruitment moiety, such as the MS2cp protein fused to the MS2 aptamer and prime editing factor positioned on tPERT. The advantage of trans prime editing is that by separating the DNA synthesis template from the guide RNA, potentially longer template lengths can be used.

transプライム編集の態様は図3Gおよび3Hに示される。図3Gは左に、transプライム編集因子複合体の組成物(「RP-PE:gRNA複合体」)を示すが、これは、ポリメラーゼ(例として、逆転写酵素)およびrPERT動員タンパク質(例として、MS2sc)の各々と融合したnapDNAbpを含み、ガイドRNAと複合体化されている。図3Gはさらに、DNA合成鋳型およびプライマー結合配列を包含するPEgRNAの伸長アーム特色を含む、別々のtPERT分子を示す。tPERT分子はまた、RNA-タンパク質動員ドメイン(これは、このケースにおいて、ステムループ構造であり、例えば、MS2アプタマーであり得る)も包含する。図3Hに記載のプロセスに描かれるとおり、RP-PE:gRNA複合体は、標的DNA配列へ結合してニックを入れる。次いで、動員タンパク質(RP)は、tPERTを動員して、DNA標的部位へ結合したプライム編集因子複合体へ共局在化させ、それによってプライマー結合部位が、ニックが入った鎖上のプライマー配列へ結合できるようになり、続いて、ポリメラーゼ(例として、RT)が、DNA合成鋳型に対し、tPERTの5'に至るまでDNAの単鎖を合成できるようになる。 Aspects of trans prime editing are shown in Figures 3G and 3H. Figure 3G shows on the left the composition of the trans prime editing factor complex (“RP-PE:gRNA complex”), which is composed of polymerases (e.g. reverse transcriptase) and rPERT recruitment proteins (e.g. MS2sc) and is complexed with guide RNA. Figure 3G further shows a separate tPERT molecule containing an extended arm feature of PEgRNA that includes the DNA synthesis template and primer binding sequences. The tPERT molecule also includes an RNA-protein recruitment domain, which in this case is a stem-loop structure and can be, for example, an MS2 aptamer. As depicted in the process described in Figure 3H, the RP-PE:gRNA complex binds and nicks the target DNA sequence. Recruitment protein (RP) then recruits tPERT to colocalize to the prime editor complex bound to the DNA target site, thereby directing the primer binding site to the primer sequence on the nicked strand. Then, a polymerase (eg, RT) can synthesize a single strand of DNA up to 5' of tPERT to the DNA synthesis template.

tPERTは、RNA-タンパク質動員ドメインの5'末上にPBSおよびDNA合成鋳型を含むように、図3Gおよび図3Hに示されているが、他の立体配置のtPERTも、RNA-タンパク質動員ドメインの3'末上に位置付けられるPBSおよびDNA合成鋳型をもつようデザインされてもよい。しかしながら、5'伸長をもつtPERTは、DNAの単鎖の合成がtPERTの5'末にて自然と終始するであろうという利点を有し、よって、プライム編集のDNA合成段階の最中に、RNA-タンパク質動員ドメインのいずれの部分も鋳型として使用するリスクがない。 tPERT is shown in Figures 3G and 3H as containing PBS and DNA synthesis template on the 5' end of the RNA-protein recruitment domain, but other configurations of tPERT can also be found on the 5' end of the RNA-protein recruitment domain. It may be designed with PBS and DNA synthesis templates positioned on the 3' end. However, tPERT with a 5' extension has the advantage that the synthesis of a single strand of DNA will naturally terminate at the 5' end of tPERT, thus during the DNA synthesis step of prime editing. There is no risk of using any part of the RNA-protein recruitment domain as a template.

Transプライム編集因子RNA鋳型(tPERT)
本明細書に使用されるとき、「transプライム編集因子RNA鋳型(tPERT)」は、transプライム編集に使用される構成要素を指す、プライム編集の修飾バージョンは、PEgRNAを2つの別個の分子:ガイドRNAおよびtPERT分子に分離することによって作動する。tPERT分子は、標的DNA部位にてプライム編集因子複合体と共局在化させて、プライマー結合部位およびDNA合成鋳型をプライム編集因子へtransで連れていくようプログラムされている。例えば、(1)RP-PE:gRNA複合体および(2)プライマー結合部位とRNA-タンパク質動員ドメインへ結び合わされたDNA合成鋳型とを包含するtPERTを含む2構成要素系を示すtransプライム編集因子(tPE)の態様については、図3Gを参照。ここでRP-PE:gRNA複合体のRP(動員タンパク質)構成要素は、tPERTを、編集されるべき標的部位へ動員させ、それによってPBSおよびDNA合成鋳型がプライム編集因子にtransで結び付けられる。別の言い方をすれば、tPERTは、PEgRNAの伸長アーム(の全部または一部)を含有するよう改変されており、これは、プライマー結合部位およびDNA合成鋳型を包含する。
Trans prime editing factor RNA template (tPERT)
As used herein, "trans prime editing factor RNA template (tPERT)" refers to the component used for trans prime editing, a modified version of prime editing that combines PEgRNA into two separate molecules: the guide It works by separating into RNA and tPERT molecules. The tPERT molecule is programmed to colocalize with the prime editing factor complex at the target DNA site, bringing the primer binding site and DNA synthesis template in trans to the prime editing factor. For example, the trans prime editing factor ( tPE), see Figure 3G. Here, the RP (recruiting protein) component of the RP-PE:gRNA complex recruits tPERT to the target site to be edited, thereby linking the PBS and DNA synthesis template in trans to the prime editing factor. Stated differently, tPERT has been modified to contain (all or part of) an extended arm of PEgRNA, which includes a primer binding site and a DNA synthesis template.

トランジション
本明細書に使用されるとき、「トランジション」は、プリン核酸塩基(A⇔G)の相互変換(interchange)またはピリミジン核酸塩基(C⇔T)の相互変換を指す。このクラスの相互変換は、同様の形状の核酸塩基を伴う。本明細書に開示の組成物および方法は、標的DNA分子において1以上のトランジションを誘導することが可能である。本明細書に開示の組成物および方法はまた、同じ標的DNA分子においてトランジションとトランスバージョンとの両方を誘導することも可能である。これらの変化は、A⇔G、G⇔A、C⇔T、またはT⇔Cを伴う。ワトソン・クリック対の核酸塩基をもつ二本鎖DNAの文脈において、トランスバージョンは、以下の塩基対交換:A:T⇔G:C、G:G⇔A:T、C:G⇔T:A、またはT:A⇔C:Gを指す。本明細書に開示の組成物および方法は、標的DNA分子において1以上のトランジションを誘導することが可能である。本明細書に開示の組成物および方法はまた、同じ標的DNA分子においてトランジションとトランスバージョンとの両方、ならびに欠失および挿入を包含する他のヌクレオチド変化を誘導することも可能である。
Transitions As used herein, "transition" refers to the interconversion of purine nucleobases (A⇔G) or the interconversion of pyrimidine nucleobases (C⇔T). This class of interconversions involves similarly shaped nucleobases. The compositions and methods disclosed herein are capable of inducing one or more transitions in a target DNA molecule. The compositions and methods disclosed herein are also capable of inducing both transitions and transversions in the same target DNA molecule. These changes involve A⇔G, G⇔A, C⇔T, or T⇔C. In the context of double-stranded DNA with Watson-Crick pairs of nucleobases, transversion involves the following base pair exchanges: A:T⇔G:C, G:G⇔A:T, C:G⇔T:A. , or refer to T:A⇔C:G. The compositions and methods disclosed herein are capable of inducing one or more transitions in a target DNA molecule. The compositions and methods disclosed herein are also capable of inducing both transitions and transversions, as well as other nucleotide changes, including deletions and insertions, in the same target DNA molecule.

トランスバージョン
本明細書に使用されるとき、「トランスバージョン」は、プリン核酸塩基のピリミジン核酸塩基への相互変換、またはその逆を指し、よって、形状が似ていない核酸塩基の相互変換を伴う。これらの変化は、T⇔A、T⇔G、C⇔G、C⇔A、A⇔T、A⇔C、G⇔C、およびG⇔Tを伴う。Watson-Crick対の核酸塩基をもつ二本鎖DNAの文脈において、トランスバージョンは、以下の塩基対交換:T:A⇔A:T、T:A⇔G:C、C:G⇔G:C、C:G⇔A:T、A:T⇔T:A、A:T⇔C:G、G:C⇔C:G、およびG:C⇔T:Aを指す。本明細書に開示の組成物および方法は、標的DNA分子において1以上のトランスバージョンを誘導することが可能である。本明細書に開示の組成物および方法はまた、同じ標的DNA分子においてトランジションとトランスバージョンとの両方、ならびに欠失および挿入を包含する他のヌクレオチド変化を誘導することも可能である。
Transversion As used herein, "transversion" refers to the interconversion of purine nucleobases to pyrimidine nucleobases, or vice versa, thus involving the interconversion of nucleobases that are dissimilar in shape. These changes involve T⇔A, T⇔G, C⇔G, C⇔A, A⇔T, A⇔C, G⇔C, and G⇔T. In the context of double-stranded DNA with Watson-Crick pairs of nucleobases, transversion refers to the following base pair exchanges: T:A⇔A:T, T:A⇔G:C, C:G⇔G:C. , C:G⇔A:T, A:T⇔T:A, A:T⇔C:G, G:C⇔C:G, and G:C⇔T:A. The compositions and methods disclosed herein are capable of inducing one or more transversions in a target DNA molecule. The compositions and methods disclosed herein are also capable of inducing both transitions and transversions, as well as other nucleotide changes, including deletions and insertions, in the same target DNA molecule.

処置
用語「処置」、「処置する」、および「処置すること」は、本明細書に記載のとおりの疾患もしくは障害、または1以上のその症状の発病を、食い止め、緩和し、遅延させるか、あるいはその進行を阻害することを目的とした臨床的介入を指す。本明細書に使用されるとき、用語「処置」、「処置する」、および「処置すること」は、本明細書に記載のとおりの疾患もしくは障害、または1以上のその症状の発病を、食い止め、緩和し、遅延させるか、あるいはその進行を阻害することを目的とした臨床的介入を指す。いくつかの態様において、処置は、1以上の症状が発症した後、および/または疾患と診断された後、施されてもよい。他の態様において、処置は、症状がない中、例として、症状の発病を予防もしくは遅延させるか、または疾患の発病もしくは進行を阻害するために、施されてもよい。例えば、処置は、症状の発現に先立ち(例として、症状の経歴に照らして、および/または遺伝因子もしくは他の感受性因子に照らして)、感受性のある個体へ施されてもよい。処置はまた、症状が消散した後も、例えば、それらの再発を予防または遅延するため、続けられてもよい。
The treatment terms "treatment,""treating," and "treating" refer to halting, alleviating, delaying the onset of a disease or disorder, or one or more symptoms thereof, as described herein; or clinical interventions aimed at inhibiting its progression. As used herein, the terms "treatment,""treating," and "treating" mean to prevent the onset of a disease or disorder, or one or more symptoms thereof, as described herein. , refers to clinical interventions aimed at alleviating, delaying, or inhibiting its progression. In some embodiments, treatment may be administered after one or more symptoms have developed and/or after the disease has been diagnosed. In other embodiments, treatment may be administered in the absence of symptoms, eg, to prevent or delay the onset of symptoms, or to inhibit the onset or progression of a disease. For example, treatment may be administered to susceptible individuals prior to the onset of symptoms (eg, in light of a history of symptoms and/or in light of genetic or other susceptibility factors). Treatment may also be continued after symptoms have resolved, eg, to prevent or delay their recurrence.

トリヌクレオチド反復(repeat)障害
本明細書に使用されるとき、「トリヌクレオチド反復障害」(または代替的に、「拡大反復障害」もしくは「反復拡大障害」)は、ある種の突然変異(あるトリヌクレオチド反復が、ある遺伝子またはイントロンにある)である「トリヌクレオチド反復拡大」によって引き起こされる、一連の遺伝性障害を指す。トリヌクレオチド反復はかつて、ゲノム中のありふれた反復(iterations)であると考えられていたが、1990年代にこれらの障害に分類された。これらDNAの一見した「良性の」伸展(stretches)はときに、拡大して疾患を引き起こし得る。数種の決定的な特色が、トリヌクレオチド反復拡大によって引き起こされた障害に共通する。第1に、突然変異反復は、体細胞と生殖細胞系列との両方に不安定さを示し、より頻繁にはこれらは代々の遺伝(successive transmissions)で縮小するよりむしろ拡大する。第2に、低年齢の発病およびこれに続く世代における表現型の増大した重症度(予想)は一般に、より大きな反復の長さと相関する。最後に、疾患アレルの親の起源はしばしば、父系の遺伝がこれら障害の多くにとって拡大のより大きなリスクを抱えるという予想に影響を及ぼし得る。
Trinucleotide repeat disorders As used herein, "trinucleotide repeat disorders" (or alternatively, "expanded repeat disorders" or "repeat expansion disorders") refer to certain mutations (certain trinucleotide repeat disorders). Refers to a group of genetic disorders caused by "trinucleotide repeat expansions," in which nucleotide repeats are found in certain genes or introns. Trinucleotide repeats, once thought to be commonplace iterations in the genome, were classified into these disorders in the 1990s. These seemingly "benign" stretches of DNA can sometimes expand and cause disease. Several defining features are common to disorders caused by trinucleotide repeat expansions. First, mutant repeats exhibit both somatic and germline instability, and more often they expand rather than shrink with successful transmissions. Second, younger age of onset and increased severity of the phenotype in subsequent generations (expected) generally correlates with larger repeat length. Finally, the parental origin of a disease allele can often influence the expectation that paternal inheritance carries a greater risk of spread for many of these disorders.

トリプレット拡大は、DNA複製最中のずれ(slippage)によって引き起こされるものと考えられる。これらの領域におけるDNA配列の反復性に起因して、「ループアウト」構造は、合成されている親鎖と娘鎖との間の相補的な塩基対合を維持しながら、DNA複製最中に形成されることもある。ループアウト構造が娘鎖上の配列から形成された場合、これは反復数の増大をもたらすであろう。しかしながら、ループアウト構造が親鎖上に形成された場合、反復数の減少が生じる。これらの反復の拡大は低減より一般的であるようである。一般に拡大がより大きくなればなるほど、これらは、より疾患を引き起こしやすくなるか、またはより疾患の重症度を増大しやすくなる。この特性は、トリヌクレオチド反復障害に見られる予想の特徴をもたらす。予想は、これら反復の拡大に起因する罹患した家族の代々の世代を通して、発病の年齢が低くなる傾向、および症状の重症度が増す傾向を説明する。 Triplet expansion is thought to be caused by slippage during DNA replication. Due to the repetitive nature of the DNA sequence in these regions, "loop-out" structures are created during DNA replication while maintaining complementary base pairing between the parent and daughter strands being synthesized. may be formed. If a loop-out structure is formed from sequences on the daughter strand, this will result in an increased number of repeats. However, if a loop-out structure is formed on the parent strand, a reduction in the number of repeats occurs. Expansion of these iterations appears to be more common than reduction. Generally, the larger the spread, the more likely they are to cause disease or increase the severity of the disease. This property results in the expected features seen in trinucleotide repeat disorders. The prediction explains the trend towards younger age of onset and increasing severity of symptoms over successive generations of affected families due to the expansion of these repeats.

ヌクレオチド反復障害は、トリプレット反復が非コード領域において生じる障害(すなわち、非コードトリヌクレオチド反復障害)またはコード領域において生じる障害を包含していてもよい。 Nucleotide repeat disorders may include disorders in which triplet repeats occur in non-coding regions (ie, non-coding trinucleotide repeat disorders) or disorders in which triplet repeats occur in coding regions.

本明細書に記載のプライム編集因子(PE)系は、数ある中でも、脆弱X症候群(FRAXA)、脆弱性XE MR(FRAXE)、フリードライヒ運動失調症(FRDA)、筋強直症ジストロフィー(DM)、8型脊髄小脳失調症(SCA8)、および12型脊髄小脳失調症(SCA12)を包含していてもよい、ヌクレオチド反復障害を処置するのに使用されてもよい。 The Prime Editor (PE) system described herein may be used to treat nucleotide repeat disorders, which may include Fragile X Syndrome (FRAXA), Fragile XE MR (FRAXE), Friedreich's Ataxia (FRDA), Myotonic Dystrophy (DM), Spinocerebellar Ataxia Type 8 (SCA8), and Spinocerebellar Ataxia Type 12 (SCA12), among others.

上流
本明細書に使用されるとき、用語「上流」および「下流」は、5'→3'方向に配向された核酸分子(単鎖または二本鎖であるかに関わらず)中に位置付けられた少なくとも2つの要素の線状の位置を定義する相対的な用語である。とりわけ、第1要素が第2要素に対して5'のどこかに位置付けられている場合、第1要素は、核酸分子中、第2要素の上流にある。例えば、SNPがニック部位の5'側にある場合、SNPは、Cas9に誘導されたニック部位の上流にある。逆に言うと、第1要素が第2要素に対して3'のどこかに位置付けられている場合、第1要素は、核酸分子中、第2要素の下流にある。例えば、SNPがニック部位の3'側にある場合、SNPは、Cas9に誘導されたニック部位の下流にある。核酸分子は、DNA(二本鎖もしくは単鎖)、RNA(二本鎖もしくは単鎖)、またはDNAとRNAとのハイブリッドであり得る。二本鎖分子のどちらの鎖を考慮するのか選択する必要がある場合を除き、上流および下流という用語が核酸分子の単鎖にのみ言及するところ、分析は単鎖核酸分子および二本鎖分子について同じであるしばしば、少なくとも2つの要素の相対的な位置を決定するのに使用され得る二本鎖のDNAの鎖は、「センス」鎖または「コード」鎖である。遺伝学において、「センス」鎖は、5'から3'へ伸びる二本鎖DNA内セグメントであって、3'から5'へ伸びるDNAのアンチセンス鎖または鋳型鎖に相補的である。よって、例として、SNP核酸塩基がセンス鎖またはコード鎖上のプロモーターの3'側にある場合、SNP核酸塩基はゲノムDNA(二本鎖である)中のプロモーター配列の「下流」にある。
Upstream As used herein, the terms "upstream" and "downstream" refer to positions in a nucleic acid molecule (whether single-stranded or double-stranded) oriented in the 5'→3' direction. is a relative term that defines the linear position of at least two elements. In particular, a first element is upstream of a second element in the nucleic acid molecule if the first element is positioned somewhere 5' to the second element. For example, if the SNP is 5' to the nick site, the SNP is upstream of the Cas9-induced nick site. Conversely, if the first element is positioned somewhere 3' to the second element, then the first element is downstream of the second element in the nucleic acid molecule. For example, if the SNP is 3' to the nick site, the SNP is downstream of the Cas9-induced nick site. Nucleic acid molecules can be DNA (double-stranded or single-stranded), RNA (double-stranded or single-stranded), or a hybrid of DNA and RNA. Where the terms upstream and downstream refer only to a single strand of a nucleic acid molecule, the analysis applies to single-stranded and double-stranded molecules, unless one needs to choose which strand of a double-stranded molecule to consider. The strand of double-stranded DNA that is often the same and can be used to determine the relative position of at least two elements is the "sense" or "coding" strand. In genetics, the "sense" strand is a 5' to 3' extending segment within double-stranded DNA that is complementary to the 3' to 5' antisense or template strand of the DNA. Thus, by way of example, a SNP nucleobase is "downstream" of a promoter sequence in genomic DNA (which is double-stranded) if the SNP nucleobase is 3' to a promoter on the sense or coding strand.

バリアント
本明細書に使用されるとき、用語「バリアント」は、天然に存在するものから逸脱したパターンを有する属性(qualities)を呈するものを意味するとして解釈されるはずであり、例として、バリアントCas9は、野生型Cas9アミノ酸配列と比較してアミノ酸残基中に1以上の変化を含むCas9である。用語「バリアント」は、参照配列と少なくとも75%、または少なくとも80%、または少なくとも85%、または少なくとも90%、または少なくとも95%、または少なくとも99%のパーセント同一性を有し、参照配列と同じかまたは実質的に同じ機能活性(単数もしくは複数)を有する、相同のタンパク質を包括する(encompasses)。用語はまた、参照配列の突然変異体、トランケーション体(truncations)、またはドメインであって、参照配列と同じかまたは実質的に同じ機能活性(単数もしくは複数)を呈示するものも包括する。
Variants As used herein, the term "variant" shall be taken to mean exhibiting qualities that have a pattern that deviates from those that occur in nature, including, by way of example, the variant Cas9 is a Cas9 that contains one or more changes in amino acid residues compared to the wild-type Cas9 amino acid sequence. The term "variant" refers to a sequence that has a percent identity of at least 75%, or at least 80%, or at least 85%, or at least 90%, or at least 95%, or at least 99% with a reference sequence and is the same as or or encompasses homologous proteins having substantially the same functional activity(s). The term also encompasses mutants, truncations, or domains of the reference sequence that exhibit the same or substantially the same functional activity(s) as the reference sequence.

ベクター
用語「ベクター」は、本明細書に使用されるとき、着目する遺伝子をコードするよう修飾され得る核酸であって、宿主細胞中へ入って宿主細胞内で突然変異または複製する(次いでベクターの複製形態を別の宿主細胞中へ移す)ことができる核酸を指す。例示の好適なベクターは、レトロウイルスベクターまたはバクテリオファージおよび繊維状ファージ、および接合性プラスミドなどの、ウイルスベクターを包含する。追加の好適なベクターは、本開示に基づき当業者に明らかであろう。
Vector The term "vector" as used herein refers to a nucleic acid that can be modified to encode a gene of interest and that can enter a host cell and mutate or replicate within the host cell (and then mutate or replicate within the host cell). refers to a nucleic acid that is capable of transferring its replicative form into another host cell). Exemplary suitable vectors include viral vectors, such as retroviral vectors or bacteriophages and filamentous phages, and conjugative plasmids. Additional suitable vectors will be apparent to those skilled in the art based on this disclosure.

野生型
本明細書に使用されるとき、用語「野生型」は、当業者によって理解される専門用語であって、突然変異体もしくはバリアントの形態とは区別されるような、天然に存在するとおりの生物、株、遺伝子、または特徴の典型的な形態を意味する。
Wild Type As used herein, the term "wild type" is a terminology understood by those skilled in the art that refers to wild type as it occurs in nature, as distinguished from mutant or variant forms. means the typical form of an organism, strain, gene, or characteristic.

5'内生DNAフラップ
本願において用いられる用語「内生5'DNAフラップ」は、標的DNA上のPEによって誘導されるニック部位の直ちに下流に所在するDNAの鎖を言う。PEによる標的DNA鎖のニッキングは、ニック部位の上流側の3'ヒドロキシル基およびニック部位の下流側の5'ヒドロキシル基を暴露する。3'ヒドロキシル基で終わる内生鎖は、プライム編集因子のDNAポリメラーゼをプライムするために用いられる(例えば、DNAポリメラーゼは逆転写酵素である)。ニック部位の下流側のかつ暴露された5'ヒドロキシル基で始まる内生鎖は、「5'内生DNAフラップ」と言われ、究極的には除去され、PEgRNAの伸長によってコードされる新たに合成された置き換え鎖(すなわち、「3'置き換えDNAフラップ」)によって置き換えられる。
5' Endogenous DNA Flap The term "endogenous 5' DNA flap" as used herein refers to the strand of DNA located immediately downstream of the PE-induced nick site on the target DNA. Nicking of the target DNA strand with PE exposes the 3' hydroxyl group upstream of the nick site and the 5' hydroxyl group downstream of the nick site. The endogenous chain ending with a 3' hydroxyl group is used to prime the prime editing factor DNA polymerase (eg, the DNA polymerase is reverse transcriptase). The endogenous strand that begins downstream of the nick site and with an exposed 5' hydroxyl group is referred to as the "5' endogenous DNA flap" and is ultimately removed, leading to the newly synthesized DNA encoded by the extension of PEgRNA. replaced by the replaced strand (i.e., the "3' replaced DNA flap").

5'内生DNAフラップ除去
本明細書に使用されるとき、用語「5'内生DNAフラップ除去」または「5'フラップ除去」は、RTによって合成された単鎖DNAフラップが競合的に侵入して内生DNAとハイブリダイズしたときに形成される5'内生DNAフラップの除去を指し、そのプロセスにおいて内生鎖に取って代わる。取って代わられたこの内生鎖を除去することは、所望のヌクレオチド変化を含む所望の産物を形成する反応を推進し得る。細胞自身のDNA修復酵素は、5'内生フラップの除去または切除を触媒してもよい(例として、EXO1またはFEN1などの、フラップエンドヌクレアーゼ)。また、宿主細胞も、該5'内生フラップの除去を触媒する1以上の酵素を発現するよう形質転換されていてもよく、これによって産物を形成するプロセスが推進される(例として、フラップエンドヌクレアーゼ)。フラップエンドヌクレアーゼは当該技術分野において知られており、Patel et al.,“Flap endonucleases pass 5'-flaps through a flexible arch using a disorder-thread-order mechanism to confer specificity for free 5'-ends,”Nucleic Acids Research,2012,40(10):4507-4519およびTsutakawa et al.,“Human flap endonuclease structures,DNA double-base flipping,and a unified understanding of the FEN1 superfamily,”Cell,2011,145(2):198-211(これらの各々は参照により本明細書に組み込まれる)に記載のものから見出され得る。
5' Endogenous DNA Flap Removal As used herein, the term "5' endogenous DNA flap removal" or "5' flap removal" refers to the competitive invasion of single-stranded DNA flaps synthesized by RT. refers to the removal of the 5' endogenous DNA flap that is formed when the strand hybridizes with endogenous DNA, displacing the endogenous strand in the process. Removal of this displaced endogenous strand may drive the reaction to form the desired product containing the desired nucleotide change. The cell's own DNA repair enzymes may catalyze the removal or excision of the 5' endogenous flap (eg, a flap endonuclease, such as EXO1 or FEN1). The host cell may also be transformed to express one or more enzymes that catalyze the removal of the 5' endogenous flap, thereby driving the process of forming the product (e.g., flap end nuclease). Flap endonucleases are known in the art and are described in Patel et al., “Flap endonucleases pass 5'-flaps through a flexible arch using a disorder-thread-order mechanism to confer specificity for free 5'-ends,” Nucleic Acids Research, 2012, 40(10): 4507-4519 and Tsutakawa et al., “Human flap endonuclease structures, DNA double-base flipping, and a unified understanding of the FEN1 superfamily,” Cell, 2011, 145(2): 198-211, each of which is incorporated herein by reference.

3'置き換えDNAフラップ
本明細書に使用されるとき、用語「3'置き換えDNAフラップ」、または単に「置き換えDNAフラップ」は、プライム編集因子によって合成され、プライム編集因子PEgRNAの伸長アームによってコードされるDNAの鎖を指す。より具体的には、3'置き換えDNAフラップは、PEgRNAのポリメラーゼ鋳型によってコードされる。3'置き換えDNAフラップは、編集済配列(例として、単一ヌクレオチドの変化)も含有することを除くと、5'内生DNAフラップと同じ配列を含む。3'置き換えDNAフラップは標的DNAとアニールして、5'内生DNAフラップ(これは、例えば、FEN1もしくはEXO1などの5'フラップエンドヌクレアーゼによって、切除され得る)に取って代わるかまたはこれを置き換え、次いで、3'置き換えDNAフラップの3'末を、内生DNAの晒された(5'内生DNAフラップの切除後に晒される)5'ヒドロキシル末と結び合わせるようにライゲートされ、これによってホスホジエステル結合が再形成されて3'置き換えDNAフラップが組み入れられ、1編集済鎖と1未編集鎖とを含有するヘテロ二重鎖DNAが形成される。DNA修復プロセスはヘテロ二重鎖を分解し、編集済鎖の情報を相補鎖へコピーすることによってDNA中へ編集が永続的に組み入れられる。この分解プロセスは、完了まで(to completion)、未編集鎖へニックを入れることによって、すなわち、本明細書に記載のとおりの「第2鎖へのニック入れ」を経由して、さらに推進され得る。
3' Replacement DNA Flap As used herein, the term "3' replacement DNA flap", or simply "replacement DNA flap", is synthesized by the prime editing factor and encoded by the extending arm of the prime editing factor PEgRNA. Refers to a strand of DNA. More specifically, the 3' replacement DNA flap is encoded by a polymerase template of PEgRNA. The 3' replacement DNA flap contains the same sequence as the 5' endogenous DNA flap, except that it also contains edited sequences (eg, single nucleotide changes). The 3' displacement DNA flap anneals with the target DNA and displaces or displaces the 5' endogenous DNA flap (which can be excised, e.g., by a 5' flap endonuclease such as FEN1 or EXO1). , the 3' end of the 3' replacement DNA flap is then ligated to join the exposed 5' hydroxyl end of the endogenous DNA (exposed after excision of the 5' endogenous DNA flap), thereby binding the phosphodiester The bonds are reformed to incorporate the 3'-displaced DNA flap, forming a heteroduplex DNA containing one edited and one unedited strand. The DNA repair process permanently incorporates the edit into the DNA by breaking down the heteroduplex and copying the information from the edited strand to the complementary strand. This degradation process can be further driven to completion by nicking the unedited strand, i.e. via "second strand nicking" as described herein. .

ある態様の詳細な記載
ゲノム編集のための、クラスター化して規則的な配置の短い回文配列反復(CRISPR)系の採用は、生命科学に革命をもたらした1~3。CRISPRを使用する遺伝子の断絶は今やルーチンとなっているが、単一ヌクレオチドの編集の正確な組み入れは、疾患が原因の多数の突然変異を研究または修正するのに必要であるにも関わらず、大きな課題のままである。相同組み換え修復(HDR)は、かかる編集を達成させることは可能ではあるが、低い効率(しばしば<5%)、ドナーDNA修復鋳型のための要件、および二本鎖DNA破壊(DSB)形成の有害効果に悩まされている。近年、David Liu教授らの実験室が塩基編集を開発したが、これによってDSBのない効率的な単一ヌクレオチドの編集が達成される。塩基編集因子(BE)は、CRISPR系を塩基修飾デアミナーゼ酵素と組み合わせて、標的C・GまたはA・T塩基対を夫々A・TまたはG・Cへ変換する4~6。既に幅広く研究者らによって世界的に使用されているが、現BEは12塩基対の起こり得る変換のうちたった4つしかできず、小さい挿入または欠失を修正することはできない。その上、塩基編集の標的範囲は、標的塩基に隣接する非標的CまたはA塩基の編集(「バイスタンダー(bystander)編集」)によって、およびPAM配列が標的塩基から15±2bpに存在するという要件によって限定されている。したがって、これらの欠点を克服することは、ゲノム編集の基礎研究および治療用途を大幅に広げるであろう。
DETAILED DESCRIPTION OF CERTAIN EMBODIMENTS The adoption of the clustered regularly spaced short palindromic repeat (CRISPR) system for genome editing has revolutionized the life sciences. Although gene disruption using CRISPR is now routine, the precise incorporation of single nucleotide edits is necessary to study or correct the large number of disease-causing mutations. This remains a major challenge. Homologous recombination repair (HDR) is capable of achieving such edits, but suffers from low efficiency (often <5%), the requirement for a donor DNA repair template, and the deleterious effects of double-stranded DNA break (DSB) formation. I'm worried about the effects. Recently, the laboratory of Professor David Liu and colleagues developed base editing, which achieves efficient single nucleotide editing without DSBs. Base editors (BEs) combine the CRISPR system with base-modifying deaminase enzymes to convert target C·G or A·T base pairs to A·T or G·C, respectively 4 - 6 . Although already widely used by researchers worldwide, current BEs can only make four of the possible 12 base pair transformations and cannot correct small insertions or deletions. Moreover, the target range of base editing is limited by the editing of non-targeted C or A bases adjacent to the target base (“bystander editing”) and by the requirement that the PAM sequence be located 15 ± 2 bp from the target base. limited by. Therefore, overcoming these drawbacks would greatly expand the basic research and therapeutic applications of genome editing.

本開示は、塩基編集の利益の多く-つまり、二本鎖破壊の回避およびドナーDNA修復鋳型-を、その大きな欠点を克服しつつ与える、新しい高精度編集アプローチを提案する。本明細書に記載の提案アプローチは、標的にプライムされた逆転写(TPRT)を使用する標的ゲノムの部位での編集済DNA鎖の直接的な組み入れを達成する。本明細書に考察されるデザインにおいて、CRISPRガイドRNA(gRNA)は、所望のヌクレオチド変化を含む単鎖DNAをコードする逆転写酵素(RT)鋳型配列を持つよう改変されるであろう。CRISPRヌクレアーゼ(Cas9)によってニックが入れられた標的部位DNAは、修飾gRNA上の鋳型配列の逆転写のためのプライマーとして働き、いずれの所望のヌクレオチド編集の直接的な組み込みを可能にするであろう。 The present disclosure proposes a new precision editing approach that provides many of the benefits of base editing - namely, avoidance of double-strand breaks and donor DNA repair templates - while overcoming its major drawbacks. The proposed approach described herein achieves direct incorporation of edited DNA strands at target genomic sites using target primed reverse transcription (TPRT). In the designs discussed herein, a CRISPR guide RNA (gRNA) will be modified to have a reverse transcriptase (RT) template sequence that encodes a single-stranded DNA containing the desired nucleotide changes. Target site DNA nicked by CRISPR nuclease (Cas9) will serve as a primer for reverse transcription of the template sequence on the modified gRNA, allowing direct incorporation of any desired nucleotide edits. .

結果的に、本発明は、標的にプライムされた逆転写(TPRT)または「プライム編集」の機序が、効率および遺伝子の融通性(genetic flexibility)が高い高精度CRISPR/Casベースのゲノム編集を(例として、図1A~1Fの様々な態様において描かれているとおり)行うために活用または採用され得るという発見に、一部関する。本発明者らは本明細書中、特定のDNA配列を修飾ガイドRNA(「伸長されたガイドRNA」)で標的にし、標的部位にて単鎖ニックを生成し、および伸長されたgRNA中へ取り入れられた改変逆転写酵素鋳型のためのプライマーとして、ニック入りDNAを使用する、Cas9タンパク質-逆転写酵素融合体を使用することを提案している。新しく合成された鎖は、所望のヌクレオチド変化(例として、単一ヌクレオチドの変化、欠失、もしくは挿入、またはそれらの組み合わせ)を包含することを除けば、ゲノムの標的配列と相同であろう。新しく合成されたDNAの鎖はまた、単鎖DNAフラップと称されることもあるが、これはハイブリダイゼーションを相補的な相同の内生DNA鎖と競合し、これによって対応する内生鎖に取って代わる。ハイブリダイズされたこの中間体の分解は、その結果得られる内生DNAの、取って代わられたフラップの(例として、5'末DNAフラップエンドヌクレアーゼ、FEN1での)除去、合成された単鎖DNAフラップの標的DNAへのライゲーション、ならびに細胞のDNA修復および/または複製プロセスの結果としての所望のヌクレオチド変化の同化を包含し得る。鋳型化(templated)DNA合成が単一ヌクレオチドという高精度を付与することから、このアプローチの幅は極めて広く、基礎科学および治療法における無数の用途に使用され得ることが予見できる。 Consequently, the present invention provides that target-primed reverse transcription (TPRT) or "prime editing" mechanisms enable high-precision CRISPR/Cas-based genome editing with high efficiency and genetic flexibility. Relating in part to the discovery that the present invention can be exploited or employed to perform (as depicted in the various embodiments of FIGS. 1A-1F, for example). We herein target a specific DNA sequence with a modified guide RNA (“elongated guide RNA”), generate a single-stranded nick at the target site, and incorporate it into the elongated gRNA. proposed the use of a Cas9 protein-reverse transcriptase fusion, using nicked DNA as a primer for modified reverse transcriptase templates. The newly synthesized strand will be homologous to the target sequence of the genome except for including the desired nucleotide changes (eg, single nucleotide changes, deletions, or insertions, or combinations thereof). The newly synthesized strand of DNA, sometimes referred to as a single-stranded DNA flap, competes for hybridization with a complementary homologous endogenous DNA strand, thereby displacing the corresponding endogenous strand. Replace. Degradation of this hybridized intermediate involves removal (e.g., with the 5' end DNA flap endonuclease, FEN1) of the superseded flap of the resulting endogenous DNA, resulting in the synthesis of a single strand. It may involve ligation of a DNA flap to target DNA and assimilation of desired nucleotide changes as a result of cellular DNA repair and/or replication processes. Because templated DNA synthesis affords high precision of single nucleotides, it is foreseeable that the breadth of this approach is extremely broad and can be used for countless applications in basic science and therapeutics.

[1]napDNAbp
本明細書に記載のプライム編集因子およびトランスプライム編集因子は、核酸プログラム型DNA結合タンパク質(napDNAbp)を含み得る。
[1]napDNAbp
The prime editing factors and transprime editing factors described herein can include nucleic acid programmed DNA binding proteins (napDNAbp).

一側面において、napDNAbpは少なくとも1つのガイド核酸(例えば、ガイドRNAまたはPEgRNA)と会合または複合体化させられ得る。これが、ガイド核酸またはその部分(例えば、DNA標的のプロトスペーサーにアニールするガイドRNAのスペーサー)に対して相補的であるDNA鎖(すなわち標的鎖)を含むDNA配列に、napDNAbpを局在させる。換言すると、ガイド核酸は、DNA上のプロトスペーサーの相補配列に局在および結合するようにnapDNAbp(例えば、Cas9または等価物)を「プログラム」する。 In one aspect, the napDNAbp can be associated or complexed with at least one guide nucleic acid (e.g., guide RNA or PEgRNA). This localizes the napDNAbp to a DNA sequence that includes a DNA strand (i.e., a target strand) that is complementary to the guide nucleic acid or a portion thereof (e.g., the spacer of the guide RNA that anneals to the protospacer of the DNA target). In other words, the guide nucleic acid "programs" the napDNAbp (e.g., Cas9 or equivalent) to localize and bind to the complementary sequence of the protospacer on the DNA.

いずれかの好適なnapDNAbpが本明細書に記載のプライム編集因子に用いられ得る。種々の態様において、napDNAbpはいずれかのクラス2 CRISPR-Casシステムであり得、いずれかのII型、V型、またはVI型CRISPR-Cas酵素を包含する。ゲノム編集のためのツールとしてのCRISPR-Casの急速な発達から、Cas9およびCas9オーソログなどのCRISPR-Cas酵素を記載および/または同定するために用いられる命名体系の一定した発達があった。本願は、古いおよび/または新たであり得る命名体系によってCRISPR-Cas酵素を参照する。当業者は、それが古い(すなわち「レガシー」)または新たな命名体系であるかどうかにかかわらず、用いられる命名体系に基づいて、本願において参照されている特定のCRISPR-Cas酵素を同定する能力があるであろう。CRISPR-Cas命名体系はMakarova et al., “Classification and Nomenclature of CRISPR-Cas Systems: Where from Here?,” The CRISPR Journal, Vol. 1. No. 5, 2018に鋭意に記載されている。これの内容全体は参照によって本願に組み込まれる。本願のいずれかの所与の場合に用いられる具体的なCRISPR-Cas命名体系は決して限定せず、当業者はどのCRISPR-Cas酵素が参照されているのかを同定する能力があるであろう。 Any suitable napDNAbp can be used in the prime editing factors described herein. In various embodiments, napDNAbp can be any class 2 CRISPR-Cas system, including any type II, type V, or type VI CRISPR-Cas enzyme. Since the rapid development of CRISPR-Cas as a tool for genome editing, there has been a constant development of nomenclature systems used to describe and/or identify CRISPR-Cas enzymes, such as Cas9 and Cas9 orthologs. This application refers to CRISPR-Cas enzymes by a nomenclature system that may be old and/or new. One of ordinary skill in the art will be able to identify the particular CRISPR-Cas enzyme referenced in this application based on the nomenclature system used, whether it is an old (i.e. "legacy") or new nomenclature system. There will be. The CRISPR-Cas nomenclature system is thoroughly described in Makarova et al., “Classification and Nomenclature of CRISPR-Cas Systems: Where from Here?,” The CRISPR Journal, Vol. 1. No. 5, 2018. The entire contents of this document are incorporated by reference into this application. The specific CRISPR-Cas nomenclature system used in any given case of this application is in no way limiting, and one of ordinary skill in the art will be able to identify which CRISPR-Cas enzyme is being referred to.

例えば、次のII型、V型、およびVI型クラス2 CRISPR-Cas酵素は、次の当該技術分野で認識される古い(すなわちレガシー)および新たな名称を有する。これらの酵素および/またはそれらのバリアントの夫々は、本明細書に記載のプライム編集因子に用いられ得る:

Figure 2020191234000010
For example, the following Type II, Type V, and Type VI class 2 CRISPR-Cas enzymes have the following art-recognized old (ie, legacy) and new names: Each of these enzymes and/or their variants can be used in the prime editing factors described herein:
Figure 2020191234000010

理論によって拘束されることなしに、本願において企図されるある種のnapDNAbpの作用機序は、Rループを形成するステップを包含する。これによって、napDNAbpは二本鎖DNA標的のほどけを誘導し、それによってnapDNAbpによって結合された領域の鎖を分離する。それから、ガイドRNAスペーサーがプロトスペーサー配列において「標的鎖」にハイブリダイズする。これは標的鎖に対して相補的である「非標的鎖」を押し除け、これはRループの一本鎖領域を形成する。いくつかの態様では、napDNAbpは1つ以上のヌクレアーゼ活性を包含し、これはそれからDNAをカットし、種々の型の傷跡を残す。例えば、napDNAbpは、第1の位置付けにおける非標的鎖をカットおよび/または第2の位置付けにおける標的鎖をカットするヌクレアーゼ活性を含み得る。ヌクレアーゼ活性に依存して、標的DNAは「二本鎖切断」を形成するようにカットされ得、これによって両方の鎖がカットされる。他の態様において、標的DNAは単一の部位でのみカットされ得る。すなわち、DNAは1つの鎖を「ニッキング」される。異なるヌクレアーゼ活性を有する例示のnapDNAbpは、「Cas9ニッカーゼ」(「nCas9」)およびヌクレアーゼ活性を有さない失活Cas9(「不活性型Cas9」または「dCas9」)を包含する。 Without being bound by theory, certain napDNAbp mechanisms of action contemplated herein include forming an R-loop, whereby the napDNAbp induces unwinding of the double-stranded DNA target, thereby separating the strands of the region bound by the napDNAbp. The guide RNA spacer then hybridizes to the "target strand" at the protospacer sequence. This displaces the "non-target strand," which is complementary to the target strand, forming the single-stranded region of the R-loop. In some embodiments, the napDNAbp includes one or more nuclease activities, which then cut the DNA, leaving various types of scars. For example, the napDNAbp can include a nuclease activity that cuts the non-target strand in a first position and/or cuts the target strand in a second position. Depending on the nuclease activity, the target DNA can be cut to form a "double-stranded break," whereby both strands are cut. In other embodiments, the target DNA can be cut only at a single site, i.e., the DNA is "nicked" one strand. Exemplary napDNAbps with different nuclease activities include "Cas9 nickase" ("nCas9") and inactivated Cas9 with no nuclease activity ("inactivated Cas9" or "dCas9").

本開示のプライム編集因子に関して用いられ得る種々のnapDNAbpの下の記載は、決して限定することを意味されない。プライム編集因子は、公知であるかまたは指向性進化もしくは別様の変異プロセスによって作られ得るかもしくは進化させられ得る標準的なSpCas9またはいずれかのオーソログCas9タンパク質またはいずれかのバリアントCas9タンパク質を含み得、Cas9のいずれかの天然に存在するバリアント、変異体、または別様に操作されたバージョンを包含する。種々の態様において、Cas9またはCas9バリアントはニッカーゼ活性を有し、すなわち標的DNA配列の1つの(of)鎖のみを切断する。他の態様において、Cas9またはCas9バリアントは不活性なヌクレアーゼを有し、すなわち「不活性型」Cas9タンパク質である。用いられ得る他のバリアントCas9タンパク質は、(例えば、より容易な送達のために)標準的なSpCas9よりも小さい分子量を有するかまたは改変もしくは再配置された一次アミノ酸構造(例えば循環置換体フォーマット)を有するものである。 The description below of various napDNAbps that may be used with respect to the prime editors of the present disclosure is not meant to be limiting in any way. Prime editors may include standard SpCas9 or any orthologous Cas9 protein or any variant Cas9 protein, which may be known or may be created or evolved by directed evolution or otherwise mutational processes, including any naturally occurring variant, mutant, or otherwise engineered version of Cas9. In various embodiments, the Cas9 or Cas9 variant has nickase activity, i.e., cleaves only one of the strands of the target DNA sequence. In other embodiments, the Cas9 or Cas9 variant has an inactive nuclease, i.e., is an "inactive" Cas9 protein. Other variant Cas9 proteins that may be used are those that have a smaller molecular weight than standard SpCas9 (e.g., for easier delivery) or have a modified or rearranged primary amino acid structure (e.g., a circular permutation format).

本明細書に記載のプライム編集因子はCas9等価物をもまた含み得、収斂進化の結果であるCas12a(Cpf1)およびCas12b1タンパク質を包含する。本願において用いられるnapDNAbp(例えば、SpCas9、Cas9バリアント、またはCas9等価物)は、それらのPAM特異性を変改/増強する種々の改変をもまた含有し得る。最後に、本願は、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも99.9%配列同一性を参照Cas9配列、例えば参照SpCas9標準的な配列または参照Cas9等価物(例えばCas12a(Cpf1))に対して有するいずれかのCas9、Cas9バリアント、またはCas9等価物を企図する。 Prime editing factors described herein may also include Cas9 equivalents, including Cas12a (Cpf1) and Cas12b1 proteins that are the result of convergent evolution. The napDNAbp (eg, SpCas9, Cas9 variants, or Cas9 equivalents) used in this application may also contain various modifications that alter/enhance their PAM specificity. Finally, the present application provides at least 70%, at least 75%, at least 80%, at least 85%, at least 90%, at least 91%, at least 92%, at least 93%, at least 94%, at least 95%, at least 96%, Any having at least 97%, at least 98%, at least 99%, or at least 99.9% sequence identity to a reference Cas9 sequence, such as a reference SpCas9 standard sequence or a reference Cas9 equivalent (e.g., Cas12a (Cpf1)) Cas9, Cas9 variants, or Cas9 equivalents are contemplated.

napDNAbpはCRISPR(クラスター化規則的間隔短回文反復)関連ヌクレアーゼであり得る。上で概説されているとおり、CRISPRは、可動遺伝因子(ウイルス、転移因子、および接合伝達性プラスミド)からの防護を提供する適応免疫系である。CRISPRクラスターは、スペーサー、祖先可動エレメントに対して相補的な配列、および標的侵入核酸を含有する。CRISPRクラスターはCRISPR RNA(crRNA)へと転写およびプロセシングされる。II型CRISPRシステムでは、プレcrRNAの正しいプロセシングは、トランスにコードされる低分子RNA(tracrRNA)、内生リボヌクレアーゼ3(rnc)、およびCas9タンパク質を要求する。tracrRNAは、プレcrRNAのリボヌクレアーゼ3によって支援されるプロセシングのためのガイドとしての用をなす。爾後に、Cas9/crRNA/tracrRNAは、スペーサーに対して相補的な直線状または環状dsDNA標的をエンド的に切断する。crRNAに対して相補的でない標的鎖は第1にエンド的にカットされ、それから3'-5'エキソ的にトリミングされる。天然では、DNA結合および切断は典型的にはタンパク質および両方のRNAを要求する。しかしながら、シングルガイドRNA(「sgRNA」または単純に「gRNA」)が、crRNAおよびtracrRNA両方の側面を単一のRNA種上に組み込むようにして操作され得る。例として、Jinek M. et al., Science 337:816-821(2012)を参照(この内容全体は参照により本明細書に組み込まれる)。 napDNAbp may be a CRISPR (clustered regularly interspaced short palindromic repeats) associated nuclease. As outlined above, CRISPR is an adaptive immune system that provides protection from mobile genetic elements (viruses, transposable elements, and conjugatively transmissible plasmids). A CRISPR cluster contains a spacer, a sequence complementary to the ancestral mobile element, and a target invading nucleic acid. CRISPR clusters are transcribed and processed into CRISPR RNA (crRNA). In type II CRISPR systems, correct processing of pre-crRNA requires trans-encoded small RNA (tracrRNA), endogenous ribonuclease 3 (rnc), and Cas9 protein. tracrRNA serves as a guide for ribonuclease 3-assisted processing of pre-crRNA. Cas9/crRNA/tracrRNA then endo-cleaves the linear or circular dsDNA target complementary to the spacer. Target strands that are not complementary to the crRNA are first cut endo- then trimmed 3'-5' exo. In nature, DNA binding and cleavage typically requires proteins and both RNA. However, single guide RNAs ("sgRNAs" or simply "gRNAs") can be engineered to incorporate aspects of both crRNA and tracrRNA onto a single RNA species. See, e.g., Jinek M. et al., Science 337:816-821 (2012), the entire contents of which are incorporated herein by reference.

いくつかの態様では、napDNAbpは、例えば標的配列上においておよび/または標的配列の相補体上において、標的配列の位置付けにおける1つまたは両方の鎖の切断を導く。いくつかの態様では、napDNAbpは、標的配列の最初のまたは最後のヌクレオチドから約1、2、3、4、5、6、7、8、9、10、15、20、25、50、100、200、500、またはより多くの塩基対以内において、1つまたは両方の鎖の切断を導く。いくつかの態様では、ベクターは、変異したnapDNAbpが標的配列を含有する標的ポリヌクレオチドの1つまたは両方の鎖を切断する能力を欠くようにして対応する野生型酵素に対して変異しているnapDNAbpをコードする。例えば、S.pyogenesからのCas9のRuvC I触媒ドメイン上のアスパラギン酸からアラニンの置換(D10A)は、両方の鎖を切断するヌクレアーゼからニッカーゼ(一本鎖を切断する)へとCas9を変換する。Cas9をニッカーゼにする変異の他の例は、限定なしに、標準的なSpCas9配列をまたは他のCas9バリアントもしくはCas9等価物の同等のアミノ酸位置を参照して、H840A、N854A、およびN863Aを包含する。 In some embodiments, the napDNAbp leads to cleavage of one or both strands at the location of the target sequence, eg, on the target sequence and/or on the complement of the target sequence. In some embodiments, napDNAbp is about 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 15, 20, 25, 50, 100, Leading to cleavage of one or both strands within 200, 500, or more base pairs. In some embodiments, the vector comprises a napDNAbp that has been mutated relative to a corresponding wild-type enzyme such that the mutated napDNAbp lacks the ability to cleave one or both strands of a target polynucleotide containing the target sequence. code. For example, an aspartate to alanine substitution (D10A) on the RuvC I catalytic domain of Cas9 from S. pyogenes converts Cas9 from a nuclease that cleaves both strands to a nickase (which cleaves single strands). Other examples of mutations that make Cas9 a nickase include, without limitation, H840A, N854A, and N863A, with reference to the standard SpCas9 sequence or equivalent amino acid positions in other Cas9 variants or Cas9 equivalents. .

本願において用いられる用語「Casタンパク質」は、天然から得られる全長Casタンパク質、天然に存在するCasタンパク質とは異なる配列を有する組み換えCasタンパク質、または本開示の方法に必要とされる全てもしくは有意な量の不可欠の基本機能、すなわち(i)標的DNAに対するCasタンパク質の核酸プログラム型結合の所有および(ii)1つの鎖上で標的DNA配列へニックを入れる能力をそれでもなお保持するCasタンパク質のいずれかのフラグメントを言う。本願において企図されるCasタンパク質は、CRISPR Cas9タンパク質、およびCas9等価物、バリアント(例えば、Cas9ニッカーゼ(nCas9)またはヌクレアーゼ不活性型Cas9(dCas9))ホモログ、オーソログ、またはパラログを、天然に存在するかまたは天然に存在しないか(例えば、操作されたかまたは組み換えか)にかかわらず包摂し、いずれかのクラス2 CRISPRシステム(例えばII、V、VI型)からのCas9等価物を包含し得、Cas12a(Cpf1)、Cas12e(CasX)、Cas12b1(C2c1)、Cas12b2、Cas12c(C2c3)、C2c4、C2c8、C2c5、C2c10、C2c9 Cas13a(C2c2)、Cas13d、Cas13c(C2c7)、Cas13b(C2c6)、およびCas13bを包含する。さらなるCas等価物はMakarova et al.,“C2c2 is a single-component programmable RNA-guided RNA-targeting CRISPR effector,”Science 2016;353(6299)およびMakarova et al.,“Classification and Nomenclature of CRISPR-Cas Systems:Where from Here?,”The CRISPR Journal,Vol.1.No.5,2018に記載されている。これらの内容は参照によって本願に組み込まれる。 As used herein, the term "Cas protein" refers to a full-length Cas protein obtained from nature, a recombinant Cas protein having a sequence different from a naturally occurring Cas protein, or all or a significant amount required for the methods of the present disclosure. of any of the Cas proteins that still retains the essential basic functions of (i) the possession of nucleic acid-programmed binding of the Cas protein to the target DNA and (ii) the ability to nick the target DNA sequence on one strand. Say fragment. Cas proteins contemplated herein include naturally occurring or or non-naturally occurring (e.g., engineered or recombinant) and may include Cas9 equivalents from any class 2 CRISPR system (e.g., type II, V, VI), Cas12a ( Cpf1), Cas12e(CasX), Cas12b1(C2c1), Cas12b2, Cas12c(C2c3), C2c4, C2c8, C2c5, C2c10, C2c9 Cas13a(C2c2), Cas13d, Cas13c(C2c7), Cas13b(C2c6), and Cas13b do. Further Cas equivalents can be found in Makarova et al., “C2c2 is a single-component programmable RNA-guided RNA-targeting CRISPR effector,” Science 2016;353(6299) and Makarova et al., “Classification and Nomenclature of CRISPR-Cas Systems :Where from Here?,” The CRISPR Journal, Vol. 1. No. 5, 2018. These contents are incorporated into this application by reference.

用語「Cas9」または「Cas9ヌクレアーゼ」または「Cas9部分」または「Cas9ドメイン」は、いずれかの生物からのいずれかの天然に存在するCas9、いずれかの天然に存在するCas9等価物またはその機能的フラグメント、いずれかの生物からのいずれかのCas9ホモログ、オーソログ、またはパラログ、および天然に存在するかまたは操作されたCas9のいずれかの変異体またはバリアントを包摂する。用語Cas9は特に限定することを意味されず、「Cas9または等価物」と言われ得る。例示のCas9タンパク質はさらに本願に記載および/または当該技術分野において記載されており、参照によって本願に組み込まれる。本開示は、本発明のプライム編集因子(PE)に使用される具体的なCas9について限定されない。 The term "Cas9" or "Cas9 nuclease" or "Cas9 moiety" or "Cas9 domain" refers to any naturally occurring Cas9 from any organism, any naturally occurring Cas9 equivalent or its functional Encompasses fragments, any Cas9 homologs, orthologs, or paralogs from any organism, and any naturally occurring or engineered mutations or variants of Cas9. The term Cas9 is not meant to be particularly limiting and may be referred to as "Cas9 or equivalent." Exemplary Cas9 proteins are further described herein and/or in the art and are incorporated herein by reference. This disclosure is not limited to the specific Cas9 used in the prime editing element (PE) of the invention.

本願に記されるCas9ヌクレアーゼ配列および構造は当業者には周知である(例として、“Complete genome sequence of an M1 strain of Streptococcus pyogenes.”Ferretti et al.,J.J.,McShan W.M.,Ajdic D.J.,Savic D.J.,Savic G.,Lyon K.,Primeaux C.,Sezate S.,Suvorov A.N.,Kenton S.,Lai H.S.,Lin S.P.,Qian Y.,Jia H.G.,Najar F.Z.,Ren Q.,Zhu H.,Song L.,White J.,Yuan X.,Clifton S.W.,Roe B.A.,McLaughlin R.E.,Proc.Natl.Acad.Sci.U.S.A.98:4658-4663(2001);“CRISPR RNA maturation by trans-encoded small RNA and host factor RNase III.”Deltcheva E.,Chylinski K.,Sharma C.M.,Gonzales K.,Chao Y.,Pirzada Z.A.,Eckert M.R.,Vogel J.,Charpentier E.,Nature 471:602-607(2011);および“A programmable dual-RNA-guided DNA endonuclease in adaptive bacterial immunity.”Jinek M.,Chylinski K.,Fonfara I.,Hauer M.,Doudna J.A.,Charpentier E.Science 337:816-821(2012)(これら各々の内容全体は参照により本明細書に組み込まれる)を参照)。 The Cas9 nuclease sequences and structures described herein are well known to those skilled in the art (e.g., “Complete genome sequence of an M1 strain of Streptococcus pyogenes.” Ferretti et al., J.J., McShan W.M., Ajdic D.J., Savic D.J. ,Savic G.,Lyon K.,Primeaux C.,Sezate S.,Suvorov A.N.,Kenton S.,Lai H.S.,Lin S.P.,Qian Y.,Jia H.G.,Najar F.Z.,Ren Q.,Zhu H.,Song L .,White J.,Yuan X.,Clifton S.W.,Roe B.A.,McLaughlin R.E.,Proc.Natl.Acad.Sci.U.S.A.98:4658-4663(2001);“CRISPR RNA maturation by trans-encoded small RNA and host factor RNase III.”Deltcheva E., Chylinski K., Sharma C.M., Gonzales K., Chao Y., Pirzada Z.A., Eckert M.R., Vogel J., Charpentier E., Nature 471:602-607(2011); and “A programmable dual-RNA-guided DNA endonuclease in adaptive bacterial immunity.”Jinek M., Chylinski K., Fonfara I., Hauer M., Doudna J.A., Charpentier E.Science 337:816-821(2012) (Contents of each of these (Incorporated herein by reference in its entirety).

Cas9およびCas9等価物の例が次のとおり提供される;しかしながら、これらの特定の例は限定することを意味されない。本開示のプライマー編集因子は、いずれかの好適なCas9またはCas9等価物を包含するいずれかの好適なnapDNAbpを用い得る。 Examples of Cas9 and Cas9 equivalents are provided below; however, these specific examples are not meant to be limiting. Primer editors of the present disclosure may use any suitable napDNAbp, including any suitable Cas9 or Cas9 equivalent.

A.標準的な野生型SpCas9
1つの態様では、本明細書に記載のプライマー編集因子構築物は、S.pyogenesからの「標準的なSpCas9」ヌクレアーゼを含み得る。これはゲノム工学のツールとして広く用いられており、クラス2 CRISPR-Casシステムの酵素のII型サブグループとして類別される。このCas9タンパク質は、2つの別物のヌクレアーゼドメインを含有する大きいマルチドメインタンパク質である。1つのまたは両方のヌクレアーゼ活性を廃止するための点変異がCas9上に導入され得、夫々ニッカーゼCas9(nCas9)または不活性型Cas9(dCas9)をもたらす。これは、sgRNAによってプログラムされる様式でDNAに結合するその能力をなお保持する。原理的には、別のタンパク質またはドメインに融合されるときに、Cas9またはそのバリアント(例えばnCas9)は、単純に適当なsgRNAとの共発現によって、そのタンパク質を実質的にいずれかのDNA配列へと標的化し得る。本願において用いられる標準的なSpCas9タンパク質は、次のアミノ酸配列を有するStreptococcus pyogenesからの野生型タンパク質を言う:

Figure 2020191234000011
Figure 2020191234000012
Figure 2020191234000013
A. Standard wild type SpCas9
In one embodiment, the primer editor constructs described herein may include the "canonical SpCas9" nuclease from S. pyogenes. It is widely used as a tool for genome engineering and is classified as a type II subgroup of enzymes in class 2 CRISPR-Cas systems. The Cas9 protein is a large multidomain protein that contains two separate nuclease domains. Point mutations can be introduced on Cas9 to abolish one or both nuclease activities, resulting in nickase Cas9 (nCas9) or inactive Cas9 (dCas9), respectively. It still retains its ability to bind DNA in the manner programmed by the sgRNA. In principle, when fused to another protein or domain, Cas9 or a variant thereof (e.g. nCas9) could bind the protein to virtually any DNA sequence by simply co-expressing it with an appropriate sgRNA. and can be targeted. Standard SpCas9 protein as used in this application refers to the wild type protein from Streptococcus pyogenes having the following amino acid sequence:
Figure 2020191234000011
Figure 2020191234000012
Figure 2020191234000013

本明細書に記載のプライム編集因子は、標準的なSpCas9、または上で提供されている野生型Cas9配列との少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、または少なくとも99%配列同一性を有するそのいずれかのバリアントを包含し得る。これらのバリアントは、1つ以上の変異を含有するSpCas9バリアントを包含し得、SwissProtアクセッションNo.Q99ZW2(配列番号18)エントリーで報告されているいずれかの公知の変異を包含する。これらは:

Figure 2020191234000014
を包含する。 The prime editing factors described herein are at least 80%, at least 85%, at least 90%, at least 95%, or at least 99% sequence with standard SpCas9, or the wild type Cas9 sequence provided above. Any variant thereof with identity may be included. These variants may include SpCas9 variants containing one or more mutations, including any known mutations reported in SwissProt Accession No. Q99ZW2 (SEQ ID NO: 18) entry. these are:
Figure 2020191234000014
includes.

本開示に用いられ得る他の野生型SpCas9配列は:

Figure 2020191234000015
Figure 2020191234000016
Figure 2020191234000017
Figure 2020191234000018
Figure 2020191234000019
Figure 2020191234000020
Figure 2020191234000021
Figure 2020191234000022
を包含する。 Other wild-type SpCas9 sequences that can be used in this disclosure are:
Figure 2020191234000015
Figure 2020191234000016
Figure 2020191234000017
Figure 2020191234000018
Figure 2020191234000019
Figure 2020191234000020
Figure 2020191234000021
Figure 2020191234000022
includes.

本明細書に記載のプライム編集因子は、上のSpCas9配列のいずれか、または少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、または少なくとも99%配列同一性をそれに対して有するそのいずれかのバリアントを包含し得る。 The prime editing factors described herein are any of the SpCas9 sequences above, or any thereof having at least 80%, at least 85%, at least 90%, at least 95%, or at least 99% sequence identity thereto. Variants of this may be included.

B.野生型Cas9オーソログ
他の態様において、Cas9タンパク質は、S.pyogenesからの標準的なCas9とは異なる別の細菌種からの野生型Cas9オーソログであり得る。例えば、次のCas9オーソログが本明細書に記載されるプライム編集因子構築物に関して用いられ得る。加えて、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、または少なくとも99%配列同一性を下のオーソログのいずれかに対して有するいずれかのバリアントCas9オーソログもまた本プライム編集因子に用いられ得る。

Figure 2020191234000023
Figure 2020191234000024
Figure 2020191234000025
Figure 2020191234000026
Figure 2020191234000027
Figure 2020191234000028
Figure 2020191234000029
B. Wild Type Cas9 Ortholog In other embodiments, the Cas9 protein can be a wild type Cas9 ortholog from another bacterial species that is different from standard Cas9 from S. pyogenes. For example, the following Cas9 orthologs can be used in conjunction with the prime editor constructs described herein. In addition, any variant Cas9 ortholog that has at least 80%, at least 85%, at least 90%, at least 95%, or at least 99% sequence identity to any of the orthologs below is also a prime editing factor. can be used.
Figure 2020191234000023
Figure 2020191234000024
Figure 2020191234000025
Figure 2020191234000026
Figure 2020191234000027
Figure 2020191234000028
Figure 2020191234000029

本明細書に記載のプライム編集因子は、上のCas9オーソログ配列のいずれか、または少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、または少なくとも99%配列同一性をそれに対して有するそのいずれかのバリアントを包含し得る。 The prime editing factors described herein are any of the above Cas9 ortholog sequences, or those having at least 80%, at least 85%, at least 90%, at least 95%, or at least 99% sequence identity thereto. Any variant may be included.

napDNAbpは、Cas9などの天然に存在する酵素の(or)いずれかの好適なホモログおよび/またはオーソログを包含し得る。Cas9ホモログおよび/またはオーソログはS.pyogenesおよびS.thermophilusを包含するがこれらに限定されない種々の種において記載されている。好ましくは、Cas部分はニッカーゼとして構成される(例えば、変異導入されるか、組み換え操作されるか、または別様に天然から得られる)。すなわち、標的の一本鎖のみを切断することができる。追加の(doubpdditional)好適なCas9ヌクレアーゼおよび配列は本開示に基づいて当業者には明らかであろう。かかるCas9ヌクレアーゼおよび配列は、Chylinski,Rhun,and Charpentier,“The tracrRNA and Cas9 families of type II CRISPR-Cas immunity systems”(2013)RNA Biology 10:5,726-737に開示されている生物および座位からのCas9配列を包含する;これの内容全体は参照によって本願に組み込まれる。いくつかの態様では、Cas9ヌクレアーゼは不活性な(例えば不活性化された)DNA切断ドメインを有する。つまり、Cas9はニッカーゼである。いくつかの態様では、Cas9タンパク質は、表3のバリアントのいずれか1つによって提供されるCas9タンパク質のアミノ酸配列と少なくとも80%同一であるアミノ酸配列を含む。いくつかの態様では、Cas9タンパク質は、上の表のCas9オーソログのいずれか1つによって提供されるCas9タンパク質のアミノ酸配列と少なくとも85%、少なくとも90%、少なくとも92%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも99.5%同一であるアミノ酸配列を含む。 napDNAbp may include any suitable homolog and/or ortholog of a naturally occurring enzyme such as Cas9. Cas9 homologs and/or orthologs have been described in various species including, but not limited to, S. pyogenes and S. thermophilus. Preferably, the Cas moiety is configured as a nickase (eg, mutagenized, recombinantly engineered, or otherwise obtained from nature). That is, only a single strand of the target can be cleaved. Additional suitable Cas9 nucleases and sequences will be apparent to those skilled in the art based on this disclosure. Such Cas9 nucleases and sequences include Cas9 nucleases from the organisms and loci disclosed in Chylinski, Rhun, and Charpentier, “The tracrRNA and Cas9 families of type II CRISPR-Cas immunity systems” (2013) RNA Biology 10:5,726-737. the entire contents of which are incorporated herein by reference. In some embodiments, the Cas9 nuclease has an inactive (eg, inactivated) DNA cleavage domain. In other words, Cas9 is a nickase. In some embodiments, the Cas9 protein comprises an amino acid sequence that is at least 80% identical to the amino acid sequence of the Cas9 protein provided by any one of the variants in Table 3. In some embodiments, the Cas9 protein has at least 85%, at least 90%, at least 92%, at least 95%, at least 96% the amino acid sequence of the Cas9 protein provided by any one of the Cas9 orthologs in the table above. , at least 97%, at least 98%, at least 99%, or at least 99.5% identical.

C.不活性型Cas9バリアント
ある態様において、本明細書に記載のプライム編集因子は、不活性型Cas9、例えば不活性型SpCas9を包含し得る。これは、Cas9の両方のヌクレアーゼドメイン、つまりRuvCドメイン(これは、非プロトスペーサーDNA鎖を切断する)およびHNHドメイン(これはプロトスペーサーDNA鎖を切断する)を不活性化する1つ以上の変異を原因として、ヌクレアーゼ活性を有さない。ヌクレアーゼ不活性化は、コードされるタンパク質、または少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、もしくは少なくとも99%配列同一性をそれに対して有するそのいずれかのバリアントのアミノ酸配列に1つ以上の置換および/または欠失をもたらす1つ以上の変異を原因とし得る。
C. Inactive Cas9 variant
In certain embodiments, the prime editing factors described herein can include an inactive form of Cas9, such as an inactive form of SpCas9. It consists of one or more mutations that inactivate both nuclease domains of Cas9, namely the RuvC domain (which cleaves the non-protospacer DNA strand) and the HNH domain (which cleaves the protospacer DNA strand). Due to this, it has no nuclease activity. Nuclease inactivation occurs when the amino acid sequence of the encoded protein, or any variant thereof, has at least 80%, at least 85%, at least 90%, at least 95%, or at least 99% sequence identity to it. It may be due to one or more mutations resulting in one or more substitutions and/or deletions.

本願において用いられる用語「dCas9」は、ヌクレアーゼ不活性(inactive)Cas9もしくはヌクレアーゼ不活性型(dead)Cas9またはその機能的フラグメントを言い、いずれかの生物からのいずれかの天然に存在するdCas9、いずれかの天然に存在するdCas9等価物またはその機能的フラグメント、いずれかの生物からのいずれかのdCas9ホモログ、オーソログ、またはパラログ、および天然に存在するかまたは操作されたdCas9のいずれかの変異体またはバリアントを包摂する。用語dCas9は特に限定することを意味されず、「dCas9または等価物」と言われ得る。例示のdCas9タンパク質とdCas9タンパク質を作るための方法とは、さらに本願に記載および/または当該技術分野において記載されており、参照によって本願に組み込まれる。 The term "dCas9" as used herein refers to nuclease inactive Cas9 or nuclease dead Cas9 or a functional fragment thereof, including any naturally occurring dCas9 from any organism, any any naturally occurring dCas9 equivalent or functional fragment thereof, any dCas9 homolog, ortholog, or paralog from any organism, and any naturally occurring or engineered dCas9 variant or Subsuming variants. The term dCas9 is not meant to be particularly limiting and may be referred to as "dCas9 or equivalent." Exemplary dCas9 proteins and methods for making dCas9 proteins are further described in this application and/or in the art, and are incorporated herein by reference.

他の態様において、dCas9は、部分的にまたは丸ごとで、Cas9ヌクレアーゼ活性を不活性化する1つ以上の変異を有するCas9アミノ酸配列に対応するかまたはそれを含む。他の態様において、D10AおよびH840A以外の変異を有するCas9バリアントが提供され、これらは内生Cas9ヌクレアーゼ活性の完全なまたは部分的な不活性化物をもたらし得る(例えば、夫々nCas9またはdCas9)。かかる変異は、例として、D10およびH820における他のアミノ酸置換、またはCas9のヌクレアーゼドメイン上の他の置換(例えば、HNHヌクレアーゼサブドメインおよび/またはRuvC1サブドメイン上の置換)を、Streptococcus pyogenesからのCas9(NCBI参照配列:NC_017053.1)などの野生型配列を参照して包含する。いくつかの態様では、Cas9のバリアントまたはホモログ(例えば、Streptococcus pyogenesからのCas9(NCBI参照配列:NC_017053.1(配列番号20))のバリアント)が提供され、これらは、NCBI参照配列:NC_017053.1と少なくとも約70%同一、少なくとも約80%同一、少なくとも約90%同一、少なくとも約95%同一、少なくとも約98%同一、少なくとも約99%同一、少なくとも約99.5%同一、または少なくとも約99.9%同一である。いくつかの態様では、dCas9のバリアント(例えば、NCBI参照配列:NC_017053.1(配列番号20)のバリアント)が提供され、NC_017053.1(配列番号20)よりも約5アミノ酸、約10アミノ酸、約15アミノ酸、約20アミノ酸、約25アミノ酸、約30アミノ酸、約40アミノ酸、約50アミノ酸、約75アミノ酸、約100アミノ酸、またはより多くだけ短いかまたは長いアミノ酸配列を有する。 In other embodiments, the dCas9 corresponds to or includes a Cas9 amino acid sequence that has one or more mutations that inactivate Cas9 nuclease activity, in part or in its entirety. In other embodiments, Cas9 variants with mutations other than D10A and H840A are provided, which can result in complete or partial inactivation of endogenous Cas9 nuclease activity (eg, nCas9 or dCas9, respectively). Such mutations may include, for example, other amino acid substitutions in D10 and H820, or other substitutions on the nuclease domain of Cas9 (e.g., substitutions on the HNH nuclease subdomain and/or RuvC1 subdomain) of Cas9 from Streptococcus pyogenes. (NCBI reference sequence: NC_017053.1) is included by reference. In some embodiments, variants or homologs of Cas9 (e.g., variants of Cas9 from Streptococcus pyogenes (NCBI Reference Sequence: NC_017053.1 (SEQ ID NO: 20)) are provided, which are similar to the NCBI Reference Sequence: NC_017053.1 at least about 70% identical, at least about 80% identical, at least about 90% identical, at least about 95% identical, at least about 98% identical, at least about 99% identical, at least about 99.5% identical, or at least about 99.9% identical to be. In some embodiments, a variant of dCas9 (e.g., a variant of NCBI reference sequence: NC_017053.1 (SEQ ID NO: 20)) is provided that has about 5 amino acids, about 10 amino acids, about having an amino acid sequence shorter or longer by 15 amino acids, about 20 amino acids, about 25 amino acids, about 30 amino acids, about 40 amino acids, about 50 amino acids, about 75 amino acids, about 100 amino acids, or more.

1つの態様では、不活性型Cas9はQ99ZW2の標準的なSpCas9配列に基づき得、D10XおよびH810X置換(下線付きかつ太字)を含む次の配列を有し得、Xはいずれかのアミノ酸であり得、またはバリアントは少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、もしくは少なくとも99%配列同一性をそれに対して有する配列番号40のバリアントであり得る。 In one embodiment, the inactive Cas9 can be based on the canonical SpCas9 sequence of Q99ZW2 and have the following sequence including the D10X and H810X substitutions (underlined and bold), where X can be any amino acid: , or the variant can be a variant of SEQ ID NO: 40 having at least 80%, at least 85%, at least 90%, at least 95%, or at least 99% sequence identity thereto.

1つの態様では、不活性型Cas9はQ99ZW2の標準的なSpCas9配列に基づき得、D10AおよびH810A置換(下線付きかつ太字)を含む次の配列を有し得、または少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、もしくは少なくとも99%配列同一性をそれに対して有する配列番号41のバリアントであり得る。

Figure 2020191234000030
Figure 2020191234000031
In one embodiment, the inactive Cas9 may be based on the standard SpCas9 sequence of Q99ZW2 and may have the following sequence, including the D10A and H810A substitutions (underlined and bold), or at least 80%, at least 85%, It can be a variant of SEQ ID NO: 41 having at least 90%, at least 95%, or at least 99% sequence identity thereto.
Figure 2020191234000030
Figure 2020191234000031

D.Cas9ニッカーゼバリアント
1つの態様において、本明細書に記載のプライム編集因子はCas9ニッカーゼを含む。用語「Cas9ニッカーゼ」または「nCas9」は、二本鎖DNA分子標的上に一本鎖切断を導入することができるCas9のバリアントを言う。いくつかの態様では、Cas9ニッカーゼは単一の機能するヌクレアーゼドメインのみを含む。野生型Cas9(例えば標準的なSpCas9)は、2つの別個のヌクレアーゼドメイン、つまりRuvCドメイン(これは非プロトスペーサーDNA鎖を切断する)およびHNHドメイン(これはプロトスペーサーDNA鎖を切断する)を含む。1つの態様では、Cas9ニッカーゼはRuvCヌクレアーゼ活性を不活性化するRuvCドメインの変異を含む。例えば、アスパラギン酸(D)10、ヒスチジン(H)983、アスパラギン酸(D)986、またはグルタミン酸(E)762の変異は、RuvCヌクレアーゼドメインの機能喪失変異および機能的なCas9ニッカーゼの生出として報告されている(例えば、Nishimasu et al., “Crystal structure of Cas9 in complex with guide RNA and target DNA,”Cell 156(5),935-949。これは参照によって本願に組み込まれる)。それゆえに、RuvCドメインのニッカーゼ変異はD10X、H983X、D986X、またはE762Xを包含し得、Xは野生型アミノ酸以外のいずれかのアミノ酸である。ある態様において、ニッカーゼはD10A、もしくは(of)H983A、もしくはD986A、もしくはE762A、またはそれらの組み合わせであり得る。
D. Cas9 nickase variant
In one embodiment, the prime editing factor described herein comprises a Cas9 nickase. The term "Cas9 nickase" or "nCas9" refers to a variant of Cas9 that is capable of introducing a single-strand break on a double-stranded DNA molecule target. In some embodiments, the Cas9 nickase contains only a single functional nuclease domain. Wild-type Cas9 (e.g. standard SpCas9) contains two separate nuclease domains: the RuvC domain (which cleaves the non-protospacer DNA strand) and the HNH domain (which cleaves the protospacer DNA strand) . In one embodiment, the Cas9 nickase comprises a mutation in the RuvC domain that inactivates RuvC nuclease activity. For example, mutations in aspartate (D)10, histidine (H)983, aspartate (D)986, or glutamate (E)762 have been reported as loss-of-function mutations in the RuvC nuclease domain and generation of a functional Cas9 nickase. (eg, Nishimasu et al., “Crystal structure of Cas9 in complex with guide RNA and target DNA,” Cell 156(5), 935-949, which is incorporated herein by reference). Therefore, nickase mutations in the RuvC domain may include D10X, H983X, D986X, or E762X, where X is any amino acid other than the wild type amino acid. In certain embodiments, the nickase can be D10A, or (of) H983A, or D986A, or E762A, or a combination thereof.

種々の態様において、Cas9ニッカーゼはRuvCヌクレアーゼドメインに変異を有し得(can having)、次のアミノ酸配列の1つ、または少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、もしくは少なくとも99%配列同一性をそれに対して有するアミノ酸配列を有するそのバリアントを有し得る。

Figure 2020191234000032
Figure 2020191234000033
Figure 2020191234000034
Figure 2020191234000035
Figure 2020191234000036
Figure 2020191234000037
In various embodiments, the Cas9 nickase can have a mutation in the RuvC nuclease domain and has one of the following amino acid sequences, or at least 80%, at least 85%, at least 90%, at least 95%, or at least 99 It may have a variant thereof that has an amino acid sequence with which it has % sequence identity.
Figure 2020191234000032
Figure 2020191234000033
Figure 2020191234000034
Figure 2020191234000035
Figure 2020191234000036
Figure 2020191234000037

別の態様では、Cas9ニッカーゼはHNHヌクレアーゼ活性を不活性化するHNHドメインの変異を含む。例えば、ヒスチジン(H)840またはアスパラギン(R)863の変異は、HNHヌクレアーゼドメインの機能喪失変異および機能的なCas9ニッカーゼの生出として報告されている(例えば、Nishimasu et al.,“Crystal structure of Cas9 in complex with guide RNA and target DNA,”Cell 156(5),935-949。これは参照によって本願に組み込まれる)。それゆえに、HNHドメインのニッカーゼ変異はH840XおよびR863Xを包含し得、Xは野生型アミノ酸以外のいずれかのアミノ酸である。ある態様において、ニッカーゼはH840AもしくはR863Aまたはそれらの組み合わせであり得る。 In another embodiment, the Cas9 nickase comprises a mutation in the HNH domain that inactivates HNH nuclease activity. For example, mutations in histidine (H)840 or asparagine (R)863 have been reported as loss-of-function mutations in the HNH nuclease domain and generation of a functional Cas9 nickase (e.g., Nishimasu et al., “Crystal structure of Cas9 in complex with guide RNA and target DNA,” Cell 156(5), 935-949, which is incorporated herein by reference). Therefore, nickase mutations in the HNH domain can include H840X and R863X, where X is any amino acid other than the wild type amino acid. In certain embodiments, the nickase can be H840A or R863A or a combination thereof.

種々の態様において、Cas9ニッカーゼはHNHヌクレアーゼドメインの変異を有し得、次のアミノ酸配列の1つ、または少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、または少なくとも99%配列同一性をそれに対して有するアミノ酸配列を有するそのバリアントを有し得る。

Figure 2020191234000038
Figure 2020191234000039
Figure 2020191234000040
In various embodiments, the Cas9 nickase can have a mutation in the HNH nuclease domain and have one of the following amino acid sequences, or at least 80%, at least 85%, at least 90%, at least 95%, or at least 99% sequence identity may have a variant thereof that has an amino acid sequence with respect to it.
Figure 2020191234000038
Figure 2020191234000039
Figure 2020191234000040

いくつかの態様では、N末端メチオニンが、Cas9ニッカーゼから、または本願において開示もしくは企図されるいずれかのCas9バリアント、オーソログ、もしくは等価物から除去される。例えば、メチオニンマイナスCas9ニッカーゼは、次の配列、または少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、もしくは少なくとも99%配列同一性をそれらに対して有するアミノ酸配列を有するそれらのバリアントを包含する。

Figure 2020191234000041
Figure 2020191234000042
Figure 2020191234000043
In some embodiments, the N-terminal methionine is removed from the Cas9 nickase or from any Cas9 variant, ortholog, or equivalent disclosed or contemplated herein. For example, methionine-minus Cas9 nickases contain the following sequences, or variants thereof that have amino acid sequences that have at least 80%, at least 85%, at least 90%, at least 95%, or at least 99% sequence identity to them: include.
Figure 2020191234000041
Figure 2020191234000042
Figure 2020191234000043

E.他のCas9バリアント
不活性型Cas9およびCas9ニッカーゼバリアントの他に、本願において用いられるCas9タンパク質は、本明細書に開示のかまたは当該技術分野において公知のいずれかの野生型Cas9または変異体Cas9(例えば、不活性型Cas9またはCas9ニッカーゼ)、またはフラグメントCas9、または循環置換体Cas9、またはCas9の他のバリアントを包含するいずれかの参照Cas9タンパク質と少なくとも約70%同一、少なくとも約80%同一、少なくとも約90%同一、少なくとも約95%同一、少なくとも約96%同一、少なくとも約97%同一、少なくとも約98%同一、少なくとも約99%同一、少なくとも約99.5%同一、または少なくとも約99.9%同一である他の「Cas9バリアント」をもまた包含し得る。いくつかの態様では、Cas9バリアントは、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、21、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、またはより多くのアミノ酸変化を、参照Cas9と比較して有し得る。いくつかの態様では、Cas9バリアントは参照Cas9のフラグメント(例えば、gRNA結合ドメインまたはDNA切断ドメイン)を含み、その結果、フラグメントは、野生型Cas9の対応するフラグメントと少なくとも約70%同一、少なくとも約80%同一、少なくとも約90%同一、少なくとも約95%同一、少なくとも約96%同一、少なくとも約97%同一、少なくとも約98%同一、少なくとも約99%同一、少なくとも約99.5%同一、または少なくとも約99.9%同一である。いくつかの態様では、フラグメントは(is is)、対応する野生型Cas9(例えば配列番号18)のアミノ酸長さの少なくとも30%、少なくとも35%、少なくとも40%、少なくとも45%、少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%同一、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも99.5%である。
E. Other Cas9 variants
In addition to inactive Cas9 and Cas9 nickase variants, Cas9 proteins used herein may include any wild-type Cas9 or mutant Cas9 (e.g., inactive Cas9) disclosed herein or known in the art. at least about 70% identical, at least about 80% identical, at least about 90% identical to any reference Cas9 protein, including Cas9 or Cas9 nickase), or fragment Cas9, or circularly substituted Cas9, or other variants of Cas9; Other "Cas9 Variants" that are at least about 95% identical, at least about 96% identical, at least about 97% identical, at least about 98% identical, at least about 99% identical, at least about 99.5% identical, or at least about 99.9% identical may also be included. In some embodiments, the Cas9 variant is 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 21, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, It may have 46, 47, 48, 49, 50, or more amino acid changes compared to the reference Cas9. In some embodiments, the Cas9 variant comprises a fragment of a reference Cas9 (e.g., a gRNA binding domain or a DNA cleavage domain) such that the fragment is at least about 70% identical, at least about 80% identical to the corresponding fragment of wild-type Cas9. % identical, at least about 90% identical, at least about 95% identical, at least about 96% identical, at least about 97% identical, at least about 98% identical, at least about 99% identical, at least about 99.5% identical, or at least about 99.9% are the same. In some embodiments, the fragment is at least 30%, at least 35%, at least 40%, at least 45%, at least 50%, at least 55%, at least 60%, at least 65%, at least 70%, at least 75%, at least 80%, at least 85%, at least 90%, at least 95% identical, at least 96%, at least 97%, at least 98%, at least 99 %, or at least 99.5%.

いくつかの態様では、本開示は、本明細書に開示のいずれかのCas9タンパク質のフラグメントであるそれらの機能性を保持するCas9フラグメントをもまた利用し得る。いくつかの態様では、Cas9フラグメントは長さが少なくとも100アミノ酸である。いくつかの態様では、フラグメントは長さが少なくとも100、150、200、250、300、350、400、450、500、550、600、650、700、750、800、850、900、950、1000、1050、1100、1150、1200、1250、または少なくとも1300アミノ酸である。 In some embodiments, the present disclosure may also utilize Cas9 fragments that retain their functionality, which are fragments of any of the Cas9 proteins disclosed herein. In some embodiments, the Cas9 fragment is at least 100 amino acids in length. In some embodiments, the fragment is at least 100, 150, 200, 250, 300, 350, 400, 450, 500, 550, 600, 650, 700, 750, 800, 850, 900, 950, 1000, 1050, 1100, 1150, 1200, 1250, or at least 1300 amino acids.

種々の態様において、本明細書に開示のプライム編集因子は、次のとおり記載されるCas9バリアントの1つ、またはいずれかの参照Cas9バリアントと少なくとも約70%同一、少なくとも約80%同一、少なくとも約90%同一、少なくとも約95%同一、少なくとも約96%同一、少なくとも約97%同一、少なくとも約98%同一、少なくとも約99%同一、少なくとも約99.5%同一、もしくは少なくとも約99.9%同一であるそのCas9バリアントを含み得る。 In various embodiments, the prime editing factors disclosed herein are at least about 70% identical, at least about 80% identical, at least about That Cas9 is 90% identical, at least about 95% identical, at least about 96% identical, at least about 97% identical, at least about 98% identical, at least about 99% identical, at least about 99.5% identical, or at least about 99.9% identical May contain variants.

F.小さいサイズのCas9バリアント
いくつかの態様では、本願において企図されるプライム編集因子は、標準的なSpCas9配列よりも小さい分子量であるCas9タンパク質を包含する。いくつかの態様では、より小さいサイズのCas9バリアントは、例えば発現ベクター、ナノ粒子、または送達の他の手段による細胞への送達を容易化し得る。ある態様において、より小さいサイズのCas9バリアントは、クラス2 CRISPR-CasシステムのII型酵素として類別される酵素を包含し得る。いくつかの態様では、より小さいサイズのCas9バリアントは、クラス2 CRISPR-CasシステムのV型酵素として類別される酵素を包含し得る。他の態様において、より小さいサイズのCas9バリアントは、クラス2 CRISPR-CasシステムのVI型酵素として類別される酵素を包含し得る。
F. Smaller size Cas9 variant
In some embodiments, prime editing agents contemplated herein include Cas9 proteins that are smaller in molecular weight than the standard SpCas9 sequence. In some embodiments, smaller sized Cas9 variants may facilitate delivery to cells, eg, by expression vectors, nanoparticles, or other means of delivery. In certain embodiments, smaller sized Cas9 variants may include enzymes classified as type II enzymes of class 2 CRISPR-Cas systems. In some embodiments, smaller sized Cas9 variants may include enzymes classified as type V enzymes of class 2 CRISPR-Cas systems. In other embodiments, smaller sized Cas9 variants may include enzymes classified as type VI enzymes of class 2 CRISPR-Cas systems.

標準的なSpCas9タンパク質は長さが1368アミノ酸であり、158キロダルトンの予測される分子量を有する。本願において用いられる用語「小さいサイズのCas9バリアント」は、少なくとも1300アミノ酸未満、または少なくとも1290アミノ酸未満、または1280アミノ酸未満、または1270アミノ酸未満、または1260アミノ酸未満、または1250アミノ酸未満、または1240アミノ酸未満、または1230アミノ酸未満、または1220アミノ酸未満、または1210アミノ酸未満、または1200アミノ酸未満、または1190アミノ酸未満、または1180アミノ酸未満、または1170アミノ酸未満、または1160アミノ酸未満、または1150アミノ酸未満、または1140アミノ酸未満、または1130アミノ酸未満、または1120アミノ酸未満、または1110アミノ酸未満、または1100アミノ酸未満、または1050アミノ酸未満、または1000アミノ酸未満、または950アミノ酸未満、または900アミノ酸未満、または850アミノ酸未満、または800アミノ酸未満、または750アミノ酸未満、または700アミノ酸未満、または650アミノ酸未満、または600アミノ酸未満、または550アミノ酸未満、または500アミノ酸未満だが、少なくとも約400アミノ酸よりも大きく、かつCas9タンパク質の要求される機能を保持している天然に存在する、操作された、または別様のいずれかのCas9バリアントを言う。Cas9バリアントは、クラス2 CRISPR-CasシステムのII型、V型、またはVI型酵素として類別されるものを包含し得る。 The standard SpCas9 protein is 1368 amino acids in length and has a predicted molecular weight of 158 kilodaltons. As used herein, the term "small size Cas9 variant" means at least less than 1300 amino acids, or at least less than 1290 amino acids, or less than 1280 amino acids, or less than 1270 amino acids, or less than 1260 amino acids, or less than 1250 amino acids, or less than 1240 amino acids, or less than 1230 amino acids, or less than 1220 amino acids, or less than 1210 amino acids, or less than 1200 amino acids, or less than 1190 amino acids, or less than 1180 amino acids, or less than 1170 amino acids, or less than 1160 amino acids, or less than 1150 amino acids, or less than 1140 amino acids, or less than 1130 amino acids, or less than 1120 amino acids, or less than 1110 amino acids, or less than 1100 amino acids, or less than 1050 amino acids, or less than 1000 amino acids, or less than 950 amino acids, or less than 900 amino acids, or less than 850 amino acids, or less than 800 amino acids, or less than 750 amino acids, or less than 700 amino acids, or less than 650 amino acids, or less than 600 amino acids, or less than 550 amino acids, or less than 500 amino acids, but greater than at least about 400 amino acids, and retains the required function of the Cas9 protein. Refers to Cas9 variants that are either naturally occurring, engineered, or otherwise. Cas9 variants can include those classified as type II, type V, or type VI enzymes of class 2 CRISPR-Cas systems.

種々の態様において、本明細書に開示のプライム編集因子は、次のとおり記載される小さいサイズのCas9バリアントの1つ、またはいずれかの参照の小さいサイズのCas9タンパク質と少なくとも約70%同一、少なくとも約80%同一、少なくとも約90%同一、少なくとも約95%同一、少なくとも約96%同一、少なくとも約97%同一、少なくとも約98%同一、少なくとも約99%同一、少なくとも約99.5%同一、もしくは少なくとも約99.9%同一である(having)そのCas9バリアントを含み得る。

Figure 2020191234000044
Figure 2020191234000045
Figure 2020191234000046
Figure 2020191234000047
In various embodiments, the prime editing factors disclosed herein are at least about 70% identical to one of the small size Cas9 variants described as follows, or to any reference small size Cas9 protein; about 80% identical, at least about 90% identical, at least about 95% identical, at least about 96% identical, at least about 97% identical, at least about 98% identical, at least about 99% identical, at least about 99.5% identical, or at least about It may include a Cas9 variant thereof having 99.9% identity.
Figure 2020191234000044
Figure 2020191234000045
Figure 2020191234000046
Figure 2020191234000047

G.Cas9等価物
いくつかの態様では、本明細書に記載のプライム編集因子はいずれかのCas9等価物を包含し得る。本願において用いられる用語「Cas9等価物」は、幅広い用語であり、これは、そのアミノ酸一次配列および/またはその三次元構造が異なり得るおよび/または進化的立場からは無関係であり得るにもかかわらず、本プライム編集因子においてCas9と同じ機能を供するいずれかのnapDNAbpタンパク質を包摂する。それゆえに、Cas9等価物は進化的に関係する本願に記載または包摂されるいずれかのCas9オーソログ、ホモログ、変異体、またはバリアントを包含するが、Cas9等価物は、Cas9と同じかまたは類似の機能を有するように収斂進化プロセスによって進化してあり得るが、アミノ酸配列および/または三次元構造についていずれかの類似性を必ずしも有さないタンパク質をもまた包摂する。Cas9等価物が収斂進化によって発生したタンパク質に基づき得るにもかかわらず、ここで記載されるプライム編集因子は、Cas9と同じかまたは類似の機能を提供するであろういずれかのCas9等価物を包摂する。例えば、Cas9がCRISPR-CasシステムのII型酵素を言う場合には、Cas9等価物はCRISPR-CasシステムのV型またはVI型酵素を言い得る。
G. Cas9 equivalent
In some embodiments, the prime editing factors described herein may include any Cas9 equivalent. The term "Cas9 equivalent" as used in this application is a broad term, which means that its primary amino acid sequence and/or its three-dimensional structure may differ and/or be unrelated from an evolutionary standpoint. , subsumes any napDNAbp protein that serves the same function as Cas9 in this prime editing factor. Therefore, while Cas9 equivalents include any evolutionarily related Cas9 orthologs, homologs, mutants, or variants described or encompassed herein, Cas9 equivalents do not have the same or similar functionality as Cas9. It also encompasses proteins that may have evolved by a convergent evolutionary process to have a molecule, but do not necessarily have any similarity in amino acid sequence and/or three-dimensional structure. Although Cas9 equivalents may be based on proteins that have arisen by convergent evolution, the prime editing factors described here encompass any Cas9 equivalent that would provide the same or similar functionality as Cas9. do. For example, if Cas9 refers to the type II enzyme of the CRISPR-Cas system, the Cas9 equivalent can refer to the type V or type VI enzyme of the CRISPR-Cas system.

例えば、Cas12e(CasX)は、報告によるとCas9と同じ機能を有するが、収斂進化によって進化したCas9等価物である。それゆえに、Liu et al.,“CasX enzymes comprises a distinct family of RNA-guided genome editors,”Nature,2019,Vol.566:218-223に記載されているCas12e(CasX)タンパク質は、本明細書に記載のプライム編集因子に用いられることを企図される。加えて、Cas12e(CasX)のいずれかのバリアントまたは改変が想像され、本開示の範囲内である。 For example, Cas12e (CasX) is a Cas9 equivalent that reportedly has the same function as Cas9 but evolved by convergent evolution. Therefore, the Cas12e (CasX) protein described in Liu et al., “CasX enzymes comprises a distinct family of RNA-guided genome editors,” Nature, 2019, Vol. 566: 218-223, is herein referred to as It is contemplated for use in the described prime editing factors. Additionally, any variants or modifications of Cas12e (CasX) are envisioned and within the scope of this disclosure.

Cas9は広い種々の種において進化した細菌酵素である。しかしながら、本願において企図されるCas9等価物は古細菌からもまた得られ得る。これらは細菌とは異なる単細胞原核微生物のドメインおよび界を構成する。 Cas9 is a bacterial enzyme that has evolved in a wide variety of species. However, Cas9 equivalents contemplated in this application may also be obtained from Archaea, which constitute a distinct domain and kingdom of unicellular prokaryotic microorganisms from Bacteria.

いくつかの態様では、Cas9等価物はCas12e(CasX)またはCas12d(CasY)を言い得る。これらは例えばBurstein et al.,“New CRISPR-Cas systems from uncultivated microbes.”Cell Res.2017 Feb 21.doi:10.1038/cr.2017.21に記載されている。これの内容全体は参照によってここに組み込まれる。ゲノム分解能メタゲノミクスを用いて、生命の古細菌ドメインにおける最初に報告されたCas9を包含するいくつものCRISPR-Casシステムが同定された。この分岐したCas9タンパク質は、わずかにしか研究されていないナノ古細菌から活性なCRISPR-Casシステムの一部として見出された。細菌では、2つの先には未知のシステムCRISPR-Cas12eおよびCRISPR-Cas12dが発見された。これらはこれまでに発見された最もコンパクトなシステムのうちである。いくつかの態様では、Cas9はCas12eまたはCas12eのバリアントを言う。いくつかの態様では、Cas9はCas12dまたはCas12dのバリアントを言う。他のRNAによってガイドされるDNA結合タンパク質が核酸プログラム型DNA結合タンパク質(napDNAbp)として用いられ得、本開示の範囲内であるということは了解されるはずである。Liu et al.,“CasX enzymes comprises a distinct family of RNA-guided genome editors,”Nature,2019,Vol.566:218-223をもまた見よ。これらのCas9等価物のいずれかが企図される。 In some embodiments, a Cas9 equivalent can refer to Cas12e (CasX) or Cas12d (CasY). These are described, for example, in Burstein et al., “New CRISPR-Cas systems from uncultivated microbes.” Cell Res.2017 Feb 21.doi:10.1038/cr.2017.21. The entire contents of this are incorporated herein by reference. Using genome-resolved metagenomics, a number of CRISPR-Cas systems were identified, including the first reported Cas9 in the archaeal domain of life. This divergent Cas9 protein was discovered as part of an active CRISPR-Cas system from a poorly studied nanoarchaea. In bacteria, two previously unknown systems were discovered: CRISPR-Cas12e and CRISPR-Cas12d. These are among the most compact systems ever discovered. In some embodiments, Cas9 refers to Cas12e or a variant of Cas12e. In some embodiments, Cas9 refers to Cas12d or a variant of Cas12d. It should be understood that other RNA-guided DNA binding proteins can be used as nucleic acid programmed DNA binding proteins (napDNAbp) and are within the scope of this disclosure. See also Liu et al., “CasX enzymes comprise a distinct family of RNA-guided genome editors,” Nature, 2019, Vol. 566:218-223. Any of these Cas9 equivalents are contemplated.

いくつかの態様では、Cas9等価物は、天然に存在するCas12e(CasX)またはCas12d(CasY)タンパク質と少なくとも85%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも99.5%同一であるアミノ酸配列を含む。いくつかの態様では、napDNAbpは天然に存在するCas12e(CasX)またはCas12d(CasY)タンパク質である。いくつかの態様では、napDNAbpは、本願において提供される野生型Cas部分またはいずれかのCas部分と少なくとも85%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも99.5%同一であるアミノ酸配列を含む。 In some embodiments, the Cas9 equivalent is at least 85%, at least 90%, at least 91%, at least 92%, at least 93%, at least 94%, naturally occurring Cas12e (CasX) or Cas12d (CasY) protein. Includes amino acid sequences that are at least 95%, at least 96%, at least 97%, at least 98%, at least 99%, or at least 99.5% identical. In some embodiments, napDNAbp is a naturally occurring Cas12e (CasX) or Cas12d (CasY) protein. According to some embodiments, NAPDNABP is at least 85 %, at least 85 %, at least 90 %, at least 92 %, at least 93 %, at least 94 %, at least 94 %, at least 93 %, at least 92 %, at least 92 %, at least 92 %, at least 92 %, at least 92 %, at least 92 %, at least 92 %, at least 92 %, at least 92 %, at least 92 %, at least 92 %, at least 92 % Includes amino acid sequences that are 95%, at least 96%, at least 97%, at least 98%, at least 99%, or at least 99.5% identical.

種々の態様において、核酸プログラム型DNA結合タンパク質は、限定なしに、Cas9(例えば、dCas9およびnCas9)、Cas12e(CasX)、Cas12d(CasY)、Cas12a(Cpf1)、Cas12b1(C2c1)、Cas13a(C2c2)、Cas12c(C2c3)、アルゴノート、およびCas12b1を包含する。Cas9とは異なるPAM特異性を有する核酸プログラム型DNA結合タンパク質の1つの例は、PrevotellaおよびFrancisellaからのクラスター化規則的間隔短回文反復1である(すなわちCas12a(Cpf1))。Cas9と類似に、Cas12a(Cpf1)もまたクラス2 CRISPRエフェクターであるが、それはII型サブグループよりもむしろ酵素のV型サブグループである。Cas12a(Cpf1)はCas9とは別物の特色を有するロバストなDNA干渉を媒介するということが示されている。Cas12a(Cpf1)は、tracrRNAを欠く単一のRNAによってガイドされるエンドヌクレアーゼであり、それは、Tリッチなプロトスペーサー隣接モチーフ(TTN、TTTN、またはYTN)を利用する。その上、Cpf1は互い違いのDNA二本鎖切断によってDNAを切断する。16のCpf1ファミリータンパク質のうち、AcidaminococcusおよびLachnospiraceaeからの2つの酵素はヒト細胞における効率的なゲノム編集活性を有することが示される。Cpf1タンパク質は当該技術分野で知られており、先に記載されている。例えばYamano et al.,“Crystal structure of Cpf1 in complex with guide RNA and target DNA.”Cell(165)2016,p.949-962;これの内容全体は参照によってここに組み込まれる。 In various embodiments, the nucleic acid programmed DNA binding proteins include, without limitation, Cas9 (e.g., dCas9 and nCas9), Cas12e (CasX), Cas12d (CasY), Cas12a (Cpf1), Cas12b1 (C2c1), Cas13a (C2c2). , Cas12c(C2c3), Argonaute, and Cas12b1. One example of a nucleic acid-programmed DNA-binding protein with a PAM specificity different from Cas9 is clustered regularly interspaced short palindromic repeat 1 from Prevotella and Francisella (ie, Cas12a (Cpf1)). Similar to Cas9, Cas12a (Cpf1) is also a class 2 CRISPR effector, but it is a type V subgroup of enzymes rather than a type II subgroup. Cas12a (Cpf1) has been shown to mediate robust DNA interference with distinct features from Cas9. Cas12a (Cpf1) is a single RNA-guided endonuclease lacking tracrRNA, which utilizes a T-rich protospacer flanking motif (TTN, TTTN, or YTN). Moreover, Cpf1 cleaves DNA by alternating DNA double-strand breaks. Among the 16 Cpf1 family proteins, two enzymes from Acidaminococcus and Lachnospiraceae are shown to have efficient genome editing activity in human cells. Cpf1 proteins are known in the art and have been previously described. For example, Yamano et al., “Crystal structure of Cpf1 in complex with guide RNA and target DNA.” Cell (165) 2016, p. 949-962; the entire contents of which are incorporated herein by reference.

なお他の態様において、Casタンパク質はいずれかのCRISPR関連タンパク質を包含し得、Cas12a、Cas12b1、Cas1、Cas1B、Cas2、Cas3、Cas4、Cas5、Cas6、Cas7、Cas8、Cas9(Csn1およびCsx12としてもまた公知)、Cas10、Csy1、Csy2、Csy3、Cse1、Cse2、Csc1、Csc2、Csa5、Csn2、Csm2、Csm3、Csm4、Csm5、Csm6、Cmr1、Cmr3、Cmr4、Cmr5、Cmr6、Csb1、Csb2、Csb3、Csx17、Csx14、Csx10、Csx16、CsaX、Csx3、Csx1、Csx15、Csf1、Csf2、Csf3、Csf4、それらのホモログ、またはそれらの改変されたバージョンを包含するが、これらに限定されず、好ましくはニッカーゼ変異を含む(例えば、配列番号18の野生型Cas9ポリペプチドのD10A変異に対応する変異)。 In still other embodiments, the Cas protein may include any CRISPR-associated protein, including Cas12a, Cas12b1, Cas1, Cas1B, Cas2, Cas3, Cas4, Cas5, Cas6, Cas7, Cas8, Cas9 (also as Csn1 and Csx12). (known), Cas10, Csy1, Csy2, Csy3, Cse1, Cse2, Csc1, Csc2, Csa5, Csn2, Csm2, Csm3, Csm4, Csm5, Csm6, Cmr1, Cmr3, Cmr4, Cmr5, Cmr6, Csb1, Csb2, Csb3, Csx17 , Csx14, Csx10, Csx16, CsaX, Csx3, Csx1, Csx15, Csf1, Csf2, Csf3, Csf4, homologues thereof, or modified versions thereof, preferably with nickase mutations. (eg, a mutation corresponding to the D10A mutation of the wild-type Cas9 polypeptide of SEQ ID NO: 18).

種々の他の態様において、napDNAbpは次のタンパク質のいずれかであり得る:Cas9、Cas12a(Cpf1)、Cas12e(CasX)、Cas12d(CasY)、Cas12b1(C2c1)、Cas13a(C2c2)、Cas12c(C2c3)、GeoCas9、CjCas9、Cas12g、Cas12h、Cas12i、Cas13b、Cas13c、Cas13d、Cas14、Csn2、xCas9、SpCas9-NG、循環置換Cas9、もしくはアルゴノート(Ago)ドメイン、またはそのバリアント。 In various other embodiments, napDNAbp can be any of the following proteins: Cas9, Cas12a (Cpf1), Cas12e (CasX), Cas12d (CasY), Cas12b1 (C2c1), Cas13a (C2c2), Cas12c (C2c3). , GeoCas9, CjCas9, Cas12g, Cas12h, Cas12i, Cas13b, Cas13c, Cas13d, Cas14, Csn2, xCas9, SpCas9-NG, circularly permuted Cas9, or Argonaute (Ago) domain, or a variant thereof.

例示のCas9等価物タンパク質配列は次を包含し得る:

Figure 2020191234000048
Figure 2020191234000049
Figure 2020191234000050
Figure 2020191234000051
Figure 2020191234000052
Figure 2020191234000053
Exemplary Cas9 equivalent protein sequences may include:
Figure 2020191234000048
Figure 2020191234000049
Figure 2020191234000050
Figure 2020191234000051
Figure 2020191234000052
Figure 2020191234000053

本明細書に記載のプライム編集因子は、ガイドヌクレオチド配列によってプログラム可能なDNA結合タンパク質ドメインとして用いられ得るCas12a(Cpf1)(dCpf1)バリアントをもまた含み得る。Cas12a(Cpf1)タンパク質は、Cas9のRuvCドメインに類似であるRuvC様エンドヌクレアーゼドメインを有するが、HNHエンドヌクレアーゼドメインは有さず、Cas12a(Cpf1)のN末端はCas9のアルファヘリックス系の認識ローブを有さない。Zetsche et al.,Cell,163,759-771,2015(これは参照によって本願に組み込まれる)においては、Cas12a(Cpf1)のRuvC様ドメインは両方のDNA鎖を切断することを担い、RuvC様ドメインの不活性化がCas12a(Cpf1)ヌクレアーゼ活性を不活性化するということが示された。 The prime editing factors described herein can also include Cas12a (Cpf1) (dCpf1) variants that can be used as DNA binding protein domains programmable by guide nucleotide sequences. Cas12a (Cpf1) protein has a RuvC-like endonuclease domain that is similar to the RuvC domain of Cas9, but does not have an HNH endonuclease domain, and the N-terminus of Cas12a (Cpf1) has a recognition lobe of the alpha-helical system of Cas9. I don't have it. In Zetsche et al., Cell, 163, 759-771, 2015 (which is incorporated herein by reference), the RuvC-like domain of Cas12a (Cpf1) is responsible for cleaving both DNA strands, and the RuvC-like domain It was shown that activation inactivates Cas12a (Cpf1) nuclease activity.

いくつかの態様では、napDNAbpは微生物CRISPR-Casシステムの単一のエフェクターである。微生物CRISPR-Casシステムの単一のエフェクターは、限定なしに、Cas9、Cas12a(Cpf1)、Cas12b1(C2c1)、Cas13a(C2c2)、およびCas12c(C2c3)を包含する。典型的には、微生物CRISPR-Casシステムはクラス1およびクラス2システムに分けられる。クラス1システムはマルチサブユニットエフェクター複合体を有するが、クラス2システムは単一のタンパク質エフェクターを有する。例えば、Cas9およびCas12a(Cpf1)はクラス2エフェクターである。Cas9およびCas12a(Cpf1)に加えて、3つの別物のクラス2 CRISPR-Casシステム(Cas12b1、Cas13a、およびCas12c)がShmakov et al.,“Discovery and Functional Characterization of Diverse Class 2 CRISPR Cas Systems”,Mol.Cell,2015 Nov 5;60(3):385-397によって記載されている。これの内容全体は参照によってここに組み込まれる。 In some embodiments, napDNAbp is a single effector of a microbial CRISPR-Cas system. Single effectors of microbial CRISPR-Cas systems include, without limitation, Cas9, Cas12a (Cpf1), Cas12b1 (C2c1), Cas13a (C2c2), and Cas12c (C2c3). Typically, microbial CRISPR-Cas systems are divided into class 1 and class 2 systems. Class 1 systems have multi-subunit effector complexes, whereas class 2 systems have a single protein effector. For example, Cas9 and Cas12a (Cpf1) are class 2 effectors. In addition to Cas9 and Cas12a (Cpf1), three distinct class 2 CRISPR-Cas systems (Cas12b1, Cas13a, and Cas12c) have been described by Shmakov et al., “Discovery and Functional Characterization of Diverse Class 2 CRISPR Cas Systems”, Mol. Cell, 2015 Nov 5;60(3):385-397. The entire contents of this are incorporated herein by reference.

システムの2つCas12b1およびCas12cのエフェクターは、Cas12aに関係するRuvC様エンドヌクレアーゼドメインを含有する。第3のシステムのCas13aは、2つの予測される(predicated)HEPN RNaseドメインを有するエフェクターを含有する。Cas12b1によるCRISPR RNAの生産とは違って、成熟CRISPR RNAの生産はtracrRNA非依存的である。Cas12b1はDNA切断についてはCRISPR RNAおよびtracrRNA両方に依存する。細菌Cas13aは、そのRNAによって活性化される一本鎖RNA分解活性とは別物のCRISPR RNA成熟のための固有のRNase活性を所有することが示されている。これらのRNase機能は、互いとは、およびCas12aのCRISPR RNAプロセシング挙動とは異なる。例えば、East-Seletsky,et al.,“Two distinct RNase activities of CRISPR-Cas13a enable guide-RNA processing and RNA detection”,Nature,2016 Oct 13;538(7624):270-273を見よ。これの内容全体は参照によってここに組み込まれる。Leptotrichia shahiiのCas13aのin vitroの生化学分析は、Cas13aが単一のCRISPR RNAによってガイドされ、相補的なプロトスペーサーを持つssRNA標的を切断するようにプログラムされ得るということを示している。2つの保存されたHEPNドメイン上の触媒残基が切断を媒介する。触媒残基の変異は触媒的に不活性なRNA結合タンパク質を生成する。例えば、Abudayyeh et al.,“C2c2 is a single-component programmable RNA-guided RNA-targeting CRISPR effector”,Science,2016 Aug 5;353(6299)を見よ。これの内容全体は参照によってここに組み込まれる。 Two of the system's effectors, Cas12b1 and Cas12c, contain RuvC-like endonuclease domains related to Cas12a. A third system, Cas13a, contains an effector with two predicated HEPN RNase domains. Unlike CRISPR RNA production by Cas12b1, mature CRISPR RNA production is tracrRNA-independent. Cas12b1 relies on both CRISPR RNA and tracrRNA for DNA cleavage. Bacterial Cas13a has been shown to possess an intrinsic RNase activity for CRISPR RNA maturation that is separate from the single-stranded RNA degradation activity activated by its RNA. These RNase functions are distinct from each other and from the CRISPR RNA processing behavior of Cas12a. See, e.g., East-Seletsky, et al., “Two distinct RNase activities of CRISPR-Cas13a enable guide-RNA processing and RNA detection”, Nature, 2016 Oct 13;538(7624):270-273. The entire contents of this are incorporated herein by reference. In vitro biochemical analysis of Leptotrichia shahii Cas13a shows that Cas13a can be guided by a single CRISPR RNA and programmed to cleave ssRNA targets with complementary protospacers. Two conserved catalytic residues on the HEPN domain mediate cleavage. Mutation of catalytic residues produces a catalytically inactive RNA binding protein. See, e.g., Abudayyeh et al., “C2c2 is a single-component programmable RNA-guided RNA-targeting CRISPR effector”, Science, 2016 Aug 5;353(6299). The entire contents of this are incorporated herein by reference.

Alicyclobaccillus acidoterrastris Cas12b1(AacC2c1)の結晶構造がキメラ単分子ガイドRNA(sgRNA)との複合体として報告されている。例えば、Liu et al.,“C2c1-sgRNA Complex Structure Reveals RNA-Guided DNA Cleavage Mechanism”,Mol.Cell,2017 Jan 19;65(2):310-322を見よ。これの内容全体は参照によってここに組み込まれる。結晶構造は三者複合体として標的DNAに結合したAlicyclobacillus acidoterrestris C2c1としてもまた報告されている。例えば、Yang et al.,“PAM-dependent Target DNA Recognition and Cleavage by C2C1 CRISPR-Cas endonuclease”,Cell,2016 Dec 15;167(7):1814-1828を見よ。これの内容全体は参照によってここに組み込まれる。AacC2c1の触媒的に有能な立体配座は、独立して単一のRuvC触媒ポケット内に位置取った標的および非標的DNA鎖両方によって、キャプチャされている。C2c1によって媒介される切断は、標的DNAの互い違いの7ヌクレオチド切断をもたらす。C2c1三者複合体と先に同定されたCas9およびCpf1カウンターパートとの間の構造比較は、CRISPR-Cas9システムによって用いられる機序の多様性を実証する。 The crystal structure of Alicyclobaccillus acidoterrastris Cas12b1 (AacC2c1) in complex with a chimeric single molecule guide RNA (sgRNA) has been reported. See, for example, Liu et al., “C2c1-sgRNA Complex Structure Reveals RNA-Guided DNA Cleavage Mechanism”, Mol. Cell, 2017 Jan 19;65(2):310-322. The entire contents of this are incorporated herein by reference. The crystal structure has also been reported as Alicyclobacillus acidoterrestris C2c1 bound to target DNA as a ternary complex. See, e.g., Yang et al., “PAM-dependent Target DNA Recognition and Cleavage by C2C1 CRISPR-Cas endonuclease”, Cell, 2016 Dec 15;167(7):1814-1828. The entire contents of this are incorporated herein by reference. The catalytically competent conformation of AacC2c1 is captured by both target and non-target DNA strands independently positioned within a single RuvC catalytic pocket. Cleavage mediated by C2c1 results in a staggered 7-nucleotide cleavage of the target DNA. Structural comparisons between the C2c1 tripartite complex and previously identified Cas9 and Cpf1 counterparts demonstrate the diversity of mechanisms used by the CRISPR-Cas9 system.

いくつかの態様では、napDNAbpはC2c1、C2c2、またはC2c3タンパク質であり得る。いくつかの態様では、napDNAbpはC2c1タンパク質である。いくつかの態様では、napDNAbpはCas13aタンパク質である。いくつかの態様では、napDNAbpはCas12cタンパク質である。いくつかの態様では、napDNAbpは、天然に存在するCas12b1(C2c1)、Cas13a(C2c2)、またはCas12c(C2c3)タンパク質と少なくとも85%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも99.5%同一であるアミノ酸配列を含む。いくつかの態様では、napDNAbpは天然に存在するCas12b1(C2c1)、Cas13a(C2c2)、またはCas12c(C2c3)タンパク質である。 In some embodiments, napDNAbp can be a C2c1, C2c2, or C2c3 protein. In some embodiments, napDNAbp is a C2c1 protein. In some embodiments, napDNAbp is a Cas13a protein. In some embodiments, napDNAbp is a Cas12c protein. In some embodiments, napDNAbp is at least 85%, at least 90%, at least 91%, at least 92%, at least 93%, naturally occurring Cas12b1 (C2c1), Cas13a (C2c2), or Cas12c (C2c3) protein. Includes amino acid sequences that are at least 94%, at least 95%, at least 96%, at least 97%, at least 98%, at least 99%, or at least 99.5% identical. In some embodiments, napDNAbp is a naturally occurring Cas12b1 (C2c1), Cas13a (C2c2), or Cas12c (C2c3) protein.

H.Cas9循環置換体
種々の態様において、本明細書に開示のプライム編集因子はCas9の循環置換体を含み得る。
H. Cas9 circular permutant
In various embodiments, the prime editing factors disclosed herein can include circular permutations of Cas9.

用語「循環置換Cas9」またはCas9の「循環置換体」または「CP-Cas9」は、循環置換体バリアントとして生起するかまたは操作されるように改変されているいずれかのCas9タンパク質またはそのバリアントを言う。これは、Cas9タンパク質(例えば、野生型Cas9タンパク質)のN末端およびC末端が局所的に再配置されているということを意味する。かかる循環置換Cas9タンパク質またはそれらのバリアントは、ガイドRNA(gRNA)と複合体化したときにDNAに結合する能力を保持する。Oakes et al.,“Protein Engineering of Cas9 for enhanced function,”Methods Enzymol,2014,546:491-511およびOakes et al.,“CRISPR-Cas9 Circular Permutants as Programmable Scaffolds for Genome Modification,”Cell,January 10,2019,176:254-267を見よ。夫々は参照によって本願に組み込まれる。もたらされる循環置換タンパク質がガイドRNA(gRNA)と複合体化したときにDNAに結合する能力を保持する限り、本開示は、いずれかの先に公知のCP-Cas9を企図するか、または新たなCP-Cas9を用いる。 The term "circularly permuted Cas9" or "circularly permuted variant" of Cas9 or "CP-Cas9" refers to any Cas9 protein or variant thereof that has been modified to occur or be engineered as a circularly permuted variant. . This means that the N-terminus and C-terminus of the Cas9 protein (eg, wild-type Cas9 protein) are locally rearranged. Such circularly permuted Cas9 proteins or variants thereof retain the ability to bind DNA when complexed with guide RNA (gRNA). Oakes et al., “Protein Engineering of Cas9 for enhanced function,” Methods Enzymol, 2014, 546: 491-511 and Oakes et al., “CRISPR-Cas9 Circular Permutants as Programmable Scaffolds for Genome Modification,” Cell, January 10, See 2019,176:254-267. Each is incorporated herein by reference. This disclosure contemplates either the previously known CP-Cas9 or the new Uses CP-Cas9.

いずれかのバリアント、オーソログ、もしくは天然に存在するCas9を包含する本明細書に記載のCas9タンパク質のいずれか、またはその等価物が、循環置換体バリアントとして再構成され得る。 Any variant, ortholog, or any of the Cas9 proteins described herein, including naturally occurring Cas9, or equivalents thereof, can be reconstituted as a circular permutant variant.

種々の態様において、Cas9の循環置換体は次の構造を有し得る:N末端-[元々のC末端]-[任意のリンカー]-[元々のN末端]-C末端。 In various embodiments, a circular permutation of Cas9 can have the following structure: N-terminus-[original C-terminus]-[optional linker]-[original N-terminus]-C-terminus.

例として、本開示は標準的なS.pyogenes Cas9の次の循環置換体を企図する(UniProtKB-Q99ZW2(CAS9_STRP1)の1368アミノ酸(付番は配列番号18のアミノ酸位置に基づく)):
N末端-[1268~1368]-[任意のリンカー]-[1~1267]-C末端;
N末端-[1168~1368]-[任意のリンカー]-[1~1167]-C末端;
N末端-[1068~1368]-[任意のリンカー]-[1~1067]-C末端;
N末端-[968~1368]-[任意のリンカー]-[1~967]-C末端;
N末端-[868~1368]-[任意のリンカー]-[1~867]-C末端;
N末端-[768~1368]-[任意のリンカー]-[1~767]-C末端;
N末端-[668~1368]-[任意のリンカー]-[1~667]-C末端;
N末端-[568~1368]-[任意のリンカー]-[1~567]-C末端;
N末端-[468~1368]-[任意のリンカー]-[1~467]-C末端;
N末端-[368~1368]-[任意のリンカー]-[1~367]-C末端;
N末端-[268~1368]-[任意のリンカー]-[1~267]-C末端;
N末端-[168~1368]-[任意のリンカー]-[1~167]-C末端;
N末端-[68~1368]-[任意のリンカー]-[1~67]-C末端;もしくは
N末端-[10~1368]-[任意のリンカー]-[1~9]-C末端、または
他のCas9タンパク質(他のCas9オーソログ、バリアントなどを包含する)の対応する循環置換体。
As an example, this disclosure contemplates the following circular permutations of standard S. pyogenes Cas9 (1368 amino acids of UniProtKB-Q99ZW2 (CAS9_STRP1) (numbering based on amino acid position of SEQ ID NO: 18)):
N-terminus-[1268-1368]-[optional linker]-[1-1267]-C-terminus;
N-terminus-[1168-1368]-[optional linker]-[1-1167]-C-terminus;
N-terminus-[1068-1368]-[optional linker]-[1-1067]-C-terminus;
N-terminus-[968-1368]-[optional linker]-[1-967]-C-terminus;
N-terminus-[868-1368]-[optional linker]-[1-867]-C-terminus;
N-terminus-[768-1368]-[optional linker]-[1-767]-C-terminus;
N-terminus-[668-1368]-[optional linker]-[1-667]-C-terminus;
N-terminus-[568-1368]-[optional linker]-[1-567]-C-terminus;
N-terminus-[468-1368]-[optional linker]-[1-467]-C-terminus;
N-terminus-[368-1368]-[optional linker]-[1-367]-C-terminus;
N-terminus-[268-1368]-[optional linker]-[1-267]-C-terminus;
N-terminus-[168-1368]-[optional linker]-[1-167]-C-terminus;
N-terminus-[68-1368]-[optional linker]-[1-67]-C-terminus; or
N-terminus-[10-1368]-[optional linker]-[1-9]-C-terminus, or the corresponding circular permutations of other Cas9 proteins (including other Cas9 orthologs, variants, etc.).

具体的な態様では、循環置換体(circular permuant)Cas9は次の構造を有する(S.pyogenes Cas9(UniProtKB-Q99ZW2(CAS9_STRP1)の1368アミノ酸(付番は配列番号18のアミノ酸位置に基づく)に基づく:
N末端-[102~1368]-[任意のリンカー]-[1~101]-C末端;
N末端-[1028~1368]-[任意のリンカー]-[1~1027]-C末端;
N末端-[1041~1368]-[任意のリンカー]-[1~1043]-C末端;
N末端-[1249~1368]-[任意のリンカー]-[1~1248]-C末端;もしくは
N末端-[1300~1368]-[任意のリンカー]-[1~1299]-C末端、または
他のCas9タンパク質(他のCas9オーソログ、バリアントなどを包含する)の対応する循環置換体。
In a specific embodiment, the circular permuant Cas9 has the following structure (based on the 1368 amino acids (numbering is based on the amino acid position of SEQ ID NO: 18) of S. pyogenes Cas9 (UniProtKB-Q99ZW2 (CAS9_STRP1)) :
N-terminus-[102-1368]-[optional linker]-[1-101]-C-terminus;
N-terminus-[1028-1368]-[optional linker]-[1-1027]-C-terminus;
N-terminus-[1041-1368]-[optional linker]-[1-1043]-C-terminus;
N-terminus-[1249-1368]-[optional linker]-[1-1248]-C-terminus; or
N-terminus-[1300-1368]-[optional linker]-[1-1299]-C-terminus, or the corresponding circular permutations of other Cas9 proteins (including other Cas9 orthologs, variants, etc.).

なお他の態様において、循環置換体(circular permuant)Cas9は次の構造を有する(S.pyogenes Cas9(UniProtKB-Q99ZW2(CAS9_STRP1)の1368アミノ酸(付番は配列番号18のアミノ酸位置に基づく)に基づく:
N末端-[103~1368]-[任意のリンカー]-[1~102]-C末端;
N末端-[1029~1368]-[任意のリンカー]-[1~1028]-C末端;
N末端-[1042~1368]-[任意のリンカー]-[1~1041]-C末端;
N末端-[1250~1368]-[任意のリンカー]-[1~1249]-C末端;もしくは
N末端-[1301~1368]-[任意のリンカー]-[1~1300]-C末端、または
他のCas9タンパク質(他のCas9オーソログ、バリアントなどを包含する)の対応する循環置換体。
In yet other embodiments, the circular permuant Cas9 has the following structure (based on the 1368 amino acids (numbering is based on the amino acid position of SEQ ID NO: 18) of S. pyogenes Cas9 (UniProtKB-Q99ZW2 (CAS9_STRP1)) :
N-terminus-[103-1368]-[optional linker]-[1-102]-C-terminus;
N-terminus-[1029-1368]-[optional linker]-[1-1028]-C-terminus;
N-terminus-[1042-1368]-[optional linker]-[1-1041]-C-terminus;
N-terminus-[1250-1368]-[optional linker]-[1-1249]-C-terminus; or
N-terminus-[1301-1368]-[optional linker]-[1-1300]-C-terminus, or the corresponding circular permutations of other Cas9 proteins (including other Cas9 orthologs, variants, etc.).

いくつかの態様では、循環置換体は、直接的にまたはアミノ酸リンカーなどのリンカーを用いることによってどちらかで、Cas9のC末端フラグメントをCas9のN末端フラグメントに連結することによって形成され得る。いくつかの態様では、C末端フラグメントは、Cas9のアミノ酸(例えば、アミノ酸約1300-1368)のC末端95%以上、あるいはCas9(例えば、配列番号77-86のいずれか1つ)のC末端90%、85%、80%、75%、70%、65%、60%、55%、50%、45%、40%、35%、30%、25%、20%、15%、10%、もしくは5%、またはより多くに対応し得る。N末端部分は、Cas9のアミノ酸(例えば、アミノ酸約1-1300)のN末端95%以上、あるいはCas9の(例えば配列番号18の)N末端90%、85%、80%、75%、70%、65%、60%、55%、50%、45%、40%、35%、30%、25%、20%、15%、10%、もしくは5%、またはより多くに対応し得る。 In some embodiments, circular permutations can be formed by linking a C-terminal fragment of Cas9 to an N-terminal fragment of Cas9, either directly or by using a linker, such as an amino acid linker. In some embodiments, the C-terminal fragment comprises the C-terminal 95% or more of the amino acids (e.g., about amino acids 1300-1368) of Cas9, or the C-terminal 90% of the amino acids of Cas9 (e.g., any one of SEQ ID NO: 77-86). %, 85%, 80%, 75%, 70%, 65%, 60%, 55%, 50%, 45%, 40%, 35%, 30%, 25%, 20%, 15%, 10%, or 5%, or more. The N-terminal portion is at least 95% of the N-terminus of Cas9 (e.g., about amino acids 1-1300), or 90%, 85%, 80%, 75%, 70% of the N-terminus of Cas9 (e.g., SEQ ID NO: 18). , 65%, 60%, 55%, 50%, 45%, 40%, 35%, 30%, 25%, 20%, 15%, 10%, or 5%, or more.

いくつかの態様では、循環置換体は、直接的にまたはアミノ酸リンカーなどのリンカーを用いることによってどちらかで、Cas9のC末端フラグメントをCas9のN末端フラグメントに連結することによって形成され得る。いくつかの態様では、N末端へと再配置されるC末端フラグメントは、Cas9のアミノ酸のC末端30%以下(例えば、配列番号18のアミノ酸1012~1368)を包含するかまたはそれらに対応する。いくつかの態様では、N末端へと再配置されるC末端フラグメントは、Cas9のアミノ酸(例えば、配列番号18のCas9)のC末端30%、29%、28%、27%、26%、25%、24%、23%、22%、21%、20%、19%、18%、17%、16%、15%、14%、13%、12%、11%、10%、9%、8%、7%、6%、5%、4%、3%、2%、または1%を包含するかまたはそれらに対応する。いくつかの態様では、N末端へと再配置されるC末端フラグメントは、Cas9(例えば、配列番号18のCas9)のC末端410残基以下を包含するかまたはそれらに対応する。いくつかの態様では、N末端へと再配置されるC末端部分は、Cas9(例えば、配列番号18のCas9)のC末端410、400、390、380、370、360、350、340、330、320、310、300、290、280、270、260、250、240、230、220、210、200、190、180、170、160、150、140、130、120、110、100、90、80、70、60、50、40、30、20、または10残基を包含するかまたはそれらに対応する。いくつかの態様では、N末端へと再配置されるC末端フラグメントは、Cas9(例えば、配列番号18のCas9)のC末端357、341、328、120、または69残基を包含するかまたはそれらに対応する。 In some embodiments, circular permutations can be formed by linking a C-terminal fragment of Cas9 to an N-terminal fragment of Cas9, either directly or by using a linker, such as an amino acid linker. In some embodiments, the C-terminal fragment that is relocated to the N-terminus includes or corresponds to the C-terminal 30% or less of the amino acids of Cas9 (eg, amino acids 1012-1368 of SEQ ID NO: 18). In some embodiments, the C-terminal fragment that is relocated to the N-terminus is the C-terminal 30%, 29%, 28%, 27%, 26%, 25 of the amino acids of Cas9 (e.g., Cas9 of SEQ ID NO: 18). %, 24%, 23%, 22%, 21%, 20%, 19%, 18%, 17%, 16%, 15%, 14%, 13%, 12%, 11%, 10%, 9%, Includes or corresponds to 8%, 7%, 6%, 5%, 4%, 3%, 2%, or 1%. In some embodiments, the C-terminal fragment that is relocated to the N-terminus includes or corresponds to the C-terminal 410 residues or less of Cas9 (eg, Cas9 of SEQ ID NO: 18). In some embodiments, the C-terminal portion that is relocated to the N-terminus is the C-terminus 410, 400, 390, 380, 370, 360, 350, 340, 330, 320, 310, 300, 290, 280, 270, 260, 250, 240, 230, 220, 210, 200, 190, 180, 170, 160, 150, 140, 130, 120, 110, 100, 90, 80, Includes or corresponds to 70, 60, 50, 40, 30, 20, or 10 residues. In some embodiments, the C-terminal fragment that is relocated to the N-terminus includes or comprises the C-terminal 357, 341, 328, 120, or 69 residues of Cas9 (e.g., Cas9 of SEQ ID NO: 18). corresponds to

他の態様において、循環置換体Cas9バリアントは、次の方法に基づくCas9一次構造のトポロジー的再配置として定められ得、これは配列番号18のS.pyogenes Cas9に基づく:(a)Cas9一次構造の内部のアミノ酸残基に対応する循環置換体(CP)部位を選択し、これが元々のタンパク質を2つの半分:N末端領域およびC末端領域へと切り分けること;(b)元々のN末端領域に先立つ(preceed)ように元々のC末端領域(CP部位アミノ酸を含む)を動かすことによって、Cas9タンパク質配列を改変し(例えば、遺伝子工学技術による)、それによって、今やCP部位アミノ酸残基で始まるCas9タンパク質の新たなN末端を形成すること。CP部位は、例えばヘリカルIIドメイン、RuvCIIIドメイン、またはCTDドメインを包含するCas9タンパク質のいずれかのドメイン上に位置付られ得る。例えば、CP部位は、(配列番号18のS.pyogenes Cas9に対して相対的に)元々のアミノ酸残基181、199、230、270、310、1010、1016、1023、1029、1041、1247、1249、または1282に位置付けられ得る。それゆえに、ひとたびN末端に位置替えされると、元々のアミノ酸181、199、230、270、310、1010、1016、1023、1029、1041、1247、1249、または1282は新たなN末端アミノ酸になるであろう。これらのCP-Cas9タンパク質の命名体系は、夫々Cas9-CP181、Cas9-CP199、Cas9-CP230、Cas9-CP270、Cas9-CP310、Cas9-CP1010、Cas9-CP1016、Cas9-CP1023、Cas9-CP1029、Cas9-CP1041、Cas9-CP1247、Cas9-CP1249、およびCas9-CP1282と言われ得る。この記載は配列番号18からのCPバリアントを作ることに限定されることを意味されず、いずれかのCas9配列において、これらの位置に対応するCP部位においてまたは全く(entireley)他のCP部位においてどちらかでCPバリアントを作るために実装され得る。この記載は決して特定のCP部位を限定することを意味されない。実質的にいずれかのCP部位がCP-Cas9バリアントを形成するために用いられ得る。 In other embodiments, circular permutant Cas9 variants may be defined as topological rearrangements of the Cas9 primary structure based on the following method, which is based on S. pyogenes Cas9 of SEQ ID NO: 18: (a) of the Cas9 primary structure. (b) selecting circular permutation (CP) sites corresponding to internal amino acid residues that cut the original protein into two halves: an N-terminal region and a C-terminal region; (b) preceding the original N-terminal region; Modifying the Cas9 protein sequence (e.g., by genetic engineering techniques) by moving the original C-terminal region (containing the CP-site amino acid) such that the Cas9 protein now begins with the CP-site amino acid residue to form a new N-terminus. The CP site can be located on any domain of the Cas9 protein, including, for example, the helical II domain, the RuvCIII domain, or the CTD domain. For example, the CP site includes the original amino acid residues 181, 199, 230, 270, 310, 1010, 1016, 1023, 1029, 1041, 1247, 1249 (relative to S. pyogenes Cas9 of SEQ ID NO: 18). , or may be located at 1282. Therefore, once relocated to the N-terminus, the original amino acid 181, 199, 230, 270, 310, 1010, 1016, 1023, 1029, 1041, 1247, 1249, or 1282 becomes the new N-terminal amino acid. Will. The naming system for these CP-Cas9 proteins is Cas9-CP 181 , Cas9-CP 199 , Cas9-CP 230 , Cas9-CP 270 , Cas9-CP 310 , Cas9-CP 1010 , Cas9-CP 1016 , Cas9-CP, respectively. 1023 , Cas9- CP1029 , Cas9- CP1041 , Cas9- CP1247 , Cas9- CP1249 , and Cas9- CP1282 . This description is not meant to be limited to making CP variants from SEQ ID NO: 18, but in any Cas9 sequence, either at the CP sites corresponding to these positions or at entirely other CP sites. or can be implemented to create CP variants. This description is in no way meant to limit specific CP sites. Virtually any CP site can be used to form a CP-Cas9 variant.

配列番号18のCas9に基づく例示のCP-Cas9アミノ酸配列が下で提供される。これにおいては、リンカー配列は下線付きによって指示され、任意のメチオニン(M)残基は太字で指示されている。本開示はリンカー配列を包含しないかまたは異なるリンカー配列を包含するCP-Cas9配列を提供するということは了解されるはずである。CP-Cas9配列が配列番号18以外のCas9配列に基づき得るということは了解されるはずであり、本願において提供されるいずれかの例は限定することを意味されない。例示のCP-Cas9配列は次のとおりである:

Figure 2020191234000054
Figure 2020191234000055
Figure 2020191234000056
Figure 2020191234000057
An exemplary CP-Cas9 amino acid sequence based on Cas9 of SEQ ID NO: 18 is provided below. In this, the linker sequence is indicated by underlining and any methionine (M) residues are indicated in bold. It should be understood that the present disclosure provides CP-Cas9 sequences that do not include a linker sequence or include different linker sequences. It should be understood that the CP-Cas9 sequence may be based on Cas9 sequences other than SEQ ID NO: 18, and any examples provided herein are not meant to be limiting. An example CP-Cas9 sequence is:
Figure 2020191234000054
Figure 2020191234000055
Figure 2020191234000056
Figure 2020191234000057

本明細書に記載のプライム編集構築物に有用であり得るCas9循環置換体。Cas9のN末端へと再配置され得る配列番号18のCas9に基づくCas9の例示のC末端フラグメントが、下で提供される。Cas9のかかるC末端フラグメントは例示的であり、限定することを意味されないということは了解されるはずである。これらの例示のCP-Cas9フラグメントは次の配列を有する:

Figure 2020191234000058
Cas9 circular permutants that may be useful in the prime editing constructs described herein. An exemplary C-terminal fragment of Cas9 based on Cas9 of SEQ ID NO: 18 that can be relocated to the N-terminus of Cas9 is provided below. It should be understood that such C-terminal fragments of Cas9 are exemplary and not meant to be limiting. These exemplary CP-Cas9 fragments have the following sequences:
Figure 2020191234000058

I.改変されたPAM特異性を有するCas9バリアント
本開示のプライム編集因子は、改変されたPAM特異性を有するCas9バリアントをもまた含み得る。本開示のいくつかの側面は、標準的なPAM(5'-NGG-3'。ここで、NはA、C、G、またはTである)をその3'端に含まない標的配列に対して活性を発揮するCas9タンパク質を提供する。いくつかの態様では、Cas9タンパク質は、5'-NGG-3'PAM配列をその3'端に含む標的配列に対して活性を発揮する。いくつかの態様では、Cas9タンパク質は、5'-NNG-3'PAM配列をその3'端に含む標的配列に対して活性を発揮する。いくつかの態様では、Cas9タンパク質は、5'-NNA-3'PAM配列をその3'端に含む標的配列に対して活性を発揮する。いくつかの態様では、Cas9タンパク質は、5'-NNC-3'PAM配列をその3'端に含む標的配列に対して活性を発揮する。いくつかの態様では、Cas9タンパク質は、5'-NNT-3'PAM配列をその3'端に含む標的配列に対して活性を発揮する。いくつかの態様では、Cas9タンパク質は、5'-NGT-3'PAM配列をその3'端に含む標的配列に対して活性を発揮する。いくつかの態様では、Cas9タンパク質は、5'-NGA-3'PAM配列をその3'端に含む標的配列に対して活性を発揮する。いくつかの態様では、Cas9タンパク質は、5'-NGC-3'PAM配列をその3'端に含む標的配列に対して活性を発揮する。いくつかの態様では、Cas9タンパク質は、5'-NAA-3'PAM配列をその3'端に含む標的配列に対して活性を発揮する。いくつかの態様では、Cas9タンパク質は、5'-NAC-3'PAM配列をその3'端に含む標的配列に対して活性を発揮する。いくつかの態様では、Cas9タンパク質は、5'-NAT-3'PAM配列をその3'端に含む標的配列に対して活性を発揮する。なお他の態様において、Cas9タンパク質は、5'-NAG-3'PAM配列をその3'端に含む標的配列に対して活性を発揮する。
I. Cas9 variants with altered PAM specificity
Prime editing agents of the present disclosure can also include Cas9 variants with altered PAM specificity. Some aspects of the present disclosure apply to target sequences that do not contain a standard PAM (5'-NGG-3', where N is A, C, G, or T) at its 3' end. The present invention provides a Cas9 protein that exhibits activity. In some embodiments, the Cas9 protein exerts activity against a target sequence that includes a 5'-NGG-3'PAM sequence at its 3' end. In some embodiments, the Cas9 protein exerts activity against a target sequence that includes a 5'-NNG-3'PAM sequence at its 3' end. In some embodiments, the Cas9 protein exerts activity against a target sequence that includes a 5'-NNA-3'PAM sequence at its 3' end. In some embodiments, the Cas9 protein exerts activity against a target sequence that includes a 5'-NNC-3'PAM sequence at its 3' end. In some embodiments, the Cas9 protein exerts activity against a target sequence that includes a 5'-NNT-3'PAM sequence at its 3' end. In some embodiments, the Cas9 protein exerts activity against a target sequence that includes a 5'-NGT-3'PAM sequence at its 3' end. In some embodiments, the Cas9 protein exerts activity against a target sequence that includes a 5'-NGA-3'PAM sequence at its 3' end. In some embodiments, the Cas9 protein exerts activity against a target sequence that includes a 5'-NGC-3'PAM sequence at its 3' end. In some embodiments, the Cas9 protein exerts activity against a target sequence that includes a 5'-NAA-3'PAM sequence at its 3' end. In some embodiments, the Cas9 protein exerts activity against a target sequence that includes a 5'-NAC-3'PAM sequence at its 3' end. In some embodiments, the Cas9 protein exerts activity against a target sequence that includes a 5'-NAT-3'PAM sequence at its 3' end. In yet other embodiments, the Cas9 protein exerts activity against a target sequence that includes a 5'-NAG-3'PAM sequence at its 3' end.

第1のアミノ酸残基(例えばA)から第2のアミノ酸残基(例えばT)への本明細書に記載のアミノ酸変異のいずれか(例えば、A262T)は、第1のアミノ酸残基から(例えば、保存された)第2のアミノ酸残基に類似であるアミノ酸残基への変異をもまた包含し得るということは了解されるはずである。例えば、疎水性側鎖を有するアミノ酸(例えば、アラニン、バリン、イソロイシン、ロイシン、メチオニン、フェニルアラニン、チロシン、またはトリプトファン)の変異は、異なる疎水性側鎖を有する第2のアミノ酸(例えば、アラニン、バリン、イソロイシン、ロイシン、メチオニン、フェニルアラニン、チロシン、またはトリプトファン)への変異であり得る。例えば、アラニンからトレオニンへの変異(例えばA262T変異)は、アラニンからサイズおよび化学的特性がトレオニンに類似であるアミノ酸、例えばセリンへの変異でもまたあり得る。別の例として、正荷電側鎖を有するアミノ酸(例えば、アルギニン、ヒスチジン、またはリジン)の変異は、異なる正荷電側鎖を有する第2のアミノ酸(例えば、アルギニン、ヒスチジン、またはリジン)への変異であり得る。別の例として、極性側鎖を有するアミノ酸(例えば、セリン、トレオニン、アスパラギン、またはグルタミン)の変異は、異なる極性側鎖を有する第2のアミノ酸(例えば、セリン、トレオニン、アスパラギン、またはグルタミン)への変異であり得る。追加の類似のアミノ酸ペアは次を包含するが、これらに限定されない:フェニルアラニンおよびチロシン;アスパラギンおよびグルタミン;メチオニンおよびシステイン;アスパラギン酸およびグルタミン酸;ならびにアルギニンおよびリジン。当業者は、かかる保存的アミノ酸置換が蓋然的にはタンパク質構造に対して軽度の効果を有し、機能を毀損することなしに良く忍容されることが蓋然的であるということを認識するであろう。いくつかの態様では、1つのアミノ酸からトレオニンへの本願において提供されるアミノ酸変異のいずれかのアミノは、セリンへのアミノ酸変異であり得る。いくつかの態様では、1つのアミノ酸からアルギニンへの本願において提供されるアミノ酸変異のいずれかのアミノは、リジンへのアミノ酸変異であり得る。いくつかの態様では、1つのアミノ酸からイソロイシンへの本願において提供されるアミノ酸変異のいずれかのアミノはアラニン、バリン、メチオニン、またはロイシンへのアミノ酸変異であり得る。いくつかの態様では、1つのアミノ酸からリジンへの本願において提供されるアミノ酸変異のいずれかのアミノはアルギニンへのアミノ酸変異であり得る。いくつかの態様では、1つのアミノ酸からアスパラギン酸への本願において提供されるアミノ酸変異のいずれかのアミノはグルタミン酸またはアスパラギンへのアミノ酸変異であり得る。いくつかの態様では、1つのアミノ酸からバリンへの本願において提供されるアミノ酸変異のいずれかのアミノはアラニン、イソロイシン、メチオニン、またはロイシンへのアミノ酸変異であり得る。いくつかの態様では、1つのアミノ酸からグリシンへの本願において提供されるアミノ酸変異のいずれかのアミノはアラニンへのアミノ酸変異であり得る。しかしながら、追加の保存されたアミノ酸残基は当業者によって認識されるであろうということは了解されるはずであり、他の保存されたアミノ酸残基へのアミノ酸変異のいずれかもまた本開示の範囲内である。 It should be understood that any of the amino acid mutations described herein from a first amino acid residue (e.g., A) to a second amino acid residue (e.g., T) (e.g., A262T) can also include a mutation from the first amino acid residue to an amino acid residue that is similar to the (e.g., conserved) second amino acid residue. For example, a mutation of an amino acid having a hydrophobic side chain (e.g., alanine, valine, isoleucine, leucine, methionine, phenylalanine, tyrosine, or tryptophan) can be a mutation to a second amino acid having a different hydrophobic side chain (e.g., alanine, valine, isoleucine, leucine, methionine, phenylalanine, tyrosine, or tryptophan). For example, a mutation from alanine to threonine (e.g., A262T mutation) can also be a mutation from alanine to an amino acid similar in size and chemical properties to threonine, such as serine. As another example, a mutation of an amino acid with a positively charged side chain (e.g., arginine, histidine, or lysine) can be a mutation to a second amino acid with a different positively charged side chain (e.g., arginine, histidine, or lysine). As another example, a mutation of an amino acid with a polar side chain (e.g., serine, threonine, asparagine, or glutamine) can be a mutation to a second amino acid with a different polar side chain (e.g., serine, threonine, asparagine, or glutamine). Additional similar amino acid pairs include, but are not limited to: phenylalanine and tyrosine; asparagine and glutamine; methionine and cysteine; aspartic acid and glutamic acid; and arginine and lysine. Those skilled in the art will recognize that such conservative amino acid substitutions will likely have minor effects on protein structure and will likely be well tolerated without impairing function. In some embodiments, any amino acid of the amino acid mutations provided herein from one amino acid to threonine can be an amino acid mutation to serine. In some embodiments, any amino acid of the amino acid mutations provided herein from one amino acid to arginine can be an amino acid mutation to lysine. In some embodiments, any amino acid of the amino acid mutations provided herein from one amino acid to isoleucine can be an amino acid mutation to alanine, valine, methionine, or leucine. In some embodiments, any amino acid of the amino acid mutations provided herein from one amino acid to lysine can be an amino acid mutation to arginine. In some embodiments, any amino acid of the amino acid mutations provided herein from one amino acid to aspartic acid can be an amino acid mutation to glutamic acid or asparagine. In some embodiments, any amino acid of the amino acid mutations provided herein from one amino acid to valine can be an amino acid mutation to alanine, isoleucine, methionine, or leucine. In some embodiments, any amino acid of the amino acid mutations provided herein from one amino acid to glycine can be an amino acid mutation to alanine. However, it should be understood that additional conserved amino acid residues would be recognized by one of skill in the art, and any amino acid mutations to other conserved amino acid residues are also within the scope of this disclosure.

いくつかの態様では、Cas9タンパク質は、5'-NAA-3'PAM配列をその3'端に含む標的配列に対して活性を発揮する変異の組み合わせを含む。いくつかの態様では、変異の組み合わせは、表1の列記されているクローンのいずれか1つに存在する。いくつかの態様では、変異の組み合わせは、表1の列記されているクローンの保存的変異である。いくつかの態様では、Cas9タンパク質は、表1に列記されるCas9クローンのいずれか1つの変異の組み合わせを含む。 In some embodiments, the Cas9 protein comprises a combination of mutations that exhibit activity against a target sequence that includes a 5'-NAA-3'PAM sequence at its 3' end. In some embodiments, the combination of mutations is present in any one of the clones listed in Table 1. In some embodiments, the combination of mutations are conservative mutations of the listed clones of Table 1. In some embodiments, the Cas9 protein comprises a combination of mutations in any one of the Cas9 clones listed in Table 1.

表1:NAA PAMクローン

Figure 2020191234000059
Figure 2020191234000060
Table 1: NAA PAM clones
Figure 2020191234000059
Figure 2020191234000060

いくつかの態様では、Cas9タンパク質は、表1のバリアントのいずれか1つによって提供されるCas9タンパク質のアミノ酸配列と少なくとも80%同一であるアミノ酸配列を含む。いくつかの態様では、Cas9タンパク質は、表1のバリアントのいずれか1つによって提供されるCas9タンパク質のアミノ酸配列と少なくとも85%、少なくとも90%、少なくとも92%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも99.5%同一であるアミノ酸配列を含む。 In some embodiments, the Cas9 protein comprises an amino acid sequence that is at least 80% identical to the amino acid sequence of the Cas9 protein provided by any one of the variants in Table 1. In some embodiments, the Cas9 protein has at least 85%, at least 90%, at least 92%, at least 95%, at least 96%, at least the amino acid sequence of the Cas9 protein provided by any one of the variants in Table 1. Comprising amino acid sequences that are 97%, at least 98%, at least 99%, or at least 99.5% identical.

いくつかの態様では、Cas9タンパク質は、配列番号18によって提供されるStreptococcus pyogenes Cas9と比較して、標準的なPAM(5'-NGG-3')をその3'端に含まない標的配列に対して増大した活性を発揮する。いくつかの態様では、Cas9タンパク質は、標準的なPAM配列(5'-NGG-3')に直接的に隣接しない3'端を有する標的配列に対して、同じ標的配列に対する配列番号18によって提供されるStreptococcus pyogenes Cas9の活性と比較して、少なくとも5倍増大した活性を発揮する。いくつかの態様では、Cas9タンパク質は、標準的なPAM配列(5'-NGG-3')に直接的に隣接しない標的配列に対して、同じ標的配列に対する配列番号18によって提供されるStreptococcus pyogenesの活性と比較して、少なくとも10倍、少なくとも50倍、少なくとも100倍、少なくとも500倍、少なくとも1,000倍、少なくとも5,000倍、少なくとも10,000倍、少なくとも50,000倍、少なくとも100,000倍、少なくとも500,000倍、または少なくとも1,000,000倍増大した活性を発揮する。いくつかの態様では、標的配列の3'端はAAA、GAA、CAA、またはTAA配列に直接的に隣接する。いくつかの態様では、Cas9タンパク質は、5'-NAC-3'PAM配列をその3'端に含む標的配列に対して活性を発揮する変異の組み合わせを含む。いくつかの態様では、変異の組み合わせは、表2の列記されているクローンのいずれか1つに存在する。いくつかの態様では、変異の組み合わせは、表2の列記されているクローンの保存的変異である。いくつかの態様では、Cas9タンパク質は、表2の列記されているCas9クローンのいずれか1つの変異の組み合わせを含む。 In some embodiments, the Cas9 protein exhibits increased activity against a target sequence that does not include a canonical PAM (5'-NGG-3') at its 3' end, as compared to the Streptococcus pyogenes Cas9 provided by SEQ ID NO: 18. In some embodiments, the Cas9 protein exhibits at least a 5-fold increased activity against a target sequence having a 3' end that is not immediately adjacent to a canonical PAM sequence (5'-NGG-3'), as compared to the activity of the Streptococcus pyogenes Cas9 provided by SEQ ID NO: 18 against the same target sequence. In some embodiments, the Cas9 protein exerts at least 10-fold, at least 50 - fold, at least 100-fold, at least 500-fold, at least 1,000-fold, at least 5,000-fold, at least 10,000-fold, at least 50,000-fold, at least 100,000-fold, at least 500,000-fold, or at least 1,000,000-fold increased activity against a target sequence that is not immediately adjacent to a standard PAM sequence (5'-NGG-3') compared to the activity of Streptococcus pyogenes provided by SEQ ID NO: 18 against the same target sequence. In some embodiments, the 3' end of the target sequence is immediately adjacent to an AAA, GAA, CAA, or TAA sequence. In some embodiments, the Cas9 protein comprises a combination of mutations that exerts activity against a target sequence that includes a 5'-NAC-3' PAM sequence at its 3' end. In some embodiments, the combination of mutations is present in any one of the clones listed in Table 2. In some embodiments, the combination of mutations is a conservative mutation of the clones listed in Table 2. In some embodiments, the Cas9 protein comprises a combination of mutations of any one of the Cas9 clones listed in Table 2.

表2:NAC PAMクローン

Figure 2020191234000061
Figure 2020191234000062
Table 2: NAC PAM clones
Figure 2020191234000061
Figure 2020191234000062

いくつかの態様では、Cas9タンパク質は、表2のバリアントのいずれか1つによって提供されるCas9タンパク質のアミノ酸配列と少なくとも80%同一であるアミノ酸配列を含む。いくつかの態様では、Cas9タンパク質は、表2のバリアントのいずれか1つによって提供されるCas9タンパク質のアミノ酸配列と少なくとも85%、少なくとも90%、少なくとも92%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも99.5%同一であるアミノ酸配列を含む。 In some embodiments, the Cas9 protein comprises an amino acid sequence that is at least 80% identical to the amino acid sequence of the Cas9 protein provided by any one of the variants in Table 2. In some embodiments, the Cas9 protein has at least 85%, at least 90%, at least 92%, at least 95%, at least 96%, at least the amino acid sequence of the Cas9 protein provided by any one of the variants in Table 2. Comprising amino acid sequences that are 97%, at least 98%, at least 99%, or at least 99.5% identical.

いくつかの態様では、Cas9タンパク質は、配列番号18によって提供されるStreptococcus pyogenes Cas9と比較して、標準的なPAM(5'-NGG-3')をその3'端に含まない標的配列に対して増大した活性を発揮する。いくつかの態様では、Cas9タンパク質は、標準的なPAM配列(5'-NGG-3')に直接的に隣接しない3'端を有する標的配列に対して、同じ標的配列に対する配列番号18によって提供されるStreptococcus pyogenes Cas9の活性と比較して少なくとも5倍増大した活性を発揮する。いくつかの態様では、Cas9タンパク質は、標準的なPAM配列(5'-NGG-3')に直接的に隣接しない標的配列に対して、同じ標的配列に対する配列番号18によって提供されるStreptococcus pyogenesの活性と比較して少なくとも10倍、少なくとも50倍、少なくとも100倍、少なくとも500倍、少なくとも1,000倍、少なくとも5,000倍、少なくとも10,000倍、少なくとも50,000倍、少なくとも100,000倍、少なくとも500,000倍、または少なくとも1,000,000倍増大した活性を発揮する。いくつかの態様では、標的配列の3'端はAAC、GAC、CAC、またはTAC配列に直接的に隣接する。 In some embodiments, the Cas9 protein is directed against a target sequence that does not contain a canonical PAM (5'-NGG-3') at its 3' end compared to the Streptococcus pyogenes Cas9 provided by SEQ ID NO: 18. exerts increased activity. In some embodiments, the Cas9 protein is provided by SEQ ID NO: 18 for a target sequence with a 3' end that is not directly adjacent to the canonical PAM sequence (5'-NGG-3') for the same target sequence. Streptococcus pyogenes Cas9 exhibits at least a 5-fold increased activity compared to that of Streptococcus pyogenes Cas9. In some embodiments, the Cas9 protein is directed against a target sequence that is not directly adjacent to the canonical PAM sequence (5'-NGG-3'), while the Cas9 protein is directed against a target sequence of Streptococcus pyogenes provided by SEQ ID NO: 18 against the same target sequence. at least 10 times, at least 50 times, at least 100 times, at least 500 times, at least 1,000 times, at least 5,000 times, at least 10,000 times, at least 50,000 times, at least 100,000 times, at least 500,000 times, or at least 1,000,000 times greater than the activity Demonstrates a certain level of activity. In some embodiments, the 3' end of the target sequence is directly adjacent to an AAC, GAC, CAC, or TAC sequence.

いくつかの態様では、Cas9タンパク質は、5'-NAT-3'PAM配列をその3'端に含む標的配列に対して活性を発揮する変異の組み合わせを含む。いくつかの態様では、変異の組み合わせは表3の列記されているクローンのいずれか1つに存在する。いくつかの態様では、変異の組み合わせは、表3の列記されているクローンの保存的変異である。いくつかの態様では、Cas9タンパク質は、表3に列記されるCas9クローンのいずれか1つの変異の組み合わせを含む。 In some embodiments, the Cas9 protein comprises a combination of mutations that exhibit activity against a target sequence that includes a 5'-NAT-3'PAM sequence at its 3' end. In some embodiments, the combination of mutations is present in any one of the clones listed in Table 3. In some embodiments, the combination of mutations are conservative mutations of the listed clones of Table 3. In some embodiments, the Cas9 protein comprises a combination of mutations in any one of the Cas9 clones listed in Table 3.

表3:NAT PAMクローン

Figure 2020191234000063
Figure 2020191234000064
Table 3: NAT PAM clone
Figure 2020191234000063
Figure 2020191234000064

本開示のプライム編集因子に関して用いられ得る種々のnapDNAbpの上の記載は、決して限定することを意味されない。プライム編集因子は、公知であるか、または指向性進化的なもしくは別様の変異プロセスによって作られ得るかもしくは進化させられ得る標準的なSpCas9、またはいずれかのオーソログCas9タンパク質、またはいずれかのバリアントCas9タンパク質を含み得、Cas9のいずれかの天然に存在するバリアント、変異体、または別様に操作されたバージョンを包含する。種々の態様において、Cas9またはCas9バリアント(varant)はニッカーゼ活性を有し、すなわち標的DNA配列の1つの(of)鎖のみを切断する。他の態様において、Cas9またはCas9バリアントは不活性なヌクレアーゼを有し、すなわち「不活性型」Cas9タンパク質である。用いられ得る他のバリアントCas9タンパク質は、標準的なSpCas9よりも小さい分子量を有するか(例えば、より容易な送達のため)または改変もしくは再配置された一次アミノ酸構造(例えば、循環置換体フォーマット)を有するものである。本明細書に記載のプライム編集因子は、収斂進化の結果であるCas12a/Cpf1およびCas12bタンパク質を包含するCas9等価物をもまた含み得る。本願において用いられるnapDNAbp(例えば、SpCas9、Cas9バリアント、またはCas9等価物)は、それらのPAM特異性(specifity)を変改/増強する種々の改変をもまた含有し得る。最後に、本願は、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも99.9%配列同一性を参照Cas9配列、例えば参照SpCas9標準的な配列または参照Cas9等価物(例えば、Cas12a/Cpf1)に対して有するいずれかのCas9、Cas9バリアント、またはCas9等価物を企図する。 The above description of various napDNAbps that may be used with respect to the prime editing factors of the present disclosure is not meant to be limiting in any way. The prime editing factor is the standard SpCas9, or any orthologous Cas9 protein, or any variant that is known or may be created or evolved by directed evolutionary or otherwise mutational processes. A Cas9 protein may be included, including any naturally occurring variants, mutants, or otherwise engineered versions of Cas9. In various embodiments, Cas9 or a Cas9 variant has nickase activity, ie, cleaves only one (of) strands of the target DNA sequence. In other embodiments, the Cas9 or Cas9 variant has an inactive nuclease, ie, is an "inactive" Cas9 protein. Other variant Cas9 proteins that may be used have lower molecular weights than standard SpCas9 (e.g., for easier delivery) or modified or rearranged primary amino acid structures (e.g., circular permutant format). It is something that you have. The prime editing factors described herein can also include Cas9 equivalents, including Cas12a/Cpf1 and Cas12b proteins that are the result of convergent evolution. The napDNAbp (eg, SpCas9, Cas9 variant, or Cas9 equivalent) used in this application may also contain various modifications that alter/enhance their PAM specificity. Finally, the present application provides at least 70%, at least 75%, at least 80%, at least 85%, at least 90%, at least 91%, at least 92%, at least 93%, at least 94%, at least 95%, at least 96%, Any having at least 97%, at least 98%, at least 99%, or at least 99.9% sequence identity to a reference Cas9 sequence, such as a reference SpCas9 standard sequence or a reference Cas9 equivalent (e.g., Cas12a/Cpf1) Cas9, Cas9 variants, or Cas9 equivalents are contemplated.

具体的な態様では、拡張されたPAM能力を有するCas9バリアントはSpCas9(H840A)VRQR(配列番号87)であり、これは次のアミノ酸配列を有する(配列番号51のSpCas9(H840A)に対して相対的なV、R、Q、R置換が太字の下線で示されている(show)。加えて、SpCas9(H840)のメチオニン残基はSpCas9(H840A)VRQRでは除去された):

Figure 2020191234000065
Figure 2020191234000066
In a specific embodiment, the Cas9 variant with expanded PAM capability is SpCas9(H840A)VRQR (SEQ ID NO: 87), which has the following amino acid sequence (relative to SpCas9(H840A) of SEQ ID NO: 51). V, R, Q, R substitutions are shown in bold and underlined (show). Additionally, the methionine residue of SpCas9(H840) was removed in SpCas9(H840A)VRQR):
Figure 2020191234000065
Figure 2020191234000066

別の具体的な態様では、拡張されたPAM能力を有するCas9バリアントはSpCas9(H840A) VRERであり、これは次のアミノ酸配列を有する(配列番号51のSpCas9(H840A)に対して相対的なV、R、E、R置換が太字の下線で示されている。加えて、SpCas9(H840)のメチオニン残基はSpCas9(H840A)VRERでは除去された):

Figure 2020191234000067
Figure 2020191234000068
In another specific embodiment, the Cas9 variant with expanded PAM capability is SpCas9(H840A) VRER, which has the following amino acid sequence (V relative to SpCas9(H840A) of SEQ ID NO:51). , R, E, R substitutions are shown in bold and underlined. Additionally, the methionine residue of SpCas9(H840) was removed in SpCas9(H840A) VRER):
Figure 2020191234000067
Figure 2020191234000068

いくつかの態様では、非標準的なPAM配列について機能するnapDNAbpはアルゴノートタンパク質である。かかる核酸プログラム型DNA結合タンパク質の1つの例は、Natronobacterium gregoryiからのアルゴノートタンパク質(NgAgo)である。NgAgoはssDNAによってガイドされるエンドヌクレアーゼである。NgAgoは~24ヌクレオチドの5'リン酸化されたssDNA(gDNA)に結合してそれをその標的部位へとガイドし、gDNA部位においてDNA二本鎖切断を作るであろう。Cas9とは対照的に、NgAgo-gDNAシステムはプロトスペーサー隣接モチーフ(PAM)を要求しない。ヌクレアーゼ不活性なNgAgo(dNgAgo)を用いることは、標的化され得る塩基を多大に拡張し得る。NgAgoの特徴付けおよび使用はGao et al.,Nat Biotechnol.,2016 Jul;34(7):768-73.PubMed PMID: 27136078;Swarts et al.,Nature.507(7491)(2014):258-61;およびSwarts et al.,Nucleic Acids Res.43(10)(2015):5120-9に記載されている。これらの夫々は参照によって本願に組み込まれる。 In some embodiments, the napDNAbp that functions with non-canonical PAM sequences is an Argonaute protein. One example of such a nucleic acid programmed DNA binding protein is Argonaute protein (NgAgo) from Natronobacterium gregoryi. NgAgo is an ssDNA-guided endonuclease. NgAgo will bind to ~24 nucleotides of 5'-phosphorylated ssDNA (gDNA) and guide it to its target site, creating a DNA double-strand break at the gDNA site. In contrast to Cas9, the NgAgo-gDNA system does not require a protospacer adjacent motif (PAM). Using nuclease-inactive NgAgo (dNgAgo) can greatly expand the bases that can be targeted. Characterization and use of NgAgo can be found in Gao et al., Nat Biotechnol.,2016 Jul;34(7):768-73. PubMed PMID: 27136078; Swarts et al., Nature.507(7491)(2014):258- 61; and Swarts et al., Nucleic Acids Res. 43(10)(2015):5120-9. Each of these is incorporated herein by reference.

いくつかの態様では、napDNAbpはアルゴノートタンパク質の原核生物ホモログである。アルゴノートタンパク質の原核生物ホモログは知られており、例えばMakarova K.,et al.,“Prokaryotic homologs of Argonaute proteins are predicted to function as key components of a novel system of defense against mobile genetic elements”,Biol Direct.2009 Aug 25;4:29.doi:10.1186/1745-6150-4-29に記載されている。これの内容全体は参照によってここに組み込まれる。いくつかの態様では、napDNAbpはMarinitoga piezophila Argunaute(MpAgo)タンパク質である。CRISPR関連Marinitoga piezophila Argunaute(MpAgo)タンパク質は、5'-リン酸化されたガイドを用いて一本鎖標的配列を切断する。5'ガイドは全ての公知のアルゴノートによって用いられる。MpAgo-RNA複合体の結晶構造は、5'リン酸相互作用をブロックする残基を含むガイド鎖結合部位を示す。このデータは、5'ヒドロキシル化されたガイドに対する非標準的な特異性を有するアルゴノートサブクラスの進化を示唆する。例えば、Kaya et al.,“A bacterial Argonaute with noncanonical guide RNA specificity”,Proc Natl Acad Sci U S A.2016 Apr 12;113(15):4057-62を見よ。これの内容全体は参照によってここに組み込まれる)。他のargonauteタンパク質が用いられ得、本開示の範囲内であるということは了解されるはずである。 In some embodiments, napDNAbp is a prokaryotic homologue of Argonaute protein. Prokaryotic homologs of Argonaute proteins are known, for example Makarova K., et al., “Prokaryotic homologs of Argonaute proteins are predicted to function as key components of a novel system of defense against mobile genetic elements”, Biol Direct. 2009 Aug 25;4:29.doi:10.1186/1745-6150-4-29. The entire contents of this are incorporated herein by reference. In some embodiments, napDNAbp is Marinitoga piezophila Argunaute (MpAgo) protein. The CRISPR-associated Marinitoga piezophila Argunaute (MpAgo) protein uses a 5'-phosphorylated guide to cleave single-stranded target sequences. The 5' guide is used by all known Argonauts. The crystal structure of the MpAgo-RNA complex shows a guide strand binding site that contains residues that block 5' phosphate interactions. This data suggests the evolution of an argonaute subclass with non-canonical specificity for 5'-hydroxylated guides. See, eg, Kaya et al., “A bacterial Argonaute with noncanonical guide RNA specificity”, Proc Natl Acad Sci U S A. 2016 Apr 12;113(15):4057-62. the entire contents of which are incorporated herein by reference). It should be understood that other argonaute proteins can be used and are within the scope of this disclosure.

本開示のいくつかの側面は、異なるPAM特異性を有するCas9ドメインを提供する。典型的には、S.pyogenesからのCas9(spCas9)などのCas9タンパク質は、具体的な核酸領域に結合するためには標準的なNGG PAM配列を要求する。これはゲノム上の所望の塩基を編集する能力を限定し得る。いくつかの態様では、本願において提供される塩基編集融合タンパク質は、精密な位置付けに置かれることを必要とし得る。例えば、ここでは、標的塩基が4塩基領域(例えば、「編集窓」)上に置かれ、これがPAMのおよそ15塩基上流にある。Komor,A.C.,et al.,“Programmable editing of a target base in genomic DNA without double-stranded DNA cleavage”Nature 533,420-424(2016)を見よ。これの内容全体は参照によってここに組み込まれる。従って、いくつかの態様では、本願において提供される融合タンパク質のいずれかは、標準的な(例えば、NGG)PAM配列を含有しないヌクレオチド配列に結合することができるCas9ドメインを含有し得る。非標準的なPAM配列に結合するCas9ドメインは当該技術分野において記載されており、当業者には明らかであろう。例えば、非標準的なPAM配列に結合するCas9ドメインは、Kleinstiver,B.P.,et al.,“Engineered CRISPR-Cas9 nucleases with altered PAM specificities”Nature 523,481-485(2015);およびKleinstiver,B.P.,et al.,“Broadening the targeting range of Staphylococcus aureus CRISPR-Cas9 by modifying PAM recognition” Nature Biotechnology 33,1293-1298(2015)に記載されている;夫々の内容全体は参照によってここに組み込まれる。 Some aspects of this disclosure provide Cas9 domains with different PAM specificities. Typically, Cas9 proteins, such as Cas9 from S. pyogenes (spCas9), require the standard NGG PAM sequence to bind to a specific nucleic acid region. This can limit the ability to edit desired bases on the genome. In some embodiments, the base editing fusion proteins provided herein may require precise positioning. For example, here the target base is placed on a four base region (eg, an "editing window"), which is approximately 15 bases upstream of the PAM. See Komor, A.C., et al., “Programmable editing of a target base in genomic DNA without double-stranded DNA cleavage” Nature 533, 420-424 (2016). The entire contents of this are incorporated herein by reference. Thus, in some embodiments, any of the fusion proteins provided herein may contain a Cas9 domain that can bind to a nucleotide sequence that does not contain a canonical (eg, NGG) PAM sequence. Cas9 domains that bind non-canonical PAM sequences have been described in the art and will be apparent to those skilled in the art. For example, Cas9 domains that bind non-canonical PAM sequences have been described by Kleinstiver, B.P., et al., “Engineered CRISPR-Cas9 nucleases with altered PAM specificities” Nature 523, 481-485 (2015); and Kleinstiver, B.P., et al. , “Broadening the targeting range of Staphylococcus aureus CRISPR-Cas9 by modifying PAM recognition” Nature Biotechnology 33, 1293-1298 (2015); each of which is incorporated herein by reference in its entirety.

例えば、変改されたPAM特異性を有するnapDNAbpドメイン、例えば、次のアミノ酸配列を有する野生型Francisella novicida Cpf1(D917、E1006、およびD1255)(配列番号74)と少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、または少なくとも99%配列同一性を有するドメイン:

Figure 2020191234000069
Figure 2020191234000070
For example, napDNAbp domains with altered PAM specificity, e.g., domains having at least 80%, at least 85%, at least 90%, at least 95%, or at least 99% sequence identity to wild-type Francisella novicida Cpf1 (D917, E1006, and D1255) (SEQ ID NO: 74) having the following amino acid sequence:
Figure 2020191234000069
Figure 2020191234000070

変改されたPAM特異性を有する追加のnapDNAbpドメイン、例えば、次のアミノ酸配列を有する野生型Geobacillus thermodenitrificans Cas9(配列番号75)と少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、または少なくとも99%配列同一性を有するドメイン:

Figure 2020191234000071
an additional napDNAbp domain with modified PAM specificity, such as at least 80%, at least 85%, at least 90%, at least 95%, or Domains with at least 99% sequence identity:
Figure 2020191234000071

いくつかの態様では、核酸プログラム型DNA結合タンパク質(napDNAbp)は、標準的な(NGG)PAM配列を要求しない核酸プログラム型DNA結合タンパク質である。いくつかの態様では、napDNAbpはargonauteタンパク質である。かかる核酸プログラム型DNA結合タンパク質の1つの例はNatronobacterium gregoryiからのアルゴノートタンパク質(NgAgo)である。NgAgoはssDNAによってガイドされるエンドヌクレアーゼである。NgAgoは~24ヌクレオチドの5'リン酸化されたssDNA(gDNA)に結合してそれをその標的部位へとガイドし、gDNA部位においてDNA二本鎖切断を作るであろう。Cas9とは対照的に、NgAgo-gDNAシステムはプロトスペーサー隣接モチーフ(PAM)を要求しない。ヌクレアーゼ不活性なNgAgo(dNgAgo)を用いることは、標的化され得る塩基を多大に拡張し得る。NgAgoの特徴付けおよび使用はGao et al.,Nat Biotechnol.,34(7):768-73(2016),PubMed PMID:27136078;Swarts et al.,Nature,507(7491):258-61(2014);およびSwarts et al.,Nucleic Acids Res.43(10)(2015):5120-9に記載されている。これらの夫々は参照によって本願に組み込まれる。Natronobacterium gregoryi Argonauteの配列は配列番号76によって提供される。 In some embodiments, the nucleic acid programmed DNA binding protein (napDNAbp) is a nucleic acid programmed DNA binding protein that does not require a canonical (NGG) PAM sequence. In some embodiments, napDNAbp is an argonaute protein. One example of such a nucleic acid programmed DNA binding protein is Argonaute protein (NgAgo) from Natronobacterium gregoryi. NgAgo is an ssDNA-guided endonuclease. NgAgo will bind to ~24 nucleotides of 5'-phosphorylated ssDNA (gDNA) and guide it to its target site, creating a DNA double-strand break at the gDNA site. In contrast to Cas9, the NgAgo-gDNA system does not require a protospacer adjacent motif (PAM). Using nuclease-inactive NgAgo (dNgAgo) can greatly expand the bases that can be targeted. Characterization and use of NgAgo are described by Gao et al., Nat Biotechnol., 34(7):768-73(2016), PubMed PMID:27136078; Swarts et al., Nature, 507(7491):258-61(2014) ); and Swarts et al., Nucleic Acids Res. 43(10)(2015):5120-9. Each of these is incorporated herein by reference. The sequence of Natronobacterium gregoryi Argonaute is provided by SEQ ID NO: 76.

開示される融合タンパク質は、次のアミノ酸配列を有する野生型Natronobacterium gregoryi Argonaute(配列番号76)と少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、または少なくとも99%配列同一性を有するnapDNAbpドメインを含み得る:

Figure 2020191234000072
The disclosed fusion proteins have a napDNAbp having at least 80%, at least 85%, at least 90%, at least 95%, or at least 99% sequence identity with wild type Natronobacterium gregoryi Argonaute (SEQ ID NO: 76) having the following amino acid sequence: May contain domains:
Figure 2020191234000072

加えて、いずれかの利用可能な方法が、バリアントまたは変異体Cas9タンパク質を得るかまたは構築するために利用され得る。本願において用いられる用語「変異」は、別の残基によるある配列、例えば核酸もしくはアミノ酸配列上の残基の置換、またはある配列上の1つ以上の残基の欠失もしくは挿入を言う。変異は、典型的には、元々の残基、次に配列上の残基の位置および新たに置換された残基のアイデンティティーを同定することによって本明細書に記載の。本願において提供されるアミノ酸置換(変異)を作るための種々の方法が当該技術分野において周知であり、例えばGreen and Sambrook,Molecular Cloning:A Laboratory Manual(4th ed.,Cold Spring Harbor Laboratory Press,Cold Spring Harbor,N.Y.(2012))によって提供される。変異は、種々のカテゴリー、例えば1塩基多型、微小重複領域、インデル、および逆位を包含し得、決して限定することを意味されない。変異は、タンパク質活性を縮減または廃止する変異の正常の結果である「機能喪失」変異を包含し得る。ほとんどの機能喪失変異は劣性である。なぜなら、ヘテロ接合体では、第2の染色体コピーが完全に機能的なタンパク質をコードする遺伝子の未変異のバージョンを持ち、この存在が変異の効果を補償するからである。変異は、「機能獲得」変異をもまた包摂する。これは、正常な条件下ではさもなければ存在しない異常な活性をタンパク質または細胞に付与するものである。多くの機能獲得変異はコード領域よりもむしろ制御配列にあり、よって、いくつもの帰結を有し得る。例えば、変異は、1つ以上の遺伝子が間違った組織において発現されることに至り得、これらの組織は、それらが正常では欠く機能を獲得する。それらの性質ゆえに、機能獲得変異は通常は優性である。 Additionally, any available method can be utilized to obtain or construct variant or mutant Cas9 proteins. The term "mutation" as used herein refers to the substitution of a residue on a sequence, such as a nucleic acid or amino acid sequence, by another residue, or the deletion or insertion of one or more residues on a sequence. Mutations are typically described herein by identifying the original residue, then the position of the residue on the sequence and the identity of the newly substituted residue. Various methods for making the amino acid substitutions (mutations) provided herein are well known in the art and are described, for example, in Green and Sambrook, Molecular Cloning: A Laboratory Manual (4th ed., Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y. (2012)). Mutations may encompass various categories, such as single nucleotide polymorphisms, microduplicated regions, indels, and inversions, and are not meant to be limiting in any way. Mutations can include "loss-of-function" mutations that are the normal result of mutations that reduce or abolish protein activity. Most loss-of-function mutations are recessive. This is because in a heterozygote, the second chromosome copy carries an unmutated version of the gene encoding a fully functional protein, and this presence compensates for the effects of the mutation. Mutations also encompass "gain-of-function" mutations. This confers on a protein or cell an abnormal activity that is not otherwise present under normal conditions. Many gain-of-function mutations are in regulatory sequences rather than coding regions and therefore can have a number of consequences. For example, mutations can lead to one or more genes being expressed in the wrong tissues, and these tissues acquire functions that they normally lack. Because of their nature, gain-of-function mutations are usually dominant.

変異は部位特異的変異導入を用いて参照Cas9タンパク質上に導入され得る。当該技術分野で公知の部位特異的変異導入のより古い方法は、一本鎖DNA鋳型の単離を許すM13バクテリオファージベクターなどのベクター上への変異させられるべき配列のサブクローニングに依拠する。これらの方法では、変異誘発プライマー(すなわち、変異させられるべき部位にアニールすることができるが、変異させられるべき部位に1つ以上のミスマッチのヌクレオチドを持つプライマー)を一本鎖鋳型にアニーリングさせ、それから、変異誘発プライマーの3'端からスタートして鋳型の相補体を重合する。それから、もたらされた二重鎖はホスト細菌に形質転換され、プラークが所望の変異についてスクリーニングされる。より最近では、部位特異的変異導入はPCR方法論を使用している。これらは一本鎖鋳型を要求しないという利点を有する。加えて、サブクローニングを要求しない方法が開発されている。PCRに基づく部位特異的変異導入が行われるときには、いくつかのイシューが考慮されなければならない。第1に、これらの方法では、ポリメラーゼによって導入される望まれない変異の拡張を防止するために、PCRサイクル数を縮減することが望ましい。第2に、反応中に残存する変異していない親の分子の数を縮減するために、セレクションが使用されなければならない。第3に、単一のPCRプライマーセットの使用を許すために、伸長された長さのPCR法が好ましい。そして第4に、いくつかの熱安定性ポリメラーゼの非鋳型依存性末端伸長活性ゆえに、多くの場合には、PCRによって生成された変異体産物の平滑末端ライゲーションに先行して、端を磨くステップを手続きに組み込むことが必要である。 Mutations can be introduced onto a reference Cas9 protein using site-directed mutagenesis. Older methods of site-directed mutagenesis known in the art rely on subcloning the sequence to be mutated onto a vector such as the M13 bacteriophage vector, which allows isolation of a single-stranded DNA template. In these methods, a mutagenic primer (i.e., a primer capable of annealing to the site to be mutated, but with one or more mismatched nucleotides at the site to be mutated) is annealed to a single-stranded template; The complement of the template is then polymerized starting from the 3' end of the mutagenic primer. The resulting duplex is then transformed into host bacteria and plaques are screened for the desired mutations. More recently, site-directed mutagenesis has used PCR methodology. These have the advantage of not requiring single-stranded templates. Additionally, methods have been developed that do not require subcloning. Several issues must be considered when PCR-based site-directed mutagenesis is performed. First, in these methods it is desirable to reduce the number of PCR cycles to prevent the expansion of unwanted mutations introduced by the polymerase. Second, selection must be used to reduce the number of unmutated parent molecules remaining in the reaction. Third, extended length PCR methods are preferred to allow the use of a single PCR primer set. And fourth, because of the nontemplate-dependent end extension activity of some thermostable polymerases, blunt-end ligation of PCR-generated mutant products is often preceded by an end-polishing step. It is necessary to incorporate this into the procedure.

変異は、指向性進化プロセス、例えばファージによって補助される連続的進化(PACE)またはファージによって補助される非連続的進化(PANCE)によってもまた導入され得る。本願において用いられる用語「ファージによって補助される連続的進化(PACE)」は、ファージをウイルスベクターとして使用する連続的進化を言う。PACEテクノロジーの一般概念は、例えば、2010年3月11日にWO2010/028347として公開された2009年9月8日出願の国際PCT出願PCT/US2009/056194;2012年6月28日にWO2012/088381として公開された2011年12月22日出願の国際PCT出願PCT/US2011/066747;2015年5月5日登録のU.S.出願U.S.特許No.9,023,594、2015年9月11日にWO2015/134121として公開された2015年1月20日出願の国際PCT出願PCT/US2015/012022、および2016年10月20日にWO2016/168631として公開された2016年4月15日出願の国際PCT出願PCT/US2016/027795に記載されている。これらの夫々の内容全体は参照によって本願に組み込まれる。バリアントCas9はファージによって補助される非連続的進化(PANCE)によってもまた得られ得る。本願において用いられるこれは、ファージをウイルスベクターとして使用する非連続的進化を言う。PANCEは急速なインビボの指向性進化のための単純化された技術であり、新しいE.coliホスト細胞による進化させられるべき目当ての遺伝子を含有する進化する「セレクションファージ」(SP)の連続フラスコ植え継ぎを用い、それによって、ホストE.coli内の遺伝子が一定に保たれることを許しながら、SPに含有される遺伝子は連続的に進化する。連続フラスコ植え継ぎは微生物の実験室進化のための広くアクセス可能なアプローチとして長く用をなしており、より最近では、バクテリオファージ進化のための類縁のアプローチが開発されている。PANCEシステムはPACEシステムよりも低いストリンジェンシーを特色とする。 Mutations can also be introduced by directed evolution processes, such as phage-assisted continuous evolution (PACE) or phage-assisted discontinuous evolution (PANCE). The term "phage-assisted continuous evolution (PACE)" as used herein refers to continuous evolution using phages as viral vectors. The general concept of PACE technology is e.g. international PCT application PCT/US2009/056194 filed September 8, 2009, published as WO2010/028347 on March 11, 2010; WO2012/088381 filed June 28, 2012. International PCT Application PCT/US2011/066747, filed December 22, 2011; U.S. Application U.S. Patent No. 9,023,594, filed May 5, 2015; published September 11, 2015 as WO2015/134121; International PCT Application PCT/US2015/012022, filed on January 20, 2015, and International PCT Application PCT/US2016/027795, filed on April 15, 2016, published as WO2016/168631 on October 20, 2016. Are listed. The entire contents of each of these are incorporated herein by reference. Variant Cas9 can also be obtained by phage-assisted discontinuous evolution (PANCE). As used herein, this refers to discontinuous evolution using phages as viral vectors. PANCE is a simplified technique for rapid in vivo directed evolution, in which serial flask planting of evolving "selection phages" (SPs) containing the genes of interest to be evolved by new E. coli host cells Using splicing, the genes contained in the SP evolve continuously while allowing the genes in the host E. coli to remain constant. Serial flask transfer has long served as a widely accessible approach for the laboratory evolution of microorganisms, and more recently, a related approach for bacteriophage evolution has been developed. The PANCE system features lower stringency than the PACE system.

Cas9またはCas9等価物に関する上に記されている参照のいずれかは、すでにそのように申し立てられていない場合には、それらの全体が参照によってここに組み込まれる。 Any of the references noted above regarding Cas9 or Cas9 equivalents are herein incorporated by reference in their entirety, unless already so claimed.

J.分裂されたPE送達のための割られたnapDNAbpドメイン
種々の態様において、本明細書に記載のプライム編集因子は2つ以上のフラグメントとして細胞に送達され得、これらは、細胞内において、再構成されたプライム編集因子へとアセンブリされるようになる(受動的アセンブリによるか、または分裂インテイン配列を用いることなどの能動的アセンブリによる)。いくつかのケースでは、自己アセンブリは受動的であり得、これによって、2つ以上のプライム編集因子フラグメントは細胞内で共有結合的にまたは非共有結合的に会合してプライム編集因子を再構成する。他のケースでは、自己アセンブリはフラグメントの夫々に組み入れされた二量体化ドメインによって触媒され得る。二量体化ドメインの例は本明細書に記載の。なお他のケースでは、自己アセンブリは、プライム編集因子フラグメントの夫々に組み入れされた分裂インテイン配列によって触媒され得る。
J. Split napDNAbp domain for split PE delivery
In various embodiments, the prime editing factors described herein can be delivered to cells as two or more fragments that become assembled into reconstituted prime editing factors within the cell ( either by passive assembly or by active assembly, such as by using a split intein sequence). In some cases, self-assembly may be passive, whereby two or more prime editing factor fragments associate covalently or non-covalently within the cell to reconstitute the prime editing factor. . In other cases, self-assembly may be catalyzed by dimerization domains incorporated into each of the fragments. Examples of dimerization domains are described herein. In still other cases, self-assembly may be catalyzed by a split intein sequence incorporated into each of the prime editing factor fragments.

分裂されたPE送達は、異なる送達アプローチの種々のサイズ制約に対処するために有利であり得る。例えば、送達アプローチは、ウイルスに基づく送達方法、メッセンジャーRNAに基づく送達方法、またはRNPに基づく送達(リボヌクレオタンパク質に基づく送達)を包含し得る。そして、送達のこれらの方法の夫々は、プライム編集因子をより小さいピースへと割ることによって、より効率的および/または有効であり得る。ひとたび細胞内においては、より小さいピースは機能的なプライム編集因子へとアセンブリし得る。分裂の手段に依存して、割られたプライム編集因子フラグメントは非共有結合的様式または共有結合的様式で再アセンブリされてプライム編集因子を再形成し得る。1つの態様では、プライム編集因子は1つ以上の分裂部位において2つ以上のフラグメントへと分裂され得る。フラグメントは(分裂される以外は)未改変であり得る。ひとたびフラグメントが細胞に送達されると(例えば、リボヌクレオタンパク質複合体の直接的送達によるか、または核酸送達、例えばmRNA送達もしくはウイルスベクターに基づく送達による)、フラグメントは共有結合的にまたは非共有結合的に再会合してプライム編集因子を再構成し得る。別の態様では、プライム編集因子は1つ以上の分裂部位において2つ以上のフラグメントへと分裂され得る。フラグメントの夫々は二量体化ドメインを含むように改変され得、これによって、形成された各フラグメントは二量体化ドメインにカップリングされる。ひとたび細胞内に送達または発現されると、異なるフラグメントの二量体化ドメイン同士は会合し、互いに結合し、異なるプライム編集因子フラグメントを一緒に持って来て、機能的なプライム編集因子を再形成する。さらに別の態様では、プライム編集因子フラグメントは分裂インテインを含むように改変され得る。ひとたび細胞内に送達または発現されると、異なるフラグメントの分裂インテインドメイン同士は会合し、互いに結合し、それからトランススプライシングを経過する。これが、フラグメントの夫々からの分裂インテインドメインの切除と、フラグメント間のペプチド結合の付随的形成とをもたらし、それによってプライム編集因子を復元する。 Split PE delivery may be advantageous to address various size constraints of different delivery approaches. For example, delivery approaches can include viral-based delivery methods, messenger RNA-based delivery methods, or RNP-based delivery (ribonucleoprotein-based delivery). And each of these methods of delivery can be made more efficient and/or effective by dividing the prime editing factor into smaller pieces. Once inside the cell, the smaller pieces can assemble into a functional prime editor. Depending on the means of disruption, the split prime editing factor fragments can be reassembled in a non-covalent or covalent manner to reform the prime editing factor. In one embodiment, the prime editing element can be split into two or more fragments at one or more cleavage sites. A fragment can be unmodified (other than split). Once the fragments are delivered to the cell (e.g., by direct delivery of ribonucleoprotein complexes or by nucleic acid delivery, e.g. mRNA delivery or viral vector-based delivery), the fragments can be covalently or non-covalently linked. can reassemble to reconstitute prime editing factors. In another embodiment, the prime editing element can be split into two or more fragments at one or more split sites. Each of the fragments can be modified to include a dimerization domain, whereby each fragment formed is coupled to a dimerization domain. Once delivered or expressed into a cell, the dimerization domains of the different fragments associate and bind to each other, bringing the different prime editing factor fragments together to re-form a functional prime editing factor. do. In yet another embodiment, the prime editing factor fragment can be modified to include a splitting intein. Once delivered or expressed into a cell, the divided intein domains of different fragments associate and bind to each other and then undergo trans-splicing. This results in the excision of the split intein domain from each of the fragments and the concomitant formation of peptide bonds between the fragments, thereby restoring the prime editing factor.

1つの態様では、プライム編集因子は分裂インテインアプローチを用いて送達され得る。 In one embodiment, prime editing factors can be delivered using a split intein approach.

分裂部位の位置付けは、プライム編集因子上の残基のいずれか1つ以上のペアの間に、ならびにnapDNAbpドメイン、ポリメラーゼドメイン(例えば、RTドメイン)、napDNAbpドメインおよびポリメラーゼドメインを連結するリンカードメイン内を包含するその中のいずれかのドメイン上に、位置取り得る。 The location of the splitting site is between any one or more pairs of residues on the prime editing factor, as well as within the linker domain that connects the napDNAbp domain, the polymerase domain (e.g., RT domain), the napDNAbp domain, and the polymerase domain. It can be located on any domain therein.

図66に図示される1つの態様では、プライム編集因子(PE)はnapDNAbp上の分裂部位において割られる。 In one embodiment, illustrated in Figure 66, the prime editing element (PE) is cleaved at the division site on napDNAbp.

ある態様において、napDNAbpは次のとおり配列番号18の標準的なSpCas9ポリペプチドである:

Figure 2020191234000073
In certain embodiments, napDNAbp is a standard SpCas9 polypeptide of SEQ ID NO: 18 as follows:
Figure 2020191234000073

ある態様において、SpCas9は、配列番号18の標準的なSpCas9の残基1および2、もしくは2および3、もしくは3および4、もしくは4および5、もしくは5および6、もしくは6および7、もしくは7および8、もしくは8および9、もしくは9および10の間に位置付けられた分裂部位において、または残基1~10、10~20、20~30、30~40、40~50、50~60、60~70、70~80、80~90、90~100、100~200、200~300、300~400、400~500、500~600、600~700、700~800、800~900、1000~1100、1100~1200、1200~1300、もしくは1300~1368の間のどこかに位置付けられた残基のいずれかの2つのペアの間において、2つのフラグメントへと分裂される。 In certain embodiments, the SpCas9 comprises residues 1 and 2, or 2 and 3, or 3 and 4, or 4 and 5, or 5 and 6, or 6 and 7, or 7 and 8, or at the cleavage site located between 8 and 9, or 9 and 10, or at residues 1 to 10, 10 to 20, 20 to 30, 30 to 40, 40 to 50, 50 to 60, 60 to 70, 70-80, 80-90, 90-100, 100-200, 200-300, 300-400, 400-500, 500-600, 600-700, 700-800, 800-900, 1000-1100, Between any two pairs of residues located anywhere between 1100-1200, 1200-1300, or 1300-1368, it is split into two fragments.

ある態様において、napDNAbpは、配列番号18の標準的なSpCas9の位置1~10、10~20、20~30、30~40、40~50、50~60、60~70、70~80、80~90、90~100、100~200、200~300、300~400、400~500、500~600、600~700、700~800、800~900、1000~1100、1100~1200、1200~1300、または1300~1368の間のどこかに位置付けられた残基のいずれか2つのペアに対応する残基のペアに位置付けられる分裂部位において、2つのフラグメントへと分裂される。 In certain embodiments, napDNAbp is at positions 1-10, 10-20, 20-30, 30-40, 40-50, 50-60, 60-70, 70-80, 80 of the canonical SpCas9 of SEQ ID NO: 18. ~90, 90~100, 100~200, 200~300, 300~400, 400~500, 500~600, 600~700, 700~800, 800~900, 1000~1100, 1100~1200, 1200~1300 , or into two fragments at a cleavage site located at a pair of residues corresponding to any two pairs of residues located anywhere between 1300 and 1368.

ある態様において、SpCas9は、配列番号18の標準的なSpCas9の残基1および2、もしくは2および3、もしくは3および4、もしくは4および5、もしくは5および6、もしくは6および7、もしくは7および8、もしくは8および9、もしくは9および10の間に位置付けられた分裂部位において、または残基1~10、10~20、20~30、30~40、40~50、50~60、60~70、70~80、80~90、90~100、100~200、200~300、300~400、400~500、500~600、600~700、700~800、800~900、1000~1100、1100~1200、1200~1300、もしくは1300~1368の間のどこかに位置付けられた残基のいずれか2つのペアの間において、2つのフラグメントへと分裂される。ある態様において、分裂部位は、1つ以上のポリペプチド結合部位(すなわち、「分裂部位または分裂インテイン分裂部位」)に位置付けられ、分裂インテインに融合され、それから、別個にコードされる融合タンパク質として細胞に送達される。ひとたび分裂インテイン融合タンパク質同士(すなわち、タンパク質の半分同士)が細胞内で発現されると、タンパク質はトランススプライシングを経過して、連結された分裂インテイン配列の付随的除去によって完全なまたは丸ごとのPEを形成する。 In certain embodiments, the SpCas9 comprises residues 1 and 2, or 2 and 3, or 3 and 4, or 4 and 5, or 5 and 6, or 6 and 7, or 7 and 8, or at the cleavage site located between 8 and 9, or 9 and 10, or at residues 1 to 10, 10 to 20, 20 to 30, 30 to 40, 40 to 50, 50 to 60, 60 to 70, 70-80, 80-90, 90-100, 100-200, 200-300, 300-400, 400-500, 500-600, 600-700, 700-800, 800-900, 1000-1100, It is split into two fragments between any two pairs of residues located anywhere between 1100-1200, 1200-1300, or 1300-1368. In certain embodiments, the fission site is located at one or more polypeptide binding sites (i.e., "split site or fission intein fission site"), fused to the fission intein, and then released into the cell as a separately encoded fusion protein. delivered to. Once the split intein fusion proteins (i.e., the protein halves) are expressed in a cell, the proteins undergo trans-splicing to form a complete or whole PE with concomitant removal of the linked split intein sequences. Form.

例えば、図66に示されているとおり、N末端エクステインは第1の分裂インテイン(例えば、Nインテイン)に融合され得、C末端エクステインは第2の分裂インテイン(例えば、Cインテイン)に融合され得る。細胞内におけるNインテインおよびCインテインの自己会合、次にそれらの自己切除と丸ごとのプライム編集因子(PE)のN末端エクステインおよびC末端エクステイン部分の間のペプチド結合の付随的形成とによって、N末端エクステインはC末端エクステインに融合されるようになって、napDNAbpドメインおよびポリメラーゼドメイン(例えば、RTドメイン)を含む丸ごとのプライム編集因子融合タンパク質を再形成する。 For example, as shown in Figure 66, an N-terminal extein can be fused to a first split intein (e.g., N intein) and a C-terminal extein can be fused to a second split intein (e.g., C intein). can be done. By self-association of N- and C-inteins within the cell, then their self-excision and concomitant formation of a peptide bond between the N-terminal and C-terminal extein moieties of the whole prime editing element (PE). The N-terminal extein becomes fused to the C-terminal extein to reform an entire prime editor fusion protein containing a napDNAbp domain and a polymerase domain (eg, RT domain).

分裂インテインを用いる分裂されたPE送達戦略を利するためには、プライム編集因子は、1つ以上の分裂部位において割られて、プライム編集因子の少なくとも2つの別個の半分を生出することを必要とする。これらの夫々は、各半分が分裂インテイン配列に融合される場合には、細胞内で再連結され得る。 To benefit from a split PE delivery strategy using split inteins, the prime editing factor must be cleaved at one or more split sites to generate at least two separate halves of the prime editing factor. do. Each of these can be religated intracellularly if each half is fused to a split intein sequence.

ある態様において、プライム編集因子は単一の分裂部位において分裂される。ある種の他の態様において、プライム編集因子は2つの分裂部位、もしくは3つの分裂部位、もしくは4つの分裂部位、またはより多くにおいて分裂される。 In certain embodiments, the prime editing factor is split at a single cleavage site. In certain other embodiments, the prime editing element is split at two split sites, or three split sites, or four split sites, or more.

好ましい態様では、プライム編集因子は単一の分裂部位において分裂されて、プライム編集因子の2つの別個の半分を生出する。これらの夫々は分裂インテイン配列に融合され得る。 In a preferred embodiment, the prime editing factor is split at a single cleavage site to generate two separate halves of the prime editing factor. Each of these can be fused to a split intein sequence.

例示の分裂インテインはSsp DnaEインテインであり、これは2つのサブユニットつまりDnaE-NおよびDnaE-Cを含む。2つの異なるサブユニットは別個の遺伝子つまりdnaE-nおよびdnaE-cによってコードされ、これらは夫々DnaE-NおよびDnaE-Cサブユニットをコードする。DnaEはSynechocytis sp. PCC6803の天然に存在する分裂インテインであり、夫々がDnaE-NまたはDnaE-Cどちらかとの融合体を含む2つの別個のタンパク質のトランススプライシングを導くことができる。 An exemplary fission intein is the Ssp DnaE intein, which contains two subunits, DnaE-N and DnaE-C. The two different subunits are encoded by separate genes, dnaE-n and dnaE-c, which encode the DnaE-N and DnaE-C subunits, respectively. DnaE is a naturally occurring fission intein of Synechocytis sp. PCC6803 that can direct the trans-splicing of two separate proteins, each containing a fusion with either DnaE-N or DnaE-C.

追加の天然に存在するかまたは操作された分裂インテイン配列は当該技術分野で公知であるか、または本明細書に記載の丸ごとのインテイン配列もしくは当該技術分野で利用可能なものから作られ得る。分裂インテイン配列の例はStevens et al.,“A promiscuous split intein with expanded protein engineering applications,”PNAS,2017,Vol.114:8538-8543;Iwai et al.,“Highly efficient protein trans-splicing by a naturally split DnaE intein from Nostc punctiforme,FEBS Lett,580:1853-1858に見出され得る。これらの夫々は参照によって本願に組み込まれる。追加の分裂インテイン配列は例えばWO2013/045632、WO2014/055782、WO2016/069774、およびEP2877490に見出され得る。これらの夫々の内容は参照によって本願に組み込まれる。 Additional naturally occurring or engineered split intein sequences are known in the art or can be made from whole intein sequences described herein or available in the art. Examples of split intein sequences are Stevens et al., “A promiscuous split intein with expanded protein engineering applications,” PNAS,2017,Vol.114:8538-8543;Iwai et al., “Highly efficient protein trans-splicing by a naturally split DnaE intein from Nostc punctiforme, FEBS Lett, 580:1853-1858, each of which is incorporated herein by reference. Additional split intein sequences can be found in, for example, WO2013/045632, WO2014/055782, WO2016/069774 , and EP2877490, the contents of each of which are incorporated herein by reference.

加えて、トランスのタンパク質スプライシングがインビボおよびin vitroで記載されており(Shingledecker,et al.,[0076]Gene 207:187(1998),Southworth,et al.,EMBO J.17:918(1998);Mills, et al.,Proc.Natl.Acad.Sci.USA,95:3543-3548(1998);Lew,et al.,J.Biol.Chem.,273:15887-15890(1998);Wu,et al.,Biochim.Biophys.Acta 35732:1(1998b),Yamazaki,et al.,J.Am.Chem.Soc.120:5591(1998),Evans,et al.,J.Biol.Chem.275:9091(2000);Otomo,et al.,Biochemistry 38:16040-16044(1999);Otomo,et al.,J.Biolmol.NMR 14:105-114(1999);Scott,et al.,Proc.Natl.Acad.Sci.USA 96:13638-13643(1999))、2つの不活性なフラグメントとして(as to)タンパク質を発現するための機会を提供し、これらは爾後にライゲーションを経過して機能的な産物を形成する。例えば、2つの別個に発現された半分からの完全なPE融合タンパク質の形成について、図66および67に示されているとおりである。 In addition, protein splicing in trans has been described in vivo and in vitro (Shingledecker, et al., Gene 207:187 (1998); Southworth, et al., EMBO J. 17:918 (1998); Mills, et al., Proc. Natl. Acad. Sci. USA, 95:3543-3548 (1998); Lew, et al., J. Biol. Chem., 273:15887-15890 (1998); Wu, et al., Biochim. Biophys. Acta 35732:1 (1998b); Yamazaki, et al., J. Am. Chem. Soc. 120:5591 (1998); Evans, et al. al., J. Biol. Chem. 275:9091 (2000); Otomo, et al., Biochemistry 38:16040-16044 (1999); Otomo, et al., J. Biomol. NMR 14:105-114 (1999); Scott, et al., Proc. Natl. Acad. Sci. USA 96:13638-13643 (1999)), providing the opportunity to express a protein as two inactive fragments which then undergo ligation to form a functional product, as shown, for example, in Figures 66 and 67 for the formation of a complete PE fusion protein from two separately expressed halves.

本明細書に記載の種々の態様では、連続的進化法(例えばPACE)が塩基編集因子の第1の部分を進化させるために用いられ得る。第1の部分は、単一の構成要素またはドメイン、例えばCas9ドメイン、デアミナーゼドメイン、またはUGIドメインを包含し得る。それから、進化した部分および残りの未進化の部分両方を分裂インテインポリペプチドドメインと共に別個に発現することによって、別個に進化した構成要素またはドメインは、細胞内において塩基編集因子の残りの部分に融合され得る。第1の部分は、より幅広く、本明細書に記載の連続的進化方法を用いて進化させられることを望まれる塩基編集因子のいずれかの第1のアミノ酸部分を包含し得る。第2の部分は、この態様では、本願の方法を用いて進化させられない塩基編集因子の残りのアミノ酸部分を言うであろう。塩基編集因子の進化した第1の部分および第2の部分は、夫々が分裂インテインポリペプチドドメインと共に細胞によって発現され得る。細胞の天然のタンパク質スプライシング機序は、進化した第1の部分および未進化の第2の部分を再アセンブリして、単一の融合タンパク質の進化した塩基編集因子を形成するであろう。進化した第1の部分は、単一の融合タンパク質のNまたはC末端パーツどちらかを含み得る。類縁の様式で、第2の直交的なトランススプライシングインテインペアの使用は、進化した第1の部分が単一の融合タンパク質の内部のパーツを含むことを許し得る。 In various embodiments described herein, continuous evolution methods (eg, PACE) can be used to evolve the first portion of the base editor. The first portion may include a single component or domain, such as a Cas9 domain, a deaminase domain, or a UGI domain. The separately evolved components or domains are then fused to the rest of the base editor within the cell by expressing both the evolved portion and the remaining unevolved portion together with the split intein polypeptide domain. obtain. The first portion may be broader and include the first amino acid portion of any base editor desired to be evolved using the continuous evolution methods described herein. The second portion, in this embodiment, would refer to the remaining amino acid portion of the base editor that cannot be evolved using the methods of the present application. The evolved first portion and second portion of the base editor can each be expressed by the cell with a split intein polypeptide domain. The cell's natural protein splicing machinery will reassemble the evolved first part and the unevolved second part to form a single fusion protein evolved base editor. The first portion evolved can include either the N- or C-terminal part of a single fusion protein. In a related fashion, the use of a second orthogonal trans-splicing intein pair may allow the evolved first portion to contain the internal parts of a single fusion protein.

それゆえに、細胞内における進化したおよび未進化の構成要素を含む完全な塩基編集因子の形成を容易化するために、本明細書に記載の塩基編集因子の進化したおよび未進化の構成要素のいずれかは、分裂インテインタグと共に発現され得る。 Thus, to facilitate the formation of a complete base editor containing evolved and unevolved components in a cell, any of the evolved and unevolved components of the base editors described herein can be expressed with a split intein tag.

タンパク質スプライシングプロセスの機序は多大に詳細に研究されており(Chong,et al.,J.Biol.Chem.1996,271,22159-22168;Xu,M-Q & Perler,F.B.EMBO Journal,1996,15,5146-5153)、保存されたアミノ酸がインテインおよびエクステインスプライシング点に見出されている(Xu,et al.,EMBO Journal,1994,13 5517-522)。本明細書に記載の構築物は、第1の遺伝子(例えば、塩基編集因子の進化した部分)の5'末端に融合されたインテイン配列を含有する。好適なインテイン配列は、タンパク質スプライシングエレメントを含有することが公知のタンパク質のいずれかから選択され得る。全ての公知のインテインを含有するデータベースはワールドワイドウェブ上に見出され得る(Perler,F.B.Nucleic Acids Research,1999,27,346-347)。インテイン配列は3'端において第2の遺伝子の5'端に融合される。ある種のオルガネラへのこの遺伝子の標的化のためには、ペプチドシグナルが遺伝子のコード配列に融合され得る。第2の遺伝子の後に、インテイン遺伝子配列は、同じ細胞における複数のタンパク質の発現のために所望の回数だけ繰り返され得る。マルチインテイン含有構築物では、異なるソースからのインテイン要素を用いることが有用であり得る。発現されるべき最後の遺伝子の配列の後には、転写終結配列が挿入されなければならない。1つの態様では、それがインテインからのエクステインの切除を触媒すると共にエクステインのライゲーションを防止し得るようにして、改変されたインテインスプライシング単位がデザインされる。Pyrococcus種GB-D DNAポリメラーゼ上のC末端エクステインジャンクションの変異導入は、変改されたスプライシングエレメントを生ずることが見出された。これは、エクステインおよびインテインの切断を誘導するが、エクステインの爾後のライゲーションを防止する(Xu,M-Q & Perler,F.B.EMBO Journal,1996,15,5146-5153)。セリン538からアラニンまたはグリシンどちらかへの変異は、切断を誘導したが、ライゲーションを防止した。インテインへのC末端エクステインジャンクションにおけるアミノ酸の保存を原因として、他のインテインスプライシング単位における同等残基の変異もまたエクステインライゲーションを防止するはずである。エンドヌクレアーゼドメインを含有しない好ましいインテインは、Mycobacterium xenopi GyrAタンパク質である(Telenti,et al.J.Bacteriol.1997,179,6378-6382)。他は天然に見出されているか、またはインテインを含有するエンドヌクレアーゼからエンドヌクレアーゼドメインを除去することによって人工的に生出されている(Chong,et al.J.Biol.Chem.1997,272,15587-15590)。好ましい態様では、インテインは、それがスプライシング機能を果たすために必要とされる最小限の数のアミノ酸からなるようにして選択され、例えばMycobacterium xenopi GyrAタンパク質からのインテインである(Telenti,A.,et al.,J.Bacteriol.1997,179,6378-6382)。代替的な態様では、エンドヌクレアーゼ活性なしのインテインが選択され、例えばMycobacterium xenopi GyrAタンパク質からのインテイン、またはエンドヌクレアーゼドメインを除去するように改変されたSaccharaomyces cerevisiae VMAインテインである(Chong,1997)。インテインスプライシング単位のさらなる改変は、切断反応の反応速度が変改されることを許し得、スプライシング単位の遺伝子配列を単純に改変することによって、タンパク質用量がコントロールされることを許す。 The mechanism of protein splicing process has been studied in great detail (Chong, et al., J. Biol. Chem. 1996, 271, 22159-22168; Xu, M-Q & Perler, F. B. EMBO Journal, 1996, 15, 5146-5153), conserved amino acids have been found at intein and extein splicing points (Xu, et al., EMBO Journal, 1994, 13 5517-522). The constructs described herein contain an intein sequence fused to the 5' end of a first gene (eg, an evolved portion of a base editor). Suitable intein sequences may be selected from any of the proteins known to contain protein splicing elements. A database containing all known inteins can be found on the World Wide Web (Perler, F.B. Nucleic Acids Research, 1999, 27, 346-347). The intein sequence is fused at the 3' end to the 5' end of the second gene. For targeting of this gene to certain organelles, a peptide signal can be fused to the coding sequence of the gene. After the second gene, the intein gene sequence can be repeated as many times as desired for expression of multiple proteins in the same cell. In multi-intein-containing constructs, it may be useful to use intein elements from different sources. A transcription termination sequence must be inserted after the last gene sequence to be expressed. In one embodiment, an engineered intein splicing unit is designed such that it can catalyze excision of extein from intein and prevent ligation of extein. Mutagenesis of the C-terminal extein junction on the Pyrococcus sp. GB-D DNA polymerase was found to result in altered splicing elements. This induces cleavage of exteins and inteins, but prevents subsequent ligation of exteins (Xu, M-Q & Perler, F.B. EMBO Journal, 1996, 15, 5146-5153). Mutation of serine 538 to either alanine or glycine induced cleavage but prevented ligation. Due to the conservation of amino acids at the C-terminal extein junction to inteins, mutation of equivalent residues in other intein splicing units should also prevent extein ligation. A preferred intein that does not contain an endonuclease domain is the Mycobacterium xenopi GyrA protein (Telenti, et al. J. Bacteriol. 1997, 179, 6378-6382). Others are found in nature or created artificially by removing the endonuclease domain from intein-containing endonucleases (Chong, et al. J. Biol. Chem. 1997, 272, 15587 -15590). In a preferred embodiment, the intein is selected such that it consists of the minimum number of amino acids required to perform the splicing function, such as the intein from the Mycobacterium xenopi GyrA protein (Telenti, A., et al. al., J. Bacteriol. 1997, 179, 6378-6382). In an alternative embodiment, an intein without endonuclease activity is selected, such as the intein from the Mycobacterium xenopi GyrA protein, or the Saccharaomyces cerevisiae VMA intein modified to remove the endonuclease domain (Chong, 1997). Further modification of the intein splicing unit may allow the kinetics of the cleavage reaction to be altered, allowing protein dosage to be controlled by simply modifying the genetic sequence of the splicing unit.

インテインは2つの別個に転写および翻訳される遺伝子によってコードされる2つのフラグメントとしてもまた存在し得る。これらのいわゆる分裂インテインは自己会合し、タンパク質スプライシング活性をトランスで触媒する。分裂インテインは多様なシアノバクテリアおよび古細菌において同定されているが(Caspi et al,Mol Microbiol.50:1569-1577(2003);Choi J.et al,J Mol Biol.556:1093-1106(2006.);Dassa B.et al,Biochemistry.46:322-330(2007.);Liu X. and Yang J.,J Biol Chem.275:26315-26318(2003);Wu H.et al. Inteins can also exist as two fragments encoded by two separately transcribed and translated genes. These so-called split inteins self-associate and catalyze protein splicing activity in trans. Fission inteins have been identified in diverse cyanobacteria and archaea (Caspi et al,Mol Microbiol.50:1569-1577(2003);Choi J.et al,J Mol Biol.556:1093-1106(2006 .);Dassa B.et al,Biochemistry.46:322-330(2007.);Liu X. and Yang J.,J Biol Chem.275:26315-26318(2003);Wu H.et al.

Proc Natl Acad Sci USA.£5:9226-9231(1998.);およびZettler J.et al,FEBS Letters.553:909-914(2009))、真核生物ではここまで見出されていない。最近、環境メタゲノムデータのバイオインフォマティクス分析は、新規のゲノム配置を有する26の異なる座位を明らかにした。各座位においては、保存された酵素コード領域が分裂インテインによって分断され、自立したエンドヌクレアーゼ遺伝子が、インテインサブドメインをコードするセクション間に挿入されている。それらのうち、5つの座位が完全にアセンブリされた:DNAヘリカーゼ(gp41-1、gp41-8);イノシン-5'-一リン酸デヒドロゲナーゼ(IMPDH-1);およびリボヌクレオチドレダクターゼ触媒サブユニット(NrdA-2およびNrdJ-1)である。このばらばらになった遺伝子編成は主にファージに存在するように見える(Dassa et al,Nucleic Acids Research.57:2560-2573(2009))。 Proc Natl Acad Sci USA. £5:9226-9231 (1998.); and Zettler J. et al, FEBS Letters. 553:909-914 (2009)), so far it has not been found in eukaryotes. Recently, bioinformatics analysis of environmental metagenomic data revealed 26 distinct loci with novel genomic locations. At each locus, the conserved enzyme-coding region is interrupted by a split intein, and an independent endonuclease gene is inserted between sections encoding intein subdomains. Among them, five loci were fully assembled: DNA helicase (gp41-1, gp41-8); inosine-5'-monophosphate dehydrogenase (IMPDH-1); and ribonucleotide reductase catalytic subunit (NrdA -2 and NrdJ-1). This disjointed genetic organization appears to be present primarily in phages (Dassa et al, Nucleic Acids Research. 57:2560-2573 (2009)).

分裂インテインNpu DnaEは、タンパク質トランススプライシング反応について報告された最も高い速度を有するとして特徴付けられた。加えて、Npu DnaEタンパク質スプライシング反応は、異なるエクステイン配列、6から37℃の温度、および最高で6Mの尿素の存在についてロバストかつ高収量と考慮される(Zettler J.et al,FEBS Letters.553:909-914(2009);Iwai I.et al,FEBS Letters 550:1853-1858(2006))。予想されたとおり、これらのインテインのNドメインにおけるCysl Ala変異が導入されたときには、当初のNからSのアシルシフト、よってタンパク質スプライシングがブロックされた。残念ながら、C末端切断反応もまたほとんど完全に阻害された。N末端の切れやすいペプチド結合におけるアシルシフトに対するC末端スプライスジャンクションにおけるアスパラギン環化の依存性は、天然に分裂されたDnaEインテインアレルに普通の固有の特性であるように見える(Zettler J.et al.FEBS Letters.555:909-914(2009))。 The split intein Npu DnaE was characterized as having the highest rate reported for a protein trans-splicing reaction. In addition, the Npu DnaE protein splicing reaction is considered robust and high-yielding for different extein sequences, temperatures from 6 to 37°C, and the presence of up to 6M urea (Zettler J. et al, FEBS Letters. 553:909-914 (2009); Iwai I. et al, FEBS Letters 550:1853-1858 (2006)). As expected, when a Cysl Ala mutation in the N domain of these inteins was introduced, the initial N to S acyl shift and thus protein splicing was blocked. Unfortunately, the C-terminal cleavage reaction was also almost completely inhibited. The dependence of asparagine cyclization at the C-terminal splice junction on acyl shift at the N-terminal scissile peptide bond appears to be a common, intrinsic property of naturally split DnaE intein alleles (Zettler J. et al. FEBS Letters. 555:909-914 (2009)).

タンパク質スプライシングの機序は、典型的には4つのステップを有する[29-30]:1)インテインN末端におけるN-SまたはN-Oアシルシフト。これは上流のペプチド結合を切断し、Nエクステインとインテインの第1のアミノ酸(CysまたはSer)の側鎖との間にエステル結合を形成する;2)NエクステインをインテインC末端へと位置替えするトランスエステル化。新たなエステル結合を形成し、NエクステインをCエクステインの第1のアミノ酸(Cys、Ser、またはThr)の側鎖に連結する;3)インテインおよびCエクステインの間のペプチド結合を切断するAsn環化;ならびに4)NエクステインおよびCエクステインの間においてペプチド結合によってエステル結合を置き換えるS-NまたはO-Nアシルシフト。 The protein splicing mechanism typically has four steps [29-30]: 1) N-S or N-O acyl shift at the intein N-terminus; This cleaves the upstream peptide bond and forms an ester bond between the N-extein and the side chain of the intein's first amino acid (Cys or Ser); 2) positions the N-extein to the intein C-terminus; Transesterification to change. Form a new ester bond and link the N extein to the side chain of the first amino acid (Cys, Ser, or Thr) of the C extein; 3) Break the peptide bond between the intein and the C extein Asn cyclization; and 4) S-N or O-N acyl shift replacing the ester bond by a peptide bond between the N and C exteins.

分裂インテインによって触媒されるタンパク質トランススプライシングは、タンパク質ライゲーションのための全く酵素的な方法を提供する[31]。分裂インテインは本質的には一続きのインテイン(例えばミニインテイン)であり、夫々NインテインおよびCインテインという名称の2つのピースへと分裂されている。分裂インテインのNインテインおよびCインテインは、非共有結合的に会合して活性なインテインを形成し、一続きのインテインがするのと本質的に同じやり方でスプライシング反応を触媒し得る。分裂インテインは天然に見出され、実験室でもまた操作されている[31-35]。本願において用いられる用語「分裂インテイン」は、1つ以上のペプチド結合切断がN末端およびC末端アミノ酸配列の間に存在するいずれかのインテインを言い、その結果、N末端およびC末端配列が別個の分子になり、これらは、トランススプライシング反応について機能的であるインテインへと非共有結合的に再会合または再構成し得る。いずれかの触媒的に活性なインテインまたはそのフラグメントが、本発明の方法への使用のための分裂インテインを導出するために用いられ得る。例えば、一側面において、分裂インテインは真核生物インテインに由来し得る。別の側面において、分裂インテインは細菌インテインに由来し得る。別の側面において、分裂インテインは古細菌インテインに由来し得る。好ましくは、そのように導出された分裂インテインは、トランススプライシング反応を触媒することにとって必須のアミノ酸配列のみを所有するであろう。 Protein trans-splicing catalyzed by split inteins provides a purely enzymatic method for protein ligation [31]. A split intein is essentially a stretch of intein (eg, a mini-intein) that has been split into two pieces, named N-intein and C-intein, respectively. The N and C inteins of a split intein non-covalently associate to form an active intein and can catalyze splicing reactions in essentially the same way that a continuous intein does. Split inteins are found in nature and have also been manipulated in the laboratory [31-35]. As used herein, the term "split intein" refers to any intein in which one or more peptide bond cleavages exist between the N-terminal and C-terminal amino acid sequences, such that the N-terminal and C-terminal sequences are distinct. molecules, which can non-covalently reassemble or reconstitute into inteins that are functional for trans-splicing reactions. Any catalytically active intein or fragment thereof can be used to derive a split intein for use in the methods of the invention. For example, in one aspect, a fission intein can be derived from a eukaryotic intein. In another aspect, the fission intein can be derived from a bacterial intein. In another aspect, the fission intein can be derived from an archaeal intein. Preferably, the split intein so derived will possess only the amino acid sequences essential for catalyzing the trans-splicing reaction.

本願において用いられる「N末端分裂インテイン(In)」は、トランススプライシング反応について機能的であるN末端アミノ酸配列を含むいずれかのインテイン配列を言う。Inは、それゆえに、トランススプライシングが生起するときにスプライスアウトされる配列をもまた含む。Inは、天然に存在するインテイン配列のN末端部分の改変である配列を含み得る。例えば、かかる追加のおよび/または変異した残基の包含がInをトランススプライシングにおいて非機能的にしない限り、Inは追加のアミノ酸残基および/または変異した残基を含み得る。好ましくは、追加のおよび/または変異した残基の包含は、Inのトランススプライシング活性を改善または増強する。 As used herein, an "N-terminally split intein (In)" refers to any intein sequence that includes an N-terminal amino acid sequence that is functional for a trans-splicing reaction. In therefore also includes sequences that are spliced out when trans-splicing occurs. In can include sequences that are modifications of the N-terminal portion of naturally occurring intein sequences. For example, an In may contain additional amino acid residues and/or mutated residues, so long as the inclusion of such additional and/or mutated residues does not render the In non-functional in trans-splicing. Preferably, the inclusion of additional and/or mutated residues improves or enhances the trans-splicing activity of the In.

本願において用いられる「C末端分裂インテイン(Ic)」は、トランススプライシング反応について機能的であるC末端アミノ酸配列を含むいずれかのインテイン配列を言う。一側面において、Icは一続きの4から7アミノ酸残基を含み、これらの少なくとも4アミノ酸はそれが由来したインテイン最後のβ鎖からである。Icは、それゆえに、トランススプライシングが生起するときにスプライスアウトされる配列をもまた含む。Icは、天然に存在するインテイン配列のC末端部分の改変である配列を含み得る。例えば、かかる追加のおよび/または変異した残基の包含がInをトランススプライシングにおいて非機能的にしない限り、Icは追加のアミノ酸残基および/または変異した残基を含み得る。好ましくは、追加のおよび/または変異した残基の包含は、Icのトランススプライシング活性を改善または増強する。 As used herein, "C-terminal split intein (Ic)" refers to any intein sequence that includes a C-terminal amino acid sequence that is functional for a trans-splicing reaction. In one aspect, Ic includes a stretch of 4 to 7 amino acid residues, at least 4 of which are from the last β-strand of the intein from which it is derived. Ic therefore also includes a sequence that is spliced out when trans-splicing occurs. Ic can include a sequence that is a modification of the C-terminal portion of a naturally occurring intein sequence. For example, Ic can include additional amino acid residues and/or mutated residues, so long as the inclusion of such additional and/or mutated residues does not render In non-functional in trans-splicing. Preferably, the inclusion of additional and/or mutated residues improves or enhances the trans-splicing activity of Ic.

本発明のいくつかの態様では、IcまたはInに連結されたペプチドは、とりわけ蛍光基、ビオチン、ポリエチレングリコール(PEG)、アミノ酸アナログ、非天然のアミノ酸、リン酸基、グリコシル基、放射性同位体標識、および医薬分子を包含する追加の化学的部分を含み得る。他の態様において、Icに連結されたペプチドは、とりわけケトン、アルデヒド、Cys残基、およびLys残基を包含する1つ以上の化学反応性基を含み得る。「インテインスプライシングポリペプチド(ISP)」が存在するときには、分裂インテインのNインテインおよびCインテインは非共有結合的に会合して活性なインテインを形成し、スプライシング反応を触媒し得る。本願において用いられる「インテインスプライシングポリペプチド(ISP)」は、Ic、In、または両方が分裂インテインから除去されるときに留まる分裂インテインのアミノ酸配列の部分を言う。ある態様において、InはISPを含む。別の態様では、IcはISPを含む。さらに別の態様では、ISPはInにもIcにも共有結合的に連結されていない別個のペプチドである。 In some embodiments of the invention, the peptide linked to Ic or In includes fluorescent groups, biotin, polyethylene glycol (PEG), amino acid analogs, unnatural amino acids, phosphate groups, glycosyl groups, radioisotope labels, among others. , and additional chemical moieties including pharmaceutical molecules. In other embodiments, the peptide linked to Ic may contain one or more chemically reactive groups including ketones, aldehydes, Cys residues, and Lys residues, among others. When an "intein splicing polypeptide (ISP)" is present, the N and C inteins of the split intein can non-covalently associate to form the active intein and catalyze the splicing reaction. As used herein, "intein splicing polypeptide (ISP)" refers to the portion of the amino acid sequence of a splitting intein that remains when Ic, In, or both are removed from the splitting intein. In certain embodiments, In includes ISP. In another embodiment, Ic comprises ISP. In yet another embodiment, the ISP is a separate peptide that is not covalently linked to either In or Ic.

分裂インテインは、ミニインテインの構造上に見出される-12の保存されたベータ鎖間の構造化されていないループまたは介在アミノ酸配列中に1つ以上の分裂部位を操作することによって、一続きのインテインから生出され得る[25-28]。分裂の生出が、タンパク質スプライシング活性が失われる十分な度合まではインテインの構造、特に構造化されたベータ鎖を遮断しないであろうという条件で、ベータ鎖間の領域内の分裂部位の位置のいくらかのフレキシビリティーが存在し得る。 Split inteins are created by engineering one or more splitting sites in unstructured loops or intervening amino acid sequences between the 12 conserved beta strands found on the structure of mini-inteins. [25-28]. Some of the location of the cleavage site within the inter-beta strand region, provided that the generation of cleavages will not interrupt the structure of the intein, particularly the structured beta strand, to a sufficient degree that protein splicing activity is lost. flexibility can exist.

タンパク質トランススプライシングでは、1つの前駆体タンパク質はNインテインによって後続されるNエクステインパーツからなり、別の前駆体タンパク質はCエクステインパーツによって後続されるCインテインからなり、トランススプライシング反応(一緒にNおよびCインテインによって触媒される)が2つのインテイン配列を切除、2つのエクステイン配列をペプチド結合によって連結する。酵素反応であるタンパク質トランススプライシングは、非常に低い(例えばマイクロモル)濃度のタンパク質で働き得、生理条件下において実行され得る。 In protein trans-splicing, one precursor protein consists of an N extein part followed by an N intein, another precursor protein consists of a C intein followed by a C extein part, and the trans-splicing reaction (together N and C intein) excises the two intein sequences and connects the two extein sequences by a peptide bond. Protein trans-splicing, an enzymatic reaction, can work with very low (eg, micromolar) concentrations of protein and can be carried out under physiological conditions.

[2]他のプログラム可能なヌクレアーゼ
本明細書に記載の種々の態様において、プライム編集因子はCas9タンパク質などのnapDNAbpを含む。これらのタンパク質は、それらがガイドRNA(または場合に応じてPEgRNA)と複合体化するようになることによって「プログラム可能」である。これは、gRNA(またはPEgRNA)のスペーサー部分に対して相補的である配列を所有し、かつ要求されるPAM配列をもまた所有するDNA上の標的部位へとCas9タンパク質をガイドする。しかしながら、ここで想定されるある態様において、napDNAbpは、異なる型のプログラム可能なタンパク質、例えばジンクフィンガーヌクレアーゼまたは転写活性化因子様エフェクターヌクレアーゼ(TALEN)によって置換され得る。
[2] Other Programmable Nucleases In various embodiments described herein, the prime editing factor comprises a napDNAbp, such as a Cas9 protein. These proteins are "programmable" by virtue of their becoming complexed with a guide RNA (or PEgRNA, as the case may be). This guides the Cas9 protein to a target site on the DNA that possesses a sequence that is complementary to the spacer portion of the gRNA (or PEgRNA) and also possesses the required PAM sequence. However, in certain embodiments envisioned herein, napDNAbp can be replaced by a different type of programmable protein, such as a zinc finger nuclease or a transcription activator-like effector nuclease (TALEN).

図1Jは、napDNAbp(例えばSpCas9ニッカーゼ)をいずれかのプログラム可能なヌクレアーゼドメイン、例えばジンクフィンガーヌクレアーゼ(ZFN)または転写活性化因子様エフェクターヌクレアーゼ(TALEN)によって置き換える本願において企図されるプライム編集のかかるバリエーションを図示する。そのため、好適なヌクレアーゼは必ずしも核酸標的化分子(例えばガイドRNA)によって「プログラム」されることを必要とせず、むしろ、DNA結合ドメイン、例えば特にヌクレアーゼの特異性を定めることによってプログラムされ得るということが企図される。ちょうどnapDNAbp部分によるプライム編集のように、かかる代替的なプログラム可能なヌクレアーゼは、標的DNAの1つの鎖のみがカットされるようにして改変されるということが好ましい。換言すると、プログラム可能なヌクレアーゼは好ましくはニッカーゼとして機能するべきである。ひとたびプログラム可能なヌクレアーゼが選択されると(例えば、ZFNまたはTALEN)、それから、それがプライム編集様機序に従って作動することを許すように、追加の機能性がシステム上に操作され得る。例えば、プログラム可能なヌクレアーゼは(例えば、化学的リンカーを介して)RNAまたはDNA伸長アームをそれにカップリングすることによって改変され得、伸長アームはプライマー結合部位(PBS)およびDNA合成鋳型を含む。プログラム可能なヌクレアーゼは(例えば、化学的またはアミノ酸リンカーを介して)ポリメラーゼにもまたカップリングされ得る。これの性質は、伸長アームがDNAまたはRNAであるかどうかに依存するであろう。RNA伸長アームのケースでは、ポリメラーゼはRNA依存性DNAポリメラーゼであり得る(例えば逆転写酵素)。DNA伸長アームのケースでは、ポリメラーゼはDNA依存性DNAポリメラーゼであり得る(例えば、Pol I、Pol II、もしくはPol IIIを包含する原核生物ポリメラーゼ、またはPol a、Pol b、Pol g、Pol d、Pol e、もしくはPol zを包含する真核生物ポリメラーゼ)。システムは、丸ごととしての反応を容易化するために、プログラム可能なヌクレアーゼへの融合体として追加またはトランスで追加される他の機能性をもまた包含し得る(例えば、(a)カットされた部位においてDNAをほどいて、プライマーとして利用可能な3’端を有するカットされた鎖を作るためのヘリカーゼ、(b)カットされた鎖上の内生鎖を除去することを助けて、合成された鎖による内生鎖の置き換えの方に反応を駆動するためのFEN1、または(c)非編集鎖の有利な細胞性修復によって合成修復の取り入れを駆動することを助け得る、対向する鎖上の第2部位ニックを生出するためのnCas9:gRNA複合体)。napDNAbpによるプライム編集と類縁の様式で、別様にプログラム可能なヌクレアーゼによるかかる複合体は、目当ての編集を持つDNAの新たに合成された置き換え鎖を合成し、それから永久的にDNAの標的部位上に組み入れるために用いられ得る。 Figure 1J shows such a variation of prime editing as contemplated herein in which napDNAbp (e.g. SpCas9 nickase) is replaced by some programmable nuclease domain, e.g. zinc finger nuclease (ZFN) or transcription activator-like effector nuclease (TALEN). Illustrated. As such, it is understood that a suitable nuclease does not necessarily need to be "programmed" by a nucleic acid targeting molecule (e.g. guide RNA), but rather can be programmed by a DNA binding domain, e.g. planned. Just like prime editing with the napDNAbp moiety, such alternative programmable nucleases are preferably modified such that only one strand of the target DNA is cut. In other words, the programmable nuclease should preferably function as a nickase. Once a programmable nuclease is selected (eg, ZFN or TALEN), additional functionality can then be engineered onto the system to allow it to operate according to a prime editing-like mechanism. For example, a programmable nuclease can be modified by coupling an RNA or DNA extension arm to it (eg, via a chemical linker), where the extension arm contains a primer binding site (PBS) and a DNA synthesis template. Programmable nucleases can also be coupled to polymerases (eg, via chemical or amino acid linkers). The nature of this will depend on whether the extended arm is DNA or RNA. In the case of RNA extension arms, the polymerase can be an RNA-dependent DNA polymerase (eg, reverse transcriptase). In the case of DNA extending arms, the polymerase can be a DNA-dependent DNA polymerase (e.g., a prokaryotic polymerase including Pol I, Pol II, or Pol III, or Pol a, Pol b, Pol g, Pol d, Pol e, or eukaryotic polymerases including Pol z). The system may also include other functionality added as a fusion to the programmable nuclease or added in trans to facilitate the whole reaction (e.g., (a) cut site (b) a helicase to unwind the DNA and create a cut strand with a 3' end that can be used as a primer; FEN1 to drive the reaction towards replacement of the endogenous strand by (c) a second on the opposing strand that may help drive the incorporation of synthetic repair by favoring cellular repair of the non-edited strand. nCas9:gRNA complex to generate site nicks). In a manner analogous to prime editing by napDNAbp, such a complex with a differently programmable nuclease synthesizes a newly synthesized replacement strand of DNA with the desired edit and then permanently places it on the target site of DNA. can be used to incorporate into

好適な代替的なプログラム可能なヌクレアーゼは当該技術分野で周知であり、これらは、DNAの標的部位に選択的に結合するようにプログラムされ得る代替的なプライム編集因子システムを構築するために、napDNAbp:gRNA複合体の代わりに用いられ得る。かつ、これらは、ポリメラーゼとプライマー結合部位およびDNA合成鋳型を含むRNAまたはDNA伸長アームとを特定のニック部位へと共局在させるために、上に記載されている様式でさらに改変され得る。例えば、図1Jによって表されるとおり、転写活性化因子様エフェクターヌクレアーゼ(TALEN)が、プログラム可能なヌクレアーゼとして、本明細書に記載のプライム編集法および組成物に用いられ得る。TALENは、TALエフェクターDNA結合ドメインをDNA切断ドメインに融合することによって生成される人工の制限酵素である。これらの試薬は効率的な、プログラム可能な、かつ特異的なDNA切断を可能化し、in situのゲノム編集のための強力なツールを表す。転写活性化因子様エフェクター(TALE)は、事実上いずれかのDNA配列に結合するように迅速に操作され得る。本願において用いられる用語TALENは幅広く、別のTALENからの補助なしに二本鎖DNAを切断し得るモノマーTALENを包含する。用語TALENは、同じ部位においてDNAを切断するために一緒に働くように操作されているTALENのペアの1つまたは両方のメンバーを言うためにもまた用いられる。一緒に働くTALENは左TALENおよび右TALENと言われ得る。これはDNAの掌性を参照している。U.S.Ser.No.12/965,590;U.S.Ser.No.13/426,991(U.S.Pat.No.8,450,471);U.S.Ser.No.13/427,040(U.S.Pat.No.8,440,431);U.S.Ser.No.13/427,137(U.S.Pat.No.8,440,432);およびU.S.Ser.No.13/738,381を見よ。これらの全てはそれらの全体が参照によって本願に組み込まれる。加えて、TALENはWO2015/027134、US 9,181,535、Boch et al.,“Breaking the Code of DNA Binding Specificity of TAL-Type III Effectors”,Science,vol.326,pp.1509-1512(2009),Bogdanove et al.,TAL Effectors:Customizable Proteins for DNA Targeting,Science,vol.333,pp.1843-1846(2011),Cade et al.,“Highly efficient generation of heritable zebrafish gene mutations using homo- and heterodimeric TALENs”,Nucleic Acids Research,vol.40,pp.8001-8010(2012),およびCermak et al.,“Efficient design and assembly of custom TALEN and other TAL effector-based constructs for DNA targeting”,Nucleic Acids Research,vol.39,No.17,e82(2011)に記載されている。これらの夫々は参照によって本願に組み込まれる。 Suitable alternative programmable nucleases are well known in the art, and these can be used to construct alternative prime editor systems that can be programmed to selectively bind to target sites in DNA. :Can be used instead of gRNA complex. And these can be further modified in the manner described above to co-localize the polymerase and the RNA or DNA extension arm containing the primer binding site and DNA synthesis template to a particular nick site. For example, as represented by FIG. 1J, transcription activator-like effector nucleases (TALENs) can be used as programmable nucleases in the prime editing methods and compositions described herein. TALENs are artificial restriction enzymes produced by fusing a TAL effector DNA binding domain to a DNA cutting domain. These reagents enable efficient, programmable, and specific DNA cleavage and represent powerful tools for in situ genome editing. Transcription activator-like effectors (TALEs) can be rapidly engineered to bind to virtually any DNA sequence. As used herein, the term TALEN is broad and includes monomeric TALENs that are capable of cleaving double-stranded DNA without assistance from another TALEN. The term TALEN is also used to refer to one or both members of a pair of TALENs that are engineered to work together to cut DNA at the same site. TALENs that work together can be referred to as a left TALEN and a right TALEN. This refers to the handedness of DNA. U.S.Ser.No.12/965,590;U.S.Ser.No.13/426,991(U.S.Pat.No.8,450,471);U.S.Ser.No.13/427,040(U.S.Pat.No.8,440,431);U.S.Ser.No.13/ 427,137 (U.S. Pat. No. 8,440,432); and U.S. Ser. No. 13/738,381. All of which are incorporated by reference into this application in their entirety. In addition, TALEN is WO2015/027134, US 9,181,535, Boch et al., “Breaking the Code of DNA Binding Specificity of TAL-Type III Effectors”, Science, vol. 326, pp. 1509-1512 (2009), Bogdanove et al. al.,TAL Effectors:Customizable Proteins for DNA Targeting,Science,vol.333,pp.1843-1846(2011),Cade et al.,“Highly efficient generation of heritable zebrafish gene mutations using homo- and heterodimeric TALENs”,Nucleic Acids Research, vol. 40, pp. 8001-8010 (2012), and Cermak et al., “Efficient design and assembly of custom TALEN and other TAL effector-based constructs for DNA targeting”, Nucleic Acids Research, vol. 39, No. 17, e82 (2011). Each of these is incorporated herein by reference.

図1Jに表されているとおり、ジンクフィンガーヌクレアーゼもまた、プライム編集への使用のための代替的なプログラム可能なヌクレアーゼとして、Cas9ニッカーゼなどのnapDNAbpの代わりに用いられ得る。TALENのように、ZFNタンパク質は、それらがニッカーゼとして機能するようにして改変され得る。すなわち、本明細書に記載のプライム編集因子に用いられるnapDNAbpと類似の様式で、それが標的DNAの1つの鎖のみを切断するようにして、ZFNを操作する。ZFNタンパク質は、当該技術分野において、例えば、Carroll et al.,“Genome Engineering with Zinc-Finger Nucleases,”Genetics,Aug 2011,Vol.188:773-782;Durai et al.,“Zinc finger nucleases: custom-designed molecular scissors for genome engineering of plant and mammalian cells,”Nucleic Acids Res,2005,Vol.33:5978-90;およびGaj et al.,“ZFN, TALEN, and CRISPR/Cas-based methods for genome engineering,”Trends Biotechnol.2013,Vol.31:397-405(これらの各々はその全体が参照されることによって本明細書に組み込まれる)に広範囲に記載されている。 As depicted in Figure 1J, zinc finger nucleases can also be used in place of napDNAbp, such as Cas9 nickase, as alternative programmable nucleases for use in prime editing. Like TALENs, ZFN proteins can be modified so that they function as nickases. That is, the ZFN is engineered such that it cuts only one strand of the target DNA, in a manner similar to the napDNAbp used in the prime editing factors described herein. ZFN proteins have been described in the art, for example, by Carroll et al., “Genome Engineering with Zinc-Finger Nucleases,” Genetics, Aug 2011, Vol. 188:773-782; Durai et al., “Zinc finger nucleases: custom -designed molecular scissors for genome engineering of plant and mammalian cells,” Nucleic Acids Res,2005,Vol.33:5978-90; and Gaj et al., “ZFN, TALEN, and CRISPR/Cas-based methods for genome engineering, 2013, Vol. 31:397-405, each of which is incorporated herein by reference in its entirety.

[3]ポリメラーゼ(例えば逆転写酵素)
種々の態様において、本明細書に開示のプライム編集因子(PE)システムはポリメラーゼ(例えば、DNA依存性DNAポリメラーゼまたはRNA依存性DNAポリメラーゼ、例えば逆転写酵素)またはそのバリアントを包含し、これは、napDNAbpもしくは他のプログラム可能なヌクレアーゼとの融合タンパク質として提供またはトランスで提供され得る。
[3] Polymerase (e.g. reverse transcriptase)
In various embodiments, the prime editing element (PE) systems disclosed herein include a polymerase (e.g., a DNA-dependent DNA polymerase or an RNA-dependent DNA polymerase, e.g., reverse transcriptase) or a variant thereof, which It can be provided as a fusion protein with napDNAbp or other programmable nucleases or in trans.

いずれかのポリメラーゼが、本明細書に開示のプライム編集因子に用いられ得る。ポリメラーゼは野生型ポリメラーゼ、機能的フラグメント、変異体、バリアント、または短縮されたバリアント、および同類であり得る。ポリメラーゼは、真核、原核、古細菌、もしくはウイルス生物からの野生型ポリメラーゼを包含し得、および/またはポリメラーゼは遺伝子工学、変異導入、指向性進化に基づくプロセスによって改変され得る。ポリメラーゼはT7 DNAポリメラーゼ、T5 DNAポリメラーゼ、T4 DNAポリメラーゼ、KlenowフラグメントDNAポリメラーゼ、DNAポリメラーゼIII、および同類を包含し得る。ポリメラーゼは熱安定性でもまたあり得、Taq、Tne、Tma、Pfu、Tfl、Tth、Stoffelフラグメント、VENT(登録商標)およびDEEPVENT(登録商標)DNAポリメラーゼ、KOD、Tgo、JDF3、ならびにそれらの変異体、バリアント、および誘導体を包含し得る(米国特許第5,436,149号;米国特許第4,889,818号;米国特許第4,965,185号;米国特許第5,079,352号;米国特許第5,614,365号;米国特許第5,374,553号;米国特許第5,270,179号;米国特許第5,047,342号;米国特許第5,512,462号;WO 92/06188;WO 92/06200;WO 96/10640;Barnes,W.M.,Gene 112:29-35(1992);Lawyer,F.C.,et al.,PCR Meth. Appl.2:275-287(1993);Flaman,J.-M,et al.,Nuc.Acids Res.22(15):3259-3260(1994)(これらの各々は参照により本明細書に組み込まれる)を参照)。より長い核酸分子(例えば、長さが約3-5Kbよりも長い核酸分子)の合成には、少なくとも2つのDNAポリメラーゼが使用され得る。ある態様において、ポリメラーゼの1つは3'エキソヌクレアーゼ活性を実質的に欠き得、他は3'エキソヌクレアーゼ活性を有し得る。かかるペアリングは同じかまたは異なるポリメラーゼを包含し得る。3'エキソヌクレアーゼ活性を実質的に欠くDNAポリメラーゼの例は、Taq、Tne(exo-)、Tma(exo-)、Pfu(exo-)、Pwo(exo-)、exo-KOD、およびTth DNAポリメラーゼ、ならびにそれらの変異体、バリアント、および誘導体を包含するが、これらに限定されない。 Any polymerase can be used in the prime editing agents disclosed herein. Polymerases can be wild-type polymerases, functional fragments, mutants, variants, or truncated variants, and the like. The polymerase may include wild-type polymerases from eukaryotic, prokaryotic, archaeal, or viral organisms, and/or the polymerase may be modified by processes based on genetic engineering, mutagenesis, directed evolution. Polymerases can include T7 DNA polymerase, T5 DNA polymerase, T4 DNA polymerase, Klenow fragment DNA polymerase, DNA polymerase III, and the like. Polymerases can also be thermostable, such as Taq, Tne, Tma, Pfu, Tfl, Tth, Stoffel fragments, VENT® and DEEPVENT® DNA polymerases, KOD, Tgo, JDF3, and variants thereof. , variants, and derivatives (US Pat. No. 5,436,149; US Pat. No. 4,889,818; US Pat. No. 4,965,185; US Pat. No. 5,079,352; US Pat. No. 5,614,365; US Pat. No. 5,374,553; US Pat. No. 5,270,179). No.; U.S. Patent No. 5,047,342; U.S. Patent No. 5,512,462; WO 92/06188; WO 92/06200; WO 96/10640; Barnes, W. M., Gene 112:29-35 (1992); Lawyer, F. C., et al. , PCR Meth. Appl. 2:275-287 (1993); Flaman, J.-M, et al., Nuc. Acids Res. 22 (15): 3259-3260 (1994) (each of which is incorporated herein by reference). (incorporated into the specification)). At least two DNA polymerases can be used to synthesize longer nucleic acid molecules (eg, nucleic acid molecules greater than about 3-5 Kb in length). In certain embodiments, one of the polymerases may be substantially devoid of 3' exonuclease activity and the other may have 3' exonuclease activity. Such pairings may involve the same or different polymerases. Examples of DNA polymerases that substantially lack 3' exonuclease activity are Taq, Tne(exo-), Tma(exo-), Pfu(exo-), Pwo(exo-), exo-KOD, and Tth DNA polymerases. , and mutants, variants, and derivatives thereof.

好ましくは、本明細書に開示のプライム編集因子に使用可能なポリメラーゼは「鋳型依存性」ポリメラーゼである(なぜなら、ポリメラーゼは、プライム編集の間に合成中のDNA鎖の配列を規定するためにはDNA合成鋳型に依拠することを意図されるからである。本願において用いられる用語「鋳型DNA分子」は、相補的な核酸鎖がDNAポリメラーゼによって例えばPEgRNAのDNA合成鋳型のプライマー伸長反応によってそれから合成される核酸の鎖を言う。 Preferably, the polymerases that can be used in the prime editing agents disclosed herein are "template-dependent" polymerases (because during prime editing, the polymerase is used to define the sequence of the DNA strand being synthesized). As used herein, the term "template DNA molecule" refers to the term "template DNA molecule" from which a complementary nucleic acid strand is synthesized by a DNA polymerase, e.g., by a primer extension reaction of a PEgRNA DNA synthesis template. refers to a chain of nucleic acid.

本願において用いられる用語「鋳型依存的様式」は、プライマー分子の鋳型依存的伸長(例えば、DNAポリメラーゼによるDNA合成)が関わるプロセスを言うことを意図される。用語「鋳型依存的様式」は、ポリヌクレオチドの新たに合成される鎖の配列が相補的な塩基対形成の周知のルールによって記述されるRNAまたはDNAのポリヌクレオチド合成を言う(例えば、Watson,J.D.et al.,In:Molecular Biology of the Gene,4th Ed.,W.A.Benjamin,Inc.,Menlo Park,Calif.(1987)を見よ)。用語「相補的」は、塩基対形成による2つのポリヌクレオチド鎖の領域間のまたは2つのヌクレオチド間の配列相補性の幅広い概念を言う。アデニンヌクレオチドは、チミンまたはウラシルであるヌクレオチドと特異的な水素結合を形成する(「塩基対形成する」)ことができるということが公知である。類似に、シトシンヌクレオチドは、グアニンヌクレオチドと塩基対形成することができるということが公知である。そのため、プライム編集のケースでは、DNA合成鋳型に対してプライム編集因子のポリメラーゼによって合成されるDNAの一本鎖は、DNA合成鋳型の配列に対して「相補的」であると言われるということが言われ得る。 As used herein, the term "template-dependent manner" is intended to refer to a process that involves template-dependent extension of a primer molecule (eg, DNA synthesis by a DNA polymerase). The term "template-dependent mode" refers to polynucleotide synthesis of RNA or DNA in which the sequence of the newly synthesized strand of polynucleotide is described by the well-known rules of complementary base pairing (e.g., Watson, J.D. et al., In: Molecular Biology of the Gene, 4th Ed., W.A. Benjamin, Inc., Menlo Park, Calif. (1987)). The term "complementary" refers to the broad concept of sequence complementarity between regions of two polynucleotide strands or between two nucleotides by base pairing. It is known that adenine nucleotides can form specific hydrogen bonds ("base pair") with nucleotides that are thymine or uracil. Similarly, it is known that cytosine nucleotides can base pair with guanine nucleotides. Therefore, in the case of prime editing, the single strand of DNA synthesized by the polymerase of the prime editing factor against the DNA synthesis template is said to be "complementary" to the sequence of the DNA synthesis template. It can be said.

A.例示のポリメラーゼ
種々の態様において、本明細書に記載のプライム編集因子はポリメラーゼを含む。本開示は、いずれかの天然に存在する生物もしくはウイルスから得られるか、または市販のもしくは非市販のソースから得られるいずれかの野生型ポリメラーゼを企図する。加えて、本開示のプライム編集因子に使用可能なポリメラーゼは、いずれかの天然に存在する変異体ポリメラーゼ、操作された変異体ポリメラーゼ、または他のバリアントポリメラーゼを包含し得、機能を保持する短縮されたバリアントを包含する。本願において使用可能なポリメラーゼは、特定のアミノ酸置換、例えば具体的に本明細書に開示のものを含有するようにもまた操作され得る。ある種の好ましい態様では、本開示のプライム編集因子に使用可能なポリメラーゼは、鋳型に基づくポリメラーゼである。すなわち、それらは鋳型依存的な様式でヌクレオチド配列を合成する。
A. Exemplary polymerases
In various embodiments, the prime editing agent described herein comprises a polymerase. This disclosure contemplates any wild-type polymerase obtained from any naturally occurring organism or virus, or obtained from commercial or non-commercial sources. In addition, polymerases that can be used in the prime editing agents of the present disclosure can include any naturally occurring, engineered, or other variant polymerases that retain function. Includes all variants. Polymerases that can be used herein can also be engineered to contain certain amino acid substitutions, such as those specifically disclosed herein. In certain preferred embodiments, the polymerases that can be used in the prime editing agents of the present disclosure are template-based polymerases. That is, they synthesize nucleotide sequences in a template-dependent manner.

ポリメラーゼは、本明細書に記載のプライム編集因子システムに関して用いられ得る、ヌクレオチド鎖を合成する酵素である。ポリメラーゼは好ましくは「鋳型依存性」ポリメラーゼである(すなわち、鋳型鎖のヌクレオチド塩基の順序に基づいてヌクレオチド鎖を合成するポリメラーゼ)。ある種の構成では、ポリメラーゼは「鋳型非依存性」でもまたあり得る(すなわち、鋳型鎖の要件なしにヌクレオチド鎖を合成するポリメラーゼ)。ポリメラーゼはさらに「DNAポリメラーゼ」または「RNAポリメラーゼ」としてもまた類別され得る。種々の態様において、プライム編集因子システムはDNAポリメラーゼを含む。種々の態様において、DNAポリメラーゼは「DNA依存性DNAポリメラーゼ」であり得る(すなわち、これによると、鋳型分子はDNAの鎖である)。かかるケースでは、DNA鋳型分子はPEgRNAであり得、伸長アームはDNAの鎖を含む。かかるケースでは、PEgRNAはキメラまたはハイブリッドPEgRNAともまた言われ得、これがRNA部分(すなわち、スペーサーおよびgRNAコアを包含するガイドRNA構成要素)およびDNA部分(すなわち、伸長アーム)を含む。種々の他の態様において、DNAポリメラーゼは「RNA依存性DNAポリメラーゼ」であり得る(すなわち、これによると、鋳型分子はRNAの鎖である)。かかるケースでは、PEgRNAはRNAであり、すなわちRNA伸長を包含する。用語「ポリメラーゼ」は、ヌクレオチドの重合を触媒する酵素をもまた言い得る(すなわち、ポリメラーゼ活性)。一般的に、酵素は、ポリヌクレオチド鋳型配列にアニーリングしたプライマー(例えば、例えば、PEgRNAのプライマー結合部位にアニーリングしたプライマー配列)の3'端において合成を開始し、鋳型鎖の5'端の方へ進むであろう。「DNAポリメラーゼ」はデオキシヌクレオチドの重合を触媒する。DNAポリメラーゼを参照して本願において用いられる用語DNAポリメラーゼは、「その機能的フラグメント」を包含する。「その機能的フラグメント」は、少なくとも1つのセットの条件下においてポリヌクレオチドの重合を触媒する能力を保持する、ポリメラーゼのアミノ酸配列全体未満を包摂する野生型または変異体DNAポリメラーゼのいずれかの部分を言う。かかる機能的フラグメントは別個の実体として存在し得るか、またはそれは融合タンパク質などのより大きいポリペプチドの構成成分であり得る。 Polymerases are enzymes that synthesize nucleotide chains that can be used in conjunction with the prime editor systems described herein. The polymerase is preferably a "template-dependent" polymerase (ie, a polymerase that synthesizes a nucleotide strand based on the order of the nucleotide bases of a template strand). In certain configurations, a polymerase can also be "template-independent" (ie, a polymerase that synthesizes a nucleotide strand without the requirement of a template strand). Polymerases can also be further classified as "DNA polymerases" or "RNA polymerases." In various embodiments, the prime editor system includes a DNA polymerase. In various embodiments, the DNA polymerase can be a "DNA-dependent DNA polymerase" (ie, according to which the template molecule is a strand of DNA). In such cases, the DNA template molecule may be PEgRNA and the extending arm comprises a strand of DNA. In such cases, the PEgRNA may also be referred to as a chimeric or hybrid PEgRNA, which includes an RNA portion (ie, a guide RNA component that includes a spacer and a gRNA core) and a DNA portion (ie, an extended arm). In various other embodiments, the DNA polymerase can be an "RNA-dependent DNA polymerase" (ie, according to which the template molecule is a strand of RNA). In such cases, PEgRNA is RNA, ie, includes RNA extension. The term "polymerase" can also refer to an enzyme that catalyzes the polymerization of nucleotides (ie, polymerase activity). Generally, the enzyme initiates synthesis at the 3' end of a primer annealed to a polynucleotide template sequence (e.g., a primer sequence annealed to the primer binding site of, e.g., PEgRNA) and towards the 5' end of the template strand. will proceed. "DNA polymerase" catalyzes the polymerization of deoxynucleotides. The term DNA polymerase, as used herein with reference to DNA polymerase, includes "functional fragments thereof." A "functional fragment thereof" means any portion of a wild-type or mutant DNA polymerase that encompasses less than the entire amino acid sequence of the polymerase that retains the ability to catalyze the polymerization of polynucleotides under at least one set of conditions. To tell. Such a functional fragment may exist as a separate entity or it may be a component of a larger polypeptide such as a fusion protein.

いくつかの態様では、ポリメラーゼはバクテリオファージからであり得る。バクテリオファージDNAポリメラーゼは5'から3'のエキソヌクレアーゼ活性を一般的に欠いている。なぜなら、この活性は別個のポリペプチドによってコードされるからである。好適なDNAポリメラーゼの例はT4、T7、およびファイ29 DNAポリメラーゼである。市販で利用可能な酵素は:T4(多くのソース、例えばEpicentreから利用可能)およびT7(多くのソース、例えば未改変についてはEpicentreおよび3'から5'のエキソT7「Sequenase」DNAポリメラーゼについてはUSBから利用可能)である。 In some embodiments, the polymerase can be from a bacteriophage. Bacteriophage DNA polymerases generally lack 5' to 3' exonuclease activity. This is because this activity is encoded by a separate polypeptide. Examples of suitable DNA polymerases are T4, T7, and Phi29 DNA polymerases. Commercially available enzymes are: T4 (available from many sources, e.g. Epicentre) and T7 (available from many sources, e.g. Epicentre for unmodified and USB for 3' to 5' exo T7 "Sequenase" DNA polymerase) available from ).

他の態様、ポリメラーゼは古細菌ポリメラーゼである。古細菌において同定されているDNAポリメラーゼの2つの異なるクラスがある:1.ファミリーB/pol I型(Pyrococcus furiosusからのPfuのホモログ)および2.pol II型(P.furiosus DP1/DP2 2サブユニットポリメラーゼのホモログ)である。両方のクラスからのDNAポリメラーゼは、関連する5'から3'のエキソヌクレアーゼ活性を天然に欠くことと、3'から5'のエキソヌクレアーゼ(プルーフリーディング)活性を所有することとが示されている。好適なDNAポリメラーゼ(pol Iまたはpol II)は、所望のアッセイ温度に類似である最適な成長温度を有する古細菌に由来し得る。 In other embodiments, the polymerase is an archaeal polymerase. There are two distinct classes of DNA polymerases that have been identified in archaea:1. Family B/pol type I (homolog of Pfu from Pyrococcus furiosus) and 2. pol type II (homolog of P. furiosus DP1/DP2 two-subunit polymerase). DNA polymerases from both classes have been shown to naturally lack the relevant 5' to 3' exonuclease activity and to possess 3' to 5' exonuclease (proofreading) activity. . Suitable DNA polymerases (pol I or pol II) may be derived from archaea, which have optimal growth temperatures similar to the desired assay temperature.

熱安定性古細菌DNAポリメラーゼはPyrococcus種(furiosus、sp. GB-D、woesii、abysii、horikoshii)、Thermococcus種(kodakaraensis KOD1、litoralis、sp.9 degrees North-7、sp. JDF-3、gorgonarius)、Pyrodictium occultum、およびArchaeoglobus fulgidusから単離される。 Thermostable archaeal DNA polymerases include Pyrococcus species (furiosus, sp. GB-D, woesii, abysii, horikoshii), Thermococcus species (kodakaraensis KOD1, litoralis, sp. 9 degrees North-7, sp. JDF-3, gorgonarius) , Pyrodictium occultum, and Archaeoglobus fulgidus.

ポリメラーゼはユーバクテリウム種からでもまたあり得る。ユーバクテリウムDNAポリメラーゼの3つのクラス、pol I、II、およびIIIがある。Pol I DNAポリメラーゼファミリーの酵素は5'から3'のエキソヌクレアーゼ活性を所有し、ある種のメンバーは3'から5'のエキソヌクレアーゼ活性をもまた発揮する。Pol II DNAポリメラーゼは5'から3'のエキソヌクレアーゼ活性を天然に欠くが、3'から5'のエキソヌクレアーゼ活性は発揮する。Pol III DNAポリメラーゼは細胞の主要な複製DNAポリメラーゼを表し、複数のサブユニットから成る。pol III触媒サブユニットは5'から3'のエキソヌクレアーゼ活性を欠くが、いくつかのケースでは、3'から5'のエキソヌクレアーゼ活性が同じポリペプチド上に位置付けられる。 The polymerase may also be from Eubacterium sp. There are three classes of Eubacterium DNA polymerases, pol I, II, and III. Enzymes of the Pol I DNA polymerase family possess 5' to 3' exonuclease activity, and certain members also exert 3' to 5' exonuclease activity. Pol II DNA polymerase naturally lacks 5' to 3' exonuclease activity, but does exert 3' to 5' exonuclease activity. Pol III DNA polymerase represents the cell's major replicative DNA polymerase and is composed of multiple subunits. Although the pol III catalytic subunit lacks 5' to 3' exonuclease activity, in some cases 3' to 5' exonuclease activity is mapped onto the same polypeptide.

種々の市販で利用可能なPol I DNAポリメラーゼがあり、これらのいくつかは5'から3'のエキソヌクレアーゼ活性を縮減または廃止するように改変されている。 There are a variety of commercially available Pol I DNA polymerases, some of which have been modified to reduce or abolish 5' to 3' exonuclease activity.

好適な熱安定性pol I DNAポリメラーゼは、Thermus種およびThermotoga maritima、例えばThermus aquaticus(Taq)、Thermus thermophilus(Tth)、およびThermotoga maritima(Tma UlTma)を包含する種々の好熱ユーバクテリウムから単離され得る。 Suitable thermostable pol I DNA polymerases are isolated from various thermophilic eubacteria, including Thermus species and Thermotoga maritima, such as Thermus aquaticus (Taq), Thermus thermophilus (Tth), and Thermotoga maritima (Tma UlTma). can be done.

上に列記されているものに関係する追加のユーバクテリウムはThermophilic Bacteria(Kristjansson, J. K., ed.) CRC Press, Inc., Boca Raton, Fla., 1992に記載されている。 Additional Eubacteria related to those listed above are described in Thermophilic Bacteria (Kristjansson, J. K., ed.) CRC Press, Inc., Boca Raton, Fla., 1992.

本発明は、さらに、米国特許第5,677,152号、第6,479,264号、および第6,183,998号に開示されている方法に従って化学的に改変されているキメラまたは非キメラDNAポリメラーゼを可能にする。これらの内容はそれらの全体が参照によってここに組み込まれる。 The present invention further enables chimeric or non-chimeric DNA polymerases that have been chemically modified according to the methods disclosed in US Pat. Nos. 5,677,152, 6,479,264, and 6,183,998. These contents are incorporated herein by reference in their entirety.

上に列記されているものに関係する追加の古細菌DNAポリメラーゼは次の参照に記載されている:Archaea:A Laboratory Manual(Robb,F.T. and Place,A.R.,eds.),Cold Spring Harbor Laboratory Press,Cold Spring Harbor,N.Y.,1995およびThermophilic Bacteria(Kristjansson,J.K.,ed.)CRC Press,Inc.,Boca Raton,Fla.,1992。 Additional archaeal DNA polymerases related to those listed above are described in the following references: Archaea: A Laboratory Manual (Robb, F.T. and Place, A.R., eds.), Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y., 1995 and Thermophilic Bacteria (Kristjansson, J.K., ed.) CRC Press, Inc., Boca Raton, Fla., 1992.

B.例示の逆転写酵素
種々の態様において、本明細書に記載のプライム編集因子はポリメラーゼとして逆転写酵素を含む。本開示は、いずれかの天然に存在する生物もしくはウイルスから得られるかまたは市販のもしくは非市販のソースから得られるいずれかの野生型逆転写酵素を企図する。加えて、本開示のプライム編集因子に使用可能な逆転写酵素は、いずれかの天然に存在する変異体RT、操作された変異体RT、または他のバリアントRTを包含し得、機能を保持する短縮されたバリアントを包含する。RTは、特定のアミノ酸置換、例えば具体的に本明細書に開示のものを含有するようにもまた操作され得る。
B. Exemplary reverse transcriptase
In various embodiments, the prime editing factors described herein include reverse transcriptase as the polymerase. This disclosure contemplates any wild-type reverse transcriptase obtained from any naturally occurring organism or virus or from commercial or non-commercial sources. In addition, reverse transcriptases that can be used in the prime editing agents of the present disclosure can include any naturally occurring, engineered, or other variant RT that retains functionality. Includes shortened variants. RTs can also be engineered to contain certain amino acid substitutions, such as those specifically disclosed herein.

逆転写酵素は多機能酵素であり、典型的には、RNAおよびDNA依存性DNA重合活性、ならびにRNA-DNAハイブリッド中のRNAの切断を触媒するRNaseH活性を包含する3つの酵素活性を有する。逆転写酵素のいくつかの変異体は、mRNAの意図されない損傷を防止するためにRNaseH部分を不能化している。mRNAを鋳型として用いて相補的なDNA(cDNA)を合成するこれらの酵素は、RNAウイルスにおいて最初に同定された。爾後に、逆転写酵素は直接的にウイルス粒子、細胞、または組織から単離および精製された(例として、Kacian et al.,1971,Biochim. Biophys.Acta 46:365-83;Yang et al.,1972,Biochem.Biophys.Res.Comm.47:505-11;Gerard et al.,1975,J.Virol.15:785-97;Liu et al.,1977,Arch.Virol.55 187-200;Kato et al.,1984,J.Virol.Methods 9:325-39;Luke et al.,1990,Biochem.29:1764-69およびLe Grice et al.,1991,J.Virol.65:7004-07(これらの各々は参照により組み込まれる)を参照)。より最近では、改善された特性、例えば熱安定性、忠実性、および活性を求めて、変異体および融合タンパク質が生出されている。当該技術分野で公知であるかまたは当該技術分野で公知の方法を用いて作られ得る逆転写酵素の野生型、バリアント、および/または変異体形態のいずれかは、本願において企図される。 Reverse transcriptase is a multifunctional enzyme, typically having three enzymatic activities, including RNA- and DNA-dependent DNA polymerization activities, and RNaseH activity, which catalyzes the cleavage of RNA in RNA-DNA hybrids. Some variants of reverse transcriptase have the RNaseH moiety disabled to prevent unintended damage to the mRNA. These enzymes, which synthesize complementary DNA (cDNA) using mRNA as a template, were first identified in RNA viruses. Later, reverse transcriptase was isolated and purified directly from virus particles, cells, or tissues (e.g., Kacian et al., 1971, Biochim. Biophys. Acta 46:365-83; Yang et al. ,1972,Biochem.Biophys.Res.Comm.47:505-11;Gerard et al.,1975,J.Virol.15:785-97;Liu et al.,1977,Arch.Virol.55 187-200; Kato et al., 1984, J. Virol. Methods 9:325-39; Luke et al., 1990, Biochem. 29: 1764-69 and Le Grice et al., 1991, J. Virol. 65: 7004-07 (each of which is incorporated by reference). More recently, mutants and fusion proteins have been generated in search of improved properties such as thermostability, fidelity, and activity. Any wild-type, variant, and/or mutant forms of reverse transcriptase that are known in the art or that can be made using methods known in the art are contemplated in this application.

逆転写酵素(RT)遺伝子(またはそれに含有される遺伝情報)はいくつもの異なるソースから得られ得る。例えば、遺伝子は、レトロウイルスに感染している真核細胞から、またはレトロウイルスゲノム全体もしくはそれの部分どちらかを含有するいくつものプラスミドから得られ得る。加えて、RT遺伝子を含有するメッセンジャーRNA様のRNAがレトロウイルスから得られ得る。RTのソースの例は、モロニーマウス白血病ウイルス(M-MLVまたはMLVRT);ヒトT細胞白血病ウイルス1型(HTLV-1);ウシ白血病ウイルス(BLV);ラウス肉腫ウイルス(RSV);ヒト免疫不全ウイルス(HIV);Saccharomycesを包含する酵母、Neurospora、Drosophila;霊長類;および齧歯類を包含するが、これらに限定されない。例えば、Weiss,et al.,米国特許第4,663,290号(1987);Gerard,G.R.,DNA:271-79(1986);Kotewicz,M.L.,et al.,Gene 35:249-58(1985);Tanese,N.,et al.,Proc.Natl.Acad.Sci.(USA):4944-48(1985);Roth,M.J.,at al.,J.Biol.Chem.260:9326-35(1985);Michel,F.,et al.,Nature 316:641-43(1985);Akins,R.A.,et al.,Cell 47:505-16(1986),EMBO J.4:1267-75(1985);およびFawcett,D.F.,Cell 47:1007-15(1986)(これらの各々はその全体が参照されることによって本明細書に組み込まれる)を参照。 The reverse transcriptase (RT) gene (or the genetic information it contains) can be obtained from a number of different sources. For example, genes can be obtained from eukaryotic cells infected with a retrovirus or from any number of plasmids containing either the entire retroviral genome or a portion thereof. In addition, messenger RNA-like RNA containing RT genes can be obtained from retroviruses. Examples of sources of RT are Moloney murine leukemia virus (M-MLV or MLVRT); human T-cell leukemia virus type 1 (HTLV-1); bovine leukemia virus (BLV); Rous sarcoma virus (RSV); human immunodeficiency virus (HIV); yeasts, including Saccharomyces; Neurospora, Drosophila; primates; and rodents. For example, Weiss, et al., U.S. Patent No. 4,663,290 (1987); Gerard, G.R., DNA:271-79 (1986); Kotewicz, M.L., et al., Gene 35:249-58 (1985); Tanese, N.,et al.,Proc.Natl.Acad.Sci.(USA):4944-48(1985);Roth,M.J.,at al.,J.Biol.Chem.260:9326-35(1985);Michel ,F.,et al.,Nature 316:641-43(1985);Akins,R.A.,et al.,Cell 47:505-16(1986),EMBO J.4:1267-75(1985);and Fawcett , D.F., Cell 47:1007-15 (1986), each of which is incorporated herein by reference in its entirety.

野生型RT
本明細書に開示のプライム編集因子による使用のための例示の酵素は、M-MLV逆転写酵素およびRSV逆転写酵素を包含し得るが、これらに限定されない。逆転写酵素活性を有する酵素は市販で利用可能である。ある態様において、逆転写酵素は、プライム編集因子(PE)システムの他の構成要素に対してトランスで提供される。つまり、逆転写酵素は、個々の構成要素として、すなわちnapDNAbpとの融合タンパク質としてではなく、発現または別様に提供される。
Wild type RT
Exemplary enzymes for use with the prime editing factors disclosed herein may include, but are not limited to, M-MLV reverse transcriptase and RSV reverse transcriptase. Enzymes with reverse transcriptase activity are commercially available. In certain embodiments, reverse transcriptase is provided in trans to other components of the prime editing element (PE) system. That is, the reverse transcriptase is expressed or otherwise provided as an individual component, ie, not as a fusion protein with napDNAbp.

当業者は、野生型逆転写酵素が(モロニーマウス白血病ウイルス(M-MLV);ヒト免疫不全ウイルス(HIV)逆転写酵素、およびトリ白血病・肉腫ウイルス(ASLV)逆転写酵素を包含するが、これらに限定されず、これはラウス肉腫ウイルス(RSV)逆転写酵素、トリ骨髄芽球症ウイルス(AMV)逆転写酵素、トリ赤芽球症ウイルス(AEV)ヘルパーウイルスMCAV逆転写酵素、トリ骨髄球腫症ウイルスMC29ヘルパーウイルスMCAV逆転写酵素、トリ細網内皮症ウイルス(REV-T)ヘルパーウイルスREV-A逆転写酵素、トリ肉腫ウイルスUR2ヘルパーウイルスUR2AV逆転写酵素、トリ肉腫ウイルスY73ヘルパーウイルスYAV逆転写酵素、ラウス随伴ウイルス(RAV)逆転写酵素、および骨髄芽球症ウイルス随伴ウイルス(MAV)逆転写酵素を包含するが、これらに限定されない)、本明細書に記載の対象の方法および組成物に好適に用いられ得るということを認識するであろう。 Those skilled in the art will appreciate that wild-type reverse transcriptases include (Moloney murine leukemia virus (M-MLV); human immunodeficiency virus (HIV) reverse transcriptase; and avian leukemia-sarcoma virus (ASLV) reverse transcriptase; These include, but are not limited to, Rous sarcoma virus (RSV) reverse transcriptase, avian myeloblastosis virus (AMV) reverse transcriptase, avian erythroblastosis virus (AEV) helper virus MCAV reverse transcriptase, avian myelocytoma disease virus MC29 helper virus MCAV reverse transcriptase, avian reticuloendotheliosis virus (REV-T) helper virus REV-A reverse transcriptase, avian sarcoma virus UR2 helper virus UR2AV reverse transcriptase, avian sarcoma virus Y73 helper virus YAV reverse transcriptase enzymes, including but not limited to Rous-associated virus (RAV) reverse transcriptase, and myeloblastosis virus-associated virus (MAV) reverse transcriptase), in the subject methods and compositions described herein. It will be appreciated that it can be used suitably.

例示の野生型RT酵素は次のとおりである:

Figure 2020191234000074
Figure 2020191234000075
Figure 2020191234000076
Figure 2020191234000077
Exemplary wild type RT enzymes are:
Figure 2020191234000074
Figure 2020191234000075
Figure 2020191234000076
Figure 2020191234000077

バリアントおよびエラーを起こしやすいRT
逆転写酵素は、相補的なDNA(cDNA)鎖をRNA鋳型から合成することにとって必須である。逆転写酵素は、異なる生化学的活性を発揮する別物のドメインから成る酵素である。酵素は次のとおりRNA鋳型からのDNAの合成を触媒する:アニーリングしたプライマーの存在下において、逆転写酵素はRNA鋳型に結合し、重合反応を開始する。RNA依存性DNAポリメラーゼ活性が相補的なDNA(cDNA)鎖を合成し、dNTPを組み込む。RNase H活性がDNA:RNA複合体のRNA鋳型を分解する。それゆえに、逆転写酵素は、(a)RNA/DNAハイブリッドを認識および結合する結合活性、(b)RNA依存性DNAポリメラーゼ活性、および(c)RNase H活性を含む。加えて、逆転写酵素は、一般的に、それらの熱安定性、処理能力(dNTP組み込みの速度)、および忠実性(またはエラー率)を包含する種々の属性を有すると見なされる。本願において企図される逆転写酵素バリアントは、これらの酵素活性(例えば、RNA依存性DNAポリメラーゼ活性、RNase H活性、またはDNA/RNAハイブリッド結合活性)または酵素特性(例えば、熱安定性、処理能力、または忠実性)のいずれか1つ以上にインパクトを及ぼすかまたは変化させる、逆転写酵素のいずれかの変異を包含し得る。かかるバリアントは、当該技術分野においてパブリックドメインにおいて利用可能、市販で利用可能であり得るか、または指向性進化プロセス(例えば、PACEまたはPANCE)を包含する変異導入の公知の方法を用いて作られ得る。
Variants and error-prone RTs
Reverse transcriptase is essential for synthesizing complementary DNA (cDNA) strands from RNA templates. Reverse transcriptase is an enzyme composed of distinct domains that exert different biochemical activities. The enzyme catalyzes the synthesis of DNA from an RNA template as follows: In the presence of annealed primers, reverse transcriptase binds to the RNA template and initiates the polymerization reaction. RNA-dependent DNA polymerase activity synthesizes complementary DNA (cDNA) strands and incorporates dNTPs. RNase H activity degrades RNA templates in DNA:RNA complexes. Therefore, reverse transcriptase contains (a) a binding activity that recognizes and binds RNA/DNA hybrids, (b) an RNA-dependent DNA polymerase activity, and (c) an RNase H activity. In addition, reverse transcriptases are generally considered to have various attributes including their thermostability, throughput (rate of dNTP incorporation), and fidelity (or error rate). Reverse transcriptase variants contemplated herein may have different enzymatic activities (e.g., RNA-dependent DNA polymerase activity, RNase H activity, or DNA/RNA hybrid binding activity) or enzymatic properties (e.g., thermostability, processivity, or fidelity) that impacts or alters any one or more of the reverse transcriptase enzymes. Such variants may be available in the public domain, commercially available in the art, or may be created using known methods of mutagenesis, including directed evolution processes (e.g., PACE or PANCE). .

種々の態様において、逆転写酵素はバリアント逆転写酵素であり得る。本願において用いられる「バリアント逆転写酵素」は、参照配列(例えば、参照野生型配列)に対して相対的に1つ以上の変異(単数の変異、逆位、欠失、挿入、および再構成を包含する)を含む、いずれかの天然に存在するかまたは遺伝子操作されたバリアントを包含する。RTは、RNA依存性DNAポリメラーゼ活性、リボヌクレアーゼH活性、およびDNA依存性DNAポリメラーゼ活性を包含するいくつかの活性を天然に有する。集合的に、これらの活性は酵素が一本鎖RNAを二本鎖cDNAへと変換することを可能化する。レトロウイルスおよびレトロトランスポゾンでは、このcDNAはそれからホストゲノム上に取り入れし得、これから新たなRNAのコピーがホスト細胞転写によって作られ得る。バリアントRTは、これらの活性の1つ以上にインパクトを及ぼす変異を含み得る(これはこれらの活性を縮減もしくは増大させるか、またはこれはこれらの活性をすっかり消去するかどちらかである)。加えて、バリアントRTは、RTを多かれ少なかれ安定に、凝集をよりしにくくし、精製および/もしくは検出を容易化する1つ以上の変異、ならびに/または特性もしくは特徴の他の(other the)改変を含み得る。 In various embodiments, the reverse transcriptase can be a variant reverse transcriptase. As used herein, a "variant reverse transcriptase" refers to one or more mutations (single mutations, inversions, deletions, insertions, and rearrangements) relative to a reference sequence (e.g., reference wild-type sequence). including any naturally occurring or genetically engineered variant. RT naturally possesses several activities, including RNA-dependent DNA polymerase activity, ribonuclease H activity, and DNA-dependent DNA polymerase activity. Collectively, these activities enable the enzyme to convert single-stranded RNA into double-stranded cDNA. For retroviruses and retrotransposons, this cDNA can then be incorporated onto the host genome, from which new RNA copies can be made by host cell transcription. Variant RTs may contain mutations that impact one or more of these activities, either reducing or increasing these activities, or eliminating them altogether. In addition, a variant RT may contain one or more mutations that make the RT more or less stable, less prone to aggregation, easier to purify and/or detect, and/or other the alterations in properties or characteristics. may include.

当業者は、他の逆転写酵素(モロニーマウス白血病ウイルス(M-MLV);ヒト免疫不全ウイルス(HIV)逆転写酵素、およびトリ白血病・肉腫ウイルス(ASLV)逆転写酵素を包含するが、これらに限定されず、これはラウス肉腫ウイルス(RSV)逆転写酵素、トリ骨髄芽球症ウイルス(AMV)逆転写酵素、トリ赤芽球症ウイルス(AEV)ヘルパーウイルスMCAV逆転写酵素、トリ骨髄球腫症ウイルスMC29ヘルパーウイルスMCAV逆転写酵素、トリ細網内皮症ウイルス(REV-T)ヘルパーウイルスREV-A逆転写酵素、トリ肉腫ウイルスUR2ヘルパーウイルスUR2AV逆転写酵素、トリ肉腫ウイルスY73ヘルパーウイルスYAV逆転写酵素、ラウス随伴ウイルス(RAV)逆転写酵素、および骨髄芽球症関連ウイルス(MAV)逆転写酵素を包含するが、これらに限定されない)に由来するバリアント逆転写酵素が、本明細書に記載の対象の方法および組成物に好適に用いられ得るということを認識するであろう。 Those skilled in the art will appreciate that other reverse transcriptases, including Moloney murine leukemia virus (M-MLV); human immunodeficiency virus (HIV) reverse transcriptase, and avian leukemia-sarcoma virus (ASLV) reverse transcriptase, These include, but are not limited to, Rous sarcoma virus (RSV) reverse transcriptase, avian myeloblastosis virus (AMV) reverse transcriptase, avian erythroblastosis virus (AEV) helper virus MCAV reverse transcriptase, avian myelocytomatosis Virus MC29 helper virus MCAV reverse transcriptase, avian reticuloendotheliosis virus (REV-T) helper virus REV-A reverse transcriptase, avian sarcoma virus UR2 helper virus UR2AV reverse transcriptase, avian sarcoma virus Y73 helper virus YAV reverse transcriptase , Rous-associated virus (RAV) reverse transcriptase, and myeloblastosis-associated virus (MAV) reverse transcriptase) are the subject matter described herein. It will be appreciated that the present invention may be suitably used in methods and compositions of the invention.

バリアントRTを調製する1つの方法は、遺伝子改変によって(例えば、野生型逆転写酵素のDNA配列を改変することによって)である。DNA配列のランダムなおよび標的化された変異を許すいくつもの方法が当該技術分野において公知である(例えば、Ausubel et.al.Short Protocols in Molecular Biology(1995)3.sup.rd Ed.John Wiley & Sons,Inc.を見よ)。加えて、従来のおよびPCRに基づく方法両方を包含する部位特異的変異導入のためのいくつもの市販で利用可能なキットがある。例は、QuikChange部位特異的変異導入キット(AGILENT(登録商標))、Q5(登録商標)部位特異的変異導入キット(NEW ENGLAND BIOLABS(登録商標))、およびGeneArt(商標)部位特異的変異導入システム(THERMOFISHER SCIENTIFIC(登録商標))を包含する。 One way to prepare variant RTs is by genetic modification (eg, by modifying the DNA sequence of wild-type reverse transcriptase). A number of methods are known in the art that allow for random and targeted mutations of DNA sequences (e.g., Ausubel et.al.Short Protocols in Molecular Biology (1995)3.sup.rd Ed.John Wiley & (See Sons, Inc.). In addition, there are a number of commercially available kits for site-directed mutagenesis, including both conventional and PCR-based methods. Examples are the QuikChange site-directed mutagenesis kit (AGILENT®), the Q5® site-directed mutagenesis kit (NEW ENGLAND BIOLABS®), and the GeneArt® site-directed mutagenesis system. (THERMOFISHER SCIENTIFIC®).

加えて、変異体逆転写酵素が、挿入変異または短縮(N末端の、内部の、またはC末端の挿入または短縮)によって当業者に公知の方法論に従って生成され得る。本願において用いられる用語「変異」は、別の残基によるある配列、例えば核酸もしくはアミノ酸配列上の残基の置換、またはある配列上の1つ以上の残基の欠失もしくは挿入を言う。変異は、典型的には、元々の残基、次に配列上の残基の位置および新たに置換された残基のアイデンティティーを同定することによって本明細書に記載の。本願において提供されるアミノ酸置換(変異)を作るための種々の方法が当該技術分野において周知であり、例えばGreen and Sambrook,Molecular Cloning:A Laboratory Manual(4th ed.,Cold Spring Harbor Laboratory Press,Cold Spring Harbor,N.Y.(2012))によって提供される。変異は種々のカテゴリー、例えば1塩基多型、微小重複領域、インデル、および逆位を包含し得、決して限定することを意味されない。変異は、タンパク質活性を縮減または廃止する変異の正常の結果である「機能喪失」変異を包含し得る。ほとんどの機能喪失変異は劣性である。なぜなら、ヘテロ接合体では、第2の染色体コピーが完全に機能的なタンパク質をコードする遺伝子の未変異のバージョンを持ち、この存在が変異の効果を補償するからである。変異は、「機能獲得」変異をもまた包摂する。これは、正常な条件下ではさもなければ存在しない異常な活性をタンパク質または細胞に付与するものである。多くの機能獲得変異はコード領域よりもむしろ制御配列にあり、よって、いくつもの帰結を有し得る。例えば、変異は、1つ以上の遺伝子が間違った組織において発現されることに至り得、これらの組織は、それらが正常では欠く機能を獲得する。それらの性質ゆえに、機能獲得変異は通常は優性である。 In addition, variant reverse transcriptases can be generated by insertional mutagenesis or truncation (N-terminal, internal, or C-terminal insertions or truncation) according to methodologies known to those skilled in the art. The term "mutation" as used herein refers to the substitution of a residue on a sequence, such as a nucleic acid or amino acid sequence, by another residue, or the deletion or insertion of one or more residues on a sequence. Mutations are typically described herein by identifying the original residue, then the position of the residue on the sequence and the identity of the newly substituted residue. Various methods for making the amino acid substitutions (mutations) provided herein are well known in the art and are described, for example, in Green and Sambrook, Molecular Cloning: A Laboratory Manual (4th ed., Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y. (2012)). Mutations may encompass various categories, such as single nucleotide polymorphisms, microduplicated regions, indels, and inversions, and are not meant to be limiting in any way. Mutations can include "loss-of-function" mutations that are the normal result of mutations that reduce or abolish protein activity. Most loss-of-function mutations are recessive. This is because in a heterozygote, the second chromosome copy carries an unmutated version of the gene encoding a fully functional protein, and this presence compensates for the effects of the mutation. Mutations also encompass "gain-of-function" mutations. This confers on a protein or cell an abnormal activity that is not otherwise present under normal conditions. Many gain-of-function mutations are in regulatory sequences rather than coding regions and therefore can have a number of consequences. For example, mutations can lead to one or more genes being expressed in the wrong tissues, and these tissues acquire functions that they normally lack. Because of their nature, gain-of-function mutations are usually dominant.

当該技術分野で公知の部位特異的変異導入のより古い方法は、一本鎖DNA鋳型の単離を許すM13バクテリオファージベクターなどのベクター上への変異させられるべき配列のサブクローニングに依拠する。これらの方法では、変異誘発プライマー(すなわち、変異させられるべき部位にアニールすることができるが、変異させられるべき部位に1つ以上のミスマッチのヌクレオチドを持つプライマー)を一本鎖鋳型にアニーリングさせ、それから、変異誘発プライマーの3'端からスタートして鋳型の相補体を重合する。それから、もたらされた二重鎖はホスト細菌に形質転換され、プラークが所望の変異についてスクリーニングされる。 Older methods of site-directed mutagenesis known in the art rely on subcloning the sequence to be mutated onto a vector such as the M13 bacteriophage vector, which allows isolation of a single-stranded DNA template. In these methods, a mutagenic primer (i.e., a primer that is capable of annealing to the site to be mutated but has one or more mismatched nucleotides at the site to be mutated) is annealed to a single-stranded template; The complement of the template is then polymerized starting from the 3' end of the mutagenic primer. The resulting duplex is then transformed into host bacteria and plaques are screened for the desired mutations.

より最近では、部位特異的変異導入がPCR方法論を使用している。これらは一本鎖鋳型を要求しないという利点を有する。加えて、サブクローニングを要求しない方法が開発されている。PCRに基づく部位特異的変異導入が行われるときには、いくつかのイシューが考慮されなければならない。第1に、これらの方法では、ポリメラーゼによって導入される望まれない変異の拡張を防止するために、PCRサイクル数を縮減することが望ましい。第2に、反応中に残存する変異していない親の分子の数を縮減するために、セレクションが使用されなければならない。第3に、単一のPCRプライマーセットの使用を許すために、伸長された長さのPCR法が好ましい。そして第4に、いくつかの熱安定性ポリメラーゼの非鋳型依存的な末端伸長活性ゆえに、多くの場合には、PCRによって生成された変異体産物の平滑末端ライゲーションに先行して、端を磨くステップを手続きに組み込むことが必要である。 More recently, site-directed mutagenesis has used PCR methodology. These have the advantage of not requiring single-stranded templates. Additionally, methods have been developed that do not require subcloning. Several issues must be considered when PCR-based site-directed mutagenesis is performed. First, in these methods it is desirable to reduce the number of PCR cycles to prevent the expansion of unwanted mutations introduced by the polymerase. Second, selection must be used to reduce the number of unmutated parent molecules remaining in the reaction. Third, extended length PCR methods are preferred to allow the use of a single PCR primer set. And fourth, because of the non-template-dependent end extension activity of some thermostable polymerases, blunt-end ligation of PCR-generated mutant products is often preceded by an end-polishing step. It is necessary to incorporate this into the procedure.

ランダム変異導入の方法が当該技術分野に存在し、これらは1つ以上のランダムに所在する変異を持つ変異体のパネルをもたらすであろう。それから、変異体のかかるパネルは、所望の特性、例えば野生型逆転写酵素に対して相対的に増大した安定性を発揮するものについてスクリーニングされ得る。 Methods of random mutagenesis exist in the art and these will result in a panel of variants with one or more randomly located mutations. Such a panel of variants can then be screened for those that exhibit a desired property, such as increased stability relative to wild-type reverse transcriptase.

ランダムな変異導入のための方法の例はいわゆる「エラーを起こしやすいPCR法」である。名称が含意するとおり、方法は、DNAポリメラーゼが高忠実性組み込みを支持しない条件下において所与の配列を増幅する。エラーを起こしやすい組み込みを促す条件は異なるDNAポリメラーゼについて変わるが、当業者は所与の酵素についてかかる条件を決定し得る。増幅の忠実性においての多くのDNAポリメラーゼの鍵の変数は、例えば緩衝液中の二価金属イオンの型および濃度である。よって、マンガンイオンの使用および/またはマグネシウムもしくはマンガンイオン濃度のバリエーションが、ポリメラーゼのエラー率に影響するように適用され得る。 An example of a method for random mutation introduction is the so-called "error-prone PCR method". As the name implies, the method amplifies a given sequence under conditions where the DNA polymerase does not support high-fidelity integration. Conditions that promote error-prone integration will vary for different DNA polymerases, but one skilled in the art can determine such conditions for a given enzyme. A key variable for many DNA polymerases in the fidelity of amplification is, for example, the type and concentration of divalent metal ions in the buffer. Thus, the use of manganese ions and/or variations in magnesium or manganese ion concentrations can be applied to affect the error rate of the polymerase.

種々の側面では、プライム編集因子のRTは「エラーを起こしやすい」逆転写酵素バリアントであり得る。当該技術分野において公知および/または利用可能であるエラーを起こしやすい逆転写酵素が用いられ得る。逆転写酵素は天然にはいずれかのプルーフリーディング機能を有さず;それゆえに、逆転写酵素のエラー率はプルーフリーディング活性を含むDNAポリメラーゼよりも一般的に高いということは了解されるであろう。いずれかの具体的な逆転写酵素のエラー率は酵素の「忠実性」の特性であり、これはそのRNA鋳型に対してDNAの鋳型によって導かれる重合の正確度を表す。高忠実性を有するRTは低いエラー率を有する。反対に、低い忠実性を有するRTは高いエラー率を有する。M-MLVに基づく逆転写酵素の忠実性は、合成される15,000から27,000ヌクレオチドに1エラーの範囲のエラー率を有することが報告される。Boutabout et al.,“DNA synthesis fidelity by the reverse transcriptase of the yeast retrotransposon Ty1,”Nucleic Acids Res,2001,29:2217-2222を見よ。これは参照によって組み込まれる。それゆえに、この適用の目的には、「エラーを起こしやすい」であると考慮されるかまたは「エラーを起こしやすい忠実性」を有すると考慮される逆転写酵素は、合成される15,000ヌクレオチドに1つのエラー未満であるエラー率を有するものである。 In various aspects, the prime editing factor RT can be an "error-prone" reverse transcriptase variant. Any error-prone reverse transcriptase known and/or available in the art may be used. It will be appreciated that reverse transcriptase does not naturally have any proofreading function; therefore, the error rate of reverse transcriptase is generally higher than that of DNA polymerases that contain proofreading activity. . The error rate of any particular reverse transcriptase is a property of the enzyme's "fidelity," which represents the accuracy of polymerization directed by its DNA template relative to its RNA template. RTs with high fidelity have low error rates. Conversely, RTs with low fidelity have high error rates. The fidelity of reverse transcriptase based on M-MLV is reported to have error rates ranging from 1 error per 15,000 to 27,000 nucleotides synthesized. See Boutabout et al., “DNA synthesis fidelity by the reverse transcriptase of the yeast retrotransposon Ty1,” Nucleic Acids Res, 2001, 29:2217-2222. This is incorporated by reference. Therefore, for the purposes of this application, a reverse transcriptase that is considered "error-prone" or has "error-prone fidelity" has a have an error rate of less than one error.

エラーを起こしやすい逆転写酵素は、出発RT酵素(例えば、野生型M-MLV RT)の変異導入によってもまた生出され得る。変異導入の方法は限定されず、指向性進化プロセス、例えばファージによって補助される連続的進化(PACE)またはファージによって補助される非連続的進化(PANCE)を包含し得る。本願において用いられる用語「ファージによって補助される連続的進化(PACE)」は、ファージをウイルスベクターとして使用する連続的進化を言う。PACEテクノロジーの一般概念は、例えば、2010年3月11日にWO2010/028347として公開された2009年9月8日出願の国際PCT出願PCT/US2009/056194;2012年6月28日にWO2012/088381として公開された2011年12月22日出願の国際PCT出願PCT/US2011/066747;2015年5月5日登録のU.S.出願U.S.特許No.9,023,594、2015年9月11日にWO2015/134121として公開された2015年1月20日出願の国際PCT出願PCT/US2015/012022、および2016年10月20日にWO2016/168631として公開された2016年4月15日出願の国際PCT出願PCT/US2016/027795に記載されている。これらの夫々の内容全体は参照によって本願に組み込まれる。 Error-prone reverse transcriptases can also be generated by mutagenesis of the starting RT enzyme (eg, wild-type M-MLV RT). The method of mutagenesis is not limited and may include directed evolution processes, such as phage-assisted continuous evolution (PACE) or phage-assisted discontinuous evolution (PANCE). The term "phage-assisted continuous evolution (PACE)" as used herein refers to continuous evolution using phages as viral vectors. The general concept of PACE technology is e.g. international PCT application PCT/US2009/056194 filed September 8, 2009, published as WO2010/028347 on March 11, 2010; WO2012/088381 filed June 28, 2012. International PCT Application PCT/US2011/066747 filed December 22, 2011; U.S. Application U.S. Patent No. 9,023,594 filed May 5, 2015; published September 11, 2015 as WO2015/134121; International PCT Application PCT/US2015/012022, filed on January 20, 2015, and International PCT Application PCT/US2016/027795, filed on April 15, 2016, published as WO2016/168631 on October 20, 2016. Are listed. The entire contents of each of these are incorporated herein by reference.

エラーを起こしやすい逆転写酵素は、「ファージによって補助される非連続的進化(PANCE)」によってもまた得られ得る。本願において用いられるこれは、ファージをウイルスベクターとして使用する非連続的進化を言う。PANCEは急速なインビボの指向性進化のための単純化された技術であり、新しいE.coliホスト細胞による進化させられるべき目当ての遺伝子を含有する進化する「セレクションファージ」(SP)の連続フラスコ植え継ぎを用い、それによって、ホストE.coli内の遺伝子が一定に保たれることを許しながら、SPに含有される遺伝子は連続的に進化する。連続フラスコ植え継ぎは微生物の実験室進化のための広くアクセス可能なアプローチとして長く用をなしており、より最近では、バクテリオファージ進化のための類縁のアプローチが開発されている。PANCEシステムはPACEシステムよりも低いストリンジェンシーを特色とする。 Error-prone reverse transcriptases can also be obtained by "phage-assisted discontinuous evolution (PANCE)." As used herein, this refers to discontinuous evolution using phages as viral vectors. PANCE is a simplified technique for rapid in vivo directed evolution, in which serial flask planting of evolving "selection phages" (SPs) containing the genes of interest to be evolved by new E. coli host cells Using splicing, the genes contained in the SP evolve continuously while allowing the genes in the host E. coli to remain constant. Serial flask transfer has long served as a widely accessible approach for the laboratory evolution of microorganisms, and more recently, a related approach for bacteriophage evolution has been developed. The PANCE system features lower stringency than the PACE system.

他のエラーを起こしやすい逆転写酵素が文献に記載されている。これらの夫々は本願の方法および組成物への使用を企図される。例えば、エラーを起こしやすい逆転写酵素は、Bebenek et al.,“Error-prone Polymerization by HIV-1 Reverse Transcriptase,”J Biol Chem,1993,Vol.268:10324-10334およびSebastian-Martin et al.,“Transcriptional inaccuracy threshold attenuates differences in RNA-dependent DNA synthesis fidelity between retroviral reverse transcriptases,”Scientific Reports,2018,Vol.8:627に記載されている。これらの夫々は参照によって組み込まれる。なお、さらに、エラーを起こしやすい逆転写酵素を包含する逆転写酵素は市販のサプライヤーから得られ得、全てNEW ENGLAND BIOLABS(登録商標)からのProtoScript(登録商標)(II)逆転写酵素、AMV逆転写酵素、WarmStart(登録商標)逆転写酵素、およびM-MuLV逆転写酵素、または全てTAKARA BIO USA,INC.(以前はCLONTECH)からのAMV逆転写酵素XL、SMARTScribe逆転写酵素、GPRウルトラピュアMMLV逆転写酵素を包含する。 Other error-prone reverse transcriptases have been described in the literature. Each of these is contemplated for use in the methods and compositions of the present application. For example, error-prone reverse transcriptases include Bebenek et al., “Error-prone Polymerization by HIV-1 Reverse Transcriptase,” J Biol Chem, 1993, Vol. 268:10324-10334 and Sebastian-Martin et al., Described in “Transcriptional inaccuracy threshold attenuates differences in RNA-dependent DNA synthesis fidelity between retroviral reverse transcriptases,” Scientific Reports, 2018, Vol. 8:627. Each of these is incorporated by reference. Additionally, reverse transcriptases, including error-prone reverse transcriptases, can be obtained from commercial suppliers, including ProtoScript® (II) Reverse Transcriptase, AMV Reverse, all from NEW ENGLAND BIOLABS®. Transcriptase, WarmStart® Reverse Transcriptase, and M-MuLV Reverse Transcriptase, or AMV Reverse Transcriptase XL, SMARTScribe Reverse Transcriptase, GPR Ultra Pure MMLV, all from TAKARA BIO USA, INC. (formerly CLONTECH) Includes reverse transcriptase.

本願の開示はRNaseHドメインに変異を有する逆転写酵素をもまた企図する。上で言及されているとおり、逆転写酵素の本来的な特性の1つはRNase H活性であり、これはRNA:cDNAハイブリッドのRNA鋳型を重合と同時的に切断する。RNA鋳型が全長の逆転写の完了前に分解され得るので、RNase H活性は長いcDNAの合成にとっては望ましくなくあり得る。おそらくは酵素のポリメラーゼ活性とのその競合を原因として、RNase H活性は逆転写効率をもまた低下させ得る。それゆえに、本開示は改変されたRNaseH活性を含むいずれかの逆転写酵素バリアントを企図する。 The present disclosure also contemplates reverse transcriptases having mutations in the RNaseH domain. As mentioned above, one of the inherent properties of reverse transcriptase is its RNase H activity, which cleaves the RNA template of RNA:cDNA hybrids simultaneously with polymerization. RNase H activity may be undesirable for the synthesis of long cDNAs because the RNA template may be degraded before full-length reverse transcription is complete. RNase H activity can also reduce reverse transcription efficiency, possibly due to its competition with the enzyme's polymerase activity. Therefore, this disclosure contemplates any reverse transcriptase variants that include altered RNaseH activity.

本願の開示は、RNA依存性DNAポリメラーゼドメインに変異を有する逆転写酵素をもまた企図する。上で言及されているとおり、逆転写酵素の本来的な特性の1つはRNA依存性DNAポリメラーゼ活性である。これは、RNA:cDNAハイブリッドの鋳型RNA鎖によってコードされる新生cDNA鎖に核酸塩基を組み込む。RNA依存性DNAポリメラーゼ活性は、酵素の処理能力を増大させるかまたは減少させるかどちらかのために(すなわち、その組み込み速度の観点から)増大または減少させられ得る。それゆえに、本開示は、酵素の処理能力が(of)未改変のバージョンに対して相対的に増大させられるかまたは減少させられるかどちらかのようにして、改変されたRNA依存性DNAポリメラーゼ活性を含むいずれかの逆転写酵素バリアントを企図する。 This disclosure also contemplates reverse transcriptases having mutations in the RNA-dependent DNA polymerase domain. As mentioned above, one of the inherent properties of reverse transcriptase is RNA-dependent DNA polymerase activity. This incorporates the nucleobase into the nascent cDNA strand encoded by the template RNA strand of the RNA:cDNA hybrid. RNA-dependent DNA polymerase activity can be increased or decreased to either increase or decrease the processivity of the enzyme (ie, in terms of its rate of incorporation). Therefore, the present disclosure discloses modified RNA-dependent DNA polymerase activity such that the processivity of the enzyme is either increased or decreased relative to the unmodified version. Any reverse transcriptase variant containing is contemplated.

変改された熱安定性特徴を有する逆転写酵素バリアントもまた本願において企図される。逆転写酵素が高い温度に耐える能力はcDNA合成の重要な側面である。上昇した反応温度は、強い二次構造および/または高いGC含量を有するRNAを変性することを助け、逆転写酵素が配列を読み通すことを許す。結果として、より高い温度における逆転写は全長cDNA合成およびより高い収量を可能化し、これはプライム編集プロセスの結果としての3'フラップssDNAの改善された生成に至り得る。野生型M-MLV逆転写酵素は典型的には37-48℃の範囲に至適温度を有する;しかしながら、49℃、50℃、51℃、52℃、53℃、54℃、55℃、56℃、57℃、58℃、59℃、60℃、61℃、62℃、63℃、64℃、65℃、66℃、およびより高くを包含する48℃超のより高い温度において逆転写活性を許す変異が導入され得る。 Reverse transcriptase variants with altered thermostability characteristics are also contemplated herein. The ability of reverse transcriptase to withstand high temperatures is an important aspect of cDNA synthesis. Elevated reaction temperature helps denature RNA with strong secondary structure and/or high GC content, allowing reverse transcriptase to read through the sequence. As a result, reverse transcription at higher temperatures allows full-length cDNA synthesis and higher yields, which can lead to improved generation of 3' flap ssDNA as a result of the prime editing process. Wild-type M-MLV reverse transcriptase typically has a temperature optimum in the range 37-48 °C; however, 49 °C, 50 °C, 51 °C, 52 °C, 53 °C, 54 °C, 55 °C, 56 °C reverse transcription activity at higher temperatures above 48°C, including 57°C, 58°C, 59°C, 60°C, 61°C, 62°C, 63°C, 64°C, 65°C, 66°C, and higher. Forgiving mutations can be introduced.

エラーを起こしやすいRT、熱安定性RT、処理能力増大RTを包含する本願において企図されるバリアント逆転写酵素は、変異導入または進化プロセスを包含する種々のルーチン戦略によって操作され得る。いくつかのケースでは、バリアントは単一の変異を導入することによって生じ得る。他のケースでは、バリアントは1つよりも多くの変異を要求し得る。1つよりも多くの変異を含む変異体では、所与の変異の効果は、具体的な変異体によって持たれる他の変異からは単離して、部位特異的変異導入による野生型遺伝子への同定された変異の導入によって評価され得る。それから、それゆえに生じた一重変異体のスクリーニングアッセイは、その変異単独の効果の決定を許すであろう。 Variant reverse transcriptases contemplated herein, including error-prone RTs, thermostable RTs, throughput-enhancing RTs, can be engineered by a variety of routine strategies, including mutagenesis or evolutionary processes. In some cases, variants can be generated by introducing a single mutation. In other cases, a variant may require more than one mutation. In mutants containing more than one mutation, the effects of a given mutation can be isolated from other mutations carried by a particular mutant and identified on the wild-type gene by site-directed mutagenesis. This can be evaluated by the introduction of mutations. Screening assays for the single mutants thus generated will then allow determination of the effect of that mutation alone.

本願において用いられるバリアントRT酵素は、本願において開示もしくは企図されるかまたは当該技術分野で公知のいずれかの野生型RTまたは変異体RTまたはフラグメントRTまたはRTの他のバリアントを包含するいずれかの参照RTタンパク質と少なくとも約70%同一、少なくとも約80%同一、少なくとも約90%同一、少なくとも約95%同一、少なくとも約96%同一、少なくとも約97%同一、少なくとも約98%同一、少なくとも約99%同一、少なくとも約99.5%同一、または少なくとも約99.9%同一である他の「RTバリアント」をもまた包含し得る。 Variant RT enzymes as used in this application refer to any reference including any wild-type RT or mutant RT or fragment RT or other variants of RT disclosed or contemplated in this application or known in the art. At least about 70% identical, at least about 80% identical, at least about 90% identical, at least about 95% identical, at least about 96% identical, at least about 97% identical, at least about 98% identical, at least about 99% identical to RT protein Other "RT variants" that are at least about 99.5% identical, or at least about 99.9% identical may also be included.

いくつかの態様では、RTバリアントは、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、21、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、または最高で100、または最高で200、または最高で300、または最高で400、または最高で500、またはより多くのアミノ酸変化を、参照RTと比較して有し得る。いくつかの態様では、フラグメントが参照RTの対応するフラグメントと少なくとも約70%同一、少なくとも約80%同一、少なくとも約90%同一、少なくとも約95%同一、少なくとも約96%同一、少なくとも約97%同一、少なくとも約98%同一、少なくとも約99%同一、少なくとも約99.5%同一、または少なくとも約99.9%同一であるようにして、RTバリアントは参照RTのフラグメントを含む。いくつかの態様では、フラグメントは、対応する野生型RT(M-MLV逆転写酵素)(例えば、配列番号89)または配列番号90-100の逆転写酵素のいずれかのアミノ酸長さの少なくとも30%、少なくとも35%、少なくとも40%、少なくとも45%、少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%同一、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも99.5%である。 In some embodiments, the RT variant is 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 21, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, or up to 100, or up to 200, or up to 300, or up to 400, or up to 500, or more amino acid changes compared to the reference RT. It is possible. In some embodiments, the fragment is at least about 70% identical, at least about 80% identical, at least about 90% identical, at least about 95% identical, at least about 96% identical, at least about 97% identical to the corresponding fragment of the reference RT. , at least about 98% identical, at least about 99% identical, at least about 99.5% identical, or at least about 99.9% identical, an RT variant comprises a fragment of a reference RT. In some embodiments, the fragment is at least 30% of the amino acid length of either the corresponding wild type RT (M-MLV reverse transcriptase) (e.g., SEQ ID NO: 89) or the reverse transcriptase of SEQ ID NO: 90-100. , at least 35%, at least 40%, at least 45%, at least 50%, at least 55%, at least 60%, at least 65%, at least 70%, at least 75%, at least 80%, at least 85%, at least 90%, at least 95% identical, at least 96%, at least 97%, at least 98%, at least 99%, or at least 99.5%.

いくつかの態様では、本開示は、それらの機能性を保持し、かついずれかの本明細書に開示のRTタンパク質のフラグメントであるRTフラグメントをもまた利用し得る。いくつかの態様では、RTフラグメントは長さが少なくとも100アミノ酸である。いくつかの態様では、フラグメントは長さが少なくとも100、150、200、250、300、350、400、450、500、550、もしくは最高で600、またはより多くのアミノ酸である。 In some embodiments, the present disclosure may also utilize RT fragments that retain their functionality and are fragments of any of the RT proteins disclosed herein. In some embodiments, the RT fragment is at least 100 amino acids in length. In some embodiments, the fragment is at least 100, 150, 200, 250, 300, 350, 400, 450, 500, 550, or up to 600, or more amino acids in length.

なお他の態様において、本開示は、N末端もしくはC末端または両方がある種のアミノ酸数だけ短縮されているRTバリアントをもまた利用し得、これは、なお十分なポリメラーゼ機能を保持する短縮バリアントをもたらす。いくつかの態様では、RT短縮バリアントは、少なくとも1、少なくとも2、少なくとも3、少なくとも4、少なくとも5、少なくとも6、少なくとも7、少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも16、少なくとも17、少なくとも18、少なくとも19、少なくとも20、少なくとも21、少なくとも22、少なくとも23、少なくとも24、少なくとも25、少なくとも30、40、50、60、70、80、90、100、110、120、130、140、150、160、170、180、190、200、210、220、230、240、または250アミノ酸の短縮を、タンパク質のN末端の端に有する。他の態様において、RT短縮バリアントは、少なくとも1、少なくとも2、少なくとも3、少なくとも4、少なくとも5、少なくとも6、少なくとも7、少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも16、少なくとも17、少なくとも18、少なくとも19、少なくとも20、少なくとも21、少なくとも22、少なくとも23、少なくとも24、少なくとも25、少なくとも30、40、50、60、70、80、90、100、110、120、130、140、150、160、170、180、190、200、210、220、230、240、または250アミノ酸の短縮を、タンパク質のC末端の端に有する。なお他の態様において、RT短縮バリアントは同じかまたは異なる長さである短縮をN末端およびC末端の端に有する。 In yet other embodiments, the present disclosure may also utilize RT variants in which the N-terminus or the C-terminus, or both, are truncated by a certain number of amino acids, which is a truncated variant that still retains sufficient polymerase function. bring about. In some embodiments, the RT shortening variant is at least 1, at least 2, at least 3, at least 4, at least 5, at least 6, at least 7, at least 8, at least 9, at least 10, at least 11, at least 12, at least 13, At least 14, at least 15, at least 16, at least 17, at least 18, at least 19, at least 20, at least 21, at least 22, at least 23, at least 24, at least 25, at least 30, 40, 50, 60, 70, 80, 90 , 100, 110, 120, 130, 140, 150, 160, 170, 180, 190, 200, 210, 220, 230, 240, or 250 amino acid truncations at the N-terminal end of the protein. In other embodiments, the RT shortening variant is at least 1, at least 2, at least 3, at least 4, at least 5, at least 6, at least 7, at least 8, at least 9, at least 10, at least 11, at least 12, at least 13, at least 14, at least 15, at least 16, at least 17, at least 18, at least 19, at least 20, at least 21, at least 22, at least 23, at least 24, at least 25, at least 30, 40, 50, 60, 70, 80, 90, A truncation of 100, 110, 120, 130, 140, 150, 160, 170, 180, 190, 200, 210, 220, 230, 240, or 250 amino acids at the C-terminal end of the protein. In still other embodiments, the RT truncation variants have truncations at the N-terminal and C-terminal ends that are the same or different lengths.

例えば、本明細書に開示のプライム編集因子は、M-MLV逆転写酵素の短縮されたバージョンを包含し得る。この態様では、逆転写酵素は4つの変異を含有する(D200N、T306K、W313F、T330P;PE2に存在するL603W変異は短縮を原因としてもはや存在しないということに注意)。この短縮された編集因子をコードするDNA配列は、PE2よりも522bp小さく、よって、DNA配列の送達がそのサイズを原因として難しい適用(すなわち、アデノ随伴ウイルスおよびレンチウイルス送達)にとってそれを可能性として有用にする。この態様はMMLV-RT(trunc)と言われ、次のアミノ酸配列を有する:

Figure 2020191234000078
For example, the prime editing factors disclosed herein can include truncated versions of M-MLV reverse transcriptase. In this embodiment, the reverse transcriptase contains four mutations (D200N, T306K, W313F, T330P; note that the L603W mutation present in PE2 is no longer present due to truncation). The DNA sequence encoding this truncated editing factor is 522 bp smaller than PE2, thus making it a potential for applications where delivery of the DNA sequence is difficult due to its size (i.e., adeno-associated virus and lentivirus delivery). Make useful. This embodiment is called MMLV-RT(trunc) and has the following amino acid sequence:
Figure 2020191234000078

種々の態様において、本明細書に開示のプライム編集因子は、本明細書に記載のRTバリアントの1つ、またはいずれかの参照Cas9バリアントと少なくとも約70%同一、少なくとも約80%同一、少なくとも約90%同一、少なくとも約95%同一、少なくとも約96%同一、少なくとも約97%同一、少なくとも約98%同一、少なくとも約99%同一、少なくとも約99.5%同一、または少なくとも約99.9%同一であるそのRTバリアントを含み得る。 In various embodiments, the prime editing factors disclosed herein are at least about 70% identical, at least about 80% identical, at least about That RT that is 90% identical, at least about 95% identical, at least about 96% identical, at least about 97% identical, at least about 98% identical, at least about 99% identical, at least about 99.5% identical, or at least about 99.9% identical May contain variants.

なお他の態様において、本方法および組成物は、Effefson et al.,“Synthetic evolutionary origin of a proofreading reverse transcriptase,”Science,June 24,2016,Vol.352:1590-1593に記載されているとおり、逆転写酵素へと進化させられたDNAポリメラーゼを利用し得る。これの内容は参照によって本願に組み込まれる。 In still other embodiments, the methods and compositions are as described in Effefson et al., “Synthetic evolutionary origin of a proofreading reverse transcriptase,” Science, June 24, 2016, Vol. 352:1590-1593. DNA polymerases evolved into reverse transcriptases can be used. The contents of which are incorporated into this application by reference.

ある種の他の態様において、逆転写酵素は、napDNAbpをもまた含む融合タンパク質の構成要素として提供される。換言すると、いくつかの態様では、逆転写酵素は融合タンパク質としてnapDNAbpに融合される。 In certain other embodiments, reverse transcriptase is provided as a component of a fusion protein that also includes napDNAbp. In other words, in some embodiments, reverse transcriptase is fused to napDNAbp as a fusion protein.

種々の態様において、バリアント逆転写酵素は配列番号89によって表される野生型M-MLV逆転写酵素から操作され得る。 In various embodiments, variant reverse transcriptases can be engineered from the wild-type M-MLV reverse transcriptase represented by SEQ ID NO:89.

種々の態様において、本明細書に記載のプライム編集因子(RTが融合パートナーとしてまたはトランスでどちらかで提供される)は、次の変異の1つ以上を含むバリアントRTを包含し得る:配列番号89の野生型M-MLV RTにおけるまたは別の野生型RTポリペプチド配列上の対応するアミノ酸位置におけるP51L、S67K、E69K、L139P、T197A、D200N、H204R、F209N、E302K、E302R、T306K、F309N、W313F、T330P、L345G、L435G、N454K、D524G、E562Q、D583N、H594Q、L603W、E607K、またはD653N。 In various embodiments, the prime editing factors described herein (wherein the RT is provided either as a fusion partner or in trans) can include variant RTs that include one or more of the following mutations: SEQ ID NO: P51L, S67K, E69K, L139P, T197A, D200N, H204R, F209N, E302K, E302R, T306K, F309N, W313F in the wild-type M-MLV RT of 89 or at the corresponding amino acid position on another wild-type RT polypeptide sequence , T330P, L345G, L435G, N454K, D524G, E562Q, D583N, H594Q, L603W, E607K, or D653N.

本開示の種々の態様に従ってnapDNAbpタンパク質に融合または個々のタンパク質として提供され得るいくつかの例示の逆転写酵素が、下で提供される。例示の逆転写酵素は、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、または少なくとも99%配列同一性を次の野生型酵素または部分的な酵素に対して有するバリアントを包含する:

Figure 2020191234000079
Figure 2020191234000080
Figure 2020191234000081
Figure 2020191234000082
Figure 2020191234000083
Figure 2020191234000084
Some exemplary reverse transcriptases that can be fused to napDNAbp proteins or provided as individual proteins according to various aspects of this disclosure are provided below. Exemplary reverse transcriptases include variants having at least 80%, at least 85%, at least 90%, at least 95%, or at least 99% sequence identity to the following wild-type enzymes or partial enzymes:
Figure 2020191234000079
Figure 2020191234000080
Figure 2020191234000081
Figure 2020191234000082
Figure 2020191234000083
Figure 2020191234000084

種々の他の態様において、本明細書に記載のプライム編集因子(RTが融合パートナーとしてまたはトランスでどちらかで提供される)は、次の変異の1つ以上を含むバリアントRTを包含し得る:配列番号89の野生型M-MLV RTにおけるまたは別の野生型RTポリペプチド配列上の対応するアミノ酸位置におけるP51X、S67X、E69X、L139X、T197X、D200X、H204X、F209X、E302X、T306X、F309X、W313X、T330X、L345X、L435X、N454X、D524X、E562X、D583X、H594X、L603X、E607X、またはD653Xであって、「X」はいずれかのアミノ酸であり得る。 In various other embodiments, the primed editing factors described herein (wherein the RT is provided either as a fusion partner or in trans) can include variant RTs that contain one or more of the following mutations: P51X, S67X, E69X, L139X, T197X, D200X, H204X, F209X, E302X, T306X, F309X, W313X, T330X, L345X, L435X, N454X, D524X, E562X, D583X, H594X, L603X, E607X, or D653X at the corresponding amino acid positions in the wild-type M-MLV RT of SEQ ID NO:89 or on another wild-type RT polypeptide sequence, where "X" can be any amino acid.

種々の他の態様において、本明細書に記載のプライム編集因子(RTが融合パートナーとしてまたはトランスでどちらかで提供される)は、配列番号89の野生型M-MLV RTにおけるまたは別の野生型RTポリペプチド配列上の対応するアミノ酸位置におけるP51X変異を含むバリアントRTを包含し得、「X」はいずれかのアミノ酸であり得る。ある態様において、XはLである。 In various other embodiments, the prime editing factors described herein (wherein the RT is provided either as a fusion partner or in trans) are primed in the wild-type M-MLV RT of SEQ ID NO: 89 or in another wild-type Variant RTs may be included that include a P51X mutation at the corresponding amino acid position on the RT polypeptide sequence, where "X" can be any amino acid. In certain embodiments, X is L.

種々の他の態様において、本明細書に記載のプライム編集因子(RTが融合パートナーとしてまたはトランスでどちらかで提供される)は、配列番号89の野生型M-MLV RTにおけるまたは別の野生型RTポリペプチド配列上の対応するアミノ酸位置におけるS67X変異を含むバリアントRTを包含し得、「X」はいずれかのアミノ酸であり得る。ある態様において、XはKである。 In various other embodiments, the prime editing factors described herein (wherein the RT is provided either as a fusion partner or in trans) are primed in the wild-type M-MLV RT of SEQ ID NO: 89 or in another wild-type Variant RTs containing the S67X mutation at the corresponding amino acid position on the RT polypeptide sequence may be included, where "X" can be any amino acid. In certain embodiments, X is K.

種々の他の態様において、本明細書に記載のプライム編集因子(RTが融合パートナーとしてまたはトランスでどちらかで提供される)は、配列番号89の野生型M-MLV RTにおけるまたは別の野生型RTポリペプチド配列上の対応するアミノ酸位置におけるE69X変異を含むバリアントRTを包含し得、「X」はいずれかのアミノ酸であり得る。ある態様において、XはKである。 In various other embodiments, a primed editing factor described herein (wherein RT is provided either as a fusion partner or in trans) can include a variant RT that includes an E69X mutation at the corresponding amino acid position in the wild-type M-MLV RT of SEQ ID NO:89 or on another wild-type RT polypeptide sequence, where "X" can be any amino acid. In some embodiments, X is K.

種々の他の態様において、本明細書に記載のプライム編集因子(RTが融合パートナーとしてまたはトランスでどちらかで提供される)は、配列番号89の野生型M-MLV RTにおけるまたは別の野生型RTポリペプチド配列上の対応するアミノ酸位置におけるL139X変異を含むバリアントRTを包含し得、「X」はいずれかのアミノ酸であり得る。ある態様において、XはPである。 In various other embodiments, the prime editing factors described herein (wherein the RT is provided either as a fusion partner or in trans) are primed in the wild-type M-MLV RT of SEQ ID NO: 89 or in another wild-type Variant RTs containing the L139X mutation at the corresponding amino acid position on the RT polypeptide sequence can be included, where "X" can be any amino acid. In certain embodiments, X is P.

種々の他の態様において、本明細書に記載のプライム編集因子(RTが融合パートナーとしてまたはトランスでどちらかで提供される)は、配列番号89の野生型M-MLV RTにおけるまたは別の野生型RTポリペプチド配列上の対応するアミノ酸位置におけるT197X変異を含むバリアントRTを包含し得、「X」はいずれかのアミノ酸であり得る。ある態様において、XはAである。 In various other embodiments, the prime editing factors described herein (wherein the RT is provided either as a fusion partner or in trans) are primed in the wild-type M-MLV RT of SEQ ID NO: 89 or in another wild-type Variant RTs can be included that include a T197X mutation at the corresponding amino acid position on the RT polypeptide sequence, where "X" can be any amino acid. In certain embodiments, X is A.

種々の他の態様において、本明細書に記載のプライム編集因子(RTが融合パートナーとしてまたはトランスでどちらかで提供される)は、配列番号89の野生型M-MLV RTにおけるまたは別の野生型RTポリペプチド配列上の対応するアミノ酸位置におけるD200X変異を含むバリアントRTを包含し得、「X」はいずれかのアミノ酸であり得る。ある態様において、XはNである。 In various other embodiments, a primed editing factor described herein (wherein RT is provided either as a fusion partner or in trans) can include a variant RT that includes a D200X mutation at the corresponding amino acid position in the wild-type M-MLV RT of SEQ ID NO:89 or on another wild-type RT polypeptide sequence, where "X" can be any amino acid. In some embodiments, X is N.

種々の他の態様において、本明細書に記載のプライム編集因子(RTが融合パートナーとしてまたはトランスでどちらかで提供される)は、配列番号89の野生型M-MLV RTにおけるまたは別の野生型RTポリペプチド配列上の対応するアミノ酸位置におけるH204X変異を含むバリアントRTを包含し得、「X」はいずれかのアミノ酸であり得る。ある態様において、XはRである。 In various other embodiments, the prime editing factors described herein (wherein the RT is provided either as a fusion partner or in trans) are primed in the wild-type M-MLV RT of SEQ ID NO: 89 or in another wild-type Variant RTs can be included that include a H204X mutation at the corresponding amino acid position on the RT polypeptide sequence, where "X" can be any amino acid. In certain embodiments, X is R.

種々の他の態様において、本明細書に記載のプライム編集因子(RTが融合パートナーとしてまたはトランスでどちらかで提供される)は、配列番号89の野生型M-MLV RTにおけるまたは別の野生型RTポリペプチド配列上の対応するアミノ酸位置におけるF209X変異を含むバリアントRTを包含し得、「X」はいずれかのアミノ酸であり得る。ある態様において、XはNである。 In various other embodiments, the prime editing factors described herein (wherein the RT is provided either as a fusion partner or in trans) are primed in the wild-type M-MLV RT of SEQ ID NO: 89 or in another wild-type Variant RTs can be included that include a F209X mutation at the corresponding amino acid position on the RT polypeptide sequence, where "X" can be any amino acid. In certain embodiments, X is N.

種々の他の態様において、本明細書に記載のプライム編集因子(RTが融合パートナーとしてまたはトランスでどちらかで提供される)は、配列番号89の野生型M-MLV RTにおけるまたは別の野生型RTポリペプチド配列上の対応するアミノ酸位置におけるE302X変異を含むバリアントRTを包含し得、「X」はいずれかのアミノ酸であり得る。ある態様において、XはKである。 In various other embodiments, a primed editing factor described herein (wherein RT is provided either as a fusion partner or in trans) can include a variant RT that includes an E302X mutation at the corresponding amino acid position in the wild-type M-MLV RT of SEQ ID NO:89 or on another wild-type RT polypeptide sequence, where "X" can be any amino acid. In some embodiments, X is K.

種々の他の態様において、本明細書に記載のプライム編集因子(RTが融合パートナーとしてまたはトランスでどちらかで提供される)は、配列番号89の野生型M-MLV RTにおけるまたは別の野生型RTポリペプチド配列上の対応するアミノ酸位置におけるE302X変異を含むバリアントRTを包含し得、「X」はいずれかのアミノ酸であり得る。ある態様において、XはRである。 In various other embodiments, the prime editing factors described herein (wherein the RT is provided either as a fusion partner or in trans) are primed in the wild-type M-MLV RT of SEQ ID NO: 89 or in another wild-type Variant RTs can be included that include the E302X mutation at the corresponding amino acid position on the RT polypeptide sequence, where "X" can be any amino acid. In certain embodiments, X is R.

種々の他の態様において、本明細書に記載のプライム編集因子(RTが融合パートナーとしてまたはトランスでどちらかで提供される)は、配列番号89の野生型M-MLV RTにおけるまたは別の野生型RTポリペプチド配列上の対応するアミノ酸位置におけるT306X変異を含むバリアントRTを包含し得、「X」はいずれかのアミノ酸であり得る。ある態様において、XはKである。 In various other embodiments, the prime editing factors described herein (wherein the RT is provided either as a fusion partner or in trans) are primed in the wild-type M-MLV RT of SEQ ID NO: 89 or in another wild-type Variant RTs can be included that include a T306X mutation at the corresponding amino acid position on the RT polypeptide sequence, where "X" can be any amino acid. In certain embodiments, X is K.

種々の他の態様において、本明細書に記載のプライム編集因子(RTが融合パートナーとしてまたはトランスでどちらかで提供される)は、配列番号89の野生型M-MLV RTにおけるまたは別の野生型RTポリペプチド配列上の対応するアミノ酸位置におけるF309X変異を含むバリアントRTを包含し得、「X」はいずれかのアミノ酸であり得る。ある態様において、XはNである。 In various other embodiments, the prime editing factors described herein (wherein the RT is provided either as a fusion partner or in trans) are primed in the wild-type M-MLV RT of SEQ ID NO: 89 or in another wild-type Variant RTs can be included that include a F309X mutation at the corresponding amino acid position on the RT polypeptide sequence, where "X" can be any amino acid. In certain embodiments, X is N.

種々の他の態様において、本明細書に記載のプライム編集因子(RTが融合パートナーとしてまたはトランスでどちらかで提供される)は、配列番号89の野生型M-MLV RTにおけるまたは別の野生型RTポリペプチド配列上の対応するアミノ酸位置におけるW313X変異を含むバリアントRTを包含し得、「X」はいずれかのアミノ酸であり得る。ある態様において、XはFである。 In various other embodiments, the prime editing factors described herein (wherein the RT is provided either as a fusion partner or in trans) are primed in the wild-type M-MLV RT of SEQ ID NO: 89 or in another wild-type Variant RTs can be included that include a W313X mutation at the corresponding amino acid position on the RT polypeptide sequence, where "X" can be any amino acid. In certain embodiments, X is F.

種々の他の態様において、本明細書に記載のプライム編集因子(RTが融合パートナーとしてまたはトランスでどちらかで提供される)は、配列番号89の野生型M-MLV RTにおけるまたは別の野生型RTポリペプチド配列上の対応するアミノ酸位置におけるT330X変異を含むバリアントRTを包含し得、「X」はいずれかのアミノ酸であり得る。ある態様において、XはPである。 In various other embodiments, the prime editing factors described herein (wherein the RT is provided either as a fusion partner or in trans) are primed in the wild-type M-MLV RT of SEQ ID NO: 89 or in another wild-type Variant RTs can be included that include a T330X mutation at the corresponding amino acid position on the RT polypeptide sequence, where "X" can be any amino acid. In certain embodiments, X is P.

種々の他の態様において、本明細書に記載のプライム編集因子(RTが融合パートナーとしてまたはトランスでどちらかで提供される)は、配列番号89の野生型M-MLV RTにおけるまたは別の野生型RTポリペプチド配列上の対応するアミノ酸位置におけるL345X変異を含むバリアントRTを包含し得、「X」はいずれかのアミノ酸であり得る。ある態様において、XはGである。 In various other embodiments, a primed editing factor described herein (wherein RT is provided either as a fusion partner or in trans) can include a variant RT that includes an L345X mutation at the corresponding amino acid position in the wild-type M-MLV RT of SEQ ID NO:89 or on another wild-type RT polypeptide sequence, where "X" can be any amino acid. In some embodiments, X is G.

種々の他の態様において、本明細書に記載のプライム編集因子(RTが融合パートナーとしてまたはトランスでどちらかで提供される)は、配列番号89の野生型M-MLV RTにおけるまたは別の野生型RTポリペプチド配列上の対応するアミノ酸位置におけるL435X変異を含むバリアントRTを包含し得、「X」はいずれかのアミノ酸であり得る。ある態様において、XはGである。 In various other embodiments, the prime editing factors described herein (wherein the RT is provided either as a fusion partner or in trans) are primed in the wild-type M-MLV RT of SEQ ID NO: 89 or in another wild-type Variant RTs can be included that include the L435X mutation at the corresponding amino acid position on the RT polypeptide sequence, where "X" can be any amino acid. In certain embodiments, X is G.

種々の他の態様において、本明細書に記載のプライム編集因子(RTが融合パートナーとしてまたはトランスでどちらかで提供される)は、配列番号89の野生型M-MLV RTにおけるまたは別の野生型RTポリペプチド配列上の対応するアミノ酸位置におけるN454X変異を含むバリアントRTを包含し得、「X」はいずれかのアミノ酸であり得る。ある態様において、XはKである。 In various other embodiments, a primed editing factor described herein (wherein RT is provided either as a fusion partner or in trans) can include a variant RT that includes an N454X mutation at the corresponding amino acid position in the wild-type M-MLV RT of SEQ ID NO:89 or on another wild-type RT polypeptide sequence, where "X" can be any amino acid. In some embodiments, X is K.

種々の他の態様において、本明細書に記載のプライム編集因子(RTが融合パートナーとしてまたはトランスでどちらかで提供される)は、配列番号89の野生型M-MLV RTにおけるまたは別の野生型RTポリペプチド配列上の対応するアミノ酸位置におけるD524X変異を含むバリアントRTを包含し得、「X」はいずれかのアミノ酸であり得る。ある態様において、XはGである。 In various other embodiments, the prime editing factors described herein (wherein the RT is provided either as a fusion partner or in trans) are primed in the wild-type M-MLV RT of SEQ ID NO: 89 or in another wild-type Variant RTs can be included that include a D524X mutation at the corresponding amino acid position on the RT polypeptide sequence, where "X" can be any amino acid. In certain embodiments, X is G.

種々の他の態様において、本明細書に記載のプライム編集因子(RTが融合パートナーとしてまたはトランスでどちらかで提供される)は、配列番号89の野生型M-MLV RTにおけるまたは別の野生型RTポリペプチド配列上の対応するアミノ酸位置におけるE562X変異を含むバリアントRTを包含し得、「X」はいずれかのアミノ酸であり得る。ある態様において、XはQである。 In various other embodiments, a primed editing factor described herein (wherein RT is provided either as a fusion partner or in trans) can include a variant RT that includes an E562X mutation at the corresponding amino acid position in the wild-type M-MLV RT of SEQ ID NO:89 or on another wild-type RT polypeptide sequence, where "X" can be any amino acid. In some embodiments, X is Q.

種々の他の態様において、本明細書に記載のプライム編集因子(RTが融合パートナーとしてまたはトランスでどちらかで提供される)は、配列番号89の野生型M-MLV RTにおけるまたは別の野生型RTポリペプチド配列上の対応するアミノ酸位置におけるD583X変異を含むバリアントRTを包含し得、「X」はいずれかのアミノ酸であり得る。ある態様において、XはNである。 In various other embodiments, the prime editing factors described herein (wherein the RT is provided either as a fusion partner or in trans) are primed in the wild-type M-MLV RT of SEQ ID NO: 89 or in another wild-type Variant RTs can be included that include a D583X mutation at the corresponding amino acid position on the RT polypeptide sequence, where "X" can be any amino acid. In certain embodiments, X is N.

種々の他の態様において、本明細書に記載のプライム編集因子(RTが融合パートナーとしてまたはトランスでどちらかで提供される)は、配列番号89の野生型M-MLV RTにおけるまたは別の野生型RTポリペプチド配列上の対応するアミノ酸位置におけるH594X変異を含むバリアントRTを包含し得、「X」はいずれかのアミノ酸であり得る。ある態様において、XはQである。 In various other embodiments, the prime editing factors described herein (wherein the RT is provided either as a fusion partner or in trans) are primed in the wild-type M-MLV RT of SEQ ID NO: 89 or in another wild-type Variant RTs can be included that include the H594X mutation at the corresponding amino acid position on the RT polypeptide sequence, where "X" can be any amino acid. In certain embodiments, X is Q.

種々の他の態様において、本明細書に記載のプライム編集因子(RTが融合パートナーとしてまたはトランスでどちらかで提供される)は、配列番号89の野生型M-MLV RTにおけるまたは別の野生型RTポリペプチド配列上の対応するアミノ酸位置におけるL603X変異を含むバリアントRTを包含し得、「X」はいずれかのアミノ酸であり得る。ある態様において、XはWである。 In various other embodiments, the prime editing factors described herein (wherein the RT is provided either as a fusion partner or in trans) are primed in the wild-type M-MLV RT of SEQ ID NO: 89 or in another wild-type Variant RTs can be included that include the L603X mutation at the corresponding amino acid position on the RT polypeptide sequence, where "X" can be any amino acid. In certain embodiments, X is W.

種々の他の態様において、本明細書に記載のプライム編集因子(RTが融合パートナーとしてまたはトランスでどちらかで提供される)は、配列番号89の野生型M-MLV RTにおけるまたは別の野生型RTポリペプチド配列上の対応するアミノ酸位置におけるE607X変異を含むバリアントRTを包含し得、「X」はいずれかのアミノ酸であり得る。ある態様において、XはKである。 In various other embodiments, the prime editing factors described herein (wherein the RT is provided either as a fusion partner or in trans) are primed in the wild-type M-MLV RT of SEQ ID NO: 89 or in another wild-type Variant RTs can be included that include the E607X mutation at the corresponding amino acid position on the RT polypeptide sequence, where "X" can be any amino acid. In certain embodiments, X is K.

種々の他の態様において、本明細書に記載のプライム編集因子(RTが融合パートナーとしてまたはトランスでどちらかで提供される)は、配列番号89の野生型M-MLV RTにおけるまたは別の野生型RTポリペプチド配列上の対応するアミノ酸位置におけるD653X変異を含むバリアントRTを包含し得、「X」はいずれかのアミノ酸であり得る。ある態様において、XはNである。 In various other embodiments, a primed editing factor described herein (wherein RT is provided either as a fusion partner or in trans) can include a variant RT that includes a D653X mutation at the corresponding amino acid position in the wild-type M-MLV RT of SEQ ID NO:89 or on another wild-type RT polypeptide sequence, where "X" can be any amino acid. In some embodiments, X is N.

本開示の種々の態様に従ってnapDNAbpタンパク質に融合または個々のタンパク質として提供され得るいくつかの例示の逆転写酵素が、下で提供される。例示の逆転写酵素は、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、または少なくとも99%配列同一性を次の野生型酵素または部分的な酵素に対して有するバリアントを包含する:

Figure 2020191234000085
Figure 2020191234000086
Figure 2020191234000087
Figure 2020191234000088
Figure 2020191234000089
Provided below are several exemplary reverse transcriptases that may be provided as fusions to napDNAbp proteins or as individual proteins according to various embodiments of the disclosure. Exemplary reverse transcriptases include variants having at least 80%, at least 85%, at least 90%, at least 95%, or at least 99% sequence identity to the following wild-type or partial enzymes:
Figure 2020191234000085
Figure 2020191234000086
Figure 2020191234000087
Figure 2020191234000088
Figure 2020191234000089

ここに記載されるプライム編集因子(PE)システムは、次の米国特許(これらの夫々はそれらの全体が参照によって組み込まれる):米国特許第10,202,658号;第10,189,831号;第10,150,955号;第9,932,567号;第9,783,791号;第9,580,698号;第9,534,201号;および第9,458,484号のいずれかに記載または開示されているいずれかの公に利用可能な逆転写酵素と、変異を組み入れるための公知の方法またはタンパク質を進化させるための公知の方法を用いて作られ得るそのいずれかのバリアントとを企図する。次の参照は当該技術分野の逆転写酵素を記載する。それらの開示の夫々はそれらの全体が参照によって本願に組み込まれる。 The prime editing factor (PE) system described herein is described in the following U.S. patents (each of which is incorporated by reference in their entirety): U.S. Patent No. 10,202,658; No. 10,189,831; No. 10,150,955; No. 9,783,791; No. 9,580,698; No. 9,534,201; and any variants thereof that can be made using known methods for evolving. The following references describe reverse transcriptases in the art. Each of those disclosures is incorporated by reference into this application in its entirety.

Herzig,E.,Voronin,N.,Kucherenko,N.&Hizi,A.A Novel Leu92 Mutant of HIV-1 Reverse Transcriptase with a Selective Deficiency in Strand Transfer Causes a Loss of Viral Replication.J.Virol.89,8119-8129(2015). Herzig, E., Voronin, N., Kucherenko, N. & Hizi, A.A Novel Leu92 Mutant of HIV-1 Reverse Transcriptase with a Selective Deficiency in Strand Transfer Causes a Loss of Viral Replication. J. Virol. 89, 8119-8129( 2015).

Mohr,G.et al.A Reverse Transcriptase-Cas1 Fusion Protein Contains a Cas6 Domain Required for Both CRISPR RNA Biogenesis and RNA Spacer Acquisition.Mol.Cell 72,700-714.e8(2018). Mohr,G.et al.A Reverse Transcriptase-Cas1 Fusion Protein Contains a Cas6 Domain Required for Both CRISPR RNA Biogenesis and RNA Spacer Acquisition.Mol.Cell 72,700-714.e8(2018).

Zhao,C.,Liu,F.&Pyle,A.M.An ultraprocessive, accurate reverse transcriptase encoded by a metazoan group II intron.RNA 24,183-195(2018). Zhao, C., Liu, F. & Pyle, A.M. An ultraprocessive, accurate reverse transcriptase encoded by a metazoan group II intron.RNA 24,183-195(2018).

Zimmerly,S.&Wu,L.An Unexplored Diversity of Reverse Transcriptases in Bacteria.Microbiol Spectr 3,MDNA3-0058-2014(2015). Zimmerly, S. & Wu, L. An Unexplored Diversity of Reverse Transcriptases in Bacteria. Microbiol Spectr 3, MDNA3-0058-2014 (2015).

Ostertag,E.M.&Kazazian Jr,H.H.Biology of Mammalian L1 Retrotransposons. Annual Review of Genetics 35,501-538(2001). Ostertag, E.M. & Kazazian Jr, H.H. Biology of Mammalian L1 Retrotransposons. Annual Review of Genetics 35,501-538(2001).

Perach,M.&Hizi,A.Catalytic Features of the Recombinant Reverse Transcriptase of Bovine Leukemia Virus Expressed in Bacteria.Virology 259,176-189(1999). Perach, M. & Hizi, A. Catalytic Features of the Recombinant Reverse Transcriptase of Bovine Leukemia Virus Expressed in Bacteria. Virology 259, 176-189 (1999).

Lim,D.et al.Crystal structure of the moloney murine leukemia virus RNase H domain.J.Virol.80,8379-8389(2006). Lim, D. et al.Crystal structure of the moloney murine leukemia virus RNase H domain.J.Virol.80,8379-8389(2006).

Zhao,C.&Pyle,A.M.Crystal structures of a group II intron maturase reveal a missing link in spliceosome evolution.Nature Structural&Molecular Biology 23,558-565(2016). Zhao,C.&Pyle,A.M.Crystal structures of a group II intron maturase reveal a missing link in spliceosome evolution.Nature Structural&Molecular Biology 23,558-565(2016).

Griffiths,D.J.Endogenous retroviruses in the human genome sequence.Genome Biol.2,REVIEWS1017(2001). Griffiths, D.J. Endogenous retroviruses in the human genome sequence.Genome Biol.2, REVIEWS1017(2001).

Baranauskas,A.et al.Generation and characterization of new highly thermostable and processive M-MuLV reverse transcriptase variants.Protein Eng Des Sel 25,657-668(2012). Baranauskas,A.et al.Generation and characterization of new highly thermostable and processive M-MuLV reverse transcriptase variants.Protein Eng Des Sel 25,657-668(2012).

Zimmerly,S.,Guo,H.,Perlman,P.S.&Lambowltz,A.M.Group II intron mobility occurs by target DNA-primed reverse transcription.Cell 82,545-554(1995). Zimmerly, S., Guo, H., Perlman, P. S. & Lambowltz, A. M. Group II intron mobility occurs by target DNA-primed reverse transcription. Cell 82, 545-554 (1995).

Feng,Q.,Moran,J.V.,Kazazian,H.H.&Boeke,J.D.Human L1 retrotransposon encodes a conserved endonuclease required for retrotransposition.Cell 87,905-916(1996). Feng, Q., Moran, J.V., Kazazian, H.H. & Boeke, J.D.Human L1 retrotransposon encodes a conserved endonuclease required for retrotransposition.Cell 87,905-916(1996).

Berkhout,B.,Jebbink,M.&Zsiros,J.Identification of an Active Reverse Transcriptase Enzyme Encoded by a Human Endogenous HERV-K Retrovirus.Journal of Virology 73,2365-2375(1999). Berkhout, B., Jebbink, M. & Zsiros, J. Identification of an Active Reverse Transcriptase Enzyme Encoded by a Human Endogenous HERV-K Retrovirus. Journal of Virology 73, 2365-2375 (1999).

Kotewicz,M.L.,Sampson,C.M.,D’Alessio,J.M.&Gerard,G.F.Isolation of cloned Moloney murine leukemia virus reverse transcriptase lacking ribonuclease H activity.Nucleic Acids Res 16,265-277(1988). Kotewicz, M.L., Sampson, C.M., D’Alessio, J.M. & Gerard, G.F. Isolation of cloned Moloney murine leukemia virus reverse transcriptase lacking ribonuclease H activity. Nucleic Acids Res 16, 265-277 (1988).

Arezi,B.&Hogrefe,H.Novel mutations in Moloney Murine Leukemia Virus reverse transcriptase increase thermostability through tighter binding to template-primer.Nucleic Acids Res 37,473-481(2009). Arezi, B. & Hogrefe, H. Novel mutations in Moloney Murine Leukemia Virus reverse transcriptase increase thermostability through tighter binding to template-primer. Nucleic Acids Res 37, 473-481 (2009).

Blain,S.W.&Goff,S.P.Nuclease activities of Moloney murine leukemia virus reverse transcriptase.Mutants with altered substrate specificities.J.Biol.Chem.268,23585-23592(1993). Blain, S.W. & Goff, S.P. Nuclease activities of Moloney murine leukemia virus reverse transcriptase. Mutants with altered substrate specificities. J. Biol. Chem. 268, 23585-23592 (1993).

Xiong,Y.&Eickbush,T.H.Origin and evolution of retroelements based upon their reverse transcriptase sequences.EMBO J 9,3353-3362(1990). Xiong, Y. & Eickbush, T.H.Origin and evolution of retroelements based upon their reverse transcriptase sequences.EMBO J 9,3353-3362(1990).

Herschhorn,A.&Hizi,A.Retroviral reverse transcriptases.Cell.Mol.Life Sci.67,2717-2747(2010). Herschhorn, A. & Hizi, A. Retroviral reverse transcriptases. Cell. Mol. Life Sci. 67, 2717-2747 (2010).

Taube,R.,Loya,S.,Avidan,O.,Perach,M.&Hizi,A.Reverse transcriptase of mouse mammary tumour virus:expression in bacteria,purification and biochemical characterization.Biochem.J.329(Pt 3),579-587(1998). Taube, R., Loya, S., Avidan, O., Perach, M. & Hizi, A. Reverse transcriptase of mouse mammary tumour virus: expression in bacteria, purification and biochemical characterization. Biochem. J. 329 (Pt 3), 579-587 (1998).

Liu,M.et al.Reverse Transcriptase-Mediated Tropism Switching in Bordetella Bacteriophage.Science 295,2091-2094(2002). Liu, M. et al.Reverse Transcriptase-Mediated Tropism Switching in Bordetella Bacteriophage.Science 295,2091-2094(2002).

Luan,D.D.,Korman,M.H.,Jakubczak,J.L.&Eickbush,T.H.Reverse transcription of R2Bm RNA is primed by a nick at the chromosomal target site:a mechanism for non-LTR retrotransposition.Cell 72,595-605(1993). Luan, D. D., Korman, M. H., Jakubczak, J. L. & Eickbush, T. H. Reverse transcription of R2Bm RNA is primed by a nick at the chromosomal target site: a mechanism for non-LTR retrotransposition. Cell 72, 595-605 (1993).

Nottingham,R.M.et al.RNA-seq of human reference RNA samples using a thermostable group II intron reverse transcriptase.RNA 22,597-613(2016). Nottingham, R.M. et al.RNA-seq of human reference RNA samples using a thermostable group II intron reverse transcriptase.RNA 22,597-613(2016).

Telesnitsky,A.&Goff,S.P.RNase H domain mutations affect the interaction between Moloney murine leukemia virus reverse transcriptase and its primer-template.Proc.Natl.Acad.Sci.U.S.A.90,1276-1280(1993). Telesnitsky,A.&Goff,S.P.RNase H domain mutations affect the interaction between Moloney murine leukemia virus reverse transcriptase and its primer-template.Proc.Natl.Acad.Sci.U.S.A.90,1276-1280(1993).

Halvas,E.K.,Svarovskaia,E.S.&Pathak,V.K.Role of Murine Leukemia Virus Reverse Transcriptase Deoxyribonucleoside Triphosphate-Binding Site in Retroviral Replication and In Vivo Fidelity.Journal of Virology 74,10349-10358(2000). Halvas, E.K., Svarovskaia, E.S. & Pathak, V.K. Role of Murine Leukemia Virus Reverse Transcriptase Deoxyribonucleoside Triphosphate-Binding Site in Retroviral Replication and In Vivo Fidelity. Journal of Virology 74, 10349-10358 (2000).

Nowak,E.et al.Structural analysis of monomeric retroviral reverse transcriptase in complex with an RNA/DNA hybrid.Nucleic Acids Res 41,3874-3887(2013). Nowak, E. et al.Structural analysis of monomeric retroviral reverse transcriptase in complex with an RNA/DNA hybrid.Nucleic Acids Res 41,3874-3887(2013).

Stamos,J.L.,Lentzsch,A.M.&Lambowitz,A.M.Structure of a Thermostable Group II Intron Reverse Transcriptase with Template-Primer and Its Functional and Evolutionary Implications.Molecular Cell 68,926-939.e4(2017). Stamos, J.L., Lentzsch, A.M. & Lambowitz, A.M.Structure of a Thermostable Group II Intron Reverse Transcriptase with Template-Primer and Its Functional and Evolutionary Implications.Molecular Cell 68,926-939.e4(2017).

Das,D.&Georgiadis,M.M.The Crystal Structure of the Monomeric Reverse Transcriptase from Moloney Murine Leukemia Virus.Structure 12,819-829(2004). Das, D. & Georgiadis, M.M. The Crystal Structure of the Monomeric Reverse Transcriptase from Moloney Murine Leukemia Virus.Structure 12, 819-829 (2004).

Avidan,O.,Meer,M.E.,Oz,I&Hizi,A.The processivity and fidelity of DNA synthesis exhibited by the reverse transcriptase of bovine leukemia virus.European Journal of Biochemistry 269,859-86(2002). Avidan, O., Meer, M. E., Oz, I & Hizi, A. The processivity and fidelity of DNA synthesis exhibited by the reverse transcriptase of bovine leukemia virus. European Journal of Biochemistry 269, 859-86 (2002).

Gerard,G.F.et al.The role of template-primer in protection of reverse transcriptase from thermal inactivation.Nucleic Acids Res 30,3118-3129(2002). Gerard, G.F. et al.The role of template-primer in protection of reverse transcriptase from thermal inactivation.Nucleic Acids Res 30,3118-3129(2002).

Monot,C.et al.The Specificity and Flexibility of L1 Reverse Transcription Priming at Imperfect T-Tracts.PLOS Genetics 9,e1003499(2013). Monot,C.et al.The Specificity and Flexibility of L1 Reverse Transcription Priming at Imperfect T-Tracts.PLOS Genetics 9,e1003499(2013).

Mohr,S.et al.Thermostable group II intron reverse transcriptase fusion proteins and their use in cDNA synthesis and next-generation RNA sequencing.RNA 19,958-970(2013). Mohr, S. et al. Thermostable group II intron reverse transcriptase fusion proteins and their use in cDNA synthesis and next-generation RNA sequencing. RNA 19,958-970(2013).

逆転写酵素に関する上に記されている参照のいずれかは、すでにそのように申し立てられていない場合には、それらの全体が参照によってここに組み込まれる。 Any of the references noted above relating to reverse transcriptase are herein incorporated by reference in their entirety, unless already so claimed.

[4]PE融合タンパク質
本明細書に記載のプライム編集因子(PE)システムは、任意にリンカーによって連結されるnapDNAbpおよびポリメラーゼ(例えば、DNA依存性DNAポリメラーゼまたはRNA依存性DNAポリメラーゼ、例えば逆転写酵素)を含む融合タンパク質を企図する。本願は、いずれかの好適なnapDNAbpおよびポリメラーゼ(例えば、DNA依存性DNAポリメラーゼまたはRNA依存性DNAポリメラーゼ、例えば逆転写酵素)が単一の融合タンパク質として組み合わせられることを企図する。napDNAbpおよびポリメラーゼ(例えば、DNA依存性DNAポリメラーゼまたはRNA依存性DNAポリメラーゼ、例えば逆転写酵素)の例は、夫々が本願において定められる。ポリメラーゼは当該技術分野において周知であり、アミノ酸配列は難なく利用可能であるので、本開示は本願において同定される特定のポリメラーゼに限定されることを決して意味されない。
[4] PE fusion protein The prime editing element (PE) system described herein consists of napDNAbp and a polymerase (e.g., DNA-dependent DNA polymerase or RNA-dependent DNA polymerase, e.g. reverse transcriptase), optionally linked by a linker. ) are contemplated. This application contemplates that any suitable napDNAbp and polymerase (eg, DNA-dependent DNA polymerase or RNA-dependent DNA polymerase, eg, reverse transcriptase) are combined as a single fusion protein. Examples of napDNAbp and polymerases (eg, DNA-dependent DNA polymerases or RNA-dependent DNA polymerases, eg, reverse transcriptase) are each defined in this application. This disclosure is in no way meant to be limited to the particular polymerases identified in this application, as polymerases are well known in the art and amino acid sequences are readily available.

種々の態様において、融合タンパク質はいずれかの好適な構造的な構成を含み得る。例えば、融合タンパク質は、N末端からC末端方向に、napDNAbpをポリメラーゼ(例えば、DNA依存性DNAポリメラーゼまたはRNA依存性DNAポリメラーゼ、例えば逆転写酵素)に融合されて含み得る。他の態様において、融合タンパク質は、N末端からC末端方向に、ポリメラーゼ(例えば、逆転写酵素)をnapDNAbpに融合されて含み得る。融合したドメインは、任意に、リンカー、例えばアミノ酸配列によって連結され得る。他の態様において、融合タンパク質は構造NH2-[napDNAbp]-[ポリメラーゼ]-COOH;またはNH2-[ポリメラーゼ]-[napDNAbp]-COOHを含み得、「]-[」の夫々のものは任意のリンカー配列の存在を指示する。ポリメラーゼが逆転写酵素である態様では、融合タンパク質は構造NH2-[napDNAbp]-[RT]-COOH;またはNH2-[RT]-[napDNAbp]-COOHを含み得、「]-[」の夫々のものは任意のリンカー配列の存在を指示する。 In various embodiments, the fusion protein can include any suitable structural configuration. For example, a fusion protein can include napDNAbp fused to a polymerase (eg, a DNA-dependent DNA polymerase or an RNA-dependent DNA polymerase, eg, reverse transcriptase) in an N-terminal to C-terminal direction. In other embodiments, the fusion protein may include a polymerase (eg, reverse transcriptase) fused to napDNAbp in an N-terminal to C-terminal direction. The fused domains may optionally be joined by a linker, such as an amino acid sequence. In other embodiments, the fusion protein may include the structure NH2- [napDNAbp]-[polymerase]-COOH; or NH2- [polymerase]-[napDNAbp]-COOH, where each occurrence of "]-[" is optional. Indicates the presence of a linker sequence. In embodiments where the polymerase is reverse transcriptase, the fusion protein may include the structure NH 2 -[napDNAbp]-[RT]-COOH; or NH 2 -[RT]-[napDNAbp]-COOH, where "]-[" Each one indicates the presence of an optional linker sequence.

例示の融合タンパク質が図14に図示されている。これはリンカー配列を介してニッカーゼCas9(「Cas9(H840A)」)に融合されたMLV逆転写酵素(「MLV-RT」)を含む融合タンパク質を示す。この例は、本明細書に記載のプライム編集因子(PE)システムに利用され得る融合タンパク質の範囲を限定することを意図されない。 Exemplary fusion proteins are illustrated in FIG. 14. This shows a fusion protein comprising MLV reverse transcriptase ("MLV-RT") fused to nickase Cas9 ("Cas9(H840A)") via a linker sequence. This example is not intended to limit the range of fusion proteins that can be utilized in the prime editor (PE) system described herein.

種々の態様において、プライム編集因子融合タンパク質は次のアミノ酸配列(本願においては「PE1」と言われる)を有し得、これは、H840A変異を含むCas9バリアント(すなわち、Cas9ニッカーゼ)およびM-MLV RT野生型と、N末端NLS配列(19アミノ酸)およびCas9ニッカーゼドメインのC末端をRTドメインのN末端に連結するアミノ酸リンカー(32アミノ酸)とを包含する。PE1融合タンパク質は次の構造を有する:[NLS]-[Cas9(H840A)]-[リンカー]-[MMLV_RT(wt)]。PE1およびその個々の構成要素のアミノ酸配列は次のとおりである:

Figure 2020191234000090
Figure 2020191234000091
Figure 2020191234000092
In various embodiments, the prime editing factor fusion protein can have the following amino acid sequence (referred to herein as "PE1"), which includes Cas9 variants containing the H840A mutation (i.e., Cas9 nickase) and M-MLV RT wild type, an N-terminal NLS sequence (19 amino acids) and an amino acid linker (32 amino acids) connecting the C-terminus of the Cas9 nickase domain to the N-terminus of the RT domain. The PE1 fusion protein has the following structure: [NLS]-[Cas9(H840A)]-[linker]-[MMLV_RT(wt)]. The amino acid sequence of PE1 and its individual components is as follows:
Figure 2020191234000090
Figure 2020191234000091
Figure 2020191234000092

別の態様では、プライム編集因子融合タンパク質は次のアミノ酸配列(本願においては「PE2」と言われる)を有し得、これは、H840A変異を含むCas9バリアント(すなわち、Cas9ニッカーゼ)ならびに変異D200N、T330P、L603W、T306K、およびW313Fを含むM-MLV RTと、N末端NLS配列(19アミノ酸)ならびにCas9ニッカーゼドメインのC末端をRTドメインのN末端に連結するアミノ酸リンカー(33アミノ酸)とを包含する。PE2融合タンパク質は次の構造を有する:[NLS]-[Cas9(H840A)]-[リンカー]-[MMLV_RT(D200N)(T330P)(L603W)(T306K)(W313F)]。PE2のアミノ酸配列は次のとおりである:

Figure 2020191234000093
Figure 2020191234000094
Figure 2020191234000095
In another aspect, the prime editing factor fusion protein can have the following amino acid sequence (referred to herein as "PE2"), which includes the Cas9 variant containing the H840A mutation (i.e., Cas9 nickase) as well as the mutation D200N, Contains an M-MLV RT containing T330P, L603W, T306K, and W313F with an N-terminal NLS sequence (19 amino acids) and an amino acid linker (33 amino acids) that connects the C-terminus of the Cas9 nickase domain to the N-terminus of the RT domain. do. The PE2 fusion protein has the following structure: [NLS]-[Cas9(H840A)]-[linker]-[MMLV_RT(D200N)(T330P)(L603W)(T306K)(W313F)]. The amino acid sequence of PE2 is:
Figure 2020191234000093
Figure 2020191234000094
Figure 2020191234000095

更なる他の態様において、プライム編集因子融合タンパク質は、以下のアミノ酸配列を有していてもよい:

Figure 2020191234000096
Figure 2020191234000097
Figure 2020191234000098
Figure 2020191234000099
In yet other embodiments, the prime editing factor fusion protein may have the following amino acid sequence:
Figure 2020191234000096
Figure 2020191234000097
Figure 2020191234000098
Figure 2020191234000099

他の態様において、プライム編集因子融合タンパク質は、次の例示の配列などのSaCas9にまたは変改されたPAM特異性を有するSpCas9ニッカーゼに基づき得る:

Figure 2020191234000100
Figure 2020191234000101
Figure 2020191234000102
Figure 2020191234000103
In other embodiments, prime editing factor fusion proteins can be based on SaCas9 or SpCas9 nickases with modified PAM specificity, such as the following exemplary sequences:
Figure 2020191234000100
Figure 2020191234000101
Figure 2020191234000102
Figure 2020191234000103

さらに他の態様において、本願において企図されるプライム編集因子融合タンパク質は、M-MLV逆転写酵素の短縮されたバージョンに融合されたCas9ニッカーゼ(例えば、Cas9(H840A))を包含し得る。この態様では、逆転写酵素は4つの変異をもまた含有する(D200N、T306K、W313F、T330P;PE2に存在するL603W変異は短縮を原因としてもはや存在しないということに注意)。この短縮された編集因子をコードするDNA配列はPE2よりも522bp小さく、よって、DNA配列の送達がそのサイズを原因として難しい適用(すなわち、アデノ随伴ウイルスおよびレンチウイルス送達)にとってそれを可能性として有用にする。この態様はCas9(H840A)-MMLV-RT(trunc)または「短いPE2(PE2-short)」または「PE2-trunc」と言われ、次のアミノ酸配列を有する:

Figure 2020191234000104
Figure 2020191234000105
In yet other embodiments, prime editing factor fusion proteins contemplated herein may include a Cas9 nickase (eg, Cas9(H840A)) fused to a truncated version of M-MLV reverse transcriptase. In this embodiment, the reverse transcriptase also contains four mutations (D200N, T306K, W313F, T330P; note that the L603W mutation present in PE2 is no longer present due to truncation). The DNA sequence encoding this truncated editing factor is 522 bp smaller than PE2, thus making it potentially useful for applications where delivery of the DNA sequence is difficult due to its size (i.e., adeno-associated virus and lentiviral delivery). Make it. This embodiment is referred to as Cas9(H840A)-MMLV-RT(trunc) or "PE2-short" or "PE2-trunc" and has the following amino acid sequence:
Figure 2020191234000104
Figure 2020191234000105

図75を見よ。これは、PE2、PE2-trunc、PE3、およびPE3-truncの効率(すなわち、「規定された編集またはインデルを有する配列決定総読取の%」)を種々の細胞株において異なる標的部位について比較する棒グラフを提供する。データは、短縮されたRTバリアントを含むプライム編集因子が、短縮されていないRTタンパク質を含むプライム編集因子と約同じくらい効率的であったということを示す。 See Figure 75. This is a bar graph comparing the efficiency (i.e., "% of total sequencing reads with defined edits or indels") of PE2, PE2-trunc, PE3, and PE3-trunc for different target sites in various cell lines. I will provide a. The data show that prime editors containing truncated RT variants were approximately as efficient as prime editors containing non-truncated RT proteins.

種々の態様において、本願において企図されるプライム編集因子融合タンパク質は、PE1、PE2、または上で指示されているプライム編集因子融合体配列のいずれかと少なくとも約70%同一、少なくとも約80%同一、少なくとも約90%同一、少なくとも約95%同一、少なくとも約96%同一、少なくとも約97%同一、少なくとも約98%同一、少なくとも約99%同一、少なくとも約99.5%同一、または少なくとも約99.9%同一であるアミノ酸配列を有する上で開示されている配列のいずれかのバリアントをもまた包含し得る。 In various embodiments, the prime editing factor fusion proteins contemplated herein are at least about 70% identical, at least about 80% identical, at least about 80% identical to PE1, PE2, or any of the prime editing factor fusion sequences indicated above. Amino acids that are about 90% identical, at least about 95% identical, at least about 96% identical, at least about 97% identical, at least about 98% identical, at least about 99% identical, at least about 99.5% identical, or at least about 99.9% identical Variants of any of the sequences disclosed above may also be included.

ある態様において、リンカーが、本発明のペプチドまたはペプチドドメインもしくは部分のいずれかを連結するために用いられ得る(例えば、逆転写酵素に連結または融合されたnapDNAbp)。 In certain embodiments, a linker can be used to join any of the peptides or peptide domains or portions of the invention (eg, napDNAbp linked or fused to reverse transcriptase).

[5]リンカーおよび他のドメイン
PE融合タンパク質は、napDNAbp(例えば、Cas9ドメイン)およびポリメラーゼドメイン(例えば、RTドメイン)以外に種々の他のドメインを含み得る。例えば、napDNAbpがCas9でありかつポリメラーゼがRTであるケースでは、PE融合タンパク質は、Cas9ドメインをRTドメインと連結する1つ以上のリンカーを含み得る。リンカーは、他の機能ドメイン、例えば核局在配列(NLS)またはFEN1(または他のフラップエンドヌクレアーゼ)をもまたPE融合タンパク質またはそのドメインに連結し得る。
[5] Linkers and other domains
PE fusion proteins can contain various other domains besides napDNAbp (eg, Cas9 domain) and polymerase domain (eg, RT domain). For example, in the case where napDNAbp is Cas9 and the polymerase is RT, the PE fusion protein can include one or more linkers that join the Cas9 domain with the RT domain. Linkers may also connect other functional domains, such as the nuclear localization sequence (NLS) or FEN1 (or other flap endonucleases) to the PE fusion protein or domain thereof.

加えて、トランスプライム編集が関わる態様では、リンカーが、tPERT動員タンパク質をプライム編集因子に例えばtPERt動員タンパク質およびnapDNAbpの間において連結するために用いられ得る。例えば、ポリメラーゼドメインおよび動員タンパク質ドメインをnapDNAbpに別個に融合するためのリンカーを包含するトランスプライム編集因子(tPE)の例示の模式図については、図3Gを見よ。 Additionally, in embodiments involving transprime editing, a linker can be used to join the tPERT recruitment protein to the prime editing factor, eg, between the tPERt recruitment protein and napDNAbp. For example, see Figure 3G for an exemplary schematic of a transprime editing element (tPE) that includes a linker to separately fuse the polymerase domain and recruitment protein domain to napDNAbp.

A.リンカー
上で定められているとおり、本願において用いられる用語「リンカー」は、2つの分子または部分、例えばヌクレアーゼの結合ドメインおよび切断ドメインを連結する化学基または分子を言う。いくつかの態様では、リンカーはRNAによってプログラム可能なヌクレアーゼのgRNA結合ドメインおよびポリメラーゼ(例えば、逆転写酵素)の触媒ドメインを連結する。いくつかの態様では、リンカーはdCas9および逆転写酵素を連結する。典型的には、リンカーは2つの基、分子、または他の部分の間に位置取るかまたはそれらによってフランキングされ、共有結合を介して夫々の1つに接続され、それゆえに2つを接続する。いくつかの態様では、リンカーはアミノ酸または複数のアミノ酸(例えば、ペプチドまたはタンパク質)である。いくつかの態様では、リンカーは有機分子、基、ポリマー、または化学的部分である。いくつかの態様では、リンカーは長さが5-100アミノ酸、例えば、長さが5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、30-35、35-40、40-45、45-50、50-60、60-70、70-80、80-90、90-100、100-150、または150-200アミノ酸である。より長いかまたはより短いリンカーもまた企図される。
A. linker
As defined above, the term "linker" as used herein refers to a chemical group or molecule that joins two molecules or moieties, such as a binding domain and a cleavage domain of a nuclease. In some embodiments, the linker connects the gRNA-binding domain of an RNA-programmable nuclease and the catalytic domain of a polymerase (eg, reverse transcriptase). In some embodiments, a linker connects dCas9 and reverse transcriptase. Typically, a linker is located between or flanked by two groups, molecules, or other moieties and is connected to each one via a covalent bond, thus connecting the two. . In some embodiments, the linker is an amino acid or multiple amino acids (eg, a peptide or protein). In some embodiments, the linker is an organic molecule, group, polymer, or chemical moiety. In some embodiments, the linker is 5-100 amino acids in length, e.g., 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19 in length. , 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 30-35, 35-40, 40-45, 45-50, 50-60, 60-70, 70-80 , 80-90, 90-100, 100-150, or 150-200 amino acids. Longer or shorter linkers are also contemplated.

リンカーは共有結合ほども単純であり得るか、またはそれは長さが多くの原子であるポリマー性リンカーであり得る。ある態様において、リンカーはポリ(pol)ペプチドであるかまたはアミノ酸に基づく。他の態様において、リンカーはペプチド様ではない。ある態様において、リンカーは共有結合である(例えば、炭素-炭素結合、ジスルフィド結合、炭素-ヘテロ原子結合など)。ある態様において、リンカーはアミド連結部の炭素-窒素結合である。ある態様において、リンカーは、環状または非環状の、置換または無置換の、分枝または非分枝の脂肪族またはヘテロ脂肪族リンカーである。ある態様において、リンカーはポリマー性である(例えば、ポリエチレン、ポリエチレングリコール、ポリアミド、ポリエステルなど)。ある態様において、リンカーはアミノアルカン酸のモノマー、二量体、またはポリマーを含む。ある態様において、リンカーはアミノアルカン酸を含む(例えば、グリシン、エタン酸、アラニン、ベータアラニン、3-アミノプロパン酸、4-アミノ酪酸、5-ペンタン酸など)。ある態様において、リンカーはアミノヘキサン酸(Ahx)のモノマー、二量体、またはポリマーを含む。ある態様において、リンカーは炭素環部分(例えば、シクロペンタン、シクロヘキサン)に基づく。他の態様において、リンカーはポリエチレングリコール部分(PEG)を含む。他の態様において、リンカーはアミノ酸を含む。ある態様において、リンカーはペプチドを含む。ある態様において、リンカーはアリールまたはヘテロアリール部分を含む。ある態様において、リンカーはフェニル環に基づく。リンカーは、ペプチドからリンカーへの求核剤の取り付けを容易化するための官能化された部分を包含し得る(例えば、チオール、アミノ)。いずれかの求電子剤がリンカーの一部として用いられ得る。例示の求電子剤は、活性化エステル、活性化アミド、マイケルアクセプター、ハロゲン化アルキル、ハロゲン化アリール、ハロゲン化アシル、およびイソチオシアネートを包含するが、これらに限定されない。 The linker can be as simple as a covalent bond, or it can be a polymeric linker many atoms in length. In certain embodiments, the linker is a poly(pol) peptide or based on amino acids. In other embodiments, the linker is not peptidic. In certain embodiments, the linker is a covalent bond (eg, a carbon-carbon bond, a disulfide bond, a carbon-heteroatom bond, etc.). In certain embodiments, the linker is a carbon-nitrogen bond of an amide linkage. In certain embodiments, the linker is a cyclic or acyclic, substituted or unsubstituted, branched or unbranched aliphatic or heteroaliphatic linker. In certain embodiments, the linker is polymeric (eg, polyethylene, polyethylene glycol, polyamide, polyester, etc.). In certain embodiments, the linker comprises an aminoalkanoic acid monomer, dimer, or polymer. In certain embodiments, the linker comprises an aminoalkanoic acid (eg, glycine, ethanoic acid, alanine, beta-alanine, 3-aminopropanoic acid, 4-aminobutyric acid, 5-pentanoic acid, etc.). In certain embodiments, the linker comprises a monomer, dimer, or polymer of aminohexanoic acid (Ahx). In certain embodiments, the linker is based on a carbocyclic moiety (eg, cyclopentane, cyclohexane). In other embodiments, the linker includes a polyethylene glycol moiety (PEG). In other embodiments, the linker includes amino acids. In certain embodiments, the linker comprises a peptide. In certain embodiments, the linker includes an aryl or heteroaryl moiety. In certain embodiments, the linker is based on a phenyl ring. The linker may include a functionalized moiety (eg, thiol, amino) to facilitate attachment of a nucleophile from the peptide to the linker. Any electrophile can be used as part of the linker. Exemplary electrophiles include, but are not limited to, activated esters, activated amides, Michael acceptors, alkyl halides, aryl halides, acyl halides, and isothiocyanates.

いくつかの他の態様において、リンカーはアミノ酸配列(GGGGS)n(配列番号165)、(G)n(配列番号166)、(EAAAK)n(配列番号167)、(GGS)n(配列番号168)、(SGGS)n(配列番号169)、(XP)n(配列番号170)、またはそれらのいずれかの組み合わせを含み、nは独立して1および30の間の整数であり、Xはいずれかのアミノ酸である。いくつかの態様では、リンカーはアミノ酸配列(GGS)N(配列番号176)を含み、nは1、3、または7である。いくつかの態様では、リンカーはアミノ酸配列SGSETPGTSESATPES(配列番号171)を含む。いくつかの態様では、リンカーはアミノ酸配列SGGSSGGSSGSETPGTSESATPESSGGSSGGS(配列番号172)を含む。いくつかの態様では、リンカーはアミノ酸配列SGGSGGSGGS(配列番号173)を含む。いくつかの態様では、リンカーはアミノ酸配列SGGS(配列番号174)を含む。他の態様において、リンカーはアミノ酸配列SGGSSGGSSGSETPGTSESATPESAGSYPYDVPDYAGSAAPAAKKKKLDGSGSGGSSGGS(配列番号175、60AA)を含む。 In some other embodiments, the linker comprises the amino acid sequence (GGGGS) n (SEQ ID NO:165), (G) n (SEQ ID NO:166), (EAAAK) n (SEQ ID NO:167), (GGS) n (SEQ ID NO:168), (SGGS) n (SEQ ID NO:169), (XP) n (SEQ ID NO:170), or any combination thereof, where n is independently an integer between 1 and 30, and X is any amino acid. In some embodiments, the linker comprises the amino acid sequence (GGS)N (SEQ ID NO:176), where n is 1, 3, or 7. In some embodiments, the linker comprises the amino acid sequence SGSETPGTSESATPES (SEQ ID NO:171). In some embodiments, the linker comprises the amino acid sequence SGGSSGGSSGSETPGTSESATPESSGGSSGGS (SEQ ID NO:172). In some embodiments, the linker comprises the amino acid sequence SGGSGGSGGS (SEQ ID NO:173). In some embodiments, the linker comprises the amino acid sequence SGGS (SEQ ID NO:174). In other embodiments, the linker comprises the amino acid sequence SGGSSGGSSGSETPGTSESATPESAGSYPYDVPDYAGSAAPAAKKKKLDGSGSGGSSGGS (SEQ ID NO: 175, 60AA).

ある態様において、リンカーは本発明のペプチドまたはペプチドドメインもしくは部分のいずれかを連結するために用いられ得る(例えば、逆転写酵素に連結または融合されるnapDNAbp)。 In certain embodiments, a linker can be used to join any of the peptides or peptide domains or moieties of the invention (eg, napDNAbp linked or fused to reverse transcriptase).

上で定められているとおり、本願において用いられる用語「リンカー」は、2つの分子または部分、例えばヌクレアーゼの結合ドメインおよび切断ドメインを連結する化学基または分子を言う。いくつかの態様では、リンカーはRNAによってプログラム可能なヌクレアーゼのgRNA結合ドメインおよびリコンビナーゼの触媒ドメインを連結する。いくつかの態様では、リンカーはdCas9および逆転写酵素を連結する。典型的には、リンカーは2つの基、分子、または他の部分の間に位置取るかまたはそれらによってフランキングされ、共有結合を介して夫々の1つに接続され、それゆえに2つを接続する。いくつかの態様では、リンカーはアミノ酸または複数のアミノ酸(例えば、ペプチドまたはタンパク質)である。いくつかの態様では、リンカーは有機分子、基、ポリマー、または化学的部分である。いくつかの態様では、リンカーは長さが5~100アミノ酸、例えば、長さが5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、30~35、35~40、40~45、45~50、50~60、60~70、70~80、80~90、90~100、100~150、または150~200アミノ酸である。より長いかまたはより短いリンカーもまた企図される。 As defined above, the term "linker" as used herein refers to a chemical group or molecule that joins two molecules or moieties, such as a binding domain and a cleavage domain of a nuclease. In some embodiments, the linker connects the gRNA binding domain of the RNA programmable nuclease and the catalytic domain of the recombinase. In some embodiments, a linker joins dCas9 and reverse transcriptase. Typically, a linker is located between or flanked by two groups, molecules, or other moieties and is connected to each one via a covalent bond, thus connecting the two. . In some embodiments, the linker is an amino acid or multiple amino acids (eg, a peptide or protein). In some embodiments, the linker is an organic molecule, group, polymer, or chemical moiety. In some embodiments, the linker is between 5 and 100 amino acids in length, e.g., 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19 in length. , 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 30-35, 35-40, 40-45, 45-50, 50-60, 60-70, 70-80 , 80-90, 90-100, 100-150, or 150-200 amino acids. Longer or shorter linkers are also contemplated.

リンカーは共有結合ほども単純であり得るか、またはそれは長さが多くの原子であるポリマー性リンカーであり得る。ある態様において、リンカーはポリペプチドであるかまたはアミノ酸に基づく。他の態様において、リンカーはペプチド様ではない。ある態様において、リンカーは共有結合である(例えば、炭素-炭素結合、ジスルフィド結合、炭素-ヘテロ原子結合など)。ある態様において、リンカーはアミド連結部の炭素-窒素結合である。ある態様において、リンカーは、環状または非環状の、置換または無置換の、分枝または非分枝の脂肪族またはヘテロ脂肪族リンカーである。ある態様において、リンカーはポリマー性である(例えば、ポリエチレン、ポリエチレングリコール、ポリアミド、ポリエステルなど)。ある態様において、リンカーはアミノアルカン酸のモノマー、二量体、またはポリマーを含む。ある態様において、リンカーはアミノアルカン酸を含む(例えば、グリシン、エタン酸、アラニン、ベータアラニン、3-アミノプロパン酸、4-アミノ酪酸、5-ペンタン酸など)。ある態様において、リンカーはアミノヘキサン酸(Ahx)のモノマー、二量体、またはポリマーを含む。ある態様において、リンカーは炭素環部分(例えば、シクロペンタン、シクロヘキサン)に基づく。他の態様において、リンカーはポリエチレングリコール部分(PEG)を含む。他の態様において、リンカーはアミノ酸を含む。ある態様において、リンカーはペプチドを含む。ある態様において、リンカーはアリールまたはヘテロアリール部分を含む。ある態様において、リンカーはフェニル環に基づく。リンカーは、ペプチドからリンカーへの求核剤の取り付けを容易化するための官能化された部分を包含し得る(例えば、チオール、アミノ)。いずれかの求電子剤がリンカーの一部として用いられ得る。例示の求電子剤は、活性化エステル、活性化アミド、マイケルアクセプター、ハロゲン化アルキル、ハロゲン化アリール、ハロゲン化アシル、およびイソチオシアネートを包含するが、これらに限定されない。 The linker can be as simple as a covalent bond, or it can be a polymeric linker many atoms in length. In certain embodiments, the linker is polypeptide or based on amino acids. In other embodiments, the linker is not peptidic. In certain embodiments, the linker is a covalent bond (eg, a carbon-carbon bond, a disulfide bond, a carbon-heteroatom bond, etc.). In certain embodiments, the linker is a carbon-nitrogen bond of an amide linkage. In certain embodiments, the linker is a cyclic or acyclic, substituted or unsubstituted, branched or unbranched aliphatic or heteroaliphatic linker. In certain embodiments, the linker is polymeric (eg, polyethylene, polyethylene glycol, polyamide, polyester, etc.). In certain embodiments, the linker comprises an aminoalkanoic acid monomer, dimer, or polymer. In certain embodiments, the linker comprises an aminoalkanoic acid (eg, glycine, ethanoic acid, alanine, beta-alanine, 3-aminopropanoic acid, 4-aminobutyric acid, 5-pentanoic acid, etc.). In certain embodiments, the linker comprises a monomer, dimer, or polymer of aminohexanoic acid (Ahx). In certain embodiments, the linker is based on a carbocyclic moiety (eg, cyclopentane, cyclohexane). In other embodiments, the linker includes a polyethylene glycol moiety (PEG). In other embodiments, the linker includes amino acids. In certain embodiments, the linker comprises a peptide. In certain embodiments, the linker includes an aryl or heteroaryl moiety. In certain embodiments, the linker is based on a phenyl ring. The linker may include a functionalized moiety (eg, thiol, amino) to facilitate attachment of a nucleophile from the peptide to the linker. Any electrophile can be used as part of the linker. Exemplary electrophiles include, but are not limited to, activated esters, activated amides, Michael acceptors, alkyl halides, aryl halides, acyl halides, and isothiocyanates.

いくつかの他の態様において、リンカーはアミノ酸配列(GGGGS)n(配列番号165)、(G)n(配列番号166)、(EAAAK)n(配列番号167)、(GGS)n(配列番号168)、(SGGS)n(配列番号169)、(XP)n(配列番号170)、またはそれらのいずれかの組み合わせを含み、nは独立して1および30の間の整数であり、Xはいずれかのアミノ酸である。いくつかの態様では、リンカーはアミノ酸配列(GGS)N(配列番号176)を含み、nは1、3、または7である。いくつかの態様では、リンカーはアミノ酸配列SGSETPGTSESATPES(配列番号171)を含む。いくつかの態様では、リンカーはアミノ酸配列SGGSSGGSSGSETPGTSESATPESSGGSSGGS(配列番号172)を含む。いくつかの態様では、リンカーはアミノ酸配列SGGSGGSGGS(配列番号173)を含む。いくつかの態様では、リンカーはアミノ酸配列SGGS(配列番号174)を含む。 In some other embodiments, the linker comprises the amino acid sequence (GGGGS) n (SEQ ID NO: 165), (G) n (SEQ ID NO: 166), (EAAAK) n (SEQ ID NO: 167), (GGS) n (SEQ ID NO: 168). ), (SGGS)n (SEQ ID NO: 169), (XP)n (SEQ ID NO: 170), or any combination thereof, where n is independently an integer between 1 and 30, and It is an amino acid. In some embodiments, the linker comprises the amino acid sequence (GGS) N (SEQ ID NO: 176), where n is 1, 3, or 7. In some embodiments, the linker comprises the amino acid sequence SGSETPGTSESATPES (SEQ ID NO: 171). In some embodiments, the linker comprises the amino acid sequence SGGSGGSSGSETPGTSESATPESSGGSSGGS (SEQ ID NO: 172). In some embodiments, the linker comprises the amino acid sequence SGGSGGSGGS (SEQ ID NO: 173). In some embodiments, the linker comprises the amino acid sequence SGGS (SEQ ID NO: 174).

特に、次のリンカーが、プライム編集因子ドメインを互いと連結するために種々の態様に用いられ得る:
GGS(配列番号767);
GGSGGS(配列番号768);
GGSGGSGGS(配列番号769);
SGGSSGGSSGSETPGTSESATPESSGGSSGGSS(配列番号127);
SGSETPGTSESATPES(配列番号171);
SGGSSGGSSGSETPGTSESATPESAGSYPYDVPDYAGSAAPAAKKKKLDGSGSGGSSGGS(配列番号175)。
In particular, the following linkers can be used in various embodiments to link the prime editor domains together:
GGS (SEQ ID NO:767);
GGSGGS (SEQ ID NO:768);
GGSGGSGGS (SEQ ID NO:769);
SGGSSGGSSGSETPGTSESATPESSGGSSGGSS (SEQ ID NO: 127);
SGSETPGTSESATPES (SEQ ID NO: 171);
SGGSSGGSSGSETPGTSESATPESAGSYPYDVPDYAGSAAPAAKKKKLDGSGSGGSSGGS (sequence number 175).

B.核局在配列(NLS)
種々の態様において、PE融合タンパク質は1つ以上の核局在配列(NLS)を含み得、これらは細胞核内へのタンパク質の移行を促進することを助ける。かかる配列は当該技術分野で周知であり、次の例を包含し得る:

Figure 2020191234000106
Figure 2020191234000107
B. Nuclear localization sequence (NLS)
In various embodiments, the PE fusion protein can include one or more nuclear localization sequences (NLS), which help facilitate translocation of the protein into the cell nucleus. Such sequences are well known in the art and may include the following examples:
Figure 2020191234000106
Figure 2020191234000107

上のNLS例は限定しない。PE融合タンパク質はいずれかの公知のNLS配列を含み得、Cokol et al.,“Finding nuclear localization signals,”EMBO Rep.,2000,1(5):411-415およびFreitas et al.,“Mechanisms and Signals for the Nuclear Import of Proteins,”Current Genomics,2009,10(8):550-7に記載されているもののいずれかを包含する。これらの夫々は参照によって本願に組み込まれる。 The above NLS example is not limiting. PE fusion proteins can include any known NLS sequence, including Cokol et al., “Finding nuclear localization signals,” EMBO Rep., 2000, 1(5):411-415 and Freitas et al., “Mechanisms and Signals for the Nuclear Import of Proteins,” Current Genomics, 2009, 10(8):550-7. Each of these is incorporated herein by reference.

種々の態様において、本明細書に開示のプライム編集因子およびプライム編集因子をコードする構築物は、さらに、1つ以上の、好ましくは少なくとも2つの核局在シグナルを含む。ある態様において、プライム編集因子は少なくとも2つのNLSを含む。少なくとも2つのNLSによる態様では、NLSは同じNLSであり得るか、またはそれらは異なるNLSであり得る。加えて、NLSはプライム編集因子の残りの部分との融合タンパク質の一部として発現され得る。いくつかの態様では、NLSの1つ以上は双節型NLS(「bpNLS」)である。ある態様において、本開示の融合タンパク質は2つの双節型NLSを含む。いくつかの態様では、本開示の融合タンパク質は2つよりも多くの双節型NLSを含む。 In various embodiments, the prime editing factors and constructs encoding prime editing factors disclosed herein further comprise one or more, preferably at least two, nuclear localization signals. In certain embodiments, the prime editing factor comprises at least two NLSs. In embodiments with at least two NLSs, the NLSs can be the same NLS or they can be different NLSs. Additionally, NLS can be expressed as part of a fusion protein with the rest of the prime editing factor. In some embodiments, one or more of the NLSs is a bibaric NLS (“bpNLS”). In certain embodiments, the fusion proteins of the present disclosure include two bisegmented NLSs. In some embodiments, the fusion proteins of the present disclosure include more than two bisegmented NLSs.

NLS融合の位置付けはプライム編集因子のN末端、C末端、または配列内であり得る(例えば、コードされるnapDNAbp構成要素(例えばCas9)およびポリメラーゼドメイン(例えば逆転写酵素ドメイン)の間に挿入される。 The positioning of the NLS fusion can be at the N-terminus, C-terminus, or within the sequence of the prime editing factor (e.g. inserted between the encoded napDNAbp component (e.g. Cas9) and the polymerase domain (e.g. reverse transcriptase domain). .

NLSは当該技術分野のいずれかの公知のNLS配列であり得る。NLSは核局在のためのいずれかの将来に発見されるNLSでもまたあり得る。NLSは、いずれかの天然に存在するNLSまたはいずれかの天然に存在しないNLS(例えば、1つ以上の所望の変異を有するNLS)でもまたあり得る。 The NLS can be any known NLS sequence in the art. NLS could also be any NLS discovered in the future for nuclear localization. The NLS can also be any naturally occurring NLS or any non-naturally occurring NLS (eg, an NLS with one or more desired mutations).

用語「核局在配列」または「NLS」は、例えば核輸送による細胞核へのタンパク質の搬入を促進するアミノ酸配列を言う。核局在配列は当該技術分野で知られており、当業者には明らかであろう。例えば、NLS配列は、2001年5月31日にWO/2001/038547として公開された2000年11月23日出願のPlank et al.の国際PCT出願PCT/EP2000/011690に記載されている。これの内容は参照によって本願に組み込まれる。いくつかの態様では、NLSはアミノ酸配列PKKKRKV(配列番号16)、MDSLLMNRRKFLYQFKNVRWAKGRRETYLC(配列番号17)、KRTADGSEFESPKKKRKV(配列番号3864)、またはKRTADGSEFEPKKKRKV(配列番号125)を含む。他の態様において、NLSはアミノ酸配列NLSKRPAAIKKAGQAKKKK(配列番号136)、PAAKRVKLD(配列番号192)、RQRRNELKRSF(配列番号3934)、NQSSNFGPMKGGNFGGRSSGPYGGGGQYFAKPRNQGGY(配列番号3935)を含む。 The term "nuclear localization sequence" or "NLS" refers to an amino acid sequence that facilitates import of proteins into the nucleus of a cell, eg, by nuclear transport. Nuclear localization sequences are known in the art and will be apparent to those skilled in the art. For example, NLS sequences are described in Plank et al.'s international PCT application PCT/EP2000/011690, filed November 23, 2000, published as WO/2001/038547 on May 31, 2001. The contents of which are incorporated into this application by reference. In some embodiments, the NLS comprises the amino acid sequence PKKKRKV (SEQ ID NO: 16), MDSLLNMNRKFLYQFKNVRWAKGRRETYLC (SEQ ID NO: 17), KRTADGSEFESPKKKRKV (SEQ ID NO: 3864), or KRTADGSEFEPKKKRKV (SEQ ID NO: 125 ). In other embodiments, the NLS comprises the amino acid sequences NLSKRPAIKKAGQAKKKK (SEQ ID NO : 136 ), PAAKRVKLD (SEQ ID NO: 192), RQRRNELKRSF (SEQ ID NO: 3934 ), NQSSNFGPMKGGNFGGRSSGPYGGGGQYFAKPRNQGGY (SEQ ID NO : 3935 ).

本開示の一側面において、プライム編集因子は、1つ以上の核局在シグナル(NLS)、好ましくは少なくとも2つのNLSによって修飾され得る。ある態様において、プライム編集因子は2つ以上のNLSによって修飾される。本開示は、本開示の時に当該技術分野で公知のいずれかの核局在シグナルまたは本出願時の後の現況技術によって同定されるかもしくはさもなければ利用可能にされるいずれかの核局在シグナルの使用を企図する。代表的な核局在シグナルは、配列が発現される細胞の核にタンパク質を導くペプチド配列である。核局在シグナルは支配的には塩基性であり、タンパク質のアミノ酸配列のほとんどどこにでも位置取り得、一般的には、4アミノ酸(Autieri & Agrawal,(1998)J.Biol.Chem.273:14731-37。参照によって本願に組み込まれる)から8アミノ酸の短い配列を含み、典型的にはリジンおよびアルギニン残基がリッチである(Magin et al.,(2000)Virology 274:11-16。参照によって本願に組み込まれる)。核局在シグナルは多くの場合にはプロリン残基を含む。種々の核局在シグナルが同定されており、細胞質から細胞の核への生物学的分子の輸送を成し遂げるために用いられている。例えば、Tinland et al.,(1992)Proc.Natl.Acad.Sci.U.S.A.89:7442-46;Moede et al.,(1999) FEBS Lett.461:229-34を見よ。これは参照によって組み込まれる。移行は現行では核膜孔タンパク質が関わると考えられる。 In one aspect of the disclosure, the prime editing factor may be modified with one or more nuclear localization signals (NLS), preferably at least two NLSs. In certain embodiments, the prime editing factor is modified with two or more NLSs. The present disclosure describes the use of any nuclear localization signal known in the art at the time of this disclosure or any nuclear localization signal identified or otherwise made available by the later state of the art at the time of this application. Contemplate the use of signals. A typical nuclear localization signal is a peptide sequence that directs the protein to the nucleus of the cell where the sequence is expressed. Nuclear localization signals are predominantly basic and can be located almost anywhere in a protein's amino acid sequence, typically consisting of four amino acids (Autieri & Agrawal, (1998) J. Biol. Chem. 273:14731- 37. (incorporated herein by reference) and is typically rich in lysine and arginine residues (Magin et al., (2000) Virology 274:11-16. ). Nuclear localization signals often contain proline residues. A variety of nuclear localization signals have been identified and used to accomplish the transport of biological molecules from the cytoplasm to the nucleus of the cell. See, for example, Tinland et al., (1992) Proc. Natl. Acad. Sci. U.S.A. 89:7442-46; Moede et al., (1999) FEBS Lett. 461:229-34. This is incorporated by reference. Translocation is currently thought to involve nuclear pore proteins.

ほとんどのNLSは3つの一般的な群に分類され得る:(i)SV40ラージT抗原NLS(PKKKRKV(配列番号16))によって例示される単節型NLS;(ii)XenopusヌクレオプラスミンNLS(KRXXXXXXXXXXKKKL(配列番号3936))によって例示される、可変の数のスペーサーアミノ酸によって分離された2つの塩基性ドメインからなる双節型モチーフ;ならびに(iii)非標準的な配列、例えばhnRNP A1タンパク質のM9、インフルエンザウイルス核タンパク質NLS、および酵母Gal4タンパク質NLS(Dingwall and Laskey 1991)。 Most NLSs can be classified into three general groups: (i) monosegmented NLSs, exemplified by the SV40 large T antigen NLS (PKKKRKV (SEQ ID NO: 16)); (ii) Xenopus nucleoplasmin NLSs (KRXXXXXXXXXXKKKL ( a bipartite motif consisting of two basic domains separated by a variable number of spacer amino acids, exemplified by SEQ ID NO: 3936 )); and (iii) non-canonical sequences, such as M9 of the hnRNP A1 protein, influenza viral nucleoprotein NLS, and yeast Gal4 protein NLS (Dingwall and Laskey 1991).

核局在シグナルはタンパク質のアミノ酸配列上の種々の点に出現する。NLSはタンパク質のN末端、C末端、および中心領域から同定されている。それゆえに、本開示は、プライム編集因子のC末端、N末端、および内部の領域において1つ以上のNLSによって修飾され得るプライム編集因子を提供する。核局在シグナルそれ自体と例えば強直的にまたは立体的に干渉しないようにして、構成要素NLS残基として機能しないより長い配列の残基が選択されるべきである。よって、NLSを含む配列の組成に厳格な限定はないが、事実上、かかる配列は長さおよび組成が機能的に限定され得る。 Nuclear localization signals appear at various points on a protein's amino acid sequence. NLSs have been identified from the N-terminus, C-terminus, and central region of the protein. Therefore, the present disclosure provides prime editing factors that can be modified by one or more NLSs at the C-terminus, N-terminus, and internal regions of the prime editing factor. Residues of the longer sequence should be selected that do not function as component NLS residues, eg, tonically or sterically, so as not to interfere with the nuclear localization signal itself. Thus, although there are no strict limitations on the composition of sequences comprising an NLS, such sequences may in fact be functionally limited in length and composition.

本開示は、1つ以上のNLSを包含するようにプライム編集因子を改変するためのいずれかの好適な手段を企図する。一側面において、プライム編集因子は、そのN末端またはそのC末端(または両方)において1つ以上のNLSに翻訳的に融合されているプライム編集因子タンパク質を発現するように、すなわちプライム編集因子-NLS融合体構築物を形成するように、操作され得る。他の態様において、プライム編集因子をコードするヌクレオチド配列は、コードされるプライム編集因子の内部の領域に1つ以上のNLSをコードする読み枠を組み込むように遺伝子改変され得る。加えて、NLSは、プライム編集因子とN末端に、C末端に、または内部に、例えばそしてタンパク質の中心領域に取り付けられたNLSアミノ酸配列との間にコードされる種々のアミノ酸リンカーまたはスペーサー領域を包含し得る。それゆえに、本開示は、プライム編集因子および1つ以上のNLSを含む融合タンパク質を発現するためのヌクレオチド構築物、ベクター、およびホスト細胞をもまた可能にする。 This disclosure contemplates any suitable means for modifying the prime editing factor to include one or more NLSs. In one aspect, the prime editing factor is configured to express a prime editing factor protein that is translationally fused at its N-terminus or its C-terminus (or both) to one or more NLSs, i.e., prime editing factor-NLS Can be engineered to form fusion constructs. In other embodiments, the nucleotide sequence encoding the prime editing factor can be genetically modified to incorporate reading frames encoding one or more NLSs into regions internal to the encoded prime editing factor. In addition, NLS encodes various amino acid linkers or spacer regions between the prime editing factor and the NLS amino acid sequence attached at the N-terminus, at the C-terminus, or internally, e.g., and in the central region of the protein. can be included. Therefore, the present disclosure also enables nucleotide constructs, vectors, and host cells for expressing fusion proteins that include a prime editing factor and one or more NLSs.

本明細書に記載のプライム編集因子は核局在シグナルをもまた含み得、これらは、1つ以上のリンカー、例えばそしてポリマー性、アミノ酸、核酸、多糖、化学的、または核酸リンカー要素を介してプライム編集因子に連結される。本開示の企図される範囲内のリンカーはいずれかの限定を有することを意図されず、いずれかの好適な型の分子(例えば、ポリマー、アミノ酸、多糖、核酸、脂質、またはいずれかの合成化学的リンカードメイン)であり得、プライム編集因子および1つ以上のNLSの間に結合(例えば、共有結合的連結、水素結合)を形成することを成就するいずれかの好適な戦略によって、プライム編集因子に連結され得る。 The prime editing factors described herein may also include nuclear localization signals, which are linked via one or more linkers, e.g., and polymeric, amino acid, nucleic acid, polysaccharide, chemical, or nucleic acid linker elements. linked to the prime editing factor. Linkers within the contemplated scope of this disclosure are not intended to have any limitations and may include any suitable type of molecule (e.g., polymer, amino acid, polysaccharide, nucleic acid, lipid, or any synthetic chemical (e.g., covalent linkage, hydrogen bonding) between the prime editing factor and one or more NLSs. can be connected to

C.フラップエンドヌクレアーゼ(例えばFEN1)
種々の態様において、PE融合タンパク質は1つ以上のフラップエンドヌクレアーゼ(例えばFEN1)を含み得、これは5'一本鎖DNAフラップの除去を触媒する酵素を言う。これらは天然に存在する酵素であり、これらはDNA複製を包含する細胞性のプロセスの間に形成される5'フラップの除去をプロセシングする。本明細書に記載のプライム編集法は、プライム編集の間に標的部位において形成される内生(endogenouse)DNAの5'フラップを除去するために、内生で供給されるフラップエンドヌクレアーゼまたはトランスで提供されるものを利用し得る。フラップエンドヌクレアーゼは当該技術分野において知られており、Patel et al.,“Flap endonucleases pass 5'-flaps through a flexible arch using a disorder-thread-order mechanism to confer specificity for free 5'-ends,”Nucleic Acids Research,2012,40(10):4507-4519およびTsutakawa et al.,“Human flap endonuclease structures,DNA double-base flipping,and a unified understanding of the FEN1 superfamily,”Cell,2011,145(2):198-211(これら各々は参照により本明細書に組み込まれる)の記載から見出され得る。例示のフラップエンドヌクレアーゼは、以下のアミノ酸配列によって表され得るFEN1である:

Figure 2020191234000108
Figure 2020191234000109
C. flap endonuclease (e.g. FEN1)
In various embodiments, the PE fusion protein can include one or more flap endonucleases (eg, FEN1), which refers to enzymes that catalyze the removal of the 5' single-stranded DNA flap. These are naturally occurring enzymes that process the removal of the 5' flap that is formed during cellular processes including DNA replication. The prime editing method described herein uses an endogenously supplied flap endonuclease or trans to remove the 5' flap of endogenous DNA that forms at the target site during prime editing. You can take advantage of what is provided. Flap endonucleases are known in the art and are described in Patel et al., “Flap endonucleases pass 5'-flaps through a flexible arch using a disorder-thread-order mechanism to confer specificity for free 5'-ends,” Nucleic Acids Research, 2012, 40(10): 4507-4519 and Tsutakawa et al., “Human flap endonuclease structures, DNA double-base flipping, and a unified understanding of the FEN1 superfamily,” Cell, 2011, 145(2): 198-211, each of which is incorporated herein by reference. An exemplary flap endonuclease is FEN1, which can be represented by the following amino acid sequence:
Figure 2020191234000108
Figure 2020191234000109

フラップエンドヌクレアーゼは、いずれかのFEN1バリアント、変異体、または他のフラップエンドヌクレアーゼオーソログ、ホモログ、もしくはバリアントをもまた包含し得る。限定しないFEN1バリアントの例は次のとおりである:

Figure 2020191234000110
Figure 2020191234000111
Flap endonucleases may also include any FEN1 variants, mutants, or other flap endonuclease orthologs, homologs, or variants. Examples of non-limiting FEN1 variants are:
Figure 2020191234000110
Figure 2020191234000111

種々の態様において、本願において企図されるプライム編集因子融合タンパク質は、上の配列のいずれかと少なくとも約70%同一、少なくとも約80%同一、少なくとも約90%同一、少なくとも約95%同一、少なくとも約96%同一、少なくとも約97%同一、少なくとも約98%同一、少なくとも約99%同一、少なくとも約99.5%同一、または少なくとも約99.9%同一であるアミノ酸配列を有する上に開示されている配列のいずれかのフラップエンドヌクレアーゼバリアントを包含し得る。 In various embodiments, the prime editing factor fusion proteins contemplated herein are at least about 70% identical, at least about 80% identical, at least about 90% identical, at least about 95% identical, at least about 96% identical to any of the above sequences. % identical, at least about 97% identical, at least about 98% identical, at least about 99% identical, at least about 99.5% identical, or at least about 99.9% identical to any of the sequences disclosed above. Flap endonuclease variants may be included.

5'端一本鎖DNAフラップの除去を容易化するために本方法によって利用され得る他のエンドヌクレアーゼは、(1)trex2、(2)exo1エンドヌクレアーゼを包含するが、これらに限定されない(例えば、Keijzers et al.,Biosci Rep.2015,35(3):e00206)。
Trex2
Other endonucleases that can be utilized by the present method to facilitate removal of the 5' single-stranded DNA flap include, but are not limited to, (1) trex2, (2) exo1 endonuclease (e.g., Keijzers et al., Biosci Rep. 2015, 35(3):e00206).
Trex2

3' 3プライム修復エキソヌクレアーゼ2(TREX2)-ヒト 3' 3 prime repair exonuclease 2 (TREX2) - human

受託番号NM_080701
MSEAPRAETFVFLDLEATGLPSVEPEIAELSLFAVHRSSLENPEHDESGALVLPRVLDKLTLCMCPERPFTAKASEITGLSSEGLARCRKAGFDGAVVRTLQAFLSRQAGPICLVAHNGFDYDFPLLCAELRRLGARLPRDTVCLDTLPALRGLDRAHSHGTRARGRQGYSLGSLFHRYFRAEPSAAHSAEGDVHTLLLIFLHRAAELLAWADEQARGWAHIEPMYLPPDDPSLEA(配列番号3865)。
Accession number NM_080701
MSEAPRAETFVFLDLEATGLPSVEPEIAELSLFAVHRSSLENPEHDESGALVLPRVLDKLTLCMCPERPFTAKASEITGLSSEGLARCRKAGFDGAVVRTLQAFLSRQAGPICLVAHNGFDYDFPLLCAELRRLGARLPRDTVCLDTLPALRGLDRAHSHGTRARGRQGYSLGSLFHRYFRAEPSAAHSAEGDVHTLLLIFLHRAAELLAWADEQARGWAHIEPMYLPPDDPSLEA (SEQ ID NO:3 865).

3' 3プライム修復エキソヌクレアーゼ2(TREX2)-マウス 3' 3 prime repair exonuclease 2 (TREX2) - mouse

受託番号NM_011907 Accession number NM_011907

MSEPPRAETFVFLDLEATGLPNMDPEIAEISLFAVHRSSLENPERDDSGSLVLPRVLDKLTLCMCPERPFTAKASEITGLSSESLMHCGKAGFNGAVVRTLQGFLSRQEGPICLVAHNGFDYDFPLLCTELQRLGAHLPQDTVCLDTLPALRGLDRAHSHGTRAQGRKSYSLASLFHRYFQAEPSAAHSAEGDVHTLLLIFLHRAPELLAWADEQARSWAHIEPMYVPPDGPSLEA(配列番号3866)。 MSEPPRAETFVFLDLEATGLPNMDPEIAEISLFAVHRSSLENPERDDSGSLVLPRVLDKLTLCMCPERPFTAKASEITGLSSESLMHCGKAGFNGAVVRTLQGFLSRQEGPICLVAHNGFDYDFPLLCTELQRLGAHLPQDTVCLDTLPALRGLDRAHSHGTRAQGRKSYSLASLFHRYFQAEPSAAHSAEGDVHTLLLIFLHRAPELLAWADEQARSWAHIEPMYVPPDGPSLEA (SEQ ID NO: 3866).

3' 3プライム修復エキソヌクレアーゼ2(TREX2)-ラット 3' 3 prime repair exonuclease 2 (TREX2) - rat

受託番号NM_001107580 Accession number NM_001107580

MSEPLRAETFVFLDLEATGLPNMDPEIAEISLFAVHRSSLENPERDDSGSLVLPRVLDKLTLCMCPERPFTAKASEITGLSSEGLMNCRKAAFNDAVVRTLQGFLSRQEGPICLVAHNGFDYDFPLLCTELQRLGAHLPRDTVCLDTLPALRGLDRVHSHGTRAQGRKSYSLASLFHRYFQAEPSAAHSAEGDVNTLLLIFLHRAPELLAWADEQARSWAHIEPMYVPPDGPSLEA(配列番号3867)。 MSEPLRAETFVFLDLEATGLPNMDPEIAEISLFAVHRSSLENPERDDSGSLVLPRVLDKLTLCMCPERPFTAKASEITGLSSEGLMNCRKAAFNDAVVRTLQGFLSRQEGPICLVAHNGFDYDFPLLCTELQRLGAHLPRDTVCLDTLPALRGLDRVHSHGTRAQGRKSYSLASLFHRYFQAEPSAAHSAEGDVNTLLLIFLHRAPELLAWADEQARSWAHIEPMYVPPDGPSLEA( SEQ ID NO: 3867).

ExoI
ヒトエキソヌクレアーゼ1(EXO1)は、DNAミスマッチ修復(MMR)、マイクロ媒介末端結合(micro-mediated end-joining、相同組換え(HR)、および複製を包含する、多くの種々のDNA代謝プロセスに関係する。ヒトEXO1は、真核生物ヌクレアーゼRad2/XPGのファミリーに属し、これはまたFEN1およびGEN1も包含する。Rad2/XPGファミリーは、ファージからヒトまでの種を通してヌクレアーゼドメインが保存されている。EXO1遺伝子産物は、5'エキソヌクレアーゼと5'フラップ活性との両方を呈する。加えて、EXO1は、固有の5'RNase H活性も含有する。ヒトEXO1は、二本鎖DNA(dsDNA)、ニック、ギャップ、シュードY構造のプロセシングに対し高親和性を有し、遺伝で受け継いだそのフラップ活性を使用してホリデイ接点を分解し得る。ヒトEXO1はMMRに関係し、MLH1およびMSH2と直接相互作用する保存された結合ドメインを含有する。EXO1核酸分解活性は、PCNA、MutSα(MSH2/MSH6複合体)、14-3-3、MRN、および9-1-1複合体によって正に刺激される。
ExoI
Human exonuclease 1 (EXO1) is involved in many different DNA metabolic processes, including DNA mismatch repair (MMR), micro-mediated end-joining, homologous recombination (HR), and replication. Human EXO1 belongs to the family of eukaryotic nucleases Rad2/XPG, which also includes FEN1 and GEN1. The Rad2/XPG family has a conserved nuclease domain across species from phages to humans. EXO1 The gene product exhibits both 5' exonuclease and 5' flap activities. In addition, EXO1 also contains unique 5' RNase H activity. It has a high affinity for processing gap, pseudo-Y structures and can use its inherited flap activity to disassemble Holliday contacts. Human EXO1 is involved in MMR and interacts directly with MLH1 and MSH2 Contains a conserved binding domain. EXO1 nucleolytic activity is positively stimulated by PCNA, MutSα (MSH2/MSH6 complex), 14-3-3, MRN, and 9-1-1 complex.

エキソヌクレアーゼ1(EXO1)受託番号NM_003686(Homo sapiensエキソヌクレアーゼ1(EXO1)、転写産物バリアント3)-アイソフォームA
MGIQGLLQFIKEASEPIHVRKYKGQVVAVDTYCWLHKGAIACAEKLAKGEPTDRYVGFCMKFVNMLLSHGIKPILVFDGCTLPSKKEVERSRRERRQANLLKGKQLLREGKVSEARECFTRSINITHAMAHKVIKAARSQGVDCLVAPYEADAQLAYLNKAGIVQAIITEDSDLLAFGCKKVILKMDQFGNGLEIDQARLGMCRQLGDVFTEEKFRYMCILSGCDYLSSLRGIGLAKACKVLRLANNPDIVKVIKKIGHYLKMNITVPEDYINGFIRANNTFLYQLVFDPIKRKLIPLNAYEDDVDPETLSYAGQYVDDSIALQIALGNKDINTFEQIDDYNPDTAMPAHSRSHSWDDKTCQKSANVSSIWHRNYSPRPESGTVSDAPQLKENPSTVGVERVISTKGLNLPRKSSIVKRPRSAELSEDDLLSQYSLSFTKKTKKNSSEGNKSLSFSEVFVPDLVNGPTNKKSVSTPPRTRNKFATFLQRKNEESGAVVVPGTRSRFFCSSDSTDCVSNKVSIQPLDETAVTDKENNLHESEYGDQEGKRLVDTDVARNSSDDIPNNHIPGDHIPDKATVFTDEESYSFESSKFTRTISPPTLGTLRSCFSWSGGLGDFSRTPSPSPSTALQQFRRKSDSPTSLPENNMSDVSQLKSEESSDDESHPLREEACSSQSQESGEFSLQSSNASKLSQCSSKDSDSEESDCNIKLLDSQSDQTSKLRLSHFSKKDTPLRNKVPGLYKSSSADSLSTTKIKPLGPARASGLSKKPASIQKRKHHNAENKPGLQIKLNELWKNFGFKKF(配列番号3868)。
Exonuclease 1 (EXO1) Accession Number NM_003686 (Homo sapiens exonuclease 1 (EXO1), transcript variant 3) - Isoform A
(SEQ ID NO: 3868).

エキソヌクレアーゼ1(EXO1)受託番号NM_006027(Homo sapiensエキソヌクレアーゼ1(EXO1)、転写産物バリアント3)-アイソフォームB Exonuclease 1 (EXO1) Accession Number NM_006027 (Homo sapiens exonuclease 1 (EXO1), transcript variant 3) - Isoform B

MGIQGLLQFIKEASEPIHVRKYKGQVVAVDTYCWLHKGAIACAEKLAKGEPTDRYVGFCMKFVNMLLSHGIKPILVFDGCTLPSKKEVERSRRERRQANLLKGKQLLREGKVSEARECFTRSINITHAMAHKVIKAARSQGVDCLVAPYEADAQLAYLNKAGIVQAIITEDSDLLAFGCKKVILKMDQFGNGLEIDQARLGMCRQLGDVFTEEKFRYMCILSGCDYLSSLRGIGLAKACKVLRLANNPDIVKVIKKIGHYLKMNITVPEDYINGFIRANNTFLYQLVFDPIKRKLIPLNAYEDDVDPETLSYAGQYVDDSIALQIALGNKDINTFEQIDDYNPDTAMPAHSRSHSWDDKTCQKSANVSSIWHRNYSPRPESGTVSDAPQLKENPSTVGVERVISTKGLNLPRKSSIVKRPRSAELSEDDLLSQYSLSFTKKTKKNSSEGNKSLSFSEVFVPDLVNGPTNKKSVSTPPRTRNKFATFLQRKNEESGAVVVPGTRSRFFCSSDSTDCVSNKVSIQPLDETAVTDKENNLHESEYGDQEGKRLVDTDVARNSSDDIPNNHIPGDHIPDKATVFTDEESYSFESSKFTRTISPPTLGTLRSCFSWSGGLGDFSRTPSPSPSTALQQFRRKSDSPTSLPENNMSDVSQLKSEESSDDESHPLREEACSSQSQESGEFSLQSSNASKLSQCSSKDSDSEESDCNIKLLDSQSDQTSKLRLSHFSKKDTPLRNKVPGLYKSSSADSLSTTKIKPLGPARASGLSKKPASIQKRKHHNAENKPGLQIKLNELWKNFGFKKDSEKLPPCKKPLSPVRDNIQLTPEAEEDIFNKPECGRVQRAIFQ(配列番号3869)。 MGIS FRYMCILSGCDYLSSLRGIGLAKACKVLRLANNPDIVKVIKKIGHYLKMNITVPEDYINGFIRANNTFLYQLVFDPIKRKLIPLNAYEDDVDPETLSYAGQYVDDSIALQIALGNKDINTFEQIDDYNPDTAMPAHSRSHSWDDKTCQKSANVSSIWHRNYSPRPESGTVSDAPQLKENPSTVGVERVISTKGLNLPRKSSIVKRPRSAELSEDDLLSQYSLSFTKKTKKNS SEGNKSLSFSEVFVPDLVNGPTNKKSVSTPPRTRNKFATFLQRKNEESGAVVVPGTRSRFFCSSDSTDCVSNKVSIQPLDETAVTDKENNLHESEYGDQEGKRLVDTDVARNSSDDIPNNHIPGDHIPDKATVFTDEESYSFESSKFTRTISPPTLGTLRSCFSWSGGLGDFSRTPSPSPSTALQQFRRKSDSPTSLPENNMSDVSQLKSEESSDDESHPLREESQSQ ESGEFSLQSNASKLSQCSSKDSDSEESDCNIKLLDSQSDQTSKLRLSHFSKKDTPLRNKVPGLYKSSSADSLSTTKIKPLGPARASGLSKKPASIQKRKHHNAENKPGLQIKLNELWKNFGFKKDSEKLPPCKKPLSPVRDNIQLTPEAEEDIFNKPECGRVQRAIFQ (SEQ ID NO: 3869).

エキソヌクレアーゼ1(EXO1)受託番号NM_001319224(Homo sapiensエキソヌクレアーゼ1(EXO1)、転写産物バリアント4)-アイソフォームC Exonuclease 1 (EXO1) Accession number NM_001319224 (Homo sapiens exonuclease 1 (EXO1), transcript variant 4) - isoform C

MGIQGLLQFIKEASEPIHVRKYKGQVVAVDTYCWLHKGAIACAEKLAKGEPTDRYVGFCMKFVNMLLSHGIKPILVFDGCTLPSKKEVERSRRERRQANLLKGKQLLREGKVSEARECFTRSINITHAMAHKVIKAARSQGVDCLVAPYEADAQLAYLNKAGIVQAIITEDSDLLAFGCKKVILKMDQFGNGLEIDQARLGMCRQLGDVFTEEKFRYMCILSGCDYLSSLRGIGLAKACKVLRLANNPDIVKVIKKIGHYLKMNITVPEDYINGFIRANNTFLYQLVFDPIKRKLIPLNAYEDDVDPETLSYAGQYVDDSIALQIALGNKDINTFEQIDDYNPDTAMPAHSRSHSWDDKTCQKSANVSSIWHRNYSPRPESGTVSDAPQLKENPSTVGVERVISTKGLNLPRKSSIVKRPRSELSEDDLLSQYSLSFTKKTKKNSSEGNKSLSFSEVFVPDLVNGPTNKKSVSTPPRTRNKFATFLQRKNEESGAVVVPGTRSRFFCSSDSTDCVSNKVSIQPLDETAVTDKENNLHESEYGDQEGKRLVDTDVARNSSDDIPNNHIPGDHIPDKATVFTDEESYSFESSKFTRTISPPTLGTLRSCFSWSGGLGDFSRTPSPSPSTALQQFRRKSDSPTSLPENNMSDVSQLKSEESSDDESHPLREEACSSQSQESGEFSLQSSNASKLSQCSSKDSDSEESDCNIKLLDSQSDQTSKLRLSHFSKKDTPLRNKVPGLYKSSSADSLSTTKIKPLGPARASGLSKKPASIQKRKHHNAENKPGLQIKLNELWKNFGFKKDSEKLPPCKKPLSPVRDNIQLTPEAEEDIFNKPECGRVQRAIFQ(配列番号3870)。 MGIS FRYMCILSGCDYLSSLRGIGLAKACKVLRLANNPDIVKVIKKIGHYLKMNITVPEDYINGFIRANNTFLYQLVFDPIKRKLIPLNAYEDDVDPETLSYAGQYVDDSIALQIALGNKDINTFEQIDDYNPDTAMPAHSRSHSWDDKTCQKSANVSSIWHRNYSPRPESGTVSDAPQLKENPSTVGVERVISTKGLNLPRKSSIVKRPRSELSEDDLLSQYSLSFTKKTKKNS SEGNKSLSFSEVFVPDLVNGPTNKKSVSTPPRTRNKFATFLQRKNEESGAVVVPGTRSRFFCSSDSTDCVSNKVSIQPLDETAVTDKENNLHESEYGDQEGKRLVDTDVARNSSDDIPNNHIPGDHIPDKATVFTDEESYSFESSKFTRTISPPTLGTLRSCFSWSGGLGDFSRTPSPSPSTALQQFRRKSDSPTSLPENNMSDVSQLKSEESSDDESHPLREESQSQ ESGEFSLQSSNASKLSQCSSKDSDSEESDCNIKLLDSQSDQTSKLRLSHFSKKDTPLRNKVPGLYKSSSADSLSTTKIKPLGPARASGLSKKPASIQKRKHHNAENKPGLQIKLNELWKNFGFKKDSEKLPPCKKPLSPVRDNIQLTPEAEEDIFNKPECGRVQRAIFQ (SEQ ID NO: 3870).

D.インテインおよび分裂インテイン
いくつかの態様では(例えば、AAV粒子を用いるインビボのプライム編集因子の送達)、ポリペプチド(例えば、デアミナーゼまたはnapDNAbp)または融合タンパク質(例えばプライム編集因子)をN末端の半分およびC末端の半分へと分裂し、それらを別個に送達し、それからそれらの共局在が完全なタンパク質(または場合に応じて融合タンパク質)を細胞内で再形成することを許すことが有利であり得るということは理解されるであろう。タンパク質または融合タンパク質の別個の半分同士は、夫々が、タンパク質トランススプライシングの機序による完全なタンパク質または融合タンパク質の再形成を容易化するための分裂インテインタグを含み得る。
D. Inteins and split inteins
In some embodiments (e.g., delivery of prime editing factor in vivo using AAV particles), a polypeptide (e.g., deaminase or napDNAbp) or fusion protein (e.g., prime editing factor) is added to the N-terminal half and the C-terminal half. It is understood that it may be advantageous to deliver them separately and then allow their co-localization to re-form the complete protein (or fusion protein, as the case may be) within the cell. will be done. The separate halves of the protein or fusion protein may each contain a split intein tag to facilitate reformation of the complete protein or fusion protein by the mechanism of protein trans-splicing.

分裂インテインによって触媒されるタンパク質トランススプライシングは、タンパク質ライゲーションのための全く酵素的な方法を提供する。分裂インテインは、夫々NインテインおよびCインテインという名称の2つのピースへと分裂された本質的に一続きのインテイン(例えばミニインテイン)である。分裂インテインのNインテインおよびCインテインは、非共有結合的に会合して活性なインテインを形成し、一続きのインテインがするのと本質的に同じやり方でスプライシング反応を触媒し得る。分裂インテインは天然に見出され、実験室でもまた操作されている。本願において用いられる用語「分裂インテイン」は、1つ以上のペプチド結合切断がN末端およびC末端アミノ酸配列の間に存在するいずれかのインテインを言い、その結果、N末端およびC末端配列が別個の分子になり、これらは、トランススプライシング反応について機能的であるインテインへと非共有結合的に再会合または再構成し得る。いずれかの触媒的に活性なインテインまたはそのフラグメントが、本発明の方法への使用のための分裂インテインを導出するために用いられ得る。例えば、一側面において、分裂インテインは真核生物インテインに由来し得る。別の側面において、分裂インテインは細菌インテインに由来し得る。別の側面において、分裂インテインは古細菌インテインに由来し得る。好ましくは、そのように導出された分裂インテインは、トランススプライシング反応を触媒することにとって必須のアミノ酸配列のみを所有するであろう。 Protein trans-splicing catalyzed by split inteins provides a purely enzymatic method for protein ligation. A split intein is essentially a continuous intein (eg, a mini-intein) that has been split into two pieces named N-intein and C-intein, respectively. The N and C inteins of a split intein can non-covalently associate to form an active intein and catalyze splicing reactions in essentially the same way that a continuous intein does. Split inteins are found in nature and have also been manipulated in the laboratory. As used herein, the term "split intein" refers to any intein in which one or more peptide bond cleavages exist between the N-terminal and C-terminal amino acid sequences, such that the N-terminal and C-terminal sequences are distinct. molecules, which can non-covalently reassemble or reconstitute into inteins that are functional for trans-splicing reactions. Any catalytically active intein or fragment thereof can be used to derive a split intein for use in the methods of the invention. For example, in one aspect, a fission intein can be derived from a eukaryotic intein. In another aspect, the fission intein can be derived from a bacterial intein. In another aspect, the fission intein can be derived from an archaeal intein. Preferably, the split intein so derived will possess only the amino acid sequences essential for catalyzing the trans-splicing reaction.

本願において用いられる「N末端分裂インテイン(In)」は、トランススプライシング反応について機能的であるN末端アミノ酸配列を含むいずれかのインテイン配列を言う。Inは、それゆえに、トランススプライシングが生起するときにスプライスアウトされる配列をもまた含む。Inは、天然に存在するインテイン配列のN末端部分の改変である配列を含み得る。例えば、かかる追加のおよび/または変異した残基の包含がInをトランススプライシングにおいて非機能的にしない限り、Inは追加のアミノ酸残基および/または変異した残基を含み得る。好ましくは、追加のおよび/または変異した残基の包含は、Inのトランススプライシング活性を改善または増強する。 As used herein, "N-terminal split intein (In)" refers to any intein sequence that includes an N-terminal amino acid sequence that is functional for a trans-splicing reaction. In therefore also includes sequences that are spliced out when trans-splicing occurs. In can include sequences that are modifications of the N-terminal portion of a naturally occurring intein sequence. For example, In can include additional amino acid residues and/or mutated residues, so long as the inclusion of such additional and/or mutated residues does not render In non-functional in trans-splicing. Preferably, the inclusion of additional and/or mutated residues improves or enhances the trans-splicing activity of In.

本願において用いられる「C末端分裂インテイン(Ic)」は、トランススプライシング反応について機能的であるC末端アミノ酸配列を含むいずれかのインテイン配列を言う。一側面において、Icは、それが由来したインテインの最後のβ鎖からである一続きの4から7アミノ酸残基、少なくとも4アミノ酸を含む。Icは、それゆえに、トランススプライシングが生起するときにスプライスアウトされる配列をもまた含む。Icは、天然に存在するインテイン配列のC末端部分の改変である配列を含み得る。例えば、かかる追加のおよび/または変異した残基の包含がInをトランススプライシングにおいて非機能的にしない限り、Icは追加のアミノ酸残基および/または変異した残基を含み得る。好ましくは、追加のおよび/または変異した残基の包含は、Icのトランススプライシング活性を改善または増強する。 As used herein, a "C-terminal split intein (Ic)" refers to any intein sequence that includes a C-terminal amino acid sequence that is functional for a trans-splicing reaction. In one aspect, the Ic comprises a stretch of 4 to 7 amino acid residues, at least 4 amino acids, from the last β-strand of the intein from which it is derived. Ic therefore also includes sequences that are spliced out when trans-splicing occurs. Ic may include a sequence that is a modification of the C-terminal portion of a naturally occurring intein sequence. For example, Ic may include additional amino acid residues and/or mutated residues, so long as the inclusion of such additional and/or mutated residues does not render the In non-functional in trans-splicing. Preferably, the inclusion of additional and/or mutated residues improves or enhances the trans-splicing activity of Ic.

本発明のいくつかの態様では、IcまたはInに連結されたペプチドは、とりわけ蛍光基、ビオチン、ポリエチレングリコール(PEG)、アミノ酸アナログ、非天然のアミノ酸、リン酸基、グリコシル基、放射性同位体標識、および医薬分子を包含する追加の化学的部分を含み得る。他の態様において、Icに連結されたペプチドは、とりわけケトン、アルデヒド、Cys残基、およびLys残基を包含する1つ以上の化学反応性基を含み得る。「インテインスプライシングポリペプチド(ISP)」が存在するときには、分裂インテインのNインテインおよびCインテインは非共有結合的に会合して活性なインテインを形成し、スプライシング反応を触媒し得る。本願において用いられる「インテインスプライシングポリペプチド(ISP)」は、Ic、In、または両方が分裂インテインから除去されるときに留まる分裂インテインのアミノ酸配列の部分を言う。ある態様において、InはISPを含む。別の態様では、IcはISPを含む。さらに別の態様では、ISPはInにもIcにも共有結合的に連結されていない別個のペプチドである。 In some embodiments of the invention, the peptide linked to Ic or In includes fluorescent groups, biotin, polyethylene glycol (PEG), amino acid analogs, unnatural amino acids, phosphate groups, glycosyl groups, radioisotope labels, among others. , and additional chemical moieties including pharmaceutical molecules. In other embodiments, the peptide linked to Ic may contain one or more chemically reactive groups including ketones, aldehydes, Cys residues, and Lys residues, among others. When an "intein splicing polypeptide (ISP)" is present, the N and C inteins of the split intein can non-covalently associate to form the active intein and catalyze the splicing reaction. As used herein, "intein splicing polypeptide (ISP)" refers to the portion of the amino acid sequence of a splitting intein that remains when Ic, In, or both are removed from the splitting intein. In certain embodiments, In includes ISP. In another embodiment, Ic comprises ISP. In yet another embodiment, the ISP is a separate peptide that is not covalently linked to either In or Ic.

分裂インテインは、ミニインテインの構造上に見出される-12の保存されたベータ鎖間の構造化されていないループまたは介在アミノ酸配列中に1つ以上の分裂部位を操作することによって、一続きのインテインから生出され得る。分裂の生出が、タンパク質スプライシング活性が失われる十分な度合まではインテインの構造、特に構造化されたベータ鎖を遮断しないであろうという条件で、ベータ鎖間の領域内の分裂部位の位置のいくらかのフレキシビリティーが存在し得る。 Split inteins are created by engineering one or more splitting sites in unstructured loops or intervening amino acid sequences between the 12 conserved beta strands found on the structure of mini-inteins. can be generated from. Some of the location of the cleavage site within the inter-beta strand region, provided that the generation of cleavages will not interrupt the structure of the intein, particularly the structured beta strand, to a sufficient degree that protein splicing activity is lost. flexibility can exist.

タンパク質トランススプライシングでは、1つの前駆体タンパク質はNインテインによって後続されるNエクステインパーツからなり、別の前駆体タンパク質はCエクステインパーツによって後続されるCインテインからなり、トランススプライシング反応(一緒にNおよびCインテインによって触媒される)が2つのインテイン配列を切除、2つのエクステイン配列をペプチド結合によって連結する。酵素反応であるタンパク質トランススプライシングは、非常に低い(例えばマイクロモル)濃度のタンパク質で働き得、生理条件下において実行され得る。 In protein trans-splicing, one precursor protein consists of an N extein part followed by an N intein, another precursor protein consists of a C intein followed by a C extein part, and the trans-splicing reaction (together N and C intein) excises the two intein sequences and connects the two extein sequences by a peptide bond. Protein trans-splicing, an enzymatic reaction, can work with very low (eg, micromolar) concentrations of protein and can be carried out under physiological conditions.

例示の配列は次のとおりである:

Figure 2020191234000112
Figure 2020191234000113
An example array is:
Figure 2020191234000112
Figure 2020191234000113

インテインは最も頻繁には一続きのドメインとして見出されるが、いくつかは天然に分裂された形態で存在する。このケースでは、2つのフラグメントは別個のポリペプチドとして発現され、スプライシング、いわゆるタンパク質トランススプライシングが生起する前に会合しなければならない。 Inteins are most frequently found as a continuous domain, but some naturally occur in a split form. In this case, the two fragments are expressed as separate polypeptides and must associate before splicing, known as protein trans-splicing, can occur.

例示の分裂インテインはSsp DnaEインテインであり、これは2つのサブユニットつまりDnaE-NおよびDnaE-Cを含む。2つの異なるサブユニットは別個の遺伝子つまりdnaE-nおよびdnaE-cによってコードされ、これらは夫々DnaE-NおよびDnaE-Cサブユニットをコードする。DnaEはSynechocytis sp. PCC6803の天然に存在する分裂インテインであり、夫々がDnaE-NまたはDnaE-Cどちらかとの融合体を含む2つの別個のタンパク質のトランススプライシングを導くことができる。 An exemplary fission intein is the Ssp DnaE intein, which contains two subunits, DnaE-N and DnaE-C. The two different subunits are encoded by separate genes, dnaE-n and dnaE-c, which encode the DnaE-N and DnaE-C subunits, respectively. DnaE is a naturally occurring fission intein of Synechocytis sp. PCC6803 that can direct the trans-splicing of two separate proteins, each containing a fusion with either DnaE-N or DnaE-C.

追加の天然に存在するまたは操作された分裂インテイン配列は当該技術分野(the)において公知であるか、または本明細書に記載の丸ごとのインテイン配列もしくは当該技術分野で利用可能なものから作られ得る。分裂インテイン配列の例は、Stevens et al.,“A promiscuous split intein with expanded protein engineering applications,”PNAS,2017,Vol.114:8538-8543;Iwai et al.,“Highly efficient protein trans-splicing by a naturally split DnaE intein from Nostc punctiforme,FEBS Lett,580:1853-1858に見出され得る。これらの夫々は参照によって本願に組み込まれる。追加の分裂インテイン配列は例えばWO2013/045632、WO2014/055782、WO2016/069774、およびEP2877490に見出され得る。これらの夫々の内容は参照によって本願に組み込まれる。 Additional naturally occurring or engineered split intein sequences are known in the art or can be made from the entire intein sequences described herein or available in the art. Examples of split intein sequences can be found in Stevens et al., “A promiscuous split intein with expanded protein engineering applications,” PNAS, 2017, Vol. 114: 8538-8543; Iwai et al., “Highly efficient protein trans-splicing by a naturally split DnaE intein from Nostc punctiforme, FEBS Lett, 580: 1853-1858, each of which is incorporated herein by reference. Additional split intein sequences can be found, for example, in WO2013/045632, WO2014/055782, WO2016/069774, and EP2877490, the contents of each of which are incorporated herein by reference.

加えて、トランスのタンパク質スプライシングがインビボおよびin vitroで記載されており(Shingledecker,et al.,[0076]Gene 207:187(1998),Southworth,et al.,EMBO J.17:918(1998);Mills,et al.,Proc.Natl.Acad.Sci.USA,95:3543-3548(1998);Lew,et al.,J.Biol.Chem.,273:15887-15890(1998);Wu,et al.,Biochim.Biophys.Acta 35732:1(1998b),Yamazaki,et al.,J.Am.Chem.Soc.120:5591(1998),Evans,et al.,J.Biol.Chem.275:9091(2000);Otomo,et al.,Biochemistry 38:16040-16044(1999);Otomo,et al.,J.Biolmol.NMR 14:105-114(1999);Scott,et al.,Proc.Natl.Acad.Sci.USA 96:13638-13643(1999))、爾後にライゲーションを経過して機能的な産物を形成する2つの不活性なフラグメントとして、あるタンパク質を発現するための機会を提供する。例えば、2つの別個に発現される半分からの完全なPE融合タンパク質の形成について、図66および67に示されているとおりである。 Additionally, protein splicing in trans has been described in vivo and in vitro (Shingledecker, et al.,[0076]Gene 207:187(1998), Southworth, et al., EMBO J.17:918(1998). ;Mills,et al.,Proc.Natl.Acad.Sci.USA,95:3543-3548(1998);Lew,et al.,J.Biol.Chem.,273:15887-15890(1998);Wu, et al.,Biochim.Biophys.Acta 35732:1(1998b),Yamazaki,et al.,J.Am.Chem.Soc.120:5591(1998),Evans,et al.,J.Biol.Chem.275 :9091(2000);Otomo,et al.,Biochemistry 38:16040-16044(1999);Otomo,et al.,J.Biolmol.NMR 14:105-114(1999);Scott,et al.,Proc. Natl. Acad. Sci. USA 96:13638-13643 (1999)), provides an opportunity to express a protein as two inactive fragments that subsequently undergo ligation to form a functional product. . For example, as shown in Figures 66 and 67 for the formation of a complete PE fusion protein from two separately expressed halves.

E.RNA-タンパク質相互作用ドメイン
種々の態様において、2つの別個のタンパク質ドメイン(例えば、Cas9ドメインおよびポリメラーゼドメイン)は、「RNA-タンパク質動員システム」、例えば「MS2タグ付け技術」を用いることによって、機能的な複合体(2つの別個のタンパク質ドメインを含む融合タンパク質の機能と同様)を形成するように互いに共局在させられ得る。かかるシステムは、一般的には、1つのタンパク質ドメインを「RNA-タンパク質相互作用ドメイン」(「RNA-タンパク質動員ドメイン」としてもまた公知)によって、他をRNA-タンパク質相互作用ドメイン、例えば特定のヘアピン構造を特異的に認識および結合する「RNA結合タンパク質」によってタグ付けする。これらの型のシステムは、プライム編集因子のドメイン同士を共局在させるためにおよびUGIドメインなどの追加の機能性をプライム編集因子に動員するために活用され得る。1つの例では、MS2タグ付け技術は、ファージのゲノム上に存在するステムループまたはヘアピン構造、すなわち「MS2ヘアピン」とのMS2バクテリオファージコートタンパク質(「MCP」または「MS2cp」)の天然の相互作用に基づく。MS2ヘアピンのケースでは、それはMS2バクテリオファージコートタンパク質(MCP)によって認識および結合される。それゆえに、1つの例示的シナリオでは、デアミナーゼ-MS2融合体はCas9-MCP融合体を動員し得る。
E. RNA-protein interaction domain
In various embodiments, two separate protein domains (e.g., a Cas9 domain and a polymerase domain) are assembled into a functional complex (two can be co-localized with each other to form (similar to the function of fusion proteins containing separate protein domains). Such systems generally define one protein domain by an "RNA-protein interaction domain" (also known as an "RNA-protein recruitment domain") and another by an RNA-protein interaction domain, e.g. a particular hairpin. The structure is tagged with an "RNA-binding protein" that specifically recognizes and binds to it. These types of systems can be exploited to colocalize domains of prime editing factors and to recruit additional functionality to prime editing factors, such as UGI domains. In one example, MS2 tagging technology is based on the natural interaction of the MS2 bacteriophage coat protein ("MCP" or "MS2cp") with a stem-loop or hairpin structure, or "MS2 hairpin," present on the phage's genome. based on. In the case of the MS2 hairpin, it is recognized and bound by the MS2 bacteriophage coat protein (MCP). Therefore, in one exemplary scenario, a deaminase-MS2 fusion may recruit a Cas9-MCP fusion.

他のモジュラーなRNA-タンパク質相互作用ドメインの総説は当該技術分野において例えばJohansson et al.,“RNA recognition by the MS2 phage coat protein,”Sem Virol.,1997,Vol.8(3):176-185;Delebecque et al.,“Organization of intracellular reactions with rationally designed RNA assemblies,”Science,2011,Vol.333:470-474;Mali et al.,“Cas9 transcriptional activators for target specificity screening and paired nickases for cooperative genome engineering,”Nat.Biotechnol.,2013,Vol.31:833-838;およびZalatan et al.,“Engineering complex synthetic transcriptional programs with CRISPR RNA scaffolds,”Cell,2015,Vol.160:339-350に記載されている。これらの夫々はそれらの全体が参照によって本願に組み込まれる。他のシステムは、特異的にPCPタンパク質を動員するPP7ヘアピン、および特異的にComタンパク質を動員する「com」ヘアピンを包含する。Zalatan et al.を見よ。 Reviews of other modular RNA-protein interaction domains are available in the art, for example, by Johansson et al., “RNA recognition by the MS2 phage coat protein,” Sem Virol., 1997, Vol. 8(3):176-185. ;Delebecque et al., “Organization of intracellular reactions with rationally designed RNA assemblies,” Science,2011,Vol.333:470-474;Mali et al., “Cas9 transcriptional activators for target specificity screening and paired nickases for cooperative genome engineering ,” Nat.Biotechnol.,2013,Vol.31:833-838; and Zalatan et al., “Engineering complex synthetic transcription synthetic programs with CRISPR RNA scaffolds,” Cell,2015,Vol.160:339-350. There is. Each of these is incorporated herein by reference in its entirety. Other systems include the PP7 hairpin, which specifically recruits PCP proteins, and the "com" hairpin, which specifically recruits Com proteins. See Zalatan et al.

MS2ヘアピン(または「MS2アプタマー」とも等価に称される)のヌクレオチド配列は:GCCAACATGAGGATCACCCATGTCTGCAGGGCC(配列番号763)である。 The nucleotide sequence of the MS2 hairpin (or equivalently referred to as "MS2 aptamer") is: GCCAACATGAGGATCACCCATGTCTGCAGGGCC (SEQ ID NO : 763 ).

MCPまたはMS2cpのアミノ酸配列は:
GSASNFTQFVLVDNGGTGDVTVAPSNFANGVAEWISSNSRSQAYKVTCSVRQSSAQNRKYTIKVEVPKVATQTVGGEELPVAGWRSYLNMELTIPIFATNSDCELIVKAMQGLLKDGNPIPSAIAANSGIY(配列番号764)である。
The amino acid sequence of MCP or MS2cp is:
GSASNFTQFVLVDNGGTGDVTVAPSNFANGVAEWISSNSRSQAYKVTCSVRQSSAQNRKYTIKVEVPKVATQTVGGEELPVAGWRSYLNMELTIPIFATNSDCELIVKAMQGLLKDGNPIPSAIAANSGIY (SEQ ID NO : 764 ).

F.UGIドメイン
他の態様において、本明細書に記載のプライム編集因子は1つ以上のウラシルグリコシラーゼ阻害剤ドメインを含み得る。本願において用いられる用語「ウラシルグリコシラーゼ阻害剤(UGI)」または「UGIドメイン」は、ウラシルDNAグリコシラーゼ塩基除去修復酵素を阻害することができるタンパク質を言う。いくつかの態様では、UGIドメインは、野生型UGIまたは配列番号3873で明示されるUGIを含む。いくつかの態様では、本願において提供されるUGIタンパク質は、UGIのフラグメント、およびUGIまたはUGIフラグメントに対して相同的なタンパク質を包含する。例えば、いくつかの態様では、UGIドメインは、配列番号3873で明示されるアミノ酸配列のフラグメントを含む。いくつかの態様では、UGIフラグメントは、配列番号3873で明示されるアミノ酸配列の少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも99.5%を含むアミノ酸配列を含む。いくつかの態様では、UGIは、配列番号3873で明示されるアミノ酸配列に対して相同的なアミノ酸配列、または配列番号3873で明示されるアミノ酸配列のフラグメントに対して相同的なアミノ酸配列を含む。いくつかの態様では、UGIもしくはUGIのフラグメントまたはUGIもしくはUGIフラグメントのホモログを含むタンパク質は、「UGIバリアント」と言われる。UGIバリアントはUGIまたはそのフラグメントに対する相同性を共有する。例えば、UGIバリアントは、野生型UGIまたは配列番号3873で明示されるUGIと少なくとも70%同一、少なくとも75%同一、少なくとも80%同一、少なくとも85%同一、少なくとも90%同一、少なくとも95%同一、少なくとも96%同一、少なくとも97%同一、少なくとも98%同一、少なくとも99%同一、少なくとも99.5%同一、または少なくとも99.9%同一である。いくつかの態様では、UGIバリアントは、フラグメントが野生型UGIまたは配列番号3873で明示されるUGIの対応するフラグメントと少なくとも70%同一、少なくとも80%同一、少なくとも90%同一、少なくとも95%同一、少なくとも96%同一、少なくとも97%同一、少なくとも98%同一、少なくとも99%同一、少なくとも99.5%同一、または少なくとも99.9%であるようにして、UGIのフラグメントを含む。いくつかの態様では、UGIは次のアミノ酸配列を含む:
F. UGI domain
In other embodiments, the prime editors described herein may comprise one or more uracil glycosylase inhibitor domains. As used herein, the term "uracil glycosylase inhibitor (UGI)" or "UGI domain" refers to a protein that can inhibit uracil DNA glycosylase base excision repair enzyme. In some embodiments, the UGI domain comprises wild-type UGI or the UGI set forth in SEQ ID NO: 3873. In some embodiments, the UGI proteins provided herein include fragments of UGI and proteins homologous to UGI or UGI fragments. For example, in some embodiments, the UGI domain comprises a fragment of the amino acid sequence set forth in SEQ ID NO: 3873. In some embodiments, the UGI fragment comprises an amino acid sequence comprising at least 60%, at least 65%, at least 70%, at least 75%, at least 80%, at least 85%, at least 90%, at least 95%, at least 96%, at least 97%, at least 98%, at least 99%, or at least 99.5% of the amino acid sequence set forth in SEQ ID NO: 3873. In some embodiments, UGI comprises an amino acid sequence homologous to the amino acid sequence set forth in SEQ ID NO: 3873, or an amino acid sequence homologous to a fragment of the amino acid sequence set forth in SEQ ID NO: 3873. In some embodiments, a protein comprising UGI or a fragment of UGI or a homolog of UGI or a UGI fragment is referred to as a "UGI variant." A UGI variant shares homology to UGI or a fragment thereof. For example, a UGI variant is at least 70% identical, at least 75% identical, at least 80% identical, at least 85% identical, at least 90% identical, at least 95% identical, at least 96% identical, at least 97% identical, at least 98% identical, at least 99% identical, at least 99.5% identical, or at least 99.9% identical to wild-type UGI or UGI set forth in SEQ ID NO: 3873. In some embodiments, the UGI variant comprises a fragment of UGI such that the fragment is at least 70% identical, at least 80% identical, at least 90% identical, at least 95% identical, at least 96% identical, at least 97% identical, at least 98% identical, at least 99% identical, at least 99.5% identical, or at least 99.9% to the corresponding fragment of wild-type UGI or UGI set forth in SEQ ID NO: 3873. In some embodiments, UGI comprises the following amino acid sequence:

ウラシル-DNAグリコシラーゼインヒビター: Uracil-DNA glycosylase inhibitor:

>sp|P14739|UNGI_BPPB2
MTNLSDIIEKETGKQLVIQESILMLPEEVEEVIGNKPESDILVHTAYDESTDENVMLLTSDAPEYKPWALVIQDSNGENKIKML(配列番号3873)。
>sp|P14739|UNGI_BPPB2
MTNLSDIIEKETGKQLVIQESILMLPEEVEEVIGNKPESDILVHTAYDESTDENVMLLTSDAPEYKPWALVIQDSNGENKIKML (SEQ ID NO: 3873).

本明細書に記載のプライム編集因子は1つよりも多くのUGIドメインを含み得、これらは本明細書に記載の1つ以上のリンカーによって分離され得る。 The prime editing factors described herein can contain more than one UGI domain, which can be separated by one or more linkers described herein.

G.追加のPEエレメント
ある態様において、本明細書に記載のプライム編集因子は塩基修復の阻害剤を含み得る。用語「塩基修復の阻害剤」または「IBR」は、核酸修復酵素、例えば塩基除去修復酵素の活性を阻害することができるタンパク質を言う。いくつかの態様では、IBRはOGG塩基除去修復の阻害剤である。いくつかの態様では、IBRは塩基除去修復の阻害剤(「iBER」)である。塩基除去修復の例示の阻害剤は、APE1、Endo III、Endo IV、Endo V、Endo VIII、Fpg、hOGG1、hNEIL1、T7 EndoI、T4PDG、UDG、hSMUG1、およびhAAGの阻害剤を包含する。いくつかの態様では、IBRはEndo VまたはhAAGの阻害剤である。いくつかの態様では、IBRは、触媒的に不活性なグリコシラーゼまたは触媒的に不活性なジオキシゲナーゼ、またはオキシダーゼの低分子もしくはペプチド阻害剤、あるいはそれらのバリアントであり得るiBERである。いくつかの態様では、IBRは、TDG阻害剤、MBD4阻害剤、またはAlkBH酵素の阻害剤であり得るiBERである。いくつかの態様では、IBRは、触媒的に不活性なTDGまたは触媒的に不活性なMBD4を含むiBERである。例示の触媒的に不活性なTDGは配列番号3872(ヒトTDG)のN140A変異体である。
G. Additional PE elements
In certain embodiments, the prime editing factors described herein can include inhibitors of base repair. The term "inhibitor of base repair" or "IBR" refers to a protein that can inhibit the activity of a nucleic acid repair enzyme, such as a base excision repair enzyme. In some embodiments, the IBR is an inhibitor of OGG base excision repair. In some embodiments, the IBR is an inhibitor of base excision repair (“iBER”). Exemplary inhibitors of base excision repair include inhibitors of APE1, Endo III, Endo IV, Endo V, Endo VIII, Fpg, hOGG1, hNEIL1, T7 EndoI, T4PDG, UDG, hSMUG1, and hAAG. In some embodiments, the IBR is an inhibitor of Endo V or hAAG. In some embodiments, the IBR is an iBER that can be a small molecule or peptide inhibitor of a catalytically inactive glycosylase or a catalytically inactive dioxygenase, or an oxidase, or a variant thereof. In some embodiments, the IBR is an iBER that can be a TDG inhibitor, an MBD4 inhibitor, or an inhibitor of the AlkBH enzyme. In some embodiments, the IBR is an iBER that includes catalytically inactive TDG or catalytically inactive MBD4. An exemplary catalytically inactive TDG is the N140A variant of SEQ ID NO: 3872 (human TDG).

いくつかの例示のグリコシラーゼは下で提供される。これらのグリコシラーゼドメインのいずれかの触媒的に不活性化されたバリアントは、本開示で提供されるプライム編集因子のnapDNAbpまたはポリメラーゼドメインに融合され得るiBERである。 Some exemplary glycosylases are provided below. Catalytically inactivated variants of any of these glycosylase domains are iBERs that can be fused to the napDNAbp or polymerase domains of the prime editing factors provided in this disclosure.

OGG(ヒト) OGG (human)

MPARALLPRRMGHRTLASTPALWASIPCPRSELRLDLVLPSGQSFRWREQSPAHWSGVLADQVWTLTQTEEQLHCTVYRGDKSQASRPTPDELEAVRKYFQLDVTLAQLYHHWGSVDSHFQEVAQKFQGVRLLRQDPIECLFSFICSSNNNIARITGMVERLCQAFGPRLIQLDDVTYHGFPSLQALAGPEVEAHLRKLGLGYRARYVSASARAILEEQGGLAWLQQLRESSYEEAHKALCILPGVGTKVADCICLMALDKPQAVPVDVHMWHIAQRDYSWHPTTSQAKGPSPQTNKELGNFFRSLWGPYAGWAQAVLFSADLRQSRHAQEPPAKRRKGSKGPEG(配列番号3937) MPARALLPRRMGHRTLASTPALWASIPCPRSELRLDLVLPSGQSFRWREQSPAHWSGVLADQVWTLTQTEEQLHCTVYRGDKSQASRPTPDELEAVRKYFQLDVTLAQLYHHWGSVDSHFQEVAQKFQGVRLLRQDPIECLFSFICSSNNNIARITGMVERLCQAFGPRLIQLDDVTYHGFPSLQALAGPEVEAHLRKLGLGYRARYVSASARAILEEQGG LAWLQQLRESSYEEAHKALCILPGVGTKVADCICLMALDKPQAVPVDVHMWHIAQRDYSWHPTTSQAKGPSPQTNKELGNFFRSLWGPYAGWAQAVLFSADLRQSRHAQEPPAKRRKGSKGPEG (SEQ ID NO: 3937 )

MPG(ヒト) MPG (human)

MVTPALQMKKPKQFCRRMGQKKQRPARAGQPHSSSDAAQAPAEQPHSSSDAAQAPCPRERCLGPPTTPGPYRSIYFSSPKGHLTRLGLEFFDQPAVPLARAFLGQVLVRRLPNGTELRGRIVETEAYLGPEDEAAHSRGGRQTPRNRGMFMKPGTLYVYIIYGMYFCMNISSQGDGACVLLRALEPLEGLETMRQLRSTLRKGTASRVLKDRELCSGPSKLCQALAINKSFDQRDLAQDEAVWLERGPLEPSEPAVVAAARVGVGHAGEWARKPLRFYVRGSPWVSVVDRVAEQDTQA(配列番号3938) MVTPALQMKKPKQFCRRMGQKKQRPARAGQPHSSSDAAQAPAEQPHSSSDAAQAPCPRERCLGPPTPGPYRSIYFSSPKGHLTRLGLEFFDQPAVPLARAFLGQVLVRRLPNGTELRGRIVETEAYLGPEDEAAHSRGGRQTPRNRGMFMKPGTLYVYIIYGMYFCMNISSQGDGACVLLRALEPLEGLETMRQLRSTLRKGTASRVLKDRELCSGPSKLCQALAIN KSFDQRDLAQDEAVWLERGPLEPSEPAVVAAARVGVGHAGEWARKPLRFYVRGSPWVSVVDRVAEQDTQA (SEQ ID NO: 3938 )

MBD4(ヒト) MBD4(human)

MGTTGLESLSLGDRGAAPTVTSSERLVPDPPNDLRKEDVAMELERVGEDEEQMMIKRSSECNPLLQEPIASAQFGATAGTECRKSVPCGWERVVKQRLFGKTAGRFDVYFISPQGLKFRSKSSLANYLHKNGETSLKPEDFDFTVLSKRGIKSRYKDCSMAALTSHLQNQSNNSNWNLRTRSKCKKDVFMPPSSSSELQESRGLSNFTSTHLLLKEDEGVDDVNFRKVRKPKGKVTILKGIPIKKTKKGCRKSCSGFVQSDSKRESVCNKADAESEPVAQKSQLDRTVCISDAGACGETLSVTSEENSLVKKKERSLSSGSNFCSEQKTSGIINKFCSAKDSEHNEKYEDTFLESEEIGTKVEVVERKEHLHTDILKRGSEMDNNCSPTRKDFTGEKIFQEDTIPRTQIERRKTSLYFSSKYNKEALSPPRRKAFKKWTPPRSPFNLVQETLFHDPWKLLIATIFLNRTSGKMAIPVLWKFLEKYPSAEVARTADWRDVSELLKPLGLYDLRAKTIVKFSDEYLTKQWKYPIELHGIGKYGNDSYRIFCVNEWKQVHPEDHKLNKYHDWLWENHEKLSLS(配列番号3871) MGTTGLESLSLGDRGAAPTVTSSERLVPDPPNDLRKEDVAMELERVGEDEEQMMIKRSSECNPLLQEPIASAQFGATAGTECRKSVPCGWERVVKQRLFGKTAGRFDVYFISPQGLKFRSKSSLANYLHKNGETSLKPEDFDFTVLSKRGIKSRYKDCSMAALTSHLQNQSNNSNWNLRTRSKCKKDVFMPPSSSSELQESRGLSNFTSTHLLLKEDEGVDDVN FRKVRKPKGKVTILKGIPIKKTKKGCRKSCSGFVQSDSKRESVCNKADAESEPVAQKSQLDRTVCISDAGACGETLSVTSEENSLVKKKERSLSSGSNFCSEQKTSGIINKFCSAKDSEHNEKYEDTFLESEEIGTKVEVVERKEHLHTDILKRGSEMDNNCSPTRKDFTGEKIFQEDTIPRTQIERRKTSLYFSSKYNKEALSPPRRKAFKWTPPRSPFNLVQKKWTPPRSPFNLVQ ETLFHDPWKLLIATIFLNRTSGKMAIPVLWKFLEKYPSAEVARTADWRDVSELLKPLGLYDLRAKTIVKFSDEYLTKQWKYPIELHGIGKYGNDSYRIFCVNEWKQVHPEDHKLNKYHDWLWENHEKLSLS (SEQ ID NO: 3871)

TDG(ヒト) TDG (human)

MEAENAGSYSLQQAQAFYTFPFQQLMAEAPNMAVVNEQQMPEEVPAPAPAQEPVQEAPKGRKRKPRTTEPKQPVEPKKPVESKKSGKSAKSKEKQEKITDTFKVKRKVDRFNGVSEAELLTKTLPDILTFNLDIVIIGINPGLMAAYKGHHYPGPGNHFWKCLFMSGLSEVQLNHMDDHTLPGKYGIGFTNMVERTTPGSKDLSSKEFREGGRILVQKLQKYQPRIAVFNGKCIYEIFSKEVFGVKVKNLEFGLQPHKIPDTETLCYVMPSSSARCAQFPRAQDKVHYYIKLKDLRDQLKGIERNMDVQEVQYTFDLQLAQEDAKKMAVKEEKYDPGYEAAYGGAYGENPCSSEPCGFSSNGLIESVELRGESAFSGIPNGQWMTQSFTDQIPSFSNHCGTQEQEEESHA(配列番号3872) MEAENAGSYSLQQAQAFYTFPFQQLMAEAPNMAVVNEQQMPEEVPAPAPAQEPVQEAPKGRKRKPRTTEPKQPVEPKKPVESKKSGKSAKSKEFREGGRI LVQKLQKYQPRIAVFNGKCIYEIFSKEVFGVKVKNLEFGLQPHKIPDTETLCYVMPSSSARCAQFPRAQDKVHYYIKLKDLRDQLKGIERNMDVQEVQYTFDLQLAQEDAKKMAVKEEKYDPGYEAAYGGAYGENPCSSEPCGFSSNGLIESVELRGESAFSGIPNGQWMTQSFTDQIPSFSNHCGTQEQEEESHA (Sequence number 3872 )

いくつかの態様では、本明細書に記載の融合タンパク質は1つ以上の異種タンパク質ドメインを含み得る(例えば、プライム編集因子構成要素に加えて、約または約1、2、3、4、5、6、7、8、9、10以上のまたはそれよりも多くのドメイン)。融合タンパク質は、いずれかの追加のタンパク質配列と、任意にいずれかの2つのドメイン間のリンカー配列とを含み得る。存在し得る他の例示の特色は、局在配列、例えば細胞質局在配列、搬出配列、例えば核搬出配列、または他の局在配列、および融合タンパク質の可溶化、精製、または検出に有用である配列タグである。 In some embodiments, the fusion proteins described herein can include one or more heterologous protein domains (e.g., in addition to the prime editor component, about or about 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 or more domains). The fusion protein may include any additional protein sequences and optionally a linker sequence between any two domains. Other exemplary features that may be present include localization sequences, such as cytoplasmic localization sequences, export sequences, such as nuclear export sequences, or other localization sequences useful for solubilizing, purifying, or detecting fusion proteins. It is an array tag.

プライム編集因子またはその構成要素(例えば、napDNAbpドメイン、ポリメラーゼドメイン、またはNLSドメイン)を融合するために用いられ得るタンパク質ドメインの例は、限定なしに、エピトープタグ、およびレポーター遺伝子配列を包含する。エピトープタグの限定しない例はヒスチジン(His)タグ、V5タグ、FLAGタグ、インフルエンザヘマグルチニン(HA)タグ、Mycタグ、VSV-Gタグ、およびチオレドキシン(Trx)タグを包含する。レポーター遺伝子の例は、グルタチオン-5-トランスフェラーゼ(GST)、西洋ワサビペルオキシダーゼ(HRP)、クロラムフェニコールアセチルトランスフェラーゼ(CAT)、ベータガラクトシダーゼ、ベータグルクロニダーゼ、ルシフェラーゼ、緑色蛍光タンパク質(GFP)、HcRed、DsRed、シアン蛍光タンパク質(CFP)、黄色蛍光タンパク質(YFP)、および青色蛍光タンパク質(BFP)を包含する自家蛍光タンパク質を包含するが、これらに限定されない。プライム編集因子は、DNA分子に結合または他の細胞分子に結合するタンパク質またはタンパク質のフラグメントをコードする遺伝子配列に融合され得、マルトース結合タンパク質(MBP)、Sタグ、Lex A DNA結合ドメイン(DBD)融合体、GAL4 DNA結合ドメイン融合体、および単純ヘルペスウイルス(HSV)BP16タンパク質融合体を包含するがこれらに限定されない。プライム編集因子の一部を形成し得る追加のドメインは2011年3月11日公開のUS特許公開No.2011/0059502に記載され、その全体が参照によって本願に組み込まれる。 Examples of protein domains that can be used to fuse prime editing factors or components thereof (eg, napDNAbp domains, polymerase domains, or NLS domains) include, without limitation, epitope tags, and reporter gene sequences. Non-limiting examples of epitope tags include histidine (His) tag, V5 tag, FLAG tag, influenza hemagglutinin (HA) tag, Myc tag, VSV-G tag, and thioredoxin (Trx) tag. Examples of reporter genes are glutathione-5-transferase (GST), horseradish peroxidase (HRP), chloramphenicol acetyltransferase (CAT), beta-galactosidase, beta-glucuronidase, luciferase, green fluorescent protein (GFP), HcRed, DsRed , autofluorescent proteins including, but not limited to, cyan fluorescent protein (CFP), yellow fluorescent protein (YFP), and blue fluorescent protein (BFP). Prime editing factors can be fused to genetic sequences encoding proteins or fragments of proteins that bind to DNA molecules or bind to other cellular molecules, such as maltose binding protein (MBP), S-tag, Lex A DNA-binding domain (DBD). fusions, GAL4 DNA binding domain fusions, and herpes simplex virus (HSV) BP16 protein fusions. Additional domains that may form part of the prime editing factor are described in US Patent Publication No. 2011/0059502, published March 11, 2011, which is incorporated herein by reference in its entirety.

本開示のある側面では、グルタチオン-5-トランスフェラーゼ(GST)、西洋ワサビペルオキシダーゼ(HRP)、クロラムフェニコールアセチルトランスフェラーゼ(CAT)ベータガラクトシダーゼ、ベータグルクロニダーゼ、ルシフェラーゼ、緑色蛍光タンパク質(GFP)、HcRed、DsRed、シアン蛍光タンパク質(CFP)、黄色蛍光タンパク質(YFP)、および青色蛍光タンパク質(BFP)を包含する自家蛍光タンパク質を包含するがこれらに限定されないレポーター遺伝子が、遺伝子産物の発現の変改または改変を測定するためのマーカーとしての用をなす遺伝子産物をコードするように、細胞に導入され得る。本開示のある態様において、遺伝子産物はルシフェラーゼである。本開示のさらなる態様では、遺伝子産物の発現は減少させられる。 In certain aspects of the disclosure, reporter genes, including but not limited to glutathione-5-transferase (GST), horseradish peroxidase (HRP), chloramphenicol acetyltransferase (CAT), beta-galactosidase, beta-glucuronidase, luciferase, autofluorescent proteins, including green fluorescent protein (GFP), HcRed, DsRed, cyan fluorescent protein (CFP), yellow fluorescent protein (YFP), and blue fluorescent protein (BFP), can be introduced into cells to encode a gene product that serves as a marker for measuring alteration or modification of expression of the gene product. In certain embodiments of the disclosure, the gene product is luciferase. In further embodiments of the disclosure, expression of the gene product is decreased.

本願において提供される好適なタンパク質タグは、ビオチンカルボキシラーゼキャリアタンパク質(BCCP)タグ、mycタグ、カルモジュリンタグ、FLAGタグ、ヘマグルチニン(HA)タグ、ヒスチジンタグまたはHisタグともまた言われるポリヒスチジンタグ、マルトース結合タンパク質(MBP)タグ、nusタグ、グルタチオン-S-トランスフェラーゼ(GST)タグ、緑色蛍光タンパク質(GFP)タグ、チオレドキシンタグ、Sタグ、Softag(例えば、Softag 1、Softag 3)、strepタグ、ビオチンリガーゼタグ、FlAsHタグ、V5タグ、およびSBPタグを包含するが、これらに限定されない。追加の好適な配列は当業者には明らかであろう。いくつかの態様では、融合タンパク質は1つ以上のHisタグを含む。 Suitable protein tags provided herein include biotin carboxylase carrier protein (BCCP) tag, myc tag, calmodulin tag, FLAG tag, hemagglutinin (HA) tag, polyhistidine tag, also referred to as histidine tag or His tag, maltose binding protein (MBP) tag, nus tag, glutathione-S-transferase (GST) tag, green fluorescent protein (GFP) tag, thioredoxin tag, S tag, Softag (e.g. Softag 1, Softag 3), strep tag, biotin ligase tag , FlAsH tag, V5 tag, and SBP tag. Additional suitable sequences will be apparent to those skilled in the art. In some embodiments, the fusion protein includes one or more His tags.

本開示のいくつかの態様では、PEシステムの発現される構成要素の滞留時間、量、および/または活性を調整することによって、プライム編集システムの活性は時間的に制御され得る。例えば、本明細書に記載のPEは、PEの細胞内半減期を改変することができるタンパク質ドメインと融合され得る。2つ以上のベクターが関わるある種の態様(例えば、本明細書に記載の構成要素が2つ以上の別個のベクター上にコードされるベクターシステム)では、PEシステムの活性は、ベクターが送達されるタイミングをコントロールすることによって時間的に制御され得る。例えば、いくつかの態様では、鋳型をコードするベクターに先行して、ヌクレアーゼシステムをコードするベクターがPEを送達し得る。他の態様において、PEシステムをコードするベクターに先行して、PEgRNAをコードするベクターはガイドを送達し得る。いくつかの態様では、PEシステムおよびPEgRNAをコードするベクターが同時に送達される。ある態様において、同時に送達されるベクターは、例えばPE、PEgRNA、および/または第2の鎖ガイドRNA構成要素を時間的に送達する。さらなる態様では、ベクター上のコード配列から転写されるRNA(例えば、例えばヌクレアーゼ転写物)は、さらに、RNAの細胞内半減期を改変および/または翻訳コントロールを調節することができる少なくとも1つのエレメントを含み得る。いくつかの態様では、RNAの半減期は増大させられ得る。いくつかの態様では、RNAの半減期は減少させられ得る。いくつかの態様では、エレメントはRNAの安定性を増大させることができ得る。いくつかの態様では、エレメントはRNAの安定性を減少させることができ得る。いくつかの態様では、エレメントはRNAの3'UTR内にあり得る。いくつかの態様では、エレメントはポリアデニル化シグナル(PA)を包含し得る。いくつかの態様では、エレメントは、キャップ、例えば上流のmRNAまたはPEgRNA端を包含し得る。いくつかの態様では、RNAはPAを含まずにあり得、その結果、それは転写後に細胞内でより迅速な分解を受ける。いくつかの態様では、エレメントは少なくとも1つのAUリッチエレメント(ARE)を包含し得る。組織型、細胞型、タイミング、細胞局在、および環境に依存的である様式で、AREはARE結合タンパク質(ARE-BP)によって結合され得る。いくつかの態様では、不安定化エレメントがRNA崩壊を促進、RNA安定性に影響、または翻訳を活性化し得る。いくつかの態様では、AREは長さが50から150ヌクレオチドを含み得る。いくつかの態様では、AREは少なくとも1コピーの配列AUUUAを含み得る。いくつかの態様では、少なくとも1つのAREがRNAの3'UTRに追加され得る。いくつかの態様では、エレメントはウッドチャック肝炎ウイルス(WHP)であり得る。 In some embodiments of the present disclosure, the activity of the prime editing system can be temporally controlled by adjusting the residence time, amount, and/or activity of the expressed components of the PE system. For example, the PE described herein can be fused to a protein domain that can alter the intracellular half-life of PE. In certain embodiments involving two or more vectors (e.g., vector systems in which components described herein are encoded on two or more separate vectors), the activity of the PE system depends on whether the vector is delivered or not. can be temporally controlled by controlling the timing of For example, in some embodiments, a vector encoding a nuclease system can deliver PE prior to a vector encoding a template. In other embodiments, a vector encoding PEgRNA can deliver a guide prior to a vector encoding a PE system. In some embodiments, the PE system and the vector encoding PEgRNA are delivered simultaneously. In certain embodiments, co-delivered vectors temporally deliver, eg, PE, PEgRNA, and/or second strand guide RNA components. In a further embodiment, the RNA transcribed from the coding sequence on the vector (e.g., a nuclease transcript) further comprises at least one element capable of altering the intracellular half-life of the RNA and/or modulating translational control. may be included. In some embodiments, the half-life of RNA can be increased. In some embodiments, the half-life of RNA can be decreased. In some embodiments, the element may be capable of increasing RNA stability. In some embodiments, the element may be capable of decreasing RNA stability. In some embodiments, the element can be within the 3'UTR of the RNA. In some embodiments, the element may include a polyadenylation signal (PA). In some embodiments, the element may include a cap, eg, an upstream mRNA or PEgRNA end. In some embodiments, the RNA can be free of PA, so that it undergoes more rapid degradation within the cell after transcription. In some embodiments, the element can include at least one AU-rich element (ARE). AREs can be bound by ARE-binding proteins (ARE-BPs) in a manner that is tissue type, cell type, timing, cellular localization, and environment dependent. In some embodiments, the destabilizing element may promote RNA decay, affect RNA stability, or activate translation. In some embodiments, the ARE can include 50 to 150 nucleotides in length. In some embodiments, the ARE can include at least one copy of the sequence AUUUA. In some embodiments, at least one ARE can be added to the 3'UTR of the RNA. In some embodiments, the element can be woodchuck hepatitis virus (WHP).

転写物からの発現を増強するための三次構造を生出する転写後制御エレメント(WPRE)。さらなる態様では、エレメントは、転写物からの発現を増強することができる改変および/または短縮されたWPRE配列であり、例えばZufferey et al., J Virol, 73(4): 2886-92(1999)およびFlajolet et al., J Virol, 72(7): 6175-80(1998)に記載されているとおりである。いくつかの態様では、WPREまたは等価物はRNAの3'UTRに追加され得る。いくつかの態様では、エレメントは、高速でまたは低速で崩壊する転写物どちらかに濃縮された他のRNA配列モチーフから選択され得る。 Post-transcriptional regulatory elements (WPREs) that generate tertiary structure to enhance expression from transcripts. In a further embodiment, the element is a modified and/or truncated WPRE sequence capable of enhancing expression from the transcript, e.g. Zufferey et al., J Virol, 73(4): 2886-92 (1999) and Flajolet et al., J Virol, 72(7): 6175-80 (1998). In some embodiments, the WPRE or equivalent may be added to the 3'UTR of the RNA. In some embodiments, elements may be selected from other RNA sequence motifs enriched in either fast or slow decaying transcripts.

いくつかの態様では、PEまたはPEgRNAをコードするベクターは、PEシステムによるベクター上に存在する標的配列の切断によって自己破壊され得る。切断はベクターからのPEまたはPEgRNAの連続した転写を防止し得る。転写は直線化されたベクター上において何らかの時間量に渡って生起し得るが、細胞内分解を受ける発現された転写物またはタンパク質は、コードするベクターの発現からの連続した供給なしには、オフターゲット効果を生ずるためのより少ない時間を有するであろう。 In some embodiments, vectors encoding PE or PEgRNA can be self-destructed by cleavage of target sequences present on the vector by the PE system. Cleavage may prevent continued transcription of PE or PEgRNA from the vector. Although transcription can occur for any amount of time on a linearized vector, the expressed transcript or protein that undergoes intracellular degradation will be off-target without continuous supply from the expression of the encoding vector. It will have less time to take effect.

[6]PEgRNA
本明細書に記載のプライム編集システムはいずれかの好適なPEgRNAの使用を企図する。本発明者は、所望のヌクレオチド変化をコードする逆転写(RT)鋳型配列を含む特殊に構成されたガイドRNAの使用によって、プライム標的にプライムされた逆転写(TPRT)の機序が、精密かつ汎用的なCRISPR/Casに基づくゲノム編集を行うことに活用または適合され得るということを発見した。RT鋳型配列は標準のまたは従来のガイドRNA分子の伸長として提供され得るので、本願はこの特殊に構成されたガイドRNAを「伸長されたガイドRNA」または「PEgRNA」と言う。本願は伸長されたガイドRNAについていずれかの好適な構成または配置を企図する。
[6] PEgRNA
The prime editing system described herein contemplates the use of any suitable PEgRNA. By the use of specially constructed guide RNAs containing reverse transcription (RT) template sequences encoding the desired nucleotide changes, the inventors have demonstrated that the mechanism of target-primed reverse transcription (TPRT) can be precisely and We have discovered that it can be utilized or adapted to perform general-purpose CRISPR/Cas-based genome editing. Since the RT template sequence can be provided as an extension of a standard or conventional guide RNA molecule, this application refers to this specially constructed guide RNA as "extended guide RNA" or "PEgRNA." This application contemplates any suitable configuration or arrangement for the elongated guide RNA.

PEgRNAアーキテクチャ
図3Aは、本明細書に開示のプライム編集因子系に使用可能な伸長されたガイドRNAの一態様を示すが、既存のガイドRNA(緑色部分)は、~20ntプロトスペーサー配列とgRNAコア領域とを包含し、napDNAbpとともに結合する。この態様において、ガイドRNAは、5'末にて伸長されたRNAセグメント、すなわち、5'伸長を包含する。この態様において、5'伸長は、逆転写鋳型配列、逆転写プライマー結合部位、および任意の5~20ヌクレオチドリンカー配列を包含する。図1A~1Bに示されるとおり、RTプライマー結合部位の、ニックの後に形成される遊離3'末とのハイブリッドは、Rループの非標的鎖に形成され、これによって5'-3'方向におけるDNA重合のために逆転写酵素がプライムされる。
PEgRNA architecture Figure 3A shows one embodiment of an elongated guide RNA that can be used in the prime editor system disclosed herein, but the existing guide RNA (green area) has a ~20nt protospacer sequence and a gRNA core. region and binds with napDNAbp. In this embodiment, the guide RNA includes an extended RNA segment at the 5' end, ie, a 5' extension. In this embodiment, the 5' extension includes a reverse transcription template sequence, a reverse transcription primer binding site, and an optional 5-20 nucleotide linker sequence. As shown in Figures 1A-1B, a hybrid of the RT primer binding site with the free 3' end formed after nicking is formed on the non-target strand of the R-loop, thereby allowing DNA in the 5'-3' direction. Reverse transcriptase is primed for polymerization.

図3Bは、本明細書に開示のプライム編集系に使用可能な伸長されたガイドRNAの別の態様を示すが、既存のガイドRNA(緑色部分)は、~20ntプロトスペーサー配列とgRNAコアとを包含し、napDNAbpとともに結合する。この態様において、ガイドRNAは、3'末にて伸長されたRNAセグメント、すなわち、3'伸長を包含する。この態様において、3'伸長は、逆転写鋳型配列および逆転写プライマー結合部位を包含する。図1C~1Dに示されるとおり、RTプライマー結合部位の、ニックの後に形成される遊離3'末とのハイブリッドは、Rループの非標的鎖に形成され、これによって5'-3'方向におけるDNA重合のために逆転写酵素がプライムされる。 Figure 3B shows another embodiment of an extended guide RNA that can be used in the prime editing system disclosed herein, where the existing guide RNA (in green) includes a ∼20 nt protospacer sequence and a gRNA core, which binds together with the napDNAbp. In this embodiment, the guide RNA includes an extended RNA segment at the 3' end, i.e., a 3' extension. In this embodiment, the 3' extension includes a reverse transcription template sequence and a reverse transcription primer binding site. As shown in Figures 1C-1D, the hybrid of the RT primer binding site with the free 3' end formed after the nick is formed on the non-target strand of the R-loop, thereby priming the reverse transcriptase for DNA polymerization in the 5'-3' direction.

図3Cは、本明細書に開示のプライム編集系に使用可能な、伸長されたガイドRNAの別の態様を示すが、既存のガイドRNA(緑色部分)は、~20ntプロトスペーサー配列とgRNAコアとを包含し、napDNAbpとともに結合する。この態様において、ガイドRNAは、gRNAコア内の分子間のある位置にて伸長されたRNAセグメント、すなわち、分子内伸長を包含する。この態様において、分子内伸長は、逆転写鋳型配列および逆転写プライマー結合部位を包含する。RTプライマー結合部位はニックの後に形成される遊離3'末とハイブリダイズし、Rループの非標的鎖に形成され、これによって5'-3'方向におけるDNA重合のために逆転写酵素がプライムされる。 Figure 3C shows another embodiment of an extended guide RNA that can be used in the prime editing system disclosed herein, where the existing guide RNA (in green) includes a ∼20 nt protospacer sequence and a gRNA core, which binds together with the napDNAbp. In this embodiment, the guide RNA includes an extended RNA segment at an intermolecular position within the gRNA core, i.e., an intramolecular extension. In this embodiment, the intramolecular extension includes a reverse transcription template sequence and a reverse transcription primer binding site. The RT primer binding site hybridizes to the free 3' end formed after the nick and is formed on the non-target strand of the R-loop, thereby priming the reverse transcriptase for DNA polymerization in the 5'-3' direction.

一態様において、分子内RNA伸長の位置は、ガイドRNAのプロトスペーサー配列中にはない。別の態様において、分子内RNA伸長の位置は、gRNAコア中にある。また別の態様において、分子内RNA伸長の位置は、プロトスペーサー配列内を除きガイドRNA分子内のどこにでも、またはプロトスペーサー配列を妨害しない位置にある。 In one embodiment, the position of intramolecular RNA extension is not in the protospacer sequence of the guide RNA. In another embodiment, the location of intramolecular RNA extension is in the gRNA core. In yet another embodiment, the location of intramolecular RNA extension is anywhere within the guide RNA molecule except within the protospacer sequence or at a position that does not interfere with the protospacer sequence.

一態様において、分子内RNA伸長は、プロトスペーサー配列の3'末から下流に挿入される。別の態様において、分子内RNA伸長は、プロトスペーサー配列の3'末の、少なくとも1ヌクレオチド、少なくとも2ヌクレオチド、少なくとも3ヌクレオチド、少なくとも4ヌクレオチド、少なくとも5ヌクレオチド、少なくとも6ヌクレオチド、少なくとも7ヌクレオチド、少なくとも8ヌクレオチド、少なくとも9ヌクレオチド、少なくとも10ヌクレオチド、少なくとも11ヌクレオチド、少なくとも12ヌクレオチド、少なくとも13ヌクレオチド、少なくとも14ヌクレオチド、少なくとも15ヌクレオチド、少なくとも16ヌクレオチド、少なくとも17ヌクレオチド、少なくとも18ヌクレオチド、少なくとも19ヌクレオチド、少なくとも20ヌクレオチド、少なくとも21ヌクレオチド、少なくとも22ヌクレオチド、少なくとも23ヌクレオチド、少なくとも24ヌクレオチド、少なくとも25ヌクレオチド下流に挿入される。 In one embodiment, an intramolecular RNA extension is inserted downstream from the 3' end of the protospacer sequence. In another embodiment, the intramolecular RNA extension comprises at least 1 nucleotide, at least 2 nucleotides, at least 3 nucleotides, at least 4 nucleotides, at least 5 nucleotides, at least 6 nucleotides, at least 7 nucleotides, at least 8 nucleotides at the 3' end of the protospacer sequence. nucleotides, at least 9 nucleotides, at least 10 nucleotides, at least 11 nucleotides, at least 12 nucleotides, at least 13 nucleotides, at least 14 nucleotides, at least 15 nucleotides, at least 16 nucleotides, at least 17 nucleotides, at least 18 nucleotides, at least 19 nucleotides, at least 20 nucleotides, At least 21 nucleotides, at least 22 nucleotides, at least 23 nucleotides, at least 24 nucleotides, at least 25 nucleotides downstream.

他の態様において、分子内RNA伸長はgRNA中へ挿入され、これは、tracrRNAに対応するかまたはtracrRNAを含むガイドRNAの部分を指し、これはCas9タンパク質またはその等価物(すなわち、異なるnapDNAbp)に結合するかおよび/またはこれと相互作用する。好ましくは、分子内RNA伸長の挿入は、tracrRNA部分とnapDNAbpとの相互作用を妨害しないか、または妨害しても最小限である。 In other embodiments, the intramolecular RNA extension is inserted into gRNA, which refers to a portion of the guide RNA that corresponds to or includes tracrRNA, which is linked to the Cas9 protein or its equivalent (i.e., a different napDNAbp). bind to and/or interact with. Preferably, the insertion of an intramolecular RNA extension does not or only minimally interferes with the interaction of the tracrRNA portion with napDNAbp.

RNA伸長の長さは、いずれの有用な長さでもあり得る。様々な態様において、RNA伸長は、長さが少なくとも5ヌクレオチド、少なくとも6ヌクレオチド、少なくとも7ヌクレオチド、少なくとも8ヌクレオチド、少なくとも9ヌクレオチド、少なくとも10ヌクレオチド、少なくとも11ヌクレオチド、少なくとも12ヌクレオチド、少なくとも13ヌクレオチド、少なくとも14ヌクレオチド、少なくとも15ヌクレオチド、少なくとも16ヌクレオチド、少なくとも17ヌクレオチド、少なくとも18ヌクレオチド、少なくとも19ヌクレオチド、少なくとも20ヌクレオチド、少なくとも21ヌクレオチド、少なくとも22ヌクレオチド、少なくとも23ヌクレオチド、少なくとも24ヌクレオチド、少なくとも25ヌクレオチド、少なくとも30ヌクレオチド、少なくとも40ヌクレオチド、少なくとも50ヌクレオチド、少なくとも60ヌクレオチド、少なくとも70ヌクレオチド、少なくとも80ヌクレオチド、少なくとも90ヌクレオチド、少なくとも100ヌクレオチド、少なくとも200ヌクレオチド、少なくとも300ヌクレオチド、少なくとも400ヌクレオチド、または少なくとも500ヌクレオチドである。 The length of RNA extension can be any useful length. In various embodiments, the RNA elongation is at least 5 nucleotides, at least 6 nucleotides, at least 7 nucleotides, at least 8 nucleotides, at least 9 nucleotides, at least 10 nucleotides, at least 11 nucleotides, at least 12 nucleotides, at least 13 nucleotides, at least 14 nucleotides in length. nucleotides, at least 15 nucleotides, at least 16 nucleotides, at least 17 nucleotides, at least 18 nucleotides, at least 19 nucleotides, at least 20 nucleotides, at least 21 nucleotides, at least 22 nucleotides, at least 23 nucleotides, at least 24 nucleotides, at least 25 nucleotides, at least 30 nucleotides, At least 40 nucleotides, at least 50 nucleotides, at least 60 nucleotides, at least 70 nucleotides, at least 80 nucleotides, at least 90 nucleotides, at least 100 nucleotides, at least 200 nucleotides, at least 300 nucleotides, at least 400 nucleotides, or at least 500 nucleotides.

RT鋳型配列はまた、いずれの好適な長さでもあり得る。例えば、RT鋳型配列は、長さが少なくとも3ヌクレオチド、少なくとも4ヌクレオチド、少なくとも5ヌクレオチド、少なくとも6ヌクレオチド、少なくとも7ヌクレオチド、少なくとも8ヌクレオチド、少なくとも9ヌクレオチド、少なくとも10ヌクレオチド、少なくとも11ヌクレオチド、少なくとも12ヌクレオチド、少なくとも13ヌクレオチド、少なくとも14ヌクレオチド、少なくとも15ヌクレオチド、少なくとも16ヌクレオチド、少なくとも17ヌクレオチド、少なくとも18ヌクレオチド、少なくとも19ヌクレオチド、少なくとも20ヌクレオチド、少なくとも30ヌクレオチド、少なくとも40ヌクレオチド、少なくとも50ヌクレオチド、少なくとも60ヌクレオチド、少なくとも70ヌクレオチド、少なくとも80ヌクレオチド、少なくとも90ヌクレオチド、少なくとも100ヌクレオチド、少なくとも200ヌクレオチド、少なくとも300ヌクレオチド、少なくとも400ヌクレオチド、または少なくとも500ヌクレオチドであり得る。 The RT template sequence can also be of any suitable length. For example, the RT template sequence has a length of at least 3 nucleotides, at least 4 nucleotides, at least 5 nucleotides, at least 6 nucleotides, at least 7 nucleotides, at least 8 nucleotides, at least 9 nucleotides, at least 10 nucleotides, at least 11 nucleotides, at least 12 nucleotides, At least 13 nucleotides, at least 14 nucleotides, at least 15 nucleotides, at least 16 nucleotides, at least 17 nucleotides, at least 18 nucleotides, at least 19 nucleotides, at least 20 nucleotides, at least 30 nucleotides, at least 40 nucleotides, at least 50 nucleotides, at least 60 nucleotides, at least 70 The nucleotides can be at least 80 nucleotides, at least 90 nucleotides, at least 100 nucleotides, at least 200 nucleotides, at least 300 nucleotides, at least 400 nucleotides, or at least 500 nucleotides.

更なる他の態様において、逆転写プライマー結合部位配列は、長さが少なくとも3ヌクレオチド、少なくとも4ヌクレオチド、少なくとも5ヌクレオチド、少なくとも6ヌクレオチド、少なくとも7ヌクレオチド、少なくとも8ヌクレオチド、少なくとも9ヌクレオチド、少なくとも10ヌクレオチド、少なくとも11ヌクレオチド、少なくとも12ヌクレオチド、少なくとも13ヌクレオチド、少なくとも14ヌクレオチド、少なくとも15ヌクレオチド、少なくとも16ヌクレオチド、少なくとも17ヌクレオチド、少なくとも18ヌクレオチド、少なくとも19ヌクレオチド、少なくとも20ヌクレオチド、少なくとも30ヌクレオチド、少なくとも40ヌクレオチド、少なくとも50ヌクレオチド、少なくとも60ヌクレオチド、少なくとも70ヌクレオチド、少なくとも80ヌクレオチド、少なくとも90ヌクレオチド、少なくとも100ヌクレオチドヌクレオチド、少なくとも200ヌクレオチドヌクレオチド、少なくとも300ヌクレオチドヌクレオチド、少なくとも400ヌクレオチドヌクレオチド、または少なくとも500ヌクレオチドヌクレオチドである。 In still other embodiments, the reverse transcription primer binding site sequence is at least 3 nucleotides, at least 4 nucleotides, at least 5 nucleotides, at least 6 nucleotides, at least 7 nucleotides, at least 8 nucleotides, at least 9 nucleotides, at least 10 nucleotides in length, At least 11 nucleotides, at least 12 nucleotides, at least 13 nucleotides, at least 14 nucleotides, at least 15 nucleotides, at least 16 nucleotides, at least 17 nucleotides, at least 18 nucleotides, at least 19 nucleotides, at least 20 nucleotides, at least 30 nucleotides, at least 40 nucleotides, at least 50 nucleotides, at least 60 nucleotides, at least 70 nucleotides, at least 80 nucleotides, at least 90 nucleotides, at least 100 nucleotides, at least 200 nucleotides, at least 300 nucleotides, at least 400 nucleotides, or at least 500 nucleotides.

他の態様において、任意のリンカーまたはスペーサー配列は、長さが少なくとも3ヌクレオチド、少なくとも4ヌクレオチド、少なくとも5ヌクレオチド、少なくとも6ヌクレオチド、少なくとも7ヌクレオチド、少なくとも8ヌクレオチド、少なくとも9ヌクレオチド、少なくとも10ヌクレオチド、少なくとも11ヌクレオチド、少なくとも12ヌクレオチド、少なくとも13ヌクレオチド、少なくとも14ヌクレオチド、少なくとも15ヌクレオチド、少なくとも16ヌクレオチド、少なくとも17ヌクレオチド、少なくとも18ヌクレオチド、少なくとも19ヌクレオチド、少なくとも20ヌクレオチド、少なくとも30ヌクレオチド、少なくとも40ヌクレオチド、少なくとも50ヌクレオチド、少なくとも60ヌクレオチド、少なくとも70ヌクレオチド、少なくとも80ヌクレオチド、少なくとも90ヌクレオチド、少なくとも100ヌクレオチド、少なくとも200ヌクレオチド、少なくとも300ヌクレオチド、少なくとも400ヌクレオチド、または少なくとも500ヌクレオチドである。 In other embodiments, any linker or spacer sequence is at least 3 nucleotides, at least 4 nucleotides, at least 5 nucleotides, at least 6 nucleotides, at least 7 nucleotides, at least 8 nucleotides, at least 9 nucleotides, at least 10 nucleotides, at least 11 nucleotides in length. nucleotides, at least 12 nucleotides, at least 13 nucleotides, at least 14 nucleotides, at least 15 nucleotides, at least 16 nucleotides, at least 17 nucleotides, at least 18 nucleotides, at least 19 nucleotides, at least 20 nucleotides, at least 30 nucleotides, at least 40 nucleotides, at least 50 nucleotides, At least 60 nucleotides, at least 70 nucleotides, at least 80 nucleotides, at least 90 nucleotides, at least 100 nucleotides, at least 200 nucleotides, at least 300 nucleotides, at least 400 nucleotides, or at least 500 nucleotides.

RT鋳型配列は、ある態様において、単鎖DNA分子をコードするが、これは、非標的鎖と相同である(よって、標的鎖の対応する部位に相補的である)が1以上のヌクレオチド変化を包含する。少なくとも1ヌクレオチド変化は、1以上の単一塩基ヌクレオチド変化、1以上の欠失、および1以上の挿入を包含していてもよい。 The RT template sequence, in some embodiments, encodes a single-stranded DNA molecule that is homologous to the non-target strand (and thus complementary to the corresponding site on the target strand) but has one or more nucleotide changes. include. The at least one nucleotide change may include one or more single base nucleotide changes, one or more deletions, and one or more insertions.

図1Gに描かれるとおり、RT鋳型配列の合成された単鎖DNA産物は、非標的鎖と相同であって、1以上のヌクレオチド変化を含有する。RT鋳型配列の単鎖DNA産物は、平衡状態で、相補的な標的鎖配列とハイブリダイズし、これによって相同の内生標的鎖配列に取って代わる。取って代わられた内生鎖は、いくつかの態様において、5'内生DNAフラップ種として言及されてもよい(例として、図1Eを参照)。この5'内生DNAフラップ種は、5'フラップエンドヌクレアーゼ(例として、FEN1)によって除去され得、単鎖DNA産物は、今や内生標的鎖とハイブリダイズされており、ライゲートされて内生配列と新しく合成された鎖との間にミスマッチが創出される。ミスマッチは、細胞固有のDNA修復および/または複製プロセスによって分解されてもよい。 As depicted in Figure 1G, the synthesized single-stranded DNA product of the RT template sequence is homologous to the non-target strand and contains one or more nucleotide changes. At equilibrium, the single-stranded DNA product of the RT template sequence hybridizes with the complementary target strand sequence, thereby displacing the homologous endogenous target strand sequence. The displaced endogenous strand may in some embodiments be referred to as a 5' endogenous DNA flap species (see, for example, FIG. 1E). This 5' endogenous DNA flap species can be removed by a 5' flap endonuclease (e.g., FEN1) and the single-stranded DNA product, now hybridized to the endogenous target strand, is ligated to A mismatch is created between the strand and the newly synthesized strand. Mismatches may be resolved by cell-intrinsic DNA repair and/or replication processes.

様々な態様において、RT鋳型配列のヌクレオチド配列は、5'フラップ種と取って代わられ、かつ編集されるべき部位と重複する、非標的鎖のヌクレオチド配列に対応する。 In various embodiments, the nucleotide sequence of the RT template sequence corresponds to the nucleotide sequence of the non-target strand that replaces the 5' flap species and overlaps the site to be edited.

伸長されたガイドRNAの様々な態様において、逆転写鋳型配列は、ニック部位に隣接する内生DNA配列に相補的な単鎖DNAフラップをコードしていてもよく、ここで単鎖DNAフラップは、所望のヌクレオチド変化を含む。単鎖DNAフラップは、ニック部位にて内生単鎖DNAに取って代わってもよい。ニック部位にて取って代わられた内生単鎖DNAは、5'末を有し、内生フラップを形成し得るが、これは細胞によって切除され得る。様々な態様において、5'末内生フラップを除去することが、単鎖3'DNAフラップの、対応する相補的なDNA鎖とのハイブリダイゼーション、および単鎖3'DNAフラップが持つ所望のヌクレオチド変化の標的DNA中への組み込みまたは同化を促すところ、5'末内生フラップの切除は、産物形成を推進するのに役立ち得る。 In various embodiments of the elongated guide RNA, the reverse transcription template sequence may encode a single-stranded DNA flap that is complementary to the endogenous DNA sequence adjacent to the nick site, where the single-stranded DNA flap is Contains desired nucleotide changes. A single-stranded DNA flap may replace endogenous single-stranded DNA at the nick site. The endogenous single-stranded DNA displaced at the nick site has a 5' end and can form an endogenous flap, which can be excised by the cell. In various embodiments, removing the 5' end endogenous flap reduces hybridization of the single stranded 3' DNA flap with the corresponding complementary DNA strand and the desired nucleotide changes that the single stranded 3' DNA flap has. Excision of the 5' endogenous flap may help drive product formation, where it promotes incorporation or assimilation into the target DNA.

伸長されたガイドRNAの様々な態様において、単鎖DNAフラップの細胞修復は、所望のヌクレオチド変化の組み入れをもたらし、これによって所望の産物が形成される。 In various embodiments of the elongated guide RNA, cellular repair of the single-stranded DNA flap results in the incorporation of the desired nucleotide changes, thereby forming the desired product.

なお他の態様において、所望のヌクレオチド変化は、ニック部位の約-5~+5の間、またはニック部位の約-10~+10の間、またはニック部位の約-20~+20の間、またはニック部位の約-30~+30の間、またはニック部位の約-40~+40の間、またはニック部位の約-50~+50の間、またはニック部位の約-60~+60の間、またはニック部位の約-70~+70の間、またはニック部位の約-80~+80の間、またはニック部位の約-90~+90の間、またはニック部位の約-100~+100の間、またはニック部位の約-200~+200の間である編集窓上に組み入れされる。
他の態様において、所望のヌクレオチド変化は、ニック部位から約+1から+2、またはニック部位から約+1~+3、+1~+4、+1~+5、+1~+6、+1~+7、+1~+8、+1~+9、+1~+10、+1~+11、+1~+12、+1~+13、+1~+14、+1~+15、+1~+16、+1~+17、+1~+18、+1~+19、+1~+20、+1~+21、+1~+22、+1~+23、+1~+24、+1~+25、+1~+26、+1~+27、+1~+28、+1~+29、+1~+30、+1~+31、+1~+32、+1~+33、+1~+34、+1~+35、+1~+36、+1~+37、+1~+38、+1~+39、+1~+40、+1~+41、+1~+42、+1~+43、+1~+44、+1~+45、+1~+46、+1~+47、+1~+48、+1~+49、+1~+50、+1~+51、+1~+52、+1~+53、+1~+54、+1~+55、+1~+56、+1~+57、+1~+58、+1~+59、+1~+60、+1~+61、+1~+62、+1~+63、+1~+64、+1~+65、+1~+66、+1~+67、+1~+68、+1~+69、+1~+70、+1~+71、+1~+72、+1~+73、+1~+74、+1~+75、+1~+76、+1~+77、+1~+78、+1~+79、+1~+80、+1~+81、+1~+82、+1~+83、+1~+84、+1~+85、+1~+86、+1~+87、+1~+88、+1~+89、+1~+90、+1~+90、+1~+91、+1~+92、+1~+93、+1~+94、+1~+95、+1~+96、+1~+97、+1~+98、+1~+99、+1~+100、+1~+101、+1~+102、+1~+103、+1~+104、+1~+105、+1~+106、+1~+107、+1~+108、+1~+109、+1~+110、+1~+111、+1~+112、+1~+113、+1~+114、+1~+115、+1~+116、+1~+117、+1~+118、+1~+119、+1~+120、+1~+121、+1~+122、+1~+123、+1~+124、もしくは+1~+125の間である編集窓上に組み入れされる。
In still other embodiments, the desired nucleotide changes are incorporated over an editing window that is between about -5 to +5 at the nick site, or between about -10 to +10 at the nick site, or between about -20 to +20 at the nick site, or between about -30 to +30 at the nick site, or between about -40 to +40 at the nick site, or between about -50 to +50 at the nick site, or between about -60 to +60 at the nick site, or between about -70 to +70 at the nick site, or between about -80 to +80 at the nick site, or between about -90 to +90 at the nick site, or between about -100 to +100 at the nick site, or between about -200 to +200 at the nick site.
In other embodiments, the desired nucleotide changes are from about +1 to +2 from the nick site, or from about +1 to +3, +1 to +4, +1 to +5, +1 to +6, +1 to +7, +1 to +8, +1 to +9, +1 to +10, +1 to +11, +1 to +12, +1 to +13, +1 to +14, +1 to +15, +1 to +16, +1 to +17, +1 to +18, +1 to +19, +1 to +20, +1 to +21, +1 to +22, +1 to +23, +1 to +24, +1 to +25, +1 to +26, +1 to +27, +1 to +28, +1 to +29, +1 to +30, +1 ~+31, +1~+32, +1~+33, +1~+34, +1~+35, +1~+36, +1~+37, +1~+38, +1~+39, +1~+40, +1~+41, +1~+42, +1~+43, +1~+44, +1~+45, +1~+46, +1~+47, +1~+48, +1~+49, +1~+50, +1~+51, +1~+52, +1~+53, +1~+54, +1~+55, +1~+56, +1~+57, +1~+58, +1~+59, +1~+60, +1~+61, +1~+62, +1~+63, +1~+64, +1~ +65, +1 to +66, +1 to +67, +1 to +68, +1 to +69, +1 to +70, +1 to +71, +1 to +72, +1 to +73, +1 to +74, +1 to +75, +1 to +76, +1 to +77, +1 to +78, +1 to +79, +1 to +80, +1 to +81, +1 to +82, +1 to +83, +1 to +84, +1 to +85, +1 to +86, +1 to +87, +1 to +88, +1 to +89, +1 to +90, +1 to +90, +1 to +91, +1 to +92, +1 to +93, +1 to +94, +1 to +95, +1 to +96, +1 to +97, +1 to + The edit window is placed between 98, +1 to +99, +1 to +100, +1 to +101, +1 to +102, +1 to +103, +1 to +104, +1 to +105, +1 to +106, +1 to +107, +1 to +108, +1 to +109, +1 to +110, +1 to +111, +1 to +112, +1 to +113, +1 to +114, +1 to +115, +1 to +116, +1 to +117, +1 to +118, +1 to +119, +1 to +120, +1 to +121, +1 to +122, +1 to +123, +1 to +124, or +1 to +125.

なお他の態様において、所望のヌクレオチド変化は、ニック部位から約+1から+2の間、またはニック部位から約+1~+5、+1~+10、+1~+15、+1~+20、+1~+25、+1~+30、+1~+35、+1~+40、+1~+45、+1~+50、+1~+55、+1~+100、+1~+105、+1~+110、+1~+115、+1~+120、+1~+125、+1~+130、+1~+135、+1~+140、+1~+145、+1~+150、+1~+155、+1~+160、+1~+165、+1~+170、+1~+175、+1~+180、+1~+185、+1~+190、+1~+195、もしくは+1~+200である編集窓上に組み入れされる。 In still other embodiments, the desired nucleotide change is between about +1 and +2 from the nick site, or about +1 to +5, +1 to +10, +1 to +15, +1 to +2 from the nick site. +20, +1~+25, +1~+30, +1~+35, +1~+40, +1~+45, +1~+50, +1~+55, +1~+100 , +1 to +105, +1 to +110, +1 to +115, +1 to +120, +1 to +125, +1 to +130, +1 to +135, +1 to +140, + 1~+145, +1~+150, +1~+155, +1~+160, +1~+165, +1~+170, +1~+175, +1~+180, +1~ It is incorporated on the editing window which is +185, +1 to +190, +1 to +195, or +1 to +200.

様々な側面において、伸長されたガイドRNAは、ガイドRNAの修飾バージョンである。ガイドRNAは、天然に存在するものであっても、コードする核酸から発現されても、または化学的に合成されてもよい。着目するゲノムの標的部位の標的鎖と相互作用してハイブリダイズするプロトスペーサー配列を包含する、ガイドRNAを入手またはそうでなければ合成するための方法、およびガイドRNAの適切な配列を決定するための方法は、当該技術分野において周知である。 In various aspects, the extended guide RNA is a modified version of a guide RNA. The guide RNA may be naturally occurring, expressed from an encoding nucleic acid, or chemically synthesized. Methods for obtaining or otherwise synthesizing a guide RNA that includes a protospacer sequence that interacts with and hybridizes to a target strand at a genomic target site of interest, and for determining the appropriate sequence of the guide RNA, are well known in the art.

様々な態様において、ガイドRNA配列の具体的なデザイン側面は、PAM配列の場所、標的配列中のパーセントG/C含量、マイクロ相同領域の程度、2次構造等々などの他の因子の中でも、着目するゲノム標的部位のヌクレオチド配列(すなわち、編集されるべき所望の部位)と、本明細書に記載のプライム編集系に存在するnapDNAbpの型(例として、Cas9タンパク質)とに依存するであろう。 In various embodiments, the specific design aspects of the guide RNA sequence will depend on the nucleotide sequence of the genomic target site of interest (i.e., the desired site to be edited) and the type of napDNAbp (e.g., Cas9 protein) present in the prime editing system described herein, among other factors such as the location of the PAM sequence, the percent G/C content in the target sequence, the extent of microhomologous regions, secondary structure, etc.

一般に、ガイド配列は、標的ポリヌクレオチド配列との充分な相補性を有するいずれのポリヌクレオチド配列であって、標的配列とハイブリダイズし、かつnapDNAbp(例として、Cas9、Cas9ホモログ、またはCas9バリアント)の標的配列への配列特異的結合に向けるものである。いくつかの態様において、ガイド配列とその対応する標的配列との間の相補性の程度は、好適な整列(alignment)アルゴリズムを使用して最適に整列されたとき、約50%、60%、75%、80%、85%、90%、95%、97.5%、99%以上、またはこれらより高い。最適な整列は、配列を整列させるためのいずれか好適なアルゴリズムの使用で決定されてもよく、前記アルゴリズムの非限定例は、Smith-Watermanアルゴリズム、Needleman-Wunschアルゴリズム、Burrows-Wheeler Transform(例として、Burrows Wheeler Aligner)、ClustalW、Clustal X、BLAT、Novoalign(Novocraft Technologies)、ELAND(Illumina,San Diego,Calif.)、SOAP(soap.genomics.org.cnにて利用可能)、およびMaq(maq.sourceforge.netにて利用可能)に基づくアルゴリズムを包含する。いくつかの態様において、ガイド配列は、長さが約5、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、35、40、45、50、75ヌクレオチド以上であるか、またはこれらより長い。 In general, the guide sequence is any polynucleotide sequence that has sufficient complementarity with the target polynucleotide sequence to hybridize with the target sequence and that napDNAbp (e.g., Cas9, Cas9 homolog, or Cas9 variant) It is directed toward sequence-specific binding to a target sequence. In some embodiments, the degree of complementarity between a guide sequence and its corresponding target sequence is about 50%, 60%, 75% when optimally aligned using a suitable alignment algorithm. %, 80%, 85%, 90%, 95%, 97.5%, 99% or higher. Optimal alignment may be determined using any suitable algorithm for aligning arrays, non-limiting examples of which algorithms include the Smith-Waterman algorithm, the Needleman-Wunsch algorithm, the Burrows-Wheeler Transform (e.g. , Burrows Wheeler Aligner), ClustalW, Clustal (available at sourceforge.net). In some embodiments, the guide sequence has a length of about 5, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 35, 40, 45, 50, 75 or more nucleotides or longer.

いくつかの態様において、ガイド配列は、長さが約75、50、45、40、35、30、25、20、15、12ヌクレオチド未満であるか、またはこれらより短い。ガイド配列の、プライム編集因子(PE)の標的配列への配列特異的結合に向ける能力は、いずれの好適なアッセイによっても査定されてもよい。例えば、プライム編集因子(PE)の構成要素(試験されるべきガイド配列を包含する)は、本明細書に開示のプライム編集因子(PE)の構成要素をコードするベクターでのトランスフェクション、これに続く、本明細書に記載のとおりのSurveyorアッセイなどによる標的配列内の優先的な切断の査定などによって、対応する標的配列を有する宿主細胞へ提供されてもよい。同様に、標的ポリヌクレオチド配列の切断は試験管中、標的配列、プライム編集因子(PE)の構成要素(試験されるべきガイド配列を包含する)、および試験ガイド配列とは異なる制御ガイド配列を提供すること、ならびに試験ガイド配列とおよび制御ガイド配列との間の反応の、標的配列での結合または切断率を比較することによって、評価されてもよい。他のアッセイもなし得、当業者に思い当たるものであろう。 In some embodiments, the guide sequence is less than or shorter than about 75, 50, 45, 40, 35, 30, 25, 20, 15, 12 nucleotides in length. The ability of a guide sequence to direct sequence-specific binding of a prime editing element (PE) to a target sequence may be assessed by any suitable assay. For example, a prime editing element (PE) component (including a guide sequence to be tested) can be prepared by transfection with a vector encoding a prime editing element (PE) component disclosed herein. Subsequent provision of the corresponding target sequence to a host cell may be performed, such as by assessment of preferential cleavage within the target sequence, such as by Surveyor assay as described herein. Similarly, cleavage of a target polynucleotide sequence in vitro provides the target sequence, a component of the prime editing element (PE) (including the guide sequence to be tested), and a regulatory guide sequence distinct from the test guide sequence. The reaction between the test guide sequence and the control guide sequence may be evaluated by comparing the rate of binding or cleavage at the target sequence. Other assays may be performed and will occur to those skilled in the art.

ガイド配列は、いずれの標的配列をも標的にするのに選択されてもよい。いくつかの態様において、標的配列は、細胞のゲノム内の配列である。例示の標的配列は、標的ゲノム中にユニークな配列を包含する。例えば、S.pyogenes Cas9について、ゲノム中のユニークな標的配列は、形態MMMMMMMMNNNNNNNNNNNNXGGのCas9標的部位を包含していてもよく、ここでNNNNNNNNNNNNXGG(Nは、A、G、T、またはCである;およびXは、何であってもよい)。ゲノム中のユニークな標的配列は、形態MMMMMMMMMNNNNNNNNNNNXGGのS.pyogenes Cas9標的部位を包含していてもよく、ここでNNNNNNNNNNNXGG(Nは、A、G、T、またはCである;およびXは、何であってもよい)。S.thermophilus CRISPR1Cas9について、ゲノム中のユニークな標的配列は、形態MMMMMMMMNNNNNNNNNNNNXXAGAAW(配列番号208)のCas9標的部位を包含していてもよく、ここでNNNNNNNNNNNNXXAGAAW(配列番号209)(Nは、A、G、T、またはCである;Xは、何であってもよい;およびWは、AまたはTである)。ゲノム中のユニークな標的配列は、形態MMMMMMMMMNNNNNNNNNNNXXAGAAW(配列番号210)のS.thermophilus CRISPR1 Cas9標的部位を包含していてもよく、ここでNNNNNNNNNNNXXAGAAW(配列番号211)(Nは、A、G、T、またはCである;Xは、何であってもよい;およびWは、AまたはTである)。S.pyogenes Cas9について、ゲノム中のユニークな標的配列は、形態MMMMMMMMNNNNNNNNNNNNXGGXGのCas9標的部位を包含していてもよく、ここでNNNNNNNNNNNNXGGXG(Nは、A、G、T、またはCである;およびXは、何であってもよい)。ゲノム中のユニークな標的配列は、形態MMMMMMMMMNNNNNNNNNNNXGGXGのS.pyogenes Cas9標的部位を包含していてもよく、ここでNNNNNNNNNNNXGGXG(Nは、A、G、T、またはC;およびXは、何であってもよい)。これらの配列の各々において、「M」は、A、G、T、またはCであってもよく、配列をユニークなものとして同定する際に考慮される必要はない。 The guide sequence may be selected to target any target sequence. In some embodiments, the target sequence is a sequence within the genome of the cell. Exemplary target sequences include sequences that are unique in the target genome. For example, for S.pyogenes Cas9, a unique target sequence in the genome may encompass a Cas9 target site of the form MMMMMMMMNNNNNNNNNNNNXG G , where N is A, G, T, or C. ; and X can be anything). A unique target sequence in the genome may encompass an S.pyogenes Cas9 target site of the form MMMMMMMMMNNNNNNNNNNNXG G , where NNNNNNNNNNNXG ( N is A, G, T, or C; and X is can be anything). For S. thermophilus CRISPR1Cas9, a unique target sequence in the genome may encompass a Cas9 target site of the form MMMMMMMMNNNNNNNNNNNNXXAGAAW (SEQ ID NO: 208), where NNNNNNNNNNNNXXAGAAW (SEQ ID NO: 209) (N is A, G, T, or C; X can be anything; and W is A or T). A unique target sequence in the genome may include a S. thermophilus CRISPR1 Cas9 target site of the form MMMMMMMMMMNNNNNNNNNNXXAGAAW (SEQ ID NO: 210), where NNNNNNNNNNNXXAGAAW (SEQ ID NO: 211) (N is A, G, T, or C; X can be anything; and W is A or T). For S.pyogenes Cas9, a unique target sequence in the genome may encompass a Cas9 target site of the form MMMMMMMMNNNNNNNNNNNNXGGX G , where NNNNNNNNNNNNNXGGX G( N is A, G, T, or C; and X can be anything). A unique target sequence in the genome may encompass an S.pyogenes Cas9 target site of the form MMMMMMMMMNNNNNNNNN ). In each of these sequences, "M" may be A, G, T, or C and need not be taken into account in identifying the sequence as unique.

いくつかの態様において、ガイド配列は、ガイド配列内の2次構造の程度を低減するよう選択される。2次構造は、いずれの好適なポリヌクレオチド折り畳みアルゴリズムによっても決定されてもよい。いくつかのプログラムは、最小限のギブス(Gibbs)自由エネルギーを算出することに基づく。かかるアルゴリズムの1つの例は、ZukerおよびStiegler(Nucleic Acids Res.9(1981),133-148)によって記載されるとおりの、mFoldである。別の例の折り畳みアルゴリズムは、重心構造予測アルゴリズムを使用する、ウィーン大学(University of Vienna)の理論化学研究所(Institute for Theoretical Chemistry)にて開発された、オンラインウェブサーバRNA foldである(例として、A.R.Gruber et al.,2008,Cell 106(1):23-24;およびPA Carr and GM Church,2009,Nature Biotechnology 27(12):1151-62を参照)。さらなるアルゴリズムは、米国出願第61/836,080号;Broad参照BI-2013/004A)に見出されるものであってもよい(参照により本明細書に組み込まれる)。 In some embodiments, the guide sequence is selected to reduce the degree of secondary structure within the guide sequence. Secondary structure may be determined by any suitable polynucleotide folding algorithm. Some programs are based on calculating the minimum Gibbs free energy. One example of such an algorithm is mFold, as described by Zuker and Stiegler (Nucleic Acids Res. 9 (1981), 133-148). Another example folding algorithm is the online web server RNA fold developed at the Institute for Theoretical Chemistry at the University of Vienna, which uses a centroid structure prediction algorithm (for example , A. R. Gruber et al., 2008, Cell 106(1):23-24; and P. A. Carr and GM Church, 2009, Nature Biotechnology 27(12):1151-62). Additional algorithms may be found in US Application No. 61/836,080; Broad Reference BI-2013/004A) (incorporated herein by reference).

一般的に、tracrメイト配列は:(1)対応するtracr配列を含有する細胞におけるtracrメイト配列によってフランキングされるガイド配列の切除;および(2)標的配列における複合体の形成の1つ以上を促進するために、tracr配列との十分な相補性を有するいずれかの配列を包含し、複合体は、tracr配列にハイブリダイズしたtracrメイト配列を含む。一般的に、相補性の度合は、2つの配列の短い方の長さに沿って、tracrメイト配列およびtracr配列の最適な整列の参照によってである。最適な整列は、いずれの好適な整列アルゴリズムによっても決定されてもよく、さらにtracr配列またはtracrメイト配列のいずれかの配列内に自己相補性などの2次構造を構成していてもよい。いくつかの態様において、tracr配列とtracrメイト配列との間の相補性の程度は、その2つのより短い長さに沿って最適に整列されたとき、約25%、30%、40%、50%、60%、70%、80%、90%、95%、97.5%、99%以上、またはこれらより高い。いくつかの態様において、tracr配列は、長さが約5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、25、30、40、50ヌクレオチド以上、またはこれらより長い。いくつかの態様において、tracr配列およびtracrメイト配列は、その2つの間のハイブリダイゼーションがヘアピンなどの2次構造を有する転写産物を産生するように、単一転写産物内に含有される。ヘアピン構造における使用のための好ましいループ形成配列は、長さが4ヌクレオチドであり、最も好ましくは配列GAAAを有する。しかしながら、より長いまたはより短いループ配列も、代替の配列になり得るよう(as may alternative sequences)使用されてもよい。配列は、好ましくは、ヌクレオチドトリプレット(例えば、AAA)、および追加のヌクレオチド(例えばCまたはG)を包含する。ループ形成配列の例は、CAAAおよびAAAGを包含する。本発明の態様において、転写産物または転写されたポリヌクレオチド配列は、少なくとも2つの、またはそれより多くのヘアピンを有する。好ましい一態様において、転写産物は、2、3、4または5つのヘアピンを有する。本発明のさらなる態様において、転写産物は、最大でも5つのヘアピンを有する。いくつかの態様において、単一の転写産物はさらに、転写終止配列を包含する;好ましくは、これは、ポリT配列、例えば6つのTヌクレオチドを包含する。ガイド配列、tracrメイト配列、およびtracr配列を含む単一ポリヌクレオチドのさらなる非限定例は、以下のとおりであるが(5'→3'に列挙)、ここで「N」は、ガイド配列の塩基を表し、第1ブロックの小文字は、tracrブロック配列を表し、および第2ブロックの小文字は、tracr配列を表し、および最後のポリT配列は、転写ターミネータを表す:(1)NNNNNNNNGTTTTTGTACTCTCAAGATTTAGAAATAAATCTTGCAGAAGCTACAAAGATAAGGCTTCATGCCGAAATCAACACCCTGTCATTTTATGGCAGGGTGTTTTCGTTATTTAATTTTTT(配列番号216); Generally, a tracr mate sequence induces one or more of: (1) excision of the guide sequence flanked by the tracr mate sequence in cells containing the corresponding tracr sequence; and (2) formation of a complex at the target sequence. To facilitate this, the complex includes a tracr mate sequence hybridized to the tracr sequence. Generally, the degree of complementarity is by reference to the optimal alignment of the tracr mate sequences and the tracr sequences along the shorter length of the two sequences. Optimal alignment may be determined by any suitable alignment algorithm and may also constitute secondary structure, such as self-complementarity, within the sequence of either the tracr or tracr mate sequences. In some embodiments, the degree of complementarity between the tracr sequence and the tracr mate sequence is about 25%, 30%, 40%, 50% when optimally aligned along their two shorter lengths. %, 60%, 70%, 80%, 90%, 95%, 97.5%, 99% or higher. In some embodiments, the tracr sequence has a length of about 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 25, 30, 40, 50 or more nucleotides or longer. In some embodiments, a tracr sequence and a tracr mate sequence are contained within a single transcript such that hybridization between the two produces a transcript with a secondary structure such as a hairpin. Preferred loop-forming sequences for use in hairpin structures are 4 nucleotides in length and most preferably have the sequence GAAA. However, longer or shorter loop sequences may also be used as may alternative sequences. The sequence preferably includes a nucleotide triplet (eg, AAA) and an additional nucleotide (eg, C or G). Examples of loop-forming sequences include CAAA and AAAG. In embodiments of the invention, the transcript or transcribed polynucleotide sequence has at least two or more hairpins. In one preferred embodiment, the transcript has 2, 3, 4 or 5 hairpins. In a further embodiment of the invention, the transcript has at most 5 hairpins. In some embodiments, the single transcript further includes a transcription termination sequence; preferably it includes a polyT sequence, eg, 6 T nucleotides. Further non-limiting examples of single polynucleotides that include a guide sequence, a tracr mate sequence, and a tracr sequence are as follows (listed 5'→3'), where "N" is a base of the guide sequence. , the lowercase letters in the first block represent the tracr block sequence, and the lowercase letters in the second block represent the tracr sequence, and the last polyT sequence represents the transcription terminator: (1) NNNNNNNNGTTTTTGTACTCTCAAGATTTAGAAATAAATCTTGCAGAAGCTACAAAGATAAGGCTTCATGCCGAAATCAACACCCTGTCATTTTATGGCAGGGTGTTTTCGTTATTTAATTTTTT (SEQ ID NO: 216 );

(2)NNNNNNNNNNNNNNNNNNgtttttgtactctcaGAAAtgcagaagctacaaagataaggcttcatgccgaaatcaacaccctgtcattttatggcagggtgttttcgttatttaaTTTTTT(配列番号217); (2) NNNNNNNNNNNNNNNNNNgtttttgtactctcaGAAAtgcagaagctacaaagataaggcttcatgccgaaatcaacaccctgtcattttatggcagggtgttttcgttatttaaTTTTTT (SEQ ID NO: 217);

(3)NNNNNNNNNNNNNNNNNNNNgtttttgtactctcaGAAAtgcagaagctacaaagataaggcttcatgccgaaatcaacaccctgtcattttatggcagggtgtTTTTT(配列番号218); (3) NNNNNNNNNNNNNNNNNNNNgtttttgtactctcaGAAAtgcagaagctacaaagataaggcttcatgccgaaatcaacaccctgtcattttatggcagggtgtTTTTT (SEQ ID NO: 218);

(4)NNNNNNNNNNNNNNNNNNNNgttttagagctaGAAAtagcaagttaaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtgcTTTTTT(配列番号219); (4) NNNNNNNNNNNNNNNNNNNNgttttagagctaGAAAtagcaagttaaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtgcTTTTTT (SEQ ID NO: 219);

(5)NNNNNNNNNNNNNNNNNNNNgttttagagctaGAAATAGcaagttaaaataaggctagtccgttatcaacttgaaaaagtgTTTTTTT(配列番号220);および (5) NNNNNNNNNNNNNNNNNNNNgttttagagctaGAAATAGcaagttaaaataaggctagtccgttatcaacttgaaaaagtgTTTTTTT (SEQ ID NO: 220); and

(6)NNNNNNNNNNNNNNNNNNNNgttttagagctagAAATAGcaagttaaaataaggctagtccgttatcaTTTTTTTT(配列番号221)。 (6) NNNNNNNNNNNNNNNNNNNNgttttagagctagAAATAGcaagttaaaataaggctagtccgttatcaTTTTTTTT (SEQ ID NO: 221).

いくつかの態様において、配列(1)~(3)は、S.thermophilus CRISPR1からのCas9と組み合わせて使用される。いくつかの態様において、配列(4)~(6)は、S.pyogenesからのCas9と組み合わせて使用される。いくつかの態様において、tracr配列は、tracrメイト配列を含む転写産物とは別々の転写産物である。 In some embodiments, sequences (1)-(3) are used in combination with Cas9 from S. thermophilus CRISPR1. In some embodiments, sequences (4)-(6) are used in combination with Cas9 from S. pyogenes. In some embodiments, the tracr sequence is a separate transcript from the transcript that includes the tracr mate sequence.

Cas9ドメインと単鎖DNA結合タンパク質とを含む本明細書に開示のとおりの融合タンパク質のいずれも、標的部位(例として、編集されるべき点突然変異を含む部位)に対して、標的にさせるために、典型的には、融合タンパク質をガイドRNA(例として、sgRNA)と一緒に共発現させることが必要であることは、当業者には明らかであろう。本明細書中、他のどこかでより詳細に説明されるとおり、ガイドRNAは、典型的には、Cas9結合を可能にさせるtracrRNAフレームワークと、配列特異性をCas9:核酸編集酵素/ドメイン融合タンパク質へ付与するガイド配列とを含む。 Any of the fusion proteins as disclosed herein comprising a Cas9 domain and a single-stranded DNA binding protein can be targeted to a target site (e.g., a site containing a point mutation to be edited). It will be clear to those skilled in the art that it is typically necessary to co-express the fusion protein together with a guide RNA (eg, sgRNA). As described in more detail elsewhere herein, the guide RNA typically includes a tracrRNA framework that allows for Cas9 binding and a sequence-specific Cas9:nucleic acid editing enzyme/domain fusion. and a guide sequence attached to the protein.

いくつかの態様において、ガイドRNAは、構造5'-[ガイド配列]-GUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUU-3'(配列番号222)を含み、ここでガイド配列は、標的配列に相補的な配列を含む。ガイド配列は、典型的には20ヌクレオチド長である。Cas9:核酸編集酵素/ドメイン融合タンパク質を特定のゲノム標的部位に対して標的にさせるための好適なガイドRNAの配列は、本開示に基づき当業者に明らかであろう。かかる好適なガイドRNA配列は、典型的には、編集されるべき標的ヌクレオチドから50ヌクレオチド以内上流または下流の核酸配列に相補的なガイド配列を含む。提供される融合タンパク質に、特定の標的配列を標的にさせるのに好適ないくつかの例示のガイドRNA配列は、本明細書に提供される。追加のガイド配列は、当該技術分野において周知であり、本明細書に記載のプライム編集因子(PE)とともに使用され得る。 In some embodiments, the guide RNA comprises the structure 5'-[guide sequence]-GUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUU-3' (SEQ ID NO: 222), where the guide sequence comprises a sequence complementary to the target sequence. The guide sequence is typically 20 nucleotides in length. Suitable guide RNA sequences for targeting Cas9:nucleic acid editing enzyme/domain fusion proteins to specific genomic target sites will be apparent to one of skill in the art based on this disclosure. Such suitable guide RNA sequences typically comprise a guide sequence complementary to a nucleic acid sequence within 50 nucleotides upstream or downstream of the target nucleotide to be edited. Some exemplary guide RNA sequences suitable for targeting the provided fusion proteins to specific target sequences are provided herein. Additional guide sequences are known in the art and may be used with the prime editors (PEs) described herein.

他の態様において、PEgRNAは、図3Dに描かれるものを包含する。 In other embodiments, the PEgRNA includes those depicted in Figure 3D.

更なる他の態様において、PEgRNAは、図3Eに描かれるものを包含していてもよい。 In yet other embodiments, the PEgRNA may include those depicted in Figure 3E.

図3Dは、本明細書に企図され、例2に定義される方法論に従ってデザインされてもよい、ある態様のPEgRNAの構造を提供する。PEgRNAは、5'→3'方向に順序付けられた3大構成要素、つまり:スペーサー、gRNAコア、および3'末にて伸長アームを含む。伸長アームはさらに、5'→3'方向に以下の構造要素、つまり:プライマー結合部位(A)、編集鋳型(B)、および相同アーム(C)に分けられてもよい。加えて、PEgRNAは、任意の3'末修飾領域(e1)および任意の5'末修飾領域(e2)を含んでいてもよい。またさらに、PEgRNAは、PEgRNAの3'末にて転写終止シグナルを含んでいてもよい(描かれず)。これらの構造要素はさらに本明細書に定義される。PEgRNA構造の描画は、限定することを意図しておらず、要素の配置におけるバリエーションを網羅するものである。例えば、任意の配列修飾因子(e1)および(e2)は、示されるいずれの他の領域内またはそれらの間に位置付けられ得るものであって、3'末および5'末にて位置付けられることに限定され得ない。 FIG. 3D provides the structure of an embodiment of PEgRNA that may be designed according to the methodology contemplated herein and defined in Example 2. PEgRNA contains three major components ordered in the 5'→3' direction: a spacer, a gRNA core, and an extended arm at the 3' end. The elongated arm may be further divided into the following structural elements in the 5'→3' direction: primer binding site (A), editing template (B), and homology arm (C). In addition, PEgRNA may include an optional 3' end modified region (e1) and an optional 5' end modified region (e2). Furthermore, the PEgRNA may include a transcription termination signal at the 3' end of the PEgRNA (not shown). These structural elements are further defined herein. The depiction of the PEgRNA structure is not intended to be limiting, but rather to cover variations in the arrangement of the elements. For example, optional sequence modifiers (e1) and (e2) can be located within or between any of the other regions shown, including being located at the 3' and 5' ends. It cannot be limited.

図3Eは、本明細書に企図され、例2に定義される方法論に従ってデザインされてもよい、別の態様のPEgRNAの構造を提供する。PEgRNAは、5'→3'方向に順序付けられた3大構成要素、つまり:スペーサー、gRNAコア、および3'末にて伸長アームを含む。伸長アームはさらに、5'→3'方向に以下の構造要素、つまり:プライマー結合部位(A)、編集鋳型(B)、ならびに相同アーム(C)に分けられてもよい。加えて、PEgRNAは、任意の3'末修飾領域(e1)および任意の5'末修飾領域(e2)を含んでいてもよい。またさらに、PEgRNAは、PEgRNAの3'末にて転写終止シグナルを含んでいてもよい(描かれず)。これらの構造要素はさらに本明細書に定義される。PEgRNA構造の描画は、限定することを意図しておらず、要素の配置におけるバリエーションを網羅するものである。例えば、任意の配列修飾因子(e1)および(e2)は、示されるいずれの他の領域内またはそれらの間に位置付けられ得るものであって、3'末および5'末にて位置付けられることに限定され得ない。 FIG. 3E provides the structure of another embodiment of PEgRNA that may be designed according to the methodology contemplated herein and defined in Example 2. PEgRNA contains three major components ordered in the 5'→3' direction: a spacer, a gRNA core, and an extended arm at the 3' end. The elongated arm may be further divided into the following structural elements in the 5'→3' direction: the primer binding site (A), the editing template (B), and the homology arm (C). In addition, PEgRNA may include an optional 3' end modified region (e1) and an optional 5' end modified region (e2). Furthermore, the PEgRNA may include a transcription termination signal at the 3' end of the PEgRNA (not shown). These structural elements are further defined herein. The depiction of the PEgRNA structure is not intended to be limiting, but rather to cover variations in the arrangement of the elements. For example, optional sequence modifiers (e1) and (e2) can be located within or between any of the other regions shown, including being located at the 3' and 5' ends. It cannot be limited.

PEgRNAはまた、PEgRNAの特性および/または特徴を修飾してもよい追加のデザイン改善点も包含していてもよく、これによってプライム編集の有効性が改善される。様々な態様において、これらの改善点は、数多の種々のカテゴリーの1以上に属するものであってもよく、これらに限定されないが、以下を包含する:(1)非ポリメラーゼIII(pol III)プロモーターからの機能的PEgRNAの効率的な発現を可能にさせるデザイン(これによって厄介な配列要件もなく、より長いPEgRNAの発現が可能になるであろう);(2)コア、Cas9結合PEgRNA骨格への改善点(これによって有効性が改善され得る);(3)RT処理能力(processivity)を改善する、PEgRNAへの修飾(標的にされたゲノム遺伝子座にてより長い配列の挿入が可能になる);および(4)RNAモチーフの、PEgRNAの5'末端または3'末端への付加(これによって、PEgRNA安定性が改善されるか、RT処理能力が増強されるか、PEgRNAの誤った折り畳みが防止されるか、またはゲノム編集に重要な追加の因子が動員される)。 The PEgRNA may also include additional design improvements that may modify the properties and/or characteristics of the PEgRNA, thereby improving the effectiveness of prime editing. In various embodiments, these improvements may belong to one or more of a number of different categories, including, but not limited to: (1) non-polymerase III (pol III); A design that allows for efficient expression of functional PEgRNA from a promoter (which would allow for the expression of longer PEgRNA without onerous sequence requirements); (2) to the core, Cas9-bound PEgRNA backbone; improvements to PEgRNA (which may improve efficacy); (3) modifications to PEgRNA that improve RT processivity (allowing insertion of longer sequences at targeted genomic loci); ); and (4) addition of RNA motifs to the 5' or 3' end of PEgRNA, which may improve PEgRNA stability, enhance RT processing capacity, or prevent PEgRNA misfolding. or recruitment of additional factors important for genome editing).

一態様において、PEgRNAは、より大きな伸長アームをもつより長い長さのPEgRNAの発現を改善するよう、pol IIIプロモーターでデザインされ得る。sgRNAは、典型的には、U6 snRNAプロモーターから発現される。このプロモーターは、pol IIIを動員して関連RNAを発現するものであって、核内に保持される短いRNAの発現に有用である。しかしながら、pol IIIは、処理能力がそれほど高くなく、効率的なゲノム編集に要されるレベルにて長さが数百ヌクレオチドより長いRNAを発現することができない。加えて、pol IIIは、伸展したU(streches of U's)にて失速または終止し、PEgRNAを使用して挿入され得る配列多様性を潜在的に限定し得る。ポリメラーゼII(pCMVなど)またはポリメラーゼI(U1 snRNAプロモーターなど)を動員する他のプロモーターも、それらのより長いsgRNAの発現能について調べられている。しかしながら、これらのプロモーターは、典型的には、部分的に転写され、これによって、発現されたPEgRNA中スペーサーの5'に余分な配列がもたらされ、このことは部位依存的なやり方で著しく低減されたCas9:sgRNA活性をもたらすことが示されている。加えて、pol III転写のPEgRNAは、6~7つ伸びたUにおいて簡単に終止し得るのに対し、pol IIまたはpol Iから転写されたPEgRNAは、異なる終止シグナルを要するであろう。しばしば、かかるシグナルはまた、ポリアデニル化ももたらし、これによってPEgRNAの核からの望ましくない輸送がもたらされるであろう。同様に、pol IIプロモーター(pCMVなど)から発現されるRNAは、典型的には、5'にキャップされており、それらの核外輸送もまたもたらされる。 In one embodiment, PEgRNAs can be designed with a pol III promoter to improve expression of longer length PEgRNAs with larger extended arms. sgRNAs are typically expressed from the U6 snRNA promoter. This promoter recruits pol III to express associated RNA and is useful for expressing short RNAs that are retained in the nucleus. However, pol III is not very processive and cannot express RNAs longer than a few hundred nucleotides at the levels required for efficient genome editing. Additionally, pol III stalls or terminates at stretches of U's, potentially limiting the sequence diversity that can be inserted using PEgRNA. Other promoters that recruit polymerase II (such as pCMV) or polymerase I (such as the U1 snRNA promoter) have also been investigated for their ability to express longer sgRNAs. However, these promoters are typically partially transcribed, resulting in an extra sequence 5' of the spacer in the expressed PEgRNA, which is significantly reduced in a site-dependent manner. Cas9:sgRNA activity has been shown to result in increased Cas9:sgRNA activity. In addition, pol III-transcribed PEgRNAs can easily terminate at 6-7 extended U's, whereas PEgRNAs transcribed from pol II or pol I will require different termination signals. Frequently, such signals will also result in polyadenylation, leading to unwanted export of PEgRNA from the nucleus. Similarly, RNAs expressed from pol II promoters (such as pCMV) are typically 5' capped, which also results in their nuclear export.

これまでに、Rinnおよび共同研究者らは、長鎖非コーディングRNA(lncRNA)でタグ付けされたsgRNAの産生のための様々な発現プラットホームをスクリーニングした183。これらのプラットホームは、pCMVから発現され、ヒトのMALAT1 ncRNAからのENE要素184、KSHVからのPAN ENE要素185、またはU1 snRNAからの3'ボックス186において終止するRNAを包含する。注目すべきことに、MALAT1 ncRNAおよびPAN ENEは、ポリAテールを保護する三重ヘリックスを形成する184,187。これらの構築物はまた、RNA安定性をも増強し得る。これらの発現系はまた、より長いPEgRNAの発現も可能にさせるであろうことが企図される。 Previously, Rinn and co-workers screened various expression platforms for the production of sgRNAs tagged with long non-coding RNAs (lncRNAs). These platforms include RNAs expressed from pCMV and terminating in the ENE element 184 from human MALAT1 ncRNA, the PAN ENE element 185 from KSHV, or the 3' box 186 from U1 snRNA. Remarkably, MALAT1 ncRNA and PAN ENE form a triple helix that protects the polyA tail. These constructs may also enhance RNA stability. It is contemplated that these expression systems will also allow expression of longer PEgRNAs.

加えて、一連の方法は、PEgRNAの一部として転写されるであろうpol IIプロモーターの部分の切断のためにデザインされており、自己切断型リボザイム(ハンマーヘッド188、ピストル189、ハチェット189、ヘアピン190、VS191、ツイスター192、もしくはツイスターシスター192リボザイムなど)、または転写されたガイドを処理する他の自己切断型要素、またはCsy4によって認識されまたガイドのプロセシングへも繋がるヘアピン193のいずれかが付加されている。また、複数のENEモチーフの組み込みは、これまでKSHV PAN RNAおよび要素について実証されたとおり185、改善されたPEgRNA発現および安定性へ繋がり得ることも仮定される。PEgRNAを環状イントロンRNA(ciRNA)の形態に環化することはまた、増強されたRNAの発現および安定性、ならびに核局在化へも繋がり得ることもまた、予想される194 In addition, a series of methods have been designed for the cleavage of the portion of the pol II promoter that would be transcribed as part of PEgRNA, including self-cleaving ribozymes (Hammerhead 188 , Pistol 189 , Hatchet 189 , Hairpin 190 , VS 191 , Twister 192 , or Twister Sister 192 ribozymes) or other self-cleaving elements that process the transcribed guide, or a hairpin 193 that is recognized by Csy4 and also leads to guide processing. has been done. It is also hypothesized that the incorporation of multiple ENE motifs may lead to improved PEgRNA expression and stability, as previously demonstrated for KSHV PAN RNA and elements. It is also anticipated that circularizing PEgRNA into the form of circular intronic RNA (ciRNA) may also lead to enhanced RNA expression and stability, as well as nuclear localization 194 .

様々な態様において、PEgRNAは、以下の配列によって例示されるとおり、上の様々な要素を包含していてもよい。 In various embodiments, PEgRNA may include various elements above, as exemplified by the sequences below.

非限定例1-pCMV、Csy4ヘアピン、PEgRNA、およびMALAT1 ENEからなるPEgRNA発現プラットホーム
TAGTTATTAATAGTAATCAATTACGGGGTCATTAGTTCATAGCCCATATATGGAGTTCCGCGTTACATAACTTACGGTAAATGGCCCGCCTGGCTGACCGCCCAACGACCCCCGCCCATTGACGTCAATAATGACGTATGTTCCCATAGTAACGCCAATAGGGACTTTCCATTGACGTCAATGGGTGGAGTATTTACGGTAAACTGCCCACTTGGCAGTACATCAAGTGTATCATATGCCAAGTACGCCCCCTATTGACGTCAATGACGGTAAATGGCCCGCCTGGCATTATGCCCAGTACATGACCTTATGGGACTTTCCTACTTGGCAGTACATCTACGTATTAGTCATCGCTATTACCATGGTGATGCGGTTTTGGCAGTACATCAATGGGCGTGGATAGCGGTTTGACTCACGGGGATTTCCAAGTCTCCACCCCATTGACGTCAATGGGAGTTTGTTTTGGCACCAAAATCAACGGGACTTTCCAAAATGTCGTAACAACTCCGCCCCATTGACGCAAATGGGCGGTAGGCGTGTACGGTGGGAGGTCTATATAAGCAGAGCTGGTTTAGTGAACCGTCAGATCGTTCACTGCCGTATAGGCAGGGCCCAGACTGAGCACGTGAGTTTTAGAGCTAGAAATAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGGACCGAGTCGGTCCTCTGCCATCAAAGCGTGCTCAGTCTGTTTTAGGGTCATGAAGGTTTTTCTTTTCCTGAGAAAACAACACGTATTGTTTTCTCAGGTTTTGCTTTTTGGCCTTTTTCTAGCTTAAAAAAAAAAAAAGCAAAAGATGCTGGTGGTTGGCACTCCTGGTTTCCAGGACGGGGTTCAAATCCCTGCGGCGTCTTTGCTTTGACT(配列番号223)
Non-limiting example 1 - PEgRNA expression platform consisting of pCMV, Csy4 hairpin, PEgRNA, and MALAT1 ENE
(Sequence number 223)

非限定例2-pCMV、Csy4ヘアピン、PEgRNA、およびPAN ENEからなるPEgRNA発現プラットホーム
TAGTTATTAATAGTAATCAATTACGGGGTCATTAGTTCATAGCCCATATATGGAGTTCCGCGTTACATAACTTACGGTAAATGGCCCGCCTGGCTGACCGCCCAACGACCCCCGCCCATTGACGTCAATAATGACGTATGTTCCCATAGTAACGCCAATAGGGACTTTCCATTGACGTCAATGGGTGGAGTATTTACGGTAAACTGCCCACTTGGCAGTACATCAAGTGTATCATATGCCAAGTACGCCCCCTATTGACGTCAATGACGGTAAATGGCCCGCCTGGCATTATGCCCAGTACATGACCTTATGGGACTTTCCTACTTGGCAGTACATCTACGTATTAGTCATCGCTATTACCATGGTGATGCGGTTTTGGCAGTACATCAATGGGCGTGGATAGCGGTTTGACTCACGGGGATTTCCAAGTCTCCACCCCATTGACGTCAATGGGAGTTTGTTTTGGCACCAAAATCAACGGGACTTTCCAAAATGTCGTAACAACTCCGCCCCATTGACGCAAATGGGCGGTAGGCGTGTACGGTGGGAGGTCTATATAAGCAGAGCTGGTTTAGTGAACCGTCAGATCGTTCACTGCCGTATAGGCAGGGCCCAGACTGAGCACGTGAGTTTTAGAGCTAGAAATAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGGACCGAGTCGGTCCTCTGCCATCAAAGCGTGCTCAGTCTGTTTTGTTTTGGCTGGGTTTTTCCTTGTTCGCACCGGACACCTCCAGTGACCAGACGGCAAGGTTTTTATCCCAGTGTATATTGGAAAAACATGTTATACTTTTGACAATTTAACGTGCCTAGAGCTCAAATTAAACTAATACCATAACGTAATGCAACTTACAACATAAATAAAGGTCAATGTTTAATCCATAAAAAAAAAAAAAAAAAAA(配列番号224)
Non-limiting example 2 - PEgRNA expression platform consisting of pCMV, Csy4 hairpin, PEgRNA, and PAN ENE
(Sequence number 224)

非限定例3-pCMV、Csy4ヘアピン、PEgRNA、および3×PAN ENEからなるPEgRNA発現プラットホーム
TAGTTATTAATAGTAATCAATTACGGGGTCATTAGTTCATAGCCCATATATGGAGTTCCGCGTTACATAACTTACGGTAAATGGCCCGCCTGGCTGACCGCCCAACGACCCCCGCCCATTGACGTCAATAATGACGTATGTTCCCATAGTAACGCCAATAGGGACTTTCCATTGACGTCAATGGGTGGAGTATTTACGGTAAACTGCCCACTTGGCAGTACATCAAGTGTATCATATGCCAAGTACGCCCCCTATTGACGTCAATGACGGTAAATGGCCCGCCTGGCATTATGCCCAGTACATGACCTTATGGGACTTTCCTACTTGGCAGTACATCTACGTATTAGTCATCGCTATTACCATGGTGATGCGGTTTTGGCAGTACATCAATGGGCGTGGATAGCGGTTTGACTCACGGGGATTTCCAAGTCTCCACCCCATTGACGTCAATGGGAGTTTGTTTTGGCACCAAAATCAACGGGACTTTCCAAAATGTCGTAACAACTCCGCCCCATTGACGCAAATGGGCGGTAGGCGTGTACGGTGGGAGGTCTATATAAGCAGAGCTGGTTTAGTGAACCGTCAGATCGTTCACTGCCGTATAGGCAGGGCCCAGACTGAGCACGTGAGTTTTAGAGCTAGAAATAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGGACCGAGTCGGTCCTCTGCCATCAAAGCGTGCTCAGTCTGTTTTGTTTTGGCTGGGTTTTTCCTTGTTCGCACCGGACACCTCCAGTGACCAGACGGCAAGGTTTTTATCCCAGTGTATATTGGAAAAACATGTTATACTTTTGACAATTTAACGTGCCTAGAGCTCAAATTAAACTAATACCATAACGTAATGCAACTTACAACATAAATAAAGGTCAATGTTTAATCCATAAAAAAAAAAAAAAAAAAAACACACTGTTTTGGCTGGGTTTTTCCTTGTTCGCACCGGACACCTCCAGTGACCAGACGGCAAGGTTTTTATCCCAGTGTATATTGGAAAAACATGTTATACTTTTGACAATTTAACGTGCCTAGAGCTCAAATTAAACTAATACCATAACGTAATGCAACTTACAACATAAATAAAGGTCAATGTTTAATCCATAAAAAAAAAAAAAAAAAAATCTCTCTGTTTTGGCTGGGTTTTTCCTTGTTCGCACCGGACACCTCCAGTGACCAGACGGCAAGGTTTTTATCCCAGTGTATATTGGAAAAACATGTTATACTTTTGACAATTTAACGTGCCTAGAGCTCAAATTAAACTAATACCATAACGTAATGCAACTTACAACATAAATAAAGGTCAATGTTTAATCCATAAAAAAAAAAAAAAAAAAA(配列番号225)
Non-limiting example 3 - PEgRNA expression platform consisting of pCMV, Csy4 hairpin, PEgRNA, and 3×PAN ENE
(Sequence number 225)

非限定例4-pCMV、Csy4ヘアピン、PEgRNA、および3'ボックスからなるPEgRNA発現プラットホーム
TAGTTATTAATAGTAATCAATTACGGGGTCATTAGTTCATAGCCCATATATGGAGTTCCGCGTTACATAACTTACGGTAAATGGCCCGCCTGGCTGACCGCCCAACGACCCCCGCCCATTGACGTCAATAATGACGTATGTTCCCATAGTAACGCCAATAGGGACTTTCCATTGACGTCAATGGGTGGAGTATTTACGGTAAACTGCCCACTTGGCAGTACATCAAGTGTATCATATGCCAAGTACGCCCCCTATTGACGTCAATGACGGTAAATGGCCCGCCTGGCATTATGCCCAGTACATGACCTTATGGGACTTTCCTACTTGGCAGTACATCTACGTATTAGTCATCGCTATTACCATGGTGATGCGGTTTTGGCAGTACATCAATGGGCGTGGATAGCGGTTTGACTCACGGGGATTTCCAAGTCTCCACCCCATTGACGTCAATGGGAGTTTGTTTTGGCACCAAAATCAACGGGACTTTCCAAAATGTCGTAACAACTCCGCCCCATTGACGCAAATGGGCGGTAGGCGTGTACGGTGGGAGGTCTATATAAGCAGAGCTGGTTTAGTGAACCGTCAGATCGTTCACTGCCGTATAGGCAGGGCCCAGACTGAGCACGTGAGTTTTAGAGCTAGAAATAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGGACCGAGTCGGTCCTCTGCCATCAAAGCGTGCTCAGTCTGTTTGTTTCAAAAGTAGACTGTACGCTAAGGGTCATATCTTTTTTTGTTTGGTTTGTGTCTTGGTTGGCGTCTTAAA(配列番号226)
Non-limiting example 4 - PEgRNA expression platform consisting of pCMV, Csy4 hairpin, PEgRNA, and 3' box
(Sequence number 226)

非限定例5-pU1、Csy4ヘアピン、PEgRNA、および3'ボックスからなるPEgRNA発現プラットホーム
CTAAGGACCAGCTTCTTTGGGAGAGAACAGACGCAGGGGCGGGAGGGAAAAAGGGAGAGGCAGACGTCACTTCCCCTTGGCGGCTCTGGCAGCAGATTGGTCGGTTGAGTGGCAGAAAGGCAGACGGGGACTGGGCAAGGCACTGTCGGTGACATCACGGACAGGGCGACTTCTATGTAGATGAGGCAGCGCAGAGGCTGCTGCTTCGCCACTTGCTGCTTCACCACGAAGGAGTTCCCGTGCCCTGGGAGCGGGTTCAGGACCGCTGATCGGAAGTGAGAATCCCAGCTGTGTGTCAGGGCTGGAAAGGGCTCGGGAGTGCGCGGGGCAAGTGACCGTGTGTGTAAAGAGTGAGGCGTATGAGGCTGTGTCGGGGCAGAGGCCCAAGATCTCAGTTCACTGCCGTATAGGCAGGGCCCAGACTGAGCACGTGAGTTTTAGAGCTAGAAATAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGGACCGAGTCGGTCCTCTGCCATCAAAGCGTGCTCAGTCTGTTTCAGCAAGTTCAGAGAAATCTGAACTTGCTGGATTTTTGGAGCAGGGAGATGGAATAGGAGCTTGCTCCGTCCACTCCACGCATCGACCTGGTATTGCAGTACCTCCAGGAACGGTGCACCCACTTTCTGGAGTTTCAAAAGTAGACTGTACGCTAAGGGTCATATCTTTTTTTGTTTGGTTTGTGTCTTGGTTGGCGTCTTAAA(配列番号227).
Non-limiting example 5 - PEgRNA expression platform consisting of pU1, Csy4 hairpin, PEgRNA, and 3' box
(SEQ ID NO: 227).

様々な他の態様において、PEgRNAは、改善点を骨格またはコア配列へ導入することによって改善されてもよい。これは、知られているものを導入することによってなされ得る。 In various other embodiments, PEgRNAs may be improved by introducing improvements to the backbone or core sequence. This can be done by introducing what is known.

コア、Cas9結合PEgRNA骨格はおそらく、PE活性を増強するのにも改善され得る。数種のかかるアプローチは既に実証されている。実例として、骨格の第1の対形成要素(P1)は、GTTTT-AAAAC(配列番号3939)対形成要素を含有する。かかるT(複数)の伸びは、RNA転写産物のpol III休止(pausing)および未成熟終止をもたらすことが示されている。このP1の部分におけるT-A対の1つの、G-C対への合理的な突然変異は、sgRNA活性を増強するのが示されたが、このアプローチもまたPEgRNAに対して実現可能であろうことを示唆する195。加えて、P1の長さを増大することはまた、sgRNAの折り畳みを増強して改善された活性へ繋がることも示されたが195、これはPEgRNA活性の改善のための別の道として示唆される。コアへの改善点の例は以下を包含し得る: The core, Cas9-bound PEgRNA backbone could probably also be improved to enhance PE activity. Several such approaches have already been demonstrated. Illustratively, the first pairing element (P1) of the scaffold contains a GTTTT-AAAAC (SEQ ID NO: 3939) pairing element. Such T(s) elongation has been shown to result in pol III pausing and premature termination of RNA transcripts. Rational mutation of one of the TA pairs in this P1 region to a GC pair was shown to enhance sgRNA activity, suggesting that this approach may also be feasible for PEgRNA. 195 . In addition, increasing the length of P1 was also shown to enhance sgRNA folding leading to improved activity, 195 which has been suggested as another avenue for improving PEgRNA activity. Ru. Examples of improvements to the core may include:

P1まで6nt伸長を含有するPEgRNA
GGCCCAGACTGAGCACGTGAGTTTTAGAGCTAGCTCATGAAAATGAGCTAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGGACCGAGTCGGTCCTCTGCCATCAAAGCGTGCTCAGTCTGTTTTTTT(配列番号228)
PEgRNA containing a 6nt extension to P1
GGCCCAGACTGAGCACGTGAGTTTTAGAGCTAGCTCATGAAAATGAGCTAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGGACCGAGTCGGTCCTCTGCCATCAAAGCGTGCTCAGTCTGTTTTTTT (SEQ ID NO: 228)

P1内にT-A→G-C突然変異を含有するPEgRNA
GGCCCAGACTGAGCACGTGAGTTTGAGAGCTAGAAATAGCAAGTTTAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGGACCGAGTCGGTCCTCTGCCATCAAAGCGTGCTCAGTCTGTTTTTTT(配列番号229)
PEgRNA containing a TA→GC mutation in P1
GGCCCAGACTGAGCACGTGAGTTTGAGAGCTAGAAATAGCAAGTTTAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGGACCGAGTCGGTCCTCTGCCATCAAAGCGTGCTCAGTCTGTTTTTTT (SEQ ID NO: 229)

様々な他の態様において、PEgRNAは、修飾を編集鋳型領域へ導入することによって改善されてもよい。PEgRNAによって鋳型にされた(templated)挿入のサイズが増大するにつれて、エンドヌクレアーゼによって分解されるか、自発的加水分解を経るか、または折り畳まれることで2次構造(RTによって逆転写され得ないか、もしくはPEgRNA骨格の折り畳みおよびこれに続くCas9-RT結合を妨害する)になるか、になる可能性が高い。結果的に、PEgRNAの鋳型への修飾が、遺伝子全体の挿入などの大きな挿入に影響を及ぼす必要もあり得る。そうするためのいくつかのストラテジーは、合成または半合成PEgRNA内の修飾ヌクレオチドの組み込み(RNAを、分解もしくは加水分解に対してより耐性があるようにさせるか、または阻害性の2次構造を採用する可能性を低くさせる)を包含する196。かかる修飾は、Gリッチ配列中のRNA2次構造を低減するであろう、8-アザ-7-デアザグアノシン;分解を低減してある種のRNA2次構造を増強する、ロックド核酸(LNA);RNA安定性を増強する、2'-O-メチル修飾、2'-フルオロ修飾、または2'-O-メトキシエトキシ修飾を包含し得る。かかる修飾はまた、安定性および活性を増強するために、PEgRNA中の他のどこかにも包含され得る。代わりに、または加えて、PEgRNAの鋳型は、所望のタンパク質産物をコードするのとともに、RTによって折り畳まれ得ない単純な2次構造を採用する可能性もまた高くなるように、デザインされ得る。かかる単純な構造は、熱力学的な流し台(sink)として作用するであろうが、これによって逆転写を防止するであろうより複雑な構造が生じる可能性が低くなる。最終的に、鋳型を分裂させて2つ別々のPEgRNAにすることもまたあり得ることである。かかるデザインにおいて、PEは、Cas9と融合したRNA結合タンパク質またはPEgRNA自身上のRNA認識要素(MS2アプタマーなど)を介して、転写を開始すること、また別々の鋳型RNAを標的にされた部位へ動員することにも使用されるであろう。RTは、この別々の鋳型RNAへ直接結合するか、または第2鋳型と入れ替える(swapping to)前に元のPEgRNA上で逆転写を開始するか、のいずれかであり得る。かかるアプローチは、長い鋳型を付加した際にPEgRNAの誤った折り畳みを予防することのみならず、長い挿入を生じさせるのにゲノムからのCas9の解離(おそらくPEベースの長い挿入を阻害している可能性がある)を要さないことによってもまた、長い挿入を可能にさせ得る。 In various other embodiments, PEgRNAs may be improved by introducing modifications to the editing template region. As the size of the PEgRNA-templated insert increases, it is degraded by endonucleases, undergoes spontaneous hydrolysis, or folds into secondary structures (which cannot be reverse transcribed by RT). , or interfere with PEgRNA backbone folding and subsequent Cas9-RT binding). Consequently, modifications to the PEgRNA template may also be necessary to affect large insertions, such as whole gene insertions. Some strategies to do so include the incorporation of modified nucleotides within synthetic or semi-synthetic PEgRNAs (making the RNA more resistant to degradation or hydrolysis or adopting inhibitory secondary structures). 196 . Such modifications will reduce RNA secondary structure in G-rich sequences, 8-aza-7-deazaguanosine; locked nucleic acids (LNA), which reduce degradation and enhance certain RNA secondary structures; 2'-O-methyl, 2'-fluoro, or 2'-O-methoxyethoxy modifications may be included that enhance RNA stability. Such modifications may also be included elsewhere in the PEgRNA to enhance stability and activity. Alternatively, or in addition, PEgRNA templates can be designed such that while encoding the desired protein product, they are also more likely to adopt simple secondary structures that cannot be folded by RT. Such a simple structure would act as a thermodynamic sink, but this reduces the likelihood of more complex structures that would prevent reverse transcription. Ultimately, it is also possible to split the template into two separate PEgRNAs. In such designs, PE can initiate transcription and recruit separate template RNAs to targeted sites via RNA binding proteins fused to Cas9 or RNA recognition elements on PEgRNA itself (such as the MS2 aptamer). It may also be used to The RT can either bind directly to this separate template RNA or initiate reverse transcription on the original PEgRNA before swapping to the second template. Such an approach not only prevents PEgRNA misfolding upon addition of long templates, but also prevents dissociation of Cas9 from the genome (possibly inhibiting PE-based long inserts) to generate long inserts. This may also allow long insertions.

更なる他の態様において、PEgRNAは、PEgRNAの5'およびは3'末端にて、それらの間の位置(例として、gRNAコア領域中もしくはスペーサー中)にてさえも、追加のRNAモチーフを導入することによって改善されることもある。数種のかかるモチーフ-KSHVからのPAN ENEおよびMALAT1からのENEなどを、非pol IIIプロモーターからのより長いPEgRNAの発現を終止させ得る手段として、上に考察した。これらの要素は、ポリAテールを飲み込むRNA三重ヘリックスを形成し、それらの核内への保持をもたらす184,187。しかしながら、末端ヌクレオチドを塞ぐ複合体構造をPEgRNAの3'末端にて形成することによって、これらの構造はまた、PEgRNAのエキソヌクレアーゼ媒介分解を予防するのにも役立つ可能性があろう。 In yet other embodiments, the PEgRNA introduces additional RNA motifs at the 5' and 3' ends of the PEgRNA, even at positions therebetween (e.g., in the gRNA core region or in the spacer). It may be improved by doing so. Several such motifs--such as PAN ENE from KSHV and ENE from MALAT1--were discussed above as means by which expression of longer PEgRNAs from non-pol III promoters could be terminated. These elements form an RNA triple helix that engulfs the polyA tails, resulting in their retention within the nucleus . However, by forming complex structures at the 3' end of PEgRNA that occlude the terminal nucleotides, these structures may also help prevent exonuclease-mediated degradation of PEgRNA.

3'末端にて挿入された他の構造要素もまた、非pol IIIプロモーターからの終止を可能にさせることはせずとも、RNA安定性を増強し得る。かかるモチーフは、3'末端を塞ぐであろうヘアピンもしくはRNA四重鎖197、または3'末端にて2'-3'-環状ホスファートの形成をもたらし、また潜在的にPEgRNAをエキソヌクレアーゼによって分解される可能性を低くもさせるHDVなどの自己切断型リボザイム198を包含し得る。不完全なスプライシングを介してPEgRNAを環化するのに誘導する-ciRNAを形成する-ことはまた、PEgRNA安定性を増大させてPEgRNAが核内に保持されることももたらし得る194 Other structural elements inserted at the 3' end may also enhance RNA stability without allowing termination from non-pol III promoters. Such motifs could include hairpins or RNA quadruplexes that would occlude the 3' end, 197 or self-cleaving ribozymes such as HDV that result in the formation of a 2'-3'-cyclic phosphate at the 3' end, potentially also making the PEgRNA less susceptible to exonuclease degradation.198 Inducing the PEgRNA to circularize through incomplete splicing - forming ciRNA - could also increase PEgRNA stability and result in the PEgRNA being retained in the nucleus.194

追加のRNAモチーフはまた、RT処理能力をも改善し得るか、またはDNA-RNA二重鎖へのRTの結合を増強することによってPEgRNA活性をも増強し得る。RTによって結合されるネイティブ配列の、その同族のレトロウイルスゲノム中での付加は、RT活性を増強し得る199。これは、レトロウイルスゲノム二量体化および転写開始に関与する、ネイティブプライマー結合部位(PBS)、ポリプリントラクト(PPT)、またはキッシングループを包含し得る199 Additional RNA motifs may also improve RT processing capacity or enhance PEgRNA activity by enhancing RT binding to DNA-RNA duplexes. Addition of native sequences bound by RT in its cognate retroviral genome can enhance RT activity 199 . This may include the native primer binding site (PBS), polypurine tract (PPT), or kissing loop, which are involved in retroviral genome dimerization and transcription initiation 199 .

二量体化チーフ-キッシングループまたはGNRAテトラループ/テトラループ受容体対200など-の、PEgRNAの5'末端および3'末端での付加はまた、PEgRNAの有効な環状化をももたらし得、安定性が改善される。加えて、これらモチーフの付加は、PEgRNAスペーサーとプライマーとの物理的な分離、PE活性の妨げになるであろうスペーサー閉塞への予防を可能にさせ得ることが想像される。スペーサー領域中もしくはプライマー結合部位に沿って小さいトウホールド(toehold)ヘアピンを形成する、PEgRNAへの短い5'伸長もしくは3'伸長はまた、好ましくは、PEgRNAの長さに沿って分子内相補領域のアニーリング(例として、スペーサーとプライマー結合部位との間に生じ得る相互作用)に対しても競合し得る。最終的に、キッシングループはまた、他の鋳型RNAをゲノム部位へ動員するのにも、あるRNAから他のRNAへのRT活性の入れ替えを可能にさせるのにも、使用され得る。様々な2次構造の例示の態様として、図3Dおよび図3Eに描かれるPEgRNAは、示されるとおり伸長アームの末端部分(すなわち、e1およびe2)にあるものを包含する、数多の2次RNA構造(改変されることで、PEgRNAのいずれの領域にもなり得る)を列挙する。 Addition of dimerizing chiefs - such as kissing loops or GNRA tetraloop/tetraloop receptor pair 200 - at the 5' and 3' ends of PEgRNA can also result in efficient circularization of PEgRNA, stabilizing it. sex is improved. In addition, it is envisioned that the addition of these motifs may allow for physical separation of the PEgRNA spacer and primer, preventing spacer occlusion that would impede PE activity. Short 5' or 3' extensions into the PEgRNA that form small toehold hairpins in the spacer region or along the primer binding site are also preferably included in intramolecular complementary regions along the length of the PEgRNA. Annealing (eg, the interaction that may occur between a spacer and a primer binding site) may also be competed for. Finally, kissing loops can also be used to recruit other template RNAs to genomic sites and to allow swapping of RT activity from one RNA to another. As an exemplary embodiment of the various secondary structures, the PEgRNA depicted in Figures 3D and 3E contains numerous secondary RNAs, including those in the terminal portions of the extended arms (i.e., e1 and e2) as shown. List the structures (which can be modified to become any region of PEgRNA).

改善例は、これらに限定されないが、以下を包含する: Examples of improvements include, but are not limited to:

PEgRNA-HDV融合体
GGCCCAGACTGAGCACGTGAGTTTTAGAGCTAGAAATAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGGACCGAGTCGGTCCTCTGCCATCAAAGCGTGCTCAGTCTGGGCCGGCATGGTCCCAGCCTCCTCGCTGGCGCCGGCTGGGCAACATGCTTCGGCATGGCGAATGGGACTTTTTTT(配列番号230)
PEgRNA-HDV fusion
GGCCCAGACTGAGCACGTGAGTTTTAGAGCTAGAAATAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGGACCGAGTCGGTCCTCTGCCATCAAAGCGTGCTCAGTCTGGGCCGGCATGGTCCCAGCCTCCTCGCTGGCGCCGGCTGGGCAACATGCTTCGGCATGGCGAATGGGACTTTTTTT (SEQ ID NO: 230)

PEgRNA-MMLVキッシングループ
GGTGGGAGACGTCCCACCGGCCCAGACTGAGCACGTGAGTTTTAGAGCTAGAAATAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGGACCGAGTCGGTCCTCTGCCATCAAAGCTTCGACCGTGCTCAGTCTGGTGGGAGACGTCCCACCTTTTTTT(配列番号231)
PEgRNA-MMLV kissing loop
GGTGGGAGACGTCCCACCGGCCCAGACTGAGCACGTGAGTTTTAGAGCTAGAAATAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGGACCGAGTCGGTCCTCTGCCATCAAAGCTTCGACCGTGCTCAGTCTGGTGGGAGACGTCCCACCTTTTTT (SEQ ID NO: 231)

PEgRNA-VSリボザイムキッシングループ
GAGCAGCATGGCGTCGCTGCTCACGGCCCAGACTGAGCACGTGAGTTTTAGAGCTAGAAATAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGGACCGAGTCGGTCCTCTGCCATCAAAGCTTCGACCGTGCTCAGTCTCCATCAGTTGACACCCTGAGGTTTTTTT(配列番号232)
PEgRNA-VS ribozyme kissing loop
GAGCAGCATGGCGTCGCTGCTCACGGCCCAGACTGAGCACGTGAGTTTTAGAGCTAGAAATAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGGACCGAGTCGGTCCTCTGCCATCAAAGCTTCGACCGTGCTCAGTCTCCATCAGTTGACACCCTGAGGTTTTTTT (SEQ ID NO: 232)

PEgRNA-GNRAテトラループ/テトラループ受容体
GCAGACCTAAGTGGUGACATATGGTCTGGGCCCAGACTGAGCACGTGAGTTTTAGAGCTAUACGTAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTUACGAAGTGGGACCGAGTCGGTCCTCTGCCATCAAAGCTTCGACCGTGCTCAGTCTGCATGCGATTAGAAATAATCGCATGTTTTTTT(配列番号233)
PEgRNA-GNRA tetraloop/tetraloop receptor
GCAGACCTAAGTGGUGACATATGGTCTGGGCCCAGACTGAGCACGTGAGTTTTAGAGCTAUACGTAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTUACGAAGTGGGACCGAGTCGGTCCTCTGCCATCAAAGCTTCGACCGTGCTCAGTCTGCATGCGATTAGAAATAATCGCATGTTTTTTT (SEQ ID NO: 233)

2次RNA-HDV融合体を切り替える(switching)PEgRNA鋳型
TCTGCCATCAAAGCTGCGACCGTGCTCAGTCTGGTGGGAGACGTCCCACCGGCCGGCATGGTCCCAGCCTCCTCGCTGGCGCCGGCTGGGCAACATGCTTCGGCATGGCGAATGGGACTTTTTTT(配列番号234)
PEgRNA templates for switching secondary RNA-HDV fusions
TCTGCCATCAAAGCTGCGACCGTGCTCAGTCTGGTGGGAGACGTCCCACCGGCCGGCATGGTCCCAGCCTCCTCGCTGGCGCCGGCTGGGCAACATGCTTCGGCATGGCGAATGGGACTTTTTTT (SEQ ID NO: 234)

PEgRNA骨格は、SpCas9およびプライム編集因子(PE)の改善のされ方に類似した様式で、指向進化を介してさらに改善され得る。指向進化は、Cas9または進化したCas9バリアントによるPEgRNA認識を増強し得る。加えて、種々のPEgRNA骨格配列はおそらく、種々のゲノム遺伝子座にて最適であって、問題になっている部位にてPE活性を増強するか、オフターゲット活性を低減するか、またはその両方のいずれかであろう。最終的に、他のRNAモチーフが付加されたPEgRNA骨格の進化は、未進化の融合RNAと比べて、融合されたPEgRNAの活性をほぼ必ず改善するであろう。実例として、c-ジ-GMP-Iアプタマーおよびハンマーヘッド型リボザイムから構成されるアロステリックリボザイムの進化は、劇的に改善された活性へ繋がったが202、これは進化がハンマーヘッド-PEgRNA融合体の活性も改善するであろうことを示唆する。加えて、Cas9は現行では一般的にsgRNAの5'伸長を忍容しないが、指向性進化は、蓋然的には、この非忍容性を和らげる有能な変異を生成し、追加のRNAモチーフが利用されることを許すであろう。 PEgRNA scaffolds can be further improved through directed evolution in a manner similar to how SpCas9 and prime editing elements (PEs) have been improved. Directed evolution can enhance PEgRNA recognition by Cas9 or evolved Cas9 variants. In addition, different PEgRNA backbone sequences are likely optimal at different genomic loci to enhance PE activity at the site in question, reduce off-target activity, or both. Probably either. Ultimately, evolution of the PEgRNA backbone with the addition of other RNA motifs will almost always improve the activity of the fused PEgRNA compared to the unevolved fusion RNA. As an illustration, the evolution of allosteric ribozymes composed of c-di-GMP-I aptamers and hammerhead ribozymes has led to dramatically improved activity202, but this is because evolution of hammerhead-PEgRNA fusions has led to dramatically improved activity. suggesting that activity would also be improved. In addition, although Cas9 currently does not generally tolerate 5' extensions of sgRNAs, directed evolution could conceivably generate potent mutations that alleviate this intolerance, creating additional RNA motifs. will be allowed to be used.

本開示は、ここで開示されるプライム編集システムの効力をさらに改善するためのいずれかのかかるやり方を企図する。 This disclosure contemplates any such approach to further improve the efficacy of the prime editing system disclosed herein.

連続した一連のTはPEgRNAが転写される容量を限定し得るので、種々の態様においては、伸長アームからのTの連続した配列の出現を限定することが有利であり得る。例えば、少なくとも3つの連続したT、少なくとも4つの連続したT、少なくとも5つの連続したT、少なくとも6つの連続したT、少なくとも7つの連続したT、少なくとも8つの連続したT、少なくとも9つの連続したT、少なくとも10の連続したT、少なくとも11の連続したT、少なくとも12の連続したT、少なくとも13の連続したT、少なくとも14の連続したT、または少なくとも15の連続したTのストリングは、PEgRNAをデザインするときに回避されるべきであるか、または少なくとも最終的なデザインされた配列からは除去されるべきである。1つの態様では、連続したA:T核酸塩基対がリッチである標的部位を回避する以外に、PEgRNA伸長アーム上の連続したTの欲されないストリングの包含を回避し得る。 In various embodiments, it may be advantageous to limit the appearance of a contiguous sequence of T's from an extended arm, as a contiguous series of T's can limit the capacity for PEgRNA to be transcribed. For example, at least 3 consecutive T's, at least 4 consecutive T's, at least 5 consecutive T's, at least 6 consecutive T's, at least 7 consecutive T's, at least 8 consecutive T's, at least 9 consecutive T's , a string of at least 10 consecutive Ts, at least 11 consecutive Ts, at least 12 consecutive Ts, at least 13 consecutive Ts, at least 14 consecutive Ts, or at least 15 consecutive Ts, design PEgRNA. or at least be removed from the final designed sequence. In one embodiment, in addition to avoiding target sites that are rich in consecutive A:T nucleobase pairs, the inclusion of undesired strings of consecutive T's on the PEgRNA extended arms may be avoided.

トランスプライム編集のための分裂PEgRNAデザイン
本開示はトランスプライム編集をもまた企図する。これは、PEgRNAを2つの別物の分子:ガイドRNAおよびtPERT分子へと分離することによって作動するプライム編集の改変されたバージョンを言う。tPERT分子は、標的DNA部位においてプライム編集因子複合体と共局在するようにプログラムされ、プライマー結合部位およびDNA合成鋳型をプライム編集因子にトランスで持って来る。例えば、トランスプライム編集因子(tPE)の態様については図3Gを見よ。これは、(1)動員タンパク質(RP)-PE:gRNA複合体と(2)RNA-タンパク質動員ドメイン(例えば、ステムループまたはヘアピン)に連結されたプライマー結合部位およびDNA合成鋳型を包含するtPERTとを含む2構成要素システムを示す。RP-PE:gRNA複合体の動員タンパク質構成要素は編集されるべき標的部位へとtPERTを動員し、それによって、PBSおよびDNA合成鋳型をプライム編集因子とトランスで会合させる。別の言い方をすると、tPERTは、プライマー結合部位およびDNA合成鋳型を包含するPEgRNAの伸長アーム(の全てまたは一部)を含有するように操作される。このアプローチの1つの利点はPEgRNAの伸長アームをガイドRNAから分離することであり、それによって、伸長アームのPBSとガイドRNAのスペーサー配列との間に生起する傾向があるアニーリング相互作用を最小化する。
Split PEgRNA Design for Transprime Editing This disclosure also contemplates transprime editing. This refers to a modified version of prime editing that operates by separating PEgRNA into two separate molecules: the guide RNA and the tPERT molecule. The tPERT molecule is programmed to colocalize with the prime editor complex at the target DNA site, bringing the primer binding site and DNA synthesis template in trans to the prime editor. For example, see Figure 3G for an embodiment of transprime editing element (tPE). It consists of tPERT, which contains (1) a recruitment protein (RP)-PE:gRNA complex and (2) a primer binding site and a DNA synthesis template linked to an RNA-protein recruitment domain (e.g., a stem-loop or hairpin). A two-component system containing: The recruitment protein component of the RP-PE:gRNA complex recruits tPERT to the target site to be edited, thereby associating PBS and DNA synthesis template in trans with the prime editing factor. Stated differently, tPERT is engineered to contain (all or part of) an extended arm of PEgRNA that includes a primer binding site and a DNA synthesis template. One advantage of this approach is that it separates the extended arm of the PEgRNA from the guide RNA, thereby minimizing annealing interactions that tend to occur between the PBS of the extended arm and the spacer sequence of the guide RNA. .

トランスプライム編集の鍵の特色は、トランスプライム編集因子がtPERTをDNA編集の部位へと動員する能力であり、それによってプライム編集の部位においてPEgRNAの機能の全てを有効に共局在させる。動員は、MS2アプタマーなどのRNA-タンパク質動員ドメインをtPERTに組み入れることと、対応する動員タンパク質をRNA-タンパク質動員ドメインに特異的に結合することができるプライム編集因子に(例えば、リンカーを介してnapDNAbpに、またはリンカーリンカーを介してポリメラーゼに)融合することとによって達成され得、それによってtPERT分子をプライム編集因子複合体へと動員する。図3Hに記載されているプロセスに図示されているとおり、RP-PE:gRNA複合体は標的DNA配列に結合およびニッキングする。それから、動員タンパク質(RP)は、DNA標的部位に結合したプライム編集因子複合体に共局在するようにtPERTを動員し、それによって、tPERT上に位置付けられたプライマー結合部位がニッキングされた鎖上のプライマー配列に結合することを許し、爾後に、ポリメラーゼ(例えばRT)がtPERTの5'端からtPERT上に位置付けられたDNA合成鋳型に対してDNAの一本鎖を合成することを許す。 A key feature of transprime editing is the ability of transprime editing factors to recruit tPERT to the site of DNA editing, thereby effectively colocalizing all of the PEgRNA functions at the site of prime editing. Recruitment involves incorporating an RNA-protein recruitment domain, such as the MS2 aptamer, into tPERT and the corresponding recruitment protein to a prime editing factor that can specifically bind to the RNA-protein recruitment domain (e.g., napDNAbp via a linker). or via a linker to a polymerase), thereby recruiting the tPERT molecule to the prime editor complex. The RP-PE:gRNA complex binds and nicks the target DNA sequence, as illustrated in the process described in Figure 3H. The recruitment protein (RP) then recruits tPERT to co-localize with the prime editing factor complex bound to the DNA target site, thereby causing the primer binding site located on tPERT to become on the nicked strand. and then allow a polymerase (eg, RT) to synthesize a single strand of DNA from the 5' end of tPERT to a DNA synthesis template positioned on tPERT.

tPERTは図3Gおよび図3HにおいてはPBSおよびDNA合成鋳型をRNA-タンパク質動員ドメインの5'端に含むとして示されているが、他の構成のtPERTは、RNA-タンパク質動員ドメインの3'端に位置付けられたPBSおよびDNA合成鋳型を有してデザインされ得る。しかしながら、5’伸長を有するtPERTは、DNAの一本鎖の合成が天然にはtPERTの5'端において終結するであろうという利点を有し、それゆえに、プライム編集のDNA合成ステージの間の鋳型としてRNA-タンパク質動員ドメインのいずれかの部分を用いるリスクがない。 Although tPERT is shown in Figures 3G and 3H as containing PBS and the DNA synthesis template at the 5' end of the RNA-protein recruitment domain, other configurations of tPERT include PBS and DNA synthesis template at the 3' end of the RNA-protein recruitment domain. can be designed with positioned PBS and DNA synthesis templates. However, tPERT with a 5' extension has the advantage that the synthesis of a single strand of DNA would naturally terminate at the 5' end of tPERT, and therefore during the DNA synthesis stage of prime editing. There is no risk of using any part of the RNA-protein recruitment domain as a template.

PEgRNAデザイン方法
本開示はPEgRNAをデザインするための方法にもまた関する。
PEgRNA Design Methods The present disclosure also relates to methods for designing PEgRNA.

デザインの一側面において、デザインアプローチは、プライム編集が用いられようとする具体的な適用を考慮に入れ得る。例えば、本願において例示され論じられるとおり、プライム編集は、限定なしに、(a)変異を修正する変化をヌクレオチド配列に組み入れ、(b)タンパク質およびRNAタグを組み入れ、(c)免疫エピトープを目当てのタンパク質に組み入れ、(d)誘導可能な二量体化ドメインをタンパク質に組み入れ、(e)バイオ分子のその活性を変改するために配列を組み入れまたは除去、(f)特定の遺伝子変化を導くためにリコンビナーゼ標的部位を組み入れ、および(g)エラーを起こしやすいRTを用いることによる標的配列の変異導入をするために用いられ得る。目当ての標的部位におけるヌクレオチド配列を一般的に挿入、変化、または欠失させるこれらの方法に加えて、プライム編集因子は、高度にプログラム可能なライブラリを構築するために、ならびに細胞データ記録および系統トレース研究を行うためにもまた用いられ得る。これらの種々の使用では、本明細書に記載のとおり、これらの適用のいずれかの所与のものにとって特に有用であるPEgRNAの調製に当てはまる具体的なデザイン側面があり得る。 In one aspect of the design, the design approach may take into account the specific application for which prime editing is to be used. For example, as illustrated and discussed herein, prime editing can be used, without limitation, to (a) incorporate changes in a nucleotide sequence that correct mutations, (b) incorporate protein and RNA tags, and (c) target immune epitopes. (d) incorporating an inducible dimerization domain into the protein; (e) incorporating or removing sequences to alter the activity of the biomolecule; (f) directing specific genetic changes. and (g) mutagenesis of the target sequence by using error-prone RT. In addition to these methods of generally inserting, changing, or deleting nucleotide sequences at the target site of interest, prime editing factors can be used to construct highly programmable libraries, as well as for cell data recording and lineage tracing. It can also be used to conduct research. For these various uses, as described herein, there may be specific design aspects that apply to the preparation of PEgRNA that are particularly useful for any given one of these applications.

プライム編集のいずれかの具体的な適用または使用のためのPEgRNAをデザインするときには、いくつもの考慮事項が考慮に入れられ得る。これらは:
(a)1つ以上の核酸塩基改変がプライム編集因子によって組み入れされることを望まれる標的配列、すなわちヌクレオチド配列;
(b)標的配列上のカットされる部位の位置付け、すなわち、プライム編集因子が一本鎖ニックを誘導して、ニックの1つの側に3'端RTプライマー配列およびニックの他の側に5'端の内生フラップ(これは究極的にはFEN1またはその等価物によって除去され、3'ssDNAフラップによって置き換えられる)を生出するであろう特定の核酸塩基位置。カットされる部位は「編集の位置付け」に類縁である。なぜなら、これは3'端RTプライマー配列を生出し、これはRNA依存的なDNA重合の間にRTによって伸長されるようになって、所望の編集を含有する3'ssDNAフラップを生出し、これがそれから標的配列上の5'内生DNAフラップを置き換えるからである;
(c)利用可能なPAM配列(標準的なSpCas9 PAM部位、および拡張されたまたは異なるPAM特異性を有するCas9バリアントおよび等価物によって認識される非標準的なPAM部位を包含する);
(d)標的配列上の利用可能なPAM配列とカットされる部位の位置付けとの間の間隔;
(e)用いられようとするプライム編集因子の具体的なCas9、Cas9バリアント、またはCas9等価物;
(f)プライマー結合部位の配列および長さ;
(g)編集鋳型の配列および長さ;
(h)相同アームの配列および長さ;
(i)スペーサー配列および長さ;ならびに
(j)コア配列、
を包含するが、これらに限定されない。
A number of considerations can be taken into account when designing a PEgRNA for any particular application or use of prime editing. These are:
(a) a target sequence, i.e., a nucleotide sequence, into which one or more nucleobase modifications are desired to be incorporated by a primed editor;
(b) Positioning of the cut site on the target sequence, i.e., the specific nucleobase position where the primed editor will induce a single-stranded nick to generate a 3'-end RT primer sequence on one side of the nick and a 5'-end endogenous flap on the other side of the nick (which is ultimately removed by FEN1 or its equivalent and replaced by a 3'-ssDNA flap). The cut site is analogous to "positioning of the edit" because it generates a 3'-end RT primer sequence that becomes extended by RT during RNA-dependent DNA polymerization to generate a 3'-ssDNA flap containing the desired edit, which then replaces the 5'-endogenous DNA flap on the target sequence;
(c) available PAM sequences (encompassing canonical SpCas9 PAM sites, as well as non-canonical PAM sites recognized by Cas9 variants and equivalents with extended or different PAM specificities);
(d) the spacing between available PAM sequences on the target sequence and the positioning of the site to be cut;
(e) the specific Cas9, Cas9 variant, or Cas9 equivalent of the prime editing element to be used;
(f) the sequence and length of the primer binding site;
(g) the sequence and length of the editing template;
(h) sequence and length of the homology arms;
(i) spacer sequence and length; and
(j) a core sequence;
These include, but are not limited to:

本開示は上のこれらの側面を論ずる。 This disclosure addresses these aspects above.

1つの態様では、好適なPEgRNAと任意に第2部位ニッキングのためのニッキングsgRNAデザインガイドとをデザインするアプローチが、ここに提供される。この態様は、プライム編集のためのPEgRNAおよびニッキングsgRNAをデザインするための説明書のステップバイステップのセットを提供し、これは上の考慮事項の1つ以上を考慮に入れる。ステップは図70A-70Iに示されている例を参照する。
1.標的配列および編集を定める。所望の編集(点変異、挿入、欠失、またはそれらの組み合わせ)の位置付けを中心とした標的DNA領域(~200bp)の配列をリトリーブする。図70Aを見よ。
2.標的PAMを位置付ける。所望の編集位置付けに対して近位のPAMを同定する。PAMは所望の編集位置付けに対して近位のDNAのどちらかの鎖上に同定され得る。編集位置に近接するPAMが好ましいが(すなわち、ニック部位は編集位置から30nt未満である。または編集位置からニック部位まで29nt、28nt、27nt、26nt、25nt、24nt、23nt、22nt、21nt、20nt、19nt、18nt、17nt、16nt、15nt、14nt、13nt、12nt、11nt、10nt、9nt、8nt、7nt、6nt、5nt、4nt、3nt、もしくは2nt未満)、編集位置から≧30ntのニックを置くプロトスペーサーおよびPAMを用いて編集を組み入れることが可能である。図70Bを見よ。
3.ニック部位を位置付ける。考慮されている各PAMについて、対応するニック部位とどの鎖上かとを同定する。Sp Cas9 H840Aニッカーゼでは、切断はNGG PAMの5'の第3および第4の塩基の間においてPAM含有鎖に生起する。全ての編集されるヌクレオチドはニック部位の3'に存在しなければならない。そのため、適当なPAMはPAM含有鎖上の標的の編集の5'にニックを置かなければならない。下で示される例では、2つの可能なPAMがある。単純のために、残りのステップはPAM 1のみを用いるPEgRNAのデザインを実証する。図70Cを見よ。
4.スペーサー配列をデザインする。Sp Cas9のプロトスペーサーはPAM含有鎖上のNGG PAMの5'の20ヌクレオチドに対応する。効率的なPol III転写開始はGが最初に転写されるヌクレオチドであることを要求する。プロトスペーサーの最初のヌクレオチドがGである場合には、PEgRNAのスペーサー配列は単純にプロトスペーサー配列である。プロトスペーサーの最初のヌクレオチドがGではない場合には、PEgRNAのスペーサー配列は、G、次にプロトスペーサー配列である。図70Dを見よ。
5.プライマー結合部位(PBS)をデザインする。出発アレル配列を用いて、PAM含有鎖上のDNAプライマーを同定する。DNAプライマーの3'端はニック部位のちょうど上流のヌクレオチドである(すなわち、Sp Cas9ではNGG PAMの5'の第4の塩基)。PE2およびPE3への使用のための一般的なデザイン原理として、DNAプライマーに対する12から13ヌクレオチドの相補性を含有するPEgRNAプライマー結合部位(PBS)が、~40-60%GC含量を含有する配列に用いられ得る。低いGC含量を有する配列では、より長い(14から15nt)PBSが試験されるべきである。より高いGC含量を有する配列では、より短い(8から11nt)PBSが試験されるべきである。GC含量にかかわらず、最適なPBS配列は経験的に決定されるはずである。長さpのPBS配列をデザインするためには、出発アレル配列を用いて、PAM含有鎖上のニック部位の5'の最初のpヌクレオチドの逆相補体を取る。図70Eを見よ。
6.RT鋳型(またはDNA合成鋳型)をデザインする。RT鋳型(または、ポリメラーゼが逆転写酵素ではないところでは、DNA合成鋳型)は、デザインされた編集と編集に隣接する配列に対する相同性とをコードする。1つの態様では、これらの領域は図3Dおよび図3EのDNA合成鋳型に対応し、DNA合成鋳型は「編集鋳型」および「相同アーム」を含む。最適なRT鋳型長さは標的部位に基づいて変わる。ショートレンジ編集(位置+1から+6)では、短い(9から12nt)、中程度の(13から16nt)、および長い(17から20nt)RT鋳型を試験することが推奨される。ロングレンジ編集(位置+7以降)では、十分な3'DNAフラップ相同性を許すように、編集の位置から少なくとも5nt(好ましくは10nt以上)伸長するRT鋳型を用いることが推奨される。ロングレンジ編集では、機能的なデザインを同定するために、いくつかのRT鋳型がスクリーニングされるべきである。より大きい挿入および欠失(≧5nt)では、RT鋳型上へのより多大な3'相同性(~20nt以上)の組み込みが推奨される。RT鋳型が、逆転写されるDNA産物上の最後のヌクレオチドとしてのG(PEgRNAのRT鋳型上のCに対応する)の合成をコードするときには、編集効率は典型的には損なわれる。多くのRT鋳型が効率的なプライム編集を支持するので、RT鋳型をデザインするときには、最後の合成されるヌクレオチドとしてのGの回避が推奨される。長さrのRT鋳型配列をデザインするためには、所望のアレル配列を用い、PAMを元々含有した鎖上のニック部位の3'の最初のrヌクレオチドの逆相補体を取る。SNP編集と比較して、同じ長さのRT鋳型を用いる挿入または欠失編集は同一の相同性を含有しないであろうということに注意せよ。図70Fを見よ。
7.完全なPEgRNA配列をアセンブリする。PEgRNA構成要素を次の順序(5'から3')でコンカテネーションする:スペーサー、骨格、RT鋳型、およびPBS。図70Gを見よ。
8.PE3のためのニッキングsgRNAをデザインする。編集の上流および下流の非編集鎖上のPAMを同定する。最適なニッキング位置は高度に座位依存的であり、経験的に決定されるはずである。一般的に、PEgRNAによって誘導されるニックの向かいの位置の40から90ヌクレオチド5'に置かれたニックは、より高い編集収量およびより少数のインデルに至る。ニッキングsgRNAは、出発アレル上の20ntプロトスペーサーにマッチするスペーサー配列を有する。プロトスペーサーがGで始まらない場合には5'Gの追加を有する。図70Hを見よ。
9.PE3bニッキングsgRNAをデザインする。PAMが相補鎖に存在し、その対応するプロトスペーサーが編集のために標的化される配列とオーバーラップする場合には、この編集はPE3bシステムの候補であり得る。PE3bシステムでは、ニッキングsgRNAのスペーサー配列は出発アレルではなく所望の編集されたアレルの配列にマッチする。編集されるヌクレオチド(単数または複数)がニッキングsgRNAプロトスペーサーのシード領域(PAMに隣接する~10nt)内に収まるときには、PE3bシステムは効率的に作動する。これは、編集された鎖の組み入れ後まで相補鎖のニッキングを防止し、標的DNAに結合することについてのPEgRNAおよびsgRNAの間の競合を防止する。PE3bは、両方の鎖上の同時のニックの生成をもまた回避し、それゆえに、高い編集効率を維持しながらインデル形成を有意に縮減する。PE3b sgRNAは、所望のアレルの20ntプロトスペーサーにマッチするスペーサー配列を有するはずである。必要とされる場合には5'Gの追加を有する。図70Iを見よ。
In one embodiment, an approach is provided herein to design suitable PEgRNAs and optionally a nicking sgRNA design guide for second site nicking. This embodiment provides a step-by-step set of instructions for designing PEgRNAs and nicking sgRNAs for prime editing, which takes into account one or more of the above considerations. The steps refer to the example shown in Figures 70A-70I.
1. Define target sequence and edits. Retrieve the sequence of the target DNA region (~200 bp) centered around the location of the desired edit (point mutation, insertion, deletion, or combination thereof). See Figure 70A.
2. Position the target PAM. Identify the PAM proximal to the desired editing location. PAMs can be identified on either strand of DNA proximal to the desired editing location. PAMs that are close to the edit position are preferred (i.e., the nick site is less than 30 nt from the edit position; or 29 nt, 28 nt, 27 nt, 26 nt, 25 nt, 24 nt, 23 nt, 22 nt, 21 nt, 20 nt, Protospacer that places a nick ≧30nt from the editing position And it is possible to incorporate editing using PAM. See Figure 70B.
3. Position the nick site. For each PAM considered, identify the corresponding nick site and on which strand. For the Sp Cas9 H840A nickase, cleavage occurs on the PAM-containing strand between the 5' third and fourth bases of the NGG PAM. All edited nucleotides must be 3' to the nick site. Therefore, a suitable PAM must be nicked 5' of the target edit on the PAM-containing strand. In the example shown below, there are two possible PAMs. For simplicity, the remaining steps demonstrate the design of PEgRNA using PAM 1 only. See Figure 70C.
Four. Design the spacer array. The protospacer of Sp Cas9 corresponds to the 5' 20 nucleotides of NGG PAM on the PAM-containing strand. Efficient Pol III transcription initiation requires G to be the first nucleotide transcribed. If the first nucleotide of the protospacer is G, the spacer sequence of PEgRNA is simply a protospacer sequence. If the first nucleotide of the protospacer is not a G, the spacer sequence of the PEgRNA is G followed by the protospacer sequence. See Figure 70D.
Five. Design the primer binding site (PBS). The starting allele sequence is used to identify DNA primers on the PAM-containing strand. The 3' end of the DNA primer is the nucleotide just upstream of the nick site (ie, the 4th base 5' of the NGG PAM for Sp Cas9). As a general design principle for use with PE2 and PE3, a PEgRNA primer binding site (PBS) containing 12 to 13 nucleotides of complementarity to the DNA primer is combined with a sequence containing ~40-60% GC content. can be used. For sequences with low GC content, longer (14 to 15 nt) PBSs should be tested. For sequences with higher GC content, shorter (8 to 11 nt) PBSs should be tested. Regardless of GC content, the optimal PBS sequence should be determined empirically. To design a PBS sequence of length p, the starting allele sequence is used to take the reverse complement of the first p nucleotides 5' of the nick site on the PAM-containing strand. See Figure 70E.
6. Design the RT template (or DNA synthesis template). The RT template (or DNA synthesis template where the polymerase is not a reverse transcriptase) encodes the designed edit and homology to the sequences flanking the edit. In one embodiment, these regions correspond to the DNA synthesis template of Figures 3D and 3E, where the DNA synthesis template includes an "editing template" and a "homologous arm." Optimal RT template length will vary based on the target site. For short range editing (positions +1 to +6), it is recommended to test short (9 to 12 nt), medium (13 to 16 nt), and long (17 to 20 nt) RT templates. For long range editing (position +7 and beyond), it is recommended to use RT templates that extend at least 5 nt (preferably 10 nt or more) from the editing position to allow sufficient 3' DNA flap homology. For long range editing, several RT templates should be screened to identify functional designs. For larger insertions and deletions (≧5nt), incorporation of more 3' homology (~20nt or more) onto the RT template is recommended. Editing efficiency is typically compromised when the RT template encodes the synthesis of a G (corresponding to C on the RT template of PEgRNA) as the last nucleotide on the reverse transcribed DNA product. Avoiding G as the last synthesized nucleotide is recommended when designing RT templates, as many RT templates support efficient prime editing. To design an RT template sequence of length r, use the desired allele sequence and take the reverse complement of the first r nucleotides 3' of the nick site on the strand that originally contained the PAM. Note that compared to SNP editing, insertion or deletion editing using RT templates of the same length will not contain the same homology. See Figure 70F.
7. Assemble the complete PEgRNA sequence. Concatenate the PEgRNA components in the following order (5' to 3'): spacer, backbone, RT template, and PBS. See Figure 70G.
8. Design a nicking sgRNA for PE3. Identify PAMs on the unedited strands upstream and downstream of the edit. The optimal nicking position is highly locus dependent and should be determined empirically. Generally, nicks placed 40 to 90 nucleotides 5' across from the nick induced by PEgRNA lead to higher editing yields and fewer indels. The nicking sgRNA has a spacer sequence that matches the 20nt protospacer on the starting allele. If the protospacer does not begin with a G, it has an addition of 5'G. See Figure 70H.
9. Design PE3b nicking sgRNA. If the PAM is present on the complementary strand and its corresponding protospacer overlaps the sequence targeted for editing, this editing may be a candidate for the PE3b system. In the PE3b system, the spacer sequence of the nicking sgRNA matches the sequence of the desired edited allele rather than the starting allele. The PE3b system operates efficiently when the edited nucleotide(s) falls within the seed region of the nicking sgRNA protospacer (~10 nt adjacent to the PAM). This prevents nicking of the complementary strand until after incorporation of the edited strand and prevents competition between PEgRNA and sgRNA for binding to target DNA. PE3b also avoids simultaneous nick generation on both strands, thus significantly reducing indel formation while maintaining high editing efficiency. The PE3b sgRNA should have a spacer sequence that matches the 20nt protospacer of the desired allele. With addition of 5'G if required. See Figure 70I.

好適なPEgRNAおよび第2部位ニッキングsgRNAをデザインするための上のステップバイステップのプロセスは、決して限定することを意味されない。本開示は上に記載されているステップバイステップのプロセスのバリエーションを企図し、これらは当業者によってそれから導出可能であろう。 The above step-by-step process for designing suitable PEgRNAs and second-site nicking sgRNAs is not meant to be limiting in any way. This disclosure contemplates variations on the step-by-step process described above, which may be derived therefrom by those skilled in the art.

[7]プライム編集を利用する適用
標的化された挿入、欠失、および全ての12の可能な塩基から塩基の変換をヒト細胞の標的座位において二本鎖DNA切断またはドナーDNA鋳型を要求することなしに媒介する新たな「検索置換」ゲノム編集テクノロジーとしての本明細書に記載のプライム編集システムの開発に加えて、本発明者は、特定の適用の広いアレイへのプライム編集因子の使用をもまた企図した。例えば、本願において例示され論じられるとおり、プライム編集は、(a)変異を修正する変化をヌクレオチド配列に組み入れ、(b)タンパク質およびRNAタグを組み入れ、(c)免疫エピトープを目当てのタンパク質に組み入れ、(d)誘導可能な二量体化ドメインをタンパク質に組み入れ、(e)バイオ分子のその活性を変改するために配列を組み入れまたは除去、(f)特定の遺伝子変化を導くためにリコンビナーゼ標的部位を組み入れ、および(g)エラーを起こしやすいRTを用いることによる標的配列の変異導入をするために用いられ得る。目当ての標的部位におけるヌクレオチド配列を一般的に挿入、変化、または欠失させるこれらの方法に加えて、プライム編集因子は、高度にプログラム可能なライブラリを構築するために、ならびに細胞データ記録および系統トレース研究を行うためにもまた用いられ得る。本発明者は、プライム編集の効力を改善することを狙うPEgRNAの追加のデザイン特色をもまた企図した。なお、さらに、本発明者は、インテインドメインを用いてnapDNAbpを分裂することが関わる、ベクター送達システムを用いてプライム編集因子を首尾良く送達するための方法の着想を得た。
[7] Applying targeted insertions, deletions, and base conversions that utilize prime editing to require double-stranded DNA breaks or donor DNA templates at the target locus in human cells In addition to the development of the prime editing system described herein as a new "search-and-replace" genome editing technology mediated by I planned it again. For example, as illustrated and discussed herein, prime editing involves (a) incorporating changes to the nucleotide sequence that correct for mutations, (b) incorporating protein and RNA tags, (c) incorporating immune epitopes into the protein of interest, (d) incorporating inducible dimerization domains into proteins; (e) incorporating or removing sequences to alter the activity of the biomolecule; (f) recombinase target sites to direct specific genetic changes. and (g) mutagenesis of a target sequence by using error-prone RT. In addition to these methods of generally inserting, changing, or deleting nucleotide sequences at the target site of interest, prime editing factors can be used to construct highly programmable libraries, as well as for cell data recording and lineage tracing. It can also be used to conduct research. The inventors also contemplated additional design features of PEgRNA aimed at improving the efficacy of prime editing. Still further, the inventors have conceived a method for successfully delivering prime editing factors using a vector delivery system that involves splitting napDNAbp using an intein domain.

プライム編集のこれらの特定の例示の使用は決して限定することを意図されない。本願は、ヌクレオチド配列、例えばゲノムDNA上の標的部位における1つ以上の核酸塩基の組み入れ、除去、および/または改変の何らかの形態が一般的に関わるプライム編集のいずれかの使用を企図する。 These particular exemplary uses of prime editing are not intended to be limiting in any way. This application contemplates any use of prime editing, which generally involves some form of incorporation, removal, and/or modification of one or more nucleobases at a target site on a nucleotide sequence, such as genomic DNA.

プライム編集の例示されている使用のいずれかについて、PE1、PE2、PE3、およびPE3b、またはPE-shortを包含する本明細書に開示のいずれかのプライム編集因子を用い得る。 For any of the illustrated uses of prime editing, any of the prime editing factors disclosed herein may be used, including PE1, PE2, PE3, and PE3b, or PE-short.

A.プライム編集機序
種々の態様において、プライム編集(または「プライム編集」)は、標的DNA分子(これに、ヌクレオチド配列の変化が導入されることが望まれる)を、伸長されたガイドRNAと複合体化した核酸プログラム型DNA結合タンパク質(napDNAbp)と接触させることによって作動する。図1Gを参照すると、伸長されたガイドRNAは、ガイドRNAの3'もしくは5'端にまたはガイドRNAの分子内の位置付けに伸長を含み、所望のヌクレオチド変化(例えば、1ヌクレオチド変化、挿入、または欠失)をコードする。ステップ(a)では、napDNAbp/伸長されたgRNA複合体がDNA分子に接触し、伸長されたgRNAがnapDNAbpをガイドして標的座位に結合させる。ステップ(b)では、ニックが標的座位のDNAの鎖の1つに導入され(例えば、ヌクレアーゼまたは化学的薬剤による)、それによって利用可能な3'端を標的座位の鎖の1つに生出する。ある態様において、ニックは、Rループ鎖に対応するDNAの鎖、すなわちガイドRNA配列にハイブリダイズされない鎖、すなわち「非標的鎖」上に生出される。しかしながら、ニックは鎖のどちらかに導入され得る。つまり、ニックは、Rループ「標的鎖」(すなわち、伸長されたgRNAのプロトスペーサー配列にハイブリダイズされる鎖)または「非標的鎖」(すなわち、Rループの一本鎖部分を形成し、標的鎖に対して相補的である鎖)上に導入され得る。ステップ(c)では、DNA鎖の3'端(ニックによって形成される)は、逆転写をプライムするためにガイドRNAの伸長された部分と相互作用する(すなわち「プライム標的にプライムされたRT」)。ある態様において、3'端DNA鎖は、ガイドRNAの伸長された部分の特定のRTプライム配列、すなわち「逆転写酵素プライム配列」にハイブリダイズする。ステップ(d)では、逆転写酵素が導入され(napDNAbpとの融合タンパク質としてまたはトランスで)、これが、プライムされた部位の3'端から伸長されたガイドRNAの5'端の方へDNAの一本鎖を合成する。これは、ニック部位におけるまたはそれに隣接する内生DNAに対してさもなければ相同的である、所望のヌクレオチド変化(例えば、1塩基変化、挿入、もしくは欠失、またはそれらの組み合わせ)を含む一本鎖DNAフラップを形成する。ステップ(e)では、napDNAbpおよびガイドRNAがリリースされる。ステップ(f)および(g)は一本鎖DNAフラップの分解に関し、その結果、所望のヌクレオチド変化が標的座位に組み込まれるようになる。このプロセスは、ひとたび3'一本鎖DNAフラップが内生DNA配列に侵入およびハイブリダイズすると形成する対応する5'内生DNAフラップを除去することによって、所望の産物形成の方へ駆動され得る(例えば、トランスで、プライム編集因子との融合体として提供、または内生で提供されるFEN1または類似の酵素による)。理論によって拘束されることなしに、細胞の内生DNA修復および複製プロセスは、ミスマッチのDNAを分解してヌクレオチド変化(単数または複数)を組み込んで、所望の変改された産物を形成する。プロセスは、図1Gにおいて例示されるとおり「第2鎖ニッキング」または図1Iにおいて例示され本願において論じられるとおり「時間的(termporal)第2鎖ニッキング」によってもまた、産物形成の方へ駆動され得る。
A. Prime editing mechanism
In various embodiments, prime editing (or "prime editing") is a nucleic acid program that complexes a target DNA molecule (into which it is desired to introduce a nucleotide sequence change) with an elongated guide RNA. It operates by contacting the type DNA binding protein (napDNAbp). Referring to Figure 1G, the elongated guide RNA includes an extension at the 3' or 5' end of the guide RNA or at an intramolecular position of the guide RNA and includes a desired nucleotide change (e.g., a single nucleotide change, an insertion, or (deletion). In step (a), the napDNAbp/elongated gRNA complex contacts the DNA molecule, and the elongated gRNA guides the napDNAbp to bind to the target locus. In step (b), a nick is introduced (e.g., by a nuclease or chemical agent) into one of the strands of the DNA at the target locus, thereby creating an available 3' end on one of the strands at the target locus. . In certain embodiments, the nick is created on the strand of DNA that corresponds to the R-loop strand, ie, the strand that is not hybridized to the guide RNA sequence, ie, the "non-target strand." However, nicks can be introduced into either of the strands. That is, the nick forms either the R-loop "target strand" (i.e., the strand that hybridizes to the protospacer sequence of the elongated gRNA) or the "non-target strand" (i.e., the single-stranded portion of the R-loop and the target strand (which is complementary to the strand). In step (c), the 3' end of the DNA strand (formed by the nick) interacts with the extended portion of the guide RNA to prime reverse transcription (i.e. "primed RT to prime target"). ). In certain embodiments, the 3' end DNA strand hybridizes to a specific RT prime sequence of the extended portion of the guide RNA, ie, a "reverse transcriptase prime sequence." In step (d), reverse transcriptase is introduced (either as a fusion protein with napDNAbp or in trans), which instructs the DNA from the 3' end of the primed site towards the 5' end of the extended guide RNA. Synthesize the main chain. This is a single strand containing the desired nucleotide changes (e.g., single base changes, insertions, or deletions, or combinations thereof) that is otherwise homologous to the endogenous DNA at or adjacent to the nick site. Strands form DNA flaps. In step (e) napDNAbp and guide RNA are released. Steps (f) and (g) involve disassembly of the single-stranded DNA flap so that the desired nucleotide change is incorporated at the target locus. This process can be driven towards the desired product formation by removing the corresponding 5' endogenous DNA flap that forms once the 3' single-stranded DNA flap invades and hybridizes to the endogenous DNA sequence ( For example, by FEN1 or a similar enzyme provided in trans, as a fusion with a prime editing factor, or endogenously). Without being bound by theory, the cell's endogenous DNA repair and replication processes degrade mismatched DNA and incorporate nucleotide change(s) to form the desired modified product. The process can also be driven towards product formation by "second strand nicking" as illustrated in FIG. 1G or "temporal second strand nicking" as illustrated in FIG. 1I and discussed herein. .

プライム編集のプロセスは次の遺伝子変化の少なくとも1つ以上を導入し得る:トランスバージョン、トランジション、欠失、および挿入。加えて、プライム編集は特定の適用のために実装され得る。例えば、本願において例示され論じられるとおり、プライム編集は、(a)変異を修正する変化をヌクレオチド配列に組み入れ、(b)タンパク質およびRNAタグを組み入れ、(c)免疫エピトープを目当てのタンパク質に組み入れ、(d)誘導可能な二量体化ドメインをタンパク質に組み入れ、(e)バイオ分子のその活性を変改するために配列を組み入れまたは除去、(f)特定の遺伝子変化を導くためにリコンビナーゼ標的部位を組み入れ、および(g)エラーを起こしやすいRTを用いることによる標的配列の変異導入をするために用いられ得る。目当ての標的部位におけるヌクレオチド配列を一般的に挿入、変化、または欠失させるこれらの方法に加えて、プライム編集因子は、高度にプログラム可能なライブラリを構築するために、ならびに細胞データ記録および系統トレース研究を行うためにもまた用いられ得る。本発明者は、プライム編集の効力を改善することを狙うPEgRNAの追加のデザイン特色をもまた企図した。なお、さらに、本発明者は、インテインドメインを用いてnapDNAbpを分裂することが関わる、ベクター送達システムを用いてプライム編集因子を首尾良く送達するための方法の着想を得た。 The process of prime editing may introduce at least one or more of the following genetic changes: transversions, transitions, deletions, and insertions. Additionally, prime editing may be implemented for specific applications. For example, as illustrated and discussed herein, prime editing involves (a) incorporating changes to the nucleotide sequence that correct for mutations, (b) incorporating protein and RNA tags, (c) incorporating immune epitopes into the protein of interest, (d) incorporating inducible dimerization domains into proteins; (e) incorporating or removing sequences to modify the biomolecule's activity; (f) recombinase target sites to direct specific genetic changes. and (g) mutagenesis of a target sequence by using error-prone RT. In addition to these methods of generally inserting, changing, or deleting nucleotide sequences at the target site of interest, prime editing factors can be used to construct highly programmable libraries, as well as for cell data recording and lineage tracing. It can also be used to conduct research. The inventors also contemplated additional design features of PEgRNA aimed at improving the efficacy of prime editing. Still further, the inventors have conceived a method for successfully delivering prime editing factors using a vector delivery system that involves splitting napDNAbp using an intein domain.

用語「プライム編集システム」または「プライム編集因子(PE)」は、本明細書に記載のプライム標的にプライムされた逆転写(TPRT)を用いるゲノム編集の方法に関わる組成物を言い、napDNAbp、逆転写酵素、融合タンパク質(例えば、DNAbpおよび逆転写酵素を含む)、伸長されたガイドRNA、および融合タンパク質と伸長されたガイドRNAとを含む複合体、ならびに補助的な要素、例えば、プライム編集プロセスを編集された産物形成の方へ駆動することを助けるための第2鎖ニッキング構成要素および5'内生DNAフラップ除去エンドヌクレアーゼ(例えばFEN1)を包含するが、これらに限定されない。 The term "primed editing system" or "primed editing factor (PE)" refers to the compositions involved in the method of genome editing using prime target-primed reverse transcription (TPRT) described herein, napDNAbp, reverse transcriptase, a fusion protein (e.g., containing DNAbp and reverse transcriptase), an elongated guide RNA, and a complex comprising the fusion protein and elongated guide RNA, as well as ancillary elements, e.g., a prime editing process. Including, but not limited to, a second strand nicking component and a 5' endogenous DNA flap removal endonuclease (eg, FEN1) to help drive toward edited product formation.

別の態様では、図3Fの模式図は、二本鎖DNAの標的部位との典型的なPEgRNAの相互作用と、目当ての遺伝子変化を含有する3'一本鎖DNAフラップの付随的生産とを図示する。二本鎖DNAは、上側鎖が3'から5'の向きで、下方の鎖が5'から3'の方向で示されている。上側の鎖は「プロトスペーサー」およびPAM配列を含み、「標的鎖」と言われる。相補的な下方の鎖は「非標的鎖」と言われる。示されていないが、図示されているPEgRNAはCas9または等価物と複合体化するであろう。模式図に示されているとおり、PEgRNAのスペーサーは、プロトスペーサーと言われる標的鎖上の相補的な領域にアニーリングし、これはPAM配列のちょうど下流に位置付けられ、長さがおよそ20ヌクレオチドである。この相互作用は、スペーサーRNAおよびプロトスペーサーDNAの間にDNA/RNAハイブリッドを形成し、プロトスペーサーに対向する領域におけるRループの形成を誘導する。本願の他所において教示されるとおり、Cas9タンパク質(示されていない)が、それから、示されているとおり非標的鎖上にニックを誘導する。それから、これは3'ssDNAフラップ領域の形成に至り、これは、*z*に従って、プライマー結合部位においてPEgRNAの3'端と相互作用する。ssDNAフラップの3'端(すなわち、逆転写酵素プライマー配列)はPEgRNA上のプライマー結合部位(A)にアニーリングし、それによって逆転写酵素をプライムする。次に、逆転写酵素(例えば、トランスで提供されるか、またはCas9構築物に取り付けられた融合タンパク質としてシスで提供される)が、それから、編集鋳型(B)および相同アーム(C)によってコードされるDNAの一本鎖を重合する。重合は伸長アームの5'端の方へ連続する。ssDNAの重合した鎖はssDNA 3'端フラップを形成する。これは、他所に記載されるとおり(例えば図1Gに示されるとおり)、内生DNAに侵入し、対応する内生鎖を押し除け(これは内生DNAの5'DNAフラップとして除去される)、所望のヌクレオチド編集(1ヌクレオチド塩基対変化、欠失、挿入(遺伝子丸ごとを包含する)を天然に存在するDNA修復/複製ラウンドによって組み入れる。 In another embodiment, the schematic diagram in Figure 3F depicts a typical PEgRNA interaction with a double-stranded DNA target site and the concomitant production of a 3' single-stranded DNA flap containing the genetic change of interest. Illustrated. Double-stranded DNA is shown with the upper strand in the 3' to 5' orientation and the lower strand in the 5' to 3' orientation. The upper strand contains the "protospacer" and PAM sequences and is referred to as the "target strand." The complementary lower strand is referred to as the "non-target strand." Although not shown, the illustrated PEgRNA will be complexed with Cas9 or equivalent. As shown in the schematic diagram, the PEgRNA spacer anneals to a complementary region on the target strand called the protospacer, which is positioned just downstream of the PAM sequence and is approximately 20 nucleotides in length. . This interaction forms a DNA/RNA hybrid between the spacer RNA and protospacer DNA and induces the formation of an R-loop in the region facing the protospacer. As taught elsewhere in this application, the Cas9 protein (not shown) then induces a nick on the non-target strand as shown. This then leads to the formation of a 3'ssDNA flap region, which interacts with the 3' end of PEgRNA at the primer binding site according to *z*. The 3' end of the ssDNA flap (i.e., the reverse transcriptase primer sequence) anneals to the primer binding site (A) on the PEgRNA, thereby priming the reverse transcriptase. Reverse transcriptase (e.g., provided in trans or in cis as a fusion protein attached to a Cas9 construct) is then encoded by the editing template (B) and the homology arm (C). Polymerize a single strand of DNA. Polymerization continues towards the 5' end of the extended arm. The polymerized strands of ssDNA form the ssDNA 3' end flap. This invades the endogenous DNA and displaces the corresponding endogenous strand (which is removed as a 5′ DNA flap of the endogenous DNA), as described elsewhere (e.g., as shown in Figure 1G). , the desired nucleotide edits (single nucleotide base pair changes, deletions, insertions (including entire genes) are incorporated by naturally occurring rounds of DNA repair/replication.

プライム編集のこの適用は例1においてさらに記載され得る。 This application of prime editing can be further described in Example 1.

B.エラーを起こしやすいRTによるプライム編集を用いる変異導入
種々の態様において、プライム編集システム(すなわちプライム編集システム)は、標的化された変異導入を行うための、すなわちゲノムまたは細胞の他のDNAエレメント上の良く定めされたDNAのストレッチのみを変異させるための、エラーを起こしやすい逆転写酵素の使用を包含し得る。図22は、標的座位上のエラーを起こしやすい逆転写酵素による標的化された変異導入を行うことを導入するための例示的プロセスの模式図を提供し、伸長されたガイドRNAと複合体化した核酸プログラム型DNA結合タンパク質(napDNAbp)を用いる。このプロセスは、標的化された変異導入のためのプライム編集のある態様と言われ得る。伸長されたガイドRNAは、ガイドRNAの3'もしくは5'端にまたはガイドRNAの分子内の位置付けに伸長を含む。ステップ(a)では、napDNAbp/gRNA複合体がDNA分子に接触し、gRNAがnapDNAbpをガイドして、変異導入されるべき標的座位に結合させる。ステップ(b)では、ニックが標的座位のDNAの鎖の1つに導入され(例えば、ヌクレアーゼまたは化学的薬剤による)、それによって利用可能な3'端を標的座位の鎖の1つに生出する。ある態様において、ニックは、Rループ鎖に対応するDNAの鎖、すなわちガイドRNA配列にハイブリダイズされない鎖上に生出される。ステップ(c)では、DNA鎖の3'端は、逆転写をプライムするためにガイドRNAの伸長された部分と相互作用する。ある態様において、3'端DNA鎖は、ガイドRNAの伸長された部分の特定のRTプライム配列にハイブリダイズする。ステップ(d)では、エラーを起こしやすい逆転写酵素が導入され、これが、プライムされた部位の3'端からガイドRNAの3'端の方へDNAの変異導入された一本鎖を合成する。例示の変異がアステリスク「*」によって指示されている。これは所望の変異導入された領域を含む一本鎖DNAフラップを形成する。ステップ(e)では、napDNAbpおよびガイドRNAがリリースされる。ステップ(f)および(g)は一本鎖DNAフラップ(変異導入された領域を含む)の分解に関し、その結果、所望の変異導入された領域が標的座位に組み込まれるようになる。このプロセスは、ひとたび3'一本鎖DNAフラップが他の鎖上の相補的な配列に侵入およびハイブリダイズすると形成する対応する5'内生DNAフラップを除去することによって、所望の産物形成の方へ駆動され得る。プロセスは、図1Fにおいて例示されるとおり第2鎖ニッキングによってもまた産物形成の方へ駆動され得る。内生DNA修復および/または複製プロセス後に、変異導入された領域はDNA座位のDNAの両方の鎖上に組み込まれるようになる。
B. Mutation introduction using prime editing with error-prone RT
In various embodiments, the prime editing system (i.e., prime editing system) is used to perform targeted mutagenesis, i.e., to mutate only well-defined stretches of DNA on other DNA elements of the genome or cell. may include the use of error-prone reverse transcriptase enzymes. Figure 22 provides a schematic diagram of an exemplary process for introducing targeted mutagenesis by error-prone reverse transcriptase on the target locus, complexed with an elongated guide RNA. Nucleic acid programmed DNA binding protein (napDNAbp) is used. This process can be referred to as a form of prime editing for targeted mutagenesis. An extended guide RNA includes an extension at the 3' or 5' end of the guide RNA or at a position within the molecule of the guide RNA. In step (a), the napDNAbp/gRNA complex contacts the DNA molecule and the gRNA guides the napDNAbp to bind to the target locus to be mutated. In step (b), a nick is introduced (e.g., by a nuclease or chemical agent) into one of the strands of the DNA at the target locus, thereby creating an available 3' end on one of the strands at the target locus. . In certain embodiments, the nick is created on the strand of DNA that corresponds to the R-loop strand, ie, the strand that is not hybridized to the guide RNA sequence. In step (c), the 3' end of the DNA strand interacts with the extended portion of the guide RNA to prime reverse transcription. In certain embodiments, the 3' end DNA strand hybridizes to a specific RT prime sequence of the extended portion of the guide RNA. In step (d), error-prone reverse transcriptase is introduced, which synthesizes a mutated single strand of DNA from the 3' end of the primed site toward the 3' end of the guide RNA. Exemplary mutations are indicated by an asterisk "*". This forms a single-stranded DNA flap containing the desired mutagenized region. In step (e) napDNAbp and guide RNA are released. Steps (f) and (g) involve disassembling the single-stranded DNA flap (containing the mutagenized region) so that the desired mutagenized region is integrated into the target locus. This process directs desired product formation by removing the corresponding 5' endogenous DNA flap that forms once a 3' single-stranded DNA flap invades and hybridizes to complementary sequences on the other strand. can be driven to. The process can also be driven towards product formation by second strand nicking as illustrated in Figure IF. After endogenous DNA repair and/or replication processes, the mutagenized region becomes integrated on both strands of DNA at the DNA locus.

プライム編集のこの適用は例2においてさらに記載され得る。 This application of prime editing can be further described in Example 2.

エラーを起こしやすいまたは変異誘発RT酵素は当該技術分野において公知である。本願において用いられる用語「エラーを起こしやすい」逆転写酵素は、野生型M-MLV逆転写酵素のエラー率未満であるエラー率を有する、天然に存在するかまたは別の逆転写酵素(例えば、野生型M-MLV逆転写酵素)から導出された逆転写酵素酵素を言う。野生型M-MLV逆転写酵素のエラー率は15,000から27,000の核酸塩基組み込みにつき1つのエラーの範囲であることが報告されている。Boutabout et al.(2001) “DNA synthesis fidelity by the reverse transcriptase of the yeast retrotransposon Ty1,” Nucleic Acids Res 29(11):2217-2222を見よ。これは参照によって本願に組み込まれる。それゆえに、この適用の目的では、用語「エラーを起こしやすい」は、15,000核酸塩基組み込みにつき1つのエラー(6.7×10-5またはより高く)、例えば、14,000核酸塩基につき1エラー(7.14×10-5またはより高く)、13,000核酸塩基もしくはより少数につき1エラー(7.7×10-5またはより高く)、12,000核酸塩基もしくはより少数につき1エラー(7.7×10-5またはより高く)、11,000核酸塩基もしくはより少数につき1エラー(9.1×10-5またはより高く)、10,000核酸塩基もしくはより少数につき1エラー(1×10-4もしくは0.0001またはより高く)、9,000核酸塩基もしくはより少数につき1エラー(0.00011またはより高く)、8,000核酸塩基もしくはより少数につき1エラー(0.00013またはより高く)、7,000核酸塩基もしくはより少数につき1エラー(0.00014またはより高く)、6,000核酸塩基もしくはより少数につき1エラー(0.00016またはより高く)、5,000核酸塩基もしくはより少数につき1エラー(0.0002またはより高く)、4,000核酸塩基もしくはより少数につき1エラー(0.00025またはより高く)、3,000核酸塩基もしくはより少数につき1エラー(0.00033またはより高く)、2,000核酸塩基もしくはより少数につき1エラー(0.00050またはより高く)、または1,000核酸塩基もしくはより少数につき1エラー(0.001またはより高く)、または500核酸塩基もしくはより少数につき1エラー(0.002またはより高く)、または250核酸塩基もしくはより少数につき1エラー(0.004またはより高く)よりも多大であるエラー率を有するRTを言う。 Error-prone or mutagenic RT enzymes are known in the art. As used herein, the term "error-prone" reverse transcriptase refers to a naturally occurring or another reverse transcriptase (e.g., a wild-type Refers to reverse transcriptase enzyme derived from M-MLV reverse transcriptase). The error rate of wild-type M-MLV reverse transcriptase has been reported to range from 1 error per 15,000 to 27,000 nucleobase integrations. See Boutabout et al. (2001) “DNA synthesis fidelity by the reverse transcriptase of the yeast retrotransposon Ty1,” Nucleic Acids Res 29(11):2217-2222. This is incorporated herein by reference. Therefore, for the purposes of this application, the term "error-prone" refers to 1 error per 15,000 nucleobase integrations (6.7 × 10 -5 or higher), e.g., 1 error per 14,000 nucleobases (7.14 × 10 - 5 or higher), 1 error per 13,000 nucleobases or fewer (7.7 x 10 -5 or higher), 1 error per 12,000 nucleobases or fewer (7.7 x 10 -5 or higher), 11,000 nucleobases or 1 error per 10,000 nucleobases or 0.0001 or higher; 1 error per 10,000 nucleobases or 0.0001 or higher; 1 error per 9,000 nucleobases or 0.0001 or higher 1 error per 8,000 nucleobases or fewer (0.00013 or higher), 1 error per 7,000 nucleobases or fewer (0.00014 or higher), 1 error per 6,000 nucleobases or fewer (0.00016 or higher) ), 1 error in 5,000 nucleobases or fewer (0.0002 or higher), 1 error in 4,000 nucleobases or fewer (0.00025 or higher), 1 error in 3,000 nucleobases or fewer (0.00033 or higher), 1 error per 2,000 nucleobases or fewer (0.00050 or higher), or 1 error per 1,000 nucleobases or fewer (0.001 or higher), or 1 error per 500 nucleobases or fewer (0.002 or higher); or RT with an error rate that is greater than 1 error per 250 nucleobases or fewer (0.004 or higher).

プライム編集を用いる変異導入された配列の生成のためには、種々の変異誘発RTが想定され得る。2つのかかる例はBordetellaファージ(Handa,S.,et al.Nucl Acids Res 9711-25(2018)を見よ。これは参照によって本願に組み込まれる)およびLegionella pneumophila(Arambula,D.,et al.Proc Natl Acad Sci USA 8212-7(2013)を見よ。これは参照によって組み込まれる)からの変異誘発逆転写酵素である。BordetellaファージからのRT(brt)のケースでは、標的部位に対する変異誘発RTの結合を改善するために、補助的なタンパク質(bavd)がCas9に、および追加のRNA配列がPEgRNAに、追加またはトランスで送達されることをもまた必要とし得る(Handa,S.,et al.Nucl Acids Res 9711-25(2018)を見よ)。変異誘発RTを用いるときには、PEgRNAの鋳型領域は、多様性を増強するためのアデノシンまたはAAYコドンが濃縮され得る。 Various mutagenic RTs can be envisioned for the generation of mutagenized sequences using prime editing. Two such examples are Bordetella phage (Handa, S., et al. Nucl Acids Res 9711-25 (2018), which is incorporated herein by reference) and Legionella pneumophila (Arambula, D., et al. Proc. See Natl Acad Sci USA 8212-7 (2013), which is incorporated by reference). In the case of RT from Bordetella phage (brt), an auxiliary protein (bavd) is added to Cas9 and an additional RNA sequence is added to PEgRNA, either in trans or to improve binding of the mutagenic RT to the target site. may also need to be delivered (see Handa, S., et al. Nucl Acids Res 9711-25 (2018)). When using mutagenic RT, the PEgRNA template region can be enriched with adenosine or AAY codons to enhance diversity.

Bordetellaファージからの変異誘発RTのアミノ酸配列は次のとおり提供される。本明細書に開示の他のRTのように、Brtタンパク質は、機能的なPEを形成するように融合タンパク質としてnapDNAbpに融合され得る。

Figure 2020191234000114
Figure 2020191234000115
The amino acid sequence of mutagenic RT from Bordetella phage is provided below. Like other RTs disclosed herein, the Brt protein can be fused to napDNAbp as a fusion protein to form a functional PE.
Figure 2020191234000114
Figure 2020191234000115

BodetellaからのBrtのケースでは、PE融合体は追加の補助的なタンパク質(Bavd)をもまた包含し得る。補助的なタンパク質はPE融合タンパク質に融合またはトランスで提供され得る。Bavd補助的タンパク質のアミノ酸配列は次のとおり提供される:

Figure 2020191234000116
In the case of Brt from Bodetella, the PE fusion may also include an additional ancillary protein (Bavd). Supplementary proteins can be fused or provided in trans to the PE fusion protein. The amino acid sequence of Bavd auxiliary protein is provided as follows:
Figure 2020191234000116

BodetellaからのBrtのケースでは、PEgRNAは、PEgRNA、例えば5'または3'端に追加された追加のヌクレオチド配列を含み得る。例示の配列は次のとおりであり、これは元々はBordetellaファージゲノムからである:

Figure 2020191234000117
In the case of Brt from Bodetella, the PEgRNA may include additional nucleotide sequences added to the PEgRNA, eg, the 5' or 3' end. An example sequence is as follows, originally from the Bordetella phage genome:
Figure 2020191234000117

長さを短くするために、このPEgRNA追加配列は種々のやり方で縮減され得る。例えば、PEgRNA追加1配列は次の例示の代替的な追加配列へと縮減され得る:

Figure 2020191234000118
Figure 2020191234000119
To reduce length, this PEgRNA additional sequence can be reduced in a variety of ways. For example, a PEgRNA addition sequence can be reduced to the following exemplary alternative addition sequences:
Figure 2020191234000118
Figure 2020191234000119

他の態様において、PEgRNA追加配列もまた変異させられ得る。例えば、PEgRNA追加1配列は次の例示の代替的な追加配列へと変異させられ得る:

Figure 2020191234000120
In other embodiments, PEgRNA additional sequences can also be mutated. For example, a PEgRNA add1 sequence can be mutated to the following exemplary alternative add sequences:
Figure 2020191234000120

変異を導入するためのPEの使用に関する種々の態様では、特殊なPEgRNAの考慮事項が適用され得る。例えば、理論によって拘束されることなしに、上に記載されている追加のPEgRNA配列は、変異誘発RTによる効率的な変異導入を可能化するために必要とされ得る。 In various embodiments regarding the use of PE to introduce mutations, special PEgRNA considerations may apply. For example, without being bound by theory, the additional PEgRNA sequences described above may be required to enable efficient mutagenesis by mutagenic RT.

いずれかの変異誘発RTが本明細書に開示のプライム編集因子に用いられ得る。例えば、次の参照に記載されるエラーを起こしやすいRTが用いられ得、参照によって本願に組み込まれる: Any mutagenic RT may be used in the prime editors disclosed herein. For example, the error-prone RTs described in the following references may be used, which are incorporated herein by reference:

Bebenek et al.,“Error-prone polymerization by HIV-1 reverse transcriptase.Contribution of template-primer misalignment,miscoding,and termination probability to mutational hot spots.,”J.BiolChem,1993,268:10324-34;および Bebenek et al., “Error-prone polymerization by HIV-1 reverse transcriptase. Contribution of template-primer misalignment, miscoding, and termination probability to mutational hot spots.,” J. BiolChem, 1993, 268: 10324-34; and

Menendez-Arias,“Mutation rates and instrinsic fidelity of retroviral reverse transcriptases,”2009,Viruses,1(3):1137-1165。 Menendez-Arias, “Mutation rates and instrinsic fidelity of retroviral reverse transcriptases,” 2009, Viruses, 1(3): 1137-1165.

種々のエラーを起こしやすいRTは、次のとおり、Menendez-Arias et al.の表1に開示されている次の酵素を包含し得るが、これらに限定されない(これの参照の内容全体は参照によって組み込まれる):

Figure 2020191234000121
Various error-prone RTs may include, but are not limited to, the following enzymes disclosed in Table 1 of Menendez-Arias et al. (the entire content of this reference is incorporated by reference): (Incorporated):
Figure 2020191234000121

C.トリプレット拡大障害を処置するためのプライム編集の使用
本明細書に記載のプライム編集システムまたはプライム編集(PE)システムは、ハンチントン病および他のトリヌクレオチド反復障害などの疾病を処置するために、トリヌクレオチド反復変異(または「トリプレット拡大疾患」)を縮小するために用いられ得る。トリヌクレオチド反復拡大障害は発達神経生物学が関わる複雑な進行性の障害であり、多くの場合には、認知および感覚運動機能に影響する。障害は遺伝学的な表現促進現象(すなわち、各世代での増大した重症度)を示す。DNA伸長または短縮は、通常は減数分裂的に(すなわち、配偶子形成の時の間に、または胚発生中に早期に)起こり、多くの場合には性バイアスを有し、いくつかの遺伝子は女性から受け継がれるときにのみ、他は男性からのみ伸長するということを意味する。ヒトでは、トリヌクレオチド反復拡大障害は転写または翻訳レベルどちらかで遺伝子サイレンシングを引き起こし得、これは本質的に遺伝子機能をノックアウトする。代替的には、トリヌクレオチド反復拡大障害は、大きい繰り返しアミノ酸配列を有して生成された変改されたタンパク質を引き起こし得る。これは、多くの場合にはドミナントネガティブな様式で(例えばポリグルタミン疾患)、タンパク質機能を無効化するかまたは変化させるかどちらかである。
C. Use of Prime Editing to Treat Triplet Expansion Disorders
The prime editing system or prime editing (PE) system described herein can be used to reduce trinucleotide repeat mutations (or "triplet expansion disorders") to treat diseases such as Huntington's disease and other trinucleotide repeat disorders. Trinucleotide repeat expansion disorders are complex progressive disorders that involve developmental neurobiology and often affect cognitive and sensorimotor functions. The disorders show genetic anticipation (i.e., increasing severity with each generation). DNA expansion or shortening usually occurs meiotically (i.e., during gamete formation or earlier during embryonic development) and often has a sex bias, meaning that some genes are expanded only when inherited from females and others only from males. In humans, trinucleotide repeat expansion disorders can cause gene silencing at either the transcriptional or translational level, which essentially knocks out gene function. Alternatively, trinucleotide repeat expansion disorders can cause altered proteins to be produced with large repeated amino acid sequences. This either disables or alters protein function, often in a dominant-negative manner (eg polyglutamine diseases).

理論によって拘束されることなしに、トリプレット拡大はDNA複製またはDNA修復合成の間のスリップによって引き起こされる。タンデム反復は互いに同一の配列を有するので、2つのDNA鎖間の塩基対形成は配列上の複数の点において生起し得る。これはDNA複製またはDNA修復合成の間の「ループアウト」構造の形成に至り得る。これは繰り返し配列の繰り返しのコピーに至り得、反復数を伸長させる。ハイブリッドRNA:DNA中間体が関わる追加の機序が提案されている。プライム編集は、害をなす繰り返しのコドントリプレットの1つ以上を欠失させることによって、これらのトリプレット拡大領域を縮減または消去するために用いられ得る。この使用のある態様では、図23が、プライム編集によってトリヌクレオチド反復配列を短縮または縮減するためのPEgRNAデザインの模式図を提供する。 Without being bound by theory, triplet expansion is caused by slippage during DNA replication or DNA repair synthesis. Because tandem repeats have identical sequences to each other, base pairing between the two DNA strands can occur at multiple points on the sequence. This can lead to the formation of "loop-out" structures during DNA replication or DNA repair synthesis. This can lead to repeated copies of repeating sequences, extending the number of repeats. Additional mechanisms involving hybrid RNA:DNA intermediates have been proposed. Prime editing can be used to reduce or eliminate these triplet expansion regions by deleting one or more of the harmful repeat codon triplets. In some embodiments of this use, Figure 23 provides a schematic representation of PEgRNA design to shorten or reduce trinucleotide repeat sequences by prime editing.

プライム編集は、カットされる部位へと標的化される充当されたPEgRNAを含むプライム編集因子によって、トリプレット反復領域の上流の領域へニックを入れることによって、トリプレット拡大領域を短縮するように実装され得る。それから、プライム編集因子は、健康な数のトリプレット反復(これは具体的な遺伝子および疾患に依存する)をコードする鋳型(すなわち、その編集鋳型)としてのPEgRNAに基づく新たなDNA鎖(ssDNAフラップ)を合成する。健康なトリプレット反復配列を含む新たに合成されたssDNA鎖は、また、反復の他端に隣接する配列にマッチする相同性の短いストレッチ(すなわち相同アーム)を包含するように合成される(赤色の鎖)。新たに合成された鎖の侵入、および新たに合成されたssDNAフラップによる内生DNAの爾後の置き換えは、短縮された反復アレルに至る。 Prime editing can be implemented to shorten the triplet expansion region by nicking the region upstream of the triplet repeat region with a prime editing agent containing a dedicated PEgRNA targeted to the site to be cut. . The prime editing factor then creates a new DNA strand (ssDNA flap) based on PEgRNA as a template (i.e., its editing template) encoding a healthy number of triplet repeats (this depends on the specific gene and disease). Synthesize. A newly synthesized ssDNA strand containing a healthy triplet repeat sequence is also synthesized to include a short stretch of homology (i.e. homology arm) that matches the sequence flanking the other end of the repeat (shown in red). chain). Invasion of the newly synthesized strand and subsequent replacement of the endogenous DNA by the newly synthesized ssDNA flap leads to a truncated repeat allele.

具体的なトリヌクレオチド伸長障害に依存して、欠陥を誘導するトリプレット拡大は「トリヌクレオチド反復拡大タンパク質」において生起し得る。トリヌクレオチド反復拡大タンパク質は、トリヌクレオチド反復拡大障害を発生する感受性、トリヌクレオチド反復拡大障害の存在、トリヌクレオチド反復拡大障害の重症度、またはそれらのいずれかの組み合わせに関連するタンパク質の多様なセットである。トリヌクレオチド反復拡大障害は反復の型によって決定される2つのカテゴリーに分けられる。最も普通の反復はトリプレットCAGであり、これは遺伝子のコード領域に存在するときにはアミノ酸のグルタミン(Q)をコードする。よって、これらの障害はポリグルタミン(ポリQ)障害と言われ、次の疾患を含む:ハンチントン病(HD);球脊髄性筋萎縮症(SBMA);脊髄小脳失調症(SCA1、2、3、6、7、および17型);および歯状核赤核淡蒼球ルイ体萎縮症(DRPLA)。残りのトリヌクレオチド反復拡大障害にはCAGトリプレットが関わらないか、またはCAGトリプレットが遺伝子のコード領域にはないかどちらかであり、よって、非ポリグルタミン障害と言われる。非ポリグルタミン障害は、脆弱X症候群(FRAXA);脆弱XE精神遅滞(FRAXE);フリードライヒ運動失調症(FRDA);筋強直性ジストロフィー(DM);および脊髄小脳失調症(SCA 8および12型)を含む。 Depending on the specific trinucleotide expansion disorder, defect-inducing triplet expansions can occur in "trinucleotide repeat expansion proteins." Trinucleotide repeat expansion proteins are a diverse set of proteins associated with susceptibility to developing trinucleotide repeat expansion disorders, presence of trinucleotide repeat expansion disorders, severity of trinucleotide repeat expansion disorders, or any combination thereof. be. Trinucleotide repeat expansion disorders are divided into two categories determined by the type of repeat. The most common repeat is the triplet CAG, which when present in the coding region of a gene encodes the amino acid glutamine (Q). These disorders are therefore referred to as polyglutamine (polyQ) disorders and include: Huntington's disease (HD); spinobulbar muscular atrophy (SBMA); spinocerebellar ataxia (SCA1, 2, 3, types 6, 7, and 17); and dentate nucleus pallidum Louisian atrophy (DRPLA). The remaining trinucleotide repeat expansion disorders either do not involve the CAG triplet or the CAG triplet is not in the coding region of the gene and are therefore referred to as non-polyglutamine disorders. Non-polyglutamine disorders include fragile including.

トリヌクレオチド反復拡大障害に関連するタンパク質は、トリヌクレオチド反復拡大障害に対するトリヌクレオチド反復拡大障害に関連するタンパク質の実験的関連に基づいて選択され得る。例えば、トリヌクレオチド反復拡大障害に関連するタンパク質の生産速度または循環濃度は、トリヌクレオチド反復拡大障害を欠く集団に対して相対的に、トリヌクレオチド反復拡大障害を有する集団において上昇または降下し得る。タンパク質レベルの違いは、ウエスタンブロット、免疫組織化学染色、酵素結合免疫吸着アッセイ(ELISA)、および質量分析を包含するがこれらに限定されないプロテオミクス技術を用いて評価され得る。代替的には、トリヌクレオチド反復拡大障害に関連するタンパク質はタンパク質をコードする遺伝子の遺伝子発現プロファイルを得ることによって同定され得、DNAマイクロアレイ分析、遺伝子発現の連続分析(SAGE)、および定量的リアルタイムポリメラーゼ連鎖反応(Q-PCR)を包含するがこれらに限定されないゲノム技術を用いる。 Proteins associated with trinucleotide repeat expansion disorders may be selected based on the experimental association of proteins associated with trinucleotide repeat expansion disorders to trinucleotide repeat expansion disorders. For example, the production rate or circulating concentration of a protein associated with a trinucleotide repeat expansion disorder may be increased or decreased in a population with a trinucleotide repeat expansion disorder relative to a population lacking the trinucleotide repeat expansion disorder. Differences in protein levels can be assessed using proteomic techniques including, but not limited to, Western blot, immunohistochemical staining, enzyme-linked immunosorbent assay (ELISA), and mass spectrometry. Alternatively, proteins associated with trinucleotide repeat expansion disorders can be identified by obtaining gene expression profiles of protein-coding genes, using DNA microarray analysis, serial analysis of gene expression (SAGE), and quantitative real-time polymerase analysis. Genomic techniques are used, including but not limited to chain reaction (Q-PCR).

プライム編集によって修正され得るトリヌクレオチド反復拡大障害に関連するタンパク質の限定しない例は、AR(アンドロゲン受容体)、FMR1(脆弱X精神遅滞1)、HTT(ハンチンチン)、DMPK(筋緊張性ジストロフィータンパク質キナーゼ)、FXN(フラタキシン)、ATXN2(アタキシン2)、ATN1(アトロフィン1)、FEN1(フラップ構造特異的エンドヌクレアーゼ1)、TNRC6A(トリヌクレオチド反復含有6A)、PABPN1(核ポリA結合タンパク質1)、JPH3(ジャンクトフィリン3)、MED15(メディエーター複合体サブユニット15)、ATXN1(アタキシン1)、ATXN3(アタキシン3)、TBP(TATAボックス結合タンパク質)、CACNA1A(電位依存性カルシウムチャネルP/Q型アルファ1Aサブユニット)、ATXN80S(ATXN8対向鎖(非タンパク質コード))、PPP2R2B(タンパク質ホスファターゼ2制御サブユニットBベータ)、ATXN7(アタキシン7)、TNRC6B(トリヌクレオチド反復含有6B)、TNRC6C(トリヌクレオチド反復含有6C)、CELF3(CUGBP Elav様ファミリーメンバー3)、MAB21L1(mab-21様1(C.elegans))、MSH2(mutSホモログ2結腸がん非ポリポーシス1型(E.coli))、TMEM185A(膜貫通タンパク質185A)、SIX5(SIXホメオボックス5)、CNPY3(canopy 3ホモログ(ゼブラフィッシュ))、FRAXE(脆弱部位、葉酸型、稀、fra(X)(q28)E)、GNB2(グアニンヌクレオチド結合タンパク質(Gタンパク質)ベータポリペプチド2)、RPL14(リボソームタンパク質L14)、ATXN8(アタキシン8)、INSR(インスリン受容体)、TTR(トランスサイレチン)、EP400(E1A結合タンパク質p400)、GIGYF2(GRB10相互作用GYFタンパク質2)、OGG1(8-オキソグアニンDNAグリコシラーゼ)、STC1(スタニオカルシン1)、CNDP1(カルノシンジペプチダーゼ1(メタロペプチダーゼM20ファミリー))、C10orf2(染色体10オープンリーディングフレーム2)、MAML3 mastermind様3(Drosophila)、DKC1(先天性角化不全症1、ジスケリン)、PAXIP1(PAX相互作用(転写活性化ドメイン)タンパク質1)、CASK(カルシウム/カルモジュリン依存性セリンタンパク質キナーゼ(MAGUKファミリー))、MAPT(微小管関連タンパク質tau)、SP1(Sp1転写因子)、POLG(ポリメラーゼ(DNA依存性)ガンマ)、AFF2(AF4/FMR2ファミリーメンバー2)、THBS1(トロンボスポンジン1)、TP53(腫瘍タンパク質p53)、ESR1(エストロゲン受容体1)、CGGBP1(CGGリプレット反復結合タンパク質1)、ABT1(基本転写活性化因子1)、KLK3(カリクレイン関連ペプチダーゼ3)、PRNP(プリオンタンパク質)、JUN(jun癌遺伝子)、KCNN3(カリウム中/小コンダクタンスカルシウム活性化チャネルサブファミリーNメンバー3)、BAX(BCL2関連Xタンパク質)、FRAXA(脆弱部位、葉酸型、稀、fra(X)(q27.3)A(巨睾丸、精神遅滞))、KBTBD10(kelch反復およびBTB(POZ)ドメイン含有10)、MBNL1(muscleblind様(Drosophila))、RAD51(RAD51ホモログ(RecAホモログ、E.coli)(S. cerevisiae))、NCOA3(核受容体コアクチベーター3)、ERDA1(伸長した反復ドメインCAG/CTG1)、TSC1(結節性硬化症1)、COMP(軟骨オリゴマーマトリックスタンパク質)、GCLC(グルタミン酸-システインリガーゼ触媒サブユニット)、RRAD(糖尿病に関連するRas関連)、MSH3(mutSホモログ3(E.coli))、DRD2(ドーパミン受容体D2)、CD44(CD44分子(インド人血液型))、CTCF(CCCTC結合因子(ジンクフィンガータンパク質))、CCND1(サイクリンD1)、CLSPN(クラスピンホモログ(Xenopus laevis))、MEF2A(筋細胞エンハンサー因子2A)、PTPRU(タンパク質チロシンホスファターゼ受容体型U)、GAPDH(グリセルアルデヒド-3-リン酸デヒドロゲナーゼ)、TRIM22(三節型モチーフ含有22)、WT1(ウィルムス腫瘍1)、AHR(アリール炭化水素受容体)、GPX1(グルタチオンペルオキシダーゼ1)、TPMT(チオプリンS-メチルトランスフェラーゼ)、NDP(ノリエ病(偽神経膠腫))、ARX(aristaless関連ホメオボックス)、MUS81(MUS81エンドヌクレアーゼホモログ(S.cerevisiae))、TYR(チロシナーゼ(眼皮膚白皮症IA))、EGR1(初期増殖応答1)、UNG(ウラシル-DNAグリコシラーゼ)、NUMBL(numbホモログ(Drosophila)様)、FABP2(腸脂肪酸結合タンパク質2)、EN2(engrailedホメオボックス2)、CRYGC(クリスタリンガンマC)、SRP14(シグナル認識粒子14kDa(相同的Alu RNA結合タンパク質))、CRYGBクリスタリンガンマB)、PDCD1(プログラム細胞死1)、HOXA1(ホメオボックスA1)、ATXN2L(アタキシン2様)、PMS2(PMS2減数分裂後分離増大2(S.cerevisiae))、GLA(ガラクトシダーゼアルファ)、CBL(Cas-Br-M(ネズミ)同種指向性レトロウイルス形質転換配列)、FTH1(フェリチン重鎖ポリペプチド1)、IL12RB2(インターロイキン12受容体ベータ2)、OTX2(orthodenticleホメオボックス2)、HOXA5(ホメオボックスA5)、POLG2(ポリメラーゼ(DNA依存性)ガンマ2補助的サブユニット)、DLX2(distal-lessホメオボックス2)、SIRPA(シグナル制御タンパク質アルファ)、OTX1(orthodenticleホメオボックス1)、AHRR(アリール炭化水素受容体リプレッサー)、MANF(中脳アストロサイト由来神経栄養因子)、TMEM158(膜貫通タンパク質158(遺伝子/偽遺伝子))、およびENSG00000078687を包含する。 Non-limiting examples of proteins associated with trinucleotide repeat expansion disorders that can be corrected by prime editing include AR (androgen receptor), FMR1 (fragile X mental retardation 1), HTT (huntingtin), DMPK (myotonic dystrophy protein). kinase), FXN (frataxin), ATXN2 (ataxin 2), ATN1 (atrophin 1), FEN1 (flap structure-specific endonuclease 1), TNRC6A (trinucleotide repeat-containing 6A), PABPN1 (nuclear polyA binding protein 1), JPH3 (junctophilin 3), MED15 (Mediator complex subunit 15), ATXN1 (ataxin 1), ATXN3 (ataxin 3), TBP (TATA box binding protein), CACNA1A (voltage-gated calcium channel P/Q type alpha 1A subunit), ATXN80S (ATXN8 opposite strand (non-protein coding)), PPP2R2B (protein phosphatase 2 regulatory subunit B beta), ATXN7 (ataxin 7), TNRC6B (trinucleotide repeat containing 6B), TNRC6C (trinucleotide repeat containing 6C), CELF3 (CUGBP Elav-like family member 3), MAB21L1 (mab-21-like 1 (C. elegans)), MSH2 (mutS homolog 2 colon cancer non-polyposis type 1 (E. coli)), TMEM185A (transmembrane protein 185A), SIX5 (SIX homeobox 5), CNPY3 (canopy 3 homolog (zebrafish)), FRAXE (fragile site, folate type, rare, fra(X)(q28)E), GNB2 (guanine nucleotide binding protein ( G protein) beta polypeptide 2), RPL14 (ribosomal protein L14), ATXN8 (ataxin 8), INSR (insulin receptor), TTR (transthyretin), EP400 (E1A binding protein p400), GIGYF2 (GRB10-interacting GYF protein 2), OGG1 (8-oxoguanine DNA glycosylase), STC1 (stanniocalcin 1), CNDP1 (carnosine dipeptidase 1 (metallopeptidase M20 family)), C10orf2 (chromosome 10 open reading frame 2), MAML3 mastermind-like 3 (Drosophila ), DKC1 (dyskeratosis congenita 1, dyskerin), PAXIP1 (PAX-interacting (transcriptional activation domain) protein 1), CASK (calcium/calmodulin-dependent serine protein kinase (MAGUK family)), MAPT (microtubule associated protein tau), SP1 (Sp1 transcription factor), POLG (polymerase (DNA-dependent) gamma), AFF2 (AF4/FMR2 family member 2), THBS1 (thrombospondin 1), TP53 (oncoprotein p53), ESR1 ( estrogen receptor 1), CGGBP1 (CGG triplet repeat binding protein 1), ABT1 (basic transcriptional activator 1), KLK3 (kallikrein-related peptidase 3), PRNP (prion protein), JUN (jun oncogene), KCNN3 (potassium Medium/small conductance calcium-activated channel subfamily N member 3), BAX (BCL2-related ), KBTBD10 (containing kelch repeats and BTB(POZ) domain 10), MBNL1 (muscleblind-like (Drosophila)), RAD51 (RAD51 homolog (RecA homolog, E. coli) (S. cerevisiae)), NCOA3 (nuclear receptor core activator 3), ERDA1 (elongated repeat domain CAG/CTG1), TSC1 (tuberous sclerosis 1), COMP (cartilage oligomeric matrix protein), GCLC (glutamate-cysteine ligase catalytic subunit), RRAD (associated with diabetes). Ras related), MSH3 (mutS homolog 3 (E. coli)), DRD2 (dopamine receptor D2), CD44 (CD44 molecule (Indian blood type)), CTCF (CCCTC binding factor (zinc finger protein)), CCND1 ( cyclin D1), CLSPN (claspin homologue (Xenopus laevis)), MEF2A (myocyte enhancer factor 2A), PTPRU (protein tyrosine phosphatase receptor type U), GAPDH (glyceraldehyde-3-phosphate dehydrogenase), TRIM22 (trisegmental type motif containing 22), WT1 (Wilms tumor 1), AHR (aryl hydrocarbon receptor), GPX1 (glutathione peroxidase 1), TPMT (thiopurine S-methyltransferase), NDP (Norie disease (pseudoglioma)), ARX (aristaless related homeobox), MUS81 (MUS81 endonuclease homolog (S. cerevisiae)), TYR (tyrosinase (oculocutaneous albinism IA)), EGR1 (early proliferative response 1), UNG (uracil-DNA glycosylase), NUMBL (numb homolog (Drosophila)-like), FABP2 (intestinal fatty acid binding protein 2), EN2 (engrailed homeobox 2), CRYGC (crystallin gamma C), SRP14 (signal recognition particle 14kDa (homologous Alu RNA binding protein)), CRYGB crystallin gamma B), PDCD1 (programmed cell death 1), HOXA1 (homeobox A1), ATXN2L (ataxin 2-like), PMS2 (PMS2 postmeiotic segregation increase 2 (S.cerevisiae)), GLA (galactosidase alpha), CBL (Cas-Br-M (murine) homotropic retroviral transformation sequence), FTH1 (ferritin heavy chain polypeptide 1), IL12RB2 (interleukin-12 receptor beta 2), OTX2 (orthodenticle homeobox 2), HOXA5 (homeobox A5), POLG2 (polymerase (DNA-dependent) gamma 2 auxiliary subunit), DLX2 (distal-less homeobox 2), SIRPA (signal regulatory protein alpha), OTX1 (orthodenticle homeobox 1), AHRR ( aryl hydrocarbon receptor repressor), MANF (midbrain astrocyte-derived neurotrophic factor), TMEM158 (transmembrane protein 158 (gene/pseudogene)), and ENSG00000078687.

本明細書に開示のプライム編集因子は、次のポリグルタミントリプレット拡大疾患遺伝子を包含する、上で指示されている疾患タンパク質のいずれかのトリプレット反復拡大領域を縮小するために用いられ得る(これらは、プライム編集によって丸ごとまたは部分的に除去され得る病原性反復の具体的位置付けを示す):

Figure 2020191234000122
Figure 2020191234000123
The prime editing factors disclosed herein can be used to reduce triplet repeat expansion regions of any of the disease proteins indicated above, including the following polyglutamine triplet expansion disease genes (these are , indicating specific locations of pathogenic repeats that can be removed in whole or in part by prime editing):
Figure 2020191234000122
Figure 2020191234000123

本明細書に開示のプライム編集因子は、次の非ポリグルタミントリプレット拡大疾患遺伝子に典型的に見出されるトリプレット反復拡大領域を縮小するためにもまた用いられ得る:

Figure 2020191234000124
The prime editing factors disclosed herein can also be used to reduce triplet repeat expansion regions typically found in the following non-polyglutamine triplet expansion disease genes:
Figure 2020191234000124

プライム編集は、トリプレット拡大領域の少なくとも1つのコドンを欠失するようにデザインされている編集鋳型を有するPEgRNAを用いて、トリプレット拡大領域を縮小するために実装され得る。他の態様において、健康な(すなわち、疾患を生ずることに関連しない)数のトリプレット反復に到達するために、これのためにプライム編集に用いるためのPEgRNAは、少なくとも1、または2、または3、または4、または5、または6、または7、または8、または9、または10、または11、または12、または13、または14、または15、または16、または17、または18、または19、または20、または21、または22、または23、または24、または25、または26、または27、または28、または29、または30、または31、または32、または33、または34、または35、または36、または37、または38、または39、または40、または41、または42、または43、または44、または45、または46、または47、または48、または49、または50、または51、または52、または53、または54、または55、または56、または57、または58、または59、または60、または61、または62、または63、または64、または65、または66、または67、または68、または69、または70、または71、または72、または73、または74、または75、または76、または77、または78、または79、または80、または81、または82、または83、または84、または85、または86、または87、または88、または89、または90、または91、または92、または93、または94、または95、または96、または97、または98、または99、または100、またはより多くのコドンをトリプレット拡大領域から欠失させるために用いられる。 Prime editing can be implemented to reduce a triplet expansion region using PEgRNA with an editing template designed to delete at least one codon of the triplet expansion region. In other embodiments, to reach a healthy (i.e., not associated with disease producing) number of triplet repeats, the PEgRNA for use in prime editing is at least 1, or 2, or 3, or 4, or 5, or 6, or 7, or 8, or 9, or 10, or 11, or 12, or 13, or 14, or 15, or 16, or 17, or 18, or 19, or 20 , or 21, or 22, or 23, or 24, or 25, or 26, or 27, or 28, or 29, or 30, or 31, or 32, or 33, or 34, or 35, or 36, or 37, or 38, or 39, or 40, or 41, or 42, or 43, or 44, or 45, or 46, or 47, or 48, or 49, or 50, or 51, or 52, or 53; or 54, or 55, or 56, or 57, or 58, or 59, or 60, or 61, or 62, or 63, or 64, or 65, or 66, or 67, or 68, or 69, or 70 , or 71, or 72, or 73, or 74, or 75, or 76, or 77, or 78, or 79, or 80, or 81, or 82, or 83, or 84, or 85, or 86, or Triplet expansion region with 87, or 88, or 89, or 90, or 91, or 92, or 93, or 94, or 95, or 96, or 97, or 98, or 99, or 100, or more codons used to delete from.

他の態様において、健康な(すなわち、疾患を生ずることに関連しない)数のトリプレット反復に到達するために、これのためにプライム編集に用いるためのPEgRNAは、少なくとも1、または2、または3、または4、または5、または6、または7、または8、または9、または10、または11、または12、または13、または14、または15、または16、または17、または18、または19、または20、またはより多くのコドンをトリプレット拡大領域から欠失させるために用いられる。 In other embodiments, to reach a healthy (i.e., not associated with causing disease) number of triplet repeats, the PEG RNA for use in priming editing therefor is used to delete at least 1, or 2, or 3, or 4, or 5, or 6, or 7, or 8, or 9, or 10, or 11, or 12, or 13, or 14, or 15, or 16, or 17, or 18, or 19, or 20, or more codons from the triplet expansion region.

他の態様において、健康な(すなわち、疾患を生ずることに関連しない)数のトリプレット反復に到達するために、これのためにプライム編集に用いるためのPEgRNAは、少なくとも1、または2、または3、または4、または5、または6、または7、または8、または9、または10、または11、または12、または13、または14、または15、またはより多くのコドンをトリプレット拡大領域から欠失させるために用いられる。 In other embodiments, to reach a healthy (i.e., not associated with disease producing) number of triplet repeats, the PEgRNA for use in prime editing is at least 1, or 2, or 3, or for deletion of 4, or 5, or 6, or 7, or 8, or 9, or 10, or 11, or 12, or 13, or 14, or 15, or more codons from the triplet expansion region. used for.

他の態様において、健康な(すなわち、疾患を生ずることに関連しない)数のトリプレット反復に到達するために、これのためにプライム編集に用いるためのPEgRNAは、少なくとも1、または2、または3、または4、または5、または6、または7、または8、または9、または10、またはより多くのコドンをトリプレット拡大領域から欠失させるために用いられる。 In other embodiments, to reach a healthy (i.e., not associated with disease producing) number of triplet repeats, the PEgRNA for use in prime editing is at least 1, or 2, or 3, or 4, or 5, or 6, or 7, or 8, or 9, or 10, or more codons are used to delete from the triplet expansion region.

プライム編集は、いずれかのトリプレット拡大領域、例えばBudworth et al.,“A Brief History of Triplet Repeat Diseases,”Methods Mol Biol,2013,1010:3-17、US20011/00165540A1(動物のトリヌクレオチド反復拡大障害に関連する遺伝子のゲノム編集)、US2016/0355796A1(crispr-casシステムの組成物およびヌクレオチド反復障害への使用の方法)に記載されているものを修正するように構成され得る。 Prime editing can be performed on any triplet expansion region, such as Budworth et al., “A Brief History of Triplet Repeat Diseases,” Methods Mol Biol, 2013, 1010:3-17, US20011/00165540A1 (animal trinucleotide repeat expansion disorders). (genome editing of genes associated with), US2016/0355796A1 (compositions of the crispr-cas system and methods of use for nucleotide repeat disorders);

種々の態様において、本開示は、欠陥遺伝子にトリヌクレオチド反復拡大領域を有する細胞への使用にとって好適なプライム編集構築物を提供し、(a)napDNAbpと逆転写酵素とを含むプライム編集因子融合体、(b)トリヌクレオチド反復拡大領域を標的化するスペーサー配列とトリヌクレオチド反復拡大領域の除去をコードする編集鋳型を含む伸長アームとを含むPEgRNAを含む。 In various embodiments, the present disclosure provides prime editing constructs suitable for use in cells having trinucleotide repeat expansions in defective genes, comprising: (a) a prime editing factor fusion comprising napDNAbp and reverse transcriptase; (b) comprises a PEgRNA comprising a spacer sequence that targets the trinucleotide repeat expansion region and an extended arm containing an editing template encoding removal of the trinucleotide repeat expansion region.

種々の他の態様において、本開示は、プライム編集を用いて細胞の欠陥遺伝子のトリヌクレオチド反復拡大領域の全てまたは部分を欠失させるための方法を提供し、napDNAbpと逆転写酵素とを含むプライム編集因子融合体、およびトリヌクレオチド反復拡大領域を標的化するスペーサー配列とトリヌクレオチド反復拡大領域の除去をコードする編集鋳型を含む伸長アームとを含むPEgRNAに、細胞を接触させることを含む。 In various other embodiments, the present disclosure provides methods for deleting all or a portion of a trinucleotide repeat expansion region of a defective gene in a cell using prime editing, wherein a prime comprising napDNAbp and reverse transcriptase is used. contacting a cell with a PEgRNA comprising an editing factor fusion and an extended arm comprising a spacer sequence targeting a trinucleotide repeat expansion region and an editing template encoding removal of the trinucleotide repeat expansion region.

種々の態様において、トリヌクレオチド反復は、繰り返すCTG、CAG、CGG、CCG、GAA、またはTTCトリヌクレオチドを含む。 In various embodiments, the trinucleotide repeat comprises repeating CTG, CAG, CGG, CCG, GAA, or TTC trinucleotides.

種々の他の態様において、テトラヌクレオチド反復、ペンタヌクレオチド反復、またはヘキサヌクレオチド反復である。 In various other embodiments, it is a tetranucleotide repeat, a pentanucleotide repeat, or a hexanucleotide repeat.

D.ペプチドタグ付けのためのプライム編集の使用
別の側面において、本開示は、プライム編集を用いてタンパク質上に1つ以上のペプチドタグを遺伝子的にグラフトするために本明細書に記載のプライム編集因子を用いるための方法を提供する。より具体的には、本開示は、1つ以上のペプチドタグをタンパク質上に遺伝子的に組み入れるための方法を提供し:タンパク質をコードする標的ヌクレオチド配列を、1つ以上のペプチドタグをコードする第2のヌクレオチド配列をその中に挿入するように構成されたプライム編集因子と接触させて、タンパク質タグに融合されたタンパク質を含む融合タンパク質をコードする組み換えヌクレオチド配列をもたらすことを含む。
D. Use of Prime Editing for Peptide Tagging
In another aspect, the present disclosure provides a method for using a prime editor described herein to genetically graft one or more peptide tags onto a protein using prime editing. More specifically, the present disclosure provides a method for genetically incorporating one or more peptide tags onto a protein, comprising: contacting a target nucleotide sequence encoding a protein with a prime editor configured to insert a second nucleotide sequence encoding one or more peptide tags therein, resulting in a recombinant nucleotide sequence encoding a fusion protein comprising the protein fused to the protein tag.

他の態様において、本開示は、目当てのペプチドと1つ以上のペプチドタグとを含む融合タンパク質を作るための方法を提供し、方法は:タンパク質をコードする標的ヌクレオチド配列を、1つ以上のペプチドタグをコードする第2のヌクレオチド配列をその中に挿入するように構成されたプライム編集因子と接触させて、タンパク質タグに融合されたタンパク質を含む融合タンパク質をコードする組み換えヌクレオチド配列をもたらすことを含む。 In other aspects, the disclosure provides methods for making fusion proteins comprising a peptide of interest and one or more peptide tags, the method comprising: combining a target nucleotide sequence encoding a protein with one or more peptide tags; contacting a second nucleotide sequence encoding a tag with a prime editing agent configured to insert therein a recombinant nucleotide sequence encoding a fusion protein comprising a protein fused to the protein tag. .

種々の態様において、標的ヌクレオチド配列はゲノムDNA上の目当ての特定の遺伝子である。目当ての遺伝子は目当てのタンパク質をコードし得る(例えば、受容体、酵素、治療学的タンパク質、膜タンパク質、輸送タンパク質、シグナル伝達タンパク質、または免疫学的タンパク質など)。目当ての遺伝子はRNA分子をもまたコードし得、メッセンジャーRNA(mRNA)、トランスファーRNA(tRNA)、リボソームRNA(rRNA)、核内低分子RNA(snRNA)、アンチセンスRNA、ガイドRNA、マイクロRNA(miRNA)、低分子干渉RNA(siRNA)、およびセルフリーRNA(cfRNA)を包含するが、これらに限定されない。 In various embodiments, the target nucleotide sequence is a particular gene of interest on genomic DNA. The gene of interest may encode a protein of interest (eg, a receptor, enzyme, therapeutic protein, membrane protein, transport protein, signal transduction protein, or immunological protein, etc.). The gene of interest may also encode RNA molecules, including messenger RNA (mRNA), transfer RNA (tRNA), ribosomal RNA (rRNA), small nuclear RNA (snRNA), antisense RNA, guide RNA, microRNA ( miRNA), small interfering RNA (siRNA), and cell-free RNA (cfRNA).

ペプチドタグは、分離、精製、視覚化、可溶化、または検出などの目的で、1つ以上の機能をタンパク質に授けるいずれかのペプチドタグまたはそのバリアントであり得る。ペプチドタグは、「アフィニティータグ」(タンパク質精製を容易化するため)、「可溶化タグ」(タンパク質の適切なフォールディングを補助するため)、「クロマトグラフィータグ」(タンパク質のクロマトグラフィー特性を変改するため)、「エピトープタグ」(高親和性抗体に結合するため)、および「蛍光タグ」(細胞のまたはin vitroのタンパク質の視覚化を容易化するため)を包含し得る。ペプチドタグの例は次のタグを包含するが、これらに限定されない:

Figure 2020191234000125
Figure 2020191234000126
The peptide tag can be any peptide tag or variant thereof that confers one or more functions on a protein for purposes such as separation, purification, visualization, solubilization, or detection. Peptide tags can be classified as "affinity tags" (to facilitate protein purification), "solubilization tags" (to aid in proper folding of proteins), and "chromatography tags" (to alter the chromatographic properties of proteins). (for binding to high affinity antibodies), and "fluorescent tags" (to facilitate visualization of proteins in cells or in vitro). Examples of peptide tags include, but are not limited to, the following tags:
Figure 2020191234000125
Figure 2020191234000126

ペプチドタグは次のアフィニティータグ(タンパク質の分離および/または精製のため)でもまたあり得る(Kimple et al.,“Overview of Affinity Tags for Protein Purification,”Curr Protoc Protein Sci,2013,73:Unit-9.9の表9.9.1に記載されているとおり。これは参照によって本願に組み込まれる)。

Figure 2020191234000127
Peptide tags can also be affinity tags (Kimple et al., “Overview of Affinity Tags for Protein Purification,” Curr Protoc Protein Sci, 2013, 73: Unit-9.9 Table 9.9.1, which is incorporated herein by reference).
Figure 2020191234000127

具体的な態様では、ペプチドタグはHis6タグ、FLAGタグ、V5タグ、GCN4タグ、HAタグ、Mycタグ、FIAsH/ReAsHタグ、ソルターゼ基質、パイクランプを包含し得る。 In specific embodiments, peptide tags can include His6 tags, FLAG tags, V5 tags, GCN4 tags, HA tags, Myc tags, FIAsH/ReAsH tags, sortase substrates, pike clamps.

種々の態様において、ペプチドタグは、タンパク質蛍光標識、免疫沈降、イムノブロッティング、免疫組織化学、タンパク質動員、誘導可能なタンパク質デグロン、およびゲノムワイドスクリーニングを包含する適用に用いられ得る。 In various embodiments, peptide tags can be used for applications including protein fluorescent labeling, immunoprecipitation, immunoblotting, immunohistochemistry, protein mobilization, inducible protein degrons, and genome-wide screening.

種々の他の態様において、ペプチドタグは、タンパク質自己スプライシング機能を組み入れるためにインテイン配列を包含し得る。本願において用いられる用語「インテイン」は、生命の全てのドメインからの生物に見出される自己プロセシングポリペプチドドメインを言う。インテイン(介在タンパク質)は、タンパク質スプライシングとして公知の固有の自己プロセシングイベントを実行する。これにおいては、それは2つのペプチド結合の切断によってそれ自体をより大きい前駆体ポリペプチドから切除、プロセスにおいて、新たなペプチド結合の形成によってフランキングするエクステイン(外部タンパク質)配列をライゲーションする。インテイン遺伝子は他のタンパク質コード遺伝子内にインフレームで埋め込まれて見出されるので、この再構成は翻訳後に(またはことによると共翻訳的に)生起する。さらにその上、インテインによって媒介されるタンパク質スプライシングは自発的である;それは外部の因子またはエネルギー源ではなくインテインドメインのフォールディングのみを要求する。このプロセスは、「分裂インテイン」によるトランスタンパク質スプライシングの天然のプロセスと対比してシスタンパク質スプライシングとしてもまた公知である。インテインは自己スプライシングRNAイントロンのタンパク質等価物であり(Perler et al.,Nucleic Acids Res.22:1125-1127(1994)を見よ)、これらは前駆体タンパク質からのそれら自体の切除を触媒し、エクステインとして公知のフランキングタンパク質配列の付随的融合を有する(Perler et al.,Curr.Opin.Chem.Biol.1:292-299(1997);Perler,F.B.Cell 92(1):1-4(1998);Xu et al.,EMBO J. 15(19):5146-5153(1996)において総説されている)。 In various other embodiments, the peptide tag may include an intein sequence to incorporate protein self-splicing functionality. The term "intein" as used herein refers to self-processing polypeptide domains found in organisms from all domains of life. Inteins (intervening proteins) carry out a unique self-processing event known as protein splicing. In this, it excises itself from the larger precursor polypeptide by cleavage of two peptide bonds, and in the process ligates the flanking extein (external protein) sequences by the formation of new peptide bonds. Since intein genes are found embedded in frame within other protein-coding genes, this rearrangement occurs post-translationally (or possibly co-translationally). Furthermore, protein splicing mediated by inteins is spontaneous; it requires only folding of the intein domain and not external factors or energy sources. This process is also known as cis-protein splicing in contrast to the natural process of trans-protein splicing by "split inteins." Inteins are the protein equivalents of self-splicing RNA introns (see Perler et al., Nucleic Acids Res. 22:1125-1127 (1994)), and they catalyze their own excision from precursor proteins and (Perler et al., Curr. Opin. Chem. Biol. 1:292-299(1997); Perler, F.B. Cell 92(1):1-4( 1998); reviewed in Xu et al., EMBO J. 15(19):5146-5153 (1996)).

タンパク質スプライシングプロセスの機序は多大に詳細に研究されており(Chong,et al.,J.Biol.Chem.1996,271,22159-22168;Xu,M-Q & Perler,F.B.EMBO Journal,1996,15,5146-5153)、保存されたアミノ酸がインテインおよびエクステインスプライシング点に見出されている(Xu,et al.,EMBO Journal,1994,13 5517-522)。 The mechanism of protein splicing process has been studied in great detail (Chong, et al., J. Biol. Chem. 1996, 271, 22159-22168; Xu, M-Q & Perler, F. B. EMBO Journal, 1996, 15, 5146-5153), conserved amino acids have been found at intein and extein splicing points (Xu, et al., EMBO Journal, 1994, 13 5517-522).

インテインは2つの別個に転写および翻訳される遺伝子によってコードされる2つのフラグメントとしてもまた存在し得る。これらの所謂分裂インテインは自己会合し(self-associate)、タンパク質-スプライシング活性をtransで触媒する。分裂インテインは、多様なシアノ細菌および古細菌において同定されている(Caspi et al,Mol Microbiol.50:1569-1577(2003);Choi J.et al,J Mol Biol.556:1093-1106(2006.);Dassa B.et al,Biochemistry.46:322-330(2007.);Liu X. and Yang J.,J Biol Chem.275:26315-26318(2003);Wu H.et al.Proc Natl Acad Sci USA.£5:9226-9231(1998.);およびZettler J.et al,FEBS Letters.553:909-914(2009))が、これまでbut have not been found in 真核生物からは見出されていない。近年、環境メタゲノムデータの生物情報学的(bioinformatic)分析から、新規ゲノム配置をもつ26の種々の遺伝子座が明らかにされた。各遺伝子座にて、保存された酵素コード領域は分裂インテインによって遮られており、独立型の(freestanding)エンドヌクレアーゼ遺伝子が、インテインサブドメインをコードする節(sections)間に挿入されている。それらのうち、5つの座位が完全にアセンブリされた:DNAヘリカーゼ(gp41-l、gp41-8);イノシン-5'-一リン酸デヒドロゲナーゼ(IMPDH-1);およびリボヌクレオチドレダクターゼ触媒サブユニット(NrdA-2およびNrdJ-1)である。このばらばらになった遺伝子編成は主にファージに存在するように見える(Dassa et al,Nucleic Acids Research.57:2560-2573(2009))。 Inteins can also exist as two fragments encoded by two separately transcribed and translated genes. These so-called split inteins self-associate and catalyze protein-splicing activity in trans. Fission inteins have been identified in diverse cyanobacteria and archaea (Caspi et al,Mol Microbiol.50:1569-1577(2003);Choi J.et al,J Mol Biol.556:1093-1106(2006 .);Dassa B.et al,Biochemistry.46:322-330(2007.);Liu X. and Yang J.,J Biol Chem.275:26315-26318(2003);Wu H.et al.Proc Natl Acad Sci USA. £5:9226-9231 (1998.); and Zettler J. et al, FEBS Letters. Not served. Recently, bioinformatic analysis of environmental metagenomic data has revealed 26 different genetic loci with novel genomic locations. At each locus, the conserved enzyme-coding region is interrupted by a split intein, and a freestanding endonuclease gene is inserted between sections encoding intein subdomains. Among them, five loci were fully assembled: DNA helicase (gp41-l, gp41-8); inosine-5'-monophosphate dehydrogenase (IMPDH-1); and ribonucleotide reductase catalytic subunit (NrdA -2 and NrdJ-1). This disjointed genetic organization appears to be present primarily in phages (Dassa et al, Nucleic Acids Research. 57:2560-2573 (2009)).

ある態様において、本明細書に記載のプライム編集因子は、分裂インテインタグを2つの異なるタンパク質上に挿入するために用いられ得、共発現されるときにそれらの細胞内ライゲーションを引き起こして融合タンパク質を形成する。タンパク質トランススプライシングでは、1つの前駆体タンパク質はNインテインによって後続されるNエクステインパーツからなり、別の前駆体タンパク質はCエクステインパーツによって後続されるCインテインからなり、トランススプライシング反応(一緒にNおよびCインテインによって触媒される)が2つのインテイン配列を切除、2つのエクステイン配列をペプチド結合によって連結する。酵素反応であるタンパク質トランススプライシングは、非常に低い(例えばマイクロモル)濃度のタンパク質で働き得、生理条件下において実行され得る。 In certain embodiments, the prime editing factors described herein can be used to insert split intein tags onto two different proteins, causing their intracellular ligation when coexpressed to create a fusion protein. Form. In protein trans-splicing, one precursor protein consists of an N extein part followed by an N intein, another precursor protein consists of a C intein followed by a C extein part, and the trans-splicing reaction (together N and C intein) excises the two intein sequences and connects the two extein sequences by a peptide bond. Protein trans-splicing, an enzymatic reaction, can work with very low (eg, micromolar) concentrations of protein and can be carried out under physiological conditions.

分裂インテインNpu DnaEは、タンパク質トランススプライシング反応について報告された最も高い速度を有するとして特徴付けられた。加えて、Npu DnaEタンパク質スプライシング反応は、異なるエクステイン配列、6から37℃の温度、および最高で6Mの尿素の存在についてロバストかつ高収量と考慮される(Zettler J.et al,FEBS Letters.553:909-914(2009);Iwai I.et al,FEBS Letters 550:1853-1858(2006))。予想されたとおり、これらのインテインのNドメインにおけるCysl Ala変異が導入されたときには、当初のNからSのアシルシフト、よってタンパク質スプライシングがブロックされた。残念ながら、C末端切断反応もまたほとんど完全に阻害された。N末端の切れやすいペプチド結合におけるアシルシフトに対するC末端スプライスジャンクションにおけるアスパラギン環化の依存性は、天然に分裂されたDnaEインテインアレルに普通の固有の特性であるように見える(Zettler J.et al.FEBS Letters.555:909-914(2009))。 The splitting intein Npu DnaE was characterized as having the highest rate reported for protein trans-splicing reactions. In addition, the Npu DnaE protein splicing reaction is considered robust and high yielding for different extein sequences, temperatures from 6 to 37 °C, and the presence of up to 6 M urea (Zettler J. et al, FEBS Letters.553 :909-914(2009);Iwai I. et al,FEBS Letters 550:1853-1858(2006)). As expected, when the Cysl Ala mutation in the N domain of these inteins was introduced, the initial N to S acyl shift and thus protein splicing was blocked. Unfortunately, the C-terminal cleavage reaction was also almost completely inhibited. The dependence of asparagine cyclization at the C-terminal splice junction on an acyl shift at the N-terminal scissile peptide bond appears to be a common and inherent property of naturally split DnaE intein alleles (Zettler J. et al. FEBS Letters.555:909-914(2009)).

分裂インテインによって触媒されるタンパク質トランススプライシングは、タンパク質ライゲーションのための全く酵素的な方法を提供する。分裂インテインは、夫々NインテインおよびCインテインという名称の2つのピースへと分裂された本質的に一続きのインテイン(例えばミニインテイン)である。分裂インテインのNインテインおよびCインテインは、非共有結合的に会合して活性なインテインを形成し、一続きのインテインがするのと本質的に同じやり方でスプライシング反応を触媒し得る。分裂インテインは天然に見出され、実験室でもまた操作されている。本願において用いられる用語「分裂インテイン」は、1つ以上のペプチド結合切断がN末端およびC末端アミノ酸配列の間に存在するいずれかのインテインを言い、その結果、N末端およびC末端配列が別個の分子になり、これらは、トランススプライシング反応について機能的であるインテインへと非共有結合的に再会合または再構成し得る。いずれかの触媒的に活性なインテインまたはそのフラグメントが、本発明の方法への使用のための分裂インテインを導出するために用いられ得る。例えば、一側面において、分裂インテインは真核生物インテインに由来し得る。別の側面において、分裂インテインは細菌インテインに由来し得る。別の側面において、分裂インテインは古細菌インテインに由来し得る。好ましくは、そのように導出された分裂インテインは、トランススプライシング反応を触媒することにとって必須のアミノ酸配列のみを所有するであろう。 Protein trans-splicing catalyzed by split inteins provides a purely enzymatic method for protein ligation. A split intein is essentially a continuous intein (eg, a mini-intein) that has been split into two pieces named N-intein and C-intein, respectively. The N and C inteins of a split intein non-covalently associate to form an active intein and can catalyze splicing reactions in essentially the same way that a continuous intein does. Split inteins are found in nature and have also been manipulated in the laboratory. As used herein, the term "split intein" refers to any intein in which one or more peptide bond cleavages exist between the N-terminal and C-terminal amino acid sequences, such that the N-terminal and C-terminal sequences are distinct. molecules, which can non-covalently reassemble or reconstitute into inteins that are functional for trans-splicing reactions. Any catalytically active intein or fragment thereof can be used to derive a split intein for use in the methods of the invention. For example, in one aspect, a fission intein can be derived from a eukaryotic intein. In another aspect, the fission intein can be derived from a bacterial intein. In another aspect, the fission intein can be derived from an archaeal intein. Preferably, the split intein so derived will possess only the amino acid sequences essential for catalyzing the trans-splicing reaction.

分裂インテインは、ミニインテインの構造上に見出される-12の保存されたベータ鎖間の構造化されていないループまたは介在アミノ酸配列中に1つ以上の分裂部位を操作することによって、一続きのインテインから生出され得る。分裂の生出が、タンパク質スプライシング活性が失われる十分な度合まではインテインの構造、特に構造化されたベータ鎖を遮断しないであろうという条件で、ベータ鎖間の領域内の分裂部位の位置のいくらかのフレキシビリティーが存在し得る。 Split inteins are created by engineering one or more splitting sites in unstructured loops or intervening amino acid sequences between the 12 conserved beta strands found on the structure of mini-inteins. can be generated from. Some of the location of the cleavage site within the inter-beta strand region, provided that the generation of cleavages will not interrupt the structure of the intein, particularly the structured beta strand, to a sufficient degree that protein splicing activity is lost. flexibility can exist.

本明細書に記載のプライム編集因子は、ペプチドタグ(インテインを包含する)を目当てのタンパク質のC末端の端に組み込み得る。他の態様において、ペプチドタグ(インテインを包含する)は目当てのタンパク質のN末端の端に組み込まれ得る。ペプチドタグは目当てのタンパク質の内側にもまた組み込まれ得る。本明細書に記載のプライム編集因子によって生出されるもたらされる融合タンパク質は、次の構造を有し得る: The prime editors described herein can incorporate peptide tags (including inteins) at the C-terminal end of the protein of interest. In other embodiments, peptide tags (including inteins) can be incorporated at the N-terminal end of the protein of interest. Peptide tags can also be incorporated inside the protein of interest. The resulting fusion protein produced by the prime editing factors described herein can have the following structure:

[目当てのタンパク質]-[ペプチドタグ]; [Target protein]-[peptide tag];

[ペプチドタグ]-[目当てのタンパク質];または [peptide tag]-[protein of interest]; or

[目当てのタンパク質-N末端領域]-[ペプチドタグ]-[目当てのタンパク質-C末端領域]。 [Protein of interest - N-terminal region] - [Peptide tag] - [Protein of interest - C-terminal region].

ペプチドタグ付けへの使用のためのガイドRNAデザインの原理は、至る所でペプチドタグ付けに適用され得る。例えば、1つの態様では、ペプチドタグ付けのためのPEgRNA構造は次の構造を有し得る:5'-[スペーサー配列]-[gRNAコアまたは骨格]-[伸長アーム]-3'。伸長アームは、5'から3'方向に、相同アーム、編集鋳型(ペプチドタグをコードする配列を含む)、およびプライマー結合部位を含む。この構成は図3Dおよび図24に図示されている。 The principles of guide RNA design for use in peptide tagging can be applied to peptide tagging everywhere. For example, in one embodiment, a PEgRNA structure for peptide tagging can have the following structure: 5'-[spacer sequence]-[gRNA core or backbone]-[extending arm]-3'. The extended arm includes, in a 5' to 3' direction, a homology arm, an editing template (containing a sequence encoding a peptide tag), and a primer binding site. This configuration is illustrated in FIG. 3D and FIG. 24.

別の態様では、ペプチドタグ付けのためのPEgRNA構造は、次の構造を有し得る:5'-[伸長アーム]-[スペーサー配列]-[gRNAコアまたは骨格]-3'。伸長アームは、5'から3'方向に、相同アーム、編集鋳型(ペプチドタグをコードする配列を含む)、およびプライマー結合部位を含む。この構成は図3Eに図示されている。 In another embodiment, the PEgRNA structure for peptide tagging can have the following structure: 5'-[extension arm]-[spacer sequence]-[gRNA core or backbone]-3'. The extension arm contains, in the 5' to 3' direction, a homology arm, an editing template (containing a sequence encoding the peptide tag), and a primer binding site. This configuration is illustrated in Figure 3E.

プライム編集を用いるペプチドタグ付けの態様は図25および26に図示され、例4に記載されている。 Embodiments of peptide tagging using prime editing are illustrated in FIGS. 25 and 26 and described in Example 4.

E.プリオン病を防止または処置するためのプライム編集の使用
プライム編集は、疾患の過程においてミスフォールディングされるようになるプリオンタンパク質(PRNP)上への1つ以上の防護性変異の組み入れによって、プリオン病を防止またはその進行を停止させるためにもまた用いられ得る。プリオン病または伝達性海綿状脳症(TSE)は、ヒトおよび動物両方を冒す稀な進行性の神経変性障害のファミリーである。それらは、長い潜伏期間、ニューロン喪失に関連する特徴的な海綿状変化、および炎症性応答を誘導することの失敗によって見分けられる。
E. Use of prime editing to prevent or treat prion diseases
Prime editing can also be used to prevent or halt the progression of prion diseases by incorporating one or more protective mutations onto the prion protein (PRNP), which becomes misfolded during the disease process. obtain. Prion diseases or transmissible spongiform encephalopathies (TSEs) are a family of rare, progressive neurodegenerative disorders that affect both humans and animals. They are distinguished by a long latency period, characteristic spongiform changes associated with neuronal loss, and failure to induce an inflammatory response.

ヒトでは、プリオン病は、クロイツフェルト・ヤコブ病(CJD)、変異型クロイツフェルト・ヤコブ病(vCJD)、ゲルストマン・ストロイスラー・シャインカー症候群、致死性家族性不眠症、およびクールー病を包含する。動物では、プリオン病は牛海綿状脳症(BSEまたは「狂牛病」)、慢性消耗病(CWD)、スクレイピー、伝達性ミンク脳症、ネコ海綿状脳症、および有蹄類海綿状脳症を包含する。これらのプリオン病のいずれか1つを防止またはその進行を停止させるために、プライム編集は防護性の点変異をプリオンタンパク質上に組み入れるために用いられ得る。 In humans, prion diseases include Creutzfeldt-Jakob disease (CJD), variant Creutzfeldt-Jakob disease (vCJD), Gerstmann-Straussler-Scheinker syndrome, fatal familial insomnia, and kuru disease. In animals, prion diseases include bovine spongiform encephalopathy (BSE or "mad cow disease"), chronic wasting disease (CWD), scrapie, transmissible mink encephalopathy, feline spongiform encephalopathy, and ungulate spongiform encephalopathy. To prevent or halt the progression of any one of these prion diseases, prime editing can be used to incorporate protective point mutations onto the prion protein.

古典的CJDはヒトプリオン病である。それは、特徴的な臨床および診断特色を有する神経変性障害である。この疾患は急速に進行性であり、常に致死的である。この疾患による感染は通常は病気の発症から1年以内に死に至る。CJDは急速に進行性の変わることなく致死的な神経変性障害であり、プリオンタンパク質として公知の細胞性の糖タンパク質の異常なアイソフォームによって引き起こされると信じられている。CJDは世界的に生起し、米国を包含する多くの国の見積もられる年間発生率は100万人の集団あたり約1ケースであることが報告されている。CJD患者の大多数は通常は病気の発症から1年以内に死ぬ。CJDは、ヒトおよび動物において生起する他のプリオン病と併せて、伝達性海綿状脳症(TSE)として分類される。患者の約85%では、CJDは伝達の認識可能なパターンなしに特発性疾患として生起する。患者のより小さい割合(5から15%)は、プリオンタンパク質遺伝子の受け継がれた変異ゆえにCJDを発生する。これらの受け継がれる形態は、ゲルストマン・ストロイスラー・シャインカー症候群および致死性家族性不眠症を包含する。CJDについて、処置は現行では公知ではない。 Classic CJD is a human prion disease. It is a neurodegenerative disorder with distinctive clinical and diagnostic features. The disease is rapidly progressive and always fatal. Infection with this disease usually results in death within one year of the onset of the disease. CJD is a rapidly progressive, permanently fatal neurodegenerative disorder believed to be caused by an abnormal isoform of a cellular glycoprotein known as prion protein. CJD occurs worldwide, with an estimated annual incidence of approximately 1 case per million population in many countries, including the United States. The majority of CJD patients usually die within a year from the onset of the disease. CJD, along with other prion diseases that occur in humans and animals, is classified as a transmissible spongiform encephalopathy (TSE). In approximately 85% of patients, CJD occurs as an idiopathic disease without a recognizable pattern of transmission. A smaller proportion of patients (5 to 15%) develop CJD due to inherited mutations in the prion protein gene. These inherited forms include Gerstmann-Straussler-Scheinker syndrome and fatal familial insomnia. For CJD, no treatment is currently known.

変異型クロイツフェルト・ヤコブ病(vCJD)は英国で1996年に最初に記載されたプリオン病である。今や、牛のプリオン病の牛海綿状脳症(BSEまたは「狂牛」病)のアウトブレイクを担う物質が、ヒトのvCJDのアウトブレイクを担う同じ物質であるという強い科学的証拠がある。バリアントCJD(vCJD)は古典的CJD(多くの場合には単純にCJDと呼ばれる)と同じ疾患ではない。それは古典的CJDとは異なる臨床的および病理学的特徴を有する。各疾患はプリオンタンパク質遺伝子の具体的な遺伝子プロファイルをもまた有する。両方の障害は、年で測定される普通でなく長い潜伏期間を有する変わることなく致死的な脳疾患であり、プリオンと呼ばれる非従来的な伝達性物質によって引き起こされる。vCJDについて、処置は現行では公知ではない。 Variant Creutzfeldt-Jakob disease (vCJD) is a prion disease first described in the United Kingdom in 1996. There is now strong scientific evidence that the agent responsible for outbreaks of the prion disease bovine spongiform encephalopathy (BSE or "mad cow" disease) in cattle is the same agent responsible for outbreaks of vCJD in humans. Variant CJD (vCJD) is not the same disease as classic CJD (often referred to simply as CJD). It has different clinical and pathological features from classic CJD. Each disease also has a specific genetic profile of prion protein genes. Both disorders are persistently fatal brain diseases with unusually long incubation periods measured in years and are caused by unconventional transmitters called prions. For vCJD, no treatment is currently known.

BSE(牛海綿状脳症または「狂牛病」)は、プリオンと呼ばれる普通でない伝達性物質による感染からもたらされる畜牛の進行性の神経学的障害である。伝達性物質の性質は良く理解されてはいない。現行では、最も受け入れられた理論は、物質が、プリオンタンパク質として公知の正常タンパク質の改変された形態であるということである。まだ理解されていない理由から、正常なプリオンタンパク質は病原性の(有害な)形態へと変化し、これはそれから畜牛の中枢神経系を損傷する。BSEの異なる株があるという増大して行く証拠がある:英国におけるアウトブレイクを担った典型的または古典的BSE株および2つの非典型的な株(HおよびL株)である。BSEについて、処置は現行では公知ではない。 BSE (bovine spongiform encephalopathy or "mad cow disease") is a progressive neurological disorder in cattle that results from infection with an unusually transmittable substance called a prion. The nature of communicable substances is not well understood. Currently, the most accepted theory is that the substance is a modified form of a normal protein known as prion protein. For reasons not yet understood, the normal prion protein transforms into a pathogenic (harmful) form, which then damages the central nervous system of cattle. There is growing evidence that there are different strains of BSE: the typical or classic BSE strain responsible for the outbreak in the UK and two atypical strains (strains H and L). For BSE, no treatment is currently known.

慢性消耗病(CWD)は、鹿、ヘラジカ、トナカイ、ニホンジカ、およびムースを冒すプリオン病である。それはカナダおよび米国を包含する北米、ノルウェー、ならびに韓国のいくつかのエリアにおいて見出されている。感染動物が症状を発生する前には1年超がかかり得、これらは激しい体重減少(消耗)、よろめき、無気力、および他の神経症状を包含し得る。CWDは全ての年齢の動物を冒し得、いくつかの感染動物はいつか疾患を発生することなしに死に得る。CWDは動物にとって致死的であり、処置またはワクチンはない。 Chronic wasting disease (CWD) is a prion disease that affects deer, elk, reindeer, sika deer, and moose. It is found in some areas of North America, Norway, and South Korea, including Canada and the United States. It can take more than a year before infected animals develop symptoms, and these can include severe weight loss (wasting), staggering, lethargy, and other neurological symptoms. CWD can affect animals of all ages, and some infected animals can eventually die without developing disease. CWD is fatal to animals and there is no treatment or vaccine.

TSEの原因物質はプリオンであると信じられている。用語「プリオン」は、伝達性であり、脳に最も豊富に見出されるプリオンタンパク質と呼ばれる特定の正常な細胞性タンパク質の異常なフォールディングを誘導する能力がある異常な病原性物質を言う。これらの正常なプリオンタンパク質の機能はなお完全には理解されていない。プリオンタンパク質の異常なフォールディングは脳損傷と疾患の特徴的な徴候および症状とに至る。プリオン病は通常は急速に進行性であり、常に致死的である。 The causative agent of TSE is believed to be a prion. The term "prion" refers to an abnormal pathogenic substance that is transmissible and capable of inducing abnormal folding of certain normal cellular proteins called prion proteins, which are most abundantly found in the brain. The function of these normal prion proteins is still not completely understood. Abnormal folding of the prion protein leads to brain damage and characteristic signs and symptoms of the disease. Prion diseases are usually rapidly progressive and always fatal.

本願において用いられる用語「プリオン」は、ヒトおよび動物の疾患(海綿状脳症)を引き起こすことが公知の感染性粒子を意味する。用語「プリオン」は単語「タンパク質」および「感染」の短縮であり、粒子は、専らではないにしても、大きくは、立体配座を変化させてPRNPScになるPRNPCを発現するPRNP遺伝子によってコードされるPRNPSc分子からなる。プリオンは細菌、ウイルス、およびウイロイドとは別物である。公知のプリオンは、動物に感染して、羊および山羊の神経系の伝達性の変性疾患スクレイピー、および牛海綿状脳症(BSE)または狂牛病および猫のネコ海綿状脳症を引き起こすものを包含する。ヒトを冒すことが公知の上で論じられている4つのプリオン病は(1)クールー病、(2)クロイツフェルト・ヤコブ病(CJD)、(3)ゲルストマン・ストロイスラー・シャインカー病(GSS)、および(4)致死性家族性不眠症(FFI)である。本願において用いられるプリオンは、用いられるいずれかの動物、具体的にはヒトおよび飼育畜産動物においてこれらの疾患または他の全てまたはいずれかを引き起こすプリオンの全ての形態を包含する。 The term "prion" as used herein refers to an infectious particle known to cause disease in humans and animals (spongiform encephalopathies). The term "prion" is a contraction of the words "protein" and "infection," and the particles are primarily, if not exclusively, infected by the PRNP gene expressing PRNP C , which changes conformation to become PRNP Sc . Consists of encoded PRNP Sc molecules. Prions are distinct from bacteria, viruses, and viroids. Known prions include those that infect animals and cause scrapie, a contagious degenerative disease of the nervous system in sheep and goats, and bovine spongiform encephalopathy (BSE) or mad cow disease and feline spongiform encephalopathy in cats. . The four prion diseases known and discussed to affect humans are (1) Kuru disease, (2) Creutzfeldt-Jakob disease (CJD), and (3) Gerstmann-Streussler-Scheinker disease (GSS). , and (4) fatal familial insomnia (FFI). Prions, as used herein, encompass all forms of prions that cause these diseases and/or others in any animal used, specifically humans and domesticated livestock.

一般的に、理論によって拘束されることなしに、プリオン病はプリオンタンパク質のミスフォールディングによって引き起こされる。多くの場合に沈着性疾患と呼ばれるかかる疾患、プリオンタンパク質のミスフォールディングは次のとおり説明され得る。Aが、意図される生理的役割をモノマーまたはオリゴマー状態で実行する正常に合成された遺伝子産物であり、かつA*が、劇的な立体配座変化を経過するために有能であるAの立体配座的に活性化された形態である場合には、Bは多量体アセンブリを好む立体配座的に変改された状態であり(すなわち、沈着を形成するミスフォールディングされた形態)、かつBnは、病原性であり、リサイクルすることが相対的に困難である多量体材料である。プリオン病では、PRNPCおよびPRNPScは状態AおよびBnに対応し、ここで、Aは大きくはヘリカルかつモノマー性であり、Bnはβリッチかつ多量体性である。 Generally, without being bound by theory, prion diseases are caused by misfolding of the prion protein. Such a disease, often referred to as deposition disease, prion protein misfolding can be explained as follows. A is a normally synthesized gene product that performs its intended physiological role in a monomeric or oligomeric state, and A* is a gene product of A that is capable of undergoing dramatic conformational changes. When in the conformationally activated form, B is in a conformationally altered state that favors multimeric assembly (i.e., a misfolded form that forms deposits), and Bn is a multimeric material that is pathogenic and relatively difficult to recycle. In prion diseases, PRNP C and PRNP Sc correspond to states A and B n , where A is largely helical and monomeric and B n is β-rich and multimeric.

プリオンタンパク質のある種の変異はプリオン(prior)病の増大したリスクに関連し得るということが公知である。反対に、プリオンタンパク質のある種の変異は天然に防護性であり得る。Bagynszky et al.,“Characterization of mutations in PRNP(prion)gene and their possible roles in neurodegenerative diseases,”Neuropsychiatr Dis Treat.,2018;14:2067-2085を見よ。これの内容は参照によって本願に組み込まれる。 It is known that certain mutations in the prion protein may be associated with an increased risk of prion disease. Conversely, certain mutations of the prion protein may be naturally protective. See Bagynszky et al., “Characterization of mutations in PRNP(prion)gene and their possible roles in neurodegenerative diseases,” Neuropsychiatr Dis Treat., 2018;14:2067-2085. The contents of which are incorporated into this application by reference.

PRNP(NCBI RefSeq No.NP_000302.1(配列番号291))ヒトプリオンタンパク質は、染色体20(4686151-4701588)上に位置付けられた16kb長の遺伝子によってコードされる。それは2つのエキソンを含有し、エキソン2はオープンリーディングフレームを持ち、これは253アミノ酸(AA)長のPrPタンパク質をコードする。エキソン1は非コードエキソンであり、これは転写開始部位としての用をなし得る。翻訳後修飾は最初の22AA N末端フラグメント(NTF)および最後の23AA C末端フラグメント(CTF)の除去をもたらす。NTFは小胞体(ER)へのPrP輸送後に切断され、CTF(グリコシルホスファチジルイノシトール[GPI]シグナルペプチド[GPI-SP])はGPIアンカーによって切断される。GPIアンカーはPrPタンパク質輸送に関わり得る。それは細胞膜の外側表面へのプリオンタンパク質の取り付けの役割をもまた演じ得る。正常なPrPは、長いN末端ループ(これはオクタペプチド反復領域を含有する)、2つの短いβシート、3つのαヘリックス、およびC末端領域(これはGPIアンカーを含有する)から成る。PrPの切断は、細胞膜にアンカー固定される208AA長の糖タンパク質をもたらす。 PRNP (NCBI RefSeq No. NP_000302.1 (SEQ ID NO: 291)) human prion protein is encoded by a 16 kb long gene located on chromosome 20 (4686151-4701588). It contains two exons, exon 2 has an open reading frame, which encodes the 253 amino acid (AA) long PrP protein. Exon 1 is a non-coding exon, which may serve as the transcription start site. Post-translational modification results in the removal of the first 22 AA N-terminal fragment (NTF) and the last 23 AA C-terminal fragment (CTF). The NTF is cleaved after PrP transport to the endoplasmic reticulum (ER), and the CTF (glycosylphosphatidylinositol [GPI] signal peptide [GPI-SP]) is cleaved by the GPI anchor. The GPI anchor may be involved in PrP protein transport. It may also play a role in the attachment of the prion protein to the outer surface of the cell membrane. Normal PrP consists of a long N-terminal loop (which contains an octapeptide repeat region), two short β-sheets, three α-helices, and a C-terminal region (which contains a GPI anchor). Cleavage of PrP results in a 208AA long glycoprotein that is anchored to the cell membrane.

PRNP(NP_000302.1)のアミノ酸配列は以下のとおりである:
MANLGCWMLVLFVATWSDLGLCKKRPKPGGWNTGGSRYPGQGSPGGNRYPPQGGGGWGQPHGGGWGQPHGGGWGQPHGGGWGQPHGGGWGQGGGTHSQWNKPSKPKTNMKHMAGAAAAGAVVGGLGGYMLGSAMSRPIIHFGSDYEDRYYRENMHRYPNQVYYRPMDEYSNQNNFVHDCVNITIKQHTVTTTTKGENFTETDVKMMERVVEQMCITQYERESQAYYQRGSSMVLFSSPPVILLISFLIFLIVG(配列番号291)。
The amino acid sequence of PRNP (NP_000302.1) is as follows:
MANLGCWMLVLFVATWSDLGLCKKRPKPGGWNTGGSRYPGQGSPGGNRYPPQGGGGWGQPHGGGWGQPHGGGWGQPHGGGWGQPHGGGWGQGGGTHSQWNKPSKPKTNMKHMAGAAAAGAVVGGGLGGYMLGSAMSRPIIHFGSDYEDRYYRENMHRYPNQVYYRPMDEYSNQNNFVHDCVNITIKQHTVTTTTKGENFTETDVKMMERV VEQMCITQYERESQAYYQRGSSMVLFSSPPVILLISFLIFLIVG (SEQ ID NO: 291).

PRNP(NP_000302.1)のアミノ酸配列は、以下のヌクレオチド配列(NCBI Ref.Seq No.NM_000311.5,“homo sapiens prion protein(PRNP),transcript variant 1,mRNA)によってコードされ、以下のとおりである:
GCGAACCTTGGCTGCTGGATGCTGGTTCTCTTTGTGGCCACATGGAGTGACCTGGGCCTCTGCAAGAAGCGCCCGAAGCCTGGAGGATGGAACACTGGGGGCAGCCGATACCCGGGGCAGGGCAGCCCTGGAGGCAACCGCTACCCACCTCAGGGCGGTGGTGGCTGGGGGCAGCCTCATGGTGGTGGCTGGGGGCAGCCTCATGGTGGTGGCTGGGGGCAGCCCCATGGTGGTGGCTGGGGACAGCCTCATGGTGGTGGCTGGGGTCAAGGAGGTGGCACCCACAGTCAGTGGAACAAGCCGAGTAAGCCAAAAACCAACATGAAGCACATGGCTGGTGCTGCAGCAGCTGGGGCAGTGGTGGGGGGCCTTGGCGGCTACATGCTGGGAAGTGCCATGAGCAGGCCCATCATACATTTCGGCAGTGACTATGAGGACCGTTACTATCGTGAAAACATGCACCGTTACCCCAACCAAGTGTACTACAGGCCCATGGATGAGTACAGCAACCAGAACAACTTTGTGCACGACTGCGTCAATATCACAATCAAGCAGCACACGGTCACCACAACCACCAAGGGGGAGAACTTCACCGAGACCGACGTTAAGATGATGGAGCGCGTGGTTGAGCAGATGTGTATCACCCAGTACGAGAGGGAATCTCAGGCCTATTACCAGAGAGGATCGAGCATGGTCCTCTTCTCCTCTCCACCTGTGATCCTCCTGATCTCTTTCCTCATCTTCCTGATAGTGGGATGAGGAAGGTCTTCCTGTTTTCACCATCTTTCTAATCTTTTTCCAGCTTGAGGGAGGCGGTATCCACCTGCAGCCCTTTTAGTGGTGGTGTCTCACTCTTTCTTCTCTCTTTGTCCCGGATAGGCTAATCAATACCCTTGGCACTGATGGGCACTGGAAAACATAGAGTAGACCTGAGATGCTGGTCAAGCCCCCTTTGATTGAGTTCATCATGAGCCGTTGCTAATGCCAGGCCAGTAAAAGTATAACAGCAAATAACCATTGGTTAATCTGGACTTATTTTTGGACTTAGTGCAACAGGTTGAGGCTAAAACAAATCTCAGAACAGTCTGAAATACCTTTGCCTGGATACCTCTGGCTCCTTCAGCAGCTAGAGCTCAGTATACTAATGCCCTATCTTAGTAGAGATTTCATAGCTATTTAGAGATATTTTCCATTTTAAGAAAACCCGACAACATTTCTGCCAGGTTTGTTAGGAGGCCACATGATACTTATTCAAAAAAATCCTAGAGATTCTTAGCTCTTGGGATGCAGGCTCAGCCCGCTGGAGCATGAGCTCTGTGTGTACCGAGAACTGGGGTGATGTTTTACTTTTCACAGTATGGGCTACACAGCAGCTGTTCAACAAGAGTAAATATTGTCACAACACTGAACCTCTGGCTAGAGGACATATTCACAGTGAACATAACTGTAACATATATGAAAGGCTTCTGGGACTTGAAATCAAATGTTTGGGAATGGTGCCCTTGGAGGCAACCTCCCATTTTAGATGTTTAAAGGACCCTATATGTGGCATTCCTTTCTTTAAACTATAGGTAATTAAGGCAGCTGAAAAGTAAATTGCCTTCTAGACACTGAAGGCAAATCTCCTTTGTCCATTTACCTGGAAACCAGAATGATTTTGACATACAGGAGAGCTGCAGTTGTGAAAGCACCATCATCATAGAGGATGATGTAATTAAAAAATGGTCAGTGTGCAAAGAAAAGAACTGCTTGCATTTCTTTATTTCTGTCTCATAATTGTCAAAAACCAGAATTAGGTCAAGTTCATAGTTTCTGTAATTGGCTTTTGAATCAAAGAATAGGGAGACAATCTAAAAAATATCTTAGGTTGGAGATGACAGAAATATGATTGATTTGAAGTGGAAAAAGAAATTCTGTTAATGTTAATTAAAGTAAAATTATTCCCTGAATTGTTTGATATTGTCACCTAGCAGATATGTATTACTTTTCTGCAATGTTATTATTGGCTTGCACTTTGTGAGTATTCTATGTAAAAATATATATGTATATAAAATATATATTGCATAGGACAGACTTAGGAGTTTTGTTTAGAGCAGTTAACATCTGAAGTGTCTAATGCATTAACTTTTGTAAGGTACTGAATACTTAATATGTGGGAAACCCTTTTGCGTGGTCCTTAGGCTTACAATGTGCACTGAATCGTTTCATGTAAGAATCCAAAGTGGACACCATTAACAGGTCTTTGAAATATGCATGTACTTTATATTTTCTATATTTGTAACTTTGCATGTTCTTGTTTTGTTATATAAAAAAATTGTAAATGTTTAATATCTGACTGAAATTAAACGAGCGAAGATGAGCACCA(配列番号292)
The amino acid sequence of PRNP (NP_000302.1) is encoded by the following nucleotide sequence (NCBI Ref.Seq No.NM_000311.5, “homo sapiens prion protein (PRNP), transcript variant 1, mRNA), and is as follows. :
(Sequence number 292)

CJDおよびFFIにリンクしているPRNP(NP_000302.1)に対して相対的な変異部位が次のとおり報告されている。これらの変異は、本明細書に開示のプライム編集因子を用いて除去または組み入れられ得る。

Figure 2020191234000128
Figure 2020191234000129
The relative mutation sites for PRNP (NP_000302.1) linked to CJD and FFI have been reported as follows. These mutations can be removed or incorporated using the prime editing factors disclosed herein.
Figure 2020191234000128
Figure 2020191234000129

GSSへ繋がる、PRNP(NP_000302.1)(配列番号291)と比べた突然変異部位は、以下のとおり報告されている:

Figure 2020191234000130
Figure 2020191234000131
The mutation site compared to PRNP (NP_000302.1) (SEQ ID NO: 291) leading to GSS is reported as follows:
Figure 2020191234000130
Figure 2020191234000131

プリオン病に対して起こり得る防護特質(protective nature)へ繋がるPRNP(NP_000302.1)(配列番号291)と比べた突然変異部位は以下のとおりである:

Figure 2020191234000132
Figure 2020191234000133
The mutation sites compared to PRNP (NP_000302.1) (SEQ ID NO: 291) leading to possible protective nature against prion diseases are as follows:
Figure 2020191234000132
Figure 2020191234000133

それゆえに、種々の態様において、プライム編集は、プリオン病にリンクしているPRNPの変異を除去するかまたはプリオン病に対して防護性であると考慮されるPRNPの変異を組み入れるために用いられ得る。例えば、プライム編集は、PRNPタンパク質のD178N、V180I、T188K、E196K、E196A、E200K、E200G、V203I、R208H、V210I、E211Q、I215V、またはM232R変異を除去または復元するために用いられ得る(NP_000302.1のPRNPに対して相対的)(配列番号291)。他の態様において、プライム編集は、PRNPタンパク質のP102L、P105L、A117V、G131V、V176G、H187R、F198S、D202N、Q212P、Q217R、またはM232T変異を除去または復元するために用いられ得る(NP_000302.1のPRNPに対して相対的)(配列番号291)。プライム編集を用いてPRNPのかかる変異の存在を除去または修正することによって、プリオン病のリスクが縮減または消去され得る。 Therefore, in various embodiments, prime editing can be used to remove mutations in PRNP that are linked to prion diseases or to incorporate mutations in PRNP that are considered to be protective against prion diseases. . For example, prime editing can be used to remove or restore the D178N, V180I, T188K, E196K, E196A, E200K, E200G, V203I, R208H, V210I, E211Q, I215V, or M232R mutations in the PRNP protein (NP_000302.1 (relative to PRNP) (SEQ ID NO: 291). In other embodiments, prime editing may be used to remove or restore the P102L, P105L, A117V, G131V, V176G, H187R, F198S, D202N, Q212P, Q217R, or M232T mutations in the PRNP protein (NP_000302.1). relative to PRNP) (SEQ ID NO: 291). By removing or correcting the presence of such mutations in PRNP using prime editing, the risk of prion disease may be reduced or eliminated.

他の態様において、プライム編集は、1つ以上のプリオン病に対する防護性の効果にリンクしているPRNPの防護性変異を組み入れるために用いられ得る。例えば、プライム編集は、PRNPのG127S、G127V、M129V、D167G、D167N、N171S、E219K、またはP238S防護性変異を組み入れるために用いられ得る(NP_000302.1のPRNPに対して相対的)(配列番号291)。なお他の態様において、防護性変異は、PRNPのG127、G127、M129、D167、D167、N171、E219、またはP238に組み入れされるいずれかの代替アミノ酸であり得る(NP_000302.1のPRNPに対して相対的)(配列番号291)。 In other embodiments, prime editing can be used to incorporate protective mutations in PRNP that are linked to protective effects against one or more prion diseases. For example, prime editing can be used to incorporate G127S, G127V, M129V, D167G, D167N, N171S, E219K, or P238S protective mutations in PRNP (relative to PRNP in NP_000302.1) (SEQ ID NO: 291 ). In still other embodiments, the protective mutation can be any alternative amino acid incorporated at G127, G127, M129, D167, D167, N171, E219, or P238 of PRNP (for PRNP of NP_000302.1 relative) (SEQ ID NO: 291).

具体的な態様では、図27において例解され例5において論じられるとおり、プライム編集はG127V防護性変異をPRNPに組み入れるために用いられ得る。 In a specific embodiment, prime editing can be used to incorporate the G127V protective mutation into PRNP, as illustrated in Figure 27 and discussed in Example 5.

別の態様では、プライム編集はE219K防護性変異をPRNPに組み入れるために用いられ得る。 In another embodiment, prime editing can be used to incorporate the E219K protective mutation into PRNP.

PRNPタンパク質および防護性変異部位は哺乳動物において保存されている。そのため、ヒト疾患を処置することに加えて、それは、プリオン病に対して免疫がある牛および羊を生成するか、またはさらにはプリオン病を患っている動物の野生集団を治癒させることを助けるためにもまた用いられ得る。プライム編集はヒト細胞における天然に存在する防護性アレルの~25%組み入れを達成するためにすでに用いられており、先のマウス実験は組み入れのこのレベルがほとんどのプリオン病に対する免疫を引き起こすために十分であるということを指示している。この方法は、ほとんどの細胞型においてかかる高い効率でこのアレルを組み入れるための最初のかつ可能性としては唯一の現行のやり方である。処置のための別の可能な戦略は、プライム編集を用いて、早期停止コドンを遺伝子に組み入れることによってPRNPの発現を縮減または消去することである。 The PRNP protein and protective mutation sites are conserved in mammals. Therefore, in addition to treating human diseases, it could be used to generate cattle and sheep that are immune to prion diseases, or even to help cure wild populations of animals suffering from prion diseases. It can also be used. Prime editing has already been used to achieve ~25% incorporation of naturally occurring protective alleles in human cells, and previous mouse experiments have shown that this level of incorporation is sufficient to induce immunity against most prion diseases. It indicates that. This method is the first and potentially the only current way to incorporate this allele with such high efficiency in most cell types. Another possible strategy for treatment is to use prime editing to reduce or eliminate expression of PRNP by incorporating a premature stop codon into the gene.

PEgRNAデザインのための本明細書に記載の原理を用いて、所望の防護性変異を組み入れるためのまたはプリオン病関連変異をPRNPから除去するための適当なPEgRNAがデザインされ得る。例えば、PEgRNAの下のリストは、G127V防護性アレルおよびE219K防護性アレルをヒトPRNPに、ならびにG127V防護性アレルを種々の動物のPRNPに組み入れるために用いられ得る。

Figure 2020191234000134
Figure 2020191234000135
Using the principles described herein for PEgRNA design, suitable PEgRNAs can be designed to incorporate desired protective mutations or to remove prion disease-associated mutations from PRNP. For example, the list below of PEgRNA can be used to incorporate the G127V and E219K protective alleles into human PRNPs, and the G127V protective allele into PRNPs of various animals.
Figure 2020191234000134
Figure 2020191234000135

F.RNAタグ付けのためのプライム編集の使用
プライム編集は、RNAタグ付けによってRNA機能をコードするDNAの配列を操作、変改、および別様に改変するためにもまた用いられ得、このやり方で、RNAの構造および機能を間接的に改変するための手段を提供する。例えば、PEは、非コードRNAまたはmRNAをタグ付けまたは別様に操作するためのRNAレベルで機能的であるモチーフ(これ以降ではRNAモチーフ)を挿入するために用いられ得る。これらのモチーフは、遺伝子発現を増大させるか、遺伝子発現を減少させるか、スプライシングを変改するか、転写後修飾を変化させるか、RNAの細胞下レベル位置付けに影響するか、RNAの単離または細胞内もしくは外の位置付けの決定を可能化するか(例えば、蛍光RNAアプタマー、例えばSpinach、Spinach2、Baby Spinach、またはBroccoliを用いる)、内生もしくは外因的なタンパク質もしくはRNA結合因子を動員するか、sgRNAを導入するか、あるいは自己切断またはRNAseどちらかによるRNAのプロセシングを誘導するための用をなし得る(さらなる詳細については図28Bおよび例6を見よ)。
F. Using prime editing for RNA tagging
Prime editing can also be used to manipulate, alter, and otherwise modify the sequences of DNA encoding RNA functions by RNA tagging, and in this way indirectly alter RNA structure and function. provide the means to do so. For example, PE can be used to insert motifs (hereinafter RNA motifs) that are functional at the RNA level for tagging or otherwise manipulating non-coding RNA or mRNA. These motifs may increase gene expression, decrease gene expression, alter splicing, alter post-transcriptional modifications, affect subcellular localization of RNA, or affect RNA isolation or allow determination of intracellular or extracellular localization (e.g., using fluorescent RNA aptamers such as Spinach, Spinach2, Baby Spinach, or Broccoli), recruit endogenous or exogenous protein or RNA binding factors, It can be used to introduce sgRNA or induce processing of the RNA either by self-cleavage or by RNAse (see Figure 28B and Example 6 for further details).

次のRNAタグまたはモチーフが、RNA輸送、発現レベル、スプライシング、および検出を包含するRNAの種々の特性に影響するための適当なPEgRNA(本願において提供されるガイダンスを用いてデザインされる)によるプライム編集を用いて目当ての遺伝子上に挿入され得る。

Figure 2020191234000136
Figure 2020191234000137
Figure 2020191234000138
Figure 2020191234000139
Figure 2020191234000140
Figure 2020191234000141
Figure 2020191234000142
Figure 2020191234000143
The following RNA tags or motifs are primed with appropriate PEgRNA (designed using the guidance provided herein) to influence various properties of RNA, including RNA transport, expression levels, splicing, and detection. It can be inserted onto the gene of interest using editing.
Figure 2020191234000136
Figure 2020191234000137
Figure 2020191234000138
Figure 2020191234000139
Figure 2020191234000140
Figure 2020191234000141
Figure 2020191234000142
Figure 2020191234000143

上の表のPEgRNAは、上のモチーフの例をHEXA遺伝子(テイ・サックス病において欠陥がある)に部位特異的に挿入するためにデザインされている(例えば、GenBank No.KR710351.1(配列番号369)。しかしながら、これは例解の目的のためのみである。RNAタグ付けへのプライム編集の使用はHEXA遺伝子に限定されず、実にいずれかの遺伝子であり得る。
HEXA mRNAは以下のヌクレオチド配列を有する:
GTTCGTTGCAACAAATTGATGAGCAATGCTTTTTTATAATGCCAACTTTGTACAAAAAAGTTGGCATGACAAGTTCCAGGCTTTGGTTTTCGCTGCTGCTGGCGGCAGCGTTCGCAGGACGGGCGACGGCCCTCTGGCCCTGGCCTCAGAACTTCCAAACCTCCGACCAGCGCTACGTCCTTTACCCGAACAACTTTCAATTCCAGTACGATGTCAGCTCGGCCGCGCAGCCCGGCTGCTCAGTCCTCGACGAGGCCTTCCAGCGCTATCGTGACCTGCTTTTCGGTTCCGGGTCTTGGCCCCGTCCTTACCTCACAGGGAAACGGCATACACTGGAGAAGAATGTGTTGGTTGTCTCTGTAGTCACACCTGGATGTAACCAGCTTCCTACTTTGGAGTCAGTGGAGAATTATACCCTGACCATAAATGATGACCAGTGTTTACTCCTCTCTGAGACTGTCTGGGGAGCTCTCCGAGGTCTGGAGACTTTTAGCCAGCTTGTTTGGAAATCTGCTGAGGGCACATTCTTTATCAACAAGACTGAGATTGAGGACTTTCCCCGCTTTCCTCACCGGGGCTTGCTGTTGGATACATCTCGCCATTACCTGCCACTCTCTAGCATCCTGGACACTCTGGATGTCATGGCGTACAATAAATTGAACGTGTTCCACTGGCATCTGGTAGATGATCCTTCCTTCCCATATGAGAGCTTCACTTTTCCAGAGCTCATGAGAAAGGGGTCCTACAACCCTGTCACCCACATCTACACAGCACAGGATGTGAAGGAGGTCATTGAATACGCACGGCTCCGGGGTATCCGTGTGCTTGCAGAGTTTGACACTCCTGGCCACACTTTGTCCTGGGGACCAGGTATCCCTGGATTACTGACTCCTTGCTACCCTGGGTCTGAGCCCTCTGGCACCTTTGGACCAGTGAATCCCAGTCTCAATAATACCTATGAGTTCATGAGCACATTCTTCTTAGAAGTCAGCTCTGTCTTCCCAGATTTTTATCTTCATCTTGGAGGAGATGAGGTTGATTTCACCTGCTGGAAGTCCAACCCAGAGATCCAGGACTTTATGAGGAAGAAAGGCTTCGGTGAGGACTTCAAGCAGCTGGAGTCCTTCTACATCCAGACGCTGCTGGACATCGTCTCTTCTTATGGCAAGGGCTATGTGGTGTGGCAGGAGGTGTTTGATAATAAAGTAAAGATTCAGCCAGACACAATCATACAGGTGTGGCGAGAGGATATTCCAGTGAACTATATGAAGGAGCTGGAACTGGTCACCAAGGCCGGCTTCCGGGCCCTTCTCTCTGCCCCCTGGTACCTGAACCGTATATCCTATGGCCCTGACTGGAAGGATTTCTACGTAGTGGAACCCCTGGCATTTGAAGGTACCCCTGAGCAGAAGGCTCTGGTGATTGGTGGAGAGGCTTGTATGTGGGGAGAATATGTGGACAACACAAACCTGGTCCCCAGGCTCTGGCCCAGAGCAGGGGCTGTTGCCGAAAGGCTGTGGAGCAACAAGTTGACATCTGACCTGACATTTGCCTATGAACGTTTGTCACACTTCCGCTGTGAGTTGCTGAGGCGAGGTGTCCAGGCCCAACCCCTCAATGTAGGCTTCTGTGAGCAGGAG TTTGAACAGACCTGCCCAACTTTCTTGTACAAAGTTGGCATTATAAGAAAGCATTGCTTATCAATTTGTTGCAACGAAC(配列番号369)。
The PEgRNAs in the table above are designed to site-specifically insert examples of the motifs above into the HEXA gene (defective in Tay-Sachs disease) (e.g., GenBank No. KR710351.1 (SEQ ID NO: 369). However, this is for illustrative purposes only; the use of prime editing for RNA tagging is not limited to the HEXA gene, but can indeed be any gene.
HEXA mRNA has the following nucleotide sequence:
GTTCGTTGCAACAAATTGATGAGCAATGCTTTTTATAATGCCAACTTTGTACAAAAAAGTTGGCATGACAAGTTCCAGGCTTTGGTTTTCGCTGCTGCTGGCGGCAGCGTTCGCAGGACGGGCGACGGCCCTCTGGCCCTGGCCTCAGAACTTCCAAACCTCCGACCAGCGCTACGTCCTTTACCCGAACAACTTTCAATTCCAGTACGATGTCAGCTCGGCCGCGCAGCCCGGCTGCTCAGTCCTCGACGAGGCCTTCCA GCGCTATCGTGACCTGCTTTTCGGTTCCGGGTCTTGGCCCCGTCCTTACCTCACAGGGAAACGGCATACACTGGAGAAGAATGTGTTGGTTGTCTCTGTAGTCACACCTGGATGTAACCAGCTTCCTACTTTGGAGTCAGTGGAGAATTATACCTGACCATAAATGATGACCAGTGTTTACTCCTCTCTGAGACTGTCTGGGGAGCTCTCCGAGGTCTGGAGACTTTTAGCCAGCTTGTTTGGAAATCTGCTGAGGGC ACATTCTTTATCAACAAGACTGAGATTGAGGACTTTCCCCGCTTTCCTCACCGGGGCTTGCTGTTGGATACATCTCGCCATTACCTGCCACTCTCTAGCATCCTGGACACTCTGGATGTCATGGCGTACAATAAATTGAACGTGTTCCACTGGCATCTGGTAGATGATCCTTCCTTCCCATATGAGAGCTTCACTTTTCCAGAGCTCATGAGAAAGGGGTCCTACAACCCTGTCACCCACATCTACACAGCACAGGATGTGAAGGAGG TCATTGAATACGCACGGCTCCGGGGTATCCGTGTGCTTGCAGAGTTTGACACTCCTGGCCACACTTTGTCCTGGGGACCAGGTATCCCTGGATTACTGACTCCTTGCTACCCTGGGTCTGAGCCCTCTGGCACCTTTGGACCAGTGAATCCCAGTCTCAATAATACCTATGAGTTCATGAGCACATTCTTCTTAGAAGTCAGCTCTGTCTTCCCAGATTTTTATCTTCATCTTGGAGGAGATGAGGTTGATTTCACCTGCT GGAAGTCCAACCCAGAGATCCAGGACTTTATGAGGAAGAAAGGCTTCGGTGAGGACTTCAAGCAGCTGGAGTCCTTCTACATCCAGACGCTGCTGGACATCGTCTCTTCTTATGGCAAGGGCTATGTGGTGTGGCAGGAGGTGTTTGATAATAAAGTAAAGATTCAGCCAGACACAATCATACAGGTGTGGCGAGAGGATATTCCAGTGAACTATATGAAGGAGCTGGAACTGGTCACCAAGGCCGGCTTCCGGGCCCTTC TCTCTGCCCCCTGGTACCTGAACCGTATATCCTATGGCCCTGACTGGAAGGATTTCTACGTAGTGGAACCCCTGGCATTTGAAGGTACCCCTGAGCAGAAGGCTCTGGTGATTGGTGGAGAGGCTTGTATGTGGGGAGAATATGTGGACAACAACAACCTGGTCCCAGGCTCTGGCCCAGAGCAGGGGCTGTTGCCGAAAGGCTGTGGAGCAACAAGTTGACATCTGACCTGACATTTGCCTATGAACGTTTGTCACACTTC CGCTGTGAGTTGCTGAGGCGAGGTGTCCAGGCCCAACCCCTCAATGTAGGCTTCTGTGAGCAGGAG TTTGAACAGACCTGCCCAACTTTCTTGTACAAAGTTGGCATTATAAGAAAGCATTGCTTATCAATTTGTTGCAACGAAC (SEQ ID NO: 369).

対応するHEXAタンパク質は以下のアミノ酸配列を有する:
MTSSRLWFSLLLAAAFAGRATALWPWPQNFQTSDQRYVLYPNNFQFQYDVSSAAQPGCSVLDEAFQRYRDLLFGSGSWPRPYLTGKRHTLEKNVLVVSVVTPGCNQLPTLESVENYTLTINDDQCLLLSETVWGALRGLETFSQLVWKSAEGTFFINKTEIEDFPRFPHRGLLLDTSRHYLPLSSILDTLDVMAYNKLNVFHWHLVDDPSFPYESFTFPELMRKGSYNPVTHIYTAQDVKEVIEYARLRGIRVLAEFDTPGHTLSWGPGIPGLLTPCYPGSEPSGTFGPVNPSLNNTYEFMSTFFLEVSSVFPDFYLHLGGDEVDFTCWKSNPEIQDFMRKKGFGEDFKQLESFYIQTLLDIVSSYGKGYVVWQEVFDNKVKIQPDTIIQVWREDIPVNYMKELELVTKAGFRALLSAPWYLNRISYGPDWKDFYVVEPLAFEGTPEQKALVIGGEACMWGEYVDNTNLVPRLWPRAGAVAERLWSNKLTSDLTFAYERLSHFRCELLRRGVQAQPLNVGFCEQEFEQT(配列番号370)。
The corresponding HEXA protein has the following amino acid sequence:
(SEQ ID NO: 370).

注意すべきことに、もたらされるRNAモチーフはHEXA遺伝子の翻訳領域内に包含され、タンパク質コード遺伝子の機能を遮断するであろう。挿入されるポリアデニル化モチーフは未成熟転写物終結をもたらすであろう。この部位は、転写される、それゆえにRNA産物を生ずるであろうゲノム部位内における上の表の列記されるRNAモチーフの挿入をもたらし得る可能性あるPEgRNAを単に例解している。 Of note, the resulting RNA motif will be included within the coding region of the HEXA gene and will block the function of the protein-coding gene. The inserted polyadenylation motif will result in premature transcript termination. This site is merely illustrative of potential PEgRNAs that could result in the insertion of the RNA motifs listed in the table above within the genomic site that would be transcribed and thus give rise to an RNA product.

RNAタグ付けのためのPEへの使用のためのPEgRNAは、U6プロモーター(このケースでは、Gで始まらないプロトスペーサーを包含するガイドでは、単一のグアノシンがPEgRNAの5'端に追加され、6~7つのチミンが3'端に追加されるであろう)またはpolIIプロモーター、例えばpCMV(このケースでは、自己切断エレメントまたはCsy4モチーフによってRNAの5'端からこのプロモーターの本来的に転写される配列を除去することが必要であり得、終結モチーフが、核からのRNAの搬出をもたらさないRNAの3'端に追加されることを必要とするであろう。例えば上に列記されている3'ボックスモチーフである。それはアニーリング領域の3'であろうから、このモチーフはPEの結果としてゲノム上に挿入されないであろうということに注意せよ)から発現され得る。コアPEgRNA骨格は下線付きであり、相同性およびアニーリング領域はイタリックであり、挿入配列は太字である。下で記載されるとおり、挿入される配列は上の例の逆相補体であり、よって、これらのPEgRNAはコード鎖へと標的化されることを必要とするであろうということに注意せよ。 PEgRNA for use in PE for RNA tagging is a guide that encompasses the U6 promoter (in this case, a protospacer that does not start with a G), a single guanosine is added to the 5' end of the PEgRNA, and 6 ~7 thymines would be added to the 3' end) or the polII promoter, e.g. pCMV (in this case, the naturally transcribed sequence of this promoter from the 5' end of the RNA by a self-cleaving element or Csy4 motif) may need to be removed and a termination motif added to the 3' end of the RNA that does not result in export of the RNA from the nucleus. For example, the 3' box motif (note that since it will be 3' of the annealing region, this motif will not be inserted onto the genome as a result of PE). The core PEgRNA backbone is underlined, homology and annealing regions are italicized, and inserted sequences are bolded. Note that, as described below, the inserted sequences are the reverse complement of the above example, so these PEgRNAs will need to be targeted to the coding strand.

また、HDV以外の自己切断リボザイムは、いくつかの態様では、所与の標的部位に合わせて仕立てられることを必要とするということに注意せよ;つまり、HDVはコードされる転写物をそれ自体の直ちに5'において切断するが、全ての他の自己切断リボザイムのカットされる部位はリボザイムそれ自体の内にある。よって、最初および最後の大体5~10ヌクレオチド(そしていくつかの場合には、可能性としては10よりも多く)は実際にはコードされる配列の一部であろう。例として、ハンマーヘッド自己切断リボザイムを用いて、Nがいずれかのヌクレオチドである配列5'NNNNNTCATCCTGATAAACTGCAAA3'(配列番号371)を5つのNの後で切断するためには、次の配列が挿入されるであろう。ここで、下線付き配列は完璧ではないRNA対形成エレメントを形成する。 Also note that self-cleaving ribozymes other than HDV require, in some embodiments, to be tailored to a given target site; It cuts immediately 5', but all other self-cleaving ribozyme cut sites are within the ribozyme itself. Thus, approximately the first and last 5 to 10 nucleotides (and in some cases potentially more than 10) will actually be part of the encoded sequence. As an example, to cleave the sequence 5'NNNNNTCATCCTGATAAACTGCAAA3' (SEQ ID NO: 371), where N is any nucleotide, using a hammerhead self-cleaving ribozyme after 5 N's, the following sequence is inserted: Will. Here, the underlined sequences form a non-perfect RNA pairing element.

5'NNNNNCAGTTTGTACGGATGACTGATGAGTCCCAAATAGGACGAAACGCGCTTCGGTGCGTCTCATCCTGATAAACTGCAAA-3'(配列番号372)。 5'NNNNNCAGTTTGTACGGATGACTGATGAGTCCCAAATAGGACGAAACGCGCTTCGGTGCGTCTCATCCTGATAAACTGCAAA-3' (SEQ ID NO: 372).

この対形成エレメントの長さおよび性質の観点からは有意なフレキシビリティーがあり、これは元々の提出物に列記される非HDV自己切断リボザイムのいずれかについて真であろう。上に列記されている構築物と同じプロトスペーサーを有するPEgRNAを用いてhexA mRNAを切断するハンマーヘッドリボザイムを組み入れるためには、次のPEgRNA配列が用いられ得る(標識は上と同じ): There is significant flexibility in terms of the length and nature of this pairing element, and this would be true for any of the non-HDV self-cleaving ribozymes listed in the original submission. To incorporate the hammerhead ribozyme to cleave hexA mRNA using PEgRNA with the same protospacer as the construct listed above, the following PEgRNA sequence can be used (labels are the same as above):

Figure 2020191234000144
Figure 2020191234000145
(ここで、コアPEgRNA骨格に下線を付し、相同領域およびアニーリング領域は斜字体に、挿入配列は太字にしている)(配列番号373)。
Figure 2020191234000144
Figure 2020191234000145
(Here, the core PEgRNA backbone is underlined, homology and annealing regions are in italics, and inserted sequences are in bold) (SEQ ID NO: 373).

RNAモチーフの挿入のために他のPEgRNAをデザインすることは、本明細書に記載の一般的な原理を踏襲する。しかしながら、RNAモチーフの多くは可能性として高度に構造化されているということが注意される。これはそれらが逆転写およびゲノム上に挿入されることを困難にし得る。いくつかのRNA配列、例えば単純なヘアピンでは、RNA配列それ自体およびその相補体両方が構造化されているが、しかしながら、それは上に記されている配列について真であることは非蓋然的である。よって、これらのモチーフを挿入するときには、最も蓋然的には、PEgRNAがこれらの配列の逆相補体をコードし、ゲノム上への実際にモチーフをコードするDNA配列の挿入をもたらすことが最善であろう。類似に、PEgRNA鋳型領域への自己切断リボザイムの包含はプロセシングおよび非効率的な活性をもたらすであろうが、その逆相補体の包含はもたらさないであろう。それゆえに、これらのPEgRNAは蓋然的にはコード鎖を標的化しなければならないであろうが、他の型の挿入(例えば治療学的な修正)をコードするPEgRNAは理論的にはどちらの鎖も標的化する能力があるであろう。 Designing other PEgRNAs for insertion of RNA motifs follows the general principles described herein. However, it is noted that many of the RNA motifs are potentially highly structured. This can make them difficult to reverse transcribe and insert onto the genome. In some RNA sequences, such as simple hairpins, both the RNA sequence itself and its complement are structured, however, this is unlikely to be true for the sequences noted above. . Therefore, when inserting these motifs, it is best to most likely ensure that the PEgRNA encodes the reverse complement of these sequences, resulting in the insertion of the DNA sequence actually encoding the motif onto the genome. Dew. Similarly, inclusion of a self-cleaving ribozyme into the PEgRNA template region will result in processing and inefficient activity, but inclusion of its reverse complement will not. Therefore, these PEgRNAs would likely have to target the coding strand, whereas PEgRNAs encoding other types of insertions (e.g. therapeutic modifications) could theoretically target either strand. There will be targeting capabilities.

また、挿入されるモチーフの多くでは、もたらされるPEgRNAはU6プロモーターから転写される能力がなくあり得、他のプロモーター、例えばpCMVの使用を要するということに注意せよ。類似に、より長いPEgRNAもまたより安定ではなくあり得る。m6Aマーカーなどのより短いモチーフはこの課題を有さないであろう。 Also note that for many of the inserted motifs, the resulting PEgRNA may not be capable of being transcribed from the U6 promoter, requiring the use of other promoters, such as pCMV. Similarly, longer PEgRNAs may also be less stable. Shorter motifs such as the m6A marker would not have this problem.

G.高性能遺伝子ライブラリの生成のためのプライム編集の使用
プライム編集は、定められたまたは可変の挿入、欠失、または定められたアミノ酸/ヌクレオチド変換を有するタンパク質またはRNAをコードする遺伝子の高性能ライブラリを生成するためにもまた用いられ得、高スループットスクリーニングおよび指向性進化へのそれらの使用が本明細書に記載の。プライム編集のこの適用は例7においてさらに記載され得る。
G. Using prime editing for the generation of high-performance gene libraries
Prime editing can also be used to generate high-performance libraries of protein- or RNA-encoding genes with defined or variable insertions, deletions, or defined amino acid/nucleotide conversions, allowing for high-throughput screening. and their use in directed evolution described herein. This application of prime editing can be further described in Example 7.

可変の遺伝子ライブラリの生成は最も普通には変異誘発PCRによって達成されている(Cadwell RC and Joyce GF.PCR Methods Appl.1992を見よ)。この方法は、DNAポリメラーゼの忠実性を縮減する反応条件を用いることまたはより高い変異率を有する改変されたDNAポリメラーゼを用いることどちらかに依拠する。そのため、これらのポリメラーゼのバイアスはライブラリ産物に反映される(例えば、トランスバージョンに対してトランジション変異の選好性)。ライブラリ構築のこのアプローチの内在する限定は、変えられようとする遺伝子のサイズに影響することの相対的不能である。ほとんどのDNAポリメラーゼはインデル変異(挿入または欠失)の極めて低い率を有し、これらのほとんどはタンパク質コード領域におけるフレームシフト変異をもたらし、ライブラリのメンバーがいずれかの下流のセレクションを通過することを非蓋然的にするであろう(McInerney P,Adams P,and Hadi MZ.Mol Biol Int.2014を見よ)。 Generation of variable gene libraries is most commonly accomplished by mutagenic PCR (see Cadwell RC and Joyce GF. PCR Methods Appl. 1992). This method relies on either using reaction conditions that reduce the fidelity of the DNA polymerase or using modified DNA polymerases that have higher mutation rates. As such, these polymerase biases are reflected in the library product (eg, preference for transition mutations over transversions). An inherent limitation of this approach to library construction is the relative inability to influence the size of the genes being altered. Most DNA polymerases have extremely low rates of indel mutations (insertions or deletions), and most of these result in frameshift mutations in protein coding regions, making it difficult for library members to pass through any downstream selection. (See McInerney P, Adams P, and Hadi MZ. Mol Biol Int. 2014).

加えて、PCRおよびクローニングのバイアスは、異なるサイズの遺伝子からなる単一のライブラリを生成することを困難にし得る。これらの限定は、存在するタンパク質機能を増強および新規のタンパク質機能を操作するための指向性進化の効力を厳しく限定し得る。天然の進化では、タンパク質機能または効力の大きい変化は、典型的には、変異導入のための標準的なライブラリ生成の間には生起することが非蓋然的である挿入および欠失変異に関連する。さらにその上、これらの変異は、最も普通には、疎水性コアと対比してループを形成することが予測される当のタンパク質の領域に生起する。それゆえに、従来のバイアスがないアプローチを用いて生成されるほとんどのインデルは、害があるかまたは無効かどちらかであることが蓋然的である。 In addition, PCR and cloning biases can make it difficult to generate a single library consisting of genes of different sizes. These limitations can severely limit the efficacy of directed evolution to enhance existing protein functions and engineer new protein functions. In natural evolution, large changes in protein function or potency are typically associated with insertion and deletion mutations that are unlikely to occur during standard library generation for mutagenesis. . Moreover, these mutations most commonly occur in regions of the protein in question that are predicted to form loops relative to the hydrophobic core. Therefore, most indels generated using traditional unbiased approaches are likely to be either harmful or invalid.

全てのライブラリは可能な変異空間のある画分のみにアクセスするということから、それらが有益であることが最も蓋然的であろうタンパク質上の部位、例えばループ領域にかかる変異を偏らせ得るライブラリは、従来のライブラリと比べて有意な利点を有するであろう。最後に、NNKプライマーを用いるマルチステップPCRおよびクローンアセンブリによってまたはDNAシャッフリングによって、部位特異的なインデル変異を有する遺伝子ライブラリを生成することは可能であるが、これらのライブラリは連続的進化では「インデルジェネシス」の追加のラウンドを経過し得ない。連続的進化は、最小限のユーザー介入によるある型の指向性進化である。1つのかかる例はPACEである(Esvelt KM,Carlson JC,and Liu DR.Nature.2011を見よ)。連続的進化は最小限のユーザー介入によって生起するので、進化の間のライブラリ多様性のいずれかの増大はネイティブな複製機構を用いて生起するはずである。そのため、PACEでは、特定の座位として挿入または除去されたコドンを有する遺伝子のライブラリが生成およびスクリーニングされ得るが、「インデルジェネシス」の追加のラウンドは可能ではない。 Because all libraries have access to only a fraction of the possible mutation space, libraries that can bias mutations towards sites on the protein where they are most likely to be beneficial, such as loop regions, would have a significant advantage over conventional libraries. Finally, while it is possible to generate gene libraries with site-specific indel mutations by multi-step PCR and clone assembly using NNK primers or by DNA shuffling, these libraries cannot undergo additional rounds of "indelgenesis" in continuous evolution. Continuous evolution is a type of directed evolution with minimal user intervention. One such example is PACE (see Esvelt KM, Carlson JC, and Liu DR. Nature. 2011). Since continuous evolution occurs with minimal user intervention, any increase in library diversity during evolution should occur using native replication mechanisms. Thus, in PACE, libraries of genes with inserted or removed codons at specific loci can be generated and screened, but additional rounds of "indelgenesis" are not possible.

プライム編集(PE)のプログラム可能性は、高スループットスクリーニングおよび指向性進化への使用のための高度に高性能なプログラムされた遺伝子ライブラリを生成するために活用され得るということが想定される(図29Aを見よ)。PEは、プライム編集ガイドRNA(PEgRNA)上にコードされた情報を用いて、規定された遺伝子座位から定められた数のヌクレオチドを挿入、変化、または除去し得る(図29Bを見よ)。これは、非機能的なフレームシフト変異のバックグラウンド導入なしに、変異が機能の変化を生じさせることが最も蓋然的であるループ領域から挿入または除去された1つ以上のアミノ酸を有する標的化されたライブラリの生成を可能化する(図29Cを見よ)。PEは、DNAポリメラーゼまたは変異させられようとする配列どちらかに内在するバイアスにかかわらず、特定のセットの変異を組み入れるために用いられ得る。 It is envisioned that the programmability of prime editing (PE) can be exploited to generate highly performing programmed gene libraries for use in high-throughput screening and directed evolution (Fig. (see 29A). PE can insert, change, or remove a defined number of nucleotides from a defined genetic locus using information encoded on the prime editing guide RNA (PEgRNA) (see Figure 29B). This is a targeted method that has one or more amino acids inserted or removed from the loop region where the mutation is most likely to result in a change in function, without the background introduction of non-functional frameshift mutations. (See Figure 29C). PE can be used to incorporate specific sets of mutations regardless of biases inherent in either the DNA polymerase or the sequence to be mutated.

例えば、それは2つのトランスバージョンを包含する3つの連続した変異を要求するであろうから、CCCコドンを停止コドンに変換することは標準的なライブラリ生成によっては非蓋然的な生起であろうが、PEは、いずれかの所与の標的コドンをTGA停止コドンへと1ステップで変換するために用いられ得る。それらは、例えば、いずれかの疎水性アミノ酸をコードしながらいずれかの他をコードしないコドンを所与の部位に組み込むことによって、プログラムされた多様性を所与の位置に組み入れるためにもまた用いられ得る。さらにその上、PEのプログラム可能性ゆえに、複数のPEgRNAが複数の異なる編集を複数の部位に同時に生成するために利用され得、高度にプログラムされたライブラリの生成を可能化する(図29Dを見よ)。加えて、より低い忠実性を有する逆転写酵素を用いて、さもなければ不変のライブラリにおいて変異導入の領域を生成することが可能である(例えば、HIV-I逆転写酵素またはBordetellaファージ逆転写酵素)(Naorem SS,Hin J,Wang S,Lee WR,Heng X,Miller JF,Guo H.Proc Natl Acad Sci 2017およびMartinez MA,Vartanian JP,Wain-Hobson S.Proc Natl Acad Sci USA 1994を見よ)。 For example, converting a CCC codon to a stop codon would be an unlikely occurrence by standard library generation, since it would require three consecutive mutations encompassing two transversions. PE can be used to convert any given target codon into a TGA stop codon in one step. They can also be used to incorporate programmed diversity into a given position, for example, by incorporating at a given site a codon that encodes for one hydrophobic amino acid but not for any other. It can be done. Moreover, because of the programmability of PE, multiple PEgRNAs can be utilized to generate multiple different edits at multiple sites simultaneously, allowing the generation of highly programmed libraries (see Figure 29D). ). In addition, it is possible to generate regions of mutagenesis in otherwise invariant libraries using reverse transcriptases with lower fidelity (e.g., HIV-I reverse transcriptase or Bordetella phage reverse transcriptase). ) (see Naorem SS, Hin J, Wang S, Lee WR, Heng X, Miller JF, Guo H. Proc Natl Acad Sci 2017 and Martinez MA, Vartanian JP, Wain-Hobson S. Proc Natl Acad Sci USA 1994).

同じ部位に対するPEの反復的なラウンドの可能性もまた想定され、例えば、例えばループ領域において、単一の部位におけるコドンの繰り返しの挿入を許す。また、上に記載されているアプローチの全てが連続的進化に組み込まれ得るということが想定され、新規のin situ進化ライブラリの生成を可能化する(図30を見よ)。それらは、大きいライブラリをアセンブリすることがさもなければ困難であろう他の細胞型内において、例えば哺乳類細胞内において、これらのライブラリを構築するためにもまた用いられ得る。指向性進化のための最適化されたPEをコードする細菌株の生成は、改善されたまたは新規の機能性を有するタンパク質およびRNAの同定のための有用な追加のツールであろう。PEのこれらの使用の全てはPEの新規の性質を原因として非自明である。結論として、PEによるライブラリ生成は、合成生物学および指向性進化において、ならびにタンパク質およびRNAのコンビナトリアル変異体の高スループットスクリーニングにとって、高度に有用なツールであろう。
競合するアプローチ
The possibility of repeated rounds of PE to the same site is also envisaged, allowing repeated insertion of codons at a single site, for example in loop regions. It is also envisioned that all of the approaches described above can be incorporated into sequential evolution, allowing the generation of new in situ evolution libraries (see Figure 30). They can also be used to construct these libraries in other cell types where it would otherwise be difficult to assemble large libraries, such as in mammalian cells. Generation of bacterial strains encoding optimized PEs for directed evolution would be a useful additional tool for the identification of proteins and RNAs with improved or novel functionality. All of these uses of PE are non-obvious due to the novel properties of PE. In conclusion, library generation by PE will be a highly useful tool in synthetic biology and directed evolution, as well as for high-throughput screening of combinatorial variants of proteins and RNA.
competing approaches

多様なライブラリが現行で生成される主だった方法は、上に記載されている変異誘発PCRによってである(Cadwell RC and Joyce GF.PCR Methods Appl.1992を見よ)。挿入または欠失はPCRの間に定められた部位において縮重したNNKプライマーによって導入され得るが、かかる変異を複数の部位において導入することは、より多様なライブラリを変異誘発PCRによって構築する前に複数のラウンドの反復的なPCRおよびクローニングを要求し、方法を低速にする。代替的な相補的な方法はDNAシャッフリングであり、ここでは、DNase処置によって生成された遺伝子のライブラリのフラグメントがプライマーなしのPCR反応に導入され、互いに対する異なるフラグメントのアニーリングと、変異誘発PCR単独よりも多様なライブラリの急速な生成とをもたらす(Meyer AJ,Ellefson JW,Ellington AD.Curr Protoc Mol Biol.2014を見よ)。このアプローチは理論的にはインデル変異を生成し得るが、それはより多くの場合には遺伝子機能を破壊するフレームシフト変異をもたらす。さらにその上、DNAシャッフリングは遺伝子フラグメント間に高い度合の相同性を要求する。 The main way that diverse libraries are currently generated is by mutagenic PCR as described above (see Cadwell RC and Joyce GF. PCR Methods Appl. 1992). Although insertions or deletions can be introduced by degenerate NNK primers at defined sites during PCR, introducing such mutations at multiple sites is important before a more diverse library is constructed by mutagenic PCR. Requires multiple rounds of iterative PCR and cloning, making the method slow. An alternative complementary method is DNA shuffling, in which fragments of a library of genes generated by DNase treatment are introduced into a primer-free PCR reaction, resulting in annealing of the different fragments to each other and a faster response than mutagenic PCR alone. (See Meyer AJ, Ellefson JW, Ellington AD. Curr Protoc Mol Biol. 2014). Although this approach could theoretically generate indel mutations, it more often results in frameshift mutations that disrupt gene function. Moreover, DNA shuffling requires a high degree of homology between gene fragments.

これらの方法の両方はin vitroでされなければならず、もたらされるライブラリは細胞に形質転換されるが、PEによって生成されるライブラリはin situで構築され得、連続的進化へのそれらの使用を可能化する。ライブラリはインビボの変異導入によってin situで構築され得、これらのライブラリはホスト細胞機構に依拠し、インデルに対してのバイアスを発揮する。類似に、従来のクローニング方法は部位特異的な変異プロファイルを生成するために用いられ得るが、それらはin situでは用いられ得ず、一般的には、細胞に形質転換される前にin vitroで1度に1つずつアセンブリされる。原核および真核細胞型両方におけるPEの効率および幅広い機能性は、さらに、E.coliなどのモデル生物にクローニングされることおよびそれから目当ての細胞または生物に移入されることと対比して、これらのライブラリが目当ての細胞型内において直接的に構築され得るということを示唆する。標的化された多様化の別の競合するアプローチは自動多重ゲノム工学またはMAGEであり、複数の一本鎖DNAオリゴヌクレオチドが複製フォークに組み込まれ得、プログラム可能な変異をもたらし得る7。しかしながら、MAGEはホスト株の有意な改変を要求し、オフターゲットまたはバックグラウンド変異の100倍の増大に至り得るが(Nyerges A et al.Proc Natl Acad Sci USA.2016を見よ)、PEはより高度にプログラムされており、より少数のオフターゲット効果をもたらすことが予期される。加えて、MAGEは哺乳類細胞を包含する広い種々の細胞型においては実証されていない。 While both of these methods have to be done in vitro and the resulting libraries are transformed into cells, libraries generated by PE can be constructed in situ, making their use for continuous evolution enable. Libraries can be constructed in situ by in vivo mutagenesis, and these libraries rely on host cellular machinery to exert a bias against indels. Similarly, while traditional cloning methods can be used to generate site-specific mutation profiles, they cannot be used in situ and are generally grown in vitro before being transformed into cells. Assembled one at a time. The efficiency and broad functionality of PEs in both prokaryotic and eukaryotic cell types further emphasizes their ability to be cloned into model organisms such as E. coli and then transferred into cells or organisms of interest. We suggest that libraries can be constructed directly within the cell type of interest. Another competing approach to targeted diversification is automated multiplex genome engineering or MAGE, in which multiple single-stranded DNA oligonucleotides can be integrated into a replication fork, resulting in programmable mutations . However, while MAGE requires significant modification of the host strain and can lead to a 100-fold increase in off-target or background mutations (see Nyerges A et al.Proc Natl Acad Sci USA.2016), PE is more is expected to result in fewer off-target effects. Additionally, MAGE has not been demonstrated in a wide variety of cell types, including mammalian cells.

対照的に、プライム編集はライブラリ生成のための新規のかつ非自明の補完的技術である。
遺伝子ライブラリを構築するためのPEの使用
In contrast, prime editing is a novel and non-obvious complementary technique for library generation.
Use of PE to construct gene libraries

PEはプログラム可能な様式で遺伝子ライブラリを構築するために用いられ得る。 PE can be used to construct gene libraries in a programmable manner.

1つの例では、PEは、PACEを用いる連続的進化実験の間に遺伝子ライブラリにタンパク質バリアントを導入するために指向性進化実験に用いられ得、従来のアプローチでは可能ではない様式で点変異およびインデル両方の反復的蓄積を許す。 In one example, PE can be used in directed evolution experiments to introduce protein variants into gene libraries during continuous evolution experiments using PACE, allowing point mutations and indels to be introduced in a manner not possible with traditional approaches. Allows repeated accumulation of both.

PEは部位特異的にかつプログラム可能にヌクレオチドをE.coliの遺伝子配列上に挿入し得るということがすでに示されている。指向性進化は、改変されたツーハイブリッドタンパク質:タンパク質結合PACEセレクションによって、特異的なエピトープに対する改善された結合を有するモノボディを同定するために用いられ得る。これらのモノボディ上の特異的なかつ高度に可変のループは、有意に親和性および特異性に寄与する。改善されたモノボディ結合は、PACEにおいてはこれらのループの長さおよび組成を標的化された様式で変えることによって急速に得られ得る。しかしながら、配列長さを変えることはPACEの確立された機能性ではない。様々なループサイズのライブラリがPACEの出発点として用いられ得るが、長さの爾後の改善はPACEセレクションの間には発生せず、点変異およびインデル変異の有益な相乗的組み合わせへのアクセスを妨害するであろう。 It has previously been shown that PE can site-specifically and programmably insert nucleotides onto E. coli gene sequences. Directed evolution can be used to identify monobodies with improved binding to specific epitopes by modified two-hybrid protein:protein binding PACE selection. Specific and highly variable loops on these monobodies contribute significantly to affinity and specificity. Improved monobody binding can be rapidly obtained in PACE by varying the length and composition of these loops in a targeted manner. However, varying sequence length is not an established functionality of PACE. Although libraries of various loop sizes can be used as a starting point for PACE, subsequent improvements in length do not occur during PACE selection, preventing access to beneficial synergistic combinations of point and indel mutations. will.

種々の態様において、PEは、様々なループ長さを有するモノボディのin situ生成および進化を可能化することによって、PACEセレクションを改善するために用いられ得る。そうするためには、PACE E.coli株は追加のPEプラスミドに導入され得、これはPE酵素および1つ以上のPEgRNAをコードする。E.coliにおけるPE酵素およびPEgRNAの発現は、実験者によって選択される速度でPACEラグーンに送達される低分子のコントロール下にあるであろう。 In various embodiments, PE can be used to improve PACE selection by allowing in situ generation and evolution of monobodies with varying loop lengths. To do so, the PACE E. coli strain can be introduced with an additional PE plasmid, which encodes the PE enzyme and one or more PEgRNAs. Expression of PE enzyme and PEgRNA in E. coli will be under the control of small molecules delivered to the PACE lagoon at a rate selected by the experimenter.

種々の態様において、PEgRNA構成要素は、セレクションファージ上の目当ての部位へとPEを導くスペーサーを含有し、複数の3ヌクレオチドが標的部位に挿入され得るようにしてデザインされるであろう。その結果、新たなPEgRNA結合部位が導入され、標的部位における1つ以上のコドンの反復的挿入を可能化するであろう。 In various embodiments, the PEgRNA component will contain a spacer that directs the PE to the site of interest on the selection phage and will be designed such that multiple 3 nucleotides can be inserted into the target site. As a result, new PEgRNA binding sites will be introduced, allowing repeated insertion of one or more codons at the target site.

並行して、別のホストE.coli株は、1つ以上のコドンの除去の鋳型となるであろうPEgRNAを包含し得、ループサイズが進化の間に縮むことを可能化する。PACE実験は両方の株の混合物を利用し得るか、または2つを交互にしてループ配列の低速のかつコントロールされた追加または除去を許し得る。 In parallel, another host E. coli strain may contain PEgRNA that would serve as a template for the removal of one or more codons, allowing the loop size to shrink during evolution. PACE experiments can utilize a mixture of both strains or alternate between the two to allow slow and controlled addition or removal of loop sequences.

モノボディライブラリを生出するためのPEおよびPACEの使用に加えて、この技術はPEおよびPACEを用いる抗体の進化にもまた適用され得る。抗体を支配する結合原理は、モノボディを支配するものに非常に類似である:抗体相補性決定領域ループの長さはそれらの結合機能にとって重大である。さらに、より長いループ長さは、HIV-1および他のウイルス感染に対する幅広く防護性の活性を有する稀な抗体の開発に重大であることが見出されている(Mascola JR,Haynes BF.Immunol Rev.2013を見よ)。抗体または抗体由来分子への上に記載されているPEの適用は、多様なループ長さおよび様々なループ配列を有する抗体の生成を許すであろう。PACEとの組み合わせで、かかるアプローチは、標準のPACEにとってはアクセス可能でないループジオメトリによる増強された結合を許し、それゆえに高度に機能的な抗体の進化を許すであろう。 In addition to using PE and PACE to generate monobody libraries, this technique can also be applied to antibody evolution using PE and PACE. The binding principles governing antibodies are very similar to those governing monobodies: the length of antibody complementarity determining region loops is critical to their binding function. Additionally, longer loop lengths have been found to be critical for the development of rare antibodies with broadly protective activity against HIV-1 and other viral infections (Mascola JR, Haynes BF. Immunol Rev. (see .2013). Application of PE as described above to antibodies or antibody-derived molecules will allow the generation of antibodies with a variety of loop lengths and a variety of loop sequences. In combination with PACE, such an approach would allow enhanced binding due to loop geometries not accessible to standard PACE, and therefore the evolution of highly functional antibodies.

限定しない例として、次のPEgRNAが、連続的進化実験に用いられるバクテリオファージのゲノムをプログラム可能に改変するために用いられ得る:

Figure 2020191234000146
As a non-limiting example, the following PEgRNAs can be used to programmably modify the genome of bacteriophages used in continuous evolution experiments:
Figure 2020191234000146

種々の態様において、遺伝子ライブラリを構築するためのPEの使用は、エラーを起こしやすい逆転写酵素の変異誘発活性の使用をなし得る。かかる変異誘発逆転写酵素の使用は、エラーを起こしやすいRTのより低い忠実性を原因として、変異導入されたプログラム可能なライブラリの生成を容易化し得る。本願において用いられる用語「エラーを起こしやすい」逆転写酵素は、野生型M-MLV逆転写酵素のエラー率未満であるエラー率を有する、天然に存在するまたは別の逆転写酵素(例えば、野生型M-MLV逆転写酵素)から導出された逆転写酵素酵素を言う。野生型M-MLV逆転写酵素のエラー率は15,000から27,000核酸塩基組み込みにつき1エラーの範囲であることが報告されている。Boutabout et al.(2001)“DNA synthesis fidelity by the reverse transcriptase of the yeast retrotransposon Ty1,”Nucleic Acids Res 29(11):2217-2222を見よ。これは参照によって本願に組み込まれる。 In various embodiments, the use of PE to construct gene libraries may make use of the error-prone mutagenic activity of reverse transcriptase. The use of such mutagenic reverse transcriptases may facilitate the generation of mutagenized programmable libraries due to the lower fidelity of error-prone RTs. As used herein, the term "error-prone" reverse transcriptase refers to a naturally occurring or another reverse transcriptase (e.g., wild-type A reverse transcriptase enzyme derived from M-MLV reverse transcriptase. The error rate for wild-type M-MLV reverse transcriptase has been reported to range from 1 error per 15,000 to 27,000 nucleobase integrations. See Boutabout et al. (2001) “DNA synthesis fidelity by the reverse transcriptase of the yeast retrotransposon Ty1,” Nucleic Acids Res 29(11):2217-2222. This is incorporated herein by reference.

それゆえに、この適用の目的には、用語「エラーを起こしやすい」は、15,000核酸塩基組み込みにつき1つのエラー(6.7×10-5またはより高く)、例えば、14,000核酸塩基につき1エラー(7.14×10-5またはより高く)、13,000核酸塩基もしくはより少数につき1エラー(7.7×10-5またはより高く)、12,000核酸塩基もしくはより少数につき1エラー(7.7×10-5またはより高く)、11,000核酸塩基もしくはより少数につき1エラー(9.1×10-5またはより高く)、10,000核酸塩基もしくはより少数につき1エラー(1×10-4もしくは0.0001またはより高く)、9,000核酸塩基もしくはより少数につき1エラー(0.00011またはより高く)、8,000核酸塩基もしくはより少数につき1エラー(0.00013またはより高く)、7,000核酸塩基もしくはより少数につき1エラー(0.00014またはより高く)、6,000核酸塩基もしくはより少数につき1エラー(0.00016またはより高く)、5,000核酸塩基もしくはより少数につき1エラー(0.0002またはより高く)、4,000核酸塩基もしくはより少数につき1エラー(0.00025またはより高く)、3,000核酸塩基もしくはより少数につき1エラー(0.00033またはより高く)、2,000核酸塩基もしくはより少数につき1エラー(0.00050またはより高く)、または1,000核酸塩基もしくはより少数につき1エラー(0.001またはより高く)、または500核酸塩基もしくはより少数につき1エラー(0.002またはより高く)、または250核酸塩基もしくはより少数につき1エラー(0.004またはより高く)よりも多大であるエラー率を有するRTを言う。 Therefore, for the purposes of this application, the term "error-prone" means 1 error per 15,000 nucleobase integrations (6.7 × 10 -5 or higher), e.g., 1 error per 14,000 nucleobases (7.14 × 10 -5 or higher), 1 error per 13,000 nucleobases or fewer (7.7 x 10 -5 or higher), 1 error per 12,000 nucleobases or fewer (7.7 x 10 -5 or higher), 11,000 nucleobases or 1 error per 10,000 nucleobases or lower (9.1 × 10 -5 or higher), 1 error per 10,000 nucleobases or lower (1 × 10 -4 or 0.0001 or higher), 1 error per 9,000 nucleobases or lower (0.00011) or higher), 1 error per 8,000 nucleobases or lower (0.00013 or higher), 1 error per 7,000 nucleobases or lower (0.00014 or higher), 1 error per 6,000 nucleobases or lower (0.00016 or higher), higher), 1 error per 5,000 nucleobases or fewer (0.0002 or higher), 1 error per 4,000 nucleobases or fewer (0.00025 or higher), 1 error per 3,000 nucleobases or fewer (0.00033 or higher) , 1 error per 2,000 nucleobases or fewer (0.00050 or higher), or 1 error per 1,000 nucleobases or fewer (0.001 or higher), or 1 error per 500 nucleobases or fewer (0.002 or higher) , or has an error rate that is greater than 1 error per 250 nucleobases or fewer (0.004 or higher).

高度に変異導入されたプログラム可能なライブラリの生成のためには、種々の変異誘発RTが想定され得る。2つのかかる例はBordetellaファージ(Handa,S.,et al.Nucl Acids Res 9711-25(2018)を見よ。これは参照によって本願に組み込まれる)およびLegionella pneumophila(Arambula,D.,et al.Proc Natl Acad Sci USA 8212-7(2013)を見よ。これは参照によって組み込まれる)からの変異誘発逆転写酵素である。BordetellaファージからのRT(brt)のケースでは、標的部位に対する変異誘発RTの結合を改善するために、補助的なタンパク質(bavd)がCas9に、および追加のRNA配列がPEgRNAに、追加またはトランスで送達されることをもまた必要とし得る(Handa,S.,et al.Nucl Acids Res 9711-25(2018)を見よ)。変異誘発RTを用いるときには、PEgRNAの鋳型領域は、多様性を増強するためのアデノシンまたはAAYコドンが濃縮され得る。 For the generation of highly mutagenized programmable libraries, various mutagenizing RTs can be envisaged. Two such examples are the mutagenizing reverse transcriptases from Bordetella phage (see Handa, S., et al. Nucl Acids Res 9711-25 (2018), which is incorporated herein by reference) and Legionella pneumophila (see Arambula, D., et al. Proc Natl Acad Sci USA 8212-7 (2013), which is incorporated herein by reference). In the case of the RT from Bordetella phage (brt), it may also be necessary to deliver an auxiliary protein (bavd) to Cas9 and an additional RNA sequence to the PEgRNA, either additionally or in trans, to improve binding of the mutagenizing RT to the target site (see Handa, S., et al. Nucl Acids Res 9711-25 (2018)). When using mutagenic RT, the template region of the PEgRNA can be enriched for adenosine or AAY codons to enhance diversity.

Bordetellaファージからの変異誘発RTのアミノ酸配列は次のとおり提供される。本明細書に開示の他のRTのように、Brtタンパク質は、機能的なPEを形成するように融合タンパク質としてnapDNAbpに融合され得る。

Figure 2020191234000147
The amino acid sequence of mutagenic RT from Bordetella phage is provided below. Like other RTs disclosed herein, the Brt protein can be fused to napDNAbp as a fusion protein to form a functional PE.
Figure 2020191234000147

BodetellaからのBrtのケースでは、PE融合体は追加の補助的なタンパク質(Bavd)をもまた包含し得る。補助的なタンパク質はPE融合タンパク質に融合またはトランスで提供され得る。Bavd補助的タンパク質のアミノ酸配列は次のとおり提供される:

Figure 2020191234000148
In the case of Brt from Bodetella, the PE fusion may also include an additional ancillary protein (Bavd). Supplementary proteins can be fused or provided in trans to the PE fusion protein. The amino acid sequence of Bavd auxiliary protein is provided as follows:
Figure 2020191234000148

BodetellaからのBrtのケースでは、PEgRNAは、PEgRNA、例えば5'または3'端に追加された追加のヌクレオチド配列を含み得る。例示の配列は次のとおりであり、これは元々はBordetellaファージゲノムからである:

Figure 2020191234000149
In the case of Brt from Bodetella, the PEgRNA may include additional nucleotide sequences added to the PEgRNA, eg, at the 5' or 3' end. An example sequence is as follows, originally from the Bordetella phage genome:
Figure 2020191234000149

長さを短くするために、このPEgRNA追加配列は種々のやり方で縮減され得る。例えば、PEgRNA追加1配列は次の例示の代替的な追加配列へと縮減され得る:

Figure 2020191234000150
To reduce length, this PEgRNA additional sequence can be reduced in a variety of ways. For example, a PEgRNA addition sequence can be reduced to the following exemplary alternative addition sequences:
Figure 2020191234000150

他の態様において、PEgRNA追加配列もまた変異させられ得る。例えば、PEgRNA追加1配列は次の例示の代替的な追加配列へと変異させられ得る:

Figure 2020191234000151
In other embodiments, the PEgRNA addition sequence can also be mutated. For example, the PEgRNA addition 1 sequence can be mutated to the following exemplary alternative addition sequences:
Figure 2020191234000151

遺伝子ライブラリをデザインするためのPEの使用に関する種々の態様では、特殊なPEgRNAの考慮事項が適用され得る。例えば、理論によって拘束されることなしに、上に記載されている追加のPEgRNA配列は、変異誘発RTによる効率的な変異導入を可能化するために必要とされ得る。別の態様では、PEを用いる反復的なコドン挿入は特定のPEgRNAデザインを要求し得る。例えば、GGG(グリシン)コドンを反復的に挿入するためには、上に示されているとおり、PEgRNAの相同性領域全体がGから成ることを必要とし得る。これはある種の部位のみが反復的な挿入をし得るということを意味するであろう。加えて、PAM配列はPEによって遮断される能力はないであろう。 In various embodiments involving the use of PE to design gene libraries, special PEgRNA considerations may apply. For example, without being bound by theory, the additional PEgRNA sequences described above may be required to enable efficient mutagenesis by mutagenic RT. In another embodiment, repetitive codon insertion using PE may require specific PEgRNA design. For example, to repetitively insert a GGG (glycine) codon, as shown above, the entire homology region of the PEgRNA may need to consist of Gs. This would mean that only certain sites would be capable of repetitive insertion. In addition, the PAM sequence would not be capable of being blocked by PE.

H.免疫エピトープの挿入のためのプライム編集の使用
プライム編集因子は、公知の免疫原性エピトープを内生または外生のゲノムDNA上に挿入するための手段としてもまた用いられ得、治療学的またはバイオテクノロジー的適用のための対応するタンパク質の改変をもたらす(図31および32を見よ)。プライム編集の本発明に先行しては、かかる挿入は、非効率的にかつDSBからの高いインデル形成率によってのみ達成され得た。プライム編集は挿入編集からの高いインデル形成の問題を解決しながら、一般的にHDRよりも高い効率をオファーする。このより低いインデル形成率は、特に免疫原性エピトープを挿入するという記載されている適用において、標的化されたDNA挿入のための方法としてのHDRと比べたプライム編集の主要な利点を提示する。エピトープの長さは少数塩基から数百塩基の範囲である。プライム編集因子はかかる標的化された挿入を哺乳類細胞において達成するための効率的なアプローチである。
H. Use of Prime Editing for Insertion of Immune Epitopes
Prime editors can also be used as a means to insert known immunogenic epitopes onto endogenous or exogenous genomic DNA, resulting in the modification of the corresponding protein for therapeutic or biotechnological applications (see Figures 31 and 32). Prior to the present invention of prime editing, such insertions could only be achieved inefficiently and with high indel formation rates from DSBs. Prime editing offers higher efficiency than HDR in general, while solving the problem of high indel formation from insertion editing. This lower indel formation rate presents a major advantage of prime editing compared to HDR as a method for targeted DNA insertion, especially in the described application of inserting immunogenic epitopes. The length of the epitopes ranges from a few bases to several hundred bases. Prime editors are an efficient approach to achieve such targeted insertions in mammalian cells.

本発明の鍵の概念は、それらのタンパク質産物および/または発現細胞型の下方制御および/または破壊のために、内生または外生のゲノムDNA上に、先に記載された免疫原性エピトープを含有するヌクレオチド配列を挿入するためのプライム編集因子の使用である。標的遺伝子のコードされるタンパク質と挿入される免疫原性のエピトープの対応するタンパク質翻訳との融合タンパク質を生ずる様式で、免疫原性のエピトープ挿入のためのヌクレオチド配列が、遺伝子へと標的化されるであろう。患者の免疫系は、例えば破傷風またジフテリアまたは麻疹に対するルーチンの予防接種からの先行する標準免疫化の結果として、これらのエピトープを認識するように先に訓練されているであろう。融合されるエピトープの免疫原性の性質の結果として、患者の免疫系は、プライム編集されたタンパク質(ただの挿入されるエピトープではない)と可能性としてはそれが発現された細胞とを認識および不能化することが予想されるであろう。 The key concept of the present invention is to incorporate previously described immunogenic epitopes onto endogenous or exogenous genomic DNA for downregulation and/or destruction of their protein products and/or expressing cell types. The use of a prime editing agent to insert the containing nucleotide sequence. The nucleotide sequence for immunogenic epitope insertion is targeted to the gene in a manner that results in a fusion protein between the encoded protein of the target gene and the corresponding protein translation of the inserted immunogenic epitope. Will. The patient's immune system will have previously been trained to recognize these epitopes as a result of previous standard immunization, for example from routine vaccination against tetanus or diphtheria or measles. As a result of the immunogenic nature of the epitope being fused, the patient's immune system recognizes and recognizes the prime-edited protein (not just the inserted epitope) and potentially the cells in which it is expressed. It is expected that it will be disabled.

CRISPR/Casシステムを用いる精密なゲノム標的化テクノロジーが、最近では、標的ゲノム座位上への操作されたDNA配列の挿入を包含する広い範囲の適用において調査されている。先には、相同組み換え修復(HDR)がこの適用について用いられ、ssDNAドナー鋳型と二本鎖DNA切断(DSB)の手段による修復開始とを要求した。この戦略は、細胞になされるべき可能な変化の最も幅広い範囲をオファーし、大きいDNA配列を哺乳類細胞に挿入するために利用可能な唯一の方法である。しかしながら、HDRは、そのDSBを開始することから派生する望まれない細胞副作用、例えば高いレベルのインデル形成、DNA転座、大きい欠失、およびP53活性化によって邪魔される。これらの欠点に加えて、HDRは多くの細胞型における低い効率によって限定される(T細胞はこの観察の注意すべき例外である)。これらの欠点を克服するための最近の作業は、ヒトRad51変異体をCas9 D10Aニッカーゼに融合することを包含し(RDN)、DSBフリーHDRシステムをもたらす。これは、改善されたHDR産物:インデル比およびより低いオフターゲット編集を特色とするが、細胞型依存性および控えめなのみのHDR編集効率によってなお邪魔される。 Precise genome targeting technology using the CRISPR/Cas system has recently been investigated in a wide range of applications, including the insertion of engineered DNA sequences onto target genomic loci. Previously, homologous recombination repair (HDR) was used for this application, requiring an ssDNA donor template and initiation of repair by means of double-stranded DNA breaks (DSB). This strategy offers the widest range of possible changes to be made to cells and is the only method available for inserting large DNA sequences into mammalian cells. However, HDR is hampered by undesired cellular side effects derived from initiating its DSBs, such as high levels of indel formation, DNA translocations, large deletions, and P53 activation. In addition to these drawbacks, HDR is limited by low efficiency in many cell types (T cells are a notable exception to this observation). Recent work to overcome these drawbacks involves fusing human Rad51 mutants to Cas9 D10A nickase (RDN), resulting in a DSB-free HDR system. It features an improved HDR product:indel ratio and lower off-target editing, but is still hampered by cell type dependence and only modest HDR editing efficiency.

PEgRNAとカップリングされた逆転写酵素へのCas9の最近開発された融合体(「プライム編集因子」)は、存在するゲノム編集法と比べていくつもの利点をオファーする新規のゲノム編集テクノロジーを表し、部位特異的な様式で、いずれかの1ヌクレオチド置換を組み入れおよびヌクレオチドのいずれかの短いストレッチ(最高で少なくとも何ダースもの塩基)を挿入または欠失する能力を包含する。注意すべきことに、PE編集は一般的には低い意図されないインデル率によって達成される。そのため、PEは、先には不可能または非実用的であった標的化された挿入に基づく編集適用を可能化する。 A recently developed fusion of Cas9 to reverse transcriptase coupled to PEgRNA (the "prime editing factor") represents a novel genome editing technology that offers several advantages compared to existing genome editing methods. Includes the ability to incorporate any single nucleotide substitutions and insert or delete any short stretches of nucleotides (up to at least several dozen bases) in a site-specific manner. Of note, PE editing is generally achieved with low unintended indel rates. PE therefore enables targeted insertion-based editing applications that were previously impossible or impractical.

この具体的な側面は、公知の免疫原性エピトープを内生または外生のゲノムDNA上に挿入するための手段としてプライム編集を用いるための方法を記載し、治療学的またはバイオテクノロジー的適用のための対応するタンパク質の改変をもたらす(図31および32を見よ)。プライム編集の本発明に先行しては、かかる挿入は、非効率的にかつDSBからの高いインデル形成率によってのみ達成され得た。プライム編集は挿入編集からの高いインデル形成の問題を解決しながら、一般的にHDRよりも高い効率をオファーする。このより低いインデル形成率は、特に免疫原性エピトープを挿入するという記載されている適用において、標的化されたDNA挿入のための方法としてのHDRと比べたプライム編集の主要な利点を提示する。エピトープの長さは少数塩基から数百塩基の範囲である。プライム編集因子はかかる標的化された挿入を哺乳類細胞において達成するための効率的なかつ最もクリーンなアプローチである。 This specific aspect describes a method for using prime editing as a means to insert known immunogenic epitopes onto endogenous or exogenous genomic DNA, for therapeutic or biotechnological applications. (See Figures 31 and 32). Prior to the present invention of prime editing, such insertions could only be achieved inefficiently and with high rates of indel formation from DSBs. Prime editing generally offers higher efficiency than HDR while solving the problem of high indel formation from insertion editing. This lower indel formation rate presents a major advantage of prime editing compared to HDR as a method for targeted DNA insertion, especially in the described application of inserting immunogenic epitopes. Epitope lengths range from a few bases to several hundred bases. Prime editing factors are the efficient and cleanest approach to achieve such targeted insertions in mammalian cells.

この側面の鍵の概念は、それらのタンパク質産物および/または発現細胞型の下方制御および/または破壊のために、先に記載された免疫原性エピトープを含有するヌクレオチド配列を内生または外生のゲノムDNA上に挿入するためのプライム編集因子の使用である。標的遺伝子のコードされるタンパク質と挿入される免疫原性のエピトープの対応するタンパク質翻訳との融合タンパク質を生ずる様式で、免疫原性のエピトープ挿入のためのヌクレオチド配列は、遺伝子へと標的化されるであろう。患者の免疫系は、例えば破傷風またジフテリアまたは麻疹に対するルーチンの予防接種からの先行する標準免疫化の結果として、これらのエピトープを認識するように先に訓練されているであろう。融合されるエピトープの免疫原性の性質の結果として、患者の免疫系は、プライム編集されたタンパク質(ただの挿入されるエピトープではない)と可能性としてはそれが発現された細胞とを認識および不能化することが予想されるであろう。 The key concept of this aspect is that nucleotide sequences containing the previously described immunogenic epitopes can be synthesized into endogenous or exogenous proteins for downregulation and/or destruction of their protein products and/or expressing cell types. The use of prime editing factors to insert onto genomic DNA. The nucleotide sequence for immunogenic epitope insertion is targeted to the gene in a manner that results in a fusion protein between the encoded protein of the target gene and the corresponding protein translation of the inserted immunogenic epitope. Will. The patient's immune system will have previously been trained to recognize these epitopes as a result of previous standard immunization, for example from routine vaccination against tetanus or diphtheria or measles. As a result of the immunogenic nature of the epitope being fused, the patient's immune system recognizes and recognizes the prime-edited protein (not just the inserted epitope) and potentially the cells in which it is expressed. It is expected that it will be disabled.

標的遺伝子への融合体は、挿入されたエピトープタンパク質翻訳が免疫系認識のために暴露されるということを保証するために必要とされるとおり操作されるであろう。これは、免疫原性エピトープがタンパク質構造の表面に暴露された領域にコードされるようにして、標的遺伝子への免疫原性エピトープのC末端融合体、標的遺伝子への免疫原性エピトープのN末端融合体、または遺伝子上へのヌクレオチドの挿入を生むタンパク質翻訳をもたらす標的化されたヌクレオチド挿入を包含し得る。 Fusions to the target gene will be manipulated as required to ensure that the inserted epitope protein translation is exposed for immune system recognition. This results in a C-terminal fusion of the immunogenic epitope to the target gene, a C-terminal fusion of the immunogenic epitope to the target gene, such that the immunogenic epitope is encoded in a surface-exposed region of the protein structure. Fusions or targeted nucleotide insertions that result in protein translation resulting in the insertion of nucleotides onto the gene may be included.

標的遺伝子の免疫系認識、細胞輸送、タンパク質機能、またはタンパク質フォールディングを容易化するために、標的遺伝子配列と挿入される免疫原性エピトープヌクレオチド配列との間に挿入されるヌクレオチドとしてコードされるタンパク質リンカーが、本発明の一部として操作されることを必要とし得る。これらの挿入されるヌクレオチドによってコードされるタンパク質リンカーは、可変の長さおよび配列のXTENリンカーまたは可変の長さおよび配列のグリシン-セリンリンカーを包含し得る(が、これらに限定されない)。これらの操作されたリンカーは、タンパク質融合を首尾良く容易化するために先に用いられている。例示のリンカーは、本明細書に記載のもののいずれかを包含し得、アミノ酸配列(GGGGS)n(配列番号165)、(G)n(配列番号166)、(EAAAK)n(配列番号167)、(GGS)n(配列番号168)、(SGGS)n(配列番号169)、(XP)n(配列番号170)、またはそれらのいずれかの組み合わせを包含し、nは独立して1および30の間の整数であり、Xはいずれかのアミノ酸である。いくつかの態様では、リンカーはアミノ酸配列(GGS)n(配列番号176)を含み、nは1、3、または7である。いくつかの態様では、リンカーはアミノ酸配列SGSETPGTSESATPES(配列番号171)を含む。いくつかの態様では、リンカーはアミノ酸配列SGGSSGGSSGSETPGTSESATPESSGGSSGGS(配列番号172)を含む。いくつかの態様では、リンカーはアミノ酸配列SGGSGGSGGS(配列番号173)を含む。いくつかの態様では、リンカーはアミノ酸配列SGGS(配列番号174)を含む。 A protein linker encoded as a nucleotide inserted between a target gene sequence and an inserted immunogenic epitope nucleotide sequence to facilitate immune system recognition, cellular trafficking, protein function, or protein folding of the target gene. may need to be manipulated as part of the invention. The protein linkers encoded by these inserted nucleotides can include (but are not limited to) XTEN linkers of variable length and sequence or glycine-serine linkers of variable length and sequence. These engineered linkers have been used previously to successfully facilitate protein fusion. Exemplary linkers may include any of those described herein, including the amino acid sequence (GGGGS)n (SEQ ID NO: 165), (G)n (SEQ ID NO: 166), (EAAAK)n (SEQ ID NO: 167). , (GGS)n (SEQ ID NO: 168), (SGGS)n (SEQ ID NO: 169), (XP)n (SEQ ID NO: 170), or any combination thereof, where n is independently 1 and 30. is an integer between and X is any amino acid. In some embodiments, the linker comprises the amino acid sequence (GGS) n (SEQ ID NO: 176), where n is 1, 3, or 7. In some embodiments, the linker comprises the amino acid sequence SGSETPGTSESATPES (SEQ ID NO: 171). In some embodiments, the linker comprises the amino acid sequence SGGSGGSSGSETPGTSESATPESSGGSSGGS (SEQ ID NO: 172). In some embodiments, the linker comprises the amino acid sequence SGGSGGSGGS (SEQ ID NO: 173). In some embodiments, the linker comprises the amino acid sequence SGGS (SEQ ID NO: 174).

この側面の際立った特色は、さもなければ非免疫原性のタンパク質に対する免疫応答を誘導するための手段として、特定のアミノ酸配列に対する先に獲得された免疫応答を用いる能力を包含する。別の際立った特色は、副産物編集としての欲されないインデルの高いレベルを誘導せずかつその挿入が効率的である標的様式で、これらの免疫原性のエピトープのヌクレオチド配列を挿入する能力である。PEのこの特定の適用は、細胞型特異的な送達方法(例えばAAV血清型)を組み合わせて、それに対する免疫応答を誘発することが目当てである細胞型にエピトープを挿入する能力を有する。 Distinguishing features of this aspect include the ability to use previously acquired immune responses against specific amino acid sequences as a means to induce immune responses against otherwise non-immunogenic proteins. Another distinguishing feature is the ability to insert the nucleotide sequences of these immunogenic epitopes in a targeted manner that does not induce high levels of unwanted indels as editing byproducts and where the insertion is efficient. This particular application of PE has the ability to combine cell type-specific delivery methods (eg, AAV serotypes) to insert epitopes into the cell type against which it is aimed to elicit an immune response.

免疫原性のエピトープを病原性の遺伝子上に挿入する手段としてのプライム編集は、広い種々の疾患(免疫腫瘍学戦略のがんに限定されない)と戦うように患者の免疫系をプログラムするために用いられ得る。このテクノロジーの直ちに該当する使用は、がんの治療学としてであろう。なぜなら、それは、HER2のような該当するがん遺伝子またはEGFRのような増殖因子に対する免疫応答を引き起こすことによって、腫瘍の免疫エスケープ機序を阻み得るからである。かかるアプローチはT細胞操作に類似に見え得るが、このアプローチの1つの新規の進歩は、操作されたT細胞を生成し患者に導入することを必要とすることなしに、それが多くの細胞型におよびがん以外の疾患に利用され得るということである。 Prime editing as a means of inserting immunogenic epitopes onto pathogenic genes can be used to program a patient's immune system to fight a wide variety of diseases (not limited to cancer in immuno-oncology strategies). can be used. An immediate relevant use of this technology would be as a cancer therapeutic. This is because it can thwart the tumor's immune escape mechanism by triggering an immune response against the relevant oncogenes, such as HER2, or growth factors, such as EGFR. Although such an approach may appear similar to T cell engineering, one novel advance in this approach is that it can be used to generate engineered T cells and to introduce them into patients, allowing them to be used in many cell types. This means that it can be used to treat diseases other than cancer.

PEを用いて、ほとんどの者がすでに予防接種されている免疫原性エピトープ(破傷風、百日咳、ジフテリア、麻疹、ムンプス、風疹など)を疾患を駆動する外生のまたは内生遺伝子上に挿入し、そのため、患者の免疫系はそのタンパク質を不能化することを学習する。 PE is used to insert an immunogenic epitope (such as tetanus, pertussis, diphtheria, measles, mumps, rubella) against which most people are already vaccinated onto an exogenous or endogenous gene that drives the disease; Therefore, the patient's immune system learns to disable the protein.

前述の戦略からの可能性ある治療学的な利益を有しそうな疾患は、毒性のタンパク質の凝集によって引き起こされるもの、例えば致死性家族性不眠症を包含する。利し得る他の疾患は、さもなければ非毒性の内生タンパク質の病原性の過剰発現によって引き起こされるもの、および外生の病原体によって引き起こされるものを包含する。 Diseases that would have potential therapeutic benefit from the aforementioned strategies include those caused by toxic protein aggregation, such as fatal familial insomnia. Other diseases that may benefit include those caused by pathogenic overexpression of otherwise non-toxic endogenous proteins, and those caused by exogenous pathogens.

一次的な治療学的適応は、上で言及されているもの、例えばがん、プリオン、および他の神経変性疾患の治療学、感染性疾患、ならびに予防的な医療を包含する。二次的な治療学的適応は、遅発性の遺伝子疾患を有する患者の予防的ケアを包含し得る。特に侵襲性のがんのようないくつかの疾患では、または薬物治療が疾患が完全に治癒するまで疾患症状を緩和することを助けるケースでは、現行の標準治療の医療がプライム編集と併せて用いられ得るということが予想される。下は、本明細書に開示のプライム編集因子によって遺伝子上に挿入され得る免疫エピトープの例である:

Figure 2020191234000152
Figure 2020191234000153
Figure 2020191234000154
Figure 2020191234000155
Figure 2020191234000156
Primary therapeutic indications include those mentioned above, such as the therapeutics of cancer, prions, and other neurodegenerative diseases, infectious diseases, and preventive medicine. Secondary therapeutic indications may include preventive care of patients with late-onset genetic diseases. In some diseases, especially aggressive cancers, or in cases where drug therapy helps alleviate disease symptoms until the disease is completely cured, the current standard of care medicine is used in conjunction with prime editing. It is expected that this may occur. Below are examples of immune epitopes that can be inserted onto genes by the prime editing factors disclosed herein:
Figure 2020191234000152
Figure 2020191234000153
Figure 2020191234000154
Figure 2020191234000155
Figure 2020191234000156

当該技術分野で公知の追加の免疫エピトープもまた組み入れられ得る。Immune Epitope Database and Analysis Resource(iedb.org/epitopedetails_v3.php)(これの内容は参照によって本願に組み込まれる)から利用可能な免疫エピトープのいずれかは、本明細書に開示のプライム編集因子によって組み入れられ得る。 Additional immune epitopes known in the art may also be incorporated. Any of the immune epitopes available from the Immune Epitope Database and Analysis Resource (iedb.org/epitopedetails_v3.php), the contents of which are incorporated herein by reference, can be incorporated by the prime editing factors disclosed herein. obtain.

いくつかの態様では、本明細書に開示のプライム編集因子によって組み入れられ得る免疫エピトープは次のエピトープのいずれかを包含し得る:

Figure 2020191234000157
Figure 2020191234000158
Figure 2020191234000159
Figure 2020191234000160
Figure 2020191234000161
Figure 2020191234000162
Figure 2020191234000163
Figure 2020191234000164
Figure 2020191234000165
Figure 2020191234000166
Figure 2020191234000167
Figure 2020191234000168
Figure 2020191234000169
Figure 2020191234000170
Figure 2020191234000171
Figure 2020191234000172
Figure 2020191234000173
Figure 2020191234000174
Figure 2020191234000175
Figure 2020191234000176
Figure 2020191234000177
Figure 2020191234000178
Figure 2020191234000179
Figure 2020191234000180
Figure 2020191234000181
Figure 2020191234000182
Figure 2020191234000183
Figure 2020191234000184
Figure 2020191234000185
Figure 2020191234000186
Figure 2020191234000187
Figure 2020191234000188
Figure 2020191234000189
Figure 2020191234000190
Figure 2020191234000191
Figure 2020191234000192
Figure 2020191234000193
Figure 2020191234000194
Figure 2020191234000195
Figure 2020191234000196
Figure 2020191234000197
Figure 2020191234000198
Figure 2020191234000199
Figure 2020191234000200
Figure 2020191234000201
Figure 2020191234000202
Figure 2020191234000203
Figure 2020191234000204
Figure 2020191234000205
Figure 2020191234000206
Figure 2020191234000207
Figure 2020191234000208
Figure 2020191234000209
Figure 2020191234000210
Figure 2020191234000211
Figure 2020191234000212
Figure 2020191234000213
Figure 2020191234000214
Figure 2020191234000215
Figure 2020191234000216
Figure 2020191234000217
Figure 2020191234000218
Figure 2020191234000219
Figure 2020191234000220
Figure 2020191234000221
Figure 2020191234000222
In some embodiments, immune epitopes that can be incorporated by the prime editing factors disclosed herein can include any of the following epitopes:
Figure 2020191234000157
Figure 2020191234000158
Figure 2020191234000159
Figure 2020191234000160
Figure 2020191234000161
Figure 2020191234000162
Figure 2020191234000163
Figure 2020191234000164
Figure 2020191234000165
Figure 2020191234000166
Figure 2020191234000167
Figure 2020191234000168
Figure 2020191234000169
Figure 2020191234000170
Figure 2020191234000171
Figure 2020191234000172
Figure 2020191234000173
Figure 2020191234000174
Figure 2020191234000175
Figure 2020191234000176
Figure 2020191234000177
Figure 2020191234000178
Figure 2020191234000179
Figure 2020191234000180
Figure 2020191234000181
Figure 2020191234000182
Figure 2020191234000183
Figure 2020191234000184
Figure 2020191234000185
Figure 2020191234000186
Figure 2020191234000187
Figure 2020191234000188
Figure 2020191234000189
Figure 2020191234000190
Figure 2020191234000191
Figure 2020191234000192
Figure 2020191234000193
Figure 2020191234000194
Figure 2020191234000195
Figure 2020191234000196
Figure 2020191234000197
Figure 2020191234000198
Figure 2020191234000199
Figure 2020191234000200
Figure 2020191234000201
Figure 2020191234000202
Figure 2020191234000203
Figure 2020191234000204
Figure 2020191234000205
Figure 2020191234000206
Figure 2020191234000207
Figure 2020191234000208
Figure 2020191234000209
Figure 2020191234000210
Figure 2020191234000211
Figure 2020191234000212
Figure 2020191234000213
Figure 2020191234000214
Figure 2020191234000215
Figure 2020191234000216
Figure 2020191234000217
Figure 2020191234000218
Figure 2020191234000219
Figure 2020191234000220
Figure 2020191234000221
Figure 2020191234000222

I.プライム編集因子の送達
別の側面において、本開示は、種々の戦略を用いてin vitroおよびインビボのプライム編集因子の送達を可能にし、分裂インテインを用いる別個のベクター、ならびにエレクトロポレーションなどの技術を用いるリボヌクレオタンパク質複合体(すなわち、PEgRNAおよび/または第2部位gRNAと複合体化したプライム編集因子)、カチオン性脂質によって媒介される製剤の使用、およびリボヌクレオタンパク質複合体に融合された受容体リガンドを用いる誘導性エンドサイトーシス法という直接的送達戦略を包含する。いずれかのかかる方法が本願において企図される。
I. Delivery of prime editing factors
In another aspect, the present disclosure enables the delivery of prime editing factors in vitro and in vivo using a variety of strategies, including separate vectors using split inteins, and ribonucleoprotein complexes using techniques such as electroporation. the use of cationic lipid-mediated formulations, and receptor ligands fused to ribonucleoprotein complexes (i.e., PEgRNA and/or prime editing factors complexed with second-site gRNAs) It includes a direct delivery strategy called endocytosis. Any such method is contemplated herein.

送達オプションの概観
いくつかの側面では、本発明は、1つ以上のプライム編集因子をコードするポリヌクレオチド、例えば本明細書に記載のプライム編集システムの1つ以上の構成要素をコードする本明細書に記載の1つ以上のベクター、その1つ以上の転写物、および/またはそれから転写される1つ以上のタンパク質を、ホスト細胞に送達することを含む方法を提供する。いくつかの側面では、本発明は、さらに、かかる方法によって生ずる細胞、およびかかる細胞を含むかまたはそれから生ずる生物(例えば動物、植物、または真菌)を提供する。いくつかの態様では、本明細書に記載のプライム編集因子は、ガイド配列との組み合わせで(任意に、それと複合体化されて)、細胞に送達される。従来のウイルスおよび非ウイルスに基づく遺伝子移入方法が、哺乳類細胞または標的組織において核酸を導入するために用いられ得る。かかる方法は、プライム編集因子の構成要素をコードする核酸を培養中のまたはホスト生物中の細胞に投与するために用いられ得る。非ウイルスベクター送達システムは、DNAプラスミド、RNA(例えば、本明細書に記載のベクターの転写物)、裸の核酸、およびリポソームなどの送達基剤と複合体化した核酸を包含する。ウイルスベクター送達システムはDNAおよびRNAウイルスを包含し、これらは細胞への送達後にエピソーム性のまたは取り入れされたゲノムどちらかを有する。遺伝子療法の総説については、Anderson,Science 256:808-813(1992);Nabel & Felgner,TIBTECH 11:211-217(1993);Mitani & Caskey,TIBTECH 11:162-166(1993);Dillon,TIBTECH 11:167-175(1993);Miller,Nature 357:455-460(1992);Van Brunt,Biotechnology 6(10):1149-1154(1988);Vigne,Restorative Neurology and Neuroscience 8:35-36(1995);Kremer & Perricaudet,British Medical Bulletin 51(1):31-44(1995);Haddada et al.,in Current Topics in Microbiology and Immunology Doerfler and Bihm(eds)(1995);およびYu et al.,Gene Therapy 1:13-26(1994)を参照。
Overview of Delivery Options In some aspects, the invention provides polynucleotides encoding one or more prime editing factors, e.g., polynucleotides encoding one or more components of the prime editing systems described herein. , one or more transcripts thereof, and/or one or more proteins transcribed therefrom, into a host cell. In some aspects, the invention further provides cells produced by such methods, and organisms (eg, animals, plants, or fungi) that contain or arise from such cells. In some embodiments, the prime editing factors described herein are delivered to cells in combination with (optionally conjugated to) a guide sequence. Conventional viral and non-viral-based gene transfer methods can be used to introduce nucleic acids in mammalian cells or target tissues. Such methods can be used to administer nucleic acids encoding components of prime editing factors to cells in culture or in a host organism. Non-viral vector delivery systems include DNA plasmids, RNA (eg, transcripts of the vectors described herein), naked nucleic acids, and nucleic acids complexed with delivery vehicles such as liposomes. Viral vector delivery systems include DNA and RNA viruses, which have either episomal or integrated genomes after delivery to cells. For reviews of gene therapy, see Anderson, Science 256:808-813(1992);Nabel & Felgner,TIBTECH 11:211-217(1993);Mitani & Caskey,TIBTECH 11:162-166(1993);Dillon,TIBTECH 11:167-175(1993);Miller,Nature 357:455-460(1992);Van Brunt,Biotechnology 6(10):1149-1154(1988);Vigne,Restorative Neurology and Neuroscience 8:35-36(1995) ); Kremer & Perricaudet, British Medical Bulletin 51(1):31-44(1995); Haddada et al., in Current Topics in Microbiology and Immunology Doerfler and Bihm(eds) (1995); and Yu et al., Gene See Therapy 1:13-26 (1994).

核酸の非ウイルス的送達の方法は、リポフェクション、ヌクレオフェクション、マイクロインジェクション、バイオリスティック、ビロソーム、リポソーム、イムノリポソーム、ポリカチオンまたは脂質:核酸コンジュゲート、裸のDNA、人工ビリオン、およびDNAの薬剤によって増強された取り込みを包含する。リポフェクションは例えば米国特許第5,049,386号、第4,946,787号;および第4,897,355号に記載され、リポフェクション試薬は市販で販売されている(例えば、Transfectam(商標)およびLipofectin(商標))。ポリヌクレオチドの効率的な受容体認識リポフェクションにとって好適であるカチオン性および中性脂質は、FeignerのWO91/17424;WO91/16024のものを包含する。送達は細胞(例えば、in vitroのまたはエクスビボの投与)または標的組織(例えばインビボの投与)にであり得る。 Methods of non-viral delivery of nucleic acids include lipofection, nucleofection, microinjection, biolistics, virosomes, liposomes, immunoliposomes, polycations or lipid:nucleic acid conjugates, naked DNA, artificial virions, and DNA agents. Includes enhanced uptake. Lipofection has been described, for example, in US Pat. Cationic and neutral lipids suitable for efficient receptor recognition lipofection of polynucleotides include those of Feigner, WO91/17424; WO91/16024. Delivery can be to cells (eg, in vitro or ex vivo administration) or target tissues (eg, in vivo administration).

イムノ脂質複合体などの標的化リポソームを包含する脂質:核酸複合体の調製は当業者に周知である(例として、Crystal,Science 270:404-410(1995);Blaese et al.,Cancer Gene Ther.2:291-297(1995);Behr et al.,Bioconjugate Chem.5:382-389(1994);Remy et al.,Bioconjugate Chem.5:647-654(1994);Gao et al.,Gene Therapy 2:710-722(1995);Ahmad et al.,Cancer Res.52:4817-4820(1992);米国特許第4,186,183号、第4,217,344号、第4,235,871号、第4,261,975号、第4,485,054号、第4,501,728号、第4,774,085号、第4,837,028号、および第4,946,787を参照)。 Preparation of lipid:nucleic acid complexes including targeted liposomes, such as immunolipid complexes, is well known to those skilled in the art (see, e.g., Crystal, Science 270:404-410 (1995); Blaese et al., Cancer Gene Ther. .2:291-297(1995);Behr et al.,Bioconjugate Chem.5:382-389(1994);Remy et al.,Bioconjugate Chem.5:647-654(1994);Gao et al.,Gene Therapy 2:710-722(1995);Ahmad et al., Cancer Res.52:4817-4820(1992);U.S. Pat. 4,501,728, 4,774,085, 4,837,028, and 4,946,787).

核酸の送達のためのRNAまたはDNAウイルスに基づくシステムの使用は、体の特定の細胞へとウイルスを標的化およびウイルスペイロードを核に輸送するための高度に進化したプロセスを利する。ウイルスベクターは、直接的に患者に投与され得るか(インビボ)、またはそれらはin vitroの細胞を処置するために用いられ得、改変された細胞が任意に患者に投与され得る(エクスビボ)。従来のウイルスに基づくシステムは、遺伝子移入のためのレトロウイルス、レンチウイルス、アデノウイルス、アデノ随伴、および単純ヘルペスウイルスベクターを包含し得る。ホストゲノムへの取り入れはレトロウイルス、レンチウイルス、およびアデノ随伴ウイルス遺伝子移入法で可能であり、多くの場合には、挿入されたトランスジーンの長期的発現をもたらす。加えて、高い形質導入効率が多くの異なる細胞型および標的組織で観察されている。 The use of RNA or DNA virus-based systems for delivery of nucleic acids takes advantage of highly evolved processes for targeting viruses to specific cells of the body and transporting viral payloads to the nucleus. Viral vectors can be administered directly to a patient (in vivo), or they can be used to treat cells in vitro and the modified cells optionally administered to a patient (ex vivo). Conventional virus-based systems can include retroviral, lentiviral, adenoviral, adeno-associated, and herpes simplex virus vectors for gene transfer. Integration into the host genome is possible by retroviral, lentiviral, and adeno-associated viral gene transfer methods, often resulting in long-term expression of the inserted transgene. In addition, high transduction efficiency has been observed in many different cell types and target tissues.

ウイルスのトロピズムは外生のエンベロープタンパク質を組み込むことによって変改され得、標的細胞の可能性ある標的集団を拡張する。レンチウイルスベクターは、非分裂細胞に形質導入または感染する能力があるレトロウイルスベクターであり、典型的には高いウイルス力価を生ずる。よって、レトロウイルス遺伝子移入システムの選択は標的組織に依存するであろう。レトロウイルスベクターはシスに作用する長い末端反復からなり、最高で6-10kbの外生の配列のパッケージング容量を有する。最小のシスに作用するLTRはベクターの複製およびパッケージングにとって十分であり、これらはそれから治療学的な遺伝子を標的細胞に取り入れするために用いられて、永久的なトランスジーン発現を提供する。広く用いられるレトロウイルスベクターは、ネズミ白血病ウイルス(MuLV)、テナガザル白血病ウイルス(GaLV)、サル免疫不全ウイルス(SIV)、ヒト免疫不全ウイルス(HIV)、およびそれらの組み合わせに基づくものを包含する(例えば、Buchscher et al.,J.Virol.66:2731-2739(1992);Johann et al.,J.Virol.66:1635-1640(1992);Sommnerfelt et al.,Virol.176:58-59(1990);Wilson et al.,J.Virol.63:2374-2378(1989);Miller et al.,J.Virol.65:2220-2224(1991);PCT/US94/05700を見よ)。一過性の発現が好ましい適用では、アデノウイルスに基づくシステムが用いられ得る。アデノウイルスに基づくベクターは、多くの細胞型において非常に高い形質導入効率ができ、細胞分裂を要求しない。かかるベクターによって、高い力価および発現レベルが得られている。このベクターは相対的に単純なシステムによって大きい数量で生じ得る。アデノ随伴ウイルス(「AAV」)ベクターもまた細胞に標的核酸を形質導入するために、例えば、核酸およびペプチドのin vitro生産にならびにインビボおよびエクスビボの遺伝子治療手続きに用いられ得る(例として、West et al.,Virology 160:38-47(1987);米国特許第4,797,368号;WO93/24641;Kotin,Human Gene Therapy 5:793-801(1994);Muzyczka,J.Clin.Invest.94:1351(1994)を参照)。組換えAAVベクターの構築は、米国特許第5,173,414号;Tratschin et al.,Mol.Cell.Biol.5:3251-3260(1985);Tratschin,et al.,Mol.Cell.Biol.4:2072-2081(1984);Hermonat & Muzyczka,PNAS 81:6466-6470(1984);およびSamulski et al.,J.Virol.63:03822-3828(1989)を包含する数多の刊行物に記載されている。 Viral tropism can be modified by incorporating exogenous envelope proteins, expanding the possible target population of target cells. Lentiviral vectors are retroviral vectors that are capable of transducing or infecting non-dividing cells and typically produce high viral titers. Therefore, the choice of retroviral gene transfer system will depend on the target tissue. Retroviral vectors consist of cis-acting long terminal repeats and have a packaging capacity of up to 6-10 kb of exogenous sequences. Minimal cis-acting LTRs are sufficient for vector replication and packaging, and these are then used to incorporate therapeutic genes into target cells to provide permanent transgene expression. Commonly used retroviral vectors include those based on murine leukemia virus (MuLV), gibbon leukemia virus (GaLV), simian immunodeficiency virus (SIV), human immunodeficiency virus (HIV), and combinations thereof (e.g. , Buchscher et al.,J.Virol.66:2731-2739(1992);Johann et al.,J.Virol.66:1635-1640(1992);Sommnerfelt et al.,Virol.176:58-59( 1990); Wilson et al., J. Virol. 63:2374-2378 (1989); Miller et al., J. Virol. 65:2220-2224 (1991); see PCT/US94/05700). In applications where transient expression is preferred, adenovirus-based systems may be used. Adenovirus-based vectors are capable of very high transduction efficiency in many cell types and do not require cell division. High titers and expression levels have been obtained with such vectors. This vector can be produced in large quantities by a relatively simple system. Adeno-associated virus (“AAV”) vectors can also be used to transduce cells with target nucleic acids, e.g., for in vitro production of nucleic acids and peptides, and for in vivo and ex vivo gene therapy procedures (see, e.g., West et al. al., Virology 160:38-47 (1987); US Patent No. 4,797,368; WO93/24641; Kotin, Human Gene Therapy 5:793-801 (1994); Muzyczka, J. Clin. Invest. 94:1351 (1994) ). Construction of recombinant AAV vectors is described in US Pat. No. 5,173,414; Tratschin et al., Mol. Cell. Biol. 5:3251-3260 (1985); 2081 (1984); Hermonat & Muzyczka, PNAS 81:6466-6470 (1984); and Samulski et al., J. Virol. 63:03822-3828 (1989). .

パッケージング細胞は、ホスト細胞に感染することができるウイルス粒子を形成するために典型的に用いられる。かかる細胞は、アデノウイルスをパッケージングする293細胞およびレトロウイルスをパッケージングするψ2細胞またはPA317細胞を包含する。遺伝子治療に用いられるウイルスベクターは、通常は、核酸ベクターをウイルス粒子にパッケージングする細胞株を生ずることによって生成される。ベクターは、典型的には、パッケージングおよびホストへの爾後の取り入れに要求される最小限のウイルス配列を含有し、他のウイルス配列は発現されるべきポリヌクレオチド(単数または複数)の発現カセットによって置き換えられる。欠けているウイルス機能は典型的にはパッケージング細胞株によってトランスで供給される。例えば、遺伝子治療に用いられるAAVベクターは、典型的には、パッケージングおよびホストゲノムへの取り入れに要求されるAAVゲノムからのITR配列のみを所有する。ウイルスDNAは細胞株によってパッケージングされ、これは、他のAAV遺伝子つまりrepおよびcapをコードするがITR配列を欠くヘルパープラスミドを含有する。細胞株はヘルパーとしてのアデノウイルスにもまた感染し得る。ヘルパーウイルスはAAVベクターの複製およびヘルパープラスミドからのAAV遺伝子の発現を促進する。ヘルパープラスミドはITR配列の欠如を原因として有意な量ではパッケージングされない。アデノウイルスによるコンタミネーションは、例えば、アデノウイルスがAAVよりも敏感である熱処置によって縮減され得る。細胞への核酸の送達のための追加の方法は当業者に公知である。例えば、参照によって本願に組み込まれるUS20030087817を見よ。 Packaging cells are typically used to form viral particles that can infect host cells. Such cells include 293 cells, which package adenoviruses, and ψ2 cells or PA317 cells, which package retroviruses. Viral vectors used in gene therapy are typically produced by generating cell lines that package nucleic acid vectors into viral particles. The vector typically contains the minimal viral sequences required for packaging and subsequent incorporation into the host, with other viral sequences carried by the expression cassette of the polynucleotide(s) to be expressed. Replaced. The missing viral functions are typically supplied in trans by the packaging cell line. For example, AAV vectors used for gene therapy typically possess only the ITR sequences from the AAV genome required for packaging and incorporation into the host genome. The viral DNA is packaged by a cell line, which contains a helper plasmid encoding the other AAV genes, rep and cap, but lacking ITR sequences. Cell lines can also be infected with adenovirus as a helper. Helper viruses facilitate replication of AAV vectors and expression of AAV genes from helper plasmids. The helper plasmid is not packaged in significant quantities due to the lack of ITR sequences. Contamination by adenoviruses can be reduced, for example, by heat treatment, to which adenoviruses are more sensitive than AAV. Additional methods for delivery of nucleic acids to cells are known to those skilled in the art. See, for example, US20030087817, which is incorporated herein by reference.

種々の態様において、PE構築物(分裂構築物を包含する)は1つ以上のrAAVベクターによる送達のために操作され得る。本願において提供される方法および組成物のいずれかに関するrAAVは、いずれかの誘導体またはシュードタイプを包含するいずれかの血清型であり得る(例えば、1、2、3、4、5、6、7、8、9、10、11、12、13、2/1、2/5、2/8、2/9、3/1、3/5、3/8、または3/9)。rAAVは細胞に送達されるべきである遺伝子積荷(すなわち、rAAVによって細胞内に持ち込まれる丸ごとのまたは分裂のPE融合タンパク質などの目当ての遺伝子を発現する組み換え核酸ベクター)を含み得る。rAAVはキメラであり得る。 In various embodiments, PE constructs (including split constructs) can be engineered for delivery by one or more rAAV vectors. The rAAV for any of the methods and compositions provided herein can be of any serotype, including any derivative or pseudotype (e.g., 1, 2, 3, 4, 5, 6, 7 , 8, 9, 10, 11, 12, 13, 2/1, 2/5, 2/8, 2/9, 3/1, 3/5, 3/8, or 3/9). The rAAV may contain the gene cargo to be delivered to the cell (ie, a recombinant nucleic acid vector expressing the gene of interest, such as a whole or split PE fusion protein, which is brought into the cell by the rAAV). rAAV can be chimeric.

rAAVの本願において用いられる血清型は、組み換えウイルスのカプシドタンパク質の血清型を言う。誘導体およびシュードタイプの限定しない例は、rAAV2/1、rAAV2/5、rAAV2/8、rAAV2/9、AAV2-AAV3ハイブリッド、AAVrh.10、AAVhu.14、AAV3a/3b、AAVrh32.33、AAV-HSC15、AAV-HSC17、AAVhu.37、AAVrh.8、CHt-P6、AAV2.5、AAV6.2、AAV2i8、AAV-HSC15/17、AAVM41、AAV9.45、AAV6(Y445F/Y731F)、AAV2.5T、AAV-HAE1/2、AAVクローン32/83、AAVShH10、AAV2(Y->F)、AAV8(Y733F)、AAV2.15、AAV2.4、AAVM41、およびAAVr3.45を包含する。キメラVP1タンパク質を有する誘導体およびシュードタイプの限定しない例はrAAV2/5-1VP1uであり、これはAAV2のゲノム、AAV5のカプシドバックボーン、およびAAV1のVP1uを有する。キメラVP1タンパク質を有する誘導体およびシュードタイプの他の限定しない例はrAAV2/5-8VP1u、rAAV2/9-1VP1u、およびrAAV2/9-8VP1uである。 As used herein, serotype of rAAV refers to the serotype of the capsid protein of the recombinant virus. Non-limiting examples of derivatives and pseudotypes include rAAV2/1, rAAV2/5, rAAV2/8, rAAV2/9, AAV2-AAV3 hybrid, AAVrh.10, AAVhu.14, AAV3a/3b, AAVrh32.33, AAV-HSC15 , AAV-HSC17, AAVhu.37, AAVrh.8, CHt-P6, AAV2.5, AAV6.2, AAV2i8, AAV-HSC15/17, AAVM41, AAV9.45, AAV6(Y445F/Y731F), AAV2.5T, Includes AAV-HAE1/2, AAV clone 32/83, AAVShH10, AAV2(Y->F), AAV8(Y733F), AAV2.15, AAV2.4, AAVM41, and AAVr3.45. A non-limiting example of a derivative and pseudotype having a chimeric VP1 protein is rAAV2/5-1VP1u, which has the genome of AAV2, the capsid backbone of AAV5, and VP1u of AAV1. Other non-limiting examples of derivatives and pseudotypes having chimeric VP1 proteins are rAAV2/5-8VP1u, rAAV2/9-1VP1u, and rAAV2/9-8VP1u.

AAV誘導体/シュードタイプ、およびかかる誘導体/シュードタイプを生ずるための方法は、当該技術分野で公知である(例えば、Mol Ther.2012 Apr;20(4):699-708.doi:10.1038/mt.2011.287.Epub 2012 Jan 24.The AAV vector toolkit:poised at the clinical crossroads.Asokan A1,Schaffer DV,Samulski RJ.を見よ)。シュードタイプのrAAVベクターを生ずるおよび用いるための方法は当該技術分野で公知である(例えば、Duan et al.,J.Virol.,75:7662-7671,2001;Halbert et al.,J.Virol.,74:1524-1532,2000;Zolotukhin et al.,Methods,28:158-167,2002;およびAuricchio et al.,Hum.Molec.Genet.,10:3075-3081,2001を見よ)。 AAV derivatives/pseudotypes and methods for producing such derivatives/pseudotypes are known in the art (e.g. Mol Ther.2012 Apr;20(4):699-708.doi:10.1038/mt. 2011.287.Epub 2012 Jan 24.The AAV vector toolkit:poised at the clinical crossroads.See Asokan A1, Schaffer DV, Samulski RJ.). Methods for generating and using pseudotyped rAAV vectors are known in the art (e.g., Duan et al., J. Virol., 75:7662-7671, 2001; Halbert et al., J. Virol. , 74:1524-1532, 2000; Zolotukhin et al., Methods, 28:158-167, 2002; and Auricchio et al., Hum. Molec. Genet., 10: 3075-3081, 2001).

rAAV粒子を作るまたはパッケージングする方法は当該技術分野で知られており、試薬が市販で利用可能である(例えば、Zolotukhin et al.Production and purification of serotype 1,2,and 5 recombinant adeno-associated viral vectors.Methods 28(2002)158-167;および米国特許公開番号US20070015238およびUS20120322861を見よ。これらは参照によって本願に組み込まれる;プラスミドおよびキットはATCCおよびCell Biolabs,Inc.から利用可能)。例えば、目当ての遺伝子を含むプラスミドが、例えばrep遺伝子(例えば、Rep78、Rep68、Rep52、およびRep40をコードする)およびcap遺伝子(本明細書に記載の改変されたVP2領域を包含するVP1、VP2、およびVP3をコードする)を含有する1つ以上のヘルパープラスミドと組み合わせられ、組み換え細胞にトランスフェクションされ得る。その結果、rAAV粒子がパッケージングおよび爾後に精製され得る。 Methods of making or packaging rAAV particles are known in the art, and reagents are commercially available (e.g., Zolotukhin et al.Production and purification of serotype 1,2,and 5 recombinant adeno-associated viral vectors.Methods 28 (2002) 158-167; and US Patent Publication Nos. US20070015238 and US20120322861, which are incorporated herein by reference; plasmids and kits available from ATCC and Cell Biolabs, Inc.). For example, a plasmid containing the genes of interest may contain, for example, the rep genes (e.g., encoding Rep78, Rep68, Rep52, and Rep40) and the cap genes (e.g., VP1, VP2, including the modified VP2 regions described herein). and VP3) and transfected into recombinant cells. As a result, rAAV particles can be packaged and subsequently purified.

組み換えAAVは核酸ベクターを含み得、これは、最小で:(a)目当てのタンパク質もしくはポリペプチドまたは目当てのRNA(例えば、siRNAもしくはmicroRNA)をコードする配列を含む1つ以上の異種核酸領域と、(b)1つ以上の核酸領域(例えば、異種核酸領域)をフランキングする逆位末端反復(ITR)配列(例えば、野生型ITR配列または操作されたITR配列)を含む1つ以上の領域とを含み得る。本願において、目当てのタンパク質または目当てのRNAをコードする配列を含む異種核酸領域は目当ての遺伝子と言われる。 A recombinant AAV can include a nucleic acid vector, which at a minimum includes: (a) one or more heterologous nucleic acid regions containing sequences encoding a protein or polypeptide of interest or an RNA of interest (e.g., siRNA or microRNA); (b) one or more regions comprising inverted terminal repeat (ITR) sequences (e.g., wild-type or engineered ITR sequences) flanking one or more nucleic acid regions (e.g., a heterologous nucleic acid region); may include. In this application, a heterologous nucleic acid region containing a sequence encoding a protein of interest or an RNA of interest is referred to as a gene of interest.

本願において提供されるrAAV粒子のいずれか1つは、VP1u領域の外に異なる血清型のアミノ酸を有するカプシドタンパク質を有し得る。いくつかの態様では、VP1タンパク質のバックボーンの血清型はITRおよび/またはRep遺伝子の血清型とは異なる。いくつかの態様では、粒子のVP1カプシドタンパク質のバックボーンの血清型はITRの血清型と同じである。いくつかの態様では、粒子のVP1カプシドタンパク質のバックボーンの血清型はRep遺伝子の血清型と同じである。いくつかの態様では、rAAV粒子のカプシドタンパク質は改善された形質導入効率をもたらすアミノ酸変異を含む。 Any one of the rAAV particles provided herein may have a capsid protein with amino acids of different serotypes outside of the VP1u region. In some embodiments, the serotype of the backbone of the VP1 protein is different from the serotype of the ITR and/or Rep genes. In some embodiments, the VP1 capsid protein backbone serotype of the particle is the same as the ITR serotype. In some embodiments, the serotype of the backbone of the VP1 capsid protein of the particle is the same as the serotype of the Rep gene. In some embodiments, the capsid protein of the rAAV particle contains amino acid mutations that result in improved transduction efficiency.

いくつかの態様では、核酸ベクターは、核酸(例えば、異種核酸)の発現を容易化する配列、例えば核酸に作動可能に連結された発現コントロール配列を含む1つ以上の領域を含む。数々のかかる配列が当該技術分野で公知である。発現コントロール配列の限定しない例は、プロモーター、インシュレーター、サイレンサー、応答エレメント、イントロン、エンハンサー、開始部位、終結シグナル、およびポリAテールを包含する。かかるコントロール配列のいずれかの組み合わせは本願において企図される(例えば、プロモーターおよびエンハンサー)。 In some embodiments, the nucleic acid vector includes one or more regions that include sequences that facilitate expression of the nucleic acid (eg, a heterologous nucleic acid), such as expression control sequences operably linked to the nucleic acid. Numerous such sequences are known in the art. Non-limiting examples of expression control sequences include promoters, insulators, silencers, response elements, introns, enhancers, initiation sites, termination signals, and polyA tails. Any combination of such control sequences is contemplated herein (eg, promoters and enhancers).

最終的なAAV構築物はPEgRNAをコードする配列を組み込み得る。他の態様において、AAV構築物は、第2部位ニッキングガイドRNAをコードする配列を組み込み得る。なお他の態様において、AAV構築物は、第2部位ニッキングガイドRNAをコードする配列とPEgRNAをコードする配列とを組み込み得る。 The final AAV construct may incorporate a sequence encoding a PEgRNA. In other embodiments, the AAV construct may incorporate a sequence encoding a second site nicking guide RNA. In yet other embodiments, the AAV construct may incorporate a sequence encoding a second site nicking guide RNA and a sequence encoding a PEgRNA.

種々の態様において、PEgRNAおよび第2部位ニッキングガイドRNAは、適当なプロモーター、例えばヒトU6(hU6)プロモーター、マウスU6(mU6)プロモーター、または他の適当なプロモーターから発現され得る。PEgRNAおよび第2部位ニッキングガイドRNAは同じプロモーターまたは異なるプロモーターから駆動され得る。 In various embodiments, PEgRNA and second site nicking guide RNA can be expressed from a suitable promoter, such as the human U6 (hU6) promoter, mouse U6 (mU6) promoter, or other suitable promoter. PEgRNA and second site nicking guide RNA can be driven from the same promoter or different promoters.

いくつかの態様では、rAAV構築物または本願の組成物は対象に経腸的に投与される。いくつかの態様では、rAAV構築物または本願の組成物は対象に非経口的に投与される。いくつかの態様では、rAAV粒子または本願の組成物は、対象に皮下で、眼内で、硝子体内で、網膜下で、静脈内で(IV)、脳室内で、筋肉内で、髄腔内で(IT)、脳槽内で、腹腔内で、吸入によって、局所的に、または1つ以上の細胞、組織、もしくは臓器への直接的注射によって投与される。いくつかの態様では、rAAV粒子または本願の組成物は、対象に肝動脈または門脈への注射によって投与される。
分裂PEベクターに基づく戦略
In some embodiments, the rAAV construct or composition of the present application is administered enterally to the subject. In some embodiments, the rAAV construct or composition of the present application is administered parenterally to the subject. In some embodiments, rAAV particles or compositions of the present invention are administered to a subject subcutaneously, intraocularly, intravitreally, subretally, intravenously (IV), intracerebroventricularly, intramuscularly, intrathecally. (IT), intracisternally, intraperitoneally, by inhalation, locally, or by direct injection into one or more cells, tissues, or organs. In some embodiments, rAAV particles or compositions herein are administered to a subject by injection into the hepatic artery or portal vein.
Strategy based on split PE vectors

この側面では、プライム編集因子は分裂部位において割られ得、丸ごとの/完全なプライム編集因子の2つの半分として提供され得る。2つの半分は細胞に送達され得(例えば、発現されたタンパク質として、または別個の発現ベクター上において)、ひとたび細胞内で接触をすると、2つの半分は各プライム編集因子半分のインテインの自己スプライシング作用によって完全なプライム編集因子を形成する。細胞内におけるそれらのトランススプライシングと完全な機能するPEの付随的復元とを容易化するために、分裂インテイン配列が、コードされるプライム編集因子の半分の夫々に操作され得る。 In this aspect, the prime editor can be split at the split site and provided as two halves of a whole/complete prime editor. The two halves can be delivered to the cell (e.g., as an expressed protein or on a separate expression vector), and once in contact within the cell, the two halves are freed from the self-splicing action of the intein of each prime editing factor half. to form a complete prime editing factor. Split intein sequences can be engineered into each half of the encoded prime editing factor to facilitate their trans-splicing within the cell and the concomitant restoration of a fully functional PE.

これらの分裂インテインに基づく方法はインビボ送達のいくつかの関門を克服する。例えば、プライム編集因子をコードするDNAはrAAVパッケージング限界よりも大きく、そのため、特殊な解決を要求する。1つのかかる解決は、分裂インテインペアに融合された編集因子を製剤することであり、これらが2つの別個のrAAV粒子にパッケージングされ、これらは細胞に同時送達されるときに機能的な編集因子タンパク質を再構成する。プライム編集の固有の特色を説明するいくつかの他の特殊な考慮事項が記載され、第2部位ニッキング標的の最適化と、レンチウイルスおよびrAAVを包含するウイルスベクターにプライム編集因子を適切にパッケージングすることとを包含する。 These split intein-based methods overcome several barriers to in vivo delivery. For example, the DNA encoding prime editing factors is larger than rAAV packaging limits and therefore requires special solutions. One such solution is to formulate editing factors fused to divisible intein pairs, which are then packaged into two separate rAAV particles that when co-delivered to cells form functional editing factors. Reconstitute proteins. Several other special considerations are described that explain the unique features of prime editing, including optimization of second-site nicking targets and proper packaging of prime editing factors into viral vectors, including lentiviruses and rAAV. It includes doing.

この側面では、プライム編集因子は分裂部位において割られ得、丸ごとの/完全なプライム編集因子の2つの半分として提供され得る。2つの半分は細胞に送達され得(例えば、発現されたタンパク質として、または別個の発現ベクター上において)、ひとたび細胞内で接触をすると、2つの半分は各プライム編集因子半分のインテインの自己スプライシング作用によって完全なプライム編集因子を形成する。細胞内におけるそれらのトランススプライシングと完全な機能するPEの付随的復元とを容易化するために、分裂インテイン配列が、コードされるプライム編集因子の半分の夫々に操作され得る。 In this aspect, the prime editor can be split at the split site and provided as two halves of a whole/complete prime editor. The two halves can be delivered to the cell (e.g., as an expressed protein or on a separate expression vector), and once in contact within the cell, the two halves are freed from the self-splicing action of the intein of each prime editing factor half. to form a complete prime editing factor. Split intein sequences can be engineered into each half of the encoded prime editing factor to facilitate their trans-splicing within the cell and the concomitant restoration of a fully functional PE.

図66は、2つのPEの半分のタンパク質として提供されているプライム編集因子の1つの態様を図示する。これらは、プライム編集因子の半分のタンパク質の夫々の終わりまたは始まりに位置付けられた分裂インテインの半分同士の自己スプライシング作用によって、丸ごとのプライム編集因子を再生する。本願において用いられる用語「PE N末端半分」は、完全なプライム編集因子のPE N末端半分のC末端の端に「Nインテイン」を含む、完全なプライム編集因子のN末端半分を言う(すなわち、N末端エクステイン)。「Nインテイン」は、完全な十分に形成された分裂インテイン部分のN末端半分を言う。本願において用いられる用語「PE C末端半分」は、完全なプライム編集因子のC末端半分のN末端の端に「Cインテイン」を含む完全なプライム編集因子のC末端半分を言う(すなわち、C末端エクステイン)。2つの半分タンパク質、すなわちPE N末端半分およびPE C末端半分が例えば細胞内において互いと接触をするときには、NインテインおよびCインテインは、自己切除とPE N末端半分のC末端の端およびPE C末端半分のN末端の端の間のペプチド結合の形成との同時プロセスを経過して、完全なnapDNAbpドメイン(例えばCas9ニッカーゼ)およびRTドメインを含む完全なプライム編集因子タンパク質を再形成する。図面には示されていないが、プライム編集因子は、N末端および/またはC末端のNLSと各ドメインを連結するアミノ酸リンカー配列とを包含する追加の配列をもまた含み得る。 Figure 66 illustrates one embodiment of a prime editing factor provided as two PE half proteins. These regenerate the entire prime editing factor by the self-splicing action of the split intein halves positioned at the end or beginning of each protein half of the prime editing factor. As used herein, the term "PE N-terminal half" refers to the N-terminal half of an intact prime editing factor that contains an "N-intein" at the C-terminal end of the PE N-terminal half of the intact prime editing factor (i.e. N-terminal extein). "N-intein" refers to the N-terminal half of the complete, fully formed split intein portion. As used herein, the term "PE C-terminal half" refers to the C-terminal half of an intact prime editing element that contains a "C intein" at the N-terminal end of the C-terminal half of the intact prime editing element (i.e., the C-terminal Extain). When the two halves of the protein, namely the PE N-terminal half and the PE C-terminal half, come into contact with each other, e.g. within a cell, the N-intein and the C-intein self-excise and release the C-terminal end of the PE N-terminal half and the PE C-terminal end. A simultaneous process with the formation of a peptide bond between the N-terminal ends of the halves re-forms the complete prime editor protein containing the complete napDNAbp domain (e.g. Cas9 nickase) and RT domain. Although not shown in the figures, the prime editor may also contain additional sequences, including an N-terminal and/or C-terminal NLS and an amino acid linker sequence connecting each domain.

種々の態様において、プライム編集因子は、丸ごとのプライム編集因子を「分裂部位」において(as)「分裂」することによって、2つの半分タンパク質(すなわち、PE N末端半分およびPE C末端半分)として操作され得る。「分裂部位」は、プライム編集因子上の2つの隣接するアミノ酸残基の間における分裂インテイン配列(すなわち、NインテインおよびCインテイン)の挿入の位置付けを言う。より具体的には、「分裂部位」は丸ごとのプライム編集因子を2つの別個の半分へと割る位置付けを言い、各半分は分裂部位においてNインテインまたはCインテインモチーフどちらかに融合される。分裂部位はプライム編集因子融合タンパク質上のいずれかの好適な位置付けであり得るが、好ましくは、分裂部位は送達(例えば発現ベクターによる)にとって適当なサイズである2つの半分タンパク質の形成を許す位置に位置付けられ、分裂部位末端において各半分タンパク質に融合されているインテインは、1つの半分タンパク質が細胞内において他の半分タンパク質に接触するときに互いと十分に相互作用するように利用可能である。 In various embodiments, the prime editing factor is engineered into two half-proteins (i.e., a PE N-terminal half and a PE C-terminal half) by "splitting" the whole prime editing factor (as) at a "splitting site." can be done. "Split site" refers to the positioning of the insertion of a split intein sequence (ie, N-intein and C-intein) between two adjacent amino acid residues on the prime editing element. More specifically, the "split site" refers to the positioning of the entire prime editing element into two separate halves, each half fused to either an N-intein or a C-intein motif at the split site. Although the splitting site can be in any suitable location on the prime editing factor fusion protein, preferably the splitting site is in a position that allows the formation of two half-proteins of appropriate size for delivery (e.g., by an expression vector). The inteins that are positioned and fused to each half protein at the end of the division site are available to fully interact with each other when one half protein contacts the other half protein within the cell.

いくつかの態様では、分裂部位はnapDNAbpドメイン上に位置付けられる。他の態様において、分裂部位はRTドメイン上に位置付けられる。他の態様において、分裂部位はnapDNAbpドメインおよびRTドメインを連結するリンカー上に位置付けられる。 In some embodiments, the division site is located on the napDNAbp domain. In other embodiments, the cleavage site is located on the RT domain. In other embodiments, the cleavage site is located on the linker that connects the napDNAbp domain and the RT domain.

種々の態様において、分裂部位デザインは、2つの半分のプライム編集因子ドメインを2つの異なるAAVゲノムにパッケージングする目的を両方が構造的に許容するNおよびC末端インテインを分裂および挿入するための部位を見出すことを要求する。加えて、トランススプライシングに必要なインテイン残基は、C末端エクステインのN末端の残基を変異させることまたはインテインの「傷跡」を残すであろう残基を挿入することによって組み込まれ得る。 In various embodiments, the split site design includes sites for splitting and inserting N- and C-terminal inteins that both structurally permit the purpose of packaging the two half prime editor domains into two different AAV genomes. We request you to find out. In addition, intein residues required for trans-splicing can be incorporated by mutating residues at the N-terminus of the C-terminal extein or inserting residues that will leave a "scar" of the intein.

SpCas9ニッカーゼまたはSaCas9ニッカーゼどちらかを含む分裂されたプライム編集因子の例示の分裂構成は次のとおりである。

Figure 2020191234000223
Figure 2020191234000224
Figure 2020191234000225
Figure 2020191234000226
Exemplary split constructs of split prime editors containing either SpCas9 nickase or SaCas9 nickase are as follows:
Figure 2020191234000223
Figure 2020191234000224
Figure 2020191234000225
Figure 2020191234000226

種々の態様では、例としてSpCas9ニッカーゼ(配列番号18、1368アミノ酸)を用いて、分裂は、1および1368の間のいずれかの2つのアミノ酸の間においてであり得る。しかしながら、好ましい分裂は、タンパク質の中心領域の間に、例えば、配列番号18のアミノ酸50~1250、または100~1200、または150~1150、または200~1100、または250~1050、または300~1000、または350~950、または400~900、または450~850、または500~800、または550~750、または600~700に位置付けられるであろう。特定の例示の態様では、分裂部位は740/741、または801/802、または1010/1011、または1041/1042の間であり得る。他の態様において、分裂部位は、配列番号18のSpCas9に対して相対的に、1/2、2/3、3/4、4/5、5/6、6/7、7/8、8/9、9/10、10/11、12/13、14/15、15/16、17/18、19/20、20/21、21/22、22/23、23/24、24/25、25/26、26/27、27/28、28/29、29/30、30/31、31/32、32/33、33/34、34/35、35/36、36/37、38/39、39/40、41/42、42/43、43/44、44/45、45/46、46/47、47/48、48/49、49/50、51/52、52/53、53/54、54/55、55/56、56/57、57/58、58/59、59/60、61/62、62/63、63/64、64/65、65/66、66/67、67/68、68/69、69/70、71/72、72/73、73/74、74/75、75/76、76/77、77/78、78/79、79/80、81/82、82/83、83/84、84/85、85/86、86/87、87/88、88/89、89/90の間、または90~100、100~150、150~200、200~250、250~300、300~350、350~400、450~500、500~550、550~600、600~650、650~700、700~750、750~800、800~850、850~900、900~950、950~1000、1000~1050、1050~1100、1100~1150、1150~1200、1200~1250、1250~1300、1300~1350、および1350~1368の間の隣接する残基のいずれか2つのペアの間、配列番号18と少なくとも80%、85%、90%、95%、98%、99%、または99.9%配列同一性を有するアミノ酸配列上のいずれか2つの対応する残基の間、あるいは配列番号19~88のアミノ酸配列のいずれかのSpCas9のバリアントもしくは等価物、または配列番号19~88のいずれかと少なくとも80%、85%、90%、95%、98%、99%、もしくは99.9%配列同一性を有するアミノ酸配列のいずれか2つの対応する残基の間であり得る。 In various embodiments, using SpCas9 nickase (SEQ ID NO: 18, 1368 amino acids) as an example, the split can be between any two amino acids between 1 and 1368. However, preferred splits are between the central regions of the protein, for example amino acids 50-1250, or 100-1200, or 150-1150, or 200-1100, or 250-1050, or 300-1000 of SEQ ID NO: 18; or 350-950, or 400-900, or 450-850, or 500-800, or 550-750, or 600-700. In certain exemplary embodiments, the cleavage site can be between 740/741, or 801/802, or 1010/1011, or 1041/1042. In other embodiments, the split sites are 1/2, 2/3, 3/4, 4/5, 5/6, 6/7, 7/8, 8 relative to SpCas9 of SEQ ID NO: 18. /9, 9/10, 10/11, 12/13, 14/15, 15/16, 17/18, 19/20, 20/21, 21/22, 22/23, 23/24, 24/25 , 25/26, 26/27, 27/28, 28/29, 29/30, 30/31, 31/32, 32/33, 33/34, 34/35, 35/36, 36/37, 38 /39, 39/40, 41/42, 42/43, 43/44, 44/45, 45/46, 46/47, 47/48, 48/49, 49/50, 51/52, 52/53 , 53/54, 54/55, 55/56, 56/57, 57/58, 58/59, 59/60, 61/62, 62/63, 63/64, 64/65, 65/66, 66 /67, 67/68, 68/69, 69/70, 71/72, 72/73, 73/74, 74/75, 75/76, 76/77, 77/78, 78/79, 79/80 , between 81/82, 82/83, 83/84, 84/85, 85/86, 86/87, 87/88, 88/89, 89/90, or 90-100, 100-150, 150- 200, 200-250, 250-300, 300-350, 350-400, 450-500, 500-550, 550-600, 600-650, 650-700, 700-750, 750-800, 800-850, Adjacent residues between 850-900, 900-950, 950-1000, 1000-1050, 1050-1100, 1100-1150, 1150-1200, 1200-1250, 1250-1300, 1300-1350, and 1350-1368 Any two correspondences on the amino acid sequence that have at least 80%, 85%, 90%, 95%, 98%, 99%, or 99.9% sequence identity with SEQ ID NO: 18 between any two pairs of groups. or at least 80%, 85%, 90%, 95%, 98% between residues that , 99%, or 99.9% sequence identity between any two corresponding residues of the amino acid sequences.

種々の態様において、分裂インテイン配列は次のインテイン配列からによって操作され得る。

Figure 2020191234000227
Figure 2020191234000228
Figure 2020191234000229
In various embodiments, a split intein sequence can be engineered from the next intein sequence.
Figure 2020191234000227
Figure 2020191234000228
Figure 2020191234000229

種々の他の態様において、分裂インテイン配列は次のとおり用いられ得る:

Figure 2020191234000230
In various other embodiments, split intein sequences can be used as follows:
Figure 2020191234000230

種々の態様において、分裂インテインは完全なPE融合タンパク質の別個の部分を細胞に別個に送達するために用いられ得、これらは、細胞内での発現によって、トランススプライシングによって完全なPE融合タンパク質として再構成されるようになる。 In various embodiments, split inteins can be used to separately deliver separate portions of a complete PE fusion protein to a cell, which upon expression in the cell become reconstituted into the complete PE fusion protein by trans-splicing.

いくつかの態様では、本開示は、PE融合タンパク質を細胞に送達する方法を提供し:
(a)第1の分裂インテイン配列に融合されたPE融合タンパク質のN末端フラグメントをコードする第1の発現ベクターを構築すること;
(b)第2の分裂インテイン配列に融合されたPE融合タンパク質のC末端フラグメントをコードする第2の発現ベクターを構築すること;
(c)第1および第2の発現ベクターを細胞に送達すること、
を含み、
第1および第2の分裂インテイン配列の自己切除を引き起こすトランススプライシング活性の結果として、N末端およびC末端フラグメントは、細胞内においてPE融合タンパク質として再構成される。
In some embodiments, the present disclosure provides a method of delivering a PE fusion protein to a cell:
(a) constructing a first expression vector encoding an N-terminal fragment of a PE fusion protein fused to a first split intein sequence;
(b) constructing a second expression vector encoding a C-terminal fragment of the PE fusion protein fused to a second split intein sequence;
(c) delivering the first and second expression vectors to the cell;
including;
As a result of the trans-splicing activity that causes self-excision of the first and second split intein sequences, the N-terminal and C-terminal fragments are reconstituted as a PE fusion protein within the cell.

分裂部位は、いくつかの態様では、napDNAbpドメイン、リンカー、または逆転写酵素ドメインを包含するプライム編集因子融合体のどこかであり得る。 The division site, in some embodiments, can be anywhere in the prime editor fusion, including the napDNAbp domain, the linker, or the reverse transcriptase domain.

他の態様において、分裂部位はnapDNAbpドメイン上である。 In other embodiments, the division site is on the napDNAbp domain.

なお他の態様において、分裂部位は逆転写酵素またはポリメラーゼドメイン上である。 In still other embodiments, the cleavage site is on the reverse transcriptase or polymerase domain.

さらに他の態様において、分裂部位はリンカー上である。 In yet other embodiments, the cleavage site is on the linker.

種々の態様において、本開示は、napDNAbp(例えばCas9ドメイン)と逆転写酵素とを含むプライム編集因子を提供し、napDNAbpおよび/または逆転写酵素の1つまたは両方は、インテイン、例えばリガンド依存性インテインを含む。典型的には、インテインはリガンド依存性インテインであり、これはリガンド(例えば、4-ヒドロキシタモキシフェンなどの低分子、ペプチド、タンパク質、ポリヌクレオチド、アミノ酸、およびヌクレオチド)の不在下ではタンパク質スプライシング活性を発揮しないか、または最小限発揮する。リガンド依存性インテインは知られており、U.S.2014/0065711A1として公開された米国特許出願U.S.S.N.14/004,280に記載されているものを包含する。これの内容全体は参照によって本願に組み込まれる。加えて、分裂Cas9アーキテクチャの使用、いくつかの態様では、インテインは配列番号8~15、447、452、462、および472~479からなる群から選択されるアミノ酸配列を含む。 In various embodiments, the present disclosure provides prime editing factors that include napDNAbp (e.g., a Cas9 domain) and a reverse transcriptase, wherein one or both of napDNAbp and/or reverse transcriptase is an intein, e.g., a ligand-dependent intein. including. Typically, inteins are ligand-dependent inteins, which exert protein splicing activity in the absence of ligands (e.g., small molecules such as 4-hydroxytamoxifen, peptides, proteins, polynucleotides, amino acids, and nucleotides). No or minimal performance. Ligand-dependent inteins are known and include those described in US patent application U.S.S.N.14/004,280, published as U.S.2014/0065711A1. The entire contents of this document are incorporated by reference into this application. In addition, using a split Cas9 architecture, in some embodiments, the intein comprises an amino acid sequence selected from the group consisting of SEQ ID NOs: 8-15, 447, 452, 462, and 472-479.

種々の態様において、napDNAbpドメインは配列番号18の標準的なSpCas9ドメインと比較して小さいサイズのnapDNAbpドメインである。 In various embodiments, the napDNAbp domain is a napDNAbp domain of reduced size compared to the standard SpCas9 domain of SEQ ID NO: 18.

標準的なSpCas9タンパク質は長さが1368アミノ酸であり、158キロダルトンという予測される分子量を有する。本願において用いられる用語「小さいサイズのCas9バリアント」は、少なくとも1300アミノ酸未満、または少なくとも1290アミノ酸未満、または1280アミノ酸未満(than less than)、または1270アミノ酸未満、または1260アミノ酸未満、または1250アミノ酸未満、または1240アミノ酸未満、または1230アミノ酸未満、または1220アミノ酸未満、または1210アミノ酸未満、または1200アミノ酸未満、または1190アミノ酸未満、または1180アミノ酸未満、または1170アミノ酸未満、または1160アミノ酸未満、または1150アミノ酸未満、または1140アミノ酸未満、または1130アミノ酸未満、または1120アミノ酸未満、または1110アミノ酸未満、または1100アミノ酸未満、または1050アミノ酸未満、または1000アミノ酸未満、または950アミノ酸未満、または900アミノ酸未満、または850アミノ酸未満、または800アミノ酸未満、または750アミノ酸未満、または700アミノ酸未満、または650アミノ酸未満、または600アミノ酸未満、または550アミノ酸未満、または500アミノ酸未満だが、少なくとも約400アミノ酸よりも大きく、かつCas9タンパク質の要求される機能を保持する、天然に存在するか、操作されたか、または別様のいずれかのCas9バリアントを言う。 The standard SpCas9 protein is 1368 amino acids in length and has a predicted molecular weight of 158 kilodaltons. As used herein, the term "small size Cas9 variant" refers to a Cas9 variant having at least 1300 amino acids, or at least 1290 amino acids, or less than 1280 amino acids, or less than 1270 amino acids, or less than 1260 amino acids, or less than 1250 amino acids, or less than 1240 amino acids, or less than 1230 amino acids, or less than 1220 amino acids, or less than 1210 amino acids, or less than 1200 amino acids, or less than 1190 amino acids, or less than 1180 amino acids, or less than 1170 amino acids, or less than 1160 amino acids, or less than 1150 amino acids, or less than 1140 amino acids, or less than 1130 amino acids, or less than 1120 amino acids, or less than 1110 amino acids, or less than 1100 amino acids. "Cas9 variants" refers to Cas9 variants, either naturally occurring, engineered, or otherwise, that are less than about 400 amino acids long, or less than 1050 amino acids long, or less than 1000 amino acids long, or less than 950 amino acids long, or less than 900 amino acids long, or less than 850 amino acids long, or less than 800 amino acids long, or less than 750 amino acids long, or less than 700 amino acids long, or less than 650 amino acids long, or less than 600 amino acids long, or less than 550 amino acids long, or less than 500 amino acids long, but greater than about 400 amino acids long, and that retain the required function of the Cas9 protein.

1つの態様では、例20に図示されるとおり、本明細書は次の分裂インテインPE構築物を包摂する。これらは標準的なSpCas9(配列番号18)の残基1024および1025の間で分裂される(または、これらはMetマイナスの配列番号18に対して相対的に夫々残基1023および1024と言われ得る)。 In one embodiment, as illustrated in Example 20, the present invention encompasses the following split intein PE construct. These are split between residues 1024 and 1025 of standard SpCas9 (SEQ ID NO: 18) (or they can be referred to as residues 1023 and 1024, respectively, relative to Met minus SEQ ID NO: 18). ).

第1に、配列番号18のアミノ酸配列は次のとおり示される。1024(「K」)および1025(「S」)残基の間の分裂部位の位置付けを指示している:

Figure 2020191234000231
First, the amino acid sequence of SEQ ID NO: 18 is shown as follows. Indicating the location of the split site between residues 1024 (“K”) and 1025 (“S”):
Figure 2020191234000231

この構成において、N末端半分のアミノ酸配列(アミノ酸1~1024)は以下のとおりである: In this configuration, the amino acid sequence of the N-terminal half (amino acids 1-1024) is as follows:

Figure 2020191234000232
Figure 2020191234000232

この構成において、N末端半分のアミノ酸配列(アミノ酸1~1023)(ここでタンパク質は位置1にてMetマイナスである)は以下のとおりである: In this configuration, the amino acid sequence of the N-terminal half (amino acids 1-1023) (where the protein is Met minus at position 1) is as follows:

Figure 2020191234000233
Figure 2020191234000233

この構成において、C末端半分のアミノ酸配列(アミノ酸1024~1368)(またはMetマイナスCas9中アミノ酸1023~1367として数えた)は以下のとおりである: In this configuration, the amino acid sequence of the C-terminal half (amino acids 1024-1368) (or counted as amino acids 1023-1367 in Met minus Cas9) is as follows:

Figure 2020191234000234
Figure 2020191234000234

例20に示されているとおり、PE2(これは配列番号18のSpCas9に基づく)構築物を、次のとおり、(Metマイナス配列番号18に対して相対的に)位置1023/1024で2つの別個の構築物へと分裂した: As shown in Example 20, the PE2 (which is based on the SpCas9 of SEQ ID NO: 18) construct was constructed with two separate molecules at positions 1023/1024 (relative to Met minus SEQ ID NO: 18) as follows: Split into constructs:

1023/1024のN末端半分でのSpPE2分裂 SpPE2 splitting in the N-terminal half of 1023/1024

Figure 2020191234000235
Figure 2020191234000235

Figure 2020191234000236
Figure 2020191234000236

1023/1024のC末端半分でのSpPE2分裂

Figure 2020191234000237
Figure 2020191234000238
SpPE2 splitting in the C-terminal half of 1023/1024
Figure 2020191234000237
Figure 2020191234000238

Figure 2020191234000239
Figure 2020191234000239

本開示は、分裂インテインプライム編集因子を細胞に送達および/または分裂インテインプライム編集因子によって細胞を処置する方法をもまた企図する。 The present disclosure also contemplates methods of delivering a dividing intein prime editing factor to a cell and/or treating a cell with a dividing intein prime editing factor.

いくつかの態様では、本開示はPE融合タンパク質を細胞に送達する方法を提供し:
(a)第1の分裂インテイン配列に融合されたPE融合タンパク質のN末端フラグメントをコードする第1の発現ベクターを構築すること;
(b)第2の分裂インテイン配列に融合されたPE融合タンパク質のC末端フラグメントをコードする第2の発現ベクターを構築すること;
(c)第1および第2の発現ベクターを細胞に送達すること、
を含み、
第1および第2の分裂インテイン配列の自己切除を引き起こすトランススプライシング活性の結果として、N末端およびC末端フラグメントは細胞内においてPE融合タンパク質として再構成される。
In some embodiments, the present disclosure provides methods of delivering PE fusion proteins to cells:
(a) constructing a first expression vector encoding an N-terminal fragment of a PE fusion protein fused to a first split intein sequence;
(b) constructing a second expression vector encoding a C-terminal fragment of the PE fusion protein fused to a second split intein sequence;
(c) delivering the first and second expression vectors to the cell;
including;
As a result of the trans-splicing activity that causes self-excision of the first and second split intein sequences, the N-terminal and C-terminal fragments are reconstituted intracellularly as a PE fusion protein.

ある態様において、第1の分裂インテイン配列に融合されたPE融合タンパク質のN末端フラグメントは、配列番号3875、または配列番号3875との少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも98%、または少なくとも99.9%配列同一性を有するアミノ酸配列である。 In certain embodiments, the N-terminal fragment of the PE fusion protein fused to the first split intein sequence is SEQ ID NO: 3875, or at least 80%, at least 85%, at least 90%, at least 95%, at least SEQ ID NO: 3875. Amino acid sequences having 98%, or at least 99.9% sequence identity.

他の態様において、第1の分裂インテイン配列に融合されたPE融合タンパク質のC末端フラグメントは、配列番号3876、または配列番号3876との少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも98%、または少なくとも99.9%配列同一性を有するアミノ酸配列である。 In other embodiments, the C-terminal fragment of the PE fusion protein fused to the first split intein sequence is SEQ ID NO: 3876, or at least 80%, at least 85%, at least 90%, at least 95% with SEQ ID NO: 3876, Amino acid sequences having at least 98%, or at least 99.9% sequence identity.

他の態様において、本開示は、細胞内の標的DNA配列を編集する方法を提供し:
(a)第1の分裂インテイン配列に融合されたPE融合タンパク質のN末端フラグメントをコードする第1の発現ベクターを構築すること;
(b)第2の分裂インテイン配列に融合されたPE融合タンパク質のC末端フラグメントをコードする第2の発現ベクターを構築すること;
(c)第1および第2の発現ベクターを細胞に送達すること、
を含み、
第1および第2の分裂インテイン配列の自己切除を引き起こすトランススプライシング活性の結果として、N末端およびC末端フラグメントは細胞内においてPE融合タンパク質として再構成される。
In other embodiments, the disclosure provides a method of editing a target DNA sequence in a cell:
(a) constructing a first expression vector encoding an N-terminal fragment of a PE fusion protein fused to a first split intein sequence;
(b) constructing a second expression vector encoding a C-terminal fragment of the PE fusion protein fused to a second split intein sequence;
(c) delivering the first and second expression vectors to the cell;
including;
As a result of trans-splicing activity that causes self-excision of the first and second split intein sequences, the N-terminal and C-terminal fragments are reconstituted intracellularly as a PE fusion protein.

ある態様において、第1の分裂インテイン配列に融合されたPE融合タンパク質のN末端フラグメントは、配列番号3875、または配列番号3875との少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも98%、または少なくとも99.9%配列同一性を有するアミノ酸配列である。 In some embodiments, the N-terminal fragment of the PE fusion protein fused to the first split-intein sequence is SEQ ID NO:3875, or an amino acid sequence having at least 80%, at least 85%, at least 90%, at least 95%, at least 98%, or at least 99.9% sequence identity to SEQ ID NO:3875.

他の態様において、第1の分裂インテイン配列に融合されたPE融合タンパク質のC末端フラグメントは、配列番号3876、または配列番号3876との少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも98%、または少なくとも99.9%配列同一性を有するアミノ酸配列である。
PEリボヌクレオタンパク質複合体の送達
In other embodiments, the C-terminal fragment of the PE fusion protein fused to the first split intein sequence is SEQ ID NO: 3876, or at least 80%, at least 85%, at least 90%, at least 95% with SEQ ID NO: 3876, Amino acid sequences having at least 98%, or at least 99.9% sequence identity.
Delivery of PE ribonucleoprotein complexes

この側面では、プライム編集因子は、エレクトロポレーションおよび脂質ナノ粒子を包含する種々の方法によって、PEgRNAと複合体化したプライム編集因子(すなわち、PEリボヌクレオタンパク質複合体)の送達が関わる非ウイルス的送達戦略によって送達され得る。核酸の非ウイルス的送達の方法は、リポフェクション、ヌクレオフェクション、マイクロインジェクション、バイオリスティック、ビロソーム、リポソーム、イムノリポソーム、ポリカチオンまたは脂質:核酸コンジュゲート、裸のDNA、人工ビリオン、およびDNAの薬剤によって増強された取り込みを包含する。リポフェクションは例えば米国特許第5,049,386号、第4,946,787号;および第4,897,355号に記載され、リポフェクション試薬は市販で販売されている(例えば、Transfectam(商標)およびLipofectin(商標))。ポリヌクレオチドの効率的な受容体認識リポフェクションにとって好適であるカチオン性および中性脂質は、FeignerのWO91/17424;WO91/16024のものを包含する。送達は細胞(例えば、in vitroのまたはエクスビボの投与)または標的組織(例えばインビボの投与)にであり得る。 In this aspect, prime editing agents can be delivered using non-viral methods that involve the delivery of prime editing agents (i.e., PE ribonucleoprotein complexes) complexed with PEgRNA by various methods including electroporation and lipid nanoparticles. delivery strategy. Methods of non-viral delivery of nucleic acids include lipofection, nucleofection, microinjection, biolistics, virosomes, liposomes, immunoliposomes, polycations or lipid:nucleic acid conjugates, naked DNA, artificial virions, and DNA agents. Includes enhanced uptake. Lipofection is described in, for example, US Pat. Cationic and neutral lipids suitable for efficient receptor recognition lipofection of polynucleotides include those of Feigner, WO91/17424; WO91/16024. Delivery can be to cells (eg, in vitro or ex vivo administration) or target tissues (eg, in vivo administration).

イムノ脂質複合体などの標的化リポソームを包含する脂質:核酸複合体の調製は当業者に周知である(例として、Crystal,Science 270:404-410(1995);Blaese et al.,Cancer Gene Ther.2:291-297(1995);Behr et al.,Bioconjugate Chem.5:382-389(1994);Remy et al.,Bioconjugate Chem.5:647-654(1994);Gao et al.,Gene Therapy 2:710-722(1995);Ahmad et al.,Cancer Res.52:4817-4820(1992);米国特許第4,186,183号、第4,217,344号、第4,235,871号、第4,261,975号、第4,485,054号、第4,501,728号、第4,774,085号、第4,837,028号、および第4,946,787号を参照)。 The preparation of lipid:nucleic acid complexes, including targeted liposomes such as immunolipid complexes, is well known to those of skill in the art (see, e.g., Crystal, Science 270:404-410 (1995); Blaese et al., Cancer Gene Ther. 2:291-297 (1995); Behr et al., Bioconjugate Chem. 5:382-389 (1994); Remy et al., Bioconjugate Chem. 5:647-654 (1994); Gao et al., Gene Therapy 2:710-722 (1995); Ahmad et al., Cancer Res. 52:4817-4820 (1992); see U.S. Patent Nos. 4,186,183, 4,217,344, 4,235,871, 4,261,975, 4,485,054, 4,501,728, 4,774,085, 4,837,028, and 4,946,787).

リボヌクレオタンパク質複合体の非ウイルス的送達のためのアプローチを論ずる次の参照の追加の参照がなされ得る。これらの夫々は参照によって本願に組み込まれる。 Additional reference may be made to the following references that discuss approaches for non-viral delivery of ribonucleoprotein complexes. Each of these is incorporated herein by reference.

Chen,Sean,et al.“Highly efficient mouse genome editing by CRISPR ribonucleoprotein electroporation of zygotes.”Journal of Biological Chemistry(2016):jbc-M116.PubMed Chen,Sean,et al.“Highly efficient mouse genome editing by CRISPR ribonucleoprotein electroporation of zygotes.”Journal of Biological Chemistry(2016):jbc-M116.PubMed

Zuris,John A.,et al.“Cationic lipid-mediated delivery of proteins enables efficient protein-based genome editing in vitro and in vivo.”Nature biotechnology 33.1(2015):73.PubMed Zuris, John A., et al. “Cationic lipid-mediated efficient delivery of proteins enables protein-based genome editing in vitro and in vivo.” Nature biotechnology 33.1(2015):73. PubMed

Rouet,Romain,et al.“Receptor-Mediated Delivery of CRISPR-Cas9 Endonuclease for Cell-Type-Specific Gene Editing.”Journal of the American Chemical Society 140.21(2018):6596-6603.PubMed. Rouet, Romain, et al. “Receptor-Mediated Delivery of CRISPR-Cas9 Endonuclease for Cell-Type-Specific Gene Editing.” Journal of the American Chemical Society 140.21(2018):6596-6603. PubMed.

図68Cは、種々の開示されるPEリボヌクレオタンパク質複合体(高濃度のPE2、高濃度のPE3、および低濃度のPE3)がこの様式で送達され得るということを示すデータを提供する。
mRNAによるPEの送達
Figure 68C provides data showing that various disclosed PE ribonucleoprotein complexes (high concentration of PE2, high concentration of PE3, and low concentration of PE3) can be delivered in this manner.
Delivery of PE by mRNA

プライム編集に基づくゲノム編集が望まれる細胞に、プライム編集因子および/またはPEgRNAを送達するために使用され得る別の方法は、メッセンジャーRNA(mRNA)送達方法およびテクノロジーの使用を使用することによってである。本開示に利用され得るmRNA送達方法および組成物の例は、例えばPCT/US2014/028330、US8822663B2、NZ700688A、ES2740248T3、EP2755693A4、EP2755986A4、WO2014152940A1、EP3450553B1、BR112016030852A2、およびEP3362461A1を包含する。これらの夫々はそれらの全体が参照によって本願に組み込まれる。参照によってここに組み込まれる追加の開示はKowalski et al.,“Delivering the Messenger:Advances in Technologies for Therapeutic mRNA Delivery,”Mol Therap.,2019; 27(4):710-728に見出され得る。 Another method that can be used to deliver prime editing factors and/or PEgRNA to cells in which prime editing-based genome editing is desired is by using messenger RNA (mRNA) delivery methods and technologies. . Examples of mRNA delivery methods and compositions that can be utilized in the present disclosure include, for example, PCT/US2014/028330, US8822663B2, NZ700688A, ES2740248T3, EP2755693A4, EP2755986A4, WO2014152940A1, EP3450553B1, BR11201603085 2A2, and EP3362461A1. Each of these is incorporated herein by reference in its entirety. Additional disclosure can be found in Kowalski et al., “Delivering the Messenger: Advances in Technologies for Therapeutic mRNA Delivery,” Mol Therap., 2019; 27(4):710-728, which is incorporated herein by reference.

プライム編集因子をコードするDNAベクターとは対照的に、プライム編集因子の送達物質としてのRNAの使用は、遺伝物質がその機能を果たすために核に入らなくてもよいという利点を有する。送達されたmRNAは細胞質において直接的に所望のタンパク質(例えば、プライム編集因子融合タンパク質)および核酸産物(例えばPEgRNA)へと翻訳され得る。しかしながら、より安定である(例えば、細胞質のRNA分解酵素に抵抗する)ためには、いくつかの態様では、送達効率を改善するためにmRNAを安定化することが必要である。ある種の送達担体、例えばカチオン性脂質またはポリマー性の送達担体は、トランスフェクションされたmRNAを内生RNase酵素から防護することをもまた助け得る。これらは、さもなければ、所望のプライム編集因子融合タンパク質をコードする治療学的なmRNAを分解し得る。加えて、修飾されたmRNAの増大した安定性にもかかわらず、治療学的レベルのタンパク質生産を許す様式でのインビボの細胞へのmRNA、特に全長タンパク質をコードするmRNAの送達は、課題のままに留まっている。 In contrast to DNA vectors encoding prime editors, the use of RNA as a delivery agent for prime editors has the advantage that the genetic material does not have to enter the nucleus to perform its function. The delivered mRNA can be translated directly in the cytoplasm into the desired protein (e.g., prime editor fusion protein) and nucleic acid product (e.g., PEgRNA). However, to be more stable (e.g., resistant to cytoplasmic RNA-degrading enzymes), in some embodiments it is necessary to stabilize the mRNA to improve delivery efficiency. Certain delivery vehicles, such as cationic lipids or polymeric delivery vehicles, can also help protect the transfected mRNA from endogenous RNase enzymes, which could otherwise degrade the therapeutic mRNA encoding the desired prime editor fusion protein. In addition, despite the increased stability of modified mRNAs, delivery of mRNAs, especially mRNAs encoding full-length proteins, to cells in vivo in a manner that allows therapeutic levels of protein production remains a challenge.

いくつかの例外はあるが、mRNAの細胞内送達は小さいオリゴヌクレオチドのものよりも一般的に難しく、それは送達ナノ粒子へのカプセル化を要求する。部分的には、他の型のRNA(低分子干渉RNA[siRNA]、~14kDa;アンチセンスオリゴヌクレオチド[ASO]、4~10kDa)と比較して、mRNA分子の有意に大きいサイズ(300~5,000kDa、~1~15kb)を原因とする。 With some exceptions, intracellular delivery of mRNA is generally more difficult than that of small oligonucleotides, which requires encapsulation into delivery nanoparticles. In part, this is due to the significantly larger size of mRNA molecules (300–5,000 kDa, ~1-15kb).

mRNAは細胞質に達するためには細胞膜を横断しなければならない。細胞膜は細胞内送達への動的なかつ手強い関門である。それは主として双性イオン性のおよび負荷電のリン脂質の脂質二重層から作り上げられており、ここで、リン脂質の極性頭部は水性環境の方を向き、疎水性テールは疎水性コアを形成する。 mRNA must cross the cell membrane to reach the cytoplasm. The cell membrane is a dynamic and formidable barrier to intracellular delivery. It is made up of a lipid bilayer of primarily zwitterionic and negatively charged phospholipids, where the polar heads of the phospholipids face towards the aqueous environment and the hydrophobic tails form a hydrophobic core. .

いくつかの態様では、本開示のmRNA組成物は、mRNA(プライム編集因子および/またはPEgRNAをコードする)、輸送基剤、および任意に標的細胞との接触と爾後のトランスフェクションとを容易化する薬剤を含む。 In some embodiments, the mRNA compositions of the present disclosure include an mRNA (encoding a prime editing factor and/or a PEgRNA), a transport vehicle, and optionally a target cell to facilitate contact and subsequent transfection. Contains drugs.

いくつかの態様では、mRNAは、(例えば、mRNAの野生型のまたはネイティブなバージョンと比較して)mRNAに安定性を付与し、タンパク質の関連する異常な発現に関わる1つ以上の改変を包含し得る。欠陥を修正する野生型の1つ以上の改変もまた包含され得る。例えば、本発明の核酸は5'非翻訳領域または3'非翻訳領域の1つまたは両方の改変を包含し得る。かかる改変は、サイトメガロウイルス(CMV)最初期1(IE1)遺伝子、ポリAテール、キャップ1構造、またはヒト成長ホルモン(hGH)の部分配列をコードする配列の包含を包含し得る。いくつかの態様では、mRNAはmRNA免疫原性を縮減するように修飾される。 In some embodiments, the mRNA includes one or more modifications that confer stability to the mRNA (e.g., compared to a wild-type or native version of the mRNA) and are involved in associated aberrant expression of the protein. It is possible. One or more modifications of the wild type that correct the defect may also be included. For example, a nucleic acid of the invention may include modifications of one or both of the 5' untranslated region or the 3' untranslated region. Such modifications may include the inclusion of sequences encoding the cytomegalovirus (CMV) immediate early 1 (IE1) gene, the poly A tail, the cap 1 structure, or a subsequence of human growth hormone (hGH). In some embodiments, the mRNA is modified to reduce mRNA immunogenicity.

1つの態様では、本発明の組成物中の「プライム編集因子」mRNAは、標的細胞への送達を容易化するためにリポソーム移入基剤によって製剤され得る。企図される移入基剤は、1つ以上のカチオン性脂質、非カチオン性脂質、および/またはPEG修飾脂質を包含し得る。例えば、移入基剤は次のカチオン性脂質の少なくとも1つを包含し得る:C12-200、DLin-KC2-DMA、DODAP、HGT4003、ICE、HGT5000、またはHGT5001。態様では、移入基剤はコレステロール(chol)および/またはPEG修飾脂質を含む。いくつかの態様では、移入基剤はDMG-PEG2Kを含む。ある態様において、移入基剤は次の脂質製剤を有する:C12-200、DOPE、chol、DMG-PEG2K;DODAP、DOPE、コレステロール、DMG-PEG2K;HGT5000、DOPE、chol、DMG-PEG2K、HGT5001、DOPE、chol、DMG-PEG2Kの1つ。 In one embodiment, the "prime editing factor" mRNA in the compositions of the invention can be formulated with a liposomal transfer vehicle to facilitate delivery to target cells. Contemplated import vehicles may include one or more cationic lipids, non-cationic lipids, and/or PEG-modified lipids. For example, the import vehicle can include at least one of the following cationic lipids: C12-200, DLin-KC2-DMA, DODAP, HGT4003, ICE, HGT5000, or HGT5001. In embodiments, the import vehicle comprises cholesterol (chol) and/or PEG-modified lipids. In some embodiments, the import vehicle comprises DMG-PEG2K. In certain embodiments, the import vehicle has the following lipid formulation: C12-200, DOPE, chol, DMG-PEG2K; DODAP, DOPE, cholesterol, DMG-PEG2K; HGT5000, DOPE, chol, DMG-PEG2K, HGT5001, DOPE , chol, one of DMG-PEG2K.

本開示は、1つ以上のPEをコードするmRNA分子による標的細胞のトランスフェクションを容易化することにとって有用な組成物および方法をもまた提供する。例えば、本発明の組成物および方法は、1つ以上の標的細胞に対する組成物の親和性を増大させ得る標的化リガンドの使用を企図する。1つの態様では、標的化リガンドはアポリポタンパク質Bまたはアポリポタンパク質Eであり、対応する標的細胞は低密度リポタンパク質受容体を発現し、それゆえに標的化リガンドの認識を促進する。膨大な数の標的細胞が本開示の方法および組成物を用いて選好的に標的化され得る。例えば、企図される標的細胞は、肝細胞、上皮細胞、造血細胞、上皮細胞、内皮細胞、肺細胞、骨細胞、幹細胞、間葉系細胞、神経細胞、心臓細胞、脂肪細胞、血管平滑筋包含(Includes)細胞、心筋細胞、骨格筋細胞、ベータ細胞、下垂体細胞、滑膜表層細胞、卵巣細胞、精巣細胞、線維芽細胞、B細胞、T細胞、網赤血球、白血球、顆粒球、および腫瘍細胞を包含する。しかしながら、それはこれらに限定されない。 The present disclosure also provides compositions and methods useful for facilitating transfection of target cells with mRNA molecules encoding one or more PEs. For example, the compositions and methods of the invention contemplate the use of targeting ligands that can increase the affinity of the composition for one or more target cells. In one embodiment, the targeting ligand is apolipoprotein B or apolipoprotein E, and the corresponding target cell expresses a low density lipoprotein receptor, thus facilitating recognition of the targeting ligand. A vast number of target cells can be selectively targeted using the methods and compositions of the present disclosure. For example, contemplated target cells include hepatocytes, epithelial cells, hematopoietic cells, epithelial cells, endothelial cells, lung cells, bone cells, stem cells, mesenchymal cells, nerve cells, cardiac cells, adipocytes, vascular smooth muscle cells. (Includes) cells, cardiomyocytes, skeletal muscle cells, beta cells, pituitary cells, synovial surface cells, ovarian cells, testicular cells, fibroblasts, B cells, T cells, reticulocytes, leukocytes, granulocytes, and tumors. Contains cells. However, it is not limited to these.

いくつかの態様では、PEをコードするmRNAは、任意に、例えばかかるmRNAの安定性および/もしくは半減期を改善するかまたはタンパク質生産を改善もしくは別様に容易化する化学的または生物学的修飾を有し得る。トランスフェクションによって、本発明の組成物中の天然のmRNAは30分および何日かの間の半減期で崩壊し得る。本開示の組成物中のmRNAは翻訳される少なくともいくらかの能力を保持し得、それによって機能的なタンパク質または酵素を生ずる。従って、本発明は、安定化されたmRNAを含む組成物およびそれを投与する方法を提供する。いくつかの態様では、mRNAの活性は伸長された期間に渡って遷延する。例えば、本開示の組成物が半週毎もしくは隔週毎の基準で、またはより好ましくは毎月、隔月毎、四半期毎、もしくは毎年の基準で対象に投与されるようにして、mRNAの活性は遷延し得る。本発明のmRNAの伸長または遷延した活性は、かかるmRNAから生ずるタンパク質または酵素の数量に直接的に関係する。類似に、本開示の組成物の活性は、mRNAの翻訳を改善または増強するためになされる改変によってさらに伸長または遷延し得る。さらにその上、標的細胞によって生ずる機能的なタンパク質または酵素の数量は、標的細胞に送達されるmRNAの数量およびかかるmRNAの安定性の関数である。本発明のmRNAの安定性が改善または増強され得る程度に合わせて、半減期、生ずるタンパク質または酵素の活性、および組成物の投薬頻度はさらに伸長され得る。 In some embodiments, the mRNA encoding PE is optionally modified with chemical or biological modifications that, for example, improves the stability and/or half-life of such mRNA or improves or otherwise facilitates protein production. may have. Upon transfection, the native mRNA in the compositions of the invention may decay with a half-life of between 30 minutes and several days. The mRNA in the compositions of the present disclosure may retain at least some ability to be translated, thereby yielding a functional protein or enzyme. Accordingly, the present invention provides compositions containing stabilized mRNA and methods of administering the same. In some embodiments, the activity of the mRNA is prolonged for an extended period of time. For example, the compositions of the present disclosure may be administered to a subject on a semi-weekly or biweekly basis, or more preferably on a monthly, bimonthly, quarterly, or yearly basis, such that the activity of the mRNA is prolonged. obtain. The elongated or prolonged activity of the mRNA of the invention is directly related to the amount of protein or enzyme produced from such mRNA. Similarly, the activity of the compositions of the present disclosure may be further extended or prolonged by modifications made to improve or enhance mRNA translation. Furthermore, the quantity of functional protein or enzyme produced by a target cell is a function of the quantity of mRNA delivered to the target cell and the stability of such mRNA. To the extent that the stability of the mRNA of the invention can be improved or enhanced, the half-life, activity of the resulting protein or enzyme, and frequency of dosing of the composition can be further extended.

従って、いくつかの態様では、本開示の組成物中のmRNAは、例えばインビボのヌクレアーゼ消化に対する改善された耐性を包含する増大または増強された安定性を核酸に付与する少なくとも1つの改変を含む。本願において用いられる用語「改変」および「改変される」は、かかる用語が本願において提供される核酸に関すると、好ましくは安定性を増強し、mRNAの野生型または天然に存在するバージョンよりもmRNAを安定に(例えば、ヌクレアーゼ消化に対して耐性に)する少なくとも1つの変改を包含する。本願において用いられる用語「安定」および「安定性」は、かかる用語が特にmRNAについて本発明の核酸に関すると、例えば正常ではかかるmRNAを分解することができるヌクレアーゼ(すなわち、エンドヌクレアーゼまたはエキソヌクレアーゼ)による分解に対する増大または増強した耐性を言う。増大した安定性は、例えば、標的細胞または組織内の内生酵素(例えば、エンドヌクレアーゼもしくはエキソヌクレアーゼ)または条件による加水分解または他の破壊に対するより少ない感度を包含し得、それによって、標的細胞、組織、対象、および/または細胞質におけるかかるmRNAの滞留を増大または増強する。本願において提供される安定化されたmRNA分子は、それらの天然に存在する未改変のカウンターパート(例えば、mRNAの野生型バージョン)に対して相対的に、長い半減期を実証する。また、かかる用語が本発明のmRNAに関係すると、用語「改変」および「改変される」によって、mRNA核酸の翻訳を改善または増強する変改が企図される。例えば、タンパク質翻訳の開始に機能する配列(例えば、Kozakコンセンサス配列)の包含を包含する。(Kozak,M.,Nucleic Acids Res 15(20):8125-48(1987))。 Thus, in some embodiments, the mRNA in the compositions of the present disclosure comprises at least one modification that confers increased or enhanced stability to the nucleic acid, including, for example, improved resistance to nuclease digestion in vivo. As used in this application, the terms "modified" and "altered", as such terms relate to the nucleic acids provided herein, preferably enhance stability and make the mRNA more stable than the wild-type or naturally occurring version of the mRNA. Includes at least one modification that renders it stable (eg, resistant to nuclease digestion). As used in this application, the terms "stable" and "stability" refer to the nucleic acids of the invention, particularly when such terms refer to mRNA, e.g. Refers to increased or enhanced resistance to degradation. Increased stability may include, for example, less susceptibility to hydrolysis or other destruction by endogenous enzymes (e.g., endonucleases or exonucleases) or conditions within the target cell or tissue, whereby the target cell, Increase or enhance the retention of such mRNA in the tissue, subject, and/or cytoplasm. The stabilized mRNA molecules provided herein demonstrate long half-lives relative to their naturally occurring, unmodified counterparts (eg, the wild-type version of the mRNA). Also, when such terms relate to the mRNA of the present invention, the terms "modification" and "altered" contemplate modifications that improve or enhance translation of the mRNA nucleic acid. For example, this includes the inclusion of sequences that function in the initiation of protein translation (eg, Kozak consensus sequences). (Kozak, M., Nucleic Acids Res 15(20):8125-48(1987)).

いくつかの態様では、本開示の組成物に用いられるmRNAは、それらをより安定にするための化学的または生物学的修飾を経過している。mRNAの例示の修飾は、塩基の枯渇(例えば、1つのヌクレオチドの欠失もしくは別のものへの置換による)または塩基の修飾、例えば塩基の化学修飾を包含する。本願において用いられる言い回し「化学修飾」は、天然に存在するmRNAに見られるものとは異なるケミストリーを導入する修飾、例えば共有結合的修飾、例えば修飾ヌクレオチドの導入(例えば、ヌクレオチドアナログ、またはかかるmRNA分子に天然には見出されないペンダント基の包含)を包含する。 In some embodiments, the mRNAs used in the compositions of the present disclosure have undergone chemical or biological modification to make them more stable. Exemplary modifications of mRNA include base depletion (eg, by deleting one nucleotide or substituting another) or base modification, eg, chemical modification of the base. As used herein, the phrase "chemical modification" refers to modifications that introduce chemistry different from that found in naturally occurring mRNA, such as covalent modifications, such as the introduction of modified nucleotides (e.g., nucleotide analogs, or (inclusion of pendant groups not found in nature).

本開示の組成物に用いられるPEをコードするmRNAに組み込まれ得る他の好適なポリヌクレオチド修飾は、4'-チオ修飾塩基:4'-チオアデノシン、4'-チオグアノシン、4'-チオシチジン、4'-チオウリジン、4'-チオ-5-メチル-シチジン、4'-チオシュードウリジン、および4'-チオ2-チオウリジン、ピリジン-4-オンリボヌクレオシド、5-アザ-ウリジン、2-チオ-5-アザ-ウリジン、2-チオウリジン、4-チオシュードウリジン、2-チオシュードウリジン、5-ヒドロキシウリジン、3-メチルウリジン、5-カルボキシメチル-ウリジン、1-カルボキシメチル-シュードウリジン、5-プロピニルウリジン、1-プロピニルシュードウリジン、5-タウリノメチルウリジン、1-タウリノメチル-シュードウリジン、5-タウリノメチル-2-チオウリジン、1-タウリノメチル-4-チオウリジン、5-メチル-ウリジン、1-メチル-シュードウリジン、4-チオ-1-メチル-シュードウリジン、2-チオ-1-メチル-シュードウリジン、1-メチル-1-デアザ-シュードウリジン、2-チオ-1-メチル-1-デアザ-シュードウリジン、ジヒドロウリジン、ジヒドロシュードウリジン、2-チオジヒドロウリジン、2-チオジヒドロシュードウリジン、2-メトキシウリジン、2-メトキシ-4-チオウリジン、4-メトキシ-シュードウリジン、4-メトキシ-2-チオシュードウリジン、5-アザ-シチジン、シュードイソシチジン、3-メチル-シチジン、N4-アセチルシチジン、5-ホルミルシチジン、N4-メチルシチジン、5-ヒドロキシメチルシチジン、1-メチル-シュードイソシチジン、ピロロ-シチジン、ピロロ-シュードイソシチジン、2-チオシチジン、2-チオ-5-メチル-シチジン、4-チオシュードイソシチジン、4-チオ-1-メチル-シュードイソシチジン、4-チオ-1-メチル-1-デアザ-シュードイソシチジン、1-メチル-1-デアザ-シュードイソシチジン、ゼブラリン、5-アザ-ゼブラリン、5-メチルゼブラリン、5-アザ-2-チオゼブラリン、2-チオゼブラリン、2-メトキシ-シチジン、2-メトキシ-5-メチル-シチジン、4-メトキシ-シュードイソシチジン、4-メトキシ-1-メチル-シュードイソシチジン、2-アミノプリン、2,6-ジアミノプリン、7-デアザ-アデニン、7-デアザ-8-アザ-アデニン、7-デアザ-2-アミノプリン、7-デアザ-8-アザ-2-アミノプリン、7-デアザ-2,6-ジアミノプリン、7-デアザ-8-アザ-2,6-ジアミノプリン、1-メチルアデノシン、N6-メチルアデノシン、N6-イソペンテニルアデノシン、N6-(シス-ヒドロキシイソペンテニル)アデノシン、2-メチルチオ-N6-(シス-ヒドロキシイソペンテニル)アデノシン、N6-グリシニルカルバモイルアデノシン、N6-スレオニルカルバモイルアデノシン、2-メチルチオ-N6-スレオニルカルバモイルアデノシン、N6,N6-ジメチルアデノシン、7-メチルアデニン、2-メチルチオアデニン、および2-メトキシ-アデニン、イノシン、1-メチル-イノシン、ワイオシン、ワイブトシン、7-デアザ-グアノシン、7-デアザ-8-アザ-グアノシン、6-チオグアノシン、6-チオ-7-デアザ-グアノシン、6-チオ-7-デアザ-8-アザ-グアノシン、7-メチル-グアノシン、6-チオ-7-メチル-グアノシン、7-メチルイノシン、6-メトキシ-グアノシン、1-メチルグアノシン、sN2-メチルグアノシン、N2,N2-ジメチルグアノシン、8-オキソ-グアノシン、7-メチル-8-オキソ-グアノシン、1-メチル-6-チオグアノシン、N2-メチル-6-チオグアノシン、およびN2,N2-ジメチル-6-チオグアノシン、ならびにそれらの組み合わせを包含するが、これらに限定されない。用語修飾は、例えば、本発明のmRNA配列上への非ヌクレオチド連結部または修飾ヌクレオチドの組み込みをもまた包含する(例えば、機能的なタンパク質または酵素をコードするmRNA分子の3'および5'端の1つまたは両方の修飾)。かかる修飾は、mRNA配列への塩基の追加(例えば、ポリAテールまたはより長いポリAテールの包含)、3'UTRまたは5'UTRの変改、mRNAを薬剤(例えば、タンパク質または相補的な核酸分子)と複合体化すること、mRNA分子の構造を変化させるエレメント(例えば、これは二次構造を形成する)の包含を包含する。 Other suitable polynucleotide modifications that may be incorporated into the mRNA encoding PE used in the compositions of the present disclosure include 4'-thio modified bases: 4'-thioadenosine, 4'-thioguanosine, 4'-thiocytidine, 4'-thiouridine, 4'-thio-5-methyl-cytidine, 4'-thiopseudouridine, and 4'-thio2-thiouridine, pyridin-4-one ribonucleoside, 5-aza-uridine, 2-thio- 5-aza-uridine, 2-thiouridine, 4-thiopseudouridine, 2-thiopseudouridine, 5-hydroxyuridine, 3-methyluridine, 5-carboxymethyl-uridine, 1-carboxymethyl-pseudouridine, 5-propynyl Uridine, 1-propynylpseudouridine, 5-taurinomethyluridine, 1-taurinomethyl-pseudouridine, 5-taurinomethyl-2-thiouridine, 1-taurinomethyl-4-thiouridine, 5-methyl-uridine, 1-methyl-pseudouridine , 4-thio-1-methyl-pseudouridine, 2-thio-1-methyl-pseudouridine, 1-methyl-1-deaza-pseudouridine, 2-thio-1-methyl-1-deaza-pseudouridine, dihydro Uridine, dihydropseudouridine, 2-thiodihydrouridine, 2-thiodihydropseudouridine, 2-methoxyuridine, 2-methoxy-4-thiouridine, 4-methoxy-pseudouridine, 4-methoxy-2-thiopseudouridine, 5 -Aza-cytidine, pseudoisocytidine, 3-methyl-cytidine, N4-acetylcytidine, 5-formylcytidine, N4-methylcytidine, 5-hydroxymethylcytidine, 1-methyl-pseudoisocytidine, pyrrolo-cytidine, pyrrolo- Pseudisocytidine, 2-Thiocytidine, 2-thio-5-methyl-cytidine, 4-Thiopseudoisocytidine, 4-thio-1-methyl-pseudoisocytidine, 4-thio-1-methyl-1-deaza-pseudo Isocytidine, 1-methyl-1-deaza-pseudoisocytidine, zebularine, 5-aza-zebularine, 5-methylzebularine, 5-aza-2-thiosebularine, 2-thiosebularine, 2-methoxy-cytidine, 2-methoxy -5-Methyl-cytidine, 4-methoxy-pseudoisocytidine, 4-methoxy-1-methyl-pseudoisocytidine, 2-aminopurine, 2,6-diaminopurine, 7-deaza-adenine, 7-deaza-8 -aza-adenine, 7-deaza-2-aminopurine, 7-deaza-8-aza-2-aminopurine, 7-deaza-2,6-diaminopurine, 7-deaza-8-aza-2,6- Diaminopurine, 1-methyladenosine, N6-methyladenosine, N6-isopentenyladenosine, N6-(cis-hydroxyisopentenyl)adenosine, 2-methylthio-N6-(cis-hydroxyisopentenyl)adenosine, N6-glycinylcarbamoyl Adenosine, N6-threonylcarbamoyladenosine, 2-methylthio-N6-threonylcarbamoyladenosine, N6,N6-dimethyladenosine, 7-methyladenine, 2-methylthioadenine, and 2-methoxy-adenine, inosine, 1-methyl- Inosine, wyosine, wybutosine, 7-deaza-guanosine, 7-deaza-8-aza-guanosine, 6-thioguanosine, 6-thio-7-deaza-guanosine, 6-thio-7-deaza-8-aza-guanosine , 7-methyl-guanosine, 6-thio-7-methyl-guanosine, 7-methylinosine, 6-methoxy-guanosine, 1-methylguanosine, sN2-methylguanosine, N2,N2-dimethylguanosine, 8-oxo-guanosine , 7-methyl-8-oxo-guanosine, 1-methyl-6-thioguanosine, N2-methyl-6-thioguanosine, and N2,N2-dimethyl-6-thioguanosine, and combinations thereof, Not limited to these. The term modification also encompasses, for example, the incorporation of non-nucleotide linkages or modified nucleotides onto the mRNA sequences of the invention (e.g., at the 3' and 5' ends of an mRNA molecule encoding a functional protein or enzyme). one or both qualifications). Such modifications may include adding bases to the mRNA sequence (e.g., inclusion of a polyA tail or a longer polyA tail), altering the 3'UTR or 5'UTR, or converting the mRNA into a drug (e.g., protein or complementary nucleic acid). molecule) and the inclusion of elements that alter the structure of the mRNA molecule (eg, which form secondary structure).

いくつかの態様では、PEをコードするmRNAは5'キャップ構造を包含する。5'キャップは典型的には次のとおり追加される:第1に、RNA末端ホスファターゼが末端リン酸基の1つを5'ヌクレオチドから除去し、2つの末端リン酸を残す;それから、グアノシン三リン酸(GTP)がグアニリルトランスフェラーゼによって末端リン酸に追加され、5'5'5三リン酸連結部を生ずる;それから、グアニンの7-窒素がメチルトランスフェラーゼによってメチル化される。キャップ構造の例は、m7G(5')ppp(5'(A、G(5')ppp(5')A、およびG(5')ppp(5')Gを包含するが、これらに限定されない。天然に存在するキャップ構造は、三リン酸ブリッジを介して最初に転写されるヌクレオチドの5'端に連結されている7-メチルグアノシンを含み、m7G(5')ppp(5')Nのジヌクレオチドキャップをもたらし、Nはいずれかのヌクレオシドである。インビボでは、キャップは酵素的に追加される。キャップは核内で追加され、酵素グアニリルトランスフェラーゼによって触媒される。RNAの5'末端の端へのキャップの追加は転写の開始後に直ちに生起する。末端ヌクレオシドは典型的にはグアノシンであり、全ての他のヌクレオチドとは逆向き、すなわちG(5')ppp(5')GpNpNpである。 In some embodiments, the mRNA encoding PE includes a 5' cap structure. The 5' cap is typically added as follows: first, RNA terminal phosphatases remove one of the terminal phosphate groups from the 5' nucleotide, leaving two terminal phosphates; Phosphate (GTP) is added to the terminal phosphate by guanylyltransferase, creating a 5'5'5 triphosphate linkage; then the 7-nitrogen of the guanine is methylated by methyltransferase. Examples of cap structures include, but are not limited to, m7G(5')ppp(5'(A, G(5')ppp(5')A, and G(5')ppp(5')G. The naturally occurring cap structure contains a 7-methylguanosine linked to the 5' end of the first transcribed nucleotide via a triphosphate bridge, m7G(5')ppp(5')N resulting in a dinucleotide cap, where N is any nucleoside. In vivo, the cap is added enzymatically. The cap is added in the nucleus, catalyzed by the enzyme guanylyltransferase. The 5' of the RNA Addition of a cap to the terminal end occurs immediately after the initiation of transcription. The terminal nucleoside is typically a guanosine and is oriented in the opposite direction to all other nucleotides, i.e. G(5')ppp(5')GpNpNp It is.

追加のキャップアナログは、m7GpppG、m7GpppA、m7GpppC;非メチル化キャップアナログ(例えばGpppG);ジメチル化キャップアナログ(例えばm2,7GpppG)、トリメチル化キャップアナログ(例えば、m2,2,7GpppG)、ジメチル化対称キャップアナログ(例えば、m7Gpppm7G)、またはアンチリバースキャップアナログ(例えば、ARCA;m7,2'OmeGpppG、m72'dGpppG、m7,3'OmeGpppG、m7,3'dGpppG、およびそれらの四リン酸誘導体)からなる群から選択される化学構造を包含するが、これらに限定されない(例えば、Jemielity,J.et al.,“Novel 'anti-reverse'cap analogs with superior translational properties”,RNA,9:1108-1122(2003)を見よ)。 Additional cap analogs include m7GpppG, m7GpppA, m7GpppC; unmethylated cap analogs (e.g. GpppG); dimethylated cap analogs (e.g. m2,7GpppG), trimethylated cap analogs (e.g. m2,2,7GpppG), dimethylated symmetrical cap analogs (e.g. m7Gpppm7G), or anti-reverse cap analogs (e.g. ARCA; m7,2'OmeGpppG, m72'dGpppG, m7,3'OmeGpppG, m7,3'dGpppG, and their tetraphosphate derivatives) including, but not limited to, chemical structures selected from the group (e.g., Jemielity, J. et al., “Novel 'anti-reverse'cap analogs with superior translational properties”, RNA, 9:1108-1122( (see 2003).

典型的には、「テール」の存在はエキソヌクレアーゼ分解からmRNAを防護するための用をなす。ポリAまたはポリUテールは天然のメッセンジャーおよび合成センスRNAを安定化すると考えられる。よって、ある態様において、長いポリAまたはポリUテールがmRNA分子に追加され得、それゆえにRNAをより安定にする。ポリAまたはポリUテールは種々の当該技術分野で認識される技術を用いて追加され得る。例えば、長いポリAテールは、ポリAポリメラーゼを用いて合成のまたはin vitro転写されたRNAに追加され得る(Yokoe,et al.Nature Biotechnology.1996;14:1252-1256)。転写ベクターもまた長いポリAテールをコードし得る。加えて、ポリAテールは直接的にPCR産物からの転写によって追加され得る。ポリAはRNAリガーゼによってもまたセンスRNAの3’端にライゲーションされ得る(例えば、Sambrook、FritschおよびManiatisによるMolecular Cloning A Laboratory Manual,2nd Ed.,ed.(Cold Spring Harbor Laboratory Press:1991 edition)を見よ)。 Typically, the presence of a "tail" serves to protect the mRNA from exonuclease degradation. PolyA or polyU tails are thought to stabilize natural messenger and synthetic sense RNA. Thus, in some embodiments, a long polyA or polyU tail can be added to an mRNA molecule, thus making the RNA more stable. PolyA or polyU tails can be added using a variety of art-recognized techniques. For example, a long polyA tail can be added to synthetic or in vitro transcribed RNA using polyA polymerase (Yokoe, et al. Nature Biotechnology. 1996;14:1252-1256). Transcription vectors can also encode long polyA tails. Additionally, polyA tails can be added by transcription directly from PCR products. Poly A can also be ligated to the 3' end of the sense RNA by RNA ligase (see, e.g., Molecular Cloning A Laboratory Manual, 2nd Ed., ed. by Sambrook, Fritsch, and Maniatis (Cold Spring Harbor Laboratory Press: 1991 edition)).

典型的には、ポリAまたはポリUテールの長さは少なくとも約10、50、100、200、300、400、少なくとも500ヌクレオチドであり得る。いくつかの態様では、mRNAの3'末端のポリAテールは典型的には約10から300アデノシンヌクレオチドを包含する(例えば、約10から200アデノシンヌクレオチド、約10から150アデノシンヌクレオチド、約10から100アデノシンヌクレオチド、約20から70アデノシンヌクレオチド、または約20から60アデノシンヌクレオチド)。いくつかの態様では、mRNAは3'ポリCテール構造を包含する。mRNAの3'末端の好適なポリCテールは典型的には約10から200シトシンヌクレオチドを包含する(例えば、約10から150シトシンヌクレオチド、約10から100シトシンヌクレオチド、約20から70シトシンヌクレオチド、約20から60シトシンヌクレオチド、または約10から40シトシンヌクレオチド)。ポリCテールはポリAまたはポリUテールに追加され得るか、あるいはポリAまたはポリUテールを置換し得る。 Typically, the length of the polyA or polyU tail can be at least about 10, 50, 100, 200, 300, 400, at least 500 nucleotides. In some embodiments, the polyA tail at the 3' end of the mRNA typically includes about 10 to 300 adenosine nucleotides (e.g., about 10 to 200 adenosine nucleotides, about 10 to 150 adenosine nucleotides, about 10 to 100 adenosine nucleotides, about 20 to 70 adenosine nucleotides, or about 20 to 60 adenosine nucleotides). In some embodiments, the mRNA includes a 3' polyC tail structure. A suitable polyC tail at the 3' end of the mRNA typically includes about 10 to 200 cytosine nucleotides (e.g., about 10 to 150 cytosine nucleotides, about 10 to 100 cytosine nucleotides, about 20 to 70 cytosine nucleotides, about 20 to 60 cytosine nucleotides, or about 10 to 40 cytosine nucleotides). The polyC tail can be in addition to or replace the polyA or polyU tail.

本開示に従うPEをコードするmRNAは種々の公知の方法のいずれかに従って合成され得る。例えば、本発明に従うmRNAはin vitro転写(IVT)によって合成され得る。手短かには、IVTは、典型的には、プロモーターを含有する直線状または環状DNA鋳型、リボヌクレオチド三リン酸のプール、DTTおよびマグネシウムイオンを包含し得る緩衝液系、ならびに適当なRNAポリメラーゼ(例えば、T3、T7、またはSP6 RNAポリメラーゼ)、DNAse I、ピロホスファターゼ、および/またはRNAse阻害剤によって行われる。厳密な条件は特定の適用に従って変わるであろう。 mRNA encoding PE according to the present disclosure can be synthesized according to any of a variety of known methods. For example, mRNA according to the invention can be synthesized by in vitro transcription (IVT). Briefly, IVT typically comprises a linear or circular DNA template containing a promoter, a pool of ribonucleotide triphosphates, a buffer system that may include DTT and magnesium ions, and a suitable RNA polymerase ( For example, T3, T7, or SP6 RNA polymerase), DNAse I, pyrophosphatase, and/or RNAse inhibitors. The exact conditions will vary according to the particular application.

mRNA送達が関わる態様では、PE融合タンパク質をコードするmRNA対PEgRNAの比は効率的な編集にとって重要であり得る。ある態様において、mRNA(PE融合タンパク質をコードする)対PEgRNAの重量比は1:1である。ある種の他の態様において、mRNA(PE融合タンパク質をコードする)対PEgRNAの重量比は2:1である。なお他の態様において、mRNA(PE融合タンパク質をコードする)対PEgRNAの重量比は1:2である。なおさらなる態様では、mRNA(PE融合タンパク質をコードする)対PEgRNAの重量比は、約1:1000、1:900;1:800;1:700;1:600;1:500;1:400;1:300;1:200;1:100;1:90;1:80;1:70;1:60;1:50;1:40;1:30;1:20;1:10;および1:1からなる群から選択される。他の態様において、mRNA(PE融合タンパク質をコードする)対PEgRNAの重量比は、約1:1000、1:900;800:1;700:1;600:1;500:1;400:1;300:1;200:1;100:1;90:1;80:1;70:1;60:1;50:1;40:1;30:1;20:1;10:1;および1:1からなる群から選択される。 In embodiments involving mRNA delivery, the ratio of mRNA encoding the PE fusion protein to PEgRNA can be important for efficient editing. In certain embodiments, the weight ratio of mRNA (encoding the PE fusion protein) to PEgRNA is 1:1. In certain other embodiments, the weight ratio of mRNA (encoding the PE fusion protein) to PEgRNA is 2:1. In still other embodiments, the weight ratio of mRNA (encoding the PE fusion protein) to PEgRNA is 1:2. In still further embodiments, the weight ratio of mRNA (encoding the PE fusion protein) to PEgRNA is selected from the group consisting of about 1:1000, 1:900; 1:800; 1:700; 1:600; 1:500; 1:400; 1:300; 1:200; 1:100; 1:90; 1:80; 1:70; 1:60; 1:50; 1:40; 1:30; 1:20; 1:10; and 1:1. In other embodiments, the weight ratio of mRNA (encoding the PE fusion protein) to PEgRNA is selected from the group consisting of about 1:1000, 1:900; 800:1; 700:1; 600:1; 500:1; 400:1; 300:1; 200:1; 100:1; 90:1; 80:1; 70:1; 60:1; 50:1; 40:1; 30:1; 20:1; 10:1; and 1:1.

J.バイアスがない様式でオフターゲット編集を同定するためのプライム編集の使用
他のゲノム編集因子のように、PEはそのプログラムされた遺伝子変改をゲノム上の意図されない部位、すなわち「オフターゲット」部位において導入し得るといういくらかのリスクが存在する。しかしながら、現行では、プライム編集因子によるオフターゲット編集を検出するための記載されている方法はない。かかる方法は、プライム編集因子を用いるオフターゲット編集の可能性ある部位の同定を許すであろう。
J. Using primed edits to identify off-target edits in an unbiased manner
Like other genome editing agents, there is some risk that PE may introduce its programmed genetic changes at unintended or "off-target" sites on the genome. However, currently there is no described method for detecting off-target edits due to prime editing factors. Such methods would allow identification of potential sites of off-target editing using prime editing factors.

この側面の鍵の概念は、プライム編集を用いて、同じPEgRNAを鋳型として、オンターゲットおよびオフターゲット部位において同じアダプター配列および/またはプライマー結合部位を挿入して、napDNAbpヌクレアーゼまたはプライム編集因子のゲノムオフターゲット改変部位の急速な同定を可能化するという発想である。アダプターおよび/またはプライマー結合配列がnapDNAbpによるDNA結合およびニッキングと同じイベントにおいて挿入され、下流プロセシングを単純化するので、この方法はヌクレアーゼオフターゲット部位を同定する他の技術から見分けられる。 The key concept of this aspect is the idea of using prime editing to insert the same adaptor sequences and/or primer binding sites at on-target and off-target sites using the same PEgRNA as a template, enabling rapid identification of genomic off-target modification sites of napDNAbp nucleases or prime editors. This method is distinguished from other techniques for identifying nuclease off-target sites because the adaptor and/or primer binding sequences are inserted in the same event as DNA binding and nicking by napDNAbp, simplifying downstream processing.

図33はオフターゲット同定の基本的原理を例解する。図は、プライマー結合配列挿入のためのPEgRNAデザインと、オフターゲット編集を決定するためのプライム編集を用いるゲノムDNA上へのプライマー結合挿入とを示す模式図である。この態様では、プライム編集が生細胞、組織、または動物モデル内において行われる。第1のステップとして、適当なPEgRNAがデザインされる。上側の模式図は、この側面に用いられ得る例示のPEgRNAを示す。PEgRNA上のスペーサー(「プロトスペーサー」と標識されている)はゲノム標的の鎖の1つに対して相補的である。PE:PEgRNA複合体(すなわちPE複合体)は一本鎖3'端フラップをニック部位に組み入れし、これは、コードされるプライマー結合配列と、カットされる部位のちょうど下流の領域に対して相補的である相同領域(PEgRNAの相同アームによってコードされる)とを含有する(赤色による)。フラップ侵入およびDNA修復/複製プロセスによって、合成された鎖はDNA上に組み込まれるようになり、それによってプライマー結合部位を組み入れる。このプロセスは、所望のゲノム標的において生起し得るが、オフターゲットの様式でPEgRNAと相互作用し得る他のゲノム部位においてもまた生起し得る(すなわち、意図されるゲノム部位ではない他のゲノム部位に対するスペーサー領域の相補性を原因として、PEgRNAはPE複合体を他のオフターゲット部位へとガイドする)。それゆえに、プライマー結合配列は、所望のゲノム標的においてのみならず、ゲノム上の他所のオフターゲットゲノム部位において組み入れられ得る。意図されるゲノム標的部位およびオフターゲットゲノム部位両方におけるこれらのプライマー結合部位の挿入を検出するためには、ゲノムDNA(PE後)が単離、フラグメント化、およびアダプターヌクレオチドにライゲーションされ得る(赤色で示されている)。次に、アダプターおよび挿入されたプライマー結合配列にアニールするPCRオリゴヌクレオチドによって、PCRが実行されて、プライマー結合部位がPEによって挿入されたオンターゲットおよびオフターゲットゲノムDNA領域を増幅し得る。それから、高スループット配列決定および配列アラインメントが行われて、オンターゲット部位またはオフターゲット部位どちらかにおけるPEによって挿入されたプライマー結合配列の挿入点を同定し得る。 Figure 33 illustrates the basic principle of off-target identification. The figure is a schematic diagram showing PEgRNA design for primer binding sequence insertion and primer binding insertion onto genomic DNA using prime editing to determine off-target editing. In this embodiment, prime editing is performed in living cells, tissues, or animal models. As a first step, a suitable PEgRNA is designed. The top schematic shows exemplary PEgRNAs that can be used in this aspect. A spacer on PEgRNA (labeled "protospacer") is complementary to one of the strands of the genomic target. The PE:PEgRNA complex (i.e., PE complex) incorporates a single-stranded 3' end flap at the nick site, which is complementary to the encoded primer binding sequence and the region just downstream of the site to be cut. (in red color) and a homologous region (encoded by the homologous arms of PEgRNA). Through flap invasion and DNA repair/replication processes, the synthesized strand becomes incorporated onto the DNA, thereby incorporating a primer binding site. This process may occur at the desired genomic target, but may also occur at other genomic sites that may interact with PEgRNA in an off-target manner (i.e., to other genomic sites that are not the intended genomic site). Due to the complementarity of the spacer region, PEgRNA guides the PE complex to other off-target sites). Therefore, primer binding sequences can be incorporated not only at the desired genomic target, but also at off-target genomic sites elsewhere on the genome. To detect the insertion of these primer binding sites at both intended and off-target genomic sites, genomic DNA (post-PE) can be isolated, fragmented, and ligated to adapter nucleotides (indicated in red). It is shown). PCR can then be performed with PCR oligonucleotides that anneal to the adapter and the inserted primer binding sequences to amplify on-target and off-target genomic DNA regions where primer binding sites were inserted by PE. High-throughput sequencing and sequence alignment can then be performed to identify the insertion point of the primer binding sequence inserted by PE at either on-target or off-target sites.

それゆえに、図33は、生細胞内、組織培養、または動物モデルにおいて編集するときのオフターゲット編集部位の同定についての1つの側面を例解する。この方法を行うためには、最終的な所望のプライム編集因子と同一のスペーサー(そして、プライム編集オフターゲットを検査する場合には、最終的な所望の編集因子と同一のプライマー結合部位配列)を有するが、プライム編集による逆転写後にアダプターまたはプライマー結合部位を組み入れるための必要な配列を包含するPEgRNAが生成される。プライム編集因子またはRTに融合したヌクレアーゼを用いるインビボ編集が行われ、ゲノムDNAを単離する。ゲノムDNAは酵素的なまたは機械的な手段によってフラグメント化され、DNAフラグメント化の部位に異なるアダプターを付加する。1つのアダプターからPEgRNAによって組み入れされたアダプターまでを増幅するためのPCRが用いられる。もたらされた産物はディープ配列決定されて、全ての改変された部位を同定する。 Thus, FIG. 33 illustrates one aspect of identifying off-target editing sites when editing in live cells, tissue culture, or animal models. To perform this method, a PEgRNA is generated that has the same spacer as the final desired prime editor (and the same primer binding site sequence as the final desired editor, if prime editing off-targets are being examined), but includes the necessary sequences for incorporating an adapter or primer binding site after reverse transcription by prime editing. In vivo editing using a nuclease fused to the prime editor or RT is performed, and genomic DNA is isolated. The genomic DNA is fragmented by enzymatic or mechanical means, adding different adapters at the sites of DNA fragmentation. PCR is used to amplify from one adapter to the adapter incorporated by the PEgRNA. The resulting product is deep sequenced to identify all modified sites.

別の側面において、PEによるオフターゲット編集の評価がin vitroで行われ得る。この側面では、ゲノムDNAのin vitro改変を用いるオフターゲット編集部位のゲノムDNA同定のin vitro改変の間に、PEが用いられる。この方法を行うためには、精製されたプライム編集因子融合タンパク質およびPEgRNAのリボヌクレオタンパク質(RNP)(すなわちPE複合体)がアセンブリされる。これは、アダプターまたはプライマー結合配列を標的部位において組み入れるように構成されるが、さもなければ目当てのPEgRNAと同じである。このRNP(すなわち、PE複合体)がDNAのフラグメント化前または後に抽出されたゲノムDNAとインキュベーションされる。フラグメント化後に、異なるアダプター配列がフラグメントDNAの端にライゲーションされる。挿入されたアダプター配列(すなわち、EPによって挿入された)とフラグメントの端にライゲーションされたアダプターとにまたがるゲノム部位を増幅するためのPCRが用いられる。アダプター配列間の高スループット配列決定は、オンターゲットおよびオフターゲットである改変のゲノム部位を同定し得る。細胞性のDNA修復は、プライム編集因子によって追加された逆転写されたDNAアダプターを消去しないであろうので、このin vitro編集法は、検出の感度を増強するはずである。 In another aspect, evaluation of off-target editing by PE can be performed in vitro. In this aspect, PE is used during in vitro modification of genomic DNA identification of off-target editing sites using in vitro modification of genomic DNA. To perform this method, purified prime editing factor fusion proteins and PEgRNA ribonucleoproteins (RNPs) (ie, PE complexes) are assembled. It is configured to incorporate an adapter or primer binding sequence at the target site, but is otherwise identical to the PEgRNA of interest. This RNP (ie, PE complex) is incubated with extracted genomic DNA before or after DNA fragmentation. After fragmentation, different adapter sequences are ligated to the ends of the fragment DNA. PCR is used to amplify the genomic site spanning the inserted adapter sequence (ie, inserted by EP) and the adapter ligated to the end of the fragment. High-throughput sequencing between adapter sequences can identify genomic sites of modification that are on-target and off-target. This in vitro editing method should enhance the sensitivity of detection since cellular DNA repair will not erase the reverse transcribed DNA adapters added by the prime editing factor.

これらの方法は、いずれかのプライム編集因子、または標的のカットされる部位を認識するためにガイドRNAを用いるいずれかのゲノム編集因子(ほとんどのCasヌクレアーゼ)について、オフターゲット編集を同定するために用いられ得る。 These methods are used to identify off-target edits for either prime editing factors or for any genome editing factors (most Cas nucleases) that use a guide RNA to recognize the cut site of the target. can be used.

これらの方法は、ゲノム編集因子が処置への使用を考慮される全ての遺伝子疾患に適用され得る。 These methods can be applied to all genetic diseases for which genome editing agents are considered for use in treatment.

PEによって組み入れられ得る例示のアダプターおよび/またはプライマー結合配列は:

Figure 2020191234000240
を包含するが、これらに限定されない。 Exemplary adapter and/or primer binding sequences that can be incorporated by PE are:
Figure 2020191234000240
including but not limited to.

これらのアダプターおよび/またはプライマー結合配列もまた、上で概説されているとおりゲノムDNAフラグメント化後のライゲーションステップに用いられ得る。 These adapter and/or primer binding sequences can also be used in the ligation step after genomic DNA fragmentation as outlined above.

オフターゲット編集を評価するための本明細書に記載の方法の使用を例解する例示のPEgRNAデザインと、それらの編集標的座位とは、次のとおりである:

Figure 2020191234000241
Figure 2020191234000242
Exemplary PEgRNA designs and their editing target loci that illustrate the use of the methods described herein to assess off-target editing are:
Figure 2020191234000241
Figure 2020191234000242

K.誘導可能な二量体化ドメインの挿入のためのプライム編集の使用
本明細書に記載のプライム編集因子は、二量体化ドメインを1つ以上のタンパク質標的に組み入れるためにもまた用いられ得る。二量体化ドメインは、二重特異的な様式で結合する連結部分(例えば、低分子、ペプチド、またはタンパク質)を介する1つ以上のタンパク質標的の二量体化に関連する活性の誘導可能な制御を容易化し得る。種々の側面では、二量体化ドメインは、異なるタンパク質(例えば、同じ型または異なるタンパク質)上に組み入れされるときに、夫々が同じ二重特異性部分(例えば、別個に二量体化ドメインに結合する少なくとも(a least)2つの領域を有する二重特異性低分子、ペプチド、またはポリペプチド)に結合し、それによって、二重特異性リガンドに対するそれらの共通の相互作用によってタンパク質の二量体化を引き起こす。この様式で、二重特異性リガンドは2つのタンパク質の二量体化の「誘導因子」として機能する。いくつかのケースでは、二重特異性リガンドまたは化合物は、同じである2つの標的化部分を有するであろう。他の態様において、二重特異性リガンドまたは化合物は夫々が他とは異なる標的化部分を有するであろう。同じ2つの標的化部分を有する二重特異性リガンドまたは化合物は、異なるタンパク質標的上に組み入れされた同じ二量体化ドメインを標的化する能力があるであろう。異なる標的化部分を有する二重特異性リガンドまたは化合物は、異なるタンパク質標的上に組み入れされた異なる二量体化ドメインを標的化する能力があるであろう。
K. Use of prime editing for insertion of inducible dimerization domains
The prime editing factors described herein can also be used to incorporate dimerization domains into one or more protein targets. A dimerization domain is an inducible domain of activity associated with dimerization of one or more protein targets via a linking moiety (e.g., a small molecule, peptide, or protein) that binds in a bispecific manner. Control can be facilitated. In various aspects, the dimerization domains can each be incorporated into the same bispecific moiety (e.g., separately into the dimerization domains) when incorporated onto different proteins (e.g., of the same type or different proteins). bispecific small molecules, peptides, or polypeptides that have at least two regions that bind, thereby forming a dimer of proteins by their common interaction with the bispecific ligand. cause In this manner, the dual-specific ligand functions as an "inducer" of the dimerization of two proteins. In some cases, a bispecific ligand or compound will have two targeting moieties that are the same. In other embodiments, the bispecific ligands or compounds will each have a targeting moiety that is different from the other. A bispecific ligand or compound with the same two targeting moieties will be capable of targeting the same dimerization domain incorporated on different protein targets. Dual specific ligands or compounds with different targeting moieties will be capable of targeting different dimerization domains incorporated on different protein targets.

本願において用いられる用語「二量体化ドメイン」は、二重特異性リガンドの結合部分に結合するリガンド結合ドメインを言う。「第1の」二量体化ドメインは二重特異性リガンドの第1の結合部分に結合し、「第2の」二量体化ドメインは同じ二重特異性リガンドの第2の結合部分に結合する。第1の二量体化ドメインが第1のタンパク質に融合され(例えば、本願において論じられるとおりPEによる)、かつ第2の二量体化ドメイン(例えば、本願において論じられるとおりPEによる)が第2のタンパク質に融合されるときには、第1および第2のタンパク質は二重特異性リガンドの存在下において二量体化し、二重特異性リガンドは、第1の二量体化ドメインに結合する少なくとも1つの部分と第2の二量体化ドメインに結合する少なくとも別の部分とを有する。 The term "dimerization domain" as used herein refers to a ligand binding domain that binds to the binding moiety of a bispecific ligand. The "first" dimerization domain binds to the first binding moiety of the bispecific ligand, and the "second" dimerization domain binds to the second binding moiety of the same bispecific ligand. Join. The first dimerization domain is fused to the first protein (e.g., by PE as discussed in this application) and the second dimerization domain (e.g., by PE as discussed in this application) is fused to the first protein. When fused to a second protein, the first and second proteins dimerize in the presence of a dual-specific ligand, the dual-specific ligand having at least one protein that binds to the first dimerization domain. one portion and at least another portion that binds to the second dimerization domain.

本願において用いられる用語「二重特異性リガンド」または「二重特異性部分」は、2つの異なるリガンド結合ドメインに結合するリガンドを言う。種々の態様においては、二重特異性部分はそれ自体が2つの同じまたは2つの異なる化学的部分の二量体であり、各部分は二量体化ドメインに特異的にかつきつく結合する。ある態様において、リガンドは低分子化合物またはペプチドまたはポリペプチドである。他の態様において、リガンド結合ドメインはペプチドタグとしてタンパク質上に組み入れられ得る「二量体化ドメイン」である。種々の態様においては、同じかまたは異なる二量体化ドメインを夫々が含む2つのタンパク質が、二重特異性リガンドに対する各二量体化ドメインの結合によって二量体化するように誘導され得る。それらの分子は「二量体化の化学的誘導因子」またはCIDともまた言われ得る。加えて、二重特異性リガンドは、(例えば、標準化された化学的連結部によって)2つの同じ部分を一緒にまたは2つの異なる部分を一緒にカップリングすることによって調製され得、各部分は二量体化ドメインにきつくかつ特異的に結合する。 The term "bispecific ligand" or "bispecific moiety" as used herein refers to a ligand that binds to two different ligand binding domains. In various embodiments, the bispecific moiety is itself a dimer of two identical or two different chemical moieties, each moiety specifically and tightly binding to a dimerization domain. In certain embodiments, the ligand is a small molecule compound or a peptide or polypeptide. In other embodiments, the ligand binding domain is a "dimerization domain" that can be incorporated onto a protein as a peptide tag. In various embodiments, two proteins each containing the same or different dimerization domains can be induced to dimerize by binding of each dimerization domain to a bispecific ligand. These molecules may also be referred to as "chemical inducers of dimerization" or CIDs. In addition, bispecific ligands can be prepared by coupling two identical moieties together (e.g., by standardized chemical linkages) or two different moieties together, where each moiety has two Binds tightly and specifically to the merization domain.

種々の側面では、PEによって組み入れされる二量体化ドメイン同士は同じかまたは異なり得る。 In various aspects, the dimerization domains incorporated by the PE can be the same or different.

例えば、二量体化ドメインはFKBP12であり得る。これは次のアミノ酸配列を有する:

Figure 2020191234000243
For example, the dimerization domain can be FKBP12. It has the following amino acid sequence:
Figure 2020191234000243

別の例では、二量体化ドメインは、FKBP12-F36Vと言われるFKBP12の変異体、合成バンプFK506ミミックに結合する操作された穴を有するFKBP12の変異体であり得る(2、図3)107:

Figure 2020191234000244
In another example, the dimerization domain can be a mutant of FKBP12 designated FKBP12-F36V, a mutant of FKBP12 with an engineered hole that binds to a synthetic bump FK506 mimic (2, Figure 3) 107 :
Figure 2020191234000244

別の例では、二量体化ドメインは次のとおりシクロフィリンであり得る:

Figure 2020191234000245
In another example, the dimerization domain can be a cyclophilin as follows:
Figure 2020191234000245

種々の態様において、これらの二量体化ドメインのアミノ酸配列は、ネイティブな標的に対する結合を最適化するかまたは結合直交性を改善するために変改され得る。低分子結合タンパク質をコードする遺伝子の核酸配列は、例えばPEgRNA二次構造を縮減することによってPEプロセスの効率を最適化するために変改され得る。 In various embodiments, the amino acid sequences of these dimerization domains can be modified to optimize binding to the native target or improve binding orthogonality. The nucleic acid sequences of genes encoding small molecule binding proteins can be modified to optimize the efficiency of the PE process, eg, by reducing PEgRNA secondary structure.

好適な二量体化ドメインおよびそれに結合する対応する低分子化合物の他の例は次のとおり提供される。2つの二量体化ドメインに結合し得る二重特異性リガンドを形成するためには、対応する低分子化合物は第2の低分子化合物(同じ化合物または異なる化合物どちらか)に(例えば、化学的リンカーによって)カップリングされ得るということに注意せよ。FK506およびシクロスポリンAなどのいくつかのケースでは、夫々の二量体化(例えば、FK506-FK506またはシクロスポリンA-シクロスポリンA)はモノマー化合物の免疫抑制活性を縮減または消去する。

Figure 2020191234000246
Figure 2020191234000247
Figure 2020191234000248
Figure 2020191234000249
Other examples of suitable dimerization domains and corresponding small molecule compounds that bind thereto are provided below. To form a bispecific ligand capable of binding two dimerization domains, the corresponding small molecule compound is attached to a second small molecule compound (either the same compound or a different compound) (e.g., by chemical Note that they can be coupled (by the linker). In some cases, such as FK506 and cyclosporin A, respective dimerization (eg, FK506-FK506 or cyclosporin A-cyclosporin A) reduces or eliminates the immunosuppressive activity of the monomeric compounds.
Figure 2020191234000246
Figure 2020191234000247
Figure 2020191234000248
Figure 2020191234000249

天然に存在する二機能性分子およびそれらの二元的な標的受容体の他の例は次のとおりである。プライム編集は、二元的な標的受容体を異なるタンパク質に組み入れるために用いられ得る。ひとたび異なるタンパク質が二機能性分子受容体を含有するようにPEによって改変されると、二機能性分子は導入され得、それによって、異なる二量体化ドメインを含むように改変されたタンパク質の二量体化を引き起こす。(1)二機能性(biofunctional)分子および(2)それらの二元的な標的受容体のペアリングの例は次のとおりである:

Figure 2020191234000250
Figure 2020191234000251
Figure 2020191234000252
Figure 2020191234000253
Other examples of naturally occurring bifunctional molecules and their dual target receptors are: Prime editing can be used to incorporate dual target receptors into different proteins. Once different proteins have been modified by PE to contain bifunctional molecule receptors, bifunctional molecules can be introduced, thereby allowing two of the proteins modified to contain different dimerization domains. Causes quantification. Examples of pairings of (1) biofunctional molecules and (2) their dual target receptors are:
Figure 2020191234000250
Figure 2020191234000251
Figure 2020191234000252
Figure 2020191234000253

プライム編集のこの側面で使用され得る他の二機能性分子の例は以下のとおりである: Examples of other bifunctional molecules that can be used in this aspect of prime editing are:

Synstab A: Synstab A:

Figure 2020191234000254
Figure 2020191234000254

パクリタキセル:

Figure 2020191234000255
Paclitaxel:
Figure 2020191234000255

ディスコデルモリド:

Figure 2020191234000256
Disco del Molido:
Figure 2020191234000256

GNE-0011

Figure 2020191234000257
GNE-0011
Figure 2020191234000257

ARV-825、および

Figure 2020191234000258
ARV-825, and
Figure 2020191234000258

dBET1

Figure 2020191234000259
。 dBET1
Figure 2020191234000259
.

Synstab A、パクリテキセル、およびディスコデルモライドは微小管安定化剤である。それゆえに、これらの化合物は、微小管タンパク質を含むようにPEによって改変されたタンパク質同士を二量体化するために用いられ得る。GNE-0011、ARV-825、およびdBET1はBRD4結合モチーフおよびCRBN結合モチーフを含む。それゆえに、これらの化合物は、これらの標的化ドメインを含むようにPEによって改変されたタンパク質同士を二量体化するために用いられ得る。 Synstab A, paclitexel, and discodermolide are microtubule stabilizing agents. Therefore, these compounds can be used to dimerize proteins modified by PE, including microtubule proteins. GNE-0011, ARV-825, and dBET1 contain BRD4-binding motifs and CRBN-binding motifs. Therefore, these compounds can be used to dimerize proteins modified by PE to contain these targeting domains.

二量体化ドメインを組み入れるためのPEgRNAは次の構造を含み得る(図3Dの参照による):
5'-[スペーサー]-[gRNAコア]-[伸長アーム]-3'であって、伸長アームは5'-[相同アーム]-[編集鋳型]-[プライマー結合部位]-3'を含む;または
5'-[伸長アーム]-[スペーサー]-[gRNAコア]-3'であって、伸長アームは5'-[相同アーム]-[編集鋳型]-[プライマー結合部位]-3'を含み、どちらの構成でも「編集鋳型」は二量体化ドメインのヌクレオチド配列を含む。
PEgRNA for incorporating a dimerization domain can include the following structure (with reference to Figure 3D):
5'-[spacer]-[gRNA core]-[extending arm]-3', where the extending arm comprises 5'-[homologous arm]-[editing template]-[primer binding site]-3'; or
5'-[extended arm]-[spacer]-[gRNA core]-3', the extended arm comprises 5'-[homologous arm]-[editing template]-[primer binding site]-3'; In either configuration, the "editing template" includes the nucleotide sequence of the dimerization domain.

1つの例では、ヒトインスリン受容体のC末端の端におけるFKBP12二量体化ドメインの挿入のためのPEgRNA(スペーサーは下線付き、gRNAコアはプレーン、フラップ相同性は太字、FKBP12挿入はイタリック、アニーリング領域は太字イタリック):

Figure 2020191234000260
Figure 2020191234000261
In one example, PEgRNA for insertion of the FKBP12 dimerization domain at the C-terminal end of the human insulin receptor (spacer underlined, gRNA core plain, flap homology bold, FKBP12 insertion italicized, annealed) Areas are bold italic):
Figure 2020191234000260
Figure 2020191234000261

別の例では、(最適化のための)HEK3座位におけるFKBP12二量体化ドメインの挿入のためのPEgRNA:

Figure 2020191234000262
In another example, PEgRNA for insertion of the FKBP12 dimerization domain in the HEK3 locus (for optimization):
Figure 2020191234000262

二量体化ドメインを組み入れるための標的タンパク質は特に限定されない;しかしながら、二重特異性リガンドの存在下におけるそれらの二量体化は(ひとたびPEによって改変されると)、何らかの有利な生物学的効果、例えばシグナル経路、減少した免疫応答性などを生ずるということが有利である。種々の側面では、二量体化ドメインのPE依存的組み入れによって二量体化させられるべきである標的タンパク質同士は、同じタンパク質または異なるタンパク質であり得る。好ましくは、タンパク質は、二量体化したときには、1つ以上の下流の生物学的カスケード、例えばシグナル伝達カスケード、リン酸化などを誘発する。PEが二量体化ドメインを組み入れるために用いられ得る例示の標的タンパク質は:

Figure 2020191234000263
Figure 2020191234000264
を包含するが、これらに限定されない。 Target proteins for incorporating dimerization domains are not particularly limited; however, their dimerization in the presence of dual-specific ligands (once modified by PE) may have some advantageous biological effects. Advantageously, effects such as signaling pathways, decreased immune responsiveness, etc. are produced. In various aspects, the target proteins to be dimerized by PE-dependent incorporation of dimerization domains can be the same protein or different proteins. Preferably, the protein, when dimerized, triggers one or more downstream biological cascades, such as signal transduction cascades, phosphorylation, etc. Exemplary target proteins for which PE can be used to incorporate dimerization domains are:
Figure 2020191234000263
Figure 2020191234000264
including but not limited to.

一側面において、本明細書に記載のプライム編集因子は、生細胞または患者の目当ての標的タンパク質をコードする1つ以上の遺伝子上に、二量体化ドメインをコードする配列を組み入れるために用いられ得る。これは「プライム編集-CIDシステム」と言われ得、CIDは二重特異性リガンドであり、これは、PEによって組み入れされる二量体化ドメインに夫々が融合された標的タンパク質の二量体化を誘導した。この編集は単独では生理学的効果を有さないはずである。典型的には夫々が標的タンパク質のコピーに融合されている2つの二量体化ドメインに同時に結合し得る二量体低分子である二重特異性リガンドの投与によって、二重特異性リガンドは標的タンパク質の二量体化を引き起こす。それから、この標的タンパク質二量体化イベントは、生物学的シグナルイベント、例えば赤血球形成またはインスリンシグナルを誘導する。プライム編集による低分子結合タンパク質(すなわち、二量体化ドメイン)をコードする遺伝子のゲノム取り入れによって、二量体化によって誘導される生物学的プロセス、例えば受容体シグナルを便利な低分子薬物(すなわち、二重特異性リガンド)のコントロール下に置くための新たな方法が、本明細書に記載の。 In one aspect, the prime editing factors described herein are used to incorporate sequences encoding dimerization domains onto one or more genes encoding target proteins of interest in living cells or patients. obtain. This can be referred to as the "prime editing-CID system," in which CID is a dual-specificity ligand that supports dimerization of the target protein, each fused to a dimerization domain incorporated by PE. was induced. This editing alone should have no physiological effect. By administration of the bispecific ligand, which is typically a dimeric small molecule that can simultaneously bind to two dimerization domains, each fused to a copy of the target protein, the bispecific ligand Causes protein dimerization. This targeted protein dimerization event then induces a biological signaling event, such as erythropoiesis or insulin signaling. Genomic incorporation of genes encoding small molecule binding proteins (i.e., dimerization domains) by prime editing allows biological processes induced by dimerization, such as receptor signaling, to be integrated into convenient small molecule drugs (i.e. , dual-specific ligands) are described herein.

タンパク質二量体化はユビキタスな生物学的プロセスである。注意すべきことに、多くの膜結合受容体のホモ二量体化はシグナルカスケードを開始することが知られており、多くの場合に深大な生物学的帰結を有する。薬物としての使用を認可されたいくつもの天然低分子産物は、それらの作用機序の一部としてタンパク質二量体化の化学的誘導因子として作用する92。例えば、FK506はFKBP12にきつく結合し、もたらされる低分子-タンパク質複合体はそれからホスファターゼカルシニューリンに結合し、それによってT細胞受容体シグナルのあるステップを阻害する93。同様に、シクロスポリンAはシクロフィリンおよびカルシニューリンの二量体化を誘導し、ラパマイシンはFKBPおよびmTORの二量体化を誘導する93,94 Protein dimerization is a ubiquitous biological process. Of note, homodimerization of many membrane-bound receptors is known to initiate signal cascades, often with profound biological consequences. A number of natural small molecule products approved for use as drugs act as chemical inducers of protein dimerization as part of their mechanism of action 92 . For example, FK506 tightly binds to FKBP12, and the resulting small molecule-protein complex then binds the phosphatase calcineurin, thereby inhibiting certain steps in T cell receptor signaling 93 . Similarly, cyclosporine A induces dimerization of cyclophilin and calcineurin, and rapamycin induces dimerization of FKBP and mTOR93,94 .

1つの態様では、FK506:FKBP12およびシクロスポリンA:シクロフィリン低分子:タンパク質結合相互作用の選択的な高親和性の結合を活用して、二量体化の合成の化学的誘導因子もまた開発されている。ある例では、シグナル受容体の細胞質ドメインがFKBP12によってタグ付けされたときに、FK1012と呼称されるFK506の2つの単位からなる低分子がシグナル伝達を成し遂げることが示された95。以来、二量体化の化学的誘導因子(CID)がいくつものシグナル経路をコントロールするために用いられている96~103 In one embodiment, chemical inducers of synthesis of dimerization are also developed, taking advantage of the selective high affinity binding of FK506:FKBP12 and cyclosporin A:cyclophilin small molecule:protein binding interactions. There is. In one example, a small molecule consisting of two units of FK506, designated FK1012, was shown to accomplish signal transduction when the cytoplasmic domain of the signal receptor was tagged with FKBP12 . Since then, chemical inducers of dimerization (CID) have been used to control a number of signaling pathways 96 - 103 .

生物学的プロセスを研究するための有用なツールではあるが、治療学的適用について合成CIDに当面する1つの課題は、患者へのFKBP12またはシクロフィリン-標的タンパク質キメラの導入が難しいということである。 Although a useful tool for studying biological processes, one challenge facing synthetic CID for therapeutic applications is the difficulty of introducing FKBP12 or cyclophilin-target protein chimeras into patients.

本開示は2つの概念を一緒に持って来て、先にはアクセス不可能な治療学的プロセスを生出する。第1の概念は、本明細書に記載のプライム編集であり、これは生細胞における標的化された挿入を包含する精密なゲノム編集を許す。第2の概念は化学物質によって誘導される二量体化であり、細胞培養物におけるシグナルおよびオリゴマー化プロセスの低分子コントロールを可能化した強力なツールである。 The present disclosure brings two concepts together to create a previously inaccessible therapeutic process. The first concept is prime editing, described herein, which allows precise genome editing involving targeted insertions in living cells. The second concept is chemically induced dimerization, a powerful tool that has enabled small molecule control of signaling and oligomerization processes in cell culture.

タンパク質二量体化の化学的コントロールが有益な治療学的効果を有し得た特定のケースが同定されている。 Certain cases have been identified where chemical control of protein dimerization could have a beneficial therapeutic effect.

インスリン受容体は、細胞質キナーゼドメインのリン酸化によって細胞外ドメインへのインスリン結合に応答するヘテロ四量体膜貫通タンパク質である104。膜局在構成要素、インスリン受容体のC末端キナーゼドメイン、および3コピーのFKBP12から成る操作されたキメラタンパク質は、細胞培養物においてFK1012に応答し、インスリン応答を開始する99。類似に、患者細胞のネイティブなインスリン受容体のキナーゼドメインのC末端の端へのFKBP12の融合は、FK1012依存的なリン酸化とインスリンシグナルカスケードの開始とを許すはずであるということが予想される。このシステムは、インスリンを作り得ない(例えば1型糖尿病)または弱くインスリンに応答する(例えば2型糖尿病)患者において、インスリン使用を置き換えるかまたは補完し得る。 The insulin receptor is a heterotetrameric transmembrane protein that responds to insulin binding to its extracellular domain by phosphorylation of its cytoplasmic kinase domain. An engineered chimeric protein consisting of a membrane-localized component, the C-terminal kinase domain of the insulin receptor, and three copies of FKBP12 responds to FK1012 in cell culture and initiates an insulin response. Similarly, it is expected that fusion of FKBP12 to the C-terminal end of the kinase domain of the native insulin receptor in patient cells should allow FK1012-dependent phosphorylation and initiation of the insulin signaling cascade. . This system may replace or supplement insulin use in patients who cannot make insulin (eg, type 1 diabetes) or are weakly responsive to insulin (eg, type 2 diabetes).

加えて、エリスロポエチンは、エリスロポエチン受容体(EpoR)に結合することによって赤血球増殖を刺激し、二量体化または予め形成された受容体二量体の立体配座変化どちらかを誘導し、これはJak/STATシグナルカスケードの活性化をもたらす105。FKBP12によってタグ付けされたEpoRの膜にアンカー固定される細胞質ドメインのFK1012によって誘導されるオリゴマー化は、Jak/STATシグナルカスケードシグナルを開始および細胞増殖を促進するために十分であるということが実証されている106。患者細胞においてプライム編集によってFKBP12をネイティブなEpoRに融合することは、赤血球増殖(赤血球形成)のFK1012によって誘導されるコントロールを許すであろうということが予期される。このシステムは貧血患者において赤血球成長を誘発するために用いられ得る。FK1012誘導性のEpoRは、エクスビボ操作を経過した血液細胞のインビボの選択マーカーとしてもまた使用され得る。 In addition, erythropoietin stimulates erythrocyte proliferation by binding to the erythropoietin receptor (EpoR), inducing either dimerization or conformational changes in preformed receptor dimers, which leading to activation of the Jak/STAT signal cascade 105 . It was demonstrated that FK1012-induced oligomerization of the membrane-anchored cytoplasmic domain of FKBP12-tagged EpoR is sufficient to initiate the Jak/STAT signal cascade and promote cell proliferation. There are 106 . It is anticipated that fusing FKBP12 to native EpoR by prime editing in patient cells will allow FK1012-induced control of red blood cell proliferation (erythropoiesis). This system can be used to induce red blood cell growth in anemic patients. FK1012-induced EpoR can also be used as an in vivo selectable marker for blood cells that have undergone ex vivo manipulation.

原理的には、いずれかの受容体チロシンキナーゼはプライム編集-CID治療学の見込みある標的である。下の表は、ヒトゲノム上の全ての受容体チロシンキナーゼのリストを包含する110

Figure 2020191234000265
In principle, any receptor tyrosine kinase is a promising target for prime editing-CID therapeutics. The table below contains a list of all receptor tyrosine kinases on the human genome110 .
Figure 2020191234000265

プライム編集-CIDシステムには数々の利点がある。1つのかかる利点は、それが、典型的には製造、コスト、送達、生産、または貯蔵において複雑化を呈するタンパク質である内生リガンドを薬物様低分子によって置き換え得るということである。これらはIVまたは注射によって投与される代わりに経口投与され得、FDA認可された薬物から難なく調製され(またはそれら自体がすでに薬物である)、タンパク質薬物に典型的に関連する特殊な生産または貯蔵コストを招かない。別の利点は、編集が単独では生理学的効果を有さないはずであるということである。標的タンパク質二量体化の量は低分子CIDを投薬することによってコントロールされ得る。さらに、標的タンパク質二量体化は、CIDのモノマー形態を追加することによって難なくかつ急速に可逆的である。さらに別の利点は、単一のリガンドが複数の受容体を標的化する場合に、1つの受容体のみをプライム編集することによって選択性が達成され得るということである。最後に、プライム編集に用いられる送達方法に依存して、局在した組織または臓器に編集を制限することもまた可能であり得、特定のエリアのみにおいて誘導可能な受容体活性化を許す。 The Prime Edit-CID system has a number of advantages. One such advantage is that it allows drug-like small molecules to replace endogenous ligands, which are typically proteins that present complications in manufacturing, cost, delivery, production, or storage. They can be administered orally instead of being administered by IV or injection, are effortlessly prepared from FDA-approved drugs (or are themselves already drugs), and require specialized production or storage costs typically associated with protein drugs. do not invite Another advantage is that editing alone should have no physiological effect. The amount of target protein dimerization can be controlled by dosing small molecule CID. Furthermore, target protein dimerization is easily and rapidly reversible by adding the monomeric form of CID. Yet another advantage is that when a single ligand targets multiple receptors, selectivity can be achieved by prime editing only one receptor. Finally, depending on the delivery method used for prime editing, it may also be possible to restrict editing to localized tissues or organs, allowing inducible receptor activation only in specific areas.

プライム編集による編集効率が十分高く、2つの別個の編集イベントが高いレベルで生起し得る場合には、目当ての2つのタンパク質を異なる低分子結合ドメイン(例えばFKBPおよびシクロフィリン)によってタグ付けし、低分子ヘテロ二量体(例えばFK506-シクロスポリンA二量体)によるヘテロ二量体化を誘導することもまた可能であろう。 If the editing efficiency of prime editing is high enough that two separate editing events can occur at high levels, it may also be possible to tag the two proteins of interest with different small molecule binding domains (e.g., FKBP and cyclophilin) and induce heterodimerization with a small molecule heterodimer (e.g., FK506-cyclosporine A dimer).

ネイティブなタンパク質へのFKBP12または他の低分子結合タンパク質の融合体は、一般的には、組織培養によるプラスミドからの過剰発現によって達成されている。爾後の化学物質によって誘導される二量体化は、融合タンパク質を生ずる細胞に表現型変化を誘導することが実証されている。 Fusions of FKBP12 or other small molecule binding proteins to native proteins are commonly accomplished by overexpression from plasmids in tissue culture. Subsequent chemical-induced dimerization has been demonstrated to induce phenotypic changes in cells producing the fusion protein.

以下の参考文献がセクションGにおいて上で引用され、参照により本明細書に組み込まれる。

Figure 2020191234000266
Figure 2020191234000267
The following references are cited above in Section G and are incorporated herein by reference.
Figure 2020191234000266
Figure 2020191234000267

L.細胞データ記録のためのプライム編集の使用
プライム編集因子およびもたらされるゲノム改変は、細胞性のプロセスおよび発生を研究および記録するためにもまた用いられ得る。例えば、核酸プログラム型DNA結合タンパク質(napDNAbp)および逆転写酵素を有する融合タンパク質をコードする第1の核酸配列を細胞に提供することと、PEgRNAをコードする少なくとも第2の核酸配列を細胞に提供することとによって、本明細書に記載のプライム編集因子は、細胞への刺激の存在および持続時間を記録するために用いられ得る。第1の、第2の、または両方の核酸配列どちらかは、細胞刺激に応答性である誘導性プロモーターに作動可能に連結され、その結果、それは融合タンパク質および/またはPEgRNAの発現を誘導し、それによって細胞内の標的配列の改変を引き起こす。
L. Using prime editing for cellular data recording
Prime editing factors and the resulting genome modifications can also be used to study and document cellular processes and development. For example, providing a cell with a first nucleic acid sequence encoding a fusion protein having a nucleic acid programmed DNA binding protein (napDNAbp) and a reverse transcriptase; and providing the cell with at least a second nucleic acid sequence encoding PEgRNA. Alternatively, the prime editing factors described herein can be used to record the presence and duration of stimulation to cells. either the first, second, or both nucleic acid sequences are operably linked to an inducible promoter that is responsive to cellular stimulation so that it induces expression of the fusion protein and/or PEgRNA; thereby causing modification of the target sequence within the cell.

本明細書に記載のプライム編集因子は細胞バーコード化および系統トレースにもまた用いられ得る。例えば、固有のゲノムバーコードによって各細胞をバーコード化することによって、プライム編集因子は、1つ以上の標的配列になされる改変に基づく系統樹の構築を許すことによって、細胞系統マップを明らかにすることを助け得る。前駆細胞から出発して、プライム編集因子システムは、丸ごとの生物中の単一細胞について細胞運命マップを築くことを可能化し得る。これは、1つ以上の標的配列になされた改変を分析することによって読み解かれ得る。細胞の系統(linage)をトレースするための方法は、napDNAbpおよび逆転写酵素による融合タンパク質をコードする核酸を提供することと、PEgRNAをコードする少なくとも1つの第2の核酸を提供することとを包含し得る。1つ以上の標的配列に1つ以上の改変を生出するために融合タンパク質およびPEgRNAを用いて固有の細胞バーコードが生成され得、それによって、最初の細胞から発生するいずれかの細胞の系統(linage)が固有の細胞バーコードを用いてトレースされることを許す。細胞データ記録および系統(linage)トレース両方のためのプライム編集因子の使用は例13においてさらに記載される。 The prime editing factors described herein can also be used for cell barcoding and lineage tracing. For example, by barcoding each cell with a unique genomic barcode, prime editing factors reveal cell lineage maps by allowing the construction of a phylogenetic tree based on the modifications made to one or more target sequences. can help you do that. Starting from progenitor cells, the prime editor system can make it possible to build cell fate maps for single cells in whole organisms. This can be deciphered by analyzing the modifications made to one or more target sequences. A method for tracing the lineage of a cell includes providing a nucleic acid encoding a fusion protein with napDNAbp and reverse transcriptase, and providing at least one second nucleic acid encoding PEgRNA. It is possible. A unique cellular barcode can be generated using a fusion protein and PEgRNA to generate one or more modifications in one or more target sequences, thereby allowing the differentiation of any cell lineage ( linage) can be traced using unique cell barcodes. The use of prime editing factors for both cell data recording and lineage tracing is further described in Example 13.

プライム編集因子は、ゲノム標的配列または取り入れされた予めデザインされた配列を改変することによって、系統トレースおよび細胞シグナル記録両方を行い得る。プライム編集因子は、Cas9ニッカーゼフラグメント(SpCas9 H840Aバリアントを包含するが、これに限定されない)および逆転写酵素ドメインを含む合成融合タンパク質を、操作されたプライム編集ガイドRNA(PEgRNA)と併せて用いる。一緒になって、これらの構成要素は特異的なゲノム配列または取り入れされた予めデザインされた配列を標的化し、予め決定された編集を組み入れる。PEgRNAは標的ゲノム配列および編集アウトカム両方を規定するので、高度に特異的なかつコントロールされたゲノム改変が複数のPEgRNAを用いて同じ細胞内において同時に達成され得る。アクセス可能なゲノム改変は、全ての1ヌクレオチド置換、小から中程度のサイズの配列挿入、および小から中程度のサイズの欠失を包含する。このゲノム編集テクノロジーの汎用性は細胞内における時間的にカップリングされたシグナル特異的な記録を可能化し得る。 Prime editing factors can perform both lineage tracing and cell signal recording by modifying genomic target sequences or incorporated pre-designed sequences. Prime editing factors use synthetic fusion proteins containing a Cas9 nickase fragment (including, but not limited to, the SpCas9 H840A variant) and a reverse transcriptase domain in conjunction with an engineered prime editing guide RNA (PEgRNA). Together, these components target specific genomic sequences or incorporated pre-designed sequences to incorporate pre-determined edits. Because PEgRNAs define both the target genome sequence and the editing outcome, highly specific and controlled genome modifications can be achieved simultaneously within the same cell using multiple PEgRNAs. Accessible genomic modifications include all single nucleotide substitutions, small to moderate sized sequence insertions, and small to moderate sized deletions. The versatility of this genome editing technology may enable temporally coupled signal-specific recording within cells.

細胞データ記録のためのプライム編集因子の使用は、細胞の一生の過程に渡って内生または外因的な刺激の強さおよび/または持続時間を記録するための、組成物(例えば核酸)、細胞、システム、キット、および方法を包含し得る。細胞データ記録システムは、細胞の刺激または変化に応答して、標的化されかつ配列が規定されたゲノム挿入、欠失、または変異を生出することによって変化を誘導するための融合タンパク質の発現を誘導するプロモーターに作動可能に連結された、napDNAbp(例えば、Cas9ドメイン)および逆転写酵素からなる融合タンパク質を包含し得る。情報(例えば、刺激の存在または不在)を2つの別物の状態の1つ(すなわち、「オン」または「オフ」)として貯蔵するデジタルメモリーデバイスとは対照的に、これらの細胞データレコーダは、1つ以上の刺激の強さ(すなわち振幅)および持続時間両方を反映する様式で細胞DNA上に永久的なマークを誘導し得る。それゆえに、いくつかの側面では、細胞データ記録システムは、複数の細胞状態を同時に記録する能力を有する。例えば、低分子、タンパク質、ペプチド、アミノ酸、代謝物質、無機分子、有機金属分子、有機分子、薬物もしくは薬物候補、糖、脂質、金属、核酸、内生もしくは外因的なシグナルカスケードの活性化の間に生ずる分子、光、熱、音、圧力、機械的ストレス、剪断ストレス、またはウイルスもしくは他の微生物に対する暴露を包含する。これらの細胞データレコーダは読み出し(例えば、細胞DNAの変化)を測定するためには配列決定テクノロジー(例えば、高スループット配列決定)を使用し得、刺激の記録または刺激によって誘導される細胞DNAの変化(単数または複数)の読み出し両方について、大きい細胞集団に依存しない。 The use of prime editing factors for cell data recording refers to the composition (e.g., nucleic acids), cell , systems, kits, and methods. The cellular data recording system induces the expression of fusion proteins to induce changes by producing targeted and sequenced genomic insertions, deletions, or mutations in response to cellular stimuli or changes. A fusion protein consisting of napDNAbp (eg, a Cas9 domain) and a reverse transcriptase operably linked to a promoter that promotes the use of a protein can be included. In contrast to digital memory devices that store information (e.g., the presence or absence of a stimulus) as one of two distinct states (i.e., "on" or "off"), these cellular data recorders Permanent marks can be induced on cellular DNA in a manner that reflects both the strength (i.e. amplitude) and duration of one or more stimuli. Therefore, in some aspects, a cellular data recording system has the ability to record multiple cellular states simultaneously. For example, during activation of small molecules, proteins, peptides, amino acids, metabolites, inorganic molecules, organometallic molecules, organic molecules, drugs or drug candidates, sugars, lipids, metals, nucleic acids, endogenous or exogenous signal cascades. exposure to molecules, light, heat, sound, pressure, mechanical stress, shear stress, or viruses or other microorganisms caused by microorganisms. These cellular data recorders may use sequencing technology (e.g., high-throughput sequencing) to measure readouts (e.g., changes in cellular DNA) and record stimulation or stimulus-induced changes in cellular DNA. Both readout(s) are independent of large cell populations.

一般的に、細胞への使用のための本願において提供される細胞データレコーダシステムは、napDNAbpおよび逆転写酵素からなる融合タンパク質を含み、融合体プラスミドをコードする核酸配列はプロモーター(例えば、誘導性プロモーターまたは恒常的プロモーター)に作動可能に連結されている。刺激が存在するかまたは細胞状態の変化が生起するときには、刺激は融合タンパク質の発現を誘導する。napDNAbpと会合し、napDNAbpまたは融合タンパク質を標的配列へと導く少なくとも1つのPEgRNAをコードする1つ以上の核酸もまた細胞内に存在する(すなわち、PEgRNAは標的配列に対して相補的である)。PEgRNAをコードする核酸もまた、または代替的に、プロモーター(例えば、誘導性プロモーターまたは恒常的プロモーター)に作動可能に連結され得る。正しい刺激または正しいセットの刺激下においては、融合タンパク質およびPEgRNA両方が細胞によって発現され、PEgRNAは融合タンパク質と会合してそれを標的配列へと導く。この標的配列はプライム編集因子の活性を記録し、それによって、刺激もしくは刺激のセットの存在または細胞状態の変化を記録する。1つよりも多くのPEgRNA配列もまた細胞内に存在し得、融合タンパク質を別物の標的配列へと導き得るこれらの追加のPEgRNA配列は夫々が、異なる刺激の存在を感知するプロモーターに作動可能に連結され得、刺激またはセットの刺激の存在および持続時間の順序付けられた記録のための複雑な細胞データレコーダシステムが構築されることを許す。いくつかのケースでは、細胞データレコーダシステムの構成要素(例えば、融合タンパク質およびPEgRNA)の1つ以上は、細胞によって恒常的に発現され得る。組成物への使用のための細胞データレコーダシステムの例示の構成要素が本明細書に記載の。本願において提供される構成要素の追加の好適な組み合わせは、本開示および当該技術分野の知識に基づいて当業者には明らかであろう。それゆえに本開示の範囲に包摂される。 Generally, the cellular data recorder systems provided herein for use in cells include a fusion protein consisting of napDNAbp and reverse transcriptase, and the nucleic acid sequence encoding the fusion plasmid is linked to a promoter (e.g., an inducible promoter). or a constitutive promoter). When a stimulus is present or a change in cellular state occurs, the stimulus induces expression of the fusion protein. Also present within the cell are one or more nucleic acids encoding at least one PEgRNA that associates with napDNAbp and directs napDNAbp or the fusion protein to the target sequence (ie, the PEgRNA is complementary to the target sequence). A nucleic acid encoding PEgRNA can also, or alternatively, be operably linked to a promoter (eg, an inducible promoter or a constitutive promoter). Under the correct stimulus or set of stimuli, both the fusion protein and PEgRNA are expressed by the cell, and the PEgRNA associates with the fusion protein and directs it to the target sequence. This targeting sequence records the activity of the prime editing factor, thereby recording the presence of a stimulus or set of stimuli or a change in cellular state. More than one PEgRNA sequence may also be present in the cell, and each of these additional PEgRNA sequences can direct the fusion protein to a different target sequence, each operable to a promoter that senses the presence of a different stimulus. can be coupled, allowing complex cellular data recorder systems to be constructed for ordered recording of the presence and duration of a stimulus or set of stimuli. In some cases, one or more of the components of the cellular data recorder system (eg, fusion protein and PEgRNA) can be constitutively expressed by the cell. Exemplary components of a cellular data recorder system for use in the compositions are described herein. Additional suitable combinations of the components provided herein will be apparent to those skilled in the art based on this disclosure and knowledge in the art. Therefore, it is within the scope of this disclosure.

標的アンプリコン配列決定および/またはRNA配列決定(これは単一細胞記録実験にとって特に価値がある)によって配列決定され得るDNA標的の繰り返しの改変が、シグナルカスケードの活性化、代謝状態、および細胞分化プログラムを包含する幾多の重要な生物学的プロセスを記録するために用いられ得る。内部のおよび外部の細胞性シグナルをゲノム上の配列改変に接続することは、シグナル応答性プロモーターが存在するいずれかのシグナルについて可能である。いくつかの態様では、プロモーターは原核生物システムへの使用にとって好適なプロモーターである(すなわち、細菌プロモーター)。いくつかの態様では、プロモーターは真核生物システムへの使用にとって好適なプロモーターである(すなわち、真核生物プロモーター)。いくつかの態様では、プロモーターは哺乳類(例えば、ヒト)システムへの使用にとって好適なプロモーターである(すなわち、哺乳類プロモーター)。いくつかの態様では、プロモーターは刺激によって誘導される(すなわち、誘導性プロモーター)。いくつかの態様では、刺激は、低分子、タンパク質、ペプチド、アミノ酸、代謝物質、無機分子、有機金属分子、有機分子、薬物もしくは薬物候補、糖、脂質、金属、核酸、内生もしくは外因的なシグナルカスケードの活性化の間に生ずる分子、光、熱、音、圧力、機械的ストレス、剪断ストレス、またはウイルスもしくは他の微生物、pHの変化、または酸化還元状態の変化である。いくつかの態様では、刺激は光である。いくつかの態様では、刺激はウイルスである。いくつかの態様では、刺激は低分子である。いくつかの態様では、刺激は抗生物質である。いくつかの態様では、刺激はアンヒドロテトラサイクリンまたはドキシサイクリンである。いくつかの態様では、刺激は糖である。いくつかの態様では、刺激はアラビノース、ラムノース、またはIPTGである。いくつかの態様では、刺激は活性化したシグナルカスケードの間に生ずるシグナル分子である(例えば、活性化したWntシグナルカスケードの間に生ずるベータカテニン)。シグナル分子を検出する追加のプロモーターが、プロモーターに作動可能に連結された核酸配列の発現を誘導するために生成され得る。例えば、免疫応答(IL-2プロモーター)、cAMP応答エレメント(CREB)、NFκBシグナル、インターフェロン応答、P53(DNA損傷)、Sox2、TGF-βシグナル(SMAD)、Erk(例えば、活性化したRas/Raf/Mek/Erkカスケードから)、PI3K/AKT(例えば、活性化したRas/PI3K/Aktカスケードから)、熱ショック、Notchシグナル、Oct4、アリール炭化水素受容体、またはAP-1転写因子を包含する内在的経路を記録するプロモーターである。いくつかの態様では、プロモーターは恒常的プロモーターである。いくつかの態様では、プロモーターは表3に列記されるプロモーターである。原核生物および真核生物システム両方への使用のための追加の好適なプロモーターは、本開示および当該技術分野の知識に基づいて当業者には明らかであろう。本開示の範囲内である。 Repetitive modifications of DNA targets, which can be sequenced by targeted amplicon sequencing and/or RNA sequencing (which is particularly valuable for single-cell recording experiments), may influence activation of signal cascades, metabolic status, and cell differentiation. The program can be used to record a number of important biological processes. Connecting internal and external cellular signals to sequence modifications on the genome is possible for any signal for which signal-responsive promoters are present. In some embodiments, the promoter is a promoter suitable for use in prokaryotic systems (ie, a bacterial promoter). In some embodiments, the promoter is a promoter suitable for use in eukaryotic systems (ie, a eukaryotic promoter). In some embodiments, the promoter is a promoter suitable for use in mammalian (eg, human) systems (ie, a mammalian promoter). In some embodiments, the promoter is induced by stimulation (ie, an inducible promoter). In some embodiments, the stimulus is a small molecule, protein, peptide, amino acid, metabolite, inorganic molecule, organometallic molecule, organic molecule, drug or drug candidate, sugar, lipid, metal, nucleic acid, endogenous or exogenous molecules, light, heat, sound, pressure, mechanical stress, shear stress, or viruses or other microorganisms, changes in pH, or changes in redox conditions that occur during activation of a signal cascade. In some embodiments, the stimulus is light. In some embodiments, the stimulus is a virus. In some embodiments, the stimulus is a small molecule. In some embodiments, the stimulus is an antibiotic. In some embodiments, the stimulus is anhydrotetracycline or doxycycline. In some embodiments, the stimulus is a sugar. In some embodiments, the stimulus is arabinose, rhamnose, or IPTG. In some embodiments, the stimulus is a signal molecule that occurs during an activated signal cascade (eg, beta-catenin that occurs during an activated Wnt signal cascade). Additional promoters that detect signal molecules can be generated to direct expression of nucleic acid sequences operably linked to the promoter. For example, immune response (IL-2 promoter), cAMP response element (CREB), NFκB signal, interferon response, P53 (DNA damage), Sox2, TGF-β signal (SMAD), Erk (e.g. activated Ras/Raf /Mek/Erk cascade), PI3K/AKT (e.g., from the activated Ras/PI3K/Akt cascade), heat shock, Notch signaling, Oct4, aryl hydrocarbon receptor, or endogenous transcription factors, including AP-1 transcription factors. It is a promoter that records the target pathway. In some embodiments, the promoter is a constitutive promoter. In some embodiments, the promoter is a promoter listed in Table 3. Additional suitable promoters for use in both prokaryotic and eukaryotic systems will be apparent to those skilled in the art based on this disclosure and knowledge in the art. Within the scope of this disclosure.

プライム編集因子は細胞系統をトレースするためにもまた用いられ得る。個々の細胞を追跡するために、固有の細胞バーコードを生成するための繰り返しの配列改変が用いられ得る。バーコードのアレイ、それらの順序、およびサイズは全て、細胞系統を推論するために用いられ得る。例えば、相同性配列(すなわち、Cas9ニックの位置付けの3'の配列)、具体的には関連するバーコードを有する相同性配列の挿入は、特に有用な系統プライム編集因子戦略であるように見える。これらのシステムは、編集の順次のラウンドが、同じ細胞の他のPEgRNA編集イベントによっては改変され得ないPEgRNAカセットからのバーコードの挿入をもたらすようにしてデザインされ得る。バーコード化システムは複数のバーコードを利用し得、これらは所与の刺激に関連し得る。このシステムは標的プロトスペーサーの多数を保全し得るが、シード配列、PAM、および下流の隣接ヌクレオチドを変改し得る。これは、用いられようとするPEgRNAの有意な再デザインなしに、複数のシグナルが1つの編集座位に接続されることを可能化する。戦略は、多数の細胞性の刺激(内部または外部どちらかの)に応答して単一の座位において多重化されたバーコード挿入を可能化し得る。それは、固有のバーコードが存在するだけ多くのシグナルの強度、持続時間、および順序の記録を可能化し得る(これらは4^Nの可能なバーコードを生成するように複数のNヌクレオチドによってデザインされ得る。例えば、5ntバーコードは4^5または1024の固有のシグナルの一度での記録を可能化するであろう)。このシステムはin vitroおよびインビボ両方で用いられ得る。 Prime editing factors can also be used to trace cell lineages. To track individual cells, repeated sequence modifications can be used to generate unique cell barcodes. The array of barcodes, their order, and size can all be used to infer cell lineage. For example, insertion of a homologous sequence (ie, a sequence 3' of the positioning of the Cas9 nick), specifically a homologous sequence with an associated barcode, appears to be a particularly useful lineage prime editor strategy. These systems can be designed such that successive rounds of editing result in the insertion of a barcode from the PEgRNA cassette that cannot be modified by other PEgRNA editing events in the same cell. A barcoding system may utilize multiple barcodes, which may be associated with a given stimulus. This system can preserve much of the target protospacer, but can modify the seed sequence, PAM, and downstream flanking nucleotides. This allows multiple signals to be connected to one editing locus without significant redesign of the PEgRNA to be used. The strategy may allow multiplexed barcode insertion at a single locus in response to multiple cellular stimuli (either internal or external). It can enable the recording of the intensity, duration, and order of as many signals as there are unique barcodes (these are designed with multiple N nucleotides to generate 4^N possible barcodes). For example, a 5nt barcode would allow recording of 4^5 or 1024 unique signals at once). This system can be used both in vitro and in vivo.

M.バイオ分子活性を調節するためのプライム編集の使用
本明細書に記載のプライム編集因子の使用は、DNA、RNA、およびタンパク質などのバイオ分子の細胞下レベル局在および修飾状態を制御するためにもまた用いられ得る。転写コントロール、細胞代謝、およびシグナル伝達カスケードのような特定の生物学的機能は、細胞内の具体的な位置付けにおいて丁寧にオーケストレーションされている。タンパク質をこれらのおよび他の固有の細胞区画に輸送する能力は、いくつもの生物学的プロセスを変改するための機会を提供し得る。
M. Using prime editing to modulate biomolecule activity
The use of prime editing factors described herein can also be used to control the subcellular localization and modification status of biomolecules such as DNA, RNA, and proteins. Specific biological functions such as transcriptional control, cellular metabolism, and signal transduction cascades are carefully orchestrated in specific locations within cells. The ability to transport proteins to these and other unique cellular compartments may provide opportunities for modifying a number of biological processes.

従って、プライム編集は、遺伝子にコードされたシグナルによるバイオ分子(例えばタンパク質、脂質、糖、および核酸)の変改された修飾状態および細胞下レベルの輸送を許すであろう遺伝子にコードされたハンドルを組み入れるために用いられ得る。種々の態様において、プライム編集因子によって媒介される薬物治療の標的バイオ分子はDNAである。例えば、DNAは、標的座位のアクセス可能性を変化させるいくつものDNA配列を組み入れることによって改変され得る。これは所望の配列の増大または減少したどちらかの転写に至り得る。他の態様において、プライム編集因子によって媒介される薬物治療の標的バイオ分子はRNAである。例えば、RNAの活性は、その細胞局在、相互作用パートナー、構造ダイナミクス、またはフォールディングの熱力学を変化させることによって改変され得る。さらに他の態様において、プライム編集因子によって媒介される薬物治療の標的バイオ分子はタンパク質である。タンパク質は翻訳後修飾にインパクトを及ぼすように改変され得るか、タンパク質モチーフがタンパク質の細胞下レベル局在を変化させるように組み入れられ得るか、またはタンパク質はタンパク質-タンパク質複合体化イベントに存在するそれらの能力を生出するかもしくは破壊するかどちらかのために改変され得る。 Therefore, prime editing involves the use of gene-encoded handles that would allow altered modification states of biomolecules (e.g. proteins, lipids, sugars, and nucleic acids) and their transport at the subcellular level by gene-encoded signals. can be used to incorporate. In various embodiments, the target biomolecule for drug therapy mediated by prime editing factors is DNA. For example, DNA can be modified by incorporating any number of DNA sequences that change the accessibility of the target locus. This can lead to either increased or decreased transcription of the desired sequence. In other embodiments, the target biomolecule for drug therapy mediated by a prime editing factor is RNA. For example, the activity of an RNA can be modified by changing its cellular localization, interaction partners, structural dynamics, or thermodynamics of folding. In yet other embodiments, the target biomolecule for drug therapy mediated by a prime editing factor is a protein. Proteins may be modified to impact post-translational modifications, protein motifs may be incorporated to alter the subcellular localization of the protein, or proteins may be present in protein-protein complexing events. can be modified to either create or destroy abilities.

プライム編集のこの適用は例14においてさらに記載され得る。 This application of prime editing can be further described in Example 14.

DNA改変
PEによって媒介される改変の1つの標的バイオ分子はDNAである。標的座位のアクセス可能性を変化させるいくつものDNA配列を組み入れるためのDNAの改変がなされ得る。クロマチンアクセス可能性は遺伝子転写アウトプットをコントロールする。クロマチンコンパクト化酵素を動員するためのマークの組み入れは、隣り合う遺伝子の転写アウトプットを減少させるはずであるが、クロマチン開放に関連する配列の組み入れは、領域をよりアクセス可能にし、翻って転写を増大させるはずである。ネイティブな制御配列を真似たより複雑な配列モチーフの組み入れは、現行で利用可能なdCas9融合体よりも微妙なかつ生物学的に敏感なコントロールを異なるエピジェネティックなリーダー、ライター、またはイレーサー酵素に提供するはずである。典型的には、具体的な生物学的祖先を有さずにあり得る多数の単一型のマークを組み入れるツールである。3Dゲノムアーキテクチャの急成長分野において実証されているとおり、2つの座位を近接する近位に持って来るかまたは座位を核膜との接触に持って来るであろう配列の組み入れもまた、それらの座位の転写アウトプットを変改するはずである。
DNA modification
One target biomolecule for PE-mediated modification is DNA. Modifications to the DNA can be made to incorporate any number of DNA sequences that change the accessibility of the target locus. Chromatin accessibility controls gene transcriptional output. Incorporation of marks to recruit chromatin-compacting enzymes should reduce the transcriptional output of neighboring genes, whereas incorporation of sequences associated with chromatin opening makes regions more accessible and, in turn, increases transcription. It should be increased. Incorporation of more complex sequence motifs that mimic native regulatory sequences should provide more subtle and biologically sensitive control over different epigenetic reader, writer, or eraser enzymes than currently available dCas9 fusions. It is. Typically, it is a tool that incorporates a large number of possible single types of marks without specific biological ancestry. As has been demonstrated in the burgeoning field of 3D genome architecture, the incorporation of sequences that would bring two loci into close proximity or bring loci into contact with the nuclear envelope also It should alter the transcriptional output of the locus.

RNA改変
それらの細胞局在、相互作用パートナー、構造ダイナミクス、またはフォールディングの熱力学を変化させることによってそれらの活性を変改するためのRNAの改変もまたなされ得る。翻訳中断またはフレームシフトを引き起こすであろうモチーフの組み入れは、種々のmRNAプロセシング機序によってmRNA種の存在量を変化させ得る。コンセンサススプライス配列を改変することもまた、異なるRNA種の存在量および保有率を変改するであろう。異なるスプライスアイソフォームの相対比を変化させることは、予測可能に、タンパク質翻訳産物の比の変化に至るであろう。これは多くの生物学的経路を変改するために用いられ得る。例えば、ミトコンドリア対核のDNA修復タンパク質のバランスをシフトさせることは、化学療法試薬に対する異なるがんのレジリエンスを変改するであろう。さらにその上、RNAは、新規のタンパク質標的への結合を可能化する配列によって修飾され得る。高い親和性で細胞タンパク質に結合するいくつものRNAアプタマーが開発されている。これらのアプタマーの1つの組み入れは、それらの翻訳、生物活性を防止するであろうタンパク質標的への結合によって異なるRNA種を隔離するために、またはRNA種を特定の細胞下レベル区画に持って来るためにどちらかで用いられ得る。バイオ分子分解は局在改変の別のクラスである。
RNA Modifications Modifications of RNAs can also be made to alter their activity by changing their cellular localization, interaction partners, structural dynamics, or thermodynamics of folding. Incorporation of motifs that would cause translation interruption or frameshifting can alter the abundance of mRNA species through various mRNA processing mechanisms. Altering the consensus splice sequence will also alter the abundance and prevalence of different RNA species. Altering the relative ratios of different splice isoforms will predictably lead to changes in the ratio of protein translation products. This can be used to modify many biological pathways. For example, shifting the balance of mitochondrial versus nuclear DNA repair proteins would alter the resilience of different cancers to chemotherapy reagents. Furthermore, RNA can be modified with sequences that allow binding to new protein targets. A number of RNA aptamers have been developed that bind with high affinity to cellular proteins. Incorporation of one of these aptamers can be used to sequester different RNA species by binding to protein targets that would prevent their translation, biological activity, or bring RNA species to specific subcellular level compartments. can be used for either purpose. Biomolecular degradation is another class of localization modification.

例えば、細胞内のRNAを制御するためのRNAメチル化が用いられる。メチル化のコンセンサスモチーフがPEによって標的RNAコード配列上に導入され得る。RNAは、ナンセンスによって媒介される崩壊機構または標的RNA種を分解するための他の核酸代謝経路を導く配列を包含するようにもまた改変され得、細胞内のRNAのプールを変化させるであろう。加えて、RNA種はそれらの凝集状態を変改するように改変され得る。RNAの絡まりを生成するための配列が目当ての単一のRNAまたは複数のRNA上に組み入れされ得、これはそれらを翻訳またはシグナルにとって無効な基質にするであろう。 For example, RNA methylation is used to control RNA within cells. A consensus motif of methylation can be introduced onto the target RNA coding sequence by PE. RNA can also be modified to include sequences that direct nonsense-mediated decay mechanisms or other nucleic acid metabolic pathways to degrade target RNA species, which would alter the pool of RNA within the cell. . Additionally, RNA species can be modified to alter their aggregation state. Sequences to generate RNA tangles can be incorporated onto a single RNA or multiple RNAs of interest, which will make them ineffective substrates for translation or signals.

タンパク質修飾
翻訳後修飾(PTM)によるタンパク質の修飾もまたPEによって実行され得るバイオ分子操作の重要なクラスを表す。RNA種のように、細胞内のタンパク質の存在量を変化させることは、PEの重要な能力である。オープンリーディングフレームに停止コドンを組み入れるための編集がされ得る。これは編集されたDNA配列から生ずる全長産物を消去するであろう。代替的には、タンパク質分解の速度が標的タンパク質について変改されることを引き起こすペプチドモチーフが組み入れられ得る。遺伝子本体上への分解タグの組み入れが、細胞内のタンパク質の存在量を変改するために用いられ得る。その上、低分子によって誘導されるデグロンの導入はタンパク質分解の時間的コントロールを可能化し得る。これは研究および治療学両方にとって重要な関連性を有し得る。なぜなら、研究者は所与の標的の低分子によって媒介される治療学的タンパク質分解が見込みある治療学的戦略であるかどうかを難なく評価し得るからである。タンパク質の細胞下レベル局在を変化させるためのタンパク質モチーフもまた組み入れられ得る。核、ミトコンドリア、細胞膜、ペルオキシソーム、リソソーム、プロテアソーム、エキソソーム、および他を包含するいくつもの細胞下レベル区画にタンパク質を選好的に輸送するためのアミノ酸モチーフが組み入れられ得る。
Protein Modification Modification of proteins by post-translational modifications (PTMs) also represents an important class of biomolecular manipulations that can be performed by PE. Like RNA species, altering the abundance of proteins within cells is an important ability of PE. Edits can be made to incorporate stop codons into the open reading frame. This will eliminate the full length product resulting from the edited DNA sequence. Alternatively, peptide motifs can be incorporated that cause the rate of proteolysis to be altered for the target protein. Incorporation of degradation tags onto gene bodies can be used to alter the abundance of proteins within cells. Moreover, introduction of degrons induced by small molecules may allow temporal control of protein degradation. This may have important implications for both research and therapeutics. This is because researchers can easily assess whether small molecule-mediated therapeutic proteolysis of a given target is a promising therapeutic strategy. Protein motifs can also be incorporated to alter the subcellular localization of the protein. Amino acid motifs can be incorporated to preferentially transport proteins to any number of subcellular level compartments, including the nucleus, mitochondria, cell membranes, peroxisomes, lysosomes, proteasomes, exosomes, and others.

PTM機構によって修飾されるモチーフを組み入れまたは破壊することはタンパク質翻訳後修飾を変改し得る。リン酸化、ユビキチン化、グリコシル化、脂質修飾(例えばファルネシル化、ミリストイル化、パルミトイル化、プレニル化、GPIアンカー)、ヒドロキシル化、メチル化、アセチル化、クロトニル化、SUMO化、ジスルフィド結合形成、側鎖結合切断イベント、ポリペプチドバックボーン切断イベント(タンパク質分解)、およびいくつもの他のタンパク質PTMが同定されている。これらのPTMは、多くの場合には細胞下レベル局在を変化させることによってタンパク質機能を変化させる。実に、キナーゼは多くの場合にはリン酸化イベントによって下流のシグナルカスケードを活性化する。標的ホスホ部位の除去はシグナル伝達を防止するであろう。全長タンパク質発現を保持しながらいずれかのPTMモチーフを部位特異的に切除または組み入れる能力は、基礎研究および治療学両方にとって重要な進歩であろう。PEの配列組み入れ範囲および標的窓は、それを幅広いPTM改変空間に良く適するようにしている。 Incorporating or destroying motifs modified by the PTM machinery can alter protein post-translational modifications. Phosphorylation, ubiquitination, glycosylation, lipid modification (e.g. farnesylation, myristoylation, palmitoylation, prenylation, GPI anchor), hydroxylation, methylation, acetylation, crotonylation, SUMOylation, disulfide bond formation, side chains Bond cleavage events, polypeptide backbone cleavage events (proteolysis), and a number of other protein PTMs have been identified. These PTMs alter protein function, often by altering subcellular localization. Indeed, kinases activate downstream signal cascades, often through phosphorylation events. Removal of the target phosphosite will prevent signal transduction. The ability to site-specifically excise or incorporate either PTM motif while preserving full-length protein expression would be an important advance for both basic research and therapeutics. PE's sequence incorporation range and targeting window make it well suited for a wide range of PTM modification spaces.

脂質修飾部位の除去は細胞膜へのタンパク質の輸送を防止するはずである。翻訳後修飾プロセスを標的化する現行の治療学における主要な限定はそれらの特異性である。ファルネシルトランスフェラーゼ阻害剤は細胞膜へのKRAS局在を消去するそれらの能力について鋭意に試験されている。残念ながら、ファルネシル化の全面的な阻害は数々のオフターゲット効果を伴い、これらはこれらの低分子の幅広い使用を防止している。類似に、低分子によるタンパク質キナーゼの特異的阻害は、ヒトゲノムの大きいサイズおよび種々のキナーゼ間の類似性を原因として非常に難しくあり得る。PEはこの特異性問題に可能性ある解決をオファーする。なぜなら、それは全面的な酵素阻害の代わりに修飾部位の切除による標的タンパク質の修飾の阻害を可能化するからである。例えば、KRAS上の脂質修飾ペプチドモチーフの除去は、ファルネシルトランスフェラーゼ阻害の代わりに用いられ得る標的化されたアプローチであろう。このアプローチは、膜結合するようにデザインされていないタンパク質上に脂質標的化モチーフを組み入れることによって標的タンパク質活性を阻害することの機能的な反対物である。 Removal of lipid modification sites should prevent protein transport to the cell membrane. A major limitation of current therapeutics targeting post-translational modification processes is their specificity. Farnesyltransferase inhibitors have been extensively tested for their ability to eliminate KRAS localization to the cell membrane. Unfortunately, total inhibition of farnesylation is associated with a number of off-target effects, which prevent the widespread use of these small molecules. Similarly, specific inhibition of protein kinases by small molecules can be very difficult due to the large size of the human genome and the similarities between various kinases. PE offers a possible solution to this specificity problem. This is because it allows inhibition of target protein modification by excision of the modification site instead of total enzyme inhibition. For example, removal of the lipid-modified peptide motif on KRAS would be a targeted approach that could be used instead of farnesyltransferase inhibition. This approach is the functional opposite of inhibiting target protein activity by incorporating lipid targeting motifs on proteins that are not designed to bind to membranes.

PEはタンパク質-タンパク質複合体化イベントを取り調べる(instigate)ためにもまた用いられ得る。タンパク質は多くの場合には複合体内で機能してそれらの生物活性を遂行する。PEは、タンパク質がこれらの複合体内に存在する能力を生出するかまたは破壊するかどちらかのために用いられ得る。複合体形成イベントを消去するためには、タンパク質:タンパク質インターフェース上のアミノ酸置換または挿入が、複合体化を好まないように組み入れられ得る。SSX18は重要なヒストンリモデリング複合体のBAF複合体のタンパク質構成要素である。SSX18の変異は滑膜肉腫を駆動する。PEは、SSX18が複合体のそのタンパク質パートナーに結合することを防止する側鎖を組み入れしてその発がん活性を防止するために用いられ得る。PEは病原性の変異を除去してこのタンパク質のWT活性を復元するためにもまた用いられ得る。代替的には、PEは、タンパク質をそれらのネイティブな複合体中に保つために、またはそれらのネイティブな活性とは無関係である相互作用に関与するようにそれらを引っ張ってそれらの活性を阻害するためにどちらかで用いられ得る。別のものと比べて1つの相互作用状態を維持する複合体を形成することは、重要な治療学的モダリティーを表し得る。タンパク質:タンパク質インターフェースを変改して相互作用のKdを減少させることは、それらのタンパク質がより長く互いにくっついていることを保つであろう。疾患においては神経芽腫シグナルカスケードを駆動するが、さもなければ他の細胞では健康な転写コントロールに関与するn-mycのように、タンパク質複合体は複数のシグナル複合体を有し得る。PEは、健康な相互作用パートナーとのn-myc会合を駆動しかつ発がん相互作用パートナーに対するその親和性を減少させる変異を組み入れるために用いられ得る。
セクションIに引用された参考文献
以下の参考文献の各々は参照により本明細書に組み込まれる。

Figure 2020191234000268
PE can also be used to investigate protein-protein conjugation events. Proteins often function within complexes to carry out their biological activities. PE can be used to either create or destroy the ability of proteins to reside within these complexes. To eliminate complexation events, amino acid substitutions or insertions on the protein:protein interface can be engineered to disfavor complexation. SSX18 is a protein component of the BAF complex, an important histone remodeling complex. Mutations in SSX18 drive synovial sarcoma. PE can be used to incorporate side chains that prevent SSX18 from binding to its protein partner in the complex, thus preventing its oncogenic activity. PE can also be used to remove pathogenic mutations and restore WT activity of the protein. Alternatively, PE inhibits the activity of proteins in order to keep them in their native complexes or by pulling them to engage in interactions that are independent of their native activity. can be used for either purpose. Forming complexes that maintain one interaction state relative to another may represent an important therapeutic modality. Modifying the protein:protein interface to reduce the Kd of interaction will keep those proteins stuck together longer. Protein complexes can have multiple signaling complexes, such as n-myc, which drives the neuroblastoma signal cascade in disease but is otherwise involved in healthy transcriptional control in other cells. PE can be used to incorporate mutations that drive n-myc association with healthy interaction partners and reduce its affinity for oncogenic interaction partners.
References cited in Section I
Each of the following references is incorporated herein by reference.
Figure 2020191234000268

N.プライム編集のためのPEgRNAの改善されたデザイン側面
他の態様において、プライム編集システムはプライム編集効率を改善し得るPEgRNAデザインおよび戦略の使用を包含し得る。これらの戦略は、プライム編集に要求されるマルチステッププロセスゆえに存在するいくつかのイシューを克服することを探究する。例えば、PEgRNA上に形成し得る好ましくないRNA構造は、DNA編集がPEgRNAからゲノム座位にコピーされることの阻害をもたらし得る。これらの限定はPEgRNA構成要素の再デザインおよび操作によって克服され得る。これらの再デザインはプライム編集因子効率を改善し得、ゲノム上へのより長い挿入配列の組み入れを許し得る。
N. Improved design aspects of PEgRNA for prime editing
In other embodiments, prime editing systems can include the use of PEgRNA designs and strategies that can improve prime editing efficiency. These strategies seek to overcome some of the issues that exist due to the multi-step process required for prime editing. For example, unfavorable RNA structures that can form on PEgRNA can result in inhibition of DNA editing being copied from PEgRNA to genomic loci. These limitations can be overcome by redesign and engineering of PEgRNA components. These redesigns can improve prime editing element efficiency and allow the incorporation of longer insert sequences onto the genome.

従って、種々の態様において、PEgRNAデザインは、非ポリメラーゼIII(pol III)プロモーターからの機能的なPEgRNAの効率的な発現を可能化することによって、より長いPEgRNAをもたらし得る。これは難儀な配列要件の必要を回避するであろう。他の態様において、コアのCas9結合PEgRNA骨格はシステムの効力を改善するように改善され得る。さらに他の態様において、逆転写酵素(RT)処理能力を改善するための改変がPEgRNAになされ得る。これは標的ゲノム座位におけるより長い配列の挿入を可能化するであろう。他の態様において、安定性を改善、RT処理能力を増強、PEgRNAのミスフォールディングを防止、および/またはゲノム編集にとって重要な追加の因子を動員するために、RNAモチーフがPEgRNAの5'および/または3'末端に追加され得る。さらに別の態様では、PEgRNA骨格を改善およびプライム編集因子効率を増強し得る所与の配列標的についてのPEgRNAの進化のためのプラットフォームが提供される。これらのデザインは、いずれかのCas9またはその進化したバリアントによって認識されるいずれかのPEgRNAを改善するために用いられ得る。 Thus, in various embodiments, PEgRNA designs may result in longer PEgRNAs by allowing efficient expression of functional PEgRNAs from non-polymerase III (pol III) promoters. This would avoid the need for onerous alignment requirements. In other embodiments, the core Cas9-bound PEgRNA backbone can be modified to improve the efficacy of the system. In yet other embodiments, modifications can be made to PEgRNA to improve reverse transcriptase (RT) processability. This would allow insertion of longer sequences at the target genomic locus. In other embodiments, the RNA motif is 5' and/or may be added to the 3' end. In yet another embodiment, a platform is provided for the evolution of PEgRNA for a given sequence target that can improve the PEgRNA backbone and enhance prime editor efficiency. These designs can be used to improve any PEgRNA recognized by any Cas9 or its evolved variants.

プライム編集のこの適用は例15にさらに記載され得る。 This application of prime editing may be further described in Example 15.

PEgRNAは、PEgRNAの特性および/または特徴を改変し得る追加のデザイン改善を包含し得、それによってプライム編集の効力を改善する。種々の態様において、これらの改善は、いくつもの異なるカテゴリーの1つ以上に属し得る:(1)難儀な配列要件なしにより長いPEgRNAの発現を可能化するであろう非ポリメラーゼIII(pol III)プロモーターからの機能的なPEgRNAの効率的な発現を可能化するためのデザイン;(2)効力を改善し得るコアのCas9結合PEgRNA骨格の改善;(3)RT処理能力を改善し、標的ゲノム座位におけるより長い配列の挿入を可能化するPEgRNAの改変;および(4)PEgRNA安定性を改善、RT処理能力を増強、PEgRNAのミスフォールディングを防止、またはゲノム編集にとって重要な追加の因子を動員するPEgRNAの5'または3'末端へのRNAモチーフの追加を包含するが、これらに限定されない。 PEgRNA may include additional design improvements that may modify the properties and/or characteristics of PEgRNA, thereby improving the efficacy of prime editing. In various embodiments, these improvements may belong to one or more of a number of different categories: (1) non-polymerase III (pol III) promoters that would allow expression of longer PEgRNAs without difficult sequence requirements; (2) improvement of the core Cas9-bound PEgRNA backbone that may improve potency; (3) improve RT processing ability and (4) modification of PEgRNA that allows insertion of longer sequences; and (4) modification of PEgRNA that improves PEgRNA stability, enhances RT processing capacity, prevents PEgRNA misfolding, or recruits additional factors important for genome editing. Including, but not limited to, the addition of RNA motifs to the 5' or 3' ends.

1つの態様では、より大きい伸長アームを有するより長い長さのPEgRNAの発現を改善するためのpol IIIプロモーターによるPEgRNAがデザインされ得る。sgRNAは典型的にはU6 snRNAプロモーターから発現される。このプロモーターはpol IIIを動員して関連するRNAを発現し、核内に保持される短いRNAの発現にとって有用である。しかしながら、pol IIIは高度にプロセッシブではなく、長さが数百ヌクレオチドよりも長いRNAを効率的なゲノム編集に要求されるレベルで発現する能力はない。加えて、pol IIIはUのストレッチにおいてストールまたは終結し得、可能性として、PEgRNAを用いて挿入され得る配列多様性を限定する。ポリメラーゼII(例えばpCMV)またはポリメラーゼI(例えばU1 snRNAプロモーター)を動員する他のプロモーターが、より長いsgRNAを発現するそれらの能力について検分されている。しかしながら、これらのプロモーターは典型的には部分的に転写され、これは発現されるPEgRNA上のスペーサーの5'に余分な配列をもたらすであろう。これは顕著に縮減されたCas9:sgRNA活性を部位依存的な様式でもたらすことが示されている。加えて、pol IIIによって転写されるPEgRNAは単純に一続きの6-7つのUで終結し得るが、pol IIまたはpol Iから転写されるPEgRNAは異なる終結シグナルを要求するであろう。多くの場合に、かかるシグナルはポリアデニル化をもまたもたらし、これは核からのPEgRNAの望まれない輸送をもたらすであろう。類似に、pCMVなどのpol IIプロモーターから発現されたRNAは典型的には5'キャッピングされ、それらの核搬出をもまたもたらすであろう。 In one embodiment, PEgRNAs with pol III promoters can be designed to improve expression of longer length PEgRNAs with larger extended arms. sgRNAs are typically expressed from the U6 snRNA promoter. This promoter recruits pol III to express the associated RNA and is useful for the expression of short RNAs that are retained in the nucleus. However, pol III is not highly processive and is not capable of expressing RNAs longer than a few hundred nucleotides in length at the levels required for efficient genome editing. In addition, pol III may stall or terminate in stretches of U, potentially limiting the sequence diversity that can be inserted using PEgRNA. Other promoters that recruit polymerase II (eg, pCMV) or polymerase I (eg, the U1 snRNA promoter) have been tested for their ability to express longer sgRNAs. However, these promoters are typically partially transcribed, which will result in an extra sequence 5' of the spacer on the PEgRNA that is expressed. This has been shown to result in significantly reduced Cas9:sgRNA activity in a site-dependent manner. In addition, PEgRNAs transcribed by pol III may simply terminate with a stretch of 6-7 U, whereas PEgRNAs transcribed from pol II or pol I will require different termination signals. In many cases, such signals will also result in polyadenylation, which will result in unwanted export of PEgRNA from the nucleus. Similarly, RNAs expressed from pol II promoters such as pCMV are typically 5'capped, which will also result in their nuclear export.

先に、Rinnおよび同僚は、長鎖非コードRNA(lncRNA)タグ付きsgRNAの生産について、種々の発現プラットフォームをスクリーニングした183。これらのプラットフォームは、ヒトのMALAT1 ncRNAからのENEエレメント184、KSHVからのPAN ENEエレメント185、またはU1 snRNAからの3'ボックス186で終結する、pCMVから発現されるRNAを包含する。注意すべきことに、MALAT1 ncRNAおよびPAN ENEは三重らせんを形成し、ポリAテールを防護する184,187。これらの構築物もまたRNA安定性を増強し得る。これらの発現システムもまたより長いPEgRNAの発現を可能化するであろうということが企図される。 Previously, Rinn and colleagues screened various expression platforms for the production of long non-coding RNA (lncRNA)-tagged sgRNAs. These platforms include RNA expressed from pCMV that terminates in the ENE element 184 from human MALAT1 ncRNA, the PAN ENE element 185 from KSHV, or the 3' box 186 from U1 snRNA. Of note, MALAT1 ncRNA and PAN ENE form a triple helix and shield the polyA tail184,187 . These constructs may also enhance RNA stability. It is contemplated that these expression systems will also allow expression of longer PEgRNAs.

加えて、PEgRNAの一部として転写されるであろうpol IIプロモーターの部分の切断のための一連の方法がデザインされており、転写されたガイドをプロセシングするための自己切断リボザイム、例えばハンマーヘッド188、ピストル189、ハチェット189、ヘアピン190、VS191、ツイスター192、もしくはツイスターシスター192リボザイム、または他の自己切断エレメント、あるいはCsy4によって認識され193、またガイドのプロセシングに至るヘアピンどちらかを追加している。また、KSHV PAN RNAおよびエレメントについて先に実証されているとおり、複数のENEモチーフの組み込みが、改善されたPEgRNA発現および安定性に至り得るという仮説が立てられている185。環状イントロン性RNA(ciRNA)の形態でPEgRNAを環状化することもまた増強されたRNA発現および安定性ならびに核局在に至り得るということもまた予期される194 In addition, a series of methods have been designed for cleavage of the portion of the pol II promoter that would be transcribed as part of PEgRNA, and a self-cleaving ribozyme, e.g. hammerhead 188 , has been designed to process the transcribed guide. , Pistol 189 , Hatchet 189 , Hairpin 190 , VS 191 , Twister 192 , or Twister Sister 192 ribozyme, or other self-cleaving elements, or recognized by Csy4 193 , and have added either a hairpin leading to the processing of the guide . It has also been hypothesized that the incorporation of multiple ENE motifs may lead to improved PEgRNA expression and stability, as previously demonstrated for KSHV PAN RNA and elements. It is also anticipated that circularizing PEgRNA in the form of circular intronic RNA (ciRNA) may also lead to enhanced RNA expression and stability as well as nuclear localization.

様々な態様において、PEgRNAは、以下の配列によって例示されるとおり、上の様々な要素を包含していてもよい。 In various embodiments, the PEgRNA may include various elements above, as exemplified by the sequences below.

非限定例1-pCMV、Csy4ヘアピン、PEgRNA、およびMALAT1 ENEからなるPEgRNA発現プラットホーム
TAGTTATTAATAGTAATCAATTACGGGGTCATTAGTTCATAGCCCATATATGGAGTTCCGCGTTACATAACTTACGGTAAATGGCCCGCCTGGCTGACCGCCCAACGACCCCCGCCCATTGACGTCAATAATGACGTATGTTCCCATAGTAACGCCAATAGGGACTTTCCATTGACGTCAATGGGTGGAGTATTTACGGTAAACTGCCCACTTGGCAGTACATCAAGTGTATCATATGCCAAGTACGCCCCCTATTGACGTCAATGACGGTAAATGGCCCGCCTGGCATTATGCCCAGTACATGACCTTATGGGACTTTCCTACTTGGCAGTACATCTACGTATTAGTCATCGCTATTACCATGGTGATGCGGTTTTGGCAGTACATCAATGGGCGTGGATAGCGGTTTGACTCACGGGGATTTCCAAGTCTCCACCCCATTGACGTCAATGGGAGTTTGTTTTGGCACCAAAATCAACGGGACTTTCCAAAATGTCGTAACAACTCCGCCCCATTGACGCAAATGGGCGGTAGGCGTGTACGGTGGGAGGTCTATATAAGCAGAGCTGGTTTAGTGAACCGTCAGATCGTTCACTGCCGTATAGGCAGGGCCCAGACTGAGCACGTGAGTTTTAGAGCTAGAAATAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGGACCGAGTCGGTCCTCTGCCATCAAAGCGTGCTCAGTCTGTTTTAGGGTCATGAAGGTTTTTCTTTTCCTGAGAAAACAACACGTATTGTTTTCTCAGGTTTTGCTTTTTGGCCTTTTTCTAGCTTAAAAAAAAAAAAAGCAAAAGATGCTGGTGGTTGGCACTCCTGGTTTCCAGGACGGGGTTCAAATCCCTGCGGCGTCTTTGCTTTGACT(配列番号501)
Non-limiting example 1 - PEgRNA expression platform consisting of pCMV, Csy4 hairpin, PEgRNA, and MALAT1 ENE
(Sequence number 501)

非限定例2-pCMV、Csy4ヘアピン、PEgRNA、およびPAN ENEからなるPEgRNA発現プラットホーム
TAGTTATTAATAGTAATCAATTACGGGGTCATTAGTTCATAGCCCATATATGGAGTTCCGCGTTACATAACTTACGGTAAATGGCCCGCCTGGCTGACCGCCCAACGACCCCCGCCCATTGACGTCAATAATGACGTATGTTCCCATAGTAACGCCAATAGGGACTTTCCATTGACGTCAATGGGTGGAGTATTTACGGTAAACTGCCCACTTGGCAGTACATCAAGTGTATCATATGCCAAGTACGCCCCCTATTGACGTCAATGACGGTAAATGGCCCGCCTGGCATTATGCCCAGTACATGACCTTATGGGACTTTCCTACTTGGCAGTACATCTACGTATTAGTCATCGCTATTACCATGGTGATGCGGTTTTGGCAGTACATCAATGGGCGTGGATAGCGGTTTGACTCACGGGGATTTCCAAGTCTCCACCCCATTGACGTCAATGGGAGTTTGTTTTGGCACCAAAATCAACGGGACTTTCCAAAATGTCGTAACAACTCCGCCCCATTGACGCAAATGGGCGGTAGGCGTGTACGGTGGGAGGTCTATATAAGCAGAGCTGGTTTAGTGAACCGTCAGATCGTTCACTGCCGTATAGGCAGGGCCCAGACTGAGCACGTGAGTTTTAGAGCTAGAAATAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGGACCGAGTCGGTCCTCTGCCATCAAAGCGTGCTCAGTCTGTTTTGTTTTGGCTGGGTTTTTCCTTGTTCGCACCGGACACCTCCAGTGACCAGACGGCAAGGTTTTTATCCCAGTGTATATTGGAAAAACATGTTATACTTTTGACAATTTAACGTGCCTAGAGCTCAAATTAAACTAATACCATAACGTAATGCAACTTACAACATAAATAAAGGTCAATGTTTAATCCATAAAAAAAAAAAAAAAAAAA(配列番号502)
Non-limiting example 2 - PEgRNA expression platform consisting of pCMV, Csy4 hairpin, PEgRNA, and PAN ENE
(Sequence number 502)

非限定例3-pCMV、Csy4ヘアピン、PEgRNA、および3×PAN ENEからなるPEgRNA発現プラットホーム
TAGTTATTAATAGTAATCAATTACGGGGTCATTAGTTCATAGCCCATATATGGAGTTCCGCGTTACATAACTTACGGTAAATGGCCCGCCTGGCTGACCGCCCAACGACCCCCGCCCATTGACGTCAATAATGACGTATGTTCCCATAGTAACGCCAATAGGGACTTTCCATTGACGTCAATGGGTGGAGTATTTACGGTAAACTGCCCACTTGGCAGTACATCAAGTGTATCATATGCCAAGTACGCCCCCTATTGACGTCAATGACGGTAAATGGCCCGCCTGGCATTATGCCCAGTACATGACCTTATGGGACTTTCCTACTTGGCAGTACATCTACGTATTAGTCATCGCTATTACCATGGTGATGCGGTTTTGGCAGTACATCAATGGGCGTGGATAGCGGTTTGACTCACGGGGATTTCCAAGTCTCCACCCCATTGACGTCAATGGGAGTTTGTTTTGGCACCAAAATCAACGGGACTTTCCAAAATGTCGTAACAACTCCGCCCCATTGACGCAAATGGGCGGTAGGCGTGTACGGTGGGAGGTCTATATAAGCAGAGCTGGTTTAGTGAACCGTCAGATCGTTCACTGCCGTATAGGCAGGGCCCAGACTGAGCACGTGAGTTTTAGAGCTAGAAATAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGGACCGAGTCGGTCCTCTGCCATCAAAGCGTGCTCAGTCTGTTTTGTTTTGGCTGGGTTTTTCCTTGTTCGCACCGGACACCTCCAGTGACCAGACGGCAAGGTTTTTATCCCAGTGTATATTGGAAAAACATGTTATACTTTTGACAATTTAACGTGCCTAGAGCTCAAATTAAACTAATACCATAACGTAATGCAACTTACAACATAAATAAAGGTCAATGTTTAATCCATAAAAAAAAAAAAAAAAAAAACACACTGTTTTGGCTGGGTTTTTCCTTGTTCGCACCGGACACCTCCAGTGACCAGACGGCAAGGTTTTTATCCCAGTGTATATTGGAAAAACATGTTATACTTTTGACAATTTAACGTGCCTAGAGCTCAAATTAAACTAATACCATAACGTAATGCAACTTACAACATAAATAAAGGTCAATGTTTAATCCATAAAAAAAAAAAAAAAAAAATCTCTCTGTTTTGGCTGGGTTTTTCCTTGTTCGCACCGGACACCTCCAGTGACCAGACGGCAAGGTTTTTATCCCAGTGTATATTGGAAAAACATGTTATACTTTTGACAATTTAACGTGCCTAGAGCTCAAATTAAACTAATACCATAACGTAATGCAACTTACAACATAAATAAAGGTCAATGTTTAATCCATAAAAAAAAAAAAAAAAAAA(配列番号503)
Non-limiting example 3 - PEgRNA expression platform consisting of pCMV, Csy4 hairpin, PEgRNA, and 3×PAN ENE
(Sequence number 503)

非限定例4-pCMV、Csy4ヘアピン、PEgRNA、および3'ボックスからなるPEgRNA発現プラットホーム
TAGTTATTAATAGTAATCAATTACGGGGTCATTAGTTCATAGCCCATATATGGAGTTCCGCGTTACATAACTTACGGTAAATGGCCCGCCTGGCTGACCGCCCAACGACCCCCGCCCATTGACGTCAATAATGACGTATGTTCCCATAGTAACGCCAATAGGGACTTTCCATTGACGTCAATGGGTGGAGTATTTACGGTAAACTGCCCACTTGGCAGTACATCAAGTGTATCATATGCCAAGTACGCCCCCTATTGACGTCAATGACGGTAAATGGCCCGCCTGGCATTATGCCCAGTACATGACCTTATGGGACTTTCCTACTTGGCAGTACATCTACGTATTAGTCATCGCTATTACCATGGTGATGCGGTTTTGGCAGTACATCAATGGGCGTGGATAGCGGTTTGACTCACGGGGATTTCCAAGTCTCCACCCCATTGACGTCAATGGGAGTTTGTTTTGGCACCAAAATCAACGGGACTTTCCAAAATGTCGTAACAACTCCGCCCCATTGACGCAAATGGGCGGTAGGCGTGTACGGTGGGAGGTCTATATAAGCAGAGCTGGTTTAGTGAACCGTCAGATCGTTCACTGCCGTATAGGCAGGGCCCAGACTGAGCACGTGAGTTTTAGAGCTAGAAATAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGGACCGAGTCGGTCCTCTGCCATCAAAGCGTGCTCAGTCTGTTTGTTTCAAAAGTAGACTGTACGCTAAGGGTCATATCTTTTTTTGTTTGGTTTGTGTCTTGGTTGGCGTCTTAAA(配列番号504)
Non-limiting example 4 - PEgRNA expression platform consisting of pCMV, Csy4 hairpin, PEgRNA, and 3' box
(Sequence number 504)

非限定例5-pU1、Csy4ヘアピン、PEgRNA、および3'ボックスからなるPEgRNA発現プラットホーム
CTAAGGACCAGCTTCTTTGGGAGAGAACAGACGCAGGGGCGGGAGGGAAAAAGGGAGAGGCAGACGTCACTTCCCCTTGGCGGCTCTGGCAGCAGATTGGTCGGTTGAGTGGCAGAAAGGCAGACGGGGACTGGGCAAGGCACTGTCGGTGACATCACGGACAGGGCGACTTCTATGTAGATGAGGCAGCGCAGAGGCTGCTGCTTCGCCACTTGCTGCTTCACCACGAAGGAGTTCCCGTGCCCTGGGAGCGGGTTCAGGACCGCTGATCGGAAGTGAGAATCCCAGCTGTGTGTCAGGGCTGGAAAGGGCTCGGGAGTGCGCGGGGCAAGTGACCGTGTGTGTAAAGAGTGAGGCGTATGAGGCTGTGTCGGGGCAGAGGCCCAAGATCTCAGTTCACTGCCGTATAGGCAGGGCCCAGACTGAGCACGTGAGTTTTAGAGCTAGAAATAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGGACCGAGTCGGTCCTCTGCCATCAAAGCGTGCTCAGTCTGTTTCAGCAAGTTCAGAGAAATCTGAACTTGCTGGATTTTTGGAGCAGGGAGATGGAATAGGAGCTTGCTCCGTCCACTCCACGCATCGACCTGGTATTGCAGTACCTCCAGGAACGGTGCACCCACTTTCTGGAGTTTCAAAAGTAGACTGTACGCTAAGGGTCATATCTTTTTTTGTTTGGTTTGTGTCTTGGTTGGCGTCTTAAA(配列番号505)
Non-limiting Example 5 - PEgRNA Expression Platform Consisting of pU1, Csy4 Hairpin, PEgRNA, and 3' Box
(SEQ ID NO:505)

種々の他の態様において、PEgRNAは、骨格またはコア配列への改善を導入することによって改善され得る。これは公知を導入することによってされ得る。 In various other embodiments, PEgRNAs can be improved by introducing improvements to the backbone or core sequence. This can be done by introducing known information.

コアのCas9結合PEgRNA骨格は、蓋然的には、PE活性を増強するように改善され得る。いくつかのかかるアプローチはすでに実証されている。例えば、骨格の第1の対形成エレメント(P1)はGTTTT-AAAAC(配列番号3939)対形成エレメントを含有する。かかる一続きのTはpol III中断とRNA転写物の未成熟な終結とをもたらすことが示されている。P1のこの部分におけるT-Aペアの1つからG-Cペアへの合理的な変異はsgRNA活性を増強することが示されており、このアプローチがPEgRNAについてもまた実現可能であろうということを示唆している195。加えて、P1の長さを増大させることは、sgRNAフォールディングを増強し、改善された活性に至るということもまた示されており195、それをPEgRNA活性の改善のための別の道として示唆している。コアの例の改善は: The core Cas9-bound PEgRNA backbone could conceivably be improved to enhance PE activity. Some such approaches have already been demonstrated. For example, the first pairing element (P1) of the scaffold contains a GTTTT-AAAAC (SEQ ID NO: 3939) pairing element. Such stretches of T have been shown to result in pol III disruption and premature termination of RNA transcripts. Rational mutation of one of the TA pairs to a GC pair in this part of P1 has been shown to enhance sgRNA activity, suggesting that this approach may also be feasible for PEgRNA. There are 195 . In addition, increasing the length of P1 has also been shown to enhance sgRNA folding and lead to improved activity, suggesting it as another avenue for improving PEgRNA activity. ing. Improvements to the core example:

P1まで6nt伸長を含有するPEgRNA
GGCCCAGACTGAGCACGTGAGTTTTAGAGCTAGCTCATGAAAATGAGCTAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGGACCGAGTCGGTCCTCTGCCATCAAAGCGTGCTCAGTCTGTTTTTTT(配列番号228)
PEgRNA containing a 6nt extension to P1
GGCCCAGACTGAGCACGTGAGTTTTAGAGCTAGCTCATGAAAATGAGCTAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGGACCGAGTCGGTCCTCTGCCATCAAAGCGTGCTCAGTCTGTTTTTTT (SEQ ID NO: 228)

P1内にT-A→G-C突然変異を含有するPEgRNA
GGCCCAGACTGAGCACGTGAGTTTGAGAGCTAGAAATAGCAAGTTTAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGGACCGAGTCGGTCCTCTGCCATCAAAGCGTGCTCAGTCTGTTTTTTT(配列番号229)
を包含し得る。
PEgRNA containing a TA→GC mutation in P1
GGCCCAGACTGAGCACGTGAGTTTGAGAGCTAGAAATAGCAAGTTTAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGGACCGAGTCGGTCCTCTGCCATCAAAGCGTGCTCAGTCTGTTTTTTT (SEQ ID NO: 229)
may be included.

種々の他の態様において、PEgRNAは編集鋳型領域の改変を導入することによって改善され得る。PEgRNAを鋳型とする挿入のサイズが増大すると、それは、エンドヌクレアーゼによって分解されるか、自発的加水分解を経過するか、またはRTによって逆転写される能力がないもしくはPEgRNA骨格のフォールディングおよび爾後のCas9-RT結合を遮断する二次構造へとフォールディングすることがより蓋然的である。従って、PEgRNAの鋳型の改変が、大きい挿入、例えば遺伝子丸ごとの挿入を成し遂げる(affect)ために必要であり得るということが蓋然的である。そうするためのいくつかの戦略は、合成または半合成PEgRNA上の修飾ヌクレオチドの組み込みを包含し、これらがRNAを分解もしくは加水分解に対してより耐性にするか、または阻害性の二次構造を採用することをより蓋然的でなくする196。かかる修飾は、Gリッチ配列のRNA二次構造を縮減するであろう8-アザ-7-デアザグアノシン;分解を縮減し、ある種の種類のRNA二次構造を増強するロック核酸(LNA);RNA安定性を増強する2'-O-メチル、2'-フルオロ、または2'-O-メトキシエトキシ修飾を包含し得る。かかる修飾は、安定性および活性を増強するためにPEgRNA上の他所にもまた包含され得る。代替的にはまたは加えて、それが所望のタンパク質産物をコードすることと、RTによってアンフォールディングされる能力がある単純な二次構造を採用することがより蓋然的でもまたあることと両方であるようにして、PEgRNAの鋳型がデザインされ得る。かかる単純な構造は熱力学的シンクとして作用し、逆転写を防止するであろうより複雑化した構造が生起することをより蓋然的でなくするであろう。最後に、鋳型を2つの別個のPEgRNAに分裂し得る。かかるデザインでは、転写を開始し、Cas9に融合されたRNA結合タンパク質またはMS2アプタマーなどのPEgRNAそれ自体の上のRNA認識エレメントによって別個の鋳型RNAを標的部位に動員するためにもまた、PEは用いられるであろう。RTは、直接的にこの別個の鋳型RNAに結合し得るか、または第2の鋳型へのスワッピング前に元々のPEgRNAから逆転写を開始し得るかどちらかである。かかるアプローチは、長い鋳型の追加によるPEgRNAのミスフォールディングを防止することによって、また、長い挿入が生起するために、ことによるとPEに基づく長い挿入を阻害し得るゲノムからのCas9の解離を要求しないことによって両方で、長い挿入を可能化し得る。 In various other embodiments, PEgRNA can be improved by introducing modifications of the editing template region. As the size of the PEgRNA-templated insert increases, it may be degraded by endonucleases, undergo spontaneous hydrolysis, or lack the ability to be reverse transcribed by RT or folding of the PEgRNA backbone and subsequent Cas9 -It is more likely that it folds into a secondary structure that blocks RT binding. Therefore, it is likely that modification of the PEgRNA template may be necessary to affect large insertions, such as insertions of entire genes. Some strategies to do so include the incorporation of modified nucleotides on synthetic or semi-synthetic PEgRNAs that make the RNA more resistant to degradation or hydrolysis, or that create inhibitory secondary structures. 196 . Such modifications would reduce RNA secondary structure in G-rich sequences such as 8-aza-7-deazaguanosine; locking nucleic acids (LNAs) that reduce degradation and enhance certain types of RNA secondary structure. ;2'-O-methyl, 2'-fluoro, or 2'-O-methoxyethoxy modifications that enhance RNA stability may be included. Such modifications may also be included elsewhere on PEgRNA to enhance stability and activity. Alternatively or additionally, it is both more likely to encode the desired protein product and adopt a simple secondary structure that is capable of being unfolded by RT. In this way, PEgRNA templates can be designed. Such a simple structure would act as a thermodynamic sink, making it less likely that more complex structures would occur that would prevent reverse transcription. Finally, the template can be split into two separate PEgRNAs. In such designs, PE is also used to initiate transcription and recruit a separate template RNA to the target site by an RNA recognition element on PEgRNA itself, such as an RNA binding protein fused to Cas9 or the MS2 aptamer. It will be done. RT can either bind directly to this separate template RNA or can initiate reverse transcription from the original PEgRNA before swapping to the second template. Such an approach prevents PEgRNA misfolding due to the addition of long templates, and also does not require dissociation of Cas9 from the genome, which could potentially inhibit PE-based long insertions, for long insertions to occur. Both may allow long insertions.

なお他の態様において、PEgRNAは、追加のRNAモチーフをPEgRNAの5'および3'末端に導入することによって改善され得る。いくつかのかかるモチーフ、例えばKSHVからのPAN ENEおよびMALAT1からのENEは、非pol IIIプロモーターからのより長いPEgRNAの発現を終結させるための可能な手段として上で論じられた。これらのエレメントはRNA三重らせんを形成し、これらはポリAテールを取り囲み、それらが核内に保持されることをもたらす184,187。しかしながら、末端ヌクレオチドを閉じ込めるPEgRNAの3'末端の複雑な構造を形成することによって、これらの構造は、蓋然的には、PEgRNAのエキソヌクレアーゼによって媒介される分解を防止することをもまた助けるであろう。 In yet other embodiments, PEgRNA can be improved by introducing additional RNA motifs to the 5' and 3' ends of PEgRNA. Several such motifs, such as PAN ENE from KSHV and ENE from MALAT1, were discussed above as possible means to terminate expression of longer PEgRNAs from non-pol III promoters. These elements form RNA triple helices that surround the polyA tails, resulting in their retention within the nucleus . However, by forming complex structures at the 3′ end of PEgRNA that trap the terminal nucleotides, these structures likely also help prevent exonuclease-mediated degradation of PEgRNA. Dew.

非pol IIIプロモーターからの終結を可能化することなしにであっても、3'末端に挿入される他の構造要素もまたRNA安定性を増強し得る。かかるモチーフは、3'末端を閉じ込めるであろうヘアピンもしくはRNA四重鎖197、または3'末端における2’-3'-環状リン酸の形成をもたらし、また、可能性としてはPEgRNAがエキソヌクレアーゼによって分解されることをより蓋然的でなくするであろうHDVなどの自己切断リボザイム198を包含し得る。不完全なスプライシングによってPEgRNAが環化することを誘導して、ciRNAを形成することもまた、PEgRNA安定性を増大させ得、PEgRNAが核内に保持されることをもたらし得る194 Other structural elements inserted at the 3' end may also enhance RNA stability, even without allowing termination from non-pol III promoters. Such a motif would result in the formation of a hairpin or RNA quadruplex 197 that would trap the 3' end, or a 2'-3'-cyclic phosphate at the 3' end, and potentially also allow PEgRNA to be catalyzed by an exonuclease. Self-cleaving ribozymes 198 such as HDV may be included, which would make them less likely to be degraded. Inducing PEgRNA to circularize through incomplete splicing to form ciRNA may also increase PEgRNA stability and result in PEgRNA being retained in the nucleus 194 .

追加のRNAモチーフもまた、DNA-RNA二重鎖に対するRT結合を増強することによって、RT処理能力を改善またはPEgRNA活性を増強し得る。その対応するレトロウイルスゲノム上のRTによって結合されるネイティブな配列の追加は、RT活性を増強し得る199。これは、ネイティブなプライマー結合部位(PBS)、ポリプリントラクト(PPT)、またはレトロウイルスゲノム二量体化および転写の開始に関わるキッシングループを包含し得る199 Additional RNA motifs may also improve RT processing capacity or enhance PEgRNA activity by enhancing RT binding to DNA-RNA duplexes. Addition of native sequences bound by RT on its corresponding retroviral genome can enhance RT activity 199 . This may include the native primer binding site (PBS), the polypurine tract (PPT), or the kissing loop involved in retroviral genome dimerization and initiation of transcription 199 .

PEgRNAの5'および3'末端におけるキッシングループまたはGNRAテトラループ/テトラループレセプターペア200などの二量体化モチーフの追加もまた、PEgRNAの有効な環状化をもたらし得、安定性を改善する。加えて、これらのモチーフの追加はPEgRNAスペーサーおよびプライマーの物理的分離を可能化し得、PE活性を妨げるであろうスペーサーの閉じ込めを防止する(prevention)ということが想定される。スペーサー領域における小さいトーホールドヘアピンを形成するPEgRNAの短い5'または3'伸長もまた、スペーサーに結合するPEgRNAのアニーリング領域に対して好ましく競合し得る。最後に、キッシングループもまた他の鋳型RNAをゲノム部位に動員するために用いられ得、1つのRNAから他へのRT活性のスワッピングを可能化し得る。例の改善は: Addition of dimerization motifs such as kissing loops or GNRA tetraloop/tetraloop receptor pair 200 at the 5′ and 3′ ends of PEgRNA may also result in effective circularization of PEgRNA, improving stability. In addition, it is envisioned that the addition of these motifs may enable physical separation of the PEgRNA spacer and primer, preventing entrapment of the spacer that would interfere with PE activity. Short 5' or 3' stretches of PEgRNA that form small toehold hairpins in the spacer region may also compete favorably for the annealing region of PEgRNA binding to the spacer. Finally, kissing loops can also be used to recruit other template RNAs to genomic sites, allowing swapping of RT activity from one RNA to another. Improvements to the example:

PEgRNA-HDV融合体
GGCCCAGACTGAGCACGTGAGTTTTAGAGCTAGAAATAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGGACCGAGTCGGTCCTCTGCCATCAAAGCGTGCTCAGTCTGGGCCGGCATGGTCCCAGCCTCCTCGCTGGCGCCGGCTGGGCAACATGCTTCGGCATGGCGAATGGGACTTTTTTT(配列番号230)
PEgRNA-HDV fusion
GGCCCAGACTGAGCACGTGAGTTTTAGAGCTAGAAATAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGGACCGAGTCGGTCCTCTGCCATCAAAGCGTGCTCAGTCTGGGCCGGCATGGTCCCAGCCTCCTCGCTGGCGCCGGCTGGGCAACATGCTTCGGCATGGCGAATGGGACTTTTTTT (SEQ ID NO: 230)

PEgRNA-MMLVキッシングループ
GGTGGGAGACGTCCCACCGGCCCAGACTGAGCACGTGAGTTTTAGAGCTAGAAATAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGGACCGAGTCGGTCCTCTGCCATCAAAGCTTCGACCGTGCTCAGTCTGGTGGGAGACGTCCCACCTTTTTTT(配列番号231)
PEgRNA-MMLV kissing loop
GGTGGGAGACGTCCCACCGGCCCAGACTGAGCACGTGAGTTTTAGAGCTAGAAATAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGGACCGAGTCGGTCCTCTGCCATCAAAGCTTCGACCGTGCTCAGTCTGGTGGGAGACGTCCCACCTTTTTT (SEQ ID NO: 231)

PEgRNA-VSリボザイムキッシングループ
GAGCAGCATGGCGTCGCTGCTCACGGCCCAGACTGAGCACGTGAGTTTTAGAGCTAGAAATAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGGACCGAGTCGGTCCTCTGCCATCAAAGCTTCGACCGTGCTCAGTCTCCATCAGTTGACACCCTGAGGTTTTTTT(配列番号232)
PEgRNA-VS ribozyme kissing loop
GAGCAGCATGGCGTCGCTGCTCACGGCCCAGACTGAGCACGTGAGTTTTAGAGCTAGAAATAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGGACCGAGTCGGTCCTCTGCCATCAAAGCTTCGACCGTGCTCAGTCTCCATCAGTTGACACCCTGAGGTTTTTTT (SEQ ID NO: 232)

PEgRNA-GNRAテトラループ/テトラループ受容体
GCAGACCTAAGTGGUGACATATGGTCTGGGCCCAGACTGAGCACGTGAGTTTTAGAGCTAUACGTAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTUACGAAGTGGGACCGAGTCGGTCCTCTGCCATCAAAGCTTCGACCGTGCTCAGTCTGCATGCGATTAGAAATAATCGCATGTTTTTTT(配列番号233)
PEgRNA-GNRA tetraloop/tetraloop receptor
GCAGACCTAAGTGGUGACATATGGTCTGGGCCCAGACTGAGCACGTGAGTTTTAGAGCTAUACGTAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTUACGAAGTGGGACCGAGTCGGTCCTCTGCCATCAAAGCTTCGACCGTGCTCAGTCTGCATGCGATTAGAAATAATCGCATGTTTTTTT (SEQ ID NO: 233)

2次RNA-HDV融合体を切り替えるPEgRNA鋳型
TCTGCCATCAAAGCTGCGACCGTGCTCAGTCTGGTGGGAGACGTCCCACCGGCCGGCATGGTCCCAGCCTCCTCGCTGGCGCCGGCTGGGCAACATGCTTCGGCATGGCGAATGGGACTTTTTTT(配列番号234)
を包含するが、これらに限定されない。
PEgRNA templates to switch secondary RNA-HDV fusions
TCTGCCATCAAAGCTGCGACCGTGCTCAGTCTGGTGGGAGACGTCCCACCGGCCGGCATGGTCCCAGCCTCCTCGCTGGCGCCGGCTGGGCAACATGCTTCGGCATGGCGAATGGGACTTTTTTT (SEQ ID NO: 234)
including but not limited to.

PEgRNA骨格は、どのようにしてSpCas9およびプライム編集因子(PE)が改善されたかに類縁の様式で、指向性進化によってさらに改善され得る。指向性進化はCas9または進化したCas9バリアントによるPEgRNA認識を増強し得る。加えて、異なるPEgRNA骨格配列が異なるゲノム座位においては最適であろうということが蓋然的であり、当の部位におけるPE活性を増強するか、オフターゲット活性を縮減するか、または両方かどちらかである。最後に、他のRNAモチーフが追加されたPEgRNA骨格の進化は、ほとんど確実に、未進化の融合RNAに対して相対的に融合PEgRNAの活性を改善するであろう。例えば、c-ジ-GMP-Iアプタマーおよびハンマーヘッドリボザイムから成るアロステリックリボザイムの進化は劇的に改善された活性に至り202、進化がハンマーヘッド-PEgRNA融合体の活性も改善するであろうということを示唆した。加えて、Cas9は現行では一般的にsgRNAの5'伸長を忍容しないが、指向性進化は、蓋然的には、この非忍容性を和らげる有能な変異を生成し、追加のRNAモチーフが利用されることを許すであろう。 PEgRNA scaffolds can be further improved by directed evolution in a manner analogous to how SpCas9 and prime editing elements (PEs) have been improved. Directed evolution can enhance PEgRNA recognition by Cas9 or evolved Cas9 variants. In addition, it is likely that different PEgRNA backbone sequences will be optimal at different genomic loci, either enhancing PE activity at the site, reducing off-target activity, or both. be. Finally, evolution of the PEgRNA backbone with the addition of other RNA motifs will almost certainly improve the activity of the fused PEgRNA relative to the unevolved fusion RNA. For example, evolution of allosteric ribozymes consisting of c-di-GMP-I aptamers and hammerhead ribozymes has led to dramatically improved activity202, suggesting that evolution will also improve the activity of hammerhead-PEgRNA fusions. suggested. In addition, although Cas9 currently does not generally tolerate 5' extensions of sgRNAs, directed evolution could conceivably generate potent mutations that alleviate this intolerance, creating additional RNA motifs. will be allowed to be used.

本開示は、ここで開示されるプライム編集システムの効力をさらに改善するためのいずれかのかかるやり方を企図する。 This disclosure contemplates any such approach to further improve the effectiveness of the prime editing system disclosed herein.

O.拡張された標的化範囲を有するプライム編集の使用
Streptococcus pyogenes Cas9(SpCas9)を用いるプライム編集(PE)は、SpCas9が効率的に結合し得る好適に置かれたNGGプロトスペーサー隣接モチーフ(PAM)があるゲノム座位において、全ての1塩基置換、挿入、欠失、およびそれらの組み合わせを効率的に組み入れ組み入れ得る。しかしながら、別の側面において、本明細書に記載の方法は、アクセス可能なPAM、よって効率的なPEのためのアクセス可能な標的化可能なゲノム座位を拡張することによって、PEの標的化能力を幅広くする。SpCas9以外のRNAによってガイドされるDNA結合タンパク質を用いるプライム編集因子は、異なるPAMへのアクセスを許すことによってゲノム座位の拡張された標的化可能な範囲を可能化する。加えて、SpCas9よりも小さいRNAによってガイドされるDNA結合タンパク質の使用は、より効率的なウイルス送達をもまた許す。SpCas9以外のCasタンパク質または他のRNAによってガイドされるDNA結合タンパク質によるPEは、SpCas9に基づくPEを用いてはアクセス不可能または非効率的どちらかであった高効率の治療学的編集を許すであろう。
O. Using prime editing with expanded targeting scope
Prime editing (PE) using Streptococcus pyogenes Cas9 (SpCas9) removes all single base substitutions, insertions, and Deletions, and combinations thereof, can be efficiently incorporated and incorporated. However, in another aspect, the methods described herein enhance the targeting ability of PE by expanding the accessible PAM and thus the accessible targetable genomic loci for efficient PE. Make it broader. Prime editing factors using DNA-binding proteins guided by RNAs other than SpCas9 enable an expanded targetable range of genomic loci by allowing access to different PAMs. In addition, the use of smaller RNA-guided DNA binding proteins than SpCas9 also allows more efficient virus delivery. PE by DNA binding proteins guided by Cas proteins or other RNAs other than SpCas9 may not allow highly efficient therapeutic editing that was either inaccessible or inefficient using SpCas9-based PE. Probably.

これは、NGG PAMに対して相対的な編集の非理想的な間隔を原因として、SpCas9に基づくPEが非効率的であるか、またはSpCas9に基づく構築物の総体的なサイズが細胞発現および/もしくは送達にとって法外であるかどちらかの状況に用いられることが予想される。SpCas9の少数のかつ不良に位置付けられたNGG PAMを標的領域の近くに有するハンチンチン遺伝子などの特定の疾患に該当する(relevent)座位は、NGA PAMを認識するSpCas9-VRQRなどのPEシステムの異なるCasタンパク質を用いて容易に標的化され得る。より効率的にAAVベクターにパッケージングされ得るより小さいPE構築物を生成するために、より小さいCasタンパク質が用いられ、標的組織へのより良好な送達を可能化するであろう。図61は、RNAによってガイドされるDNA結合タンパク質としてStaphylococcus aureus CRISPR-Casを用いるプライム編集の実施化を示す。NTは無処置の対照である。 This may be due to the inefficiency of SpCas9-based PE due to non-ideal spacing of edits relative to the NGG PAM, or the overall size of SpCas9-based constructs may affect cellular expression and/or It is anticipated that it will be used in situations where delivery is either prohibitive. Certain disease-relevant loci, such as the huntingtin gene, which has a small number and poorly positioned NGG PAM of SpCas9 near its target region, are distinct from PE systems such as SpCas9-VRQR, which recognizes the NGA PAM. Can be easily targeted using Cas proteins. Smaller Cas proteins will be used to generate smaller PE constructs that can be more efficiently packaged into AAV vectors, allowing better delivery to target tissues. Figure 61 shows the implementation of prime editing using Staphylococcus aureus CRISPR-Cas as an RNA-guided DNA binding protein. NT is the untreated control.

図62A~62Bは、プライム編集による精密な位置付けにおける所望の編集の効率的な組み入れのためのプロトスペーサーの重要性の実証を提供する。これは、このテクノロジーの新規の特色としての代替的なPAMおよびプロトスペーサーの重要性を強調する。図62Aの「n.d.」は「検出されない」である。 Figures 62A-62B provide demonstration of the importance of protospacers for efficient incorporation of desired edits in precise positioning by prime editing. This highlights the importance of alternative PAM and protospacers as novel features of this technology. "n.d." in FIG. 62A is "not detected."

図63は、プライム編集因子システムのRNAによってガイドされるDNA結合タンパク質としてSpCas9(H840A)-VRQRおよびSpCas9(H840A)-VRERを用いるPEの実施化を示す。SpCas9(H840A)-VRQR napDNAbpは配列番号87として本明細書に開示の。SpCas9(H840A)-VRER napDNAbpは配列番号88として本明細書に開示の。SpCas9(H840A)-VRER-MMLV RT融合タンパク質は配列番号516として本願において開示され、MMLV RTはD200N、L603W、T330P、T306K、およびW313F置換を野生型MMLV RTに対して相対的に含む。SpCas9(H840A)-VRQR-MMLV RT融合タンパク質は配列番号515として本願において開示され、MMLV RTはD200N、L603W、T330P、T306K、およびW313F置換を野生型MMLV RTに対して相対的に含む。ヒトゲノム上の7つの異なる座位が標的化される:4つはSpCas9(H840A)-VRQR-MMLV RTプライム編集因子システムにより、3つはSpCas9(H840A)-VRER-MMLV RTシステムによる。試験された構築物のアミノ酸配列は次のとおりである:

Figure 2020191234000269
Figure 2020191234000270
Figure 2020191234000271
Figure 2020191234000272
Figure 63 shows the implementation of PE using SpCas9(H840A)-VRQR and SpCas9(H840A)-VRER as RNA-guided DNA binding proteins of the prime editing factor system. SpCas9(H840A)-VRQR napDNAbp is disclosed herein as SEQ ID NO:87. SpCas9(H840A)-VRER napDNAbp is disclosed herein as SEQ ID NO:88. The SpCas9(H840A)-VRER-MMLV RT fusion protein is disclosed herein as SEQ ID NO: 516, and the MMLV RT contains D200N, L603W, T330P, T306K, and W313F substitutions relative to wild-type MMLV RT. The SpCas9(H840A)-VRQR-MMLV RT fusion protein is disclosed herein as SEQ ID NO: 515, and the MMLV RT contains D200N, L603W, T330P, T306K, and W313F substitutions relative to wild-type MMLV RT. Seven different loci on the human genome are targeted: four by the SpCas9(H840A)-VRQR-MMLV RT prime editor system and three by the SpCas9(H840A)-VRER-MMLV RT system. The amino acid sequence of the tested construct is as follows:
Figure 2020191234000269
Figure 2020191234000270
Figure 2020191234000271
Figure 2020191234000272

図63に示されているとおり、SpCas9(H840A)-VRQR-MMLV RTは「AGAG」および「GGAG」を包含するPAM部位において作動性であり、いくらかの編集活性を「GGAT」および「AGAT」PAM配列において有した。SpCas9(H840A)-VRER-MMLV RTは「AGCG」および「GGCG」を包含するPAM部位において作動性であり、いくらかの編集活性を「TGCG」において有した。 As shown in Figure 63, SpCas9(H840A)-VRQR-MMLV RT was active at PAM sites including "AGAG" and "GGAG" and had some editing activity at "GGAT" and "AGAT" PAM sequences. SpCas9(H840A)-VRER-MMLV RT was active at PAM sites including "AGCG" and "GGCG" and had some editing activity at "TGCG".

データは、プライム編集が、異なるPAM特異性を持つnapDNAbp、例えば本明細書に記載のCas9バリアントを用いて行われ得るということを実証している。 The data demonstrate that prime editing can be performed using napDNAbp with different PAM specificities, such as the Cas9 variants described herein.

種々の態様において、変改されたPAM特異性を有するnapDNAbp(例えばCas9)は、その3'端に5'-NAA-3'PAM配列を含む標的配列に対して活性を発揮する変異の組み合わせを含む。いくつかの態様では、変異の組み合わせは、表1の列記されているクローンのいずれか1つに存在する。いくつかの態様では、変異の組み合わせは、表1の列記されているクローンの保存的変異である。いくつかの態様では、Cas9タンパク質は、表1に列記されるCas9クローンのいずれか1つの変異の組み合わせを含む。 In various embodiments, napDNAbp with modified PAM specificity (e.g., Cas9) carries a combination of mutations at its 3' end that is active against a target sequence containing a 5'-NAA-3' PAM sequence. include. In some embodiments, the combination of mutations is present in any one of the clones listed in Table 1. In some embodiments, the combination of mutations are conservative mutations of the listed clones of Table 1. In some embodiments, the Cas9 protein comprises a combination of mutations in any one of the Cas9 clones listed in Table 1.

表1:NAA PAMクローン

Figure 2020191234000273
Figure 2020191234000274
Table 1: NAA PAM clones
Figure 2020191234000273
Figure 2020191234000274

いくつかの態様では、Cas9タンパク質は、表1のバリアントのいずれか1つによって提供されるCas9タンパク質のアミノ酸配列と少なくとも80%同一であるアミノ酸配列を含む。いくつかの態様では、Cas9タンパク質は、表1のバリアントのいずれか1つによって提供されるCas9タンパク質のアミノ酸配列と少なくとも85%、少なくとも90%、少なくとも92%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも99.5%同一であるアミノ酸配列を含む。 In some embodiments, the Cas9 protein comprises an amino acid sequence that is at least 80% identical to the amino acid sequence of the Cas9 protein provided by any one of the variants in Table 1. In some embodiments, the Cas9 protein has at least 85%, at least 90%, at least 92%, at least 95%, at least 96%, at least the amino acid sequence of a Cas9 protein provided by any one of the variants in Table 1. Comprising amino acid sequences that are 97%, at least 98%, at least 99%, or at least 99.5% identical.

いくつかの態様では、Cas9タンパク質は、配列番号18によって提供されるStreptococcus pyogenes Cas9と比較して、その3'端に標準的なPAM(5'-NGG-3')を含まない標的配列に対する増大した活性を発揮する。いくつかの態様では、Cas9タンパク質は、同じ標的配列に対する配列番号18によって提供されるStreptococcus pyogenes Cas9の活性と比較して、少なくとも5倍増大した標準的なPAM配列(5'-NGG-3')に直接的に隣接しない3'端を有する標的配列に対する活性を発揮する。いくつかの態様では、Cas9タンパク質は、同じ標的配列に対する配列番号18によって提供されるStreptococcus pyogenesの活性と比較して、少なくとも10倍、少なくとも50倍、少なくとも100倍、少なくとも500倍、少なくとも1,000倍、少なくとも5,000倍、少なくとも10,000倍、少なくとも50,000倍、少なくとも100,000倍、少なくとも500,000倍、または少なくとも1,000,000倍増大した標準的なPAM配列(5'-NGG-3')に直接的に隣接しない標的配列に対する活性を発揮する。いくつかの態様では、標的配列の3'端はAAA、GAA、CAA、またはTAA配列に直接的に隣接する。いくつかの態様では、Cas9タンパク質は、その3'端に5'-NAC-3'PAM配列を含む標的配列に対する活性を発揮する変異の組み合わせを含む。いくつかの態様では、変異の組み合わせは、表2の列記されているクローンのいずれか1つに存在する。いくつかの態様では、変異の組み合わせは表2の列記されているクローンの保存的変異である。いくつかの態様では、Cas9タンパク質は、表2に列記されるCas9クローンのいずれか1つの変異の組み合わせを含む。 In some embodiments, the Cas9 protein has an increased target sequence that does not contain a canonical PAM (5'-NGG-3') at its 3' end compared to Streptococcus pyogenes Cas9 provided by SEQ ID NO: 18. Demonstrates a certain level of activity. In some embodiments, the Cas9 protein has a canonical PAM sequence (5'-NGG-3') that is at least 5-fold increased compared to the activity of Streptococcus pyogenes Cas9 provided by SEQ ID NO: 18 against the same target sequence. It exerts activity against target sequences with a 3' end that is not directly adjacent to the target sequence. In some embodiments, the Cas9 protein has at least 10-fold, at least 50-fold, at least 100-fold, at least 500-fold, at least 1,000-fold, as compared to the activity of Streptococcus pyogenes provided by SEQ ID NO: 18 against the same target sequence. At least 5,000-fold, at least 10,000-fold, at least 50,000-fold, at least 100,000-fold, at least 500,000-fold, or at least 1,000,000-fold increased activity against target sequences that are not directly adjacent to the canonical PAM sequence (5'-NGG-3') demonstrate. In some embodiments, the 3' end of the target sequence is directly adjacent to an AAA, GAA, CAA, or TAA sequence. In some embodiments, the Cas9 protein comprises a combination of mutations that exert activity against a target sequence that includes a 5'-NAC-3'PAM sequence at its 3' end. In some embodiments, the combination of mutations is present in any one of the clones listed in Table 2. In some embodiments, the combination of mutations are conservative mutations of the listed clones of Table 2. In some embodiments, the Cas9 protein comprises a combination of mutations in any one of the Cas9 clones listed in Table 2.

表2:NAC PAMクローン

Figure 2020191234000275
Figure 2020191234000276
Figure 2020191234000277
Table 2: NAC PAM clones
Figure 2020191234000275
Figure 2020191234000276
Figure 2020191234000277

いくつかの態様では、Cas9タンパク質は、表2のバリアントのいずれか1つによって提供されるCas9タンパク質のアミノ酸配列と少なくとも80%同一であるアミノ酸配列を含む。いくつかの態様では、Cas9タンパク質は、表2のバリアントのいずれか1つによって提供されるCas9タンパク質のアミノ酸配列と少なくとも85%、少なくとも90%、少なくとも92%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも99.5%同一であるアミノ酸配列を含む。 In some embodiments, the Cas9 protein comprises an amino acid sequence that is at least 80% identical to the amino acid sequence of a Cas9 protein provided by any one of the variants in Table 2. In some embodiments, the Cas9 protein comprises an amino acid sequence that is at least 85%, at least 90%, at least 92%, at least 95%, at least 96%, at least 97%, at least 98%, at least 99%, or at least 99.5% identical to the amino acid sequence of a Cas9 protein provided by any one of the variants in Table 2.

いくつかの態様では、Cas9タンパク質は、配列番号18によって提供されるStreptococcus pyogenes Cas9と比較して、その3'端に標準的なPAM(5'-NGG-3')を含まない標的配列に対する増大した活性を発揮する。いくつかの態様では、Cas9タンパク質は、同じ標的配列に対する配列番号18によって提供されるStreptococcus pyogenes Cas9の活性と比較して、少なくとも5倍増大した標準的なPAM配列(5'-NGG-3')に直接的に隣接しない3'端を有する標的配列に対する活性を発揮する。いくつかの態様では、Cas9タンパク質は、同じ標的配列に対する配列番号18によって提供されるStreptococcus pyogenesの活性と比較して、少なくとも10倍、少なくとも50倍、少なくとも100倍、少なくとも500倍、少なくとも1,000倍、少なくとも5,000倍、少なくとも10,000倍、少なくとも50,000倍、少なくとも100,000倍、少なくとも500,000倍、または少なくとも1,000,000倍増大した、標準的なPAM配列(5'-NGG-3')に直接的に隣接しない標的配列に対する活性を発揮する。いくつかの態様では、標的配列の3'端はAAC、GAC、CAC、またはTAC配列に直接的に隣接する。 In some embodiments, the Cas9 protein has an increased target sequence that does not contain a canonical PAM (5'-NGG-3') at its 3' end compared to Streptococcus pyogenes Cas9 provided by SEQ ID NO: 18. Demonstrates a certain level of activity. In some embodiments, the Cas9 protein has a canonical PAM sequence (5'-NGG-3') that is at least 5-fold increased compared to the activity of Streptococcus pyogenes Cas9 provided by SEQ ID NO: 18 against the same target sequence. It exerts activity against target sequences with a 3' end that is not directly adjacent to the target sequence. In some embodiments, the Cas9 protein has at least 10-fold, at least 50-fold, at least 100-fold, at least 500-fold, at least 1,000-fold, as compared to the activity of Streptococcus pyogenes provided by SEQ ID NO: 18 against the same target sequence. to a target sequence that is not directly adjacent to a canonical PAM sequence (5'-NGG-3') that is increased at least 5,000-fold, at least 10,000-fold, at least 50,000-fold, at least 100,000-fold, at least 500,000-fold, or at least 1,000,000-fold Demonstrate activity. In some embodiments, the 3' end of the target sequence is directly adjacent to an AAC, GAC, CAC, or TAC sequence.

いくつかの態様では、Cas9タンパク質は、その3'端に5'-NAT-3'PAM配列を含む標的配列に対する活性を発揮する変異の組み合わせを含む。いくつかの態様では、変異の組み合わせは表3の列記されているクローンのいずれか1つに存在する。いくつかの態様では、変異の組み合わせは表3の列記されているクローンの保存的変異である。いくつかの態様では、Cas9タンパク質は、表3に列記されるCas9クローンのいずれか1つの変異の組み合わせを含む。 In some embodiments, the Cas9 protein contains a combination of mutations that exert activity against a target sequence that includes a 5'-NAT-3'PAM sequence at its 3' end. In some embodiments, the combination of mutations is present in any one of the clones listed in Table 3. In some embodiments, the combination of mutations are conservative mutations of the listed clones of Table 3. In some embodiments, the Cas9 protein comprises a combination of mutations in any one of the Cas9 clones listed in Table 3.

表3:NAT PAMクローン

Figure 2020191234000278
Table 3: NAT PAM clone
Figure 2020191234000278

標準的なSpCas9と比較して差次的なPAM特異性を呈示する上のCas9バリアントのいずれかは、本明細書に開示のプライム編集因子に用いられ得る。 Any of the above Cas9 variants that exhibit differential PAM specificity compared to standard SpCas9 can be used in the prime editors disclosed herein.

P.リコンビナーゼ標的部位を挿入するためのプライム編集の使用
別の側面において、プライム編集は、リコンビナーゼ部位(または「リコンビナーゼ認識配列」)を所望のゲノム部位に挿入するために用いられ得る。リコンビナーゼ部位の挿入は、部位特異的な遺伝子変化をゲノムに成し遂げるためのプログラムされた位置付けを提供する。かかる遺伝子変化は、他の遺伝子変化の中でも、例えばプラスミドのゲノム取り入れ、ゲノム欠失または挿入、染色体転座、およびカセット交換を包含し得る。遺伝子変化のこれらの例示の型は図64B~64Fにおいて例解されている。それから、組み入れされたリコンビナーゼ認識配列は、その部位における部位特異的な組み換えを行うために用いられて、種々の組み換えアウトカム、例えば切除、取り入れ、逆位、またはDNAフラグメントの交換を成就し得る。例えば、図65はリコンビナーゼ部位の組み入れを例解し、これはそれからGFP発現マーカーを含むDNAドナー鋳型を取り入れするために用いられ得る。リコンビナーゼ部位に取り入れされたGFP発現システムを含有する細胞は、蛍光発光するであろう。
P. Use of prime editing to insert recombinase target sites
In another aspect, prime editing can be used to insert a recombinase site (or "recombinase recognition sequence") at a desired genomic site. Insertion of recombinase sites provides programmed positioning for accomplishing site-specific genetic changes in the genome. Such genetic changes can include, for example, plasmid genomic integration, genomic deletions or insertions, chromosomal translocations, and cassette exchanges, among other genetic changes. These exemplary types of genetic changes are illustrated in Figures 64B -64F . The incorporated recombinase recognition sequences can then be used to perform site-specific recombination at that site to achieve various recombination outcomes, such as excision, incorporation, inversion, or exchange of DNA fragments. For example, Figure 65 illustrates the incorporation of a recombinase site, which can then be used to incorporate a DNA donor template containing a GFP expression marker. Cells containing the GFP expression system incorporated into the recombinase site will fluoresce.

リコンビナーゼ部位をゲノムに組み入れる機序は、ペプチド/タンパク質およびRNAタグなどの他の配列をゲノムに組み入れることに類縁である。リコンビナーゼ標的配列の組み入れを例示する模式図が図64Aに示されている。プロセスは、リコンビナーゼ標的配列が導入されるであろう所望の標的座位を選択することによって始まる。次に、プライム編集因子融合体が提供される(「RT-Cas9:gRNA」)。ここで、「gRNA」はPEgRNAを言い、これは本明細書に記載の原理を用いてデザインされ得る。PEgRNAは種々の態様において図3Dに対応するアーキテクチャを含むであろう(5'-[~20ntスペーサー]-[gRNAコア]-[伸長アーム]-3'であって、伸長アームは3'から5'の方向にプライマー結合部位(「A」)、編集鋳型(「B」)、および相同アーム(「C」)を含む。編集鋳型(「B」)は、リコンビナーゼ部位に対応する配列、すなわち、リコンビナーゼ部位のセンスまたはアンチセンス鎖どちらかでありかつプライム編集プロセスによってゲノムDNA標的座位に組み込まれる相補的な一本鎖DNAをコードするPEgRNAの一本鎖RNAを含むであろう。 The mechanism for incorporating recombinase sites into the genome is analogous to incorporating other sequences into the genome, such as peptide/protein and RNA tags. A schematic diagram illustrating the incorporation of recombinase target sequences is shown in Figure 64A . The process begins by selecting the desired target locus into which the recombinase target sequence will be introduced. A prime editing factor fusion is then provided ("RT-Cas9:gRNA"). Here, "gRNA" refers to PEgRNA, which can be designed using the principles described herein. The PEgRNA will in various embodiments contain an architecture corresponding to Figure 3D (5'-[~20nt spacer]-[gRNA core]-[extended arm]-3', with the extended arm varying from 3' to 5'). ' orientation includes a primer binding site ('A'), an editing template ('B'), and a homology arm ('C'). The editing template ('B') contains a sequence corresponding to the recombinase site, i.e. It will contain single-stranded RNA of PEgRNA that is either the sense or antisense strand of the recombinase site and encodes complementary single-stranded DNA that is incorporated into the genomic DNA target locus by the prime editing process.

種々の側面では、本開示は、ヒトまたは他のゲノム上の高価値の座位にリコンビナーゼ認識配列を導入するためのPEの使用を可能にする。これらは、部位特異的なリコンビナーゼ(単数または複数)に対する暴露後に、精密なかつ効率的なゲノム改変を導くであろう(図64)。図64に示されている(show)種々の態様では、PEは、(b)DNAドナー鋳型のゲノム取り入れの部位としての使用のための単一のSSR標的を挿入するために用いられ得る。(c)は、どのようにしてSSR標的部位のタンデム挿入がゲノムのある部分を欠失させるために用いられ得るかを示す。(d)は、どのようにしてSSR標的部位のタンデム挿入がゲノムのある部分を逆位させるために用いられ得るかを示す。(e)は、どのようにして2つの遠位の染色体領域における2つのSSR標的部位の挿入が染色体転座をもたらし得るかを示す。(f)は、どのようにしてゲノム上の2つの異なるSSR標的部位の挿入がDNAドナー鋳型からのカセットを交換するために用いられ得るかを示す。ゲノム改変の型の夫々は、SSR標的を挿入するためにPEを用いることによって想定されるが、このリストもまた限定することを意味されない。 In various aspects, the present disclosure enables the use of PE to introduce recombinase recognition sequences at high-value loci on human or other genomes. These will lead to precise and efficient genome modification after exposure to site-specific recombinase(s) (Figure 64). In various embodiments shown in Figure 64, PE can be used to insert (b) a single SSR target for use as a site of genomic incorporation of a DNA donor template. (c) shows how tandem insertion of SSR target sites can be used to delete a portion of a genome. (d) shows how tandem insertion of SSR target sites can be used to invert a portion of a genome. (e) shows how insertion of two SSR target sites in two distal chromosomal regions can result in a chromosomal translocation. (f) shows how insertion of two different SSR target sites on a genome can be used to exchange a cassette from a DNA donor template. Each of the types of genome modifications envisioned by using PE to insert SSR targets, but this list is also not meant to be limiting.

リコンビナーゼ認識配列のPEによって媒介される導入は、大スケールのゲノム欠陥、例えば遺伝子喪失、逆位、もしくは重複、または染色体転座によって引き起こされる遺伝子疾患の処置にとって特に有用であり得る1~7(表6)。例えば、ウィリアムズ・ボイレン症候群は染色体7上の24の欠失によって引き起こされる発達障害である21。現行では、生細胞における複数の遺伝子全体の効率的なかつ標的化された挿入のためのテクノロジーは存在しない(かかる全長遺伝子挿入をするPEのポテンシャルは現行では調査されているが、まだ確立されていない);しかしながら、PEによって挿入される標的におけるリコンビナーゼによって媒介される取り入れは、このおよび他の疾患の永久的な治癒への1つのアプローチをオファーする。加えて、リコンビナーゼ認識配列の標的化された導入は、トランスジェニック植物、動物研究モデル、バイオプロダクション細胞株、または他のカスタム真核細胞株の生成を包含する適用にとって高度に有能であり得る。例えば、PE特異的な標的におけるトランスジェニック植物のリコンビナーゼによって媒介されるゲノム再構成は、改善された特性を有する農作物を生成することのボトルネックの1つを克服し得る8,9 PE-mediated introduction of recombinase recognition sequences may be particularly useful for the treatment of genetic diseases caused by large-scale genomic defects, such as gene losses, inversions, or duplications, or chromosomal translocations1-7 (Tables 1-7). 6). For example, Williams-Beuren syndrome is a developmental disorder caused by a 24 deletion on chromosome 721. Currently, no technology exists for efficient and targeted insertion of multiple entire genes in living cells (the potential of PE for such full-length gene insertions is currently being investigated but not yet established). ); However, recombinase-mediated uptake at targets inserted by PE offers one approach to permanent cure of this and other diseases. In addition, targeted introduction of recombinase recognition sequences can be highly capable for applications including the generation of transgenic plants, animal research models, bioproduction cell lines, or other custom eukaryotic cell lines. For example, recombinase-mediated genome rearrangement of transgenic plants in PE-specific targets may overcome one of the bottlenecks in generating agricultural crops with improved properties.

表6.リコンビナーゼ認識配列のPEに基づく組み入れによって修復され得る大スケールゲノム改変にリンクした遺伝子疾患の例。

Figure 2020191234000279
Table 6. Examples of genetic diseases linked to large-scale genome modifications that can be repaired by PE-based incorporation of recombinase recognition sequences.
Figure 2020191234000279

いくつものSSRファミリーメンバーが特徴付けられ、それらのリコンビナーゼ認識配列が記載されており、天然のおよび操作されたチロシンリコンビナーゼ(表7)、ラージセリンインテグラーゼ(表8)、セリンリゾルバーゼ(表9)、およびチロシンインテグラーゼ(表10)を包含する。増強されたゲノム取り入れ率を実証する改変された標的配列もまたいくつかのSSRについて記載されている22-30。天然のリコンビナーゼに加えて、別物の特異性を有するプログラム可能なリコンビナーゼが開発されている31~40。所望の適用に依存して、PEを用いて、これらの認識配列の1つ以上が、規定された位置付け、例えばセーフハーバー座位においてゲノム上に導入され得る41~43 Several SSR family members have been characterized and their recombinase recognition sequences have been described, including natural and engineered tyrosine recombinases (Table 7), large serine integrases (Table 8), and serine resolvases (Table 9). , and tyrosine integrase (Table 10). Modified target sequences demonstrating enhanced genomic uptake rates have also been described for several SSRs22-30 . In addition to natural recombinases, programmable recombinases with distinct specificities have been developed 31-40 . Depending on the desired application, using PE one or more of these recognition sequences can be introduced onto the genome at defined positions, such as safe harbor loci 41 - 43 .

例えば、プライム編集によるゲノム上の単一のリコンビナーゼ認識配列の導入は、DNAドナー鋳型との取り入れ的な組み換えをもたらすであろう(図64b)。ヒト細胞においてロバストに作動するセリンインテグラーゼは、遺伝子取り入れに特に良く適し得る44,45 For example, introduction of a single recombinase recognition sequence on the genome by prime editing will result in integral recombination with the DNA donor template (Figure 64b). Serine integrases that operate robustly in human cells may be particularly well suited for gene transfer44,45 .

加えて、標的のアイデンティティーおよび向きに依存して、2つのリコンビナーゼ認識配列の導入は介在配列の欠失、介在配列の逆位、染色体転座、またはカセット交換をもたらし得る(図64C~64F)。すでにリコンビナーゼ標的に密に似ている内生配列を選ぶことによって、完全なリコンビナーゼ標的を導入するために要求される編集の範囲は縮減されるであろう。 In addition, depending on the identity and orientation of the targets, introduction of two recombinase recognition sequences can result in an intervening sequence deletion, an intervening sequence inversion, a chromosomal translocation, or a cassette exchange (Figures 64C -64F ). By choosing an endogenous sequence that already closely resembles a recombinase target, the extent of editing required to introduce a perfect recombinase target will be reduced.

最後に、いくつかのリコンビナーゼは、ネイティブに生起する偽部位(pseudosite)においてヒトまたは真核ゲノムに取り入れすることが実証されている46~64。PE編集は、これらの天然の偽部位における取り入れ率を増強するために、または代替的には欲されないオフターゲット配列としての用をなし得る偽部位を消去するために、これらの座位を改変するために用いられ得る。 Finally, some recombinases have been demonstrated to integrate into human or eukaryotic genomes at natively occurring pseudosites46-64 . PE editing alters these loci to enhance incorporation rates at these natural pseudosites, or alternatively to eliminate pseudosites that can serve as unwanted off-target sequences. It can be used for.

本開示は、PEを用いて真核ゲノム上にリコンビナーゼ標的配列を導入するための一般的な方法論を記載する。これの適用は無限に近い。ゲノム編集反応はCRISPR/Cas9タンパク質と逆転写酵素ドメインとのキメラ融合体の「プライム編集因子」による使用を意図され、これはカスタムのプライム編集ガイドRNA(PEgRNA)を利用する。さらに伸長して、Cas9ツールおよび相同組み換え修復(HDR)経路は、いくつかの技術を用いてインデル率を低下させることによって、DNA鋳型からリコンビナーゼ認識配列を導入するためにもまた有効利用され得る65~67。ヒト細胞培養における概念実証実験が図65に示されている。 This disclosure describes a general methodology for introducing recombinase target sequences onto eukaryotic genomes using PE. The applications of this are nearly endless. The genome editing reaction is intended for use with a "prime editing factor", a chimeric fusion of a CRISPR/Cas9 protein and a reverse transcriptase domain, which utilizes a custom prime editing guide RNA (PEgRNA). By further extension, the Cas9 tool and homologous recombination repair (HDR) pathway can also be exploited to introduce recombinase recognition sequences from DNA templates by reducing the indel rate using several techniques. ~67 . A proof-of-concept experiment in human cell culture is shown in Figure 65.

次のいくつかの表は、リコンビナーゼ認識配列のPEによって導かれる組み入れに関して上の記載に引用され、用いられ得る例示のリコンビナーゼとPEによって組み入れられ得るそれらの対応するリコンビナーゼ認識配列とのリストを提供する。
表7.チロシンリコンビナーゼおよびSSR標的配列。

Figure 2020191234000280
Figure 2020191234000281
表8.ラージセリンインテグラーゼおよびSSR標的配列。
Figure 2020191234000282
Figure 2020191234000283
Figure 2020191234000284
表9.セリンリゾルバーゼおよびSSR標的配列。
Figure 2020191234000285
Figure 2020191234000286
表10.チロシンインテグラーゼおよび標的配列。
Figure 2020191234000287
Figure 2020191234000288
The following several tables are cited above with respect to PE-guided incorporation of recombinase recognition sequences and provide a list of exemplary recombinases that may be used and their corresponding recombinase recognition sequences that may be incorporated by PE. .
Table 7. Tyrosine recombinase and SSR target sequences.
Figure 2020191234000280
Figure 2020191234000281
Table 8. Large serine integrase and SSR target sequences.
Figure 2020191234000282
Figure 2020191234000283
Figure 2020191234000284
Table 9. Serine resolvase and SSR target sequences.
Figure 2020191234000285
Figure 2020191234000286
Table 10. Tyrosine integrase and target sequences.
Figure 2020191234000287
Figure 2020191234000288

種々の他の側面では、本開示は、1つ以上のリコンビナーゼ認識配列を組み入れるためにPEを用いる方法と、部位特異的な組み換えへのそれらの使用とに関する。 In various other aspects, the disclosure relates to methods of using PE to incorporate one or more recombinase recognition sequences and their use for site-specific recombination.

いくつかの態様では、部位特異的な組み換えは、種々の組み換えアウトカム、例えば切除、取り入れ、逆位、またはDNAフラグメントの交換を成就させ得る。 In some embodiments, site-specific recombination can accomplish various recombination outcomes, such as excision, incorporation, inversion, or exchange of DNA fragments.

いくつかの態様では、方法は、2つ以上の核酸(例えばDNA)分子の2つ以上の領域のまたはそれらの間の組み換えを誘導することにとって有用である。他の態様において、方法は、単一の核酸分子(例えばDNA)の2つ以上の領域のまたはそれらの間の組み換えを誘導することにとって有用である。 In some embodiments, the methods are useful for inducing recombination of or between two or more regions of two or more nucleic acid (eg, DNA) molecules. In other embodiments, the methods are useful for inducing recombination of or between two or more regions of a single nucleic acid molecule (eg, DNA).

いくつかの態様では、本開示は、部位特異的な組み換えによってドナーDNA鋳型を取り入れするための方法を提供し:(a)プライム編集によってゲノム座位にリコンビナーゼ認識配列を組み入れること;(b)リコンビナーゼの存在下において、リコンビナーゼ認識配列をもまた含むDNAドナー鋳型とゲノム座位を接触させることを含む。 In some embodiments, the present disclosure provides methods for incorporating a donor DNA template by site-specific recombination: (a) incorporating a recombinase recognition sequence into a genomic locus by prime editing; (b) incorporating a recombinase recognition sequence into a genomic locus by prime editing; in the presence of a DNA donor template that also includes a recombinase recognition sequence.

他の態様において、本開示は、部位特異的な組み換えによってゲノム領域を欠失させるための方法を提供し:(a)プライム編集によってゲノム座位にリコンビナーゼ認識配列のペアを組み入れること;(b)ゲノム座位をリコンビナーゼと接触させることを含み、それによって、リコンビナーゼ認識配列のペア間のゲノム領域の欠失を触媒する。 In other aspects, the disclosure provides methods for deleting a genomic region by site-specific recombination: (a) incorporating a pair of recombinase recognition sequences at a genomic locus by prime editing; (b) genomic contacting the locus with a recombinase, thereby catalyzing deletion of the genomic region between the pair of recombinase recognition sequences.

さらに他の態様において、本開示は、部位特異的な組み換えによってゲノム領域を逆位させるための方法を提供し:(a)プライム編集によってゲノム座位にリコンビナーゼ認識配列のペアを組み入れること;(b)ゲノム座位をリコンビナーゼと接触させることを含み、それによって、リコンビナーゼ認識配列のペア間のゲノム領域の逆位を触媒する。 In yet other aspects, the present disclosure provides methods for inverting genomic regions by site-specific recombination: (a) incorporating a pair of recombinase recognition sequences at a genomic locus by prime editing; (b) It involves contacting a genomic locus with a recombinase, thereby catalyzing the inversion of the genomic region between a pair of recombinase recognition sequences.

なお他の態様において、本開示は、第1のゲノム部位と第2のゲノム部位との間の染色体転座を誘導するための方法を提供し:(a)プライム編集によって第1のゲノム座位に第1のリコンビナーゼ認識配列を組み入れること;(b)プライム編集によって第2のゲノム座位に第2のリコンビナーゼ認識配列を組み入れること;(c)第1および第2のゲノム座位をリコンビナーゼと接触させることを含み、それによって、第1および第2のゲノム座位の染色体転座を触媒する。 In yet other aspects, the present disclosure provides a method for inducing a chromosomal translocation between a first genomic site and a second genomic site, comprising: (a) incorporating a first recombinase recognition sequence at the first genomic locus by prime editing; (b) incorporating a second recombinase recognition sequence at the second genomic locus by prime editing; and (c) contacting the first and second genomic loci with a recombinase, thereby catalyzing a chromosomal translocation of the first and second genomic loci.

他の態様において、本開示は、ゲノム座位とカセットを含むドナーDNAとの間のカセット交換を誘導するための方法を提供し:(a)プライム編集によって第1のゲノム座位に第1のリコンビナーゼ認識配列を組み入れること;(b)プライム編集によって第2のゲノム座位に第2のリコンビナーゼ認識配列を組み入れること;(c)第1および第2のリコンビナーゼ認識配列によってフランキングされているカセットを含むドナーDNAおよびリコンビナーゼと第1および第2のゲノム座位を接触させることを含み、それによって、フランキングされたゲノム座位とDNAドナー上のカセットとの交換を触媒する。 In other embodiments, the present disclosure provides a method for inducing cassette exchange between a genomic locus and donor DNA comprising a cassette, comprising: (a) directing a first recombinase recognition to a first genomic locus by prime editing; (b) incorporating a second recombinase recognition sequence at a second genomic locus by prime editing; (c) donor DNA comprising a cassette flanked by first and second recombinase recognition sequences; and contacting the first and second genomic loci with a recombinase, thereby catalyzing the exchange of the flanked genomic loci with a cassette on the DNA donor.

ゲノム上の1つよりも多くのリコンビナーゼ認識配列の挿入が関わる種々の態様では、リコンビナーゼ認識配列は同じかまたは異なり得る。いくつかの態様では、リコンビナーゼ認識配列は同じである。他の態様において、リコンビナーゼ認識配列は異なる。 In various embodiments involving the insertion of more than one recombinase recognition sequence on the genome, the recombinase recognition sequences can be the same or different. In some embodiments, the recombinase recognition sequences are the same. In other embodiments, the recombinase recognition sequences are different.

種々の態様において、リコンビナーゼはチロシンリコンビナーゼ、例えばCre、Dre、Vcre、Scre、Flp、B2、B3、Kw、R、TD1-40、Vika、Nigri、Panto、Kd、Fre、Cre(ALSHG)、Tre、Brec1、またはCre-R3M3であり得、表7に示されているとおりである。かかる態様では、リコンビナーゼ認識配列は使用中のリコンビナーゼに対応する表7のRRSであり得る。 In various embodiments, the recombinase is a tyrosine recombinase, such as Cre, Dre, Vcre, Scre, Flp, B2, B3, Kw, R, TD1-40, Vika, Nigri, Panto, Kd, Fre, Cre(ALSHG), Tre, Brec1, or Cre-R3M3, as shown in Table 7. In such embodiments, the recombinase recognition sequence can be the RRS of Table 7 corresponding to the recombinase in use.

種々の他の態様において、リコンビナーゼはラージセリンリコンビナーゼ、例えばBxb1、PhiC31、R4、phiBT1、MJ1、MR11、TP901-1、A118、V153、phiRV1、phi370.1、TG1、WB、BL3、SprA、phiJoe、phiK38、Int2、Int3、Int4、Int7、Int8、Int9、Int10、Int11、Int12、Int13、L1、peaches、Bxz2、またはSV1であり得、表8に示されているとおりである。かかる態様では、リコンビナーゼ認識配列は使用中のリコンビナーゼに対応する表8のRRSであり得る。 In various other embodiments, the recombinase is a large serine recombinase, such as Bxb1, PhiC31, R4, phiBT1, MJ1, MR11, TP901-1, A118, V153, phiRV1, phi370.1, TG1, WB, BL3, SprA, phiJoe, It can be phiK38, Int2, Int3, Int4, Int7, Int8, Int9, Int10, Int11, Int12, Int13, L1, peaches, Bxz2, or SV1, as shown in Table 8. In such embodiments, the recombinase recognition sequence can be the RRS of Table 8 corresponding to the recombinase in use.

なお他の態様において、リコンビナーゼはセリンリコンビナーゼ、例えばBxb1、PhiC31、R4、phiBT1、MJ1、MR11、TP901-1、A118、V153、phiRV1、phi370.1、TG1、WB、BL3、SprA、phiJoe、phiK38、Int2、Int3、Int4、Int7、Int8、Int9、Int10、Int11、Int12、Int13、L1、peaches、Bxz2、またはSV1であり得、表8に示されているとおりである。かかる態様では、リコンビナーゼ認識配列は使用中のリコンビナーゼに対応する表8のRRSであり得る。 In still other embodiments, the recombinase is a serine recombinase, such as Bxb1, PhiC31, R4, phiBT1, MJ1, MR11, TP901-1, A118, V153, phiRV1, phi370.1, TG1, WB, BL3, SprA, phiJoe, phiK38, It can be Int2, Int3, Int4, Int7, Int8, Int9, Int10, Int11, Int12, Int13, L1, peaches, Bxz2, or SV1, as shown in Table 8. In such embodiments, the recombinase recognition sequence can be the RRS of Table 8 corresponding to the recombinase in use.

他の態様において、リコンビナーゼは表9に示されているとおりGin、Cin、Hin、Min、またはSinなどのセリンリゾルバーゼであり得る。かかる態様では、リコンビナーゼ認識配列は、使用中のリコンビナーゼに対応する表9のRRSであり得る。 In other embodiments, the recombinase can be a serine resolvase, such as Gin, Cin, Hin, Min, or Sin, as shown in Table 9. In such embodiments, the recombinase recognition sequence can be the RRS of Table 9 corresponding to the recombinase in use.

種々の他の態様において、リコンビナーゼは表10に示されているとおりHK022、P22、またはL5などのチロシンインテグラーゼであり得る。かかる態様では、リコンビナーゼ認識配列は、使用中のリコンビナーゼに対応する表10のRRSであり得る。 In various other embodiments, the recombinase can be a tyrosine integrase, such as HK022, P22, or L5, as shown in Table 10. In such embodiments, the recombinase recognition sequence can be the RRS of Table 10 corresponding to the recombinase in use.

いくつかの態様では、PEによる部位特異的な組み換えのための方法のいずれかがインビボでまたはin vitroで行われ得る。いくつかの態様では、部位特異的な組み換えための方法のいずれかが細胞に行われる(例えば、細胞のゲノムDNAを組み換える)。細胞は原核または真核であり得る。真核細胞などの細胞は本明細書に記載の対象などの個体(例えば、ヒト対象)中にあり得る。本明細書に記載の方法は、in vitroおよびインビボの細胞の遺伝子改変にとって、例えば、トランスジェニック細胞、細胞株、もしくは動物の生成という文脈において、または対象の細胞のゲノム配列の変改、例えば遺伝子欠陥の修正において、有用である。 In some embodiments, any of the methods for site-specific recombination by PE can be performed in vivo or in vitro. In some embodiments, any method for site-specific recombination is performed on the cell (eg, recombining the genomic DNA of the cell). Cells may be prokaryotic or eukaryotic. Cells, such as eukaryotic cells, can be in individuals such as the subjects described herein (eg, human subjects). The methods described herein are useful for genetic modification of cells in vitro and in vivo, e.g., in the context of the generation of transgenic cells, cell lines, or animals, or for alteration of the genomic sequence of a cell of interest, e.g. Useful in correcting defects.

セクションLに引用された参考文献
以下の参考文献の各々は例17に引用され、これらの各々は参照により本明細書に組み込まれる。

Figure 2020191234000289
Figure 2020191234000290
References Cited in Section L Each of the following references is cited in Example 17, each of which is incorporated herein by reference.
Figure 2020191234000289
Figure 2020191234000290

[8]処置の方法
本開示は、例示されるとおりであるがプリオン病(例えば本願の例5)、トリヌクレオチド反復拡大疾患(例えば本願の例3)、またはCDKL5欠損症障害(CDD)(例えば本願の例23)に限定されない、本願において提供されるプライム編集システムによって修正され得る点変異または他の変異(例えば、欠失、挿入、逆位、重複など)に関連するかまたはそれによって引き起こされる疾患と診断された対象の処置のための方法を提供する。
[8] Methods of Treatment The present disclosure provides methods for the treatment of a subject diagnosed with a disease associated with or caused by a point mutation or other mutation (e.g., deletion, insertion, inversion, duplication, etc.) that can be corrected by the prime editing system provided herein, including, but not limited to, a prion disease (e.g., Example 5 of the present application), a trinucleotide repeat expansion disease (e.g., Example 3 of the present application), or a CDKL5 deficiency disorder (CDD) (e.g., Example 23 of the present application).

実質的にいずれかの疾患を引き起こす遺伝子欠陥は、プライム編集を用いることによって修復され得る。これは、napDNAbpおよびポリメラーゼ(例えば逆転写酵素)を包含する適当なプライム編集因子融合タンパク質の選択と、(a)編集部位を含有する適当な標的DNAを標的化し、(b)ニック部位の直ちに下流の内生鎖を押し除け、置き換える所望の編集を包含するニック部位の3’端からのDNAの一本鎖の合成のための鋳型を提供するようにデザインされる適当なPEgRNAのデザインとを包含する。プライム編集は、限定なしに、(a)変異を修正する変化をヌクレオチド配列に組み入れ、(b)タンパク質およびRNAタグを組み入れ、(c)免疫エピトープを目当てのタンパク質上に組み入れ、(d)誘導可能な二量体化ドメインをタンパク質に組み入れ、(e)バイオ分子のその活性を変改するための配列を組み入れまたは除去、(f)特定の遺伝子変化を導くためのリコンビナーゼ標的部位を組み入れ、および(g)エラーを起こしやすいRTを用いることによって標的配列の変異導入をするために用いられ得る。 Virtually any disease-causing genetic defect can be repaired by using prime editing. This involves the selection of an appropriate prime editor fusion protein, including napDNAbp and a polymerase (e.g., reverse transcriptase), and the design of an appropriate PEgRNA designed to (a) target the appropriate target DNA containing the editing site, and (b) provide a template for synthesis of a single strand of DNA from the 3' end of the nick site that contains the desired edit that displaces and replaces the endogenous strand immediately downstream of the nick site. Prime editing can be used, without limitation, to (a) incorporate mutation-correcting changes into a nucleotide sequence, (b) incorporate protein and RNA tags, (c) incorporate immune epitopes onto a protein of interest, (d) incorporate inducible dimerization domains into a protein, (e) incorporate or remove sequences in a biomolecule to alter its activity, (f) incorporate recombinase target sites to direct specific genetic changes, and (g) mutate a target sequence by using error-prone RT.

障害を処置する方法には、早期のステップとして、本明細書に記載の方法に従う適当なPEgRNAおよびプライム編集因子融合タンパク質のデザインが関わり、これらは、考慮に入れられ得るいくつもの考慮事項を包含する。例えば:
(a)1つ以上の核酸塩基改変がプライム編集因子によって組み入れされることを望まれる標的配列、すなわちヌクレオチド配列;
(b)標的配列上のカットされる部位の位置付け、すなわち、プライム編集因子が一本鎖ニックを誘導して、ニックの1つの側に3'端RTプライマー配列およびニックの他の側に5'端の内生フラップ(これは究極的にはFEN1またはその等価物によって除去され、3'ssDNAフラップによって置き換えられる)を生出するであろう特定の核酸塩基位置。カットされた部位は3'端プライマー配列を生出し、これはRNA依存的なDNA重合の間にPE融合タンパク質(例えばRT酵素)のポリメラーゼによって伸長されるようになって、所望の編集を含有する3'ssDNAフラップを生出し、これがそれから標的配列上の5'内生DNAフラップを置き換える;
(c)利用可能なPAM配列(標準的なSpCas9 PAM部位、および拡張されたまたは異なるPAM特異性を有するCas9バリアントおよび等価物によって認識される非標準的なPAM部位を包含する);
(d)PAM鎖上の利用可能なPAM配列とカットされる部位の位置付けとの間の間隔;
(e)用いられるべき利用可能なプライム編集因子の具体的なCas9、Cas9バリアント、またはCas9等価物(これは部分的には利用可能なPAMによって記述される);
(f)プライマー結合部位の配列および長さ;
(g)編集鋳型の配列および長さ;
(h)相同アームの配列および長さ;
(i)スペーサー配列および長さ;ならびに
(j)gRNAコア配列。
Methods of treating disorders involve as an early step the design of appropriate PEgRNA and prime editor fusion proteins according to the methods described herein, which encompass a number of considerations that can be taken into account. . for example:
(a) a target sequence, i.e., a nucleotide sequence, in which one or more nucleobase modifications are desired to be incorporated by a prime editing agent;
(b) Positioning of the site to be cut on the target sequence, i.e., the prime editing factor induces a single-stranded nick, with the 3' end RT primer sequence on one side of the nick and the 5' end on the other side of the nick. A specific nucleobase position that will give rise to an endogenous flap at the end, which will ultimately be removed by FEN1 or its equivalent and replaced by a 3'ssDNA flap. The cut site generates a 3' end primer sequence, which becomes extended by the polymerase of the PE fusion protein (e.g. RT enzyme) during RNA-dependent DNA polymerization to contain the desired edits. Generating a 3'ssDNA flap, which then replaces the 5' endogenous DNA flap on the target sequence;
(c) available PAM sequences (including standard SpCas9 PAM sites and non-canonical PAM sites recognized by Cas9 variants and equivalents with extended or different PAM specificities);
(d) the distance between the available PAM sequence on the PAM strand and the positioning of the site to be cut;
(e) the specific Cas9, Cas9 variant, or Cas9 equivalent of the available prime editing factor to be used (this is described in part by the available PAM);
(f) sequence and length of the primer binding site;
(g) sequence and length of the editing template;
(h) Sequence and length of homologous arms;
(i) spacer sequence and length; and
(j) gRNA core sequence.

好適なPEgRNAと任意に第2部位ニッキングのためのニッキングsgRNAデザインガイドとが、説明書の次の例示の(exemplarly)ステップバイステップのセットによってデザインされ得る。これは上の考慮事項の1つ以上を考慮に入れる。ステップは図70A-70Iに示されている例を参照する。
1.標的配列および編集を定める。所望の編集(点変異、挿入、欠失、またはそれらの組み合わせ)の位置付けを中心とした標的DNA領域(~200bp)の配列をリトリーブする。図70Aを見よ。
2.標的PAMを位置付ける。所望の編集位置付けに対して近位のPAMを同定する。PAMは所望の編集位置付けに対して近位のDNAのどちらかの鎖上に同定され得る。編集位置に近接するPAMが好ましいが(すなわち、ニック部位は編集位置から30nt未満である。または編集位置からニック部位まで29nt、28nt、27nt、26nt、25nt、24nt、23nt、22nt、21nt、20nt、19nt、18nt、17nt、16nt、15nt、14nt、13nt、12nt、11nt、10nt、9nt、8nt、7nt、6nt、5nt、4nt、3nt、もしくは2nt未満)、編集位置から≧30ntのニックを置くプロトスペーサーおよびPAMを用いて編集を組み入れることが可能である。図70Bを見よ。
3.ニック部位を位置付ける。考慮されている各PAMについて、対応するニック部位とどの鎖上かとを同定する。Sp Cas9 H840Aニッカーゼでは、切断はNGG PAMの5'の第3および第4の塩基の間においてPAM含有鎖に生起する。全ての編集されるヌクレオチドはニック部位の3'に存在しなければならない。そのため、適当なPAMはPAM含有鎖上の標的の編集の5'にニックを置かなければならない。下で示される例では、2つの可能なPAMがある。単純のために、残りのステップはPAM 1のみを用いるPEgRNAのデザインを実証する。図70Cを見よ。
4.スペーサー配列をデザインする。Sp Cas9のプロトスペーサーはPAM含有鎖上のNGG PAMの5'の20ヌクレオチドに対応する。効率的なPol III転写開始はGが最初に転写されるヌクレオチドであることを要求する。プロトスペーサーの最初のヌクレオチドがGである場合には、PEgRNAのスペーサー配列は単純にプロトスペーサー配列である。プロトスペーサーの最初のヌクレオチドがGではない場合には、PEgRNAのスペーサー配列は、G、次にプロトスペーサー配列である。図70Dを見よ。
5.プライマー結合部位(PBS)をデザインする。出発アレル配列を用いて、PAM含有鎖上のDNAプライマーを同定する。DNAプライマーの3'端はニック部位のちょうど上流のヌクレオチドである(すなわち、Sp Cas9ではNGG PAMの5'の第4の塩基)。PE2およびPE3への使用のための一般的なデザイン原理として、DNAプライマーに対する12から13ヌクレオチドの相補性を含有するPEgRNAプライマー結合部位(PBS)が、~40-60%GC含量を含有する配列に用いられ得る。低いGC含量を有する配列では、より長い(14から15nt)PBSが試験されるべきである。より高いGC含量を有する配列では、より短い(8から11nt)PBSが試験されるべきである。GC含量にかかわらず、最適なPBS配列は経験的に決定されるはずである。長さpのPBS配列をデザインするためには、出発アレル配列を用いて、PAM含有鎖上のニック部位の5'の最初のpヌクレオチドの逆相補体を取る。図70Eを見よ。
6.RT鋳型(またはDNA合成鋳型)をデザインする。RT鋳型(または、ポリメラーゼが逆転写酵素ではないところでは、DNA合成鋳型)は、デザインされた編集と編集に隣接する配列に対する相同性とをコードする。1つの態様では、これらの領域は図3Dおよび図3EのDNA合成鋳型に対応し、DNA合成鋳型は「編集鋳型」および「相同アーム」を含む。最適なRT鋳型長さは標的部位に基づいて変わる。ショートレンジ編集(位置+1から+6)では、短い(9から12nt)、中程度の(13から16nt)、および長い(17から20nt)RT鋳型を試験することが推奨される。ロングレンジ編集(位置+7以降)では、十分な3'DNAフラップ相同性を許すように、編集の位置から少なくとも5nt(好ましくは10nt以上)伸長するRT鋳型を用いることが推奨される。ロングレンジ編集では、機能的なデザインを同定するために、いくつかのRT鋳型がスクリーニングされるべきである。より大きい挿入および欠失(≧5nt)では、RT鋳型上へのより多大な3'相同性(~20nt以上)の組み込みが推奨される。RT鋳型が、逆転写されるDNA産物上の最後のヌクレオチドとしてのG(PEgRNAのRT鋳型上のCに対応する)の合成をコードするときには、編集効率は典型的には損なわれる。多くのRT鋳型が効率的なプライム編集を支持するので、RT鋳型をデザインするときには、最後の合成されるヌクレオチドとしてのGの回避が推奨される。長さrのRT鋳型配列をデザインするためには、所望のアレル配列を用い、PAMを元々含有した鎖上のニック部位の3'の最初のrヌクレオチドの逆相補体を取る。SNP編集と比較して、同じ長さのRT鋳型を用いる挿入または欠失編集は同一の相同性を含有しないであろうということに注意せよ。図70Fを見よ。
7.完全なPEgRNA配列をアセンブリする。PEgRNA構成要素を次の順序(5'から3')でコンカテネーションする:スペーサー、骨格、RT鋳型、およびPBS。図70Gを見よ。
8.PE3のためのニッキングsgRNAをデザインする。編集の上流および下流の非編集鎖上のPAMを同定する。最適なニッキング位置は高度に座位依存的であり、経験的に決定されるはずである。一般的に、PEgRNAによって誘導されるニックの向かいの位置の40から90ヌクレオチド5'に置かれたニックは、より高い編集収量およびより少数のインデルに至る。ニッキングsgRNAは、出発アレル上の20ntプロトスペーサーにマッチするスペーサー配列を有する。プロトスペーサーがGで始まらない場合には5'Gの追加を有する。図70Hを見よ。
9.PE3bニッキングsgRNAをデザインする。PAMが相補鎖に存在し、その対応するプロトスペーサーが編集のために標的化される配列とオーバーラップする場合には、この編集はPE3bシステムの候補であり得る。PE3bシステムでは、ニッキングsgRNAのスペーサー配列は出発アレルではなく所望の編集されたアレルの配列にマッチする。編集されるヌクレオチド(単数または複数)がニッキングsgRNAプロトスペーサーのシード領域(PAMに隣接する~10nt)内に収まるときには、PE3bシステムは効率的に作動する。これは、編集された鎖の組み入れ後まで相補鎖のニッキングを防止し、標的DNAに結合することについてのPEgRNAおよびsgRNAの間の競合を防止する。PE3bは、両方の鎖上の同時のニックの生成をもまた回避し、それゆえに、高い編集効率を維持しながらインデル形成を有意に縮減する。PE3b sgRNAは所望のアレルの20ntプロトスペーサーにマッチするスペーサー配列を有するべきである。必要とされる場合には5'Gの追加を有する。図70Iを見よ。
A suitable PEgRNA and optionally a nicking sgRNA design guide for second site nicking can be designed by the following exemplarly step-by-step set of instructions. This takes into account one or more of the above considerations. The steps refer to the example shown in Figures 70A-70I.
1. Define target sequence and edits. Retrieve the sequence of the target DNA region (~200 bp) centered on the location of the desired edit (point mutation, insertion, deletion, or combination thereof). See Figure 70A.
2. Position the target PAM. Identify the PAM proximal to the desired editing location. PAMs can be identified on either strand of DNA proximal to the desired editing location. PAMs that are close to the edit position are preferred (i.e., the nick site is less than 30 nt from the edit position; or 29 nt, 28 nt, 27 nt, 26 nt, 25 nt, 24 nt, 23 nt, 22 nt, 21 nt, 20 nt, Protospacer that places a nick ≧30nt from the editing position And it is possible to incorporate editing using PAM. See Figure 70B.
3. Position the nick site. For each PAM considered, identify the corresponding nick site and on which strand. For Sp Cas9 H840A nickase, cleavage occurs on the PAM-containing strand between the 5' third and fourth bases of the NGG PAM. All edited nucleotides must be present 3' to the nick site. Therefore, a suitable PAM must be nicked 5' of the target edit on the PAM-containing strand. In the example shown below, there are two possible PAMs. For simplicity, the remaining steps demonstrate the design of PEgRNA using PAM 1 only. See Figure 70C.
Four. Design the spacer array. The protospacer of Sp Cas9 corresponds to the 5' 20 nucleotides of the NGG PAM on the PAM-containing strand. Efficient Pol III transcription initiation requires G to be the first nucleotide transcribed. If the first nucleotide of the protospacer is G, the spacer sequence of PEgRNA is simply a protospacer sequence. If the first nucleotide of the protospacer is not a G, the spacer sequence of the PEgRNA is G followed by the protospacer sequence. See Figure 70D.
Five. Design the primer binding site (PBS). The starting allele sequence is used to identify DNA primers on the PAM-containing strand. The 3' end of the DNA primer is the nucleotide just upstream of the nick site (ie, the 4th base 5' of the NGG PAM for Sp Cas9). As a general design principle for use with PE2 and PE3, a PEgRNA primer binding site (PBS) containing 12 to 13 nucleotides of complementarity to the DNA primer is combined with a sequence containing ~40-60% GC content. can be used. For sequences with low GC content, longer (14 to 15 nt) PBSs should be tested. For sequences with higher GC content, shorter (8 to 11 nt) PBSs should be tested. Regardless of GC content, the optimal PBS sequence should be determined empirically. To design a PBS sequence of length p, the starting allele sequence is used to take the reverse complement of the first p nucleotides 5' of the nick site on the PAM-containing strand. See Figure 70E.
6. Design the RT template (or DNA synthesis template). The RT template (or DNA synthesis template where the polymerase is not a reverse transcriptase) encodes the designed edit and homology to the sequences flanking the edit. In one embodiment, these regions correspond to the DNA synthesis template of Figures 3D and 3E, where the DNA synthesis template includes an "editing template" and a "homologous arm." Optimal RT template length will vary based on the target site. For short range editing (positions +1 to +6), it is recommended to test short (9 to 12 nt), medium (13 to 16 nt), and long (17 to 20 nt) RT templates. For long range editing (position +7 and beyond), it is recommended to use RT templates that extend at least 5 nt (preferably 10 nt or more) from the editing position to allow sufficient 3' DNA flap homology. For long range editing, several RT templates should be screened to identify functional designs. For larger insertions and deletions (≧5nt), incorporation of more 3' homology (~20nt or more) onto the RT template is recommended. Editing efficiency is typically compromised when the RT template encodes the synthesis of a G (corresponding to C on the RT template of PEgRNA) as the last nucleotide on the reverse transcribed DNA product. Avoiding G as the last synthesized nucleotide is recommended when designing RT templates, as many RT templates support efficient prime editing. To design an RT template sequence of length r, use the desired allele sequence and take the reverse complement of the first r nucleotides 3' of the nick site on the strand that originally contained the PAM. Note that compared to SNP editing, insertion or deletion editing using RT templates of the same length will not contain the same homology. See Figure 70F.
7. Assemble the complete PEgRNA sequence. Concatenate the PEgRNA components in the following order (5' to 3'): spacer, backbone, RT template, and PBS. See Figure 70G.
8. Design a nicking sgRNA for PE3. Identify PAMs on the unedited strands upstream and downstream of the edit. The optimal nicking position is highly locus dependent and should be determined empirically. Generally, nicks placed 40 to 90 nucleotides 5' across from the nick induced by PEgRNA lead to higher editing yields and fewer indels. The nicking sgRNA has a spacer sequence that matches the 20nt protospacer on the starting allele. If the protospacer does not begin with a G, it has an addition of 5'G. See Figure 70H.
9. Design PE3b nicking sgRNA. If the PAM is present on the complementary strand and its corresponding protospacer overlaps the sequence targeted for editing, then this editing may be a candidate for the PE3b system. In the PE3b system, the spacer sequence of the nicking sgRNA matches the sequence of the desired edited allele rather than the starting allele. The PE3b system operates efficiently when the nucleotide(s) to be edited fall within the seed region (~10 nt adjacent to the PAM) of the nicking sgRNA protospacer. This prevents nicking of the complementary strand until after incorporation of the edited strand and prevents competition between PEgRNA and sgRNA for binding to target DNA. PE3b also avoids simultaneous nick generation on both strands, thus significantly reducing indel formation while maintaining high editing efficiency. PE3b sgRNA should have a spacer sequence that matches the 20nt protospacer of the desired allele. With addition of 5'G if required. See Figure 70I.

好適なPEgRNAおよび第2部位ニッキングsgRNAをデザインするための上のステップバイステップのプロセスは、決して限定することを意味されない。本開示は上に記載されているステップバイステップのプロセスのバリエーションを企図し、これらは当業者によってそれから導出可能であろう。 The above step-by-step process for designing suitable PEgRNAs and second-site nicking sgRNAs is not meant to be limiting in any way. This disclosure contemplates variations on the step-by-step process described above, which may be derived therefrom by those skilled in the art.

ひとたび好適なPEgRNAおよびPE融合タンパク質が選択/デザインされると、それらは、好適な方法論によって、例えば、ベクターに基づくトランスフェクション(これにおいては、ベクターによるトランスフェクションによって細胞内で発現される、PEgRNAおよびPE融合タンパク質をコードするDNAを含む1つ以上のベクター)、送達フォーマット(例えば、脂質粒子、ナノ粒子)でPEgRNAと複合体化したPE融合タンパク質の直接的送達(例えばRNP送達)によって、またはmRNAに基づく送達システムによって、投与され得る。かかる方法は本願において本開示によって記載され、いずれかの公知の方法が利用され得る。 Once suitable PEgRNA and PE fusion proteins have been selected/designed, they can be prepared by suitable methodologies, such as vector-based transfection, in which PEgRNA and one or more vectors containing DNA encoding the PE fusion protein), by direct delivery of the PE fusion protein complexed with PEgRNA (e.g., RNP delivery) in a delivery format (e.g., lipid particles, nanoparticles), or by direct delivery of the PE fusion protein (e.g., RNP delivery), or by mRNA can be administered by a delivery system based on Such methods are described herein by the present disclosure, and any known method may be utilized.

目当ての標的DNAに接触することによって、所望の編集がそれに組み入れされるようになるようにして、PEgRNAおよびPE融合タンパク質(または一緒にPE複合体と言われる)は治療学的有効量で細胞に送達され得る。 PEgRNA and PE fusion protein (or together referred to as PE conjugate) are delivered to cells in therapeutically effective amounts by contacting the desired target DNA such that the desired edits are incorporated into it. can be delivered.

適当な細胞への送達が実現可能である限りは、いずれかの疾患は、着想上はかかる方法によって処置可能である。当業者は、意図される目的および意図される標的細胞に適するようにPE送達方法論を選ぶおよび/またはセレクションする能力があるであろう。 Any disease could conceptually be treated by such methods, so long as delivery to the appropriate cells is feasible. Those skilled in the art will be able to choose and/or select PE delivery methodologies to suit the intended purpose and intended target cells.

例えば、いくつかの態様において、かかる疾患(例として、上に記載のとおりの点突然変異に関連するがん)を有する対象へ、有効量の、本明細書に記載のプライム編集系(所望の遺伝子変化を含むドナーDNA分子の存在下での相同特異的(homology-directed)修復によって媒介されるとおりに、点突然変異を修正するかまたは疾患関連遺伝子中へ不活性化突然変異を導入する)を投与することを含む方法が提供される。いくつかの態様において、かかる疾患(例として、上に記載のとおりの点突然変異に関連するがん)を有する対象へ、有効量の、本明細書に記載のプライム編集系(点突然変異を修正するかまたは疾患関連遺伝子中へ不活性化突然変異を導入する)を投与することを含む方法が提供される。いくつかの態様において、疾患は、増殖性疾患である。いくつかの態様において、疾患は、遺伝的疾患である。いくつかの態様において、疾患は、新生物疾患である。いくつかの態様において、疾患は、代謝疾患である。いくつかの態様において、疾患は、リソソーム蓄積症である。点突然変異を修正するかまたは疾患関連遺伝子中へ不活性化突然変異を導入することによって処置され得る他の疾患は当業者に知られており、本開示はこの点において限定されない。 For example, in some embodiments, an effective amount of a prime editing system described herein (desired Correcting point mutations or introducing inactivating mutations into disease-associated genes, as mediated by homology-directed repair in the presence of a donor DNA molecule containing the genetic alteration) A method is provided comprising administering. In some embodiments, an effective amount of a prime editing system as described herein (which has a point mutation) is administered to a subject having such a disease (e.g., a cancer associated with a point mutation as described above). or introducing an inactivating mutation into a disease-associated gene). In some embodiments, the disease is a proliferative disease. In some embodiments, the disease is a genetic disease. In some embodiments, the disease is a neoplastic disease. In some embodiments, the disease is a metabolic disease. In some embodiments, the disease is a lysosomal storage disease. Other diseases that can be treated by correcting point mutations or introducing inactivating mutations into disease-associated genes are known to those skilled in the art, and the present disclosure is not limited in this respect.

本開示は、追加の疾患または障害(例として、TPRT媒介の遺伝子編集によって修正され得る点突然変異に関連するかもしくはこれによって引き起こされる疾患または障害)の処置のための方法を提供する。いくつかのかかる疾患は本明細書に記載されており、本明細書に提供されるストラテジーおよび融合タンパク質で処置され得る追加の好適な疾患は本開示に基づき当業者に明らかであろう。例示の好適な疾患および障害は下に列挙される。夫々の配列における特定の位置または残基のナンバリングが、使用される具体的なタンパク質およびナンバリングスキームに依存することは、理解されるであろう。ナンバリングは、例として、成熟したタンパク質の前駆体および成熟したタンパク質それ自体において異なることもあり、種ごと(from species to species)の配列の差異はナンバリングに影響を及ぼすこともある。当業者は、当該技術分野において周知である方法によって(例として、配列の整列および相同の残基の決定によって)、いずれの相同のタンパク質および夫々のコード核酸における夫々の残基を同定することができるであろう。例示の好適な疾患および障害は、限定せずに以下を包含する:2-メチル-3-ヒドロキシ酪酸尿症;3ベータ-ヒドロキシステロイドデヒドロゲナーゼ欠損症;3-メチルグルタコン酸尿症;3-オキソ-5アルファ-ステロイドデルタ4-デヒドロゲナーゼ欠損症;46,XY性転換、1型,3型および5型;5-オキソプロリナーゼ欠損症;6-ピルボイル-テトラヒドロプテリンシンターゼ欠損症;アースコグ症候群;アーセ症候群;2型軟骨無発生症;色覚異常2および7;後天性QT延長症候群;シンゲル(Schinzel)型先端脳梁症候群;先端大腿骨頭異形成症;ホルモン耐性の有無に関わらない先端骨形成不全症2;先端紅斑角皮症(Acroerythrokeratoderma);先端短肢異形成症;Acth-非依存性の副腎皮質大結節性過形成2;活性化PI3K-delta症候群;急性間欠性ポルフィリン症;アシル-CoAデヒドロゲナーゼファミリー、メンバー9の欠損症;アダムス-オリバー症候群5および6;アデニンホスホリボシルトランスフェラーゼ欠損症;アデニル酸キナーゼ欠損症;アデニロコハク酸リアーゼ欠損症に起因する溶血性貧血;青年期のネフロン癆;腎・肝・膵異形成症;7型メッケル症候群;副腎白質ジストロフィー;成人接合部型表皮水疱症;表皮水疱症、接合部型、限局性バリアント;成人神経セロイドリポフスチン症;成人神経セロイドリポフスチン症;成人発症の、眼球運動失効を伴う運動失調症;ADULT症候群;無フィブリノーゲン血症および先天性無フィブリノーゲン血症;常染色体潜性無ガンマグロブリン血症2;加齢性黄斑変性症3,6,11および12;アイカルディ・グティエール症候群1,4および5;凍傷状狼瘡1;アラジール症候群1および2;アレキサンダー病;アルカプトン尿症;アラン・ハーンドン・ダドリー症候群;先天性の汎発性脱毛症;アルパース脳症;アルファ-1-抗トリプシン欠損症;常染色体優性の、常染色体劣性の、およびX連鎖劣性のアルポート症候群;アルツハイマー病、家族性、3、痙性対麻痺および運動失行あり;アルツハイマー病、1型,3型および4型;低石灰化型および低成熟型、IIA1遺伝性エナメル質形成不全症;アミノアシラーゼ1欠損症;アーミッシュ小児てんかん症候群;アミロイド形成性トランスサイレチンアミロイドーシス;トランスサイレチンに関する、アミロイド心筋症;心筋症;筋萎縮性側索硬化症1型,6型,15型(前頭側頭型認知症の有無に関わらない),22型(前頭側頭型認知症の有無に関わらない),および10型;TARDBPに関する、TDP43封入体を伴う前頭側頭型認知症;アンダーマン(Andermann)症候群;アンダーセン・タウィル症候群;先天性QT延長症候群;G6PD欠損症に起因する非球形溶血性の貧血症;アンジェルマン(Angelman)症候群;小頭症を伴う、新生児発症の重症脳症;自閉症、X連鎖性3に対する感受性;腎症、動脈瘤、および筋痙攣を伴う遺伝性の血管症;アンジオテンシンi変換酵素、穏やかな血清増加;無虹彩症、小脳性運動失調症、および精神遅滞;無爪症;アンチトロンビンIII欠損症;性器奇形およびステロイド産生異常を伴うアントレー・ビクスラー症候群;家族性胸部大動脈瘤4,6および9;胸部大動脈瘤および大動脈解離;多臓器平滑筋機能障害症候群(multisystemic smooth muscle dysfunction syndrome);もやもや病5;再生不良性貧血;見かけの鉱質コルチコイド過剰;アルギナーゼ欠損症;アルギニノコハク酸リアーゼ欠損症;アロマターゼ欠損症;5型,8型および10型不整脈原性右室心筋症;原発性家族性肥大型心筋症;先天性多発性関節拘縮症、末梢の、X連鎖性;関節拘縮-腎機能障害-胆汁うっ滞症候群;関節拘縮、腎機能障害、および胆汁うっ滞2;アスパラギン合成酵素欠損症;神経細胞移動の異常性;ビタミンE欠損症を伴う運動失調症;感覚性の、常染色体優性の、運動失調症;運動失調症-毛細血管拡張症候群;遺伝性がん素因症候群(hereditary cancer-predisposing syndrome);無トランスフェリン血症;家族性の心房細動11,12,13および16;心房中隔欠損症2,4および7(心室伝導欠陥の有無に関わらない);心房停止2;房室中隔欠損症4;遺伝性眼球萎縮;ATR-X症候群;耳介下顎骨症候群2;自己免疫疾患、多臓器、小児発症;1a型自己免疫リンパ増殖性症候群;常染色体優性の無汗性外胚葉形成不全症;ミトコンドリアDNA欠失1および3を伴う、常染色体優性の進行性外眼筋麻痺;常染色体優性の捻転ジストニア4;常染色体劣性の中心核ミオパチー;常染色体劣性の先天性魚鱗癬1,2,3,4Aおよび4B;常染色体劣性のIA型および1B型皮膚弛緩症;常染色体劣性の無汗性外胚葉形成不全症候群;外胚葉異形成症11b;発汗低下/毛髪/歯型、常染色体劣性;常染色体劣性低リン酸血症性の骨疾患;3型アクセンフェルト・リーガー症候群;ベインブリッジ・ロパーズ症候群;バナヤン・ライリー・ルバルカ症候群;PTEN過誤腫症候群;バライスター(Baraitser)・ウインター症候群1および2;バラカート症候群;バルデ・ビードル症候群1,11,16および19;2型裸リンパ球症候群、相補群E;出生前2型バーター症候群;バーター症候群の3型,低カルシウム尿を伴う3型,および4型;特発性基底核石灰化症4;連珠毛;良性家族性血尿;良性家族性新生児発作1および2;発作、良性家族性新生児1、および/またはミオキミア;発作、早期小児てんかん性脳症7;良性家族性新生児-小児発作;良性遺伝性舞踏病;心筋症を伴う良性肩甲骨骨膜筋ジストロフィー;A1型およびA2型(常染色体優性)ベルナール・スーリエ症候群;ベストロフィノパチー(常染色体劣性);ベータ サラセミア;ベスレムミオパチーおよびベスレムミオパチー2;ビエッティ結晶性角膜網膜ジストロフィー;胆汁酸合成欠損症、先天性2;ビオチニダーゼ欠損症;バーク・バレル(Birk Barel)精神遅滞異形症候群;眼裂縮小、眼瞼下垂症、および眼瞼内反症;ブルーム症候群;ベルエソン・フォルスマン・レーマン症候群;バウチャー・ノイハウザー(Boucher Neuhauser)症候群;A1型およびA2型乳頭症;高血圧症を伴う乳頭症;出血を伴う脳小血管疾患;分岐鎖ケト酸デヒドロゲナーゼキナーゼ欠損症;分岐鎖症候群2および3;乳がん、早期発症;乳房卵巣がん、家族性1,2および4;角膜脆性症候群2;ブロディミオパチー;汗の塩化物上昇の有無に関わらない気管支拡張症3;ブラウン・ビアレット・ヴァン レアレ症候群およびブラウン・ビアレット・ヴァン レアレ症候群2;ブルガダ症候群;ブルガダ症候群1;心室細動;発作性家族性心室細動;ブルガダ症候群およびブルガダ症候群4;QT延長症候群;心臓性突然死;標的(Bull eye)黄斑ジストロフィー;スターガート病4;錐体桿体ジストロフィー12;水疱性魚鱗癬様紅皮症;バーン・マッキューン(Burn-Mckeown)症候群;家族性カンジダ症2,5,6および8;I型およびII型糖タンパク質糖鎖不全症候群;高アンモニア血症に起因する炭酸脱水酵素VA欠損症;結腸癌;心筋不整脈;QT延長症候群、LQT1亜型;チトクロームcオキシダーゼ欠損症に起因する致死性乳児心臓脳筋症;心筋症;ダノン病;肥大型心筋症;左心室非圧縮心筋症;カルネヴァーレ症候群;1型カーニー複合体;カルニチンアシルカルニチントランスロカーゼ欠損症;カルニチンパルミトイルトランスフェラーゼI,II,II(遅発性)およびII(小児性)欠損症;白内障1,4、常染色体優性、常染色体優性の多型、微小角膜を伴う、コポック様、若年性、微小角膜と糖尿を伴う、および核びまん性非進行性;カテコラミン作動性多形心室頻拍;尾状回帰症候群;家族性Cd8欠損症;中心核疾患;1,9および16番染色体の中心核不安定性ならびに免疫不全;進行性外眼筋を伴う小児小脳性運動失調症および小脳性運動失調症、精神遅滞、ならびに平衡障害症候群2;APPに関する脳アミロイド血管症;大脳皮質下梗塞および白質脳症を伴う、脳の常染色体優性および劣性の動脈症;脳海綿状奇形2;脳・眼・顔・骨格症候群2;脳-眼-顔-骨格症候群;石灰化および嚢胞を伴う脳網膜微小血管症;セロイドリポフスチン症神経細胞2,6,7および10;Ch\xc3\xa9diak・東症候群;成人型チェディアック・東症候群;シャルコー・マリー・トゥース病の1B型,2B2型,2C型,2F型,2I型,2U型(軸索性),1C型(脱髄性),優性中間C型,劣性中間A型,2A2型,4C型,4D型,4H型,IF型,IVF型およびX型;肩甲骨腹側脊髄筋萎縮症;遠位型脊髄性筋萎縮症、先天性非進行性;脊髄筋萎縮症、遠位型、常染色体劣性、5;CHARGE関連;小児低リン酸塩症;成人低リン酸塩症;胆嚢炎;進行性家族性肝内胆汁うっ滞3;妊娠性肝内胆汁うっ滞3;コレスタノール蓄積症;コレステロールモノオキシゲナーゼ(側鎖切断)欠損症;ブロムストランド型軟骨異形成症;穿刺性軟骨異形成症1、X連鎖劣性および2 X連鎖優性;CHOPS症候群;慢性肉芽腫性疾患、常染色体劣性チトクロームb陽性、1型および2型;チュドリー・マッカラー症候群; 原発性毛様体ジスキネジア、7,11,15,20および22;I型シトルリン血症;I型およびII型シトルリン血症;頭蓋骨裂傷症;C様症候群;A型コケイン症候群;原発性補酵素Q10欠乏症、1,4および7;コフィン・シリス/知的障害;コフィン・ローリー症候群;コーエン症候群;寒冷時発汗症候群1;コール・カーペンター症候群2;肉芽腫を伴う、細胞性および体液性免疫複合欠損症;d-2-およびl-2-ヒドロキシグルタル酸複合尿症;マロン酸およびメチルマロン酸複合尿症;酸化的リン酸化複合欠損症1,3,4,12,15および25;一部および全部の17-アルファ-ヒドロキシラーゼ/17,20-リアーゼ複合欠損症;共通可変性免疫不全症9;c1インヒビターの機能不全に起因する補体成分4の部分欠損;補体因子B欠損症;錐体単色症;錐体桿体ジストロフィー2および6;錐体桿体ジストロフィー遺伝性エナメル質形成不全症;先天性副腎過形成および先天性副腎低形成、X連鎖性;先天性無巨核球性血小板減少症;先天性無虹彩症;先天性中枢性低換気;ヒルシュスプルング病3;先天性収縮性腕十二指腸症;四肢および顔面の先天性拘縮、低緊張、および発育遅延;グリコシル化の先天性障害1B型,1D型,1G型,1H型,1J型,1K型,1N型,1P型,2C型,2J型,2K型,IIm型;I型およびII型先天性赤血球異形成貧血;顔面の先天性外胚葉異形成症;先天性赤血球生成性ポルフィリン症;2型先天性全身性リポジストロフィー;先天性心疾患、多発型2;先天性心疾患;大動脈弓離断症;先天性脂肪腫性過成長、血管奇形、および表皮母斑;非小細胞肺がん;卵巣の新生物;心伝導系障害、非特異性;先天性微絨毛萎縮症;先天性筋ジストロフィー;LAMA2の部分的欠損に起因する先天性筋ジストロフィー;先天性筋ジストロフィー-脳および眼の異常を伴うジストログリカノパチー、A2型,A7型,A8型,A11型およびA14型;先天性筋ジストロフィー-精神遅滞を伴うジストログリカノパチー、B2型,B3型,B5型およびB15型;先天性筋ジストロフィー-精神遅滞を伴わないジストログリカノパチー、B5型;先天性筋肥大-大脳症候群;先天性筋無力症候群、アセタゾールアミド反応性;繊維型不均衡を伴う先天性ミオパチー;先天性眼球コロボマ;先天性静止型夜盲症、1A型,1B型,1C型,1E型,1F型および2A型;コプロポルフィリン症;角膜平板症2;角膜ジストロフィー、フックス内皮性4;2型角膜内皮性ジストロフィー;角膜脆弱性ケラトグロブ、青色強膜、および関節過度可動性;コーネリア ド ランゲ症候群1および5;常染色体優性の冠動脈疾患2;冠状動脈疾患;高αリポタンパク質血症2; 皮質異形成症(他の脳奇形との複合)5および6;後頭部の皮質奇形;コルチコステロイド結合グロブリン欠損症;2型コルチコステロンメチルオキシダーゼ欠損症;コステロ症候群;カウデン症候群1;扁平股;常染色体優性の頭蓋骨異形成症;頭蓋縫合早期癒合症1お
よび4;頭蓋縫合早期癒合症および歯異常;クレアチン欠損症、X連鎖;クルーゾン症候群;潜在眼球症候群;停留精巣、片側または両側;クッシング指節癒合症;皮膚悪性黒色腫1;骨異栄養症と、肺、胃腸、および泌尿器の重度の異常とを伴う皮膚弛緩症;チアノーゼ、一過的な新生児のおよび非定型の腎症;嚢胞性線維症;シスチン尿症;シトクロムcオキシダーゼi欠損症;シトクロムcオキシダーゼ欠損症;D-2-ヒドロキシグルタル酸尿症2;分節性ダリエー病;内耳形成不全、小耳症、および小歯症(LAMM)を伴う難聴;難聴、常染色体優性3a,4,12,13,15、常染色体優性の非症候性感音性17,20および65;難聴、常染色体劣性1A,2,3,6,8,9,12,15,16,18b,22,28,31,44,49,63,77,86および89;難聴、蝸牛の、近視および知的障害あり、前庭障害なし、常染色体優性、X連鎖2;2-メチルブチリル-CoA脱水素酵素の欠損症;3-ヒドロキシアシル-CoA脱水素酵素の欠損症;アルファ-マンノシダーゼの欠損症;芳香族-L-アミノ酸脱炭酸酵素の欠損症;ビスホスホグリセリン酸ムターゼの欠損症;ブチリル-CoA脱水素酵素の欠損症;フェロキシダーゼの欠損症;ガラクトキナーゼの欠損症;グアニジノ酢酸メチルトランスフェラーゼの欠損症;ヒアルロノグルコサミニダーゼの欠損症;リボース-5-リン酸イソメラーゼの欠損症;ステロイド11-ベータ-モノオキシゲナーゼの欠損症;UDPグルコース-ヘキソース-1-リン酸ウリジリルトランスフェラーゼの欠損症;キサンチンオキシダーゼの欠損症;デジェリン・ソッタス病;シャルコー・マリー・トゥース病、ID型およびIVF型;デジェリン・ソッタス症候群、常染色体優性;樹状細胞、単球、Bリンパ球、およびナチュラルキラーリンパ球の欠損症;デビュクワ(Desbuquois)異形成症2; デビュクワ症候群;DFNA 2非症候性の聴力低下;視神経萎縮および難聴を伴う糖尿病および尿崩症;2型糖尿病、およびインスリン依存性20;ダイアモンド・ブラックファン貧血1,5,8および10;下痢3(分泌性ナトリウム、先天性、症候性)、および5(タフティング腸症(tufting enteropathy)を伴う、先天性);ジカルボキシルアミノ酸尿症;びまん性掌蹠角化症、ボスニア型;デジトレノ脳症候群;ジヒドロプテリジン還元酵素欠損症;拡張型心筋症1A,1AA,1C,1G,1BB,1DD,1FF,1HH,1I,1KK,1N,1S,1Yおよび3B;左心室非圧縮3;シトクロムp450酸化還元酵素欠損症に起因するステロイド産生異常;遠位型関節拘縮2B型;遠位型遺伝性運動ニューロン症2B型;遠位型ミオパチーMarkesbery-Griggs型;遠位型脊髄性筋萎縮症、X連鎖3;二重睫毛・リンパ浮腫症候群;皮膚の欠如を伴う、優性栄養傷害性表皮水疱症;優性遺伝性視神経萎縮症;ドンナイ・バロウ症候群;ドーパミン ベータ水酸化酵素欠損症;ドーパミン受容体d2、脳内密度低下;ダウリング・デゴス病4;ドイン蜂巣状網膜ジストロフィー;マラティア・レベンチーヌ(Malattia leventinese);2型デュアン症候群;デュビン・ジョンソン症候群;デュシェンヌ型筋ジストロフィー;ベッカー型筋ジストロフィー;異常フィブリノーゲン血症;常染色体優性の先天性角化異常症および常染色体優性、3;常染色体劣性の先天性角化異常症1,3,4および5;X連鎖性の先天性角化異常症;顔面ミオキミアを伴う、家族性ジスキネジア;プラスミノーゲン分子異常症;ジストニア2(捻転、常染色体劣性),3(捻転、X連鎖),5(ドーパ反応型),10,12,16,25,26(ミオクロニー);良性家族性乳児の発作2;早期乳児てんかん性脳症2,4,7,9,10,11,13および14;非定型レット症候群;初期T細胞前駆体急性リンパ性白血病;外胚葉性異形成表皮水疱症候群;外胚葉性異形成-合指症候群1;偏位水晶体、単独で(isolated)常染色体劣性および優性;裂手裂足(Ectrodactyly)、外胚葉性異形成、および口唇口蓋裂症候群3;エーラス・ダンロス症候群7型(常染色体劣性)、古典型、2型(早老性)、ヒドロキシリジン欠損型、4型、4型バリアント、およびテナシンX欠損に起因するもの;アイヒスフェルト型先天性筋ジストロフィー;内分泌-大脳骨異形成症(cerebroosteodysplasia);S錐体増強症候群;拡大前庭水管症候群;エンテロキナーゼ欠損症;疣贅状表皮発育異常症;単純型表皮水疱症および肢帯筋ジストロフィー、斑状色素沈着(mottled pigmentation)を伴う単純型、幽門閉鎖を伴う単純型、単純型、常染色体劣性、および幽門閉鎖を伴う;表皮剥離性掌蹠角化症;家族性熱性痙攣8;てんかん、小児欠神2,12(特発性全身、感受性),5(夜間前頭葉型)、夜間前頭葉型1、部分性、可変の病巣があるもの(with variable foci)、進行性ミオクロニー3、およびX連鎖性、可変の学習障害および行動障害があるもの;てんかん性脳症、小児期発症、乳児期早期、1,19,23,25,30および32;骨端異形成症、多発性、近視および伝音難聴を伴う;一過性運動失調症2型;一過性疼痛症候群、家族性、3;エプスタイン症候群;フェクトナー症候群;赤芽球増殖性プロトポルフィリン症;エストロゲン抵抗性;滲出性硝子体網膜症6;ファブリー病、およびファブリー病、心臓変異型;第H因子、第VII因子、第X因子、第v因子、および第viii因子の、2つの複合欠損症、第xiii因子、サブユニット、欠損症;家族性腺腫性ポリポーシス1および3;蕁麻疹および難聴を伴う家族性アミロイド腎症;家族性寒冷蕁麻疹;家族性の小脳虫部無発生;家族性良性天疱瘡;家族性乳がん;乳がん感受性(Breast cancer, susceptibility to);骨肉腫;膵臓がん3;家族性心筋症;家族性寒冷自己炎症性症候群2;家族性大腸がん;家族性滲出性硝子体網膜症、X連鎖性;家族性片麻痺性片頭痛1型および2型;家族性高コレステロール血症;家族性肥大型心筋症1,2,3,4,7,10,23および24;家族性低カリウム血症-低マグネシウム血症;家族性低形成の、糸球体嚢胞腎;家族性乳児筋無力症;家族性若年性痛風;家族性地中海熱、および家族性地中海熱、常染色体優性;家族性多弁症;家族性晩発性皮膚ポルフィリン症;家族性肺毛細血管腫症;家族性腎性糖尿;家族性腎性低尿酸血症;家族性拘束性心筋症1;家族性1型および3型高リポ蛋白血症;ファンコニー貧血,補欠群E,I,NおよびO;ファンコニー・ビッケル症候群;ファビズム感受性(Favism, susceptibility to);熱性痙攣、家族性、11;フェインゴールド症候群1;胎児ヘモグロビン量的形質遺伝子座1;FG症候群およびFG症候群4;眼球外筋の線維症、先天性、1,2,3a(眼球外病変の有無に関わらない),3b;魚眼病;フレック角膜ジストロフィー;フローティング・ハーバー症候群;精神遅滞の有無に関わらない、言語障害を伴う焦点てんかん;巣状分節性糸球体硬化症5;前脳欠損症;フランク・テル・ハール症候群;Borrone Di Rocco Crovato症候群;フレイジャー症候群;ウィルムス腫瘍1;フリーマン・シェルドン症候群;前頭骨幹端異形成症1および3;前頭側頭型認知症;前頭側頭型認知症および/または筋萎縮性側索硬化症3および4;前頭側頭型認知症第3染色体連鎖性および前頭側頭型認知症ユビキチン陽性;フルクトース-ビホスファターゼ欠損症;フールマン(Fuhrmann)症候群;ガンマ-アミノ酪酸トランスアミナーゼ欠損症;ガムストープ・ウォールファールト(Gamstorp-Wohlfart)症候群; ゴーシェ病1型および亜急性神経障害性;進行性の脊椎側弯症を伴う、家族性水平注視麻痺;全般性優性ジストロフィー型表皮水疱症;全般性てんかん、熱性痙攣プラス3,1型,2型を伴う;レノックス・ガストー型てんかん脳症;巨大軸索ニューロパチー;グランツマン血栓症;緑内障1、開放角、e,FおよびG;緑内障3、原発性先天性、d;先天性緑内障、および先天性緑内障、コロボマ;緑内障、原発性開放角、若年性発症;神経膠腫感受性1;グルコーストランスポーター1型欠損症候群;ルコース-6-リン酸輸送欠損症;GLUT1欠損症候群2;特発性全般性てんかん感受性、12;グルタミン酸ホルミノトランスフェラーゼ欠損症;グルタル酸血症IIAおよびIIB;グルタル酸尿症1型;グルタチオン合成酵素欠損症;糖原病0(筋肉),II(成人形),IXa2,IXc,1A型;II型,IV型,IV(肝とミオパチーとの複合),V型およびVI型;ゴールドマン・ファーブル症候群;ゴードン症候群;ゴーリン症候群;全前脳胞症シークエンス;全前脳胞症7;顆粒腫性疾患、慢性、X連鎖性、バリアント;卵巣の顆粒膜細胞腫瘍;灰色血小板症候群;グリセリ症候群3型;グレーノー角膜ジストロフィーI型;成長および精神遅滞、下顎顔面異形症、小頭症、および口蓋裂;下垂体異常を伴う成長ホルモン欠損症;免疫不全を伴う成長ホルモン不感受性;GTPシクロハイドロラーゼI欠損症;ハジュ・チーニー症候群;手足子宮症候群;聴覚障害;小児毛細血管腫;血液腫瘍;ヘモクロマトーシス1型,2B型および3型;糖尿病の微小血管合併症7;トランスフェリン血清レベル量的形質座2;ヘモグロビンH病、無欠損;グルコースリン酸イソメラーゼ欠損症に起因する、溶血性貧血、非球状赤血球性;血球貪食性リンパ組織球症、家族性、2;血球貪食性リンパ組織球症、家族性、3;ヘパリン補因子II欠損症;遺伝性腸性先端皮膚炎;遺伝性乳がん・卵巣がん症候群;運動失調・毛細血管拡張症様障害;遺伝性びまん性胃がん;スフェロイドを伴う遺伝性びまん性白質脳症;遺伝性第II,第IX,第VIII因子欠損症;遺伝性出血性毛細血管拡張症2型;無汗症を伴う遺伝性無痛症;遺伝性リンパ浮腫I型;視神経萎縮を伴う遺伝性運動・感覚神経症;早期呼吸不全を伴う遺伝性ミオパチー;遺伝性神経痛性筋萎縮症;遺伝性非ポリポーシス大腸新生物;リンチ症候群IおよびII;遺伝性膵炎;慢性膵炎感受性;遺伝性感覚・自律神経障害IIB型およびIIA型;遺伝性鉄芽球性貧血;ヘルマンスキー・ポドラック症候群1,3,4および6;内臓錯位、2,4および6、常染色体;内臓錯位、X連鎖性;組織球性髄様細網症;異所形成;組織球症-リンパ節腫大プラス症候群;ホロカルボキシラーゼ合成酵素欠損症;全前脳胞症2,3,7および9;ホルト・オラム症候群;MTHFR欠損症、CBS欠損症、およびホモシステイン尿症に起因するホモシステイン血症、ピリドキシン応答性;コバラミン代謝異常に起因する、ホモシステイン尿症-巨赤芽球性貧血、cblE相補型;ハウエル・エバンス(Howel-Evans)症候群;ハーラー症候群;ハッチンソン・ギルフォード症候群;水頭症;高アンモニア血症、III型;高コレステロール血症、および高コレステロール血症、常染色体劣性;過剰驚愕症2および遺伝性の過剰驚愕症;高フェリチン血症白内障症候群;高グリシン尿症;周期性発熱を伴う高免疫グロブリンD;メバロン酸尿症;高免疫グロブリンE症候群;家族性の高インスリン血症性低血糖症3,4および5;高インスリン血症-高アンモニア血症症候群;高リシン血症;ジストニア、赤血球増加症、および肝硬変を伴う高マンガン血症;高オルニチン血症-高アンモニア血症-ホモシトルリン尿症症候群;副甲状腺機能亢進症1および2;副甲状腺機能亢進症、新生児重度;部分的pts欠損症、BH4欠損症、D、非pkuに起因する、高フェニルアラニン血症、bh4欠損症、a;精神遅滞症候群2,3および4を伴う高リン酸血症;多毛性骨軟骨異形成症;apob32に関連する、低ベータリポ蛋白血症、家族性;低カルシウム血症、常染色体優性1;低カルシウム尿性高カルシウム血症、家族性、1型および3型;低軟骨形成症;鉄過剰症を伴う低クロム小球性貧血;肝臓中グリコーゲン合成酵素の欠損症を伴う低血糖症;臭覚障害の有無に関わらない低ゴナドトロピン性性腺機能低下症11;免疫不全を伴う無汗性外胚葉形成不全症;発汗低下のX連鎖性外胚葉異形成;低カリウム性周期性四肢麻痺1および2;低マグネシウム血症1、腸の;低マグネシウム血症、発作、および精神遅滞;低髄性白質ジストロフィー7;左心低形成症候群;房室中隔欠損症および共通房室接合部;尿道下裂1および2、X連鎖性;甲状腺機能低下症、先天性非甲状腺腫、1;減毛症8および12;減毛症-リンパ浮腫-血管拡張症候群;I血液型系;シーメンス型水疱性魚鱗癬;剥脱性魚鱗癬;未熟児魚鱗癬症候群;特発性基底核石灰化症5;特発性線維性肺胞炎、慢性型;先天性角化不全症、常染色体優性、2および5;乳児期の特発性高カルシウム血症;カルシウム流入障害2に起因するT細胞不活性化を伴う免疫機能障害; 1型および2型高IgMを伴う、cd3-ゼータの欠陥に起因する、免疫不全15,16,19,30,31C,38,40,8、ならびにマグネシウム欠陥を伴う、X連鎖性、エプスタイン・バーウイルス感染、および新形成;免疫不全-動原体不安定性-顔面奇形症候群2;封入体ミオパチー2および3;野中ミオパチー;乳児痙攣および発作性舞踏症、家族性;乳児皮質過骨症;乳児GM1ガングリオシドーシス;乳児低ホスファタシアーゼ血症;乳児ネフロン癆;乳児眼振、X連鎖性;乳児パーキンソン病-ジストニア;多尾性精子および過剰なDNAに関連する不妊症;イ
ンスリン抵抗性;インスリン抵抗性糖尿病および黒色表皮腫;インスリン依存性糖尿病分泌性下痢症候群;間質性腎炎、核巨大化(karyomegalic);子宮内発育遅延、骨幹端異形成症、先天性副腎低形成、および性器奇形;ヨードチロシン結合欠損症;IRAK4欠損症;虹彩隅角異発生優性型および1型;脳内鉄蓄積;坐骨膝蓋骨異形成;膵島細胞過形成;17,20-リアーゼ単独欠損症;ルトロピン単独欠損症;イソバレリル-CoAデヒドロゲナーゼ欠損症;ヤンコヴィッチ・リベラ症候群;ジャーベルおよびランゲ・ニールセン症候群2;ジュベール症候群1,6,7,9/15(2遺伝子性),14,16および17、ならびに口顔面指症候群xiv;ヘルリッツの接合部表皮水疱症;若年性GM>1<ガングリオシドーシス;若年性ポリポーシス症候群;若年性ポリポーシス/遺伝性出血性毛細血管拡張症症候群;若年性網膜炎;歌舞伎メーキャップ症候群;カルマン症候群1,2および6;思春期遅延症;神崎病;カラック症候群;カルタゲナー症候群;ケニー・ケイフィ症候群2型;ケッペン・ルビンスキー(Keppen-Lubinsky)症候群;円錐角膜1;毛包性角化症;掌蹠膿疱症1;キンドラー症候群;L-2-ヒドロキシグルタル酸尿症;ラーセン症候群、優性型;格子状角膜ジストロフィーIII型;レーバー黒内障;ツェルウェガー症候群;ペルオキシソーム生合成異常症;ツェルウェガー症候群スペクトラム;レーバー先天性黒内障11,12,13,16,4,7および9;レーバー視神経萎縮症;アミノグリコシド誘発性難聴;難聴、非症候性感音性、ミトコンドリア;左心室非圧縮症5;左右軸奇形;リー病;ミトコンドリア短鎖エノイル-CoAヒドラターゼ1欠損症;ミトコンドリア複合体I欠損症に起因するリー症候群;ライナー病;レリー・ワイル軟骨骨異形成症;致死性先天性拘縮症候群6;白血球接着不全症I型およびIII型;白骨ジストロフィー、ミエリン形成不全性、11および6;白質脳症、運動失調を伴う、脳幹・脊髄障害と乳酸値上昇とを伴う、白質の消失を伴う、および進行性の、卵巣不全を伴う;全白爪;レビー小体型認知症;リヒテンシュタイン・クノール症候群;リー・フラウメニ症候群1;Lig4症候群;肢帯筋ジストロフィー1B型,2A型,2B型,2D型,C1型,C5型,C9型,C14型;脳および眼の異常を伴う先天性筋ジストロフィー-ジストログリカノパチー、A14型およびB14型;複合型リパーゼ欠損症;脂肪蛋白症;リポジストロフィー、家族性部分的、2型および3型;脳回欠損1,2(X連鎖性),3,6(小頭症を伴う),X連鎖性;皮質下帯状ヘテロトピア、X連鎖性;急性乳児肝不全;ロイス・ディーツ症候群1,2,3;QT延長症候群1,2,2/9,2/5,(2遺伝子性),3,5および5、後天性、感受性;肺がん;リンパ浮腫、遺伝性、id;リンパ浮腫、原発性、骨髄異形成を伴う;リンパ増殖症候群1,1(X連鎖性)および2;リソソーム酸リパーゼ欠損症;大頭症、巨人症、顔面異形症候群;黄斑変性症、卵黄様、成人期に発症;悪性高熱感受性1型;悪性リンパ腫、非ホジキン;悪性黒色腫;前立腺の悪性腫瘍;下顎骨異形成症;A型またはB型リポジストロフィーを伴う下顎骨異形成症、非定型;下顎顔面異形成症、トレーチャー・コリンズ型、常染色体劣性;マンノース結合タンパク質欠乏症;メープルシロップ尿症1A型および3型;マルデン・ウォーカー様症候群;マルファン症候群;マリネスコ・Sj\xc3\xb6gren症候群;マートソフル(Martsolf)症候群;成熟期に発症する若年性糖尿病、1型,2型,11型,3型および9型;メイ・ヘグリン異常症;MYH9関連疾患;セバスチャン症候群;マキュン・オルブライト症候群;体細胞腺腫;性索-間質性腫瘍;クッシング症候群;マクシック・カウフマン症候群;マクラウド神経赤血球症症候群;メッケル・グルーバー症候群;中鎖アシル-補酵素A脱水素酵素欠損症;髄芽腫;皮質下嚢胞1および2aを伴う大脳白質脳症;大頭-先天性大理石様皮膚;PIK3CA関連過成長スペクトラム;巨脳-多小脳回-多指-水頭症候群2;巨大芽球性貧血、チアミン反応性、糖尿病および感音性難聴を伴う;マイヤー・ゴーリン症候群1および4;メルニック・ニードルズ症候群;髄膜腫;精神遅滞、X連鎖性、3,21,30および72;精神遅滞および小頭症、脳橋および小脳の低形成を伴う;X連鎖精神遅滞症候群5;精神遅滞、上顎前突、および斜視;精神遅滞、常染色体優性12,13,15,24,3,30,4,5,6および9;精神遅滞、常染色体劣性15,44,46および5;精神遅滞、定型動作、てんかん、および/または脳奇形;精神遅滞、症候群性、クラース・ジェンセン(Claes-Jensen)型、X連鎖性;精神遅滞、X連鎖、非特異的、症候性、ヘデラ(Hedera)型、および症候性、ウー(wu)型;メロシン欠損型先天性筋ジストロフィー;異染性白質ジストロフィー若年型、乳児期後期型、および成人型;異染性白質ジストロフィー;変容性骨異形成症;メトヘモグロビン血症I型および2型;メチオニンアデノシルトランスフェラーゼ欠損症、常染色体優性;ホモシスチン尿症を伴うメチルマロン酸血症;メチルマロン酸尿症cblB型;メチルマロニル-CoAムターゼ欠損症に起因するメチルマロン酸尿症;メチルマロン酸尿症mut(0)型;小頭症性骨異形成原基性小人症2型;絨毛網膜症、リンパ浮腫、または精神遅滞の有無に関わらない小頭症;小頭症、裂孔ヘルニア、およびネフローゼ症候群;小頭症;脳梁の低形成症;痙性対麻痺50、常染色体劣性;全身性発育遅延;CNSミエリン形成不全症;脳萎縮;小頭症、正常な知能および免疫不全;小頭症-毛細血管奇形症候群;小球性貧血;症候群性小眼球症5,7および9;小眼球症、単独3,5,6,8、およびコロボマ6を伴う;微小球症;片頭痛、家族性片麻痺性;ミラー症候群;外眼筋麻痺を伴うミニコアミオパチー;コアを伴う先天性ミオパチー;ミッチェル・ライリー症候群;ミトコンドリア3-ヒドロキシ-3-メチルグルタリル-CoA合成酵素欠損症;ミトコンドリア複合体I,II,III,III(核型2,4または8)欠損症;ミトコンドリアDNA枯渇症候群11,12(心筋症型),2,4B(MNGIE型),8B(MNGIE型);ミトコンドリアDNA枯渇症候群3および7,肝脳型および13(脳筋症型);ミトコンドリアリン酸担体およびピルビン酸担体欠損症;ミトコンドリア三機能性タンパク質欠損症;長鎖3-ヒドロキシアシル-CoAデヒドロゲナーゼ欠損症;三好型筋ジストロフィー1;遠位型ミオパチー、前脛骨発症を伴う;モーア・トラネジャーグ(Mohr-Tranebjaerg)症候群;モリブデン補因子欠損症、相補群A;モワット・ウィルソン症候群;ムコリピドーシスIIIガンマ;ムコ多糖症VI型,VI型(重症)およびVII型;ムコ多糖症、MPS-I-H/S,MPS-II,MPS-III-A,MPS-III-B,MPS-III-C、MPS-IV-A,MPS-IV-B;網膜色素変性症73;ガングリオシドーシスGM1型1(心臓障害を伴う)3;多中心性骨溶解腎症;多中心性骨溶解、結節症、および関節症;多発性先天異常;心房中隔欠損症2;多発性先天異常-筋緊張低下-発作症候群3;多発性の皮膚および粘膜静脈奇形;多発性内分泌腺新形成1型および4型;多発性骨端異形成症5型または優性;多発性腸管閉鎖症;多発性翼状片症候群エスコバール型;多発性スルファターゼ欠損症;多発性骨癒合症症候群3;筋AMPグアニンオキシダーゼ欠損症;筋眼脳疾患;筋ジストロフィー、先天性、巨円錐体型;筋無力症、家族性小児、1;アセチルコリン受容体欠損症に関連する、先天性筋無力症症候群11;先天性筋無力症症候群17,2A(スローチャネル),4B(ファストチャネル)および管状集合体を伴わない;ミエロペルオキシダーゼ欠損症;MYH関連ポリポーシス;子宮内膜癌;心筋梗塞1;ミオクローヌス性ジストニア;ミオクローヌス性-無緊張性てんかん;赤色ボロ繊維・ミオクローヌスてんかん;筋原線維ミオパチー1およびZASP関連;ミオグロビン尿、急性再発性、常染色体劣性;筋神経胃腸管性脳症症候群;進行性外眼筋麻痺を伴う小児小脳性運動失調症;ミトコンドリアDNA枯渇症候群4B、MNGIE型;ミオパチー、中心核、1、先天性、過剰の筋紡錘を伴う、遠位の、1、乳酸アシドーシス、および鉄芽球性貧血1、先天性白内障を伴うミトコンドリア進行性の、聴覚消失、および発育遅延、および管状集合体、2;近視6;筋硬化症、常染色体劣性;先天性筋強直症;先天性筋強直症、常染色体優性型および劣性型;爪膝蓋骨症候群;ナンス・ホラン症候群;小眼球症2;ナバホ神経肝障害;ネマリンミオパチー3および9;新生児筋緊張低下;知的障害;痙攣;言語発達遅延;精神遅滞、常染色体優性31;シトリン欠損症によって引き起こされる新生児肝内胆汁うっ滞;腎性尿崩症、腎性尿崩症、X連鎖性;腎結石症/骨粗鬆症、低リン酸血症性、2;ネフロン癆13,15および4;不妊症;脳-眼-腎症候群(ネフロン癆、眼球運動失効、および小脳異常);ネフローゼ症候群、3型,5型、眼球異常の有無に関わらない、7型および9型;ネスター・グレルモプロジェリア症候群;ノイ・ラクソバ(Neu-Laxova)症候群1;脳鉄蓄積を伴う神経変性症4および6;神経フェリチン症;神経線維腫症、1型および2型;神経線維肉腫;神経下垂体性尿崩症;ニューロパチー、遺伝性感覚性、IC型;中性1アミノ酸輸送障害;ミオパチーを伴う中性脂質蓄積症;好中球免疫不全症候群;ニコライデス・バライスター症候群;ニーマン・ピック病C1型,C2型,A型およびC1、成人型;非ケトーシス性高グリシン血症;ヌーナン症候群1および4、LEOPARD症候群1;若年性骨髄単球性白血病の有無に関わらないヌーナン症候群様障害;正常カリウム血性周期性四肢麻痺、カリウム感受性;ノルム病;てんかん、聴覚消失、および精神遅滞症候群;精神遅滞、X連鎖性102および症候性13;肥満;眼白子症、I型;眼皮膚白子症1B型,3型および4型;眼歯指異形成症;歯限局型低ホスファターゼ症;歯-毛髪-四肢症候群(Odontotrichomelic syndrome);大口病;減歯症-大腸直腸癌症候群;オピッツG/BBB症候群;視神経萎縮症9;口腔顔面指趾症候群;オルニチンアミノトランスフェラーゼ欠損症;口腔顔面裂11および7、口唇/口蓋外胚葉異形成症候群;オルスタビック・リンデマン・ソルベルグ症候群;軽度の軟骨異形成症を伴う骨関節炎;離断性骨軟骨炎;骨形成不全症12型,5型,7型,8型,I型,III型、正常な強膜を伴う、優性型、劣性周産期致死性;頭蓋骨硬化症を伴う線条骨症;常染色体優性の大理石骨症1型および2型,劣性4型,劣性1型,劣性6型;偽神経膠腫を伴う骨粗鬆症;耳口蓋指症候群I型およびII型;卵巣形成不全1;卵巣白質脳症;先天性爪肥厚症4および2型;骨パジェット病、家族性;パリスター・ホール症候群;掌蹠角化症、非表皮剥離性、局所性またはびまん性;膵臓無形成および先天性心疾患;パピロン・Lef\xc3\xa8vre症候群;傍神経膠節腫3;フォン・オレインブルグ(von Eulenburg)の先天性異常筋強直症;副甲状腺癌;パーキンソン病14,15,19(若年性発症),2,20(早期発症),6,(常染色体劣性の早期発症)および9;限局性白皮証;ヒポキサンチン-グアニンホスホリボシルトランスフェラーゼ部分欠損症;網膜色素上皮の模様ジストロフィー;PC-K6a;ペリザウス・メルツバッハー病;ペンドレッド症候群;末梢性脱髄性神経障害、中枢性脱髄性;ヒルシュスプルング病;永続型新生児糖尿病;永続型新生児糖尿病、神経学的特色を伴う;新生児インスリン依存性糖尿病;若年発症成人型糖尿病、2型;ペルオキシソーム生合成障害14B,2A,4A,5B,6A,7Aおよび7B;ペロー症候群4;ペリー症候群;新生児の持続性高インスリン性低血糖症;家族性高インスリン症;表現型;フェニルケトン尿症;褐色細胞腫;遺伝性パラガングリオーマ-褐色細胞腫症候群;パラガングリオーマ1;腸のカルチノイド腫瘍;カウデン症候群3;ホスホグリセリン酸脱水素酵素欠損症;ホスホグリセリン酸キナーゼ1欠損症;光感受性硫黄欠乏性毛髪発育異常症;フィタン酸蓄積病;ピック病;ピアソン症候群;色素性網膜ジストロフィー;色素性結節状副腎皮質病変、原発性、1;石灰化上皮腫;ピット・ホプキンス症候群;下垂体依存性高コルチゾール症;下垂体ホルモン欠損症、複合型1,2,3および4;プラスミノーゲン活性化因子インヒビター1型欠損症;プラスミノーゲン欠損症、I型;血小板型出血障害15および8;多形皮膚萎縮症、遺伝性線維化、腱性拘縮、ミオパチー、および肺線維症を伴う;多発性嚢胞腎疾患2、成人型および乳児型;硬化性白質脳症を伴う多嚢胞性脂肪膜性骨異形成症;免疫不全の有無に関わらないポリグルコサン体ミオパチー1;多小脳回、非対称性、両側性前頭頭頂部;多発性神経炎、聴覚消失、運動失調、網膜色素変性、および白内障;4型橋小脳形成不全症;膝窩部贅皮症候群;孔脳症2;汗孔角化症8、伝染性表層化学活性型;ポルフォビリノーゲン合成酵素欠損症;晩発性皮膚ポルフィリン症;網膜色素変性症を伴う脊髄後索性失調症;後極白内障2型;プラダー・ウィリー様症候群;早発卵巣不全4,5,7および9;原発性常染色体劣性小頭症10,2,3および5;原発性線毛機能不全24;原発性拡張
型心筋症;左心緻密化障害6;4、左心緻密化障害10;発作性心房細動;原発性高シュウ酸尿症、I型およびIII型;原発性肥大性骨関節症、常染色体劣性2;原発性低マグネシウム血症;原発性開放隅角緑内障若年発症1;原発性肺高血圧症;プリムローズ症候群;進行性家族性心ブロック1B型;進行性家族性肝内胆汁うっ滞2および3;進行性肝内胆汁うっ滞;運動失調症を伴う進行性ミオクローヌスてんかん;進行性偽リウマチ性異形成症;進行性硬化性灰白異栄養症;プロリダーゼ欠損症;プロリン脱水素酵素欠損症;統合失調症4;プロパジン欠損症、X連鎖性;プロピオン酸血症;プロタンパク質変換酵素1/3欠損症;前立腺がん、遺伝性、2;プロタン欠損症;蛋白尿;フィンランド型先天性ネフローゼ症候群;プロテウス症候群;乳腺癌;偽軟骨発育不全脊椎骨端異形成症;偽性低アルドステロン症1型常染色体優性および劣性および2型;偽性副甲状腺機能低下症1A型;偽性偽性副甲状腺機能低下症;仮性新生児副腎白質ジストロフィー;偽原発性高アルドステロン症;弾性線維性仮性黄色腫;乳児の全身性動脈石灰化症2;多発性凝固因子欠損症を伴う弾性線維性仮性黄色腫様障害;乾癬感受性2;PTEN過誤腫症候群;遺伝性出血性毛細血管拡張症に関連する肺動脈性高血圧症;肺線維症および/または骨髄不全、テロメアに関連する、1および3;遺伝性出血性毛細血管拡張症を伴う、肺高血圧症、原発性、1;プリン-ヌクレオシドホスホリラーゼ欠損症;ピルビン酸カルボキシラーゼ欠損症;ピルビン酸脱水素酵素E1-アルファ欠損症;赤血球のピルビン酸キナーゼ欠損症;レイン症候群;ラスオパチー;劣性栄養障害性表皮水疱症;爪障害、非症候性先天性、8;ライフェンスタイン症候群;腎欠損症;腎カルニチン輸送障害;腎コロボマ症候群;腎異形成症;腎異形成症、網膜色素性ジストロフィー、小脳性運動失調症、および骨格異形成症;遅発性感音性聴覚消失を伴うか、または溶血性貧血を伴う、腎尿細管性アシドーシス、遠位型、常染色体劣性;眼球異常および精神遅滞を伴う、腎尿細管性アシドーシス、近位型;網膜錐体ジストロフィー3B;網膜色素変性症;網膜色素変性症10,11,12,14,15,17および19;網膜色素変性症2,20,25,35,36,38,39,4,40,43,45,48,66,7,70,72;網膜芽細胞腫;レット障害;ラブドイド腫瘍素因症候群2;裂孔原生網膜剥離、常染色体優性;肢根型点状軟骨異形成症2型および3型;ロバーツ-SCあざらし肢奇形症候群;ロビノー・ソラウフ(Robinow Sorauf)症候群;ロビノー症候群、常染色体劣性、短合多指症を伴う常染色体劣性;ロスムンド・トムソン症候群;ラパデリノ症候群;RRM2B関連ミトコンドリア病;ルービンシュタイン・タイビ症候群;サラ病;サンドホフ病、成人型および乳児型;サルコイドーシス、早期発症;ブラウ症候群;シンドラー病、1型;裂脳症;統合失調症15;蝸牛様骨盤異形成症;神経鞘腫症2;シュワルツ・ヤンペル症候群1型;角膜硬化、常染色体劣性;硬結性骨化症;二次性甲状腺機能低下症;瀬川症候群、常染色体劣性;セニオール・ローケン症候群4および5;感覚性運動失調型ニューロパチー、構音障害、および眼麻痺;セピアプテリン還元酵素欠損症;SeSAME症候群;小頭症、成長遅延、電離放射線感受性を伴う、ADA欠損症に起因する重症複合免疫不全症、非定型、常染色体劣性、T細胞陰性、B細胞陽性、NK細胞陽性のNK細胞陰性;重症先天性好中球減少症;重症先天性好中球減少症3、常染色体劣性または優性;重症先天性好中球減少症および6、常染色体劣性;乳児期の重篤なミオクロニーてんかん;熱性痙攣プラスの全般てんかん、1型および2型;重篤なX連鎖性筋細管ミオパチー;QT短縮症候群3型;非特異的な骨格異常を伴う低身長;低身長、耳道狭窄症、下顎形成不全、骨格異常;低身長、爪甲形成不全、顔異形、および貧毛症;原基性小人症;多指症の有無に関わらない短肋胸郭異形成症11または3;シアリドーシスI型およびII型;シルバー痙性対麻痺症候群;神経伝導速度遅延、常染色体優性;スミス・レムリ・オピッツ症候群;スナイダー・ロビンソン症候群;成長ホルモン分泌腺腫;プロラクチノーマ;家族性、下垂体腺腫素因;ソトス症候群1または2;痙性失調症5、常染色体劣性、シャルルボワ・サグネ型、1,10または11、常染色体劣性;筋萎縮性側索硬化症5型;痙性対麻痺15,2,3,35,39,4、常染色体優性、55、常染色体劣性、および5A;胆汁酸合成障害、先天性、3;精子形成不全11,3および8;球状赤血球症4型および5型;球状体ミオパチー;脊髄性筋萎縮症、下肢優位2、常染色体優性;脊髄性筋萎縮症、II型;脊髄小脳失調症14,21,35,40および6;脊髄小脳失調症、常染色体劣性1および16;脾臓低形成;脊椎手根骨足根骨癒合症候群;脊椎手掌異形成、エーラス・ダンロス症候群様、免疫調節異常を伴う、アグリカン型、先天性関節脱臼を伴う、短肢-手型、セダガッテン(Sedaghatian)型、錐体桿体ジストロフィーを伴う、およびコズロウスキー型; 捩れ小人症;シュタルガルト病1;錐体桿体ジストロフィー3;スティックラー症候群1型;クニースト(Kniest)異形成症;スティックラー症候群、1型(非症候性眼性)および4型;スティング関連脈管障害、小児期発症;ストームオルケン症候群;スタージ・ウェーバー症候群、毛細血管奇形、先天性、1;サクシニル-CoAアセト酢酸転移酵素欠損症;スクラーゼ-イソマルターゼ欠損症;乳児突然死症候群;亜硫酸酸化酵素欠損症、独立型;大動脈弁上狭窄;肺サーファクタント代謝機能障害、2および3;指節癒合症、近位、1b;セナニー・レンツ型合指症;3型合指症;症候性X連鎖性精神遅滞16;内反尖足;タンジール病;TARP症候群;テイ・サックス病、B1バリアント、Gm2ガングリオシドーシス(成人)、Gm2ガングリオシドーシス(成人発症);テムタリー(Temtamy)症候群;テノリオ症候群;肢端骨異形成;テストステロン17-ベータ-デヒドロゲナーゼ欠損症;無四肢症、常染色体劣性;ファロー四徴症;左心低形成症候群2;動脈瘤;心臓および大血管の奇形;心室中隔欠損症1;ティール・ベーンケ(Thiel-Behnke)角膜ジストロフィー;胸部大動脈瘤および大動脈解離;マルファン様体型;3M症候群2;血小板減少症、血小板機能障害、溶血、およびグロビン合成不均衡;血小板減少症、X連鎖性;血栓症、遺伝性、プロテインC欠損症に起因、常染色体優性および劣性;甲状腺無形成;甲状腺がん、濾胞性;甲状腺ホルモン代謝異常;甲状腺ホルモン抵抗性、汎発性、常染色体優性;甲状腺中毒性周期性四肢麻痺および甲状腺中毒性周期性四肢麻痺2;サイトロピン放出ホルモン抵抗性、汎発性;チモシー症候群;TNF受容体関連周期熱症候群(TRAPS);歯無発生、選択的、3および4;多形性心室頻拍(Torsades de pointes);タウンズ・ブロックス鰓弓耳腎様症候群;新生児の一過性表皮水疱症;トリーチャー・コリンズ症候群1;精神遅滞、小人症、および網膜の色素変性を伴う長睫毛症;三叉神経節異形成症I型;三叉神経節症候群3型;トリメチルアミン尿症;結節性硬化症症候群;リンパ管筋腫症;結節性硬化症1および2;チロシナーゼ陰性眼皮膚白皮症;チロシナーゼ陽性眼皮膚白皮症;チロシン血症I型;UDPグルコース-4-エピメラーゼ欠損症;ウルリッヒ型先天性筋ジストロフィー;重度の四肢欠損を伴う尺骨・腓骨欠損症;アップショー・シュールマン症候群;ウロカニン酸加水酵素欠損症;アッシャー症候群、1型,1B型,1D型,1G型,2A型,2C型および2D型;網膜色素変性症39;紫外線感受性症候群;ファン・デル・ウーデ(Van der Woude)症候群;ヴァン・マルダーゲム(Van Maldergem)症候群2;ヘンカムリンパ管拡張症-リンパ浮腫症候群2;異型ポルフィリン症;嚢胞性腎疾患を伴う脳室拡大;ヴェルヘイ(Verheij)症候群;超長鎖アシル-CoA脱水素酵素欠損症;膀胱尿管逆流症8;内臓逆位5、常染色体;腹部ミオパチー;ビタミンD依存性くる病、1型および2型;卵黄型ジストロフィー;フォン・ヴィルブランド病2M型および3型;ワールデンブルグ症候群1型,4C型および2E型(神経学的病変を伴う);クライン・ワールデンブルグ症候群;ウォーカー・ワールブルグ先天性筋ジストロフィー;ワールブルグ・マイクロ症候群2および4;イボ、低ガンマグロブリン血症、感染症、および骨髄性細胞貯留;ウィーバー症候群;ヴァイユ・マルケザーニ症候群1および3;ヴァイユ・マルケザーニ様症候群;ワイセンバッハー・ツウェイミュラー(Weissenbacher-Zweymuller)症候群;ウェルドニッヒ・ホフマン病;シャルコー・マリー・トゥース病;ウェルナー症候群;WFS1関連障害;ウィデマン・スタイナー症候群;ウィルソン病;ウォルフラム様症候群、常染色体優性;ワース(Worth)病;ファン・ブッヘム病2型;色素性乾皮症、相補群b,群D,群Eおよび群G;X連鎖無ガンマグロブリン血症;X連鎖性 遺伝性運動感覚性ニューロパチー;ステリルスルファターゼ欠損症を伴うX連鎖性魚鱗癬;X連鎖性脳室周囲異所性灰白質;耳口蓋指症候群、I型;X連鎖性重症複合免疫不全症;チンメルマン・レーバンド(Zimmermann-Laband)症候群およびチンメルマン・レーバンド症候群2;ならびに小帯(Zonular)粉状白内障3。
The present disclosure provides methods for the treatment of additional diseases or disorders, for example, diseases or disorders associated with or caused by point mutations that can be corrected by TPRT-mediated gene editing. Some such diseases are described herein, and additional suitable diseases that can be treated with the strategies and fusion proteins provided herein will be apparent to the skilled artisan based on the present disclosure. Exemplary suitable diseases and disorders are listed below. It will be understood that the numbering of specific positions or residues in each sequence will depend on the specific protein and numbering scheme used. The numbering may be different, for example, in the precursor of the mature protein and the mature protein itself, and sequence differences from species to species may affect the numbering. The skilled artisan will be able to identify any homologous proteins and the respective residues in the respective encoding nucleic acids by methods well known in the art, for example, by aligning sequences and determining homologous residues. Exemplary suitable diseases and disorders include, without limitation, the following: 2-methyl-3-hydroxybutyric aciduria; 3 beta-hydroxysteroid dehydrogenase deficiency; 3-methylglutaconic aciduria; 3-oxo-5 alpha-steroid delta 4-dehydrogenase deficiency; 46,XY sex reversal, types 1, 3 and 5; 5-oxoprolinase deficiency; 6-pyruvoyl-tetrahydropterin synthase deficiency; Aarskog syndrome; Aase syndrome; achondroplasia type 2; color vision deficiencies 2 and 7; acquired long QT syndrome; Schinzel type acrocallosal syndrome; acrofemoral head dysplasia; acroostosis deficiency 2 with or without hormone resistance; acroerythrokeratoderma; acrobrachydysplasia; Acth-independent adrenal macronodular hyperplasia 2; activity PI3K-delta syndrome;acute intermittent porphyria;acyl-CoA dehydrogenase family, member 9 deficiency;Adams-Oliver syndrome 5 and 6;adenine phosphoribosyltransferase deficiency;adenylate kinase deficiency;hemolytic anemia due to adenylosuccinate lyase deficiency;nephronophthisis of adolescence;renal-hepatic-pancreatic dysplasia;Meckel syndrome type 7;adrenoleukodystrophy;adult junctional epidermolysis bullosa;epidermolysis bullosa, junctional, focal variant;adult neuronal ceroid lipofuscinosis;adult-onset ataxia with ocular lag;ADULT syndrome;afibrinogenemia and congenital afibrinogenemia;autosomal recessive agammaglobulinemia 2;age-related macular degeneration 3, 6, 11 and 12;Aicardi-Goutier syndrome Alzheimer's syndrome 1, 4, and 5; lupus pernio 1; Alagille syndrome 1 and 2; Alexander disease; alkaptonuria; Allan Herndon-Dudley syndrome; alopecia universalis; Alpers encephalopathy; alpha-1-antitrypsin deficiency; autosomal dominant, autosomal recessive, and X-linked recessive Alport syndrome; Alzheimer's disease, familial, 3, with spastic paraplegia and apraxia; Alzheimer's disease, types 1, 3, and 4; hypocalcifying and hypomature, IIA1 hereditary amelogenesis imperfecta; aminoacylase 1 deficiency; Amish childhood epilepsy syndrome; amyloidogenic transthyretin amyloidosis; transthyretin-related amyloid cardiomyopathy; cardiomyopathy; amyotrophic lateral sclerosis types 1, 6, 15 (with or without frontotemporal dementia), and 22 (with or without frontotemporal dementia) with or without, and type 10; frontotemporal dementia with TDP43 inclusions related to TARDBP; Andermann syndrome; Andersen-Tawil syndrome; congenital long QT syndrome; non-spherolytic anemia due to G6PD deficiency; Angelman syndrome; neonatal onset severe encephalopathy with microcephaly; susceptibility to autism, X-linked 3; hereditary vasculopathy with nephropathy, aneurysms, and muscle spasms; mild serum elevation of angiotensin I converting enzyme; aniridia, cerebellar ataxia, and mental retardation; onychomycosis; antithrombin III deficiency; Antley-Bixler syndrome with genital anomalies and steroidogenesis abnormalities; familial thoracic aortic aneurysms 4, 6, and 9; thoracic aortic aneurysm and aortic dissection; multisystemic smooth muscle dysfunction syndrome smooth muscle dysfunction syndrome;moyamoya disease 5;aplastic anemia;apparent mineralocorticoid excess;arginase deficiency;argininosuccinate lyase deficiency;aromatase deficiency;arrhythmogenic right ventricular cardiomyopathy types 5, 8, and 10;primary familial hypertrophic cardiomyopathy;arthrogryposis multiplex congenital, peripheral, X-linked;arthrogryposis-renal dysfunction-cholestasis syndrome;arthrogryposis, renal dysfunction, and cholestasis 2;asparagine synthetase deficiency;neuronal migration abnormalities;ataxia with vitamin E deficiency;sensory, autosomal dominant, ataxia;ataxia-telangiectasia syndrome;hereditary cancer-predisposing syndrome syndrome);atransferrinemia;familial atrial fibrillation 11, 12, 13 and 16;atrial septal defect 2, 4 and 7 (with or without ventricular conduction defect);atrial stop 2;atrioventricular septal defect 4;hereditary ophthalmotrophy;ATR-X syndrome;auriculomandibular syndrome 2;autoimmune disease, multisystem, childhood onset;autoimmune lymphoproliferative syndrome type 1a;autosomal dominant anhidrotic ectodermal dysplasia;autosomal dominant progressive external ophthalmoplegia with mitochondrial DNA deletions 1 and 3;autosomal dominant torsion dystonia 4;autosomal recessive centronuclear myopathy;autosomal recessive congenital ichthyosis 1, 2, 3, 4A and 4B;autosomal recessive cutis laxa types IA and 1B;autosomal recessive anhidrotic ectodermal dysplasia syndrome;ectodermal dysplasia 11b;hypophidrosis/hair/dentition, autosomal recessive;autosomal recessive hypophosphatemic bone disease;accentre type 3 Feldt-Rieger syndrome;Bainbridge-Lopers syndrome;Banayan-Riley-Rubarka syndrome;PTEN hamartoma syndrome;Baraitser-Winter syndrome 1 and 2;Baracart syndrome;Bardet-Biedl syndrome 1, 11, 16 and 19;Bare lymphocyte syndrome type 2, complementation group E;Prenatal Bartter syndrome type 2;Bartter syndrome type 3, type 3 with hypocalciuria, and type 4;Idiopathic basal ganglia calcification 4;Monethlis;Benign familial hematuria;Benign familial neonatal seizures 1 and 2;Seizures, benign familial neonatal 1, and/or myokymia;Seizures, early childhood epileptic encephalopathy 7;Benign familial neonatal-pediatric seizures;Benign hereditary chorea;Benign scapular periosteal muscular dystrophy with cardiomyopathy;Types A1 and A2 (autosomal dominant) Bernard-Soulier syndrome;Bestrophinopathies (autosomal recessive);Beta Thalassemia;Bethlem myopathy and Bethlem myopathy 2;Vietti crystalline corneal retinal dystrophy;Bile acid synthesis deficiency, congenital 2;Biotinidase deficiency;Birk Barel mental retardation dysmorphic syndrome;Eyelid reduction, ptosis, and entropion;Bloom syndrome;Bielson-Forssmann-Lehmann syndrome;Boucher-Neuhauser syndrome;Papillary disease types A1 and A2;Papillary disease with hypertension;Cerebral small vessel disease with hemorrhage;Branched-chain ketoacid dehydrogenase kinase deficiency;Branched-chain syndromes 2 and 3;Breast cancer, early onset;Breast and ovarian cancer, familial 1, 2, and 4;Corneal fragility syndrome 2;Brody myopathy;Bronchiectasis with or without elevated sweat chloride 3;Brown-Vialet-Van Reale syndrome and Brown-Vialet-Van Reale syndrome Reale syndrome 2;Brugada syndrome;Brugada syndrome 1;Ventricular fibrillation;Paroxysmal familial ventricular fibrillation;Brugada syndrome and Brugada syndrome 4;Long QT syndrome;Sudden cardiac death;Bull eye macular dystrophy;Stargardt disease 4;Cone-rod dystrophy 12;Bullous ichthyosiform erythroderma;Burn-McKeown syndrome;Familial candidiasis 2, 5, 6 and 8;Types I and II glycoprotein glycosylation deficiency syndromes;Carbonic anhydrase VA deficiency due to hyperammonemia;Colon cancer;Cardiomyopathy;Long QT syndrome, LQT1 variant;Fatal infantile cardiac encephalomyopathy due to cytochrome c oxidase deficiency;Cardiomyopathy;Danon disease;Hypertrophic cardiomyopathy;Left ventricular noncompaction cardiomyopathy;Carnevale syndrome;Type 1 Carney complex; carnitine acylcarnitine translocase deficiency; carnitine palmitoyltransferase I, II, II (late-onset) and II (pediatric) deficiency; cataract 1, 4, autosomal dominant, autosomal dominant polymorphism, with microcornea, Coppock-like, juvenile, with microcornea and glycosuria, and nuclear diffuse nonprogressive; catecholaminergic polymorphic ventricular tachycardia; caudate regression syndrome; familial Cd8 deficiency; central core disease; central core instability of chromosomes 1, 9 and 16 and immunodeficiency; childhood cerebellar ataxia and cerebellar ataxia with progressive extraocular muscles ataxia, mental retardation, and balance disorder syndrome 2; cerebral amyloid angiopathy related to APP; cerebral autosomal dominant and recessive arteriopathy with subcortical infarctions and leukoencephalopathy; cerebral cavernous malformations 2; cerebro-oculofacial-skeletal syndrome 2; cerebro-oculofacial-skeletal syndrome; cerebro-retinal microangiopathy with calcifications and cysts; cerebro-lipofuscinosis neuronal 2, 6, 7, and 10; Ch\xc3\xa9diak-Higashi syndrome; adult Chédiak-Higashi syndrome; Charcot-Marie-Tooth disease types 1B, 2B2, 2C, 2F, 2I, and 2U (axonal ), 1C (demyelinating), dominant intermediate C, recessive intermediate A, 2A2, 4C, 4D, 4H, IF, IVF and X; ventral scapular spinal muscular atrophy; distal spinal muscular atrophy, congenital non-progressive; spinal muscular atrophy, distal, autosomal recessive, 5; CHARGE-related; childhood hypophosphatemia; adult hypophosphatemia; cholecystitis; progressive familial intrahepatic cholestasis 3; intrahepatic cholestasis of pregnancy 3; cholestanol storage disease; cholesterol monooxygenase (side chain truncation) deficiency; Blomstrand chondrodysplasia; perforating chondrodysplasia 1, X-linked recessive and 2 X-linked dominant; CHOPS syndrome; chronic granulomatous disease, autosomal recessive cytochrome b positive, types 1 and 2; Chudhry-McCuller syndrome; Primary ciliary dyskinesia, 7, 11, 15, 20 and 22; citrullinemia type I; citrullinemia types I and II; craniofacial fissure; C-like syndrome; Cockayne syndrome type A; primary coenzyme Q10 deficiency, 1, 4 and 7; Coffin-Siris/intellectual disability; Coffin-Lowry syndrome; Cohen syndrome; cold sweats syndrome 1; Cole-Carpenter syndrome 2; combined cellular and humoral immune deficiency with granulomas; d-2- and l-2-hydroxyglutaric acid complexuria; malonic and methylmalonic acid complexuria; combined oxidative phosphorylation deficiency 1, 3, 4, 12, 15 and 25; partial and total 17-alpha- Combined hydroxylase/17,20-lyase deficiency;common variable immunodeficiency 9;partial deficiency of complement component 4 due to c1 inhibitor dysfunction;complement factor B deficiency;cone monochromacytosis;cone-rod dystrophies 2 and 6;cone-rod dystrophies;hereditary amelogenesis imperfecta;congenital adrenal hyperplasia and congenital adrenal hypoplasia, X-linked;congenital amegakaryocytic thrombocytopenia;congenital aniridia;congenital central hypoventilation;Hirschsprung's disease 3;congenital contractile brachioduodenopathy;congenital contractures, hypotonia, and growth retardation of the limbs and face;congenital disorders of glycosylation types 1B, 1D, 1G, 1H, 1J, 1K, 1N, and 1P type 2, type 2C, type 2J, type 2K, type IIm; types I and II congenital dyserythroid anemia; congenital ectodermal dysplasia of the face; congenital erythropoietic porphyria; type 2 congenital generalized lipodystrophy; congenital heart disease, multiple type 2; congenital heart disease; interrupted aortic arch; congenital lipomatous overgrowth, vascular malformations, and epidermal nevi; non-small cell lung cancer; ovarian neoplasms; cardiac conduction disorders, nonspecific; congenital microvillous atrophy; congenital muscular dystrophies; congenital muscular dystrophies due to partial deficiency of LAMA2; congenital muscular dystrophies - dystroglycanopathy with brain and eye abnormalities, types A2, A7, A8, A11, and A14 type;congenital muscular dystrophy - dystroglycanopathy with mental retardation, types B2, B3, B5 and B15;congenital muscular dystrophy - dystroglycanopathy without mental retardation, type B5;congenital hypertrophy-cerebral syndrome;congenital myasthenic syndrome, acetazolamide responsive;congenital myopathy with fiber type imbalance;congenital ocular coloboma;congenital stationary night blindness, types 1A, 1B, 1C, 1E, 1F and 2A;coproporphyria;planokeratosis 2;corneal dystrophy, Fuchs endothelial 4;endothelial corneal dystrophy type 2;corneal fragility keratoglobus, blue sclera and joint hypermobility;Cornelia de Lange syndrome 1 and 5;autosomal dominant coronary artery disease 2;coronary artery disease;hyperalphalipoproteinemia 2; Cortical dysplasia (combined with other brain anomalies) 5 and 6; occipital cortical malformations; corticosteroid-binding globulin deficiency; corticosterone methyloxidase deficiency type 2; Costello syndrome; Cowden syndrome 1; flat coxa; autosomal dominant cranial dysplasia; craniosynostosis 1 and 4; craniosynostosis and dental anomalies; creatine deficiency, X-linked; Crouzon syndrome; cryptophthalmos syndrome; cryptorchidism, unilateral or bilateral; Cushing synostosis; cutaneous melanoma 1; bone dystrophies with severe pulmonary, gastrointestinal, and urinary anomalies cutis laxa with cyanosis;cyanosis, transient neonatal and atypical nephropathy;cystic fibrosis;cystinuria;cytochrome c oxidase I deficiency;cytochrome c oxidase deficiency;D-2-hydroxyglutaric aciduria 2;segmental Darier's disease;hearing loss with cochlear hypoplasia, microtia, and microdontia (LAMM);hearing loss, autosomal dominant 3a, 4, 12, 13, 15, autosomal dominant nonsyndromic sensorineural 17, 20 and 65;hearing loss, autosomal recessive 1A, 2, 3, 6, 8, 9, 12, 15, 16, 18b, 22, 28, 31, 44, 49 , 63, 77, 86 and 89; hearing loss, cochlear, myopic and intellectual disability, no vestibular disorder, autosomal dominant, X-linked 2; 2-methylbutyryl-CoA dehydrogenase deficiency; 3-hydroxyacyl-CoA dehydrogenase deficiency; alpha-mannosidase deficiency; aromatic-L-amino acid decarboxylase deficiency; bisphosphoglycerate mutase deficiency; butyryl-CoA dehydrogenase deficiency; ferroxidase deficiency; galactokinase deficiency; guanidinoacetate methyltransferase deficiency; hyaluronan Glucosaminidase deficiency;ribose-5-phosphate isomerase deficiency;steroid 11-beta-monooxygenase deficiency;UDP glucose-hexose-1-phosphate uridylyltransferase deficiency;xanthine oxidase deficiency;Dejerine-Sottas disease;Charcot-Marie-Tooth disease, ID and IVF;Dejerine-Sottas syndrome, autosomal dominant;dendritic cell, monocyte, B lymphocyte, and natural killer lymphocyte deficiencies;Desbuquois dysplasia 2;Debuquois syndrome;DFNA 2 nonsyndromic hearing loss;diabetes and diabetes insipidus with optic atrophy and deafness;type 2 diabetes, and insulin-dependent 20;Diamond-Blackfan anemia 1, 5, 8, and 10;diarrhoea 3 (secretory sodium, congenital, symptomatic), and 5 (tufting enteropathy) enteropathy);congenital;dicarboxyaminoaciduria;diffuse palmoplantar keratoderma, Bosnian type;digitrenoencephalic syndrome;dihydropteridine reductase deficiency;dilated cardiomyopathy 1A, 1AA, 1C, 1G, 1BB, 1DD, 1FF, 1HH, 1I, 1KK, 1N, 1S, 1Y and 3B;left ventricular noncompaction 3;steroidogenesis disorder due to cytochrome p450 oxidoreductase deficiency;distal arthrogryposis type 2B;distal hereditary motor neuronopathy type 2B;distal myopathy Markesbery-Griggs type;distal spinal muscular atrophy, X-linked 3;double lash-lymphoedema syndrome;dominant tropholytic epidermolysis bullosa with absence of skin;dominant hereditary optic atrophy;Donnay-Barrow syndrome;dopamine Beta-hydroxylase deficiency; dopamine receptor d2, brain density reduction; Dowling-Degos disease 4; Doyne honeycomb retinal dystrophy; Malattia leventi leventinese);Duane syndrome type 2;Dubin-Johnson syndrome;Duchenne muscular dystrophy;Becker muscular dystrophy;Dysfibrinogenemia;Dyskeratosis congenita autosomal dominant and autosomal dominant, 3;Dyskeratosis congenita autosomal recessive 1, 3, 4 and 5;X-linked dyskeratosis congenita;Familial dyskinesia with facial myokymia;Plasminogen molecule disorders;Dystonia 2 (torsion, autosomal recessive), 3 (torsion, X-linked), 5 (dopa-responsive), 10, 12, 16, 25, 26 (myoclonic);Benign familial infantile seizures 2;Early infantile epileptic encephalopathy 2, 4, 7, 9, 10, 11, 13 and 14;Atypical Rett syndrome;Early T-cell precursor acute lymphoblastic leukemia disease;ectodermal dysplasia-epidermolysis bullosa syndrome;ectodermal dysplasia-syndactyly syndrome 1;ectopic phakia, isolated autosomal recessive and dominant;ectodactyly, ectodermal dysplasia, and cleft lip and palate syndrome 3;Ehlers-Danlos syndrome type 7 (autosomal recessive), classic, type 2 (progeroid), hydroxylysine deficiency, type 4, type 4 variant, and due to tenascin X deficiency;Eichsfeldt congenital muscular dystrophy;cerebroosteodysplasia;S cone enhancement syndrome;enlarged vestibular aqueduct syndrome;enterokinase deficiency;epidermodysplasia verruciformis;epidermolysis bullosa simplex and limb-girdle muscular dystrophy, mottled pigmentation simple with pyloric atresia, simple, autosomal recessive, and with pyloric atresia;epidermolytic palmoplantar keratoderma;familial febrile convulsions 8;epilepsy, childhood absence 2, 12 (idiopathic generalized, susceptible), 5 (nocturnal frontal type), nocturnal frontal type 1, partial, with variable foci, progressive myoclonia 3, and X-linked, with variable learning and behavioral disorders;epileptic encephalopathy, childhood onset, early infancy, 1, 19, 23, 25, 30, and 32;epiphyseal dysplasia, multiple, with myopia and conductive hearing loss;transient ataxia type 2;transient pain syndrome, familial, 3;Epstein syndrome;Fechtner syndrome;erythropoietic protoporphyria;estrogen resistance;exudation Fabry disease and Fabry disease, cardiac variant; two combined deficiencies of factors H, VII, X, V, and VIII; factor XIII subunit deficiency; familial adenomatous polyposis 1 and 3; familial amyloid nephropathy with urticaria and hearing loss; familial cold urticaria; familial cerebellar vermis agenesis; familial benign pemphigus; familial breast cancer; breast cancer susceptibility cancer, susceptibility to);osteosarcoma;pancreatic cancer 3;familial cardiomyopathy;familial cold autoinflammatory syndrome 2;familial colorectal cancer;familial exudative vitreoretinopathy, X-linked;familial hemiplegic migraine types 1 and 2;familial hypercholesterolemia;familial hypertrophic cardiomyopathy 1, 2, 3, 4, 7, 10, 23 and 24;familial hypokalemia-hypomagnesemia;familial hypoplastic glomerular cystic kidney disease;familial infantile myasthenia;familial juvenile gout;familial Mediterranean fever, and familial Mediterranean fever, autosomal dominant;familial polypharyngeal syndrome;familial porphyria cutanea tarda;familial pulmonary capillary hemangiomatosis;familial renal glycosuria;familial renal hypouricemia;familial restrictive cardiomyopathy 1;familial types 1 and 3 hyperlipoproteinemia;Fanconi anemia, complement groups E, I, N and O;Fanconi-Bickel syndrome;Favism susceptibility (Favism, susceptibility to);febrile convulsions, familial, 11;Feingold syndrome 1;fetal hemoglobin quantitative trait locus 1;FG syndrome and FG syndrome 4;fibrosis of extraocular muscles, congenital, 1,2,3a (with or without extraocular involvement), 3b;fish eye disease;Fleck corneal dystrophy;Floating-Haber syndrome;focal epilepsy with speech disorder with or without mental retardation;focal segmental glomerulosclerosis 5;forebrain coloboma;Frank-ter-Haar syndrome;Borrone Di Rocco Crovato syndrome;Frasier syndrome;Wilms tumor 1;Freeman-Sheldon syndrome;Frontometaphyseal dysplasia 1 and 3;Frontotemporal dementia;Frontotemporal dementia and/or amyotrophic lateral sclerosis 3 and 4;Frontotemporal dementia chromosome 3 linked and frontotemporal dementia ubiquitin positive;Fructose biphosphatase deficiency;Fuhrmann syndrome;Gamma-aminobutyric acid transaminase deficiency;Gamstorp-Wohlfart syndrome; Gaucher disease type 1 and subacute neuropathic;familial horizontal gaze palsy with progressive scoliosis;generalized dominant dystrophic epidermolysis bullosa;generalized epilepsy with febrile seizures plus type 3, 1, 2;Lennox-Gastaut epileptic encephalopathy;giant axonal neuropathy;Glanzmann thrombosis;glaucoma 1, open angle, e, F and G;glaucoma 3, primary congenital, d;congenital glaucoma, and congenital glaucoma, coloboma;glaucoma, primary open angle, early-onset;glioma susceptibility 1;glucose transporter type 1 deficiency syndrome;glucose-6-phosphate transport deficiency;GLUT1 deficiency syndrome 2;idiopathic generalized epilepsy susceptibility, 12 ;glutamate forminotransferase deficiency;glutaric acidemia IIA and IIB;glutaric aciduria type 1;glutathione synthetase deficiency;glycogen storage diseases types 0 (muscle), II (adult form), IXa2, IXc, 1A; types II, IV, IV (combined hepatic and myopathic), V and VI;Goldman-Fabre syndrome;Gordon syndrome;Gorlin syndrome;holoprosencephaly sequence;holoprosencephaly 7;granulomatous disease, chronic, X-linked, variant;granulosa cell tumor of the ovary;gray platelet syndrome;Griselli syndrome type 3;Grenau corneal dystrophy type I;growth and mental retardation, mandibulofacial dysmorphism, microcephaly, and Cleft palate;growth hormone deficiency with pituitary abnormalities;growth hormone insensitivity with immunodeficiency;GTP cyclohydrolase I deficiency;Hajj-Cheney syndrome;hand-foot-uterine syndrome;hearing impairment;infantile capillary hemangioma;hematological neoplasms;hemochromatosis types 1, 2B, and 3;microvascular complications of diabetes mellitus 7;transferrin serum level quantitative trait locus 2;hemoglobin H disease, nondeficient;hemolytic anemia, nonspherocytic, due to glucose phosphate isomerase deficiency;hemophagocytic lymphohistiocytosis, familial, 2;hemophagocytic lymphohistiocytosis, familial, 3;heparin cofactor II deficiency;hereditary acrodermatitis enteropathica;hereditary breast and ovarian cancer Cancer syndromes; ataxia-telangiectasia-like disorder; hereditary diffuse gastric cancer; hereditary diffuse leukoencephalopathy with spheroids; hereditary factor II, IX, and VIII deficiency; hereditary hemorrhagic telangiectasia type 2; hereditary insensitivity to pain with anhidrosis; hereditary lymphedema type I; hereditary motor and sensory neuropathy with optic atrophy; hereditary myopathy with early respiratory failure; hereditary neuralgic amyotrophy; hereditary nonpolyposis colon neoplasms; Lynch syndrome I and II; hereditary pancreatitis; chronic pancreatitis susceptibility; hereditary sensory and autonomic neuropathy types IIB and IIA; hereditary sideroblastic anemia; Hermansky-Podlak syndromes 1, 3, 4, and 6; visceral paresis position, 2, 4, and 6, autosomal; heterotaxy, X-linked; histiocytic medullary reticulosis; heterotopia; histiocytosis-lymphadenopathy plus syndrome; holocarboxylase synthase deficiency; holoprosencephaly 2, 3, 7, and 9; Holt-Oram syndrome; homocysteinemia due to MTHFR deficiency, CBS deficiency, and homocysteinuria, pyridoxine responsive; homocysteinuria-megaloblastic anemia, cblE complementation type, due to abnormal cobalamin metabolism; Howel-Evans syndrome; Hurler syndrome; Hutchinson-Gilford syndrome; hydrocephalus; hyperammonemia, type III; hypercholesterolemia hypercholesterolemia, autosomal recessive;hyperconvulsant 2 and hereditary hyperconvulsant 2;hyperferritinemia cataract syndrome;hyperglycinuria;hyperimmunoglobulin D with periodic fever;mevalonic aciduria;hyperimmunoglobulin E syndrome;familial hyperinsulinemic hypoglycemia 3, 4 and 5;hyperinsulinemia-hyperammonemia syndrome;hyperlysinemia;hypermanganemia with dystonia, polycythemia, and cirrhosis;hyperornithinemic-hyperammonemia-homocitrullinuria syndrome;hyperparathyroidism 1 and 2;hyperparathyroidism, neonatal severe;partial pts deficiency, BH4 deficiency, D, non Hyperphenylalaninemia, BH4 deficiency, A due to PKU; hyperphosphatemia with mental retardation syndromes 2, 3, and 4; polychondrodysplasia; hypobetalipoproteinemia, familial, associated with APOB32; hypocalcemia, autosomal dominant 1; hypocalciuric hypercalcemia, familial, types 1 and 3; hypochondroplasia; hypochromic microcytic anemia with iron overload; hypoglycemia with hepatic glycogen synthase deficiency; hypogonadotropic hypogonadism with or without anosmia 11; anhidrotic ectodermal dysplasia with immunodeficiency; X-linked ectodermal dysplasia with hypohidrosis; hypokalemic periodic paralysis 1 and 2 ;hypomagnesemia 1, intestinal;hypomagnesemia, seizures, and mental retardation;hypomedullary leukodystrophy 7;hypoplastic left heart syndrome;atrioventricular septal defect and common atrioventricular junction;hypospadias 1 and 2, X-linked;hypothyroidism, congenital nongoiter, 1;hypotrichosis 8 and 12;hypotrichosis-lymphoedema-vasoectasia syndrome;I blood group system;bullous ichthyosis of Siemens type;exfoliative ichthyosis;ichthyosis of prematurity syndrome;idiopathic basal ganglia calcification 5;idiopathic fibrosing alveolitis, chronic type;dyskeratosis congenita, autosomal dominant, 2 and 5;idiopathic hypercalcemia of infancy;immune dysfunction with T-cell inactivation due to impaired calcium influx 2; Immunodeficiency15,16,19,30,31C,38,40,8 with hyper-IgM, due to defects in CD3-zeta, and with magnesium deficiency, X-linked, Epstein-Barr virus infection, and neoplasia; immunodeficiency-centromeric instability-facial malformation syndrome2; inclusion body myopathy2 and 3; Nonaka myopathy; infantile spasms and paroxysmal chorea, familial; infantile cortical hyperostosis; infantile GM1 gangliosidosis; infantile hypophosphatasia; infantile nephronophthisis; infantile nystagmus, X-linked; infantile Parkinson's disease-dystonia; infertility associated with polyturias and excess DNA; insulin resistance; insulin-resistant diabetes and black table erythroderma; insulin-dependent diabetes mellitus secretory diarrhea syndrome; interstitial nephritis, karyomegalic; intrauterine growth retardation, metaphyseal dysplasia, congenital adrenal hypoplasia, and genital anomalies; iodotyrosine binding deficiency; IRAK4 deficiency; iris angle dysplasia dominant and type 1; brain iron accumulation; ischiopatellar dysplasia; islet cell hyperplasia; isolated 17,20-lyase deficiency; isolated lutropin deficiency; isovaleryl-CoA dehydrogenase deficiency; Jankovic-Rivera syndrome; Jarvell and Lange-Nielsen syndromes 2; Joubert syndromes 1, 6, 7, 9/15 (bigénicent), 14, 16, and 17, and orofaciodigital syndrome xiv; Herlitz's joint syndrome Syndesmotic epidermolysis bullosa;Juvenile GM>1<gangliosidosis;Juvenile polyposis syndrome;Juvenile polyposis/hereditary hemorrhagic telangiectasia syndrome;Juvenile retinitis;Kabuki makeup syndrome;Kalmann syndrome 1, 2 and 6;Delayed puberty;Kanzaki disease;Karak syndrome;Kartagener syndrome;Kenny-Cafe syndrome type 2;Köppen-Lubinsky syndrome;Keratoconus 1;Folliculor keratosis;Palmoplantar pustulosis 1;Kindler syndrome;L-2-hydroxyglutaric aciduria;Larsen syndrome, dominant;Lattice corneal dystrophy type III;Leber amaurosis;Zellweger syndrome;Peroxisome biogenesis disorders;Tu Wellweger syndrome spectrum;Leber congenital amaurosis 11, 12, 13, 16, 4, 7 and 9;Leber optic atrophy;Aminoglycoside-induced hearing loss;Hearing loss, nonsyndromic, sensorineural, mitochondrial;Left ventricular noncompaction 5;Leigh-right axis anomaly;Leigh disease;Mitochondrial short-chain enoyl-CoA hydratase 1 deficiency;Leigh syndrome due to mitochondrial complex I deficiency;Reiner disease;Lelly-Weil chondro-osseous dysplasia;Lethal congenital contracture syndrome 6;Leukocyte adhesion deficiency types I and III;Leukodystrophy, hypomyelination, 11 and 6;Leukoencephalopathy, with ataxia, with brainstem and spinal cord involvement and elevated lactate, with loss of white matter, and progressive , with ovarian failure;white nails;dementia with Lewy bodies;Liechtenstein-Knorr syndrome;Li-Fraumeni syndrome 1;Lig4 syndrome;limb-girdle muscular dystrophy types 1B, 2A, 2B, 2D, C1, C5, C9, C14;congenital muscular dystrophy-dystroglycanopathy with brain and eye abnormalities, types A14 and B14;combined lipase deficiency;lipoproteinosis;lipodystrophy, familial partial, types 2 and 3;liary dysencephaly 1,2 (X-linked), 3,6 (with microcephaly), X-linked;subcortical band heterotopia, X-linked;acute infantile liver failure;Loeys-Dietz syndrome 1,2,3;long QT syndrome 1,2,2/9,2/5,( 2, genetic), 3, 5 and 5, acquired, susceptible;lung cancer;lymphoedema, hereditary, id;lymphoedema, primary, with myelodysplasia;lymphoproliferative syndrome 1, 1 (X-linked) and 2;lysosomal acid lipase deficiency;macrophagia, gigantism, facial dysmorphism syndrome;macular degeneration, vitelliform, adult onset;malignant hyperthermia type 1;malignant lymphoma, non-Hodgkin;malignant melanoma;malignant tumor of the prostate;mandibular dysplasia;mandibular dysplasia with lipodystrophy types A or B, atypical;mandibulofacial dysplasia, Treacher-Collins type, autosomal recessive;mannose-binding protein deficiency;maple syrup urine disease types 1A and 3;Malden-Walker-like syndrome;malf Fan syndrome;Marinesco-Sj\xc3\xb6gren syndrome;Martsolf syndrome;Maturity-onset diabetes mellitus, types 1, 2, 11, 3 and 9;May-Hegglin syndrome;MYH9-related disorders;Sebastian syndrome;McCun-Albright syndrome;Somatic adenoma;Sex cord-stromal tumor;Cushing syndrome;Macksick-Kauffman syndrome;McLeod neuroerythrocytosis syndrome;Meckel-Gruber syndrome;Medium-chain acyl-coenzyme A dehydrogenase deficiency;Medulloblastoma;Cerebral leukoencephalopathy with subcortical cysts 1 and 2a;Macrocephaly-congenital marbled cutis;PIK3CA-related overgrowth spectrum;Megalencephaly-polymicrogyria-polydactyly-hydrocephalus syndrome 2;megaloblastic anemia, thiamine-responsive, with diabetes mellitus, and sensorineural hearing loss;Meyer-Gorlin syndrome 1 and 4;Melnick-Needles syndrome;meningioma;mental retardation, X-linked, 3, 21, 30, and 72;mental retardation and microcephaly, with pontine and cerebellar hypoplasia;X-linked mental retardation syndrome 5;mental retardation, maxillary prognathism, and strabismus;mental retardation, autosomal dominant 12, 13, 15, 24, 3, 30, 4, 5, 6, and 9;mental retardation, autosomal recessive 15, 44, 46, and 5;mental retardation, stereotypical behavior, epilepsy, and/or brain malformations;mental retardation, syndromic, Claes-Jensen, X-linked;mental retardation, X-linked, nonspecific merosin-deficient congenital muscular dystrophy;metachromatic leukodystrophy juvenile, late infantile, and adult;metachromatic leukodystrophy;metamorphic bone dysplasia;methemoglobinemia types I and 2;methionine adenosyltransferase deficiency, autosomal dominant;methylmalonic acidemia with homocystinuria;methylmalonic aciduria type cblB;methylmalonic aciduria due to methylmalonyl-CoA mutase deficiency;methylmalonic aciduria type mut(0);microcephalic osteodysplasia primordial dwarfism type 2;microcephaly with or without chorioretinopathy, lymphedema, or mental retardation ;microcephaly, hiatal hernia, and nephrotic syndrome;microcephaly;hypoplasia of the corpus callosum;spastic paraplegia50, autosomal recessive;generalized developmental delay;CNS hypomyelination;cerebral atrophy;microcephaly, normal intelligence and immunodeficiency;microcephaly-capillary malformation syndrome;microcytic anemia;syndromic microphthalmia5,7 and 9;microphthalmia, isolated3,5,6,8, and with coloboma6;microcytosis;migraine, familial hemiplegic;Miller syndrome;minicore myopathy with external ophthalmoplegia;congenital myopathy with core;Mitchell-Riley syndrome;mitochondrial 3-hydroxy-3-methylglutaryl-CoA synthetase deficiency;mitochondrial complexes I, II, III, III (nuclear Mitochondrial DNA depletion syndromes 11, 12 (cardiomyopathic type), 2, 4B (MNGIE type), 8B (MNGIE type); mitochondrial DNA depletion syndromes 3 and 7, hepatocerebral type and 13 (encephalomyopathic type); mitochondrial phosphate carrier and pyruvate carrier deficiency; mitochondrial trifunctional protein deficiency; long-chain 3-hydroxyacyl-CoA dehydrogenase deficiency; Miyoshi muscular dystrophy 1; distal myopathy with pretibial involvement; Mohr-Tranebjaerg syndrome; molybdenum cofactor deficiency, complementation group A; Mowat-Wilson syndrome; mucolipidosis III gamma; mucopolypeptide Saccharidosis type VI, type VI (severe) and type VII;mucopolysaccharidosis, MPS-IH/S, MPS-II, MPS-III-A, MPS-III-B, MPS-III-C, MPS-IV-A, MPS-IV-B;retinitis pigmentosa 73;gangliosidosis GM1 type 1 (with cardiac involvement) 3;multicentric osteolytic nephropathy;multicentric osteolysis, nodular disease and arthropathy;multiple congenital anomalies;atrial septal defect 2;multiple congenital anomalies-hypotonia-seizure syndrome 3;multiple skin and mucosal venous malformations;multiple endocrine neoplasia types 1 and 4;multiple epiphyseal dysplasia type 5 or dominant;multiple intestinal atresia;multiple pterygium syndrome Escobar type;multiple sulfatase deficiency;multiple Synostosis syndrome 3;muscle AMP guanine oxidase deficiency;muscle oculoencephalopathy;muscular dystrophy, congenital, megaconoid type;myasthenia, familial childhood, 1;congenital myasthenic syndrome 11, associated with acetylcholine receptor deficiency;congenital myasthenic syndrome 17, without 2A (slow channel), 4B (fast channel) and tubular assembly;myeloperoxidase deficiency;MYH-associated polyposis;endometrial cancer;myocardial infarction 1;myoclonic dystonia;myoclonic-atonic epilepsy;red rag fiber myoclonic epilepsy;myofibrillar myopathy 1 and ZASP associated;myoglobinuria, acute relapsing, autosomal recessive;myoneurogastroenteric cerebral cerebellar ataxia with progressive external ophthalmoplegia;mitochondrial DNA depletion syndrome 4B, MNGIE type;myopathy, central, 1, congenital, with excess muscle spindles, distal, 1, lactic acidosis, and sideroblastic anemia 1;mitochondrial progressive with congenital cataracts, hearing loss, and developmental delay, and tubular aggregates, 2;myopia 6;myosclerosis, autosomal recessive;myotonia congenita;myotonia congenita, autosomal dominant and recessive;nail-patella syndrome;Nance-Hollan syndrome;microphthalmia 2;Navajo neurohepatopathy;nemaline myopathy 3 and 9;neonatal hypotonia;intellectual disability;seizures;language delay;mental retardation, autosomal dominant 31;citrine deficiency Neonatal intrahepatic cholestasis caused by nephropathy;nephrogenic diabetes insipidus, nephrogenic diabetes insipidus, X-linked;nephrolithiasis/osteoporosis, hypophosphatemic, 2;nephronophthisis 13, 15 and 4;infertility;cerebro-ocular-renal syndrome (nephronophthisis, oculomotor ataxia, and cerebellar abnormalities);nephrotic syndrome, types 3, 5, with or without ocular abnormalities, types 7 and 9;Nester-Greermoprogeria syndrome;Neu-Laxova syndrome 1;neurodegeneration with brain iron accumulation 4 and 6;neuroferritinopathy;neurofibromatosis, types 1 and 2;neurofibrosarcoma;neurohypophyseal diabetes insipidus;neuropathy, hereditary sensory, type IC;neutral 1 amino acid transport disorder;myopathy Neutral lipid storage disease with leukemia;Neutrophil immunodeficiency syndrome;Nicolades-Baraist syndrome;Niemann-Pick disease types C1, C2, A, and C1, adult type;Nonketotic hyperglycinemia;Noonan syndrome 1 and 4, LEOPARD syndrome 1;Noonan-like disorder with or without juvenile myelomonocytic leukemia;Emokalemic periodic paralysis, potassium sensitivity;Norm disease;Epilepsy, deafness, and mental retardation syndrome;Mental retardation, X-linked 102 and syndromic 13;Obesity;Ocular albinism, type I;Oculocutaneous albinism types 1B, 3, and 4;Oculodentodigital dysplasia;Odontohypophosphatasia;Odonto-hair-limb syndrome syndrome); macrostomia; hypodontia-colorectal cancer syndrome; Opitz G/BBB syndrome; optic atrophy 9; orofacial dactyly syndrome; ornithine aminotransferase deficiency; orofacial clefts 11 and 7; lip/palate ectodermal dysplasia syndrome; Olstavic-Lindemann-Solberg syndrome; osteoarthritis with mild chondrodysplasia; osteochondritis dissecans; osteogenesis imperfecta types 12, 5, 7, 8, I, and III, with normal sclera, dominant, recessive perinatal lethal; craniosclerosis striated osteomyelopathy with osteoporosis;autosomal dominant osteopetrosis types 1 and 2, recessive type 4, recessive type 1, recessive type 6;osteoporosis with pseudoglioma;otopalatodactyl syndrome types I and II;ovarian hypoplasia 1;ovarian leukoencephalopathy;congenital pachyonychia types 4 and 2;Paget's disease of bone, familial;Pallister-Hall syndrome;palmoplantar keratoderma, non-epidermolytic, focal or diffuse;pancreatic agenesis and congenital heart disease;Papillon-Lef\xc3\xa8vre syndrome;paraganglioma 3;von Oleinburg Congenital anomaly myotonia of Eulenburg;parathyroid carcinoma;Parkinson's disease 14, 15, 19 (early onset), 2, 20 (early onset), 6, (autosomal recessive early onset) and 9;localized albinism;hypoxanthine-guanine phosphoribosyltransferase partial deficiency;pattern dystrophy of the retinal pigment epithelium;PC-K6a;Pelizaeus-Merzbacher disease;Pendred syndrome;peripheral demyelinating neuropathy, central demyelinating;Hirschsprung's disease;permanent neonatal diabetes mellitus;permanent neonatal diabetes mellitus, with neurological features;neonatal insulin-dependent diabetes mellitus;maturity-onset diabetes mellitus of the young, Type 2;Peroxisome biogenesis disorders 14B, 2A, 4A, 5B, 6A, 7A and 7B;Perot syndrome 4;Perry syndrome;Persistent hyperinsulinemic hypoglycemia of the newborn;Familial hyperinsulinism;Phenotype;Phenylketonuria;Pheochromocytoma;Hereditary paraganglioma-pheochromocytoma syndrome;Paraganglioma 1;Intestinal carcinoid tumors;Cowden syndrome 3;Phosphoglycerate dehydrogenase deficiency;Phosphoglycerate kinase 1 deficiency;Photosensitive sulfur deficiency hair dystrophy;Phytanic acid storage disease;Pick's disease;Pearson syndrome;Pigmentary retinal dystrophy;Pigmented nodular adrenal corticopathy aberrant, primary, 1;calcifying epithelioma;Pitt-Hopkins syndrome;pituitary-dependent hypercortisolism;pituitary hormone deficiency, combined types 1, 2, 3, and 4;plasminogen activator inhibitor type 1 deficiency;plasminogen deficiency, type I;platelet-type bleeding disorders 15 and 8;poikiloderma, with hereditary fibrosis, tendon contractures, myopathy, and pulmonary fibrosis;polycystic kidney disease 2, adult and infantile types;polycystic lipomembranous dysplasia with sclerosing leukoencephalopathy;polyglucosan body myopathy 1 with or without immunodeficiency;polymicrogyria, asymmetric, bilateral frontoparietal;polyneuritis, Hearing loss, ataxia, retinitis pigmentosa, and cataract;pontocerebellar hypoplasia type 4;popliteal fold syndrome;porencephaly 2;porokeratosis 8, contagious superficial chemoactive type;porphobilinogen synthase deficiency;porphyria cutanea tarda;spinal ataxia with retinitis pigmentosa;posterior polar cataract type 2;Prader-Willi-like syndrome;premature ovarian failure 4, 5, 7, and 9;primary autosomal recessive microcephaly 10, 2, 3, and 5;primary ciliary dyskinesia 24;primary dilated cardiomyopathy;left heart noncompaction 6;4,left heart noncompaction 10;paroxysmal atrial fibrillation;primary hyperoxaluria, types I and III;primary hypertrophic bone Arthropathy, autosomal recessive 2;primary hypomagnesemia;primary open-angle glaucoma early-onset 1;primary pulmonary hypertension;Primrose syndrome;progressive familial heart block type 1B;progressive familial intrahepatic cholestasis 2 and 3;progressive intrahepatic cholestasis;progressive myoclonic epilepsy with ataxia;progressive pseudorheumatic dysplasia;progressive sclerosing poliodystrophy;prolidase deficiency;proline dehydrogenase deficiency;schizophrenia 4;propazine deficiency, X-linked;propionic acidemia;proprotein convertase 1/3 deficiency;prostate cancer, hereditary, 2;protan deficiency;proteinuria;Finland congenital nephrotic syndrome; Proteus syndrome; breast cancer; pseudoachondroplasia spondyloepiphyseal dysplasia; pseudohypoaldosteronism type 1 autosomal dominant and recessive and type 2; pseudohypoparathyroidism type 1A; pseudopseudohypoparathyroidism; pseudoneonatal adrenoleukodystrophy; pseudoprimary hyperaldosteronism; pseudoxanthoma elasticum; generalized arterial calcification of infancy 2; pseudoxanthoma elasticum-like disorder with multiple coagulation factor deficiencies; psoriasis susceptibility 2; PTEN hamartoma syndrome; pulmonary arterial hypertension associated with hereditary hemorrhagic telangiectasia; pulmonary fibrosis and/or bone marrow failure, telomere-related, 1 and and 3; pulmonary hypertension, primary, with hereditary hemorrhagic telangiectasia; 1; purine-nucleoside phosphorylase deficiency; pyruvate carboxylase deficiency; pyruvate dehydrogenase E1-alpha deficiency; erythrocyte pyruvate kinase deficiency; Raine syndrome; rasopathy; recessive dystrophic epidermolysis bullosa; nail disorder, nonsyndromic congenital, 8; Reifenstein syndrome; renal coloboma syndrome; renal dysplasia; renal dysplasia, pigmentary retinal dystrophy, cerebellar ataxia, and skeletal dysplasia; with delayed sensorineural hearing loss or with hemolytic anemia renal tubular acidosis, distal, autosomal recessive; renal tubular acidosis, proximal, with ocular abnormalities and mental retardation; cone dystrophy 3B; retinitis pigmentosa; retinitis pigmentosa 10, 11, 12, 14, 15, 17, and 19; retinitis pigmentosa 2, 20, 25, 35, 36, 38, 39, 4, 40, 43, 45, 48, 66, 7, 70, 72; retinoblastoma; Rett's disorder; rhabdoid tumor predisposition syndrome 2; rhegmatogenous retinal detachment, autosomal dominant; rhabdoid chondrodysplasia punctata types 2 and 3; Roberts-SC azoobium limb anomaly syndrome; Robinow-Solauf Sorauf syndrome;Robinow syndrome, autosomal recessive, autosomal recessive with brachypolydactyly;Rothmund-Thomson syndrome;Lapadellino syndrome;RRM2B-related mitochondrial disease;Rubinstein-Taybi syndrome;Salla disease;Sandhoff disease, adult and infantile;Sarcoidosis, early onset;Blau syndrome;Schindler disease, type 1;schizencephaly;schizophrenia 15;cochlear-pelvic dysplasia;schwannomatosis 2;Schwartz-Jampel syndrome type 1;keratosclerosis, autosomal recessive;sclerosteosis;secondary hypothyroidism;Segawa syndrome, autosomal recessive;Senior-Loken syndromes 4 and 5;sensory ataxic neuropathies Qi, dysarthria, and ophthalmoplegia;sepiapterin reductase deficiency;SeSAME syndrome;severe combined immunodeficiency due to ADA deficiency, with microcephaly, growth retardation, and sensitivity to ionizing radiation, atypical, autosomal recessive, T cell negative, B cell positive, NK cell negative with NK cell positive;severe congenital neutropenia;severe congenital neutropenia 3, autosomal recessive or dominant;severe congenital neutropenia and 6, autosomal recessive;severe myoclonic epilepsy of infancy;generalized epilepsy with febrile convulsions, types 1 and 2;severe X-linked myotubular myopathy;short QT syndrome type 3;short stature with nonspecific skeletal abnormalities;short stature, auditory canal stenosis , mandibular hypoplasia, skeletal abnormalities; short stature, onychodysplasia, facial dysmorphism, and hypotrichosis; primordial dwarfism; short-costothoracic dysplasia 11 or 3 with or without polydactyly; sialidosis types I and II; Silver spastic paraplegia syndrome; nerve conduction velocity delay, autosomal dominant; Smith-Lemli-Opitz syndrome; Snyder-Robinson syndrome; growth hormone-secreting adenoma; prolactinoma; familial, predisposition to pituitary adenoma; Sotos syndrome 1 or 2; spastic ataxia 5, autosomal recessive; Charlevoix-Saguenay type 1,10 or 11, autosomal recessive; amyotrophic lateral sclerosis type 5; spastic paraplegia 15,2,3,35,39,4, autosomal dominant , 55, autosomal recessive, and 5A; bile acid synthesis disorder, congenital, 3; spermatogenesis impair, 11, 3, and 8; spherocytosis types 4 and 5; spherocytosis, spherocytosis, 2, autosomal dominant; spinal muscular atrophy, type II; spinocerebellar ataxia, 14, 21, 35, 40, and 6; spinocerebellar ataxia, autosomal recessive, 1 and 16; splenic hypoplasia; spinocarpal synostosis syndrome; spondylopalmal dysplasia, Ehlers-Danlos-like, with immune dysregulation, aggrecan type, with congenital joint dislocation, brachy-hand type, Sedaghatian type, with cone-rod dystrophy, and Kozlowski type; twisted dwarfism;Stargardt disease 1;cone-rod dystrophy 3;Stickler syndrome type 1;Kniest dysplasia;Stickler syndrome, types 1 (nonsyndromic ocular) and 4;Sting-associated vasculopathy, childhood onset;Storm-Olken syndrome;Sturge-Weber syndrome, capillary malformation, congenital, 1;succinyl-CoA acetoacetate transferase deficiency;sucrase-isomaltase deficiency;sudden infant death syndrome;subcutaneous Sulfate oxidase deficiency, isolated;Supravalvular aortic stenosis;Pulmonary surfactant metabolic dysfunction, 2 and 3;Synopsis, proximal, 1b;Senanyi-Lenz syndactyly;Syndactyly type 3;Syndromic X-linked mental retardation 16;Equilateral talipes;Tangier disease;TARP syndrome;Tay-Sachs disease, B1 variant;Gm2 gangliosidosis (adult);Gm2 gangliosidosis (adult onset);Temtamy syndrome;Tenorio syndrome;Epiphyseal dysplasia formation;testosterone 17-beta-dehydrogenase deficiency;atetramelia, autosomal recessive;tetralogy of Fallot;hypoplastic left heart syndrome 2;aneurysm;cardiac and great vascular anomalies;ventricular septal defect 1;Thiel-Behnke corneal dystrophy;thoracic aortic aneurysm and aortic dissection;marfanoid habitus;3M syndrome 2;thrombocytopenia, platelet dysfunction, hemolysis, and globin synthesis imbalance;thrombocytopenia, X-linked;thrombosis, hereditary, due to protein C deficiency, autosomal dominant and recessive;thyroid agenesis;thyroid cancer, follicular;thyroid hormone metabolism disorders;thyroid hormone resistance, generalized, autosomal dominant;thyrotoxic periodic paralysis and thyrotoxic periodic paralysis 2;cytotropin-releasing hormone resistance, generalized;timothy syndrome;tumor necrosis factor receptor-associated periodic fever syndrome (TRAPS);tooth agenesis, selective, 3 and 4;polymorphic ventricular tachycardia (Torsades de pointes);Townes-Brocks branchio-oto-nephroid syndrome;Epidermolysis bullosa transientes of the newborn;Treacher Collins syndrome 1;Lymphocytosis with mental retardation, dwarfism, and pigmentary degeneration of the retina;Trigeminal ganglion dysplasia type I;Trigeminal ganglion syndrome type 3;Trimethylaminuria;Tuberous sclerosis syndrome;Lymphangioleiomyomatosis;Tuberous sclerosis complex 1 and 2;Tyrosinase-negative oculocutaneous albinism;Tyrosinase-positive oculocutaneous albinism;Tyrosinemia type I;UDP-glucose-4-epimerase deficiency;Ullrich congenital muscular dystrophy;Ulnar-peroneal deficiency with severe limb defects;Upshaw-Schulman syndrome;Urocanic acid hydratase deficiency;Usher syndrome, types 1, 1B, 1D, 1G, 2A, 2C, and 2D;Retinitis pigmentosa 39;UVA-sensitive syndrome;Van der Woude Woude syndrome; Van Maldergem syndrome 2; Henkam lymphangiectasia-lymphedema syndrome 2; variant porphyria; ventricular enlargement with cystic kidney disease; Verheij syndrome; very long-chain acyl-CoA dehydrogenase deficiency; vesicoureteral reflux 8; situs inversus 5, autosomal; abdominal myopathy; vitamin D-dependent rickets, types 1 and 2; vitellogenic dystrophy; von Willebrand disease types 2M and 3; Waardenburg syndrome types 1, 4C, and 2E (with neurological involvement); Klein-Waardenburg syndrome; Walker-Warburg congenital muscular dystrophy; Warburg-Micro syndrome 2 and 4; IgE , hypogammaglobulinemia, infection, and myeloid cellular pools;Weaver syndrome;Weill-Marchesani syndromes 1 and 3;Weill-Marchesani-like syndromes;Weissenbacher-Zweymuller syndrome;Werdnig-Hoffmann disease;Charcot-Marie-Tooth disease;Werner syndrome;WFS1-related disorders;Wiedemann-Steiner syndrome;Wilson's disease;Wolfram-like syndromes, autosomal dominant;Worth disease;van Buchem disease type 2;xeroderma pigmentosum, complementation groups b, D, E, and G;X-linked agammaglobulinemia;X-linked Hereditary motor and sensory neuropathies; X-linked ichthyosis with sterylsulfatase deficiency; X-linked periventricular heterotopic gray matter; Otopalatodactyl syndrome, type I; X-linked severe combined immunodeficiency; Zimmermann-Laband syndrome and Zimmermann-Laband syndrome 2; and Zonular powdery cataract 3.

標的ヌクレオチド配列は、疾患、障害、または疾病に関連する標的配列(例えば点変異)を含み得る。標的配列は疾患、障害、または疾病に関連するTからC(またはAからG)の点変異を含み得、変異体C塩基の脱アミノ化は、疾患、障害、または疾病に関連しない配列へのミスマッチ修復によって媒介される修正をもたらす。標的配列は疾患、障害、または疾病に関連するGからA(またはCからT)の点変異を含み得、変異体A塩基の脱アミノ化は、疾患、障害、または疾病に関連しない配列へのミスマッチ修復によって媒介される修正をもたらす。標的配列はタンパク質をコードし得、点変異がコドンにあるところでは、野生型コドンと比較して変異体コドンによってコードされるアミノ酸の変化をもたらす。標的配列はスプライス部位にもまたあり得、点変異は野生型転写物と比較してmRNA転写物のスプライシングの変化をもたらす。加えて、標的は遺伝子の非コード配列、例えばプロモーターにもまたあり得、点変異は遺伝子の増大または減少した発現をもたらす。 The target nucleotide sequence may include a target sequence (eg, a point mutation) associated with a disease, disorder, or disease. The target sequence may contain a T to C (or A to G) point mutation that is associated with a disease, disorder, or illness, and deamination of the mutant C base leads to a sequence that is not associated with the disease, disorder, or disease. resulting in correction mediated by mismatch repair. The target sequence may contain a G to A (or C to T) point mutation that is associated with a disease, disorder, or illness, and deamination of the mutant A base leads to a sequence that is not associated with the disease, disorder, or illness. resulting in correction mediated by mismatch repair. The target sequence may encode a protein, and where a point mutation is in a codon, it results in a change in the amino acid encoded by the mutant codon compared to the wild-type codon. Target sequences can also be at splice sites, with point mutations resulting in altered splicing of the mRNA transcript compared to the wild-type transcript. In addition, targets can also be in non-coding sequences of genes, such as promoters, where point mutations result in increased or decreased expression of the gene.

それゆえに、いくつかの側面では、変異体Cの脱アミノ化は変異体コドンによってコードされるアミノ酸の変化をもたらし、これはいくつかのケースでは野生型アミノ酸の発現をもたらし得る。他の側面では、変異体Aの脱アミノ化は変異体コドンによってコードされるアミノ酸の変化をもたらし、これはいくつかのケースでは野生型アミノ酸の発現をもたらし得る。 Therefore, in some aspects, deamination of variant C results in a change in the amino acid encoded by the variant codon, which in some cases may result in expression of the wild-type amino acid. In other aspects, deamination of variant A results in a change in the amino acid encoded by the variant codon, which in some cases may result in expression of the wild-type amino acid.

細胞を組成物またはrAAV粒子と接触させることが関わる本明細書に記載の方法は、in vitroで、エクスビボで、またはインビボで生起し得る。ある態様において、接触させるステップは対象に生起する。ある態様において、対象は疾患、障害、または疾病と診断されている。 Methods described herein that involve contacting cells with compositions or rAAV particles can occur in vitro, ex vivo, or in vivo. In some embodiments, the contacting step occurs to the subject. In certain embodiments, the subject has been diagnosed with a disease, disorder, or disease.

いくつかの態様では、本明細書に開示の方法には、哺乳類細胞を組成物またはrAAV粒子と接触させることが関わる。具体的な態様では、方法には、網膜細胞、皮質細胞、または小脳細胞に接触することが関わる。 In some embodiments, the methods disclosed herein involve contacting a mammalian cell with a composition or rAAV particle. In specific embodiments, the methods involve contacting retinal cells, cortical cells, or cerebellar cells.

本明細書に記載の方法を用いて送達される分裂されたCas9タンパク質または分裂されたプライム編集因子は、好ましくは、元々のCas9タンパク質またはプライム編集因子(すなわち、丸ごと細胞に送達または細胞によって発現される未分裂のタンパク質)と比較して遜色ない活性を有する。例えば、分裂されたCas9タンパク質または分裂されたプライム編集因子は、元々のCas9タンパク質またはプライム編集因子の活性の少なくとも50%(例えば、少なくとも50%、少なくとも60%、少なくとも70%、少なくとも80%、少なくとも90%、少なくとも95%、少なくとも98%、少なくとも99%、または100%)を保持する。いくつかの態様では、分裂されたCas9タンパク質または分裂されたプライム編集因子は、元々のCas9タンパク質またはプライム編集因子のものよりも(例えば、2倍、5倍、10倍、100倍、1000倍、またはより多く)活性である。 The split Cas9 protein or split prime editing factor delivered using the methods described herein is preferably the original Cas9 protein or prime editing factor (i.e., delivered to or expressed by the cell whole). It has an activity comparable to that of undivided proteins (undivided proteins). For example, the split Cas9 protein or split prime editor has at least 50% of the activity of the original Cas9 protein or prime editor (e.g., at least 50%, at least 60%, at least 70%, at least 80%, at least 90%, at least 95%, at least 98%, at least 99%, or 100%). In some embodiments, the split Cas9 protein or split prime editing factor is greater than that of the original Cas9 protein or prime editing factor (e.g., 2x, 5x, 10x, 100x, 1000x, or more) active.

本明細書に記載の組成物は、対象が患っている疾患または障害を処置および/または防止するための治療学的有効量でその必要がある対象に投与され得る。CRISPR/Cas9に基づくゲノム編集テクノロジーを用いて処置および/または防止され得るいずれかの疾患または障害は、本明細書に記載の分裂されたCas9タンパク質または分裂されたプライム編集因子によって処置され得る。分裂されたCas9タンパク質またはプライム編集因子をコードするヌクレオチド配列がさらにgRNAをコードしない場合には、gRNAをコードする別個の核酸ベクターが本明細書に記載の組成物と一緒に投与され得るということは理解されるはずである。 The compositions described herein can be administered to a subject in need thereof in a therapeutically effective amount to treat and/or prevent a disease or disorder afflicting the subject. Any disease or disorder that can be treated and/or prevented using CRISPR/Cas9-based genome editing technology can be treated by the split Cas9 proteins or split prime editing factors described herein. If the nucleotide sequence encoding the split Cas9 protein or prime editing factor does not further encode a gRNA, this means that a separate nucleic acid vector encoding the gRNA can be administered with the compositions described herein. It should be understood.

例示の好適な疾患、障害、または疾病は、限定なしに:嚢胞性線維症、フェニルケトン尿症、表皮剥離性角質増殖症(EHK)、慢性閉塞性肺疾患(COPD)、シャルコー・マリー・トゥース病4J型、神経芽腫(NB)、フォン・ヴィレブランド病(vWD)、先天性ミオトニー、遺伝性腎アミロイドーシス、拡張型心筋症、遺伝性リンパ浮腫、家族性アルツハイマー病、プリオン病、慢性乳児神経皮膚関節症候群(CINCA)、先天性難聴、ニーマン・ピック病C型(NPC)疾患、およびデスミン関連ミオパチー(DRM)からなる群から選択される疾患または障害を包含する。具体的な態様では、疾患または疾病はニーマン・ピック病C型(NPC)疾患である。 Illustrative and preferred diseases, disorders, or diseases include, without limitation: cystic fibrosis, phenylketonuria, epidermal hyperkeratosis (EHK), chronic obstructive pulmonary disease (COPD), Charcot-Marie-Tooth. Disease type 4J, neuroblastoma (NB), von Willebrand disease (vWD), congenital myotonia, hereditary renal amyloidosis, dilated cardiomyopathy, hereditary lymphedema, familial Alzheimer's disease, prion disease, chronic infantile neuropathy Includes diseases or disorders selected from the group consisting of skin and joint syndrome (CINCA), congenital deafness, Niemann-Pick type C (NPC) disease, and desmin-related myopathy (DRM). In a specific embodiment, the disease or illness is Niemann-Pick disease type C (NPC) disease.

いくつかの態様では、疾患、障害、または状態はNPC遺伝子、DNMT1遺伝子、PCSK9遺伝子、またはTMC1遺伝子の点変異に関連する。ある態様において、点変異はNPCのT3182C変異であり、これはI1061Tアミノ酸置換をもたらす。 In some embodiments, the disease, disorder, or condition is associated with a point mutation in the NPC gene, DNMT1 gene, PCSK9 gene, or TMC1 gene. In certain embodiments, the point mutation is the T3182C mutation in NPC, which results in an I1061T amino acid substitution.

ある態様において、点変異はTMC1のA545G変異であり、これはY182Cアミノ酸置換をもたらす。TMC1は内耳の感覚有毛細胞の機械受容イオンチャネルを形成するタンパク質をコードし、正常な聴覚機能に要求される。Y182Cアミノ酸置換は先天性難聴に関連する。 In some embodiments, the point mutation is an A545G mutation in TMC1, which results in a Y182C amino acid substitution. TMC1 encodes a protein that forms mechanosensitive ion channels in sensory hair cells of the inner ear and is required for normal hearing function. The Y182C amino acid substitution is associated with congenital hearing loss.

いくつかの態様では、疾患、障害、または疾病は、停止コドン、例えば遺伝子のコード領域内の未成熟停止コドンを生成する点変異に関連する。 In some embodiments, the disease, disorder, or disease is associated with a stop codon, eg, a point mutation that produces a premature stop codon within the coding region of a gene.

追加の例示の疾患、障害、または疾病は、嚢胞性線維症(例えば、Schwank et al.,Functional repair of CFTR by CRISPR/Cas9 in intestinal stem cell organoids of cystic fibrosis patients.Cell stem cell.2013;13:653-658;およびWu et.al.,Correction of a genetic disease in mouse via use of CRISPR-Cas9.Cell stem cell.2013;13:659-662を見よ。これらのいずれも、遺伝子欠陥を修正するためにデアミナーゼ融合タンパク質を用いていない);フェニルケトン尿症-例えば、フェニルアラニンヒドロキシラーゼ遺伝子の位置835(マウス)もしくは240(ヒト)または相同残基におけるフェニルアラニンからセリンの変異(T>C変異)-例えばMcDonald et al.,Genomics.1997;39:402-405を見よ;ベルナール・スーリエ症候群(BSS)-例えば、血小板膜糖タンパク質IXの位置55もしくは相同残基におけるフェニルアラニンからセリンの変異または残基24もしくは相同残基におけるシステインからアルギニン(T>C変異)-例えばNoris et al.,British Journal of Haematology.1997;97:312-320およびAli et al.,Hematol.2014;93:381-384を見よ;表皮剥離性角質増殖症(EHK)-例えば、ケラチン1の位置160もしくは161(開始メチオニンをカウントする場合)または相同残基におけるロイシンからプロリンの変異(T>C変異)-例えば、Chipev et al.,Cell.1992;70:821-828を見よ。www[dot]uniprot[dot]orgのUNIPROTデータベースのアクセッション番号P04264をもまた見よ;慢性閉塞性肺疾患(COPD)-例えば、α1-アンチトリプシンのプロセシングされた形態の位置54もしくは55(開始メチオニンをカウントする場合)または相同残基あるいはプロセシングされない形態の残基78または相同残基におけるロイシンからプロリンの変異(T>C変異)-例えば、Poller et al.,Genomics.1993;17:740-743を見よ。UNIPROTデータベースのアクセッション番号P01011をもまた見よ;シャルコー・マリー・トゥース病4J型 - 例えばFIG4の位置41または相同残基におけるイソロイシンからトレオニンの変異(T>C変異)-例えば、Lenk et al.,PLoS Genetics.2011;7:e1002104を見よ;神経芽腫(NB)-例えば、カスパーゼ-9の位置197または相同残基におけるロイシンからプロリンの変異(T>C変異)-例えば、Kundu et al.,3 Biotech.2013,3:225-234を見よ;フォン・ヴィレブランド病(vWD)-例えば、フォン・ヴィレブランド因子のプロセシングされた形態の位置509もしくは相同残基またはフォン・ヴィレブランド因子のプロセシングされない形態の位置1272もしくは相同残基におけるシステインからアルギニンの変異(T>C変異)-例えば、Lavergne et al.,Br.J.Haematol.1992を見よ。UNIPROTデータベースのアクセッション番号P04275をもまた見よ;82:66-72;先天性ミオトニー-例えば、筋肉塩素チャネル遺伝子CLCN1の位置277または相同残基におけるシステインからアルギニンの変異(T>C変異)-例えば、Weinberger et al.,The J.of Physiology.2012;590:3449-3464を見よ;遺伝性腎アミロイドーシス-例えば、アポリポタンパク質AIIのプロセシングされた形態の位置78もしくは相同残基またはプロセシングされない形態の位置101もしくは相同残基における停止コドンからアルギニンの変異(T>C変異)-例えば、Yazaki et al.,Kidney Int.2003;64:11-16を見よ;拡張型心筋症(DCM)-例えば、FOXD4遺伝子の位置148または相同残基におけるトリプトファンからアルギニンの変異(T>C変異)、例えば、Minoretti et.al.,Int.J.of Mol.Med.2007;19:369-372を見よ;遺伝性リンパ浮腫 - 例えば、VEGFR3チロシンキナーゼの位置1035または相同残基におけるヒスチジンからアルギニンの変異(A>G変異)、例えば、Irrthum et al.,Am.J.Hum.Genet.2000;67:295-301を見よ;家族性アルツハイマー病-例えば、プレセニリン1の位置143または相同残基におけるイソロイシンからバリンの変異(A>G変異)、例えば、Gallo et.al.,J.Alzheimer's Disease.2011;25:425-431を見よ;プリオン病-例えば、プリオンタンパク質の位置129または相同残基におけるメチオニンからバリンの変異(A>G変異)-例えば、Lewis et.al.,J.of General Virology.2006;87:2443-2449を見よ;慢性乳児神経皮膚関節症候群(CINCA)-例えば、クリオピリンの位置570または相同残基におけるチロシンからシステインの変異(A>G変異)-例えば、Fujisawa et.al.Blood.2007;109:2903-2911を見よ;ならびにデスミン関連ミオパチー(DRM)-例えば、αβクリスタリンの位置120または相同残基におけるアルギニンからグリシンの変異(A>G変異)を包含する。例えば、Kumar et al.,J.Biol.Chem.1999;274:24137-24141を見よ。全ての参照およびデータベースエントリーの内容全体は参照によって本願に組み込まれる。 Additional exemplary diseases, disorders, or conditions include cystic fibrosis (see, e.g., Schwank et al., Functional repair of CFTR by CRISPR/Cas9 in intestinal stem cell organoids of cystic fibrosis patients. Cell stem cell. 2013;13:653-658; and Wu et.al., Correction of a genetic disease in mouse via use of CRISPR-Cas9. Cell stem cell. 2013;13:659-662, neither of which use a deaminase fusion protein to correct the genetic defect); phenylketonuria - e.g., a phenylalanine to serine mutation (T>C mutation) at position 835 (mouse) or 240 (human) of the phenylalanine hydroxylase gene or at a homologous residue - see, e.g., McDonald et al. al., Genomics. 1997;39:402-405; Bernard-Soulier syndrome (BSS) - e.g., a phenylalanine to serine mutation at position 55 or homologous residues of platelet membrane glycoprotein IX or a cysteine to arginine at residue 24 or homologous residues (T>C mutation) - see, e.g., Noris et al., British Journal of Haematology. 1997;97:312-320 and Ali et al., Hematol. 2014;93:381-384; epidermolytic hyperkeratosis (EHK) - e.g., a leucine to proline mutation at position 160 or 161 (counting the initiator methionine) or homologous residues of keratin 1 (T>C mutation) - see, e.g., Chipev et al., Cell. 1992;70:821-828. See also accession number P04264 in the UNIPROT database at www[dot]uniprot[dot]org; chronic obstructive pulmonary disease (COPD) - e.g., a leucine to proline mutation (T > C mutation) at positions 54 or 55 (counting the initiator methionine) or homologous residues in the processed form of α1-antitrypsin or at residue 78 or homologous residues in the unprocessed form - see, e.g., Poller et al., Genomics. 1993;17:740-743. see also UNIPROT database accession number P01011; Charcot-Marie-Tooth disease type 4J - e.g., an isoleucine to threonine mutation at position 41 or a homologous residue in FIG4 (T>C mutation) - see, e.g., Lenk et al., PLoS Genetics. 2011;7:e1002104; Neuroblastoma (NB) - e.g., a leucine to proline mutation at position 197 or a homologous residue in caspase-9 (T>C mutation) - see, e.g., Kundu et al., 3 Biotech. 2013,3:225-234; von Willebrand disease (vWD) - e.g., a cysteine to arginine mutation at position 509 or a homologous residue in the processed form of von Willebrand factor or at position 1272 or a homologous residue in the unprocessed form of von Willebrand factor (T>C mutation) - see, e.g., Lavergne et al., See al., Br. J. Haematol. 1992. see also UNIPROT database accession number P04275;82:66-72;myotonia congenita - e.g., a cysteine to arginine mutation (T>C mutation) at position 277 or a homologous residue in the muscle chloride channel gene CLCN1 - see, e.g., Weinberger et al., The J. of Physiology. 2012;590:3449-3464;hereditary renal amyloidosis - e.g., a stop codon to arginine mutation (T>C mutation) at position 78 or a homologous residue in the processed form of apolipoprotein AII or at position 101 or a homologous residue in the unprocessed form - see, e.g., Yazaki et al., Kidney Int. 2003;64:11-16;dilated cardiomyopathy (DCM) - e.g., a tryptophan to arginine mutation (T>C mutation) at position 148 or a homologous residue in the FOXD4 gene, see, e.g., Minoretti et.al., Int. J. of Mol. Med. 2007;19:369-372; hereditary lymphedema - e.g., a histidine to arginine mutation (A>G mutation) at position 1035 or a homologous residue in VEGFR3 tyrosine kinase, see e.g., Irrthum et al., Am. J. Hum. Genet. 2000;67:295-301; familial Alzheimer's disease - e.g., an isoleucine to valine mutation (A>G mutation) at position 143 or a homologous residue in presenilin 1, see e.g., Gallo et.al., J. Alzheimer's Disease. 2011;25:425-431; prion disease - e.g., a methionine to valine mutation (A>G mutation) at position 129 or a homologous residue in the prion protein - see e.g., Lewis et.al., J. of General Virology. 2006;87:2443-2449; chronic infantile neurological cutaneous articular syndrome (CINCA) - e.g., a tyrosine to cysteine mutation (A>G mutation) at position 570 or homologous residues in cryopyrin - see, e.g., Fujisawa et.al. Blood. 2007;109:2903-2911; and desmin-related myopathy (DRM) - e.g., an arginine to glycine mutation (A>G mutation) at position 120 or homologous residues in αβ crystallin. See, e.g., Kumar et al., J. Biol. Chem. 1999;274:24137-24141. The entire contents of all references and database entries are incorporated herein by reference.

トリヌクレオチド反復拡大疾患
トリヌクレオチド反復拡大は、ハンチントン病、脆弱X症候群、およびフリードライヒ運動失調症を包含するいくつものヒト疾患に関連する。最も普通のトリヌクレオチド反復はCAGトリプレットを含有するが、GAAトリプレット(フリードライヒ運動失調症)およびCGGトリプレット(脆弱X症候群)もまた生起する。拡大の素因を受け継ぐことまたはすでに伸長した親のアレルを獲得することは、疾患を獲得する蓋然性を増大させる。トリヌクレオチド反復の病原性の拡大は仮説上はプライム編集を用いて修正され得る。
Trinucleotide Repeat Expansion Disease Trinucleotide repeat expansions are associated with a number of human diseases, including Huntington's disease, Fragile X syndrome, and Friedreich's ataxia. The most common trinucleotide repeat contains the CAG triplet, but the GAA triplet (Friedreich's ataxia) and CGG triplet (Fragile X syndrome) also occur. Inheriting a predisposition to expansion or acquiring an allele from an already expanded parent increases the probability of acquiring the disease. Pathogenic expansion of trinucleotide repeats could hypothetically be corrected using prime editing.

図1Gまたは図22に概説されている一般的な機序に従って、反復領域の上流の領域が、RNAによってガイドされるヌクレアーゼによってニッキングされ得、それから、健康な反復数(これは具体的な遺伝子および疾患に依存する)を含有する新たなDNA鎖の合成をプライムするために用いられ得る。反復配列の後には、反復の他端に隣接する配列のアイデンティティーにマッチする相同性の短いストレッチが追加される(赤色の鎖)。TPRTシステムによる新たに合成された鎖の侵入、および新たに合成されたフラップによる内生DNAの爾後の置き換えは、短縮された反復アレルに至る。用語「短縮された」はヌクレオチド反復領域の長さの短くなることを言い、それによって、トリヌクレオチド反復領域を修復することをもたらす。 According to the general mechanism outlined in Figure 1G or Figure 22, the region upstream of the repeat region can be nicked by an RNA-guided nuclease, and then the healthy repeat number (which is determined by the specific gene and (depending on the disease) can be used to prime the synthesis of new DNA strands containing After the repeat sequence, a short stretch of homology is added that matches the identity of the sequence flanking the other end of the repeat (red strand). Invasion of the newly synthesized strand by the TPRT system and subsequent replacement of the endogenous DNA by the newly synthesized flap leads to a truncated repeat allele. The term "truncated" refers to a shortening in the length of a nucleotide repeat region, thereby resulting in repair of the trinucleotide repeat region.

本明細書に記載のプライム編集システムまたはプライム編集(PE)システムは、ハンチントン病および他のトリヌクレオチド反復障害などの疾病を処置するために、トリヌクレオチド反復変異(または「トリプレット拡大疾患」)を短縮するために用いられ得る。トリヌクレオチド反復拡大障害は発達神経生物学が関わる複雑な進行性の障害であり、多くの場合には、認知および感覚運動機能に影響する。障害は遺伝学的な表現促進現象(すなわち、各世代での増大した重症度)を示す。DNA伸長または短縮は、通常は減数分裂的に(すなわち、配偶子形成の時の間に、または胚発生中に早期に)起こり、多くの場合には性バイアスを有し、いくつかの遺伝子は女性から受け継がれるときにのみ、他は男性からのみ伸長するということを意味する。ヒトでは、トリヌクレオチド反復拡大障害は転写または翻訳レベルどちらかで遺伝子サイレンシングを引き起こし得、これは本質的に遺伝子機能をノックアウトする。代替的には、トリヌクレオチド反復拡大障害は、大きい繰り返しアミノ酸配列を有して生成された変改されたタンパク質を引き起こし得る。これは、多くの場合にはドミナントネガティブな様式で(例えばポリグルタミン疾患)、タンパク質機能を無効化するかまたは変化させるかどちらかである。 The prime editing system or prime editing (PE) system described herein truncates trinucleotide repeat mutations (or "triplet expansion diseases") to treat diseases such as Huntington's disease and other trinucleotide repeat disorders. It can be used to Trinucleotide repeat expansion disorders are complex, progressive disorders that involve developmental neurobiology and often affect cognitive and sensorimotor functions. The disorder exhibits a genetic facilitation phenomenon (ie, increasing severity with each generation). DNA elongation or shortening usually occurs meiotically (i.e., during the time of gametogenesis or early during embryonic development) and often has a sex bias, with some genes being isolated from females. This means that only when inherited, others only grow from males. In humans, trinucleotide repeat expansion disorders can cause gene silencing at either the transcriptional or translational level, essentially knocking out gene function. Alternatively, trinucleotide repeat expansion disorders may result in modified proteins produced with large repeat amino acid sequences. This either disables or alters protein function, often in a dominant-negative manner (eg polyglutamine diseases).

理論によって拘束されることなしに、トリプレット拡大はDNA複製またはDNA修復合成の間のスリップによって引き起こされる。タンデム反復は互いに同一の配列を有するので、2つのDNA鎖間の塩基対形成は配列上の複数の点において生起し得る。これはDNA複製またはDNA修復合成の間の「ループアウト」構造の形成に至り得る。これは繰り返し配列の繰り返しのコピーに至り得、反復数を伸長させる。ハイブリッドRNA:DNA中間体が関わる追加の機序が提案されている。プライム編集は、害をなす繰り返しのコドントリプレットの1つ以上を欠失させることによって、これらのトリプレット拡大領域を縮減または消去するために用いられ得る。この使用のある態様では、図23が、プライム編集によってトリヌクレオチド反復配列を短縮または縮減するためのPEgRNAデザインの模式図を提供する。 Without being bound by theory, triplet expansion is caused by slippage during DNA replication or DNA repair synthesis. Because tandem repeats have identical sequences to each other, base pairing between the two DNA strands can occur at multiple points on the sequence. This can lead to the formation of "loop-out" structures during DNA replication or DNA repair synthesis. This can lead to repeated copies of repeating sequences, extending the number of repeats. Additional mechanisms involving hybrid RNA:DNA intermediates have been proposed. Prime editing can be used to reduce or eliminate regions of these triplet expansions by deleting one or more of the harmful repeat codon triplets. In some embodiments of this use, Figure 23 provides a schematic representation of PEgRNA design to shorten or reduce trinucleotide repeat sequences by prime editing.

プライム編集は、カットされる部位へと標的化される充当されたPEgRNAを含むプライム編集因子によって、トリプレット反復領域の上流の領域へニックを入れることによって、トリプレット拡大領域を短縮するように実装され得る。それから、プライム編集因子は、健康な数のトリプレット反復(これは具体的な遺伝子および疾患に依存する)をコードする鋳型(すなわち、その編集鋳型)としてのPEgRNAに基づく新たなDNA鎖(ssDNAフラップ)を合成する。新たに合成されたssDNA鎖は健康なトリプレット反復配列を含み、また、反復の他端に隣接する配列にマッチする相同性の短いストレッチ(すなわち相同アーム)を包含するように合成される(赤色の鎖)。新たに合成された鎖の侵入、および新たに合成されたssDNAフラップによる内生DNAの爾後の置き換えは、短縮された反復アレルに至る。 Prime editing can be implemented to shorten the triplet expansion region by nicking the region upstream of the triplet repeat region with prime editing factors containing appropriate PEgRNA targeted to the site to be cut. . The prime editing factor then creates a new DNA strand (ssDNA flap) based on PEgRNA as a template (i.e., its editing template) encoding a healthy number of triplet repeats (this depends on the specific gene and disease). Synthesize. The newly synthesized ssDNA strand contains a healthy triplet repeat sequence and is also synthesized to include a short stretch of homology (i.e. homology arm) that matches the sequence flanking the other end of the repeat (shown in red). chain). Invasion of the newly synthesized strand and subsequent replacement of the endogenous DNA by the newly synthesized ssDNA flap leads to a truncated repeat allele.

具体的なトリヌクレオチド伸長障害に依存して、欠陥を誘導するトリプレット拡大は「トリヌクレオチド反復拡大タンパク質」において生起し得る。トリヌクレオチド反復拡大タンパク質は、トリヌクレオチド反復拡大障害を発生する感受性、トリヌクレオチド反復拡大障害の存在、トリヌクレオチド反復拡大障害の重症度、またはそれらのいずれかの組み合わせに関連するタンパク質の多様なセットである。トリヌクレオチド反復拡大障害は反復の型によって決定される2つのカテゴリーに分けられる。最も普通の反復はトリプレットCAGであり、これは遺伝子のコード領域に存在するときにはアミノ酸のグルタミン(Q)をコードする。よって、これらの障害はポリグルタミン(ポリQ)障害と言われ、次の疾患を含む:ハンチントン病(HD);球脊髄性筋萎縮症(SBMA);脊髄小脳失調症(SCA 1、2、3、6、7、および17型);および歯状核赤核淡蒼球ルイ体萎縮症(DRPLA)。残りのトリヌクレオチド反復拡大障害にはCAGトリプレットが関わらないか、またはCAGトリプレットが遺伝子のコード領域にはないかどちらかであり、よって、非ポリグルタミン障害と言われる。非ポリグルタミン障害は、脆弱X症候群(FRAXA);脆弱XE精神遅滞(FRAXE);フリードライヒ運動失調症(FRDA);筋強直性ジストロフィー(DM);および脊髄小脳失調症(SCA 8および12型)を含む。 Depending on the specific trinucleotide expansion disorder, defect-inducing triplet expansions can occur in "trinucleotide repeat expansion proteins." Trinucleotide repeat expansion proteins are a diverse set of proteins associated with susceptibility to developing trinucleotide repeat expansion disorders, presence of trinucleotide repeat expansion disorders, severity of trinucleotide repeat expansion disorders, or any combination thereof. be. Trinucleotide repeat expansion disorders are divided into two categories determined by the type of repeat. The most common repeat is the triplet CAG, which when present in the coding region of a gene encodes the amino acid glutamine (Q). These disorders are therefore referred to as polyglutamine (polyQ) disorders and include: Huntington's disease (HD); spinobulbar muscular atrophy (SBMA); spinocerebellar ataxia (SCA 1, 2, 3). , types 6, 7, and 17); and dentate nucleus pallidum Louisian atrophy (DRPLA). The remaining trinucleotide repeat expansion disorders either do not involve the CAG triplet or the CAG triplet is not in the coding region of the gene and are therefore referred to as non-polyglutamine disorders. Non-polyglutamine disorders include fragile including.

トリヌクレオチド反復拡大障害に関連するタンパク質は、トリヌクレオチド反復拡大障害に対するトリヌクレオチド反復拡大障害に関連するタンパク質の実験的関連に基づいて選択され得る。例えば、トリヌクレオチド反復拡大障害に関連するタンパク質の生産速度または循環濃度は、トリヌクレオチド反復拡大障害を欠く集団に対して相対的に、トリヌクレオチド反復拡大障害を有する集団において上昇または降下し得る。タンパク質レベルの違いは、ウエスタンブロット、免疫組織化学染色、酵素結合免疫吸着アッセイ(ELISA)、および質量分析を包含するがこれらに限定されないプロテオミクス技術を用いて評価され得る。代替的には、トリヌクレオチド反復拡大障害に関連するタンパク質はタンパク質をコードする遺伝子の遺伝子発現プロファイルを得ることによって同定され得、DNAマイクロアレイ分析、遺伝子発現の連続分析(SAGE)、および定量的リアルタイムポリメラーゼ連鎖反応(Q-PCR)を包含するがこれらに限定されないゲノム技術を用いる。 Proteins associated with trinucleotide repeat expansion disorders may be selected based on the experimental association of proteins associated with trinucleotide repeat expansion disorders to trinucleotide repeat expansion disorders. For example, the production rate or circulating concentration of a protein associated with a trinucleotide repeat expansion disorder may be increased or decreased in a population with a trinucleotide repeat expansion disorder relative to a population lacking the trinucleotide repeat expansion disorder. Differences in protein levels can be assessed using proteomic techniques including, but not limited to, Western blot, immunohistochemical staining, enzyme-linked immunosorbent assay (ELISA), and mass spectrometry. Alternatively, proteins associated with trinucleotide repeat expansion disorders can be identified by obtaining gene expression profiles of protein-coding genes, using DNA microarray analysis, serial analysis of gene expression (SAGE), and quantitative real-time polymerase analysis. Genomic techniques are used, including but not limited to chain reaction (Q-PCR).

プライム編集によって修正され得るトリヌクレオチド反復拡大障害に関連するタンパク質の限定しない例は、AR(アンドロゲン受容体)、FMR1(脆弱X精神遅滞1)、HTT(ハンチンチン)、DMPK(筋緊張性ジストロフィータンパク質キナーゼ)、FXN(フラタキシン)、ATXN2(アタキシン2)、ATN1(アトロフィン1)、FEN1(フラップ構造特異的エンドヌクレアーゼ1)、TNRC6A(トリヌクレオチド反復含有6A)、PABPN1(核ポリA結合タンパク質1)、JPH3(ジャンクトフィリン3)、MED15(メディエーター複合体サブユニット15)、ATXN1(アタキシン1)、ATXN3(アタキシン3)、TBP(TATAボックス結合タンパク質)、CACNA1A(電位依存性カルシウムチャネルP/Q型アルファ1Aサブユニット)、ATXN80S(ATXN8対向鎖(非タンパク質コード))、PPP2R2B(タンパク質ホスファターゼ2制御サブユニットBベータ)、ATXN7(アタキシン7)、TNRC6B(トリヌクレオチド反復含有6B)、TNRC6C(トリヌクレオチド反復含有6C)、CELF3(CUGBP Elav様ファミリーメンバー3)、MAB21L1(mab-21様1(C.elegans))、MSH2(mutSホモログ2結腸がん非ポリポーシス1型(E.coli))、TMEM185A(膜貫通タンパク質185A)、SIX5(SIXホメオボックス5)、CNPY3(canopy 3ホモログ(ゼブラフィッシュ))、FRAXE(脆弱部位、葉酸型、稀、fra(X)(q28)E)、GNB2(グアニンヌクレオチド結合タンパク質(Gタンパク質)ベータポリペプチド2)、RPL14(リボソームタンパク質L14)、ATXN8(アタキシン8)、INSR(インスリン受容体)、TTR(トランスサイレチン)、EP400(E1A結合タンパク質p400)、GIGYF2(GRB10相互作用GYFタンパク質2)、OGG1(8-オキソグアニンDNAグリコシラーゼ)、STC1(スタニオカルシン1)、CNDP1(カルノシンジペプチダーゼ1(メタロペプチダーゼM20ファミリー))、C10orf2(染色体10オープンリーディングフレーム2)、MAML3 mastermind様3(Drosophila)、DKC1(先天性角化不全症1、ジスケリン)、PAXIP1(PAX相互作用(転写活性化ドメイン)タンパク質1)、CASK(カルシウム/カルモジュリン依存性セリンタンパク質キナーゼ(MAGUKファミリー))、MAPT(微小管関連タンパク質tau)、SP1(Sp1転写因子)、POLG(ポリメラーゼ(DNA依存性)ガンマ)、AFF2(AF4/FMR2ファミリーメンバー2)、THBS1(トロンボスポンジン1)、TP53(腫瘍タンパク質p53)、ESR1(エストロゲン受容体1)、CGGBP1(CGGリプレット反復結合タンパク質1)、ABT1(基本転写活性化因子1)、KLK3(カリクレイン関連ペプチダーゼ3)、PRNP(プリオンタンパク質)、JUN(junがん遺伝子)、KCNN3(カリウム中/小コンダクタンスカルシウム活性化チャネルサブファミリーNメンバー3)、BAX(BCL2関連Xタンパク質)、FRAXA(脆弱部位、葉酸型、稀、fra(X)(q27.3)A(巨睾丸、精神遅滞))、KBTBD10(kelch反復およびBTB(POZ)ドメイン含有10)、MBNL1(muscleblind様(Drosophila))、RAD51(RAD51ホモログ(RecAホモログ、E.coli)(S.cerevisiae))、NCOA3(核受容体コアクチベーター3)、ERDA1(伸長した反復ドメインCAG/CTG1)、TSC1(結節性硬化症1)、COMP(軟骨オリゴマーマトリックスタンパク質)、GCLC(グルタミン酸-システインリガーゼ触媒サブユニット)、RRAD(糖尿病に関連するRas関連)、MSH3(mutSホモログ3(E.coli))、DRD2(ドーパミン受容体D2)、CD44(CD44分子(インド人血液型))、CTCF(CCCTC結合因子(ジンクフィンガータンパク質))、CCND1(サイクリンD1)、CLSPN(クラスピンホモログ(Xenopus laevis))、MEF2A(筋細胞エンハンサー因子2A)、PTPRU(タンパク質チロシンホスファターゼ受容体型U)、GAPDH(グリセルアルデヒド-3-リン酸デヒドロゲナーゼ)、TRIM22(三節型モチーフ含有22)、WT1(ウィルムス腫瘍1)、AHR(アリール炭化水素受容体)、GPX1(グルタチオンペルオキシダーゼ1)、TPMT(チオプリンS-メチルトランスフェラーゼ)、NDP(ノリエ病(偽神経膠腫))、ARX(aristaless関連ホメオボックス)、MUS81(MUS81エンドヌクレアーゼホモログ(S.cerevisiae))、TYR(チロシナーゼ(眼皮膚白皮症IA))、EGR1(初期増殖応答1)、UNG(ウラシル-DNAグリコシラーゼ)、NUMBL(numbホモログ(Drosophila)様)、FABP2(腸脂肪酸結合タンパク質2)、EN2(engrailedホメオボックス2)、CRYGC(クリスタリンガンマC)、SRP14(シグナル認識粒子14kDa(相同的Alu RNA結合タンパク質))、CRYGBクリスタリンガンマB)、PDCD1(プログラム細胞死1)、HOXA1(ホメオボックスA1)、ATXN2L(アタキシン2様)、PMS2(PMS2減数分裂後分離増大2(S.cerevisiae))、GLA(ガラクトシダーゼアルファ)、CBL(Cas-Br-M(ネズミ)同種指向性レトロウイルス形質転換配列)、FTH1(フェリチン重鎖ポリペプチド1)、IL12RB2(インターロイキン12受容体ベータ2)、OTX2(orthodenticleホメオボックス2)、HOXA5(ホメオボックスA5)、POLG2(ポリメラーゼ(DNA依存性)ガンマ2補助的サブユニット)、DLX2(distal-lessホメオボックス2)、SIRPA(シグナル制御タンパク質アルファ)、OTX1(orthodenticleホメオボックス1)、AHRR(アリール炭化水素受容体リプレッサー)、MANF(中脳アストロサイト由来神経栄養因子)、TMEM158(膜貫通タンパク質158(遺伝子/偽遺伝子))、およびENSG00000078687を包含する。 Non-limiting examples of proteins associated with trinucleotide repeat expansion disorders that can be corrected by prime editing include AR (androgen receptor), FMR1 (fragile X mental retardation 1), HTT (huntingtin), DMPK (myotonic dystrophy protein). kinase), FXN (frataxin), ATXN2 (ataxin 2), ATN1 (atrophin 1), FEN1 (flap structure-specific endonuclease 1), TNRC6A (trinucleotide repeat-containing 6A), PABPN1 (nuclear polyA binding protein 1), JPH3 (junctophilin 3), MED15 (Mediator complex subunit 15), ATXN1 (ataxin 1), ATXN3 (ataxin 3), TBP (TATA box binding protein), CACNA1A (voltage-gated calcium channel P/Q type alpha 1A subunit), ATXN80S (ATXN8 opposite strand (non-protein coding)), PPP2R2B (protein phosphatase 2 regulatory subunit B beta), ATXN7 (ataxin 7), TNRC6B (trinucleotide repeat containing 6B), TNRC6C (trinucleotide repeat containing 6C), CELF3 (CUGBP Elav-like family member 3), MAB21L1 (mab-21-like 1 (C. elegans)), MSH2 (mutS homolog 2 colon cancer non-polyposis type 1 (E. coli)), TMEM185A (transmembrane protein 185A), SIX5 (SIX homeobox 5), CNPY3 (canopy 3 homolog (zebrafish)), FRAXE (fragile site, folate type, rare, fra(X)(q28)E), GNB2 (guanine nucleotide binding protein ( G protein) beta polypeptide 2), RPL14 (ribosomal protein L14), ATXN8 (ataxin 8), INSR (insulin receptor), TTR (transthyretin), EP400 (E1A binding protein p400), GIGYF2 (GRB10-interacting GYF protein 2), OGG1 (8-oxoguanine DNA glycosylase), STC1 (stanniocalcin 1), CNDP1 (carnosine dipeptidase 1 (metallopeptidase M20 family)), C10orf2 (chromosome 10 open reading frame 2), MAML3 mastermind-like 3 (Drosophila ), DKC1 (dyskeratosis congenita 1, dyskerin), PAXIP1 (PAX-interacting (transcriptional activation domain) protein 1), CASK (calcium/calmodulin-dependent serine protein kinase (MAGUK family)), MAPT (microtubule associated protein tau), SP1 (Sp1 transcription factor), POLG (polymerase (DNA-dependent) gamma), AFF2 (AF4/FMR2 family member 2), THBS1 (thrombospondin 1), TP53 (oncoprotein p53), ESR1 ( estrogen receptor 1), CGGBP1 (CGG triplet repeat binding protein 1), ABT1 (basic transcriptional activator 1), KLK3 (kallikrein-related peptidase 3), PRNP (prion protein), JUN (jun oncogene), KCNN3 ( Potassium medium/small conductance calcium-activated channel subfamily N member 3), BAX (BCL2-related )), KBTBD10 (containing kelch repeats and BTB (POZ) domain 10), MBNL1 (muscleblind-like (Drosophila)), RAD51 (RAD51 homolog (RecA homolog, E. coli) (S. cerevisiae)), NCOA3 (nuclear receptor coactivator 3), ERDA1 (elongated repeat domain CAG/CTG1), TSC1 (tuberous sclerosis 1), COMP (cartilage oligomeric matrix protein), GCLC (glutamate-cysteine ligase catalytic subunit), RRAD (associated with diabetes) (Ras-related), MSH3 (mutS homolog 3 (E.coli)), DRD2 (dopamine receptor D2), CD44 (CD44 molecule (Indian blood type)), CTCF (CCCTC binding factor (zinc finger protein)), CCND1 (cyclin D1), CLSPN (claspin homologue (Xenopus laevis)), MEF2A (myocyte enhancer factor 2A), PTPRU (protein tyrosine phosphatase receptor type U), GAPDH (glyceraldehyde-3-phosphate dehydrogenase), TRIM22 ( Contains three-node motif22), WT1 (Wilms tumor 1), AHR (aryl hydrocarbon receptor), GPX1 (glutathione peroxidase 1), TPMT (thiopurine S-methyltransferase), NDP (Norie disease (pseudoglioma)) , ARX (aristaless-related homeobox), MUS81 (MUS81 endonuclease homolog (S. cerevisiae)), TYR (tyrosinase (oculocutaneous albinism IA)), EGR1 (early proliferative response 1), UNG (uracil-DNA glycosylase) , NUMBL (numb homologue (Drosophila)-like), FABP2 (intestinal fatty acid binding protein 2), EN2 (engrailed homeobox 2), CRYGC (crystallin gamma C), SRP14 (signal recognition particle 14kDa (homologous Alu RNA binding protein)) , CRYGB crystallin gamma B), PDCD1 (programmed cell death 1), HOXA1 (homeobox A1), ATXN2L (ataxin 2-like), PMS2 (PMS2 postmeiotic segregation augmentation 2 (S.cerevisiae)), GLA (galactosidase alpha) , CBL (Cas-Br-M (murine) homotropic retroviral transformation sequence), FTH1 (ferritin heavy chain polypeptide 1), IL12RB2 (interleukin 12 receptor beta 2), OTX2 (orthodenticle homeobox 2), HOXA5 (homeobox A5), POLG2 (polymerase (DNA-dependent) gamma 2 auxiliary subunit), DLX2 (distal-less homeobox 2), SIRPA (signal regulatory protein alpha), OTX1 (orthodenticle homeobox 1), AHRR (aryl hydrocarbon receptor repressor), MANF (midbrain astrocyte-derived neurotrophic factor), TMEM158 (transmembrane protein 158 (gene/pseudogene)), and ENSG00000078687.

具体的な側面において、本開示は、拡大反復障害(また反復拡大障害もしくはトリヌクレオチド反復障害としても知られている)と診断された対象の処置のためのTPRTベースの方法を提供する。拡大反復障害は、マイクロサテライト反復が長さ閾値を超えて拡大したときに生じる。目下、少なくとも30の遺伝的疾患は、反復拡大によって引き起こされるものと考えられている。この多様な群の障害への科学的理解は、1990年代初頭に、トリヌクレオチド反復が、脆弱X、球脊髄性筋萎縮症、筋強直症ジストロフィー、およびハンチントン病(Nelson et al,“The unstable repeats-3 evolving faces of neurological disease,”Neuron,March 6,2013,Vol.77;825-843(これは参照により本明細書に組み込まれる))、ならびにホー・リバー(Haw River)症候群、ヤコブセン症候群、歯状核赤核淡蒼球ルイ体萎縮症(DRPLA)、マシャド・ジョセフ病、合多指症(SPD II)、手足生殖器症候群(HFGS)、鎖骨頭蓋異形成症(CCD)、全前脳欠損障害(HPE)、先天性中枢性低換気症候群(CCHS)、ARX非症候性のX連鎖精神遅滞(XLMR)、および眼咽頭型筋ジストロフィー(OPMD)(参照を包含する、数種の主要な遺伝性疾病にあるという発見で明るみに出た。マイクロサテライト反復の不安定性は、反復拡大が、後に続く各世代に生じ得、子孫におけるより重度の表現型および発症の低年齢へ繋がるという現象が予想されたとおり、これらの疾病の証であることが見出された。反復拡大は、数種の異なる機序を介して疾患を引き起こすものと考えられている。つまり、拡大は、遺伝子、mRNA転写産物、および/またはコードされたタンパク質のレベルにて機能する細胞に干渉し得る。いくつかの疾病において、突然変異は、反復含有遺伝子をサイレンシングすることによる機能喪失型の機序を介して作用する。その他において、疾患は、mRNA転写産物またはタンパク質のいずれかが新しい異常な機能を帯びるようになる機能獲得型の機序の結果として生じる。 In a specific aspect, the present disclosure provides TPRT-based methods for the treatment of subjects diagnosed with expanded repeat disorder (also known as repeat expanded disorder or trinucleotide repeat disorder). Expanded repeat disorders occur when microsatellite repeats expand beyond a length threshold. At least 30 genetic diseases are currently thought to be caused by repeat expansions. Scientific understanding of this diverse group of disorders began in the early 1990s when trinucleotide repeats were identified in fragile X, spinobulbar muscular atrophy, myotonic dystrophy, and Huntington's disease (Nelson et al, “The unstable repeats Haw River syndrome, Jacobsen syndrome, Denticulopallidoid Luysian atrophy (DRPLA), Machado-Joseph disease, synpolydactyly (SPD II), hand-foot-genital syndrome (HFGS), cleidocranial dysplasia (CCD), holoprosencephalic defect Several major hereditary disorders, including Congenital Central Hypoventilation Syndrome (HPE), Congenital Central Hypoventilation Syndrome (CCHS), ARX Nonsyndromic X-Linked Mental Retardation (XLMR), and Oculopharyngeal Muscular Dystrophy (OPMD) The instability of microsatellite repeats has been brought to light with the discovery that microsatellite repeat instability could occur in each subsequent generation, leading to a more severe phenotype in offspring and a younger age of onset. It has been found that repeat expansions are a hallmark of these diseases.Repeat expansions are thought to cause disease through several different mechanisms; that is, expansions , and/or may interfere with cell functioning at the level of the encoded protein. In some diseases, mutations act through a loss-of-function mechanism by silencing repeat-containing genes. In others, diseases arise as a result of gain-of-function mechanisms in which either mRNA transcripts or proteins take on new abnormal functions.

一態様において、トリヌクレオチド反復障害を処置する方法は、図23に描かれている。一般に、アプローチは、プライム編集プロセスの機序を通して内生の罹患トリヌクレオチド反復配列を置き換えることが意図される、所望されかつ健常な置き換えトリヌクレオチド反復配列をコードする領域を含む伸長されたgRNAと組み合わせて、TPRTゲノム編集(すなわち、プライム編集)を使用することを伴う。例示の、トリヌクレオチド反復配列を縮小するためのgRNAデザインおよびTPRTゲノム編集でのトリヌクレオチド反復縮小の概略図が、図23に示される。 In one embodiment, a method of treating trinucleotide repeat disorders is depicted in FIG. 23. Generally, the approach involves combining an elongated gRNA containing a region encoding the desired and healthy replacement trinucleotide repeat sequence with the intention of replacing the endogenous diseased trinucleotide repeat sequence through the mechanism of a prime editing process. involves using TPRT genome editing (i.e., prime editing). An exemplary gRNA design to reduce trinucleotide repeat sequences and a schematic diagram of trinucleotide repeat reduction with TPRT genome editing is shown in FIG. 23.

プリオン病
プライム編集は、疾患の過程においてミスフォールディングされるようになるプリオンタンパク質(PRNP)上への1つ以上の防護性変異の組み入れによって、プリオン病を防止またはその進行を停止させるためにもまた用いられ得る。プリオン病または伝達性海綿状脳症(TSE)は、ヒトおよび動物両方を冒す稀な進行性の神経変性障害のファミリーである。それらは、長い潜伏期間、ニューロン喪失に関連する特徴的な海綿状変化、および炎症性応答を誘導することの失敗によって見分けられる。
Prion Disease Prime editing can also be used to prevent prion diseases or halt their progression by incorporating one or more protective mutations onto the prion protein (PRNP), which becomes misfolded during the disease process. can be used. Prion diseases or transmissible spongiform encephalopathies (TSEs) are a family of rare, progressive neurodegenerative disorders that affect both humans and animals. They are distinguished by a long latency period, characteristic spongiform changes associated with neuronal loss, and failure to induce an inflammatory response.

ヒトでは、プリオン病は、クロイツフェルト・ヤコブ病(CJD)、変異型クロイツフェルト・ヤコブ病(vCJD)、ゲルストマン・ストロイスラー・シャインカー症候群、致死性家族性不眠症、およびクールー病を包含する。動物では、プリオン病は牛海綿状脳症(BSEまたは「狂牛病」)、慢性消耗病(CWD)、スクレイピー、伝達性ミンク脳症、ネコ海綿状脳症、および有蹄類海綿状脳症を包含する。これらのプリオン病のいずれか1つを防止またはその進行を停止させるために、プライム編集は防護性の点変異をプリオンタンパク質上に組み入れるために用いられ得る。 In humans, prion diseases include Creutzfeldt-Jakob disease (CJD), variant Creutzfeldt-Jakob disease (vCJD), Gerstmann-Sträussler-Scheinker syndrome, fatal familial insomnia, and kuru. In animals, prion diseases include bovine spongiform encephalopathy (BSE or "mad cow disease"), chronic wasting disease (CWD), scrapie, transmissible mink encephalopathy, feline spongiform encephalopathy, and ungulate spongiform encephalopathy. To prevent or halt the progression of any one of these prion diseases, prime editing can be used to incorporate protective point mutations onto the prion protein.

古典的CJDはヒトプリオン病である。それは、特徴的な臨床および診断特色を有する神経変性障害である。この疾患は急速に進行性であり、常に致死的である。この疾患による感染は通常は病気の発症から1年以内に死に至る。CJDは急速に進行性の変わることなく致死的な神経変性障害であり、プリオンタンパク質として公知の細胞性の糖タンパク質の異常なアイソフォームによって引き起こされると信じられている。CJDは世界的に生起し、米国を包含する多くの国の見積もられる年間発生率は100万人の集団あたり約1ケースであることが報告されている。CJD患者の大多数は通常は病気の発症から1年以内に死ぬ。CJDは、ヒトおよび動物において生起する他のプリオン病と併せて、伝達性海綿状脳症(TSE)として分類される。患者の約85%では、CJDは伝達の認識可能なパターンなしに特発性疾患として生起する。患者のより小さい割合(5から15%)は、プリオンタンパク質遺伝子の受け継がれた変異ゆえにCJDを発生する。これらの受け継がれる形態は、ゲルストマン・ストロイスラー・シャインカー症候群および致死性家族性不眠症を包含する。CJDについて、処置は現行では公知ではない。 Classical CJD is a human prion disease. It is a neurodegenerative disorder with characteristic clinical and diagnostic features. The disease is rapidly progressive and invariably fatal. Infection with the disease is usually fatal within one year of disease onset. CJD is a rapidly progressive, invariably fatal neurodegenerative disorder believed to be caused by an abnormal isoform of a cellular glycoprotein known as the prion protein. CJD occurs worldwide, with an estimated annual incidence in many countries, including the United States, reported to be about one case per million population. The majority of CJD patients usually die within one year of disease onset. CJD is classified as a transmissible spongiform encephalopathy (TSE), along with other prion diseases occurring in humans and animals. In approximately 85% of patients, CJD occurs as an idiopathic disease with no discernible pattern of transmission. A smaller percentage of patients (5 to 15%) develop CJD due to inherited mutations in the prion protein gene. These inherited forms include Gerstmann-Straussler-Scheinker syndrome and fatal familial insomnia. There is currently no known treatment for CJD.

変異型クロイツフェルト・ヤコブ病(vCJD)は英国で1996年に最初に記載されたプリオン病である。今や、牛のプリオン病の牛海綿状脳症(BSEまたは「狂牛」病)のアウトブレイクを担う物質が、ヒトのvCJDのアウトブレイクを担う同じ物質であるという強い科学的証拠がある。バリアントCJD(vCJD)は古典的CJD(多くの場合には単純にCJDと呼ばれる)と同じ疾患ではない。それは古典的CJDとは異なる臨床的および病理学的特徴を有する。各疾患はプリオンタンパク質遺伝子の具体的な遺伝子プロファイルをもまた有する。両方の障害は、年で測定される普通でなく長い潜伏期間を有する変わることなく致死的な脳疾患であり、プリオンと呼ばれる非従来的な伝達性物質によって引き起こされる。vCJDについて、処置は現行では公知ではない。 Variant Creutzfeldt-Jakob disease (vCJD) is a prion disease first described in the United Kingdom in 1996. There is now strong scientific evidence that the agent responsible for outbreaks of the prion disease bovine spongiform encephalopathy (BSE or "mad cow" disease) in cattle is the same agent responsible for outbreaks of vCJD in humans. Variant CJD (vCJD) is not the same disease as classic CJD (often referred to simply as CJD). It has different clinical and pathological features from classic CJD. Each disease also has a specific genetic profile of prion protein genes. Both disorders are persistently fatal brain diseases with unusually long incubation periods measured in years and are caused by unconventional transmitters called prions. For vCJD, no treatment is currently known.

BSE(牛海綿状脳症または「狂牛病」)は、プリオンと呼ばれる普通でない伝達性物質による感染からもたらされる畜牛の進行性の神経学的障害である。伝達性物質の性質は良く理解されてはいない。現行では、最も受け入れられた理論は、物質が、プリオンタンパク質として公知の正常タンパク質の改変された形態であるということである。まだ理解されていない理由から、正常なプリオンタンパク質は病原性の(有害な)形態へと変化し、これはそれから畜牛の中枢神経系を損傷する。BSEの異なる株があるという増大して行く証拠がある:英国におけるアウトブレイクを担った典型的または古典的BSE株および2つの非典型的な株(HおよびL株)である。BSEについて、処置は現行では公知ではない。 BSE (bovine spongiform encephalopathy or "mad cow disease") is a progressive neurological disorder in cattle that results from infection with an unusually transmittable substance called a prion. The nature of communicable substances is not well understood. Currently, the most accepted theory is that the substance is a modified form of a normal protein known as prion protein. For reasons not yet understood, the normal prion protein transforms into a pathogenic (harmful) form, which then damages the central nervous system of cattle. There is growing evidence that there are different strains of BSE: the typical or classic BSE strain responsible for the outbreak in the UK and two atypical strains (strains H and L). For BSE, no treatment is currently known.

慢性消耗病(CWD)は、鹿、ヘラジカ、トナカイ、ニホンジカ、およびムースを冒すプリオン病である。それはカナダおよび米国を包含する北米、ノルウェー、ならびに韓国のいくつかのエリアにおいて見出されている。感染動物が症状を発生する前には1年超がかかり得、これらは激しい体重減少(消耗)、よろめき、無気力、および他の神経症状を包含し得る。CWDは全ての年齢の動物を冒し得、いくつかの感染動物はいつか疾患を発生することなしに死に得る。CWDは動物にとって致死的であり、処置またはワクチンはない。 Chronic wasting disease (CWD) is a prion disease that affects deer, elk, reindeer, sika deer, and moose. It is found in some areas of North America, Norway, and South Korea, including Canada and the United States. It can take more than a year before infected animals develop symptoms, and these can include severe weight loss (wasting), staggering, lethargy, and other neurological symptoms. CWD can affect animals of all ages, and some infected animals can eventually die without developing disease. CWD is fatal to animals and there is no treatment or vaccine.

TSEの原因物質はプリオンであると信じられている。用語「プリオン」は、伝達性であり、脳に最も豊富に見出されるプリオンタンパク質と呼ばれる特定の正常な細胞性タンパク質の異常なフォールディングを誘導する能力がある異常な病原性物質を言う。これらの正常なプリオンタンパク質の機能はなお完全には理解されていない。プリオンタンパク質の異常なフォールディングは脳損傷と疾患の特徴的な徴候および症状とに至る。プリオン病は通常は急速に進行性であり、常に致死的である。 The causative agent of TSE is believed to be a prion. The term "prion" refers to an abnormal pathogenic substance that is transmissible and capable of inducing abnormal folding of certain normal cellular proteins called prion proteins, which are most abundantly found in the brain. The function of these normal prion proteins is still not completely understood. Abnormal folding of the prion protein leads to brain damage and characteristic signs and symptoms of the disease. Prion diseases are usually rapidly progressive and always fatal.

本願において用いられる用語「プリオン」は、ヒトおよび動物の疾患(海綿状脳症)を引き起こすことが公知の感染性粒子を意味する。用語「プリオン」は単語「タンパク質」および「感染」の短縮であり、粒子は、専らではないにしても、大きくは、立体配座を変化させてPRNPScになるPRNPCを発現するPRNP遺伝子によってコードされるPRNPSc分子からなる。プリオンは細菌、ウイルス、およびウイロイドとは別物である。公知のプリオンは、動物に感染して、羊および山羊の神経系の伝達性の変性疾患スクレイピー、ならびに牛海綿状脳症(BSE)または狂牛病および猫のネコ海綿状脳症を引き起こすものを包含する。ヒトを冒すことが公知の上で論じられている4つのプリオン病は(1)クールー病、(2)クロイツフェルト・ヤコブ病(CJD)、(3)ゲルストマン・ストロイスラー・シャインカー病(GSS)、および(4)致死性家族性不眠症(FFI)である。本願において用いられるプリオンは、用いられるいずれかの動物、具体的にはヒトおよび飼育畜産動物においてこれらの疾患または他の全てまたはいずれかを引き起こすプリオンの全ての形態を包含する。 The term "prion" as used herein refers to an infectious particle known to cause disease in humans and animals (spongiform encephalopathies). The term "prion" is a contraction of the words "protein" and "infection," and the particles are primarily, if not exclusively, infected by the PRNP gene expressing PRNP C , which changes conformation to become PRNP Sc . Consists of encoded PRNP Sc molecules. Prions are distinct from bacteria, viruses, and viroids. Known prions include those that infect animals and cause scrapie, a contagious degenerative disease of the nervous system in sheep and goats, as well as bovine spongiform encephalopathy (BSE) or mad cow disease and feline spongiform encephalopathy in cats. . The four prion diseases known and discussed to affect humans are (1) Kuru disease, (2) Creutzfeldt-Jakob disease (CJD), and (3) Gerstmann-Streussler-Scheinker disease (GSS). , and (4) fatal familial insomnia (FFI). Prions, as used herein, encompass all forms of prions that cause these diseases and/or others in any animal used, specifically humans and domesticated livestock.

一般的に、理論によって拘束されることなしに、プリオン病はプリオンタンパク質のミスフォールディングによって引き起こされる。多くの場合に沈着性疾患と呼ばれるかかる疾患、プリオンタンパク質のミスフォールディングは次のとおり説明され得る。Aが、意図される生理的役割をモノマーまたはオリゴマー状態で実行する正常に合成された遺伝子産物であり、かつA*が、劇的な立体配座変化を経過するために有能であるAの立体配座的に活性化された形態である場合には、Bは多量体アセンブリを好む立体配座的に変改された状態であり(すなわち、沈着を形成するミスフォールディングされた形態)、かつBnは、病原性であり、リサイクルすることが相対的に困難である多量体材料である。プリオン病では、PRNPCおよびPRNPScは状態AおよびBnに対応し、ここで、Aは大きくはヘリカルかつモノマー性であり、Bnはβリッチかつ多量体性である。 Generally, without being bound by theory, prion diseases are caused by misfolding of the prion protein. Such a disease, often referred to as deposition disease, prion protein misfolding can be explained as follows. A is a normally synthesized gene product that performs its intended physiological role in a monomeric or oligomeric state, and A* is a gene product of A that is capable of undergoing dramatic conformational changes. When in the conformationally activated form, B is in a conformationally altered state that favors multimeric assembly (i.e., a misfolded form that forms deposits), and Bn is a multimeric material that is pathogenic and relatively difficult to recycle. In prion diseases, PRNP C and PRNP Sc correspond to states A and B n , where A is largely helical and monomeric and B n is β-rich and multimeric.

プリオンタンパク質のある種の変異はプリオン(prior)病の増大したリスクに関連し得るということが公知である。反対に、プリオンタンパク質のある種の変異は天然に防護性であり得る。Bagynszky et al.,“Characterization of mutations in PRNP(prion)gene and their possible roles in neurodegenerative diseases,”Neuropsychiatr Dis Treat.,2018;14:2067-2085を見よ。これの内容は参照によって本願に組み込まれる。 It is known that certain mutations in the prion protein may be associated with an increased risk of prion disease. Conversely, certain mutations of the prion protein may be naturally protective. See Bagynszky et al., “Characterization of mutations in PRNP(prion)gene and their possible roles in neurodegenerative diseases,” Neuropsychiatr Dis Treat., 2018;14:2067-2085. The contents of which are incorporated into this application by reference.

PRNP(NCBI RefSeq No.NP_000302.1(配列番号291))ヒトプリオンタンパク質は、染色体20(4686151-4701588)上に位置付けられた16kb長の遺伝子によってコードされる。それは2つのエキソンを含有し、エキソン2はオープンリーディングフレームを持ち、これは253アミノ酸(AA)長のPrPタンパク質をコードする。エキソン1は非コードエキソンであり、これは転写開始部位としての用をなし得る。翻訳後修飾は最初の22AA N末端フラグメント(NTF)および最後の23AA C末端フラグメント(CTF)の除去をもたらす。NTFは小胞体(ER)へのPrP輸送後に切断され、CTF(グリコシルホスファチジルイノシトール[GPI]シグナルペプチド[GPI-SP])はGPIアンカーによって切断される。GPIアンカーはPrPタンパク質輸送に関わり得る。それは細胞膜の外側表面へのプリオンタンパク質の取り付けの役割をもまた演じ得る。正常なPrPは、長いN末端ループ(これはオクタペプチド反復領域を含有する)、2つの短いβシート、3つのαヘリックス、およびC末端領域(これはGPIアンカーを含有する)から成る。PrPの切断は、細胞膜にアンカー固定される208AA長の糖タンパク質をもたらす。 PRNP (NCBI RefSeq No. NP_000302.1 (SEQ ID NO: 291)) human prion protein is encoded by a 16 kb long gene located on chromosome 20 (4686151-4701588). It contains two exons, exon 2 has an open reading frame, which encodes the 253 amino acid (AA) long PrP protein. Exon 1 is a non-coding exon, which can serve as a transcription initiation site. Post-translational modification results in the removal of the first 22AA N-terminal fragment (NTF) and the last 23AA C-terminal fragment (CTF). NTF is cleaved after PrP transport to the endoplasmic reticulum (ER), and CTF (glycosylphosphatidylinositol [GPI] signal peptide [GPI-SP]) is cleaved by the GPI anchor. GPI anchors may be involved in PrP protein transport. It may also play a role in attaching the prion protein to the outer surface of the cell membrane. Normal PrP consists of a long N-terminal loop (which contains an octapeptide repeat region), two short β-sheets, three α-helices, and a C-terminal region (which contains a GPI anchor). Cleavage of PrP results in a 208AA long glycoprotein that is anchored to the cell membrane.

PRNP(NP_000302.1)の253アミノ酸配列は以下のとおりである:
MANLGCWMLVLFVATWSDLGLCKKRPKPGGWNTGGSRYPGQGSPGGNRYPPQGGGGWGQPHGGGWGQPHGGGWGQPHGGGWGQPHGGGWGQGGGTHSQWNKPSKPKTNMKHMAGAAAAGAVVGGLGGYMLGSAMSRPIIHFGSDYEDRYYRENMHRYPNQVYYRPMDEYSNQNNFVHDCVNITIKQHTVTTTTKGENFTETDVKMMERVVEQMCITQYERESQAYYQRGSSMVLFSSPPV(配列番号291)。
The 253 amino acid sequence of PRNP (NP_000302.1) is as follows:
MANLGCWMLVLFVATWSDLGLCKKRPKPGGWNTGGSRYPGQGSPGGNRYPPQGGGGWGQPHGGGWGQPHGGGWGQPHGGGWGQPHGGGWGQGGGTHSQWNKPSKPKTNMKHMAGAAAAGAVVGGGLGGYMLGSAMSRPIIHFGSDYEDRYYRENMHRYPNQVYYRPMDEYSNQNNFVHDCVNITIKQHTVTTTTKGENFTETDVKMMERV VEQMCITQYERESQAYYQRGSSMVLFSSPPV (SEQ ID NO: 291).

PRNP(NP_000302.1)の253アミノ酸配列は、以下のヌクレオチド配列(NCBI Ref.Seq No.NM_000311.5,“homo sapiens prion protein(PRNP),transcript variant 1,mRNA)によってコードされており、以下のとおりである:
GCGAACCTTGGCTGCTGGATGCTGGTTCTCTTTGTGGCCACATGGAGTGACCTGGGCCTCTGCAAGAAGCGCCCGAAGCCTGGAGGATGGAACACTGGGGGCAGCCGATACCCGGGGCAGGGCAGCCCTGGAGGCAACCGCTACCCACCTCAGGGCGGTGGTGGCTGGGGGCAGCCTCATGGTGGTGGCTGGGGGCAGCCTCATGGTGGTGGCTGGGGGCAGCCCCATGGTGGTGGCTGGGGACAGCCTCATGGTGGTGGCTGGGGTCAAGGAGGTGGCACCCACAGTCAGTGGAACAAGCCGAGTAAGCCAAAAACCAACATGAAGCACATGGCTGGTGCTGCAGCAGCTGGGGCAGTGGTGGGGGGCCTTGGCGGCTACATGCTGGGAAGTGCCATGAGCAGGCCCATCATACATTTCGGCAGTGACTATGAGGACCGTTACTATCGTGAAAACATGCACCGTTACCCCAACCAAGTGTACTACAGGCCCATGGATGAGTACAGCAACCAGAACAACTTTGTGCACGACTGCGTCAATATCACAATCAAGCAGCACACGGTCACCACAACCACCAAGGGGGAGAACTTCACCGAGACCGACGTTAAGATGATGGAGCGCGTGGTTGAGCAGATGTGTATCACCCAGTACGAGAGGGAATCTCAGGCCTATTACCAGAGAGGATCGAGCATGGTCCTCTTCTCCTCTCCACCTGTGATCCTCCTGATCTCTTTCCTCATCTTCCTGATAGTGGGATGAGGAAGGTCTTCCTGTTTTCACCATCTTTCTAATCTTTTTCCAGCTTGAGGGAGGCGGTATCCACCTGCAGCCCTTTTAGTGGTGGTGTCTCACTCTTTCTTCTCTCTTTGTCCCGGATAGGCTAATCAATACCCTTGGCACTGATGGGCACTGGAAAACATAGAGTAGACCTGAGATGCTGGTCAAGCCCCCTTTGATTGAGTTCATCATGAGCCGTTGCTAATGCCAGGCCAGTAAAAGTATAACAGCAAATAACCATTGGTTAATCTGGACTTATTTTTGGACTTAGTGCAACAGGTTGAGGCTAAAACAAATCTCAGAACAGTCTGAAATACCTTTGCCTGGATACCTCTGGCTCCTTCAGCAGCTAGAGCTCAGTATACTAATGCCCTATCTTAGTAGAGATTTCATAGCTATTTAGAGATATTTTCCATTTTAAGAAAACCCGACAACATTTCTGCCAGGTTTGTTAGGAGGCCACATGATACTTATTCAAAAAAATCCTAGAGATTCTTAGCTCTTGGGATGCAGGCTCAGCCCGCTGGAGCATGAGCTCTGTGTGTACCGAGAACTGGGGTGATGTTTTACTTTTCACAGTATGGGCTACACAGCAGCTGTTCAACAAGAGTAAATATTGTCACAACACTGAACCTCTGGCTAGAGGACATATTCACAGTGAACATAACTGTAACATATATGAAAGGCTTCTGGGACTTGAAATCAAATGTTTGGGAATGGTGCCCTTGGAGGCAACCTCCCATTTTAGATGTTTAAAGGACCCTATATGTGGCATTCCTTTCTTTAAACTATAGGTAATTAAGGCAGCTGAAAAGTAAATTGCCTTCTAGACACTGAAGGCAAATCTCCTTTGTCCATTTACCTGGAAACCAGAATGATTTTGACATACAGGAGAGCTGCAGTTGTGAAAGCACCATCATCATAGAGGATGATGTAATTAAAAAATGGTCAGTGTGCAAAGAAAAGAACTGCTTGCATTTCTTTATTTCTGTCTCATAATTGTCAAAAACCAGAATTAGGTCAAGTTCATAGTTTCTGTAATTGGCTTTTGAATCAAAGAATAGGGAGACAATCTAAAAAATATCTTAGGTTGGAGATGACAGAAATATGATTGATTTGAAGTGGAAAAAGAAATTCTGTTAATGTTAATTAAAGTAAAATTATTCCCTGAATTGTTTGATATTGTCACCTAGCAGATATGTATTACTTTTCTGCAATGTTATTATTGGCTTGCACTTTGTGAGTATTCTATGTAAAAATATATATGTATATAAAATATATATTGCATAGGACAGACTTAGGAGTTTTGTTTAGAGCAGTTAACATCTGAAGTGTCTAATGCATTAACTTTTGTAAGGTACTGAATACTTAATATGTGGGAAACCCTTTTGCGTGGTCCTTAGGCTTACAATGTGCACTGAATCGTTTCATGTAAGAATCCAAAGTGGACACCATTAACAGGTCTTTGAAATATGCATGTACTTTATATTTTCTATATTTGTAACTTTGCATGTTCTTGTTTTGTTATATAAAAAAATTGTAAATGTTTAATATCTGACTGAAATTAAACGAGCGAAGATGAGCACCA(配列番号292)
The 253 amino acid sequence of PRNP (NP_000302.1) is encoded by the following nucleotide sequence (NCBI Ref.Seq No.NM_000311.5, “homo sapiens prion protein (PRNP), transcript variant 1, mRNA), and the following It is as follows:
(Sequence number 292)

CJDおよびFFIにリンクしているPRNP(NP_000302.1)に対して相対的な変異部位は報告されており、次のとおりである。これらの変異は本明細書に開示のプライム編集因子を用いて除去または組み入れられ得る。

Figure 2020191234000291
Figure 2020191234000292
The relative mutation sites for PRNP (NP_000302.1) linked to CJD and FFI have been reported and are as follows. These mutations can be removed or incorporated using the prime editing factors disclosed herein.
Figure 2020191234000291
Figure 2020191234000292

GSSにリンクしているPRNP(NP_000302.1)(配列番号291)に対して相対的な変異部位は次のとおり報告されている:

Figure 2020191234000293
Figure 2020191234000294
The mutation sites relative to GSS-linked PRNP (NP_000302.1) (SEQ ID NO: 291) are reported as follows:
Figure 2020191234000293
Figure 2020191234000294

プリオン病に対する可能な防護性の性質にリンクしているPRNP(NP_000302.1)(配列番号291)に対して相対的な変異部位は次のとおり:

Figure 2020191234000295
Figure 2020191234000296
The mutation sites relative to PRNP (NP_000302.1) (SEQ ID NO: 291) that are linked to possible protective properties against prion disease are as follows:
Figure 2020191234000295
Figure 2020191234000296

それゆえに、種々の態様において、プライム編集は、プリオン病にリンクしているPRNPの変異を除去するかまたはプリオン病に対して防護性であると考慮されるPRNPの変異を組み入れるために用いられ得る。例えば、プライム編集は、PRNPタンパク質のD178N、V180I、T188K、E196K、E196A、E200K、E200G、V203I、R208H、V210I、E211Q、I215V、またはM232R変異を除去または復元するために用いられ得る(NP_000302.1のPRNPに対して相対的)(配列番号291)。他の態様において、プライム編集は、PRNPタンパク質のP102L、P105L、A117V、G131V、V176G、H187R、F198S、D202N、Q212P、Q217R、またはM232T変異を除去または復元するために用いられ得る(NP_000302.1のPRNPに対して相対的)(配列番号291)。プライム編集を用いてPRNPのかかる変異の存在を除去または修正することによって、プリオン病のリスクが縮減または消去され得る。 Therefore, in various embodiments, prime editing can be used to remove mutations in PRNP that are linked to prion diseases or to incorporate mutations in PRNP that are considered to be protective against prion diseases. . For example, prime editing can be used to remove or restore the D178N, V180I, T188K, E196K, E196A, E200K, E200G, V203I, R208H, V210I, E211Q, I215V, or M232R mutations in the PRNP protein (NP_000302.1 (relative to PRNP) (SEQ ID NO: 291). In other embodiments, prime editing may be used to remove or restore the P102L, P105L, A117V, G131V, V176G, H187R, F198S, D202N, Q212P, Q217R, or M232T mutations in the PRNP protein (NP_000302.1). relative to PRNP) (SEQ ID NO: 291). By removing or correcting the presence of such mutations in PRNP using prime editing, the risk of prion disease may be reduced or eliminated.

他の態様において、プライム編集は、1つ以上のプリオン病に対する防護性の効果にリンクしているPRNPの防護性変異を組み入れるために用いられ得る。例えば、プライム編集は、PRNPのG127S、G127V、M129V、D167G、D167N、N171S、E219K、またはP238S防護性変異を組み入れるために用いられ得る(NP_000302.1のPRNPに対して相対的)(配列番号291)。なお他の態様において、防護性変異は、PRNPのG127、G127、M129、D167、D167、N171、E219、またはP238に組み入れされるいずれかの代替アミノ酸であり得る(NP_000302.1のPRNPに対して相対的)(配列番号291)。 In other embodiments, prime editing can be used to incorporate protective mutations in PRNP that are linked to protective effects against one or more prion diseases. For example, prime editing can be used to incorporate G127S, G127V, M129V, D167G, D167N, N171S, E219K, or P238S protective mutations in PRNP (relative to PRNP in NP_000302.1) (SEQ ID NO: 291 ). In still other embodiments, the protective mutation can be any alternative amino acid incorporated at G127, G127, M129, D167, D167, N171, E219, or P238 of PRNP (for PRNP of NP_000302.1 relative) (SEQ ID NO: 291).

具体的な態様では、図27において例解され例5において論じられるとおり、プライム編集はG127V防護性変異をPRNPに組み入れるために用いられ得る。 In a specific embodiment, prime editing can be used to incorporate the G127V protective mutation into PRNP, as illustrated in FIG. 27 and discussed in Example 5.

別の態様では、プライム編集はE219K防護性変異をPRNPに組み入れるために用いられ得る。 In another embodiment, prime editing can be used to incorporate the E219K protective mutation into PRNP.

PRNPタンパク質および防護性変異部位は哺乳動物において保存されている。そのため、ヒト疾患を処置することに加えて、それは、プリオン病に対して免疫がある牛および羊を生成するか、またはさらにはプリオン病を患っている動物の野生集団を治癒させることを助けるためにもまた用いられ得る。プライム編集はヒト細胞における天然に存在する防護性アレルの~25%組み入れを達成するためにすでに用いられており、先のマウス実験は組み入れのこのレベルがほとんどのプリオン病に対する免疫を引き起こすために十分であるということを指示している。この方法は、ほとんどの細胞型においてかかる高い効率でこのアレルを組み入れるための第1のかつ可能性としては唯一の現行のやり方である。処置のための別の可能な戦略は、プライム編集を用いて、早期停止コドンを遺伝子に組み入れることによってPRNPの発現を縮減または消去することである。 The PRNP protein and protective mutation sites are conserved in mammals. Therefore, in addition to treating human diseases, it could be used to generate cattle and sheep that are immune to prion diseases, or even to help cure wild populations of animals suffering from prion diseases. It can also be used. Prime editing has already been used to achieve ~25% incorporation of naturally occurring protective alleles in human cells, and previous mouse experiments have shown that this level of incorporation is sufficient to induce immunity against most prion diseases. It indicates that. This method is the first and potentially the only current way to incorporate this allele with such high efficiency in most cell types. Another possible strategy for treatment is to use prime editing to reduce or eliminate expression of PRNP by incorporating a premature stop codon into the gene.

PEgRNAデザインのための本明細書に記載の原理を用いて、適当なPEgRNAが、所望の防護性変異を組み入れるために、またはPRNPからプリオン病関連変異を除去するためにデザインされ得る。例えば、PEgRNAの下のリストは、G127V防護性アレルおよびE219K防護性アレルをヒトPRNPに、ならびにG127V防護性アレルを種々の動物のPRNPに組み入れるために用いられ得る。 Using the principles described herein for PEgRNA design, suitable PEgRNAs can be designed to incorporate desired protective mutations or to remove prion disease-associated mutations from PRNP. For example, the list below of PEgRNA can be used to incorporate the G127V and E219K protective alleles into human PRNPs, and the G127V protective allele into PRNPs of various animals.

[9]医薬組成物
他の本開示の側面は、本明細書に記載のプライム編集系の様々な構成要素のいずれも(例として、これらに限定されないが、napDNAbp、逆転写酵素、融合タンパク質(例として、napDNAbpsと逆転写酵素とを含む)、伸長されたガイドRNA、および融合タンパク質と伸長されたガイドRNAとを含む複合体、ならびに第2鎖へニックを入れる構成要素および5'内生DNAフラップ除去エンドヌクレアーゼなどの、編集済産物形成へのプライム編集プロセスを推進するのに役立つ付属要素を包含する)含む医薬組成物に関する。
[9] Pharmaceutical compositions Other aspects of the present disclosure include pharmaceutical compositions that contain any of the various components of the prime editing system described herein, including, but not limited to, napDNAbp, reverse transcriptase, fusion proteins ( Examples include napDNAbps and reverse transcriptase), an extended guide RNA, and a complex comprising a fusion protein and extended guide RNA, as well as a component that nicks the second strand and the 5' endogenous DNA. The present invention relates to pharmaceutical compositions containing adjuncts that help drive the prime editing process to the formation of edited products, such as flap removal endonucleases.

用語「医薬組成物」は、本明細書に使用されるとき、医薬使用のために製剤化された組成物を指す。いくつかの態様において、医薬組成物はさらに、薬学的に許容し得る担体を含む。いくつかの態様において、医薬組成物は、追加の剤(例として、特定の送達、半減期の増大、または他の治療的化合物のための)を含む。 The term "pharmaceutical composition" as used herein refers to a composition formulated for pharmaceutical use. In some embodiments, the pharmaceutical composition further comprises a pharmaceutically acceptable carrier. In some embodiments, the pharmaceutical composition includes additional agents (eg, for specific delivery, half-life enhancement, or other therapeutic compounds).

ここで使用されるとき、用語「薬学的に許容し得る担体」は、液体または固体の充填剤、希釈剤、賦形剤、製造補助剤(例として、潤滑剤、タルクマグネシウム、カルシウム、またはステアリン酸亜鉛もしくはステアリン酸)、あるいは身体のある部位(例として、送達部位)から別の部位(例として、器官、組織、もしくは身体部分)へ化合物を運搬または輸送することに関与する溶媒封入材料などの、薬学的に許容し得る材料、組成物、またはビヒクルを意味する。薬学的に許容し得る担体は、製剤の他の成分と相溶性があるが対象の組織に対しては傷害性がない(例として、生理学的に相溶性のある、滅菌された、生理学的なpH、等々)という意味で「許容し得る」ものである。薬学的に許容し得る担体として働き得る材料のいくつかの例は以下を包含する:(1)ラクトース、グルコース、およびスクロースなどの、糖;(2)コーンスターチおよびジャガイモデンプンなどの、デンプン;(3)ナトリウムカルボキシメチルセルロース、メチルセルロース、エチルセルロース、微結晶性セルロース、および酢酸セルロースなどの、セルロースおよびその誘導体;(4)粉末状トラガカント;(5)麦芽;(6)ゼラチン;(7)ステアリン酸マグネシウム、ラウリル硫酸ナトリウム、およびタルクなどの、平滑剤;(8)カカオバターおよび坐薬蝋などの、賦形剤;(9)落花生油、綿実油、紅花油、ゴマ 油、オリーブ油、トウモロコシ油、および大豆油などの、油;(10)プロピレングリコールなどの、グリコール;(11)グリセリン、ソルビトール、マンニトール、およびポリエチレングリコール(PEG)などの、ポリオール;(12)オレイン酸エチルおよびラウリン酸エチルなどの、エステル;(13)寒天;(14)水酸化マグネシウムおよび水酸化アルミニウムなどの、緩衝剤;(15)アルギン酸;(16)パイロジェンフリー水;(17)等浸透圧の生理食塩水;(18)リンガー溶液;(19)エチルアルコール;(20)pH緩衝溶液;(21)ポリエステル、ポリカーボネート、および/またはポリ酸無水物;(22)ポリペプチドおよびアミノ酸などの、増量剤;(23)血清アルブミン、HDL、およびLDLなどの、血清構成要素;(22)エタノールなどの、C2~C12アルコール;ならびに(23)医薬製剤に採用される、相溶性のある他の非毒性物質。湿潤剤、着色剤、離型剤、コーティング剤、甘味剤、香味剤、芳香剤、保存料、および抗酸化剤もまた、製剤中に存在し得る。「賦形剤」、「担体」、「薬学的に許容し得る担体」または同種のものなどの用語は本明細書中、互換的に使用される。 As used herein, the term "pharmaceutically acceptable carrier" refers to liquid or solid fillers, diluents, excipients, manufacturing aids such as lubricants, talc, magnesium, calcium, or stearin. zinc acid or stearic acid), or solvent-encapsulated materials involved in transporting or transporting the compound from one site of the body (e.g., the site of delivery) to another (e.g., an organ, tissue, or body part). means a pharmaceutically acceptable material, composition, or vehicle. A pharmaceutically acceptable carrier is one that is compatible with the other ingredients of the formulation but not injurious to the target tissue (e.g., a physiologically compatible, sterile, "acceptable" in the sense of pH, etc.). Some examples of materials that can serve as pharmaceutically acceptable carriers include: (1) sugars, such as lactose, glucose, and sucrose; (2) starches, such as corn starch and potato starch; (3) ) Cellulose and its derivatives, such as sodium carboxymethylcellulose, methylcellulose, ethylcellulose, microcrystalline cellulose, and cellulose acetate; (4) powdered tragacanth; (5) malt; (6) gelatin; (7) magnesium stearate, lauryl (8) Excipients, such as cocoa butter and suppository wax; (9) Lubricant agents, such as sodium sulfate, and talc; (9) Excipients, such as peanut oil, cottonseed oil, safflower oil, sesame oil, olive oil, corn oil, and soybean oil. (10) Glycols, such as propylene glycol; (11) Polyols, such as glycerin, sorbitol, mannitol, and polyethylene glycol (PEG); (12) Esters, such as ethyl oleate and ethyl laurate; (13) ) agar; (14) buffering agents, such as magnesium hydroxide and aluminum hydroxide; (15) alginic acid; (16) pyrogen-free water; (17) isotonic saline; (18) Ringer's solution; (19) ) ethyl alcohol; (20) pH buffer solutions; (21) polyesters, polycarbonates, and/or polyanhydrides; (22) bulking agents, such as polypeptides and amino acids; (23) serum albumin, HDL, and LDL. (22) C2-C12 alcohols, such as ethanol; and (23) other compatible non-toxic substances employed in pharmaceutical formulations. Wetting agents, coloring agents, mold release agents, coating agents, sweetening agents, flavoring agents, perfuming agents, preservatives, and antioxidants may also be present in the formulation. Terms such as "excipient", "carrier", "pharmaceutically acceptable carrier" or the like are used interchangeably herein.

いくつかの態様において、医薬組成物は、対象への送達のために、例として、遺伝子編集のために、製剤化される。本明細書に記載の医薬組成物を投与する好適なルートは、限定せずに、以下を包含する:局所、皮下、経皮、皮内、病巣内、関節内、腹腔内、膀胱内、経粘膜、歯肉、歯内(intradental)、蝸牛内、経鼓膜、器官内、硬膜外、髄腔内、筋肉内、静脈内、血管内、骨内、眼周囲、腫瘍内、脳内、および脳室内の投与。 In some embodiments, the pharmaceutical composition is formulated for delivery to a subject, eg, for gene editing. Suitable routes for administering the pharmaceutical compositions described herein include, but are not limited to: topical, subcutaneous, transdermal, intradermal, intralesional, intraarticular, intraperitoneal, intravesical, intravesical. Mucosal, gingival, intradental, intracochlear, transtympanic, intraorgan, epidural, intrathecal, intramuscular, intravenous, intravascular, intraosseous, periocular, intratumor, intracerebral, and cerebral. Indoor administration.

いくつかの態様において、本明細書に記載の医薬組成物は、罹患部位(例として、腫瘍部位)へ局部的に投与される。いくつかの態様において、本明細書に記載の医薬組成物は、注射によって、カテーテルを用いて、坐薬を用いて、あるいは移植片(多孔性材料、非多孔性材料、またはゼラチン材料(シラスティック膜などの膜もしくは繊維を包含する)の移植片)を用いて、対象へ投与される。 In some embodiments, the pharmaceutical compositions described herein are administered locally to an affected site (eg, a tumor site). In some embodiments, the pharmaceutical compositions described herein are administered by injection, using a catheter, using a suppository, or using an implant (porous material, non-porous material, or gelatin material (silastic membrane)). (including membranes or fibers such as

他の態様において、本明細書に記載の医薬組成物は、制御放出系において送達される。一態様において、ポンプが使用されてもよい(例として、Langer,1990,Science 249:1527-1533;Sefton,1989,CRC Crit.Ref.Biomed.Eng.14:201;Buchwald et al.,1980,Surgery 88:507;Saudek et al.,1989,N.Engl.J.Med.321:574を参照)。別の態様において、ポリマー材料が使用され得る。(例として、Langer and Wise eds.,CRC Press,Boca Raton,Fla.,1974);Controlled Drug Bioavailability, Drug Product Design and Performance(Smolen and Ball eds.,Wiley,New York,1984);Ranger and Peppas,1983,Macromol.Sci.Rev.Macromol.Chem.23:61を参照。またLevy et al.,1985,Science 228:190;During et al.,1989,Ann.Neurol.25:351;Howard et al.,1989,J.Neurosurg.71:105も参照。)他の制御放出系も、例えば、Langer(上記を参照)において考察されている。 In other embodiments, the pharmaceutical compositions described herein are delivered in a controlled release system. In one embodiment, a pump may be used (see, for example, Langer, 1990, Science 249:1527-1533; Sefton, 1989, CRC Crit.Ref.Biomed.Eng.14:201; Buchwald et al., 1980, Surgery 88:507; see Saudek et al., 1989, N. Engl. J. Med. 321:574). In another embodiment, polymeric materials may be used. (For example, Langer and Wise eds., CRC Press, Boca Raton, Fla., 1974); Controlled Drug Bioavailability, Drug Product Design and Performance (Smolen and Ball eds., Wiley, New York, 1984); Ranger and Peppas, See 1983, Macromol. Sci. Rev. Macromol. Chem. 23:61. See also Levy et al., 1985, Science 228:190; During et al., 1989, Ann. Neurol. 25: 351; Howard et al., 1989, J. Neurosurg. 71: 105. ) Other controlled release systems are also discussed, for example in Langer (see above).

いくつかの態様において、医薬組成物は、対象(例として、ヒト)への静脈内投与または皮下投与に適した組成物として、定型的な手順に従って製剤化される。いくつかの態様において、注射による投与のための医薬組成物は、滅菌された等浸透圧の水性緩衝液中の溶液である。必要なら、医薬はまた、可溶化剤、および注射部位での疼痛を和らげるリグノカインなどの局所麻酔薬も包含し得る。一般に、成分は、個別にまたは一緒に混合されて、例えば、活性剤の分量を示したアンプルもしくは小袋(sachette)などの密閉容器中の凍結乾燥された(dry liophilized)粉末または水がない濃縮物として単位剤形で供給される。医薬が注入によって投与されることになっている場合、滅菌医薬グレードの水または生理食塩水を含有する注入瓶で分配され得る。医薬組成物が注射によって投与される場合、注射用滅菌水または生理食塩水のアンプルは、成分が投与に先立ち混合され得るように、提供され得る。 In some embodiments, the pharmaceutical composition is formulated according to routine procedures as a composition suitable for intravenous or subcutaneous administration to a subject (eg, a human). In some embodiments, pharmaceutical compositions for administration by injection are solutions in sterile isotonic aqueous buffer. Where necessary, the drug may also include a solubilizing agent and a local anesthetic such as lignocaine to ease pain at the site of the injection. In general, the ingredients are either individually or mixed together in a dry liophilized powder or waterless concentrate in a sealed container such as an ampoule or sachette indicating the amount of active agent. Supplied in unit dosage form as If the drug is to be administered by injection, it may be dispensed in an infusion bottle containing sterile pharmaceutical grade water or saline. When the pharmaceutical composition is administered by injection, an ampoule of sterile water for injection or saline can be provided so that the ingredients can be mixed prior to administration.

全身投与のための医薬組成物は、液体、例として、滅菌された生理食塩水、乳酸リンガー溶液またはハンクス溶液であってもよい。加えて、医薬組成物は固体形態であって、使用に先立ち即時に再溶解または懸濁され得る。凍結乾燥された形態もまた企図される。 Pharmaceutical compositions for systemic administration may be liquids, such as sterile saline, lactated Ringer's solution or Hank's solution. Additionally, the pharmaceutical compositions are in solid form and can be reconstituted or suspended extemporaneously prior to use. Lyophilized forms are also contemplated.

医薬組成物は、非経口投与にも好適なリポソームもしくはマイクロ結晶などの脂質粒子またはベシクル内に含有され得る。粒子は、組成物がこれに含有される限り、単層(unilamellar)または多層(plurilamellar)などの、いずれの好適な構造でもあり得る。化合物は、膜融合(fusogenic)脂質ジオレオイルホスファチジルエタノールアミン(DOPE)、低レベル(5~10mol%)のカチオン性脂質を含有し、かつポリエチレングリコール(PEG)コーティングによって安定化された「安定化プラスミド-脂質粒子」(SPLP)に封入され得る(Zhang Y.P.et al.,Gene Ther.1999,6:1438-47)。N-[1-(2,3-ジオレオイルオキシ)プロピル]-N,N,N-トリメチル-アンモニウムメチルスルファート、または「DOTAP」などの、正に帯電した脂質は、かかる粒子およびベシクルにとって具体的に好ましい。かかる脂質粒子の調製は周知である。例として、米国特許第4,880,635号;第4,906,477号;第4,911,928号;第4,917,951号;第4,920,016号;および第4,921,757号を参照;これらの各々は参照により本明細書に組み込まれる。 Pharmaceutical compositions may be contained within lipid particles or vesicles such as liposomes or microcrystals, which are also suitable for parenteral administration. The particles may be of any suitable structure, such as unilamellar or plurilamellar, so long as the composition is contained therein. The compound contains the fusogenic lipid dioleoylphosphatidylethanolamine (DOPE), low levels (5-10 mol%) of cationic lipids, and is stabilized by a polyethylene glycol (PEG) coating. plasmid-lipid particles (SPLP) (Zhang Y.P. et al., Gene Ther. 1999, 6:1438-47). Positively charged lipids, such as N-[1-(2,3-dioleoyloxy)propyl]-N,N,N-trimethyl-ammonium methyl sulfate, or "DOTAP", are effective for such particles and vesicles. Specifically preferred. The preparation of such lipid particles is well known. See, by way of example, U.S. Pat. No. 4,880,635;

本明細書に記載の医薬組成物は、例えば、単位用量として投与またはパッケージされてもよい。用語「単位用量」は、本開示の医薬組成物に関して使用されるとき、まとまった投薬量として対象に好適な、物理的に不連続な単位を指し、予め決められた分量の活性材料を含有する各単位は、要求される希釈剤;すなわち、担体またはビヒクルを伴って所望の治療効果を産生するよう算出される。 The pharmaceutical compositions described herein may be administered or packaged as unit doses, for example. The term "unit dose" as used in reference to the pharmaceutical compositions of the present disclosure refers to physically discrete units suitable for a subject as a unitary dosage and containing a predetermined amount of active material. Each unit is calculated to produce the desired therapeutic effect in association with the required diluent; ie, carrier or vehicle.

さらに、医薬組成物は、(a)本発明の化合物を凍結乾燥形態で含有する容器、および(b)注射のための薬学的に許容し得る希釈剤(例として、滅菌水)を含有する第2容器を含む医薬のキットとして提供され得る。薬学的に許容し得る希釈剤は、凍結乾燥された本発明の化合物の再構成または希釈のために使用され得る。任意に、かかる容器(単数または複数)に関連する通知は、医薬もしくは生物学的産物の製造、使用、または販売を規制する政府機関によって規定される形態であり得、前記通知は、ヒト投与のための製造、使用、または販売の機関による承認を反映する。 Additionally, the pharmaceutical composition comprises (a) a container containing a compound of the invention in lyophilized form, and (b) a container containing a pharmaceutically acceptable diluent for injection (eg, sterile water). It may be provided as a pharmaceutical kit containing two containers. Pharmaceutically acceptable diluents may be used for reconstitution or dilution of lyophilized compounds of the invention. Optionally, the notice associated with such container(s) may be in a form prescribed by a governmental agency that regulates the manufacture, use, or sale of pharmaceutical or biological products; reflects an agency's approval of manufacture, use, or sale for.

別の側面において、上に記載の疾患の処置に有用な材料を含有する製造物品が、包含される。いくつかの態様において、製造物品は、容器およびラベルを含む。好適な容器は、例えば、瓶、バイアル、シリンジ、および試験管を包含する。容器は、ガラスまたはプラスチックなどの様々な材料から形成されてもよい。いくつかの態様において、容器は、本明細書に記載の疾患を処置するのに有効であって滅菌アクセスポートを有していてもよい組成物をとどめておく。例えば、容器は、皮下注射針によって穿刺可能なストッパーを有する静脈内溶液バッグまたはバイアルであってもよい。組成物中の活性剤は本発明の化合物である。いくつかの態様において、容器上のまたはこれに関連したラベルは、組成物が、選んだ疾患を処置するのに使用されることを示す。製造物品はさらに、リン酸緩衝生理食塩水、リンガー溶液、またはデキストロース溶液などの薬学的に許容し得る緩衝液を含む第2容器を含んでもよい。これはさらに、他の緩衝液、希釈剤、フィルター、針、シリンジ、および使用のための指示がある添付文書を包含する、商業的観点およびユーザーの観点から所望される他の材料も包含していてもよい。 In another aspect, articles of manufacture containing materials useful for treating the diseases described above are included. In some embodiments, the article of manufacture includes a container and a label. Suitable containers include, for example, bottles, vials, syringes, and test tubes. The container may be formed from a variety of materials such as glass or plastic. In some embodiments, the container retains a composition effective to treat a disease described herein and may have a sterile access port. For example, the container may be an intravenous solution bag or vial with a stopper pierceable by a hypodermic needle. The active agent in the composition is a compound of the invention. In some embodiments, a label on or associated with the container indicates that the composition is used to treat the disease of choice. The article of manufacture may further include a second container containing a pharmaceutically acceptable buffer, such as phosphate buffered saline, Ringer's solution, or dextrose solution. It further encompasses other materials desirable from a commercial and user standpoint, including other buffers, diluents, filters, needles, syringes, and package inserts with instructions for use. It's okay.

[10]キット、ベクター、細胞、および送達
キット
本開示の組成物は、キット中へ集められ得る。いくつかの態様において、キットは、本明細書に記載のプライム編集因子の発現のための核酸ベクターを含む。他の態様において、キットはさらに、適切なガイドヌクレオチド配列(例として、PEgRNAおよび第2部位gRNA)、またはかかるガイドヌクレオチド配列(Cas9タンパク質またはプライム編集因子に所望の標的配列を標的にさせる)の発現のための核酸ベクターを含む。
[10] Kits, vectors, cells, and delivery
Kits Compositions of the present disclosure can be assembled into kits. In some embodiments, the kit includes a nucleic acid vector for expression of a prime editing factor described herein. In other embodiments, the kit further provides for expression of suitable guide nucleotide sequences (e.g., PEgRNA and second site gRNA), or such guide nucleotide sequences (which direct the Cas9 protein or prime editing factor to the desired target sequence). Contains nucleic acid vectors for.

本明細書に記載のキットは、本明細書に記載の方法を実施するための構成要素および任意に使用のための指示を収納する1以上の容器を包含していてもよい。本明細書に記載のキットのいずれも、アッセイ方法を実施するのに必要とされる構成要素をさらに含んでいてもよい。キットの各構成要素は、適用可能であれば、液体形態(例として、溶液中)で、または固体形態(例として、乾燥粉末)で提供されてもよい。あるケースにおいて、構成要素のいくつかは、例えば、好適な溶媒または他の種(例えば、水)(これらはキットとともに提供されてもまたはされなくてもよい)の添加によって、再構成可能または別様に(例として、活性形態へ)処理可能であってもよい。 The kits described herein may include one or more containers housing the components for carrying out the methods described herein and optionally instructions for use. Any of the kits described herein may further include components needed to carry out the assay method. Each component of the kit may be provided in liquid form (eg, in solution) or solid form (eg, dry powder), where applicable. In some cases, some of the components are reconstituted or otherwise reconstituted, for example, by the addition of a suitable solvent or other species (e.g., water), which may or may not be provided with the kit. (eg, into an active form).

いくつかの態様において、キットは任意に、提供される構成要素の使用のための指示および/または促進(promotion)を包含していてもよい。本明細書に使用されるとき、「指示」は、指示および/または促進の構成要素を定義し得るものであって、典型的には、本開示のパッケージング上にまたはこれに関連して書面の指示を伴い得る。指示はまた、ユーザーが明確に、指示がキットに関連するものであることを認識できるように(例えば、視聴覚に訴えるもの(例として、ビデオテープ、DVD、等々)、インターネット、および/またはウェブベースの連絡、等々)、形はどうあれ、いずれの口授または電子的指示も包含し得る。書面の指示は、医薬もしくは生物学的産物の製造、使用、または販売を規制する政府機関によって規定される形態であってもよく、これは動物投与のための製造、使用、または販売の機関による承認も反映し得る。本明細書に使用されるとき、「促進された」は、本開示に関連する、教育方法、病院のおよび他の臨床の指示、科学研究、薬物の発見または開発、学術研究、医薬産業活動(医薬販売を包含する)、ならびにいずれの広告活動または他の宣伝活動(いずれの形態の書面の、口述の、および電子的な連絡を包含する)を包含する、営業行為のすべての方法を包含する。加えて、キットは、本明細書に記載のとおりの特定の用途に応じて、他の構成要素も包含していてもよい。 In some embodiments, the kit may optionally include instructions and/or promotion for the use of the provided components. As used herein, "instructions" may define instructions and/or promotional components, typically written on or in connection with the packaging of the present disclosure. May be accompanied by instructions. The instructions should also be clearly printed so that the user clearly knows that the instructions pertain to the kit (e.g., audiovisual (e.g., videotape, DVD, etc.), Internet, and/or web-based). communication, etc.), any form of oral or electronic instruction may be included. The written instructions may be in the form prescribed by a governmental agency that regulates the manufacture, use, or sale of pharmaceutical or biological products; It can also reflect approval. As used herein, "facilitated" means educational methods, hospital and other clinical instruction, scientific research, drug discovery or development, academic research, pharmaceutical industry activities ( (including pharmaceutical sales) and any advertising or other promotional activities (including all forms of written, oral, and electronic communications) . In addition, the kit may also include other components depending on the particular use as described herein.

キットは、1以上の容器中に、本明細書に記載のいずれの構成要素の1以上を含有していてもよい。構成要素は、滅菌的に調製され、シリンジ中にパッケージされ、および冷凍保存されて出荷されてもよい。代替的に、これは、バイアルまたは保管のための他の容器に収納されてもよい。第2容器は、滅菌的に調製された他の構成要素も有していてもよい。代替的に、キットは、予め混合されて、バイアル、管、または他の容器中で出荷される活性剤を包含していてもよい。 A kit may contain one or more of any of the components described herein in one or more containers. The components may be sterilely prepared, packaged in syringes, and shipped frozen. Alternatively, it may be placed in a vial or other container for storage. The second container may also contain other sterilely prepared components. Alternatively, the kit may include the active agents premixed and shipped in a vial, tube, or other container.

キットは、パウチ、1以上の管、容器、箱、または袋内に緩くパックされた付属物とともに、ブリスターパウチ(blister pouch)、収縮包装パウチ、真空シール可能なパウチ、シール可能な熱成形トレイ、または同様のパウチもしくはトレイの形態などの様々な形態を有してもよい。キットは、付属物が加えられた後に滅菌されてもよく、これによって容器中の個々の付属物が別様に開封され得る。キットは、放射線滅菌、加熱滅菌、または当該技術分野において知られている他の滅菌方法などの、いずれの適切な滅菌技法も使用して滅菌され得る。キットはまた、特定の用途に応じて、他の構成要素、例えば、容器、細胞培地、塩、緩衝剤、試薬、シリンジ、針、殺菌剤を適用または除去するための生地(ガーゼなど)、使い捨て手袋、投与に先立ち剤を支持するためのもの等々も包含していてもよい。本開示のいくつかの側面は、本明細書に記載のプライム編集系の様々な構成要素(例として、これらに限定されないが、napDNAbp、逆転写酵素、ポリメラーゼ、融合タンパク質(例として、napDNAbpと逆転写酵素(またはより広くは、ポリメラーゼ)とを含む)、伸長されたガイドRNA、および融合タンパク質と伸長されたガイドRNAとを含む複合体、ならびに第2鎖へニックを入れる構成要素(例として、第2鎖へニックを入れるgRNA)および5'内生DNAフラップ除去エンドヌクレアーゼなどの付属要素(編集済産物形成へのプライム編集プロセスを推進するのに役立つ)を包含する)をコードするヌクレオチド配列を含む核酸構築物を含むキットを提供する。いくつかの態様において、ヌクレオチド配列(単数または複数)は、プライム編集系構成要素の発現を推進する異種プロモーター(または単一のプロモーターより多く)を含む。 The kit includes a blister pouch, a shrink-wrapped pouch, a vacuum-sealable pouch, a sealable thermoformable tray, along with accessories loosely packed in a pouch, one or more tubes, containers, boxes, or bags. or similar pouch or tray configurations. The kit may be sterilized after the accessories are added, so that individual accessories in the container can be opened differently. The kit may be sterilized using any suitable sterilization technique, such as radiation sterilization, heat sterilization, or other sterilization methods known in the art. The kit may also include other components, depending on the specific application, such as containers, cell culture media, salts, buffers, reagents, syringes, needles, fabrics (such as gauze) for applying or removing the sterilant, and disposable Gloves, materials to support the agent prior to administration, etc. may also be included. Some aspects of the present disclosure describe various components of the prime editing system described herein, including, but not limited to, napDNAbp, reverse transcriptase, polymerase, fusion proteins (for example, napDNAbp and reverse a transcriptase (or more broadly, a polymerase)), an extended guide RNA, and a complex comprising a fusion protein and the extended guide RNA, as well as components that nick the second strand (e.g. nucleotide sequence encoding a gRNA that nicks the second strand) and accessory elements such as a 5' endogenous DNA flap removal endonuclease (which helps drive the prime editing process to the formation of the edited product). A kit comprising a nucleic acid construct comprising the method is provided. In some embodiments, the nucleotide sequence(s) comprises a heterologous promoter (or more than a single promoter) that drives expression of the prime editing system components.

本開示の他の側面は、本明細書に記載のプライム編集因子系の様々な構成要素(例として、標的DNA配列を修飾することが可能なプライム編集因子系の構成要素をコードするヌクレオチド配列を含む)をコードする1以上の核酸構築物を含むキットを提供する。いくつかの態様において、ヌクレオチド配列は、プライム編集因子系構成要素の発現を推進する異種プロモーターを含む。 Other aspects of the present disclosure provide for nucleotide sequences encoding various components of the prime editing factor system described herein (e.g., components of the prime editing factor system capable of modifying a target DNA sequence). A kit is provided that includes one or more nucleic acid constructs encoding a nucleotide sequence comprising: In some embodiments, the nucleotide sequence includes a heterologous promoter that drives expression of the prime editor system components.

本開示のいくつかの側面は、(a)逆転写酵素と融合したnapDNAbp(例として、Cas9ドメイン)をコードするヌクレオチド配列、および(b)(a)の配列の発現を推進する異種プロモーターを含む核酸構築物を含むキットを提供する。 Some aspects of the present disclosure include (a) a nucleotide sequence encoding napDNAbp (e.g., a Cas9 domain) fused to a reverse transcriptase, and (b) a heterologous promoter driving expression of the sequence of (a). Kits containing the nucleic acid constructs are provided.

細胞
本明細書に記載の組成物のいずれも含有していてもよい細胞は、原核細胞および真核細胞を包含する。本明細書に記載の方法は、Cas9タンパク質またはプライム編集因子を真核細胞(例として、ヒト細胞などの哺乳動物の細胞)中へ送達するのに使用される。いくつかの態様において、細胞は、in vitroにある(例として、培養された細胞)。いくつかの態様において、細胞は、in vivoにある(例として、ヒト対象などの対象中にある)。いくつかの態様において、細胞は、ex vivoにある(例として、対象から単離され、同じ対象へ戻すかまたは異なる対象へ投与されてもよい)。
Cells Cells that may contain any of the compositions described herein include prokaryotic and eukaryotic cells. The methods described herein are used to deliver Cas9 proteins or prime editors into eukaryotic cells (e.g., mammalian cells, such as human cells). In some embodiments, the cells are in vitro (e.g., cultured cells). In some embodiments, the cells are in vivo (e.g., in a subject, such as a human subject). In some embodiments, the cells are ex vivo (e.g., isolated from a subject and may be administered back to the same subject or to a different subject).

本開示の哺乳動物の細胞は、ヒト細胞、霊長目の動物細胞(例として、ベロ細胞)、ラット細胞(例として、GH3細胞、OC23細胞)、またはマウス細胞(例として、MC3T3細胞)を包含する。様々なヒト細胞株には、限定せずに、ヒト胚性腎臓(HEK)細胞、HeLa細胞、国立がん研究所の60のがん細胞株(NCI60)からのがん細胞、DU145(前立腺がん)細胞、Lncap(前立腺がん)細胞、MCF-7(乳がん)細胞、MDA-MB-438(乳がん)細胞、PC3(前立腺がん)細胞、T47D(乳がん)細胞、THP-1(急性骨髄性白血病)細胞、U87(膠芽腫)細胞、SHSY5Yヒト神経芽細胞腫細胞(骨髄腫からクローン化)、およびSaos-2(骨がん)細胞が包含される。いくつかの態様において、rAAVベクターは、ヒト胚性腎臓(HEK)細胞(例として、HEK293またはHEK 293T細胞)中へ送達される。いくつかの態様において、rAAVベクターは、例えば、多能性幹細胞(例として、ヒト人工(induced)多能性幹細胞(hiPSC)を包含するヒト多能性幹細胞)などの、幹細胞(例として、ヒト幹細胞)中へ送達される。幹細胞は培養中、無期限に分裂して、特化された細胞を生じさせる能力をもつ細胞を指す。多能性幹細胞は、分化して生物のすべての組織になることが可能であるが、完全な生物の発生を単独では支えることが可能でないある種の幹細胞を指す。ヒト人工多能性幹細胞は、胚性幹細胞を定義する特性を維持するのに重要な遺伝子および因子の発現が強いられることによって胚性幹細胞様状態へ再プログラムされる体細胞(例として、成熟した(mature)細胞または成熟(adult)細胞)を指す(例として、Takahashi and Yamanaka,Cell 126(4):663-76,2006を参照(参照により本明細書に組み込まれる))。ヒト人工多能性幹細胞は、幹細胞マーカーを発現しており、全3種の胚葉(外胚葉、内胚葉、中胚葉)の細胞特徴を生成するのが可能である。 Mammalian cells of the present disclosure include human cells, primate cells (e.g., Vero cells), rat cells (e.g., GH3 cells, OC23 cells), or mouse cells (e.g., MC3T3 cells). do. Various human cell lines include, but are not limited to, human embryonic kidney (HEK) cells, HeLa cells, cancer cells from the National Cancer Institute 60 Cancer Cell Lines (NCI60), DU145 (prostate ) cells, Lncap (prostate cancer) cells, MCF-7 (breast cancer) cells, MDA-MB-438 (breast cancer) cells, PC3 (prostate cancer) cells, T47D (breast cancer) cells, THP-1 (acute bone marrow) U87 (glioblastoma) cells, SHSY5Y human neuroblastoma cells (cloned from myeloma), and Saos-2 (bone cancer) cells. In some embodiments, the rAAV vector is delivered into human embryonic kidney (HEK) cells (eg, HEK293 or HEK 293T cells). In some embodiments, rAAV vectors are derived from stem cells (e.g., human pluripotent stem cells, including, e.g., human induced pluripotent stem cells (hiPSCs)). stem cells). Stem cells refer to cells that have the ability to divide indefinitely in culture and give rise to specialized cells. Pluripotent stem cells refer to a type of stem cell that is capable of differentiating into all tissues of an organism, but is not capable of supporting the development of a complete organism on its own. Human induced pluripotent stem cells are somatic cells (e.g., mature (mature or adult cells) (see, e.g., Takahashi and Yamanaka, Cell 126(4):663-76, 2006, incorporated herein by reference). Human induced pluripotent stem cells express stem cell markers and are capable of generating cellular characteristics of all three germ layers (ectoderm, endoderm, and mesoderm).

本開示に従って使用されてもよい追加の細胞株の非限定例は、293-T、293-T、3T3、4T1、721、9L、A-549、A172、A20、A253、A2780、A2780ADR、A2780cis、A431、ALC、B16、B35、BCP-1、BEAS-2B、bEnd.3、BHK-21、BR 293、BxPC3、C2C12、C3H-10T1/2、C6、C6/36、Cal-27、CGR8、CHO、CML T1、CMT、COR-L23、COR-L23/5010、COR-L23/CPR、COR-L23/R23、COS-7、COV-434、CT26、D17、DH82、DU145、DuCaP、E14Tg2a、EL4、EM2、EM3、EMT6/AR1、EMT6/AR10.0、FM3、H1299、H69、HB54、HB55、HCA2、Hepa1c1c7、High Five細胞、HL-60、HMEC、HT-29、HUVEC、J558L細胞、Jurkat、JY細胞、K562細胞、KCL22、KG1、Ku812、KYO1、LNCap、Ma-Mel 1、2、3....48、MC-38、MCF-10A、MCF-7、MDA-MB-231、MDA-MB-435、MDA-MB-468、MDCK II、MG63、MONO-MAC 6、MOR/0.2R、MRC5、MTD-1A、MyEnd、NALM-1、NCI-H69/CPR、NCI-H69/LX10、NCI-H69/LX20、NCI-H69/LX4、NIH-3T3、NW-145、OPCN/OPCT Peer、PNT-1A/PNT 2、PTK2、Raji、RBL細胞、RenCa、RIN-5F、RMA/RMAS、S2、Saos-2細胞、Sf21、Sf9、SiHa、SKBR3、SKOV-3、T-47D、T2、T84、THP1、U373、U87、U937、VCaP、WM39、WT-49、X63、YAC-1、およびYAR細胞を包含する。 Non-limiting examples of additional cell lines that may be used in accordance with the present disclosure include 293-T, 293-T, 3T3, 4T1, 721, 9L, A-549, A172, A20, A253, A2780, A2780ADR, A2780cis, A431, ALC, B16, B35, BCP-1, BEAS-2B, bEnd.3, BHK-21, BR 293, BxPC3, C2C12, C3H-10T1/2, C6, C6/36, Cal-27, CGR8, CHO, CML. T1, CMT, COR-L23, COR-L23/5010, COR-L23/CPR, COR-L23/R23, COS-7, COV-434, CT26, D17, DH82, DU145, DuCaP, E14Tg2a, EL4, EM2, EM3, EMT6/AR1, EMT6/AR10.0, FM3, H1299, H69, HB54, HB55, HCA2, Hepa1c1c7, High Five cells, HL-60, HMEC, HT-29, HUVEC, J558L cells, Jurkat, JY cells, K562 cells, KCL22, KG1, Ku812, KYO1, LNCap, Ma-Mel 1, 2, 3....48, MC-38, MCF-10A, MCF-7, MDA-MB-231, MDA-MB-435, MDA-MB-468, MDCK II, MG63, MONO-MAC 6, MOR/0.2R, MRC5, MTD-1A, MyEnd, NALM-1, NCI-H69/CPR, NCI-H69/LX10, NCI-H69/LX20, NCI-H69/LX4, NIH-3T3, NW-145, OPCN/OPCT Peer, PNT-1A/PNT 2, PTK2, Raji, RBL cells, RenCa, RIN-5F, RMA/RMAS, S2, Saos-2 cells, Sf21, Sf9, SiHa, SKBR3, SKOV-3, T-47D, T2, T84, THP1, U373, U87, U937, VCaP, WM39, WT-49, X63, YAC-1, and YAR cells.

本開示のいくつかの側面は、本明細書に開示される構築物のいずれも含む細胞を提供する。いくつかの態様において、宿主細胞は、本明細書に記載の1以上のベクターで一過的または非一過的にトランスフェクトされている。いくつかの態様において、細胞は、対象中に天然に存在するとき、トランスフェクトされる。いくつかの態様において、トランスフェクトされる細胞は、対象から採られる。いくつかの態様において、細胞は、細胞株などの、対象から採られた細胞に由来する。組織培養のための多種多様の細胞株が当該技術分野において知られている。細胞株の例は、これらに限定されないが、C8161、CCRF-CEM、MOLT、mIMCD-3、NHDF、HeLa-S3、Huh1、Huh4、Huh7、HUVEC、HASMC、HEKn、HEKa、MiaPaCell、Panc1、PC-3、TF1、CTLL-2、C1R、Rat6、CV1、RPTE、A10、T24、J82、A375、ARH-77、Calu1、SW480、SW620、SKOV3、SK-UT、CaCo2、P388D1、SEM-K2、WEHI-231、HB56、TIB55、Jurkat、J45.01、LRMB、Bcl-1、BC-3、IC21、DLD2、Raw264.7、NRK、NRK-52E、MRC5、MEF、Hep G2、HeLa B、HeLa T4、COS、COS-1、COS-6、COS-M6A、BS-C-1サル腎臓上皮、BALB/3T3マウス胚線維芽細胞、3T3 Swiss、3T3-L1、132-d5ヒト胎児線維芽細胞;10.1マウス線維芽細胞、293-T、3T3、721、9L、A2780、A2780ADR、A2780cis、A 172、A20、A253、A431、A-549、ALC、B16、B35、BCP-1細胞、BEAS-2B、bEnd.3、BHK-21、BR 293.BxPC3.C3H-10T1/2、C6/36、Cal-27、CHO、CHO-7、CHO-IR、CHO-K1、CHO-K2、CHO-T、CHO Dhfr -/-、COR-L23、COR-L23/CPR、COR-L23/5010、COR-L23/R23、COS-7、COV-434、CML T1、CMT、CT26、D17、DH82、DU145、DuCaP、EL4、EM2、EM3、EMT6/AR1、EMT6/AR10.0、FM3、H1299、H69、HB54、HB55、HCA2、HEK-293、HeLa、Hepa1c1c7、HL-60、HMEC、HT-29、Jurkat、JY細胞、K562細胞、Ku812、KCL22、KG1、KYO1、LNCap、Ma-Mel 1-48、MC-38、MCF-7、MCF-10A、MDA-MB-231、MDA-MB-468、MDA-MB-435、MDCK II、MDCK 11、MOR/0.2R、MONO-MAC 6、MTD-1A、MyEnd、NCI-H69/CPR、NCI-H69/LX10、NCI-H69/LX20、NCI-H69/LX4、NIH-3T3、NALM-1、NW-145、OPCN/OPCT細胞株、Peer、PNT-1A/PNT 2、RenCa、RIN-5F、RMA/RMAS、Saos-2細胞、Sf-9、SkBr3、T2、T-47D、T84、THP1細胞株、U373、U87、U937、VCaP、Vero細胞、WM39、WT-49、X63、YAC-1、YAR、およびそれらのトランスジェニック種を包含する。 Some aspects of this disclosure provide cells that include any of the constructs disclosed herein. In some embodiments, the host cell is transiently or non-transiently transfected with one or more vectors described herein. In some embodiments, the cell is transfected when naturally present in the subject. In some embodiments, the cells to be transfected are taken from a subject. In some embodiments, the cells are derived from cells taken from the subject, such as cell lines. A wide variety of cell lines for tissue culture are known in the art. Examples of cell lines include, but are not limited to, C8161, CCRF-CEM, MOLT, mIMCD-3, NHDF, HeLa-S3, Huh1, Huh4, Huh7, HUVEC, HASMC, HEKn, HEKa, MiaPaCell, Panc1, PC- 3, TF1, CTLL-2, C1R, Rat6, CV1, RPTE, A10, T24, J82, A375, ARH-77, Calu1, SW480, SW620, SKOV3, SK-UT, CaCo2, P388D1, SEM-K2, WEHI- 231, HB56, TIB55, Jurkat, J45.01, LRMB, Bcl-1, BC-3, IC21, DLD2, Raw264.7, NRK, NRK-52E, MRC5, MEF, Hep G2, HeLa B, HeLa T4, COS , COS-1, COS-6, COS-M6A, BS-C-1 monkey kidney epithelium, BALB/3T3 mouse embryonic fibroblasts, 3T3 Swiss, 3T3-L1, 132-d5 human fetal fibroblasts; 10.1 mouse fibers Blast, 293-T, 3T3, 721, 9L, A2780, A2780ADR, A2780cis, A 172, A20, A253, A431, A-549, ALC, B16, B35, BCP-1 cell, BEAS-2B, bEnd.3 , BHK-21, BR 293.BxPC3.C3H-10T1/2, C6/36, Cal-27, CHO, CHO-7, CHO-IR, CHO-K1, CHO-K2, CHO-T, CHO Dhfr -/ -, COR-L23, COR-L23/CPR, COR-L23/5010, COR-L23/R23, COS-7, COV-434, CML T1, CMT, CT26, D17, DH82, DU145, DuCaP, EL4, EM2 , EM3, EMT6/AR1, EMT6/AR10.0, FM3, H1299, H69, HB54, HB55, HCA2, HEK-293, HeLa, Hepa1c1c7, HL-60, HMEC, HT-29, Jurkat, JY cells, K562 cells , Ku812, KCL22, KG1, KYO1, LNCap, Ma-Mel 1-48, MC-38, MCF-7, MCF-10A, MDA-MB-231, MDA-MB-468, MDA-MB-435, MDCK II , MDCK 11, MOR/0.2R, MONO-MAC 6, MTD-1A, MyEnd, NCI-H69/CPR, NCI-H69/LX10, NCI-H69/LX20, NCI-H69/LX4, NIH-3T3, NALM- 1, NW-145, OPCN/OPCT cell line, Peer, PNT-1A/PNT 2, RenCa, RIN-5F, RMA/RMAS, Saos-2 cells, Sf-9, SkBr3, T2, T-47D, T84, Includes THP1 cell lines, U373, U87, U937, VCaP, Vero cells, WM39, WT-49, X63, YAC-1, YAR, and transgenic strains thereof.

細胞株は、当業者に知られている様々な供給源から利用可能である(例として、American Type Culture Collection(ATCC)(Manassus,Va.)を参照)。いくつかの態様において、本明細書に記載の1以上のベクターでトランスフェクトされた細胞は、1以上のベクター由来配列を含む新しい細胞株を確立するのに使用される。いくつかの態様において、本明細書に記載のとおりのCRISPR系の構成要素で(1以上のベクターの一過的なトランスフェクション、またはRNAでのトランスフェクションなどによって)一過的にトランスフェクトされて、CRISPR複合体の活性を通して修飾された細胞は、修飾は含有するが他の外来配列のいずれも欠く細胞を含む新しい細胞株を確立するのに使用される。いくつかの態様において、本明細書に記載の1以上のベクターで一過的もしくは非一過的にトランスフェクトされた細胞、またはかかる細胞に由来する細胞株は、1以上の試験化合物を査定するのに使用される。 Cell lines are available from a variety of sources known to those skilled in the art (see, for example, the American Type Culture Collection (ATCC), Manassus, Va.). In some embodiments, cells transfected with one or more vectors described herein are used to establish new cell lines containing one or more vector-derived sequences. In some embodiments, the patient is transiently transfected (such as by transient transfection of one or more vectors, or by transfection with RNA) with components of a CRISPR system as described herein. , cells modified through the activity of the CRISPR complex are used to establish new cell lines containing cells containing the modification but lacking any of the other foreign sequences. In some embodiments, cells transiently or non-transiently transfected with one or more vectors described herein, or cell lines derived from such cells, are assayed for one or more test compounds. used for.

ベクター
本開示のいくつかの側面は、本明細書に記載のプライム編集因子またはその構成要素(例として、分裂Cas9タンパク質もしくは分裂核酸塩基プライム編集因子)の細胞中への送達のための、組換えウイルスベクター(例として、アデノ随伴ウイルスベクター、アデノウイルスベクター、または単純ヘルペスウイルスベクター)の使用に関する。分裂-PEアプローチのケースにおいて、全長Cas9タンパク質またはプライム編集因子が様々なウイルスベクター(例として、rAAV(~4.9kb))のパッケージング限界を超えることから、PE融合タンパク質のN末端部分およびPE融合のC末端部分は、別々の組換えウイルスベクター(例として、アデノ随伴ウイルスベクター、アデノウイルスベクター、または単純ヘルペスウイルスベクター)によって同じ細胞中へ送達される。
Vectors Some aspects of the present disclosure provide recombinant vectors for the delivery of a prime editing agent described herein or a component thereof (eg, a splitting Cas9 protein or a splitting nucleobase prime editing factor) into a cell. Concerning the use of viral vectors (eg, adeno-associated virus vectors, adenovirus vectors, or herpes simplex virus vectors). In the case of the split-PE approach, the N-terminal portion of the PE fusion protein and the PE fusion, as full-length Cas9 proteins or prime editing factors exceed the packaging limits of various viral vectors (e.g., rAAV (~4.9 kb)). The C-terminal portion of is delivered into the same cell by a separate recombinant viral vector (eg, an adeno-associated viral vector, an adenoviral vector, or a herpes simplex virus vector).

よって、一態様において、本開示は、分裂プライム編集因子融合タンパク質またはそれらの分裂構成要素を送達するのか可能なベクターを企図する。いくつかの態様において、分裂Cas9タンパク質または分裂プライム編集因子を細胞(例として、哺乳動物の細胞、ヒト細胞)中へ送達するための組成物が提供される。いくつかの態様において、本開示の組成物は以下を含む:(i)そのC末端にてインテイン-Nと融合したCas9タンパク質またはプライム編集因子のN末端部分をコードする第1ヌクレオチド配列を含む第1組換えアデノ随伴ウイルス(rAAV)粒子;および(ii)Cas9のタンパク質またはプライム編集因子のC末端部分のN末端と融合したインテイン-Cをコードする第2ヌクレオチド配列を含む第2組換えアデノ随伴ウイルス(rAAV)粒子。本開示のrAAV粒子は、ウイルスのカプシドタンパク質で包まれた(encapsidated)rAAVベクター(すなわち、rAAVの組換えゲノム)を含む。 Thus, in one aspect, the present disclosure contemplates vectors capable of delivering mitotic prime editing factor fusion proteins or their mitotic components. In some embodiments, compositions for delivering a mitotic Cas9 protein or mitotic prime editing factor into a cell (eg, a mammalian cell, a human cell) are provided. In some embodiments, the compositions of the present disclosure include: (i) a first nucleotide sequence encoding the N-terminal portion of a Cas9 protein or prime editing factor fused at its C-terminus to intein-N; 1 a recombinant adeno-associated virus (rAAV) particle; and (ii) a second recombinant adeno-associated virus particle comprising a second nucleotide sequence encoding intein-C fused to the N-terminus of the protein of Cas9 or the C-terminal portion of the prime editing factor. Virus (rAAV) particles. The rAAV particles of the present disclosure include an rAAV vector (ie, a recombinant genome of rAAV) encapsidated with a viral capsid protein.

いくつかの態様において、rAAVベクターは以下を含む:(1)本明細書に記載のとおりのいずれの形態の分裂Cas9タンパク質もしくは分裂プライム編集因子のN末端部分またはC末端部分をコードする第1あるいは第2ヌクレオチド配列を含む異種核酸領域、(2)異種核酸領域の発現を容易にさせる配列(例として、プロモーター)を含む1以上のヌクレオチド配列、および(3)異種核酸領域(任意に、発現を容易にさせる配列を含む1以上の核酸領域をもつ)の細胞ゲノム中への組み入れを容易にさせる配列を含む1以上の核酸領域。いくつかの態様において、組み入れを容易にさせるウイルスの配列は、逆方向末端反復(ITR)配列を含む。いくつかの態様において、分裂Cas9タンパク質もしくは分裂プライム編集因子のN末端部分またはC末端部分をコードする第1あるいは第2ヌクレオチド配列は、ITR配列によって両側から挟まれている。いくつかの態様において、核酸ベクターはさらに、本明細書に記載のとおりのAAV Repタンパク質をコードする領域を含むが、前記領域は、ITRによって挟まれる領域内またはその領域外のいずれかに含有される。ITR配列は、いずれかのAAV血清型(例として、1、2、3、4、5、6、7、8、9もしくは10)に由来し得るか、または1より多くの血清型に由来し得る。いくつかの態様において、ITR配列は、AAV2またはAAV6に由来する。 In some embodiments, the rAAV vector comprises: (1) a first or a second nucleotide sequence; (2) one or more nucleotide sequences comprising a sequence (e.g., a promoter) that facilitates expression of the heterologous nucleic acid region; and (3) a heterologous nucleic acid region (optionally, one or more nucleic acid regions comprising a sequence that facilitates integration into the genome of a cell. In some embodiments, the viral sequences that facilitate integration include inverted terminal repeat (ITR) sequences. In some embodiments, the first or second nucleotide sequence encoding the N-terminal or C-terminal portion of the splitting Cas9 protein or splitting prime editor is flanked on both sides by ITR sequences. In some embodiments, the nucleic acid vector further comprises a region encoding an AAV Rep protein as described herein, but the region is contained either within or outside the region flanked by the ITRs. Ru. The ITR sequences may be derived from any AAV serotype (e.g., 1, 2, 3, 4, 5, 6, 7, 8, 9, or 10) or from more than one serotype. obtain. In some embodiments, the ITR sequence is derived from AAV2 or AAV6.

よって、いくつかの態様において、本明細書に開示のrAAV粒子は、少なくとも1のrAAV2粒子、rAAV6粒子、rAAV8粒子、rPHP.B粒子、rPHP.eB粒子、もしくはrAAV9粒子、またはそのバリアントを含む。具体的な態様において、開示されたrAAV粒子は、rPHP.B粒子、rPHP.eB粒子、rAAV9粒子である。 Thus, in some embodiments, the rAAV particles disclosed herein include at least one rAAV2 particle, rAAV6 particle, rAAV8 particle, rPHP.B particle, rPHP.eB particle, or rAAV9 particle, or a variant thereof. In specific embodiments, the disclosed rAAV particles are rPHP.B particles, rPHP.eB particles, rAAV9 particles.

ITR配列およびITR配列含有プラスミドは当該技術分野において知られており、市販されている(例として、Vector Biolabs,Philadelphia,PA;Cellbiolabs,San Diego,CA;Agilent Technologies,Santa Clara,Ca;およびAddgene,Cambridge,MAから利用可能な製品ならびにサービス;ならびに、骨格筋への遺伝子送達は治療用タンパク質の持続発現および全身送達をもたらす。Kessler PD,Podsakoff GM,Chen X,McQuiston SA,Colosi PC,Matelis LA,Kurtzman GJ,Byrne BJ.Proc Natl Acad Sci USA.1996 Nov 26;93(24):14082-7;およびCurtis A.Machida.Methods in Molecular MedicineTM.Viral Vectors for Gene Therapy Methods and Protocols.10.1385/1-59259-304-6:201cHumana Press Inc.2003.Chapter 10.Targeted Integration by Adeno-Associated Virus.Matthew D.Weitzman,Samuel M.Young Jr.,Toni Cathomen and Richard Jude Samulski;米国特許第5,139,941号および第5,962,313号を参照(これらすべては参照により本明細書に組み込まれる))。 ITR sequences and ITR sequence-containing plasmids are known in the art and are commercially available (e.g., Vector Biolabs, Philadelphia, PA; Cellbiolabs, San Diego, CA; Agilent Technologies, Santa Clara, CA; and Addgene, Products and services available from Cambridge, MA; and gene delivery to skeletal muscle results in sustained expression and systemic delivery of therapeutic proteins. Kessler PD, Podsakoff GM, Chen X, McQuiston SA, Colosi PC, Matelis LA, Kurtzman GJ, Byrne BJ. Proc Natl Acad Sci USA.1996 Nov 26;93(24):14082-7; and Curtis A. Machida. Methods in Molecular Medicine TM .Viral Vectors for Gene Therapy Methods and Protocols.10.1385/1- 59259-304-6:201cHumana Press Inc.2003.Chapter 10.Targeted Integration by Adeno-Associated Virus.Matthew D. Weitzman, Samuel M. Young Jr., Toni Cathomen and Richard Jude Samulski; U.S. Patent Nos. 5,139,941 and 5,962,313 (all of which are incorporated herein by reference).

いくつかの態様において、本開示のrAAVベクターは、異種核酸領域の発現を制御する1以上の調節要素(例として、プロモーター、転写ターミネータ、および/または他の調節要素)を含む。いくつかの態様において、第1および/または第2ヌクレオチド配列は、1以上の(例として、1、2、3、4、5、またはそれ以上の)転写ターミネータへ作動可能に(operably)連結されている。本開示に従って使用されてもよい転写ターミネータの非限定例は、ウシ成長ホルモン遺伝子(bGH)、ヒト成長ホルモン遺伝子(hGH)、SV40、CW3、φ、またはそれらの組み合わせの転写ターミネータを包含する。数種の転写ターミネータの効率が試験され、分裂Cas9タンパク質または分裂プライム編集因子の発現レベルにおけるそれら夫々の効果を決定した。いくつかの態様において、本開示に使用される転写ターミネータは、bGH転写ターミネータである。いくつかの態様において、rAAVベクターはさらに、ウッドチャック肝炎ウイルス転写後調節要素(WPRE)を含む。ある態様において、WPREは、「W3」などのトランケートされたWPRE配列である。いくつかの態様において、WPREは、転写ターミネータの5'に挿入されている。かかる配列は、転写されたとき、発現、とりわけウイルスベクターからの発現を増強する3次構造を創出する。 In some embodiments, the rAAV vectors of the present disclosure include one or more regulatory elements (eg, promoters, transcription terminators, and/or other regulatory elements) that control expression of the heterologous nucleic acid region. In some embodiments, the first and/or second nucleotide sequences are operably linked to one or more (eg, 1, 2, 3, 4, 5, or more) transcription terminators. ing. Non-limiting examples of transcription terminators that may be used in accordance with this disclosure include transcription terminators for the bovine growth hormone gene (bGH), human growth hormone gene (hGH), SV40, CW3, φ, or combinations thereof. The efficiency of several transcription terminators was tested to determine their respective effects on the expression levels of mitotic Cas9 proteins or mitotic prime editors. In some embodiments, the transcription terminator used in this disclosure is a bGH transcription terminator. In some embodiments, the rAAV vector further comprises a woodchuck hepatitis virus post-transcriptional regulatory element (WPRE). In certain embodiments, the WPRE is a truncated WPRE sequence, such as "W3." In some embodiments, the WPRE is inserted 5' of the transcription terminator. Such sequences, when transcribed, create a tertiary structure that enhances expression, particularly from viral vectors.

いくつかの態様において、本明細書に使用されるベクターは、PE融合タンパク質、またはそれら構成要素(例として、napDNAbp、リンカー、もしくはポリメラーゼ)のいずれもコードしていてもよい。加えて、本明細書に使用されるベクターは、PEgRNA、および/または第2鎖へニックを入れるための付属(accessory)gRNAをコードしていてもよい。ベクターは、細胞中の1以上のコード配列の発現を推進するのが可能であってもよい。いくつかの態様において、細胞は、例として細菌性細胞などの、原核細胞であってもよい。いくつかの態様において、細胞は、例として、酵母、植物、昆虫、または哺乳動物の細胞などの、真核細胞であってもよい。いくつかの態様において、真核細胞は、哺乳動物の細胞であってもよい。いくつかの態様において、真核細胞は、齧歯類の動物の細胞であってもよい。いくつかの態様において、真核細胞は、ヒトの細胞であってもよい。種々の型の細胞中の発現を推進する好適なプロモーターは当該技術分野において知られている。いくつかの態様において、プロモーターは、野生型であってもよい。他の態様において、プロモーターは、より効率的またはより効果的な発現のために修飾されていてもよい。もう1つの他の態様において、プロモーターは、トランケートされていてもよいが、依然としてその機能を保持する。例えば、プロモーターは、正常なサイズ、またはベクターのウイルス中への正しいパッケージングに好適な低減されたサイズを有していてもよい。 In some embodiments, the vectors used herein may encode a PE fusion protein, or any of its components (eg, napDNAbp, linker, or polymerase). In addition, the vectors used herein may encode PEgRNA and/or accessory gRNA for nicking the second strand. The vector may be capable of driving the expression of one or more coding sequences in a cell. In some embodiments, the cell may be a prokaryotic cell, such as a bacterial cell. In some embodiments, the cell may be a eukaryotic cell, such as, for example, a yeast, plant, insect, or mammalian cell. In some embodiments, the eukaryotic cell may be a mammalian cell. In some embodiments, the eukaryotic cell may be a rodent cell. In some embodiments, the eukaryotic cell may be a human cell. Suitable promoters that drive expression in various types of cells are known in the art. In some embodiments, the promoter may be wild type. In other embodiments, promoters may be modified for more efficient or effective expression. In another other embodiment, the promoter may be truncated but still retain its function. For example, the promoter may have a normal size or a reduced size suitable for correct packaging of the vector into the virus.

いくつかの態様において、プライム編集因子ベクターに使用されてもよいプロモーターは、構成的、誘導的、または組織特異的であってもよい。いくつかの態様において、プロモーターは、構成的プロモーターであってもよい。非限定的な例示の構成的プロモーターは、サイトメガロウイルス前初期プロモーター(CMV)、サルウイルス(SV40)プロモーター、アデノウイルス主要後期(MLP)プロモーター、ラウス肉腫ウイルス(RSV)プロモーター、マウス乳腺腫瘍ウイルス(MMTV)プロモーター、ホスホグリセリン酸キナーゼ(PGK)プロモーター、伸長(elongation)因子-アルファ(EFla)プロモーター、ユビキチンプロモーター、アクチンプロモーター、チューブリンプロモーター、免疫グロブリンプロモーター、それらの機能的フラグメント、または上記のいずれの組み合わせを包含する。いくつかの態様において、プロモーターは、CMVプロモーターであってもよい。いくつかの態様において、プロモーターは、トランケートされたCMVプロモーターであってもよい。他の態様において、プロモーターは、EFlaプロモーターであってもよい。いくつかの態様において、プロモーターは、誘導性プロモーターであってもよい。非限定的な例示の誘導性プロモーターは、熱ショック、光、化学物質、ペプチド、金属、ステロイド、抗生物質、またはアルコールによって誘導可能なものを包含する。いくつかの態様において、誘導性プロモーターは、基底(非誘導)発現レベルが低いもの、例として、Tet-On(登録商標)プロモーター(Clontech)などであってもよい。いくつかの態様において、プロモーターは、組織特異的プロモーターであってもよい。いくつかの態様において、組織特異的プロモーターは、専らまたは主として、肝臓組織に発現される。非限定的な例示の組織特異的プロモーターは、B29プロモーター、CD14プロモーター、CD43プロモーター、CD45プロモーター、CD68プロモーター、デスミンプロモーター、エラスターゼ-1プロモーター、エンドグリンプロモーター、フィブロネクチンプロモーター、Flt-1プロモーター、GFAPプロモーター、GPIIbプロモーター、ICAM-2プロモーター、INF-βプロモーター、Mbプロモーター、Nphslプロモーター、OG-2プロモーター、SP-Bプロモーター、SYN1プロモーター、およびWASPプロモーターを包含する。 In some embodiments, promoters that may be used in prime editing factor vectors may be constitutive, inducible, or tissue-specific. In some embodiments, the promoter may be a constitutive promoter. Non-limiting example constitutive promoters include the cytomegalovirus immediate early promoter (CMV), the simian virus (SV40) promoter, the adenovirus major late (MLP) promoter, the Rous sarcoma virus (RSV) promoter, the mouse mammary tumor virus ( MMTV) promoter, phosphoglycerate kinase (PGK) promoter, elongation factor-alpha (EFla) promoter, ubiquitin promoter, actin promoter, tubulin promoter, immunoglobulin promoter, functional fragments thereof, or any of the above. Includes combinations. In some embodiments, the promoter may be a CMV promoter. In some embodiments, the promoter may be a truncated CMV promoter. In other embodiments, the promoter may be the EFla promoter. In some embodiments, the promoter may be an inducible promoter. Non-limiting examples of inducible promoters include those inducible by heat shock, light, chemicals, peptides, metals, steroids, antibiotics, or alcohol. In some embodiments, an inducible promoter may have a low basal (non-induced) expression level, such as the Tet-On® promoter (Clontech). In some embodiments, the promoter may be a tissue-specific promoter. In some embodiments, the tissue-specific promoter is expressed exclusively or primarily in liver tissue. Non-limiting example tissue-specific promoters include B29 promoter, CD14 promoter, CD43 promoter, CD45 promoter, CD68 promoter, desmin promoter, elastase-1 promoter, endoglin promoter, fibronectin promoter, Flt-1 promoter, GFAP promoter, Includes GPIIb promoter, ICAM-2 promoter, INF-β promoter, Mb promoter, Nphsl promoter, OG-2 promoter, SP-B promoter, SYN1 promoter, and WASP promoter.

いくつかの態様において、プライム編集因子ベクター(例として、プライム編集因子融合タンパク質および/またはPEgRNA、および/または第2鎖へニックを入れる付属gRNAをコードするいずれのベクターも包含する)は、標的細胞へ送達された後にしか発現を開始しない誘導性プロモーターを含んでいてもよい。非限定的な例示の誘導性プロモーターは、熱ショック、光、化学物質、ペプチド、金属、ステロイド、抗生物質、またはアルコールによって誘導可能なものを包含する。いくつかの態様において、誘導性プロモーターは、基底(非誘導)発現レベルが低いもの、例として、Tet-On(登録商標)プロモーター(Clontech)などであってもよい。 In some embodiments, the prime editing factor vector (including, by way of example, any vector encoding a prime editing factor fusion protein and/or PEgRNA and/or an accessory gRNA that nicks the second strand) The vector may contain an inducible promoter that initiates expression only after delivery to the vector. Non-limiting examples of inducible promoters include those inducible by heat shock, light, chemicals, peptides, metals, steroids, antibiotics, or alcohol. In some embodiments, an inducible promoter may have a low basal (non-induced) expression level, such as the Tet-On® promoter (Clontech).

追加の態様において、プライム編集因子ベクター(例として、プライム編集因子融合タンパク質および/またはPEgRNA、および/または第2鎖へニックを入れる付属gRNAをコードするいずれのベクターも包含する)は、特定の組織へ送達された後にしか発現を開始しない組織特異的なプロモーターを含んでいてもよい。非限定的な例示の組織特異的プロモーターは、B29プロモーター、CD14プロモーター、CD43プロモーター、CD45プロモーター、CD68プロモーター、デスミンプロモーター、エラスターゼ-1プロモーター、エンドクリンプロモーター、フィブロネクチンプロモーター、Flt-1プロモーター、GFAPプロモーター、GPIIbプロモーター、ICAM-2プロモーター、INF-βプロモーター、Mbプロモーター、Nphslプロモーター、OG-2プロモーター、SP-Bプロモーター、SYN1プロモーター、およびWASPプロモーターを包含する。 In additional embodiments, the prime editing factor vector (including, by way of example, any vector encoding a prime editing factor fusion protein and/or a PEgRNA and/or an accessory gRNA that nicks the second strand) It may also contain a tissue-specific promoter that initiates expression only after delivery to the tissue. Non-limiting example tissue-specific promoters include B29 promoter, CD14 promoter, CD43 promoter, CD45 promoter, CD68 promoter, desmin promoter, elastase-1 promoter, endocrine promoter, fibronectin promoter, Flt-1 promoter, GFAP promoter, Includes GPIIb promoter, ICAM-2 promoter, INF-β promoter, Mb promoter, Nphsl promoter, OG-2 promoter, SP-B promoter, SYN1 promoter, and WASP promoter.

いくつかの態様において、PEgRNA(またはプライム編集に関係して使用されるいずれのガイドRNA)をコードするヌクレオチド配列は、少なくとも1の転写または翻訳制御配列へ作動可能に連結されていてもよい。いくつかの態様において、ガイドRNAをコードするヌクレオチド配列は、少なくとも1のプロモーターへ作動可能に連結されていてもよい。いくつかの態様において、プロモーターは、RNAポリメラーゼ III(Pol III)によって認識されてもよい。Pol IIIプロモーターの非限定例は、U6、HI、およびtRNAプロモーターを包含する。いくつかの態様において、ガイドRNAをコードするヌクレオチド配列は、マウスまたはヒトU6プロモーターへ作動可能に連結されていてもよい。他の態様において、ガイドRNAをコードするヌクレオチド配列は、マウスまたはヒトHIプロモーターへ作動可能に連結されていてもよい。いくつかの態様において、ガイドRNAをコードするヌクレオチド配列は、マウスまたはヒトtRNAプロモーターへ作動可能に連結されていてもよい。1より多くのガイドRNAを用いる態様において、発現を推進するのに使用されるプロモーターは、同じであっても、または異なっていてもよい。いくつかの態様において、ガイドRNAのcrRNAをコードするヌクレオチド、およびガイドRNAのtracr RNAをコードするヌクレオチドは、同じベクター上に提供されていてもよい。いくつかの態様において、crRNAをコードするヌクレオチド、およびtracr RNAをコードするヌクレオチドは、同じプロモーターによって推進されてもよい。いくつかの態様において、crRNAおよびtracr RNAは、転写されて単一の転写産物になってもよい。例えば、crRNAおよびtracr RNAは、単一の転写産物からプロセシングされて二本鎖分子(double-molecule)ガイドRNAを形成してもよい。代替的に、crRNAおよびtracr RNAは、転写されて単一分子ガイドRNAになってもよい。 In some embodiments, the nucleotide sequence encoding PEgRNA (or any guide RNA used in connection with prime editing) may be operably linked to at least one transcriptional or translational control sequence. In some embodiments, the nucleotide sequence encoding the guide RNA may be operably linked to at least one promoter. In some embodiments, the promoter may be recognized by RNA polymerase III (Pol III). Non-limiting examples of Pol III promoters include U6, HI, and tRNA promoters. In some embodiments, the nucleotide sequence encoding the guide RNA may be operably linked to a mouse or human U6 promoter. In other embodiments, the nucleotide sequence encoding the guide RNA may be operably linked to a mouse or human HI promoter. In some embodiments, the nucleotide sequence encoding the guide RNA may be operably linked to a mouse or human tRNA promoter. In embodiments using more than one guide RNA, the promoters used to drive expression may be the same or different. In some embodiments, the nucleotides encoding the crRNA of the guide RNA and the nucleotides encoding the tracr RNA of the guide RNA may be provided on the same vector. In some embodiments, the nucleotides encoding crRNA and nucleotides encoding tracr RNA may be driven by the same promoter. In some embodiments, crRNA and tracr RNA may be transcribed into a single transcript. For example, crRNA and tracr RNA may be processed from a single transcript to form a double-molecule guide RNA. Alternatively, crRNA and tracr RNA may be transcribed into single molecule guide RNAs.

いくつかの態様において、ガイドRNAをコードするヌクレオチド配列は、PE融合タンパク質をコードするヌクレオチド配列を含む同じベクター上に位置付けられていてもよい。いくつかの態様において、ガイドRNAの発現およびPE融合タンパク質の発現は、それらの対応するプロモーターによって推進されてもよい。いくつかの態様において、ガイドRNAの発現は、PE融合タンパク質の発現を推進する同じプロモーターによって推進されてもよい。いくつかの態様において、ガイドRNAおよびPE融合タンパク質の転写産物は、単一の転写産物内に含有されていてもよい。例えば、ガイドRNAは、Cas9タンパク質転写産物の非翻訳領域(UTR)内にあってもよい。いくつかの態様において、ガイドRNAは、PE融合タンパク質転写産物の5'UTR内にあってもよい。他の態様において、ガイドRNAは、PE融合タンパク質転写産物の3'UTR内にあってもよい。いくつかの態様において、PE融合タンパク質転写産物の細胞内半減期は、ガイドRNAをその3'UTR内に含有することによって低減されることもあり、これによってその3'UTRの長さが短縮される。追加の態様において、ガイドRNAは、PE融合タンパク質転写産物のイントロン内にあってもよい。いくつかの態様において、好適なスプライシング部位は、ガイドRNAが転写産物から正しくスプライシングされるように、ガイドRNAが位置付けられるイントロンに付加されてもよい。いくつかの態様において、同じベクター上の極めて近いところにあるCas9タンパク質およびガイドRNAの発現は、CRISPR複合体のより効率的な形成を容易にさせることもある。 In some embodiments, the nucleotide sequence encoding the guide RNA may be located on the same vector that contains the nucleotide sequence encoding the PE fusion protein. In some embodiments, the expression of the guide RNA and the expression of the PE fusion protein may be driven by their corresponding promoters. In some embodiments, the expression of the guide RNA may be driven by the same promoter that drives the expression of the PE fusion protein. In some embodiments, the transcript of the guide RNA and the PE fusion protein may be contained within a single transcript. For example, the guide RNA may be within the untranslated region (UTR) of the Cas9 protein transcript. In some embodiments, the guide RNA may be within the 5'UTR of the PE fusion protein transcript. In other embodiments, the guide RNA may be within the 3'UTR of the PE fusion protein transcript. In some embodiments, the intracellular half-life of the PE fusion protein transcript may be reduced by containing the guide RNA within its 3'UTR, thereby shortening the length of the 3'UTR. In additional embodiments, the guide RNA may be within an intron of the PE fusion protein transcript. In some embodiments, a suitable splicing site may be added to the intron in which the guide RNA is located so that the guide RNA is correctly spliced from the transcript. In some embodiments, expression of the Cas9 protein and guide RNA in close proximity on the same vector may facilitate more efficient formation of CRISPR complexes.

プライム編集因子ベクター系は、1つのベクター、もしくは2つのベクター、もしくは3つのベクター、もしくは4つのベクター、もしくは5つのベクター、またはこれ以上を含んでいてもよい。いくつかの態様において、ベクター系は、PE融合タンパク質とPEgRNAとの両方をコードする1つの単一ベクターを含んでいてもよい。他の態様において、ベクター系は2つのベクターを含んでいてもよいが、ここで一方のベクターはPE融合タンパク質をコードし、他方がPEgRNAをコードする。追加の態様において、ベクター系は3つのベクターを含んでいてもよいが、ここで第3ベクターは、本明細書の方法に使用される、第2鎖へニックを入れるgRNAをコードする。 The prime editing factor vector system may include one vector, or two vectors, or three vectors, or four vectors, or five vectors, or more. In some embodiments, the vector system may include one single vector encoding both the PE fusion protein and PEgRNA. In other embodiments, the vector system may include two vectors, where one vector encodes the PE fusion protein and the other encodes PEgRNA. In additional embodiments, the vector system may include three vectors, where the third vector encodes a gRNA that nicks the second strand for use in the methods herein.

いくつかの態様において、rAAV粒子を含む組成物(本明細書に企図されるいずれの形態)はさらに、薬学的に許容し得る担体を含む。いくつかの態様において、組成物は、ヒトまたは動物の対象への投与に適切な医薬ビヒクル中で製剤化される。 In some embodiments, a composition comprising rAAV particles (in any form contemplated herein) further comprises a pharmaceutically acceptable carrier. In some embodiments, the composition is formulated in a pharmaceutical vehicle suitable for administration to a human or animal subject.

薬学的に許容し得る担体として働き得る材料のいくつかの例は以下を包含する:(1)ラクトース、グルコース、およびスクロースなどの、糖;(2)コーンスターチおよびジャガイモデンプンなどの、デンプン;(3)ナトリウムカルボキシメチルセルロース、メチルセルロース、エチルセルロース、微結晶性セルロース、および酢酸セルロースなどの、セルロースおよびその誘導体;(4)粉末状トラガカント;(5)麦芽;(6)ゼラチン;(7)ステアリン酸マグネシウム、ラウリル硫酸ナトリウム、およびタルクなどの、平滑剤;(8)カカオバターおよび坐薬蝋などの、賦形剤;(9)落花生油、綿実油、紅花油、ゴマ 油、オリーブ油、トウモロコシ油、および大豆油などの、油;(10)プロピレングリコールなどの、グリコール;(11)グリセリン、ソルビトール、マンニトール、およびポリエチレングリコール(PEG)などの、ポリオール;(12)オレイン酸エチルおよびラウリン酸エチルなどの、エステル;(13)寒天;(14)水酸化マグネシウムおよび水酸化アルミニウムなどの、緩衝剤;(15)アルギン酸;(16)パイロジェンフリー水;(17)等浸透圧の生理食塩水;(18)リンガー溶液;(19)エチルアルコール;(20)pH緩衝溶液;(21)ポリエステル、ポリカーボネート、および/またはポリ酸無水物;(22)ポリペプチドおよびアミノ酸などの、増量剤;(23)血清アルブミン、HDL、およびLDLなどの、血清構成要素;(22)エタノールなどの、C2~C12アルコール;ならびに(23)医薬製剤に採用される、相溶性のある他の非毒性物質。湿潤剤、着色剤、離型剤、コーティング剤、甘味剤、香味剤、芳香剤、保存料、および抗酸化剤もまた、製剤中に存在し得る。「賦形剤」、「担体」、「薬学的に許容し得る担体」または同種のものなどの用語は本明細書中、互換的に使用される。 Some examples of materials that can serve as pharmaceutically acceptable carriers include: (1) sugars, such as lactose, glucose, and sucrose; (2) starches, such as corn starch and potato starch; (3) ) Cellulose and its derivatives, such as sodium carboxymethylcellulose, methylcellulose, ethylcellulose, microcrystalline cellulose, and cellulose acetate; (4) powdered tragacanth; (5) malt; (6) gelatin; (7) magnesium stearate, lauryl (8) Excipients, such as cocoa butter and suppository wax; (9) Lubricant agents, such as sodium sulfate, and talc; (9) Excipients, such as peanut oil, cottonseed oil, safflower oil, sesame oil, olive oil, corn oil, and soybean oil. (10) Glycols, such as propylene glycol; (11) Polyols, such as glycerin, sorbitol, mannitol, and polyethylene glycol (PEG); (12) Esters, such as ethyl oleate and ethyl laurate; (13) ) agar; (14) buffering agents, such as magnesium hydroxide and aluminum hydroxide; (15) alginic acid; (16) pyrogen-free water; (17) isotonic saline; (18) Ringer's solution; (19) ) ethyl alcohol; (20) pH buffer solutions; (21) polyesters, polycarbonates, and/or polyanhydrides; (22) bulking agents, such as polypeptides and amino acids; (23) serum albumin, HDL, and LDL. (22) C2-C12 alcohols, such as ethanol; and (23) other compatible non-toxic substances employed in pharmaceutical formulations. Wetting agents, coloring agents, mold release agents, coating agents, sweetening agents, flavoring agents, perfuming agents, preservatives, and antioxidants may also be present in the formulation. Terms such as "excipient", "carrier", "pharmaceutically acceptable carrier" or the like are used interchangeably herein.

送達方法
いくつかの側面において、本発明は、それらの1以上の転写産物、および/またはそれらから転写される1以上のタンパク質をコードする1以上のベクターなどの、本明細書に記載のとおりの1以上のポリヌクレオチドを宿主細胞へ送達することを含む方法を提供する。いくつかの側面において、本発明はさらに、かかる方法によって産生される細胞、およびかかる細胞を含むかまたはかかる細胞から産生される生物(動物、植物、もしくは真菌など)を提供する。いくつかの態様において、本明細書に記載のとおりの塩基編集因子は、ガイド配列と組み合わせて(任意にこれと複合化されて)、細胞へ送達される。
Methods of Delivery In some aspects, the invention provides vectors as described herein, such as one or more vectors encoding one or more transcripts thereof, and/or one or more proteins transcribed therefrom. A method is provided that includes delivering one or more polynucleotides to a host cell. In some aspects, the invention further provides cells produced by such methods, and organisms (such as animals, plants, or fungi) that include or are produced from such cells. In some embodiments, base editors as described herein are delivered to cells in combination with (optionally conjugated to) a guide sequence.

例示の送達ストラテジーは、本明細書のどこかに記載されるが、ベクターベースのストラテジー、PEリボヌクレオタンパク質複合体の送達、およびmRNA方法によるPEの送達を包含する。 Exemplary delivery strategies are described elsewhere herein and include vector-based strategies, delivery of PE ribonucleoprotein complexes, and delivery of PE by mRNA methods.

いくつかの態様において、提供される送達方法は、ヌクレオフェクション、マイクロ注射、微粒子銃(biolistics)、ビロソーム、リポソーム、イムノリポソーム、ポリカチオンまたは脂質:核酸抱合体、裸のDNA、人工ビリオン、およびDNAの取り込みを増強する剤を包含する。 In some embodiments, delivery methods provided include nucleofection, microinjection, biolistics, virosomes, liposomes, immunoliposomes, polycation or lipid:nucleic acid conjugates, naked DNA, artificial virions, and agents that enhance DNA uptake.

例示の核酸送達方法は、リポフェクション、ヌクレオフェクション、エレクトロポレーション、安定したゲノム組み入れ(例として、piggybac)、マイクロ注射、微粒子銃(biolistics)、ビロソーム、リポソーム、イムノリポソーム、ポリカチオンまたは脂質:核酸抱合体、裸のDNA、人工ビリオン、およびDNAの取り込みを増強する剤を包含する。リポフェクションは、例として、米国特許第5,049,386号、第4,946,787号;および第4,897,355号)に記載されており、リポフェクション試薬は商業的に販売されている(例として、Transfectam(商標)、Lipofectin(商標)、およびSF細胞株4D-Nucleofector X Kit(商標)(Lonza))。ポリヌクレオチドの効率的な受容体認識リポフェクションに好適なカチオン性脂質および中性脂質は、Feigner、WO91/17424;WO91/16024の脂質を包含する。送達は、細胞(例として、in vitro投与もしくはex vivo投与)、または標的組織(例として、in vivo投与)に対するものであり得る。送達は、RNP複合体の使用を通して達成されてもよい。 Exemplary nucleic acid delivery methods include lipofection, nucleofection, electroporation, stable genomic integration (e.g., piggybac), microinjection, biolistics, virosomes, liposomes, immunoliposomes, polycations or lipid:nucleic acids. Includes conjugates, naked DNA, artificial virions, and agents that enhance DNA uptake. Lipofection is described, for example, in U.S. Patent Nos. 5,049,386, 4,946,787; and 4,897,355), and lipofection reagents are commercially available (for example, Transfectam(TM), Lipofectin(TM)). , and SF cell line 4D-Nucleofector X Kit™ (Lonza)). Suitable cationic and neutral lipids for efficient receptor recognition lipofection of polynucleotides include the lipids of Feigner, WO91/17424; WO91/16024. Delivery can be to cells (eg, in vitro or ex vivo administration) or to target tissues (eg, in vivo administration). Delivery may be achieved through the use of RNP complexes.

イムノ脂質複合体などの標的化リポソームを包含する脂質:核酸複合体の調製は、当業者に周知である(例として、Crystal,Science 270:404-410(1995);Blaese et al.,Cancer Gene Ther.2:291-297(1995);Behr et al.,Bioconjugate Chem.5:382-389(1994);Remy et al.,Bioconjugate Chem.5:647-654(1994);Gao et al.,Gene Therapy 2:710-722(1995);Ahmad et al.,Cancer Res.52:4817-4820(1992);米国特許第4,186,183号、第4,217,344号、第4,235,871号、第4,261,975号、第4,485,054号、第4,501,728号、第4,774,085号、第4,837,028号、および第4,946,787号を参照)。 The preparation of lipid:nucleic acid complexes including targeted liposomes, such as immunolipid complexes, is well known to those skilled in the art (see, e.g., Crystal, Science 270:404-410 (1995); Blaese et al., Cancer Gene Ther.2:291-297(1995);Behr et al.,Bioconjugate Chem.5:382-389(1994);Remy et al.,Bioconjugate Chem.5:647-654(1994);Gao et al., Gene Therapy 2:710-722(1995);Ahmad et al., Cancer Res.52:4817-4820(1992);U.S. Pat. 4,501,728, 4,774,085, 4,837,028, and 4,946,787).

他の態様において、本明細書に提供される送達方法およびベクターは、RNP複合体である。融合タンパク質のRNP送達は、塩基編集のDNA特異性を著しく増大させる。融合タンパク質のRNP送達は、オン-およびオフ-ターゲットDNA編集の分断(decoupling)へ繋がる。RNP送達は、プラスミド送達に匹敵するオン-ターゲット編集を維持しながら、非反復部位にてオフターゲット編集を小さくし(ablates)、高度に反復したVEGFA部位2でさえもオフ-ターゲットDNA編集を大いに低減させる。Rees,H.A.et al.,Improving the DNA specificity and applicability of base editing through protein engineering and protein delivery,Nat.Commun.8,15790(2017)、2016年12月27日に発行された米国特許第9,526,784号、および2017年8月22日に発行された米国特許第9,737,604号を参照(これらの各々は参照により本明細書に組み込まれる)。 In other embodiments, the delivery methods and vectors provided herein are RNP complexes. RNP delivery of fusion proteins significantly increases the DNA specificity of base editing. RNP delivery of fusion proteins leads to decoupling of on- and off-target DNA editing. RNP delivery ablates off-target editing at non-repetitive sites while maintaining on-target editing comparable to plasmid delivery, greatly reducing off-target DNA editing even at highly repetitive VEGFA site 2. reduce Rees, H.A. et al., Improving the DNA specificity and applicability of base editing through protein engineering and protein delivery, Nat.Commun.8, 15790 (2017), U.S. Patent No. 9,526,784, issued December 27, 2016; and US Pat. No. 9,737,604, issued August 22, 2017, each of which is incorporated herein by reference.

細胞への核酸送達のための追加の方法は当業者に知られている。例えば、US 2003/0087817を参照(参照により本明細書に組み込まれる)。 Additional methods for nucleic acid delivery to cells are known to those skilled in the art. See, eg, US 2003/0087817 (incorporated herein by reference).

他の本開示の側面は、プライム編集因子構築物を細胞中へ送達して、完全かつ機能的なプライム編集因子を細胞内に形成する方法を提供する。例えば、いくつかの態様において、細胞は、本明細書に記載の組成物(例として、分裂Cas9もしくは分裂プライム編集因子をコードするヌクレオチド配列、またはかかるヌクレオチド配列を含む核酸ベクターを含有するAAV粒子を含む組成物)と接触させられる。いくつかの態様において、接触させることは、かかるヌクレオチド配列の細胞中への送達をもたらすが、ここでCas9タンパク質またはプライム編集因子のN末端部分、およびCas9タンパク質またはプライム編集因子のC末端部分は、細胞中で発現され結び合わされて、完全なCas9タンパク質または完全なプライム編集因子を形成する。 Other aspects of the present disclosure provide methods of delivering a prime editing factor construct into a cell to form a complete and functional prime editing factor within the cell. For example, in some embodiments, the cells contain AAV particles containing a composition described herein (e.g., a nucleotide sequence encoding a mitotic Cas9 or mitotic prime editing factor, or a nucleic acid vector comprising such a nucleotide sequence). (composition containing). In some embodiments, the contacting results in delivery of such nucleotide sequences into the cell, wherein the N-terminal portion of the Cas9 protein or prime editing factor and the C-terminal portion of the Cas9 protein or prime editing factor are Expressed in cells and combined to form the complete Cas9 protein or the complete prime editor.

本明細書に提供されるいずれのrAAV粒子、核酸分子、または組成物も、安定的または一過的のいずれかのいずれか好適なやり方で、細胞中へ導入されてもよいことは解されるはずである。いくつかの態様において、開示されたタンパク質は、細胞中へトランスフェクトされてもよい。いくつかの態様において、細胞は、核酸分子で形質導入またはトランスフェクトされてもよい。例えば、細胞は、分裂タンパク質をコードする核酸分子、もしくは1以上の核酸分子をコードするウイルスのゲノムを含有するrAAV粒子で、形質導入されても(例として、分裂タンパク質をコードするウイルスで)、またはトランスフェクトされてもよい(例として、分裂タンパク質をコードするプラスミドで)。かかる形質導入は、安定的な形質導入または一過的な形質導入であってもよい。いくつかの態様において、分裂タンパク質を発現するかまたは分裂タンパク質を含有する細胞は、例えば、分裂Cas9(例として、nCas9)タンパク質の送達において、1以上のガイドRNA配列で形質導入またはトランスフェクトされてもよい。いくつかの態様において、分裂タンパク質を発現するプラスミドは、電気穿孔法、一過的な(例として、リポフェクション)および安定したゲノム取り入れ(例として、piggybac)、およびウイルスの形質導入または当業者に知られている他の方法を通して、細胞中へ導入されてもよい。 It is understood that any rAAV particle, nucleic acid molecule, or composition provided herein may be introduced into cells in any suitable manner, either stably or transiently. It should be. In some embodiments, the disclosed proteins may be transfected into cells. In some embodiments, cells may be transduced or transfected with a nucleic acid molecule. For example, a cell may be transduced with a nucleic acid molecule encoding a fission protein, or an rAAV particle containing the genome of a virus encoding one or more nucleic acid molecules (e.g., with a virus encoding a fission protein). or may be transfected (eg, with a plasmid encoding a fission protein). Such transduction may be stable transduction or transient transduction. In some embodiments, cells expressing or containing a fission protein are transduced or transfected with one or more guide RNA sequences, e.g., in the delivery of a fission Cas9 (e.g., nCas9) protein. Good too. In some embodiments, plasmids expressing split proteins are produced by electroporation, transient (e.g., lipofection) and stable genomic incorporation (e.g., piggybac), and viral transduction or other methods known to those skilled in the art. It may also be introduced into cells through other methods described.

ある態様において、本明細書に提供される組成物は、脂質および/またはポリマーを含む。ある態様において、脂質および/またはポリマーはカチオン性である。かかる脂質粒子の調製は周知である。例として、米国特許第4,880,635号;第4,906,477号;第4,911,928号;第4,917,951号;第4,920,016号;第4,921,757号;および第9,737,604号を参照(これらの各々は参照により本明細書に組み込まれる)。 In some embodiments, the compositions provided herein include lipids and/or polymers. In some embodiments, the lipids and/or polymers are cationic. The preparation of such lipid particles is well known. See, e.g., U.S. Patent Nos. 4,880,635; 4,906,477; 4,911,928; 4,917,951; 4,920,016; 4,921,757; and 9,737,604, each of which is incorporated herein by reference.

ガイドRNA配列は長さが15~100ヌクレオチドであってもよく、標的ヌクレオチド配列に相補的な少なくとも10、少なくとも15、または少なくとも20の連続したヌクレオチドの配列を含む。ガイドRNAは、標的ヌクレオチド配列に相補的な15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、または40の連続したヌクレオチドの配列を含んでいてもよい。ガイドRNAは、長さが15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、または50ヌクレオチドであってもよい。 The guide RNA sequence may be 15-100 nucleotides in length and includes a sequence of at least 10, at least 15, or at least 20 contiguous nucleotides complementary to the target nucleotide sequence. The guide RNA is complementary to the target nucleotide sequence. , 35, 36, 37, 38, 39, or 40 contiguous nucleotides. Guide RNAs were 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36 in length. , 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, or 50 nucleotides.

いくつかの態様において、標的ヌクレオチド配列は、ゲノム(例として、真核生物のゲノム)中のDNA配列である。ある態様において、標的ヌクレオチド配列は、哺乳類の動物(例として、ヒト)ゲノム中にある。 In some embodiments, the target nucleotide sequence is a DNA sequence in a genome (eg, a eukaryotic genome). In certain embodiments, the target nucleotide sequence is in the mammalian (eg, human) genome.

本開示の組成物は、例えば、単位用量として投与またはパッケージされてもよい。用語「単位用量」は、本開示の医薬組成物に関して使用されるとき、まとまった投薬量として対象に好適な、物理的に不連続な単位を指し、予め決められた分量の活性材料を含有する各単位は、要求される希釈剤;すなわち、担体またはビヒクルを伴って所望の治療効果を産生するよう算出される。 Compositions of the present disclosure may be administered or packaged as unit doses, for example. The term "unit dose" as used in reference to the pharmaceutical compositions of the present disclosure refers to physically discrete units suitable for a subject as a unitary dosage and containing a predetermined amount of active material. Each unit is calculated to produce the desired therapeutic effect in association with the required diluent; ie, carrier or vehicle.

疾患または障害の処置は、疾患の発症もしくは進行を遅延させるか、または疾患の重症度を低減させることを包含する。疾患を処置することは、根治した(curative)結果を必ずしも要さない。 Treatment of a disease or disorder includes delaying the onset or progression of the disease or reducing the severity of the disease. Treating a disease does not necessarily require a curative result.

そこで使用されたとおり、疾患の発症を「遅延すること」は、疾患の進行を、先送りする(defer)、妨げる(hinder)、遅らせる(slow)、妨害する(retard)、留める(stabilize)、および/または延ばす(postpone)ことを意味する。この遅延は、病歴および/または処置される個体に応じて、時間の長さを変動させることでもあり得る。疾患の発症を「遅延」もしくは緩和する方法、または疾患の発病を遅延する方法は、この方法を使用しない場合と比較して、所定の時間枠での疾患の1以上の症状を発症する確率を低減するか、および/または所定の時間枠での症状の程度を低減する方法である。かかる比較は、典型的には、統計的に有意な結果を与えるのに充分数多の対象を使用する臨床研究に基づく。 As used there, "delaying" the onset of a disease means deferring, hindering, slowing, retarding, stabilizing, and / or means to postpone (postpone). This delay may be of varying length of time depending on the medical history and/or the individual being treated. A method of "delaying" or mitigating the onset of a disease, or of delaying the onset of a disease, increases the probability of developing one or more symptoms of the disease in a given time frame compared to not using the method. and/or reduce the severity of symptoms over a given time frame. Such comparisons are typically based on clinical studies using a sufficiently large number of subjects to yield statistically significant results.

疾患の「発症」または「進行」は、最初の兆候および/またはその後の疾患の進行を意味する。疾患の発症は、当該技術分野において周知のとおりの標準の臨床技法を使用し検出可能であり、かつ査定され得る。しかしながら、発症はまた、検出不能なこともある進行も指す。本開示の目的上、発症または進行は、症状の生物学的な経過を指す。「発症」は、発生、再発、および発病を包含する。 "Onset" or "progression" of a disease refers to the first signs and/or subsequent progression of the disease. The onset of disease can be detected and assessed using standard clinical techniques as known in the art. However, onset also refers to progression, which may be undetectable. For purposes of this disclosure, onset or progression refers to the biological course of a condition. "Development" includes occurrence, recurrence, and onset.

本明細書に使用されるとき、疾患の「発病」または「発生」は、最初の発病および/または再発を包含する。医学の当業者に知られている従来の方法は、処置されるべき疾患の型または疾患の部位に応じて、単離されたポリペプチドまたは医薬組成物を対象へ投与するのに使用され得る。 As used herein, "onset" or "occurrence" of a disease includes initial onset and/or recurrence. Conventional methods known to those skilled in the art of medicine may be used to administer the isolated polypeptide or pharmaceutical composition to a subject, depending on the type of disease or site of the disease to be treated.

さらなる詳細化はしないが、当業者は、上の記載に基づき、本開示を最大限に利用し得るものと思われる。したがって、以下の特定の態様は、単なる説明として解釈されるべきであって、いずれにしても本開示の残りを何ら限定するものではない。本明細書に引用されるすべての刊行物は、本明細書に言及される目的または主題のため、参照により組み込まれる。 Without going into further detail, it is believed that one skilled in the art can utilize the present disclosure to its fullest extent based on the above description. The following specific aspects are therefore to be construed as merely illustrative, and not limitative of the remainder of the disclosure in any way whatsoever. All publications cited herein are incorporated by reference for the purposes or subject matter discussed herein.


例1.ゲノム中に正確なヌクレオチド変化を組み入れるためのプライム編集(PE)
目的は、正確なゲノム編集の変革技術を開発すること、および哺乳動物ゲノム中の単一ヌクレオチドの変化の組み入れを生成することである。この技術は、研究者らに、事実上いずれの哺乳動物遺伝子においても、単一ヌクレオチドのバリエーションの効果を研究できるようにさせ、ヒト患者における病原性の点突然変異を修正するための治療的介入を潜在的に可能にさせるであろう。
example
Example 1. Prime editing (PE) to incorporate precise nucleotide changes into the genome
The goal is to develop transformative technologies for precise genome editing and to generate incorporation of single nucleotide changes in mammalian genomes. This technology will allow researchers to study the effects of single nucleotide variations in virtually any mammalian gene, allowing therapeutic interventions to correct pathogenic point mutations in human patients. would potentially make it possible.

ゲノム編集のための、クラスター化して規則的な配置の短い回文配列反復(CRISPR)系の採用は、生命科学に革命をもたらした1~3。CRISPRを使用する遺伝子の断絶は今やルーチンとなっているが、単一ヌクレオチドの編集の正確な組み入れは、疾患が原因の多数の突然変異を研究または修正するのに必要であるにも関わらず、大きな課題のままである。相同組み換え修復(HDR)は、かかる編集を達成させることは可能ではあるが、低い効率(しばしば<5%)、ドナーDNA修復鋳型のための要件、および二本鎖DNA破壊(DSB)形成の有害効果に悩まされている。近年、Liu実験室が塩基編集を開発したが、これによってDSBのない効率的な単一ヌクレオチドの編集が達成される。塩基編集因子(BE)は、CRISPR系を塩基修飾デアミナーゼ酵素と組み合わせて、標的C・GまたはA・T塩基対を夫々A・TまたはG・Cへ変換する4~6。研究者らによって既に幅広く世界的に使用されているが(Addgeneによって流通された>5,000 Liu実験室のBE構築物)、最新のBEは12塩基対の起こり得る変換のうちたった4つしかできず、小さい挿入または欠失を修正することはできない。その上、塩基編集の標的範囲は、標的塩基に隣接する非標的CまたはA塩基の編集(「バイスタンダー(bystander)編集」)によって、およびPAM配列が標的塩基から15±2bpに存在するという要件によって限定されている。したがって、これらの欠点を克服することは、ゲノム編集の基礎研究および治療用途を大幅に広げるであろう。 The adoption of the clustered regularly interspaced short palindromic repeats (CRISPR) system for genome editing has revolutionized the life sciences. 1 - 3 Although gene disruption using CRISPR is now routine, precise incorporation of single-nucleotide edits remains a major challenge, despite being necessary to study or correct a large number of disease-causing mutations. Homologous directed repair (HDR) can achieve such edits but suffers from low efficiency (often <5%), the requirement for a donor DNA repair template, and the deleterious effects of double-stranded DNA break (DSB) formation. Recently, the Liu laboratory developed base editing, which achieves efficient single-nucleotide editing without DSBs. Base editors (BEs) combine the CRISPR system with base-modifying deaminase enzymes to convert targeted C·G or A·T base pairs to A·T or G·C, respectively. 4 - 6 Although already widely used by researchers worldwide (>5,000 Liu lab BE constructs distributed by Addgene), the latest BEs can only modify 4 of 12 possible base pair conversions and cannot correct small insertions or deletions. Moreover, the target scope of base editing is limited by the editing of non-targeted C or A bases adjacent to the target base ("bystander editing") and by the requirement that the PAM sequence be present 15±2bp from the target base. Thus, overcoming these shortcomings would greatly broaden the basic research and therapeutic applications of genome editing.

ここで、塩基編集の利益の多く-つまり、二本鎖破壊の回避およびドナーDNA修復鋳型-を、その大きな欠点を克服しつつ与える、新しい高精度編集アプローチを開発することが提案される。この意欲的な目標を達成するため、標的にプライムされた逆転写(TPRT)を使用して、標的ゲノムの部位にて編集済DNA鎖を直接組み入れることを目的とする。本明細書に考察されるデザインにおいて、CRISPRガイドRNA(gRNA)は、結び付けられた逆転写酵素(RT)鋳型配列によって実行される、変異誘発DNA鎖合成をコードする鋳型を持つよう改変されるであろう。CRISPRヌクレアーゼ(Cas9)によってニックが入れられた標的部位DNAは、修飾gRNA上の鋳型配列の逆転写のためのプライマーとして働き、いずれの所望のヌクレオチド編集の直接的な組み込みを可能にするであろう。 It is now proposed to develop a new precision editing approach that provides many of the benefits of base editing - namely, avoidance of double-strand breaks and donor DNA repair templates - while overcoming its major drawbacks. To achieve this ambitious goal, we aim to use target primed reverse transcription (TPRT) to directly incorporate edited DNA strands at targeted genomic sites. In the designs discussed herein, a CRISPR guide RNA (gRNA) can be modified to carry a template encoding mutagenic DNA strand synthesis carried out by an associated reverse transcriptase (RT) template sequence. Probably. Target site DNA nicked by CRISPR nuclease (Cas9) will serve as a primer for reverse transcription of the template sequence on the modified gRNA, allowing direct incorporation of any desired nucleotide edits. .

セクション1
変異誘発DNA鎖の、ガイドRNAを鋳型にした逆転写を確立する。先行研究によって、DNA切断の後であって複合体解離の前に、Cas9が非標的DNA鎖を放出して遊離の3'末端を晒すことが示された。このDNA鎖が、ポリメラーゼ酵素による伸長へアクセス可能であって、gRNAが、それらの5'末端または3'末端の伸長を通してDNA合成の鋳型として働くよう改変され得るものと仮定する。in vitroでの予備研究において、Cas9:gRNA結合複合体内のニックが入ったDNA鎖が、結合したgRNAを鋳型として使用する逆転写(transのRT酵素)を実際にプライムし得ることが確立された。次に、種々のgRNAリンカー、プライマー結合部位、および合成鋳型を、in vitroでの最適なデザイン規則を決定するために詳しく研究する。次いで、transで作用するかまたはCas9との融合体として作用する種々のRT酵素をin vitroで評価する。最終的に、細胞中の効率的な結合および切断活性を保持する改変gRNAデザインを同定する。これを目的とした実証実験の成功によって、細胞中の変異誘発鎖合成を遂行するための基盤が提供される。
Section 1
Establish guide RNA-templated reverse transcription of the mutagenic DNA strand. Previous studies have shown that after DNA cleavage but before complex dissociation, Cas9 releases the non-target DNA strand, exposing the free 3' end. Assume that this DNA strand is accessible for extension by a polymerase enzyme and that gRNAs can be modified to serve as templates for DNA synthesis through extension of their 5' or 3' ends. Preliminary in vitro studies established that the nicked DNA strand within the Cas9:gRNA binding complex can indeed prime reverse transcription (RT enzyme in trans), which uses the bound gRNA as a template. . Next, various gRNA linkers, primer binding sites, and synthetic templates are studied in detail to determine optimal design rules in vitro. Various RT enzymes acting in trans or as fusions with Cas9 are then evaluated in vitro. Ultimately, modified gRNA designs that retain efficient binding and cleavage activity in cells are identified. Successful demonstration experiments to this end provide the basis for carrying out mutagenic chain synthesis in cells.

セクション2
ヒト細胞中のプライム編集を確立する。DNAプロセシングおよび修復機序に基づき、変異誘発DNA鎖(単鎖フラップ)は、標的ヌクレオチドの特異的かつ効率的な編集に向かうのに使用し得るものと仮定する。有望な予備研究において、このストラテジーの実現性を、変異誘発フラップを含有するモデルプラスミド基質での編集を実証することによって確立した。目的1と同時に、修復成果を、変異誘発フラップの長さ、配列組成、標的ヌクレオチドの同一性、および3'末端を系統的に変動させることによってさらに評価する。1~3ヌクレオチドの小さい挿入および欠失もまた試験する。目的1と並行して目的1から組み立て、融合タンパク質および非共有結合動員ストラテジーを包含するCas9-RT構造を評価する。Cas9-RT構造および伸長されたgRNAを、ヒトゲノム中の複数の標的部位での細胞の編集についてアッセイし、次いで高効率のために最適化する。成功した場合、この目的によって、基礎科学への適用のためのTPRTゲノム編集(すなわち、プライム編集)が即時に確立される。
Section 2
Establishing prime editing in human cells. Based on DNA processing and repair mechanisms, we hypothesize that mutagenic DNA strands (single-stranded flaps) can be used to direct specific and efficient editing of target nucleotides. In promising preliminary studies, the feasibility of this strategy was established by demonstrating editing with a model plasmid substrate containing a mutagenic flap. Concurrent with objective 1, repair outcomes will be further evaluated by systematically varying the length, sequence composition, target nucleotide identity, and 3' end of the mutagenic flap. Small insertions and deletions of 1-3 nucleotides are also tested. Evaluate Cas9-RT constructs assembled from Aim 1 in parallel with Aim 1 and encompassing fusion proteins and non-covalent recruitment strategies. The Cas9-RT construct and extended gRNA are assayed for cellular editing at multiple target sites in the human genome and then optimized for high efficiency. If successful, this objective will immediately establish TPRT genome editing (i.e., prime editing) for basic science applications.

セクション3
培養ヒト細胞中の病原性の突然変異の部位特異的編集を達成する。この技術の潜在的な普遍性は、目下BEによっては修正不能なトランスバージョン突然変異およびインデルの編集を可能にし得る。目的1および目的2の結果によって導かれて、鎌状赤血球病の創始者突然変異をベータグロビン中に(修正にはA・T→T・Aトランスバージョンを要する)および最も蔓延しているウィルソン病の突然変異をATP7B中に(修正にはG・C→T・Aトランスバージョンを要する)包含する培養ヒト細胞中の病原性のトランスバージョン突然変異を標的にする。嚢胞性線維症を引き起こすCFTR中の3ヌクレオチド△F508欠失を包含する、小さい挿入および欠失の突然変異の修正もまた調べる。成功した場合、これは、これらの重要なヒト疾患に対処する強力な治療的アプローチを開発するための基盤を据える。
Section 3
Achieving site-specific editing of pathogenic mutations in cultured human cells. The potential ubiquity of this technology may enable the editing of transversion mutations and indels that are currently uncorrectable by BE. Guided by the results of Aim 1 and Aim 2, we identified the founder mutation in beta-globin of sickle cell disease (correction requires an A.T→T.A transversion) and the most prevalent Wilson disease. targeting pathogenic transversion mutations in cultured human cells containing mutations in ATP7B (requiring G·C→T·A transversion for correction). Correction of small insertion and deletion mutations, including the 3-nucleotide ΔF508 deletion in CFTR that causes cystic fibrosis, will also be examined. If successful, this will lay the foundation for developing powerful therapeutic approaches to address these important human diseases.

アプローチ
目標は、標的にされたゲノム部位にて点突然変異を直接組み入れるゲノム編集ストラテジーを開発することである。技術開発段階において、CRISPR/Cas系中へTPRT機能性を組み込む努力が、タンパク質およびRNA工学に注がれる。TPRTの各ステップの機能を慎重に探り、基礎から組み立てるのにIn vitroアッセイを使用する(目的1)。第2集中領域は、モデル基質と改変CRISPR/Cas系との組み合わせを使用して哺乳動物の細胞中の編集成果を評価する(目的2)。最終的に、適用段階は、他の方法によるゲノム編集では解決困難な突然変異を修正する技術を使用する(目的3)。
The goal of the approach is to develop genome editing strategies that directly incorporate point mutations at targeted genomic sites. During the technology development stage, efforts to incorporate TPRT functionality into CRISPR/Cas systems are focused on protein and RNA engineering. Use in vitro assays to carefully explore the function of each step of TPRT and assemble it from the ground up (Aim 1). The second focus area evaluates editing outcomes in mammalian cells using a combination of model substrates and a modified CRISPR/Cas system (Aim 2). Finally, the application phase uses the technology to correct mutations that are difficult to resolve with other methods of genome editing (Objective 3).

一般的な編集デザインを図1A~1Bに示す。Cas9ニッカーゼは、PAM含有鎖(非標的鎖)へのDNA切断を制限する、HNHヌクレアーゼドメインに対する不活性化突然変異(Spy Cas9 H840AまたはN863A)を含有する。ガイドRNA(gRNA)を、逆転写のための鋳型を含有するよう改変する(デザインはスライド5上に詳細化)。示されるのはgRNAの5'伸長であるが、3'伸長でも実践できる。Cas9ニッカーゼを、C末端またはN末端のいずれかを通して、逆転写酵素(RT)酵素と融合させる。gRNA:Cas9-RT複合体は、着目するDNA領域を標的にし、非標的鎖に取って代わった後にRループを形成する。Cas9は非標的DNA鎖へニックを入れる。ニックが入った鎖の放出によって遊離の3'-OH末端が晒されるが、前記末端は、伸長されたgRNAを鋳型として使用する逆転写のプライム能がある。このDNA合成反応は、融合されたRT酵素によって遂行される。gRNA鋳型は、編集が標的にするヌクレオチドを除いて、元のDNA二重鎖と相同のDNA配列をコードする。逆転写産物は、所望の編集をコードする単鎖DNAフラップである。遊離の3'末端を含有するこのフラップは、隣接するDNA鎖と平衡化でき、5'フラップ種がもたらされる。後者の種は、FEN1(フラップエンドヌクレアーゼ1)の効率的な基質として働くものと仮定されており、前記酵素は、ラギング鎖DNA合成の最中に岡崎フラグメントから5'フラップを天然に切除し、長いパッチ(long-patch)の塩基切除修復の最中に生じる鎖置き換え合成の後に5'フラップを除去する。ニックが入ったDNAのライゲーションは、ミスマッチした塩基対を産生する。この中間体は、ミスマッチ修復(MMR)プロセスを介して、元の塩基対への復元または所望される編集済塩基対への変換のいずれかを経ることができる。代替的に、半保存的DNA複製によって、復元と編集との各1コピーが生み出され得る。 Typical editorial designs are shown in Figures 1A-1B. Cas9 nickase contains an inactivating mutation (Spy Cas9 H840A or N863A) to the HNH nuclease domain that limits DNA cleavage to the PAM-containing strand (non-target strand). Modify the guide RNA (gRNA) to contain the template for reverse transcription (design detailed on slide 5). Although 5' extension of gRNA is shown, 3' extension can also be practiced. Cas9 nickase is fused with reverse transcriptase (RT) enzyme through either the C-terminus or the N-terminus. The gRNA:Cas9-RT complex targets the DNA region of interest and forms an R-loop after replacing the non-target strand. Cas9 nicks non-target DNA strands. Release of the nicked strand exposes a free 3'-OH end, which is capable of priming reverse transcription using the extended gRNA as a template. This DNA synthesis reaction is carried out by a fused RT enzyme. The gRNA template encodes a DNA sequence homologous to the original DNA duplex, except for the nucleotides targeted by the edit. The reverse transcription product is a single-stranded DNA flap encoding the desired edit. This flap, containing a free 3' end, can equilibrate with adjacent DNA strands, yielding the 5' flap species. The latter species is hypothesized to serve as an efficient substrate for FEN1 (flap endonuclease 1), which naturally excises the 5' flap from the Okazaki fragment during lagging strand DNA synthesis. The 5' flap is removed after strand displacement synthesis that occurs during long-patch base excision repair. Ligation of nicked DNA produces mismatched base pairs. This intermediate can undergo either restoration to the original base pair or conversion to the desired edited base pair via a mismatch repair (MMR) process. Alternatively, semi-conservative DNA replication can produce one restored and one edited copy.

1.変異誘発DNA鎖の、ガイドRNAを鋳型にした逆転写を確立する。
背景および論拠
提案されたゲノム編集ストラテジーにおいて、Cas9によってニックが入れられた非標的DNA鎖(Rループを形成するPAM含有鎖)は、DNA合成のためのプライマーとして作用する。これは生化学的データおよび構造のデータの数種の実例(pieces)に基づき起こり得るものと仮定される。ヌクレアーゼ保護実験32、結晶学的研究33、および塩基編集窓4,24は、Cas9結合複合体の所謂Rループ内の非標的鎖ヌクレオチド-20~-10について、柔軟性および障害のかなりの程度を実証した(ナンバリングは第1PAMヌクレオチドの5'からの距離を示す)。その上、相補的なssDNAが加えられたとき、切断された非標的鎖のPAM遠位部分は、緊密に結合した3元複合体から外され得る20。これらの研究によって、非標的鎖が高度に柔軟であって酵素へのアクセスが可能であること、およびニックが入った後にPAM遠位フラグメントの3'末端がCas9解離に先立ち放出されることが支持される。さらにまた、gRNAが、鋳型DNA合成まで伸長され得るものと仮定される。先行研究によって、SpCas9、SaCas9、およびLbCas12a(かつてはCpf1)のためのgRNAが、RNAアプタマー34、リガンド誘導性自己切断型リボザイム35、および長鎖ノンコーディングRNA36でのgRNA伸長を許容することが示された。生かされる2つの主要な特色に対し、この文献によって前例が確立される。このストラテジーの査定において、数種のCRISPR-Cas系を、in vitroでのアッセイと細胞アッセイとの組み合わせを使用し5'および3'伸長されたgRNAデザインと併せて評価する(図2A~2C)。
1. Establish guide RNA-templated reverse transcription of the mutagenic DNA strand.
Background and Rationale In the proposed genome editing strategy, the non-target DNA strand (PAM-containing strand forming an R-loop) nicked by Cas9 acts as a primer for DNA synthesis. It is hypothesized that this may occur based on several pieces of biochemical and structural data. Nuclease protection experiments, 32 crystallographic studies, 33 and base editing windows4,24 have revealed a significant degree of flexibility and disorder for non-target strand nucleotides -20 to -10 within the so-called R-loop of the Cas9 binding complex. demonstrated (numbering indicates distance from the 5' of the first PAM nucleotide). Moreover, when complementary ssDNA is added, the PAM distal portion of the cleaved non-target strand can be dislodged from the tightly bound ternary complex. These studies support that the non-target strand is highly flexible and accessible to the enzyme and that after nicking, the 3' end of the PAM distal fragment is released prior to Cas9 dissociation. be done. Furthermore, it is assumed that the gRNA can be extended until template DNA synthesis. Previous studies have shown that gRNAs for SpCas9, SaCas9 , and LbCas12a (formerly Cpf1) are permissive for gRNA elongation with RNA aptamers, 34 ligand-induced self-cleaving ribozymes, 35 and long noncoding RNAs. Shown. This literature establishes a precedent for two main features that are exploited. In assessing this strategy, several CRISPR-Cas systems are evaluated in conjunction with 5' and 3' extended gRNA designs using a combination of in vitro and cellular assays (Figures 2A-2C). .

TRT編集のための改変gRNAのためのデザインを図3A~3Bに示す。DNA合成は5'→3'に進み、よってRNA鋳型を3'→5'方向にコピーする。5'伸長のためのデザインは、リンカー領域、ニックが入ったDNA鎖がアニールするプライマー結合部位、および逆転写によるDNA合成のための鋳型を含有する。3'伸長されたgRNAは、プライマー結合部位および逆転写鋳型を含有する。in vitroでの実験によって、逆転写が、3'伸長されたgRNA構築物のgRNAコア中へ、~3ヌクレオチド伸長することが示されたところ、いくつかのケースにおいて、gRNAコアの3'RNAヘアピンをDNA標的配列とマッチするよう修飾する(ヘアピンRNA構造の維持を代償する変化がなされる限り、ヘアピン配列の修飾には十分耐性があるように見える)。DNA合成は、ヌクレオチドが成長するDNA鎖の3'OHへ付加されながら5'→3'に進む。 Designs for modified gRNAs for TRT editing are shown in Figures 3A-3B. DNA synthesis proceeds 5'→3', thus copying the RNA template in the 3'→5' direction. The design for 5' extension contains a linker region, a primer binding site to which the nicked DNA strand anneals, and a template for DNA synthesis by reverse transcription. The 3' extended gRNA contains a primer binding site and a reverse transcription template. In vitro experiments showed that reverse transcription extends ~3 nucleotides into the gRNA core of 3'-extended gRNA constructs, and in some cases the 3' RNA hairpin of the gRNA core Modify the DNA to match the target sequence (as long as changes are made that compensate for the maintenance of the hairpin RNA structure, modifications of the hairpin sequence appear to be well tolerated). DNA synthesis proceeds 5'→3' with nucleotides being added to the 3'OH of the growing DNA strand.

予備実験結果
Cas9によってニックが入れられたDNAは、gRNA鋳型の逆転写をプライムする。ニックが入れられた非標的DNA鎖へのアクセス可能性を評価するため、in vitroでの生化学的アッセイを、S.pyogenes(SpCas9)からのCas9ヌクレアーゼおよびCy5蛍光標識二重鎖DNA基質(51塩基対)を使用して実施した。第1に、合成鋳型の長さが変動する一連の5'伸長含有gRNAを、in vitroでの転写によって調製した(全体的なデザインは図2Bに示される)。ヌクレアーゼ不活性型Cas9(dCas9)を用いた電気泳動移動度シフトアッセイ(EMSA)によって、5'伸長されたgRNAが標的への結合親和性を維持することが確立された(データは示さず)。次に、TPRT活性を、dCas9、5'伸長されたgRNA、およびモロニー-マウス白血病ウイルス(M-MLV)逆転写酵素(Superscript III)を使用して、予めニックが入れられたCy5標識二重鎖DNA基質に対し試験した。37℃での1時間のインキュベーション後、産物を変性ポリアクリルアミドゲル電気泳動(PAGE)によって評価し、Cy5蛍光を使用して撮像した(図4A)。5'伸長されたgRNAバリアントは各々、有意な産物形成をもたらし、観察されたDNA産物サイズは伸長鋳型の長さと一致した(図4B)。重要なことに、dCas9の不在下で、予めニックが入れられた基質はDNA基質の全長51bpまで伸長されたが、これは相補的なDNA鎖(gRNAではない)が、dCas9が存在しないときにDNA合成のための鋳型として使用されたことを強く示唆する(図4C)。注目すべきは、新しく合成されたDNA鎖が、標的部位の編集に要求される産物(単一ヌクレオチドの変化と相同の鎖)を映し出す(mirrors)ように、系をデザインした。この結果は、Cas9:gRNA結合によってニックが入れられた非標的鎖の3'末が晒されること、および非標的鎖が逆転写へアクセス可能であることを確立する。
Preliminary experiment results
The Cas9-nicked DNA primes reverse transcription of the gRNA template. To assess the accessibility of nicked non-target DNA strands, in vitro biochemical assays were performed using Cas9 nuclease from S. pyogenes (SpCas9) and Cy5 fluorescently labeled double-stranded DNA substrate (51 Base pairs) were used. First, a series of 5' extension-containing gRNAs with varying synthetic template lengths were prepared by in vitro transcription (the overall design is shown in Figure 2B). Electrophoretic mobility shift assay (EMSA) using nuclease-inactive Cas9 (dCas9) established that 5'-extended gRNA maintains binding affinity to target (data not shown). TPRT activity was then determined using dCas9, 5'-extended gRNA, and Moloney-murine leukemia virus (M-MLV) reverse transcriptase (Superscript III) on a pre-nicked Cy5-labeled duplex. Tested against DNA substrate. After 1 h incubation at 37 °C, products were evaluated by denaturing polyacrylamide gel electrophoresis (PAGE) and imaged using Cy5 fluorescence (Figure 4A). Each 5'-extended gRNA variant resulted in significant product formation, and the observed DNA product size was consistent with the length of the extended template (Figure 4B). Importantly, in the absence of dCas9, the pre-nicked substrate was elongated to the full length of the DNA substrate, 51 bp, which is because the complementary DNA strand (not gRNA) Strongly suggests that it was used as a template for DNA synthesis (Figure 4C). Of note, the system was designed so that the newly synthesized DNA strand mirrors the product required for editing the target site (a strand homologous to a single nucleotide change). This result establishes that Cas9:gRNA binding exposes the 3' end of the nicked non-target strand and that the non-target strand is accessible to reverse transcription.

次に、ニックが入れられていないdsDNA基質を、非標的DNA鎖へニックを入れるCas9(H840A)突然変異体を使用して評価した。第1に、5'伸長されたgRNAを用いてCas9(H840A)ニッカーゼ活性を試験するため、in vitroでの切断アッセイを、これまでに記載されたとおりに実施した37。ニックを入れることは、標準のgRNAと比較すると損なわれていたが、相当の切断産物が形成されていた(図4D)。重要なことに、TPRT反応を5'伸長されたgRNAおよびCas9(H840A)で遂行したとき、より低い収率(ニックを入れる活性の減少によって説明可能)ではあるがRT産物もまた観察された(図4D)。この結果によって、5'伸長されたgRNA:Cas9(H840A)複合体がDNAへニックを入れ、逆転写の鋳型となり得ることが確立される。 The unnicked dsDNA substrate was then evaluated using the Cas9(H840A) mutant, which nicks the non-target DNA strand. First, to test Cas9(H840A) nickase activity using 5′-extended gRNA, in vitro cleavage assays were performed as previously described 37 . Although nicking was impaired compared to standard gRNA, substantial cleavage products were formed (Figure 4D). Importantly, when the TPRT reaction was carried out with 5′-extended gRNA and Cas9(H840A), RT products were also observed, albeit at a lower yield (which can be explained by the decreased nicking activity). Figure 4D). This result establishes that the 5'-extended gRNA:Cas9(H840A) complex can nick DNA and serve as a template for reverse transcription.

最終的に、3'gRNA伸長を、Cas9(H840A)のニック入れおよびTPRTについて評価した。5'伸長されたgRNAと比較すると、3'伸長されたgRNAによるDNA切断は、標準のgRNAと比較していずれも検出可能な程度までには損なわれていなかった。有意に、3'伸長されたgRNA鋳型もまた、M-MLV RTがtransで供給されたとき、予めニックが入れられた二重鎖DNA基質と無傷の二重鎖DNA基質との両方で効率的な逆転写を支持した(図4E)。驚くべきことに、3'伸長された鋳型について単一産物のみが観察されたが、これは逆転写がgRNA骨格に沿った特定の場所にて終止することを示す。末端トランスフェラーゼでの産物のホモポリマーテール化(Homopolymer tailing)、これに続くクレノウ伸長およびサンガー配列決定によって、全gRNA合成鋳型がgRNAコアの末端3ヌクレオチドが付加されてコピーされたことが明らかにされた。今後、フラップ末端は、末端gRNA配列を修飾することによって再プログラムされるであろう38,39。この結果は、3'伸長されたgRNAが、効率的なヌクレアーゼ標的化ガイドとして働き、逆転写の鋳型となり得ることを実証する。 Finally, 3'gRNA extension was evaluated for Cas9(H840A) nicking and TPRT. When compared to 5'-extended gRNA, DNA cleavage by 3'-extended gRNA was not detectably impaired in any case compared to standard gRNA. Significantly, 3'-extended gRNA templates were also efficient on both pre-nicked and intact duplex DNA substrates when M-MLV RT was supplied in trans. reverse transcription was supported (Figure 4E). Surprisingly, only a single product was observed for the 3' extended template, indicating that reverse transcription terminates at a specific location along the gRNA backbone. Homopolymer tailing of the product with terminal transferase, followed by Klenow extension and Sanger sequencing revealed that the entire gRNA synthesis template was copied with the addition of the terminal three nucleotides of the gRNA core. . In the future, flap ends will be reprogrammed by modifying the terminal gRNA sequences38,39 . This result demonstrates that 3'-extended gRNA can serve as an efficient nuclease targeting guide and serve as a template for reverse transcription.

Cas9-TPRTは、ニックが入ったDNAおよびgRNAをcisで使用する。二色実験を、RT反応が優先的にgRNAとともにcisで(同じ複合体中に結合されている)生じるかを決定するのに使用した(図8を参照)。2つ別々の実験を、5'伸長されたgRNAおよび3'伸長されたgRNAについて行った。所定の実験について、dCas9、gRNA、およびDNA基質の3元複合体を別々の管中に形成させた。一方の管中、gRNAは長いRT産物をコードし、DNA基質はCy3(赤色)で標識されている;他方の管中、gRNAは短いRT産物をコードし、DNA基質はCy5(青色)で標識されている。短いインキュベーションの後、複合体を混合し、次いでRT酵素およびdNTPsで処置する。産物を尿素-変性PAGEによって分離し、Cy3およびCy5チャネルの蛍光によって視覚化した。反応産物は、予めDNA基質と複合体化されたgRNA鋳型を使用して優先的に形成されることが見出されたが、これはRT反応がcisで生じ得る可能性があることを示す。この結果は、単一のCas9:gRNA複合体がDNA部位を標的にし、変異誘発DNA鎖の逆転写の鋳型になり得ることを支持する。 Cas9-TPRT uses nicked DNA and gRNA in cis. Two-color experiments were used to determine whether the RT reaction preferentially occurs in cis (bound in the same complex) with gRNA (see Figure 8). Two separate experiments were performed with 5' extended gRNA and 3' extended gRNA. For a given experiment, ternary complexes of dCas9, gRNA, and DNA substrate were formed in separate tubes. In one tube, the gRNA encodes a long RT product and the DNA substrate is labeled with Cy3 (red); in the other tube, the gRNA encodes a short RT product and the DNA substrate is labeled with Cy5 (blue) has been done. After a short incubation, the complexes are mixed and then treated with RT enzyme and dNTPs. Products were separated by urea-denaturing PAGE and visualized by fluorescence in Cy3 and Cy5 channels. Reaction products were found to be preferentially formed using gRNA templates previously complexed with DNA substrates, indicating that the RT reaction may occur in cis. This result supports that a single Cas9:gRNA complex can target a DNA site and serve as a template for reverse transcription of the mutagenized DNA strand.

TPRTを他のCas系で試験する
先のセクションにおいて提示されたものと同様の実験を、S.aureusからのCas9およびL.bacteriumからCas12aを包含する他のCas系を使用して、遂行する(図2A~2Cを参照)。TRPTもまた、これらのCasバリアントについて実証され得る場合、潜在的な編集範囲および細胞において全般的に成功する可能性が増大するであろう。
Testing TPRT with other Cas systems Experiments similar to those presented in the previous section are performed using other Cas systems, including Cas9 from S. aureus and Cas12a from L. bacterium ( (see Figures 2A-2C). If TRPT could also be demonstrated for these Cas variants, the potential editing scope and overall chances of success in cells would increase.

TPRTをRT-Cas9融合タンパク質で試験する
第1に、商業的に入手可能または精製可能な一連のRT酵素をTPRT活性についてtransで評価する。M-MLVからの既に試験されたRTに加えて、トリ骨髄芽球症ウイルス(AMV)、Geobacillus stearothermophilusグループIIイントロン(GsI-IIC)41,42、およびEubacterium rectaleグループIIイントロン(Eu.re.I2)43,44からのRTを評価する。有意に、後者2つのRTは、それら天然の生物学的な文脈において、TPRTを実施する。関係のある場合、RNAse不活性化突然変異および他の潜在的に有益なRT酵素修飾も試験する。transで供給されたとき機能的RTが同定されたら、各々を融合タンパク質としてCas9バリアントに対し評価する。N末端融合配向とC末端融合配向との両方を、様々なリンカー長さおよび構造と併せて試験する。速度論的な時間経過実験を、TPRTがRT酵素をcisで使用して生じ得るか決定するのに使用する。効率的なTPRT化学を可能にするRT-Cas9融合構造体が構築され得る場合、これは、細胞という文脈における機能的編集の可能性を大いに増大するであろう。
Testing TPRT with RT-Cas9 fusion proteins First, a series of commercially available or purified RT enzymes are evaluated in trans for TPRT activity. In addition to the already tested RTs from M-MLV, avian myeloblastosis virus (AMV), Geobacillus stearothermophilus group II intron (GsI-IIC) 41,42 and Eubacterium rectale group II intron (Eu.re.I2 ) Rate RT from 43,44 . Significantly, the latter two RTs perform TPRT in their natural biological context. Where relevant, RNAse inactivating mutations and other potentially beneficial RT enzyme modifications will also be tested. Once functional RTs are identified when delivered in trans, each is evaluated as a fusion protein against the Cas9 variant. Both N-terminal and C-terminal fusion orientations are tested along with various linker lengths and structures. Kinetic time course experiments are used to determine whether TPRT can occur using the RT enzyme in cis. If RT-Cas9 fusion constructs could be constructed that allow efficient TPRT chemistry, this would greatly increase the potential for functional editing in a cellular context.

細胞中の改変gRNAでのCas9標的化
先の副目的(sub-aims)において開発された改変gRNA候補を、Cas9標的化効率を確認するため、ヒト細胞培養実験(HEK293)において評価する。野生型SpCas9を採用する、確立されたインデル形成アッセイ45を使用して、改変gRNAを、ヒトゲノム中5部位またはそれ以上の部位にわたり、標準のgRNAと並べて(side-by-side)比較する。ゲノム編集効率を、実験室に収納されているIllumina MiSeqプラットホームを使用する多重アンプリコン配列決定によって特徴付ける。本セクションおよび先行するセクションからの結果から、これに続くデザイン-組み立て-試験サイクルの反復(iterations)という情報を与える洞察力が生み出されることが予想されるが、ここでgRNAは細胞中、逆転写の鋳型化と効率的なCas9標的化との両方に最適化され得る。
Cas9 targeting with modified gRNA in cells The modified gRNA candidates developed in the previous sub-aims are evaluated in human cell culture experiments (HEK293) to confirm Cas9 targeting efficiency. Modified gRNAs are compared side-by-side with standard gRNAs across five or more sites in the human genome using an established indel formation assay employing wild-type SpCas9. Genome editing efficiency is characterized by multiplex amplicon sequencing using the Illumina MiSeq platform housed in the laboratory. It is anticipated that the results from this and preceding sections will generate insights that will inform subsequent iterations of the design-build-test cycle, in which gRNAs are reverse transcribed in cells. templating and efficient Cas9 targeting.

in vitroでの検証結果を図5~7に示す。In vitroでの実験は、ニックが入れられた非標的DNA鎖がDNA合成をプライムするのに柔軟かつ利用可能であること、およびgRNA伸長が逆転写のための鋳型として働き得ることを実証した(図5を参照)。この一連の実験は、編集鋳型の長さを変動させた(左側へ列挙)、5'伸長されたgRNA(図3A~3Bに示されるとおりにデザインされた)を使用した。蛍光標識(Cy5)DNA標的を基質として使用し、この一連の実験においてこれへ予めニックを入れた。これらの実験に使用されたCas9は触媒不活性型Cas9(dCas9)であり、そのためDNAは切れないが、依然として効率的に結合することはできる。モロニーマウス白血病ウイルス(M-MLV)に由来する商業的RTであるSuperscript IIIをtransで供給した。第1に、dCas9:gRNA複合体を精製された構成要素から構成させた。次いで、蛍光標識DNA基質をdNTPsおよびRT酵素と一緒に加えた。37Cでの1時間のインキュベーション後、反応産物を変性尿素-ポリアクリルアミドゲル電気泳動(PAGE)によって分析した。ゲル画像は、逆転写鋳型の長さと一致する長さまで元のDNA鎖が伸長したことを示す。注目すべきことに、dCas9の不在下で遂行された反応は、使用されたgRNAを問わず、51ヌクレオチド長のDNA産物を産生した。この産物は、DNA合成のための鋳型として相補的なDNA(RNAではない)鎖の使用に対応する(データは示さず)。よって、Cas9結合は、DNA合成をRNA鋳型へ向けるのに要される。この一連のin vitroでの実験は、DNA基質へ予めニックが入れられておらず、かつCas9ニッカーゼ(SpyCas9 H840A 突然変異体)を使用する以外は、図5に示されるものと厳密に類似する(closely parallels)。ゲルに示されるとおり、ニッカーゼは、標準のgRNAを使用したときDNA鎖を効率的に切断する(gRNA_0、レーン3)。複数の切断産物が観察されるが、SpyCas9の先行する生化学的研究と一致する。5'伸長はニックを入れる活性(レーン4~8)を損なうが、あるRT産物は依然として観察される。図7は、3'伸長がDNA合成を支持し、Cas9ニッカーゼ活性を有意には生じさせないことを示す。予めニックが入れられた基質(黒色矢印)は、dCas9またはCas9ニッカーゼのいずれかを使用したとき、ほぼ定量的にRT産物へ変換される(レーン4および5)。RT産物(赤色矢印)への50%超の変換が全基質で観察される(レーン3)。RT産物の長さおよび配列を決定するため、産物バンドをゲルから切除し、抽出して配列決定した。これはRTがgRNAコアの3'末端ヘアピン中へ3ヌクレオチド伸長したことを明らかにした。これに続く実験(示されず)は、これらの3ヌクレオチドが、ヘアピンRNA構造を維持する相補的な変化がなされる限り、標的DNA配列とマッチするために変化され得ることを実証した。 The in vitro verification results are shown in Figures 5 to 7. In vitro experiments demonstrated that nicked non-target DNA strands are flexible and available to prime DNA synthesis and that gRNA extension can serve as a template for reverse transcription ( (see Figure 5). This series of experiments used 5' extended gRNAs (designed as shown in Figures 3A-3B) with varying lengths of editing templates (listed on the left). Fluorescently labeled (Cy5) DNA targets were used as substrates and were previously nicked in this series of experiments. The Cas9 used in these experiments is a catalytically inactive form of Cas9 (dCas9), so it cannot cut DNA but can still bind efficiently. Superscript III, a commercial RT derived from Moloney murine leukemia virus (M-MLV), was supplied in trans. First, the dCas9:gRNA complex was constructed from purified components. Fluorescently labeled DNA substrates were then added together with dNTPs and RT enzyme. After 1 hour incubation at 37C, reaction products were analyzed by denaturing urea-polyacrylamide gel electrophoresis (PAGE). The gel image shows that the original DNA strand has been extended to a length that matches the length of the reverse transcription template. Remarkably, reactions carried out in the absence of dCas9 produced DNA products 51 nucleotides long, regardless of the gRNA used. This product corresponds to the use of a complementary DNA (not RNA) strand as a template for DNA synthesis (data not shown). Thus, Cas9 binding is required to direct DNA synthesis to the RNA template. This series of in vitro experiments is exactly similar to that shown in Figure 5, except that the DNA substrate is not pre-nicked and a Cas9 nickase (SpyCas9 H840A mutant) is used ( closely parallels). As shown in the gel, nickase efficiently cleaves DNA strands when using standard gRNA (gRNA_0, lane 3). Multiple cleavage products are observed, consistent with previous biochemical studies of SpyCas9. Although 5' extension impairs nicking activity (lanes 4-8), some RT products are still observed. Figure 7 shows that 3' extension supports DNA synthesis and does not significantly generate Cas9 nickase activity. Pre-nicked substrates (black arrows) are almost quantitatively converted to RT products when using either dCas9 or Cas9 nickase (lanes 4 and 5). More than 50% conversion to RT product (red arrow) is observed for all substrates (lane 3). To determine the length and sequence of the RT product, the product band was excised from the gel, extracted and sequenced. This revealed that RT extended 3 nucleotides into the 3' terminal hairpin of the gRNA core. Subsequent experiments (not shown) demonstrated that these three nucleotides could be changed to match the target DNA sequence as long as complementary changes were made that maintained the hairpin RNA structure.

潜在的な困難および代替手段
(1)RTは、融合体としては機能しない:分子密集および/または好ましくない形状(geometries)は、Cas9融合RT酵素によるポリメラーゼ伸長を妨げ得る。第1に、リンカー最適化は試験できる。DNAプライマーとgRNAとRT酵素との間の空間的な関係性を再配向し得るCas9の循環置換バリアントを評価する。目的2に詳述したとおりの非共有結合のRT動員ストラテジーは試験できる。(2)伸長されたgRNAバリアントによって減少したCas標的化効率:これは、最も5'伸長されたgRNAの問題点になり得るものである。構造データ24に基づき、Cas9突然変異体をデザイン、スクリーニングし、gRNA伸長に対してより耐性があるバリアントを同定できる。加えて、gRNAライブラリは、標的化活性を改善するリンカーについて細胞中でスクリーニングできる。
Potential difficulties and alternatives
(1) RT does not function as a fusion: molecular crowding and/or unfavorable geometries can prevent polymerase extension by the Cas9 fusion RT enzyme. First, linker optimization can be tested. We evaluate circular substitution variants of Cas9 that can reorient the spatial relationship between DNA primers, gRNA, and RT enzymes. Non-covalent RT mobilization strategies as detailed in Aim 2 can be tested. (2) Reduced Cas targeting efficiency by extended gRNA variants: This can be a problem with most 5' extended gRNAs. Based on structural data24 , Cas9 mutants can be designed and screened to identify variants that are more resistant to gRNA elongation. Additionally, gRNA libraries can be screened in cells for linkers that improve targeting activity.

有意性
これらの予備実験結果は、Cas9ニッカーゼおよび伸長されたgRNAが、transで供給された逆転写酵素を使用して、結合したDNA標的上、標的にプライムされた逆転写を開始し得ることを確立する。重要なことに、Cas9結合は、産物形成にとって極めて重要であることが見出された。おそらく細胞中のゲノム編集にとって絶対的な要件ではないが、RT酵素機能をcisで組み込む系のさらなる開発は、細胞ベースの適用において成功する可能性を有意に増大させるであろう。この目的の残りの側面を達成すると、ヒトゲノムという文脈における高精度ゲノム編集を遂行するための分子基盤が提供されるであろう。
Significance These preliminary experimental results demonstrate that Cas9 nickase and elongated gRNA can initiate target-primed reverse transcription on bound DNA targets using reverse transcriptase supplied in trans. Establish. Importantly, Cas9 binding was found to be critical for product formation. Although probably not an absolute requirement for genome editing in cells, further development of systems that incorporate RT enzyme function in cis will significantly increase the likelihood of success in cell-based applications. Achieving the remaining aspects of this objective will provide the molecular basis for performing precision genome editing in the context of the human genome.

2.ヒト細胞中のプライム編集を確立する。
背景および論拠
提案のストラテジーにおいて、改変RT-Cas9:gRNA複合体は、変異誘発3'DNAフラップをゲノムの標的部位にて導入する。単一ミスマッチを含有する変異誘発3'フラップは、エネルギー的に利用しやすい隣接5'フラップ(これは優先的に除去される)との平衡を通して、DNA修復機構によって組み込まれるものと仮定する(図1C~1D)。DNA複製および修復機構は、岡崎フラグメントをプロセシングするとき46かつ長いパッチの塩基切除修復(LP-BER)の最中47、5'ssDNAフラップに遭遇する。5'フラップは、幅広く発現されるフラップエンドヌクレアーゼFEN1の好ましい基質であって、前記酵素は、ホモ三量体のスライド型(sliding)クランプ複合体PCNAによってDNA修復部位へ動員される48。PCNAはまた、他の修復因子(DNAリガーゼLig1を包含する)も同時に動員するための骨格としても働く49。PCNAは、「ツールベルト(toolbelt)」として作用すると、細胞分裂の最中ごとに生成される数百万の岡崎フラグメントをプロセシングするのに不可欠である連続フラップ切断およびライゲーションを加速させる50,51。これら天然のDNA中間体との類似点に基づき、変異誘発鎖は、5'フラップとの平衡、これに続く5'フラップ切除とライゲーションとの連携を通して組み込まれるものと仮定される。次いで、ミスマッチ修復(MMR)が、いずれかの鎖上に等しい確率で生じるはずであって、編集または復元へ繋がる(図1C~1D)。代替的に、DNA複製が最初に生じ、新しく合成された娘鎖中の編集の組み込みへ直接繋がり得る。このプロセスから期待される最も高い収率は50%ではあるが、複数の基質編集を試みることによって、編集修復の不可逆性に起因して完成へ向かう反応が推進され得る。
2. Establishing prime editing in human cells.
Background and Rationale In the proposed strategy, a modified RT-Cas9:gRNA complex introduces a mutagenic 3' DNA flap at a target site in the genome. We hypothesize that the mutagenic 3' flap containing a single mismatch is incorporated by the DNA repair machinery through equilibrium with the energetically more available adjacent 5' flap, which is preferentially removed (Fig. 1C-1D). The DNA replication and repair machinery encounters the 5'ssDNA flap when processing Okazaki fragments46 and during long patch base excision repair (LP-BER)47 . The 5' flap is a preferred substrate for the widely expressed flap endonuclease FEN1, which is recruited to DNA repair sites by the homotrimeric sliding clamp complex PCNA 48 . PCNA also serves as a scaffold for the simultaneous recruitment of other repair factors (including the DNA ligase Lig1). Acting as a "toolbelt", PCNA accelerates the sequential flap cleavage and ligation that is essential for processing the millions of Okazaki fragments generated during each cell division50,51. Based on these similarities to natural DNA intermediates, it is hypothesized that the mutagenic strand is incorporated through a combination of equilibration with the 5' flap, followed by 5' flap excision and ligation. Mismatch repair (MMR) should then occur with equal probability on either strand, leading to editing or restoration (Figures 1C-1D). Alternatively, DNA replication can occur first, leading directly to incorporation of the edit in the newly synthesized daughter strand. Although the highest yield expected from this process is 50%, multiple substrate editing attempts can drive the reaction toward completion due to the irreversibility of editing repair.

予備実験結果
DNAフラップは、酵母およびHEK細胞中のプラスミドモデル基質中に部位特異的変異誘発を包含する。提案の編集ストラテジーを試験するため、TPRT産物と似ている変異誘発3'フラップ含有モデルプラスミド基質で研究を始めた。GFPとmCherryとの間に停止コドンをコードする二重蛍光タンパク質レポーターを創出した。変異誘発フラップは停止コドンへの修正をコードしており(図9A)、mCherry合成を可能にさせる。よって、変異誘発効率はGFP:mCherry比率によって定量化できる。プラスミド基質をin vitroで調製し、酵母(S.cerevisiae)またはヒト細胞(HEK293)中へ導入した。高頻度変異誘発が両系ともに観察され(図9B)、単離された酵母コロニーは、元の状態の(reverted)塩基、突然変異塩基、または両産物の混合物のいずれかを含有していた(図9C)。後者の検出は、これらのケースにおいてプラスミド複製がMMRに先立ち生じたことを示唆し、さらに、フラップ切除およびライゲーションがMMRに先行することを示唆する。この結果は、3'変異誘発鎖を使用するDNA編集の実現性を確立する。
Preliminary experiment results
DNA flaps involve site-directed mutagenesis in plasmid model substrates in yeast and HEK cells. To test the proposed editing strategy, we began work with a model plasmid substrate containing a mutagenic 3' flap that resembles the TPRT product. We created a dual fluorescent protein reporter that encodes a stop codon between GFP and mCherry. The mutagenic flap encodes a modification to the stop codon (Figure 9A), allowing mCherry synthesis. Therefore, mutagenesis efficiency can be quantified by the GFP:mCherry ratio. Plasmid substrates were prepared in vitro and introduced into yeast (S. cerevisiae) or human cells (HEK293). Hypermutagenesis was observed in both systems (Figure 9B), with isolated yeast colonies containing either the reverted base, the mutant base, or a mixture of both products ( Figure 9C). The latter detection suggests that plasmid replication occurred prior to MMR in these cases, further suggesting that flap excision and ligation precede MMR. This result establishes the feasibility of DNA editing using the 3' mutagenic strand.

●モデルラップ基質での系統的な研究
上に記載の予備実験結果に基づき、効率的な編集の原理を推察するため、より広範囲のフラップ基質をHEK細胞において評価する。ミスマッチ対形成の影響、フラップに沿った変異誘発ヌクレオチドの場所、および末端ヌクレオチドの同一性を決定するため、3'ssDNAフラップを系統的に変動させる(図9D)。単一ヌクレオチドの挿入および欠失もまた試験する。編集高精度を分析するため、アンプリコン配列決定を使用する。これらの結果は、gRNA逆転写鋳型のデザイン情報を与えるのに役立つ。
●Systematic studies on model Wrap substrates Based on the preliminary experimental results described above, a broader range of flap substrates will be evaluated in HEK cells in order to infer the principles of efficient editing. Systematically vary the 3'ssDNA flap to determine the effects of mismatch pairing, the location of the mutagenic nucleotides along the flap, and the identity of the terminal nucleotides (Figure 9D). Single nucleotide insertions and deletions are also tested. Use amplicon sequencing to analyze the editing with high precision. These results help inform the design of gRNA reverse transcription templates.

プラスミド基質上のIn vitroでのTPRTは、効率的な編集成果へ繋がる。目的1において開発されたTPRT反応を、プラスミド基質内に変異誘発を導入するのに使用した。反応を環状DNAプラスミド基質上で遂行した(図10を参照)。これは、先のin vitroでの実験におけるRT伸長の機序としてDNA鎖が解離する可能性を除外する。これはまた、細胞中のフラップ基質のDNA修復も可能にさせる。二重蛍光レポータープラスミドを酵母(S.cerevisiae)発現のために構築した。このプラスミドは、停止コドン(TGA)を介在してGFP(緑色蛍光タンパク質)およびmCherry(赤色蛍光タンパク質)をコードする。この構築物の酵母中の発現は、GFPしか産生しない。プラスミドを、in vitroでのTRT[Cas9(H840A)ニッカーゼ、改変gRNA、MLV RT酵素、dNTPS]のための基質として使用した。gRNA伸長は、停止コドンに対する突然変異をコードする。フラップ鎖を停止コドンの修復のために使用すると、GFPとmCherryとの両方を発現するプラスミドを融合タンパク質として産生するものと予想される。酵母二重FPプラスミド形質転換体を図10に示す。親プラスミドまたはin vitroでCas9(H840A)がニックを入れたプラスミドを形質転換すると、緑色GFP発現コロニーのみがもたらされる。5'伸長されたgRNAまたは3'伸長されたgRNAでのTRT反応は、緑色コロニーと黄色コロニーとの混合を産生する。後者はGFPとmCherryとの両方を発現する。より多くの黄色コロニーが3'伸長されたgRNAで観察される。停止コドンを含有しない陽性対照も示す。 In vitro TPRT on plasmid substrates leads to efficient editing outcomes. The TPRT reaction developed in Aim 1 was used to introduce mutagenesis into the plasmid substrate. Reactions were carried out on circular DNA plasmid substrates (see Figure 10). This excludes the possibility of DNA strand dissociation as a mechanism for RT elongation in the previous in vitro experiments. This also allows DNA repair of the flap substrate in the cell. A dual fluorescent reporter plasmid was constructed for yeast (S. cerevisiae) expression. This plasmid encodes GFP (green fluorescent protein) and mCherry (red fluorescent protein) with an intervening stop codon (TGA). Expression of this construct in yeast produces only GFP. The plasmid was used as a substrate for TRT [Cas9(H840A) nickase, modified gRNA, MLV RT enzyme, dNTPS] in vitro. gRNA extension encodes a mutation to the stop codon. Using the flap strand for stop codon repair would be expected to produce a plasmid expressing both GFP and mCherry as a fusion protein. A yeast double FP plasmid transformant is shown in FIG. Transformation of the parental plasmid or the Cas9(H840A) nicked plasmid in vitro results in only green GFP-expressing colonies. TRT reactions with 5' extended gRNA or 3' extended gRNA produce a mixture of green and yellow colonies. The latter expresses both GFP and mCherry. More yellow colonies are observed with 3' extended gRNA. A positive control that does not contain a stop codon is also shown.

この結果は、長い二本鎖の基質がTPRTを経り得ること、およびTPRT産物が真核細胞中に編集を誘導することを確立する。 This result establishes that long double-stranded substrates can undergo TPRT and that TPRT products induce editing in eukaryotic cells.

上記のプライム編集実験と同様の別の実験も遂行したが、停止コドン中に点突然変異を組み入れる代わりに、TRT編集は、フレームシフト突然変異を修復しかつ下流mCherryの合成を可能にさせる単一ヌクレオチドの挿入(左)または欠失(右)を取り入れる(図11を参照)。両実験とも、3'伸長されたgRNAを使用した。TRT形質転換体からの個々のコロニーを選択し、サンガー配列決定によって分析した(図12を参照)。緑色コロニーは元のDNA配列をもつプラスミドを含有し、一方黄色コロニーは、TRT編集gRNAによってデザインされた正確な突然変異を含有していた。他の点突然変異もインデルも観察されなかった。 We also performed another experiment similar to the prime editing experiment described above, but instead of incorporating a point mutation in the stop codon, TRT editing repaired the frameshift mutation and enabled synthesis of downstream mCherry. Incorporate nucleotide insertions (left) or deletions (right) (see Figure 11). Both experiments used 3' extended gRNA. Individual colonies from TRT transformants were selected and analyzed by Sanger sequencing (see Figure 12). Green colonies contained the plasmid with the original DNA sequence, while yellow colonies contained the exact mutations designed by the TRT-edited gRNA. No other point mutations or indels were observed.

RT-Cas9構造体を使用するHEK細胞中のプライム編集を確立する
先の目的から最適化された構築物を、哺乳動物発現およびヒトゲノム中の標的部位での編集のために適合させる。複数のRT酵素および融合構造体を、2次gRNA(ニックが入れられるのを防止するためにトランケートされた)での隣接標的化に加えて、試験する。非共有結合のRT動員もまた、Sun-Tag系52およびMS2アプタマー系53を使用して評価する。インデル形成アッセイを、標準のgRNAおよびRT-Cas9融合体(上のとおり)での標的化効率を評価するのに使用する。次いで、各ゲノムの部位について、伸長されたgRNAとRT-Cas9との対を、単一ヌクレオチドの編集についてアッセイする。編集成果をMiSeqで評価する。
Establishing Prime Editing in HEK Cells Using the RT-Cas9 Construct The optimized construct from the previous purpose is adapted for mammalian expression and editing at targeted sites in the human genome. Multiple RT enzymes and fusion constructs are tested in addition to flanking targeting with a secondary gRNA (truncated to prevent nicking). Non-covalent RT recruitment is also assessed using the Sun-Tag system 52 and the MS2 aptamer system 53 . Indel formation assays are used to assess targeting efficiency with standard gRNA and RT-Cas9 fusions (as above). For each genomic site, the extended gRNA and RT-Cas9 pairs are then assayed for single nucleotide editing. Evaluate the editing results with MiSeq.

HEK細胞における最初の実験を、Cas9-RT融合体を使用して実施した。細胞内に発現される構成要素による編集には、Cas9(H840A)ニッカーゼ、逆転写酵素(融合体として発現されるか、またはtransで供給される)、および3'伸長をもつ改変gRNAを要する(図14を参照)。予備研究は、gRNA伸長内のプライマー結合部位の長さがヒト細胞中の編集の効率を増大させるのに重要であることを示した(図15を参照)。 Initial experiments in HEK cells were performed using the Cas9-RT fusion. Editing by intracellularly expressed components requires Cas9(H840A) nickase, reverse transcriptase (expressed as a fusion or supplied in trans), and a modified gRNA with a 3' extension ( (see Figure 14). Preliminary studies showed that the length of the primer binding site within the gRNA extension is important in increasing the efficiency of editing in human cells (see Figure 15).

HEK細胞中のプライム編集パラメータを最適化する
細胞中でプライム編集を実施できるCas9-RT構造体を同定した後、構成要素およびデザインを、高効率編集を達成するのに最適化する。コードされた点突然変異の場所およびヌクレオチド同一性、ならびに新しく合成されたDNA鎖の全長を、編集範囲および潜在的な欠点を評価するために変動させる。短い挿入および欠失の突然変異もまた評価する。タンパク質発現構築物をコドン最適化する。成功した場合、これは、哺乳動物細胞中の効率的なプライム編集を確立するであろう。
Optimizing Prime Editing Parameters in HEK Cells After identifying a Cas9-RT construct capable of performing prime editing in cells, the components and design are optimized to achieve high efficiency editing. The location and nucleotide identity of the encoded point mutations and the total length of the newly synthesized DNA strand are varied to assess the extent of editing and potential drawbacks. Short insertion and deletion mutations are also evaluated. Codon-optimize protein expression constructs. If successful, this will establish efficient prime editing in mammalian cells.

予備実験結果。
万一、融合RT酵素による分子内逆転写が起こり得なかったという場合には、追加のgRNAを、RT酵素が編集遺伝子座にてより高い局所濃度になるようデザインした。これらの補助ガイドを5'末にてトランケートするが(14~15ntスペーサー)、これによってCas9切断は防止されるが結合は保持されることがこれまでに示されている(図16を参照)。HEK3遺伝子座を、このストラテジーを探索するために選んだ。
Preliminary experimental results.
In the unlikely event that intramolecular reverse transcription by the fused RT enzyme could not occur, additional gRNAs were designed to provide a higher local concentration of the RT enzyme at the edited locus. These auxiliary guides are truncated at the 5' end (14-15 nt spacer), which has previously been shown to prevent Cas9 cleavage but preserve binding (see Figure 16). The HEK3 locus was chosen to explore this strategy.

潜在的な困難および代替手段
(1)細胞中のgRNA分解:伸長されたgRNA末端が細胞中でトランケートされた場合、安定化2次構造を組み入れるか、または安定化修飾をもつ合成gRNAを試験できる。(2)ヒト細胞中で編集が観察されない:RT-Cas9融合体の隣接ゲノム部位への2次標的化を包含する、追加のストラテジーを探索する54。加えて、E.coliまたはS.cerevisiae中の潜在的な指向進化ストラテジーも探索できる。
Potential difficulties and alternatives
(1) gRNA degradation in cells: If extended gRNA ends are truncated in cells, synthetic gRNAs that incorporate stabilizing secondary structures or have stabilizing modifications can be tested. (2) No editing observed in human cells: explore additional strategies, including secondary targeting of RT-Cas9 fusions to adjacent genomic sites . Additionally, potential directed evolution strategies in E. coli or S. cerevisiae can also be explored.

有意性
プライム編集を実験の細胞株中で確立できた場合、これは、ヒト遺伝子中の多数の点突然変異の迅速な生成および特徴付けを可能にすることによって、生物医学の基礎研究に直接の影響を有するであろう。塩基編集因子に関する方法の一般論、およびその直交する編集窓は、目下アクセス不能な多くの突然変異を取り入れるアプローチを提供する。その上、プライム編集を高い効率および産物純度に最適化できた場合、他のヒト細胞型中の疾患突然変異を修正することへのその潜在的な適用性は意義深い。
If significant prime editing could be established in experimental cell lines, this would have direct implications for basic biomedical research by allowing the rapid generation and characterization of large numbers of point mutations in human genes. will have an impact. The generalization of the method for base editors and their orthogonal editing windows provides an approach that incorporates many mutations that are currently inaccessible. Moreover, if prime editing can be optimized for high efficiency and product purity, its potential applicability to correcting disease mutations in other human cell types is significant.

3.培養ヒト細胞中の病原性の突然変異の部位特異的編集を達成する。3. Achieving site-specific editing of pathogenic mutations in cultured human cells.
背景および論拠。Background and rationale.

多数の病原性の突然変異は、PAMの制限に起因する最新の塩基編集因子によっては修正できない、すなわちトランスバージョンまたはインデル突然変異の修正が必要とされる。プライム編集で、すべてのトランジションおよびトランスバージョンは、挿入および欠失が小さい場合ではあるが、理論上起こり得る。その上、PAMとの関係において、プライム編集窓(-3~+4と予想される)は、塩基編集因子(-18~-12)とは違う(図13)。目下、塩基編集因子によって修正不能であるメンデル型疾病は、以下を包含する:(1)ヘモグロビンベータ中の鎌状赤血球病Glu6Val創始者突然変異(A・T→T・Aトランスバージョンを要する);(2)ATP7B中の最も一般的なウィルソン病バリアントHis1069Gln(G・C→T・Aトランスバージョンを要する);および(3)嚢胞性線維症を引き起こすCFTR中の△Phe508突然変異(3ヌクレオチド挿入を要する)。これらの標的の各々は、SpCas9標的化およびプライム編集にとって適切に位置付けられたPAMを含有する。
予備実験結果。
●HEK3細胞中のT→A編集は、最新の塩基編集では達成できないが、TRPT編集では達成できる(図17A~17Cを参照)。
Many pathogenic mutations cannot be corrected by modern base editing agents due to limitations of PAM, ie, correction of transversion or indel mutations is required. With prime editing, all transitions and transversions can theoretically occur, albeit with minor insertions and deletions. Moreover, in relation to PAM, the prime editing window (predicted from -3 to +4) is different from the base editing factor (-18 to -12) (Figure 13). Mendelian diseases that are currently uncorrectable by base editors include: (1) the sickle cell Glu6Val founder mutation in hemoglobin beta (requiring A.T→T.A transversion); (2) the most common Wilson disease variant His1069Gln in ATP7B (requiring G・C→T・A transversion); and (3) the △Phe508 mutation in CFTR (requiring a 3-nucleotide insertion) that causes cystic fibrosis. required). Each of these targets contains a PAM appropriately positioned for SpCas9 targeting and prime editing.
Preliminary experimental results.
• T→A editing in HEK3 cells cannot be achieved with modern base editing, but can be achieved with TRPT editing (see Figures 17A-17C).

図17Aは、ヒト胚性腎臓(HEK)細胞中の構成要素のトランスフェクション後の標的ヌクレオチドでの%T→A変換を表示するグラフを示す。このデータは、野生型MLV逆転写酵素のCas9(H840A)ニッカーゼ(32アミノ酸リンカー)とのN末端融合体を使用する結果を提示する。編集効率は、プライマー結合部位の長さが7ヌクレオチドから11または12ヌクレオチドまで伸長されたとき劇的に改善した。加えて、編集遺伝子座のちょうど上流に位置付けられる補助(auxiliary)ガイドAは(図16を参照)、具体的にはプライマー結合部位の長さがより短い場合に、編集活性を有意に改善する。編集効率を、MiSeqプラットホームを使用するアンプリコン配列決定によって定量化した。図17Bはまた、ヒト胚性腎臓(HEK)細胞中の構成要素のトランスフェクション後の標的ヌクレオチドでの%T→A変換も示すが、このデータは、RT酵素のC末端融合体を使用する結果を提示する。ここで、補助ガイドAはそれほどの(as much of)効果を有さず、編集効率全体はより高い。図17Cは、図17Aにおいて使用されたものと同様の野生型MLV逆転写酵素のCas9(H840A)ニッカーゼとのN末端融合体を使用する結果を提示するデータを示す;しかしながら、MLV RTとCas9との間のリンカーは、32アミノ酸の代わりに60アミノ酸長である。 Figure 17A shows a graph displaying the %T→A conversion at the target nucleotide following transfection of the components in human embryonic kidney (HEK) cells. This data presents the results of using an N-terminal fusion of wild-type MLV reverse transcriptase with Cas9(H840A) nickase (32 amino acid linker). Editing efficiency improved dramatically when the length of the primer binding site was extended from 7 to 11 or 12 nucleotides. In addition, an auxiliary guide A located just upstream of the editing locus (see Figure 16) significantly improves editing activity, particularly when the length of the primer binding site is shorter. Editing efficiency was quantified by amplicon sequencing using the MiSeq platform. Figure 17B also shows the %T→A conversion at the target nucleotide after transfection of the constructs in human embryonic kidney (HEK) cells; this data is the result of using a C-terminal fusion of the RT enzyme. present. Here, auxiliary guide A does not have as much of an effect, and the overall editing efficiency is higher. Figure 17C shows data presenting the results of using an N-terminal fusion of wild-type MLV reverse transcriptase with Cas9(H840A) nickase similar to that used in Figure 17A; however, MLV RT and Cas9 The linker between is 60 amino acids long instead of 32 amino acids.

●RPT編集結果によるHEK3部位でのT→A編集は高純度を表示する。
図18は、ハイスループットアンプリコン配列決定による配列決定分析の入力を示す。入力は、編集済細胞の最も豊富な遺伝子型を表示する。注目すべきことに、主要なインデル産物は得られず、所望の点突然変異(T→A)は、バイスタンダー編集をせずとも明確に取り入れられる。第1配列は参照遺伝子型を示す。上側2つの産物は、内生多型を含有する出発遺伝子型(GまたはA)である。下側2つの産物は、修正して編集された遺伝子型を表す。
●T→A editing at HEK3 site according to RPT editing results shows high purity.
Figure 18 shows input for sequencing analysis by high-throughput amplicon sequencing. The input displays the most abundant genotype of the edited cells. Remarkably, no major indel product is obtained and the desired point mutation (T→A) is clearly incorporated without bystander editing. The first sequence represents the reference genotype. The top two products are the starting genotype (G or A) containing the endogenous polymorphism. The bottom two products represent the corrected and edited genotypes.

●MLV RT突然変異体は編集を改善する。
Baranauskasら(doi:10.1093/protein/gzs034)に記載される突然変異逆転写酵素を、ヒト胚性腎臓(HEK)細胞中の標的ヌクレオチド編集について、Cas9(H840A)ニッカーゼとのC末端融合体として試験した。Cas9-RT編集因子プラスミドを、逆転写の鋳型となる3'プライム編集ガイドRNAをコードするプラスミドとともに共トランスフェクトした。図19において標的ヌクレオチドでの編集効率(青色バー)を、インデル率(オレンジ色バー)と並べて示す。WTは野生型MLV RT酵素を指す。突然変異酵素(M1~M4)は、右に列挙された突然変異を含有する。編集率をゲノムDNAアンプリコンのハイスループット配列決定によって定量化した。
●MLV RT mutants improve editing.
The mutant reverse transcriptase described in Baranauskas et al. (doi:10.1093/protein/gzs034) was tested as a C-terminal fusion with Cas9 (H840A) nickase for targeted nucleotide editing in human embryonic kidney (HEK) cells. did. The Cas9-RT editing factor plasmid was co-transfected with a plasmid encoding a 3' prime editing guide RNA that served as a template for reverse transcription. In Figure 19, the editing efficiency at the target nucleotide (blue bar) is shown alongside the indel rate (orange bar). WT refers to wild type MLV RT enzyme. The mutant enzymes (M1-M4) contain the mutations listed on the right. Editing rates were quantified by high-throughput sequencing of genomic DNA amplicons.

第2gRNAで相補鎖へニックを入れることは編集を改善する。
この実験は、単鎖ニックが、標的ヌクレオチドに近接する相補的なDNA鎖中に導入されたときの、標的ヌクレオチドの編集効率を評価する(これがミスマッチ修復へ指向して、元のヌクレオチドを優先的に除去しかつ塩基対を所望の編集へ変換するとの仮説から)。Cas9(H840A)-RT編集構築物を、2つのガイドRNA(その一方が逆転写反応の鋳型になり、他方が、ニックを入れるための相補的なDNA鎖を標的にする)をコードするプラスミドとともに共トランスフェクトした。標的ヌクレオチドから様々な距離にてニックを入れることを試験した(オレンジ色三角形)(図20を参照)。標的塩基対での編集効率(青色バー)を、インデル率(オレンジ色バー)と並べて示す。「なし」の例は、相補鎖へニックを入れるガイドRNAを含有しない。編集率をゲノムDNAアンプリコンのハイスループット配列決定によって定量化した。
Nicking the complementary strand with a second gRNA improves editing.
This experiment evaluates the editing efficiency of a target nucleotide when a single-stranded nick is introduced into the complementary DNA strand in close proximity to the target nucleotide, directing mismatch repair to preferentially replace the original nucleotide. ) and convert the base pairs to the desired edit). The Cas9(H840A)-RT editing construct was co-incorporated with a plasmid encoding two guide RNAs, one of which serves as the template for the reverse transcription reaction and the other that targets the complementary DNA strand for nicking. transfected. Nicking at various distances from the target nucleotide was tested (orange triangle) (see Figure 20). Editing efficiency at the target base pair (blue bar) is shown alongside the indel rate (orange bar). An example of "none" does not contain a guide RNA that nicks the complementary strand. Editing rates were quantified by high-throughput sequencing of genomic DNA amplicons.

図21は、所望のT→Aトランスバージョン突然変異と、他の主要ゲノム編集副産物が全体的に存在しないこととを示す、処理済ハイスループット配列決定データを示す。 Figure 21 shows processed high-throughput sequencing data demonstrating the desired T→A transversion mutation and the overall absence of other major genome editing byproducts.

範囲。
新しい編集技術のための潜在的な範囲を図13に示し、デアミナーゼ媒介の塩基編集因子技術と比較する。これまでに開発された塩基編集因子は、PAMの上流、~15±2bp領域を標的にする。標的CまたはAヌクレオチドを夫々、TまたはGへ変換することによって、これまでに開発された塩基編集因子は、すべてのトランジション突然変異(A:T→G:C変換)を可能にする。しかしながら、これまでに開発された塩基編集因子は、トランスバージョン突然変異(A→T、A→C、G→T、G→C、T→A、T→G、C→A、C→G)を取り入れることはできない。その上、編集窓に複数の標的ヌクレオチドがある場合、望ましくない追加の編集をもたらすことがある。
range.
The potential range for the new editing technology is shown in Figure 13 and compared to deaminase-mediated base editor technology. Base editing factors developed to date target an ~15±2 bp region upstream of PAM. By converting target C or A nucleotides to T or G, respectively, the base editors developed so far allow for all transition mutations (A:T→G:C conversions). However, the base editing factors developed so far are transversion mutations (A→T, A→C, G→T, G→C, T→A, T→G, C→A, C→G). cannot be incorporated. Moreover, multiple target nucleotides in the editing window may result in undesirable additional editing.

新しいプライム編集技術は理論上、いずれのヌクレオチドおよび塩基対の変換も、潜在的に小さい挿入および欠失の編集も取り入れられる。PAMに関し、プライム編集窓は、DNAへニックを入れる部位(PAMの3塩基上流)にて始まり、PAMの下流の、これまでのところ決定されていない位置にて終わる。注目すべきことに、この編集窓は、デアミナーゼ塩基編集因子とは違う。TPRT系は、DNAポリメラーゼ酵素を使用して編集を実施することから、一般性、高精度、および忠実度を包含するそれら利益のすべてを有する。 The new prime editing technology could theoretically incorporate any nucleotide and base pair changes, and potentially small insertion and deletion edits. For PAM, the prime editing window begins at the site of nicking the DNA (three bases upstream of PAM) and ends at a so far undetermined position downstream of PAM. Notably, this editing window is different from deaminase base editing factors. The TPRT system has all of its benefits, including generality, high precision, and fidelity, since it uses a DNA polymerase enzyme to perform the editing.

患者由来細胞株中の病原性の突然変異を修正する。
関係のある突然変異を内包する細胞株(鎌状赤血球病:CD34+造血幹細胞;ウィルソン病:培養線維芽細胞;嚢胞性線維症:培養気管支上皮)を、ATCC、Coriell Biobank、またはハーバード/ブロード連携共同研究所(collaborating Harvard/Broad affiliate laboratories)から得る。編集効率をハイスループット配列決定によって評価し、修正された遺伝子型の有効性を、表現型アッセイ(ヘモグロビンHPLC、ATP7B免疫染色、およびCFTR膜電位アッセイ)を使用して試験する。
Correcting pathogenic mutations in patient-derived cell lines.
Cell lines harboring relevant mutations (sickle cell disease: CD34+ hematopoietic stem cells; Wilson disease: cultured fibroblasts; cystic fibrosis: cultured bronchial epithelium) were collected from ATCC, Coriell Biobank, or the Harvard/Broad collaboration. Obtained from collaborating Harvard/Broad affiliate laboratories. Editing efficiency will be assessed by high-throughput sequencing and efficacy of the corrected genotypes will be tested using phenotypic assays (hemoglobin HPLC, ATP7B immunostaining, and CFTR membrane potential assay).

オフターゲット編集活性を特徴付けする。
潜在的なオフターゲット編集を、野生型Cas9と対になった標的gRNAを使用し、GUIDE-seq55およびCIRCLE-seq56などの確立された方法でスクリーニングする。潜在的なオフターゲットが同定された場合、これらの遺伝子座をTPRT編集済細胞から探り、真のオフターゲット編集事象を同定する。
Characterizing off-target editing activity.
Screen potential off-target edits with established methods such as GUIDE-seq 55 and CIRCLE-seq 56 using target gRNA paired with wild-type Cas9. If potential off-targets are identified, these loci are probed from TPRT-edited cells to identify true off-target editing events.

潜在的な困難および代替手段。
(1)低い編集効率:プライム編集因子(PE)は各標的について最適化を要することがある。このケースにおいて、gRNAライブラリは、特定の用途への最高機能バリアントを同定するのに試験できる。RT-Cas融合体の発現および核局在化は最適化できる。リポソームRNP送達を、オフターゲット編集を制限するのに使用できる。
Potential difficulties and alternatives.
(1) Low editing efficiency: Prime editing factors (PEs) may require optimization for each target. In this case, gRNA libraries can be tested to identify the best performing variants for a particular application. Expression and nuclear localization of RT-Cas fusions can be optimized. Liposomal RNP delivery can be used to limit off-target editing.

次の実験。
gRNAデザインの最適化は、プライマー結合部位の長さおよび編集鋳型の伸長のさらなる探査によって達成できる。範囲および一般性を試験することは、種々のヌクレオチド変換、小さい挿入および欠失、ならびに、PAMに関する種々の編集位置、およびヒトゲノム中の複数部位を包含する。RT構成要素の最適化は、MLV RT中の活性(Rnase Hの不活化、プライマー-鋳型結合親和性の増大、処理能力(processivity)の調整)を増強する突然変異、および新しいRT酵素(グループIIイントロンRT、他のレトロウイルスのRT)中の突然変異を探査することを包含する。
Next experiment.
Optimization of gRNA design can be achieved by further exploration of primer binding site length and editing template extension. Testing scope and generality includes various nucleotide conversions, small insertions and deletions, and various editing positions relative to the PAM and multiple sites in the human genome. Optimization of RT components includes exploring mutations that enhance activity in MLV RT (inactivation of Rnase H, increasing primer-template binding affinity, tuning processivity) and mutations in new RT enzymes (group II intron RT, RT of other retroviruses).

有意性。
無数の遺伝性障害は、個々の遺伝子中の単一ヌクレオチドの変化からもたらされる。ここに記載のゲノム編集技術を開発すること、およびこれを疾患に関係のある細胞型に適用することは、臨床へ移行するための基礎を確立するであろう。鎌状赤血球病などのいくつかの疾患について、単一の点突然変異は、その集団全体にわたって優性遺伝子型を表す。しかしながら、多くの他の遺伝性障害について、単一遺伝子内の種々の点突然変異の大きな不均一性は、患者集団(この各々は同様の疾患表現型を生じている)全体にわたって観察される。したがって、一般のゲノム編集方法は理論上かかる多数の突然変異を標的にできるところ、この技術はこれら患者および彼らの家族の多くへ莫大な潜在的利益を提供できる。これら適用のための原理の証明が細胞中で確立できた場合、疾患の動物モデルにおいて研究するための基盤を確立するであろう。
Significance.
Myriad genetic disorders result from single nucleotide changes in individual genes. Developing the genome editing technology described here and applying it to disease-relevant cell types will establish the basis for translation into the clinic. For some diseases, such as sickle cell disease, a single point mutation represents the dominant genotype throughout the population. However, for many other genetic disorders, large heterogeneity of different point mutations within a single gene is observed across patient populations, each of which produces a similar disease phenotype. Therefore, while common genome editing methods could theoretically target such large numbers of mutations, this technology could offer enormous potential benefits to many of these patients and their families. If proof of principle for these applications could be established in cells, it would establish the basis for studies in animal models of disease.

利点
高精度:所望の編集は、核酸配列にコード、指向される。一般性:理論上、トランスバージョン編集、ならびに小さい挿入または欠失を包含する、いずれの塩基対変換もなし得る。Cas9プロトスペーサー隣接モチーフ(PAM)配列に関する塩基編集因子とは違う編集窓がある。この方法は相同組み換え修復(HDR)の編集能の多くを獲得するが、HDRの主な欠点(ほとんどの細胞型において非効率であって、大抵、インデルなどの望ましくない過剰の副産物が付随する)がない。前記方法はまた、二本鎖DNA破壊(DSB)、極少数のインデル、転座、大きな欠失、p53活性化等々もない。
Advantages High precision: the desired edits are encoded and directed into the nucleic acid sequence. Generality: in theory, any base pair change can be made, including transversion edits as well as small insertions or deletions. There is a different editing window than base editors for the Cas9 protospacer adjacent motif (PAM) sequence. This method captures many of the editing capabilities of homology-directed repair (HDR), but without the major drawbacks of HDR (inefficiency in most cell types, often accompanied by excess unwanted by-products such as indels). The method also lacks double-stranded DNA breaks (DSBs), very few indels, translocations, large deletions, p53 activation, etc.

例2-エラーを起こしやすいプライム編集(PE)Example 2 – Error-prone Prime Editing (PE)

本明細書に記載のプライム編集(PE)システムは、ゲノム上に変異を組み入れるためにエラーを起こしやすい逆転写酵素酵素と併せてもまた用いられ得る。 The prime editing (PE) system described herein can also be used in conjunction with the error-prone reverse transcriptase enzyme to incorporate mutations onto the genome.

ある態様が図22に図示されている。これは、標的座位に対してエラーを起こしやすい逆転写酵素による標的化された変異導入を行うための例示のプロセスの模式図であり、伸長されたガイドRNAと複合体化した核酸プログラム型DNA結合タンパク質(napDNAbp)を用いている。このプロセスは標的化された変異導入のためのプライム編集のある態様と言われ得る。伸長されたガイドRNAは、ガイドRNAの3'もしくは5'端にまたはガイドRNAの分子内の位置付けに伸長を含む。ステップ(a)では、napDNAbp/gRNA複合体がDNA分子に接触し、gRNAがnapDNAbpをガイドして、変異導入されるべき標的座位に結合させる。ステップ(b)では、ニックが標的座位のDNAの鎖の1つに導入され(例えば、ヌクレアーゼまたは化学的薬剤による)、それによって利用可能な3'端を標的座位の鎖の1つに生出する。ある態様において、ニックは、Rループ鎖に対応するDNAの鎖、すなわちガイドRNA配列にハイブリダイズされない鎖上に生出される。ステップ(c)では、3'端DNA鎖が、逆転写をプライムするためにガイドRNAの伸長された部分と相互作用する。ある態様において、3'端DNA鎖は、ガイドRNAの伸長された部分の特定のRTプライム配列にハイブリダイズする。ステップ(d)では、エラーを起こしやすい逆転写酵素が導入され、これが、プライムされた部位の3'端からガイドRNAの3'端の方へDNAの変異導入された一本鎖を合成する。例示の変異がアステリスク「*」によって指示されている。これは所望の変異導入された領域を含む一本鎖DNAフラップを形成する。ステップ(e)では、napDNAbpおよびガイドRNAがリリースされる。ステップ(f)および(g)は一本鎖DNAフラップ(変異導入された領域を含む)の分解に関し、その結果、所望の変異導入された領域が標的座位に組み込まれるようになる。このプロセスは、ひとたび3'一本鎖DNAフラップが他の鎖上の相補的な配列に侵入およびハイブリダイズすると形成する対応する5'内生DNAフラップを除去することによって、所望の産物形成の方へ駆動され得る。プロセスは、図1Fにおいて例示されるとおり第2鎖ニッキングによってもまた産物形成の方へ駆動され得る。内生DNA修復および/または複製プロセス後に、変異導入された領域はDNA座位のDNAの両方の鎖上に組み込まれるようになる。 One embodiment is illustrated in FIG. 22. This is a schematic illustration of an exemplary process for error-prone reverse transcriptase-mediated targeted mutagenesis of a target locus, with nucleic acid-programmed DNA binding complexed with an elongated guide RNA. A protein (napDNAbp) is used. This process can be referred to as a form of prime editing for targeted mutagenesis. An extended guide RNA includes an extension at the 3' or 5' end of the guide RNA or at a position within the molecule of the guide RNA. In step (a), the napDNAbp/gRNA complex contacts the DNA molecule and the gRNA guides the napDNAbp to bind to the target locus to be mutated. In step (b), a nick is introduced (e.g., by a nuclease or chemical agent) into one of the strands of the DNA at the target locus, thereby creating an available 3' end on one of the strands at the target locus. . In certain embodiments, the nick is created on the strand of DNA that corresponds to the R-loop strand, ie, the strand that is not hybridized to the guide RNA sequence. In step (c), the 3' end DNA strand interacts with the extended portion of the guide RNA to prime reverse transcription. In certain embodiments, the 3' end DNA strand hybridizes to a specific RT prime sequence of the extended portion of the guide RNA. In step (d), an error-prone reverse transcriptase is introduced, which synthesizes a mutated single strand of DNA from the 3' end of the primed site toward the 3' end of the guide RNA. Exemplary mutations are indicated by an asterisk "*". This forms a single-stranded DNA flap containing the desired mutagenized region. In step (e) napDNAbp and guide RNA are released. Steps (f) and (g) involve disassembly of the single-stranded DNA flap (containing the mutagenized region) so that the desired mutagenized region becomes integrated at the target locus. This process directs desired product formation by removing the corresponding 5' endogenous DNA flap that forms once a 3' single-stranded DNA flap invades and hybridizes to complementary sequences on the other strand. can be driven to. The process can also be driven towards product formation by second strand nicking as illustrated in Figure IF. After endogenous DNA repair and/or replication processes, the mutagenized region becomes integrated on both strands of DNA at the DNA locus.

例3-PEによるトリヌクレオチド反復短縮
本明細書に記載のプライム編集システムまたはプライム編集(PE)システムは、トリヌクレオチド反復変異(または「トリプレット拡大疾患」)を短縮してハンチントン病および他のトリヌクレオチド反復障害などの疾病を処置するために用いられ得る。理論によって拘束されることなしに、トリプレット拡大はDNA複製またはDNA修復合成の間のスリップによって引き起こされる。タンデム反復は互いに同一の配列を有するので、2つのDNA鎖間の塩基対形成は配列上の複数の点において生起し得る。これはDNA複製またはDNA修復合成の間の「ループアウト」構造の形成に至り得る。これは繰り返し配列の繰り返しのコピーに至り得、反復数を伸長させる。ハイブリッドRNA:DNA中間体が関わる追加の機序が提案されている。プライム編集は、害をなす繰り返しのコドントリプレットの(or)1つ以上を欠失させること(deletion)によって、これらのトリプレット拡大領域を縮減または消去するために用いられ得る。この使用のある態様では、図23が、プライム編集によってトリヌクレオチド反復配列を短縮または縮減するためのPEgRNAデザインの模式図を提供する。
Example 3 - Trinucleotide Repeat Truncation by PE The prime editing system or prime editing (PE) system described herein can shorten trinucleotide repeat mutations (or "triplet expansion diseases") to treat Huntington's disease and other trinucleotide repeat mutations. It can be used to treat diseases such as repetitive disorders. Without being bound by theory, triplet expansion is caused by slippage during DNA replication or DNA repair synthesis. Because tandem repeats have identical sequences to each other, base pairing between the two DNA strands can occur at multiple points on the sequence. This can lead to the formation of "loop-out" structures during DNA replication or DNA repair synthesis. This can lead to repeated copies of repeating sequences, extending the number of repeats. Additional mechanisms involving hybrid RNA:DNA intermediates have been proposed. Prime editing can be used to reduce or eliminate these triplet expansion regions by deleting one or more of the offending repeat codon triplets. In some embodiments of this use, Figure 23 provides a schematic representation of PEgRNA design to shorten or reduce trinucleotide repeat sequences by prime editing.

それゆえに、プライム編集は、ハンチントン病、脆弱X症候群、およびフリードライヒ運動失調症を包含するいずれかのトリヌクレオチド反復障害を修正するために用いられる能力があり得る。 Therefore, prime editing may have the potential to be used to correct any trinucleotide repeat disorder, including Huntington's disease, Fragile X syndrome, and Friedreich's ataxia.

最も普通のトリヌクレオチド反復はCAGトリプレットを含有するが、GAAトリプレット(フリードライヒ運動失調症)およびCGGトリプレット(脆弱X症候群)もまた生起する。CAGトリプレットはグルタミン(Q)をコードし、それゆえに、CAG反復は有疾患タンパク質のコード領域においてはポリグルタミントラクトをもたらす。トリヌクレオチド反復障害のこの具体的なクラスは「ポリグルタミン(ポリQ)疾患」ともまた呼ばれる。他のトリヌクレオチド反復は遺伝子制御の変改を引き起こし得、「非ポリグルタミン疾患」と言われる。拡大の素因を受け継ぐことまたはすでに伸長した親のアレルを獲得することは、疾患を獲得する蓋然性を増大させる。トリヌクレオチド反復の病原性の拡大はプライム編集を用いて修正され得る。 The most common trinucleotide repeat contains the CAG triplet, but the GAA triplet (Friedreich's ataxia) and CGG triplet (Fragile X syndrome) also occur. The CAG triplet encodes glutamine (Q) and therefore the CAG repeats give rise to polyglutamine tracts in the coding regions of diseased proteins. This specific class of trinucleotide repeat disorders is also referred to as "polyglutamine (polyQ) diseases." Other trinucleotide repeats can cause alterations in gene regulation and are referred to as "non-polyglutamine diseases." Inheriting a predisposition to expansion or acquiring an allele from an already expanded parent increases the probability of acquiring the disease. Pathogenic expansion of trinucleotide repeats can be corrected using prime editing.

プライム編集は、カットされる部位へと標的化される充当されたPEgRNAを含むプライム編集因子によって、トリプレット反復領域の上流の領域へニックを入れることによって、トリプレット拡大領域を短縮するように実装され得る。それから、プライム編集因子は、健康な数のトリプレット反復(これは具体的な遺伝子および疾患に依存する)をコードする鋳型(すなわち、その編集鋳型)としてのPEgRNAに基づく新たなDNA鎖(ssDNAフラップ)を合成する。健康なトリプレット反復配列を含む新たに合成されたssDNA鎖は、また、反復の他端に隣接する配列にマッチする相同性の短いストレッチ(すなわち相同アーム)を包含するように合成される(赤色の鎖)。新たに合成された鎖の侵入、および新たに合成されたssDNAフラップによる内生DNAの爾後の置き換えは、短縮された反復アレルに至る。 Prime editing can be implemented to shorten the triplet expansion region by nicking the region upstream of the triplet repeat region with a prime editing agent containing a dedicated PEgRNA targeted to the site to be cut. . The prime editing factor then creates a new DNA strand (ssDNA flap) based on PEgRNA as a template (i.e., its editing template) encoding a healthy number of triplet repeats (this depends on the specific gene and disease). Synthesize. A newly synthesized ssDNA strand containing a healthy triplet repeat sequence is also synthesized to include a short stretch of homology (i.e. homology arm) that matches the sequence flanking the other end of the repeat (shown in red). chain). Invasion of the newly synthesized strand and subsequent replacement of the endogenous DNA by the newly synthesized ssDNA flap leads to a truncated repeat allele.

例4-PEによるペプチドタグ付け
本明細書に記載のプライム編集システム(すなわち、PEシステム)は、種々のペプチドタグをタンパク質コード遺伝子上に導入するためにもまた用いられ得る。かかるタグはHEXAヒスチジンタグ、FLAGタグ、V5タグ、GCN4タグ、HAタグ、Mycタグ、および他を包含し得る。このアプローチは、タンパク質蛍光標識、免疫沈降、イムノブロッティング、免疫組織化学、タンパク質動員、誘導可能なタンパク質デグロン、およびゲノムワイドスクリーニングなどの適用に有用であり得る。態様が図25および26に図示されている。
Example 4 - Peptide tagging with PE The prime editing system described herein (i.e., the PE system) can also be used to introduce various peptide tags onto protein-coding genes. Such tags can include HEXA histidine tags, FLAG tags, V5 tags, GCN4 tags, HA tags, Myc tags, and others. This approach can be useful for applications such as protein fluorescent labeling, immunoprecipitation, immunoblotting, immunohistochemistry, protein mobilization, inducible protein degrons, and genome-wide screening. An embodiment is illustrated in Figures 25 and 26.

図25は、内生ゲノム座位の遺伝子をペプチドタグ付けするためのgRNAデザインと、TPRTゲノム編集(すなわち、プライム編集)によるペプチドタグ付けとを示す模式図である。FlAsHおよびReAsHタグ付けシステムは2つのパーツを含む:(1)フルオロフォア-二ヒ素系プローブおよび(2)配列FLNCCPGCCMEP(配列番号1)によって例示されるテトラシステインモチーフを含有する遺伝子によってコードされるペプチドである。細胞内で発現されるときに、テトラシステインモチーフを含有するタンパク質はフルオロフォア-ヒ素プローブによって蛍光標識され得る(ref:J.Am.Chem.Soc.,2002,124(21),pp 6063-6076.DOI:10.1021/ja017687nを見よ)。「ソルタギング」システムは、標識されたペプチドプローブを好適なペプチド基質を含有するタンパク質に共有結合的にコンジュゲート化する細菌ソルターゼ酵素を使用する(ref:Nat.Chem.Biol.2007 Nov;3(11):707-8.DOI:10.1038/nchembio.2007.31を見よ)。FLAGタグ(DYKDDDDK(配列番号2))、V5タグ(GKPIPNPLLGLDST(配列番号3))、GCN4タグ(EELLSKNYHLENEVARLKK(配列番号4))、HAタグ(YPYDVPDYA(配列番号5))、およびMycタグ(EQKLISEEDL(配列番号6))はエピトープタグとしてイムノアッセイに普通に使用される。パイクランプはペンタフルオロ-芳香族基質によって標識され得るペプチド配列(FCPF)(配列番号622)をコードする(ref:Nat.Chem.2016 Feb;8(2):120-8.doi:10.1038/nchem.2413)。 FIG. 25 is a schematic diagram showing gRNA design for peptide tagging genes at endogenous genomic loci and peptide tagging by TPRT genome editing (ie, prime editing). The FlAsH and ReAsH tagging systems include two parts: (1) a fluorophore-biarsenic probe and (2) a peptide encoded by a gene containing a tetracysteine motif exemplified by the sequence FLNCCPGCCMEP (SEQ ID NO: 1). It is. When expressed intracellularly, proteins containing tetracysteine motifs can be fluorescently labeled by fluorophore-arsenic probes (ref: J.Am.Chem.Soc., 2002, 124(21), pp 6063-6076 .DOI:10.1021/ja017687n). The "Sortagging" system uses a bacterial sortase enzyme to covalently conjugate a labeled peptide probe to a protein containing a suitable peptide substrate (ref:Nat.Chem.Biol.2007 Nov;3(11 ):707-8.DOI:10.1038/nchembio.2007.31). FLAG tag (DYKDDDDK (SEQ ID NO: 2)), V5 tag (GKPIPNPLLGLDST (SEQ ID NO: 3)), GCN4 tag (EELLSKNYHLENEVARLKK (SEQ ID NO: 4)), HA tag (YPYDVPDYA (SEQ ID NO: 5)), and Myc tag (EQKLISEEDL( SEQ ID NO: 6)) is commonly used in immunoassays as an epitope tag. Pyclamp encodes a peptide sequence (FCPF) (SEQ ID NO: 622) that can be labeled with pentafluoro-aromatic substrates (ref:Nat.Chem.2016 Feb;8(2):120-8.doi:10.1038/nchem .2413).

図26は、ゲノムDNA上へのHis6タグおよびFLAGタグの精密な組み入れを示す。18nt Hisタグ挿入または24nt FLAGタグ挿入どちらかをコードする逆転写鋳型を有するHEK3座位を標的化するガイドRNAをデザインした。トランスフェクションされたHEK細胞の編集効率をアンプリコン配列決定を用いて評価した。FLAGタグの完全な24nt配列はビューフレーム外であるということに注意せよ(配列決定は完全なかつ精密な挿入を確認した)。 Figure 26 shows the precise incorporation of His6 and FLAG tags onto genomic DNA. Guide RNAs were designed to target the HEK3 locus with reverse transcription templates encoding either an 18nt His tag insertion or a 24nt FLAG tag insertion. Editing efficiency in transfected HEK cells was assessed using amplicon sequencing. Note that the complete 24nt sequence of the FLAG tag is out of the view frame (sequencing confirmed complete and precise insertion).

例5-PEによるプリオン病の防止または処置Example 5 – Prevention or treatment of prion disease with PE

本発明はヒト、家畜、および野生生物のプリオン病の問題に対処することを助け得る。先に記載されている編集戦略は、防護性変異を組み入れまたはPRNPを確かにノックダウンするために十分に効率的かつクリーンではない。Cas9ヌクレアーゼおよびHDRは用いられ得るが、ほぼPRNPインデルバリアントの混合物を生成するであろう。これらのいくつかは病原性であると考えられる。その上、HDRは細胞のほとんどの型においては働かない。プライム編集は、余分な二本鎖DNA切断またはもたらされるインデルを生成することなしに、変異の両方の型を組み入れることにおいて確かでかつ効率的である。 The present invention can help address the problem of prion diseases in humans, livestock, and wildlife. The previously described editing strategies are not efficient and clean enough to incorporate protective mutations or reliably knock down PRNP. Cas9 nuclease and HDR can be used, but will mostly generate a mixture of PRNP indel variants. Some of these are considered pathogenic. Furthermore, HDR does not work in most cell types. Prime editing is robust and efficient in incorporating both types of mutations without generating extra double-stranded DNA breaks or resulting indels.

本発明は、どのようにしてプリオン病を防止またはその進行を停止させるPRNPの防護性変異を組み入れるのかを記載する。この部位は哺乳動物において保存され、そのため、ヒト疾患を処置することに加えて、それはプリオン病に対して免疫がある牛および羊を生成するかまたはさらにはプリオン病を患う動物の野生集団を治癒させることを助けるためにもまた用いられ得る。プライム編集はヒト細胞における天然に存在する防護性アレルの~25%の組み入れを達成するためにすでに用いられており、先のマウス実験は、このレベルの組み入れがほとんどのプリオン病に対する免疫を引き起こすために十分であるということを指示している。この方法は、かかる高い効率でほとんどの細胞型においてこのアレルを組み入れるための第1のかつ可能性としては唯一の現行のやり方である。処置のための別の可能な戦略は、プライム編集を用いて、早期停止コドンを遺伝子に組み入れることによってPRNPの発現を縮減または消去することである。多くの研究者がそうすることは疾患を処置するであろうということを予測している。 The present invention describes how to incorporate protective mutations in PRNP that prevent or halt the progression of prion diseases. This site is conserved in mammals, so in addition to treating human disease, it could produce cows and sheep immune to prion diseases or even cure wild populations of animals suffering from prion diseases. It can also be used to help make things happen. Prime editing has already been used to achieve ~25% incorporation of naturally occurring protective alleles in human cells, and previous mouse experiments have shown that this level of incorporation induces immunity against most prion diseases. It indicates that it is sufficient. This method is the first and possibly the only current way to incorporate this allele in most cell types with such high efficiency. Another possible strategy for treatment is to use prime editing to reduce or eliminate expression of PRNP by incorporating a premature stop codon into the gene. Many researchers predict that doing so will treat the disease.

3つの可能性ある治療学的戦略は、PrPの発現を縮減するためのプライム編集を包含する。このゴールは、未成熟停止コドンをPRNPに引き起こすか、スタートコドンを消去するか、必須アミノ酸コドンを変異もしくは欠失させるか、異状な転写物を生成するためのスプライス部位を導入もしくは除去するか、または転写物レベルを縮減する制御エレメントを変改する変異の導入によって達成され得る。疾患変異を消去するためのプライム編集。疾患に罹患する増大した蓋然性に至るPRNPの多くのバリアントが記載されている(ncbi.nlm.nih.gov/pmc/articles/PMC6097508/#b154-ndt-14-2067)。プライム編集は全ての可能な型の点変異、局所的挿入、および局所的欠失をなし得るので、各公知のバリアントはプライム編集を用いて逆転させられ得る。プリオン形成および/または伝達を遮断する1つ以上の防護性変異をPRNPに導入するためのプライム編集。例えば、ヒトPRNP遺伝子のG127Vは、プリオン病の多くの形態から防護することが実証されている(ncbi.nlm.nih.gov/pmc/articles/PMC4486072/)。後に、この変異は安定なベータシートおよび二量体の形成を防止することによってプリオン形成に干渉することが記載された(ncbi.nlm.nih.gov/pubmed/30181558、ncbi.nlm.nih.gov/pubmed/26906032)。1ヌクレオチド多型の導入に加えて、プリオン形成に干渉するであろうPRNP上の配列の挿入または欠失もまた、プリオン病から防護またはそれを処置するために用いられ得る。 Three potential therapeutic strategies include prime editing to reduce PrP expression. The goal may be to cause a premature stop codon in PRNP, eliminate a start codon, mutate or delete an essential amino acid codon, introduce or remove a splice site to generate an aberrant transcript, or or may be accomplished by introducing mutations that alter regulatory elements to reduce transcript levels. Prime editing to eliminate disease mutations. A number of variants of PRNP have been described that lead to an increased likelihood of contracting the disease (ncbi.nlm.nih.gov/pmc/articles/PMC6097508/#b154-ndt-14-2067). Since prime editing can make all possible types of point mutations, local insertions, and local deletions, each known variant can be reversed using prime editing. Prime editing to introduce one or more protective mutations into PRNP that block prion formation and/or transmission. For example, the human PRNP gene G127V has been demonstrated to protect against many forms of prion disease (ncbi.nlm.nih.gov/pmc/articles/PMC4486072/). This mutation was later described to interfere with prion formation by preventing the formation of stable beta sheets and dimers (ncbi.nlm.nih.gov/pubmed/30181558, ncbi.nlm.nih.gov /pubmed/26906032). In addition to introducing single nucleotide polymorphisms, insertions or deletions of sequences on PRNP that would interfere with prion formation can also be used to protect against or treat prion diseases.

防護性のバリアントの導入は相対的に小さい数の細胞が編集を経験するときでさえも利益を付与し得るので、第3の治療学的戦略は特に有利である。さらにその上、防護性のバリアント、特にG127Vなどのヒト集団に天然に存在するものの導入は、いずれかの不利益な帰結を有することは予想されないであろうが、PRNPノックアウトマウスにおいて立証されているとおり、戦略1のようにプリオンタンパク質の発現を縮減することはいくつかの不利益な表現型を有し得る(ncbi.nlm.nih.gov/pmc/articles/PMC4601510/、ncbi.nlm.nih.gov/pmc/articles/PMC2634447/)。 The third therapeutic strategy is particularly advantageous because the introduction of a protective variant can confer benefit even when a relatively small number of cells undergo editing. Furthermore, the introduction of protective variants, particularly those naturally present in the human population such as G127V, would not be expected to have any adverse consequences, as has been demonstrated in PRNP knockout mice. As per strategy 1, reducing prion protein expression may have some disadvantageous phenotypes (ncbi.nlm.nih.gov/pmc/articles/PMC4601510/, ncbi.nlm.nih. gov/pmc/articles/PMC2634447/).

およそ2:1の比の野生型ヒトプリオンタンパク質:ヒトプリオンタンパク質の防護性G127Vバリアント(防護性のバリアントのおよそ33%発現)を発現するマウスは、プリオン病のほとんどの試験された形態に対して全く免疫があり、牛海綿状脳症(BSEまたは狂牛病)から伝達されるヒト疾患の変異型クロイツフェルト・ヤコブ病(vCJD)に対してもまた耐性であったということが先に実証されている91。防護性のG127Vバリアントのみを発現するマウスは、vCJDを包含する全ての試験されたプリオン病課題に対して全く免疫があった。 Mice expressing an approximately 2:1 ratio of the protective G127V variant of human prion protein (approximately 33% expression of the protective variant) wild-type human prion protein: It was previously demonstrated that they were completely immune and also resistant to variant Creutzfeldt-Jakob disease (vCJD), a human disease transmitted from bovine spongiform encephalopathy (BSE or mad cow disease). There are 91 . Mice expressing only the protective G127V variant were completely immune to all prion disease challenges tested, including vCJD.

防護性のG127V変異はプライム編集を用いて組織培養においてヒト細胞に効率的に組み入れられ得るということが本願において実証される(図27を見よ)。 It is demonstrated herein that the protective G127V mutation can be efficiently incorporated into human cells in tissue culture using prime editing (see Figure 27).

これらの結果によって情報提供され、PRNP編集が用いられ得る3つの設定が記載される。1つの設定のPRNP編集は、プリオン病を防止または処置するためのヒト患者におけるプライム編集に用いられ得る。第2の設定のPRNP編集は、プリオン病の生起および広がりを防止するための家畜におけるプライム編集に(is)用いられ得る。牛および羊両方の家畜は、PRNP遺伝子によって生成されるタンパク質によって引き起こされるプリオン病の特発性の生起を経験している。動物が患う衰弱性のかつ致命的な疾患に加えて、これらのケースは経済的にもまた破壊的である。部分的には、極めて感染性の疾患の広がりを防止するために取られなければならないケアを原因とする。ワシントン州の単一の乳牛が2003年の12月にBSEについて検査陽性となり、これは次の年の牛肉売上の28-42億ドルという推測される損失に至った(bookstore.ksre.ksu.edu/pubs/MF2678.pdf)。PRNP遺伝子は哺乳動物において高度に保存されている。G127VなどのPRNP変異を家畜生殖細胞系列に導入することは、BSEまたは羊におけるプリオン病の現れのスクレイピーの生起を消去し得る。第3の設定のPRNP編集は野生生物のプライム編集に(is)用いられ得、野生のプリオン病の広がりを防止し得る。現行では、北米の鹿、ヘラジカ、およびムースを包含するシカ科集団が、これらの種においてPNRPによって引き起こされるプリオン病の現れの慢性消耗病(CWD)を患う。生起はいくつかの集団においては25%ほども高いことが報告されている(cdc.gov/prions/cwd/occurrence.html)。CWDはノルウェー、フィンランド、および韓国においてもまた報告されている。疾患がこれらの種からヒト(cdc.gov/prions/cwd/transmission.html)または家畜へと伝達性であるかどうかはまだ未知である。これらの種の生殖細胞系列におけるG127VなどのPRNP変異の導入は、それらをCWDから防護し得、ヒトを包含する他の種への伝達のリスクを縮減し得る。 Informed by these results, three settings in which PRNP editing can be used are described. PRNP editing in one setting can be used for prime editing in human patients to prevent or treat prion diseases. PRNP editing in the second setting can be used for prime editing in livestock to prevent the initiation and spread of prion diseases. Livestock, both cattle and sheep, have experienced idiopathic outbreaks of prion disease caused by the protein produced by the PRNP gene. In addition to the debilitating and fatal diseases that animals suffer from, these cases are also economically devastating. In part, this is due to the care that must be taken to prevent the spread of the highly infectious disease. A single dairy cow in Washington state tested positive for BSE in December of 2003, leading to an estimated loss of $2.8-4.2 billion in beef sales the following year (bookstore.ksre.ksu.edu /pubs/MF2678.pdf). The PRNP gene is highly conserved in mammals. Introducing a PRNP mutation such as G127V into the livestock germline can eliminate the occurrence of BSE or scrapie, a manifestation of prion disease in sheep. PRNP editing in the third setting can be used to prime edit wildlife and prevent the spread of prion diseases in the wild. Currently, North American cervid populations, including deer, elk, and moose, suffer from chronic wasting disease (CWD), a manifestation of prion disease caused by PNRP in these species. Occurrence has been reported to be as high as 25% in some populations (cdc.gov/prions/cwd/occurrence.html). CWD has also been reported in Norway, Finland, and South Korea. It is still unknown whether the disease is transmissible from these species to humans (cdc.gov/prions/cwd/transmission.html) or livestock. Introduction of PRNP mutations such as G127V in the germline of these species may protect them from CWD and reduce the risk of transmission to other species, including humans.

この方法はクロイツフェルト・ヤコブ病(CJD)、クールー病、ゲルストマン・ストロイスラー・シャインカー病、致死性家族性不眠症(FFI)、牛海綿状脳症(BSE;狂牛病)、スクレイピー(羊)、および慢性消耗病(CWD;鹿、ヘラジカ、およびムース)を処置するために用いられ得る。 This method is used to treat Creutzfeldt-Jakob disease (CJD), kuru disease, Gerstmann-Straussler-Scheinker disease, fatal familial insomnia (FFI), bovine spongiform encephalopathy (BSE; mad cow disease), and scrapie (sheep). , and chronic wasting disease (CWD; deer, elk, and moose).

方法は、胚または成体ニューロンのための送達方法論、例えばマイクロインジェクション、脂質ナノ粒子、またはAAVベクターと組み合わせられることを必要とするであろう。 The method will require being combined with delivery methodologies for embryonic or adult neurons, such as microinjection, lipid nanoparticles, or AAV vectors.

例6-PEを用いるRNAタグ付けおよび操作
哺乳類、真核生物、および細菌細胞においてRNAをタグ付けまたは別様に操作する遺伝子配列上へのモチーフの挿入のための新たな方法が、本明細書に記載の。ヒトゲノムの1%のみがタンパク質をコードするということが見積もられているが、ゲノムの実質的に全ては何らかのレベルで転写される。もたらされる非コードRNA(ncRNA)のどれくらい多くが機能的な役割を演ずるのか、ましてやこれらの推定RNAのほとんどの役割が何であるのかは、未解決の問いかけである。目当ての遺伝子上への有用な特性を有する新規のRNAコード配列の挿入によるこれらのRNA分子の「タグ付け」は、細胞におけるRNA分子の生物学的機能を研究するための有用な方法である。それは、どのようにしてmRNA修飾が細胞機能に影響し得るかを撹乱し、それゆえにより良く理解するための手段として、タンパク質をコードするmRNA上にタグを組み入れるにもまた有用であり得る。例えば、ユビキタスな天然のRNAタグのポリアデニル化は、細胞質へのmRNAの輸送に影響するために細胞によって用いられる。異なる型のポリアデニル化シグナルは、異なる輸送速度および異なるmRNA寿命、それゆえにコードされるタンパク質が発現されるレベルの違いをもたらす。
Example 6 - RNA Tagging and Manipulation Using PE A new method for the insertion of motifs onto gene sequences to tag or otherwise manipulate RNA in mammalian, eukaryotic, and bacterial cells is described herein. As stated in. Although it is estimated that only 1% of the human genome encodes proteins, virtually all of the genome is transcribed at some level. How many of the resulting non-coding RNAs (ncRNAs) play a functional role, much less what the role of most of these putative RNAs is, is an open question. "Tagging" these RNA molecules by inserting new RNA coding sequences with useful properties onto genes of interest is a useful method for studying the biological functions of RNA molecules in cells. It may also be useful to incorporate tags onto protein-encoding mRNAs as a means to perturb and therefore better understand how mRNA modifications can affect cellular function. For example, polyadenylation of the ubiquitous natural RNA tag is used by cells to influence export of mRNA to the cytoplasm. Different types of polyadenylation signals result in different transport rates and different mRNA lifetimes, and therefore different levels at which the encoded protein is expressed.

タグ付けされたRNAを細胞内で発現するための普通のアプローチは、合成構築物を外因的に導入することであり、(i)短期的な突発的な遺伝子発現を多くの場合には超生理学的レベルで生ずる一過性プラスミドトランスフェクション;または(ii)遷延した発現を可能化するレンチウイルス取り入れもしくはトランスポゾンを用いるゲノム上への(ランダムな部位における)タグ付けされたRNA遺伝子の永久的な取り入れどちらかを用いる。これらのアプローチの両方は、変改された発現レベルの生産によっておよび遺伝子の発現または活性を制御する天然の機序の不在によって限定される。代替的な戦略は、Cas9または他の標的化されたDNAヌクレアーゼによって誘導される二本鎖DNA切断の相同組み換え修復(HDR)を用いて、目当ての遺伝子をその内生座位において直接的にタグ付けすることである。このアプローチは広い範囲の内生でタグ付けされた遺伝子の生成を可能化するが、HDRは顕著に非効率的であり、そのため、首尾良くタグ付けされた細胞の所望のクローン集団を同定するための有意なスクリーニングを要求する。その上、HDRは、多数の細胞型、最も注意すべきことに有糸分裂後細胞において典型的には非常に非効率的または全く不活性である。HDRの低い効率は望まれないインデル産物の生成によってさらに複雑化し、これはRNA遺伝子のケースにおいて特に問題であり得る。なぜなら、それらはその活性が正常アレルの機能に干渉するRNAの生産に至り得るからである。最後に、最適な性能を達成するためには、研究者は多くの場合にはRNA分子上の種々のタグ付け位置をスクリーニングすることを必要とする。組み合わせると、これらの欠点は、HDRをRNA上のタグの組み入れのためのより望ましくない方法にしている。 A common approach to expressing tagged RNA in cells is to exogenously introduce synthetic constructs, which (i) produce short-term bursts of gene expression that are often supraphysiological; or (ii) permanent incorporation of tagged RNA genes onto the genome (at random sites) using lentiviral incorporation or transposons to allow prolonged expression. or Both of these approaches are limited by the production of altered expression levels and by the absence of natural mechanisms controlling gene expression or activity. An alternative strategy is to tag the gene of interest directly at its endogenous locus using homologous recombination repair (HDR) of double-stranded DNA breaks induced by Cas9 or other targeted DNA nucleases. It is to be. Although this approach allows the generation of a wide range of endogenously tagged genes, HDR is markedly inefficient and therefore difficult to identify the desired clonal population of successfully tagged cells. requires meaningful screening of Moreover, HDR is typically very inefficient or completely inactive in many cell types, most notably post-mitotic cells. The low efficiency of HDR is further complicated by the generation of unwanted indel products, which can be particularly problematic in the case of RNA genes. This is because they can lead to the production of RNA whose activity interferes with the function of the normal allele. Finally, to achieve optimal performance, researchers often need to screen various tagging positions on the RNA molecule. Combined, these drawbacks make HDR a less desirable method for incorporation of tags on RNA.

プライム編集は新たなゲノム編集テクノロジーであり、これはRNAからDNAへの遺伝情報の移入によってゲノム座位の標的化された編集を可能化する。プライム編集を用いて、RNA遺伝子は、種々の構成要素、例えばRNAアプタマー、リボザイム、または他のRNAモチーフによってタグ付けされ得る。プライム編集は、HDR戦略と比較して、多大な種々の細胞型において高速、安価、有効であるポテンシャルを有する。そのため、記載される発明は、健康および疾患におけるRNA遺伝子の生物学を取り調べるための新規の有用なかつ非自明のツールを表す。プライム編集因子(PE)を用いてRNAをタグ付けまたは別様に操作する遺伝子配列上へのRNAモチーフの挿入のための新たな方法が、本明細書に記載の。PEは、CRISPR/Casシステムによって標的化可能である所望のゲノム座位において、複数のヌクレオチドを部位特異的に挿入、変異、および/または欠失させることができる。PEはCas9ヌクレアーゼドメインと逆転写酵素ドメインとの間の融合体からなる。それらは、DNA標的化のためのガイドスペーサー部分と所望のゲノム編集をコードする逆転写の鋳型とを含有する操作されたPEgRNA(プライム編集ガイドRNA)によってそれらのゲノム標的へとガイドされる(図28Aを見よ)。PEは、RNAレベルで機能的であるモチーフ(これ以降ではRNAモチーフ)を挿入して非コードRNAまたはmRNAをタグ付けまたは別様に操作するために用いられ得るということが想定される。これらのモチーフは、遺伝子発現を増大させるか、遺伝子発現を減少させるか、スプライシングを変改するか、転写後修飾を変化させるか、RNAの細胞下レベル位置付けに影響するか、RNAの単離またはその細胞内もしくは外の位置付けの決定を可能化するか(例えば、蛍光RNAアプタマー、例えばSpinach、Spinach2、Baby Spinach、またはBroccoliを用いる)、内生または外因的なタンパク質またはRNA結合因子を動員するか、sgRNAを導入するか、あるいは自己切断またはRNAseどちらかによるRNAのプロセシングを誘導するための用をなし得る(図28Bを見よ)。プライム編集のフレキシビリティーを原因として、ゲノム上に組み入れられ得るRNAモチーフの網羅的なリストを提供することは可能ではない。ここでは、RNA遺伝子にタグ付けするために用いられ得るPEによって組み入れされるRNAモチーフの予測される範囲を幅広く例解する一連の例が示される。PE以外のいずれかの他の報告されたゲノム編集法を用いては、これらの変化を効率的にかつ相当クリーンになすことは、ほとんどの型の細胞(HDRを支持しない多くを包含する)において現行では可能ではない。 Prime editing is an emerging genome editing technology that enables targeted editing of genomic loci by transferring genetic information from RNA to DNA. Using prime editing, RNA genes can be tagged with various components, such as RNA aptamers, ribozymes, or other RNA motifs. Prime editing has the potential to be fast, cheap, and effective in a wide variety of cell types compared to HDR strategies. As such, the described invention represents a new, useful and non-obvious tool for interrogating the biology of RNA genes in health and disease. Described herein is a new method for insertion of RNA motifs onto gene sequences that tags or otherwise manipulates RNA using prime editing elements (PE). PE can site-specifically insert, mutate, and/or delete multiple nucleotides at desired genomic loci that can be targeted by the CRISPR/Cas system. PE consists of a fusion between a Cas9 nuclease domain and a reverse transcriptase domain. They are guided to their genomic targets by an engineered PEgRNA (prime editing guide RNA) containing a guide spacer moiety for DNA targeting and a reverse transcription template encoding the desired genome editing (Fig. (see 28A). It is envisioned that PE can be used to tag or otherwise manipulate non-coding RNA or mRNA by inserting motifs that are functional at the RNA level (hereinafter RNA motifs). These motifs may increase gene expression, decrease gene expression, alter splicing, alter post-transcriptional modifications, affect subcellular localization of RNA, or affect RNA isolation or enable determination of its intracellular or extracellular localization (e.g., using fluorescent RNA aptamers, e.g. Spinach, Spinach2, Baby Spinach, or Broccoli), recruit endogenous or exogenous protein or RNA binding factors; , can serve to introduce sgRNA or induce processing of the RNA by either self-cleavage or RNAse (see Figure 28B). Due to the flexibility of prime editing, it is not possible to provide an exhaustive list of RNA motifs that can be incorporated onto the genome. Here, a series of examples are provided that broadly illustrate the predicted range of RNA motifs incorporated by PE that can be used to tag RNA genes. With any other reported genome editing method other than PE, it is difficult to make these changes efficiently and fairly cleanly in most cell types (including many that do not support HDR). This is not currently possible.

遺伝子発現は、核輸送もしくは保持またはmRNA寿命の変化をもたらす3'非翻訳領域(UTR)をコードすることによって影響され得る。例えば、ポリオーマウイルスサルウイルス40(SV40)からのポリAテールは、効率的な転写終結を可能化する追加のヘルパー配列を有し、他の3'UTRに対して相対的に遺伝子発現を増大させ得る57,58。SV40ポリAテールの例の配列:

Figure 2020191234000297
Gene expression can be influenced by encoding 3' untranslated regions (UTRs) that result in nuclear transport or retention or altered mRNA lifetime. For example, the polyA tail from the polyomavirus simian virus 40 (SV40) has additional helper sequences that allow efficient transcription termination and can increase gene expression relative to other 3'UTRs. 57,58 An example sequence of the SV40 polyA tail:
Figure 2020191234000297

ポリアデニル化シグナル以外の翻訳後修飾シグナルもまたPEによってコードされ得る。これらの包含されるシグナルは、N6-メチルアデノシン、N1-メチルアデノシン、5-メチルシトシン、およびシュードウリジン修飾を組み込む59。PEを用いて、RNA転写物上のこれらの修飾を書き込むかまたは除去する酵素によって結合される配列を包含することによって、それらの書き込みまたは消し去りを誘導することが可能であろう。これは、これらのマーカーの効果を研究するための、細胞分化を誘導するための、ストレス応答に影響するための、またはこれらのマーカーの機能がまだ未調査であるということからは、他の様式で標的細胞に影響するためのツールとして用いられ得る。 Post-translational modification signals other than polyadenylation signals can also be encoded by PE. These included signals incorporate N6-methyladenosine, N1-methyladenosine, 5-methylcytosine, and pseudouridine modifications59 . Using PE, it would be possible to induce the writing or erasing of these modifications on RNA transcripts by including sequences that are bound by enzymes that write or remove them. This may be useful for studying the effects of these markers, for inducing cell differentiation, for influencing stress responses, or for other modalities since the function of these markers is still unexplored. can be used as a tool to influence target cells.

PEは細胞下レベル局在に影響する変異をコードし得る。例えば、mRNA上のtRNA-Lysの組み込みは、理論的にはミトコンドリアへの輸送をもたらし得るが60、種々の3'UTRは核保持または輸送をもたらし得る61 PE can encode mutations that affect subcellular localization. For example, incorporation of tRNA-Lys on mRNA could theoretically result in export to the mitochondria 60 , but various 3'UTRs could result in nuclear retention or export 61 .

例: example:

SV40ポリAシグナルが輸送をもたらす。

Figure 2020191234000298
SV40 polyA signal results in transport.
Figure 2020191234000298

U1 snRNA 3ボックスは保持をもたらす。

Figure 2020191234000299
U1 snRNA 3 box provides retention.
Figure 2020191234000299

内生RNAの細胞下レベル局在を決定することは難しくあり得、FISHのケースのように外因的な蛍光タグ付けされたヌクレオチドプローブの追加、または時間を消費するかつ可能性として不正確な細胞分画、次にRNA検出を要求する。内生RNA上にプローブをコードすることは、これらのイシューの多くを取り除くであろう。1つの例は、蛍光RNAアプタマー、例えばSpinach62またはBroccoliを内生RNA上にコードし、それによって、低分子プロトフルオロフォアの追加によってRNAの存在を視覚化することであろう。 Determining the subcellular localization of endogenous RNA can be difficult and requires the addition of exogenous fluorescently tagged nucleotide probes, as in the case of FISH, or the time-consuming and potentially inaccurate cellular Require fractionation and then RNA detection. Coding probes on endogenous RNA would eliminate many of these issues. One example would be to encode a fluorescent RNA aptamer, such as Spinach 62 or Broccoli, on endogenous RNA, thereby visualizing the presence of the RNA by the addition of a small protofluorophore.

Broccoliアプタマー:

Figure 2020191234000300
Broccoli aptamer:
Figure 2020191234000300

PEは、RNA結合タンパク質によって認識されるRNAをコードする配列を挿入または除去し得、RNA安定性、発現、局在、または修飾に影響する(例えば、列記されているタンパク質を見よ63)。 PEs can insert or remove sequences encoding RNAs that are recognized by RNA binding proteins, affecting RNA stability, expression, localization, or modification (see, eg, listed proteins 63 ).

ウイルスまたはがん防御機序として、PEはsgRNAをコードする配列をゲノム上に挿入し得る。類似に、それは、標的遺伝子のサイレンシングを導くためのマイクロRNA(例えば、プレマイクロRNA)を挿入するために用いられ得る。 As a viral or cancer defense mechanism, PE can insert sequences encoding sgRNAs into the genome. Similarly, it can be used to insert microRNAs (e.g., pre-microRNAs) to direct the silencing of target genes.

PEは、治療、またはRNAの種々の部分の機能を研究するためのツールとしてどちらかで、それ自体によるかまたは外部の因子によるかどちらかのRNAのプロセシングをもたらす配列を挿入し得る。例えば、HDVリボザイム64は、RNA配列上に包含されるときには、リボザイムの直ちに5'のRNAのプロセシングをもたらし、ハンマーヘッドリボザイムはリボザイム上の第3のステムに先行して切断する65。他の自己切断リボザイムは、ピストル66、ハチェット66、ヘアピン67、Neuropora Varkudサテライト68、glmS69、ツイスター70、およびツイスターシスター66を包含する。これらの配列はリボザイムの野生型のまたは操作されたまたは進化したバージョンを包含し得る。リボザイムによってカットされる部位がどこに位置付けられるかに依存して、これらのリボザイムの多数はそれらが関連するRNAの領域に依存して異なる配列を有し得る。外部の因子、例えば配列特異的RNAse71、特定の構造を認識するRNAse72、例えばDicer73およびDrosha74によるRNAのプロセシングを導くであろう配列もまた達成され得る。 PE can insert sequences that result in the processing of RNA either by itself or by external factors, either therapeutically or as a tool to study the function of various parts of the RNA. For example, the HDV ribozyme 64 , when included on an RNA sequence, results in processing of the RNA immediately 5' of the ribozyme, and the hammerhead ribozyme cleaves prior to the third stem on the ribozyme 65 . Other self-cleaving ribozymes include Pistol 66 , Hatchet 66 , Hairpin 67 , Neuropora Varkud Satellite 68 , glmS 69 , Twister 70 , and Twister Sister 66 . These sequences may include wild type or engineered or evolved versions of ribozymes. Depending on where the site cut by the ribozyme is located, many of these ribozymes can have different sequences depending on the region of the RNA with which they are associated. Sequences that will guide the processing of the RNA by external factors, such as sequence-specific RNAses 71 , RNAses 72 that recognize specific structures, such as Dicer 73 and Drosha 74 , can also be achieved.

Figure 2020191234000301
Figure 2020191234000301

例6のための参考文献References for Example 6

以下の参考文献はこれら全体が参照されることによって本明細書に組み込まれる。

Figure 2020191234000302
Figure 2020191234000303
The following references are incorporated herein by reference in their entirety.
Figure 2020191234000302
Figure 2020191234000303

例7-PEによる遺伝子ライブラリの生成
定められたまたは可変の挿入、欠失、または定められたアミノ酸/ヌクレオチド変換を有するタンパク質またはRNAをコードする遺伝子の高度に高性能なライブラリの細胞性の生成のための新たな方法と、高スループットスクリーニングおよび指向性進化へのそれらの使用とが、本明細書に記載の。例において引用される参照はこの例の終わりに包含される参照のリストに基づく。
Example 7 - Generation of gene libraries by PE Cellular generation of highly high-performance libraries of protein- or RNA-encoding genes with defined or variable insertions, deletions, or defined amino acid/nucleotide conversions. New methods for and their use for high-throughput screening and directed evolution are described herein. References cited in the example are based on the list of references included at the end of this example.

可変の遺伝子ライブラリの生成は最も普通には変異誘発PCRによって達成されている1。この方法は、DNAポリメラーゼの忠実性を縮減する反応条件を用いることまたはより高い変異率を有する改変されたDNAポリメラーゼを用いることどちらかに依拠する。そのため、これらのポリメラーゼのバイアスはライブラリ産物に反映される(例えば、トランスバージョンに対してトランジション変異の選好性)。ライブラリ構築のこのアプローチの内在する限定は、変えられようとする遺伝子のサイズに影響することの相対的不能である。ほとんどのDNAポリメラーゼは極めて低いインデル変異2(挿入または欠失)率を有し、これらのほとんどはタンパク質をコードする領域のフレームシフト変異をもたらし、ライブラリのメンバーがいずれかの下流セレクションを通過することを非蓋然的にするであろう。加えて、PCRおよびクローニングのバイアスは、異なるサイズの遺伝子からなる単一のライブラリを生成することを困難にし得る。これらの限定は、存在するタンパク質機能を増強または新規のタンパク質機能を操作するための指向性進化の効力を厳しく限定し得る。天然の進化では、タンパク質機能または効力の大きい変化は典型的には挿入および欠失変異に関連し、これらは変異導入のための標準的なライブラリ生成の間に生起することが非蓋然的である。さらにその上、これらの変異は、最も普通には、疎水性コアと対比してループを形成することが予測される当のタンパク質の領域に生起する。それゆえに、従来のバイアスがないアプローチを用いて生成されるほとんどのインデルは、害があるかまたは無効であるかどちらかであることが蓋然的である。 Generation of variable gene libraries is most commonly accomplished by mutagenic PCR1 . This method relies on either using reaction conditions that reduce the fidelity of the DNA polymerase or using modified DNA polymerases that have higher mutation rates. As such, these polymerase biases are reflected in the library product (eg, preference for transition mutations over transversions). An inherent limitation of this approach to library construction is the relative inability to influence the size of the genes being altered. Most DNA polymerases have extremely low rates of indel mutations2 (insertions or deletions), and most of these result in frameshift mutations in protein-coding regions, making it difficult for library members to pass through any downstream selection. would make it improbable. In addition, PCR and cloning biases can make it difficult to generate a single library consisting of genes of different sizes. These limitations can severely limit the efficacy of directed evolution to enhance existing protein functions or engineer new protein functions. In natural evolution, large changes in protein function or efficacy are typically associated with insertion and deletion mutations, which are unlikely to occur during standard library generation for mutagenesis. . Moreover, these mutations most commonly occur in regions of the protein in question that are predicted to form loops relative to the hydrophobic core. Therefore, most indels generated using traditional unbiased approaches are likely to be either harmful or invalid.

全てのライブラリは可能な変異空間のある画分のみにアクセスするということから、それらが有益であることが最も蓋然的であろうタンパク質上の部位、例えばループ領域にかかる変異を偏らせ得るライブラリは、従来のライブラリと比べて有意な利点を有するであろう。最後に、NNKプライマーを用いるマルチステップPCRおよびクローンアセンブリによってまたはDNAシャッフリングによって、部位特異的なインデル変異を有する遺伝子ライブラリを生成することは可能であるが、これらのライブラリは連続的進化の「インデルジェネシス」の追加のラウンドを経過し得ない。連続的進化は、最小限のユーザー介入によるある型の指向性進化である。1つのかかる例はPACEである3。連続的進化は最小限のユーザー介入によって生起するので、進化の間のライブラリ多様性のいずれかの増大はネイティブな複製機構を用いて生起するはずである。そのため、PACEでは、特定の座位として挿入または除去されたコドンを有する遺伝子のライブラリが生成およびスクリーニングされ得るが、「インデルジェネシス」の追加のラウンドは可能ではない。 Because all libraries access only a fraction of the possible mutation space, libraries that can bias mutations toward sites on the protein where they are most likely to be beneficial, such as loop regions, , would have significant advantages compared to traditional libraries. Finally, although it is possible to generate gene libraries with site-specific indel mutations by multi-step PCR and clone assembly using NNK primers or by DNA shuffling, these libraries cannot be No additional rounds of "Genesis" can pass. Continuous evolution is a type of directed evolution with minimal user intervention. One such example is PACE3 . Since continuous evolution occurs with minimal user intervention, any increase in library diversity during evolution should occur using the native replication machinery. Therefore, in PACE, libraries of genes with codons inserted or removed as specific loci can be generated and screened, but additional rounds of "indergenesis" are not possible.

プライム編集(PE)のプログラム可能性は、高スループットスクリーニングおよび指向性進化への使用のための高度に高性能なプログラムされた遺伝子ライブラリを生成するために活用され得るということが想定される(図29Aを見よ)。PEは、プライム編集ガイドRNA(PEgRNA)上にコードされた情報を用いて、規定された遺伝子座位から定められた数のヌクレオチドを挿入、変化、または除去し得る(図29Bを見よ)。これは、非機能的なフレームシフト変異のバックグラウンド導入なしに、変異が機能の変化を生じさせることが最も蓋然的であるループ領域から挿入または除去された1つ以上のアミノ酸を有する標的化されたライブラリの生成を可能化する(図29Cを見よ)。PEは、DNAポリメラーゼまたは変異させられようとする配列どちらかに内在するバイアスにかかわらず、特定のセットの変異を組み入れるために用いられ得る。 It is envisioned that the programmability of prime editing (PE) can be exploited to generate highly performing programmed gene libraries for use in high-throughput screening and directed evolution (Fig. (see 29A). PE can insert, change, or remove a defined number of nucleotides from a defined genetic locus using information encoded on the prime editing guide RNA (PEgRNA) (see Figure 29B). This is a targeted method that has one or more amino acids inserted or removed from the loop region where the mutation is most likely to result in a change in function, without the background introduction of non-functional frameshift mutations. (See Figure 29C). PE can be used to incorporate a specific set of mutations regardless of biases inherent in either the DNA polymerase or the sequence being mutated.

例えば、それは2つのトランスバージョンを包含する3つの連続した変異を要求するであろうから、CCCコドンを停止コドンに変換することは標準的なライブラリ生成によっては非蓋然的な生起であろうが、PEは、いずれかの所与の標的コドンをTGA停止コドンへと1ステップで変換するために用いられ得る。それらは、例えば、いずれかの疎水性アミノ酸をコードしながらいずれかの他をコードしないコドンを所与の部位に組み込むことによって、プログラムされた多様性を所与の位置に組み入れるためにもまた用いられ得る。さらにその上、PEのプログラム可能性ゆえに、複数のPEgRNAが複数の異なる編集を複数の部位に同時に生成するために利用され得、高度にプログラムされたライブラリの生成を可能化する(図29Dを見よ)。加えて、より低い忠実性を有する逆転写酵素を用いて、さもなければ不変のライブラリにおいて変異導入の領域を生成することが可能である(例えば、HIV-I逆転写酵素4またはBordetellaファージ逆転写酵素5)。 For example, converting a CCC codon to a stop codon would be an unlikely occurrence by standard library generation, since it would require three consecutive mutations encompassing two transversions. PE can be used to convert any given target codon into a TGA stop codon in one step. They can also be used to incorporate programmed diversity into a given position, for example, by incorporating at a given site a codon that encodes for one hydrophobic amino acid but not for any other. It can be done. Moreover, because of the programmability of PE, multiple PEgRNAs can be utilized to generate multiple different edits at multiple sites simultaneously, allowing the generation of highly programmed libraries (see Figure 29D). ). In addition, it is possible to generate regions of mutagenesis in otherwise invariant libraries using reverse transcriptases with lower fidelity (e.g., HIV-I reverse transcriptase 4 or Bordetella phage reverse transcriptase). Enzyme 5 ).

同じ部位に対するPEの反復的なラウンドの可能性もまた想定され、例えば、単一の部位におけるコドンの繰り返しの挿入を許す。最後に、上に記載されているアプローチの全てが連続的進化に組み込まれ得るということが想定され、新規のin situ進化ライブラリの生成を可能化する(図30を見よ)。それらは、大きいライブラリをアセンブリすることがさもなければ困難であろう他の細胞型内において、例えば哺乳類細胞内において、これらのライブラリを構築するためにもまた用いられ得る。指向性進化のための最適化されたPEをコードする細菌株の生成は、改善されたまたは新規の機能性を有するタンパク質およびRNAの同定のための有用な追加のツールであろう。PEのこれらの使用の全てはPEの新規の性質を原因として非自明である。結論として、PEによるライブラリ生成は、合成生物学および指向性進化において、ならびにタンパク質およびRNAのコンビナトリアル変異体の高スループットスクリーニングにとって、高度に有用なツールであろう。 The possibility of repeated rounds of PE to the same site is also envisioned, allowing for example repeated insertions of codons at a single site. Finally, it is envisaged that all of the approaches described above can be incorporated into sequential evolution, allowing the generation of new in situ evolution libraries (see Figure 30). They can also be used to construct these libraries in other cell types where it would otherwise be difficult to assemble large libraries, such as in mammalian cells. Generation of bacterial strains encoding optimized PEs for directed evolution would be a useful additional tool for the identification of proteins and RNAs with improved or novel functionality. All of these uses of PE are non-obvious due to the novel properties of PE. In conclusion, library generation by PE will be a highly useful tool in synthetic biology and directed evolution, as well as for high-throughput screening of combinatorial variants of proteins and RNA.

競合するアプローチ
多様なライブラリが現行で生成される主だった方法は、上に記載されている変異誘発PCRによってである1。挿入または欠失はPCRの間に定められた部位において縮重したNNKプライマーによって導入され得るが、かかる変異を複数の部位において導入することは、より多様なライブラリを変異誘発PCRによって構築する前に複数のラウンドの反復的なPCRおよびクローニングを要求し、方法を低速にする。代替的な補完的な方法はDNAシャッフリングであり、ここでは、DNase処置によって生成された遺伝子のライブラリのフラグメントがプライマーなしのPCR反応に導入され、互いに対する異なるフラグメントのアニーリングと、変異誘発PCR単独よりも多様なライブラリの急速な生成とをもたらす6。このアプローチは理論的にはインデル変異を生成し得るが、それはより多くの場合には遺伝子機能を破壊するフレームシフト変異をもたらす。さらにその上、DNAシャッフリングは遺伝子フラグメント間に高い度合の相同性を要求する。これらの方法の両方はin vitroでされなければならず、もたらされるライブラリは細胞に形質転換されるが、PEによって生成されるライブラリはin situで構築され得、連続的進化へのそれらの使用を可能化する。ライブラリはインビボの変異導入によってin situで構築され得、これらのライブラリはホスト細胞機構に依拠し、インデルに対してバイアスを発揮する。類似に、従来のクローニング方法は部位特異的な変異プロファイルを生成するために用いられ得るが、それらはin situでは用いられ得ず、一般的には、細胞に形質転換される前にin vitroで1度に1つずつアセンブリされる。原核および真核細胞型両方におけるPEの効率および幅広い機能性は、さらに、E.coliなどのモデル生物にクローニングされることおよびそれから目当ての細胞または生物に移入されることと対比して、これらのライブラリが目当ての細胞型内において直接的に構築され得るということを示唆する。標的化された多様化の別の競合するアプローチは自動多重ゲノム工学またはMAGEであり、複数の一本鎖DNAオリゴヌクレオチドが複製フォークに組み込まれ得、プログラム可能な変異をもたらし得る7。しかしながら、MAGEはホスト株の有意な改変を要求し、オフターゲットまたはバックグラウンド変異の100倍の増大に至り得るが8、PEはより高度にプログラムされており、より少数のオフターゲット効果をもたらすことが予期される。加えて、MAGEは哺乳類細胞を包含する広い種々の細胞型においては実証されていない。プライム編集はライブラリ生成のための新規のかつ非自明な補完的な技術である。
遺伝子ライブラリを構築するための指向性進化におけるPEの例
Competing Approaches The main way that diverse libraries are currently generated is by mutagenic PCR as described above1. Although insertions or deletions can be introduced by degenerate NNK primers at defined sites during PCR, introducing such mutations at multiple sites is important before a more diverse library is constructed by mutagenic PCR. Requires multiple rounds of iterative PCR and cloning, making the method slow. An alternative and complementary method is DNA shuffling, in which fragments of a library of genes generated by DNase treatment are introduced into a primer-free PCR reaction, resulting in annealing of the different fragments to each other and a faster response than mutagenic PCR alone. It also brings with it the rapid generation of diverse libraries6 . Although this approach could theoretically generate indel mutations, it more often results in frameshift mutations that disrupt gene function. Moreover, DNA shuffling requires a high degree of homology between gene fragments. While both of these methods have to be done in vitro and the resulting libraries are transformed into cells, libraries generated by PE can be constructed in situ, making their use for continuous evolution enable. Libraries can be constructed in situ by in vivo mutagenesis, and these libraries rely on host cellular machinery to exert a bias against indels. Similarly, while traditional cloning methods can be used to generate site-specific mutation profiles, they cannot be used in situ and are generally grown in vitro before being transformed into cells. Assembled one at a time. The efficiency and broad functionality of PEs in both prokaryotic and eukaryotic cell types further emphasizes their ability to be cloned into model organisms such as E. coli and then transferred into cells or organisms of interest. We suggest that libraries can be constructed directly within the cell type of interest. Another competing approach to targeted diversification is automated multiplex genome engineering or MAGE, in which multiple single-stranded DNA oligonucleotides can be integrated into a replication fork, resulting in programmable mutations . However, MAGE requires significant modification of the host strain and can lead to off-target or 100-fold increases in background mutations8, whereas PE is more highly programmed and may result in fewer off-target effects. is expected. Additionally, MAGE has not been demonstrated in a wide variety of cell types, including mammalian cells. Prime editing is a novel and non-trivial complementary technique for library generation.
Example of PE in directed evolution to build gene libraries

1つの例では、PEは、PACEを用いる連続的進化実験の間に遺伝子ライブラリにタンパク質バリアントを導入するために指向性進化実験に用いられ得、従来のアプローチでは可能ではない様式で点変異およびインデル両方の反復的蓄積を許す。PEは部位特異的にかつプログラム可能にヌクレオチドをE.coliの遺伝子配列上に挿入し得るということがすでに示されている。概説された指向性進化では、改変されたツーハイブリッドタンパク質:タンパク質結合PACEセレクションによって、特異的なエピトープに対する改善された結合を有するモノボディを同定することが提案されている。これらのモノボディ上の特異的なかつ高度に可変のループは親和性および特異性に有意に寄与する。改善されたモノボディ結合は、PACEにおいてはこれらのループの長さおよび組成を標的化された様式で変えることによって急速に得られ得る。しかしながら、配列長さを変えることはPACEの確立された機能性ではない。様々なループサイズのライブラリがPACEの出発点として用いられ得るが、長さの爾後の改善はPACEセレクションの間に発生せず、点変異およびインデル変異の有益な相乗的組み合わせへのアクセスを妨害するであろう。PEをPACEセレクションに導入することは、様々なループ長さを有するモノボディのin situ生成および進化を可能化するであろう。そうするためには、それは、ホストE.coli株へのPE酵素および1つ以上のPEgRNAをコードする追加のPEプラスミドの導入を想定される。PE酵素およびPEgRNAの発現は、実験者によって選択される速度でPACEラグーンに送達される低分子のコントロール下にあるであろう。 In one example, PE can be used in directed evolution experiments to introduce protein variants into gene libraries during continuous evolution experiments using PACE, allowing point mutations and indels to be introduced in a manner not possible with traditional approaches. Allows repeated accumulation of both. It has previously been shown that PE can site-specifically and programmably insert nucleotides onto E. coli gene sequences. Directed evolution outlined proposes to identify monobodies with improved binding to specific epitopes by engineered two-hybrid protein:protein binding PACE selection. Specific and highly variable loops on these monobodies contribute significantly to affinity and specificity. Improved monobody binding can be rapidly obtained in PACE by varying the length and composition of these loops in a targeted manner. However, varying sequence length is not an established functionality of PACE. Although libraries of various loop sizes can be used as a starting point for PACE, subsequent improvements in length do not occur during PACE selection, preventing access to beneficial synergistic combinations of point and indel mutations. Will. Introducing PE into PACE selection will allow in situ generation and evolution of monobodies with various loop lengths. To do so, it is envisaged the introduction of an additional PE plasmid encoding the PE enzyme and one or more PEgRNAs into the host E. coli strain. Expression of PE enzyme and PEgRNA will be under the control of small molecules delivered to the PACE lagoon at a rate selected by the experimenter.

種々の態様において、PEgRNA構成要素は、セレクションファージ上の目当ての部位へとPEを導くスペーサーを含有し、複数の3ヌクレオチドが標的部位に挿入され得るようにしてデザインされるであろう。その結果、新たなPEgRNA結合部位が導入され、標的部位における1つ以上のコドンの反復的挿入を可能化するであろう。 In various embodiments, the PEgRNA component will contain a spacer that directs the PE to the site of interest on the selection phage and will be designed such that multiple 3 nucleotides can be inserted into the target site. As a result, new PEgRNA binding sites will be introduced, allowing repeated insertion of one or more codons at the target site.

並行して、別のホストE.coli株は、1つ以上のコドンの除去の鋳型となるPEgRNAを包含し得、ループサイズが進化の間に縮むことを可能化する。PACE実験は両方の株の混合物を利用し得るか、または2つを交互にしてループ配列の低速のかつコントロールされた追加もしくは除去を許し得る。 In parallel, another host E. coli strain may contain PEgRNA that templates the removal of one or more codons, allowing the loop size to shrink during evolution. PACE experiments can utilize a mixture of both strains or alternate between the two to allow slow and controlled addition or removal of loop sequences.

この技術は抗体の進化にもまた適用され得るということが注意される。抗体を支配する結合原理は、モノボディを支配するものに非常に類似である:抗体相補性決定領域ループの長さはそれらの結合機能にとって重大である。さらに、より長いループ長さは、HIV-1および他のウイルス感染に対する幅広く防護性の活性を有する稀な抗体の開発において重大であることが見出されている9。抗体または抗体由来分子への上に記載されているPEの適用は、多様なループ長さおよび様々なループ配列を有する抗体の生成を許すであろう。PACEとの組み合わせで、かかるアプローチは標準のPACEにとってはアクセス可能でないループジオメトリによる増強された結合を許し、それゆえに高度に機能的な抗体の進化を許すであろう。 It is noted that this technique can also be applied to antibody evolution. The binding principles governing antibodies are very similar to those governing monobodies: the length of antibody complementarity determining region loops is critical to their binding function. Furthermore, longer loop lengths have been found to be critical in the development of rare antibodies with broadly protective activity against HIV-1 and other viral infections . Application of PE as described above to antibodies or antibody-derived molecules will allow the generation of antibodies with a variety of loop lengths and a variety of loop sequences. In combination with PACE, such an approach would allow enhanced binding due to loop geometries not accessible to standard PACE, and therefore the evolution of highly functional antibodies.

実験は、ファージによって補助される非連続的進化(PANCE)においてバクテリオファージM3の害がある変異を修正するためにPEを用いる能力を示すであろう。連続的進化にPEを用いるための必要な第1ステップである(図69を見よ)。 Experiments will demonstrate the ability to use PE to correct deleterious mutations of bacteriophage M3 in phage-assisted discontinuous evolution (PANCE). This is a necessary first step in using PE for continuous evolution (see Figure 69).

例7のための参考文献 References for example 7

以下の参考文献はこれら全体が参照されることによって本明細書に組み込まれる。

Figure 2020191234000304
The following references are incorporated herein by reference in their entirety:
Figure 2020191234000304

例8-PEによる免疫エピトープ挿入
CRISPR/Casシステムを用いる精密なゲノム標的化テクノロジーが、最近では、標的ゲノム座位上への操作されたDNA配列の挿入を包含する広い範囲の適用において調査されている。先には、相同組み換え修復(HDR)がこの適用について用いられ、ssDNAドナー鋳型と二本鎖DNA切断(DSB)の手段による修復開始とを要求した。この戦略は、細胞になされるべき可能な変化の最も幅広い範囲をオファーし、大きいDNA配列を哺乳類細胞に挿入するために利用可能な唯一の方法である。しかしながら、HDRは、そのDSBを開始することから派生する望まれない細胞副作用、例えば高いレベルのインデル形成、DNA転座、大きい欠失、およびP53活性化によって邪魔される。これらの欠点に加えて、HDRは多くの細胞型における低い効率によって限定される(T細胞はこの観察の注意すべき例外である)。これらの欠点を克服するための最近の作業は、ヒトRad51変異体をCas9 D10Aニッカーゼに融合することを包含し(RDN)、DSBフリーHDRシステムをもたらす。これは、改善されたHDR産物:インデル比およびより低いオフターゲット編集を特色とするが、細胞型依存性および控えめなのみのHDR編集効率によってなお邪魔される。
Example 8 – Immune epitope insertion by PE
Precise genome targeting technology using the CRISPR/Cas system has recently been investigated in a wide range of applications, including the insertion of engineered DNA sequences onto target genomic loci. Previously, homologous recombination repair (HDR) was used for this application, requiring an ssDNA donor template and initiation of repair by means of double-stranded DNA breaks (DSB). This strategy offers the widest range of possible changes to be made to cells and is the only method available for inserting large DNA sequences into mammalian cells. However, HDR is hampered by undesired cellular side effects derived from initiating its DSBs, such as high levels of indel formation, DNA translocations, large deletions, and P53 activation. In addition to these drawbacks, HDR is limited by low efficiency in many cell types (T cells are a notable exception to this observation). Recent work to overcome these drawbacks involves fusing human Rad51 mutants to Cas9 D10A nickase (RDN), resulting in a DSB-free HDR system. It features an improved HDR product:indel ratio and lower off-target editing, but is still hampered by cell type dependence and only modest HDR editing efficiency.

PEgRNAとカップリングされた逆転写酵素へのCas9の最近開発された融合体(「プライム編集因子」)は、存在するゲノム編集法と比べていくつもの利点をオファーする新規のゲノム編集テクノロジーを表し、部位特異的な様式で、いずれかの1ヌクレオチド置換を組み入れおよびヌクレオチドのいずれかの短いストレッチ(最高で少なくとも何ダースもの塩基)を挿入または欠失する能力を包含する。注意すべきことに、PE編集は一般的に低い意図されないインデル率で達成される。そのため、PEは、先には不可能または非実用的であった標的化された挿入に基づく編集適用を可能化する。 A recently developed fusion of Cas9 to reverse transcriptase coupled to PEgRNA (the "prime editing factor") represents a novel genome editing technology that offers several advantages compared to existing genome editing methods. Includes the ability to incorporate any single nucleotide substitutions and insert or delete any short stretches of nucleotides (up to at least several dozen bases) in a site-specific manner. Of note, PE editing is generally achieved with low unintended indel rates. PE therefore enables targeted insertion-based editing applications that were previously impossible or impractical.

具体的な本発明は、公知の免疫原性エピトープを内生または外生のゲノムDNA上に挿入するための手段としてプライム編集を用いるための方法を記載し、治療学的またはバイオテクノロジー的適用のための対応するタンパク質の改変をもたらす(図31および32を見よ)。プライム編集の本発明に先行しては、かかる挿入は、非効率的にかつDSBからの高いインデル形成率によってのみ達成され得た。プライム編集は挿入編集からの高いインデル形成の問題を解決しながら、一般的にHDRよりも高い効率をオファーする。このより低いインデル形成率は、特に免疫原性エピトープを挿入するという記載されている適用において、標的化されたDNA挿入のための方法としてのHDRと比べたプライム編集の主要な利点を提示する。エピトープの長さは少数塩基から数百塩基の範囲である。プライム編集因子はかかる標的化された挿入を哺乳類細胞において達成するための効率的なかつ最もクリーンなテクノロジーである。 Specifically, the present invention describes a method for using prime editing as a means to insert known immunogenic epitopes onto endogenous or exogenous genomic DNA, for therapeutic or biotechnological applications. (See Figures 31 and 32). Prior to the present invention of prime editing, such insertions could only be achieved inefficiently and with high rates of indel formation from DSBs. Prime editing generally offers higher efficiency than HDR while solving the problem of high indel formation from insert editing. This lower indel formation rate presents a major advantage of prime editing compared to HDR as a method for targeted DNA insertion, especially in the described application of inserting immunogenic epitopes. Epitope lengths range from a few bases to several hundred bases. Prime editing factors are the efficient and cleanest technology to achieve such targeted insertions in mammalian cells.

本発明の鍵の概念は、それらのタンパク質産物および/または発現細胞型の下方制御および/または破壊のために、先に記載された免疫原性エピトープを含有するヌクレオチド配列を内生または外生のゲノムDNA上に挿入するためのプライム編集因子の使用である。標的遺伝子のコードされるタンパク質と挿入される免疫原性のエピトープの対応するタンパク質翻訳との融合タンパク質を生ずる様式で、免疫原性のエピトープ挿入のためのヌクレオチド配列は、遺伝子へと標的化されるであろう。患者の免疫系は、例えば破傷風またジフテリアまたは麻疹に対するルーチンの予防接種からの先行する標準免疫化の結果として、これらのエピトープを認識するように先に訓練されているであろう。融合されるエピトープの免疫原性の性質の結果として、患者の免疫系は、プライム編集されたタンパク質(ただの挿入されるエピトープではない)と可能性としてはそれが発現された細胞とを認識および不能化することが予想されるであろう。 The key concept of the present invention is to use endogenous or exogenous nucleotide sequences containing the immunogenic epitopes described above for the downregulation and/or destruction of their protein products and/or expressing cell types. The use of prime editing factors to insert onto genomic DNA. The nucleotide sequence for immunogenic epitope insertion is targeted to the gene in a manner that results in a fusion protein between the encoded protein of the target gene and the corresponding protein translation of the inserted immunogenic epitope. Will. The patient's immune system will have previously been trained to recognize these epitopes as a result of previous standard immunization, for example from routine vaccination against tetanus or diphtheria or measles. As a result of the immunogenic nature of the epitope being fused, the patient's immune system recognizes and recognizes the prime-edited protein (not just the inserted epitope) and potentially the cells in which it is expressed. It is expected that it will be disabled.

標的遺伝子への融合体は、挿入されたエピトープタンパク質翻訳が免疫系認識のために暴露されるということを保証するために必要とされるとおり操作されるであろう。これは、標的遺伝子への免疫原性エピトープのC末端融合体、標的遺伝子への免疫原性エピトープのN末端融合体、または遺伝子上へのヌクレオチドの挿入を生むタンパク質翻訳をもたらす標的化されたヌクレオチド挿入を包含し得、その結果、免疫原性エピトープがタンパク質構造の表面の暴露された領域にコードされる。 Fusions to the target gene will be manipulated as required to ensure that the inserted epitope protein translation is exposed for immune system recognition. This may result in a C-terminal fusion of an immunogenic epitope to a target gene, an N-terminal fusion of an immunogenic epitope to a target gene, or a targeted nucleotide that results in protein translation resulting in the insertion of a nucleotide onto a gene. Insertions may be involved such that immunogenic epitopes are encoded in exposed regions of the surface of the protein structure.

標的遺伝子の免疫系認識、細胞輸送、タンパク質機能、またはタンパク質フォールディングを容易化するために、標的遺伝子配列と挿入される免疫原性エピトープヌクレオチド配列との間に挿入されるヌクレオチドとしてコードされるタンパク質リンカーが、本発明の一部として操作されることを必要とし得る。これらの挿入されるヌクレオチドによってコードされるタンパク質リンカーは、可変の長さおよび配列のXTENリンカーまたは可変の長さおよび配列のグリシン-セリンリンカーを包含し得る(が、これらに限定されない)。これらの操作されたリンカーは、タンパク質融合を首尾良く容易化するために先に用いられている。 A protein linker encoded as a nucleotide inserted between a target gene sequence and an inserted immunogenic epitope nucleotide sequence to facilitate immune system recognition, cellular trafficking, protein function, or protein folding of the target gene. may need to be manipulated as part of the invention. The protein linkers encoded by these inserted nucleotides can include (but are not limited to) XTEN linkers of variable length and sequence or glycine-serine linkers of variable length and sequence. These engineered linkers have been used previously to successfully facilitate protein fusion.

本発明の際立った特色は、さもなければ非免疫原性のタンパク質に対する免疫応答を誘導するための手段として、特定のアミノ酸配列に対する先に獲得された免疫応答を用いる能力を包含する。別の際立った特色は、副産物編集としての欲されないインデルの高いレベルを誘導せずかつその挿入が効率的である標的様式で、これらの免疫原性のエピトープのヌクレオチド配列を挿入する能力である。本願において論じられる本発明は、細胞型特異的な送達方法(例えばAAV血清型)を組み合わせて、それに対する免疫応答を誘発することが目当てである細胞型にエピトープを挿入する能力をもまた有する。 A distinctive feature of the invention includes the ability to use a previously acquired immune response to a particular amino acid sequence as a means to induce an immune response against an otherwise non-immunogenic protein. Another distinguishing feature is the ability to insert the nucleotide sequences of these immunogenic epitopes in a targeted manner that does not induce high levels of unwanted indels as editing byproducts and where the insertion is efficient. The invention discussed herein also has the ability to combine cell type-specific delivery methods (eg, AAV serotypes) to insert epitopes into the cell type against which it is aimed to elicit an immune response.

免疫原性のエピトープを病原性の遺伝子上に挿入する手段としてのプライム編集は、広い種々の疾患(免疫腫瘍学戦略のがんに限定されない)と戦うように患者の免疫系をプログラムするために用いられ得る。このテクノロジーの直ちに該当する使用は、がんの治療学としてであろう。なぜなら、それは、HER2のような該当するがん遺伝子またはEGFRのような増殖因子に対する免疫応答を引き起こすことによって、腫瘍の免疫エスケープ機序を阻み得るからである。かかるアプローチはT細胞操作に類似に見え得るが、このアプローチの1つの新規の進歩は、操作されたT細胞を生成し患者に導入することを必要とすることなしに、それが多くの細胞型におよびがん以外の疾患に利用され得るということである。 Prime editing as a means of inserting immunogenic epitopes onto pathogenic genes can be used to program a patient's immune system to fight a wide variety of diseases (not limited to cancer in immuno-oncology strategies). can be used. An immediate relevant use of this technology would be as a cancer therapeutic. This is because it can thwart the tumor's immune escape mechanism by triggering an immune response against the relevant oncogenes, such as HER2, or growth factors, such as EGFR. Although such an approach may appear similar to T cell engineering, one novel advance in this approach is that it can be used to generate engineered T cells and to introduce them into patients, allowing them to be used in many cell types. This means that it can be used to treat diseases other than cancer.

PEを用いて、ほとんどの者がすでに予防接種されている免疫原性エピトープ(破傷風、百日咳、ジフテリア、麻疹、ムンプス、風疹など)を疾患を駆動する外生のまたは内生遺伝子上に挿入し、そのため、患者の免疫系はそのタンパク質を不能化することを学習する。 PE is used to insert an immunogenic epitope (such as tetanus, pertussis, diphtheria, measles, mumps, rubella) against which most people are already vaccinated onto an exogenous or endogenous gene that drives the disease; Therefore, the patient's immune system learns to disable the protein.

前述の戦略からの可能性ある治療学的な利益を有しそうな疾患は、毒性のタンパク質の凝集によって引き起こされるもの、例えば致死性家族性不眠症を包含する。利し得る他の疾患は、さもなければ非毒性の内生タンパク質の病原性の過剰発現によって引き起こされるもの、および外生の病原体によって引き起こされるものを包含する。 Diseases likely to have potential therapeutic benefit from the aforementioned strategies include those caused by toxic protein aggregation, such as fatal familial insomnia. Other diseases that may benefit include those caused by pathogenic overexpression of otherwise non-toxic endogenous proteins and those caused by exogenous pathogens.

一次的な治療学的適応は、上で言及されているもの、例えばがん、プリオン、および他の神経変性疾患の治療学、感染性疾患、ならびに予防的な医療を包含する。二次的な治療学的適応は、遅発性の遺伝子疾患を有する患者の予防的ケアを包含し得る。特に侵襲性のがんのようないくつかの疾患では、または薬物治療が疾患が完全に治癒するまで疾患症状を緩和することを助けるケースでは、現行の標準治療の医療がプライム編集と併せて用いられ得るということが予想される。下は、プライム編集因子によって挿入され得る、達成するために用いられ得る免疫エピトープの例である:

Figure 2020191234000305
Figure 2020191234000306
Figure 2020191234000307
Figure 2020191234000308
Primary therapeutic indications include those mentioned above, such as the therapeutics of cancer, prions, and other neurodegenerative diseases, infectious diseases, and preventive medicine. Secondary therapeutic indications may include preventive care of patients with late-onset genetic diseases. In some diseases, particularly aggressive cancers, or in cases where drug therapy can help alleviate disease symptoms until the disease is completely cured, current standard of care medicine is used in conjunction with prime editing. It is expected that this may occur. Below are examples of immune epitopes that can be inserted by prime editing factors and can be used to achieve:
Figure 2020191234000305
Figure 2020191234000306
Figure 2020191234000307
Figure 2020191234000308

下は、免疫エピトープタグ付けのために標的遺伝子上に取り入れされ得るエピトープの追加の例である: Below are additional examples of epitopes that can be incorporated onto target genes for immune epitope tagging:

例8に引用された参考文献
以下の参考文献はこれら全体が参照されることによって本明細書に組み込まれる。

Figure 2020191234000309
References Cited in Example 8 The following references are incorporated herein by reference in their entirety.
Figure 2020191234000309

例9-PE薬剤のインビボ送達
CRISPR/Casシステムを用いる精密なゲノム標的化テクノロジーが、最近では、遺伝子治療を包含する広い範囲の適用において調査されている。遺伝子治療におけるCas9およびCas9に基づくゲノム編集薬剤の適用の主要な限定はCas9のサイズ(>4kb)であり、組み換えアデノ随伴ウイルス(rAAV)によるその効率的な送達の足枷となる。逆転写酵素へのCas9の最近開発された融合体(「プライム編集因子」)は、存在するゲノム編集法と比べていくつもの利点を所有する新規のゲノム編集テクノロジーを表し、部位特異的な様式でいずれかの1ヌクレオチド置換を組み入れおよびヌクレオチドのいずれかの随意に定められた短い(<~20)ストレッチを挿入または欠失する能力を包含する。そのため、この方法は先には修正をし難かったヒト病原性バリアントの編集を可能化する。プライム編集試薬の送達は、ヒト疾患を引き起こす遺伝子配列の修正を可能化し得るか、または疾患を防止する遺伝子バリアントの組み入れを許し得る。
Example 9 - In vivo delivery of PE drugs
Precise genome targeting technologies using the CRISPR/Cas system have been recently explored in a wide range of applications, including gene therapy. A major limitation of the application of Cas9 and Cas9-based genome editing agents in gene therapy is the size of Cas9 (>4kb), which hampers its efficient delivery by recombinant adeno-associated viruses (rAAV). Recently developed fusions of Cas9 to reverse transcriptase ("prime editors") represent a novel genome editing technology that possesses several advantages over existing genome editing methods, including the ability to incorporate any single nucleotide substitution in a site-specific manner and to insert or delete any arbitrarily defined short (<~20) stretches of nucleotides. Thus, this method allows the editing of previously inaccessible human pathogenic variants. Delivery of prime editing reagents may enable the correction of gene sequences that cause human disease or allow the incorporation of disease-preventing gene variants.

本発明は、in vitroおよびインビボの細胞にプライム編集因子を送達するための方法を記載する。プライム編集因子は培養細胞だけにおいて開発および特徴付けられている。公知の方法はプライム編集因子をインビボで送達し得ない。rAAVまたは予めアセンブリされたリボヌクレオタンパク質(RNP)複合体によってプライム編集因子を送達するための本開示の方法は、インビボの送達へのいくつかの関門を克服するであろう。例えば、プライム編集因子をコードするDNAはrAAVパッケージング限界よりも大きく、そのため、特殊な解決を要求する。1つのかかる解決は分裂インテインペアに融合された編集因子を製剤することであり、これらが2つの別個のrAAV粒子にパッケージングされる。これらは細胞に同時送達されるときに機能的な編集因子タンパク質を再構成する。プライム編集の固有の特色を説明するいくつかの他の特殊な考慮事項が記載され、第2部位ニッキング標的の最適化とプライム編集因子をレンチウイルスおよびrAAVを包含するウイルスベクターに適切にパッケージングすることとを包含する。 The present invention describes methods for delivering prime editing factors to cells in vitro and in vivo. Prime editing factors have only been developed and characterized in cultured cells. Known methods cannot deliver prime editing factors in vivo. The disclosed methods for delivering prime editing factors by rAAV or preassembled ribonucleoprotein (RNP) complexes will overcome several barriers to in vivo delivery. For example, the DNA encoding prime editing factors is larger than rAAV packaging limits and therefore requires special solutions. One such solution is to formulate editing factors fused to split intein pairs, which are then packaged into two separate rAAV particles. These reconstitute functional editor proteins when co-delivered to cells. Several other special considerations are described that explain the unique features of prime editing, optimization of second site nicking targets and proper packaging of prime editing factors into viral vectors including lentiviruses and rAAV. It includes things.

際立った特色はリボヌクレオタンパク質(RNP)送達製剤を用いることを包含し、プライム編集因子および近傍のニッキング標的がそれらの特異的なsgRNA/PEgRNAと予め複合体化され得る。これは可能な標的化可能な部位の範囲を増強し、DNA送達を用いた現行のデータに対して相対的に編集効率の多大な最適化を許すであろう。RNPまたはmRNA送達製剤どちらかを用いて、夫々がそれら自身のガイドRNAバリアントと複合体化するバリアントCasタンパク質が用いられ得る。これは、可能性あるニッキング座位のより多大な多様性をもまた許すであろう。そのため、いずれかの所与の適用について、より多大な効率のための最適化が達成され得るということが予想される。RNPを用いると、それは先のRNP報告に基づいて編集特異性を増大させることが予想される(Rees et al.,2017)。これはオフターゲットプライム編集を縮減するであろう。インビボまたはエクスビボの送達のためにプライム編集因子を2つのAAVベクターへと分裂するための可能性あるアーキテクチャが記載される。プライム編集因子を二元的AAVシステムにパッケージングすることは、分裂部位、再構成方法(例えばインテイン)、およびガイド発現アーキテクチャを包含するデザイン考慮事項の最適化を要求する。プライム編集因子の送達のためのウイルスおよびRNPの混合物を用いると、編集が経時的にコントロールされるであろうということが予想される。なぜなら、RNPはインビボでは結局は分解し、これはRNPがもはや供給されない後にはプライム編集をストップするであろうからである。 Distinguishing features include the use of ribonucleoprotein (RNP) delivery formulations, where prime editing factors and nearby nicking targets can be pre-complexed with their specific sgRNA/PEgRNA. This will enhance the range of possible targetable sites and allow for significant optimization of editing efficiency relative to current data using DNA delivery. Variant Cas proteins, each complexed with their own guide RNA variant, can be used using either RNP or mRNA delivery formulations. This would also allow for greater diversity of possible nicking loci. It is therefore anticipated that optimization for greater efficiency can be achieved for any given application. Using RNP, it is expected to increase editing specificity based on previous RNP reports (Rees et al., 2017). This will reduce off-target prime edits. A potential architecture for splitting the prime editing factor into two AAV vectors for in vivo or ex vivo delivery is described. Packaging prime editing factors into a dual AAV system requires optimization of design considerations including the division site, reconstitution method (eg, intein), and guiding expression architecture. Using a mixture of viruses and RNPs for the delivery of prime editing factors, it is anticipated that editing will be controlled over time. This is because RNPs will eventually degrade in vivo, which will stop prime editing after RNPs are no longer supplied.

インビボおよびエクスビボのゲノムDNAを変改するために、プライム編集因子リボヌクレオタンパク質(RNP)、プライム編集因子ガイドRNAと共にmRNA、またはDNAは脂質ナノ粒子、rAAV、もしくはレンチウイルスにパッケージング、注射、摂取、または吸入され得る。ヒト疾患の動物モデルを確立、ヒト疾患の動物モデルにおいて治療学的および科学的仮説を試験、ならびにヒトの疾患を処置する目的のためを包含する。 To modify genomic DNA in vivo and ex vivo, prime editing factor ribonucleoproteins (RNPs), mRNA along with prime editing factor guide RNA, or DNA can be packaged, injected, or ingested into lipid nanoparticles, rAAV, or lentiviruses. , or can be inhaled. Includes purposes of establishing animal models of human diseases, testing therapeutic and scientific hypotheses in animal models of human diseases, and treating human diseases.

インビボの該当する細胞型への送達の好適な手段が開発される場合には、プライム編集因子は、実現可能に、全ての遺伝子疾患の大きい画分(Clinvarの病原性のヒト遺伝子バリアントの~89%)を修正するために用いられ得る。血液疾患、網膜疾患、および肝臓疾患は、他の試薬の確立された送達システムを原因として、最も蓋然的な第1の適用である。AAVカプシド、他の進化したまたは操作されたウイルスベクター、および脂質ナノ粒子製剤が、本発明との組み合わせで用いられることを必要とするであろう。 If suitable means of delivery to the relevant cell types in vivo are developed, prime editing factors could feasibly be used to treat a large fraction of all genetic diseases (~89 of the pathogenic human genetic variants of Clinvar). %). Blood diseases, retinal diseases, and liver diseases are the most likely first applications due to the established delivery systems of other reagents. AAV capsids, other evolved or engineered viral vectors, and lipid nanoparticle formulations will need to be used in combination with the present invention.

ある態様において、プライム編集因子ドメインの1つ以上(例えば、napDNAbpドメインまたはRTドメイン)がインテイン配列を有して操作され得る。 In certain embodiments, one or more of the prime editing factor domains (eg, napDNAbp domain or RT domain) can be engineered with an intein sequence.

例10-オフターゲット編集を同定するためのPEの使用
現行では、プライム編集因子によるオフターゲット編集を検出するための記載された方法はない(プライム編集それ自体がまだ公開されていない)。これらの方法は、研究者がプライム編集因子を用いてオフターゲット編集の可能性ある部位を同定することを許すであろう。これは、この技術が患者の遺伝子疾患を処置するために用いられる場合には重要な考慮事項であろう。
Example 10 - Using PE to identify off-target edits Currently, there is no described method for detecting off-target edits by prime editing factors (prime edits themselves have not yet been published). These methods will allow researchers to identify potential sites of off-target editing using prime editing factors. This would be an important consideration if this technology were to be used to treat genetic diseases in patients.

ここに記載される方法は、Casヌクレアーゼのオフターゲットを同定するためにもまた有用であり得る。これらのオフターゲットはBLESS、Guide-Seq、CIRCLE-Seq、およびDigenome-Seqを用いて先に同定されている。しかしながら、この方法はプロセスの感度および単純さにおいて有利である。 The methods described here may also be useful for identifying off-targets of Cas nucleases. These off-targets have been previously identified using BLESS, Guide-Seq, CIRCLE-Seq, and Digenome-Seq. However, this method has advantages in the sensitivity and simplicity of the process.

この側面の鍵の概念は、プライム編集を用いて、PEgRNAを鋳型とするアダプター配列またはプライマー結合部位を挿入して、Casヌクレアーゼまたはプライム編集因子のゲノムオフターゲット改変部位の急速な同定を可能化するという発想である。 The key concept in this aspect is to use prime editing to insert PEgRNA-templated adapter sequences or primer binding sites to allow rapid identification of genomic off-target modification sites for Cas nucleases or prime editing factors. This is the idea.

バイアスがない様式でプライム編集オフターゲット部位を同定するための方法は公知ではない。アダプター配列がDNA結合およびニッキングと同じイベントにおいて挿入され、下流プロセシングを単純化するので、この方法はヌクレアーゼオフターゲット部位を同定する他の技術から見分けられる。 There are no known methods to identify prime editing off-target sites in an unbiased manner. This method is distinguishable from other techniques for identifying nuclease off-target sites because the adapter sequence is inserted in the same event as DNA binding and nicking, simplifying downstream processing.

本発明は、組織培養または動物モデルにおいて、生細胞内で編集するときのオフターゲット編集部位の同定を包含する(図33を見よ)。この方法を行うためには、最終的な所望の編集因子と同一のプロトスペーサー(およびプライム編集オフターゲットを検査する場合には最終的な所望の編集因子と同一のプライマー結合部位配列)を有するが、プライム編集による逆転写後にアダプターまたはプライマー結合部位を組み入れるための必要な配列を包含するPEgRNAが生成される。インビボ編集がプライム編集因子またはRT融合ヌクレアーゼを用いて行われ、ゲノムDNAを単離する。ゲノムDNAが酵素的または機械的手段によってフラグメント化され、異なるアダプターをDNAフラグメント化の部位に付加する。PCRが用いられて、1つのアダプターからPEgRNAによって組み入れされたアダプターまで増幅する。もたらされた産物がディープ配列決定されて、全ての改変された部位を同定する。 The invention encompasses the identification of off-target editing sites when editing in living cells, in tissue culture or animal models (see Figure 33). To perform this method, you need to have a protospacer identical to the final desired editing agent (and a primer binding site sequence identical to the final desired editing agent when examining prime editing off-targets); , PEgRNA containing the necessary sequences to incorporate adapter or primer binding sites is generated after reverse transcription by prime editing. In vivo editing is performed using prime editing factors or RT fusion nucleases to isolate genomic DNA. Genomic DNA is fragmented by enzymatic or mechanical means and different adapters are added at the sites of DNA fragmentation. PCR is used to amplify from one adapter to the adapter incorporated by PEgRNA. The resulting product is deep sequenced to identify all modified sites.

本発明は、ゲノムDNAのin vitro改変を用いるオフターゲット編集部位の同定をもまた包含する(図33を見よ)。この方法を行うためには、精製されたプライム編集因子タンパク質と、アダプターまたはプライマー結合配列を組み入れるであろうが、さもなければ目当てのPEgRNAと同じであるPEgRNAとのRNPがアセンブリされる。このRNPは、DNAのフラグメント化およびDNA切断の部位への異なるアダプターの取り付けの前または後に、抽出されたゲノムDNAとインキュベーションされる。PCRが用いられて、フラグメント化された部位からPEによって組み入れされたアダプターまで増幅する。ディープ配列決定して改変の部位を同定する。細胞性のDNA修復はプライム編集因子によって追加される逆転写されたDNAアダプターを消去することがないであろうから、このin vitro編集法は検出の感度を増強するはずである。 The invention also encompasses the identification of off-target editing sites using in vitro modification of genomic DNA (see Figure 33). To perform this method, an RNP is assembled with purified prime editor protein and a PEgRNA that will incorporate an adapter or primer binding sequence, but is otherwise identical to the PEgRNA of interest. This RNP is incubated with extracted genomic DNA before or after fragmentation of the DNA and attachment of different adapters to the site of DNA cleavage. PCR is used to amplify from the fragmented site to the adapter incorporated by PE. Deep sequencing to identify sites of modification. This in vitro editing method should enhance the sensitivity of detection since cellular DNA repair will not erase the reverse transcribed DNA adapters added by the prime editing factor.

これらの方法は、いずれかのプライム編集因子、または標的のカットされる部位を認識するためにガイドRNAを用いるいずれかのゲノム編集因子(ほとんどのCasヌクレアーゼ)について、オフターゲット編集を同定するために用いられ得る。 These methods are used to identify off-target edits for either prime editing factors or for any genome editing factors (most Cas nucleases) that use a guide RNA to recognize the cut site of the target. can be used.

これらの方法は、ゲノム編集因子が処置への使用を考慮される全ての遺伝子疾患に適用され得る。 These methods can be applied to all genetic diseases for which genome editing agents are considered for use in treatment.

例11-インビボの標的タンパク質の化学物質によって誘導される二量体化を可能化するためのPEの使用
本明細書に記載のプライム編集因子は、プライム編集による低分子結合タンパク質をコードする遺伝子のゲノム取り入れによって、二量体化によって誘導される生物学的プロセス、例えば受容体シグナルを、便利な低分子薬物のコントロール下に置くためにもまた用いられ得、本明細書に記載の。本明細書に記載のプライム編集因子を用いて、低分子結合タンパク質をコードする遺伝子配列が、生細胞または患者の目当ての標的タンパク質をコードする遺伝子上に挿入され得る。この編集は単独では生理学的効果を有さないはずである。典型的には夫々が標的タンパク質のコピーに融合されている2つの薬物結合タンパク質ドメインに同時に結合し得る二量体低分子である低分子薬物の投与によって、低分子は標的タンパク質の二量体化を誘導する。それから、この標的タンパク質二量体化イベントは、生物学的シグナルイベント、例えば赤血球形成またはインスリンシグナルを誘導する。
Example 11 - Use of PE to enable chemical-induced dimerization of target proteins in vivo Genomic incorporation can also be used to bring biological processes induced by dimerization, such as receptor signaling, under the control of convenient small molecule drugs, as described herein. Using the prime editing factors described herein, gene sequences encoding small molecule binding proteins can be inserted onto genes encoding target proteins of interest in living cells or patients. This editing alone should have no physiological effect. Administration of a small molecule drug, typically a dimeric small molecule that can simultaneously bind to two drug-binding protein domains, each fused to a copy of the target protein, causes the small molecule to dimerize the target protein. induce. This targeted protein dimerization event then induces a biological signaling event, such as erythropoiesis or insulin signaling.

例12-プライム編集:二本鎖DNA切断なしのヒト細胞における高度に汎用的なかつ精密な検索置換ゲノム編集
現行のゲノム編集法は、プログラム可能なヌクレアーゼを用いて二本鎖DNA切断の随伴する副産物と共に標的遺伝子を遮断、欠失、または挿入し得、塩基編集因子を用いて標的座位に4つのトランジション点変異を組み入れ組み入れ得る。しかしながら、小さい挿入、小さい欠失、および8つのトランスバージョン点変異は、集合的にはほとんどの病原性の遺伝子バリアントを表すが、ほとんどの細胞型において、効率的にかつ余分な副産物なしに修正はされ得ない。標的部位を規定することおよび所望の編集をコードすることの両方をする操作されたプライム編集ガイドRNA(PEgRNA)によってプログラムされる操作された逆転写酵素に融合された触媒的に損なわれたCas9を用いて、新たな遺伝情報を規定されたDNA部位に直接的に書き込む高度に汎用的なかつ精密なゲノム編集法、プライム編集が本明細書に記載の。ヒト細胞の175よりも多大な別物の編集を行って、プライム編集が、標的化された挿入、欠失、全ての12の可能な型の点変異、およびそれらの組み合わせを、効率的に(未ソーティングの細胞において典型的には20-60%、最高で77%)かつ低い副産物(典型的には1-10%)によって、二本鎖切断またはドナーDNA鋳型を要求することなしになし得るということを確立した。プライム編集をヒト細胞において適用して、鎌状赤血球症(HBBのA・TからT・Aのトランスバージョンを要求する)およびテイ・サックス病(HEXAの4塩基欠失を要求する)の一次的な遺伝学的原因を修正し、両方のケースにおいて、最小限の副産物によって病原性のゲノムアレルを野生型に効率的に復帰させた。これらの病原性のHBBトランスバージョンおよびHEXA挿入変異を有するヒト細胞株を生出するために、プリオン病に対する耐性を付与するG127V変異をPRNPに組み入れるために(G・CからT・Aのトランスバージョンを要求する)、ならびにHis6タグ、FLAGエピトープタグ、および伸長されたLoxP部位をヒト細胞の標的座位に効率的に挿入するためにもまた、プライム編集を用いた。プライム編集は、HDRと比べて効率および産物純度の利点、ならびに塩基編集と比較して補完的な強さおよび弱さをオファーする。3つの別物の塩基対形成イベントを要求するその検索置換機序と整合して、プライム編集は公知のCas9オフターゲット部位においてCas9よりもかなりオフターゲットDNA改変をしにくい。プライム編集はゲノム編集の範囲および能力を実質的に拡張し、原理的には、公知の病原性のヒト遺伝子バリアントの~89%を修正し得る。
Example 12 - Prime Editing: Highly Versatile and Precise Search and Replace Genome Editing in Human Cells Without Double-Stranded DNA Breaks Current genome editing methods can use programmable nucleases to block, delete, or insert target genes with the concomitant by-products of double-stranded DNA breaks, and base editors to incorporate four transition point mutations at target loci. However, small insertions, small deletions, and eight transversion point mutations, which collectively represent most pathogenic genetic variants, cannot be corrected efficiently and without extra by-products in most cell types. Described herein is a highly versatile and precise genome editing method, prime editing, that uses a catalytically impaired Cas9 fused to an engineered reverse transcriptase that is programmed by an engineered prime editing guide RNA (PEgRNA) that both defines the target site and encodes the desired edit to directly write new genetic information into a defined DNA site. Editing more than 175 variants in human cells has established that prime editing can make targeted insertions, deletions, and point mutations of all 12 possible types, and combinations thereof, efficiently (typically 20-60% in unsorted cells, up to 77%) and with low by-products (typically 1-10%), without requiring double-strand breaks or a donor DNA template. Prime editing has been applied in human cells to correct the primary genetic cause of sickle cell disease (requiring an HBB A.T to T.A transversion) and Tay-Sachs disease (requiring a HEXA tetranucleotide deletion), efficiently reverting the pathogenic genomic allele to wild type in both cases with minimal by-products. To generate human cell lines carrying these pathogenic HBB transversion and HEXA insertion mutations, we also used prime editing to incorporate the G127V mutation (requiring a G-C to T-A transversion) that confers resistance to prion disease into PRNP, and to efficiently insert His6 tags, FLAG epitope tags, and extended LoxP sites into target loci in human cells. Prime editing offers the advantages of efficiency and product purity compared to HDR, and complementary strengths and weaknesses compared to base editing. Consistent with its search-and-replace mechanism, which requires three separate base-pairing events, prime editing is much less prone to off-target DNA modifications than Cas9 at known Cas9 off-target sites. Prime editing substantially expands the scope and capabilities of genome editing and, in principle, can correct ∼89% of known pathogenic human gene variants.

実質的にいずれかの標的化された変化をいずれかの生細胞または生物のゲノムになす能力は、生命科学の長年の熱望である。ゲノム編集テクノロジーの急速な進歩にもかかわらず、疾患に関連する>75,000の公知のヒト遺伝子バリアントの多数は111、ほとんどの治療学的に該当する細胞においては修正または組み入れされ得ない(図38A)。CRISPR-Cas9などのプログラム可能なヌクレアーゼは二本鎖DNA切断(DSB)を作り、これは挿入および欠失の混合物(インデル)を標的部位において誘導することによって遺伝子を遮断し得る112~114。ヌクレアーゼは、相同性非依存的プロセスによって、標的遺伝子を欠失115,116または外因的な遺伝子を挿入117-119するためにもまた用いられ得る。しかしながら、二本鎖DNA切断は、産物の複雑な混合物、転座120、およびp53活性化121,122を包含する望まれないアウトカムにもまた関連する。その上、病原性のアレルの大多数は、それらの非病原性のカウンターパートとは小さい挿入、欠失、または塩基置換が異なり、これらは修正するためにはかなりより精密な編集テクノロジーを要求する(図38A)。ヌクレアーゼによって誘導されるDSBによって刺激される相同組み換え修復(HDR)123は、種々の精密なDNA変化を組み入れるために広く用いられている。しかしながら、HDRは外因的なドナーDNA修復鋳型に依拠し、典型的にはDSBの末端結合修復からの余分なインデル副産物を生成し、ほとんどの治療学的に該当する細胞型では非効率的である(T細胞およびいくつかの幹細胞は重要な例外である)124,125。DSBによって媒介されるゲノム編集の効率および精度を増強することは有望な作業のフォーカスのままに留まっており126~130、これらの課題は代替的な精密ゲノム編集戦略の調査を要する。 The ability to make virtually any targeted change to the genome of any living cell or organism is a long-standing aspiration of the life sciences. Despite rapid advances in genome editing technology, many of the >75,000 known human gene variants associated with disease111 cannot be corrected or incorporated in most therapeutically relevant cells (Figure 38A). . Programmable nucleases such as CRISPR-Cas9 create double-stranded DNA breaks (DSBs), which can block genes by inducing mixtures of insertions and deletions (indels) at target sites 112 - 114 . Nucleases can also be used to delete target genes115,116 or insert exogenous genes117-119 by homology-independent processes. However, double-stranded DNA breaks are also associated with undesirable outcomes, including complex mixtures of products, translocations, 120 and p53 activation. Moreover, the majority of pathogenic alleles differ from their non-pathogenic counterparts by small insertions, deletions, or base substitutions, which require significantly more precise editing technologies to correct. (Figure 38A). Homologous recombination repair (HDR) stimulated by nuclease-induced DSBs 123 has been widely used to incorporate a variety of precise DNA changes. However, HDR relies on exogenous donor DNA repair templates, typically generates extra indel byproducts from end-joining repair of DSBs, and is inefficient in most therapeutically relevant cell types. (T cells and some stem cells are important exceptions) 124,125 . Enhancing the efficiency and precision of genome editing mediated by DSBs remains the focus of promising work , 126-130 and these challenges require investigation of alternative precision genome editing strategies.

塩基編集は、哺乳動物を包含する広い種々の細胞型および生物において、DSBを要求することなしに、4つの型のトランジション変異(CからT、GからA、AからG、およびTからC)を効率的に組み入れまたは修正し得るが128~131、現行では、8つのトランスバージョン変異(CからA、CからG、GからC、GからT、AからC、AからT、TからA、およびTからG)のいずれか、例えば鎌状赤血球症の最も普通の原因(HBB E6V)を直接的に修正するために必要とされるT・AからA・Tの変異を達成し得ない132。加えて、標的の欠失、例えばテイ・サックス病を引き起こす4塩基重複(HEXA 1278+TATC)の除去133、または標的化された挿入、例えば嚢胞性線維症の最も普通の原因(CFTR ΔF508)を直接的に修正するために要求される精密な3塩基挿入134を行うためのDSBフリーの方法は報告されていない。それゆえに、それらは集合的にほとんどの公知の病原性アレルを説明するにもかかわらず、標的化されたトランスバージョン点変異、挿入、および欠失は、ほとんどの細胞型においては効率的にかつ余分な副産物なしに組み入れまたは修正することが困難である(図38A)。 Base editing produces four types of transition mutations (C to T, G to A, A to G, and T to C) in a wide variety of cell types and organisms, including mammals, without requiring DSBs. 128-131 Currently, eight transversion mutations (C to A, C to G, G to C, G to T, A to C, A to T, T to A , and T to G), e.g., the T A to A T mutation required to directly correct the most common cause of sickle cell disease (HBB E6V) cannot be achieved. 132 . In addition, targeted deletions, e.g. removal of the four base duplication (HEXA 1278+TATC) that causes Tay-Sachs disease (HEXA 1278+TATC) 133 , or targeted insertions, e.g. the most common cause of cystic fibrosis (CFTR ΔF508) No DSB-free method has been reported to perform the precise three-base insertions 134 required for direct modification. Therefore, targeted transversion point mutations, insertions, and deletions are efficient and redundant in most cell types, even though they collectively account for most known pathogenic alleles. difficult to incorporate or modify without harmful by-products (Figure 38A).

二本鎖DNA切断またはドナーDNA鋳型を要求することなしに、ヒト細胞の標的座位における標的化された挿入、欠失、および全ての12の可能な塩基から塩基の変換を媒介する新たな「検索置換」ゲノム編集テクノロジー、プライム編集の開発が本明細書に記載の。当初にPE1によって例示されたプライム編集因子は、プログラム可能なニッカーゼに融合された逆転写酵素とプライム編集の伸長されたガイドRNA(PEgRNA)とを用いて、遺伝情報をPEgRNA上の伸長から標的ゲノム座位に直接的にコピーする。第2世代プライム編集因子(PE2)は、操作された逆転写酵素を用いて最小限の(典型的には<2%)インデル形成によって編集効率を実質的に増大させ、第3世代PE3システムは第2のガイドRNAを追加して非編集鎖にニッキングし、それによって非編集鎖の置き換えを好み、約1~10%インデル形成によってヒト細胞において典型的には約20~50%まで編集効率をさらに増大させる。PE3は最適化されたCas9ヌクレアーゼによって開始されるHDRと比較してずっと少数の副産物および高いかまたは類似の効率をオファーし、現行世代の塩基編集因子と比較して補完的な強さおよび弱さをオファーする。 A new “search” mediates targeted insertions, deletions, and base conversions from all 12 possible bases at target loci in human cells without requiring double-stranded DNA breaks or donor DNA templates. The development of a 'replacement' genome editing technology, prime editing, is described herein. Prime editing factors, originally exemplified by PE1, use a reverse transcriptase fused to a programmable nickase and a prime editing extended guide RNA (PEgRNA) to transfer genetic information from an extension on PEgRNA to a target genome. Copy directly to the locus. The second generation prime editing factor (PE2) uses an engineered reverse transcriptase to substantially increase editing efficiency with minimal (typically <2%) indel formation, and the third generation PE3 system A second guide RNA is added to nick the non-edited strand, thereby favoring its displacement, increasing the editing efficiency to typically about 20-50% in human cells by about 1-10% indel formation. Increase further. PE3 offers much fewer byproducts and higher or similar efficiency compared to optimized Cas9 nuclease-initiated HDR, and complementary strengths and weaknesses compared to current generation base editors. Make an offer.

PE3をヒトHEK293T細胞のゲノム座位において適用して、HBB E6Vから野生型HBBへの効率的変換、HEXA 1278+TATCを野生型HEXAに復元するための挿入されたTATCの欠失、プリオン病に対する耐性を付与するG127V変異のPRNPへの組み入れ135(G・CからT・Aのトランスバージョンを要求する)、ならびにHis6タグ(18bp)、FLAGエピトープタグ(24bp)、およびCreによって媒介される組み換えのための伸長されたLoxP部位(44bp)の標的化された挿入を達成した。プライム編集は3つの他のヒト細胞株および有糸分裂後初代マウス皮質ニューロンにおいてもまた様々な効率で首尾良かった。当初のニックおよび編集の位置付けの間の距離の高い度合のフレキシビリティーを原因として、プライム編集はCas9のPAM要件によって実質的に制約されず、原理的にはゲノム座位の大多数を標的化し得る。蓋然的には、生産的なプライム編集が生起するための3つの別物のDNA塩基対形成イベントという要件を原因として、オフターゲットプライム編集は公知のCas9オフターゲット座位におけるオフターゲットCas9編集よりもかなり稀である。精密な標的化された挿入、欠失、および全ての12の可能なクラスの点変異を広い種々のゲノム座位においてDSBまたはドナーDNA鋳型の必要なしに可能化することによって、プライム編集は多くの遺伝子バリアントの研究および修正を進歩させるポテンシャルを有する。 Application of PE3 at the genomic locus of human HEK293T cells for efficient conversion of HBB E6V to wild-type HBB, deletion of inserted TATC to restore HEXA 1278+TATC to wild-type HEXA, and resistance to prion disease. Incorporation of the G127V mutation into PRNP that confers 135 (requiring G·C to T·A transversion), as well as a His6 tag (18bp), a FLAG epitope tag (24bp), and for recombination mediated by Cre. Targeted insertion of an extended LoxP site (44 bp) was achieved. Prime editing was also successful with varying efficiencies in three other human cell lines and in postmitotic primary mouse cortical neurons. Due to the high degree of flexibility in the distance between the initial nick and editing position, prime editing is not substantially constrained by the PAM requirements of Cas9 and could in principle target the majority of genomic loci. . Off-target prime editing is much rarer than off-target Cas9 editing at known Cas9 off-target loci, likely due to the requirement of three distinct DNA base pairing events for productive prime editing to occur. It is. By allowing precise targeted insertions, deletions, and point mutations in all 12 possible classes at a wide variety of genomic loci without the need for DSBs or donor DNA templates, prime editing can It has the potential to advance variant research and modification.

結果
伸長されたガイドRNAからの情報を標的DNA座位上に移入するための戦略
Cas9は、標的DNA部位にハイブリダイズするスペーサー配列を含有するガイドRNAを用いてDNAを標的化する112~114,136,137。狙いは、天然のCRISPRシステムのようにDNA標的を規定するように138,139、また、標的座位の対応するDNAヌクレオチドを置き換える新たな遺伝情報を含有するように両方でガイドRNAを操作することであった。伸長されたガイドRNAから規定されたDNA部位への遺伝情報の直接的移入、次に元々の編集されないDNAの置き換えは、原理的には、DSBまたはドナーDNA鋳型への依存性なしに、標的化されたDNA配列変化を生細胞に組み入れる一般的手段を提供し得る。この直接的情報移入を達成するために、狙いは、3'-ヒドロキシル基を暴露するように標的部位においてニッキングされたゲノムDNAを用いて、操作されたガイドRNA(これ以降では、プライム編集ガイドRNAまたはPEgRNAと言われる)の伸長から直接的に標的部位への遺伝情報の逆転写をプライムすることであった(図38A)。
Results Strategies for importing information from elongated guide RNA onto target DNA loci
Cas9 targets DNA using a guide RNA containing a spacer sequence that hybridizes to the target DNA site. The aim was to engineer the guide RNA both to define the DNA target as in the natural CRISPR system, 138,139 and also to contain new genetic information that replaces the corresponding DNA nucleotide at the target locus. . Direct transfer of genetic information from an elongated guide RNA to a defined DNA site, then replacing the original unedited DNA, could, in principle, result in targeted transfer without dependence on DSBs or donor DNA templates. This provides a general means of incorporating modified DNA sequence changes into living cells. To achieve this direct information transfer, the aim is to use engineered guide RNA (hereinafter prime edited guide RNA or PEgRNA) directly from the elongation to the target site (Figure 38A).

いくつかの天然の可動遺伝因子によって用いられる機序に似るニッキングおよび逆転写のこれらの当初のステップは140、2つの冗長性の一本鎖DNAフラップを1つの鎖上に有する分岐した中間体をもたらす:編集されないDNA配列を含有する5'フラップおよびPEgRNAからコピーされた編集された配列を含有する3'フラップである(図38B)。首尾良い編集を達成するためには、編集された3'フラップが編集されない5'フラップを置き換えるようにして、この分岐した中間体は分解されなければならない。編集された3'フラップは編集されない鎖とより少数の塩基対を作り得るので、編集されない鎖との5'フラップのハイブリダイゼーションは熱力学的に有利であることが蓋然的であるが、5'フラップはFEN1などの構造特異的エンドヌクレアーゼの好ましい基質である141。これは、ラギング鎖DNA合成およびロングパッチ塩基除去修復の間に生成された5'フラップを切り出す。選好的5'フラップ切除および3'フラップライゲーションは、編集されたDNA鎖の組み込みを駆動し得、1つの編集された鎖および1つの編集されない鎖を含有するヘテロ二重鎖DNAを生出するということが推論された(図38B)。 These initial steps of nicking and reverse transcription, similar to the mechanisms used by some naturally occurring mobile genetic elements140 , produced a branched intermediate with two redundant single-stranded DNA flaps on one strand. Result: a 5' flap containing unedited DNA sequences and a 3' flap containing edited sequences copied from PEgRNA (Figure 38B). To achieve successful editing, this branched intermediate must be resolved such that the edited 3' flap replaces the unedited 5' flap. Since the edited 3' flap can make fewer base pairs with the unedited strand, hybridization of the 5' flap with the unedited strand is likely to be thermodynamically favorable, whereas the 5' Flap is a preferred substrate for structure-specific endonucleases such as FEN1 141 . This excises the 5' flap generated during lagging strand DNA synthesis and long patch base excision repair. That preferential 5' flap excision and 3' flap ligation can drive the incorporation of edited DNA strands, producing heteroduplex DNA containing one edited strand and one unedited strand. was inferred (Figure 38B).

編集の永久的な組み入れは、編集された鎖から相補的なDNA鎖に情報をコピーする様式で、2つのDNA鎖間のミスマッチを分解する爾後のDNA修復から発生し得る(図38C)。DNA塩基編集の効率を最大化するために開発された類似の戦略に基づいて131~133、二本鎖切断形成を最小化するために当初のニックの部位から十分遠くにおける非編集DNA鎖へニックを入れることは、非編集鎖を選好的に置き換えるようにDNA修復を偏らせ得るということが想定された。 Permanent incorporation of an edit can occur from subsequent DNA repair that resolves the mismatch between the two DNA strands in a manner that copies information from the edited strand to the complementary DNA strand (Figure 38C). Based on similar strategies developed to maximize the efficiency of DNA base editing, 131-133 nicks into the unedited DNA strand at a sufficient distance from the site of the original nick to minimize double-strand break formation. It was hypothesized that the inclusion of a molecule could bias DNA repair to preferentially replace the non-edited strand.

in vitroおよび酵母細胞におけるプライム編集ステップの検証
Cas9のRuvCヌクレアーゼドメインによるPAM含有DNA鎖の切断後に、この鎖のPAM遠位フラグメントは、さもなければ安定なCas9:sgRNA:DNA複合体から解離し得る143。この解放された鎖の3'端は、DNA重合をプライムするために十分にアクセス可能であり得るという仮説が立てられた。ガイドRNA操作作業144~146およびCas9:sgRNA:DNA複合体の結晶構造147~149は、sgRNAの5'および3'末端がCas9:sgRNA活性を廃止することなしに伸長され得るということを示唆する。2つの重大な構成要素を包含するようにsgRNAを伸長することによって、PEgRNAをデザインした:ニッキングされたDNA鎖の3'端がPEgRNAにハイブリダイズすることを許すプライマー結合部位(PBS)、およびニッキングされたDNA鎖の3'端がポリメラーゼによってRNA鋳型上を伸長されるとゲノムDNA部位に直接的にコピーされるであろう所望の編集を含有する逆転写酵素(RT)鋳型である(図38C)。
Validation of the prime editing step in vitro and in yeast cells
Following cleavage of the PAM-containing DNA strand by the RuvC nuclease domain of Cas9, the PAM-distal fragment of this strand may dissociate from the otherwise stable Cas9:sgRNA:DNA complex.143 It was hypothesized that the 3' end of this released strand may be sufficiently accessible to prime DNA polymerization. Guide RNA engineering work144-146 and the crystal structure of the Cas9:sgRNA:DNA complex147-149 suggest that the 5' and 3' ends of the sgRNA can be extended without abolishing Cas9:sgRNA activity. PEgRNA was designed by extending the sgRNA to encompass two critical components: a primer binding site (PBS) that allows the 3' end of the nicked DNA strand to hybridize to the PEgRNA, and a reverse transcriptase (RT) template containing the desired edit that would be copied directly into the genomic DNA site once the 3' end of the nicked DNA strand is extended onto the RNA template by a polymerase (Figure 38C).

これらの仮説を、精製されたS.pyogenes Cas9タンパク質を用いてin vitroで試験した。sgRNAをどちらかの末端においてPBS配列(5から6ヌクレオチド、nt)およびRT鋳型(7から22nt)によって伸長することによって、一連のPEgRNA候補を構築した。5'伸長されたPEgRNAは標的DNAに対するCas9結合を導くということ、ならびに5'伸長されたPEgRNAおよび3'伸長されたPEgRNA両方がin vitroのCas9によって媒介される標的ニッキングと哺乳類細胞におけるDNA切断活性とを支持するということが確認された(図44A~44C)。これらの候補PEgRNAデザインを、予めニックが入った5'-Cy5標識dsDNA基質、触媒的に不活性型Cas9(dCas9)、およびモロニーマウス白血病ウイルス(M-MLV)逆転写酵素の市販のバリアントを用いて試験した(図44D)。全ての構成要素が存在するときには、ゲル移動度によって、蛍光標識されたDNA鎖からより長いDNA産物への効率的な変換が観察され、RT鋳型に沿った逆転写と整合した(図38D、図44D~44E)。所望の長さの産物が、5'伸長または3'伸長されたPEgRNAどちらかで形成された(図38D-38E)。dCas9の省略は、PEgRNA情報移入なしに、DNA鋳型上の逆転写酵素によって媒介されるDNA重合に由来するニックトランスレーション産物に至った(図38D)。PEgRNAが従来のsgRNAによって置き換えられたときには、DNA重合産物は観察されず、PEgRNAのPBSおよびRT鋳型構成要素の必要性を確認した(図38D)。これらの結果は、Cas9によって媒介されるDNA融解が一本鎖Rループを暴露し、これは、ニッキングされる場合には、5'伸長または3'伸長されたPEgRNAどちらかからの逆転写をプライムすることに有能であるということを実証している。 These hypotheses were tested in vitro using purified S. pyogenes Cas9 protein. A series of PEgRNA candidates were constructed by extending the sgRNA at either end with a PBS sequence (5 to 6 nucleotides, nt) and an RT template (7 to 22 nt). that 5'-extended PEgRNA directs Cas9 binding to target DNA, and that both 5'-extended and 3'-extended PEgRNA exhibit Cas9-mediated target nicking in vitro and DNA cleavage activity in mammalian cells. It was confirmed that it supported the following (Figures 44A to 44C). These candidate PEgRNA designs were developed using a pre-nicked 5'-Cy5-labeled dsDNA substrate, catalytically inactive Cas9 (dCas9), and a commercially available variant of Moloney murine leukemia virus (M-MLV) reverse transcriptase. (Figure 44D). When all components were present, efficient conversion of fluorescently labeled DNA strands to longer DNA products was observed by gel mobility, consistent with reverse transcription along the RT template (Figure 38D, Figure 44D-44E). Products of the desired length were formed with either 5' or 3' extended PEgRNA (Figures 38D-38E). Omission of dCas9 led to nick translation products derived from reverse transcriptase-mediated DNA polymerization on the DNA template without PEgRNA information transfer (Figure 38D). No DNA polymerization products were observed when PEgRNA was replaced by conventional sgRNA, confirming the need for the PBS and RT template components of PEgRNA (Figure 38D). These results demonstrate that Cas9-mediated DNA melting exposes single-stranded R-loops, which, when nicked, prime reverse transcription from either 5'- or 3'-extended PEgRNAs. Demonstrates that he or she is capable of doing so.

次に、ニッキングされないdsDNA基質を、専らPAM含有鎖へニックを入れるCas9ニッカーゼ(H840A変異体)によって試験した112。これらの反応では、ことによると損なわれたCas9ニッカーゼ活性を原因として、5'伸長されたPEgRNAは逆転写産物を非効率的に生成した(図44F)。しかしながら、3'伸長されたPEgRNAはロバストなCas9ニッキングおよび効率的な逆転写を可能化した(図38E)。原理的には逆転写がPEgRNAの残りのどこかで終結するポテンシャルにもかかわらず、3'伸長されたPEgRNAの使用は単一の明らかな産物のみを生成した。Cas9ニッカーゼ、RT、および3'伸長されたPEgRNAによる反応の産物のDNA配列決定は、完全なRT鋳型配列がDNA基質へと逆転写されるということを明らかにした(図44G)。これらの実験は、3'伸長されたPEgRNAが、Cas9ニッカーゼ活性を導く能力を保持しながら、新たなDNA鎖の逆転写の鋳型となり得るということを確立した。 The unnicked dsDNA substrate was then tested with a Cas9 nickase (H840A mutant) that exclusively nicks PAM-containing strands. In these reactions, the 5'-extended PEgRNA produced reverse transcripts inefficiently (Figure 44F), possibly due to impaired Cas9 nickase activity. However, 3' extended PEgRNA enabled robust Cas9 nicking and efficient reverse transcription (Figure 38E). Despite the potential in principle for reverse transcription to terminate anywhere on the remainder of the PEgRNA, the use of 3'-extended PEgRNA produced only a single apparent product. DNA sequencing of the products of the reaction with Cas9 nickase, RT, and 3' extended PEgRNA revealed that the complete RT template sequence was reverse transcribed into the DNA substrate (Figure 44G). These experiments established that 3'-extended PEgRNA can serve as a template for reverse transcription of new DNA strands while retaining the ability to direct Cas9 nickase activity.

in vitroのPEgRNAによってプログラムされる逆転写によって生ずる3'フラップの真核細胞DNA修復アウトカムを評価するために、レポータープラスミド基質に対するin vitroのPEgRNA、Cas9ニッカーゼ、およびRTを用いるDNAニッキングおよび逆転写を行い、それから、反応産物を酵母(S.cerevisiae)細胞に形質転換した(図45A)。心強いことに、プラスミドが、未成熟停止コドンを修正するT・AからA・Tのトランスバージョンをコードする3'伸長されたPEgRNAによってin vitroで編集されたときには、酵母形質転換体の37%がGFPおよびmCherryタンパク質両方を発現した(図38F、図45C)。図38Eおよび図44Fの結果と整合して、5'伸長されたPEgRNAによってin vitroで実行された編集反応は、3'伸長されたPEgRNAによるものよりも少数のGFPおよびmCherry二重陽性コロニー(9%)を生んだ(図38Fおよび図45D)。生産的な編集は、フレームシフト変異を修正するために1ヌクレオチドを挿入するか(15%の二重陽性形質転換体)または1ヌクレオチドを欠失する(29%の二重陽性形質転換体)3'伸長されたPEgRNAを用いてもまた観察された(図38Fおよび図45E~45F)。二重陽性の酵母コロニーから回復した編集されたプラスミドのDNA配列決定は、コードされるトランスバージョン編集が所望の配列位置において生起するということを確認した(図45G)。これらの結果は、真核細胞のDNA修復がプライム編集から発生する3'DNAフラップを分解して、トランスバージョン、挿入、および欠失を包含する精密なDNA編集を組み込み得るということを実証している。 DNA nicking and reverse transcription using in vitro PEgRNA, Cas9 nickase, and RT on reporter plasmid substrates to evaluate eukaryotic DNA repair outcomes of 3' flaps produced by in vitro PEgRNA-programmed reverse transcription. and the reaction products were then transformed into yeast (S. cerevisiae) cells (Figure 45A). Encouragingly, 37% of yeast transformants Both GFP and mCherry proteins were expressed (Figure 38F, Figure 45C). Consistent with the results in Figures 38E and 44F, the editing reaction performed in vitro with 5'-extended PEgRNA resulted in fewer GFP and mCherry double-positive colonies (9) than with 3'-extended PEgRNA. %) (Figures 38F and 45D). Productive editing involves inserting one nucleotide (15% of double-positive transformants) or deleting one nucleotide (29% of double-positive transformants) to correct the frameshift mutation. 'Also observed with elongated PEgRNA (Figure 38F and Figures 45E-45F). DNA sequencing of edited plasmids recovered from double-positive yeast colonies confirmed that the encoded transversion edit occurred at the desired sequence position (Figure 45G). These results demonstrate that eukaryotic DNA repair can disassemble the 3' DNA flap generated from prime editing and incorporate precision DNA editing encompassing transversions, insertions, and deletions. There is.

プライム編集因子1(PE1)のデザイン
in vitroのおよび酵母の結果によって促されて、哺乳類細胞のゲノムDNAを編集することができる最小の数の構成要素によるプライム編集システムを、開発のために探求した。3'伸長されたPEgRNA(これ以降では単純にPEgRNAと言われる。図39A)とフレキシブルなリンカーを介した逆転写酵素へのCas9 H840Aの直接的融合体とは、機能的な2構成要素プライム編集システムを構成し得るという仮説が立てられた。HEK293T(不死化ヒト胎児腎臓)細胞を、Cas9 H840Aニッカーゼのどちらかの末端への野生型M-MLV逆転写酵素の融合体をコードする1つのプラスミドと、PEgRNAをコードする第2のプラスミドとによってトランスフェクションした。当初の試みはHEK3標的座位における検出可能なT・AからA・Tの変換には至らなかった。
Design of Prime Editing Factor 1 (PE1)
Prompted by the in vitro and yeast results, we sought to develop a prime editing system with a minimal number of components capable of editing genomic DNA in mammalian cells. A direct fusion of Cas9 H840A to the 3'-extended PEgRNA (hereafter simply referred to as PEgRNA, Figure 39A) and reverse transcriptase via a flexible linker is a functional two-component prime editing It was hypothesized that a system could be constructed. HEK293T (immortalized human embryonic kidney) cells were infected with one plasmid encoding a fusion of wild-type M-MLV reverse transcriptase to either end of Cas9 H840A nickase and a second plasmid encoding PEgRNA. transfected. Initial attempts did not result in a detectable T·A to A·T conversion at the HEK3 target locus.

しかしながら、8-15塩基へのPEgRNA上のPBSの伸長は(図39A)、HEK3標的部位における検出可能なT・AからA・Tの編集に至った(図39B)。RTがCas9ニッカーゼのC末端に融合されたプライム編集因子構築物(8~15ntの範囲であるPBS長さによって、3.7%の最大のT・AからA・Tの変換)では、N末端RT-Cas9ニッカーゼ融合体(1.3%の最大のT・AからA・Tの変換)と比較して高い効率であった(図39B;別様に規定されない限り、本願の全ての哺乳類細胞データは、セレクションまたはソーティングなしの処置された細胞集団全体の値を報告している)。これらの結果は、トランスで供給されるM-MLV RTの市販のバリアントを用いてin vitroで要求されるものと比較して、Cas9に融合された野生型M-MLV RTがヒト細胞におけるゲノム編集のための長いPBS配列を要求するということを示唆する。Cas9 H840AニッカーゼのC末端に融合されたこの第1世代野生型M-MLV逆転写酵素はPE1として指定された。 However, extension of PBS on PEgRNA to bases 8-15 (FIG. 39A) led to detectable T·A to A·T editing at the HEK3 target site (FIG. 39B). In prime editing factor constructs in which RT was fused to the C-terminus of Cas9 nickase (3.7% maximal T·A to A·T conversion, depending on PBS length ranging from 8 to 15 nt), the N-terminal RT-Cas9 nickase fusion (maximal T A to A T conversion of 1.3%) (Figure 39B; unless otherwise specified, all mammalian cell data in this application refers to selection or (Reporting values for the entire treated cell population without sorting). These results demonstrate that wild-type M-MLV RT fused to Cas9 improves genome editing in human cells compared to that required in vitro using commercially available variants of M-MLV RT delivered in trans. suggests that long PBS sequences are required for This first generation wild-type M-MLV reverse transcriptase fused to the C-terminus of Cas9 H840A nickase was designated as PE1.

PEgRNAによって規定される4つの追加のゲノム標的部位におけるトランスバージョン点変異を精密に導入するPE1の能力(図39C)を試験した。HEK3座位における編集と類似に、これらのゲノム部位における効率はPBS長さに依存的であり、最大の編集効率は0.7-5.5%の範囲であった(図39C)。PE1からのインデルは低く、各部位の編集効率を最大化する条件下において、5つの部位について平均で0.2±0.1%であった(図46A)。PE1は、HEK3座位において、1ヌクレオチド欠失(4.0%効率)、1ヌクレオチド挿入(9.7%)、および3ヌクレオチド挿入(17%)によって例示される標的化された挿入および欠失を組み入れる能力があった(図39C)。これらの結果は、二本鎖DNA切断またはDNA鋳型を要求することなしに、標的化されたトランスバージョン、挿入、および欠失を直接的に組み入れるPE1の能力を確立する。 The ability of PE1 to precisely introduce transversion point mutations at four additional genomic target sites defined by PEgRNA (Figure 39C) was tested. Similar to editing at the HEK3 locus, efficiency at these genomic sites was dependent on PBS length, with maximum editing efficiency ranging from 0.7-5.5% (Figure 39C). Indels from PE1 were low, averaging 0.2±0.1% for the five sites under conditions that maximized the editing efficiency of each site (Figure 46A). PE1 is capable of incorporating targeted insertions and deletions at the HEK3 locus, exemplified by 1-nucleotide deletions (4.0% efficiency), 1-nucleotide insertions (9.7%), and 3-nucleotide insertions (17%). (Figure 39C). These results establish the ability of PE1 to directly incorporate targeted transversions, insertions, and deletions without requiring double-stranded DNA breaks or DNA templates.

プライム編集因子2(PE2)のデザイン Design of Prime Editing Factor 2 (PE2)

PE1は種々の編集をHEK293T細胞のいくつかの座位において組み入れ組み入れ得るが、編集効率は一般的に低かった(典型的には≦5%)(図39C)。PE1の逆転写酵素を操作することは、プライム編集複合体の固有の立体配座制約内でDNA合成の効率を改善し得、より高いゲノム編集収量をもたらすという仮説が立てられた。酵素熱安定性150,151、処理能力150、およびDNA:RNAヘテロ二重鎖基質親和性152を増大させる、ならびにRNaseH活性を不活性化する153M-MLV RT変異が先に報告されている。種々の逆転写酵素変異を含有する19のPE1バリアントを構築して、それらのプライム編集効率をヒト細胞において評価した。 Although PE1 could incorporate various edits at several loci in HEK293T cells, the editing efficiency was generally low (typically ≦5%) (Figure 39C). It was hypothesized that engineering the reverse transcriptase of PE1 could improve the efficiency of DNA synthesis within the unique conformational constraints of the prime editing complex, resulting in higher genome editing yields. M-MLV RT mutations have been previously reported that increase enzyme thermostability , processivity , and DNA:RNA heteroduplex substrate affinity, as well as inactivate RNase H activity. Nineteen PE1 variants containing various reverse transcriptase mutations were constructed and their prime editing efficiencies were evaluated in human cells .

第1に、上昇した温度における逆転写を支持するそれらの能力について先に実験室進化から新興した一連のM-MLV RTバリアント150を取り調べた。これ以降ではM3と言われるM-MLV RT上へのこれらのアミノ酸置換の3つ(D200N、L603W、およびT330P)の順次の導入は、PE1のものと比較して、HEK293T細胞の5つのゲノム座位におけるトランスバージョンおよび挿入編集効率の6.8倍の平均の増大に至った(図47A-47S)。 First, we interrogated a series of 150 M-MLV RT variants that had previously emerged from laboratory evolution for their ability to support reverse transcription at elevated temperatures. Sequential introduction of three of these amino acid substitutions (D200N, L603W, and T330P) onto M-MLV RT, hereafter referred to as M3, resulted in five genomic loci in HEK293T cells compared to that of PE1. (Figures 47A-47S).

次に、M3との組み合わせで、鋳型:PBS複合体に対する結合、酵素処理能力、および熱安定性を増強することが先に示された追加の逆転写酵素変異152を試験した。分析された14の追加の変異体のうち、M3変異に加えてT306KおよびW313F置換を有するバリアントは、ヒト細胞の5つのゲノム部位における6つのトランスバージョンまたは挿入編集について、M3と比較して編集効率を追加の1.3倍から3.0倍改善した(図47A~47S)。PE1アーキテクチャに組み込まれたM-MLV逆転写酵素のこの五重変異体(Cas9 H840A-M-MLV RT(D200N L603W T330P T306K W313F))はこれ以降ではPE2と言われる。 Next, we tested additional reverse transcriptase mutations 152 that were previously shown to enhance binding to template:PBS complexes, enzymatic processability, and thermostability in combination with M3. Among the 14 additional variants analyzed, the variant with T306K and W313F substitutions in addition to the M3 mutation showed higher editing efficiency compared to M3 for 6 transversion or insertion edits at 5 genomic sites in human cells. was improved by 1.3 to 3.0 times compared to the addition (Figures 47A to 47S). This quintuple mutant of M-MLV reverse transcriptase (Cas9 H840A-M-MLV RT(D200N L603W T330P T306K W313F)) integrated into the PE1 architecture is referred to as PE2 from here on.

PE2は、1ヌクレオチドトランスバージョン、挿入、および欠失変異をPE1よりも実質的に高い効率で組み入れし(図39C)、より短いPBS PEgRNA配列と適合性であり(図39C)、一過性のゲノムDNA:PBS複合体に生産的に係合する増強された能力と整合する。平均で、PE2はPE1と比べてプライム編集点変異効率の1.6から5.1倍の改善に至り(図39C)、いくつかのケースでは、編集収量を最高で46倍まで劇的に改善した(図47Fおよび図47I)。PE2は標的化された挿入および欠失をPE1よりも効率的に成し遂げ、PE1によってこの挿入を組み入れる効率と比べて15倍の改善の4.5%の効率でHEK3座位における24bp FLAGエピトープタグの標的化された挿入を達成し(図47D)、PE1のものよりも2.1倍高い8.6%の効率でHEK3の1bp欠失を媒介した(図39C)。これらの結果はPE2をPE1よりも効率的なプライム編集因子として確立する。 PE2 incorporates single-nucleotide transversion, insertion, and deletion mutations with substantially higher efficiency than PE1 (Figure 39C), is compatible with shorter PBS PEgRNA sequences (Figure 39C), and Consistent with an enhanced ability to productively engage genomic DNA:PBS complexes. On average, PE2 led to a 1.6- to 5.1-fold improvement in prime edit point mutation efficiency compared to PE1 (Figure 39C), and in some cases dramatically improved editing yield by up to 46-fold (Figure 47F). and Figure 47I). PE2 accomplished targeted insertions and deletions more efficiently than PE1, targeting a 24bp FLAG epitope tag at the HEK3 locus with an efficiency of 4.5%, a 15-fold improvement compared to the efficiency of incorporating this insertion by PE1. (Figure 47D) and mediated a 1 bp deletion in HEK3 with an efficiency of 8.6%, 2.1-fold higher than that of PE1 (Figure 39C). These results establish PE2 as a more efficient prime editing factor than PE1.

PEgRNA特色の最適化 Optimization of PEgRNA characteristics

PEgRNAアーキテクチャおよびプライム編集効率の間の関係性をHEK293T細胞の5つのゲノム座位においてPE2によって体系的に探査した(図39C)。一般的に、より低いGC含量を有するプライム部位はより長いPBS配列を要求するが(EMX1およびRNF2。夫々40%および30%GC含量をニックの上流の最初の10ntに含有する)、より多大なGC含量を有するものはより短いPBS配列によるプライム編集を支持し(HEK4およびFANCF。夫々80%および60%GC含量をニックの上流の最初の10ntに含有する)(図39C)、PEgRNA PBSに対するニッキングされたDNA鎖のハイブリダイゼーションのためのエネルギー的要件と整合する。PBS長さまたはGC含量レベルはプライム編集効率を厳格には予測せず、DNAプライマーまたはPEgRNA伸長の二次構造などの他の因子もまた編集活性に影響を及ぼし得る。典型的な標的配列では~13ntのPBS長さから出発し、配列が、~40~60%GC含量から逸脱する場合には異なるPBS長さを調査することが推奨される。必要なときには、最適なPBS配列は経験的に決定されるはずである。 The relationship between PEgRNA architecture and prime editing efficiency was systematically explored with PE2 at five genomic loci in HEK293T cells (Figure 39C). In general, prime sites with lower GC content require longer PBS sequences (EMX1 and RNF2, which contain 40% and 30% GC content in the first 10 nt upstream of the nick, respectively), but with more extensive Those with GC content favor prime editing with shorter PBS sequences (HEK4 and FANCF, which contain 80% and 60% GC content in the first 10 nt upstream of the nick, respectively) (Figure 39C), and PEgRNA nicking against PBS. consistent with the energetic requirements for hybridization of the hybridized DNA strands. PBS length or GC content level does not strictly predict prime editing efficiency, and other factors such as secondary structure of DNA primers or PEgRNA extension may also influence editing activity. It is recommended to start with a PBS length of ˜13 nt for typical target sequences and explore different PBS lengths if the sequence deviates from ˜40-60% GC content. When necessary, the optimal PBS sequence should be determined empirically.

次に、PEgRNAのRT鋳型部分の性能決定要因を研究した。長さが10~20ntの範囲であるRT鋳型を有するPEgRNAを、5つのゲノム標的部位においてPE2を用いて(図39D)および31ntほども長いより長いRT鋳型によって3つのゲノム部位において(図48A~48C)体系的に評価した。PBS長さのように、RT鋳型長さもまたプライム編集効率を最大化するために変えられ得るが、一般的には、多くのRT鋳型長さ≧10nt長はより効率的なプライム編集を支持する(図39D)。いくつかの標的部位はより高い編集効率(FANCF、EMX1)を達成するためにはより長いRT鋳型(>15nt)を好み、他の座位は短いRT鋳型(HEK3、HEK4)を好むので(図39D)、~10~16ntから出発して、PEgRNAを最適化するときには、短いおよび長いRT鋳型両方が試験されるということが推奨される。 Next, we investigated the performance determinants of the RT template portion of PEgRNA. PEgRNAs with RT templates ranging in length from 10 to 20 nt were generated using PE2 at five genomic target sites (Figure 39D) and at three genomic sites with longer RT templates as long as 31 nt (Figures 48A to 48D). 48C) Systematically evaluated. Like PBS length, RT template length can also be varied to maximize prime editing efficiency, but in general, many RT template lengths ≧10 nt length favor more efficient prime editing. (Figure 39D). Some target sites prefer longer RT templates (>15 nt) to achieve higher editing efficiency (FANCF, EMX1), while other loci prefer shorter RT templates (HEK3, HEK4) (Figure 39D ), starting from ~10-16 nt, it is recommended that both short and long RT templates be tested when optimizing PEgRNA.

重要なことに、sgRNA骨格の末端ヘアピンに隣接するヌクレオチドとしてCを置くRT鋳型は、一般的に、類似の長さのRT鋳型を有する他のPEgRNAと比較して低い編集効率をもたらした(図48A~48C)。Cas9に結合したsgRNAの構造に基づいて148,149、標準的なsgRNAの3'伸長の最初のヌクレオチドとしてのCの存在は、Cas9のTyr 1356とのパイスタックおよびsgRNA A68との非標準的な塩基対をネイティブに形成するヌクレオチドG81との対形成によって、sgRNA骨格折り畳みを遮断し得るということが推量された。多くのRT鋳型長さはプライム編集を支持するので、3'伸長の最初の塩基(RT鋳型の最後の逆転写される塩基)がCではないPEgRNAを選ぶことが推奨される。 Importantly, RT templates placing C as a nucleotide adjacent to the terminal hairpin of the sgRNA backbone generally resulted in lower editing efficiency compared to other PEgRNAs with RT templates of similar length (Figure 48A-48C). Based on the structure of sgRNA bound to Cas9148,149 , the presence of C as the first nucleotide of the canonical sgRNA 3' extension leads to the pi-stacking with Tyr 1356 of Cas9 and the non-canonical base pairing with sgRNA A68. It was speculated that sgRNA backbone folding could be blocked by pairing with nucleotide G81, which natively forms . Since many RT template lengths support prime editing, it is recommended to choose PEgRNAs where the first base of the 3' extension (the last reverse transcribed base of the RT template) is not a C.

プライム編集因子3システム(PE3およびPE3b)のデザイン Design of prime editing factor 3 systems (PE3 and PE3b)

PE2は遺伝情報をPEgRNAから標的座位にPE1よりも効率的に移入し得るが、細胞が1つの編集された鎖および1つの編集されない鎖によって生出されるもたらされるヘテロ二重鎖DNAを分解する様式は、編集が耐久性であるかどうかを決定する。シトシンまたはアデニン脱アミノ化の当初の産物は1つの編集されたおよび1つの非編集の鎖を含有するヘテロ二重鎖DNAであるので、塩基編集の先の開発は類似の課題に当面した。塩基編集の効率を増大させるために、Cas9 D10Aニッカーゼを用いてニックを非編集鎖に導入し、編集された鎖を鋳型として用いるDNA修復をその鎖へと導いた129,130,142。この原理を有効利用してプライム編集効率を増強するために、細胞による非編集鎖の選好的置き換えを誘導するために、すでにPE2に存在するCas9 H840Aニッカーゼと単純なsgRNAとを用いて非編集鎖へニックを入れる類似の戦略(図40A)を試験した。編集されたDNA鎖もまたプライム編集を開始するためにニッキングされたので、種々のsgRNAによってプログラムされるニックの位置付けを非編集鎖について試験して、インデルに至る二本鎖DNA切断の生産を最小化した。 Although PE2 may transfer genetic information from PEgRNA to target loci more efficiently than PE1, the manner in which cells degrade the resulting heteroduplex DNA produced by one edited strand and one unedited strand determines whether the edit is durable. Previous developments in base editing faced similar challenges since the original product of cytosine or adenine deamination is heteroduplex DNA containing one edited and one unedited strand. To increase the efficiency of base editing, Cas9 D10A nickase was used to introduce a nick into the unedited strand and direct DNA repair to that strand using the edited strand as a template . To take advantage of this principle and enhance prime editing efficiency, we used the Cas9 H840A nickase already present in PE2 and a simple sgRNA to induce preferential replacement of the unedited strand by cells. A similar strategy of nicking (Figure 40A) was tested. Since the edited DNA strand was also nicked to initiate prime editing, the nick positioning programmed by various sgRNAs was tested on the unedited strand to minimize the production of double-stranded DNA breaks leading to indels. It became.

PAMの5'または3'どちらかのPEgRNAによって誘導されるニックの部位から14から116塩基に位置付けられるニックを誘導するsgRNAをスクリーニングすることによって、このPE3戦略を最初にHEK293T細胞の5つのゲノム部位において試験した。試験された5つの部位のうち4つでは、非編集鎖へニックを入れることは、インデルフリーなプライム編集産物の量を、PE2システムと比較して1.5から4.2倍、55%ほども高くまで増大させた(図40B)。最適なニッキング位置はゲノム部位に依存して変わったが、PEgRNAによって誘導されるニックからおよそ40-90bpのPAMの3'に位置取るニックは(図40Bの正の距離)、一般的には、プライム編集効率の好ましい増大(平均で41%である)を余分なインデル形成なしに生じた(試験された5つの部位の夫々において、最も高い編集効率をもたらすsgRNAでは6.8%の平均インデル)(図40B)。予想されるとおり、いくつかの部位では、PEgRNAによって誘導されるニックの40bp以内に非編集鎖ニックを置くことは、最高で22%のインデル形成の大きい増大に至った(図40B)。おそらくは、近接する両方の鎖に一緒へニックを入れることからの二本鎖切断の形成を原因とする。しかしながら、他の部位では、PEgRNAによって誘導されるニックから14bpほども近接するニッキングは5%インデルのみを生じ(図40B)、座位依存性因子が近位の二元的なニックから二本鎖DNA切断への変換をコントロールするということを示唆した。1つの試験された部位(HEK4)では、PEgRNAによって誘導されるニックから距離>70bpに置かれるときでさえも、相補鎖ニックは利益を提供しないかまたは編集効率を越えるインデルレベル(最高で26%)に至るかどちらかであり、その部位の編集された鎖が細胞によってニッキングされるかまたは非効率的にライゲーションされる普通でない傾向と整合した。PEgRNAによって媒介されるニックからおよそ50bpの非編集鎖ニックから出発することと、インデル度数が許容されるレベルを超過する場合には代替的なニック位置付けを試験することとが推奨される。 We first applied this PE3 strategy to five genomic sites in HEK293T cells by screening for nick-inducing sgRNAs located 14 to 116 bases from the site of the nick induced by PEgRNA either 5' or 3' of the PAM. It was tested in At four of the five sites tested, nicking the non-edited strand increased the amount of indel-free prime editing product by 1.5 to 4.2 times, or as much as 55% higher, compared to the PE2 system. (Figure 40B). Although the optimal nicking position varied depending on the genomic site, a nick located approximately 40-90 bp 3' of the PAM from the PEgRNA-induced nick (positive distance in Figure 40B) generally A favorable increase in prime editing efficiency (41% on average) occurred without extra indel formation (an average indel of 6.8% for the sgRNA yielding the highest editing efficiency at each of the five sites tested) (Fig. 40B). As expected, at some sites, placing the non-edited strand nick within 40 bp of the PEgRNA-induced nick led to a large increase in indel formation, up to 22% (Figure 40B). Possibly due to the formation of a double-strand break from nicking both adjacent strands together. However, at other sites, nicking as close as 14 bp from the PEgRNA-induced nick resulted in only 5% indels (Figure 40B), indicating that locus-dependent factors move from the proximal binary nick to the double-stranded DNA. It was suggested that the conversion to cleavage could be controlled. In one tested site (HEK4), complementary strand nicks provided no benefit or resulted in indel levels exceeding editing efficiency (up to 26 %), consistent with an unusual tendency for the edited strand at that site to be nicked or ligated inefficiently by the cell. It is recommended to start with an unedited strand nick approximately 50 bp from the PEgRNA-mediated nick and to test alternative nick positions if the indel frequency exceeds acceptable levels.

どのようにして相補鎖ニッキングがプライム編集効率を改善するのかについてのこのモデルは(図40A)、編集された鎖のフラップ分解後にのみ非編集鎖へニックを入れることが、同時的なニックの存在を最小化し得、引き続きインデルを形成する二本鎖切断の度数を減少させるということを予測した。非編集鎖ニッキングの時間的コントロールを達成するために、元々のアレルではなく編集された鎖にマッチするスペーサー配列を有するsgRNAをデザインした。これ以降ではPE3bと言われるこの戦略を用いて、スペーサーおよび編集されないアレルの間のミスマッチは、PAM鎖上の編集イベントが生起する後までは、sgRNAによるニッキングを好まないはずである。このPE3bアプローチを、HEK293T細胞の3つのゲノム部位における5つの異なる編集によって試験し、アウトカムをPE2およびPE3システムによって達成されるものと比較した。全てのケースで、PE3bは、PE3と比較して総体的な編集効率のいずれかの明白な減少なしに、PE3と比較して実質的に低いレベルのインデルに関連した(3.5から30倍。平均で12倍低いインデルまたは0.85%である)(図40C)。よって、編集が第2のプロトスペーサー上に在ったときには、PE3bシステムは、PE2と比較して編集効率を多くの場合にはPE3のものと類似のレベルまでなお改善しながら、インデルを減少させ得た(図40C)。 This model of how complementary strand nicking improves prime editing efficiency (Figure 40A) is that nicking the non-edited strand only after flap disassembly of the edited strand is due to the presence of simultaneous nicks. We predicted that this would reduce the number of double-strand breaks that subsequently form indels. To achieve temporal control of non-edited strand nicking, we designed sgRNAs with spacer sequences that matched the edited strand rather than the original allele. Using this strategy, hereafter referred to as PE3b, mismatches between the spacer and the non-edited allele should not favor nicking by the sgRNA until after the editing event on the PAM strand has occurred. This PE3b approach was tested with five different edits at three genomic sites in HEK293T cells, and outcomes were compared to those achieved by the PE2 and PE3 systems. In all cases, PE3b was associated with substantially lower levels of indels compared to PE3 (3.5- to 30-fold; on average 12 times lower indels or 0.85%) (Figure 40C). Thus, when editing was on a second protospacer, the PE3b system reduced indels while still improving editing efficiency compared to PE2, often to a level similar to that of PE3. (Figure 40C).

一緒になって、これらの知見は、PE3システム(Cas9ニッカーゼ-最適化逆転写酵素+PEgRNA+sgRNA)が編集効率をPE2と比較して~3倍改善するということを確立した(図40B~40C)。PE3の追加のニッキング活性から、予想されるとおり、PE3はPE2よりも広い範囲のインデルによって随伴された。PE3の使用はプライム編集効率を優先するときに推奨される。インデルの最小化が重大であるときには、PE2は~10倍低いインデル度数をオファーする。組み入れされた編集を認識して非編集鎖へニックを入れるsgRNAを用いることが可能であるときには、PE3bシステムはインデル形成を多大に縮減しながらPE3様の編集レベルを達成し得る。 Together, these findings established that the PE3 system (Cas9 nickase-optimized reverse transcriptase + PEgRNA + sgRNA) improves editing efficiency ~3-fold compared to PE2 (Figures 40B-40C ). As expected from the additional nicking activity of PE3, PE3 was accompanied by a wider range of indels than PE2. Use of PE3 is recommended when prime editing efficiency is a priority. When indel minimization is critical, PE2 offers ~10 times lower indel frequencies. When it is possible to use sgRNAs that recognize incorporated edits and nick into the non-edited strand, the PE3b system can achieve PE3-like editing levels while greatly reducing indel formation.

PE3によるプライム編集の標的化範囲および汎用性を実証するために、HEK3標的部位の+1から+8位置(PEgRNAによって誘導されるニックの3'の最初の塩基を位置+1としてカウントする)における全ての可能な1ヌクレオチド置換の組み入れを、PE3と10ヌクレオチドRT鋳型を有するPEgRNAとを用いて(図41A)調査した。集合的に、これらの24の別物の編集は全ての4つのトランジション変異および全ての8つのトランスバージョン変異をカバーし、平均で33±7.9%である(14%および48%の間の範囲である)編集効率(インデルを含有しない)で、平均で7.5±1.8%のインデルによって進む。 To demonstrate the targeting scope and versatility of prime editing with PE3, at positions +1 to +8 of the HEK3 target site (counting the first base 3' of the PEgRNA-induced nick as position +1). Incorporation of all possible single nucleotide substitutions was investigated using PE3 and PEgRNA with a 10 nucleotide RT template (Figure 41A). Collectively, these 24 distinct edits cover all 4 transition mutations and all 8 transversion mutations, with an average of 33 ± 7.9% (ranging between 14% and 48%). ) editing efficiency (containing no indels), proceeding with an average of 7.5 ± 1.8% indels.

重要なことに、長距離RT鋳型もまたPE3による効率的なプライム編集を生じさせ得る。例えば、PE3を34nt RT鋳型と共に用いて、点変異をHEK3座位の位置+12、+14、+17、+20、+23、+24、+26、+30、および+33(PEgRNAによって誘導されるニックから12から33塩基)に組み入れし、平均で36±8.7%の効率および8.6±2.0%のインデルを有した(図41B)。他の座位における+10位置以降の編集は試みなかったが、3つの代替的な部位における他のRT鋳型≧30ntもまた効率的編集を支持する(図48A-C)。長いRT鋳型の実行可能性は、当初のニック部位から何ダースものヌクレオチドについて効率的なプライム編集を可能化した。どちらかのDNA鎖上のNGG PAMは、効率的なプライム編集を支持する編集およびPAMの間の最大距離よりもずっと少ない平均で~8bp毎に生起するので、他の精密ゲノム編集法とは対照的に、プライム編集は近傍のPAM配列の利用可能性によって実質的に制約されない125,142,154。RNA二次構造とプライム編集効率との間の推定される関係性から、ロングレンジ編集のためのPEgRNAをデザインするときには、種々の長さおよび必要な場合には配列組成(例えば、同義コドン)のRT鋳型を試験して編集効率を最適化することが賢明である。 Importantly, long-range RT templates can also result in efficient prime editing by PE3. For example, using PE3 with a 34nt RT template, point mutations were made at positions +12, +14, +17, +20, +23, +24, +26, +30, and +33 of the HEK3 locus (induced by PEgRNA). (12 to 33 bases from the nick) with an average efficiency of 36±8.7% and indels of 8.6±2.0% (Figure 41B). Other RT templates ≧30 nt at three alternative sites also support efficient editing, although editing beyond position +10 at other loci was not attempted (Figures 48A-C). The feasibility of long RT templates enabled efficient prime editing of dozens of nucleotides from the original nick site. In contrast to other precision genome editing methods, NGG PAMs on either DNA strand occur on average every ~8 bp, much less than the maximum distance between edits and PAMs that favors efficient prime editing. In general, prime editing is not substantially constrained by the availability of nearby PAM sequences125,142,154. Given the presumed relationship between RNA secondary structure and prime editing efficiency, when designing PEgRNAs for long-range editing, a variety of lengths and, if necessary, sequence compositions (e.g., synonymous codons) are recommended. It is prudent to test RT templates to optimize editing efficiency.

トランジションおよびトランスバージョン点変異を導入するためのPE3システムの範囲および限定をさらに試験するために、全ての12の可能な方の点変異をカバーする72の追加の編集を6つの追加のゲノム標的部位(図41C~41H)について試験した。総体的に、インデルフリーな編集効率は平均で25±14%であり、インデル形成は平均で8.3±7.5%であった。PEgRNA RT鋳型はPAM配列を包含したので、プライム編集はPAM配列の変化を誘導し得た。これらのケースでは、より高い編集効率(平均で39±9.7%である)およびより低いインデル生成(平均で5.0±2.9%である)が観察された(図41A~41K。位置+5または+6における点変異)。PAM編集の効率のこの増大およびインデル形成の減少は、Cas9ニッカーゼが相補鎖の修復に先行して編集された鎖に再結合およびニッキングすることの不能から発生し得る。プライム編集は編集効率の明らかな損失なしに組み合わせ編集を支持するので、可能なときには、他の所望の変化に加えてPAMを編集することが推奨される。 To further test the scope and limitations of the PE3 system for introducing transition and transversion point mutations, we made 72 additional edits covering all 12 possible point mutations at 6 additional genomic target sites. (Figures 41C to 41H). Overall, indel-free editing efficiency averaged 25±14% and indel formation averaged 8.3±7.5%. Since the PEgRNA RT template contained the PAM sequence, prime editing could induce changes in the PAM sequence. In these cases, higher editing efficiency (on average 39 ± 9.7%) and lower indel generation (on average 5.0 ± 2.9%) was observed (Figures 41A-41K. Positions +5 or +6 point mutations in ). This increase in the efficiency of PAM editing and decrease in indel formation may result from the inability of Cas9 nickase to recombine and nick the edited strand prior to repair of the complementary strand. Prime editing supports combinatorial editing without obvious loss of editing efficiency, so it is recommended to edit PAM in addition to other desired changes when possible.

次に、14の標的化された小さい挿入および14の標的化された小さい欠失を、7つのゲノム部位において、PE3を用いて(図41I)行った。標的化された1bp挿入は32±9.8%の平均効率で進み、3bp挿入は39±16%の平均効率で組み入れされた。標的化された1bpおよび3bp欠失もまた効率的であり、夫々29±14%および32±11%の平均収量で進んだ。インデル生成(標的化された挿入または欠失以外)は平均で6.8±5.4%であった。位置+1および+6の間に導入された挿入および欠失はPAMの位置または構造を変改するので、PAMを編集する点変異と類似に、Cas9ニッカーゼが相補鎖の修復に先行して編集された鎖に再結合およびニッキングすることの不能を原因として、この範囲の挿入および欠失編集は典型的にはより効率的であるということが推量された。 Next, 14 targeted small insertions and 14 targeted small deletions were performed using PE3 (Figure 41I) at 7 genomic sites. Targeted 1bp insertions proceeded with an average efficiency of 32±9.8%, and 3bp insertions were incorporated with an average efficiency of 39±16%. Targeted 1bp and 3bp deletions were also efficient, proceeding with average yields of 29±14% and 32±11%, respectively. Indel generation (other than targeted insertions or deletions) averaged 6.8±5.4%. Insertions and deletions introduced between positions +1 and +6 alter the position or structure of PAM, so that Cas9 nickase precedes repair of the complementary strand, analogous to point mutations that edit PAM. It has been surmised that this range of insertion and deletion editing is typically more efficient due to the inability to recombine and nick the strands that have been removed.

PE3は、HEK3部位における5bpから80bpのより大きい精密な欠失を媒介するその能力についてもまた試験された(図41J)。13nt PBSと夫々29、24、または19bpの相同性を標的座位に対して含有するRT鋳型とを用いたときには、非常に高い編集効率(52から78%)が5、10、および15bp欠失について観察された。26nt RT鋳型を用いることは、72±4.2%の効率で25bpというより大きい欠失を支持し、20nt RT鋳型は52±3.8%の効率で80bp欠失を可能化した。これらの標的化された欠失は平均で11±4.8%であるインデル度数によって随伴された(図41J)。 PE3 was also tested for its ability to mediate larger, precise deletions of 5 bp to 80 bp at the HEK3 site (Figure 41J). Very high editing efficiencies (52 to 78%) were observed for 5, 10, and 15 bp deletions when using the 13 nt PBS and RT templates containing 29, 24, or 19 bp of homology to the target locus, respectively. Using a 26 nt RT template supported larger deletions of 25 bp with an efficiency of 72 ± 4.2%, and a 20 nt RT template enabled an 80 bp deletion with an efficiency of 52 ± 3.8%. These targeted deletions were accompanied by an indel frequency that averaged 11 ± 4.8% (Figure 41J).

最後に、3つのゲノム部位における挿入および欠失、挿入および点変異、欠失および点変異、または2つの点変異からなる同じ標的座位における複数の編集の12の組み合わせを媒介するPE3の能力を試験した。これらの組み合わせ編集は非常に効率的であり、6.4%のインデルによって平均で55%の標的編集であり(図41K)、精密な挿入、欠失、および点変異の組み合わせを個々の標的部位において高い効率および低いインデル度数でなすプライム編集の能力を実証した。 Finally, we tested the ability of PE3 to mediate 12 combinations of insertions and deletions at three genomic sites, insertions and point mutations, deletions and point mutations, or multiple edits at the same target locus consisting of two point mutations. did. These combinatorial edits are highly efficient, averaging 55% target editing with 6.4% indels (Figure 41K), allowing combinations of precise insertions, deletions, and point mutations to be highly efficient at individual target sites. The ability of prime editing to be done with efficiency and low indel frequency was demonstrated.

一緒になって、図41A-41Kの例は7つのヒトゲノム座位における156の別物のトランジション、トランスバージョン、挿入、欠失、および組み合わせ編集を表す。これらの知見はプライム編集の汎用性、精度、および標的化フレキシビリティーを確立する。 Together, the examples in Figures 41A-41K represent 156 distinct transitions, transversions, insertions, deletions, and combinatorial edits at seven human genomic loci. These findings establish the versatility, precision, and targeting flexibility of prime editing.

塩基編集と比較したプライム編集 Prime editing compared to base editing

現行世代のシチジン塩基編集因子(CBE)およびアデニン塩基編集因子(ABE)は、C・GからT・Aのトランジション変異およびA・TからG・Cのトランジション変異を高い効率および低いインデルで組み入れ組み入れ得る129,130,142。塩基編集の適用は、欲されないバイスタンダー編集を生じさせる塩基編集活性窓(典型的には~5bpの幅)上の複数のシチジンまたはアデニン塩基の存在によって129,130,142,155、または標的ヌクレオチドからおよそ15±2ntに位置取るPAMの不在によって142,156限定され得る。プライム編集は、バイスタンダー編集なしの、または好適に位置取ったPAMの欠如が標的ヌクレオチドをCBEまたはABE活性窓上に好ましく位置取らせることを不可能にするときの、トランジション変異の精密な組み入れにとって特に有用であり得るということが予期された。 Current generation cytidine base editors (CBEs) and adenine base editors (ABEs) incorporate and incorporate C, G to T, A and A, T to G, C transition mutations with high efficiency and low indels. Get 129,130,142 . The application of base editing is limited by the presence of multiple cytidine or adenine bases on the base editing active window (typically ~5 bp wide), which results in unwanted bystander editing, or approximately 15 ± 2 nt from the target nucleotide. 142,156 may be limited by the absence of PAM positions. Prime editing is useful for the precise incorporation of transition mutations without bystander editing or when the lack of a suitably positioned PAM makes it impossible to position the target nucleotide favorably on the CBE or ABE activity window. It was anticipated that it could be particularly useful.

プライム編集およびシトシン塩基編集を、複数の標的シチジンを標準的な塩基編集窓(プロトスペーサー位置4~8。PAMを位置21~23としてカウントする)上に含有する3つのゲノム座位を編集することによって比較した。ニッカーゼ活性なしの(BE2max)もしくはニッカーゼ活性ありの(BE4max)最適化されたCBE157を用いるか、または類縁のPE2およびPE3プライム編集システムを用いた。3つの部位の塩基編集窓上の9つのトータルの標的シトシンのうち、BE4maxは、PE3よりも2.2倍高い平均のトータルのC・GからT・Aの変換を塩基編集窓の中心の塩基(プロトスペーサー位置5~7。図42A)について生んだ。同様に、非ニッキングBE2maxはこれらの良く位置取った塩基においてPE2に平均で1.4倍優った(図42A)。しかしながら、塩基編集窓の中心以外のシトシンについて、PE3はBE4maxに2.7倍優り、PE2はBE2maxに2.0倍優った(PE3の40±17%対BE4maxの15±18%、およびPE2の22±11%対BE2maxの11±13%の平均編集)。総体的に、PE2のインデル度数は非常に低く(平均で0.86±0.47%であった)、PE3では、BE4maxのものに類似かまたはそれよりも控えめに高かった(BE4max範囲:2.5%から14%;PE3範囲:2.5%から21%)(図42B)。 Prime editing and cytosine base editing by editing three genomic loci that contain multiple target cytidines on the standard base editing window (protospacer positions 4-8; counting PAM as positions 21-23). compared. Optimized CBE 157 without (BE2max) or with (BE4max) nickase activity was used, or the related PE2 and PE3 prime editing systems were used. Among the nine total target cytosines on the three-site base editing window, BE4max has a 2.2-fold higher average total C/G to T/A conversion than PE3 at the central base of the base editing window (protocol). Spacer positions 5 to 7. Generated for Figure 42A). Similarly, non-nicking BE2max outperformed PE2 by an average of 1.4 times at these well-positioned bases (Figure 42A). However, for cytosines outside the center of the base editing window, PE3 outperformed BE4max by 2.7 times and PE2 outperformed BE2max by 2.0 times (40 ± 17% for PE3 vs. 15 ± 18% for BE4max, and 22 ± 11% for PE2). mean edit of 11 ± 13% of BE2max). Overall, the indel frequencies in PE2 were very low (0.86 ± 0.47% on average), and in PE3 they were similar to or modestly higher than those in BE4max (BE4max range: 2.5% to 14%). ; PE3 range: 2.5% to 21%) (Figure 42B).

精密なC・GからT・Aの編集の組み入れ(いずれかのバイスタンダー編集なし)について塩基編集の効率をプライム編集と比較したときには、プライム編集の効率は上の部位において塩基編集のものを多大に超過した。これらは、ほとんどのゲノムDNA部位のように、複数のシトシンを~5bp塩基編集窓上に含有する(図42C)。シトシンをプロトスペーサー位置C5、C6、およびC7に含有するEMX1などのこれらの部位では、BE4maxは、バイスタンダー編集なしの単一の標的塩基対変換のみを含有する少数の産物を生成した。対照的に、この部位におけるプライム編集は、C・GからT・Aの編集をいずれかの位置または位置の組み合わせ(C5、C6、C7、C5+C6、C6+C7、C5+C7、またはC5+C6+C7)において選択的に組み入れるために用いられ得た(図42C)。全ての精密な1塩基または2塩基編集(つまり、いずれかの他の近傍塩基を改変しない編集)は、PE3またはPE2では夫々BE4maxまたはBE2よりもかなり効率的であったが、3塩基のC・GからT・Aの編集はBE4maxでより効率的であり(図42C)、活性窓上の全ての標的塩基を編集する塩基編集因子の傾向を反映した。一緒にすると、これらの結果は、シトシン塩基編集因子は最適に位置取った標的塩基においてPE2またはPE3よりも高いレベルの編集をもたらし得るが、プライム編集は非最適に位置取った標的塩基において塩基編集に優り得、複数の編集可能な塩基ではかなり高い精度で編集し得るということを実証している。 When we compare the efficiency of base editing with prime editing for the incorporation of precise C, G to T, and A edits (without any bystander editing), we find that the efficiency of prime editing greatly outweighs that of base editing at the upper sites. exceeded. These, like most genomic DNA sites, contain multiple cytosines over a ˜5 bp base editing window (FIG. 42C). At these sites, such as EMX1, which contains cytosines at protospacer positions C5, C6, and C7, BE4max generated a small number of products containing only a single target base pair conversion without bystander editing. In contrast, prime editing at this site involves editing C-G to T-A at any position or combination of positions (C5, C6, C7, C5+C6, C6+C7, C5+C7, or C5 +C6+C7) (Figure 42C). All precise one- or two-base edits (i.e., edits that did not alter any other neighboring bases) were significantly more efficient for PE3 or PE2 than for BE4max or BE2, respectively, but for the three-base C. G to T·A editing was more efficient in BE4max (FIG. 42C), reflecting the tendency of base editors to edit all target bases on the activity window. Taken together, these results indicate that cytosine base editors may result in higher levels of editing than PE2 or PE3 at optimally positioned target bases, whereas prime editing may result in base editing at non-optimally positioned target bases. It has been demonstrated that multiple editable bases can be edited with considerably high accuracy.

最適化された非ニッキングABE(Cas9ニッカーゼの代わりにdCas9によるABEmax152。これ以降ではABEdmaxと言われる)対PE2によるおよび最適化されたニッキングアデニン塩基編集因子ABEmax対PE3によるA・TからG・Cの編集を2つのゲノム座位において比較した。2つの標的アデニンを塩基編集窓上に含有する部位(HEK3)では、ABEはA5の変換についてPE2またはPE3よりも効率的であったが、PE3はABEmax編集窓の縁部に在るA8の変換についてより効率的であった(図42D)。単一のアデニンのみが変換される精密編集の効率を比較するときには、PE3はA5およびA8両方においてABEmaxに優った(図42E)。総体的には、ABEはプライム編集因子よりもずっと少数のインデルをHEK3において生じた(ABEdmaxの0.19±0.02%対PE2の1.5±0.46%、およびABEmaxの0.53±0.16%対PE3の11±2.3%、図42F)。単一のAのみが塩基編集窓上に存在するFANCFにおいては、ABE2およびABEmaxはトータルの標的塩基対変換がそれらのプライム編集カウンターパートに1.8から2.9倍優り、塩基編集およびプライム編集両方からの実質的に全ての編集された産物は精密な編集のみを含有した(図42D~42E)。HEK3部位のように、ABEはFANCF部位においてずっと少数のインデルを生じた(図42F)。 Optimized non-nicking ABE (ABEmax 152 with dCas9 instead of Cas9 nickase, hereafter referred to as ABEdmax) vs. PE2 and optimized nicking adenine base editor ABEmax vs. A.T to G.C with PE3. editing was compared at two genomic loci. At a site containing two target adenines on the base editing window (HEK3), ABE was more efficient than PE2 or PE3 in converting A5, whereas PE3 was more efficient in converting A8 at the edge of the ABEmax editing window. (Figure 42D). When comparing the efficiency of precision editing where only a single adenine is converted, PE3 outperformed ABEmax in both A5 and A8 (Figure 42E). Overall, ABE generated much fewer indels in HEK3 than prime editing factors (0.19 ± 0.02% of ABEdmax vs. 1.5 ± 0.46% of PE2, and 0.53 ± 0.16% of ABEmax vs. 11 ± 2.3% of PE3). , Figure 42F). In FANCF, where only a single A is present on the base-editing window, ABE2 and ABEmax outperform their prime-edited counterparts by a factor of 1.8 to 2.9 in total target base-pair conversions, resulting in substantial reductions from both base-editing and prime-editing. Generally all edited products contained only precise edits (Figures 42D-42E). Like the HEK3 site, ABE produced much fewer indels at the FANCF site (Figure 42F).

集合的に、これらの結果は、標的化されたトランジション変異を作ることについて、塩基編集およびプライム編集が補完的な強さおよび弱さをオファーするということを指示する。単一の標的ヌクレオチドが塩基編集窓上に存在するケースでは、またはバイスタンダー編集が許容されるときには、現行の塩基編集因子は典型的にはプライム編集因子よりも効率的であり、少数のインデルをもたらす。複数のシトシンまたはアデニンが存在しかつバイスタンダー編集が望ましくないときには、または標的塩基が利用可能なPAMに対して相対的に塩基編集にとって不良に位置取るときには、プライム編集因子は実質的な利点をオファーする。 Collectively, these results indicate that base editing and prime editing offer complementary strengths and weaknesses for creating targeted transition mutations. In cases where a single target nucleotide lies on the base editing window, or when bystander editing is allowed, current base editors are typically more efficient than prime editors and eliminate small numbers of indels. bring. Prime editing factors offer substantial advantages when multiple cytosines or adenines are present and bystander editing is undesirable, or when the target base is poorly positioned for base editing relative to the available PAM. do.

オフターゲットプライム編集 Off-target prime editing

生産的な編集をもたらすためには、プライム編集は、Cas9ドメインが結合するための相補的な標的座位:PEgRNAスペーサー、PEgRNAによってプライムされる逆転写が開始するための標的座位:PEgRNA PBS相補性、およびフラップ分解のための標的座位:逆転写酵素産物相補性を要求する。これらの3つの別物のDNAハイブリダイゼーション要件は、他のゲノム編集法のものと比較してオフターゲットプライム編集を最小化し得るという仮説が立てられた。この可能性を試験するために、HEK293T細胞を、PE3またはPE2と4つのオンターゲットゲノム座位を標的化するようにデザインされたトータルで16のPEgRNAとによって、Cas9と同じプロトスペーサーを標的化する4つの対応するsgRNAとによって、またはCas9と同じ16のPEgRNAとによって処置した。夫々が、Cas9および対応するオンターゲットsgRNAがHEK293T細胞において実質的なオフターゲットDNA改変を引き起こすことが公知である少なくとも4つの良く特徴付けられたオフターゲット部位を有するので118,159、これらの4つの標的座位が選ばれた。処置後に、各オンターゲットスペーサーにとっての4つのオンターゲット座位および上位4つの公知のCas9オフターゲット部位をトータルで16のオフターゲット部位について配列決定した(表1)。 To result in productive editing, prime editing requires a complementary target locus for the Cas9 domain to bind: PEgRNA spacer, a target locus for reverse transcription to initiate primed by PEgRNA: PEgRNA PBS complementarity, and target locus for flap degradation: Requires reverse transcriptase product complementation. It was hypothesized that these three distinct DNA hybridization requirements may minimize off-target prime editing compared to those of other genome editing methods. To test this possibility, HEK293T cells were incubated with PEgRNAs targeting the same protospacer as Cas9 with PE3 or PE2 and a total of 16 PEgRNAs designed to target 4 on-target genomic loci. or with the same 16 PEgRNAs as Cas9. These four target loci each have at least four well-characterized off-target sites where Cas9 and the corresponding on-target sgRNAs are known to cause substantial off-target DNA modifications in HEK293T cells. was selected. After treatment, the four on-target loci and the top four known Cas9 off-target sites for each on-target spacer were sequenced for a total of 16 off-target sites (Table 1).

先の研究と整合して118、Cas9および4つの標的sgRNAは、先に報告されたオフターゲット座位の全ての16を改変した(図42G)。HEK3標的座位について、4つのオフターゲット部位におけるCas9オフターゲット改変効率は平均で16%であった。Cas9およびHEK4を標的化するsgRNAは、4つの試験された公知のオフターゲット部位の平均で60%の改変をもたらした。同様に、EMX1およびFANCFのオフターゲット部位は、Cas9:sgRNAによって夫々48%および4.3%の平均度数で改変された(図42G)。sgRNAと比較して、PEgRNAはCas9ヌクレアーゼと共にオンターゲット部位を平均して類似の(1から1.5倍低い)効率で改変するが、PEgRNAはCas9ヌクレアーゼと共にオフターゲット部位をsgRNAよりも~4倍低い平均効率で改変するということが注意された。 Consistent with previous studies, Cas9 and the four targeted sgRNAs modified all 16 of the previously reported off-target loci (Figure 42G). For the HEK3 target locus, Cas9 off-target modification efficiency at the four off-target sites was 16% on average. sgRNAs targeting Cas9 and HEK4 resulted in an average of 60% modification of the four known off-target sites tested. Similarly, off-target sites of EMX1 and FANCF were modified by Cas9:sgRNA with an average frequency of 48% and 4.3%, respectively (Figure 42G). Compared to sgRNA, PEgRNA with Cas9 nuclease modifies on-target sites with similar (1 to 1.5-fold lower) efficiency on average, but PEgRNA with Cas9 nuclease modifies off-target sites with an average ~4-fold lower efficiency than sgRNA. It was noted that modification is done with efficiency.

著しくは、これらの4つの標的スペーサーを含有する同じ16の試験されたPEgRNAによるPE3またはPE2はかなり低いオフターゲット編集をもたらした(図42H)。Cas9+sgRNAによるオフターゲット編集を経過することが公知の16の部位のうち、PE3+PEgRNAまたはPE2+PEgRNAは16のオフターゲット部位のうち3つのみにおいて検出可能なオフターゲットプライム編集をもたらし、16のうち1つのみがオフターゲット編集効率≧1%を示した(図42H)。これらの16の公知のCas9オフターゲット部位におけるHEK3、HEK4、EMX1、およびFANCFを標的化するPEgRNAの平均オフターゲットプライム編集は、夫々<0.1%、<2.2±5.2%、<0.1%、および<0.13±0.11%であった(図42H)。注意すべきことに、Cas9+PEgRNA1が97%効率で編集するHEK4オフターゲット3部位では、PE2+PEgRNA1は同じスペーサー配列を共有するにもかかわらず0.7%オフターゲット編集のみをもたらし、Cas9編集と比較してプライム編集に要求される2つの追加のDNAハイブリダイゼーションイベントが、どのようにしてオフターゲット編集を多大に縮減し得るのかということを実証する。一緒にすると、これらの結果は、PE3およびPEgRNAが、Cas9および同じプロトスペーサーを標的化するsgRNAよりもヒト細胞におけるかなり低いオフターゲットDNA編集を誘導するということを示唆する。 Remarkably, PE3 or PE2 with the same 16 tested PEgRNAs containing these four target spacers resulted in significantly lower off-target editing (Figure 42H). Of the 16 sites known to undergo off-target editing by Cas9+sgRNA, PE3+PEgRNA or PE2+PEgRNA resulted in detectable off-target prime editing at only 3 of the 16 off-target sites; Only one of them showed off-target editing efficiency ≧1% (Figure 42H). The average off-target prime editing of PEgRNA targeting HEK3, HEK4, EMX1, and FANCF at these 16 known Cas9 off-target sites was <0.1%, <2.2±5.2%, <0.1%, and <0.13, respectively. It was ±0.11% (Figure 42H). Of note, at HEK4 off-target 3 sites where Cas9+PEgRNA1 edits with 97% efficiency, PE2+PEgRNA1 results in only 0.7% off-target editing despite sharing the same spacer sequence, compared to Cas9 editing. We demonstrate how the two additional DNA hybridization events required for prime editing can greatly reduce off-target editing. Together, these results suggest that PE3 and PEgRNA induce significantly less off-target DNA editing in human cells than Cas9 and sgRNA targeting the same protospacer.

3'伸長されたPEgRNAの逆転写は原理的にはガイドRNA骨格上へと進み得る。もたらされる3'フラップが、編集されないDNA鎖とのその3'端における相補性の欠如にもかかわらず、標的座位に組み込まれる場合には、アウトカムはPEgRNA骨格ヌクレオチドの挿入であり、これはインデル度数に寄与する。我々は、HEK293T細胞の4つの座位における66のPE3によって媒介される編集実験からの配列決定データを分析し、いずれかの数のPEgRNA骨格ヌクレオチドの平均で1.7±1.5%のトータルの挿入である低い度数で、PEgRNA骨格挿入を観察した(図56A~56D)。Cas9ドメイン結合を原因とする逆転写酵素にとってのガイドRNA骨格のアクセス不可能性と、PEgRNA骨格逆転写からもたらされる3'フラップのミスマッチの3'端のフラップ分解の間の細胞性の切除とは、PEgRNA骨格ヌクレオチドを組み込む産物を最小化するということが推量される。かかるイベントは稀であるが、PEgRNA骨格組み込みを最小化するPEgRNAまたはプライム編集因子タンパク質を操作するための将来の作業は、インデル度数をさらに減少させ得る。 Reverse transcription of the 3'-extended PEgRNA could in principle proceed onto the guide RNA backbone. If the resulting 3' flap is incorporated into the target locus despite the lack of complementarity at its 3' end with the unedited DNA strand, the outcome is the insertion of PEgRNA backbone nucleotides, which increases the indel frequency. Contribute to We analyzed sequencing data from 66 PE3-mediated editing experiments at four loci in HEK293T cells and found that an average of 1.7 ± 1.5% total insertion of PEgRNA backbone nucleotides in any number of low At high frequencies, PEgRNA backbone insertion was observed (Figures 56A-56D). Inaccessibility of the guide RNA backbone to reverse transcriptase due to Cas9 domain binding and cellular excision during flap degradation at the 3' end of the 3' flap mismatch resulting from PEgRNA backbone reverse transcription It is speculated that this will minimize products that incorporate PEgRNA backbone nucleotides. Although such events are rare, future work to engineer PEgRNA or prime editor proteins that minimize PEgRNA backbone integration could further reduce indel frequency.

デアミナーゼはいくつかの塩基編集因子ではCas9非依存的様式で作用し得、低レベルだが広範囲のオフターゲットDNA編集を(ABEではなく)第1世代CBEにおいて160~162、ならびにオフターゲットRNA編集を第1世代CBEおよびABEにおいてもたらすが163~165、操作されたデアミナーゼによるより新たなCBEおよびABEバリアントはCas9非依存的なオフターゲットDNAおよびRNA編集を多大に縮減する163~165。プライム編集因子はデアミナーゼなどの塩基修飾酵素を欠き、よって、Cas9非依存的様式でDNAまたはRNA塩基を改変する内在的能力を有さない。 Deaminases can act in a Cas9-independent manner for some base editors, causing low-level but widespread off-target DNA editing in first-generation CBE (but not ABE) 160-162 as well as off-target RNA editing. Although in one generation CBE and ABE163-165 newer CBE and ABE variants with engineered deaminases greatly reduce Cas9-independent off-target DNA and RNA editing163-165. Prime editors lack base modifying enzymes such as deaminases and therefore have no intrinsic ability to modify DNA or RNA bases in a Cas9-independent manner.

原理的には、プライム編集因子の逆転写酵素ドメインは適切にプライムされたRNAまたはDNA鋳型を細胞内でプロセシングし得るが、レトロトランスポゾン、例えばLINE-1ファミリー166、内生レトロウイルス167,168、およびヒトテロメラーゼのものは全て、活性な内生ヒト逆転写酵素を提供するということが注意された。ヒト細胞におけるそれらの天然の存在は、逆転写酵素活性それ自体は実質的に毒性ではないということを示唆する。実に、dCas9、Cas9 H840Aニッカーゼ、または逆転写酵素を不活性化するR110S+K103L変異を有するPE2(PE2-dRT)を発現する対照のものと比較して、HEK293T細胞生存性のPE3依存的な違いは観察されなかった169(図49A~49B)。 In principle, the reverse transcriptase domain of primed editing factors could process appropriately primed RNA or DNA templates intracellularly, but retrotransposons, such as the LINE-1 family 166 , endogenous retroviruses 167,168 , and humans It was noted that all telomerase versions provided active endogenous human reverse transcriptase. Their natural presence in human cells suggests that reverse transcriptase activity itself is not substantially toxic. Indeed, PE3-dependent differences in HEK293T cell viability compared to those of controls expressing PE2 with an R110S+K103L mutation (PE2-dRT) that inactivates dCas9, Cas9 H840A nickase, or reverse transcriptase. was not observed169 ( Figures 49A-49B).

上のデータおよび分析にもかかわらず、オフターゲットプライム編集をバイアスがないゲノムワイドな様式で評価するために、およびプライム編集因子またはプライム編集中間体の逆転写酵素バリアントが細胞に影響し得る程度を特徴付けるために、追加の研究が必要とされる。 Despite the above data and analysis, it is difficult to assess off-target prime editing in an unbiased, genome-wide manner and to determine the extent to which reverse transcriptase variants of prime editing factors or intermediates can affect cells. Additional studies are needed to characterize it.

ヒト細胞の病原性のトランスバージョン、挿入、および欠失変異をプライム編集する Prime editing pathogenic transversion, insertion, and deletion mutations in human cells

遺伝子疾患を引き起こすトランスバージョン、小さい挿入、および小さい欠失変異をヒト細胞に直接的に組み入れまたは修正するPE3の能力を試験した。鎌状赤血球症は最も普通にはHBBのA・TからT・Aのトランスバージョン変異によって引き起こされ、ベータグロビンのGlu6→Valの変異をもたらす。Cas9ヌクレアーゼとHDRのためのドナーDNA鋳型とによるエクスビボの造血幹細胞の処置、次に編集された細胞の濃縮、移植、および定着は、鎌状赤血球症の処置のための有望な可能性ある戦略である170。しかしながら、このアプローチは、正しく編集されたHBBアレルに加えてなお多くのインデル含有副産物を生成する170~171。塩基編集因子は一般的にはずっと少数のインデルを生ずるが、それらはHBBの正常配列を直接的に復元するために必要とされるT・AからA・Tのトランスバージョン変異を現行ではなし得ない。 The ability of PE3 to directly incorporate or correct transversions, small insertions, and small deletion mutations that cause genetic diseases into human cells was tested. Sickle cell disease is most commonly caused by an A.T to T.A transversion mutation in HBB, resulting in a Glu6→Val mutation in beta globin. Treatment of ex vivo hematopoietic stem cells with Cas9 nuclease and donor DNA template for HDR, followed by enrichment, transplantation, and colonization of the edited cells is a promising potential strategy for the treatment of sickle cell disease. There are 170 . However, this approach still generates many indel-containing byproducts in addition to correctly edited HBB alleles. Although base editors generally produce much fewer indels, they currently cannot make the T·A to A·T transversion mutation required to directly restore the normal sequence of HBB. do not have.

PE3を用いて、44%の効率および4.8%インデルでHEK293T細胞にHBB E6V変異を組み入れした(図43A)。PE3処置された細胞の混合物から、我々はHBB E6Vアレルについてホモ接合(三倍体)である6つのHEK293T細胞株を単離し(図53A~53E)、プライム編集が病原性の変異を有するヒト細胞株を生成する能力を実証した。HBB E6Vアレルを野生型HBBに修正するために、我々は、HBB E6V変異を野生型HBBに直接的に復帰させるようにプログラムされたPE3およびPEgRNAによってホモ接合HBB E6V HEK293T細胞を処置した。トータルで、14のPEgRNAデザインを試験した。3日後に、DNA配列決定は、全ての14のPEgRNAがPE3と組み合わせられたときに、HBB E6Vから野生型HBBへの効率的な修正と(インデルなしの≧26%野生型HBB)平均で2.8±0.70%であるインデルレベルとを与えるということを明らかにした(図50A)。最も良好なPEgRNAはHBB E6Vから野生型への52%修正を2.4%インデルでもたらした(図43A)。PEgRNAによって認識されるPAMを改変するサイレントな変異の導入は、編集効率および産物純度を1.4%インデルによる58%修正まで控えめに改善した(図43A)。これらの結果は、プライム編集がヒト細胞株の病原性のトランスバージョン点変異を高い効率および最小限の副産物によって組み入れおよび修正し得るということを確立する。 PE3 was used to incorporate the HBB E6V mutation into HEK293T cells with 44% efficiency and 4.8% indels (Figure 43A). From a mixture of PE3-treated cells, we isolated six HEK293T cell lines that were homozygous (triploid) for the HBB E6V allele (Figures 53A to 53E ) and showed that prime-edited human demonstrated the ability to generate cell lines. To correct the HBB E6V allele to wild-type HBB, we treated homozygous HBB E6V HEK293T cells with PE3 and PEgRNA programmed to directly revert the HBB E6V mutation to wild-type HBB. In total, 14 PEgRNA designs were tested. After 3 days, DNA sequencing showed that when all 14 PEgRNAs were combined with PE3, efficient correction of HBB E6V to wild-type HBB (≧26% wild-type HBB without indels) and an average of 2.8 It was revealed that the indel level was ±0.70% (Figure 50A). The best PEgRNA resulted in a 52% correction of HBB E6V to wild type with 2.4% indels (Figure 43A). Introduction of silent mutations that modify the PAM recognized by PEgRNA modestly improved editing efficiency and product purity to 58% correction with 1.4% indels (Figure 43A). These results establish that prime editing can incorporate and correct pathogenic transversion point mutations in human cell lines with high efficiency and minimal side products.

テイ・サックス病は最も多くの場合にはHEXA遺伝子上への4bp挿入(HEXA 1278+TATC)によって引き起こされる136。PE3を用いて、この4bp挿入をHEK293T細胞に31%の効率および0.8%のインデルで組み入れし(図43B)、HEXA 1278+TATCアレルについてホモ接合である2つのHEK293T細胞株を単離した(図53A-53E)。これらの細胞を用いて、43のPEgRNAおよび3つのニッキングsgRNAを、PE3またはPE3bシステムによって、HEXAの病原性の挿入の修正について試験した(図50B)。野生型アレルへの完璧な復帰によるか、またはPAMを遮断しかつサイレントな変異を組み入れるシフトした4bp欠失によるかどちらかである。試験された43のPEgRNAのうち19は≧20%編集をもたらした。PE3またはPE3bおよび最も良好なPEgRNAによる野生型HEXAへの完璧な修正は類似の平均効率で進んだが(PE3の30%対PE3bの33%)、PE3bシステムは5.3倍少数のインデル産物によって随伴された(PE3の1.7%対PE3bの0.32%)(図43Bおよび図50B)。これらの知見は、哺乳類細胞の病原性のアレルを効率的にかつ最小の副産物によって組み入れまたは修正する精密な小さい挿入および欠失をなすプライム編集の能力を実証する。 Tay-Sachs disease is most often caused by a 4bp insertion onto the HEXA gene (HEXA 1278+TATC) 136 . Using PE3, we incorporated this 4bp insertion into HEK293T cells with 31% efficiency and 0.8% indels (Figure 43B) and isolated two HEK293T cell lines homozygous for the HEXA 1278+TATC allele (Figure 43B). 53A- 53E ). Using these cells, 43 PEgRNAs and 3 nicking sgRNAs were tested for correction of HEXA pathogenic insertions by PE3 or PE3b systems (Figure 50B). Either by a complete reversion to the wild type allele or by a shifted 4 bp deletion that blocks PAM and incorporates a silent mutation. 19 of the 43 PEgRNAs tested resulted in ≧20% editing. Complete modification of wild-type HEXA by PE3 or PE3b and the best PEgRNA proceeded with similar average efficiency (30% for PE3 vs. 33% for PE3b), but the PE3b system was accompanied by 5.3 times fewer indel products. (1.7% of PE3 vs. 0.32% of PE3b) (Figure 43B and Figure 50B). These findings demonstrate the ability of prime editing to make precise small insertions and deletions that incorporate or correct pathogenic alleles in mammalian cells efficiently and with minimal side products.

最後に、ヒトプリオンタンパク質(PrP)をコードする遺伝子PRNP上への防護性のSNPの組み入れを試験した。PrPミスフォールディングは進行性のかつ致死的な神経変性プリオン病を引き起こし、これはPRNP遺伝子上の受け継がれた優性変異によってまたはミスフォールディングしたPrPに対する暴露によって自発的に発生し得る172。天然に存在するPRNP G127V変異体アレルはヒト138およびマウス173においてプリオン病に対する耐性を付与する。PE3を用いてG127VをHEK293T細胞のヒトPRNPアレルに組み入れした。これはG・CからT・Aのトランスバージョンを要求する。4つのPEgRNAおよび3つのニッキングsgRNAをPE3システムによって評価した。最も有効なPE3およびPEgRNAに対する3日の暴露後に、DNA配列決定は、G127V変異を組み入れる53±11%の効率と1.7±0.7%のインデルレベルとを明らかにした(図43C)。一緒にすると、これらの結果は、プライム編集がヒト細胞においてトランスバージョン、挿入、または欠失変異を組み入れまたは修正する能力を確立する。これらは、疾患に対する耐性を効率的にかつ最小の副産物によって引き起こすかまたは付与する。 Finally, the incorporation of a protective SNP onto the gene PRNP encoding human prion protein (PrP) was tested. PrP misfolding causes a progressive and fatal neurodegenerative prion disease, which can arise spontaneously by inherited dominant mutations on the PRNP gene or by exposure to misfolded PrP 172 . The naturally occurring PRNP G127V mutant allele confers resistance to prion disease in humans138 and mice173 . G127V was incorporated into the human PRNP allele in HEK293T cells using PE3. This requires a transversion of T.A from G.C. Four PEgRNAs and three nicking sgRNAs were evaluated by PE3 system. After 3 days of exposure to the most effective PE3 and PEgRNA, DNA sequencing revealed a 53±11% efficiency of incorporating the G127V mutation and an indel level of 1.7±0.7% (Figure 43C). Together, these results establish the ability of prime editing to incorporate or correct transversion, insertion, or deletion mutations in human cells. They cause or confer resistance to disease efficiently and with minimal side products.

種々のヒト細胞株および初代マウスニューロンのプライム編集 Prime editing of various human cell lines and primary mouse neurons

次に、プライム編集を、3つの追加のヒト細胞株の内生部位を編集するその能力について試験した。K562(白血病骨髄)細胞では、PE3を用いて、HEK3、EMX1、およびFANCF部位のトランスバージョン編集、ならびにHEK3における6xHisタグの18bp挿入を行った。15-30%の平均編集効率がこれらの4つのPE3によって媒介される編集の夫々について観察され、インデルは平均で0.85~2.2%であった(図43A)。U2OS(骨肉腫)細胞では、HEK3およびFANCFのトランスバージョン変異、ならびにHEK3への3bp挿入および6xHisタグ挿入を、インデル形成を10から76倍超過する7.9-22%の編集効率によって組み入れした(図43A)。最後に、HeLa(子宮頸がん)細胞では、HEK3への3bp挿入を12%平均効率および1.3%インデルによって行った(図43A)。集合的に、これらのデータはHEK293T細胞以外の複数の細胞株がプライム編集を支持するということを指示しているが、編集効率は細胞型によって変わり、一般的にはHEK293T細胞よりも効率的ではない。編集:インデル比は、全ての試験されたヒト細胞株において高いままに留まった。 Prime editing was then tested for its ability to edit endogenous sites in three additional human cell lines. In K562 (leukemia bone marrow) cells, PE3 was used to perform transversion editing of HEK3, EMX1, and FANCF sites, as well as 18 bp insertion of a 6xHis tag in HEK3. Average editing efficiencies of 15-30% were observed for each of these four PE3-mediated edits, with indels averaging 0.85-2.2% (Figure 43A). In U2OS (osteosarcoma) cells, transversion mutations in HEK3 and FANCF, as well as 3bp insertions and 6xHis tag insertions in HEK3, were incorporated with editing efficiencies of 7.9-22%, exceeding indel formation by 10- to 76-fold (Figure 43A ). Finally, in HeLa (cervical cancer) cells, a 3bp insertion into HEK3 was performed with 12% average efficiency and 1.3% indels (Figure 43A). Collectively, these data indicate that multiple cell lines other than HEK293T cells support prime editing, but editing efficiency varies by cell type and is generally less efficient than HEK293T cells. do not have. Edit:Indel ratios remained high in all human cell lines tested.

プライム編集が有糸分裂後の終末分化した初代細胞において可能であるかどうかを決定するために、E18.5マウスから収穫された初代皮質ニューロンを二元的な分裂PE3レンチウイルス送達システムによって形質導入した。これにおいては、分裂インテインスプライシング203が、夫々が別個のウイルスから送達されるN末端およびC末端半分からPE2タンパク質を再構成する。編集を有糸分裂後ニューロンに制限するために、成熟したニューロンに高度に特異的であるヒトシナプシンプロモーター204を用いて両方のPE2タンパク質構成要素の発現を駆動した。GFPを自己切断P2Aペプチド205を介してPE2のN末端半分に融合した。ニューロンからの核を二元的なウイルス形質導入の2週後に単離し、直接的に配列決定するかまたは配列決定前にGFP発現についてソーティングした。ソーティングされた核において0.58±0.14%の平均インデルによってDNMT1座位におけるトランスバージョンを組み入れるための7.1±1.2%の平均プライム編集(図43D)が観察された。同じ分裂インテインの二元的レンチウイルスシステムにおけるCas9ヌクレアーゼは、ソーティングされた皮質ニューロン核において31±5.5%のインデルをもたらした(図43D)。これらのデータは、有糸分裂後の終末分化した初代細胞がプライム編集を支持し得るということを指示し、それゆえにプライム編集が細胞複製を要求しないということを確立する。 To determine whether prime editing is possible in postmitotic terminally differentiated primary cells, primary cortical neurons harvested from E18.5 mice were transduced with a binary split PE3 lentiviral delivery system, in which split intein splicing 203 reconstitutes the PE2 protein from N- and C-terminal halves, each delivered from a separate virus. To restrict editing to postmitotic neurons, the human synapsin promoter 204 , which is highly specific for mature neurons, was used to drive expression of both PE2 protein components. GFP was fused to the N-terminal half of PE2 via a self-cleaving P2A peptide 205. Nuclei from neurons were isolated 2 weeks after binary viral transduction and either sequenced directly or sorted for GFP expression prior to sequencing. An average prime editing of 7.1 ± 1.2% was observed to incorporate transversions at the DNMT1 locus (Figure 43D), with an average indel of 0.58 ± 0.14% in the sorted nuclei. Cas9 nuclease in the same split intein binary lentiviral system resulted in 31±5.5% indels in sorted cortical neuron nuclei (Figure 43D). These data indicate that postmitotic terminally differentiated primary cells can support prime editing, thus establishing that prime editing does not require cell replication.

Cas9によって開始されるHDRと比較したプライム編集 Prime editing compared to HDR initiated by Cas9

PE3の性能を、HDRを支持する有糸分裂細胞株において128、最適化されたCas9によって開始されるHDR128,125のものと比較した。HEK293T、HeLa、K562、およびU2OS細胞を、種々のトランスバージョンおよび挿入編集を組み入れるようにデザインされたCas9ヌクレアーゼ、sgRNA、およびssDNAドナーオリゴヌクレオチド鋳型によって処置した(図43E-43Gおよび図51A-51G)。Cas9によって開始されるHDRは、全てのケースにおいて、二本鎖切断を引き起こす処置から予想されるとおりずっと高いレベルの副産物(支配的にはインデル)によって、所望の編集を首尾良く組み入れした。PE3をHEK293T細胞に用いて、HBB E6V組み入れおよび修正は夫々42%および58%の平均編集効率で2.6%および1.4%の平均インデルによって進んだ(図43Eおよび図43G)。対照的に、Cas9ヌクレアーゼおよびHDR鋳型による同じ編集は、5.2%および6.7%の平均編集効率を79%および51%の平均インデル度数によってもたらした(図43Eおよび図43G)。類似に、PE3はPRNP G127Vを53%の効率および1.7%インデルで組み入れしたが、Cas9によって開始されるHDRはこの変異を6.9%の効率および53%インデルで組み入れした(図43Eおよび図43G)。それゆえに、HBB E6V組み入れ、HBB E6V修正、およびPRNP G127V組み入れの編集:インデルの比は、Cas9によって開始されるHDRよりもPE3では平均で270倍高かった。 The performance of PE3 was compared to that of an optimized Cas9-initiated HDR 128,125 in a mitotic cell line that supports HDR. HEK293T, HeLa, K562, and U2OS cells were treated with Cas9 nuclease, sgRNA, and ssDNA donor oligonucleotide templates designed to incorporate various transversion and insertion edits (Figures 43E-43G and Figures 51A- 51G ). Cas9-initiated HDR successfully incorporated the desired edits in all cases, with much higher levels of byproducts (predominantly indels) as expected from treatments that cause double-strand breaks. Using PE3 in HEK293T cells, HBB E6V integration and correction proceeded with average indels of 2.6% and 1.4% with average editing efficiencies of 42% and 58%, respectively (Figures 43E and 43G). In contrast, the same editing with Cas9 nuclease and HDR template resulted in average editing efficiencies of 5.2% and 6.7% with average indel frequencies of 79% and 51% (Figures 43E and 43G). Similarly, PE3 incorporated PRNP G127V with 53% efficiency and 1.7% indels, whereas Cas9-initiated HDR incorporated this mutation with 6.9% efficiency and 53% indels (Figures 43E and 43G). Therefore, the edit:indel ratios for HBB E6V integration, HBB E6V modification, and PRNP G127V integration were on average 270-fold higher in PE3 than in Cas9-initiated HDR.

HEK293T以外のヒト細胞株におけるPE3およびHDRの間の比較は、より低いPE3編集効率でだが、類似の結果を示した。例えば、K562細胞では、HEK3上へのPE3によって媒介される3bp挿入は、Cas9によって開始されるHDRの17%編集および72%インデルと比較して25%の効率および2.8%のインデル、PE3を好む40倍の編集:インデル率という利点によって進んだ(図43F~43G)。U2OS細胞では、PE3はこの3bp挿入を22%効率および2.2%インデルで行い、Cas9によって開始されるHDRは、74%のインデルによる15%の編集、49倍低い編集:インデル比をもたらした(図43F-43G)。HeLa細胞では、Cas9によって開始されるHDRの3.0%の編集および69%のインデルに対して、PE3はこの挿入を12%の効率および1.3%のインデル、210倍の編集:インデル比の違いによってなした(図43F~43G)。集合的に、これらのデータは、HDRが、典型的には、試験された4つの細胞株においてPE3よりも低いかまたは類似の編集効率およびずっと高いインデルをもたらすということを指示した(図51A~51G)。 Comparison between PE3 and HDR in human cell lines other than HEK293T showed similar results, albeit with lower PE3 editing efficiency. For example, in K562 cells, PE3-mediated 3bp insertion onto HEK3 favors PE3 with 25% efficiency and 2.8% indels compared to 17% editing of HDR and 72% indels initiated by Cas9. 40x editing: proceeded by the advantage of indel rate (Figures 43F-43G). In U2OS cells, PE3 performed this 3bp insertion with 22% efficiency and 2.2% indels, and Cas9-initiated HDR resulted in 15% editing with 74% indels, a 49-fold lower edit:indel ratio (Figure 43F-43G). In HeLa cells, PE3 carries out this insertion with 12% efficiency and 1.3% indels, with a 210-fold difference in edit:indel ratio, compared to 3.0% editing and 69% indels of HDR initiated by Cas9. (Figures 43F to 43G). Collectively, these data indicated that HDR typically resulted in lower or similar editing efficiency and much higher indels than PE3 in the four cell lines tested (Figure 51A- 51G ).

考察および将来の方向 Discussion and future directions

1ヌクレオチド精度でDNA配列を挿入する能力は、特に有能なプライム編集能力である。例えば、PE3を用いて、HEK293T細胞のHEK3座位にHis6タグ(18bp、65%平均効率)、FLAGエピトープタグ(24bp、18%平均効率)、およびCreリコンビナーゼのネイティブな基質である伸長されたLoxP部位(44bp、23%平均効率)を精密に挿入した。平均インデルはこれらの例では3.0%および5.9%の間の範囲であった(図43H)。多くのバイオテクノロジー、合成生物学、および治療学的適用が、新たなDNA配列を生細胞の目当ての標的部位に効率的にかつ精密に導入する能力から発生することが想定される。 The ability to insert DNA sequences with single nucleotide precision is a particularly potent prime editing ability. For example, PE3 was used to inject a His 6 tag (18 bp, 65% average efficiency), a FLAG epitope tag (24 bp, 18% average efficiency), and an extended LoxP, a native substrate of Cre recombinase, into the HEK3 locus in HEK293T cells. The site (44 bp, 23% average efficiency) was precisely inserted. Average indels ranged between 3.0% and 5.9% in these examples (Figure 43H). Many biotechnology, synthetic biology, and therapeutic applications are envisioned to arise from the ability to efficiently and precisely introduce new DNA sequences into desired target sites in living cells.

集合的に、本明細書に記載のプライム編集実験は、最高で44bpの18の挿入、最高で80bpの22の欠失、77のトランスバージョンを包含する113の点変異、および18の組み合わせ編集を、ヒトおよびマウスゲノムの12の内生座位において、PAMのスタートの3bp上流から29bp下流の範囲である位置付けにおいて、あからさまな二本鎖DNA切断を作ることなしに組み入れした。これらの結果はプライム編集を著しく汎用的なゲノム編集法として確立する。ClinVarの挿入、欠失、インデル、および重複の圧倒的多数(85-99%)は≦30bpであるので(図52A~52D)、原理的には、プライム編集はClinVarの75,122の現行で公知の病原性のヒト遺伝子バリアントの最高で~89%を修正し得(図38Aのトランジション、トランスバージョン、挿入、欠失、インデル、および重複)、コピー数獲得または損失によって引き起こされる疾患を改善する追加のポテンシャルを有する。 Collectively, the prime editing experiments described herein generated 113 point mutations encompassing 18 insertions of up to 44 bp, 22 deletions of up to 80 bp, 77 transversions, and 18 combinatorial edits. , integrated without creating overt double-stranded DNA breaks at 12 endogenous loci in the human and mouse genomes, at positions ranging from 3 bp upstream to 29 bp downstream of the start of PAM. These results establish prime editing as an extremely versatile genome editing method. Since the vast majority (85-99%) of ClinVar insertions, deletions, indels, and duplications are ≦30bp (Figures 52A-52D), prime editing could in principle reduce the current known size of ClinVar's 75,122 It can correct up to ~89% of pathogenic human gene variants (transitions, transversions, insertions, deletions, indels, and duplications in Figure 38A) and provides additional potential for ameliorating diseases caused by copy number gain or loss. It has potential.

重要なことに、いずれかの所望の編集について、プライム編集のフレキシビリティーは、PEgRNAによって誘導されるニックの位置付け、sgRNAによって誘導される第2のニックの位置付け、PBS長さ、RT鋳型長さ、およびどの鎖が最初に編集されるかの多くの可能な選択肢を、本願において鋭意実証されるとおりオファーする。他の精密ゲノム編集法で典型的に利用可能なより限定されたオプション125,142,154とは対照をなすこのフレキシビリティーは、編集効率、産物純度、DNA特異性、または他のパラメータが、所与の適用の必要に適するように最適化されることを許す。図50A~50Bに示されているとおりであり、これらにおいては、ある範囲のプライム編集戦略をカバーする14および43のPEgRNAを試験することが、夫々病原性のHBBおよびHEXAアレルの修正を最適化した。 Importantly, for any desired edit, the flexibility of prime editing depends on the positioning of the nick induced by PEgRNA, the positioning of the second nick induced by sgRNA, the PBS length, the RT template length. , and many possible choices of which strand is edited first, as will be extensively demonstrated in this application. This flexibility, in contrast to the more limited options typically available with other precision genome editing methods, 125,142,154 allows for the flexibility of editing efficiency, product purity, DNA specificity, or other parameters for a given application. allow it to be optimized to suit its needs. As shown in Figures 50A-50B, testing 14 and 43 PEgRNAs covering a range of prime editing strategies optimized the correction of pathogenic HBB and HEXA alleles, respectively. did.

かなりの追加の研究が、プライム編集をさらに理解および改善するために必要とされる。プライム編集因子システムの追加の改変が、有糸分裂後細胞などの他の細胞型を包含するようにそれらの適合性を拡張するために要求され得る。プライム編集をウイルス的および非ウイルス的なin vitroおよびインビボ送達戦略とインターフェース接続することが、遺伝子疾患の研究および処置を包含する広い範囲の適用を可能化するプライム編集のポテンシャルを十分に調査するために必要とされる。しかしながら、二本鎖切断またはHDRを要求することなしに、哺乳類細胞のゲノム上の高度に精密な標的化されたトランジション、トランスバージョン、小さい挿入、および小さい欠失を可能化することによって、プライム編集は、ゲノム編集の範囲を実質的に拡張する新たな「検索置換」能力を提供する。 Considerable additional research is needed to further understand and improve prime editing. Additional modifications of prime editing factor systems may be required to extend their suitability to include other cell types such as post-mitotic cells. To fully explore the potential of prime editing, interfacing prime editing with viral and non-viral in vitro and in vivo delivery strategies will enable a wide range of applications encompassing genetic disease research and treatment. required. However, by enabling highly precise targeted transitions, transversions, small insertions, and small deletions on the genome of mammalian cells without requiring double-strand breaks or HDR, prime editing provides new "search and replace" capabilities that substantially expand the scope of genome editing.

方法
一般的な方法
Method <br/> General method

別様に記されない限り、DNA増幅はPhusion U Green Multiplex PCRマスターミックス(ThermoFisher Scientific)またはQ5 Hot Start高忠実性2×マスターミックス(New England BioLabs)を用いるPCRによって行った。Cy5標識DNAオリゴヌクレオチド、dCas9タンパク質、およびCas9 H840Aタンパク質を包含するDNAオリゴヌクレオチドはIntegrated DNA Technologiesから得た。酵母レポータープラスミドは先に記載されたプラスミド64に由来し、Gibsonアセンブリ法によってクローニングされた。本願において用いられる全ての哺乳類編集因子プラスミドは先に記載されているとおりUSERクローニング法を用いてアセンブリされた175。sgRNAを発現するプラスミドは、BsmBI消化されたアクセプターベクター上へのアニーリングされたオリゴヌクレオチドのライゲーションによって構築した。PEgRNAを発現するプラスミドはGibsonアセンブリまたはゴールデンゲートアセンブリによってカスタムのアクセプタープラスミドを用いて構築した(補足の「ゴールデンゲートアセンブリ」概説を見よ)。本願において用いられるsgRNAおよびPEgRNA構築物の配列は表2A-2Cおよび表3A-3Rに列記されている。哺乳類細胞実験のための全てのベクターはPlasmid Plusミニプレップキット(Qiagen)またはPureYieldプラスミドミニプレップキット(Promega)を用いて精製した。これらはエンドトキシン除去ステップを包含する。生きた動物を用いる全ての実験はBroad Institute動物実験委員会によって認可された。野生型C57BL/6マウスはCharles Riverから得た(#027)。 Unless otherwise noted, DNA amplification was performed by PCR using Phusion U Green Multiplex PCR Master Mix (ThermoFisher Scientific) or Q5 Hot Start High Fidelity 2× Master Mix (New England BioLabs). DNA oligonucleotides containing Cy5-labeled DNA oligonucleotides, dCas9 protein, and Cas9 H840A protein were obtained from Integrated DNA Technologies. The yeast reporter plasmid was derived from previously described plasmid 64 and was cloned by the Gibson assembly method. All mammalian editing factor plasmids used in this application were assembled using the USER cloning method as previously described175 . Plasmids expressing sgRNA were constructed by ligation of annealed oligonucleotides onto the BsmBI-digested acceptor vector. Plasmids expressing PEgRNA were constructed using custom acceptor plasmids by Gibson assembly or Golden Gate assembly (see "Golden Gate Assembly" overview in the supplement). The sequences of the sgRNA and PEgRNA constructs used in this application are listed in Tables 2A-2C and Tables 3A-3R. All vectors for mammalian cell experiments were purified using the Plasmid Plus miniprep kit (Qiagen) or the PureYield plasmid miniprep kit (Promega). These include an endotoxin removal step. All experiments using live animals were approved by the Broad Institute Animal Care and Use Committee. Wild type C57BL/6 mice were obtained from Charles River (#027).

in vitroの生化学アッセイ in vitro biochemical assays

PEgRNAおよびsgRNAは、HiScribe T7in vitro転写キット(New England Biolabs)を用いて、T7プロモーター配列を含有するPCR増幅された鋳型からin vitro転写した。RNAを変性尿素PAGEによって精製し、使用に先行して分析ゲルによって品質確認した。5'-Cy5標識DNA二重鎖基質は、ニッキングされていない基質には2つのオリゴヌクレオチド(Cy5-AVA024およびAVA025;1:1.1比)または予めニックが入った基質には3つのオリゴヌクレオチド(Cy5-AVA023、AVA025、およびAVA026;1:1.1:1.1)を用いて、95℃への3分に渡る加熱、次に室温への低速の冷却によってアニーリングした(表2A~2C)。Cas9切断および逆転写反応はdNTPを足された1×切断緩衝液中で実行した205(20mM HEPES-K、pH7.5;100mM KCl;5%グリセロール;0.2mM EDTA、pH8.0;3mM MgCl2;0.5mM dNTPミックス;5mM DTT)。dCas9またはCas9 H840A(最終5μM)およびsgRNAまたはPEgRNA(最終5μM)を、二重鎖DNA基質(最終400nM)の追加、適用可能なときには次に開示されていないM-MLV RTバリアントSuperscript III逆転写酵素(ThermoFisher Scientific)の追加に先立って、10分に渡って5μL反応混合物中で室温においてプレインキュベーションした。反応を37℃で1時間に渡って実行し、それから水によって10μLの体積まで希釈し、0.2μLのプロテイナーゼK溶液(20mg/mL、ThermoFisher Scientific)によって処置し、室温で30分に渡ってインキュベーションした。10分の95℃における熱不活性化後に、反応産物を2×ホルムアミドゲルローディング緩衝液(90%ホルムアミド;10%グリセロール;0.01%ブロモフェノールブルー)と組み合わせ、95℃で5分に渡って変性し、変性尿素-PAGEゲル(15%TBE-尿素、55℃、200V)によって分離した。DNA産物はTyphoon FLA 7000バイオ分子イメージャーを用いてCy5蛍光シグナルによって視覚化した。 PEgRNA and sgRNA were transcribed in vitro from PCR amplified templates containing T7 promoter sequences using the HiScribe T7 in vitro transcription kit (New England Biolabs). RNA was purified by denaturing urea PAGE and quality checked by analytical gel prior to use. 5'-Cy5-labeled DNA duplex substrates were prepared using two oligonucleotides (Cy5-AVA024 and AVA025; 1:1.1 ratio) for unnicked substrates or three oligonucleotides (Cy5-AVA024 and AVA025; 1:1.1 ratio) for pre-nicked substrates. -AVA023, AVA025, and AVA026;1:1.1:1.1) were annealed by heating to 95°C for 3 minutes, followed by slow cooling to room temperature (Tables 2A-2C). Cas9 cleavage and reverse transcription reactions were carried out in 1× cleavage buffer supplemented with dNTPs ( 20mM HEPES-K, pH 7.5; 100mM KCl; 5% glycerol; 0.2mM EDTA, pH 8.0; 3mM MgCl2; 0.5mM dNTP mix; 5mM DTT). Add dCas9 or Cas9 H840A (5 μM final) and sgRNA or PEgRNA (5 μM final) to double-stranded DNA substrate (400 nM final), when applicable, then undisclosed M-MLV RT variant Superscript III reverse transcriptase (ThermoFisher Scientific) was pre-incubated at room temperature in 5 μL reaction mixture for 10 minutes. Reactions were carried out for 1 hour at 37°C, then diluted to a volume of 10 μL with water, treated with 0.2 μL of proteinase K solution (20 mg/mL, ThermoFisher Scientific), and incubated for 30 minutes at room temperature. . After heat inactivation at 95 °C for 10 min, the reaction product was combined with 2x formamide gel loading buffer (90% formamide; 10% glycerol; 0.01% bromophenol blue) and denatured at 95 °C for 5 min. , separated by denaturing urea-PAGE gel (15% TBE-urea, 55°C, 200V). DNA products were visualized by Cy5 fluorescence signal using a Typhoon FLA 7000 biomolecule imager.

電気泳動移動度シフトアッセイを、プレインキュベーションされたdCas9:sgRNAまたはdCas9:PEgRNA複合体(最終5nMおよび1μMの間の濃度範囲)およびCy5標識された二重鎖DNA(Cy5-AVA024およびAVA025;最終20nM)を用いて、1×結合緩衝液(1×切断緩衝液+10μg/mLヘパリン)中で実行した。37℃における15分のインキュベーション後に、サンプルをネイティブPAGEゲル(10%TBE)によって分析し、Cy5蛍光についてイメージングした。 Electrophoretic mobility shift assays were performed using preincubated dCas9:sgRNA or dCas9:PEgRNA complexes (concentration range between 5 nM and 1 μM final) and Cy5-labeled double-stranded DNA (Cy5-AVA024 and AVA025; final 20 nM). ) in 1× binding buffer (1× cleavage buffer + 10 μg/mL heparin). After 15 minutes of incubation at 37°C, samples were analyzed by native PAGE gel (10% TBE) and imaged for Cy5 fluorescence.

逆転写産物のDNA配列決定のために、蛍光バンドを尿素-PAGEゲルから切除、精製し、それから、ターミナルトランスフェラーゼ(TdT;New England Biolabs)によってdGTPまたはdATPの存在下において製造者のプロトコールに従って3'テーリングした。テーリングされたDNA産物を結合緩衝液(40%塩化グアニジニウム飽和水溶液+60%イソプロパノール)によって10倍希釈し、QIAquickスピンカラム(Qiagen)によって精製し、それから、プライマーAVA134(Aテーリングされた産物)またはAVA135(Gテーリングされた産物)を用いるKlenowフラグメント(New England Biolabs)によるプライマー伸長のための鋳型として用いた(表2A-2C)。伸長を10サイクルのPCRによってプライマーAVA110およびAVA122を用いて増幅し、それからAVA037によってSanger法を用いて配列決定した(表2A-2C)。 For DNA sequencing of the reverse transcripts, fluorescent bands were excised and purified from urea-PAGE gels and then 3' transduced by terminal transferase (TdT; New England Biolabs) in the presence of dGTP or dATP according to the manufacturer's protocol. I tailed it. The tailed DNA product was diluted 10 times with binding buffer (40% saturated aqueous guanidinium chloride + 60% isopropanol), purified by QIAquick spin columns (Qiagen), and then purified with primers AVA134 (A-tailed product) or AVA135. (G-tailed product) was used as template for primer extension with the Klenow fragment (New England Biolabs) (Tables 2A-2C). The extension was amplified by 10 cycles of PCR using primers AVA110 and AVA122 and then sequenced using the Sanger method with AVA037 (Tables 2A-2C).

酵母蛍光レポーターアッセイ Yeast fluorescent reporter assay

インフレーム停止コドン、+1フレームシフト、または-1フレームシフトを含有する二元的な蛍光レポータープラスミドを、上に記載されているとおりin vitroの5'伸長されたPEgRNAまたは3'伸長されたPEgRNAのプライム編集反応に付した。37℃での1時間のインキュベーション後に、反応を水によって希釈し、プラスミドDNAを0.3M酢酸ナトリウムおよび70%エタノールによって沈殿した。再懸濁されたDNAを先に記載されているとおりエレクトロポレーションによってS.cerevisiaeに形質転換し67、ロイシンなしの合成完全培地(SC(グルコース)、L-)にプレーティングした。GFPおよびmCherry蛍光シグナルをTyphoon FLA 7000バイオ分子イメージャーによってコロニーから視覚化した。 Dual fluorescent reporter plasmids containing an in-frame stop codon, +1 frameshift, or -1 frameshift were added to in vitro 5'-extended PEgRNA or 3'-extended PEgRNA as described above. Submitted to Prime Edit Reaction. After 1 hour incubation at 37°C, the reaction was diluted with water and the plasmid DNA was precipitated with 0.3M sodium acetate and 70% ethanol. The resuspended DNA was transformed into S. cerevisiae by electroporation as previously described 67 and plated on synthetic complete medium without leucine (SC (glucose), L-). GFP and mCherry fluorescent signals were visualized from colonies by a Typhoon FLA 7000 biomolecular imager.

一般的な哺乳類細胞培養条件 Common mammalian cell culture conditions

HEK293T(ATCC CRL-3216)、U2OS(ATTC HTB-96)、K562(CCL-243)、およびHeLa(CCL-2)細胞はATCCから購入し、夫々が10%(v/v)ウシ胎児血清(Gibco、品質保証)および1×ペニシリンストレプトマイシン(Corning)を足された夫々ダルベッコ改変イーグル培地(DMEM)プラスGlutaMAX(ThermoFisher Scientific)、マッコイ5A培地(Gibco)、RPMI培地1640プラスGlutaMAX(Gibco)、またはイーグル最小必須培地(EMEM、ATCC)によって培養および継代した。全ての細胞型は37℃において5%CO2でインキュベーション、維持、および培養した。細胞株はそれらの夫々のサプライヤーによって認証され、マイコプラズマ検査陰性であった。 HEK293T (ATCC CRL-3216), U2OS (ATTC HTB-96), K562 (CCL-243), and HeLa (CCL-2) cells were purchased from ATCC and each supplemented with 10% (v/v) fetal bovine serum ( Dulbecco's Modified Eagle's Medium (DMEM) plus GlutaMAX (ThermoFisher Scientific), McCoy's 5A Medium (Gibco), RPMI Medium 1640 plus GlutaMAX (Gibco), or Eagle supplemented with Gibco, Quality Assurance) and 1× Penicillin-Streptomycin (Corning), respectively. Cultured and passaged with minimal essential medium (EMEM, ATCC). All cell types were incubated, maintained, and cultured at 37 °C with 5% CO2 . Cell lines were certified by their respective suppliers and tested negative for mycoplasma.

HEK293T組織培養トランスフェクションプロトコールおよびゲノムDNA調製 HEK293T tissue culture transfection protocol and genomic DNA preparation

成長したHEK293T細胞を48ウェルポリD-リジンコーティングプレート(Corning)上に播種した。播種の16から24時間後に、細胞を、およそ60%コンフルエンシーで、製造者のプロトコールに従う1μLのLipofectamine 2000(Thermo Fisher Scientific)、ならびに750ngのPEプラスミド、250ngのPEgRNAプラスミド、および83ngのsgRNAプラスミド(PE3およびPE3bについて)によってトランスフェクションした。別様に申し立てられない限り、細胞はトランスフェクション後に3日培養し、これの後に培地を除去し、細胞を1×PBS溶液(Thermo Fisher Scientific)によって洗浄し、ゲノムDNAを、直接的に組織培養プレートの各ウェルへの150μLの新しく調製されたリシス緩衝液(10mM Tris-HCl、pH7.5;0.05%SDS;25μg/mLプロテイナーゼK(ThermoFisher Scientific))の追加によって抽出した。ゲノムDNA混合物を37℃で1から2時間に渡ってインキュベーションし、次に30分の80℃の酵素不活性化ステップをした。哺乳類細胞ゲノムDNA増幅に用いられたプライマーは表4に列記されている。HEK293T細胞におけるHDR実験では、231 ngのヌクレアーゼ発現プラスミド、69 ngのsgRNA発現プラスミド、50 ng(1.51 pmol)の100nt ssDNAドナー鋳型(PAGE精製済み;Integrated DNA Technologies)を、1.4 μLのLipofectamine 2000(ThermoFisher)を用いてウェル当たりリポフェクションした。全てのHDR実験からのゲノムDNAはAgencourt DNAdvanceキット(Beckman Coulter)を用いて製造者のプロトコールに従って精製した。 Grown HEK293T cells were seeded onto 48-well poly D-lysine coated plates (Corning). 16 to 24 hours after seeding, cells were incubated at approximately 60% confluency with 1 μL of Lipofectamine 2000 (Thermo Fisher Scientific) according to the manufacturer's protocol, and 750 ng of PE plasmid, 250 ng of PEgRNA plasmid, and 83 ng of sgRNA plasmid ( PE3 and PE3b). Unless otherwise stated, cells were cultured for 3 days after transfection, after which the medium was removed, cells were washed with 1x PBS solution (Thermo Fisher Scientific), and genomic DNA was transferred directly to tissue culture. Extraction was performed by adding 150 μL of freshly prepared lysis buffer (10 mM Tris-HCl, pH 7.5; 0.05% SDS; 25 μg/mL proteinase K (ThermoFisher Scientific)) to each well of the plate. The genomic DNA mixture was incubated at 37°C for 1 to 2 hours, followed by a 30 minute 80°C enzyme inactivation step. Primers used for mammalian cell genomic DNA amplification are listed in Table 4. For HDR experiments in HEK293T cells, 231 ng of nuclease expression plasmid, 69 ng of sgRNA expression plasmid, 50 ng (1.51 pmol) of 100 nt ssDNA donor template (PAGE purified; Integrated DNA Technologies) were mixed with 1.4 μL of Lipofectamine 2000 (ThermoFisher ) was used for lipofection per well. Genomic DNA from all HDR experiments was purified using the Agencourt DNAdvance kit (Beckman Coulter) according to the manufacturer's protocol.

ゲノムDNAサンプルの高スループットDNA配列決定 High-throughput DNA sequencing of genomic DNA samples

目当てのゲノム部位をゲノムDNAサンプルから増幅し、次の改変によって先に記載されているとおりIllumina MiSeqによって配列決定した129,130。手短かには、Illuminaフォワードおよびリバースアダプターを含有する増幅プライマー(表4)を第1ラウンドのPCR(PCR1)に用い、目当てのゲノム領域を増幅した。25μLのPCR1反応を、0.5μMの各フォワードおよびリバースプライマー、1μLのゲノムDNA抽出物、および12.5μLのPhusion U Green Multiplex PCRマスターミックスによって行った。PCR反応は次のとおり実行した:2分の98℃、それから30サイクルの[10秒の98℃、20秒の61℃、および30秒の72℃]、次に2分の最終の72℃伸長。固有のIlluminaバーコード化プライマーペアを二次PCR反応(PCR2)の各サンプルに追加した。具体的には、25μLの所与のPCR2反応は、0.5μMの各固有のフォワードおよびリバースilluminaバーコード化プライマーペア、1μLの未精製のPCR1反応混合物、および12.5μLのPhusion U Green Multiplex PCR 2×マスターミックスを含有した。バーコード化PCR2反応は次のとおり実行した:2分の98℃、それから12サイクルの[10秒の98℃、20秒の61℃、および30秒の72℃]、次に2分の最終の72℃伸長。PCR産物は1.5%アガロースゲルによる電気泳動によって分析的に評価した。PCR2産物(共通アンプリコンによってプールされた)を1.5%アガロースゲルによる電気泳動によって精製した。QIAquickゲル抽出キット(Qiagen)を用い、40μLの水によって溶出した。DNA濃度をフルオロメトリー定量(Qubit、ThermoFisher Scientific)またはqPCR(KAPAライブラリ定量キット-Illumina、KAPA Biosystems)によって測定し、製造者のプロトコールに従ってIllumina MiSeq装置によって配列決定した。 Genomic sites of interest were amplified from genomic DNA samples and sequenced by Illumina MiSeq as previously described with the following modifications. Briefly, amplification primers containing Illumina forward and reverse adapters (Table 4) were used in the first round of PCR (PCR1) to amplify the genomic region of interest. A 25 μL PCR1 reaction was performed with 0.5 μM of each forward and reverse primer, 1 μL of genomic DNA extract, and 12.5 μL of Phusion U Green Multiplex PCR master mix. PCR reactions were performed as follows: 98°C for 2 min, then 30 cycles [98°C for 10 s, 61°C for 20 s, and 72°C for 30 s], then a final 72°C extension for 2 min. . A unique Illumina barcoded primer pair was added to each sample in the secondary PCR reaction (PCR2). Specifically, 25 μL of a given PCR2 reaction contains 0.5 μM of each unique forward and reverse illumina barcoded primer pair, 1 μL of unpurified PCR1 reaction mix, and 12.5 μL of Phusion U Green Multiplex PCR 2× Contains a master mix. Barcoding PCR2 reactions were performed as follows: 98°C for 2 min, then 12 cycles [98°C for 10 s, 61°C for 20 s, and 72°C for 30 s], then a final cycle of 2 min. Extended at 72℃. PCR products were evaluated analytically by electrophoresis on a 1.5% agarose gel. PCR2 products (pooled by common amplicon) were purified by electrophoresis on a 1.5% agarose gel. Elution was performed with 40 μL of water using the QIAquick gel extraction kit (Qiagen). DNA concentration was measured by fluorometric quantification (Qubit, ThermoFisher Scientific) or qPCR (KAPA Library Quantification Kit - Illumina, KAPA Biosystems) and sequenced by an Illumina MiSeq instrument according to the manufacturer's protocol.

配列決定読取をMiSeqレポーター(Illumina)を用いてデマルチプレックスした。参照配列に対するアンプリコン配列のアラインメントをCRISPResso2を用いて行った178。点変異編集の定量のためには、CRISPResso2を「discard_indel_reads」オンによる標準モードで走らせた。編集効率は:(捨てられなかった読取における規定された点変異の度数)×(捨てられなかった読取の#)÷トータル読取として計算した。挿入または欠失編集では、CRISPResso2を「discard_indel_reads」オンで予想されるアレル(e flag)として所望のアレルを用いてHDRモードで走らせた。編集収量はトータル読取によって割られたHDRアラインメント読取の数として計算した。全ての編集について、インデル収量はトータル読取によって割られた捨てられた読取の数として計算した。 Sequencing reads were demultiplexed using MiSeq reporter (Illumina). Alignment of amplicon sequences to reference sequences was performed using CRISPResso2 . For quantification of point mutation edits, CRISPResso2 was run in standard mode with "discard_indel_reads" on. Editing efficiency was calculated as: (frequency of defined point mutation in non-discarded reads) x (# of non-discarded reads) ÷ total reads. For insertion or deletion edits, CRISPResso2 was run in HDR mode with "discard_indel_reads" on and the desired allele as the expected allele (e flag). Editing yield was calculated as the number of HDR aligned reads divided by total reads. For all edits, indel yield was calculated as the number of discarded reads divided by total reads.

U2OS、K562、およびHeLa細胞のヌクレオフェクション Nucleofection of U2OS, K562, and HeLa cells

ヌクレオフェクションは全ての実験においてK562、HeLa、およびU2OS細胞を用いて行った。これらの細胞型のPE条件では、800ngプライム編集因子発現プラスミド、200ngのPEgRNA発現プラスミド、および83ngのニッキングプラスミドを20μLの最終体積で16ウェルnucleocuvetteストリップ(Lonza)上でヌクレオフェクションした。これらの3つの細胞型のHDR条件では、350ngヌクレアーゼ発現プラスミド、150ngのsgRNA発現プラスミド、および200pmol(6.6μg)の100nt ssDNAドナー鋳型(PAGE精製済み;Integrated DNA Technologies)をサンプル当たり20 μLの最終体積で16ウェルNucleocuvetteストリップ(Lonza)上でヌクレオフェクションした。K562細胞は、SF Cell Line 4D-Nucleofector Xキット(Lonza)を用いて、サンプル当たり5×105細胞で(プログラムFF-120)、製造者のプロトコールに従ってヌクレオフェクションした。U2OS細胞は、SE Cell Line 4D-Nucleofector Xキット(Lonza)を用いて、サンプル当たり3-4×105細胞で(プログラムDN-100)、製造者のプロトコールに従ってヌクレオフェクションした。HeLa細胞は、SE Cell Line 4D-Nucleofector Xキット(Lonza)を用いて、サンプル当たり2×105細胞で(プログラムCN-114)、製造者のプロトコールに従ってヌクレオフェクションした。細胞はヌクレオフェクションの72時間後にゲノムDNA抽出のために収穫した。 Nucleofection was performed using K562, HeLa, and U2OS cells in all experiments. For PE conditions for these cell types, 800 ng prime editing factor expression plasmid, 200 ng PEgRNA expression plasmid, and 83 ng nicking plasmid were nucleofected on 16-well nucleocuvette strips (Lonza) in a final volume of 20 μL. For HDR conditions for these three cell types, 350 ng nuclease expression plasmid, 150 ng sgRNA expression plasmid, and 200 pmol (6.6 μg) of 100 nt ssDNA donor template (PAGE purified; Integrated DNA Technologies) were added in a final volume of 20 μL per sample. Nucleofection was performed on 16-well Nucleocuvette strips (Lonza). K562 cells were nucleofected using the SF Cell Line 4D-Nucleofector X kit (Lonza) at 5×10 5 cells per sample (program FF-120) according to the manufacturer's protocol. U2OS cells were nucleofected using the SE Cell Line 4D-Nucleofector X kit (Lonza) at 3-4×10 5 cells per sample (program DN-100) according to the manufacturer's protocol. HeLa cells were nucleofected using the SE Cell Line 4D-Nucleofector X kit (Lonza) at 2×10 5 cells per sample (program CN-114) according to the manufacturer's protocol. Cells were harvested for genomic DNA extraction 72 hours after nucleofection.

HDR実験のためのゲノムDNA抽出 Genomic DNA extraction for HDR experiments

HEK293T、HEK293T HBB E6V、K562、U2OS、およびHeLa細胞における全てのHDR比較実験からのゲノムDNAは、製造者のプロトコールに従ってAgencourt DNAdvanceキット(Beckman Coulter)を用いて精製した。 Genomic DNA from all HDR comparison experiments in HEK293T, HEK293T HBB E6V, K562, U2OS, and HeLa cells was purified using the Agencourt DNAdvance kit (Beckman Coulter) according to the manufacturer's protocol.

PE2、PE3、BE2、BE4max、ABEdmax、およびABEmaxの間の比較 Comparison between PE2, PE3, BE2, BE4max, ABEdmax, and ABEmax

HEK293T細胞を48ウェルポリD-リジンコーティングプレート(Corning)に播種した。16から24時間後に、細胞をおよそ60%コンフルエンシーでトランスフェクションした。CBEまたはABE構築物による塩基編集では、細胞を750ngの塩基編集因子プラスミド、250ngのsgRNA発現プラスミド、および1μLのLipofectamine 2000(Thermo Fisher Scientific)によってトランスフェクションした。PEトランスフェクションは上に記載されているとおり行った。PEおよびBEのゲノムDNA抽出は上に記載されているとおり行った。 HEK293T cells were seeded in 48-well poly D-lysine coated plates (Corning). After 16 to 24 hours, cells were transfected at approximately 60% confluency. For base editing with CBE or ABE constructs, cells were transfected with 750 ng of base editor plasmid, 250 ng of sgRNA expression plasmid, and 1 μL of Lipofectamine 2000 (Thermo Fisher Scientific). PE transfection was performed as described above. Genomic DNA extraction of PE and BE was performed as described above.

公知のCas9オフターゲット部位におけるPE3活性の決定 Determination of PE3 activity at known Cas9 off-target sites

公知のCas9オフターゲット部位におけるPE3オフターゲット編集活性を評価するために、PE3によるトランスフェクションの3日後にHEK293T細胞から抽出されたゲノムDNAを、16の先に報告されたCas9オフターゲットゲノム部位のPCR増幅のための鋳型として用いた118,159(夫々HEK3、EMX1、FANCF、およびHEK4スペーサーの上位4つのオフターゲット部位;プライマー配列は表4に列記されている)。これらのゲノムDNAサンプルは、図41A-41Kに示されているオンターゲットPE3編集活性を定量するために用いられたものと同一であった;PEgRNAおよびニッキングsgRNA配列は表3A-3Rに列記されている。オフターゲット部位のPCR増幅後に、アンプリコンを上に記載されているとおりIllumina MiSeqプラットフォームによって配列決定した(HTS分析)。Cas9ヌクレアーゼ、Cas9 H840Aニッカーゼ、dCas9、ならびにPE2-dRTオンターゲットおよびオフターゲット編集活性を決定するために、HEK293T細胞を750ngの編集因子プラスミド(Cas9ヌクレアーゼ、Cas9 H840Aニッカーゼ、dCas9、またはPE2-dRT)、250ngのPEgRNAまたはsgRNAプラスミド、および1μLのLipofectamine 2000によってトランスフェクションした。ゲノムDNAを上に記載されているとおりトランスフェクションの3日後に細胞から単離した。オンターゲットおよびオフターゲットゲノム座位を表4のプライマー配列を用いてPCRによって増幅し、Illumina MiSeqによって配列決定した。 To assess PE3 off-target editing activity at known Cas9 off-target sites, genomic DNA extracted from HEK293T cells 3 days after transfection with PE3 was subjected to PCR for 16 previously reported Cas9 off-target genomic sites. 118,159 (top four off-target sites of HEK3, EMX1, FANCF, and HEK4 spacers, respectively; primer sequences are listed in Table 4) used as templates for amplification. These genomic DNA samples were identical to those used to quantify on-target PE3 editing activity shown in Figures 41A-41K; PEgRNA and nicking sgRNA sequences are listed in Tables 3A-3R. There is. After PCR amplification of off-target sites, amplicons were sequenced by the Illumina MiSeq platform as described above (HTS analysis). To determine Cas9 nuclease, Cas9 H840A nickase, dCas9, and PE2-dRT on-target and off-target editing activities, HEK293T cells were incubated with 750 ng of editing factor plasmid (Cas9 nuclease, Cas9 H840A nickase, dCas9, or PE2-dRT); Transfection was performed with 250 ng of PEgRNA or sgRNA plasmid and 1 μL of Lipofectamine 2000. Genomic DNA was isolated from cells 3 days after transfection as described above. On-target and off-target genomic loci were amplified by PCR using the primer sequences in Table 4 and sequenced by Illumina MiSeq.

HTSデータ分析をCRISPResso2を用いて行った178。Cas9ヌクレアーゼ、Cas9 H840Aニッカーゼ、およびdCas9の編集効率を、インデルを含有する配列決定総読取のパーセントとして定量した。PE3およびPE3-dRTオフターゲットの定量のために、アラインメントされた配列決定読取を、Cas9ニック部位において開始されるPEgRNA逆転写の予期される産物と整合する点変異、挿入、または欠失について検分した。サンプル中のトータル読取のうち<0.1%の総体的な度数で生起する1ヌクレオチドバリエーションは、分析から排除した。度数≧0.1%で生起するかつPEgRNAによってコードされる編集と部分的に整合する両方である1ヌクレオチドバリエーションを含有する読取については、t検定(対応なし、片側、α=0.5)を用いて、同じスペーサーを含有するが異なる編集をコードするPEgRNAによって処置されたサンプルと比較して、バリアントが有意に高いレベルで生起するかどうかを決定した。配列決定エラーの違いを回避するために、同じMiSeqランによって同時に配列決定されたサンプル間の比較をなした。p値>0.05の基準を満たさなかったバリアントは排除した。それから、オフターゲットPE3編集活性を上の基準を満たす配列決定総読取のパーセンテージとして計算した。 HTS data analysis was performed using CRISPResso2178 . The editing efficiency of Cas9 nuclease, Cas9 H840A nickase, and dCas9 was quantified as the percentage of total sequencing reads containing indels. For PE3 and PE3-dRT off-target quantification, aligned sequencing reads were inspected for point mutations, insertions, or deletions consistent with the expected product of PEgRNA reverse transcription initiated at the Cas9 nick site. . Single nucleotide variations occurring at an overall frequency of <0.1% of the total reads in the sample were excluded from the analysis. For reads containing a single nucleotide variation that both occurs at a frequency ≧0.1% and is partially consistent with the edit encoded by PEgRNA, a t-test (unpaired, one-tailed, α=0.5) was used to determine whether the same We determined whether the variants occurred at significantly higher levels compared to samples treated with PEgRNAs containing spacers but encoding different edits. Comparisons were made between samples sequenced simultaneously by the same MiSeq run to avoid differences in sequencing errors. Variants that did not meet the criteria of p-value > 0.05 were excluded. Off-target PE3 editing activity was then calculated as the percentage of total sequencing reads that met the above criteria.

Cas9によって開始されるHDRを用いるHBB E6V変異を含有するHEK293T細胞株の生成 Generation of HEK293T cell line containing HBB E6V mutation using Cas9-initiated HDR

HEK293T細胞を48ウェルプレートに播種し、およそ60%コンフルエンシーで、1.5μLのLipofectamine 2000、300ngのCas9 D10Aニッカーゼプラスミド、100ngのsgRNAプラスミド、および200ngの100mer ssDNAドナー鋳型(表5)によってトランスフェクションした。トランスフェクションの3日後に、培地を新しい培地に交換した。トランスフェクションの4日後に、細胞を30μLのTrypLE溶液を用いて解離させ、1.5mLの培地に懸濁した。単細胞を蛍光活性化細胞ソーティング(FACS)(Beckman-Coulter Astrios)によって2つの96ウェルプレートの個々のウェルに単離した。代表的なFACSソーティング例は図53A-53Bを見よ。細胞を、上に記載されているとおりゲノムDNA配列決定に先行して14日に渡って拡大培養した。単離されたクローン集団からは、いずれもHBB E6V変異についてホモ接合であることは見出されなかった。そのため、リポフェクションによる編集、ソーティング、およびアウトグロースの第2ラウンドを部分的に編集された細胞株において繰り返して、E6Vアレルについてホモ接合の細胞株を生んだ。 HEK293T cells were seeded in 48-well plates and transfected at approximately 60% confluency with 1.5 μL Lipofectamine 2000, 300 ng Cas9 D10A nickase plasmid, 100 ng sgRNA plasmid, and 200 ng 100mer ssDNA donor template (Table 5). Three days after transfection, the medium was replaced with fresh medium. Four days after transfection, cells were dissociated with 30 μL TrypLE solution and suspended in 1.5 mL medium. Single cells were isolated into individual wells of two 96-well plates by fluorescence-activated cell sorting (FACS) (Beckman-Coulter Astrios). See Figures 53A-53B for representative FACS sorting examples. Cells were expanded for 14 days prior to genomic DNA sequencing as described above. None of the isolated clonal populations were found to be homozygous for the HBB E6V mutation, so a second round of lipofection-based editing, sorting, and outgrowth was repeated in the partially edited cell line to generate a cell line homozygous for the E6V allele.

PE3を用いるHBB E6V変異を含有するHEK293T細胞株の生成 Generation of HEK293T cell line containing HBB E6V mutation using PE3

抗生物質の不在下で成長させた2.5×104のHEK293T細胞を48ウェルポリD-リジンコーティングプレート(Corning)に播種した。播種の16から24時間後に、細胞を、およそ70%コンフルエンシーで、製造者のプロトコールに従って1μLのLipofectamine 2000(Thermo Fisher Scientific)、ならびに750ngのPE2-P2A-GFPプラスミド、250ngのPEgRNAプラスミド、および83ngのsgRNAプラスミドによってトランスフェクションした。トランスフェクション後の3日後に、細胞をリン酸緩衝生理食塩水(Gibco)によって洗浄し、TrypLE Express(Gibco)を用いて解離させた。それから、細胞を10%(v/v)FBS(Gibco)を足されたDMEMプラスGlutaMax(Thermo Fisher Scientific)によって希釈し、ソーティングに先行して35μmセルストレーナー(Corning)を通過させた。フローサイトメトリーをLE-MA900セルソーター(Sony)によって実行した。細胞は3nM DAPI(BioLegend)によってソーティングに15分先行して処置した。ダブレット除去のためのゲーティング後に、GFP陰性対照細胞集団のものよりも上のGFP蛍光を有するDAPI陰性単細胞を、10%FBSを足されたGlutaMaxありの予冷されたDMEMを充填した96ウェル平底細胞培養プレート(Corning)にソーティングした。代表的なFACSソーティング例は図53A-53Bを見よ。細胞は、上に記載されているとおり、ゲノムDNA抽出およびHTSによる特徴付けに先行して10日に渡って培養した。HBBのE6V変異についてホモ接合であるトータルで6つのクローン細胞株を同定した。 2.5 x 104 HEK293T cells grown in the absence of antibiotics were seeded in 48-well poly-D-lysine coated plates (Corning). 16 to 24 hours after seeding, cells were incubated at approximately 70% confluency with 1 μL of Lipofectamine 2000 (Thermo Fisher Scientific) according to the manufacturer's protocol, as well as 750 ng of PE2-P2A-GFP plasmid, 250 ng of PEgRNA plasmid, and 83 ng of PEgRNA plasmid. transfected with the sgRNA plasmid. Three days after transfection, cells were washed with phosphate buffered saline (Gibco) and dissociated using TrypLE Express (Gibco). Cells were then diluted in DMEM plus GlutaMax (Thermo Fisher Scientific) supplemented with 10% (v/v) FBS (Gibco) and passed through a 35 μm cell strainer (Corning) prior to sorting. Flow cytometry was performed with a LE-MA900 cell sorter (Sony). Cells were treated with 3nM DAPI (BioLegend) for 15 minutes prior to sorting. After gating for doublet removal, select DAPI-negative single cells with GFP fluorescence above that of the GFP-negative control cell population in 96-well flat-bottomed cells filled with pre-chilled DMEM with GlutaMax supplemented with 10% FBS. Sorted onto culture plates (Corning). See Figures 53A-53B for representative FACS sorting examples. Cells were cultured for 10 days prior to genomic DNA extraction and HTS characterization as described above. A total of six clonal cell lines homozygous for the E6V mutation in HBB were identified.

PE3を用いるHEXA 1278+TATC挿入を含有するHEK293T細胞株の生成 Generation of HEK293T cell lines containing HEXA 1278+TATC insertions using PE3

HEXA 1278+TATCアレルを含有するHEK293T細胞を、HBB E6V細胞株の生出について上に記載されているプロトコールを踏襲して生成した;PEgRNAおよびsgRNA配列は表2A-2Cにおいて図43A-43H小見出し下に列記されている。トランスフェクションおよびソーティング後に、細胞を、上に記載されているとおりゲノムDNA抽出およびHTSによる特徴付けに先行して10日に渡って培養した。50%のHEXA 1278+TATCアレルを含有する2つのヘテロ接合体細胞株を単離し、100%のHEXA 1278+TATCアレルを含有する2つのホモ接合細胞株を回復した。 HEK293T cells containing the HEXA 1278+TATC allele were generated following the protocol described above for the generation of HBB E6V cell lines; PEgRNA and sgRNA sequences are shown in Tables 2A-2C under the subheadings of Figures 43A-43H. listed. After transfection and sorting, cells were cultured for 10 days prior to genomic DNA extraction and HTS characterization as described above. Two heterozygous cell lines containing 50% HEXA 1278+TATC allele were isolated and two homozygous cell lines containing 100% HEXA 1278+TATC allele were recovered.

細胞生存性アッセイ Cell viability assay

HEK293T細胞を48ウェルプレートに播種し、およそ70%コンフルエンシーにおいて、750ngの編集因子プラスミド(PE3、PE3 R110S K103L、Cas9 H840Aニッカーゼ、またはdCas9)、250ngのHEK3標的化PEgRNAプラスミド、および1μLのLipofectamine 2000によって、上に記載されているとおりトランスフェクションした。細胞生存性を、トランスフェクション後に3日に渡って24時間毎に測定した。製造者のプロトコールに従ってCellTiter-Glo 2.0アッセイ(Promega)を用いた。ルミネセンスを96ウェル平底ポリスチレンマイクロプレート(Corning)上でM1000 Proマイクロプレートリーダー(Tecan)を用いて1秒の積算時間で測定した。 HEK293T cells were seeded in 48-well plates at approximately 70% confluence with 750 ng of editing factor plasmid (PE3, PE3 R110S K103L, Cas9 H840A nickase, or dCas9), 250 ng of HEK3-targeting PEgRNA plasmid, and 1 μL of Lipofectamine 2000. Transfection was performed as described above. Cell viability was measured every 24 hours for 3 days after transfection. The CellTiter-Glo 2.0 assay (Promega) was used according to the manufacturer's protocol. Luminescence was measured on 96-well flat bottom polystyrene microplates (Corning) using an M1000 Pro microplate reader (Tecan) with an integration time of 1 second.

レンチウイルス生産 lentivirus production

レンチウイルスは先に記載されているとおり生じた206。T-75フラスコの急速に分裂するHEK293T細胞(ATCC;マナサス、VA、USA)を、インテイン分裂PE2編集因子を持つ改変されたlentiCRISPR_v2ゲノムとの組み合わせで、レンチウイルス生産ヘルパープラスミドpVSV-GおよびpsPAX2によってトランスフェクションした。製造者の説明に従ってFuGENE HD(Promega、マディソン、WI、USA)を用いた。4つの分裂インテイン編集因子構築物をデザインした:1)U6-PEgRNA発現カセットとNpu Nインテイン、自己切断P2Aペプチド、およびGFP-KASHに融合されたCas9 H840AニッカーゼのN末端部分(1-573)とをコードするウイルスゲノム;2)PE2のC末端残りに融合されたNpu Cインテインをコードするウイルスゲノム;3)Cas9対照のためのCas9のC末端残りに融合されたNpu Cインテインをコードするウイルスゲノム;および4)DNMT1のニッキングsgRNAである。分裂インテインはPE2またはCas9の2つの半分同士を連結するためのトランススプライシングを媒介し、P2A GFP-KASHは核膜局在したGFPの共翻訳的生産を可能化する。48時間後に、上清を収集し、500gで5分に渡って遠心して細胞破片を除去し、0.45μmフィルターを用いて濾過した。濾過された上清を製造者の説明に従ってPEG-itウイルス沈殿溶液(System Biosciences、パロアルト、CA、USA)を用いて濃縮した。もたらされたペレットを元々の培地体積の1%を用いてOpti-MEM(Thermo Fisher Scientific、ウォルサム、MA、USA)に再懸濁した。再懸濁されたペレットを瞬間凍結し、使用まで-80℃で貯蔵した。 Lentivirus was generated as previously described206 . Rapidly dividing HEK293T cells (ATCC; Manassas, VA, USA) in T-75 flasks were infected with lentivirus-produced helper plasmids pVSV-G and psPAX2 in combination with a modified lentiCRISPR_v2 genome carrying the intein-splitting PE2 editing factor. transfected. FuGENE HD (Promega, Madison, WI, USA) was used according to the manufacturer's instructions. We designed four split intein editing factor constructs: 1) a U6-PEgRNA expression cassette with Npu N intein, a self-cleaving P2A peptide, and the N-terminal part of Cas9 H840A nickase (1-573) fused to GFP-KASH; 2) a viral genome encoding the Npu C intein fused to the C-terminal remainder of PE2; 3) a viral genome encoding the Npu C intein fused to the C-terminal remainder of Cas9 for a Cas9 control; and 4) DNMT1 nicking sgRNA. The mitotic intein mediates trans-splicing to join the two halves of PE2 or Cas9, and P2A GFP-KASH allows co-translational production of nuclear envelope-localized GFP. After 48 hours, the supernatant was collected, centrifuged at 500g for 5 minutes to remove cell debris, and filtered using a 0.45 μm filter. The filtered supernatant was concentrated using PEG-it virus precipitation solution (System Biosciences, Palo Alto, CA, USA) according to the manufacturer's instructions. The resulting pellet was resuspended in Opti-MEM (Thermo Fisher Scientific, Waltham, MA, USA) using 1% of the original medium volume. The resuspended pellets were snap frozen and stored at -80°C until use.

マウス初代皮質ニューロン解剖および培養 Mouse primary cortical neuron dissection and culture

E18.5解離皮質培養物を計画妊娠C57BL/6マウス(Charles River)から収穫した。CO2による安楽死後に、胎児を妊娠マウスから収穫し、次に断頭をした。皮質キャップをペニシリン/ストレプトマイシン(Life Technologies)を足された氷冷Hibernate-E中で解剖した。氷冷Hibernate-Eによるリンス後に、組織を37℃で8分に渡ってパパイン/DNase(Worthington/Sigma)によって消化した。組織をDNaseを足されたNBActiv4(BrainBits)中でトリチュレーションした。細胞をカウントし、ウェル当たり100,000細胞で24ウェルプレートに置いた。培地の半分を週当たり2回換えた。 E18.5 dissociated cortical cultures were harvested from planned pregnancy C57BL/6 mice (Charles River). Fetuses were harvested from pregnant mice after CO2 euthanasia and then decapitated. Cortical caps were dissected in ice-cold Hibernate-E supplemented with penicillin/streptomycin (Life Technologies). After rinsing with ice-cold Hibernate-E, tissues were digested with papain/DNase (Worthington/Sigma) for 8 minutes at 37°C. Tissues were triturated in NBActiv4 (BrainBits) supplemented with DNase. Cells were counted and placed in 24-well plates at 100,000 cells per well. Half of the medium was changed twice per week.

初代ニューロンのプライム編集および核単離 Prime editing of primary neurons and nuclear isolation

DIV1において、15μLのレンチウイルスを10:10:1比のN末端:C末端:ニッキングsgRNAで追加した。DIV14において、ニューロン核を製造者のプロトコールを踏襲してEZ-PREP緩衝液(Sigma D8938)を用いて単離した。全てのステップは氷上でまたは4℃で行った。培地を解離した培養物から除去し、培養物を氷冷PBSによって洗浄した。PBSをアスピレーションし、200μLのEZ-PREP溶液によって置き換えた。氷上での5分のインキュベーション後に、EZ-PREPをウェルの表面上にピペッティングし、残りの細胞を取り去った。サンプルを500gで5分に渡って遠心し、上清を除去した。サンプルを200μLのEZ-PREPによって洗浄し、500gで5分に渡って遠心した。サンプルは、穏やかなピペッティングによって、1×PBS中の100μg/mL BSAおよび3.33μM Vybrant DyeCycle Ruby(Thermo Fisher)からなる200μL氷冷核懸濁緩衝液(NSB)に再懸濁し、それから500gで5分に渡って遠心した。上清を除去し、核を100μLのNSBに再懸濁し、Broad Instituteフローサイトメトリー施設においてMoFlo Astrios(Beckman Coulter)を用いて100μLのAgencourt DNAdvanceリシス緩衝液中にソーティングした。ゲノムDNAは製造者のAgencourt DNAdvanceの説明書に従って精製した。 At DIV1, 15 μL of lentivirus was added with a 10:10:1 ratio of N-terminus:C-terminus:nicking sgRNA. At DIV14, neuronal nuclei were isolated using EZ-PREP buffer (Sigma D8938) following the manufacturer's protocol. All steps were performed on ice or at 4°C. The medium was removed from the dissociated cultures and the cultures were washed with ice-cold PBS. PBS was aspirated and replaced by 200 μL of EZ-PREP solution. After 5 minutes of incubation on ice, EZ-PREP was pipetted onto the surface of the wells to remove remaining cells. Samples were centrifuged at 500g for 5 minutes and the supernatant was removed. Samples were washed with 200 μL of EZ-PREP and centrifuged at 500 g for 5 minutes. Samples were resuspended in 200 μL ice-cold nuclear suspension buffer (NSB) consisting of 100 μg/mL BSA and 3.33 μM Vybrant DyeCycle Ruby (Thermo Fisher) in 1× PBS by gentle pipetting and then incubated at 500 g Centrifuged for minutes. The supernatant was removed and the nuclei were resuspended in 100 μL of NSB and sorted into 100 μL of Agencourt DNAdvance lysis buffer using a MoFlo Astrios (Beckman Coulter) at the Broad Institute flow cytometry facility. Genomic DNA was purified according to the manufacturer's Agencourt DNAdvance instructions.

RNA配列決定およびデータ分析 RNA sequencing and data analysis

HEK293T細胞を、PRNP標的化またはHEXA標的化PEgRNAおよびPE2、PE2-dRT、またはCas9 H840Aニッカーゼによってコトランスフェクションした。トランスフェクションの72時間後に、トータルRNAをTRIzol試薬(Thermo Fisher)を用いて細胞から収穫し、オンカラムのDNaseI処置を包含するRNeasyミニキット(Qiagen)によって精製した。TruSeq StrandedトータルRNAライブラリプレップキット(Illumina)のrRNA除去プロトコールを用いて、リボソームをトータルRNAから枯渇させ、爾後にRNAClean XPビーズ(Beckman Coulter)によって洗浄した。製造者のプロトコールを踏襲して、SMARTer PrepX Apollo NGSライブラリプレップシステム(Takara)によって、配列決定ライブラリをリボ枯渇したRNAを用いて調製した。もたらされたライブラリを2200 TapeStation(Agilent Technologies)によって視覚化し、Qubit dsDNA HSアッセイ(Thermo Fisher)を用いて正規化し、75bpペアエンド読取として高アウトプットv2フローセル(Illumina)を用いてNextSeq 550によって配列決定した。Fastqファイルをbcl2fastq2バージョン2.20によって生成し、TrimGaloreバージョン0.6.2を用いてトリミングして(github.com/FelixKrueger/TrimGalore)、低品質塩基、非ペア配列、およびアダプター配列を除去した。トリミングされた読取を、RSEMバージョン1.3.1207を用いて、カスタムのCas9 H840A遺伝子エントリーによって、Homo sapiensゲノムアセンブリGRCh148とアラインメントした。limma-voom208パッケージを用いて遺伝子発現レベルを正規化し、バッチ効果補正によって差次的発現分析を行った。差次的に発現される遺伝子をFDR補正されたp値<0.05および~倍の変化>2のカットオフでコールし、結果をRによって視覚化した。 HEK293T cells were co-transfected with PRNP-targeted or HEXA-targeted PEgRNA and PE2, PE2-dRT, or Cas9 H840A nickase. Seventy-two hours after transfection, total RNA was harvested from cells using TRIzol reagent (Thermo Fisher) and purified by the RNeasy mini kit (Qiagen), which includes on-column DNaseI treatment. Ribosomes were depleted from total RNA using the rRNA removal protocol of the TruSeq Stranded Total RNA Library Prep Kit (Illumina) and then washed with RNAClean XP beads (Beckman Coulter). Sequencing libraries were prepared using ribo-depleted RNA with the SMARTer PrepX Apollo NGS Library Prep System (Takara) following the manufacturer's protocol. The resulting libraries were visualized by a 2200 TapeStation (Agilent Technologies), normalized using the Qubit dsDNA HS assay (Thermo Fisher), and sequenced by NextSeq 550 using a high output v2 flow cell (Illumina) as a 75bp paired-end read. did. Fastq files were generated by bcl2fastq2 version 2.20 and trimmed using TrimGalore version 0.6.2 (g ithub.com/FelixKrueger/TrimGalore) to remove low quality bases, unpaired sequences, and adapter sequences. The trimmed reads were aligned to the Homo sapiens genome assembly GRCh 148 by custom Cas9 H840A gene entry using RSEM version 1.3.1 207 . Gene expression levels were normalized using the limma-voom 208 package and differential expression analysis was performed with batch effect correction. Differentially expressed genes were called with a cutoff of FDR-corrected p-value <0.05 and ~fold change >2, and results were visualized by R.

ClinVar分析 ClinVar analysis

ClinVarバリアントサマリーをNCBIからダウンロードし(2019年7月15日にアクセス)、それに含有される情報を全ての下流分析に用いた。全ての報告されたバリアントのリストを、重複物を除去するためのアレルIDによって、および分析を病原性のバリアントに制限するための臨床的有意性によってフィルタリングした。挿入、欠失などである病原性のバリアントの画分を計算するためには、病原性のバリアントのリストをバリアント型によって逐次的にフィルタリングした。1ヌクレオチドバリアント(SNV)を、報告された参照および代替対立遺伝子に基づいて2つのカテゴリー(トランジションおよびトランスバージョン)に分離した。参照または代替対立遺伝子を報告しなかったSNVは分析から排除した。 The ClinVar variant summary was downloaded from NCBI (accessed July 15, 2019) and the information it contains was used for all downstream analyses. The list of all reported variants was filtered by allele ID to remove duplicates and by clinical significance to limit the analysis to pathogenic variants. To calculate the fraction of pathogenic variants that are insertions, deletions, etc., the list of pathogenic variants was sequentially filtered by variant type. Single nucleotide variants (SNVs) were separated into two categories (transitions and transversions) based on the reported reference and alternative alleles. SNVs that did not report a reference or alternative allele were excluded from the analysis.

報告された挿入、欠失、および重複の長さを、参照/代替対立遺伝子、バリアントスタート/ストップ位置、またはバリアント名称の適当な識別情報を用いて計算した。上の情報のいずれかを報告しないバリアントは分析から排除した。報告されたインデル(参照ゲノムに対して相対的に挿入および欠失両方を包含する単一のバリアント)の長さは、参照および代替対立遺伝子間の最も良好なペアワイズアラインメントにおけるミスマッチまたはギャップの数を決定することによって計算された。バリアント長さの度数分布はGraphPad Prism 8を用いて計算された。 Lengths of reported insertions, deletions, and duplications were calculated using appropriate identification of reference/alternative alleles, variant start/stop positions, or variant names. Variants that did not report any of the above information were excluded from the analysis. The reported length of indels (single variants encompassing both insertions and deletions relative to the reference genome) reflects the number of mismatches or gaps in the best pairwise alignment between the reference and alternative alleles. Calculated by determining. Frequency distributions of variant lengths were calculated using GraphPad Prism 8.

データ利用性 Data availability

高スループット配列決定データはNCBI配列読取アーカイブデータベースに寄託されている。PE1、PE2/PE3、およびPEgRNA発現ベクターをコードするプラスミドはAddgeneから利用可能であろう。 High-throughput sequencing data has been deposited in the NCBI Sequence Read Archive database. Plasmids encoding PE1, PE2/PE3, and PEgRNA expression vectors will be available from Addgene.

コード利用性 Code usage

PEgRNA骨格挿入を定量するために用いられるスクリプトは図60A-60Bに提供される。 The script used to quantify PEgRNA backbone insertion is provided in Figures 60A-60B.

補足情報:表および配列 Additional information: Tables and arrays

表1:HEK3、HEK4、EMX1、およびFANCFオンターゲットおよびオフターゲット部位におけるプライム編集因子、Cas9ヌクレアーゼ、Cas9 H840Aニッカーゼ、およびPE2-dRTの活性。PE2/PE3編集が%インデル(括弧内)と並べて%プライム編集として示されている。%インデルは、Cas9、Cas9 H840Aニッカーゼ(nCas9)、およびPE2-dRTについて、上位4つの先に特徴付けられたオフターゲット部位において示されている179,180。sgRNAおよびPEgRNA配列は表3A~3Rにおいて図42A-42Hの見出しの下に見出され得る。全ての値は3つの独立した生物学的レプリケートの平均である。 Table 1: Activities of prime editing factors, Cas9 nuclease, Cas9 H840A nickase, and PE2-dRT at HEK3, HEK4, EMX1, and FANCF on- and off-target sites. PE2/PE3 edits are shown as % prime edits alongside % indels (in parentheses). % indels are shown in the top four previously characterized off-target sites for Cas9, Cas9 H840A nickase (nCas9), and PE2-dRT. The sgRNA and PEgRNA sequences can be found in Tables 3A-3R under the headings of Figures 42A-42H. All values are the average of three independent biological replicates.

Figure 2020191234000310
Figure 2020191234000310

表2A~2C:in vitroでの実験のために使用されたDNAオリゴヌクレオチド、PEgRNA、およびsgRNAの配列。 Tables 2A-2C: Sequences of DNA oligonucleotides, PEgRNA, and sgRNA used for in vitro experiments.

表2A:DNAオリゴヌクレオチド

Figure 2020191234000311
Table 2A: DNA oligonucleotides
Figure 2020191234000311

表2B:5'-伸長されたPEgRNA

Figure 2020191234000312
Table 2B: 5'-extended PEgRNA
Figure 2020191234000312

表2C:3'-伸長されたPEgRNA

Figure 2020191234000313
Table 2C: 3'-extended PEgRNA
Figure 2020191234000313

表3A~3R:哺乳類細胞実験に用いられたPEgRNAおよびsgRNAの配列。全ての配列は5'から3'の向きで示されている。PEgRNAを構築するためには、下に列記されるスペーサー配列をsgRNA骨格の5'端に追加し、プライマー結合部位とRT鋳型とを含有する下に列記される3'伸長をsgRNA骨格の3'端に追加した。sgRNA骨格配列はGTTTTAGAGCTAGAAATAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGCACCGAGTCGGTGC(配列番号131)である。 Tables 3A-3R: Sequences of PEgRNA and sgRNA used in mammalian cell experiments. All sequences are shown in 5' to 3' orientation. To construct PEgRNA, add the spacer sequence listed below to the 5' end of the sgRNA backbone and add the 3' extension listed below containing the primer binding site and RT template to the 3' end of the sgRNA backbone. Added at the end. The sgRNA backbone sequence is GTTTTAGAGCTAGAAATAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGCACCGAGTCGGTGC (SEQ ID NO: 131).

表3A:図39A~39D PEgRNA

Figure 2020191234000314
Figure 2020191234000315
Figure 2020191234000316
Figure 2020191234000317
Figure 2020191234000318
Figure 2020191234000319
Table 3A: Figures 39A-39D PEgRNA
Figure 2020191234000314
Figure 2020191234000315
Figure 2020191234000316
Figure 2020191234000317
Figure 2020191234000318
Figure 2020191234000319

表3B:図40A~40C PEgRNA

Figure 2020191234000320
Table 3B: Figures 40A-40C PEgRNA
Figure 2020191234000320

表3C:図40A~40C ニックを入れるsgRNA配列

Figure 2020191234000321
Table 3C: Figures 40A-40C Nicked sgRNA sequences
Figure 2020191234000321

表3D:図41A~41K PEgRNA

Figure 2020191234000322
Figure 2020191234000323
Figure 2020191234000324
Figure 2020191234000325
Figure 2020191234000326
Figure 2020191234000327
Figure 2020191234000328
Figure 2020191234000329
Table 3D: Figures 41A-41K PEgRNA
Figure 2020191234000322
Figure 2020191234000323
Figure 2020191234000324
Figure 2020191234000325
Figure 2020191234000326
Figure 2020191234000327
Figure 2020191234000328
Figure 2020191234000329

表3E:図41A~41Kニックを入れるsgRNA Table 3E: Figures 41A to 41K nicking sgRNAs

Figure 2020191234000330
Figure 2020191234000330
Figure 2020191234000331
Figure 2020191234000331

表3F:図42A~42H PEgRNA Table 3F: Figures 42A-42H PEgRNA

Figure 2020191234000332
Figure 2020191234000332

表3G:図42A~42Hニックを入れるsgRNA

Figure 2020191234000333
Figure 2020191234000334
Table 3G: Figures 42A to 42H Nicking sgRNAs
Figure 2020191234000333
Figure 2020191234000334

表3H:図42A~42H塩基編集sgRNA

Figure 2020191234000335
Table 3H: Figures 42A-42H base-edited sgRNAs
Figure 2020191234000335

表3I:図42A~42HオンターゲットsgRNA

Figure 2020191234000336
Table 3I: Figures 42A-42H on-target sgRNAs
Figure 2020191234000336

表3J:図42A~42H オンターゲットPEgRNA

Figure 2020191234000337
Figure 2020191234000338
Table 3J: Figures 42A-42H On-target PEgRNA
Figure 2020191234000337
Figure 2020191234000338

表3K:図49A~49B PEgRNA

Figure 2020191234000339
Figure 2020191234000340
Table 3K: Figures 49A-49B PEgRNA
Figure 2020191234000339
Figure 2020191234000340

表3L:図47A~74D PEgRNA

Figure 2020191234000341
Table 3L: Figures 47A-74D PEgRNA
Figure 2020191234000341

表3M:図48A~48C PEgRNA

Figure 2020191234000342
Figure 2020191234000343
Figure 2020191234000344
Figure 2020191234000345
Figure 2020191234000346
Table 3M: Figures 48A-48C PEgRNA
Figure 2020191234000342
Figure 2020191234000343
Figure 2020191234000344
Figure 2020191234000345
Figure 2020191234000346

表3N:図48A~48C PEgRNA

Figure 2020191234000347
Table 3N: Figures 48A-48C PEgRNA
Figure 2020191234000347

表3O:図48A~48Cニックを入れるsgRNA

Figure 2020191234000348
Table 3O: Figures 48A-48C Nicking sgRNAs
Figure 2020191234000348

表3P:図50A~50B PRgRNA

Figure 2020191234000349
Figure 2020191234000350
Figure 2020191234000351
Table 3P: Figures 50A-50B PRgRNA
Figure 2020191234000349
Figure 2020191234000350
Figure 2020191234000351

表3Q:図50A~50Bニックを入れるsgRNA

Figure 2020191234000352
Table 3Q: Figure 50A-50B Nicking sgRNA
Figure 2020191234000352

表3R:図51A~51G PEgRNA

Figure 2020191234000353
Figure 2020191234000354
Table 3R: Figures 51A-51 G PEgRNA
Figure 2020191234000353
Figure 2020191234000354

表4:哺乳動物細胞ゲノムDNA増幅およびHTS181に使用されたプライマーの配列。

Figure 2020191234000355
Figure 2020191234000356
Figure 2020191234000357
Table 4: Sequences of primers used for mammalian cell genomic DNA amplification and HTS 181 .
Figure 2020191234000355
Figure 2020191234000356
Figure 2020191234000357

表5:HDR実験におよびHBB E6V HEK293T細胞株の生出に用いられた100mer一本鎖DNAオリゴヌクレオチドドナー鋳型の配列。オリゴヌクレオチドは長さが100-103ntであり、編集の部位を中心とした相同アームを有する。オリゴヌクレオチドはIntegrated DNA Technologiesからであり、PAGEによって精製された。

Figure 2020191234000358
Figure 2020191234000359
Table 5: Sequence of 100mer single-stranded DNA oligonucleotide donor template used for HDR experiments and generation of HBB E6V HEK293T cell line. The oligonucleotides are 100-103 nt in length and have homologous arms centered around the site of editing. Oligonucleotides were from Integrated DNA Technologies and purified by PAGE.
Figure 2020191234000358
Figure 2020191234000359

追加の配列 additional array

本明細書に使用された酵母二重蛍光レポータープラスミドの配列
p425-GFP_停止_mCherry:

Figure 2020191234000360
Figure 2020191234000361
Figure 2020191234000362
Figure 2020191234000363
Figure 2020191234000364
Figure 2020191234000365
Figure 2020191234000366
Figure 2020191234000367
Figure 2020191234000368
Figure 2020191234000369
Figure 2020191234000370
Figure 2020191234000371
Figure 2020191234000372
Sequence of yeast dual fluorescent reporter plasmid used herein
p425-GFP_stop_mCherry:
Figure 2020191234000360
Figure 2020191234000361
Figure 2020191234000362
Figure 2020191234000363
Figure 2020191234000364
Figure 2020191234000365
Figure 2020191234000366
Figure 2020191234000367
Figure 2020191234000368
Figure 2020191234000369
Figure 2020191234000370
Figure 2020191234000371
Figure 2020191234000372

哺乳動物プライム編集因子プラスミドおよび例となるPEgRNAプラスミドのDNA配列

Figure 2020191234000373
Figure 2020191234000374
Figure 2020191234000375
Figure 2020191234000376
Figure 2020191234000377
Figure 2020191234000378
Figure 2020191234000379
Figure 2020191234000380
Figure 2020191234000381
Figure 2020191234000382
Figure 2020191234000383
Figure 2020191234000384
Figure 2020191234000385
Figure 2020191234000386
Figure 2020191234000387
Figure 2020191234000388
Figure 2020191234000389
Figure 2020191234000390
Figure 2020191234000391
Figure 2020191234000392
Figure 2020191234000393
Figure 2020191234000394
Figure 2020191234000395
Figure 2020191234000396
pLenti-U6-DNMT1_ニックを入れる_sgRNA:
Figure 2020191234000397
Figure 2020191234000398
Figure 2020191234000399
Figure 2020191234000400
DNA sequences of mammalian prime editor plasmids and exemplary PEgRNA plasmids.
Figure 2020191234000373
Figure 2020191234000374
Figure 2020191234000375
Figure 2020191234000376
Figure 2020191234000377
Figure 2020191234000378
Figure 2020191234000379
Figure 2020191234000380
Figure 2020191234000381
Figure 2020191234000382
Figure 2020191234000383
Figure 2020191234000384
Figure 2020191234000385
Figure 2020191234000386
Figure 2020191234000387
Figure 2020191234000388
Figure 2020191234000389
Figure 2020191234000390
Figure 2020191234000391
Figure 2020191234000392
Figure 2020191234000393
Figure 2020191234000394
Figure 2020191234000395
Figure 2020191234000396
pLenti-U6-DNMT1_nick_sgRNA:
Figure 2020191234000397
Figure 2020191234000398
Figure 2020191234000399
Figure 2020191234000400

本明細書に使用されたモロニーマウス白血病ウイルス逆転写酵素(M-MLV RT)バリアントのアミノ酸配列。
PE1 M-MLV RT:
TLNIEDEYRLHETSKEPDVSLGSTWLSDFPQAWAETGGMGLAVRQAPLIIPLKATSTPVSIKQYPMSQEARLGIKPHIQRLLDQGILVPCQSPWNTPLLPVKKPGTNDYRPVQDLREVNKRVEDIHPTVPNPYNLLSGLPPSHQWYTVLDLKDAFFCLRLHPTSQPLFAFEWRDPEMGISGQLTWTRLPQGFKNSPTLFDEALHRDLADFRIQHPDLILLQYVDDLLLAATSELDCQQGTRALLQTLGNLGYRASAKKAQICQKQVKYLGYLLKEGQRWLTEARKETVMGQPTPKTPRQLREFLGTAGFCRLWIPGFAEMAAPLYPLTKTGTLFNWGPDQQKAYQEIKQALLTAPALGLPDLTKPFELFVDEKQGYAKGVLTQKLGPWRRPVAYLSKKLDPVAAGWPPCLRMVAAIAVLTKDAGKLTMGQPLVILAPHAVEALVKQPPDRWLSNARMTHYQALLLDTDRVQFGPVVALNPATLLPLPEEGLQHNCLDILAEAHGTRPDLTDQPLPDADHTWYTDGSSLLQEGQRKAGAAVTTETEVIWAKALPAGTSAQRAELIALTQALKMAEGKKLNVYTDSRYAFATAHIHGEIYRRRGLLTSEGKEIKNKDEILALLKALFLPKRLSIIHCPGHQKGHSAEARGNRMADQAARKAAITETPDTSTLLIENSSP(配列番号739)

M3 M-MLV RT(D200N、T330P、L603W)(Baranauskas et al.182を参照):

Figure 2020191234000401
PE2 M-MLV RT(D200N、T306K、W313F、T330P、L603W):
Figure 2020191234000402
Figure 2020191234000403
M3-不活性型RT M-MLV RT:
Figure 2020191234000404
Amino acid sequences of Moloney murine leukemia virus reverse transcriptase (M-MLV RT) variants used herein.
PE1 M-MLV RT:
(Sequence number 739)

M3 M-MLV RT (D200N, T330P, L603W) (see Baranauskas et al. 182 ):
Figure 2020191234000401
PE2 M-MLV RT(D200N, T306K, W313F, T330P, L603W):
Figure 2020191234000402
Figure 2020191234000403
M3-Inactive RT M-MLV RT:
Figure 2020191234000404

例12のための参考文献
以下の参考文献の各々は例12に引用され、これらの各々は参照により本明細書に組み込まれる。

Figure 2020191234000405
Figure 2020191234000406
Figure 2020191234000407
Figure 2020191234000408
Figure 2020191234000409
References for Example 12 Each of the following references is cited in Example 12, each of which is incorporated herein by reference.
Figure 2020191234000405
Figure 2020191234000406
Figure 2020191234000407
Figure 2020191234000408
Figure 2020191234000409

例13-PEによる細胞データ記録および系統トレース
背景
ゲノム改変は、細胞性のプロセスおよび発生を研究および記録するためにもまた用いられ得る。細胞分裂またはシグナルカスケード活性化のような細胞性のイベントをDNA配列改変にリンクすることは、解釈可能なDNA配列変化として細胞の履歴を貯蔵し、これらは特定の細胞性のイベントが生起したかどうかを記述するであろう。DNAは、RNAおよびタンパク質がされないやり方で1つの細胞から次へと忠実に受け渡されるので、DNA編集はこれらの適用にとって必要である。改変が短寿命のタンパク質およびRNA分子になされるときには、細胞状態および系統に関する情報は一般的には失われる。単一の細胞内の細胞性のイベントを記録することは、どのようにして疾患状態が開始、維持、および健康な対照に対して相対的に変化するかを理解するための強力なやり方である。これらの問いかけを探査する能力は、がん、神経学的疾患、およびヒトの健康の幾多の他の重要な問題の発生を理解することに関連性を有する。プライム編集(PE)は、標的化されたかつ配列によって規定されたゲノム挿入、欠失、または変異を生出するためのシステムを提供する。標的アンプリコン配列決定および/またはRNA配列決定(これは単細胞記録実験にとって特に価値がある)によって配列決定され得るDNA標的の繰り返しの改変が、シグナルカスケードの活性化、代謝状態、および細胞分化プログラムを包含する幾多の重要な生物学的プロセスを記録するために用いられ得る。内部のおよび外部の細胞性シグナルをゲノム上の配列改変に接続することは、理論上は、シグナル応答性プロモーターが存在するいずれかのシグナルについて可能である。PEは、培養条件およびインビボの両方において真核および原核細胞の細胞系統およびシグナルの履歴を探査するための多大に拡張されたツールキットを可能化するということが信じられる。
Example 13 - Cell data recording and lineage tracing with PE Background Genomic modification can also be used to study and document cellular processes and development. Linking cellular events such as cell division or signal cascade activation to DNA sequence modifications stores the cell's history as interpretable DNA sequence changes, and these can be linked to the occurrence of specific cellular events. I will describe what. DNA editing is necessary for these applications because DNA is faithfully passed from one cell to the next in a way that RNA and proteins are not. When modifications are made to short-lived proteins and RNA molecules, information about cellular state and lineage is generally lost. Recording cellular events within single cells is a powerful way to understand how disease states initiate, maintain, and change relative to healthy controls. . The ability to explore these questions has relevance to understanding the occurrence of cancer, neurological diseases, and numerous other important problems in human health. Prime editing (PE) provides a system for generating targeted and sequence-defined genomic insertions, deletions, or mutations. Repeated modifications of DNA targets, which can be sequenced by targeted amplicon sequencing and/or RNA sequencing (which is particularly valuable for single-cell recording experiments), influence activation of signal cascades, metabolic state, and cellular differentiation programs. It can be used to record a number of important biological processes involved. Connecting internal and external cellular signals to sequence modifications on the genome is theoretically possible for any signal for which signal-responsive promoters are present. It is believed that PE enables a greatly expanded toolkit for probing the cell lineage and signal history of eukaryotic and prokaryotic cells both in culture conditions and in vivo.

先の標準 standard ahead

標的化された配列挿入、欠失、または変異は、系統トレースおよび細胞性の刺激の記録を包含するいくつもの重要な生物学的問いかけを研究するために用いられ得る。ゲノム上にこれらのシグネチャーを生成するための現行のツールキットは限定されている。標的座位の変異導入は今日までDNAヌクレアーゼおよび塩基編集因子両方を用いて開発されている。 Targeted sequence insertions, deletions, or mutations can be used to study a number of important biological questions, including lineage tracing and recording cellular stimulation. Current toolkits for generating these signatures on the genome are limited. Targeted locus mutagenesis has been developed to date using both DNA nucleases and base editing agents.

標的配列のCRISPR/Cas9ヌクレアーゼカットは、確率的な配列変化を生成して、多数の挿入または欠失(インデル)産物を生成する。Cas9カットから発生する多数の配列アウトカムは、ヌクレアーゼによってカットされた配列の明瞭な決定を許す。カット対非カット配列を見分ける能力は2つの支配的なやり方で用いられた。 CRISPR/Cas9 nuclease cuts of target sequences generate stochastic sequence changes, producing multiple insertion or deletion (indel) products. The multiple sequence outcomes generated from Cas9 cuts allow unambiguous determination of the sequences cut by the nuclease. The ability to distinguish cut versus uncut sequences was used in two dominant ways.

第1に、Cas9ヌクレアーゼおよび/またはそのシングルガイドRNA(sgRNA)の発現が細胞シグナルに接続された。加えて、Cas9標的ゲノム座位の配列改変に基づいて、そのシグナルが生起したかどうかが記録された。しかしながら、このアプローチは限定される。なぜなら、各シグナルは固有の標的座位を要求し、これは複数のシグナルの相対的タイミングを追跡することを解釈困難にするからである。このアプローチの別の限定は、ある特定のsgRNAについて、複数の標的座位が望まれるということである。なぜなら、インデルの生成は多くの場合には標的座位の追加の変異導入を厳しく妨げるからである;多くの場合には、これは、内生座位の直接的変異導入の代わりに、予め操作された標的座位が編集のために細胞に取り入れられるということを意味する。 First, expression of the Cas9 nuclease and/or its single guide RNA (sgRNA) was connected to a cellular signal. In addition, the occurrence of the signal was recorded based on sequence modification of the Cas9 target genomic locus. However, this approach is limited because each signal requires a unique target locus, which makes tracking the relative timing of multiple signals difficult to interpret. Another limitation of this approach is that multiple target loci are desired for a given sgRNA, because the generation of indels often severely precludes additional mutagenesis of the target locus; in many cases, this means that a pre-engineered target locus is introduced into the cell for editing, instead of direct mutagenesis of the endogenous locus.

第2に、Cas9インデルが細胞系統を追跡するために用いられた。本明細書に記載のとおり、Cas9ヌクレアーゼ活性によって生成される多数の可能なインデル状態は、細胞発生樹形図の生成を許す。これらは時間的にどの細胞が互いから発生したかを示唆する。このアプローチは、どのようにして細胞が互いから発生したかを理解するための強力なやり方であり、選択された細胞プールに対するRNA配列決定を行うことによって固有の細胞状態および型を発生時間的に同定することを助けるために用いられている。このアプローチは細胞シグナルイベント、それらの順序について独立しては報告し得ず、前駆体対終末分化した細胞状態について報告するときにはバイアスを有し得る。 Second, Cas9 indels were used to trace cell lineage. As described herein, the large number of possible indel states generated by Cas9 nuclease activity allows for the generation of a cell developmental dendrogram. These suggest which cells evolved from each other in time. This approach is a powerful way to understand how cells develop from each other, and by performing RNA sequencing on selected cell pools, unique cell states and types can be identified in developmental time. used to aid in identification. This approach cannot independently report on cell signaling events, their order, and can have bias when reporting on progenitor versus terminally differentiated cell states.

Cas9ヌクレアーゼによって媒介される系統トレースおよびシグナル記録は、いくつかの重要な警告を伴う強力な技術である。Cas9ヌクレアーゼによるシグナル記録は多くの場合には非常に技術的に難しい。Cas9カットは標的座位を消耗させ(ひとたびインデルが生成されると、繰り返しのカットは困難である)、単一細胞レベルにおいて長期的刺激を記録することを困難にする。Cas9カットのキネティクスはイベントをより長期間記録することを可能化するようにチューニングされ得るが、複数の刺激の順序、強度、および持続時間を取り入れする能力は非常に難しい技術的問題のままに留まり、これはこのツールでは達成可能でなくあり得る。Cas9系統トレース実験はとてつもなく強力であるが、標的座位における同時のCas9カットを原因とする配列の崩れという軽度の技術的課題を患う。これらの系統トレース実験は予めデザインされた標的座位の編集を要求し、このアプローチのフレキシビリティーを限定する。 Cas9 nuclease-mediated lineage tracing and signal recording is a powerful technique with some important caveats. Signal recording with Cas9 nuclease is often very technically difficult. Cas9 cuts deplete the target locus (once an indel is generated, repeated cuts are difficult), making it difficult to record long-term stimulation at the single-cell level. Although the kinetics of Cas9 cuts can be tuned to allow events to be recorded over longer periods of time, the ability to incorporate multiple stimulus orders, intensities, and durations remains a very difficult technical problem. , this may not be achievable with this tool. Although Cas9 lineage tracing experiments are tremendously powerful, they suffer from the minor technical challenge of sequence disruption due to simultaneous Cas9 cuts at target loci. These lineage tracing experiments require editing of predesigned target loci, limiting the flexibility of this approach.

DNA塩基編集は細胞シグナルイベントを追跡するためにもまた用いられている。Cas9インデルによって生成される状態の数に対して相対的に編集イベントによって生成されるアウトカム状態の低い数を原因として、塩基編集は系統トレースにはあまり適さない;しかしながら、塩基編集因子によって作られる配列改変の予め定められた性質は、内部のおよび外部の細胞性の刺激を追跡することにとって特に有用である。本明細書に記載の塩基編集因子またはsgRNA発現どちらかは、具体的な生物学的または化学的刺激に接続され得る。哺乳類および細菌細胞両方において多数の個々の刺激を追跡するために、塩基編集活性が用いられた。このアプローチは、第2の編集が生起し得る前に第1の編集イベントが必要である連続した刺激を追跡するためにもまた用いられた。 DNA base editing has also been used to track cellular signaling events. Due to the low number of outcome states generated by editing events relative to the number of states generated by Cas9 indels, base editing is not well suited for lineage tracing; however, sequences created by base editors The predetermined nature of the modification is particularly useful for tracking internal and external cellular stimuli. Either the base editors or sgRNA expression described herein can be coupled to specific biological or chemical stimuli. Base editing activity has been used to track a large number of individual stimuli in both mammalian and bacterial cells. This approach was also used to track sequential stimuli where a first editing event is required before a second editing can occur.

塩基編集シグナル記録は分野にとって重要な第1ステップであるが、それはいくつもの限定を有する。1つのかかる限定は、塩基編集が編集後にその標的を消耗させ、技術のダイナミックレンジを限定するということである。これは、イベントを記録するために内生標的を用いることが多くの場合には困難であり、単一細胞レベルにおける活性の代わりにバルクの活性を記録することに限定されるということを意味する。これの代替は予めデザインされた繰り返し記録座位の導入であるが、これは今日まで行われていない。2シグナル記録のイシューもまたある。これらの2シグナル記録実験は第1の後の第2の刺激の存在についてのみ報告する;それは、どの刺激が最初に起こったのかまたはどのくらい長く刺激が存在したのかを報告しない。これは実験から拾い集められる生物学的理解を根本的に限定する。 Although base editing signal recording is an important first step for the field, it has a number of limitations. One such limitation is that base editing depletes the target after editing, limiting the dynamic range of the technique. This means that using endogenous targets to record events is often difficult and limited to recording bulk activity instead of activity at the single cell level. . An alternative to this is the introduction of pre-designed repeat recording loci, but this has not been done to date. There is also the issue of 2-signal recording. These two-signal recording experiments only report on the presence of the second stimulus after the first; it does not report which stimulus occurred first or how long the stimulus was present. This fundamentally limits the biological understanding that can be gleaned from experiments.

ゲノム標的配列および取り入れされた予めデザインされた配列を改変することによって、PE系統トレースは系統トレースおよび細胞シグナル記録両方をし得るということが提案されている。PEは、Cas9ニッカーゼフラグメント(多くの場合にはSpCas9 H840Aバリアント)と逆転写酵素(RT)ドメインとを含む合成融合タンパク質を、操作されたプライム編集ガイドRNA(PEgRNA)と併せて用いる。一緒になって、これらの構成要素は特定のゲノム配列を標的化し、予め決定された編集を組み入れる。PEgRNAは標的ゲノム配列および編集アウトカム両方を規定するので、高度に特異的なかつコントロールされたゲノム改変が、同じ細胞内の複数のPEgRNAを用いて同時に達成され得る。アクセス可能なゲノム改変は、全ての1ヌクレオチド置換、小から中程度のサイズの配列挿入、および小から中程度のサイズの配列欠失を包含する。このゲノム編集テクノロジーの汎用性は、細胞内の時間的にカップリングされたシグナル特異的な記録を可能化するはずである。 It has been proposed that by modifying the genomic target sequence and incorporated pre-designed sequences, PE lineage tracing can be both lineage tracing and cell signal recording. PE uses a synthetic fusion protein containing a Cas9 nickase fragment (often the SpCas9 H840A variant) and a reverse transcriptase (RT) domain in conjunction with an engineered prime editing guide RNA (PEgRNA). Together, these components target specific genomic sequences and incorporate predetermined edits. Because PEgRNAs define both the target genome sequence and the editing outcome, highly specific and controlled genome modifications can be achieved simultaneously using multiple PEgRNAs within the same cell. Accessible genomic modifications include all single nucleotide substitutions, small to medium sized sequence insertions, and small to medium sized sequence deletions. The versatility of this genome editing technology should enable temporally coupled signal-specific recording within cells.

PE系統および細胞シグナル記録の有用性 Utility of PE lineage and cell signal recording

細胞シグナルを記録することはいくつものやり方で達成され得る。このアプローチの1つの重要な第1の適用は、DNA改変イベントをサイクリン、CDK、または細胞寿命の局面に特異的な他のタンパク質の発現のような細胞周期関連シグナルに接続することであり、細胞時計を生成し得る。細胞時計は、研究者が個々の細胞によって受容およびプロセシングされている種々のシグナルの順序を理解することを許す。分子時計は長期的なシグナル対短期的な突発的シグナルの決定をもまた可能化するであろう。細胞周期に1回のみ編集し得るプライム編集構成要素を用いることもまた分子時計に至り得る。連続したDNA改変なしに(おそらく、非編集DNA鎖にニッキングしないことによって)、編集が細胞周期に1回のみ進み得る場合には、爾後の細胞分裂において第2の標的化PEsgRNAによってのみ編集され得るシステムを想像し得る。それは規定されたやり方で座位を繰り返して挿入、欠失、または変異させ得るので、PEは細胞時計として特に有用であり、挿入は特に重宝である。なぜなら、繰り返しの規則的挿入がいずれかの標的ゲノム座位においてなされ得るからである。 Recording cellular signals can be accomplished in a number of ways. One important first application of this approach is to connect DNA modification events to cell cycle-related signals such as the expression of cyclins, CDKs, or other proteins specific to aspects of cell lifespan, allowing cells to Can generate a clock. Cellular clocks allow researchers to understand the order of various signals being received and processed by individual cells. Molecular clocks would also allow determination of long-term signals versus short-term bursts. The use of prime editing components that can edit only once per cell cycle can also lead to a molecular clock. If editing can proceed only once in the cell cycle without successive DNA modifications (perhaps by not nicking the non-edited DNA strand), it can only be edited by a second targeting PEsgRNA in subsequent cell divisions. I can imagine a system. PE is particularly useful as a cellular clock, and insertions are particularly useful because it can repeatedly insert, delete, or mutate loci in a defined manner. This is because repeated regular insertions can be made at any target genomic locus.

細胞シグナルを記録することに関する別の重要な適用は、多数の細胞性のインプットの並行的な記録である。細胞シグナルイベントをDNA改変にリンクすることは、かかるシグナルイベントが生起したかどうかを記録することを可能化する。Cas9ヌクレアーゼに基づくまたは塩基編集に基づく記録システムに類似に、細胞性のイベントの記録はgRNAまたは編集因子発現にテザリングされ得る。これらの他のアプローチとは違って、系統プライム編集は、順序付けられた編集のための厳格な配列モチーフを要求することなしに、シグナルイベントの順序、強度、および持続時間を記録する能力があるはずである。実に、系統プライム編集は、生物学的シグナルの順序、強度、および持続時間を研究するために、上に記載されている細胞性のカウンターをシグナル特異的な挿入、欠失、または変異と取り入れする能力があるはずである。プライム編集のプログラム可能な性質を原因として、このアプローチは目当ての標的細胞に予め存在するゲノム座位において達成され得る(これが細菌、マウス、ラット、サル、ブタ、ヒト、ゼブラフィッシュ、C.elegansなどにおいてであるかにかかわらない)。プライム編集記録はガイドRNA依存的な様式でバーコードを組み入れるということに注意することも重要であり、インプットの数は、確かなシグナル特異的なガイドRNA発現カセットがあるシグナルの数に限定される(これは、これらの発現をRNA Pol IIプロモーターの活性にテザリングする能力を原因として非常に高いはずである)。記録可能なシグナルの数は必要とされるPEgRNAの数に直線的に比例する。 Another important application for recording cellular signals is the parallel recording of multiple cellular inputs. Linking cellular signaling events to DNA modifications makes it possible to record whether such signaling events have occurred. Similar to Cas9 nuclease-based or base editing-based recording systems, recording of cellular events can be tethered to gRNA or editing factor expression. Unlike these other approaches, lineage prime editing should have the ability to record the order, intensity, and duration of signal events without requiring strict sequence motifs for ordered editing. It is. Indeed, lineage prime editing incorporates the cellular counters described above with signal-specific insertions, deletions, or mutations to study the order, intensity, and duration of biological signals. He must have the ability. Due to the programmable nature of prime editing, this approach can be achieved at pre-existing genomic loci in the desired target cells (such as in bacteria, mice, rats, monkeys, pigs, humans, zebrafish, C. elegans, etc.). ). It is also important to note that prime editing records incorporate barcodes in a guide RNA-dependent manner, and the number of inputs is limited to the number of signals for which there is a robust signal-specific guide RNA expression cassette. (This should be very high due to their ability to tether their expression to the activity of the RNA Pol II promoter). The number of recordable signals is linearly proportional to the number of PEgRNA required.

PEは細胞系統をトレースするためにもまた用いられ得る。個々の細胞を追跡するための固有の細胞バーコードを生成するために、繰り返しの配列改変が用いられ得る。バーコードのアレイ、それらの順序、およびサイズは全て、Cas9ヌクレアーゼによって生成される多数のインデル状態に対して相補的であり得るやり方で、細胞系統を推論するために用いられ得る。 PE can also be used to trace cell lineages. Iterative sequence modification can be used to generate unique cell barcodes for tracking individual cells. The array of barcodes, their order, and size can all be used to infer cell lineage in a manner that can be complementary to the large number of indel states generated by Cas9 nuclease.

繰り返しの配列改変のためのプライム編集方法論 Prime editing methodology for repetitive sequence modification

プライム編集(PE)を用いる繰り返しの配列改変のいくつもの別物のモダリティーが想定された:DNA変異導入;配列欠失;および配列挿入である。注意すべきことに、これらの適用は、予め存在するゲノムDNA標的に対してまたは研究者が標的細胞に取り入れする予めデザインされたDNA配列に対してどちらかで用いられ得る。連続配列改変のこれらの技術は、連続的な様式で、情報を記録することにとって、および標的座位のデザインされたまたは確率的な改変にとって価値を有する。連続標的座位改変は、種々のホストにおいてバリアントのライブラリを生成ことにとって特に有用であり得る。 A number of different modalities of repetitive sequence modification using prime editing (PE) have been envisioned: DNA mutagenesis; sequence deletion; and sequence insertion. Of note, these applications can be used either against pre-existing genomic DNA targets or against pre-designed DNA sequences that researchers introduce into target cells. These techniques of sequential sequence modification are valuable for recording information in a continuous manner and for designed or stochastic modification of target loci. Sequential targeted locus modification may be particularly useful for generating libraries of variants in different hosts.

繰り返しの配列変異は、細胞シグナルイベントについて報告するために、反復的な様式で、ゲノムDNAまたは予めデザインされた取り入れされたDNA配列どちらかを変改するために用いられ得る。このパラダイムでは、PE gRNA活性によって組み入れされる変異は細胞性のシグナルの存在に対応するであろう。これらの点変異は、連続編集イベントにとって必要なPAMモチーフ、および特定のシグナルの存在に対応する点変異を組み入れ組み入れ得る。各順次のガイドRNAは新規のプロトスペーサーを用いるであろうから、このシステムは使用に先行してgRNAデザインを要求するであろう;しかしながら、それは特に目当ての個々のまたは小さい数の刺激を検分することにとって特に強力であり得る。これらの変異の組み入れは個々の生物学的刺激に依存的であり得るか、または細胞時間をマークするであろう整合する細胞性のプロセスに接続され得る。下の配列は配列番号743、744、744、および745に対応する。

Figure 2020191234000410
Repetitive sequence variation can be used to modify either genomic DNA or pre-designed incorporated DNA sequences in a recursive manner to report on cellular signaling events. In this paradigm, mutations incorporated by PE gRNA activity would correspond to the presence of cellular signals. These point mutations can incorporate and incorporate the PAM motif required for sequential editing events, and point mutations that correspond to the presence of specific signals. Since each sequential guide RNA will use a novel protospacer, this system will require gRNA design prior to use; however, it specifically examines individual or small numbers of stimuli of interest. It can be particularly powerful for Incorporation of these mutations may be dependent on individual biological stimuli or may be connected to coordinating cellular processes that would mark cellular time. The sequences below correspond to SEQ ID NOs: 743, 744, 744, and 745.
Figure 2020191234000410

別の類似のPEガイドRNA集約型の方法は標的配列の繰り返しの欠失である。標的座位からの個々の配列の除去は、DNAモチーフの喪失によってシグナルイベントを再構築する能力を許すであろう。順次の配列を欠失するPEgRNAのデザインは、連続したシグナルの追跡を可能化するであろう。これは、研究者が1つのシグナルが別のものに後続する場合を同定することを許すであろう。これは、研究者がどのシグナルイベントがどの順序で起こるかを探査することを許すであろう。かかるシステムはCAMERAを用いて試験されている;しかしながら、これは固有の配列要件を有する具体的な座位の予めの選択を要求する。特定の配列決定要因が要求されないので、PEを用いる順次の配列欠失は、個々の細胞におけるペアワイズなイベントの並行的な記録を許すであろう。これは、目当てのいずれかの標的細胞内における多重化された様式のペアワイズなシグナルイベントを探査する能力を研究者に許すであろう。下の配列は配列番号746、747、および748に対応する。 Another similar PE-guided RNA-intensive method is repeat deletion of the target sequence. Removal of individual sequences from the target locus will allow the ability to reconstruct the signaling event by loss of the DNA motif. Designing PEgRNAs that delete sequential sequences will allow continuous signal tracking. This will allow researchers to identify cases in which one signal follows another. This will allow researchers to explore which signal events occur in which order. Such a system has been tested using CAMERA; however, this requires prior selection of specific loci with unique sequence requirements. Since no specific sequence determinants are required, sequential sequence deletion using PE will allow parallel recording of pairwise events in individual cells. This will allow researchers the ability to probe pairwise signaling events in a multiplexed manner within any target cell of interest. The sequences below correspond to SEQ ID NOs: 746, 747, and 748.

Figure 2020191234000411
Figure 2020191234000411

配列挿入は、細胞シグナルイベントを追跡するための第3のアプローチである。この戦略のいくつかのバリアントは変異導入または欠失よりもPEgRNA依存的でない。短い配列の挿入、プロトスペーサーの挿入、プロトスペーサーおよびバーコードの挿入、新規の相同性配列の挿入、ならびにバーコードを有する相同性配列の挿入の、いくつもの異なる挿入戦略が存在する。 Sequence insertion is a third approach to tracking cell signaling events. Some variants of this strategy are less dependent on PEgRNA than mutagenesis or deletion. There are a number of different insertion strategies: insertion of short sequences, insertion of protospacers, insertion of protospacers and barcodes, insertion of novel homologous sequences, and insertion of homologous sequences with barcodes.

短い繰り返し配列の挿入は、細胞時間の経過を測定するために標的配列のサイズを漸増的に増大させるためのやり方である。このシステムでは、5ヌクレオチド以上の繰り返し配列の挿入が、時間の経過または予め決定された刺激の連続した存在どちらかに関して反復拡大を引き起こし得る。系統PEの座位アグノスティックな性質は、再度、別々の生物学的シグナルに関して複数の固有の配列伸長の並行的な追跡を可能化する。これは、個々の細胞において細胞時間に渡って複数の生物学的シグナルの強度の測定を可能化するはずである。下の配列は配列番号749、750、および751に対応する。 Insertion of short repeat sequences is a way to incrementally increase the size of a target sequence to measure cellular time course. In this system, insertion of repeat sequences of 5 or more nucleotides can cause repeat expansion either over time or with the continued presence of a predetermined stimulus. The loci-agnostic nature of phylogenetic PE once again allows parallel tracking of multiple unique sequence stretches for separate biological signals. This should allow measurement of the intensity of multiple biological signals over cellular time in individual cells. The sequences below correspond to SEQ ID NOs: 749, 750, and 751.

Figure 2020191234000412
Figure 2020191234000412

異なる短い配列の挿入は、欠失空間に類似の様式でわずかのPEgRNAを要求するであろう。記録されようとするシグナルの数および挿入される配列のサイズは、必要とされるPEgRNAの組み合わせの数を決定するであろう。このシステムにおいて複数の配列を記録することの1つの課題は、そのカーゴ配列を挿入することにおける各PEgRNAの異なる効率であろう。 Insertion of a different short sequence will require fewer PEgRNAs in a similar manner in the deletion space. The number of signals to be recorded and the size of the inserted sequences will determine the number of PEgRNA combinations required. One challenge of recording multiple sequences in this system would be the different efficiency of each PEgRNA in inserting its cargo sequence.

細胞シグナルの指標としてのプロトスペーサーの挿入は魅惑的であるが、技術的課題がこのアプローチの効率を侵害し得る。PEgRNAカセットはそれら自体が基質であり、順次の編集の効率および忠実性を毀損するPEgRNA上への挿入を引き起こすであろうから、単一PEgRNAシステムは用いることが難しいであろう。この同じ問題は2または3 PEgRNAシステムについても残存する。なぜなら、各ガイドは別のものの基質であり、ガイドカセットそれ自体への他の配列の挿入を可能化し、これは間違ったシグナルに関してプロトスペーサー配列の不適当な挿入に至り得るからである。これらのプロトスペーサー挿入システムはバーコード配列の包含について想像することもまた困難である。単一PEgRNAバーコードシステムは用いられるバーコードを単純に書き換え、第1の編集に貯蔵されたデータを除去するであろう。再度、複数ガイドシステムは他のPEgRNA発現構築物上への挿入を患い、その有用性を(特にインビボで)限定する。下の配列は配列番号752、752、753、754、754、755、および756に対応する。 Although protospacer insertion as an indicator of cellular signals is attractive, technical challenges can compromise the efficiency of this approach. A single PEgRNA system would be difficult to use because the PEgRNA cassettes are themselves substrates and would cause insertion onto the PEgRNA, compromising the efficiency and fidelity of sequential editing. This same problem remains for 2 or 3 PEgRNA systems. This is because each guide is a substrate for another, allowing the insertion of other sequences into the guide cassette itself, which could lead to inappropriate insertion of the protospacer sequence with respect to the wrong signal. These protospacer insertion systems are also difficult to envision for the inclusion of barcode sequences. A single PEgRNA barcode system would simply rewrite the barcode used and remove the data stored in the first compilation. Again, the multiple guide system suffers from insertion onto other PEgRNA expression constructs, limiting its utility (especially in vivo). The sequences below correspond to SEQ ID NOs: 752, 752, 753, 754, 754, 755, and 756.

Figure 2020191234000413
Figure 2020191234000413

相同性配列(すなわち、Cas9ニックの位置付けの3'の配列)、特に関連するバーコードを有する相同性配列の挿入は、特に有用な系統PE戦略であるように見える。このシステムは、編集の順次のラウンドが、同じ細胞の他のPEgRNA編集イベントによっては改変され得ないPEgRNAカセットからのバーコードの挿入をもたらすということを保証することによって、プロトスペーサー挿入に関連するイシューを回避する。バーコード化システムは、複数のバーコードが所与の刺激に関連し得るので重宝である。このシステムは標的プロトスペーサーの多数を保全するが、シード配列、PAM、および下流の隣接ヌクレオチドを変改する。これは、用いられようとするPEgRNAの有意な再デザインなしに、複数のシグナルが1つの編集座位に接続されることを可能化する。この戦略は、多数の細胞性の刺激(内部または外部どちらかの)に応答して単一の座位において多重化されたバーコード挿入を可能化するであろう。それは、固有のバーコードが存在するだけ多くのシグナルの強度、持続時間、および順序の記録を可能化し得る(これらは4^Nの可能なバーコードを生成するように複数のNヌクレオチドによってデザインされ得る。すなわち、5ntバーコードは4^5または1024の固有のシグナルの一度での記録を可能化するであろう)。このシステムはin vitroおよびインビボ両方で用いられ得る。 Insertion of homologous sequences (ie, sequences 3' of the positioning of the Cas9 nick), especially homologous sequences with associated barcodes, appears to be a particularly useful phylogenetic PE strategy. This system addresses issues related to protospacer insertion by ensuring that sequential rounds of editing result in barcode insertions from PEgRNA cassettes that cannot be modified by other PEgRNA editing events in the same cell. Avoid. Barcoding systems are useful because multiple barcodes can be associated with a given stimulus. This system preserves much of the target protospacer but alters the seed sequence, PAM, and downstream flanking nucleotides. This allows multiple signals to be connected to one editing locus without significant redesign of the PEgRNA to be used. This strategy will allow multiplexed barcode insertion at a single locus in response to multiple cellular stimuli (either internal or external). It can enable recording of the intensity, duration, and order of as many signals as there are unique barcodes (these are designed with multiple N nucleotides to generate 4^N possible barcodes). i.e. a 5nt barcode would allow recording of 4^5 or 1024 unique signals at once). This system can be used both in vitro and in vivo.

例13において引用された参考文献
以下の参考文献の各々は参照により本明細書に組み込まれる。
1.Recording development with single cell dynamic lineage tracing. Aaron McKenna,James A.Gagnon.
2.Whole-organism lineage tracing by combinatorial and cumulative genome editing.Mckenna et al.Science.2016 Jul 29;353(6298):aaf7907.doi10.1126/science.aaf7907. Epub 2016 May 26.
3.Molecular recording of mammalian embryogenesis.Chan et al.2019.Nature.Jun;570(7759):77-82.doi:10.1038/s41586-019-1184-5.Epub 2019 May 13.
References Cited in Example 13 Each of the following references is incorporated herein by reference.
1. Recording development with single cell dynamic lineage tracing. Aaron McKenna,James A.Gagnon.
2. Whole-organism lineage tracing by combinatorial and cumulative genome editing.Mckenna et al.Science.2016 Jul 29;353(6298):aaf7907.doi10.1126/science.aaf7907. Epub 2016 May 26.
3. Molecular recording of mammalian embryogenesis.Chan et al.2019.Nature.Jun;570(7759):77-82.doi:10.1038/s41586-019-1184-5.Epub 2019 May 13.

例14-PEによってバイオ分子活性および/または局在を調節する
バイオ分子の細胞下レベルの局在および修飾状態はそれらの活性を制御する。転写コントロール、細胞代謝、およびシグナル伝達カスケードのような特定の生物学的機能は、全て、細胞内の具体的な位置付けにおいて丁寧にオーケストレーションされている。そのため、タンパク質の細胞局在および修飾状態を調節することは、疾患の処置のための可能性ある治療学的戦略を表す。標的タンパク質の局在を変改するためのいくつかの存在する治療学が開発されている。例えば、ファルネシル化阻害剤は、KRASのような重要な発がんタンパク質の脂質修飾および膜標的化を防止するようにデザインされる。類似に、標的タンパク質の低分子によって誘導されるユビキチン化は、それらを分解のためのプロテアソームに導く。タンパク質をこれらのおよび他の固有の細胞区画に輸送する能力は、いくつもの生物学的プロセスを変改するための機会を提供する。治療学の目的で、遺伝子にコードされたシグナルによってバイオ分子(例えばタンパク質、脂質、糖、および核酸)の修飾状態および細胞下レベルの輸送を変改するための遺伝子にコードされたハンドルを組み入れるために、プライム編集(PE)を用いることが本願において提案される。
Example 14 - Modulating biomolecule activity and/or localization by PE The subcellular localization and modification status of biomolecules controls their activity. Specific biological functions such as transcriptional control, cellular metabolism, and signal transduction cascades are all carefully orchestrated in specific locations within the cell. Modulating the cellular localization and modification status of proteins therefore represents a potential therapeutic strategy for the treatment of diseases. Several existing therapeutics have been developed to alter the localization of target proteins. For example, farnesylation inhibitors are designed to prevent lipid modification and membrane targeting of important oncogenic proteins such as KRAS. Similarly, small molecule-induced ubiquitination of target proteins directs them to the proteasome for degradation. The ability to transport proteins to these and other unique cellular compartments provides opportunities for modifying a number of biological processes. To incorporate genetically encoded handles to alter the modification status and subcellular level transport of biomolecules (e.g. proteins, lipids, sugars, and nucleic acids) by genetically encoded signals for therapeutic purposes. In this application, it is proposed to use prime editing (PE).

PEは、Cas9酵素によって標的化可能ないずれかのゲノム座位上への短いDNA配列の組み入れ、欠失、または置き換えを可能化するゲノム編集テクノロジーである。このテクノロジーを用いて、原理的には、これらの重要なバイオ分子の活性を変化させる重要なDNA、RNA、またはタンパク質コード配列を組み入れまたは除去し得る。より具体的には、プライム編集は、バイオ分子の局在または修飾特性を変化させるモチーフまたはシグナルを組み入れるために用いられ得る。いくつかの例は:タンパク質アミノ酸配列;翻訳後修飾のモチーフ;フォールディングまたは局在を変化させるRNAモチーフ;および周囲のDNAの局所的クロマチン状態またはアーキテクチャを変化させるDNA配列の組み入れの改変を包含する。 PE is a genome editing technology that allows the insertion, deletion, or replacement of short DNA sequences onto any genomic locus that can be targeted by the Cas9 enzyme. This technology could, in principle, be used to incorporate or remove important DNA, RNA, or protein coding sequences that would alter the activity of these important biomolecules. More specifically, prime editing can be used to incorporate motifs or signals that alter the localization or modification properties of a biomolecule. Some examples include: modifications of protein amino acid sequences; post-translational modification motifs; RNA motifs that alter folding or localization; and the incorporation of DNA sequences that alter the local chromatin state or architecture of the surrounding DNA.

PEによって媒介される改変の1つの標的バイオ分子はDNAである。標的座位のアクセス可能性を変化させるいくつものDNA配列を組み入れるためのDNAの改変がなされ得る。クロマチンアクセス可能性は遺伝子転写アウトプットをコントロールする。クロマチンコンパクト化酵素を動員するためのマークの組み入れは、隣り合う遺伝子の転写アウトプットを減少させるはずであるが、クロマチン開放に関連する配列の組み入れは、領域をよりアクセス可能にし、翻って転写を増大させるはずである。ネイティブな制御配列を真似たより複雑な配列モチーフの組み入れは、現行で利用可能なdCas9融合体よりも微妙なかつ生物学的に敏感なコントロールを異なるエピジェネティックなリーダー、ライター、またはイレーサー酵素に提供するはずである。典型的には、具体的な生物学的祖先を有さずにあり得る多数の単一型のマークを組み入れるツールである。3Dゲノムアーキテクチャの急成長分野において実証されているとおり、2つの座位を近接する近位に持って来るかまたは座位を核膜との接触に持って来るであろう配列の組み入れもまた、それらの座位の転写アウトプットを変改するはずである。 One target biomolecule for PE-mediated modifications is DNA. DNA can be modified to incorporate any number of DNA sequences that alter the accessibility of the target locus. Chromatin accessibility controls gene transcription output. Incorporation of a mark to recruit chromatin compacting enzymes should decrease the transcription output of neighboring genes, while incorporation of sequences associated with chromatin opening should make the region more accessible and in turn increase transcription. Incorporation of more complex sequence motifs that mimic native regulatory sequences should provide more subtle and biologically sensitive control over different epigenetic reader, writer, or eraser enzymes than currently available dCas9 fusions. Typically, it is a tool that incorporates a large number of possible monotypic marks without a specific biological ancestry. Incorporation of sequences that would bring two loci into close proximity or bring loci into contact with the nuclear membrane should also alter the transcription output of those loci, as demonstrated in the burgeoning field of 3D genome architecture.

それらの細胞局在、相互作用パートナー、構造ダイナミクス、またはフォールディングの熱力学を変化させることによってそれらの活性を変改するためのRNAの改変もまたなされ得る。翻訳中断またはフレームシフトを引き起こすであろうモチーフの組み入れは、種々のmRNAプロセシング機序によってmRNA種の存在量を変化させ得る。コンセンサススプライス配列を改変することもまた、異なるRNA種の存在量および保有率を変改するであろう。異なるスプライスアイソフォームの相対比を変化させることは、予測可能に、タンパク質翻訳産物の比の変化に至るであろう。これは多くの生物学的経路を変改するために用いられ得る。例えば、ミトコンドリア対核のDNA修復タンパク質のバランスをシフトさせることは、化学療法試薬に対する異なるがんのレジリエンスを変改するであろう。さらにその上、RNAは、新規のタンパク質標的への結合を可能化する配列によって修飾され得る。高い親和性で細胞タンパク質に結合するいくつものRNAアプタマーが開発されている。これらのアプタマーの1つの組み入れは、それらの翻訳、生物活性を防止するであろうタンパク質標的への結合によって異なるRNA種を隔離するために、またはRNA種を特定の細胞下レベル区画に持って来るためにどちらかで用いられ得る。バイオ分子分解は局在改変の別のクラスである。例えば、細胞内のRNAを制御するためのRNAメチル化が用いられる。メチル化のコンセンサスモチーフがPEによって標的RNAコード配列上に導入され得る。RNAは、ナンセンスによって媒介される崩壊機構または標的RNA種を分解するための他の核酸代謝経路を導く配列を包含するようにもまた改変され得、細胞内のRNAのプールを変化させるであろう。加えて、RNA種はそれらの凝集状態を変改するように改変され得る。RNAの絡まりを生成するための配列が目当ての単一のRNAまたは複数のRNA上に組み入れされ得、これはそれらを翻訳またはシグナルにとって無効な基質にするであろう。 Modifications of RNA can also be made to alter their activity by changing their cellular localization, interaction partners, structural dynamics, or thermodynamics of folding. Incorporation of motifs that would cause translation interruption or frameshifting can alter the abundance of mRNA species by various mRNA processing mechanisms. Altering the consensus splice sequence will also alter the abundance and prevalence of different RNA species. Altering the relative ratios of different splice isoforms will predictably lead to changes in the ratio of protein translation products. This can be used to modify many biological pathways. For example, shifting the balance of mitochondrial versus nuclear DNA repair proteins would alter the resilience of different cancers to chemotherapy reagents. Furthermore, RNA can be modified with sequences that allow binding to new protein targets. A number of RNA aptamers have been developed that bind with high affinity to cellular proteins. Incorporation of one of these aptamers can be used to sequester different RNA species by binding to protein targets that would prevent their translation, biological activity, or bring RNA species to specific subcellular level compartments. can be used for either purpose. Biomolecular degradation is another class of localization modification. For example, RNA methylation is used to control RNA within cells. A consensus motif of methylation can be introduced onto the target RNA coding sequence by PE. RNA can also be modified to include sequences that direct nonsense-mediated decay mechanisms or other nucleic acid metabolic pathways to degrade target RNA species, which would alter the pool of RNA within the cell. . Additionally, RNA species can be modified to alter their aggregation state. Sequences to generate RNA tangles can be incorporated onto a single RNA or multiple RNAs of interest, which will make them ineffective substrates for translation or signals.

翻訳後修飾(PTM)によるタンパク質の修飾もまたPEによって実行され得るバイオ分子操作の重要なクラスを表す。RNA種のように、細胞内のタンパク質の存在量を変化させることは、PEの重要な能力である。オープンリーディングフレームに停止コドンを組み入れるための編集がされ得る。これは編集されたDNA配列から生ずる全長産物を消去するであろう。代替的には、タンパク質分解の速度が標的タンパク質について変改されることを引き起こすペプチドモチーフが組み入れられ得る。遺伝子本体上への分解タグの組み入れが、細胞内のタンパク質の存在量を変改するために用いられ得る。その上、低分子によって誘導されるデグロンの導入はタンパク質分解の時間的コントロールを可能化し得る。これは研究および治療学両方にとって重要な関連性を有し得る。なぜなら、研究者は所与の標的の低分子によって媒介される治療学的タンパク質分解が見込みある治療学的戦略であるかどうかを難なく評価し得るからである。タンパク質の細胞下レベル局在を変化させるためのタンパク質モチーフもまた組み入れられ得る。核、ミトコンドリア、細胞膜、ペルオキシソーム、リソソーム、プロテアソーム、エキソソーム、および他を包含するいくつもの細胞下レベル区画にタンパク質を選好的に輸送するためのアミノ酸モチーフが組み入れられ得る。 Modification of proteins by post-translational modifications (PTMs) also represents an important class of biomolecular manipulations that can be performed by PE. Like RNA species, altering the abundance of proteins in cells is an important capability of PE. Open reading frames can be edited to incorporate stop codons. This will eliminate the full-length product resulting from the edited DNA sequence. Alternatively, peptide motifs can be incorporated that cause the rate of protein degradation to be altered for the target protein. Incorporation of degradation tags onto the gene body can be used to alter the abundance of proteins in cells. Moreover, introduction of small molecule-induced degrons can allow for temporal control of protein degradation. This can have important implications for both research and therapeutics, since researchers can readily assess whether small molecule-mediated therapeutic protein degradation of a given target is a promising therapeutic strategy. Protein motifs can also be incorporated to change the subcellular localization of proteins. Amino acid motifs can be incorporated to preferentially target proteins to a number of subcellular compartments, including the nucleus, mitochondria, cell membrane, peroxisomes, lysosomes, proteasomes, exosomes, and others.

PTM機構によって修飾されるモチーフを組み入れまたは破壊することはタンパク質翻訳後修飾を変改し得る。リン酸化、ユビキチン化、グリコシル化、脂質修飾(例えばファルネシル化、ミリストイル化、パルミトイル化、プレニル化、GPIアンカー)、ヒドロキシル化、メチル化、アセチル化、クロトニル化、SUMO化、ジスルフィド結合形成、側鎖結合切断イベント、ポリペプチドバックボーン切断イベント(タンパク質分解)、およびいくつもの他のタンパク質PTMが同定されている。これらのPTMは、多くの場合には細胞下レベル局在を変化させることによってタンパク質機能を変化させる。実に、キナーゼは多くの場合にはリン酸化イベントによって下流のシグナルカスケードを活性化する。標的ホスホ部位の除去はシグナル伝達を防止するであろう。全長タンパク質発現を保持しながらいずれかのPTMモチーフを部位特異的に切除または組み入れる能力は、基礎研究および治療学両方にとって重要な進歩であろう。PEの配列組み入れ範囲および標的窓は、それを幅広いPTM改変空間に良く適するようにしている。 Incorporating or destroying motifs modified by the PTM machinery can alter protein post-translational modifications. Phosphorylation, ubiquitination, glycosylation, lipid modification (e.g. farnesylation, myristoylation, palmitoylation, prenylation, GPI anchor), hydroxylation, methylation, acetylation, crotonylation, SUMOylation, disulfide bond formation, side chains Bond cleavage events, polypeptide backbone cleavage events (proteolysis), and a number of other protein PTMs have been identified. These PTMs alter protein function, often by altering subcellular localization. Indeed, kinases activate downstream signal cascades, often through phosphorylation events. Removal of the target phosphosite will prevent signal transduction. The ability to site-specifically excise or incorporate either PTM motif while retaining full-length protein expression would be an important advance for both basic research and therapeutics. PE's sequence incorporation range and targeting window make it well suited for a wide range of PTM modification spaces.

脂質修飾部位の除去は細胞膜へのタンパク質の輸送を防止するはずである。翻訳後修飾プロセスを標的化する現行の治療学における主要な限定はそれらの特異性である。ファルネシルトランスフェラーゼ阻害剤は細胞膜へのKRAS局在を消去するそれらの能力について鋭意に試験されている。残念ながら、ファルネシル化の全面的な阻害は数々のオフターゲット効果を伴い、これらはこれらの低分子の幅広い使用を防止している。類似に、低分子によるタンパク質キナーゼの特異的阻害は、ヒトゲノムの大きいサイズおよび種々のキナーゼ間の類似性を原因として非常に難しくあり得る。PEはこの特異性問題に可能性ある解決をオファーする。なぜなら、それは全面的な酵素阻害の代わりに修飾部位の切除による標的タンパク質の修飾の阻害を可能化するからである。例えば、KRAS上の脂質修飾ペプチドモチーフの除去は、ファルネシルトランスフェラーゼ阻害の代わりに用いられ得る標的化されたアプローチであろう。このアプローチは、膜結合するようにデザインされていないタンパク質上に脂質標的化モチーフを組み入れることによって標的タンパク質活性を阻害することの機能的な反対物である。 Removal of lipid modification sites should prevent protein transport to the cell membrane. A major limitation of current therapeutics targeting post-translational modification processes is their specificity. Farnesyltransferase inhibitors have been extensively tested for their ability to eliminate KRAS localization to the cell membrane. Unfortunately, total inhibition of farnesylation is associated with a number of off-target effects, which prevent the widespread use of these small molecules. Similarly, specific inhibition of protein kinases by small molecules can be very difficult due to the large size of the human genome and the similarities between various kinases. PE offers a possible solution to this specificity problem. This is because it allows inhibition of target protein modification by excision of the modification site instead of total enzyme inhibition. For example, removal of the lipid-modified peptide motif on KRAS would be a targeted approach that could be used instead of farnesyltransferase inhibition. This approach is the functional opposite of inhibiting target protein activity by incorporating lipid targeting motifs on proteins that are not designed to be membrane bound.

PEはタンパク質-タンパク質複合体化イベントを取り調べるためにもまた用いられ得る。タンパク質は多くの場合には複合体内で機能してそれらの生物活性を遂行する。PEは、タンパク質がこれらの複合体内に存在する能力を生出するかまたは破壊するかどちらかのために用いられ得る。複合体形成イベントを消去するためには、タンパク質:タンパク質インターフェース上のアミノ酸置換または挿入が、複合体化を好まないように組み入れられ得る。SSX18は重要なヒストンリモデリング複合体のBAF複合体のタンパク質構成要素である。SSX18の変異は滑膜肉腫を駆動する。PEは、SSX18が複合体のそのタンパク質パートナーに結合することを防止する側鎖を組み入れしてその発がん活性を防止するために用いられ得る。PEは病原性の変異を除去してこのタンパク質のWT活性を復元するためにもまた用いられ得る。代替的には、PEは、タンパク質をそれらのネイティブな複合体中に保つために、またはそれらのネイティブな活性とは無関係である相互作用に関与するようにそれらを引っ張ってそれらの活性を阻害するためにどちらかで用いられ得る。別のものと比べて1つの相互作用状態を維持する複合体を形成することは、重要な治療学的モダリティーを表し得る。タンパク質:タンパク質インターフェースを変改して相互作用のKdを減少させることは、それらのタンパク質がより長く互いにくっついていることを保つであろう。疾患においては神経芽腫シグナルカスケードを駆動するが、さもなければ他の細胞では健康な転写コントロールに関与するn-mycのように、タンパク質複合体は複数のシグナル複合体を有し得る。PEは、健康な相互作用パートナーとのn-myc会合を駆動しかつ発がん相互作用パートナーに対するその親和性を減少させる変異を組み入れるために用いられ得る。 PE can also be used to interrogate protein-protein conjugation events. Proteins often function within complexes to carry out their biological activities. PE can be used to either create or destroy the ability of proteins to reside within these complexes. To eliminate complexation events, amino acid substitutions or insertions on the protein:protein interface can be engineered to disfavor complexation. SSX18 is a protein component of the BAF complex, an important histone remodeling complex. Mutations in SSX18 drive synovial sarcoma. PE can be used to incorporate side chains that prevent SSX18 from binding to its protein partner in the complex, thus preventing its oncogenic activity. PE can also be used to remove pathogenic mutations and restore WT activity of the protein. Alternatively, PE inhibits the activity of proteins in order to keep them in their native complexes or by pulling them to engage in interactions that are independent of their native activity. can be used for either purpose. Forming complexes that maintain one interaction state relative to another may represent an important therapeutic modality. Modifying the protein:protein interface to reduce the Kd of interaction will keep those proteins stuck together longer. Protein complexes can have multiple signaling complexes, such as n-myc, which drives the neuroblastoma signal cascade in disease but is otherwise involved in healthy transcriptional control in other cells. PE can be used to incorporate mutations that drive n-myc association with healthy interaction partners and reduce its affinity for oncogenic interaction partners.

例14において引用された参考文献
以下の参考文献の各々は参照により本明細書に組み込まれる。
1. Selective Target Protein Degradation via Phthalimide Conjugation.Winter et al.Science.Author manuscript;available in PMC 2016 Jul 8.
References Cited in Example 14 Each of the following references is incorporated herein by reference.
1. Selective Target Protein Degradation via Phthalimide Conjugation.Winter et al.Science.Author manuscript;available in PMC 2016 Jul 8.

2. Reversible disruption of mSWI/SNF(BAF)complexes by the SS18-SSX oncogenic fusion in synovial sarcoma.Kadoch and Crabtree.Cell.2013 Mar 28;153(1):71-85.doi:10.1016/j.cell.2013.02.036.
3. Ribosomal frameshifting and transcriptional slippage:From genetic steganography and cryptography to adventitious use.Atkins et al.Nucleic Acids Research,Volume 44,Issue 15,6 September 2016,Pages 7007-7078.
4. Transcriptional Regulation and its Misregulation in Disease.Lee and Young.Cell.Author manuscript;available in PMC 2014 Mar 14.
5. Protein localization in disease and therapy.Mien-Chie Hung,Wolfgang Link Journal of Cell Science 2011 124:3381-3392.
6. Loss of post-translational modification sites in disease.Li et al.Pac Symp Biocomput.2010:337-47.PTMD:A Database of Human Disease-associated Post-translational Modifications.Xu et al.Genomics Proteomics Bioinformatics.2018 Aug;16(4):244-251.Epub 2018 Sep 21.
7. Post-transcriptional gene regulation by mRNA modifications.Zhao et al.Nature Reviews Molecular Cell Biology volume18,pages31-42(2017).
2. Reversible disruption of mSWI/SNF(BAF)complexes by the SS18-SSX oncogenic fusion in synovial sarcoma.Kadoch and Crabtree.Cell.2013 Mar 28;153(1):71-85.doi:10.1016/j.cell. 2013.02.036.
3. Ribosomal frameshifting and transcriptional slippage:From genetic steganography and cryptography to adventitious use.Atkins et al.Nucleic Acids Research,Volume 44,Issue 15,6 September 2016,Pages 7007-7078.
4. Transcriptional Regulation and its Misregulation in Disease.Lee and Young.Cell.Author manuscript;available in PMC 2014 Mar 14.
5. Protein localization in disease and therapy. Mien-Chie Hung, Wolfgang Link Journal of Cell Science 2011 124:3381-3392.
6. Loss of post-translational modification sites in disease.Li et al.Pac Symp Biocomput.2010:337-47.PTMD:A Database of Human Disease-associated Post-translational Modifications.Xu et al.Genomics Proteomics Bioinformatics.2018 Aug ;16(4):244-251.Epub 2018 Sep 21.
7. Post-transcriptional gene regulation by mRNA modifications.Zhao et al.Nature Reviews Molecular Cell Biology volume18, pages31-42(2017).

例15-PEgRNASのデザインおよび改変
本明細書に記載されるのは、プライム編集(PE)効率を改善し得る一連のPEgRNAデザインおよびストラテジーである。
Example 15 - PEgRNAS Design and Modification Described herein is a series of PEgRNA designs and strategies that can improve prime editing (PE) efficiency.

プライム編集(PE)は、プライム編集因子ガイドRNA(PEgRNA)内にコードされた情報を使用して、標的にされた遺伝子座内の定義されたDNA配列を置き換え得、挿入し得、または除去し得るゲノム編集技術である。プライム編集因子(PE)は、逆転写酵素(RT)酵素と融合したヌクレアーゼ活性(Cas9)をもつ配列-プログラム型DNA結合タンパク質からなる。PEはPEgRNAと複合体を形成するが、前記複合体は、それらのスペーサー配列内に標的化特定DNA遺伝子座のための情報、ならびに標準のsgRNA骨格中へ備えられた改変伸長中に所望の編集を特定する情報を含有する。PE:PEgRNA複合体は、プログラムされた標的DNA遺伝子座に結合しニックを入れるが、これによってニックが入れられたDNA鎖の、PEgRNAの改変プライマー結合配列(PBS)とのハイブリダイゼーションが可能になる。次いで、逆転写酵素ドメインは、ニックが入れられたゲノムDNAをDNA重合のためのプライマーとして使用して、PEgRNAのRT鋳型部分内の編集コード情報をコピーする。これに続くDNA修復プロセスは、新しく合成された編集済DNA鎖をゲノム遺伝子座中へ組み込む。プライム編集の多用途性は、研究ツールおよび潜在的な治療薬として前途有望ではあるものの、効率および範囲における数種の限界が、編集に要される多段階プロセスに起因して存在する。例えば、PEgRNA内に形成される好ましくないRNA構造は、PEgRNAからゲノム遺伝子座へのDNA編集のコピーを阻害し得る。PE技術を改善する潜在的な1つのやり方は、不可欠なPEgRNA構成要素の再デザインおよび改変を介する。これらPEgRNAのデザインへの改善は、改善されたPE効率に必要とされそうであって、挿入されるより長い配列のゲノム中への組み入れを可能にさせそうである。 Prime editing (PE) uses information encoded within a prime editing factor guide RNA (PEgRNA) to replace, insert, or remove defined DNA sequences within a targeted genetic locus. This is the genome editing technology that can be used. Prime editing factors (PEs) consist of sequence-programmed DNA-binding proteins with nuclease activity (Cas9) fused to reverse transcriptase (RT) enzymes. PE forms a complex with PEgRNA, which contains information for targeted specific DNA loci within their spacer sequences, as well as modifications provided into the standard sgRNA backbone for desired editing during extension. Contains information that identifies the person. The PE:PEgRNA complex binds and nicks the programmed target DNA locus, allowing hybridization of the nicked DNA strand with the PEgRNA's modified primer binding sequence (PBS). . The reverse transcriptase domain then uses the nicked genomic DNA as a primer for DNA polymerization to copy the editing code information within the RT template portion of PEgRNA. The subsequent DNA repair process incorporates the newly synthesized edited DNA strand into the genomic locus. Although the versatility of prime editing holds promise as a research tool and potential therapeutic, several limitations in efficiency and scope exist due to the multi-step process required for editing. For example, unfavorable RNA structures formed within PEgRNA can inhibit DNA editing copying from PEgRNA to genomic loci. One potential way to improve PE technology is through redesign and modification of essential PEgRNA components. Improvements to the design of these PEgRNAs are likely required for improved PE efficiency and are likely to allow the incorporation of longer inserted sequences into the genome.

本明細書に記載されるのは、PEの有効性を改善するのを思い描いた一連のPEgRNAデザインである。これらのデザインは、sgRNAの有効性および/または安定性を改善するための、これまでに公開された数多のアプローチ利点を生かし、ならびに数多の新規ストラテジーを利用する。これらの改善点は、数多の種々のカテゴリーの1以上に属し得る: Described herein is a series of PEgRNA designs envisioned to improve the efficacy of PE. These designs take advantage of numerous previously published approaches and utilize a number of novel strategies to improve sgRNA efficacy and/or stability. These improvements may belong to one or more of a number of different categories:

(1)より長いPEgRNA。このカテゴリーは、非ポリメラーゼIII(pol III)プロモーターからの機能的PEgRNAの効率的な発現を可能にさせる、改善されたデザイン(これによって厄介な配列要件もなく、より長いPEgRNAの発現が可能になるであろう)に関する; (1) Longer PEgRNA. This category includes improved designs that allow efficient expression of functional PEgRNAs from non-polymerase III (pol III) promoters, which allow expression of longer PEgRNAs without cumbersome sequence requirements. concerning);

(2)コア改善。このカテゴリーはコアのCas9結合PEgRNA骨格の改善に関し、これは効力を改善し得る; (2) Core improvement. This category concerns improvements to the core Cas9-bound PEgRNA backbone, which may improve efficacy;

(3)RT処理能力。このカテゴリーは、RT処理能力を改善するPEgRNAの改善に関し、標的ゲノム座位におけるより長い配列の挿入を可能化する;および (3) RT processing ability. This category relates to improvements in PEgRNA that improve RT throughput, allowing insertion of longer sequences at targeted genomic loci; and

(4)末端モチーフ。このカテゴリーはPEgRNAの5'および/または3'末端へのRNAモチーフの追加に関し、これらはPEgRNA安定性を改善するか、RT処理能力を増強するか、PEgRNAのミスフォールディングを防止するか、またはゲノム編集にとって重要な追加の因子を動員する。 (4) Terminal motif. This category pertains to the addition of RNA motifs to the 5' and/or 3' ends of PEgRNAs that may improve PEgRNA stability, enhance RT processing capacity, prevent misfolding of PEgRNAs, or Mobilize additional factors important for editing.

本明細書に記載されるのは、各カテゴリーにおいて、数多の潜在的なかかるPEgRNAである。これらのデザインの数種は、Cas9をもつsgRNA活性を改善するためにこれまでにも記載されており、それ自体示されている。また本明細書に記載されるのには、PEgRNA骨格の洗練化(polishing)を可能にさせてPE活性(5)を増強させる、所定の配列標的のためのPEgRNAの進化のためのプラットホームもある。注目すべきことに、これらのデザインはまた、いずれのCas9またはその進化バリアントによって認識されるPEgRNAを改善するのにも容易に適用され得る。 Described herein are a number of potential such PEgRNAs in each category. Several of these designs have been previously described and demonstrated as such to improve sgRNA activity with Cas9. Also described herein is a platform for the evolution of PEgRNA for a given sequence target that allows polishing of the PEgRNA backbone to enhance PE activity (5). . Of note, these designs can also be easily applied to improve PEgRNA recognized by any Cas9 or its evolved variants.

(1)より長いPEgRNA。 (1) Longer PEgRNA.

sgRNAは、典型的には、U6 snRNAプロモーターから発現される。このプロモーターは、pol IIIを動員して関連RNAを発現するものであって、核内に保持される短いRNAの発現に有用である。しかしながら、pol IIIは、処理能力がそれほど高くなく、効率的なゲノム編集に要されるレベルにて長さが数百ヌクレオチドより長いRNAを発現することができない183。加えて、pol IIIは、伸展したUにて失速または終止し、PEgRNAを使用して挿入され得る配列多様性を潜在的に限定し得る。ポリメラーゼII(pCMVなど)またはポリメラーゼI(U1 snRNAプロモーターなど)を動員する他のプロモーターも、それらのより長いsgRNAの発現能について調べられている183。しかしながら、これらのプロモーターは、典型的には、部分的に転写され、これによって、発現されたPEgRNA中スペーサーの5'に余分な配列がもたらされ、このことは部位依存的なやり方で著しく低減されたCas9:sgRNA活性をもたらすことが示されている。加えて、pol III転写のPEgRNAは、6~7つ伸びたUにおいて簡単に終止し得るのに対し、pol IIまたはpol Iから転写されたPEgRNAは、異なる終止シグナルを要するであろう。しばしば、かかるシグナルはまた、ポリアデニル化ももたらし、これによってPEgRNAの核からの望ましくない輸送がもたらされるであろう。同様に、pol IIプロモーター(pCMVなど)から発現されるRNAは、典型的には、5'にキャップされており、それらの核外輸送もまたもたらされる。 sgRNAs are typically expressed from the U6 snRNA promoter. This promoter recruits pol III to express associated RNA and is useful for expressing short RNAs that are retained in the nucleus. However, pol III is not very processive and cannot express RNAs longer than a few hundred nucleotides at the levels required for efficient genome editing . In addition, pol III stalls or terminates at the extended U, potentially limiting the sequence diversity that can be inserted using PEgRNA. Other promoters that recruit polymerase II (such as pCMV) or polymerase I (such as the U1 snRNA promoter) have also been investigated for their ability to express longer sgRNAs . However, these promoters are typically partially transcribed, resulting in an extra sequence 5' of the spacer in the expressed PEgRNA, which is significantly reduced in a site-dependent manner. Cas9:sgRNA activity has been shown to result in increased Cas9:sgRNA activity. In addition, pol III-transcribed PEgRNAs can easily terminate at 6-7 extended U's, whereas PEgRNAs transcribed from pol II or pol I will require different termination signals. Frequently, such signals will also result in polyadenylation, leading to unwanted export of PEgRNA from the nucleus. Similarly, RNAs expressed from pol II promoters (such as pCMV) are typically 5' capped, which also results in their nuclear export.

これまでに、Rinnおよび共同研究者らは、長鎖非コーディングRNA(lncRNA)でタグ付けされたsgRNAの産生のための様々な発現プラットホームをスクリーニングした183。これらのプラットホームは、pCMVから発現され、ヒトのMALAT1 ncRNAからのENE要素184、KSHVからのPAN ENE要素185、またはU1 snRNAからの3'ボックス186において終止するRNAを包含する。注目すべきことに、MALAT1 ncRNAおよびPAN ENEは、ポリAテールを保護する三重ヘリックスを形成する184,187。これらの構築物はまた、RNAの発現を可能にさせることに加え、RNA安定性をも増強し得ることが予想される(セクションivを参照)。U1 snRNAからのプロモーターを使用すると、これらのより長いsgRNAの発現が可能になることもまた183、探索した。これらの発現系はまた、より長いPEgRNAの発現も可能にさせるであろうことが予想される。加えて、一連の方法は、PEgRNAの一部として転写されるであろうpol IIプロモーターの部分の切断のためにデザインされており、自己切断型リボザイム(ハンマーヘッド188、ピストル189、ハチェット189、ヘアピン190、VS191、ツイスター192、もしくはツイスターシスター192リボザイムなど)、または転写されたガイドを処理する他の自己切断型要素、またはCsy4によって認識されまたガイドのプロセシングへも繋がるヘアピン193のいずれかが付加されている。また、複数のENEモチーフの組み込みは、これまでKSHV PAN RNAおよび要素について実証されたとおり185、改善されたPEgRNA発現および安定性へ繋がり得ることも仮定される。PEgRNAを環状イントロンRNA(ciRNA)の形態に環化することはまた、増強されたRNAの発現および安定性、ならびに核局在化へも繋がり得ることもまた、予想される194 Previously, Rinn and colleagues screened various expression platforms for the production of sgRNAs tagged with long non-coding RNAs (lncRNAs). These platforms include RNAs expressed from pCMV and terminating in the ENE element 184 from human MALAT1 ncRNA, the PAN ENE element 185 from KSHV, or the 3' box 186 from U1 snRNA. Remarkably, MALAT1 ncRNA and PAN ENE form a triple helix that protects the polyA tail. It is anticipated that these constructs, in addition to allowing expression of RNA, may also enhance RNA stability (see section iv). We also explored that using the promoter from U1 snRNA allows expression of these longer sgRNAs. It is anticipated that these expression systems will also allow expression of longer PEgRNAs. In addition, a series of methods have been designed for cleavage of the portion of the pol II promoter that would be transcribed as part of the PEgRNA, using self-cleaving ribozymes (Hammerhead 188 , Pistol 189 , Hatchet 189 , Hairpin 190 , VS 191 , Twister 192 , or Twister Sister 192 ribozymes) or other self-cleaving elements that process the transcribed guide, or a hairpin 193 that is recognized by Csy4 and also leads to guide processing. has been done. It is also hypothesized that the incorporation of multiple ENE motifs may lead to improved PEgRNA expression and stability, as previously demonstrated for KSHV PAN RNA and elements. It is also anticipated that circularizing PEgRNA into the form of circular intronic RNA (ciRNA) may also lead to enhanced RNA expression and stability, as well as nuclear localization 194 .

pCMV、Csy4ヘアピン、PEgRNA、およびMALAT1 ENEからなるPEgRNA発現プラットホーム
TAGTTATTAATAGTAATCAATTACGGGGTCATTAGTTCATAGCCCATATATGGAGTTCCGCGTTACATAACTTACGGTAAATGGCCCGCCTGGCTGACCGCCCAACGACCCCCGCCCATTGACGTCAATAATGACGTATGTTCCCATAGTAACGCCAATAGGGACTTTCCATTGACGTCAATGGGTGGAGTATTTACGGTAAACTGCCCACTTGGCAGTACATCAAGTGTATCATATGCCAAGTACGCCCCCTATTGACGTCAATGACGGTAAATGGCCCGCCTGGCATTATGCCCAGTACATGACCTTATGGGACTTTCCTACTTGGCAGTACATCTACGTATTAGTCATCGCTATTACCATGGTGATGCGGTTTTGGCAGTACATCAATGGGCGTGGATAGCGGTTTGACTCACGGGGATTTCCAAGTCTCCACCCCATTGACGTCAATGGGAGTTTGTTTTGGCACCAAAATCAACGGGACTTTCCAAAATGTCGTAACAACTCCGCCCCATTGACGCAAATGGGCGGTAGGCGTGTACGGTGGGAGGTCTATATAAGCAGAGCTGGTTTAGTGAACCGTCAGATCGTTCACTGCCGTATAGGCAGGGCCCAGACTGAGCACGTGAGTTTTAGAGCTAGAAATAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGGACCGAGTCGGTCCTCTGCCATCAAAGCGTGCTCAGTCTGTTTTAGGGTCATGAAGGTTTTTCTTTTCCTGAGAAAACAACACGTATTGTTTTCTCAGGTTTTGCTTTTTGGCCTTTTTCTAGCTTAAAAAAAAAAAAAGCAAAAGATGCTGGTGGTTGGCACTCCTGGTTTCCAGGACGGGGTTCAAATCCCTGCGGCGTCTTTGCTTTGACT(配列番号757)
PEgRNA expression platform consisting of pCMV, Csy4 hairpin, PEgRNA, and MALAT1 ENE
(Sequence number 757)

pCMV、Csy4ヘアピン、PEgRNA、およびPAN ENEからなるPEgRNA発現プラットホーム
TAGTTATTAATAGTAATCAATTACGGGGTCATTAGTTCATAGCCCATATATGGAGTTCCGCGTTACATAACTTACGGTAAATGGCCCGCCTGGCTGACCGCCCAACGACCCCCGCCCATTGACGTCAATAATGACGTATGTTCCCATAGTAACGCCAATAGGGACTTTCCATTGACGTCAATGGGTGGAGTATTTACGGTAAACTGCCCACTTGGCAGTACATCAAGTGTATCATATGCCAAGTACGCCCCCTATTGACGTCAATGACGGTAAATGGCCCGCCTGGCATTATGCCCAGTACATGACCTTATGGGACTTTCCTACTTGGCAGTACATCTACGTATTAGTCATCGCTATTACCATGGTGATGCGGTTTTGGCAGTACATCAATGGGCGTGGATAGCGGTTTGACTCACGGGGATTTCCAAGTCTCCACCCCATTGACGTCAATGGGAGTTTGTTTTGGCACCAAAATCAACGGGACTTTCCAAAATGTCGTAACAACTCCGCCCCATTGACGCAAATGGGCGGTAGGCGTGTACGGTGGGAGGTCTATATAAGCAGAGCTGGTTTAGTGAACCGTCAGATCGTTCACTGCCGTATAGGCAGGGCCCAGACTGAGCACGTGAGTTTTAGAGCTAGAAATAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGGACCGAGTCGGTCCTCTGCCATCAAAGCGTGCTCAGTCTGTTTTGTTTTGGCTGGGTTTTTCCTTGTTCGCACCGGACACCTCCAGTGACCAGACGGCAAGGTTTTTATCCCAGTGTATATTGGAAAAACATGTTATACTTTTGACAATTTAACGTGCCTAGAGCTCAAATTAAACTAATACCATAACGTAATGCAACTTACAACATAAATAAAGGTCAATGTTTAATCCATAAAAAAAAAAAAAAAAAAA(配列番号758)
PEgRNA expression platform consisting of pCMV, Csy4 hairpin, PEgRNA, and PAN ENE
(Sequence number 758)

pCMV、Csy4ヘアピン、PEgRNA、および3×PAN ENEからなるPEgRNA発現プラットホーム
TAGTTATTAATAGTAATCAATTACGGGGTCATTAGTTCATAGCCCATATATGGAGTTCCGCGTTACATAACTTACGGTAAATGGCCCGCCTGGCTGACCGCCCAACGACCCCCGCCCATTGACGTCAATAATGACGTATGTTCCCATAGTAACGCCAATAGGGACTTTCCATTGACGTCAATGGGTGGAGTATTTACGGTAAACTGCCCACTTGGCAGTACATCAAGTGTATCATATGCCAAGTACGCCCCCTATTGACGTCAATGACGGTAAATGGCCCGCCTGGCATTATGCCCAGTACATGACCTTATGGGACTTTCCTACTTGGCAGTACATCTACGTATTAGTCATCGCTATTACCATGGTGATGCGGTTTTGGCAGTACATCAATGGGCGTGGATAGCGGTTTGACTCACGGGGATTTCCAAGTCTCCACCCCATTGACGTCAATGGGAGTTTGTTTTGGCACCAAAATCAACGGGACTTTCCAAAATGTCGTAACAACTCCGCCCCATTGACGCAAATGGGCGGTAGGCGTGTACGGTGGGAGGTCTATATAAGCAGAGCTGGTTTAGTGAACCGTCAGATCGTTCACTGCCGTATAGGCAGGGCCCAGACTGAGCACGTGAGTTTTAGAGCTAGAAATAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGGACCGAGTCGGTCCTCTGCCATCAAAGCGTGCTCAGTCTGTTTTGTTTTGGCTGGGTTTTTCCTTGTTCGCACCGGACACCTCCAGTGACCAGACGGCAAGGTTTTTATCCCAGTGTATATTGGAAAAACATGTTATACTTTTGACAATTTAACGTGCCTAGAGCTCAAATTAAACTAATACCATAACGTAATGCAACTTACAACATAAATAAAGGTCAATGTTTAATCCATAAAAAAAAAAAAAAAAAAAACACACTGTTTTGGCTGGGTTTTTCCTTGTTCGCACCGGACACCTCCAGTGACCAGACGGCAAGGTTTTTATCCCAGTGTATATTGGAAAAACATGTTATACTTTTGACAATTTAACGTGCCTAGAGCTCAAATTAAACTAATACCATAACGTAATGCAACTTACAACATAAATAAAGGTCAATGTTTAATCCATAAAAAAAAAAAAAAAAAAATCTCTCTGTTTTGGCTGGGTTTTTCCTTGTTCGCACCGGACACCTCCAGTGACCAGACGGCAAGGTTTTTATCCCAGTGTATATTGGAAAAACATGTTATACTTTTGACAATTTAACGTGCCTAGAGCTCAAATTAAACTAATACCATAACGTAATGCAACTTACAACATAAATAAAGGTCAATGTTTAATCCATAAAAAAAAAAAAAAAAAAA(配列番号759)
PEgRNA expression platform consisting of pCMV, Csy4 hairpin, PEgRNA, and 3×PAN ENE
(Sequence number 759)

pCMV、Csy4ヘアピン、PEgRNA、および3'ボックスからなるPEgRNA発現プラットホーム
TAGTTATTAATAGTAATCAATTACGGGGTCATTAGTTCATAGCCCATATATGGAGTTCCGCGTTACATAACTTACGGTAAATGGCCCGCCTGGCTGACCGCCCAACGACCCCCGCCCATTGACGTCAATAATGACGTATGTTCCCATAGTAACGCCAATAGGGACTTTCCATTGACGTCAATGGGTGGAGTATTTACGGTAAACTGCCCACTTGGCAGTACATCAAGTGTATCATATGCCAAGTACGCCCCCTATTGACGTCAATGACGGTAAATGGCCCGCCTGGCATTATGCCCAGTACATGACCTTATGGGACTTTCCTACTTGGCAGTACATCTACGTATTAGTCATCGCTATTACCATGGTGATGCGGTTTTGGCAGTACATCAATGGGCGTGGATAGCGGTTTGACTCACGGGGATTTCCAAGTCTCCACCCCATTGACGTCAATGGGAGTTTGTTTTGGCACCAAAATCAACGGGACTTTCCAAAATGTCGTAACAACTCCGCCCCATTGACGCAAATGGGCGGTAGGCGTGTACGGTGGGAGGTCTATATAAGCAGAGCTGGTTTAGTGAACCGTCAGATCGTTCACTGCCGTATAGGCAGGGCCCAGACTGAGCACGTGAGTTTTAGAGCTAGAAATAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGGACCGAGTCGGTCCTCTGCCATCAAAGCGTGCTCAGTCTGTTTGTTTCAAAAGTAGACTGTACGCTAAGGGTCATATCTTTTTTTGTTTGGTTTGTGTCTTGGTTGGCGTCTTAAA(配列番号760)
PEgRNA expression platform consisting of pCMV, Csy4 hairpin, PEgRNA, and 3' box
(Sequence number 760)

pU1、Csy4ヘアピン、PEgRNA、および3'ボックスからなるPEgRNA発現プラットホーム
CTAAGGACCAGCTTCTTTGGGAGAGAACAGACGCAGGGGCGGGAGGGAAAAAGGGAGAGGCAGACGTCACTTCCCCTTGGCGGCTCTGGCAGCAGATTGGTCGGTTGAGTGGCAGAAAGGCAGACGGGGACTGGGCAAGGCACTGTCGGTGACATCACGGACAGGGCGACTTCTATGTAGATGAGGCAGCGCAGAGGCTGCTGCTTCGCCACTTGCTGCTTCACCACGAAGGAGTTCCCGTGCCCTGGGAGCGGGTTCAGGACCGCTGATCGGAAGTGAGAATCCCAGCTGTGTGTCAGGGCTGGAAAGGGCTCGGGAGTGCGCGGGGCAAGTGACCGTGTGTGTAAAGAGTGAGGCGTATGAGGCTGTGTCGGGGCAGAGGCCCAAGATCTCAGTTCACTGCCGTATAGGCAGGGCCCAGACTGAGCACGTGAGTTTTAGAGCTAGAAATAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGGACCGAGTCGGTCCTCTGCCATCAAAGCGTGCTCAGTCTGTTTCAGCAAGTTCAGAGAAATCTGAACTTGCTGGATTTTTGGAGCAGGGAGATGGAATAGGAGCTTGCTCCGTCCACTCCACGCATCGACCTGGTATTGCAGTACCTCCAGGAACGGTGCACCCACTTTCTGGAGTTTCAAAAGTAGACTGTACGCTAAGGGTCATATCTTTTTTTGTTTGGTTTGTGTCTTGGTTGGCGTCTTAAA(配列番号761)
PEgRNA expression platform consisting of pU1, Csy4 hairpin, PEgRNA, and 3' box
(Sequence number 761)

(2)コアの改善。 (2) Core improvements.

コア、Cas9結合PEgRNA骨格はおそらく、PE活性を増強するのにも改善され得る。数種のかかるアプローチは既に実証されている。実例として、骨格の第1の対形成要素(P1)は、GTTTT-AAAAC(配列番号3939)対形成要素を含有する。かかるT(複数)の伸びは、RNA転写産物のpol III休止(pausing)および未成熟終止をもたらすことが示されている。このP1の部分におけるT-A対の1つの、G-C対への合理的な突然変異は、sgRNA活性を増強するのが示されたが、このアプローチもまたPEgRNAに対して実現可能であろうことを示唆する195。加えて、P1の長さを増大することはまた、sgRNAの折り畳みを増強して改善された活性へ繋がることも示されたが195、これはPEgRNA活性の改善のための別の道として示唆される。最終的に、所定DNA標的上のPEgRNAの指向進化を通じたPEgRNA骨格の洗練化がまた、改善された活性ももたらす可能性がある。これはセクション(v)に記載される。 The core, Cas9-bound PEgRNA backbone could probably also be improved to enhance PE activity. Several such approaches have already been demonstrated. Illustratively, the first pairing element (P1) of the scaffold contains a GTTTT-AAAAC (SEQ ID NO: 3939) pairing element. Such T(s) elongation has been shown to result in pol III pausing and premature termination of RNA transcripts. Rational mutation of one of the TA pairs in this P1 region to a GC pair was shown to enhance sgRNA activity, suggesting that this approach may also be feasible for PEgRNA. 195 . In addition, increasing the length of P1 was also shown to enhance sgRNA folding leading to improved activity, 195 which has been suggested as another avenue for improving PEgRNA activity. Ru. Ultimately, refinement of the PEgRNA backbone through directed evolution of PEgRNA on a given DNA target may also result in improved activity. This is described in section (v).

P1まで6ntの伸長を含有するPEgRNA
GGCCCAGACTGAGCACGTGAGTTTTAGAGCTAGCTCATGAAAATGAGCTAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGGACCGAGTCGGTCCTCTGCCATCAAAGCGTGCTCAGTCTGTTTTTTT(配列番号228)
PEgRNA containing a 6nt extension to P1
GGCCCAGACTGAGCACGTGAGTTTTAGAGCTAGCTCATGAAAATGAGCTAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGGACCGAGTCGGTCCTCTGCCATCAAAGCGTGCTCAGTCTGTTTTTTT (SEQ ID NO: 228)

P1内にT-A→G-C突然変異を含有するPEgRNA
GGCCCAGACTGAGCACGTGAGTTTGAGAGCTAGAAATAGCAAGTTTAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGGACCGAGTCGGTCCTCTGCCATCAAAGCGTGCTCAGTCTGTTTTTTT(配列番号229)
PEgRNA containing a TA→GC mutation in P1
GGCCCAGACTGAGCACGTGAGTTTGAGAGCTAGAAATAGCAAGTTTAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGGACCGAGTCGGTCCTCTGCCATCAAAGCGTGCTCAGTCTGTTTTTTT (SEQ ID NO: 229)

(iii)PEgRNAの鋳型領域への修飾を介したRT処理能力の改善 (iii) Improvement of RT processing ability through modification of PEgRNA template region

PEgRNAによって鋳型にされた(templated)挿入のサイズが増大するにつれて、エンドヌクレアーゼによって分解されるか、自発的加水分解を経るか、または折り畳まれることで2次構造(RTによって逆転写され得ないか、もしくはPEgRNA骨格の折り畳みおよびこれに続くCas9-RT結合を妨害する)になるか、になる可能性が高い。結果的に、PEgRNAの鋳型への修飾が、遺伝子全体の挿入などの大きな挿入に影響を及ぼす必要もあり得る。そうするためのいくつかのストラテジーは、合成または半合成PEgRNA内の修飾ヌクレオチドの組み込み(RNAを、分解もしくは加水分解に対してより耐性があるようにさせるか、または阻害性の2次構造を採用する可能性を低くさせる)を包含する196。かかる修飾は、Gリッチ配列中のRNA2次構造を低減するであろう、8-アザ-7-デアザグアノシン;分解を低減してある種のRNA2次構造を増強する、ロックド核酸(LNA);RNA安定性を増強する、2'-O-メチル修飾、2'-フルオロ修飾、または2'-O-メトキシエトキシ修飾を包含し得る。かかる修飾はまた、安定性および活性を増強するために、PEgRNA中の他のどこかにも包含され得る。代わりに、または加えて、PEgRNAの鋳型は、所望のタンパク質産物をコードするのとともに、RTによって折り畳まれ得ない単純な2次構造を採用する可能性もまた高くなるように、デザインされ得る。かかる単純な構造は、熱力学的な流し台(sink)として作用するであろうが、これによって逆転写を防止するであろうより複雑な構造が生じる可能性が低くなる。最終的に、鋳型を分裂させて2つ別々のPEgRNAにすることもまたあり得ることである。かかるデザインにおいて、PEは、Cas9と融合したRNA結合タンパク質またはPEgRNA自身上のRNA認識要素(MS2アプタマーなど)を介して、転写を開始すること、また別々の鋳型RNAを標的にされた部位へ動員することにも使用されるであろう。RTは、この別々の鋳型RNAへ直接結合するか、または第2鋳型と入れ替える前に元のPEgRNA上で逆転写を開始するか、のいずれかであり得る。かかるアプローチは、長い鋳型を付加した際にPEgRNAの誤った折り畳みを予防することのみならず、長い挿入を生じさせるのにゲノムからのCas9の解離(おそらくPEベースの長い挿入を阻害している可能性がある)を要さないことによってもまた、長い挿入を可能にさせ得る。 As the size of the PEgRNA-templated insert increases, it is degraded by endonucleases, undergoes spontaneous hydrolysis, or folds into secondary structures (which cannot be reverse transcribed by RT). , or interfere with PEgRNA backbone folding and subsequent Cas9-RT binding). Consequently, modifications to the PEgRNA template may also be necessary to affect large insertions, such as whole gene insertions. Some strategies to do so include the incorporation of modified nucleotides within synthetic or semi-synthetic PEgRNAs (making the RNA more resistant to degradation or hydrolysis or adopting inhibitory secondary structures). 196 . Such modifications will reduce RNA secondary structure in G-rich sequences, 8-aza-7-deazaguanosine; locked nucleic acids (LNA), which reduce degradation and enhance certain RNA secondary structures; 2'-O-methyl, 2'-fluoro, or 2'-O-methoxyethoxy modifications may be included that enhance RNA stability. Such modifications may also be included elsewhere in the PEgRNA to enhance stability and activity. Alternatively, or in addition, PEgRNA templates can be designed such that while encoding the desired protein product, they are also more likely to adopt simple secondary structures that cannot be folded by RT. Such a simple structure would act as a thermodynamic sink, but this reduces the likelihood of more complex structures that would prevent reverse transcription. Ultimately, it is also possible to split the template into two separate PEgRNAs. In such designs, PE can initiate transcription and recruit separate template RNAs to targeted sites via RNA binding proteins fused to Cas9 or RNA recognition elements on PEgRNA itself (such as the MS2 aptamer). It may also be used to The RT can either bind directly to this separate template RNA or initiate reverse transcription on the original PEgRNA before replacing it with the second template. Such an approach not only prevents PEgRNA misfolding upon addition of long templates, but also prevents dissociation of Cas9 from the genome (possibly inhibiting PE-based long inserts) to generate long inserts. This may also allow long insertions.

(iv)追加のRNAモチーフの5'末端または3'末端での組み入れ (iv) Incorporation of additional RNA motifs at the 5' or 3' end

PEgRNAデザインはまた、追加のモチーフの、RNAの末端のいずれかの末での組み入れを介しても改善され得る。数種のかかるモチーフ-KSHVからのPAN ENEおよびMALAT1からのENEなどを、非pol IIIプロモーターからのより長いPEgRNAの発現を終止させ得る手段として、前にパート(i)において考察した184,185。これらの要素は、ポリAテールを飲み込むRNA三重ヘリックスを形成し、それらの核内への保持をもたらす184,187。しかしながら、末端ヌクレオチドを塞ぐ複合体構造をPEgRNAの3'末端にて形成することによって、これらの構造はまた、PEgRNAのエキソヌクレアーゼ媒介分解を予防するのにも役立つ可能性があろう。3'末端にて挿入された他の構造要素もまた、非pol IIIプロモーターからの終止を可能にさせることはせずとも、RNA安定性を増強し得る。かかるモチーフは、3'末端を塞ぐであろうヘアピンもしくはRNA四重鎖197、または3'末端にて2'-3'-環状ホスファートの形成をもたらし、また潜在的にPEgRNAをエキソヌクレアーゼによって分解される可能性を低くもさせるHDVなどの自己切断型リボザイム198を包含し得る。不完全なスプライシングを介してPEgRNAを環化するのに誘導する-ciRNAを形成する-ことはまた、PEgRNA安定性を増大させてPEgRNAが核内に保持されることももたらし得る194 PEgRNA design can also be improved through the incorporation of additional motifs at either end of the RNA. Several such motifs - such as PAN ENE from KSHV and ENE from MALAT1, were previously discussed in part (i) as means by which expression of longer PEgRNAs from non-pol III promoters could be terminated. These elements form an RNA triple helix that engulfs the polyA tails, resulting in their retention within the nucleus . However, by forming complex structures at the 3' end of PEgRNA that occlude the terminal nucleotides, these structures may also help prevent exonuclease-mediated degradation of PEgRNA. Other structural elements inserted at the 3' end may also enhance RNA stability without allowing termination from non-pol III promoters. Such motifs result in the formation of a hairpin or RNA quadruplex 197 that would occlude the 3' end, or a 2'-3'-cyclic phosphate at the 3' end, and also potentially render PEgRNA susceptible to degradation by exonucleases. self-cleaving ribozymes such as HDV, which also reduce the likelihood of Inducing PEgRNA to circularize through defective splicing - forming ciRNA - can also increase PEgRNA stability and result in PEgRNA retention in the nucleus 194 .

追加のRNAモチーフはまた、RT処理能力をも改善し得るか、またはDNA-RNA二重鎖へのRTの結合を増強することによってPEgRNA活性をも増強し得る。RTによって結合されるネイティブ配列の、その同族のレトロウイルスゲノム中での付加は、RT活性を増強し得る199。これは、レトロウイルスゲノム二量体化および転写開始に関与する、ネイティブプライマー結合部位(PBS)、ポリプリントラクト(PPT)、またはキッシングループを包含し得る199。二量体化チーフ-キッシングループまたはGNRAテトラループ/テトラループ受容体対200など-の、PEgRNAの5'末端および3'末端での付加はまた、PEgRNAの有効な環状化をももたらし得、安定性が改善される。加えて、これらモチーフの付加は、PEgRNAスペーサーとプライマーとの物理的な分離、PE活性の妨げになるであろうスペーサー閉塞への予防を可能にさせ得ることが想像される。スペーサー領域中に小さいトウホールド(toehold)ヘアピンを形成する、PEgRNAへの短い5'伸長はまた、好ましくは、PEgRNA結合スペーサーのアニーリング領域に対しても競合し得る。最終的に、キッシングループはまた、他の鋳型RNAをゲノム部位へ動員するのにも、あるRNAから他のセクションiii)のRT活性の入れ替えを可能にさせるのにも、使用され得る。 Additional RNA motifs may also improve RT processivity or enhance PEgRNA activity by enhancing RT binding to the DNA-RNA duplex. The addition of native sequences bound by RT in its cognate retroviral genome can enhance RT activity.199 This may include native primer binding sites (PBS), polypurine tracts (PPT), or kissing loops, which are involved in retroviral genome dimerization and transcription initiation.199 The addition of dimerization chiefs such as kissing loops or GNRA tetraloop/tetraloop receptor pairs —at the 5′ and 3′ ends of the PEgRNA may also result in efficient circularization of the PEgRNA, improving stability. In addition, it is envisioned that the addition of these motifs may allow for physical separation of the PEgRNA spacer and primer, preventing spacer occlusion that would otherwise hinder PE activity. A short 5' extension to the PEgRNA, forming a small toehold hairpin in the spacer region, may also preferably compete for the annealing region of the PEgRNA-binding spacer. Finally, kissing loops may also be used to recruit other template RNAs to genomic sites and allow for the swapping of RT activity from one RNA to the other, section iii).

PEgRNA-HDV融合体
GGCCCAGACTGAGCACGTGAGTTTTAGAGCTAGAAATAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGGACCGAGTCGGTCCTCTGCCATCAAAGCGTGCTCAGTCTGGGCCGGCATGGTCCCAGCCTCCTCGCTGGCGCCGGCTGGGCAACATGCTTCGGCATGGCGAATGGGACTTTTTTT(配列番号230)
PEgRNA-HDV fusion
GGCCCAGACTGAGCACGTGAGTTTTAGAGCTAGAAATAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGGACCGAGTCGGTCCTCTGCCATCAAAGCGTGCTCAGTCTGGGCCGGCATGGTCCCAGCCTCCTCGCTGGCGCCGGCTGGGCAACATGCTTCGGCATGGCGAATGGGACTTTTTTT (SEQ ID NO: 230)

PEgRNA-MMLVキッシングループ
GGTGGGAGACGTCCCACCGGCCCAGACTGAGCACGTGAGTTTTAGAGCTAGAAATAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGGACCGAGTCGGTCCTCTGCCATCAAAGCTTCGACCGTGCTCAGTCTGGTGGGAGACGTCCCACCTTTTTTT(配列番号231)
PEgRNA-MMLV kissing loop
GGTGGGAGACGTCCCACCGGCCCAGACTGAGCACGTGAGTTTTAGAGCTAGAAATAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGGACCGAGTCGGTCCTCTGCCATCAAAGCTTCGACCGTGCTCAGTCTGGTGGGAGACGTCCCACCTTTTTTTT (SEQ ID NO: 231)

PEgRNA-VSリボザイムキッシングループ
GAGCAGCATGGCGTCGCTGCTCACGGCCCAGACTGAGCACGTGAGTTTTAGAGCTAGAAATAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGGACCGAGTCGGTCCTCTGCCATCAAAGCTTCGACCGTGCTCAGTCTCCATCAGTTGACACCCTGAGGTTTTTTT(配列番号232)
PEgRNA-VS ribozyme kissing loop
GAGCAGCATGGCGTCGCTGCTCACGGCCCAGACTGAGCACGTGAGTTTTAGAGCTAGAAATAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGGACCGAGTCGGTCCTCTGCCATCAAAGCTTCGACCGTGCTCAGTCTCCATCAGTTGACACCCTGAGGTTTTTTT (SEQ ID NO: 232)

PEgRNA-GNRAテトラループ/テトラループ受容体
GCAGACCTAAGTGGUGACATATGGTCTGGGCCCAGACTGAGCACGTGAGTTTTAGAGCTAUACGTAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTUACGAAGTGGGACCGAGTCGGTCCTCTGCCATCAAAGCTTCGACCGTGCTCAGTCTGCATGCGATTAGAAATAATCGCATGTTTTTTT(配列番号233)
PEgRNA-GNRA tetraloop/tetraloop receptor
GCAGACCTAAGTGGUGACATATGGTCTGGGCCCAGACTGAGCACGTGAGTTTTAGAGCTAUACGTAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTUACGAAGTGGGACCGAGTCGGTCCTCTGCCATCAAAGCTTCGACCGTGCTCAGTCTGCATGCGATTAGAAATAATCGCATGTTTTTTT (SEQ ID NO: 233)

2次RNA-HDV融合体を切り替えるPEgRNA鋳型
TCTGCCATCAAAGCTGCGACCGTGCTCAGTCTGGTGGGAGACGTCCCACCGGCCGGCATGGTCCCAGCCTCCTCGCTGGCGCCGGCTGGGCAACATGCTTCGGCATGGCGAATGGGACTTTTTTT(配列番号234)
PEgRNA templates to switch secondary RNA-HDV fusions
TCTGCCATCAAAGCTGCGACCGTGCTCAGTCTGGTGGGAGACGTCCCACCGGCCGGCATGGTCCCAGCCTCCTCGCTGGCGCCGGCTGGGCAACATGCTTCGGCATGGCGAATGGGACTTTTTTT (SEQ ID NO: 234)

(v)PEgRNAの進化 (v) Evolution of PEgRNA

PEgRNA骨格は、SpCas9および塩基編集因子の改善のされ方に類似した様式で、指向進化を介してさらに改善され得る。指向進化は、Cas9または進化したCas9バリアントによるPEgRNA認識を増強し得る。加えて、種々のPEgRNA骨格配列はおそらく、種々のゲノム遺伝子座にて最適であって、問題になっている部位にてPE活性を増強するか、オフターゲット活性を低減するか、またはその両方のいずれかであろう。最終的に、他のRNAモチーフが付加されたPEgRNA骨格の進化は、未進化の融合RNAと比べて、融合されたPEgRNAの活性をほぼ必ず改善するであろう。実例として、c-ジ-GMP-Iアプタマーおよびハンマーヘッド型リボザイムから構成されるアロステリックリボザイムの進化は、劇的に改善された活性へ繋がったが202、これは進化がハンマーヘッド-PEgRNA融合体の活性も改善するであろうことを示唆する。加えて、目下Cas9は一般にsgRNAの5'伸長の耐性がないものの、指向進化は、この不耐性を和らげることを可能にする突然変異を生成し、追加のRNAモチーフが利用され得るようになる可能性があろう。 PEgRNA scaffolds can be further improved through directed evolution in a manner similar to how SpCas9 and base editors have been improved. Directed evolution can enhance PEgRNA recognition by Cas9 or evolved Cas9 variants. In addition, different PEgRNA backbone sequences are likely optimal at different genomic loci to enhance PE activity at the site in question, reduce off-target activity, or both. Probably either. Ultimately, evolution of the PEgRNA backbone with the addition of other RNA motifs will almost always improve the activity of the fused PEgRNA compared to the unevolved fusion RNA. As an illustration, the evolution of allosteric ribozymes composed of c-di-GMP-I aptamers and hammerhead ribozymes has led to dramatically improved activity202, but this is because evolution of hammerhead-PEgRNA fusions has led to dramatically improved activity. suggesting that activity would also be improved. Additionally, although currently Cas9 is generally intolerant of sgRNA 5' extensions, directed evolution may generate mutations that allow this intolerance to be alleviated, and additional RNA motifs may become available. There must be a sex.

本明細書に記載のとおり、数多のこれらアプローチは既に、Cas9:sgRNA複合体との使用のために記載されているが、PEgRNA活性を改善するためのデザインは報告されていない。プログラム可能な突然変異をゲノム中へ組み入れるための他のストラテジーも、塩基編集、相同組み換え修復(HDR)、正確なマイクロ相同媒介末端結合(MMEJ)、またはトランスポサーゼ媒介編集を包含する。しかしながら、これらアプローチのすべてが、PEと比較すると著しい難点を有する。最新の塩基編集因子は、現行のPEより効率的ではあるが、あるクラスのゲノム突然変異しか組み入れられず、着目部位にて、望ましくない追加のヌクレオチド変換をもたらし得る。HDRは、極少数の細胞型にしか実現可能でなく、比較的高比率のランダムな挿入および欠失の突然変異(インデル)をもたらす。正確なMMEJは、二本鎖破壊の予測可能な修復へ繋がり得るが、欠失の組み入れに大きく限定されており、極めて部位依存性であって、また比較的高比率の望ましくないインデルも有し得る。トランスポサーゼ媒介編集は、今日まで、細菌において機能することしか示されていない。してみると、PEへの改善点は、ゲノム突然変異の広範な見本の治療的修正へのおそらく最良の道を表す。 As described herein, a number of these approaches have already been described for use with Cas9:sgRNA complexes, but no designs have been reported to improve PEgRNA activity. Other strategies for incorporating programmable mutations into the genome also include base editing, homologous recombination repair (HDR), precise microhomology-mediated end joining (MMEJ), or transposase-mediated editing. However, all of these approaches have significant drawbacks when compared to PE. Although modern base editors are more efficient than current PEs, they can only incorporate certain classes of genomic mutations and may result in additional unwanted nucleotide changes at the site of interest. HDR is only feasible for a small number of cell types and results in a relatively high rate of random insertion and deletion mutations (indels). Precise MMEJ can lead to predictable repair of double-strand breaks, but is largely limited to incorporation of deletions, is highly site-dependent, and also has a relatively high proportion of undesired indels. obtain. Transposase-mediated editing has to date only been shown to function in bacteria. As such, improvements to PE represent perhaps the best path to therapeutic correction of a broad sample of genomic mutations.

References cited in例15において引用された参考文献
以下の参考文献の各々は例15において引用されており、これらの各々は参照により本明細書に組み込まれる。
1. Schechner,DM,Hacisuleyman E.,Younger ST,Rinn JL.Nat Methods 664-70(2015).
2. Brown JA,et al.Nat Struct Mol Biol 633-40(2014).
3. Conrad NA and Steitz JA.EMBO J 1831-41(2005).
4. Bartlett JS,et al.Proc Natl Acad Sci USA 8852-7(1996).
5. Mitton-Fry RM,DeGregorio SJ,Wang J,Steitz TA,Steitz JA.Science 1244-7(2010).
6. Forster AC,Symons RH.Cell.1987.
7. Weinberg Z,Kim PB,Chen TH,Li S,Harris KA,Lunse CE,Breaker RR.Nat.Chem.Biol.2015.
8. Feldstein PA,Buzayan JM,Bruening G.Gene 1989.
9. Saville BJ,Collins RA.Cell.1990.
10. Roth A,Weinberg Z,Chen AG,Kim PG,Ames TD,Breaker RR.Nat Chem Biol.2013.
11. Borchardt EK,et al.RNA 1921-30(2015).
12. Zhang Y,et al.Mol Cell 792-806(2013).
13. Dang Y,et al.Genome Biol 280(2015).
14. Schaefer M,Kapoor U,and Jantsch MF.Open Biol 170077(2017).
15. Nahar S,et al.Chem Comm 2377-80(2018).
References cited in Example 15 Each of the following references is cited in Example 15, each of which is incorporated herein by reference.
1. Schechner, DM, Hacisuleyman E., Younger ST, Rinn JL. Nat Methods 664-70 (2015).
2. Brown JA, et al.Nat Struct Mol Biol 633-40(2014).
3. Conrad NA and Steitz JA.EMBO J 1831-41(2005).
4. Bartlett JS, et al.Proc Natl Acad Sci USA 8852-7(1996).
5. Mitton-Fry RM, DeGregorio SJ, Wang J, Steitz TA, Steitz JA. Science 1244-7(2010).
6. Forster AC,Symons RH.Cell.1987.
7. Weinberg Z,Kim PB,Chen TH,Li S,Harris KA,Lunse CE,Breaker RR.Nat.Chem.Biol.2015.
8. Feldstein PA, Buzayan JM, Bruening G. Gene 1989.
9. Saville BJ,Collins RA.Cell.1990.
10. Roth A, Weinberg Z, Chen AG, Kim PG, Ames TD, Breaker RR. Nat Chem Biol.2013.
11. Borchardt EK, et al.RNA 1921-30(2015).
12. Zhang Y, et al.Mol Cell 792-806(2013).
13. Dang Y, et al. Genome Biol 280(2015).
14. Schaefer M,Kapoor U,and Jantsch MF.Open Biol 170077(2017).
15. Nahar S, et al.Chem Comm 2377-80(2018).

例16-SPCAS9以外のDNA結合タンパク質を用いてPEの標的化範囲を拡張する
SpCas9が効率的に結合し得る好適に置かれたNGGプロトスペーサー隣接モチーフ(PAM)があるゲノム座位において、Streptococcus pyogenes Cas9(SpCas9)を用いるプライム編集(PE)は全ての1塩基置換、挿入、欠失、およびそれらの組み合わせを効率的に組み入れ組み入れ得る。本明細書に記載の方法は、効率的なPEにとってアクセス可能なPAM、よってアクセス可能な標的化可能なゲノム座位を拡張することによって、PEの標的化能力を幅広くする。SpCas9以外のRNAによってガイドされるDNA結合タンパク質を用いるプライム編集因子は、異なるPAMへのアクセスを許すことによってゲノム座位の拡張された標的化可能な範囲を可能化する。加えて、SpCas9よりも小さいRNAによってガイドされるDNA結合タンパク質の使用は、より効率的なウイルス送達をもまた許す。SpCas9以外のCasタンパク質または他のRNAによってガイドされるDNA結合タンパク質によるPEは、SpCas9に基づくPEを用いてはアクセス不可能または非効率的どちらかであった高効率の治療学的編集を許すであろう。
Example 16 – Extending the targeting scope of PE using DNA binding proteins other than SPCAS9
Prime editing (PE) using Streptococcus pyogenes Cas9 (SpCas9) removes all single base substitutions, insertions, and deletions at genomic loci with well-placed NGG protospacer-adjacent motifs (PAMs) to which SpCas9 can bind efficiently. errors, and combinations thereof can be efficiently incorporated and incorporated. The methods described herein broaden the targeting capabilities of PE by expanding the PAMs and thus the targetable genomic loci accessible to efficient PE. Prime editing factors using DNA-binding proteins guided by RNAs other than SpCas9 enable an expanded targetable range of genomic loci by allowing access to different PAMs. In addition, the use of smaller RNA-guided DNA binding proteins than SpCas9 also allows more efficient virus delivery. PE with DNA-binding proteins guided by Cas proteins other than SpCas9 or other RNAs may not allow highly efficient therapeutic editing that was either inaccessible or inefficient using SpCas9-based PEs. Probably.

これは、NGG PAMに対して相対的な編集の非理想的な間隔を原因として、SpCas9に基づくPEが非効率的であるか、またはSpCas9に基づく構築物の総体的なサイズが細胞発現および/または送達にとって法外であるかどちらかの状況に用いられることが予想される。SpCas9の少数のかつ不良に位置付けられたNGG PAMを標的領域の近くに有するハンチンチン遺伝子などの特定の疾患に該当する(relevent)座位は、NGA PAMを認識するSpCas9-VRQRなどのPEシステムの異なるCasタンパク質を用いて容易に標的化され得る。より効率的にAAVベクターにパッケージングされ得るより小さいPE構築物を生成するために、より小さいCasタンパク質が用いられ、標的組織へのより良好な送達を可能化するであろう。図61は、RNAによってガイドされるDNA結合タンパク質としてStaphylococcus aureus CRISPR-Casを用いるプライム編集の実施化を示す。NTは無処置の対照である。 This may be due to the inefficiency of SpCas9-based PE due to non-ideal spacing of edits relative to the NGG PAM, or the overall size of SpCas9-based constructs may affect cellular expression and/or It is anticipated that it will be used in situations where delivery is either prohibitive. Certain disease-relevent loci, such as the huntingtin gene, which has a small number and poorly positioned NGG PAM of SpCas9 near its target region, are distinct from PE systems such as SpCas9-VRQR, which recognizes the NGA PAM. Can be easily targeted using Cas proteins. Smaller Cas proteins will be used to generate smaller PE constructs that can be more efficiently packaged into AAV vectors, allowing better delivery to target tissues. Figure 61 shows the implementation of prime editing using Staphylococcus aureus CRISPR-Cas as an RNA-guided DNA binding protein. NT is the untreated control.

図62A~62Bは、プライム編集による精密な位置付けにおける所望の編集の効率的な組み入れのためのプロトスペーサーの重要性の実証を提供する。これは、このテクノロジーの新規の特色としての代替的なPAMおよびプロトスペーサーの重要性を強調する。図62Aの「n.d.」は「検出されない」である。 Figures 62A-62B provide demonstration of the importance of protospacers for efficient incorporation of desired edits in precise positioning by prime editing. This highlights the importance of alternative PAM and protospacers as novel features of this technology. "n.d." in FIG. 62A is "not detected."

図63は、プライム編集因子システムのRNAによってガイドされるDNA結合タンパク質としてSpCas9(H840A)-VRQRおよびSpCas9(H840A)-VRERを用いるPEの実施化を示す。SpCas9(H840A)-VRQR napDNAbpは配列番号87として本明細書に開示の。SpCas9(H840A)-VRER napDNAbpは配列番号88として本明細書に開示の。SpCas9(H840A)-VRER-MMLV RT融合タンパク質は配列番号516として本願において開示され、MMLV RTはD200N、L603W、T330P、T306K、およびW313F置換を野生型MMLV RTに対して相対的に含む。SpCas9(H840A)-VRQR-MMLV RT融合タンパク質は配列番号515として本願において開示され、MMLV RTはD200N、L603W、T330P、T306K、およびW313F置換を野生型MMLV RTに対して相対的に含む。ヒトゲノム上の7つの異なる座位が標的化される:4つはSpCas9(H840A)-VRQR-MMLV RTプライム編集因子システムにより、3つはSpCas9(H840A)-VRER-MMLV RTシステムによる。試験された構築物のアミノ酸配列は次のとおりである:

Figure 2020191234000414
Figure 2020191234000415
Figure 2020191234000416
Figure 63 shows the implementation of PE using SpCas9(H840A)-VRQR and SpCas9(H840A)-VRER as RNA-guided DNA binding proteins of the prime editing factor system. SpCas9(H840A)-VRQR napDNAbp is disclosed herein as SEQ ID NO:87. SpCas9(H840A)-VRER napDNAbp is disclosed herein as SEQ ID NO:88. The SpCas9(H840A)-VRER-MMLV RT fusion protein is disclosed herein as SEQ ID NO: 516, and the MMLV RT contains D200N, L603W, T330P, T306K, and W313F substitutions relative to wild-type MMLV RT. The SpCas9(H840A)-VRQR-MMLV RT fusion protein is disclosed herein as SEQ ID NO: 515, and the MMLV RT contains D200N, L603W, T330P, T306K, and W313F substitutions relative to wild-type MMLV RT. Seven different loci on the human genome are targeted: four by the SpCas9(H840A)-VRQR-MMLV RT prime editor system and three by the SpCas9(H840A)-VRER-MMLV RT system. The amino acid sequence of the tested construct is as follows:
Figure 2020191234000414
Figure 2020191234000415
Figure 2020191234000416

図63に示されているとおり、SpCas9(H840A)-VRQR-MMLV RTは「AGAG」および「GGAG」を包含するPAM部位において作動性であり、いくらかの編集活性を「GGAT」および「AGAT」PAM配列において有した。SpCas9(H840A)-VRER-MMLV RTは「AGCG」および「GGCG」を包含するPAM部位において作動性であり、いくらかの編集活性を「TGCG」において有した。 As shown in Figure 63, SpCas9(H840A)-VRQR-MMLV RT is agonistic at PAM sites encompassing "AGAG" and "GGAG" and imparts some editing activity to "GGAT" and "AGAT" PAM sites. had in the array. SpCas9(H840A)-VRER-MMLV RT was agonistic at PAM sites including 'AGCG' and 'GGCG' and had some editing activity at 'TGCG'.

データは、プライム編集が、異なるPAM特異性を持つnapDNAbp、例えば本明細書に記載のCas9バリアントを用いて行われ得るということを実証している。 The data demonstrate that prime editing can be performed using napDNAbp with different PAM specificities, such as the Cas9 variants described herein.

例17-PEによるリコンビナーゼ標的部位の導入
この例は、高い特異性および効率で哺乳類および他のゲノムにリコンビナーゼ標的部位(SSR標的部位)を導入するためにプライム編集(PE)を用いることによって、遺伝子疾患に対処するかまたはテーラーメイド動物もしくは植物モデルを生成するための方法を記載する。
Example 17 - Introduction of Recombinase Target Sites with PE This example shows how to introduce recombinase target sites (SSR target sites) into mammalian and other genomes with high specificity and efficiency by using prime editing (PE). Methods for addressing disease or generating tailored animal or plant models are described.

この例は、ヒトまたは他のゲノム上の高価値の座位にリコンビナーゼ認識配列を導入するためのPEの使用を記載する。これらは、部位特異的リコンビナーゼ(単数または複数)に対する暴露後に、精密なかつ効率的なゲノム改変を導くであろう(図64)。図64に示されている種々の態様では、PEは、(b)DNAドナー鋳型のゲノム取り入れの部位としての使用のための単一のSSR標的を挿入するために用いられ得る。(c)は、どのようにしてSSR標的部位のタンデム挿入がゲノムのある部分を欠失させるために用いられ得るかを示す。(d)は、どのようにしてSSR標的部位のタンデム挿入がゲノムのある部分を逆位させるために用いられ得るかを示す。(e)は、どのようにして2つの遠位の染色体領域における2つのSSR標的部位の挿入が染色体転座をもたらし得るかを示す。(f)は、どのようにしてゲノム上の2つの異なるSSR標的部位の挿入がDNAドナー鋳型からのカセットを交換するために用いられ得るかを示す。ゲノム改変の型の夫々は、SSR標的を挿入するためにPEを用いることによって想定されるが、このリストもまた限定することを意味されない。 This example describes the use of PE to introduce recombinase recognition sequences into high value loci on human or other genomes. These will lead to precise and efficient genome modification after exposure to site-specific recombinase(s) (Figure 64). In various embodiments shown in FIG. 64, PE can be used to (b) insert a single SSR target for use as a site of genomic incorporation of a DNA donor template. (c) shows how tandem insertion of SSR target sites can be used to delete a portion of the genome. (d) shows how tandem insertion of SSR target sites can be used to invert a portion of the genome. (e) shows how insertion of two SSR target sites in two distal chromosomal regions can result in a chromosomal translocation. (f) shows how insertion of two different SSR target sites on the genome can be used to exchange cassettes from the DNA donor template. Each type of genome modification is envisioned by using PE to insert an SSR target, but this list is also not meant to be limiting.

多くの大スケールゲノム変化、例えば遺伝子挿入、欠失、逆位、または染色体転座が遺伝子疾患に関連付けられている1-7。加えて、真核ゲノムのカスタムのかつ標的化された操作は、ヒト疾患の研究、およびトランスジェニック植物8,9またはほかのバイオテクノロジー製品の生成にとって重要である。例えば、染色体の微小欠失は疾患に至り得、重大なDNAエレメントの挿入によるこれらの欠失の置き換えは疾患の永久的な改善に至り得る。加えて、逆位、遺伝子コピー数変化、または染色体転座からもたらされる疾患は、有疾患細胞の先の遺伝子構造を復元することによって対処され得る。代替的には、産業に用いられる植物または他の高価値真核生物において、組み換えDNAまたは標的化されたゲノム再構成の導入は、改善された製品、例えばより少数の資源を要求するかまたは病原体に対して耐性である作物に至り得る。大スケールゲノム変化を成し遂げるための現行のテクノロジーはランダムなまたは確率的なプロセス、例えばトランスポゾンまたはレトロウイルスの使用に依拠し、他の所望のゲノム改変は相同組み換え戦略のみによって達成されている。 Many large-scale genomic alterations, such as gene insertions, deletions, inversions, or chromosomal translocations, have been associated with genetic diseases 1-7 . In addition, custom and targeted manipulation of eukaryotic genomes is important for the study of human diseases and the generation of transgenic plants8,9 or other biotechnological products. For example, chromosomal microdeletions can lead to disease, and replacement of these deletions by insertion of critical DNA elements can lead to permanent amelioration of the disease. In addition, diseases resulting from inversions, gene copy number changes, or chromosomal translocations can be addressed by restoring the previous genetic structure of diseased cells. Alternatively, in plants or other high-value eukaryotes used in industry, the introduction of recombinant DNA or targeted genomic rearrangements could lead to improved products, e.g. requiring fewer resources or reducing pathogens. can lead to crops that are resistant to Current technologies for achieving large-scale genomic changes rely on random or stochastic processes, such as the use of transposons or retroviruses; other desired genome modifications have been achieved solely by homologous recombination strategies.

標的化されたかつ効率的なゲノム改変を達成するためのタンパク質の1つの魅力的なクラスは部位特異的リコンビナーゼ(SSR)である。SSRはゲノム改変のためのツールとして用いられた長い履歴を有する10~13。SSRは遺伝子治療のための有望なツールとして考慮される。なぜなら、それらは、インデル、転座、他のDNA再構成、またはp53活性化を誘導し得る二本鎖切断の内生修復に依拠することなしに15~18、定められた組み換え標的における精密な切断、鎖交換、およびDNAフラグメントの再連結を誘導し得るからである14。SSRによって触媒される反応は、相同組み換え修復のものを超過する効率で標的DNAフラグメントの直接的置き換え、挿入、または欠失をもたらし得る14,19 One attractive class of proteins for achieving targeted and efficient genome modification is site-specific recombinases (SSRs). SSR has a long history of being used as a tool for genome modification 10 - 13 . SSR is considered as a promising tool for gene therapy. 15-18 This is because they allow precise recombination at defined recombination targets without relying on indels, translocations, other DNA rearrangements, or endogenous repair of double-strand breaks that can induce p53 activation. This is because it can induce cleavage, strand exchange, and religation of DNA fragments14. Reactions catalyzed by SSR can result in direct replacement, insertion, or deletion of target DNA fragments with efficiencies that exceed those of homologous recombination repair .

SSRは多くの利点をオファーするが、それらはそれらの対応する標的配列に対して強い自然の選好性を有するので、それらは広く用いられてはいない。SSRの認識配列は典型的には≧20塩基対であり、それゆえに、ヒトまたはモデル生物のゲノム上に生起することは非蓋然的である。さらに、SSRのネイティブな基質選好性は大規模な実験室操作または進化によってであっても容易には変改されない20。この限定は、リコンビナーゼ標的をゲノム上に直接的に導入するためにまたはリコンビナーゼ標的にネイティブに似ている内生ゲノム配列を改変するためにPEを用いることによって克服される。リコンビナーゼタンパク質に対する細胞の爾後の暴露は、リコンビナーゼ標的(単数または複数)の位置付けおよび向きによって導かれる精密なかつ効率的なゲノム改変を許すであろう(図64)。 Although SSRs offer many advantages, they have not been widely used because they have a strong natural preference for their corresponding target sequences. SSR recognition sequences are typically ≧20 base pairs and are therefore unlikely to occur on the genome of humans or model organisms. Furthermore, the native substrate preference of SSRs is not easily altered, even by extensive laboratory manipulation or evolution. This limitation is overcome by using PE to introduce recombinase targets directly onto the genome or to modify endogenous genomic sequences that natively resemble recombinase targets. Subsequent exposure of cells to recombinase proteins will allow precise and efficient genome modification guided by the positioning and orientation of the recombinase target(s) (Figure 64).

リコンビナーゼ標的のPEによって媒介される導入は、大スケールゲノム欠陥、例えば遺伝子喪失、逆位、もしくは重複、または染色体転座によって引き起こされる遺伝子疾患の処置にとって特に有用であり得る1-7(表6)。例えば、ウィリアムズ・ボイレン症候群は染色体7上の24の欠失によって引き起こされる発達障害である21。現行では、生細胞における複数の遺伝子全体の効率的なかつ標的化された挿入のためのテクノロジーは存在しない(かかる全長遺伝子挿入をするPEのポテンシャルは現行では調査されているが、まだ確立されていない);しかしながら、PEによって挿入される標的におけるリコンビナーゼによって媒介される取り入れは、このおよび他の疾患の永久的な治癒への1つのアプローチをオファーする。加えて、リコンビナーゼ認識配列の標的化された導入は、トランスジェニック植物、動物研究モデル、バイオプロダクション細胞株、または他のカスタム真核細胞株の生成を包含する適用にとって高度に有能であり得る。例えば、PE特異的な標的におけるトランスジェニック植物のリコンビナーゼによって媒介されるゲノム再構成は、改善された特性を有する農作物を生成することのボトルネックの1つを克服し得る8,9。 PE-mediated introduction of recombinase targets may be particularly useful for the treatment of genetic diseases caused by large-scale genomic defects, such as gene losses, inversions, or duplications, or chromosomal translocations1-7 (Table 6 ) . For example, Williams-Beuren syndrome is a developmental disorder caused by a 24 deletion on chromosome 721. Currently, no technology exists for the efficient and targeted insertion of multiple entire genes in living cells (the potential of PE for such full-length gene insertions is currently being investigated but not yet established). ); However, recombinase-mediated uptake at targets inserted by PE offers one approach to permanent cure of this and other diseases. In addition, targeted introduction of recombinase recognition sequences can be highly capable for applications including the generation of transgenic plants, animal research models, bioproduction cell lines, or other custom eukaryotic cell lines. For example, recombinase-mediated genome rearrangement of transgenic plants in PE-specific targets may overcome one of the bottlenecks in generating agricultural crops with improved properties.

いくつものSSRファミリーメンバーが特徴付けられ、それらの標的配列が記載されており、天然のおよび操作されたチロシンリコンビナーゼ(表7)、ラージセリンインテグラーゼ(表8)、セリンリゾルバーゼ(表9)、およびチロシンインテグラーゼ(表10)を包含する。増強されたゲノム取り入れ率を実証する改変された標的配列もまたいくつかのSSRについて記載されている22~30。天然のリコンビナーゼに加えて、別物の特異性を有するプログラム可能なリコンビナーゼが開発されている31~40。所望の適用に依存して、PEを用いて、これらの認識配列の1つ以上が、規定された位置付け、例えばセーフハーバー座位においてゲノム上に導入され得る41~43 A number of SSR family members have been characterized and their target sequences have been described, including natural and engineered tyrosine recombinases (Table 7), large serine integrases (Table 8), serine resolvases (Table 9), and tyrosine integrase (Table 10). Modified target sequences demonstrating enhanced genomic uptake rates have also been described for several SSRs22-30 . In addition to natural recombinases, programmable recombinases with distinct specificities have been developed 31-40 . Depending on the desired application, using PE one or more of these recognition sequences can be introduced onto the genome at defined positions, such as safe harbor loci 41 - 43 .

例えば、ゲノム上の単一のリコンビナーゼ標的の導入は、DNAドナー鋳型との取り入れ的な組み換えをもたらすであろう(図64B)。ヒト細胞においてロバストに作動するセリンインテグラーゼは、遺伝子取り入れに特に良く適し得る44,45。加えて、標的のアイデンティティーおよび向きに依存して、2つのリコンビナーゼ標的の導入は介在配列の欠失、介在配列の逆位、染色体転座、またはカセット交換をもたらし得る(図64C64F)。すでにリコンビナーゼ標的に密に似ている内生配列を選ぶことによって、完全なリコンビナーゼ標的を導入するために要求される編集の範囲は縮減されるであろう。 For example, introduction of a single recombinase target on the genome will result in integral recombination with the DNA donor template (Figure 64 B ). Serine integrases that operate robustly in human cells may be particularly well suited for gene transfer44,45 . Additionally, depending on the identity and orientation of the targets, introduction of two recombinase targets can result in deletion of the intervening sequence, inversion of the intervening sequence, chromosomal translocation, or cassette exchange (Figures 64 C to 64F ) . By choosing an endogenous sequence that already closely resembles the recombinase target, the extent of editing required to introduce the complete recombinase target will be reduced.

最後に、いくつかのリコンビナーゼは、ネイティブに生起する偽部位においてヒトまたは真核ゲノムに取り入れすることが実証されている46-64。PE編集は、これらの天然の偽部位における取り入れ率を増強するために、または代替的には欲されないオフターゲット配列としての用をなし得る偽部位を消去するために、これらの座位を改変するために用いられ得る。 Finally, some recombinases have been demonstrated to integrate into human or eukaryotic genomes at natively occurring pseudosites46-64 . PE editing alters these loci in order to enhance incorporation rates at these natural pseudosites, or alternatively to eliminate pseudosites that can serve as unwanted off-target sequences. It can be used for

この報告は、PEを用いて真核ゲノム上にリコンビナーゼ標的配列を導入するための一般的な方法論を記載する。これの適用は無限に近い。ゲノム編集反応はCRISPR/Cas9タンパク質と逆転写酵素ドメインとのキメラ融合体の「プライム編集因子」による使用を意図され、これはカスタムのプライム編集ガイドRNA(PEgRNA)を利用する。さらに伸長して、Cas9ツールおよび相同組み換え修復(HDR)経路もまた、いくつかの技術を用いてインデル率を低下させることによって、DNA鋳型からリコンビナーゼ標的を導入するために有効利用され得る65~67。ヒト細胞培養における概念実証実験が図65に示されている。
表6.大スケールゲノム改変にリンクした遺伝子疾患の例。

Figure 2020191234000417
表7.チロシンリコンビナーゼおよびSSR標的配列
Figure 2020191234000418
Figure 2020191234000419
表8.大セリンインテグラーゼおよびSSR標的配列。
Figure 2020191234000420
Figure 2020191234000421
Figure 2020191234000422
表9.セリンリゾルバーゼおよびSSR標的配列。
Figure 2020191234000423
表10.チロシンインテグラーゼおよび標的配列。
Figure 2020191234000424
This report describes a general methodology for introducing recombinase target sequences onto eukaryotic genomes using PE. The applications of this are nearly endless. The genome editing reaction is intended for use with a "prime editing factor", a chimeric fusion of a CRISPR/Cas9 protein and a reverse transcriptase domain, which utilizes a custom prime editing guide RNA (PEgRNA). By further extension, Cas9 tools and the homologous recombination repair (HDR) pathway can also be exploited to introduce recombinase targets from DNA templates by reducing the indel rate using several techniques. . A proof-of-concept experiment in human cell culture is shown in Figure 65.
Table 6. Examples of genetic diseases linked to large-scale genome modification.
Figure 2020191234000417
Table 7. Tyrosine recombinase and SSR target sequences
Figure 2020191234000418
Figure 2020191234000419
Table 8. Large serine integrase and SSR target sequences.
Figure 2020191234000420
Figure 2020191234000421
Figure 2020191234000422
Table 9. Serine resolvase and SSR target sequences.
Figure 2020191234000423
Table 10. Tyrosine integrase and target sequences.
Figure 2020191234000424

例17において引用された参考文献
以下の参考文献の各々は例17において引用されており、これらの各々は参照により本明細書に組み込まれる。

Figure 2020191234000425
Figure 2020191234000426
Figure 2020191234000427
Figure 2020191234000428
Figure 2020191234000429
Figure 2020191234000430
Figure 2020191234000431
Figure 2020191234000432
Figure 2020191234000433
Figure 2020191234000434
References Cited in Example 17 Each of the following references is cited in Example 17, each of which is incorporated herein by reference.
Figure 2020191234000425
Figure 2020191234000426
Figure 2020191234000427
Figure 2020191234000428
Figure 2020191234000429
Figure 2020191234000430
Figure 2020191234000431
Figure 2020191234000432
Figure 2020191234000433
Figure 2020191234000434

例18-プライマー結合部位(PBS)中の3'トウループの組み込みはPEgRNA活性を改善する
さらにPE活性を改善するために、本発明者らは、3'伸長アームを有するPEgRNAの3'末にてトウループ配列を付加することを企図した。図71Aは、3'伸長アームを有する全体的な(generic)SpCas9 PEgRNAの例(上の分子)を提供する。次に、3'伸長アームは、RT鋳型(これは、その所望の編集を包含する)および分子の3'末にてプライマー結合部位(PBS)を含む。分子は、3つのU核酸塩基を含むポリ(U)配列(すなわち、5'-UUU-3')で終止する。
Example 18 - Incorporation of a 3' toe loop in the primer binding site (PBS) improves PEgRNA activity To further improve PE activity, we It was planned to add a toe loop sequence. Figure 71A provides an example (top molecule) of a generic SpCas9 PEgRNA with a 3' extended arm. The 3' extending arm then contains the RT template (which contains the desired edits) and a primer binding site (PBS) at the 3' end of the molecule. The molecule terminates with a poly(U) sequence containing three U nucleobases (ie, 5'-UUU-3').

これに反して、図71Aの下部は、図71Aの上部と同じPEgRNA分子を示すが、ここで5'-GAAANNNNN-3'の9核酸塩基配列は、プライマー結合部位の3'末と末端ポリ(U)配列の5'末との間に挿入されている。この構造は、自身を180°まで後方へ折り畳み「トウループ」RNA構造を形成するが、ここで9核酸塩基挿入の5'-NNNNN-3'の配列はプライマー結合部位中の相補的な配列とアニールし、5'-GAAA-3'部分は180°のひねり(turn)を形成する。図71Aに描かれるトウループ配列の特色は、その場所において使用され得るトウループの範囲を限定も制限もする意図はない。さらに、トウループの配列は、プライマー結合部位の相補的な配列に依存するであろう。とは言え、本質的にはトウループ配列は、様々な態様において、180°を形成する第1配列部分、およびプライマー結合部位の部分に相補的な配列を有する第2配列部分を有していてもよい。 In contrast, the lower part of Figure 71A shows the same PEgRNA molecule as the upper part of Figure 71A, but now the 9 nucleobase sequence of 5'-GAAANNNNN-3' is located at the 3' end of the primer binding site and at the terminal poly( U) It is inserted between the 5' end of the sequence. This structure folds itself backwards by 180° to form a "toe-loop" RNA structure, where the 5'-NNNNN-3' sequence of the 9 nucleobase insert anneals to the complementary sequence in the primer binding site. The 5'-GAAA-3' portion forms a 180° turn. The toe loop arrangement features depicted in FIG. 71A are not intended to limit or limit the range of toe loops that may be used in that location. Furthermore, the sequence of the toe loop will depend on the complementary sequence of the primer binding site. However, essentially the toe loop sequence may in various embodiments have a first sequence portion forming a 180° and a second sequence portion having a complementary sequence to a portion of the primer binding site. good.

理論によって拘泥されないが、トウループ配列は、別様には可能性が十二分にあるものより(than would otherwise be possible)、プライマー結合部位が益々長くなるPEgRNAの使用をPEgRNAに可能にさせると考えられる。次に、より長いPBS配列は、PE活性を改善すると考えられる。PEgRNAのより具体的には、トウループのあり得る機能は、PBSを塞ぐか、または少なくともスペーサーと相互作用するPBSを最小化することである。PBSとスペーサーとの間の安定したヘアピン形成は、不活性なPEgRNAへ繋がり得る。トウループがないと、この相互作用は、PBSの長さ制限を要することになり得る。3'末トウループを使用してスペーサーとPBSとの間の相互作用を遮断または最小化することは、PE活性の改善へ繋がることもある。 Without being bound by theory, it is believed that the toe loop sequence allows PEgRNA to use PEgRNAs with increasingly longer primer binding sites than would otherwise be possible. It will be done. Next, longer PBS sequences are thought to improve PE activity. More specifically for PEgRNA, a possible function of the toe loop is to occlude the PBS or at least minimize the PBS interacting with the spacer. Stable hairpin formation between PBS and spacer can lead to inactive PEgRNA. Without the toe loop, this interaction could require length limitations of the PBS. Blocking or minimizing the interaction between the spacer and PBS using the 3'-terminal toe loop may also lead to improved PE activity.

例19-代替的な核酸鋳型および編集因子タンパク質構築物によるプライム編集
この例に先行して、プライム編集はPEgRNAを要求することが記載される。プライム編集への使用のための好適なPEgRNAの可能な構成を記載する例示の態様が、図3A(5'伸長アームを有するPEgRNA)、図3B(3'伸長アームを有するPEgRNA)、図3C(内部に伸長されたPEgRNA)、図3D(3'伸長アームを有し、プライマー結合部位、編集鋳型、相同アーム、ならびに任意の3'および5'修飾領域と、DNA合成鋳型として指示される領域とを含むPEgRNA)、および図3E(5’伸長アームを有し、プライマー結合部位、編集鋳型、相同アーム、ならびに任意の3'および5'修飾領域と、DNA合成鋳型として指示される領域とを含むPEgRNA)に図示されている。加えて、PEgRNA構造および組成は本願において発明を実施するための形態および至る所で鋭意に記載される。
Example 19 - Prime Editing with Alternative Nucleic Acid Templates and Editing Factor Protein Constructs Prior to this example, it is described that prime editing requires PEgRNA. Exemplary embodiments describing possible configurations of suitable PEgRNAs for use in prime editing are shown in Figure 3A (PEgRNA with 5' extended arm), Figure 3B (PEgRNA with 3' extended arm), Figure 3C ( Internally extended PEgRNA), Figure 3D (with 3' extended arm, primer binding site, editing template, homology arm, and any 3' and 5' modified regions and region designated as DNA synthesis template). PEgRNA), and Figure 3E (having a 5' extended arm and containing a primer binding site, editing template, homology arm, and any 3' and 5' modification regions and a region designated as a DNA synthesis template). PEgRNA). In addition, PEgRNA structure and composition are extensively described in the detailed description and elsewhere in this application.

この例は、PEgRNAの追加のデザインバリエーション、いくつかのケースでは、細胞外で丸ごとまたは部分的に化学合成されるPEgRNAを記載する。これらは、本明細書のプライム編集因子と併せて働くことが想定される。かかる代替的なデザインはプライム編集の種々の側面を改善し得、プライム編集によるより長いDNA配列の挿入、可能性としては増大した効率および/または忠実性で作動する代替的なポリメラーゼ(すなわち、逆転写酵素の代替)の使用、ならびにプライム編集を増強または拡大するための代替的なおよび/または追加のプライム編集因子タンパク質エフェクター構成要素の使用または動員を包含する。加えて、化学合成PEgRNAの使用は、可能性としては、より安定であり、かつプライム編集効率および能力を増強する望ましい特色を所有する分子の生産に至り得る。 This example describes additional design variations of PEgRNA, in some cases PEgRNA that is chemically synthesized in whole or in part outside the cell. These are envisioned to work in conjunction with the prime editing factors herein. Such alternative designs could improve various aspects of prime editing, including the insertion of longer DNA sequences by prime editing, and potentially the use of alternative polymerases operating with increased efficiency and/or fidelity (i.e., inversion). the use of alternative and/or additional prime editing factor protein effector components to enhance or amplify prime editing. In addition, the use of chemically synthesized PEgRNA can potentially lead to the production of molecules that are more stable and possess desirable features that enhance prime editing efficiency and capacity.

PEgRNAは、標的部位に組み込まれるべきである所望の編集された遺伝情報をコードする核酸鋳型としての用をなす。一側面において、PEgRNAは、伸長アームをsgRNAの5'端もしくは3’端どちらかに追加することによって(例えば、図3A、3B、3D、もしくは3Eの態様に示されているとおり)または類似の配列をsgRNA上の内部に挿入することによって(例えば、図3Cの態様に示されているとおり)生出される。伸長アームはDNA合成鋳型を含み、これはポリメラーゼ(例えば逆転写酵素)によるssDNA産物をコードすることができ、かつこれは目当ての編集された遺伝情報を包含する。伸長アームは、napDNAbpによってニッキングされたゲノムDNA鎖にアニールするためのプライマー結合部位(PBS)と、カウンターパートDNA鎖を置き換えることによって内生DNA標的部位に組み込まれるようになる目当ての編集されたDNA鎖をコードするためのDNA合成鋳型とを含む。PEgRNAは、プラスミドDNAもしくはゲノム取り入れされたDNAカセットから細胞内で発現され得るか、またはそれらは細胞外でin vitro転写によってもしくは化学合成によって作られ得、爾後に細胞に送達され得る。特に化学合成による細胞外におけるPEgRNAの調製は、実質的にPEgRNAを改変するための機会をオファーする。本発明はプライム編集鋳型の代替的なデザインを記載する(図72)。 The P EgRNA serves as a nucleic acid template encoding the desired edited genetic information to be incorporated into the target site. In one aspect, the PEgRNA is prepared by adding an extended arm to either the 5' or 3' end of the sgRNA (e.g., as shown in the embodiments of Figures 3A, 3B, 3D, or 3E) or similar generated by inserting the sequence internally on the sgRNA (eg, as shown in the embodiment of Figure 3C). The extension arm contains a DNA synthesis template, which can encode an ssDNA product by a polymerase (eg, reverse transcriptase), and which contains the edited genetic information of interest. The extended arm contains a primer binding site (PBS) for annealing to the genomic DNA strand nicked by napDNAbp and the intended edited DNA to become incorporated into the endogenous DNA target site by displacing the counterpart DNA strand. and a DNA synthesis template for encoding the strand. PEgRNAs can be expressed intracellularly from plasmid DNA or genomically incorporated DNA cassettes, or they can be made extracellularly by in vitro transcription or by chemical synthesis and then delivered to the cell. The preparation of PEgRNA extracellularly, especially by chemical synthesis, offers the opportunity to substantially modify PEgRNA. The present invention describes an alternative design of prime editing templates (Figure 72).

(A)ガイドRNAとは別個の分子として発現されるDNA合成鋳型(すなわち、プライム編集因子複合体(napDNAbp+ガイドRNA)にトランスで提供されるDNA合成鋳型。
本明細書に記載の種々の態様では、プライム編集はプログラム可能な標的化分子および編集をコードする分子両方としての用をなす単一のPEgRNAを利用する。この態様は3’伸長アームを有するPEgRNAについて図72Aに図示されている。しかしながら、いくつかのケースでは、これは、特に、より複雑なPEgRNA分子、例えば大きい挿入をコードするものにとっては不利であり得る。これらのRNAは大規模な二次構造を含有し得、これがPEgRNA骨格構造およびCas9との相互作用に干渉し得る。代替的には、プライム編集はPEgRNAを2つの別個のRNA分子によって置換することによって実行され得る:図72Bに図示されているとおりsgRNAおよびトランスプライム編集RNA鋳型(tPERT)である。sgRNAはCas9(またはより一般的にはnapDNAbp)を所望のゲノム標的部位へと標的化するための用をなし、tPERTは新たなDNA配列を標的座位に書き込むためにポリメラーゼ(例えば逆転写酵素)によって用いられる。
(A) DNA synthesis template expressed as a separate molecule from the guide RNA (i.e., DNA synthesis template provided in trans to the prime editing factor complex (napDNAbp+guide RNA).
In various embodiments described herein, prime editing utilizes a single PEgRNA that serves as both a programmable targeting molecule and an editing encoding molecule. This embodiment is illustrated in Figure 72A for PEgRNA with a 3' extended arm. However, in some cases this may be a disadvantage, especially for more complex PEgRNA molecules, such as those encoding large insertions. These RNAs can contain extensive secondary structure, which can interfere with PEgRNA backbone structure and interaction with Cas9. Alternatively, prime editing can be performed by replacing PEgRNA by two separate RNA molecules: sgRNA and transprime editing RNA template (tPERT) as illustrated in Figure 72B . sgRNA serves to target Cas9 (or napDNAbp more generally) to a desired genomic target site, and tPERT is used by a polymerase (e.g. reverse transcriptase) to write a new DNA sequence into the target locus. used.

一般的に、tPERTの単純な発現はPEgRNAと比較して低い編集効率に至る。しかしながら、トランスプライム編集の効率は、プライム編集因子タンパク質へのMS2コートタンパク質(MS2cp)の融合体(MS2cp-Cas9-RTを作るため)と併せたtPERT RNA上への1つ以上のMS2 RNAアプタマーの導入によって増強され得る。これはMS2 RNAアプタマーがMS2cpに結合することを許し、それによって、プライム編集因子複合体によってtPERT(これはDNA合成鋳型を含む)を編集の部位に共局在させる。アプタマー配列の逆転写を回避するために、MS2アプタマーは好ましくはtPERTの3’端に置かれる。 In general, simple expression of tPERT leads to lower editing efficiency compared to PEgRNA. However, the efficiency of transprime editing is limited by the addition of one or more MS2 RNA aptamers onto tPERT RNA in conjunction with a fusion of MS2 coat protein (MS2cp) to the prime editing factor protein (to create MS2cp-Cas9-RT). can be enhanced by introduction. This allows the MS2 RNA aptamer to bind to MS2cp, thereby colocalizing tPERT (which contains the DNA synthesis template) to the site of editing by the prime editor complex. To avoid reverse transcription of the aptamer sequence, the MS2 aptamer is preferably placed at the 3' end of tPERT.

この例はMS2タグ付け技術を利用するが(プライム編集因子に融合されたMS2cpタンパク質とペアリングされたtPERTのMS2 RNAアプタマーを含む)、他のRNA-タンパク質動員システムが代替で用いられ得る。ここで想定される一般的な概念は、tPERTのDNA合成鋳型がRNA動員二次構造(例えば、MS2アプタマーのような特殊化したヘアピン)を含有するように改変され、その結果、tPERTが、tPERT分子上のRNA動員二次(second)構造を特異的に認識および結合するRNA結合タンパク質をさらに含む改変されたプライム編集因子融合タンパク質によって動員され得るということである。他のRNA-タンパク質動員ドメインの総説は当該技術分野において例えばJohansson et al.,“RNA recognition by the MS2 phage coat protein,”Sem Virol.,1997,Vol.8(3):176-185;Delebecque et al.,“Organization of intracellular reactions with rationally designed RNA assemblies,”Science,2011,Vol.333:470-474;Mali et al.,“Cas9 transcriptional activators for target specificity screening and paired nickases for cooperative genome engineering,”Nat.Biotechnol.,2013,Vol.31:833-838;およびZalatan et al.,“Engineering complex synthetic transcriptional programs with CRISPR RNA scaffolds,”Cell,2015,Vol.160:339-350に記載されている。これらの夫々はそれらの全体が参照によって本願に組み込まれる。他のシステムは、PCPタンパク質を特異的に動員するPP7ヘアピンおよびComタンパク質を特異的に動員する「com」ヘアピンを包含する。Zalatan et al.を見よ。これらの周知の動員システムのいずれかは本明細書に記載のトランスプライム編集に使用され得る。 Although this example utilizes MS2 tagging technology (including a tPERT MS2 RNA aptamer paired with an MS2cp protein fused to a prime editing factor), other RNA-protein recruitment systems can alternatively be used. The general concept envisioned here is that the DNA synthesis template for tPERT is modified to contain an RNA recruitment secondary structure (e.g., a specialized hairpin such as the MS2 aptamer), such that tPERT It can be recruited by a modified prime editor fusion protein that further includes an RNA binding protein that specifically recognizes and binds RNA recruitment second structures on the molecule. Reviews of other RNA-protein recruitment domains are available in the art, for example, by Johansson et al., “RNA recognition by the MS2 phage coat protein,” Sem Virol., 1997, Vol. 8(3):176-185; Delebecque et al. al.,“Organization of intracellular reactions with rationally designed RNA assemblies,”Science,2011,Vol.333:470-474;Mali et al.,“Cas9 transcriptional activators for target specificity screening and paired nickases for cooperative genome engineering,”Nat Biotechnol., 2013, Vol. 31: 833-838; and Zalatan et al., “Engineering complex synthetic transcriptional programs with CRISPR RNA scaffolds,” Cell, 2015, Vol. 160: 339-350. Each of these is incorporated herein by reference in its entirety. Other systems include the PP7 hairpin, which specifically recruits PCP proteins, and the "com" hairpin, which specifically recruits Com proteins. See Zalatan et al. Any of these well-known recruitment systems can be used for the transprime editing described herein.

本tPERTトランスプライム編集システムの効率を試験した。His6挿入(18bp)の最高で20%の効率がHEK293T細胞のHEK3部位において達成された。単一の3’MS2アプタマー、13ntプライマー結合部位、および挿入配列と座位に対する34ntの相同性とを含有するRT鋳型を含有するtPERTを、PE2のN末端に融合されたMS2cpを含有する編集因子と併せて用いた。図73を見よ。トランスプライム編集の戦略は、PEgRNAのPEgRNAデザインに関連する複雑化に対処するポテンシャルを有し、プライム編集因子ニック部位からさらに遠くの距離におけるより大きい挿入、欠失、または編集を達成するためのより長いRT鋳型により適し得る。 The efficiency of the present tPERT transprime editing system was tested. Up to 20% efficiency of His6 insertion (18 bp) was achieved at the HEK3 site in HEK293T cells. tPERT containing a single 3'MS2 aptamer, a 13nt primer binding site, and an RT template containing 34nt of homology to the insert sequence and the locus was combined with an editing element containing MS2cp fused to the N-terminus of PE2. Used together. See Figure 73. The transprime editing strategy has the potential to address the complications associated with PEgRNA design of PEgRNAs and is more convenient for achieving larger insertions, deletions, or edits at greater distances from the prime editor nick site. May be more suitable for long RT templates.

(B)RNAおよびDNA合成鋳型を有する化学合成PEgRNA
代替的な核酸鋳型が化学合成PEgRNA上に用いられ得る(図72C)。例えば、合成PEgRNAはRNA/DNAハイブリッドとして構築され得、スペーサー配列およびsgRNA骨格がRNAヌクレオチドから成り、プライマー結合部位および合成鋳型(図72Cにおいて3'伸長として示される)がDNAヌクレオチドから成る。これはDNA依存性DNAポリメラーゼが逆転写酵素の代わりにプライム編集因子上に用いられることを許し得る。それはsgRNA骨格配列を鋳型とするDNAの合成をもまた防止し得る。他のデザインでは、鋳型とされないヌクレオチドから成る化学的リンカーまたは他の好適なリンカー部分が、核酸編集鋳型(RNAまたはDNAから成る)をsgRNA骨格にテザリングするために用いられ得る。これはsgRNA骨格の連続したDNA重合を防止し得、より効率的な鋳型による合成を許す伸長のフレキシビリティーを許し得る。最後に、核酸合成鋳型の方向性が逆位させられ得、その結果、DNA重合が、それの方と対比してsgRNA骨格から別方向に進む。
(B) Chemically synthesized PEgRNA with RNA and DNA synthesis templates
Alternative nucleic acid templates can be used on chemically synthesized PEgRNA (Figure 72C ). For example, synthetic PEgRNA can be constructed as an RNA/DNA hybrid, with the spacer sequence and sgRNA backbone consisting of RNA nucleotides, and the primer binding site and synthetic template (shown as a 3' extension in Figure 72C ) consisting of DNA nucleotides. This could allow a DNA-dependent DNA polymerase to be used on the prime editing factor instead of reverse transcriptase. It may also prevent synthesis of DNA templated by the sgRNA backbone sequence. In other designs, chemical linkers consisting of non-templated nucleotides or other suitable linker moieties can be used to tether the nucleic acid editing template (consisting of RNA or DNA) to the sgRNA backbone. This may prevent sequential DNA polymerization of the sgRNA backbone and allow extension flexibility allowing more efficient templated synthesis. Finally, the directionality of the nucleic acid synthesis template can be reversed so that DNA polymerization proceeds in the opposite direction away from the sgRNA backbone as opposed to towards it.

(C)トランスで発現されるDNAポリメラーゼの動員
プライム編集の主な態様では、ポリメラーゼ(例えば、逆転写酵素酵素)はnapDNAbp(例えば、Cas9ニッカーゼ)への融合体として発現される。代替的には、ポリメラーゼ(例えば、逆転写酵素)はトランスで発現され得、その活性が、MS2 RNAアプタマーおよびMS2コートタンパク質などの動員システム、または当該技術分野で公知の他の類似の動員システムを用いて編集部位に局在し得る。このシステムでは、PEgRNAはMS2アプタマーをsgRNA骨格ヘアピンの1つに包含するように改変され、ポリメラーゼ(例えば、逆転写酵素)はMS2cpへの融合タンパク質として発現される。napDNAbp(例えば、Cas9ニッカーゼ)は独立したポリペプチドとしてもまた発現される。このシステムは野生型M-MLV逆転写酵素について実証されており(図74)、他のRTバリアントに適用可能であるはずである。加えて、他のRNA-タンパク質相互作用またはタンパク質-タンパク質相互作用がRT動員に用いられ得る。
次の配列は例19に当てはまる:
tPERTの配列:

Figure 2020191234000435
MS2 PEgRNAの配列:
Figure 2020191234000436
タンパク質配列:
Figure 2020191234000437
Figure 2020191234000438
Figure 2020191234000439
Figure 2020191234000440
Figure 2020191234000441
(C) Mobilization of DNA Polymerase Expressed in Trans In the main embodiment of prime editing, the polymerase (eg, reverse transcriptase enzyme) is expressed as a fusion to napDNAbp (eg, Cas9 nickase). Alternatively, the polymerase (e.g., reverse transcriptase) can be expressed in trans and its activity is linked to mobilization systems such as the MS2 RNA aptamer and MS2 coat protein, or other similar mobilization systems known in the art. can be used to localize to the editing site. In this system, PEgRNA is modified to include the MS2 aptamer in one of the sgRNA backbone hairpins, and the polymerase (eg, reverse transcriptase) is expressed as a fusion protein to MS2cp. napDNAbp (eg, Cas9 nickase) is also expressed as an independent polypeptide. This system has been demonstrated for wild type M-MLV reverse transcriptase (Figure 74) and should be applicable to other RT variants. Additionally, other RNA-protein or protein-protein interactions can be used for RT recruitment.
The following array applies to Example 19:
Array of tPERT:
Figure 2020191234000435
Sequence of MS2 PEgRNA:
Figure 2020191234000436
Protein sequence:
Figure 2020191234000437
Figure 2020191234000438
Figure 2020191234000439
Figure 2020191234000440
Figure 2020191234000441

例20.プライム編集因子の分裂インテイン送達
この例は、別個のベクターによって細胞にプライム編集因子を送達するための手段として、プライム編集因子がインテインを用いて分裂され得るということを実証する。各ベクターはプライム編集因子融合タンパク質のある部分をコードする。この例は標準的なSpCas9(配列番号18)を含むPE融合タンパク質にフォーカスする。他のCas9タンパク質の分裂部位は対応する同じ部位であり得るか、または各異なるCas9タンパク質について最適化されることを必要とし得る。本例では、プライム編集因子をSpCas9(配列番号18)の残基1023および1024の間で分裂した。これは「1023/1024」分裂部位と言われる。
Example 20. Split Intein Delivery of Prime Editor This example demonstrates that a prime editor can be split using an intein as a means to deliver the prime editor to cells by separate vectors. Each vector encodes a portion of a prime editor fusion protein. This example focuses on a PE fusion protein containing the standard SpCas9 (SEQ ID NO: 18). The split site for other Cas9 proteins can be the same corresponding site or may need to be optimized for each different Cas9 protein. In this example, the prime editor was split between residues 1023 and 1024 of SpCas9 (SEQ ID NO: 18). This is referred to as the "1023/1024" split site.

プライム編集因子(PE)はAAVパッケージング容量を超過する。よって、トランススプライシングNpuインテインを配列番号18のS. pyogenes Cas9残基1024に挿入することによってPEを分裂し、夫々が二元的AAVシステムの1つによってコードされる2つの別個のポリペプチドとしての分裂SpPEの送達を許すことが企図された。それは(1)ガイドカセット(単数または複数)および最小限の制御エレメントのための空間を容れながら、2つのAAVへのパッケージングを許す、(2)ネイティブなセリンからシステインへの変異は相対的に保存的であろう、(3)部位は、スプライシングが生起することを許すことが立体的に予測されるCas9の辺縁部の近くのフレキシブルなループである、そして(4)Cas9は(先には、この特定の分裂部位ではないが)このループにおいて循環置換によって首尾良く変改されているので、分裂部位1023/1024が選ばれた。 Prime editing factor (PE) exceeds AAV packaging capacity. Thus, we split the PE by inserting a trans-splicing Npu intein into S. pyogenes Cas9 residue 1024 of SEQ ID NO: 18, resulting in its creation as two separate polypeptides, each encoded by one of the dualistic AAV systems. It was contemplated to allow delivery of split SpPE. It (1) allows packaging into two AAVs while accommodating space for guide cassette(s) and minimal control elements; (2) the native serine to cysteine mutation is relatively likely to be conservative, (3) the site is a flexible loop near the margin of Cas9 that is sterically predicted to allow splicing to occur, and (4) Cas9 (previously Split site 1023/1024 was chosen because it has been successfully modified by circular substitution in this loop (although not at this particular split site).

Npu分裂プライム編集因子が活性化であるかどうかを決定するために、HEK細胞を分裂編集因子をコードするプラスミドによってトランスフェクションし、それらが全長PE3の活性を再現するということを見出した。高スループット配列決定によって分析した。さらにその上、C末端エクステインの3つのネイティブなNpuアミノ末端残基は最も効率的にスプライシングすることが公知であるが、Cas9残基1024をネイティブにフランキングするものとは異なる。ネイティブなNpu残基によるこれらのCas9残基の置き換えは、プライム編集因子の活性を変改し得る。よって、Cas9にネイティブな「SEQ」からNpuインテイン「CFN」配列への変異がプライム編集の効率を変改するかどうかを決定した。「SEQ」残基は、全長に類似の効率でプライム編集を容易化し、インテイン分裂PEの半分同士が会合しプライム編集を媒介する能力があるということを示唆する。「CFN」への変異によるさらなる増大は見られず、我々が先にインテイン分裂塩基編集因子で観察したとおり、会合単独が分裂PE活性にとって十分であり得るということを示唆した。 To determine whether the Npu mitotic prime editor is activating, we transfected HEK cells with a plasmid encoding the mitotic editor and found that they recapitulated the activity of full-length PE3. Analyzed by high-throughput sequencing. Moreover, the three native Npu amino-terminal residues of the C-terminal extein, which are known to splice most efficiently, are distinct from those that natively flank Cas9 residue 1024. Replacement of these Cas9 residues with native Npu residues may alter the activity of the prime editor. We therefore determined whether mutation of the Cas9 native "SEQ" to the Npu intein "CFN" sequence alters the efficiency of prime editing. The "SEQ" residue facilitates prime editing with an efficiency similar to the full-length one, suggesting that the halves of the intein split PE are capable of associating with each other and mediating prime editing. No further increase was seen upon mutation to 'CFN', suggesting that association alone may be sufficient for fission PE activity, as we previously observed with intein fission base editors.

会合した未スプライシングの編集因子は活性であり得るが、開始ステップの間の不完全なスプライシングからもたらされるプライム編集因子の立体性の撹乱が編集アウトカムに影響し得る。よって、1024-CFNをさらなる研究のために選んだ。なぜなら、それもまた全長PE3活性を再現するからである。 Although the associated unspliced editors can be active, steric disturbance of the prime editor resulting from incomplete splicing during the initiation step may affect the editing outcome. Therefore, 1024-CFN was chosen for further studies because it also recapitulates full-length PE3 activity.

以下は1023/1024分裂のアミノ酸配列である。 Below is the amino acid sequence of the 1023/1024 split.

1023/1024 N末端半分でのSpPE2分裂 1023/1024 SpPE2 splitting in the N-terminal half

Figure 2020191234000442
Figure 2020191234000442
Figure 2020191234000443
Figure 2020191234000443

Figure 2020191234000444
Figure 2020191234000444

1023/1024 C末端半分でのSpPE2分裂 1023/1024 SpPE2 splitting in the C-terminal half

Figure 2020191234000445
Figure 2020191234000445

Figure 2020191234000446
Figure 2020191234000446

二元的AAVシステムによってパッケージングされた(packages)プライム編集因子
Npuトランススプライシングインテインによって残基1023および1024の間で分裂されたプライム編集因子はAAV内にパッケージングされる(packages)ようになり、同じ様式で生じた類似のゲノムサイズの塩基編集因子のものと遜色ない高い力価を有する。
Prime editing factors packaged by dual AAV systems
Prime editors split between residues 1023 and 1024 by the Npu trans-splicing intein become packaged within AAV and are similar to those of similar genome-sized base editors generated in the same manner. It has a comparable high potency.

インビボのプライム編集
P0マウスへの脳室内注射によってAAV9によって送達された分裂SpPE3は、インビボの脳組織においてプライム編集を媒介する。GからTの位置+5におけるヌクレオチド置換(すなわち、ニック部位の5ヌクレオチド塩基下流かつPAM配列上)は、DNMT1のN末端の近くのPro>Glnをコードする変異の組み入れをもたらす。この編集はインビボのプライム編集の実行可能性を実証し、編集された細胞に対するいずれかの選択圧を導入するとは考えられない(「+5」はニック部位の下流の+5位置を言う)。試験されたAAVアーキテクチャは全長MMLV RTとRNAse Hドメインを欠く短縮されたバリアントとを包含する。短縮された転写後制御エレメントW3をもまた評価した。なぜなら、それは、インビボのウイルスカセットからの発現を増大させることが示されているが、その重要性は塩基編集因子またはプライム編集因子コンテキストにおいては試験されていなかったからである。全長RTは短縮されたRTに優り、W3配列の追加は活性を改善するということが見出された。W3が存在するときの編集活性の増大は、プライム編集因子の発現がインビボでは限定されるということを指示し、細胞培養に対してインビボのプライム編集の別物の課題を実証する。
In vivo prime editing
Split SpPE3 delivered by AAV9 by intracerebroventricular injection into P0 mice mediates prime editing in brain tissue in vivo. A nucleotide substitution at position +5 from G to T (ie, 5 nucleotide bases downstream of the nick site and on the PAM sequence) results in the incorporation of a mutation encoding Pro>Gln near the N-terminus of DNMT1. This editing demonstrates the feasibility of prime editing in vivo and is not expected to introduce any selective pressure on the edited cells ('+5' refers to the +5 position downstream of the nick site). The AAV architecture tested includes the full-length MMLV RT and a truncated variant lacking the RNAse H domain. The truncated post-transcriptional control element W3 was also evaluated. This is because, although it has been shown to increase expression from viral cassettes in vivo, its significance was not tested in the base editor or prime editor context. It was found that full-length RT was superior to truncated RT and that addition of the W3 sequence improved activity. The increased editing activity in the presence of W3 indicates that the expression of prime editing factors is limited in vivo and demonstrates the distinct challenges of in vivo prime editing versus cell culture.

参考文献
Oakes,B.L.,Fellmann,C.et al.CRISPR-Cas9 Circular Permutants as Programmable Scaffolds for Genome Modification.Cell.2019 Jan 10;176(1-2):254-267.e16.doi:10.1016/j.cell.2018.11.052.
References
Oakes, BL, Fellmann, C. et al. CRISPR-Cas9 Circular Permutants as Programmable Scaffolds for Genome Modification. Cell. 2019 Jan 10;176(1-2):254-267.e16.doi:10.1016/j.cell.2018.11.052.

例21.PE2フォーマットでのリンカー最適化
この例は、全てPE2に基づくいくつものバリアントプライム編集因子を構築した。PE2は次の配列および構造を有する:
Example 21. Linker Optimization in PE2 Format This example constructed a number of variant prime editing factors, all based on PE2. PE2 has the following sequence and structure:

本願において用いられる「PE2」は、次の構造を有するCas9(H840A)とバリアントMMLV RTとを含む融合タンパク質を含むPE複合体を言う:[NLS]-[Cas9(H840A)]-[リンカー]-[MMLV_RT(D200N)(T330P)(L603W)(T306K)(W313F)]+所望のPEgRNA。PE融合体は配列番号134のアミノ酸配列を有し、これは次のとおり示される:

Figure 2020191234000447
As used herein, "PE2" refers to a PE complex comprising a fusion protein containing Cas9(H840A) and variant MMLV RT with the following structure: [NLS]-[Cas9(H840A)]-[Linker]- [MMLV_RT(D200N)(T330P)(L603W)(T306K)(W313F)]+desired PEgRNA. The PE fusion has the amino acid sequence of SEQ ID NO: 134, which is shown below:
Figure 2020191234000447

M-MLV逆転写酵素(配列番号139)。 M-MLV reverse transcriptase (SEQ ID NO: 139).

PE2リンカーは、SGGSSGGSSGSETPGTSESATPESSGGSSGGSS(配列番号127)である。 The PE2 linker is SGGSSGGSSGSETPGTSESATPESSGGSSGGSS (SEQ ID NO: 127).

この実験では、PE2のリンカーを次の代わりのリンカーの1つによって置き換えた(または1つの場合にはリンカーなし):

Figure 2020191234000448
Figure 2020191234000449
In this experiment, the linker in PE2 was replaced by one of the following alternative linkers (or in one case no linker):
Figure 2020191234000448
Figure 2020191234000449

図79は置き換えリンカー構築物の編集効率を示す。特に、データは、現行のリンカーによるPE2構築物(PE2として記されている。白色のボックス)の編集効率を、指示されている配列によって置き換えられたリンカーによる種々のバージョンと比較して、HEK3、EMX1、FANCF、RNF2座位において、トランジション、トランスバージョン、挿入、および欠失編集のための代表的なPEgRNAについて示す。置き換えリンカーは「1×SGGS」(配列番号174)、「2×SGGS」(配列番号446)、「3×SGGS」(配列番号3889)、「1×XTEN」(配列番号171)、「リンカーなし」、「1×Gly」、「1×Pro」、「1×EAAAK」(配列番号3968)、「2×EAAAK」(配列番号3969)、および「3×EAAAK」(配列番号3970)と言われる。編集効率は棒グラフフォーマットでPE2の「対照」編集効率に対して相対的に測定される。PE2のリンカーはSGGSSGGSSGSETPGTSESATPESSGGSSGGSS(配列番号127)である。全ての編集はPE3システムという文脈でされた。すなわち、これはPE2編集構築物プラス最適な二次sgRNAニッキングガイドの追加を言う。 Figure 79 shows the editing efficiency of replacement linker constructs. In particular, the data compare the editing efficiency of the PE2 construct (marked as PE2; white box) with the current linker to various versions with the linker replaced by the indicated sequences, HEK3, EMX1 Representative PEgRNAs for transition, transversion, insertion, and deletion editing at the , FANCF, and RNF2 loci are shown. Replacement linkers are “1×SGGS” (SEQ ID NO: 174) , “2×SGGS” (SEQ ID NO: 446) , “3×SGGS” (SEQ ID NO: 3889) , “1×XTEN” (SEQ ID NO: 171) , “No linker ”, “1×Gly”, “1×Pro”, “1×EAAAK” (SEQ ID NO: 3968) , “2×EAAAK” (SEQ ID NO: 3969) , and “3×EAAAK” (SEQ ID NO: 3970) . Editing efficiency is measured relative to the PE2 "control" editing efficiency in bar graph format. The linker for PE2 is SGGSSGGSSGSETPGTSESATPESSGGSSGGSS (SEQ ID NO: 127). All editing was done in the context of the PE3 system. Namely, this refers to the PE2 editing construct plus the addition of an optimal secondary sgRNA nicking guide.

図80は、1×XTEN(配列番号171)リンカーが編集効率の増大を提供したということを示す。PE2に対して相対的な平均の~倍効力を取ることは、示されているグラフを生み、1×XTEN(配列番号171)リンカー配列の使用が編集効率を平均で1.14倍改善するということを指示している(n=15)。 Figure 80 shows that the 1xXTEN (SEQ ID NO: 171) linker provided increased editing efficiency. Taking the average ˜fold potency relative to PE2 yields the graph shown, indicating that use of the 1×XTEN (SEQ ID NO: 171) linker sequence improves editing efficiency by a factor of 1.14 on average. giving instructions (n=15).

例22.改善された活性を有するプライム編集因子ガイドRNA
種々の態様において、PEgRNAは標的DNA部位および編集依存的であることが蓋然的である。つまり、PEgRNAの配列は、標的DNA配列およびプライム編集によってそれに導入されようとする具体的な編集(例えば、欠失、挿入、逆位、置換)に依存するであろう。例えば、ある態様において、PEgRNAのプライマー結合部位(PBS)の3'のモチーフを取り付けるときには、PE融合タンパク質のポリメラーゼドメイン(例えば、逆転写酵素)との立体的衝突を防止するために、PBSおよびモチーフの間のリンカーが好ましい。しかしながら、そのリンカーの性質は各部位について異なり得る。例えば、同じリンカーが各部位に用いられた場合には、それはスペーサー配列に対する偶然の対形成によって偽性的に13nt PBSを16nt PBSにし得る。類似に、リンカーはPBSそれ自体に塩基対形成し得、その閉じ込めをもたらし、可能性としては活性を縮減する。そのため、PEまたはBE4などのタンパク質に基づく編集因子とは違って、2つのエレメントを接続する単一リンカー配列オプションは各構築物に有効ではなくあり得、部分的には、標的DNA配列および目当ての編集の配列に依存するであろう。
Example 22. Prime editing factor guide RNA with improved activity
In various embodiments, PEgRNA is likely to be target DNA site and editing dependent. Thus, the sequence of the PEgRNA will depend on the target DNA sequence and the specific edit (eg, deletion, insertion, inversion, substitution) being introduced into it by prime editing. For example, in some embodiments, when attaching a motif 3' of the primer binding site (PBS) of PEgRNA, the PBS and the motif are A linker between is preferred. However, the nature of the linker may be different for each site. For example, if the same linker is used at each site, it can pseudo-morph a 13nt PBS into a 16nt PBS by fortuitous pairing to a spacer sequence. Similarly, the linker can base pair to PBS itself, resulting in its confinement and potentially reducing activity. Therefore, unlike protein-based editing factors such as PE or BE4, a single linker sequence option connecting the two elements may not be effective for each construct, in part due to the target DNA sequence and the desired editing will depend on the array.

部分的には、例15(PEgRNAのデザインおよび操作)において提示されている情報に立脚して、この例は、PEgRNAになされた種々の構造改変を構築し、それから、他の側面の中でも編集機能に対するそれの効果を試験した。
非pol IIIプロモーターからのPEgRNAの発現
Building in part on the information presented in Example 15 (PEgRNA Design and Manipulation), this example builds on the various structural modifications made to PEgRNA and then introduces the editing functionality, among other aspects. The effect of it on was tested.
Expression of PEgRNA from non-pol III promoters

種々のPEgRNA発現システムを、PEgRNAを生成するそれらの能力について試験した。読み出しとしてFKBPからの102ヌクレオチド配列の挿入を用いた。 Various PEgRNA expression systems were tested for their ability to produce PEgRNA. A 102 nucleotide sequence insert from FKBP was used as the readout.

PEgRNAの転写はU6プロモーターなどの典型的な恒常的プロモーターによって導かれ得る。U6プロモーターはほとんどのケースではPEgRNAの転写を導くことに有効であるが、U6プロモーターはより長いPEgRNAまたはUリッチなRNAの転写を導くことにはあまり有効ではない。UリッチなRNAストレッチは転写の未成熟な終結を引き起こす。この例は、CMVプロモーターまたはU1プロモーターから発現されるガイドの編集アウトカムをU6プロモーターと比較した。これらのプロモーターは下で提供されるMASC ENEまたはPAN ENEなどの異なるターミネーター配列を要求する。編集の増大がpCMV/MASC-ENEシステムでは観察された。しかしながら、これらのガイドは配列の不完全な挿入をもたらしたが、U6プロモーターでは、完全な挿入がより低いレベルの編集において観察された。図81を見よ。データは、代替的な発現システムが長い挿入にとって有用であり得るという蓋然性を示唆している。 Transcription of PEgRNA can be guided by typical constitutive promoters such as the U6 promoter. Although the U6 promoter is effective in directing the transcription of PEgRNA in most cases, the U6 promoter is less effective in directing the transcription of longer PEgRNAs or U-rich RNAs. U-rich RNA stretches cause premature termination of transcription. This example compared the editing outcomes of guides expressed from the CMV promoter or the U1 promoter to the U6 promoter. These promoters require different terminator sequences such as MASC ENE or PAN ENE provided below. Increased editing was observed in the pCMV/MASC-ENE system. However, these guides resulted in incomplete insertion of sequences, whereas in the U6 promoter, complete insertion was observed at lower levels of editing. See Figure 81. The data suggest that alternative expression systems may be useful for long insertions.

pCMV/MASC-ENE発現システムのヌクレオチド配列は次のとおり(5'から3'の方向)(モチーフの名称はそれが指す領域に直ちに先立って太字である): The nucleotide sequence of the pCMV/MASC-ENE expression system is as follows (5' to 3' direction) (motif names are in bold immediately preceding the region to which they refer):

Figure 2020191234000450
Figure 2020191234000451
Figure 2020191234000452
PEgRNA骨格の改善
Figure 2020191234000450
Figure 2020191234000451
Figure 2020191234000452
Improvement of the PEGRNA backbone

gRNA骨格のいくつもの構造改変をもまた試験した。これらのいずれも編集活性の有意な増大を示さなかった(3.30と比較してX軸の3.30.13から3.30.19において図82を見よ)。しかしながら、このデータは注意する価値がある2つの警告を有する。第1に、このガイドはすでに割と良く働いており、より有効でないガイドが試験される方が良かったであろう。第2に、HEK細胞では、トランスフェクションが割と効率的であり、トランスフェクションされるガイドRNAの量は、必要とされるものと比較して大過剰であるということが注意された(量を、~4~8倍縮減することは編集に対する効果を有さない)。これらの改善は、トランスフェクション効率がより低い他の細胞型で、またはより有効でないガイドによってのみ見られ得る。これらの変化の多くは、他の細胞株においてsgRNA活性を改善するための前例とされる。 Several structural modifications of the gRNA backbone were also tested. None of these showed a significant increase in editing activity (see Figure 82 at 3.30.13 to 3.30.19 on the X-axis compared to 3.30). However, this data has two caveats worth noting. First, this guide already works reasonably well, and it would have been better if a less effective guide was tested. Second, it was noted that in HEK cells, transfection was relatively efficient, and the amount of guide RNA transfected was in large excess compared to that required (the amount , ~4-8x reduction has no effect on editing). These improvements may only be seen in other cell types with lower transfection efficiency or with less effective guides. Many of these changes serve as precedents for improving sgRNA activity in other cell lines.

図82の構築物の配列は次のとおりである:

Figure 2020191234000453
Figure 2020191234000454
Figure 2020191234000455
Figure 2020191234000456
末端モチーフが存在しないかまたは一続きのUで終わらない末端モチーフが存在するかどちらかであるところではいつも、転写物は次のHDVリボザイムを用いて終結させられたということに注意せよ:
GGCCGGCAUGGUCCCAGCCUCCUCGCUGGCGCCGGCUGGGCAACAUGCUUCGGCAUGGCGAAUGGGAC [配列番号3990] The sequence of the construct in Figure 82 is as follows:
Figure 2020191234000453
Figure 2020191234000454
Figure 2020191234000455
Figure 2020191234000456
Note that wherever either a terminal motif was absent or a terminal motif that did not end with a series of U was present, the transcript was terminated using the following HDV ribozyme:
GGCCGGCAUGGUCCCAGCCUCCUCGCUGGCGCCGGCUGGGCAACAUGCUUCGGCAUGGCGAAUGGGAC [SEQ ID NO : 3990 ]

追加のRNAモチーフ
ある種のモチーフ、例えばPEgRNAの3'のHDVリボザイム、またはG四重鎖挿入、P1伸長、鋳型ヘアピン、およびテトラループサークルの詳細については、図82を見よ。これらはその性能を改善するためにPEgRNA上に導入され得る。
Additional RNA Motifs See Figure 82 for details of certain motifs, such as HDV ribozyme 3' of PEgRNA, or G-quadruplex insertions, P1 extensions, template hairpins, and tetraloop circles. These can be introduced onto PEgRNA to improve its performance.

特に、この例は、プライマー結合部位の3'にtRNAモチーフを組み入れることの効果を試験した。このエレメントは複数の可能性ある機能ゆえに選ばれた: In particular, this example tested the effect of incorporating a tRNA motif 3' of the primer binding site. This element was chosen because of its multiple possible functions:

(1)tRNAモチーフは非常に安定なRNAモチーフであり、そのため、可能性としてはPEgRNA分解を縮減し得る; (1) The tRNA motif is a very stable RNA motif and therefore could potentially reduce PEgRNA degradation;

(2)MMLV RTは転写の間にウイルスゲノムをDNAに変換するときのプライマーとしてプロリル-tRNAを用いる。そのため、同じキャップがRTによって結合され得、PEによるPEgRNAの結合、RNA安定性を改善し、PBSをゲノム部位の近接する近位に再び持って来て、可能性としては活性をもまた改善するのではないかと思われた。 (2) MMLV RT uses prolyl-tRNA as a primer when converting the viral genome into DNA during transcription. Therefore, the same cap can be attached by RT, improving binding of PEgRNA by PE, RNA stability, and bringing the PBS back into close proximity to the genomic site, potentially also improving activity. I thought it might be.

これらの構築物では、tRNAのP1(図84を見よ)を伸長した。P1はtRNAの第1のステム/塩基対形成エレメントを言う(図84を見よ)。これは、PEgRNAからのその除去をもたらすであろうP1の5’のtRNAのRNAsePによって媒介される切断を防止するために必要であると信じられた。 In these constructs, tRNA P1 (see Figure 84) was extended. P1 refers to the first stem/base pairing element of the tRNA (see Figure 84). This was believed to be necessary to prevent RNAseP-mediated cleavage of the 5' tRNA of P1, which would result in its removal from PEgRNA.

このデザインでは、tRNAおよびPBSの間の短い3ntリンカーおよび伸長されたP1を有するプロリル-tRNA(コドンCGG)を用いた。種々のtRNAデザインを試験し、編集効率をtRNAキャップを有さないPEgRNAと比較して試験した。図83(HEK3遺伝子の編集を標的化したPE実験を図示する。ニック部位に対して相対的に位置+1における10nt挿入の挿入を特異的に標的化し、PE3を用いた)、図85(FANCF遺伝子の編集を標的化したPE実験を図示する。ニック部位に対して相対的に位置+5におけるGからTの変換を特異的に標的化し、PE3構築物を用いた)、および図86(HEK3遺伝子の編集を標的化したPE実験を図示する。ニック部位に対して相対的に位置+1における71nt FLAGタグ挿入の挿入を特異的に標的化し、PE3構築物を用いた)の比較データを見よ。tRNA修飾されたPEgRNAを未修飾のPEgRNA対照に対して試験した。 This design used prolyl-tRNA (codon CGG) with a short 3nt linker between the tRNA and PBS and an extended P1. Various tRNA designs were tested and editing efficiency was tested compared to PEgRNA without a tRNA cap. Figure 83 (Illustrating PE experiments targeting editing of the HEK3 gene, using PE3 to specifically target the insertion of a 10 nt insertion at position +1 relative to the nick site), Figure 85 (FANCF Figure 86 illustrates PE experiments targeting gene editing (specifically targeting the G to T conversion at position +5 relative to the nick site, using the PE3 construct), and Figure 86 (HEK3 gene Figure 1 illustrates a PE experiment targeting the editing of (using the PE3 construct) specifically targeting the insertion of a 71nt FLAG tag insertion at position +1 relative to the nick site (see comparative data). tRNA modified PEgRNA was tested against unmodified PEgRNA control.

UGG/CGGは用いられたコドンを言い、数は追加されたP1伸長の長さを言い、長は8ntリンカーを指示し、指定なしは3ntリンカーである。 UGG/CGG refers to the codon used, the number refers to the length of the added P1 extension, length indicates an 8nt linker, and unspecified is a 3nt linker.

データは、tRNAの組み入れがより短いPBSの使用を可能化し得るということを示唆している。これは蓋然的には追加の活性改善をもたらすであろう。RNF2のケースでは、用いられたリンカーが、スペーサーに対する改善されたPBS結合と活性のもたらされる逓減とをもたらしたということが可能/蓋然的である。 Data suggest that incorporation of tRNA may allow the use of shorter PBS. This would likely result in additional activity improvements. In the case of RNF2, it is possible/probable that the linker used resulted in improved PBS binding to the spacer and a resulting reduction in activity.

使用されたいくつかの配列: Some arrays used:

HEK3+1 FLAG-タグ挿入、プロリル-tRNA{UGG} P1 ext 5nt、リンカー3nt HEK3+1 FLAG-tag insertion, prolyl-tRNA{UGG} P1 ext 5nt, linker 3nt

GGCCCAGACUGAGCACGUGAGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUGGAGGAAGCAGGGCUUCCUUUCCUCUGCCAUCACUUAUCGUCGUCAUCCUUGUAAUCCGUGCUCAGUCUGUCUGGCGGGGCUCGUUGGUCUAGGGGUAUGAUUCUCGCUUCGGGUGCGAGAGGUCCCGGGUUCAAAUCCCGGACGAGCCCCGCCUUUU[配列番号3902] GGCCCAGACUGAGCACGUGAGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUGGAGGAAGCAGGGCUUCCUUUCCUCUGCCAUCACUUAUCGUCGUCAUCCUUGUAAUCCGUGCUCAGUCUGUCUGGCGGGGCUCGUUGGUCUAGGGGUAUGAUUCCGCUUCGGGUGCGAGAGGUCCCGGGUUCAAAUCCCGGAC GAGCCCCGCCUUUU [SEQ ID NO: 3902]

FANCF+5G→Tプロリル-tRNA{CGG} P1 ext 5nt、リンカー3nt FANCF+5G→T prolyl-tRNA{CGG} P1 ext 5nt, linker 3nt

GGAAUCCCUUCUGCAGCACCGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCGGAAAAGCGAUCAAGGUGCUGCAGAAGGGAUCUGGCGGGGCUCGUUGGUCUAGGGGUAUGAUUCUCGCUUCGGGUGCGAGAGGUCCCGGGUUCAAAUCCCGGACGAGCCCCGCCUUUU[配列番号3903] GGAAUCCCUUCUGCAGCACCGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCGGAAAAGCGAUCAAGGUGCUGCAGAAGGGAUCUGGCGGGGCUCGUUGGUCUAGGGGUAUGAUUCUCGCUUCGGGUGCGAGAGGUCCCGGGUUCAAAUCCCGGACGAGCCCCGCCUUUU [SEQ ID NO: 3903]

HEK3++1 10nt挿入,、プロリル-tRNA{UGG} P1 ext 5nt、リンカー3nt HEK3++1 10nt insertion, prolyl-tRNA{UGG} P1 ext 5nt, linker 3nt

GGCCCAGACUGAGCACGUGAGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGGACCGAGUCGGUCCUCUGCCAUCAAAGCUUCGACCGUGCUCAGUCUUCUGCUCGAGGCGGGGCUCGUUGGUCUAGGGGUAUGAUUCUCGCUUCGGGUGCGAGAGGUCCCGGGUUCAAAUCCCGGACGAGCCCCGCCUCGAGCUUUU[配列番号3904] GGCCCAGACUGAGCACGUGAGUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGGACCGAGUCGGUCCUCUGCCAUCAAAGCUUCGACCGUGCUCAGUCUUCUGCUCGAGGCGGGGCUCGUUGGUCUAGGGGUAUGAUUCUCGCUUCGGGUGCGAGAGGUCCCGGGUUCAAAUCCCGGACGAGCCCCGCCUCGAGCUUUU [SEQ ID NO: 390 4]

図85および86のデータに報告された配列は以下のとおりである:

Figure 2020191234000457
Figure 2020191234000458
Figure 2020191234000459
Figure 2020191234000460
The sequences reported for the data in Figures 85 and 86 are as follows:
Figure 2020191234000457
Figure 2020191234000458
Figure 2020191234000459
Figure 2020191234000460

例23.CDKL5および鎌状赤血球症を修正するためのプライム編集の使用
1412delA変異を有するCDKL5のマウスモデルをデザインするためのPEの使用
CDKL5欠損症障害(CDD)は神経変性疾患であり、最も多くの場合にはサイクリン依存性キナーゼ様5遺伝子の自然突然変異によって引き起こされる。症状は早期小児期に現れ、痙攣発作、不規則な睡眠パターン、胃腸ストレス、および発達遅滞を包含する。1412delAを包含するCDDを引き起こすいくつかの変異は塩基編集によって修正され得ない。しかしながら、プライム編集は全ての塩基から塩基の変化、欠失、および挿入を精密に修正するポテンシャルを有する。1412delA変異へのフォーカスによって、変異を抱くマウスニューロン細胞株(N2A)を確立することを期待して、この例は変異を挿入することができるpegRNAをデザインおよび試験した。これは、変異を修正する可能性として治療学的なpegRNAを大規模スクリーニングすることを許すであろう。究極的なゴールは、1412delA変異を有するCDDマウスモデルまで進展して、治療学的効果を評価する能力があることである。CDDの現行のマウスモデルはヒト化アレルを有さない。しかしながら、pegRNAの最適化がHEK293T細胞においても進行中である。図87および88はpegRNAが1412Adelを組み入れるN2A細胞におけるパイロットスクリーンからの結果であり、プライマー結合部位(PBS)長さおよび逆転写酵素(RT)鋳型長さについての詳細を有する(インデルありおよびなしで示されている)。
Example 23. Using prime editing to correct CDKL5 and sickle cell disease
Use of PE to design a mouse model of CDKL5 with the 1412delA mutation
CDKL5 deficiency disorder (CDD) is a neurodegenerative disease, most often caused by spontaneous mutations in the cyclin-dependent kinase-like 5 gene. Symptoms appear in early childhood and include seizures, irregular sleep patterns, gastrointestinal stress, and developmental delay. Some mutations that cause CDD, including 1412delA, cannot be corrected by base editing. However, prime editing has the potential to precisely correct base changes, deletions, and insertions from all bases. By focusing on the 1412delA mutation, this example designed and tested a pegRNA capable of inserting the mutation, with the hope of establishing a mouse neuronal cell line (N2A) harboring the mutation. This would allow large-scale screening of therapeutic pegRNAs as potential mutation correctors. The ultimate goal is the ability to develop mouse models of CDD carrying the 1412delA mutation to assess therapeutic efficacy. Current mouse models of CDD do not have humanized alleles. However, optimization of pegRNA is also underway in HEK293T cells. Figures 87 and 88 are results from a pilot screen in N2A cells where pegRNA incorporates 1412Adel, with details on primer binding site (PBS) length and reverse transcriptase (RT) template length (with and without indel). It is shown).

鎌状赤血球症(SCA)を処置するためのPEの使用
鎌状赤血球症(SCA)は劣性血液障害であり、β-グロビン遺伝子の位置6におけるグルタミン酸からバリンの変異によって引き起こされる。結果は鎌状赤血球であり、これらは不良な酸素輸送体であり、凝集をしやすい。凝集の症状は生命を脅かし得る。先に、D. LiuラボはDNAプラスミドトランスフェクションによるプライム編集を用いてHEK293T細胞のSCA座位の組み入れおよび修正両方を示す能力があった。造血幹細胞(HSC)はDNAプラスミドトランスフェクションによって編集することが困難であるので、この例はタンパク質およびmRNAヌクレオフェクションによってHSCにおいてPE3システムを試験した。図89は、健康なHSCのβ-グロビン遺伝子の近位(proxy)座位およびHEK3における編集の結果であり、編集因子対pegRNAおよびニッキングgRNAの濃度を変えている。
Use of PE to Treat Sickle Cell Anemia (SCA) Sickle cell anemia (SCA) is a recessive blood disorder caused by a glutamate to valine mutation in position 6 of the β-globin gene. The result is sickle cells, which are poor oxygen transporters and prone to clumping. Symptoms of aggregation can be life-threatening. Previously, the D. Liu lab had the ability to demonstrate both the integration and correction of the SCA locus in HEK293T cells using prime editing by DNA plasmid transfection. Since hematopoietic stem cells (HSCs) are difficult to edit by DNA plasmid transfection, this example tested the PE3 system in HSCs by protein and mRNA nucleofection. Figure 89 is the result of editing at the proxy locus of the β-globin gene and HEK3 in healthy HSCs, varying the concentration of editing factors versus pegRNA and nicking gRNA.

mRNAヌクレオフェクションプロトコール:
編集因子対ガイドの比([編集因子]対[ガイド]比または編集因子:ガイド比)を調整することによって、プロトコールを改善した。
mRNA nucleofection protocol:
The protocol was improved by adjusting the edit factor to guide ratio ([edit factor] to [guide] ratio or edit factor: guide ratio).

ニッキングガイドプロトスペーサー配列は:CCTTGATACCAACCTGCCCA(配列番号3991)であった。 The nicking guide protospacer sequence was: CCTTGATACCAACCTGCCCA (SEQ ID NO: 3991) .

pegRNA配列は:
CATGGTGCACCTGACTCCTGGTTTTAGAGCTAGAAATAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGCACCGAGTCGGTGCAGACTTCTCTTCAGGAGTCAGGTGCACTTT(配列番号3992)であった。
The pegRNA sequence is:
CATGGTGCACCTGACTCCTGGTTTTAGAGCTAGAAATAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGCACCGAGTCGGTGCAGACTTCTCTTCAGGAGTCAGGTGCACTTT (SEQ ID NO: 3992) .

1.CD34+細胞を融解し、X-Vivo15培地においてサイトカイン(SCF、Flt3、およびTPO)によって24hrに渡って予備刺激する。播種密度100万細胞/mL。 1. CD34+ cells are thawed and primed with cytokines (SCF, Flt3, and TPO) in X-Vivo15 medium for 24 hr. Seeding density 1 million cells/mL.

2.次の日に(24hr後に)、CD34+細胞(1×105)をアスピレーションし、PBSによって1回洗浄し(遠心は300gで10minに渡ってRTで行う)、P3溶液(Lonza)に再懸濁する(条件当たり20ul)。 2. The next day (after 24 hr), CD34+ cells (1 x 105) were aspirated, washed once with PBS (centrifuged at 300 g for 10 min at RT) and resuspended in P3 solution (Lonza). (20ul per condition).

3.フード内で、2ugのSpPE2 mRNA、pegRNAおよびsgRNAの組み合わせた1ugを氷上の無菌PCRストリップ上で組み合わせる。体積を20ulに調整する(P3溶液中の細胞+mRNA&gRNAミックス)。 3. In the hood, combine 2ug of SpPE2 mRNA, 1ug of pegRNA and sgRNA combination on a sterile PCR strip on ice. Adjust the volume to 20ul (cells + mRNA&gRNA mix in P3 solution).

4.細胞懸濁液を20uLのLonza4D 16ウェルストリップにピペッティングし、プログラムDS130でエレクトロポレーションする。 Four. Pipette the cell suspension into 20 uL Lonza4D 16-well strips and electroporate with program DS130.

5.エレクトロポレーション後に10から15min待ち、80uLのX-Vivo10+サイトカイン培地を細胞懸濁液に追加し、サイトカインを有する予温したX-Vivo10培地に移入する。 Five. Wait 10-15 min after electroporation, add 80 uL of X-Vivo10+ cytokine medium to the cell suspension and transfer into pre-warmed X-Vivo10 medium with cytokines.

6.細胞をエレクトロポレーションの72時間後に収穫し、細胞回復をチェックし、バルク集団およびソーティングされたCD34+およびCD34+90+集団についても遺伝子型判定する。
野生型CDKL5タンパク質(受託番号NP_001032420)(アイソフォーム1-ヒト)
MKIPNIGNVM NKFEILGVVG EGAYGVVLKC RHKETHEIVA IKKFKDSEEN EEVKETTLRE LKMLRTLKQE NIVELKEAFR RRGKLYLVFE YVEKNMLELL EEMPNGVPPE KVKSYIYQLI KAIHWCHKND IVHRDIKPEN LLISHNDVLK LCDFGFARNL SEGNNANYTE YVATRWYRSP ELLLGAPYGK SVDMWSVGCI LGELSDGQPL FPGESEIDQL FTIQKVLGPL PSEQMKLFYS NPRFHGLRFP AVNHPQSLER RYLGILNSVL LDLMKNLLKL DPADRYLTEQ CLNHPTFQTQ RLLDRSPSRS AKRKPYHVES STLSNRNQAG KSTALQSHHR SNSKDIQNLS VGLPRADEGL PANESFLNGN LAGASLSPLH TKTYQASSQP GSTSKDLTNN NIPHLLSPKE AKSKTEFDFN IDPKPSEGPG TKYLKSNSRS QQNRHSFMES SQSKAGTLQP NEKQSRHSYI DTIPQSSRSP SYRTKAKSHG ALSDSKSVSN LSEARAQIAE PSTSRYFPSS CLDLNSPTSP TPTRHSDTRT LLSPSGRNNR NEGTLDSRRT TTRHSKTMEE LKLPEHMDSS HSHSLSAPHE SFSYGLGYTS PFSSQQRPHR HSMYVTRDKV RAKGLDGSLS IGQGMAARAN SLQLLSPQPG EQLPPEMTVA RSSVKETSRE GTSSFHTRQK SEGGVYHDPH SDDGTAPKEN RHLYNDPVPR RVGSFYRVPS PRPDNSFHEN NVSTRVSSLP SESSSGTNHS KRQPAFDPWK SPENISHSEQ LKEKEKQGFF RSMKKKKKKS QTVPNSDSPD LLTLQKSIHS ASTPSSRPKE WRPEKISDLQ TQSQPLKSLR KLLHLSSASN HPASSDPRFQ PLTAQQTKNS FSEIRIHPLS QASGGSSNIR QEPAPKGRPA LQLPDGGCDG RRQRHHSGPQ DRRFMLRTTE QQGEYFCCGD PKKPHTPCVP NRALHRPISS PAPYPVLQVR GTSMCPTLQV RGTDAFSCPT QQSGFSFFVR HVMREALIHR AQVNQAALLT YHENAALTGK(配列番号3993)

野生型CDKL5タンパク質(受託番号NP_001310218)(アイソフォーム2-ヒト)
MKIPNIGNVM NKFEILGVVG EGAYGVVLKC RHKETHEIVA IKKFKDSEEN EEVKETTLRE LKMLRTLKQE NIVELKEAFR RRGKLYLVFE YVEKNMLELL EEMPNGVPPE KVKSYIYQLI KAIHWCHKND IVHRDIKPEN LLISHNDVLK LCDFGFARNL SEGNNANYTE YVATRWYRSP ELLLGAPYGK SVDMWSVGCI LGELSDGQPL FPGESEIDQL FTIQKVLGPL PSEQMKLFYS NPRFHGLRFP AVNHPQSLER RYLGILNSVL LDLMKNLLKL DPADRYLTEQ CLNHPTFQTQ
RLLDRSPSRS AKRKPYHVES STLSNRNQAG KSTALQSHHR SNSKDIQNLS VGLPRADEGL PANESFLNGN LAGASLSPLH TKTYQASSQP GSTSKDLTNN NIPHLLSPKE AKSKTEFDFN IDPKPSEGPG TKYLKSNSRS QQNRHSFMES SQSKAGTLQP NEKQSRHSYI DTIPQSSRSP SYRTKAKSHG ALSDSKSVSN LSEARAQIAE PSTSRYFPSS CLDLNSPTSP TPTRHSDTRT LLSPSGRNNR NEGTLDSRRT TTRHSKTMEE LKLPEHMDSS HSHSLSAPHE SFSYGLGYTS PFSSQQRPHR HSMYVTRDKV RAKGLDGSLS IGQGMAARAN SLQLLSPQPG EQLPPEMTVARSSVKETSRE GTSSFHTRQK SEGGVYHDPH SDDGTAPKEN RHLYNDPVPR RVGSFYRVPS PRPDNSFHEN NVSTRVSSLP SESSSGTNHS KRQPAFDPWK SPENISHSEQ LKEKEKQGFF RSMKKKKKKS QTVPNSDSPD LLTLQKSIHS ASTPSSRPKE WRPEKISDLQ TQSQPLKSLR KLLHLSSASN HPASSDPRFQ PLTAQQTKNS FSEIRIHPLS QASGGSSNIR QEPAPKGRPA LQLPGQMDPG WHVSSVTRSA TEGPSYSEQL GAKSGPNGHP YNRTNRSRMP NLNDLKETAL(配列番号3994)
6. Cells are harvested 72 hours after electroporation to check cell recovery and also genotype for bulk and sorted CD34+ and CD34+90+ populations.
Wild-type CDKL5 protein (accession number NP_001032420) (isoform 1-human)
MKIPNIGNVM NKFEILGVVG EGAYGVVLKC RHKETHEIVA IKKFKDSEEN EEVKETTLRE LKMLRTLKQE NIVELKEAFR RRGKLYLVFE YVEKNMLELL EEMPNGVPPE KVKSYIYQLI KAIHWCHKND IVHRDIKPEN LLISHNDVLK LCDFGFARNL SEGNNANYTE YVATRWYRSP ELLLGAPYGK SVDMWSVGC I LGELSDGQPL FPGESEIDQL FTIQKVLGPL PSEQMKLFYS NPRFHGLRFP AVNHPQSLER RYLGILNSVL LDLMKNLLKL DPADRYLTEQ CLNHPTFQTQ RLLDRSPSRS AKRKPYHVES STLSNRNQAG KSTALQSHHR SNSKDIQNLS VGLPRADEGL PANESFLNGN LAGASLSPLH TKTYQASSQP GST SKDLTNN NIPHLLSPKE AKSKTEFDFN IDPKPSEGPG TKYLKSNSRS QQNRHSFMES SQSKAGTLQP NEKQSRHSYI DTIPQSSRSP SYRTKAKSHG ALSDSKSVSN LSEARAQIAE PSTSRYFPSS CLDLNSPTSP TPTRHSDTRT LLSPSGRNNR NEGTLDSRRT TTRHSKTMEE LKLPEHMDSS HSHSLSAPHE SFSYGLGYTS PFSSQQRPHR HSMYVTRDKV RAKGLDGSLS IGQGMAARAN SLQLLSPQPG EQLPPEMTVA RSSVKETSRE GTSSFHTRQK SEGGVYHDPH SDDGTAPKEN RHLY NDPVPR RVGSFYRVPS PRPDNSFHEN NVSTRVSSLP SESSSGTNHS KRQPAFDPWK SPENISHSEQ LKEKEKQGFF RSMKKKKKKS QTVPNSDSPD LLTLQKSIHS ASTPSSRPKE WRPEKISDLQ TQSQPLKSLR KLLHLSSASN HPASSDPRFQ PLTAQQTKNS FSEIRIHPLS QASGGSSNIR QEPAPKGRPA LQLPDGGCDG RRQRHHSGPQ DRRFMLRTTE QQGEYFCCGD PKKPHTPCVP NRALHRPISS PAPYPVLQVR GTSMCPTLQV RGTDAFSCPT QQSGFSFFVR HVMREALIHR AQVNQAALLT YHENAALTGK (SEQ ID NO: 3993)

Wild-type CDKL5 protein (accession number NP_001310218) (isoform 2-human)
MKIPNIGNVM NKFEILGVVG EGAYGVVLKC RHKETHEIVA IKKFKDSEEN EEVKETTLRE LKMLRTLKQE NIVELKEAFR RRGKLYLVFE YVEKNMLELL EEMPNGVPPE KVKSYIYQLI KAIHWCHKND IVHRDIKPEN LLISHNDVLK LCDFGFARNL SEGNNANYTE YVATRWYRSP ELLLGAPYGK SVDMWSVGC I LGELSDGQPL FPGESEIDQL FTIQKVLGPL PSEQMKLFYS NPRFHGLRFP AVNHPQSLER RYLGILNSVL LDLMKNLLKL DPADRYLTEQ CLNHPTFQTQ
RLLDRSPSRS AKRKPYHVES STLSNRNQAG KSTALQSHHR SNSKDIQNLS VGLPRADEGL PANESFLNGN LAGASLSPLH TKTYQASSQP GSTSKDLTNN NIPHLLSPKE AKSKTEFDFN IDPKPSEGPG TKYLKSNSRS QQNRHSFMES SQSKAGTLQP NEKQSRHSYI DTIPQSSRSP SYRTKAKSHG ALSDSKSVSN LS EARAQIAE PSTSRYFPSS CLDLNSPTSP TPTRHSDTRT LLSPSGRNNR NEGTLDSRRT TTRHSKTMEE LKLPEHMDSS HSHSLSAPHE SFSYGLGYTS PFSSQQRPHR HSMYVTRDKV RAKGLDGSLS IGQGMAARAN SLQLLSPQPG EQLPPEMTVARSSVKETSRE GTSSFHTRQK SEGGVYHDPH SDDGTAPKEN RHLYNDPVPR RV GSFYRVPS PRPDNSFHEN NVSTRVSSLP SESSSGTNHS KRQPAFDPWK SPENISHSEQ LKEKEKQGFF RSMKKKKKKS QTVPNSDSPD LLTLQKSIHS ASTPSSRPKE WRPEKISDLQ TQSQPLKSLR KLLHLSSASN HPASSDPRFQ PLTAQQTKNS FSEIRIHPLS QASGGSSNIR QEPAPKGRPA LQLPGQMDPG WHVSSVTRSA TEGPSYSEQL GAKSGPNGHP YNRTNRSRMP NLNDLKETAL (SEQ ID NO: 3994)

例24.非糖尿病性慢性腎臓病の処置のために病原性のAOL1アレルを標的化するためのプライム編集の使用
この例は、腎疾患を処置またはそれを発生する蓋然性を縮減するためのプライム編集への使用のための、病原性のAPOL1アレルを標的化することができるPEgRNAをデザインした。
Example 24. Use of Prime Editing to Target Pathogenic AOL1 Alleles for Treatment of Non-Diabetic Chronic Kidney Disease This example uses prime editing to treat kidney disease or reduce the likelihood of developing it. designed a PEgRNA capable of targeting the pathogenic APOL1 allele for use in.

末期腎不全(ESKD)は今や米国の50万超の個人を冒す成長していく問題である。ESKDを有する患者をケアするコストは現行では年当たり400億ドル超である。米国では、アフリカ系血統の対象がESKDを発生するであろう蓋然性はアフリカ家系なしのアメリカ人よりも4から5倍高い。これらの事実は、アフリカ系血統を有するU.S.集団の12~13%とアフリカ系アメリカ人であるU.S.透析患者の40%との間の相違に反映されている。肥満および代謝症候群などの腎疾患リスク因子の流行は、この問題の大きさは増大するのみであろうということを示唆している。 End-stage renal disease (ESKD) is now a growing problem affecting more than 500,000 individuals in the United States. The cost of caring for patients with ESKD currently exceeds $40 billion per year. In the United States, subjects of African descent are four to five times more likely to develop ESKD than Americans without African descent. These facts are reflected in the disparity between the 12-13% of the U.S. population with African ancestry and the 40% of U.S. dialysis patients who are African American. The prevalence of kidney disease risk factors such as obesity and metabolic syndrome suggests that the magnitude of this problem will only increase.

進行性の腎臓病の大多数について、特定の治療はない。いくつかの型の慢性腎疾患進行は特定の薬剤による血圧コントロールによって低速化され得るが、腎臓病医はどの患者が応答するであろうかを正確には予測し得ない。その上、首尾良い処置は典型的には進行を低速化させるが、それは疾患を防止も疾患進行を停止させもしない。 There is no specific treatment for the majority of progressive kidney diseases. Although the progression of some types of chronic kidney disease can be slowed by blood pressure control with certain drugs, nephrologists cannot accurately predict which patients will respond. Moreover, although successful treatment typically slows progression, it neither prevents the disease nor halts disease progression.

最近では、アポリポタンパク質L1(APOL1)のタンパク質配列を変改する特定の遺伝子バリアントは進行性の腎臓病に関連するということが決定された。驚くべきことに、APOL1腎臓病バリアントは、高血圧関連末期腎疾患(H-ESRD)、巣状分節性糸球体硬化症(FSGS)、およびHIV関連腎症(HIVAN)を包含する腎臓病の複数の異なる型に対して主要なインパクトを有する。これらのバリアントAPOL1アレルを有する個人は7~30倍増大したリスクを腎臓病について有する。これらのAPOL1リスクアレルの高い度数に基づくと、350万よりも多くのアフリカ系アメリカ人が蓋然的には高リスクAPOL1遺伝子型を有する。高リスク遺伝子型なしのアフリカ系アメリカ人はヨーロッパ家系のアメリカ人と比較してわずかな余分なリスクしか有さない。 Recently, it was determined that certain genetic variants that alter the protein sequence of apolipoprotein L1 (APOL1) are associated with progressive kidney disease. Remarkably, APOL1 kidney disease variants are associated with multiple kidney diseases including hypertension-associated end-stage renal disease (H-ESRD), focal segmental glomerulosclerosis (FSGS), and HIV-associated nephropathy (HIVAN). It has major impact on different types. Individuals with these variant APOL1 alleles have a 7- to 30-fold increased risk for kidney disease. Based on the high frequency of these APOL1 risk alleles, more than 3.5 million African Americans likely have high-risk APOL1 genotypes. African Americans without high-risk genotypes have only a small extra risk compared to Americans of European ancestry.

APOL1遺伝子のバリアントが腎疾患を引き起こすという証拠にもかかわらず、その産物APOL1の生物学または腎臓におけるその役割については、非常にわずかしか公知ではない。APOL1はトリパノソーマに対する耐性において定められた役割を有し、G1およびG2バリアントはアフリカにおいては普通になっているように見える。なぜなら、それらはアフリカ睡眠病を引き起こすトリパノソーマの形態からの防護を付与するからである。 Despite evidence that variants in the APOL1 gene cause kidney disease, very little is known about the biology of its product APOL1 or its role in the kidney. APOL1 has a defined role in resistance to trypanosomes, and the G1 and G2 variants appear to be common in Africa. This is because they confer protection against the form of trypanosomes that causes African sleeping sickness.

1つ以上のAPOL1リスクアレルを有する患者の腎臓病のための治療の必要がなお存在する。これらは、このおよび他の対象集団において多大な罹患率および死亡率を引き起こし、高い経済的インパクトを有する。 There remains a need for treatments for kidney disease in patients with one or more APOL1 risk alleles. They cause significant morbidity and mortality in this and other target populations and have high economic impact.

この例は、3つの例示のPEgRNAデザインオプションを提供する。APOL1欠陥アレルを修正するためにプライム編集に用いられ得る特定の例示の標的配列に基づく。 This example provides three exemplary PEgRNA design options. Based on specific exemplary target sequences that can be used for prime editing to correct APOL1 defective alleles.

PEgRNA 1 PEgRNA 1

APOL1アレルrs73885319(p.S342G)のPEgRNAをデザインする。これは有疾患個体のG→A修正を表す。標的配列は5-GGAGTCAAGCTCACGGATGTGGCCCCTGTA(GからA)GCTTCTTTCTTGTGCTGGATGTAGTCTACCT-3(配列番号3995)である。 Design PEgRNA for APOL1 allele rs73885319 (p.S342G). This represents a G→A correction in diseased individuals. The target sequence is 5-GGAGTCAAGCTCACGGATGTGGCCCCTGTA (G to A)GCTTCTTTCTTGTGCTGGATGTAGTCTACCT-3 (SEQ ID NO: 3995) .

プロトスペーサー(上の太字)はAAGCTCACGGATGTGGCCCC(配列番号3996)である。選択されたPEはSaCas9(D10A)を含む。 The protospacer (in bold above) is AAGCTCACGGATGTGGCCCC (SEQ ID NO: 3996) . Selected PEs include SaCas9(D10A).

プライマー結合部位は以下であってもよい: Primer binding sites may be:

GTGGCCCC(配列番号3997) GTGGCCCC (SEQ ID NO:3997)

TGTGGCCCC(配列番号3998) TGTGGCCCC (SEQ ID NO: 3998)

ATGTGGCCCC(配列番号3999) ATGTGGCCCC (SEQ ID NO:3999)

GATGTGGCCCC(配列番号4000) GATGTGGCCCC (SEQ ID NO: 4000)

GGATGTGGCCCC(配列番号4001) GGATGTGGCCCC (SEQ ID NO: 4001)

CGGATGTGGCCCC(配列番号4002) CGGATGTGGCCCC (SEQ ID NO: 4002)

ACGGATGTGGCCCC(配列番号4003) ACGGATGTGGCCCC (SEQ ID NO: 4003)

CACGGATGTGGCCCC(配列番号4004) CACGGATGTGGCCCC (SEQ ID NO: 4004)

TCACGGATGTGGCCCC(配列番号4005) TCACGGATGTGGCCCC (SEQ ID NO: 4005)

CTCACGGATGTGGCCCC(配列番号4006) CTCACGGATGTGGCCCC (sequence number 4006) .

RT鋳型は以下であってもよい: RT templates may be:

AAGAAGCTTACA(配列番号4007) AAGAAGCTTACA (SEQ ID NO: 4007)

AAAGAAGCTTACA(配列番号4008) AAAGAAGCTTACA (SEQ ID NO: 4008)

GAAAGAAGCTTACA(配列番号4009) GAAAGAAGCTTACA (SEQ ID NO: 4009)

AGAAAGAAGCTTACA(配列番号4010) AGAAAGAAGCTTACA (SEQ ID NO: 4010)

AAGAAAGAAGCTTACA(配列番号4011) AAGAAAGAAGCTTACA (SEQ ID NO: 4011)

CAAGAAAGAAGCTTACA(配列番号4012) CAAGAAAGAAGCTTACA (SEQ ID NO: 4012)

ACAAGAAAGAAGCTTACA(配列番号4013) ACAAGAAAGAAGCTTACA (SEQ ID NO: 4013)

CACAAGAAAGAAGCTTACA(配列番号4014) CACAAGAAAGAAGCTTACA (SEQ ID NO: 4014)

GCACAAGAAAGAAGCTTACA(配列番号4015) GCACAAGAAAGAAGCTTACA (SEQ ID NO: 4015)

AGCACAAGAAAGAAGCTTACA(配列番号4016) AGCACAAGAAAGAAGCTTACA (SEQ ID NO: 4016)

CAGCACAAGAAAGAAGCTTACA(配列番号4017) CAGCACAAGAAAGAAGCTTACA (SEQ ID NO: 4017)

CCAGCACAAGAAAGAAGCTTACA(配列番号4018) CCAGCACAAGAAAGAAGCTTACA (SEQ ID NO: 4018)

TCCAGCACAAGAAAGAAGCTTACA(配列番号4019) TCCAGCACAAGAAAGAAGCTTACA (SEQ ID NO: 4019)

ATCCAGCACAAGAAAGAAGCTTACA(配列番号4020) ATCCAGCACAAGAAAGAAGCTTACA (SEQ ID NO: 4020) .

ニックを入れる鋳型は、GCTTTGATTCGTACACGAGG(配列番号4021)であってもよい。 The nicking template may be GCTTTGATTCGTACACGAGG (SEQ ID NO: 4021) .

PEgRNA 2 PEgRNA 2

APOL1アレルrs60910145のPEgRNAをデザインする。これは有疾患個体におけるG→T修正を表す。 Design PEgRNA for APOL1 allele rs60910145. This represents a G→T correction in diseased individuals.

プロトスペーサーはGCTGGAGGAGAAGCTAAACA(配列番号4022)である。選択されるPEは、SpCas9(D10A)-NGを含む。 The protospacer is GCTGGAGGAGAAGCTAAACA (SEQ ID NO: 4022) . The selected PE includes SpCas9(D10A)-NG.

プライマー結合部位は以下であってもよい: The primer binding site may be:

GAAGCTAA(配列番号4023) GAAGCTAA (SEQ ID NO: 4023)

AGAAGCTAA(配列番号4024) AGAAGCTAA (SEQ ID NO: 4024)

GAGAAGCTAA(配列番号4025) GAGAAGCTAA (SEQ ID NO: 4025)

GGAGAAGCTAA(配列番号4026) GGAGAAGCTAA (SEQ ID NO: 4026)

AGGAGAAGCTAA(配列番号4027) AGGAGAAGCTAA (SEQ ID NO: 4027)

GAGGAGAAGCTAA(配列番号4028) GAGGAGAAGCTAA (SEQ ID NO: 4028)

GGAGGAGAAGCTAA(配列番号4029) GGAGGAGAAGCTAA (SEQ ID NO: 4029)

TGGAGGAGAAGCTAA(配列番号4030) TGGAGGAGAAGCTAA (SEQ ID NO: 4030)

CTGGAGGAGAAGCTAA(配列番号4031) CTGGAGGAGAAGCTAA (SEQ ID NO: 4031)

GCTGGAGGAGAAGCTAA(配列番号4032) GCTGGAGGAGAAGCTAA (SEQ ID NO: 4032) .

RT鋳型は以下であってもよい(Cでは終われない): The RT template may be (does not end in C):

AGAATGT(配列番号4033) AGAATGT (SEQ ID NO: 4033)

GAGAATGT(配列番号4034) GAGAATGT (SEQ ID NO: 4034)

TGAGAATGT(配列番号4035) TGAGAATGT (SEQ ID NO: 4035)

TTGAGAATGT(配列番号4036) TTGAGAATGT (SEQ ID NO: 4036)

GTTGAGAATGT(配列番号4037) GTTGAGAATGT (SEQ ID NO: 4037)

TGTTGAGAATGT(配列番号4038) TGTTGAGAATGT (SEQ ID NO: 4038)

TTGTTGAGAATGT(配列番号4039) TTGTTGAGAATGT (SEQ ID NO: 4039)

ATTGTTGAGAATGT(配列番号4040) ATTGTTGAGAATGT (SEQ ID NO: 4040)

TATTGTTGAGAATGT(配列番号4041) TATTGTTGAGAATGT (SEQ ID NO: 4041)

TTATTGTTGAGAATGT(配列番号4042) TTATTGTTGAGAATGT (SEQ ID NO: 4042)

ATTATTGTTGAGAATGT(配列番号4043) ATTATTGTTGAGAATGT (SEQ ID NO: 4043)

AATTATTGTTGAGAATGT(配列番号4044) AATTATTGTTGAGAATGT (SEQ ID NO: 4044)

TAATTATTGTTGAGAATGT(配列番号4045) TAATTATTGTTGAGAATGT (SEQ ID NO: 4045)

ATAATTATTGTTGAGAATGT(配列番号4046) ATAATTATTGTTGAGAATGT (SEQ ID NO: 4046) .

ニックを入れる鋳型は以下であってもよい: The nicking mold may be:

CCTGTGGTCACAGTTCTTGG(配列番号4047) CCTGTGGTCACAGTTCTTGG (SEQ ID NO: 4047)

CCACAGGGCAGGGCAGCCAC(配列番号4048) CCACAGGGCAGGGGCAGCCAC (SEQ ID NO: 4048) .

PEgRNA 3 PEgRNA 3

APOL1アレルrs71785313のPEgRNAをデザインする。これは次のとおり挿入を表す:ATTCTCAACAA[挿入:TAATTA]TAAGATTC(配列番号4049) Design PEgRNA for APOL1 allele rs71785313. This represents the insertion as follows: ATTCTCAACAA[insert:TAATTA]TAAGATTC (SEQ ID NO: 4049) .

プロトスペーサーは以下:TCTCAACAATAAGATTCTGC(配列番号4050)であり得る。 The protospacer can be: TCTCAACAATAAGATTCTGC (SEQ ID NO: 4050) .

PEはSaKKH-PE2を含む。 PE includes SaKKH-PE2.

プライマー結合部位は以下であってもよい: Primer binding sites may be:

TTCTCAAC(配列番号4051) TTCTCAAC (SEQ ID NO: 4051)

ATTCTCAAC(配列番号4052) ATTCTCAAC (SEQ ID NO: 4052)

CATTCTCAAC(配列番号4053) CATTCTCAAC (SEQ ID NO: 4053)

ACATTCTCAAC(配列番号4054) ACATTCTCAAC (SEQ ID NO: 4054)

AACATTCTCAAC(配列番号4055) AACATTCTCAAC (SEQ ID NO: 4055)

AAACATTCTCAAC(配列番号4056) AAACATTCTCAAC (SEQ ID NO: 4056)

TAAACATTCTCAAC(配列番号4057) TAAACATTCTCAAC (SEQ ID NO: 4057)

CTAAACATTCTCAAC(配列番号4058) CTAAACATTCTCAAC (SEQ ID NO: 4058)

GCTAAACATTCTCAAC(配列番号4059) GCTAAACATTCTCAAC (SEQ ID NO: 4059)

AGCTAAACATTCTCAAC(配列番号4060) AGCTAAACATTCTCAAC (sequence number 4060) .

RT鋳型は以下であってもよい: RT templates may be:

AATCTTATAATTATT(配列番号4061) AATCTTATAATTATT (SEQ ID NO: 4061)

GAATCTTATAATTATT(配列番号4062) GAATCTTATAATTATT (SEQ ID NO: 4062)

AGAATCTTATAATTATT(配列番号4063) AGAATCTTATAATTATT (SEQ ID NO: 4063)

CAGAATCTTATAATTATT(配列番号4064) CAGAATCTTATAATTATT (SEQ ID NO: 4064)

GCAGAATCTTATAATTATT(配列番号4065) GCAGAATCTTATAATTATT (SEQ ID NO: 4065)

TGCAGAATCTTATAATTATT(配列番号4066) TGCAGAATCTTATAATTATT (SEQ ID NO: 4066)

CTGCAGAATCTTATAATTATT(配列番号4067) CTGCAGAATCTTATAATTATT (SEQ ID NO: 4067)

CCTGCAGAATCTTATAATTATT(配列番号4068) CCTGGAGAATCTTTATAATTATT (SEQ ID NO: 4068)

GCCTGCAGAATCTTATAATTATT(配列番号4069) GCCTGCAGAATCTTATAATTATT (SEQ ID NO: 4069)

CGCCTGCAGAATCTTATAATTATT(配列番号4070) CGCCTGCAGAATCTTATAATTATT (SEQ ID NO: 4070)

CCGCCTGCAGAATCTTATAATTATT(配列番号4071) CCGCCTGCAGAATCTTATAATTATT (SEQ ID NO: 4071)

TCCGCCTGCAGAATCTTATAATTATT(配列番号4072) TCCGCCTGCAGAATCTTATAATTATT (SEQ ID NO: 4072)

GTCCGCCTGCAGAATCTTATAATTATT(配列番号4073) GTCCGCCTGCAGAATCTTATAATTATT (SEQ ID NO: 4073)

GGTCCGCCTGCAGAATCTTATAATTATT(配列番号4074) GGTCCGCCTGCAGAATCTTATAATTATT (SEQ ID NO: 4074) .

ニックを入れる鋳型は以下であってもい: The nicking mold may be:

CCTGTGGTCACAGTTCTTGG(配列番号4047) CCTGTGGTCACAGTTCTTGG (SEQ ID NO: 4047)

CCACAGGGCAGGGCAGCCAC(配列番号4048)
本開示を通して言及された他の参考文献
以下の参考文献は各々、これら全体が参照されることによって本明細書に組み込まれる。

Figure 2020191234000461
Figure 2020191234000462
Figure 2020191234000463
Figure 2020191234000464
Figure 2020191234000465
Figure 2020191234000466
Figure 2020191234000467
Figure 2020191234000468
Figure 2020191234000469
Figure 2020191234000470
Figure 2020191234000471
Figure 2020191234000472
Figure 2020191234000473
Figure 2020191234000474
Figure 2020191234000475
Figure 2020191234000476
CCACAGGGCAGGGGCAGCCAC (SEQ ID NO: 4048) .
Other references mentioned throughout this disclosure
Each of the following references is incorporated herein by reference in its entirety.
Figure 2020191234000461
Figure 2020191234000462
Figure 2020191234000463
Figure 2020191234000464
Figure 2020191234000465
Figure 2020191234000466
Figure 2020191234000467
Figure 2020191234000468
Figure 2020191234000469
Figure 2020191234000470
Figure 2020191234000471
Figure 2020191234000472
Figure 2020191234000473
Figure 2020191234000474
Figure 2020191234000475
Figure 2020191234000476

態様
以下の態様は本開示の範囲内にある。しかも、本開示は、列挙された態様の1以上からの1以上の限定、要素、節、および記述用語(descriptive terms)が、本セクション中に列挙された別の態様中へ導入される、すべてのバリエーション、組み合わせ、および順列を包括する。例えば、列挙された別の態様に従属する、列挙されたいずれの態様も、同じ基本態様に従属する、本セクション中に列挙されたいずれか他の態様中に見出される1以上の限定を包含するように修飾され得る。要素が、例として、マーカッシュ群形式において列挙されたものとして提示されている場合、要素の各下位群もまた開示されており、いずれの要素(単数または複数)も群から除去され得る。一般に、本開示、または本開示の側面が、具体的な要素および/または特色を含むものとして見なされる場合、本発明のある態様または本発明の側面は、かかる要素および/または特色からなるか、あるいは実質的にそれらからなると理解されるはずである。用語「含むこと(comprising)」および「含有すること(containing)」が、オープンであることを意図し、追加の要素またはステップの包含を容認することにもまた留意する。範囲が与えられるとき、エンドポイントも包含される。しかも、別段の指示がないか、またはそれとは別に、文脈および当業者の理解から明らかでない場合に限り、範囲として表現された値は、いずれか具体的な値、または本発明の異なる態様において述べられた範囲内の部分範囲を、文脈が明確に別段の指図をしない限り範囲の下限の単位の10倍まで、想定し得る。
群1.態様1~212
1.融合タンパク質であって、核酸プログラム型DNA結合タンパク質(napDNAbp)および逆転写酵素を含む。
2.態様1の融合タンパク質であって、融合タンパク質が、伸長されたガイドRNAの存在下において、プライム標的にプライムされた逆転写によるゲノム編集を実行することができる。
3.態様1の融合タンパク質であって、napDNAbpがニッカーゼ活性を有する。
4.態様1の融合タンパク質であって、napDNAbpがCas9タンパク質またはそのバリアントである。
5.態様1の融合タンパク質であって、napDNAbpがヌクレアーゼ活性Cas9、ヌクレアーゼ不活性型Cas9(dCas9)、またはCas9ニッカーゼ(nCas9)である。
6.態様1の融合タンパク質であって、napDNAbpがCas9ニッカーゼ(nCas9)である。
7.態様1の融合タンパク質であって、napDNAbpが:Cas9、CasX、CasY、Cpf1、C2c1、C2c2、C2C3、およびアルゴノートからなる群から選択され、任意にニッカーゼ活性を有する。
8.態様1の融合タンパク質であって、融合タンパク質が伸長されたガイドRNAと複合体化したときに標的DNA配列に結合することができる。
9.態様8の融合タンパク質であって、標的DNA配列が標的鎖および相補的な非標的鎖を含む。
10.態様8の融合タンパク質であって、伸長されたガイドRNAと複合体化した融合タンパク質の結合がRループを形成する。
11.態様10の融合タンパク質であって、Rループが、(i)伸長されたガイドRNAと標的鎖とを含むRNA-DNAハイブリッド、および(ii)相補的な非標的鎖を含む。
12.態様11の融合タンパク質であって、相補的な非標的鎖がニッキングされて、遊離の3’端を有する逆転写酵素プライム配列を形成する。
13.態様2の融合タンパク質であって、伸長されたガイドRNAが(a)ガイドRNAおよび(b)ガイドRNAの5'もしくは3’端またはガイドRNAの分子内の位置付けにおけるRNA伸長を含む。
14.態様13の融合タンパク質であって、RNA伸長が(i)所望のヌクレオチド変化を含む逆転写鋳型配列、(ii)逆転写プライマー結合部位、および(iii)任意にリンカー配列を含む。
15.態様14の融合タンパク質であって、逆転写鋳型配列が、ニック部位に隣接する内生DNA配列に対して相補的である一本鎖DNAフラップをコードし、一本鎖DNAフラップが所望のヌクレオチド変化を含む。
16.態様13の融合タンパク質であって、RNA伸長が、長さが少なくとも5ヌクレオチド、少なくとも6ヌクレオチド、少なくとも7ヌクレオチド、少なくとも8ヌクレオチド、少なくとも9ヌクレオチド、少なくとも10ヌクレオチド、少なくとも11ヌクレオチド、少なくとも12ヌクレオチド、少なくとも13ヌクレオチド、少なくとも14ヌクレオチド、少なくとも15ヌクレオチド、少なくとも16ヌクレオチド、少なくとも17ヌクレオチド、少なくとも18ヌクレオチド、少なくとも19ヌクレオチド、少なくとも20ヌクレオチド、少なくとも21ヌクレオチド、少なくとも22ヌクレオチド、少なくとも23ヌクレオチド、少なくとも24ヌクレオチド、または少なくとも25ヌクレオチドである。
17.態様15の融合タンパク質であって、一本鎖DNAフラップがニック部位に隣接する内生DNA配列にハイブリダイズし、それによって所望のヌクレオチド変化を組み入れる。
18.態様15の融合タンパク質であって、一本鎖DNAフラップが、遊離の5'端を有しかつニック部位に隣接する内生DNA配列に取って代わる。
19.態様18の融合タンパク質であって、5'端を有する内生DNA配列が細胞によって切除される。
20.態様18の融合タンパク質であって、一本鎖DNAフラップの細胞性修復が所望のヌクレオチド変化の組み入れをもたらし、それによって所望の産物を形成する。
21.態様14の融合タンパク質であって、所望のヌクレオチド変化がPAM配列の約-4から+10の間もしくはPAM配列の約-10から+20の間もしくはPAM配列の約-20から+40の間もしくはPAM配列の約-30から+100の間である編集窓上に組み入れされるか、または所望のヌクレオチド変化がニック部位の少なくとも1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、もしくは100ヌクレオチド下流に組み入れされる。
22.態様1の融合タンパク質であって、napDNAbpが、配列番号18のアミノ酸配列、または配列番号18のアミノ酸配列と少なくとも80%、85%、90%、95%、98%、もしくは99%同一であるアミノ酸配列を含む。
23.態様1の融合タンパク質であって、napDNAbpが、配列番号18~88、126、130、137、141、147、153、157、445、460、467、および482~487のいずれか1つのアミノ酸配列と少なくとも80%、85%、90%、95%、98%、または99%同一であるアミノ酸配列を含む。
24.態様1の融合タンパク質であって、逆転写酵素が配列番号89~100、105~122、128~129、132、139、143、149、154、159、235、454、471、516、662、700、701~716、739~741、および766のアミノ酸配列のいずれか1つを含む。
25.態様1の融合タンパク質であって、逆転写酵素が、配列番号89~100、105~122、128~129、132、139、143、149、154、159、235、454、471、516、662、700、701~716、739~741、および766のいずれか1つのアミノ酸配列と少なくとも80%、85%、90%、95%、98%、または99%同一であるアミノ酸配列を含む。
26.態様1の融合タンパク質であって、逆転写酵素が、レトロウイルスまたはレトロトランスポゾンからの天然に存在する逆転写酵素である。
27.先の態様のいずれか1つの融合タンパク質であって、融合タンパク質が構造NH2-[napDNAbp]-[逆転写酵素]-COOH;またはNH2-[逆転写酵素]-[napDNAbp]-COOHを含み、「]-[」の夫々のものが任意のリンカー配列の存在を指示する。
28.態様27の融合タンパク質であって、リンカー配列が配列番号127、165~176、446、453、および767~769のアミノ酸配列を含む。
29.態様14の融合タンパク質であって、所望のヌクレオチド変化が、1ヌクレオチド変化、1つ以上のヌクレオチドの挿入、または1つ以上のヌクレオチドの欠失である。
30.態様29の融合タンパク質であって、挿入または欠失が少なくとも1、少なくとも2、少なくとも3、少なくとも4、少なくとも5、少なくとも6、少なくとも7、少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも16、少なくとも17、少なくとも18、少なくとも19、少なくとも20、少なくとも21、少なくとも22、少なくとも23、少なくとも24、少なくとも25、少なくとも26、少なくとも27、少なくとも28、少なくとも29、少なくとも30、少なくとも31、少なくとも32、少なくとも33、少なくとも34、少なくとも35、少なくとも36、少なくとも37、少なくとも38、少なくとも39、少なくとも40、少なくとも41、少なくとも42、少なくとも43、少なくとも44、少なくとも45、少なくとも46、少なくとも47、少なくとも48、少なくとも49、または少なくとも50である。
31.ガイドRNAと少なくとも1つのRNA伸長とを含む伸長されたガイドRNA。
32.態様1の伸長されたガイドRNAであって、RNA伸長が、ガイドRNAの3'もしくは5'端またはガイドRNAの分子内の位置の位置である。
33.態様31の伸長されたガイドRNAであって、伸長されたガイドRNAが、napDNAbpに結合することおよびnapDNAbpを標的DNA配列へと導くことができる。
34.態様33の伸長されたガイドRNAであって、標的DNA配列が標的鎖および相補的な非標的鎖を含み、ガイドRNAが標的鎖にハイブリダイズしてRNA-DNAハイブリッドおよびRループを形成する。
35.態様31の伸長されたガイドRNAであって、少なくとも1つのRNA伸長が、(i)逆転写鋳型配列、(ii)逆転写プライマー結合部位、および(iii)任意にリンカー配列を含む。
36.態様35の伸長されたガイドRNAであって、RNA伸長が、長さが少なくとも5ヌクレオチド、少なくとも6ヌクレオチド、少なくとも7ヌクレオチド、少なくとも8ヌクレオチド、少なくとも9ヌクレオチド、少なくとも10ヌクレオチド、少なくとも11ヌクレオチド、少なくとも12ヌクレオチド、少なくとも13ヌクレオチド、少なくとも14ヌクレオチド、少なくとも15ヌクレオチド、少なくとも16ヌクレオチド、少なくとも17ヌクレオチド、少なくとも18ヌクレオチド、少なくとも19ヌクレオチド、少なくとも20ヌクレオチド、少なくとも21ヌクレオチド、少なくとも22ヌクレオチド、少なくとも23ヌクレオチド、少なくとも24ヌクレオチド、または少なくとも25ヌクレオチドである。
37.態様35の伸長されたガイドRNAであって、逆転写鋳型配列が、長さが少なくとも3ヌクレオチド、少なくとも4ヌクレオチド、少なくとも5ヌクレオチド、少なくとも6ヌクレオチド、少なくとも7ヌクレオチド、少なくとも8ヌクレオチド、少なくとも9ヌクレオチド、少なくとも10ヌクレオチド、少なくとも11ヌクレオチド、少なくとも12ヌクレオチド、少なくとも13ヌクレオチド、少なくとも14ヌクレオチド、または少なくとも15ヌクレオチドである。
38.態様35の伸長されたガイドRNAであって、逆転写プライマー結合部位配列が、長さが少なくとも3ヌクレオチド、少なくとも4ヌクレオチド、少なくとも5ヌクレオチド、少なくとも6ヌクレオチド、少なくとも7ヌクレオチド、少なくとも8ヌクレオチド、少なくとも9ヌクレオチド、少なくとも10ヌクレオチド、少なくとも11ヌクレオチド、少なくとも12ヌクレオチド、少なくとも13ヌクレオチド、少なくとも14ヌクレオチド、または少なくとも15ヌクレオチドである。
39.態様35の伸長されたガイドRNAであって、任意のリンカー配列が、長さが少なくとも3ヌクレオチド、少なくとも4ヌクレオチド、少なくとも5ヌクレオチド、少なくとも6ヌクレオチド、少なくとも7ヌクレオチド、少なくとも8ヌクレオチド、少なくとも9ヌクレオチド、少なくとも10ヌクレオチド、少なくとも11ヌクレオチド、少なくとも12ヌクレオチド、少なくとも13ヌクレオチド、少なくとも14ヌクレオチド、または少なくとも15ヌクレオチドである。
40.態様35の伸長されたガイドRNAであって、逆転写鋳型配列が、ニック部位に隣接する内生DNA配列に対して相補的である一本鎖DNAフラップをコードし、一本鎖DNAフラップが所望のヌクレオチド変化を含む。
41.態様40の伸長されたガイドRNAであって、一本鎖DNAフラップが、ニッキングされた標的DNA配列上の5'端を有する内生一本鎖DNAを押し除け、内生一本鎖DNAがニック部位の下流において直ちに隣接する。
42.態様41の伸長されたガイドRNAであって、遊離の5'端を有する内生一本鎖DNAが細胞によって切除される。
43.態様41の伸長されたガイドRNAであって、一本鎖DNAフラップの細胞性修復が、所望のヌクレオチド変化の組み入れをもたらし、それによって所望の産物を形成する。
44.態様31の伸長されたガイドRNAであって、配列番号394、429~442、641~649、678~692、2997~3103、3113~3121、3305~3455、3479~3493、3522~3556、3628~3698、および3755~3810のヌクレオチド配列、または配列番号394、429~442、641~649、678~692、2997~3103、3113~3121、3305~3455、3479~3493、3522~3556、3628~3698、および3755~3810のいずれか1つとの少なくとも85%もしくは少なくとも90%もしくは少なくとも95%もしくは少なくとも98%もしくは少なくとも99%配列同一性を有するヌクレオチド配列を含む。
45.態様35の伸長されたガイドRNAであって、逆転写鋳型配列が、内生DNA標的と少なくとも80%または85%または90%または95%または99%同一であるヌクレオチド配列を含む。
46.態様35の伸長されたガイドRNAであって、逆転写プライマー結合部位が、カットされたDNAの遊離の3'端とハイブリダイズする。
47.態様35の伸長されたガイドRNAであって、任意のリンカー配列が、長さが少なくとも1ヌクレオチド、または少なくとも2、少なくとも3、少なくとも4、少なくとも5、少なくとも6、少なくとも7、少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、または少なくとも15ヌクレオチドである。
48.態様1~30のいずれか1つの融合タンパク質と伸長されたガイドRNAとを含むことを含む複合体。
49.態様48の複合体であって、伸長されたガイドRNAが、ガイドRNAと、ガイドRNAの3'もしくは5'端またはガイドRNAの分子内の位置におけるRNA伸長とを含む。
50.態様48の複合体であって、伸長されたガイドRNAが、napDNAbpに結合することおよびnapDNAbpを標的DNA配列へと導くことができる。
51.態様50の複合体であって、標的DNA配列が標的鎖および相補的な非標的鎖を含み、ガイドRNAが標的鎖にハイブリダイズして、RNA-DNAハイブリッドおよびRループを形成する。
52.態様49の複合体であって、少なくとも1つのRNA伸長が、(i)逆転写鋳型配列、(ii)逆転写プライマー結合部位、および(iii)任意にリンカー配列を含む。
53.態様48の複合体であって、伸長されたガイドRNAが、配列番号18~36のヌクレオチド配列、または配列番号18~36のいずれか1つとの少なくとも85%、もしくは少なくとも90%、もしくは少なくとも95%、もしくは少なくとも98%、もしくは少なくとも99%配列同一性を有するヌクレオチド配列を含む。
54.態様52の複合体であって、逆転写鋳型配列が、内生DNA標的との少なくとも80%または85%または90%または95%または99%配列同一性を有するヌクレオチド配列を含む。
55.態様52の複合体であって、逆転写プライマー結合部位が、カットされたDNAの遊離の3'端とハイブリダイズする。
56.napDNAbpおよび伸長されたガイドRNAを含むことを含む複合体。
57.態様56の複合体であって、napDNAbpがCas9ニッカーゼである。
58.態様56の複合体であって、napDNAbpが、配列番号18のアミノ酸配列、または配列番号18との少なくとも80%、85%、90%、95%、98%、もしくは99%配列同一性を有するアミノ酸配列を含む。
59.態様57の複合体であって、napDNAbpが、配列番号18~88、126、130、137、141、147、153、157、445、460、467、および482~487のいずれか1つのアミノ酸配列との少なくとも80%、85%、90%、95%、98%、または99%配列同一性を有するアミノ酸配列を含む。
60.態様57の複合体であって、伸長されたガイドRNAが、ガイドRNAと、ガイドRNAの3'もしくは5'端またはガイドRNAの分子内の位置におけるRNA伸長とを含む。
61.態様57の複合体であって、伸長されたガイドRNAがnapDNAbpを標的DNA配列へと導くことができる。
62.態様61の複合体であって、標的DNA配列が標的鎖および相補的な非標的鎖を含み、スペーサー配列が標的鎖にハイブリダイズして、RNA-DNAハイブリッドおよびRループを形成する。
63.態様61の複合体であって、RNA伸長が、(i)逆転写鋳型配列、(ii)逆転写プライマー結合部位、および(iii)任意にリンカー配列を含む。
64.態様57の複合体であって、伸長されたガイドRNAが、配列番号394、429~442、641~649、678~692、2997~3103、3113~3121、3305~3455、3479~3493、3522~3556、3628~3698、および3755~3810のヌクレオチド配列、または配列番号394、429~442、641~649、678~692、2997~3103、3113~3121、3305~3455、3479~3493、3522~3556、3628~3698、および3755~3810のいずれか1つとの少なくとも85%、もしくは少なくとも90%、もしくは少なくとも95%、もしくは少なくとも98%、もしくは少なくとも99%配列同一性を有するヌクレオチド配列を含む。
65.態様63の複合体であって、逆転写鋳型配列が、内生DNA標的と少なくとも80%または85%または90%または95%または99%同一であるヌクレオチド配列を含む。
66.態様63の複合体であって、逆転写プライマー結合部位が、カットされたDNAの遊離の3'端とハイブリダイズする。
67.態様63の複合体であって、任意のリンカー配列が、長さが少なくとも1ヌクレオチド、または少なくとも2、少なくとも3、少なくとも4、少なくとも5、少なくとも6、少なくとも7、少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、または少なくとも15ヌクレオチドである。
68.態様1~30のいずれかの融合タンパク質をコードするポリヌクレオチド。
69.態様68のポリヌクレオチドを含むベクター。
70.態様1~30のいずれかの融合タンパク質と融合タンパク質のnapDNAbpに結合した伸長されたガイドRNAとを含む細胞。
71.態様48~67のいずれか1つの複合体を含む細胞。
72.(i)態様1~30のいずれかの融合タンパク質、態様48~67の複合体、態様68のポリヌクレオチド、または態様69のベクター;および(ii)薬学的に許容される賦形剤を含む医薬組成物。
73.(i)態様48~67の複合体、(ii)トランスで提供される逆転写酵素;および(iii)薬学的に許容される賦形剤を含む医薬組成物。
74.キットであって:(i)態様1~30のいずれか1つの融合タンパク質をコードする核酸配列;および(ii)(i)の配列の発現を駆動するプロモーターを含む核酸構築物を含む。
75.所望のヌクレオチド変化を二本鎖DNA配列に組み入れるための方法であって、方法が:
(i)融合タンパク質および伸長されたガイドRNAを含む複合体と二本鎖DNA配列を接触させ、融合タンパク質がnapDNAbpおよび逆転写酵素を含み、伸長されたガイドRNAが所望のヌクレオチド変化を含む逆転写鋳型配列を含むこと;
(ii)非標的鎖上において二本鎖DNA配列にニッキングし、それによって3'端を有する遊離の一本鎖DNAを生成すること;
(iii)遊離の一本鎖DNAの3'端を逆転写鋳型配列にハイブリダイズさせ、それによって逆転写酵素ドメインをプライムすること;
(iv)3'端からDNAの鎖を重合し、それによって所望のヌクレオチド変化を含む一本鎖DNAフラップを生成すること;
(v)カットされた部位に隣接する内生DNA鎖を一本鎖DNAフラップによって置き換え、それによって所望のヌクレオチド変化を二本鎖DNA配列に組み入れること、
を含む。
76.態様75の方法であって、(v)置き換えるステップが:(i)一本鎖DNAフラップをカットされた部位に隣接する内生DNA鎖にハイブリダイズさせて、配列ミスマッチを生出すること;(ii)内生DNA鎖を切り出すこと;および(iii)ミスマッチを修復して、所望のヌクレオチド変化をDNAの両方の鎖に含む所望の産物を形成すること、を含む。
77.態様76の方法であって、所望のヌクレオチド変化が1ヌクレオチド置換、欠失、または挿入である。
78.態様77の方法であって、1ヌクレオチド置換がトランジションまたはトランスバージョンである。
79.態様76の方法であって、所望のヌクレオチド変化が、(1)GからTの置換、(2)GからAの置換、(3)GからCの置換、(4)TからGの置換、(5)TからAの置換、(6)TからCの置換、(7)CからGの置換、(8)CからTの置換、(9)CからAの置換、(10)AからTの置換、(11)AからGの置換、または(12)AからCの置換である。
80.態様76の方法であって、所望のヌクレオチド(nucleoid)変化が、(1)G:C塩基対をT:A塩基対に、(2)G:C塩基対をA:T塩基対に、(3)G:C塩基対をC:G塩基対に、(4)T:A塩基対をG:C塩基対に、(5)T:A塩基対をA:T塩基対に、(6)T:A塩基対をC:G塩基対に、(7)C:G塩基対をG:C塩基対に、(8)C:G塩基対をT:A塩基対に、(9)C:G塩基対をA:T塩基対に、(10)A:T塩基対をT:A塩基対に、(11)A:T塩基対をG:C塩基対に、または(12)A:T塩基対をC:G塩基対に変換する。
81.態様76の方法であって、所望のヌクレオチド変化が1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、または25ヌクレオチドの挿入または欠失である。
82.態様76の方法であって、所望のヌクレオチド変化が疾患関連遺伝子を修正する。
83.態様82の方法であって、疾患関連遺伝子が:アデノシンデアミナーゼ(ADA)欠損症;アルファ-1アンチトリプシン欠損症;嚢胞性線維症;デュシェンヌ型筋ジストロフィー;ガラクトース血症;ヘモクロマトーシス;ハンチントン病;メープルシロップ尿症;マルファン症候群;1型神経線維腫症;先天性爪肥厚症;フェニルケトン尿症;重症複合免疫不全;鎌状赤血球症;スミス・レムリ・オピッツ症候群;およびテイ・サックス病からなる群から選択される単一遺伝子障害に関連する。
84.態様82の方法であって、疾患関連遺伝子が:心臓病;高血圧;アルツハイマー病;関節炎;糖尿病;がん;および肥満からなる群から選択される多遺伝子性障害に関連する。
85.態様76の方法であって、napDNAbpが、ヌクレアーゼ不活性型Cas9(dCas9)、Cas9ニッカーゼ(nCas9)、またはヌクレアーゼ活性Cas9である。
86.態様76の方法であって、napDNAbpが配列番号18のアミノ酸配列を含む。
87.態様76の方法であって、napDNAbpが、配列番号18~88、126、130、137、141、147、153、157、445、460、467、および482~487のいずれか1つのアミノ酸配列との少なくとも80%、85%、90%、95%、98%、または99%配列同一性を有するアミノ酸配列を含む。
88.態様76の方法であって、逆転写酵素が配列番号89~100、105~122、128~129、132、139、143、149、154、159、235、454、471、516、662、700、701~716、739~741、および766のアミノ酸配列のいずれか1つを含む。
89.態様76の方法であって、逆転写酵素ドメインが、配列番号89~100、105~122、128~129、132、139、143、149、154、159、235、454、471、516、662、700、701~716、739~741、および766のいずれか1つのアミノ酸配列との少なくとも80%、85%、90%、95%、98%、または99%配列同一性を有するアミノ酸配列を含む。
90.態様76の方法であって、伸長されたガイドRNAが、ガイドRNAの5'もしくは3'端または分子内の位置付けにおけるRNA伸長を含み、RNA伸長が逆転写鋳型配列を含む。
91.態様90の方法であって、RNA伸長が、長さが少なくとも5ヌクレオチド、少なくとも6ヌクレオチド、少なくとも7ヌクレオチド、少なくとも8ヌクレオチド、少なくとも9ヌクレオチド、少なくとも10ヌクレオチド、少なくとも11ヌクレオチド、少なくとも12ヌクレオチド、少なくとも13ヌクレオチド、少なくとも14ヌクレオチド、少なくとも15ヌクレオチド、少なくとも16ヌクレオチド、少なくとも17ヌクレオチド、少なくとも18ヌクレオチド、少なくとも19ヌクレオチド、少なくとも20ヌクレオチド、少なくとも21ヌクレオチド、少なくとも22ヌクレオチド、少なくとも23ヌクレオチド、少なくとも24ヌクレオチド、または少なくとも25ヌクレオチドである。
92.態様76の方法であって、伸長されたガイドRNAが、配列番号394、429~442、641~649、678~692、2997~3103、3113~3121、3305~3455、3479~3493、3522~3556、3628~3698、および3755~3810からなる群から選択されるヌクレオチド配列を有する。
93.標的座位におけるDNA分子のヌクレオチド配列の1つ以上の変化を導入するための方法であって:
(i)核酸プログラム型DNA結合タンパク質(napDNAbp)およびnapDNAbpを標的座位へと標的化するガイドRNAとDNA分子を接触させ、ガイドRNAが少なくとも1つの所望のヌクレオチド変化を含む逆転写酵素(RT)鋳型配列を含むこと;
(ii)標的座位におけるDNA鎖の暴露された3’端を形成すること;
(iii)暴露された3'端をRT鋳型配列にハイブリダイズさせて逆転写をプライムすること;
(vi)逆転写酵素によって、RT鋳型配列に基づく少なくとも1つの所望のヌクレオチド変化を含む一本鎖DNAフラップを合成すること;および
(v)少なくとも1つの所望のヌクレオチド変化を対応する内生DNA上に組み込み、それによって、標的座位においてDNA分子のヌクレオチド配列の1つ以上の変化を導入すること、
を含む。
94.態様93の方法であって、ヌクレオチド配列の1つ以上の変化がトランジションを含む。
95.態様94の方法であって、トランジションが:(a)TからC;(b)AからG;(c)CからT;および(d)GからAからなる群から選択される。
96.態様93の方法であって、ヌクレオチド配列の1つ以上の変化がトランスバージョンを含む。
97.態様96の方法であって、トランスバージョンが、(a)TからA;(b)TからG;(c)CからG;(d)CからA;(e)AからT;(f)AからC;(g)GからC;および(h)GからTからなる群から選択される。
98.態様93の方法であって、ヌクレオチド配列の1つ以上の変化が、(1)G:C塩基対をT:A塩基対に、(2)G:C塩基対をA:T塩基対に、(3)G:C塩基対をC:G塩基対に、(4)T:A塩基対をG:C塩基対に、(5)T:A塩基対をA:T塩基対に、(6)T:A塩基対をC:G塩基対に、(7)C:G塩基対をG:C塩基対に、(8)C:G塩基対をT:A塩基対に、(9)C:G塩基対をA:T塩基対に、(10)A:T塩基対をT:A塩基対に、(11)A:T塩基対をG:C塩基対に、または(12)A:T塩基対をC:G塩基対に変化させることを含む。
99.態様93の方法であって、ヌクレオチド配列の1つ以上の変化が、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、または25ヌクレオチドの挿入または欠失を含む。
100.態様93の方法であって、ヌクレオチド配列の1つ以上の変化が疾患関連遺伝子の修正を含む。
101.態様100の方法であって、疾患関連遺伝子が:アデノシンデアミナーゼ(ADA)欠損症;アルファ-1アンチトリプシン欠損症;嚢胞性線維症;デュシェンヌ型筋ジストロフィー;ガラクトース血症;ヘモクロマトーシス;ハンチントン病;メープルシロップ尿症;マルファン症候群;1型神経線維腫症;先天性爪肥厚症;フェニルケトン尿症;重症複合免疫不全;鎌状赤血球症;スミス・レムリ・オピッツ症候群;およびテイ・サックス病からなる群から選択される単一遺伝子障害に関連する。
102.態様100の方法であって、疾患関連遺伝子が:心臓病;高血圧;アルツハイマー病;関節炎;糖尿病;がん;および肥満からなる群から選択される多遺伝子性障害に関連する。
103.態様93の方法であって、napDNAbpがヌクレアーゼ活性Cas9またはそのバリアントである。
104.態様93の方法であって、napDNAbpがヌクレアーゼ不活性型Cas9(dCas9)もしくはCas9ニッカーゼ(nCas9)またはそのバリアントである。
105.態様93の方法であって、napDNAbpが配列番号18のアミノ酸配列を含む。
106.態様93の方法であって、napDNAbpが、配列番号18~88、126、130、137、141、147、153、157、445、460、467、および482~487のいずれか1つのアミノ酸配列との少なくとも80%、85%、90%、95%、98%、または99%配列同一性を有するアミノ酸配列を含む。
107.態様93の方法であって、逆転写酵素がトランスで導入される。
108.態様93の方法であって、napDNAbpが逆転写酵素への融合体を含む。
109.態様93の方法であって、逆転写酵素が配列番号89~100、105~122、128~129、132、139、143、149、154、159、235、454、471、516、662、700、701~716、739~741、および766のアミノ酸配列のいずれか1つを含む。
110.態様93の方法であって、逆転写酵素が、配列番号89~100、105~122、128~129、132、139、143、149、154、159、235、454、471、516、662、700、701~716、739~741、および766のいずれか1つのアミノ酸配列との少なくとも80%、85%、90%、95%、98%、または99%配列同一性を有するアミノ酸配列を含む。
111.態様93の方法であって、標的座位におけるDNA鎖の暴露された3’端を形成するステップが、ヌクレアーゼによってDNA鎖へニックを入れることを含む。
112.態様111の方法であって、ヌクレアーゼがnapDNAbpであるか、napDNAbpの融合ドメインとして提供されるか、またはトランスで提供される。
113.態様93の方法であって、標的座位におけるDNA鎖の暴露された3’端を形成するステップが、DNA鎖を化学的薬剤と接触させることを含む。
114.態様93の方法であって、標的座位におけるDNA鎖の暴露された3’端を形成するステップが、複製エラーを導入することを含む。
115.態様93の方法であって、DNA分子をnapDNAbpおよびガイドRNAと接触させるステップがRループを形成する。
116.態様115の方法であって、暴露された3’端が形成されるDNA鎖がRループ上にある。
117.態様93の方法であって、ガイドRNAが、逆転写酵素(RT)鋳型配列を含む伸長された部分を含む。
118.態様117の方法であって、伸長された部分が、ガイドRNAの3’端、ガイドRNAの5'端、またはガイドRNAの分子内の位置にある。
119.態様93の方法であって、ガイドRNAがさらにプライマー結合部位を含む。
120.態様93の方法であって、ガイドRNAがさらにスペーサー配列を含む。
121.態様93の方法であって、RT鋳型配列が、対応する内生DNAに対して相同的である。
122.プライム標的にプライムされた逆転写によって標的座位におけるDNA分子のヌクレオチド配列の1つ以上の変化を導入するための方法であって、方法が:(a)標的座位におけるDNA分子を(i)核酸プログラム型DNA結合タンパク質(napDNAbp)および逆転写酵素を含む融合タンパク質ならびに(ii)所望のヌクレオチド変化を含むRT鋳型を含むガイドRNAと接触させること;(b)RT鋳型のプライム標的にプライムされた逆転写を行なって、所望のヌクレオチド変化を含む一本鎖DNAを生成すること;ならびに(c)DNA修復および/または複製プロセスによって標的座位におけるDNA分子上に所望のヌクレオチド変化を組み込むことを含む。
123.態様122の方法であって、RT鋳型が、ガイドRNAの3'端、ガイドRNAの5'端、またはガイドRNAの分子内の位置付けに位置付けられる。
124.態様122の方法であって、所望のヌクレオチド変化が、トランジション、トランスバージョン、挿入、もしくは欠失、またはそれらのいずれかの組み合わせを含む。
125.態様122の方法であって、所望のヌクレオチド変化が:(a)TからC;(b)AからG;(c)CからT;および(d)GからAからなる群から選択されるトランジションを含む。
126.態様122の方法であって、所望のヌクレオチド変化が:(a)TからA;(b)TからG;(c)CからG;(d)CからA;(e)AからT;(f)AからC;(g)GからC;および(h)GからTからなる群から選択されるトランスバージョンを含む。
127.態様122の方法であって、所望のヌクレオチド変化が、(1)G:C塩基対をT:A塩基対に、(2)G:C塩基対をA:T塩基対に、(3)G:C塩基対をC:G塩基対に、(4)T:A塩基対をG:C塩基対に、(5)T:A塩基対をA:T塩基対に、(6)T:A塩基対をC:G塩基対に、(7)C:G塩基対をG:C塩基対に、(8)C:G塩基対をT:A塩基対に、(9)C:G塩基対をA:T塩基対に、(10)A:T塩基対をT:A塩基対に、(11)A:T塩基対をG:C塩基対に、または(12)A:T塩基対をC:G塩基対に変化させることを含む。
128.態様31~47のいずれか1つの伸長されたガイドRNAをコードするポリヌクレオチド。
129.態様128のポリヌクレオチドを含むベクター。
130.態様129のベクターを含む細胞。
131.態様1~30のいずれかの融合タンパク質であって、逆転写酵素がエラーを起こしやすい逆転写酵素である。
132.プライム標的にプライムされた逆転写によって標的座位におけるDNA分子に変異導入するための方法であって、方法が:(a)標的座位におけるDNA分子を(i)核酸プログラム型DNA結合タンパク質(napDNAbp)およびエラーを起こしやすい逆転写酵素を含む融合タンパク質ならびに(ii)所望のヌクレオチド変化を含むRT鋳型を含むガイドRNAと接触させること;(b)RT鋳型のプライム標的にプライムされた逆転写を行なって、変異導入された一本鎖DNAを生成すること;ならびに(c)DNA修復および/または複製プロセスによって、変異導入された一本鎖DNAを標的座位におけるDNA分子上に組み込むことを含む。
133.態様132の方法であって、融合タンパク質がPE1、PE2、またはPE3のアミノ酸配列を含む。
134.態様132の方法であって、napDNAbpがCas9ニッカーゼ(nCas9)である。
135.態様132の方法であって、napDNAbpが配列番号18~88、126、130、137、141、147、153、157、445、460、467、および482~487のアミノ酸配列を含む。
136.態様132の方法であって、ガイドRNAが配列番号222を含む。
137.態様132の方法であって、(b)プライム標的にプライムされた逆転写を行うステップが、ガイドRNA上のプライマー結合部位へのアニーリングによって逆転写をプライムすることができる標的座位における3'端プライマー結合配列を生成することを含む。
138.健康な数の反復トリヌクレオチドを含む健康な配列によって標的DNA分子上のトリヌクレオチド反復拡大変異を置き換えるための方法であって、方法が:(a)標的座位におけるDNA分子を(i)核酸プログラム型DNA結合タンパク質(napDNAbp)および逆転写酵素を含む融合タンパク質ならびに(ii)置き換え配列を含むRT鋳型を含むガイドRNAと接触させ、前記融合タンパク質が導入すること;(b)RT鋳型のプライム標的にプライムされた逆転写を行なって、置き換え配列を含む一本鎖DNAを生成すること;ならびに(c)DNA修復および/または複製プロセスによって、標的座位におけるDNA分子上に一本鎖DNAを組み込むことを含む。
139.態様138の方法であって、融合タンパク質がPE1、PE2、またはPE3のアミノ酸配列を含む。
140.態様138の方法であって、napDNAbpがCas9ニッカーゼ(nCas9)である。
141.態様138の方法であって、napDNAbpが配列番号18~88、126、130、137、141、147、153、157、445、460、467、および482~487のアミノ酸配列を含む。
142.態様138の方法であって、ガイドRNAが配列番号222を含む。
143.態様138の方法であって、(b)プライム標的にプライムされた逆転写を行うステップが、ガイドRNA上のプライマー結合部位へのアニーリングによって逆転写をプライムすることができる標的座位における3’端プライマー結合配列を生成することを含む。
144.態様138の方法であって、トリヌクレオチド反復拡大変異がハンチントン病、脆弱X症候群、またはフリードライヒ運動失調症に関連する。
145.態様138の方法であって、トリヌクレオチド反復拡大変異がCAGトリプレットの繰り返し単位を含む。
146.態様138の方法であって、トリヌクレオチド反復拡大変異がGAAトリプレットの繰り返し単位を含む。
147.プライム編集によって標的ヌクレオチド配列によってコードされる目当てのタンパク質上に機能部分を組み入れる方法であって、方法が:(a)標的ヌクレオチド配列を(i)核酸プログラム型DNA結合タンパク質(napDNAbp)および逆転写酵素を含むプライム編集因子ならびに(ii)機能部分をコードする編集鋳型を含むPEgRNAと接触させること;(b)機能部分をコードする一本鎖DNA配列を重合すること;ならびに(c)DNA修復および/または複製プロセスによって、標的ヌクレオチド配列における対応する内生鎖の代わりに一本鎖DNA配列を組み込むことを含み、方法が、目当てのタンパク質と機能部分とを含む融合タンパク質をコードする組み換え標的ヌクレオチド配列を生ずる。
148.態様147の方法であって、機能部分がペプチドタグである。
149.態様148の方法であって、ペプチドタグがアフィニティータグ、可溶化タグ、クロマトグラフィータグ、エピトープタグ、または蛍光タグである。
150.態様148の方法であって、ペプチドタグが:AviTag(配列番号245);Cタグ(配列番号246);カルモジュリンタグ(配列番号247);ポリグルタミン酸タグ(配列番号248);Eタグ(配列番号249);FLAGタグ(配列番号2);HAタグ(配列番号5);Hisタグ(配列番号252~262);Mycタグ(配列番号6);NEタグ(配列番号264);Rho1D4タグ(配列番号265);Sタグ(配列番号266);SBPタグ(配列番号267);Softag-1(配列番号268);Softag-2(配列番号269);Spotタグ(配列番号270);Strepタグ(配列番号271);TCタグ(配列番号272);Tyタグ(配列番号273);V5タグ(配列番号3);VSVタグ(配列番号275);およびXpressタグ(配列番号276)からなる群から選択される。
151.態様148の方法であって、ペプチドタグが:AU1エピトープ(配列番号278);AU5エピトープ(配列番号279);バクテリオファージT7エピトープ(T7タグ)(配列番号280);ブルータングウイルスタグ(Bタグ)(配列番号281);E2エピトープ(配列番号282);ヒスチジンアフィニティータグ(HAT)(配列番号283);HSVエピトープ(配列番号284);ポリアルギニン(Argタグ)(配列番号285);ポリアスパラギン酸(Aspタグ)(配列番号286);ポリフェニルアラニン(Pheタグ)(配列番号287);S1タグ(配列番号288);Sタグ(配列番号266);およびVSVタグ(配列番号275)からなる群から選択される。
152.態様147の方法であって、機能部分が免疫エピトープである。
153.態様152の方法であって、免疫エピトープが:破傷風トキソイド(配列番号396);ジフテリア毒素変異体CRM197(配列番号398);ムンプス免疫エピトープ1(配列番号400);ムンプス免疫エピトープ2(配列番号402);ムンプス免疫エピトープ3(配列番号404);風疹ウイルス(配列番号406);ヘマグルチニン(配列番号408);ノイラミニダーゼ(配列番号410);TAP1(配列番号412);TAP2(配列番号414);クラスI HLAに対するヘマグルチニンエピトープ(配列番号416);クラス I HLAに対するノイラミニダーゼエピトープ(配列番号418);クラスII HLAに対するヘマグルチニンエピトープ(配列番号420);クラスII HLAに対するノイラミニダーゼエピトープ(配列番号422);ヘマグルチニンエピトープH5N1結合クラスIおよびクラスII HLA(配列番号424);ノイラミニダーゼエピトープH5N1結合クラスIおよびクラスII HLA(配列番号426)からなる群から選択される。
154.態様147の方法であって、機能部分が目当てのタンパク質の局在を変改する。
155.態様147の方法であって、機能部分が分解タグであり、その結果、目当てのタンパク質の分解速度が変改される。
156.態様155の方法であって、分解タグが、本明細書に開示の分解タグをコードするアミノ酸配列を含む
157.態様147の方法であって、機能部分が低分子結合ドメインである。
158.態様157の方法であって、低分子結合ドメインが配列番号488のFKBP12である。
159.態様157の方法であって、低分子結合ドメインが配列番号489のFKBP12-F36Vである。
160.態様157の方法であって、低分子結合ドメインが配列番号490および493~494のシクロフィリンである。
161.態様157の方法であって、低分子結合ドメインが目当ての2つ以上のタンパク質上に組み入れされる。
162.態様161の方法であって、目当ての2つ以上のタンパク質が低分子に接触することによって二量体化し得る。
163.態様157の方法であって、低分子が:

Figure 2020191234000477
Figure 2020191234000478
からなる群から選択される低分子の二量体である。
164.プライム編集によって、標的ヌクレオチド配列によってコードされる目当てのタンパク質に免疫エピトープを組み入れる方法であって、方法が:(a)標的ヌクレオチド配列を(i)核酸プログラム型DNA結合タンパク質(napDNAbp)および逆転写酵素を含むプライム編集因子ならびに(ii)機能部分をコードする編集鋳型を含むPEgRNAと接触させること;(b)免疫エピトープをコードする一本鎖DNA配列を重合すること;ならびに(c)DNA修復および/または複製プロセスによって、標的ヌクレオチド配列における対応する内生鎖の代わりに一本鎖DNA配列を組み込むことを含み、方法が、目当てのタンパク質と免疫エピトープとを含む融合タンパク質をコードする組み換え標的ヌクレオチド配列を生ずる。
165.態様164の方法であって、免疫エピトープが:破傷風トキソイド(配列番号396);ジフテリア毒素変異体CRM197(配列番号398);ムンプス免疫エピトープ1(配列番号400);ムンプス免疫エピトープ2(配列番号402);ムンプス免疫エピトープ3(配列番号404);風疹ウイルス(配列番号406);ヘマグルチニン(配列番号408);ノイラミニダーゼ(配列番号410);TAP1(配列番号412);TAP2(配列番号414);クラスI HLAに対するヘマグルチニンエピトープ(配列番号416);クラスI HLAに対するノイラミニダーゼエピトープ(配列番号418);クラスII HLAに対するヘマグルチニンエピトープ(配列番号420);クラスII HLAに対するノイラミニダーゼエピトープ(配列番号422);ヘマグルチニンエピトープH5N1結合クラスIおよびクラスII HLA(配列番号424);ノイラミニダーゼエピトープH5N1結合クラスIおよびクラスII HLA(配列番号426)からなる群から選択される。
166.態様164の方法であって、融合タンパク質がPE1、PE2、またはPE3のアミノ酸配列を含む。
167.態様164の方法であって、napDNAbpがCas9ニッカーゼ(nCas9)である。
168.態様164の方法であって、napDNAbpが配列番号18~88、126、130、137、141、147、153、157、445、460、467、および482~487のアミノ酸配列を含む。
169.態様164の方法であって、ガイドRNAが配列番号222を含む。
170.プライム編集によって、標的ヌクレオチド配列によってコードされる目当てのタンパク質上に低分子二量体化ドメインを組み入れる方法であって、方法が:(a)標的ヌクレオチド配列を(i)核酸プログラム型DNA結合タンパク質(napDNAbp)および逆転写酵素を含むプライム編集因子ならびに(ii)低分子二量体化ドメインをコードする編集鋳型を含むPEgRNAと接触させること;(b)免疫エピトープをコードする一本鎖DNA配列を重合すること;ならびに(c)DNA修復および/または複製プロセスによって、標的ヌクレオチド配列における対応する内生鎖の代わりに一本鎖DNA配列を組み込むことを含み、方法が、目当てのタンパク質と低分子二量体化ドメインとを含む融合タンパク質をコードする組み換え標的ヌクレオチド配列を生ずる。
171.態様170の方法であって、さらに、目当ての第2のタンパク質に対して方法を行うことを含む。
172.態様171の方法であって、目当ての第1のタンパク質および目当ての第2のタンパク質が、前記タンパク質の夫々の二量体化ドメインに結合する低分子の存在下において二量体化する。
173.態様170の方法であって、低分子結合ドメインが配列番号488のFKBP12である。
174.態様170の方法であって、低分子結合ドメインが配列番号489のFKBP12-F36Vである。
175.態様170の方法であって、低分子結合ドメインが配列番号490および493~494のシクロフィリンである。
176.態様170の方法であって、低分子が:
Figure 2020191234000479
Figure 2020191234000480
Figure 2020191234000481
からなる群から選択される低分子の二量体である。
177.態様170の方法であって、融合タンパク質がPE1、PE2、またはPE3のアミノ酸配列を含む。
178.態様170の方法であって、napDNAbpがCas9ニッカーゼ(nCas9)である。
179.態様170の方法であって、napDNAbpが配列番号18~88、126、130、137、141、147、153、157、445、460、467、および482~487のアミノ酸配列を含む。
180.態様170の方法であって、ガイドRNAが配列番号222を含む。
181.プライム編集を用いてタンパク質上にペプチドタグまたはエピトープを組み入れる方法であって:タンパク質をコードする標的ヌクレオチド配列を、ペプチドタグをコードする第2のヌクレオチド配列をそれに挿入するように構成されたプライム編集因子構築物と接触させて、組み換えヌクレオチド配列をもたらすことを含み、その結果、ペプチドタグおよびタンパク質が融合タンパク質として組み換えヌクレオチド配列から発現される。
182.態様181の方法であって、ペプチドタグがタンパク質の精製および/または検出に用いられる。
183.態様181の方法であって、ペプチドタグが、ポリヒスチジン(例えば、HHHHHH(配列番号257))、FLAG(例えば、DYKDDDDK(配列番号2))、V5(例えば、GKPIPNPLLGLDST(配列番号3))、GCN4、HA(例えば、YPYDVPDYA(配列番号5))、Myc(例えばEQKLISEED(配列番号6))、GSTなどである。
184.態様181の方法であって、ペプチドタグが、配列番号245~290からなる群から選択されるアミノ酸配列を有する。
185.態様181の方法であって、ペプチドタグがリンカーによってタンパク質に融合される。
186.態様181の方法であって、融合タンパク質が次の構造を有し:[タンパク質]-[ペプチドタグ]または[ペプチドタグ]-[タンパク質]、「]-[」が任意のリンカーを表す。
187.態様181の方法であって、リンカーが配列番号127、165~176、446、453、および767~769のアミノ酸配列を有する。
188.態様181の方法であって、プライム編集因子構築物が、配列番号101~104、181~183、223~234、237~244、277、324~330、332、334、336、338、340、342、344、346、348、350、352、354、356、358、360、362、364、366、368、394、429~442、499~505、641~649、678~692、735~736、757~761、776~777のヌクレオチド配列を含むPEgRNAを含む。
189.態様181の方法であって、PEgRNAがスペーサー、gRNAコア、および伸長アームを含み、スペーサーが標的ヌクレオチド配列に対して相補的であり、伸長アームがペプチドタグをコードする逆転写酵素鋳型を含む。
190.態様181の方法であって、PEgRNAがスペーサー、gRNAコア、および伸長アームを含み、スペーサーが標的ヌクレオチド配列に対して相補的であり、伸長アームがペプチドタグをコードする逆転写酵素鋳型を含む。
191.プライム編集によって標的ヌクレオチド配列によってコードされるPRNP上に1つ以上の防護性変異を組み入れることによって、プリオン病を防止またはその進行を停止させる方法であって、方法が:(a)標的ヌクレオチド配列を(i)核酸プログラム型DNA結合タンパク質(napDNAbp)および逆転写酵素を含むプライム編集因子ならびに(ii)機能部分をコードする編集鋳型を含むPEgRNAと接触させること;(b)防護性変異をコードする一本鎖DNA配列を重合すること;ならびに(c)DNA修復および/または複製プロセスによって、標的ヌクレオチド配列における対応する内生鎖の代わりに一本鎖DNA配列を組み込むことを含み、方法が、ミスフォールディングに対して耐性である防護性変異を含むPRNPをコードする組み換え標的ヌクレオチド配列を生ずる。
192.態様191の方法であって、プリオン病がヒトプリオン病である。
193.態様191の方法であって、プリオン病が動物プリオン病である。
194.態様192の方法であって、プリオン病がクロイツフェルト・ヤコブ病(CJD)、変異型クロイツフェルト・ヤコブ病(vCJD)、ゲルストマン・ストロイスラー・シャインカー症候群、致死性家族性不眠症、またはクールー病である。
195.態様193の方法であって、プリオン病が牛海綿状脳症(BSEまたは「狂牛病」)、慢性消耗病(CWD)、スクレイピー、伝達性ミンク脳症、ネコ海綿状脳症、および有蹄類海綿状脳症である。
196.態様191の方法であって、野生型PRNPアミノ酸配列が配列番号291~292である。
197.態様191の方法であって、方法が、配列番号293~323からなる群から選択される改変されたPRNPアミノ酸配列をもたらし、前記改変されたPRNPタンパク質がミスフォールディングに対して耐性である。
198.態様191の方法であって、融合タンパク質がPE1、PE2、またはPE3のアミノ酸配列を含む。
199.態様191の方法であって、napDNAbpがCas9ニッカーゼ(nCas9)である。
200.態様191の方法であって、napDNAbpが配列番号18~88、126、130、137、141、147、153、157、445、460、467、および482~487のアミノ酸配列を含む。
201.態様191の方法であって、ガイドRNAが配列番号222を含む。
202.プライム編集によって、標的ヌクレオチド配列によってコードされる目当てのRNA上にリボヌクレオチドモチーフまたはタグを組み入れる方法であって、方法が:(a)標的ヌクレオチド配列を(i)核酸プログラム型DNA結合タンパク質(napDNAbp)および逆転写酵素を含むプライム編集因子ならびに(ii)リボヌクレオチドモチーフまたはタグをコードする編集鋳型を含むPEgRNAと接触させること;(b)リボヌクレオチドモチーフまたはタグをコードする一本鎖DNA配列を重合すること;ならびに(c)DNA修復および/または複製プロセスによって、標的ヌクレオチド配列における対応する内生鎖の代わりに一本鎖DNA配列を組み込むことを含み、方法が、リボヌクレオチドモチーフまたはタグを含む目当ての修飾されたRNAをコードする組み換え標的ヌクレオチド配列を生ずる。
203.態様202の方法であって、リボヌクレオチドモチーフまたはタグが検出部分である。
204.態様202の方法であって、リボヌクレオチドモチーフまたはタグが目当てのRNAの発現レベルに影響する。
205.態様202の方法であって、リボヌクレオチドモチーフまたはタグが目当てのRNAの輸送または細胞下レベル位置付けに影響する。
206.態様202の方法であって、リボヌクレオチドモチーフまたはタグが、SV40 1型、SV40 2型、SV40 3型、hGH、BGH、rbGlob、TK、MALAT1 ENE-mascRNA、KSHV PAN ENE、Smbox/U1 snRNAボックス、U1 snRNA 3'ボックス、tRNA-リジン、broccoliアプタマー、spinachアプタマー、mangoアプタマー、HDVリボザイム、およびm6Aからなる群から選択される。
207.態様202の方法であって、PEgRNAが配列番号101~104、181~183、223~234、237~244、277、324~330、332、334、336、338、340、342、344、346、348、350、352、354、356、358、360、362、364、366、368、394、429~442、499~505、641~649、678~692、735~736、757~761、776~777、2997~3103、3113~3121、3305~3455、3479~3493、3522~3540、3549~3556、3628~3698、3755~3810、3874、3890~3901、3905~3911、3913~3929、3972~3989を含む。
208.態様202の方法であって、融合タンパク質がPE1、PE2、またはPE3のアミノ酸配列を含む。
209.態様202の方法であって、napDNAbpがCas9ニッカーゼ(nCas9)である。
210.態様202の方法であって、napDNAbpが配列番号18~88、126、130、137、141、147、153、157、445、460、467、および482~487のアミノ酸配列を含む。
211.プライム編集によって、標的ヌクレオチド配列によってコードされる目当てのタンパク質上の機能部分を組み入れまたは欠失する方法であって、方法が:(a)標的ヌクレオチド配列を(i)核酸プログラム型DNA結合タンパク質(napDNAbp)および逆転写酵素を含むプライム編集因子ならびに(ii)機能部分またはその欠失をコードする編集鋳型を含むPEgRNAと接触させること;(b)機能部分またはその欠失をコードする一本鎖DNA配列を重合すること;ならびに(c)DNA修復および/または複製プロセスによって、標的ヌクレオチド配列における対応する内生鎖の代わりに一本鎖DNA配列を組み込むことを含み、方法が、目当てのタンパク質および機能部分またはその除去を含む改変されたタンパク質をコードする組み換え標的ヌクレオチド配列を生じ、機能部分がタンパク質の修飾状態または局在状態を変改する。
212.態様211の方法であって、機能部分が、目当てのタンパク質のリン酸化、ユビキチン化、グリコシル化、脂質修飾、ヒドロキシル化、メチル化、アセチル化、クロトニル化、SUMO化状態を変改する。
群2.態様213~424
213.融合タンパク質であって、核酸プログラム型DNA結合タンパク質(napDNAbp)およびポリメラーゼを含む。
214.態様213の融合タンパク質であって、融合タンパク質が、プライム編集ガイドRNA(PEgRNA)の存在下においてプライム編集を実行することができる。
215.態様213の融合タンパク質であって、napDNAbpがニッカーゼ活性を有する。
216.態様213の融合タンパク質であって、napDNAbpがCas9タンパク質またはそのバリアントである。
217.態様213の融合タンパク質であって、napDNAbpがヌクレアーゼ活性Cas9、ヌクレアーゼ不活性型Cas9(dCas9)、またはCas9ニッカーゼ(nCas9)である。
218.態様213の融合タンパク質であって、napDNAbpがCas9ニッカーゼ(nCas9)である。
219.態様213の融合タンパク質であって、napDNAbpが:Cas9、Cas12e、Cas12d、Cas12a、Cas12b1、Cas13a、Cas12c、およびアルゴノートからなる群から選択され、任意にニッカーゼ活性を有する。
220.態様213の融合タンパク質であって、融合タンパク質がPEgRNAと複合体化したときに標的DNA配列に結合することができる。
221.態様220の融合タンパク質であって、標的DNA配列が標的鎖および相補的な非標的鎖を含む。
222.態様220の融合タンパク質であって、PEgRNAと複合体化した融合タンパク質の結合がRループを形成する。
223.態様222の融合タンパク質であって、Rループが、(i)PEgRNAと標的鎖とを含むRNA-DNAハイブリッドおよび(ii)相補的な非標的鎖を含む。
224.態様223の融合タンパク質であって、相補的な非標的鎖がニッキングされて、遊離の3’端を有するプライム配列を形成する。
225.態様214の融合タンパク質であって、PEgRNAが(a)ガイドRNAおよび(b)ガイドRNAの5'もしくは3’端またはガイドRNAの分子内の位置付けにおける伸長アームを含む。
226.態様225の融合タンパク質であって、伸長アームが(i)所望のヌクレオチド変化を含むDNA合成鋳型配列および(ii)プライマー結合部位を含む。
227.態様226の融合タンパク質であって、DNA合成鋳型配列が、ニック部位に隣接する内生DNA配列に対して相補的である一本鎖DNAフラップをコードし、一本鎖DNAフラップが所望のヌクレオチド変化を含む。
228.態様225の融合タンパク質であって、伸長アームが、長さが少なくとも5ヌクレオチド、少なくとも6ヌクレオチド、少なくとも7ヌクレオチド、少なくとも8ヌクレオチド、少なくとも9ヌクレオチド、少なくとも10ヌクレオチド、少なくとも11ヌクレオチド、少なくとも12ヌクレオチド、少なくとも13ヌクレオチド、少なくとも14ヌクレオチド、少なくとも15ヌクレオチド、少なくとも16ヌクレオチド、少なくとも17ヌクレオチド、少なくとも18ヌクレオチド、少なくとも19ヌクレオチド、少なくとも20ヌクレオチド、少なくとも21ヌクレオチド、少なくとも22ヌクレオチド、少なくとも23ヌクレオチド、少なくとも24ヌクレオチド、または少なくとも25ヌクレオチドである。
229.態様227の融合タンパク質であって、一本鎖DNAフラップが、ニック部位に隣接する内生DNA配列にハイブリダイズし、それによって所望のヌクレオチド変化を組み入れる。
230.態様227の融合タンパク質であって、一本鎖DNAフラップが、遊離の5'端を有しかつニック部位に隣接する内生DNA配列に取って代わる。
231.態様230の融合タンパク質であって、5'端を有する内生DNA配列が細胞によって切除される。
232.態様230の融合タンパク質であって、一本鎖DNAフラップの細胞性修復が所望のヌクレオチド変化の組み入れをもたらし、それによって所望の産物を形成する。
233.態様226の融合タンパク質であって、所望のヌクレオチド変化がPAM配列の約-4から+10の間もしくはPAM配列の約-10から+20の間もしくはPAM配列の約-20から+40の間もしくはPAM配列の約-30から+100の間である編集窓上に組み入れされるか、または所望のヌクレオチド変化がニック部位の少なくとも1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、もしくは100ヌクレオチド下流に組み入れされる。
234.態様213の融合タンパク質であって、napDNAbpが、配列番号18のアミノ酸配列、または配列番号18のアミノ酸配列との少なくとも80%、85%、90%、95%、98%、もしくは99%配列同一性を有するアミノ酸配列を含む。
235.態様213の融合タンパク質であって、napDNAbpが、配列番号18~88、126、130、137、141、147、153、157、445、460、467、および482~487のいずれか1つのアミノ酸配列との少なくとも80%、85%、90%、95%、98%、または99%配列同一性を有するアミノ酸配列を含む。
236.態様213の融合タンパク質であって、ポリメラーゼが逆転写酵素であり、配列番号89~100、105~122、128~129、132、139、143、149、154、159、235、454、471、516、662、700、701~716、739~741、および766のアミノ酸配列のいずれか1つを含む。
237.態様213の融合タンパク質であって、ポリメラーゼが逆転写酵素であり、配列番号89~100、105~122、128~129、132、139、143、149、154、159、235、454、471、516、662、700、701~716、739~741、および766のいずれか1つのアミノ酸配列との少なくとも80%、85%、90%、95%、98%、または99%配列同一性を有するアミノ酸配列を含む。
238.態様213の融合タンパク質であって、ポリメラーゼがレトロウイルスまたはレトロトランスポゾンからの天然に存在する逆転写酵素である。
239.先の態様のいずれか1つの融合タンパク質であって、融合タンパク質が構造NH2-[napDNAbp]-[ポリメラーゼ]-COOH;またはNH2-[ポリメラーゼ]-[napDNAbp]-COOHを含み、「]-[」の夫々のものが任意のリンカー配列の存在を指示する。
240.態様239の融合タンパク質であって、リンカー配列が配列番号127、165~176、446、453、および767~769のアミノ酸配列を含む。
241.態様226の融合タンパク質であって、所望のヌクレオチド変化が1ヌクレオチド変化、1つ以上のヌクレオチドの挿入、または1つ以上のヌクレオチドの欠失である。
242.態様241の融合タンパク質であって、挿入または欠失が、少なくとも1、少なくとも2、少なくとも3、少なくとも4、少なくとも5、少なくとも6、少なくとも7、少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも16、少なくとも17、少なくとも18、少なくとも19、少なくとも20、少なくとも21、少なくとも22、少なくとも23、少なくとも24、少なくとも25、少なくとも26、少なくとも27、少なくとも28、少なくとも29、少なくとも30、少なくとも31、少なくとも32、少なくとも33、少なくとも34、少なくとも35、少なくとも36、少なくとも37、少なくとも38、少なくとも39、少なくとも40、少なくとも41、少なくとも42、少なくとも43、少なくとも44、少なくとも45、少なくとも46、少なくとも47、少なくとも48、少なくとも49、または少なくとも50である。
243.ガイドRNAとDNA合成鋳型を含む少なくとも1つの核酸伸長アームとを含むPEgRNA。
244.態様241のPEgRNAであって、核酸伸長アームがガイドRNAの3'もしくは5'端またはガイドRNAの分子内の位置の位置であり、核酸伸長アームがDNAまたはRNAである。
245.態様242のPEgRNAであって、PEgRNAが、napDNAbpに結合することおよびnapDNAbpを標的DNA配列へと導くことができる。
246.態様245のPEgRNAであって、標的DNA配列が標的鎖および相補的な非標的鎖を含み、ガイドRNAが標的鎖にハイブリダイズしてRNA-DNAハイブリッドおよびRループを形成する。
247.態様243のPEgRNAであって、少なくとも1つの核酸伸長アームが(i)DNA合成鋳型および(ii)プライマー結合部位を含む。
248.態様247のPEgRNAであって、核酸伸長アームが、長さが少なくとも5ヌクレオチド、少なくとも6ヌクレオチド、少なくとも7ヌクレオチド、少なくとも8ヌクレオチド、少なくとも9ヌクレオチド、少なくとも10ヌクレオチド、少なくとも11ヌクレオチド、少なくとも12ヌクレオチド、少なくとも13ヌクレオチド、少なくとも14ヌクレオチド、少なくとも15ヌクレオチド、少なくとも16ヌクレオチド、少なくとも17ヌクレオチド、少なくとも18ヌクレオチド、少なくとも19ヌクレオチド、少なくとも20ヌクレオチド、少なくとも21ヌクレオチド、少なくとも22ヌクレオチド、少なくとも23ヌクレオチド、少なくとも24ヌクレオチド、または少なくとも25ヌクレオチドである。
249.態様247のPEgRNAであって、DNA合成鋳型が、長さが少なくとも3ヌクレオチド、少なくとも4ヌクレオチド、少なくとも5ヌクレオチド、少なくとも6ヌクレオチド、少なくとも7ヌクレオチド、少なくとも8ヌクレオチド、少なくとも9ヌクレオチド、少なくとも10ヌクレオチド、少なくとも11ヌクレオチド、少なくとも12ヌクレオチド、少なくとも13ヌクレオチド、少なくとも14ヌクレオチド、または少なくとも15ヌクレオチドである。
250.態様247のPEgRNAであって、プライマー結合部位が、長さが少なくとも3ヌクレオチド、少なくとも4ヌクレオチド、少なくとも5ヌクレオチド、少なくとも6ヌクレオチド、少なくとも7ヌクレオチド、少なくとも8ヌクレオチド、少なくとも9ヌクレオチド、少なくとも10ヌクレオチド、少なくとも11ヌクレオチド、少なくとも12ヌクレオチド、少なくとも13ヌクレオチド、少なくとも14ヌクレオチド、または少なくとも15ヌクレオチドである。
251.態様243のPEgRNAであって、さらに、リンカー、ステムループ、ヘアピン、トウループ、アプタマー、またはRNA-タンパク質動員ドメインからなる群から選択される少なくとも1つの追加の構造を含む。
252.態様247のPEgRNAであって、DNA合成鋳型が、ニック部位に隣接する内生DNA配列に対して相補的である一本鎖DNAフラップをコードし、一本鎖DNAフラップが所望のヌクレオチド変化を含む。
253.態様252のPEgRNAであって、一本鎖DNAフラップが、ニッキングされた標的DNA配列上の5'端を有する内生一本鎖DNAを押し除け、内生一本鎖DNAがニック部位の下流において直ちに隣接する。
254.態様253のPEgRNAであって、遊離の5'端を有する内生一本鎖DNAが細胞によって切除される。
255.態様253のPEgRNAであって、一本鎖DNAフラップの細胞性修復が所望のヌクレオチド変化の組み入れをもたらし、それによって所望の産物を形成する。
256.態様243のPEgRNAであって、配列番号101~104、181~183、223~234、237~244、277、324~330、332、334、336、338、340、342、344、346、348、350、352、354、356、358、360、362、364、366、368、394、429~442、499~505、641~649、678~692、735~736、757~761、776~777のヌクレオチド配列、または配列番号101~104、181~183、223~234、237~244、277、324~330、332、334、336、338、340、342、344、346、348、350、352、354、356、358、360、362、364、366、368、394、429~442、499~505、641~649、678~692、735~736、757~761、776~777のいずれか1つとの少なくとも85%、または少なくとも90%、または少なくとも95%、または少なくとも98%、または少なくとも99%配列同一性を有するヌクレオチド配列を含む。
257.態様247のPEgRNAであって、DNA合成鋳型が、内生DNA標的と少なくとも80%または85%または90%または95%または99%同一であるヌクレオチド配列を含む。
258.態様247のPEgRNAであって、プライマー結合部位が、カットされたDNAの遊離の3'端とハイブリダイズする。
259.態様251のPEgRNAであって、少なくとも1つの追加の構造がPEgRNAの3'または5'端に位置付けられる。
260.態様213~242のいずれか1つの融合タンパク質とPEgRNAとを含むことを含む複合体。
261.態様260の複合体であって、PEgRNAが、ガイドRNAと、ガイドRNAの3'もしくは5'端またはガイドRNAの分子内の位置における核酸伸長アームとを含む。
262.態様260の複合体であって、PEgRNAが、napDNAbpに結合することおよびnapDNAbpを標的DNA配列へと導くことができる。
263.態様262の複合体であって、標的DNA配列が標的鎖および相補的な非標的鎖を含み、ガイドRNAが標的鎖にハイブリダイズして、RNA-DNAハイブリッドおよびRループを形成する。
264.態様261の複合体であって、少なくとも1つの核酸伸長アームが(i)DNA合成鋳型および(ii)プライマー結合部位を含む。
265.態様260の複合体であって、PEgRNAが、配列番号101~104、181~183、223~234、237~244、277、324~330、332、334、336、338、340、342、344、346、348、350、352、354、356、358、360、362、364、366、368、394、429~442、499~505、641~649、678~692、735~736、757~761、776~777のヌクレオチド配列、または配列番号101~104、181~183、223~234、237~244、277、324~330、332、334、336、338、340、342、344、346、348、350、352、354、356、358、360、362、364、366、368、394、429~442、499~505、641~649、678~692、735~736、757~761、776~777のいずれか1つとの少なくとも85%、もしくは少なくとも90%、もしくは少なくとも95%、もしくは少なくとも98%、もしくは少なくとも99%配列同一性を有するヌクレオチド配列を含む。
266.態様264の複合体であって、DNA合成鋳型が、内生DNA標的と少なくとも80%または85%または90%または95%または99%同一であるヌクレオチド配列を含む。
267.態様264の複合体であって、プライマー結合部位が、カットされたDNAの遊離の3'端とハイブリダイズする。
268.napDNAbpおよびPEgRNAを含むことを含む複合体。
269.態様268の複合体であって、napDNAbpがCas9ニッカーゼである。
270.態様268の複合体であって、napDNAbpが配列番号18のアミノ酸配列を含む。
271.態様268の複合体であって、napDNAbpが、配列番号18~88、126、130、137、141、147、153、157、445、460、467、および482~487のいずれか1つのアミノ酸配列との少なくとも80%、85%、90%、95%、98%、または99%配列同一性を有するアミノ酸配列を含む。
272.態様268の複合体であって、PEgRNAが、ガイドRNAと、ガイドRNAの3'もしくは5'端またはガイドRNAの分子内の位置における核酸伸長アームとを含む。
273.態様268の複合体であって、PEgRNAがnapDNAbpを標的DNA配列へと導くことができる。
274.態様272の複合体であって、標的DNA配列が標的鎖および相補的な非標的鎖を含み、PEgRNAのスペーサー配列が標的鎖にハイブリダイズして、RNA-DNAハイブリッドおよびRループを形成する。
275.態様273の複合体であって、核酸伸長アームが(i)DNA合成鋳型および(ii)プライマー結合部位を含む。
276.態様269の複合体であって、PEgRNAが、配列番号101~104、181~183、223~234、237~244、277、324~330、332、334、336、338、340、342、344、346、348、350、352、354、356、358、360、362、364、366、368、394、429~442、499~505、641~649、678~692、735~736、757~761、776~777、2997~3103、3113~3121、3305~3455、3479~3493、3522~3540、3549~3556、3628~3698、3755~3810、3874、3890~3901、3905~3911、3913~3929、3972~3989のヌクレオチド配列、または配列番号101~104、181~183、223~234、237~244、277、324~330、332、334、336、338、340、342、344、346、348、350、352、354、356、358、360、362、364、366、368、394、429~442、499~505、641~649、678~692、735~736、757~761、776~777のいずれか1つとの少なくとも85%、もしくは少なくとも90%、もしくは少なくとも95%、もしくは少なくとも98%、もしくは少なくとも99%配列同一性を有するヌクレオチド配列を含む。
277.態様276の複合体であって、DNA合成鋳型が、内生DNA標的と少なくとも80%または85%または90%または95%または99%同一であるヌクレオチド配列を含む。
278.態様276の複合体であって、プライマー結合部位が、カットされたDNAの遊離の3'端とハイブリダイズする。
279.態様276の複合体であって、PEgRNAが、さらに、リンカー、ステムループ、ヘアピン、トウループ、アプタマー、またはRNA-タンパク質動員ドメインからなる群から選択される少なくとも1つの追加の構造を含む。
280.態様213~242のいずれかの融合タンパク質をコードするポリヌクレオチド。
281.態様280のポリヌクレオチドを含むベクター。
282.態様213~242のいずれかの融合タンパク質と融合タンパク質のnapDNAbpに結合したPEgRNAとを含む細胞。
283.態様260~279のいずれか1つの複合体を含む細胞。
284.医薬組成物であって:(i)態様213~242のいずれかの融合タンパク質、態様260~279の複合体、態様68のポリヌクレオチド、または態様69のベクター;および(ii)薬学的に許容される賦形剤を含む。
285.医薬組成物であって:(i)態様260~279の複合体、(ii)トランスで提供されるポリメラーゼ;および(iii)薬学的に許容される賦形剤を含む。
286.キットであって:(i)態様213~242のいずれか1つの融合タンパク質をコードする核酸配列;および(ii)(i)の配列の発現を駆動するプロモーターを含む核酸構築物を含む。
287.所望のヌクレオチド変化を二本鎖DNA配列に組み入れるための方法であって、方法が:
(i)融合タンパク質およびPEgRNAを含む複合体と二本鎖DNA配列を接触させ、融合タンパク質がnapDNAbpおよびポリメラーゼを含み、PEgRNAが所望のヌクレオチド変化を含むDNA合成鋳型とプライマー結合部位とを含むこと;
(ii)二本鎖DNA配列にニッキングし、それによって、3'端を有する遊離の一本鎖DNAを生成すること;
(iii)遊離の一本鎖DNAの3'端をプライマー結合部位にハイブリダイズさせ、それによってポリメラーゼをプライムすること;
(iv)プライマー結合部位にハイブリダイズした3'端からDNAの鎖を重合し、それによって、DNA合成鋳型に対して相補的であるかつ所望のヌクレオチド変化を含む一本鎖DNAフラップを生成すること;
(v)カットされた部位に隣接する内生DNA鎖を一本鎖DNAフラップによって置き換え、それによって所望のヌクレオチド変化を二本鎖DNA配列に組み入れること、
を含む。
288.態様287の方法であって、(v)置き換えるステップが:(i)一本鎖DNAフラップをカットされた部位に隣接する内生DNA鎖にハイブリダイズさせて、配列ミスマッチを生出すること;(ii)内生DNA鎖を切り出すこと;および(iii)ミスマッチを修復して、所望のヌクレオチド変化をDNAの両方の鎖に含む所望の産物を形成すること、を含む。
289.態様288の方法であって、所望のヌクレオチド変化が1ヌクレオチド置換、欠失、または挿入である。
290.態様289の方法であって、1ヌクレオチド置換がトランジションまたはトランスバージョンである。
291.態様288の方法であって、所望のヌクレオチド変化が、(1)GからTの置換、(2)GからAの置換、(3)GからCの置換、(4)TからGの置換、(5)TからAの置換、(6)TからCの置換、(7)CからGの置換、(8)CからTの置換、(9)CからAの置換、(10)AからTの置換、(11)AからGの置換、または(12)AからCの置換である。
292.態様288の方法であって、所望のヌクレオチド(nucleoid)変化が、(1)G:C塩基対をT:A塩基対に、(2)G:C塩基対をA:T塩基対に、(3)G:C塩基対をC:G塩基対に、(4)T:A塩基対をG:C塩基対に、(5)T:A塩基対をA:T塩基対に、(6)T:A塩基対をC:G塩基対に、(7)C:G塩基対をG:C塩基対に、(8)C:G塩基対をT:A塩基対に、C:G塩基対をA:T塩基対に、(10)A:T塩基対をT:A塩基対に、(11)A:T塩基対をG:C塩基対に、または(12)A:T塩基対をC:G塩基対に変換する。
293.態様288の方法であって、所望のヌクレオチド変化が、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、または25ヌクレオチドの挿入または欠失である。
294.態様288の方法であって、所望のヌクレオチド変化が疾患関連遺伝子を修正する。
295.態様294の方法であって、疾患関連遺伝子が:アデノシンデアミナーゼ(ADA)欠損症;アルファ-1アンチトリプシン欠損症;嚢胞性線維症;デュシェンヌ型筋ジストロフィー;ガラクトース血症;ヘモクロマトーシス;ハンチントン病;メープルシロップ尿症;マルファン症候群;1型神経線維腫症;先天性爪肥厚症;フェニルケトン尿症;重症複合免疫不全;鎌状赤血球症;スミス・レムリ・オピッツ症候群;トリヌクレオチド反復障害;プリオン病;およびテイ・サックス病からなる群から選択される単一遺伝子障害に関連する。
296.態様294の方法であって、疾患関連遺伝子が:心臓病;高血圧;アルツハイマー病;関節炎;糖尿病;がん;および肥満からなる群から選択される多遺伝子性障害に関連する。
297.態様287の方法であって、napDNAbpが、ヌクレアーゼ不活性型Cas9(dCas9)、Cas9ニッカーゼ(nCas9)、またはヌクレアーゼ活性Cas9である。
298.態様287の方法であって、napDNAbpが、配列番号18のアミノ酸配列、または配列番号18のアミノ酸配列との少なくとも80%、85%、90%、95%、98%、もしくは99%配列同一性を有するアミノ酸配列を含む。
299.態様287の方法であって、napDNAbpが、配列番号18~88、126、130、137、141、147、153、157、445、460、467、および482~487のいずれか1つのアミノ酸配列との少なくとも80%、85%、90%、95%、98%、または99%配列同一性を有するアミノ酸配列を含む。
300.態様287の方法であって、ポリメラーゼが逆転写酵素であり、配列番号89~100、105~122、128~129、132、139、143、149、154、159、235、454、471、516、662、700、701~716、739~741、および766のアミノ酸配列のいずれか1つを含む。
301.態様287の方法であって、ポリメラーゼが逆転写酵素であり、配列番号89~100、105~122、128~129、132、139、143、149、154、159、235、454、471、516、662、700、701~716、739~741、および766のいずれか1つのアミノ酸配列との少なくとも80%、85%、90%、95%、98%、または99%配列同一性を有するアミノ酸配列を含む。
302.態様287の方法であって、PEgRNAが核酸伸長アームをガイドRNAの3'もしくは5'端または分子内の位置付けに含み、伸長アームがDNA合成鋳型配列およびプライマー結合部位を含む。
303.態様302の方法であって、伸長アームが、長さが少なくとも5ヌクレオチド、少なくとも6ヌクレオチド、少なくとも7ヌクレオチド、少なくとも8ヌクレオチド、少なくとも9ヌクレオチド、少なくとも10ヌクレオチド、少なくとも11ヌクレオチド、少なくとも12ヌクレオチド、少なくとも13ヌクレオチド、少なくとも14ヌクレオチド、少なくとも15ヌクレオチド、少なくとも16ヌクレオチド、少なくとも17ヌクレオチド、少なくとも18ヌクレオチド、少なくとも19ヌクレオチド、少なくとも20ヌクレオチド、少なくとも21ヌクレオチド、少なくとも22ヌクレオチド、少なくとも23ヌクレオチド、少なくとも24ヌクレオチド、または少なくとも25ヌクレオチドである。
304.態様287の方法であって、PEgRNAが、配列番号101~104、181~183、223~234、237~244、277、324~330、332、334、336、338、340、342、344、346、348、350、352、354、356、358、360、362、364、366、368、394、429~442、499~505、641~649、678~692、735~736、757~761、776~777からなる群から選択されるヌクレオチド配列を有する。
305.標的座位におけるDNA分子のヌクレオチド配列の1つ以上の変化を導入するための方法であって:
(i)DNA分子を、核酸プログラム型DNA結合タンパク質(napDNAbp)およびnapDNAbpを標的座位へと標的化するPEgRNAと接触させ、PEgRNAが、少なくとも1つの所望のヌクレオチド変化を含む逆転写酵素(RT)鋳型配列とプライマー結合部位とを含むことと;
(ii)標的座位におけるDNA鎖の暴露された3'端を形成すること;
(iii)暴露された3'端をプライマー結合部位にハイブリダイズさせて逆転写をプライムすること;
(iv)逆転写酵素によって、RT鋳型配列に基づく少なくとも1つの所望のヌクレオチド変化を含む一本鎖DNAフラップを合成すること;および
(v)少なくとも1つの所望のヌクレオチド変化を対応する内生DNA上に組み込み、それによって、標的座位においてDNA分子のヌクレオチド配列の1つ以上の変化を導入すること、
を含む。
306.態様305の方法であって、ヌクレオチド配列の1つ以上の変化がトランジションを含む。
307.態様306の方法であって、トランジションが、(a)TからC;(b)AからG;(c)CからT;および(d)GからAからなる群から選択される。
308.態様305の方法であって、ヌクレオチド配列の1つ以上の変化がトランスバージョンを含む。
309.態様308の方法であって、トランスバージョンが、(a)TからA;(b)TからG;(c)CからG;(d)CからA;(e)AからT;(f)AからC;(g)GからC;および(h)GからTからなる群から選択される。
310.態様305の方法であって、ヌクレオチド配列の1つ以上の変化が、(1)G:C塩基対をT:A塩基対に、(2)G:C塩基対をA:T塩基対に、(3)G:C塩基対をC:G塩基対に、(4)T:A塩基対をG:C塩基対に、(5)T:A塩基対をA:T塩基対に、(6)T:A塩基対をC:G塩基対に、(7)C:G塩基対をG:C塩基対に、(8)C:G塩基対をT:A塩基対に、(9)C:G塩基対をA:T塩基対に、(9)A:T塩基対をT:A塩基対に、(11)A:T塩基対をG:C塩基対に、または(12)A:T塩基対をC:G塩基対に変化させることを含む。
311.態様305の方法であって、ヌクレオチド配列の1つ以上の変化が、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、または25ヌクレオチドの挿入または欠失を含む。
312.態様305の方法であって、ヌクレオチド配列の1つ以上の変化が疾患関連遺伝子の修正を含む。
313.態様312の方法であって、疾患関連遺伝子が:アデノシンデアミナーゼ(ADA)欠損症;アルファ-1アンチトリプシン欠損症;嚢胞性線維症;デュシェンヌ型筋ジストロフィー;ガラクトース血症;ヘモクロマトーシス;ハンチントン病;メープルシロップ尿症;マルファン症候群;1型神経線維腫症;先天性爪肥厚症;フェニルケトン尿症;重症複合免疫不全;鎌状赤血球症;スミス・レムリ・オピッツ症候群;トリヌクレオチド反復障害;プリオン病;およびテイ・サックス病からなる群から選択される単一遺伝子障害に関連する。
314.態様312の方法であって、疾患関連遺伝子が:心臓病;高血圧;アルツハイマー病;関節炎;糖尿病;がん;および肥満からなる群から選択される多遺伝子性障害に関連する。
315.態様305の方法であって、napDNAbpがヌクレアーゼ活性Cas9またはそのバリアントである。
316.態様305の方法であって、napDNAbpがヌクレアーゼ不活性型Cas9(dCas9)もしくはCas9ニッカーゼ(nCas9)またはそのバリアントである。
317.態様305の方法であって、napDNAbpが、配列番号18のアミノ酸配列、または配列番号18との少なくとも80%、85%、90%、95%、98%、もしくは99%配列同一性を有するアミノ酸配列を含む。
318.態様305の方法であって、napDNAbpが、配列番号18~88、126、130、137、141、147、153、157、445、460、467、および482~487のいずれか1つのアミノ酸配列との少なくとも80%、85%、90%、95%、98%、または99%配列同一性を有するアミノ酸配列を含む。
319.態様305の方法であって、逆転写酵素がトランスで導入される。
320.態様305の方法であって、napDNAbpが逆転写酵素への融合体を含む。
321.態様305の方法であって、逆転写酵素が配列番号89~100、105~122、128~129、132、139、143、149、154、159、235、454、471、516、662、700、701~716、739~741、および766のアミノ酸配列のいずれか1つを含む。
322.態様305の方法であって、逆転写酵素が、配列番号89~100、105~122、128~129、132、139、143、149、154、159、235、454、471、516、662、700、701~716、739~741、および766のいずれか1つのアミノ酸配列との少なくとも80%、85%、90%、95%、98%、または99%配列同一性を有するアミノ酸配列を含む。
323.態様305の方法であって、標的座位におけるDNA鎖の暴露された3’端を形成するステップが、ヌクレアーゼによってDNA鎖へニックを入れることを含む。
324.態様323の方法であって、ヌクレアーゼがトランスで提供される.
325.態様305の方法であって、標的座位におけるDNA鎖の暴露された3’端を形成するステップが、DNA鎖を化学的薬剤と接触させることを含む。
326.態様305の方法であって、標的座位におけるDNA鎖の暴露された3’端を形成するステップが、複製エラーを導入することを含む。
327.態様305の方法であって、DNA分子をnapDNAbpおよびガイドRNAと接触させるステップがRループを形成する。
328.態様327の方法であって、暴露された3’端が形成されるDNA鎖がRループ上にある。
329.態様315の方法であって、PEgRNAが、逆転写酵素(RT)鋳型配列とプライマー結合部位とを含む伸長アームを含む。
330.態様329の方法であって、伸長アームが、ガイドRNAの3'端、ガイドRNAの5'端、またはガイドRNAの分子内の位置にある。
331.態様305の方法であって、PEgRNAが、さらに、リンカー、ステムループ、ヘアピン、トウループ、アプタマー、またはRNA-タンパク質動員ドメインからなる群から選択される少なくとも1つの追加の構造を含む。
332.態様305の方法であって、PEgRNAがさらに相同アームを含む。
333.態様305の方法であって、RT鋳型配列が、対応する内生DNAに対して相同的である。
334.プライム標的にプライムされた逆転写によって標的座位におけるDNA分子のヌクレオチド配列の1つ以上の変化を導入するための方法であって、方法が:(a)標的座位におけるDNA分子を(i)核酸プログラム型DNA結合タンパク質(napDNAbp)および逆転写酵素を含む融合タンパク質ならびに(ii)所望のヌクレオチド変化を含むRT鋳型を含むガイドRNAと接触させること;(b)RT鋳型のプライム標的にプライムされた逆転写を行なって、所望のヌクレオチド変化を含む一本鎖DNAを生成すること;ならびに(c)DNA修復および/または複製プロセスによって標的座位におけるDNA分子上に所望のヌクレオチド変化を組み込むことを含む。
335.態様334の方法であって、RT鋳型が、ガイドRNAの3'端、ガイドRNAの5'端、またはガイドRNAの分子内の位置付けに位置付けられる。
336.態様334の方法であって、所望のヌクレオチド変化が、トランジション、トランスバージョン、挿入、もしくは欠失、またはそれらのいずれかの組み合わせを含む。
337.態様334の方法であって、所望のヌクレオチド変化が、(a)TからC;(b)AからG;(c)CからT;および(d)GからAからなる群から選択されるトランジションを含む。
338.請求項334の方法であって、所望のヌクレオチド変化が、(a)TからA;(b)TからG;(c)CからG;(d)CからA;(e)AからT;(f)AからC;(g)GからC;および(h)GからTからなる群から選択されるトランスバージョンを含む。
339.請求項334の方法であって、所望のヌクレオチド変化が、(1)G:C塩基対をT:A塩基対に、(2)G:C塩基対をA:T塩基対に、(3)G:C塩基対をC:G塩基対に、(4)T:A塩基対をG:C塩基対に、(5)T:A塩基対をA:T塩基対に、(6)T:A塩基対をC:G塩基対に、(7)C:G塩基対をG:C塩基対に、(8)C:G塩基対をT:A塩基対に、(9)C:G塩基対をA:T塩基対に、(10)A:T塩基対をT:A塩基対に、(11)A:T塩基対をG:C塩基対に、または(12)A:T塩基対をC:G塩基対に変化させることを含む。
340.態様243~259のいずれか1つのPEgRNAをコードするポリヌクレオチド。
341.態様340のポリヌクレオチドを含むベクター。
342.態様341のベクターを含む細胞。
343.態様213の融合タンパク質であって、ポリメラーゼがエラーを起こしやすい逆転写酵素である。
344.プライム標的にプライムされた逆転写によって標的座位におけるDNA分子に変異導入するための方法であって、方法が:(a)標的座位におけるDNA分子を(i)核酸プログラム型DNA結合タンパク質(napDNAbp)およびエラーを起こしやすい逆転写酵素を含む融合タンパク質ならびに(ii)所望のヌクレオチド変化を含むRT鋳型を含むガイドRNAと接触させること;(b)RT鋳型のプライム標的にプライムされた逆転写を行なって、変異導入された一本鎖DNAを生成すること;ならびに(c)DNA修復および/または複製プロセスによって、変異導入された一本鎖DNAを標的座位におけるDNA分子上に組み込むことを含む。
345.いずれかの先行する態様の方法であって、融合タンパク質がPE1、PE2、またはPE3のアミノ酸配列を含む。
346.いずれかの先行する態様の方法であって、napDNAbpがCas9ニッカーゼ(nCas9)である。
347.態様344の方法であって、napDNAbpが配列番号18~88、126、130、137、141、147、153、157、445、460、467、および482~487のアミノ酸配列を含む。
348.態様344の方法であって、ガイドRNAが配列番号222を含む。
349.態様344の方法であって、(b)プライム標的にプライムされた逆転写を行うステップが、ガイドRNA上のプライマー結合部位へのアニーリングによって逆転写をプライムすることができる標的座位における3'端プライマー結合配列を生成することを含む。
350.健康な数の反復トリヌクレオチドを含む健康な配列によって標的DNA分子上のトリヌクレオチド反復拡大変異を置き換えるための方法であって、方法が:(a)標的座位におけるDNA分子を(i)核酸プログラム型DNA結合タンパク質(napDNAbp)およびポリメラーゼを含む融合タンパク質ならびに(ii)置き換え配列を含むDNA合成鋳型とプライマー結合部位とを含むPEgRNAと接触させること;(b)プライム編集を行なって、置き換え配列を含む一本鎖DNAを生成すること;ならびに(c)DNA修復および/または複製プロセスによって、標的座位におけるDNA分子上に一本鎖DNAを組み込むことを含む。
351.態様350の方法であって、融合タンパク質がPE1、PE2、またはPE3のアミノ酸配列を含む。
352.態様350の方法であって、napDNAbpがCas9ニッカーゼ(nCas9)である。
353.態様350の方法であって、napDNAbpが配列番号18~88、126、130、137、141、147、153、157、445、460、467、および482~487のアミノ酸配列を含む。
354.態様350の方法であって、ガイドRNAが配列番号222を含む。
355.態様350の方法であって、(b)プライム編集を行うステップが、ガイドRNA上のプライマー結合部位へのアニーリングによってポリメラーゼをプライムすることができる標的座位における3'端プライマー結合配列を生成することを含む。
356.態様350の方法であって、トリヌクレオチド反復拡大変異がハンチントン病、脆弱X症候群、またはフリードライヒ運動失調症に関連する。
357.態様350の方法であって、トリヌクレオチド反復拡大変異がCAGトリプレットの繰り返し単位を含む。
358.態様350の方法であって、トリヌクレオチド反復拡大変異がGAAトリプレットの繰り返し単位を含む。
359.プライム編集によって標的ヌクレオチド配列によってコードされる目当てのタンパク質上に機能部分を組み入れる方法であって、方法が:(a)標的ヌクレオチド配列を(i)核酸プログラム型DNA結合タンパク質(napDNAbp)およびポリメラーゼを含むプライム編集因子ならびに(ii)機能部分をコードするDNA合成鋳型を含むPEgRNAと接触させること;(b)機能部分をコードする一本鎖DNA配列を重合すること;ならびに(c)DNA修復および/または複製プロセスによって、標的ヌクレオチド配列における対応する内生鎖の代わりに一本鎖DNA配列を組み込むことを含み、方法が、目当てのタンパク質と機能部分とを含む融合タンパク質をコードする組み換え標的ヌクレオチド配列を生ずる。
360.態様359の方法であって、機能部分がペプチドタグである。
361.態様360の方法であって、ペプチドタグがアフィニティータグ、可溶化タグ、クロマトグラフィータグ、エピトープもしくは免疫エピトープタグ、または蛍光タグである。
362.態様360の方法であって、ペプチドタグが:AviTag(配列番号245);Cタグ(配列番号246);カルモジュリンタグ(配列番号247);ポリグルタミン酸タグ(配列番号248);Eタグ(配列番号249);FLAGタグ(配列番号2);HAタグ(配列番号5);Hisタグ(配列番号252~262);Mycタグ(配列番号6);NEタグ(配列番号264);Rho1D4タグ(配列番号265);Sタグ(配列番号266);SBPタグ(配列番号267);Softag-1(配列番号268);Softag-2(配列番号269);Spotタグ(配列番号270);Strepタグ(配列番号271);TCタグ(配列番号272);Tyタグ(配列番号273);V5タグ(配列番号3);VSVタグ(配列番号275);およびXpressタグ(配列番号276)からなる群から選択される。
363.態様360の方法であって、ペプチドタグが:AU1エピトープ(配列番号278);AU5エピトープ(配列番号279);バクテリオファージT7エピトープ(T7タグ)(配列番号280);ブルータングウイルスタグ(Bタグ)(配列番号281);E2エピトープ(配列番号282);ヒスチジンアフィニティータグ(HAT)(配列番号283);HSVエピトープ(配列番号284);ポリアルギニン(Argタグ)(配列番号285);ポリアスパラギン酸(Aspタグ)(配列番号286);ポリフェニルアラニン(Pheタグ)(配列番号287);S1タグ(配列番号288);Sタグ(配列番号266);およびVSV-タグ(配列番号275)からなる群から選択される。
364.態様359の方法であって、機能部分が免疫エピトープである。
365.態様364の方法であって、免疫エピトープが:破傷風トキソイド(配列番号396);ジフテリア毒素変異体CRM197(配列番号398);ムンプス免疫エピトープ1(配列番号400);ムンプス免疫エピトープ2(配列番号402);ムンプス免疫エピトープ3(配列番号404);風疹ウイルス(配列番号406);ヘマグルチニン(配列番号408);ノイラミニダーゼ(配列番号410);TAP1(配列番号412);TAP2(配列番号414);クラスI HLAに対するヘマグルチニンエピトープ(配列番号416);クラスI HLAに対するノイラミニダーゼエピトープ(配列番号418);クラスII HLAに対するヘマグルチニンエピトープ(配列番号420);クラスII HLAに対するノイラミニダーゼエピトープ(配列番号422);ヘマグルチニンエピトープH5N1結合クラスIおよびクラスII HLA(配列番号424);ノイラミニダーゼエピトープH5N1結合クラスIおよびクラスII HLA(配列番号426)からなる群から選択される。
366.態様359の方法であって、機能部分が目当てのタンパク質の局在を変改する。
367.態様359の方法であって、機能部分が分解タグであり、その結果、目当てのタンパク質の分解速度が変改される。
368.態様367の方法であって、分解タグが、タグ付けされたタンパク質の消去をもたらす。
369.態様359の方法であって、機能部分が低分子結合ドメインである。
370.態様359の方法であって、低分子結合ドメインが配列番号488のFKBP12である。
371.態様359の方法であって、低分子結合ドメインが配列番号489のFKBP12-F36Vである。
372.態様359の方法であって、低分子結合ドメインが配列番号490および493~494のシクロフィリンである。
373.態様359の方法であって、低分子結合ドメインが目当ての2つ以上のタンパク質上に組み入れされる。
374.態様373の方法であって、目当ての2つ以上のタンパク質が低分子に接触することによって二量体化し得る。
375.態様369の方法であって、低分子が:
Figure 2020191234000482
Figure 2020191234000483
Figure 2020191234000484
からなる群から選択される低分子の二量体である。
376.プライム編集によって、標的ヌクレオチド配列によってコードされる目当てのタンパク質に免疫エピトープを組み入れる方法であって、方法が:(a)標的ヌクレオチド配列を(i)核酸プログラム型DNA結合タンパク質(napDNAbp)およびポリメラーゼを含むプライム編集因子ならびに(ii)機能部分をコードする編集鋳型を含むPEgRNAと接触させること;(b)免疫エピトープをコードする一本鎖DNA配列を重合すること;ならびに(c)DNA修復および/または複製プロセスによって、標的ヌクレオチド配列における対応する内生鎖の代わりに一本鎖DNA配列を組み込むことを含み、方法が、目当てのタンパク質と免疫エピトープとを含む融合タンパク質をコードする組み換え標的ヌクレオチド配列を生ずる。
377.態様376の方法であって、免疫エピトープが:破傷風トキソイド(配列番号396);ジフテリア毒素変異体CRM197(配列番号398);ムンプス免疫エピトープ1(配列番号400);ムンプス免疫エピトープ2(配列番号402);ムンプス免疫エピトープ3(配列番号404);風疹ウイルス(配列番号406);ヘマグルチニン(配列番号408);ノイラミニダーゼ(配列番号410);TAP1(配列番号412);TAP2(配列番号414);クラスI HLAに対するヘマグルチニンエピトープ(配列番号416);クラスI HLAに対するノイラミニダーゼエピトープ(配列番号418);クラスII HLAに対するヘマグルチニンエピトープ(配列番号420);クラスII HLAに対するノイラミニダーゼエピトープ(配列番号422);ヘマグルチニンエピトープH5N1結合クラスIおよびクラスII HLA(配列番号424);ノイラミニダーゼエピトープH5N1結合クラスIおよびクラスII HLA(配列番号426)からなる群から選択される。
378.態様376の方法であって、融合タンパク質がPE1、PE2、またはPE3のアミノ酸配列を含む。
379.態様376の方法であって、napDNAbpがCas9ニッカーゼ(nCas9)である。
380.態様376の方法であって、napDNAbpが配列番号18~88、126、130、137、141、147、153、157、445、460、467、および482~487のアミノ酸配列を含む。
381.態様376の方法であって、PEgRNAが配列番号101~104、181~183、223~234、237~244、277、324~330、332、334、336、338、340、342、344、346、348、350、352、354、356、358、360、362、364、366、368、394、429~442、499~505、641~649、678~692、735~736、757~761、776~777を含む。
382.プライム編集によって、標的ヌクレオチド配列によってコードされる目当てのタンパク質上に低分子二量体化ドメインを組み入れる方法であって、方法が:(a)標的ヌクレオチド配列を(i)核酸プログラム型DNA結合タンパク質(napDNAbp)およびポリメラーゼを含むプライム編集因子ならびに(ii)低分子二量体化ドメインをコードする編集鋳型を含むPEgRNAと接触させること;(b)免疫エピトープをコードする一本鎖DNA配列を重合すること;ならびに(c)DNA修復および/または複製プロセスによって、標的ヌクレオチド配列における対応する内生鎖の代わりに一本鎖DNA配列を組み込むことを含み、方法が、目当てのタンパク質と低分子二量体化ドメインとを含む融合タンパク質をコードする組み換え標的ヌクレオチド配列を生ずる。
383.態様382の方法であって、さらに、目当ての第2のタンパク質に対して方法を行うことを含む。
384.態様383の方法であって、目当ての第1のタンパク質および目当ての第2のタンパク質が、前記タンパク質の夫々の二量体化ドメインに結合する低分子の存在下において二量体化する。
385.態様382の方法であって、低分子結合ドメインが配列番号488のFKBP12である。
386.態様382の方法であって、低分子結合ドメインが配列番号489のFKBP12-F36Vである。
387.態様382の方法であって、低分子結合ドメインが配列番号490および493~494のシクロフィリンである。
388.態様382の方法であって、低分子が:
Figure 2020191234000485
Figure 2020191234000486
Figure 2020191234000487
からなる群から選択される低分子の二量体である。
389.態様382の方法であって、融合タンパク質がPE1、PE2、またはPE3のアミノ酸配列を含む。
390.態様382の方法であって、napDNAbpがCas9ニッカーゼ(nCas9)である。
391.態様382の方法であって、napDNAbpが配列番号18~88、126、130、137、141、147、153、157、445、460、467、および482~487のアミノ酸配列を含む。
392.態様382の方法であって、PEgRNAが配列番号101~104、181~183、223~234、237~244、277、324~330、332、334、336、338、340、342、344、346、348、350、352、354、356、358、360、362、364、366、368、394、429~442、499~505、641~649、678~692、735~736、757~761、776~777を含む。
393.プライム編集を用いてタンパク質上にペプチドタグまたはエピトープを組み入れる方法であって:タンパク質をコードする標的ヌクレオチド配列を、ペプチドタグをコードする第2のヌクレオチド配列をそれに挿入するように構成されたプライム編集因子構築物と接触させて、組み換えヌクレオチド配列をもたらすことを含み、その結果、ペプチドタグおよびタンパク質が融合タンパク質として組み換えヌクレオチド配列から発現される。
394.態様383の方法であって、ペプチドタグがタンパク質の精製および/または検出に用いられる。
395.態様383の方法であって、ペプチドタグが、ポリヒスチジン(例えば、HHHHHH(配列番号257))、FLAG(例えば、DYKDDDDK(配列番号2))、V5(例えば、GKPIPNPLLGLDST(配列番号3))、GCN4、HA(例えば、YPYDVPDYA(配列番号5))、Myc(例えばEQKLISEED(配列番号6))、またはGSTである。
396.態様383の方法であって、ペプチドタグが、配列番号245~290からなる群から選択されるアミノ酸配列を有する。
397.態様383の方法であって、ペプチドタグがリンカーによってタンパク質に融合される。
398.態様383の方法であって、融合タンパク質が次の構造を有し:[タンパク質]-[ペプチドタグ]または[ペプチドタグ]-[タンパク質]、「]-[」が任意のリンカーを表す。
399.態様383の方法であって、リンカーが配列番号127、165~176、446、453、および767~769のアミノ酸配列を有する。
400.態様383の方法であって、プライム編集因子構築物が、配列番号101~104、181~183、223~234、237~244、277、324~330、332、334、336、338、340、342、344、346、348、350、352、354、356、358、360、362、364、366、368、394、429~442、499~505、641~649、678~692、735~736、757~761、776~777のヌクレオチド配列を含むPEgRNAを含む。
401.態様383の方法であって、PEgRNAがスペーサー、gRNAコア、および伸長アームを含み、スペーサーが標的ヌクレオチド配列に対して相補的であり、伸長アームがペプチドタグをコードする逆転写酵素鋳型を含む。
402.態様383の方法であって、PEgRNAがスペーサー、gRNAコア、および伸長アームを含み、スペーサーが標的ヌクレオチド配列に対して相補的であり、伸長アームがペプチドタグをコードする逆転写酵素鋳型を含む。
403.プライム編集によって標的ヌクレオチド配列によってコードされるPRNP上に1つ以上の防護性変異を組み入れることによって、プリオン病を防止またはその進行を停止させる方法であって、方法が:(a)標的ヌクレオチド配列を(i)核酸プログラム型DNA結合タンパク質(napDNAbp)およびポリメラーゼを含むプライム編集因子ならびに(ii)機能部分をコードする編集鋳型を含むPEgRNAと接触させること;(b)防護性変異をコードする一本鎖DNA配列を重合すること;ならびに(c)DNA修復および/または複製プロセスによって、標的ヌクレオチド配列における対応する内生鎖の代わりに一本鎖DNA配列を組み込むことを含み、方法が、ミスフォールディングに対して耐性である防護性変異を含むPRNPをコードする組み換え標的ヌクレオチド配列を生ずる。
404.態様403の方法であって、プリオン病がヒトプリオン病である。
405.態様403の方法であって、プリオン病が動物プリオン病である。
406.態様404の方法であって、プリオン病がクロイツフェルト・ヤコブ病(CJD)、変異型クロイツフェルト・ヤコブ病(vCJD)、ゲルストマン・ストロイスラー・シャインカー症候群、致死性家族性不眠症、またはクールー病である。
407.態様403の方法であって、プリオン病が牛海綿状脳症(BSEまたは「狂牛病」)、慢性消耗病(CWD)、スクレイピー、伝達性ミンク脳症、ネコ海綿状脳症、および有蹄類海綿状脳症である。
408.態様403の方法であって、野生型PRNPアミノ酸配列が配列番号291~292である。
409.態様403の方法であって、方法が、配列番号293~323からなる群から選択される改変されたPRNPアミノ酸配列をもたらし、前記改変されたPRNPタンパク質がミスフォールディングに対して耐性である。
410.態様403の方法であって、融合タンパク質がPE1、PE2、またはPE3のアミノ酸配列を含む。
411.態様403の方法であって、napDNAbpがCas9ニッカーゼ(nCas9)である。
412.態様403の方法であって、napDNAbpが配列番号18~88、126、130、137、141、147、153、157、445、460、467、および482~487のアミノ酸配列を含む。
413.態様403の方法であって、PEgRNAが配列番号101~104、181~183、223~234、237~244、277、324~330、332、334、336、338、340、342、344、346、348、350、352、354、356、358、360、362、364、366、368、394、429~442、499~505、641~649、678~692、735~736、757~761、776~777を含む。
414.プライム編集によって、標的ヌクレオチド配列によってコードされる目当てのRNA上にリボヌクレオチドモチーフまたはタグを組み入れる方法であって、方法が:(a)標的ヌクレオチド配列を(i)核酸プログラム型DNA結合タンパク質(napDNAbp)およびポリメラーゼを含むプライム編集因子ならびに(ii)リボヌクレオチドモチーフまたはタグをコードする編集鋳型を含むPEgRNAと接触させること;(b)リボヌクレオチドモチーフまたはタグをコードする一本鎖DNA配列を重合すること;ならびに(c)DNA修復および/または複製プロセスによって、標的ヌクレオチド配列における対応する内生鎖の代わりに一本鎖DNA配列を組み込むことを含み、方法が、リボヌクレオチドモチーフまたはタグを含む目当ての修飾されたRNAをコードする組み換え標的ヌクレオチド配列を生ずる。
415.態様414の方法であって、リボヌクレオチドモチーフまたはタグが検出部分である。
416.態様414の方法であって、リボヌクレオチドモチーフまたはタグが目当てのRNAの発現レベルに影響する。
417.態様414の方法であって、リボヌクレオチドモチーフまたはタグが目当てのRNAの輸送または細胞下レベル位置付けに影響する。
418.態様414の方法であって、リボヌクレオチドモチーフまたはタグが、SV40 1型、SV40 2型、SV40 3型、hGH、BGH、rbGlob、TK、MALAT1 ENE-mascRNA、KSHV PAN ENE、Smbox/U1 snRNAボックス、U1 snRNA 3’ボックス、tRNA-リジン、broccoliアプタマー、spinachアプタマー、mangoアプタマー、HDVリボザイム、およびm6Aからなる群から選択される。
419.態様414の方法であって、PEgRNAが配列番号101~104、181~183、223~234、237~244、277、324~330、332、334、336、338、340、342、344、346、348、350、352、354、356、358、360、362、364、366、368、394、429~442、499~505、641~649、678~692、735~736、757~761、776~777を含む。
420.態様414の方法であって、融合タンパク質がPE1、PE2、またはPE3のアミノ酸配列を含む。
421.態様414の方法であって、napDNAbpがCas9ニッカーゼ(nCas9)である。
422.態様414の方法であって、napDNAbpが配列番号18~88、126、130、137、141、147、153、157、445、460、467、および482~487のアミノ酸配列を含む。
423.プライム編集によって、標的ヌクレオチド配列によってコードされる目当てのタンパク質上の機能部分を組み入れまたは欠失する方法であって、方法が:(a)標的ヌクレオチド配列を(i)核酸プログラム型DNA結合タンパク質(napDNAbp)およびポリメラーゼを含むプライム編集因子ならびに(ii)機能部分またはその欠失をコードする編集鋳型を含むPEgRNAと接触させること;(b)機能部分またはその欠失をコードする一本鎖DNA配列を重合すること;ならびに(c)DNA修復および/または複製プロセスによって、標的ヌクレオチド配列における対応する内生鎖の代わりに一本鎖DNA配列を組み込むことを含み、方法が、目当てのタンパク質および機能部分またはその除去を含む改変されたタンパク質をコードする組み換え標的ヌクレオチド配列を生じ、機能部分がタンパク質の修飾状態または局在状態を変改する。
424.態様423の方法であって、機能部分が、目当てのタンパク質のリン酸化、ユビキチン化、グリコシル化、脂質修飾、ヒドロキシル化、メチル化、アセチル化、クロトニル化、SUMO化状態を変改する。 aspect
The following aspects are within the scope of this disclosure. Moreover, this disclosure discloses that all limitations, elements, clauses, and descriptive terms from one or more of the enumerated embodiments are introduced into another embodiment enumerated in this section. encompassing variations, combinations, and permutations of. For example, any enumerated embodiment that is subordinate to another enumerated embodiment includes one or more limitations found in any other enumerated embodiment in this section that is subordinate to the same base embodiment. It can be modified as follows. When elements are presented as enumerated in Markush group format, as an example, each subgroup of the elements is also disclosed, and any element(s) may be removed from the group. In general, when the disclosure, or an aspect of the disclosure, is viewed as including specific elements and/or features, an embodiment of the invention or an aspect of the invention consists of such elements and/or features; or should be understood to consist essentially of them. It is also noted that the terms "comprising" and "containing" are intended to be open, allowing the inclusion of additional elements or steps. When a range is given, endpoints are also included. Moreover, unless otherwise indicated or otherwise clear from the context and understanding of those skilled in the art, a value expressed as a range may refer to any specific value or value stated in different aspects of the invention. Subranges within the specified ranges may be envisioned up to 10 times the units of the lower limit of the range unless the context clearly dictates otherwise.
Group 1. Aspects 1 to 212
1. A fusion protein that includes a nucleic acid programmed DNA binding protein (napDNAbp) and a reverse transcriptase.
2. The fusion protein of embodiment 1, wherein the fusion protein is capable of performing genome editing by primed target-primed reverse transcription in the presence of an elongated guide RNA.
3. The fusion protein of embodiment 1, wherein napDNAbp has nickase activity.
Four. The fusion protein of embodiment 1, wherein napDNAbp is a Cas9 protein or a variant thereof.
Five. The fusion protein of embodiment 1, wherein napDNAbp is nuclease-active Cas9, nuclease-inactive Cas9 (dCas9), or Cas9 nickase (nCas9).
6. The fusion protein of embodiment 1, wherein napDNAbp is Cas9 nickase (nCas9).
7. The fusion protein of embodiment 1, wherein napDNAbp is selected from the group consisting of: Cas9, CasX, CasY, Cpf1, C2c1, C2c2, C2C3, and Argonaute, and optionally has nickase activity.
8. The fusion protein of embodiment 1 is capable of binding to a target DNA sequence when the fusion protein is complexed with an elongated guide RNA.
9. The fusion protein of embodiment 8, wherein the target DNA sequence comprises a target strand and a complementary non-target strand.
10. The fusion protein of embodiment 8, wherein binding of the fusion protein complexed with the extended guide RNA forms an R-loop.
11. The fusion protein of embodiment 10, wherein the R-loop comprises (i) an RNA-DNA hybrid comprising an extended guide RNA and a target strand, and (ii) a complementary non-target strand.
12. The fusion protein of embodiment 11, wherein the complementary non-target strand is nicked to form a reverse transcriptase prime sequence with a free 3' end.
13. The fusion protein of embodiment 2, wherein the extended guide RNA comprises (a) a guide RNA and (b) an RNA extension at the 5' or 3' end of the guide RNA or at an intramolecular location of the guide RNA.
14. The fusion protein of embodiment 13, wherein the RNA extension comprises (i) a reverse transcription template sequence containing the desired nucleotide changes, (ii) a reverse transcription primer binding site, and (iii) an optional linker sequence.
15. The fusion protein of embodiment 14, wherein the reverse transcription template sequence encodes a single-stranded DNA flap that is complementary to an endogenous DNA sequence adjacent to the nick site, and wherein the single-stranded DNA flap carries a desired nucleotide change. including.
16. The fusion protein of embodiment 13, wherein the RNA elongation is at least 5 nucleotides, at least 6 nucleotides, at least 7 nucleotides, at least 8 nucleotides, at least 9 nucleotides, at least 10 nucleotides, at least 11 nucleotides, at least 12 nucleotides, at least 13 nucleotides in length. nucleotides, at least 14 nucleotides, at least 15 nucleotides, at least 16 nucleotides, at least 17 nucleotides, at least 18 nucleotides, at least 19 nucleotides, at least 20 nucleotides, at least 21 nucleotides, at least 22 nucleotides, at least 23 nucleotides, at least 24 nucleotides, or at least 25 nucleotides It is.
17. The fusion protein of embodiment 15, wherein the single-stranded DNA flap hybridizes to the endogenous DNA sequence adjacent to the nick site, thereby incorporating the desired nucleotide change.
18. The fusion protein of embodiment 15, wherein the single-stranded DNA flap replaces the endogenous DNA sequence with a free 5' end and adjacent to the nick site.
19. A fusion protein of embodiment 18, wherein the endogenous DNA sequence having the 5' end is excised by the cell.
20. A fusion protein of embodiment 18, wherein cellular repair of the single-stranded DNA flap results in incorporation of a desired nucleotide change, thereby forming a desired product.
twenty one. The fusion protein of embodiment 14, wherein the desired nucleotide change is between about -4 and +10 of the PAM sequence, or between about -10 and +20 of the PAM sequence, or between about -20 and +40 of the PAM sequence, or The desired nucleotide change is incorporated on an editing window that is between approximately -30 and +100 of the PAM sequence, or the desired nucleotide change is at least 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, Incorporates 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99, or 100 nucleotides downstream.
twenty two. The fusion protein of embodiment 1, wherein napDNAbp is SEQ ID NO.18Amino acid sequence of or SEQ ID NO.18an amino acid sequence that is at least 80%, 85%, 90%, 95%, 98%, or 99% identical to the amino acid sequence of
twenty three. The fusion protein of embodiment 1, wherein napDNAbp is SEQ ID NO.18-88, 126, 130, 137, 141, 147, 153, 157, 445, 460, 467, and 482-487an amino acid sequence that is at least 80%, 85%, 90%, 95%, 98%, or 99% identical to any one amino acid sequence of
twenty four. The fusion protein of embodiment 1, wherein the reverse transcriptase is SEQ ID NO.89-100, 105-122, 128-129, 132, 139, 143, 149, 154, 159, 235, 454, 471, 516, 662, 700, 701-716, 739-741, and 766The amino acid sequence of any one of the following:
twenty five. The fusion protein of embodiment 1, wherein the reverse transcriptase is SEQ ID NO.89-100, 105-122, 128-129, 132, 139, 143, 149, 154, 159, 235, 454, 471, 516, 662, 700, 701-716, 739-741, and 766an amino acid sequence that is at least 80%, 85%, 90%, 95%, 98%, or 99% identical to any one amino acid sequence of
26. The fusion protein of embodiment 1, wherein the reverse transcriptase is a naturally occurring reverse transcriptase from a retrovirus or retrotransposon.
27. The fusion protein of any one of the preceding embodiments, wherein the fusion protein has the structure NH2-[napDNAbp]-[reverse transcriptase]-COOH; or NH2-[reverse transcriptase]-[napDNAbp]-COOH, with each "]-[" indicating the presence of an optional linker sequence.
28. The fusion protein of embodiment 27, wherein the linker sequence is SEQ ID NO.127, 165-176, 446, 453, and 767-769Contains the amino acid sequence of
29. The fusion protein of embodiment 14, wherein the desired nucleotide change is a single nucleotide change, an insertion of one or more nucleotides, or a deletion of one or more nucleotides.
30. The fusion protein of embodiment 29, wherein the insertion or deletion is at least 1, at least 2, at least 3, at least 4, at least 5, at least 6, at least 7, at least 8, at least 9, at least 10, at least 11, at least 12, At least 13, at least 14, at least 15, at least 16, at least 17, at least 18, at least 19, at least 20, at least 21, at least 22, at least 23, at least 24, at least 25, at least 26, at least 27, at least 28, at least 29 , at least 30, at least 31, at least 32, at least 33, at least 34, at least 35, at least 36, at least 37, at least 38, at least 39, at least 40, at least 41, at least 42, at least 43, at least 44, at least 45, at least 46, at least 47, at least 48, at least 49, or at least 50.
31. An extended guide RNA comprising a guide RNA and at least one RNA extension.
32. The elongated guide RNA of embodiment 1, wherein the RNA extension is at the 3' or 5' end of the guide RNA or at a position within the molecule of the guide RNA.
33. The elongated guide RNA of embodiment 31, wherein the elongated guide RNA is capable of binding napDNAbp and directing napDNAbp to a target DNA sequence.
34. The elongated guide RNA of embodiment 33, wherein the target DNA sequence includes a target strand and a complementary non-target strand, and the guide RNA hybridizes to the target strand to form an RNA-DNA hybrid and an R-loop.
35. The extended guide RNA of embodiment 31, wherein the at least one RNA extension comprises (i) a reverse transcription template sequence, (ii) a reverse transcription primer binding site, and (iii) an optional linker sequence.
36. The elongated guide RNA of embodiment 35, wherein the RNA elongation is at least 5 nucleotides, at least 6 nucleotides, at least 7 nucleotides, at least 8 nucleotides, at least 9 nucleotides, at least 10 nucleotides, at least 11 nucleotides, at least 12 nucleotides in length. , at least 13 nucleotides, at least 14 nucleotides, at least 15 nucleotides, at least 16 nucleotides, at least 17 nucleotides, at least 18 nucleotides, at least 19 nucleotides, at least 20 nucleotides, at least 21 nucleotides, at least 22 nucleotides, at least 23 nucleotides, at least 24 nucleotides, or At least 25 nucleotides.
37. The elongated guide RNA of embodiment 35, wherein the reverse transcription template sequence is at least 3 nucleotides, at least 4 nucleotides, at least 5 nucleotides, at least 6 nucleotides, at least 7 nucleotides, at least 8 nucleotides, at least 9 nucleotides, at least 10 nucleotides, at least 11 nucleotides, at least 12 nucleotides, at least 13 nucleotides, at least 14 nucleotides, or at least 15 nucleotides.
38. The elongated guide RNA of embodiment 35, wherein the reverse transcription primer binding site sequence is at least 3 nucleotides, at least 4 nucleotides, at least 5 nucleotides, at least 6 nucleotides, at least 7 nucleotides, at least 8 nucleotides, at least 9 nucleotides in length. , at least 10 nucleotides, at least 11 nucleotides, at least 12 nucleotides, at least 13 nucleotides, at least 14 nucleotides, or at least 15 nucleotides.
39. The elongated guide RNA of embodiment 35, wherein the optional linker sequence is at least 3 nucleotides, at least 4 nucleotides, at least 5 nucleotides, at least 6 nucleotides, at least 7 nucleotides, at least 8 nucleotides, at least 9 nucleotides, at least 10 nucleotides, at least 11 nucleotides, at least 12 nucleotides, at least 13 nucleotides, at least 14 nucleotides, or at least 15 nucleotides.
40. The extended guide RNA of embodiment 35, wherein the reverse transcription template sequence encodes a single-stranded DNA flap that is complementary to the endogenous DNA sequence adjacent to the nick site, and the single-stranded DNA flap contains a desired nucleotide change.
41. The elongated guide RNA of embodiment 40, wherein the single-stranded DNA flap displaces endogenous single-stranded DNA having a 5' end on the nicked target DNA sequence, and the endogenous single-stranded DNA is nicked. Immediately adjacent downstream of the site.
42. The elongated guide RNA of embodiment 41, wherein the endogenous single-stranded DNA with a free 5' end is excised by the cell.
43. The elongated guide RNA of embodiment 41, wherein cellular repair of the single-stranded DNA flap results in the incorporation of the desired nucleotide change, thereby forming the desired product.
44. The elongated guide RNA of embodiment 31, comprising SEQ ID NO:394, 429-442, 641-649, 678-692, 2997-3103, 3113-3121, 3305-3455, 3479-3493, 3522-3556, 3628-3698, and 3755-3810nucleotide sequence, or SEQ ID NO.394, 429-442, 641-649, 678-692, 2997-3103, 3113-3121, 3305-3455, 3479-3493, 3522-3556, 3628-3698, and 3755-3810nucleotide sequences having at least 85% or at least 90% or at least 95% or at least 98% or at least 99% sequence identity with any one of the following.
45. The elongated guide RNA of embodiment 35, wherein the reverse transcription template sequence comprises a nucleotide sequence that is at least 80% or 85% or 90% or 95% or 99% identical to the endogenous DNA target.
46. The elongated guide RNA of embodiment 35, wherein the reverse transcription primer binding site hybridizes to the free 3' end of the cut DNA.
47. The elongated guide RNA of embodiment 35, wherein any linker sequence is at least 1 nucleotide in length, or at least 2, at least 3, at least 4, at least 5, at least 6, at least 7, at least 8, at least 9, At least 10, at least 11, at least 12, at least 13, at least 14, or at least 15 nucleotides.
48. A complex comprising the fusion protein of any one of embodiments 1 to 30 and an elongated guide RNA.
49. Embodiment 48, wherein the elongated guide RNA comprises a guide RNA and an RNA extension at the 3' or 5' end of the guide RNA or at a position within the molecule of the guide RNA.
50. The complex of embodiment 48, wherein the elongated guide RNA is capable of binding napDNAbp and directing napDNAbp to a target DNA sequence.
51. The complex of embodiment 50, wherein the target DNA sequence comprises a target strand and a complementary non-target strand, and the guide RNA hybridizes to the target strand to form an RNA-DNA hybrid and an R-loop.
52. Embodiment 49, wherein the at least one RNA extension comprises (i) a reverse transcription template sequence, (ii) a reverse transcription primer binding site, and (iii) an optional linker sequence.
53. Embodiment 48, wherein the elongated guide RNA is at least 85%, or at least 90%, or at least 95% with the nucleotide sequence of SEQ ID NO: 18-36, or with any one of SEQ ID NO: 18-36. , or nucleotide sequences having at least 98%, or at least 99% sequence identity.
54. A complex of embodiment 52, wherein the reverse transcription template sequence comprises a nucleotide sequence having at least 80%, 85%, 90%, 95%, or 99% sequence identity with the endogenous DNA target.
55. The complex of embodiment 52, wherein the reverse transcription primer binding site hybridizes to the free 3' end of the cut DNA.
56. complex containing napDNAbp and elongated guide RNA.
57. The conjugate of embodiment 56, wherein napDNAbp is Cas9 nickase.
58. The complex of embodiment 56, wherein napDNAbp is SEQ ID NO.18Amino acid sequence of or SEQ ID NO.18an amino acid sequence having at least 80%, 85%, 90%, 95%, 98%, or 99% sequence identity with.
59. Embodiment 57, wherein napDNAbp is SEQ ID NO:18-88, 126, 130, 137, 141, 147, 153, 157, 445, 460, 467, and 482-487an amino acid sequence having at least 80%, 85%, 90%, 95%, 98%, or 99% sequence identity with any one amino acid sequence of
60. Embodiment 57, wherein the elongated guide RNA comprises a guide RNA and an RNA extension at the 3' or 5' end of the guide RNA or at a position within the molecule of the guide RNA.
61. Embodiment 57. The complex of embodiment 57, wherein the elongated guide RNA is capable of directing napDNAbp to a target DNA sequence.
62. The complex of embodiment 61, wherein the target DNA sequence comprises a target strand and a complementary non-target strand, and the spacer sequence hybridizes to the target strand to form an RNA-DNA hybrid and an R-loop.
63. The complex of embodiment 61, wherein the RNA extension comprises (i) a reverse transcription template sequence, (ii) a reverse transcription primer binding site, and (iii) optionally a linker sequence.
64. The complex of embodiment 57, wherein the elongated guide RNA has SEQ ID NO.394, 429-442, 641-649, 678-692, 2997-3103, 3113-3121, 3305-3455, 3479-3493, 3522-3556, 3628-3698, and 3755-3810nucleotide sequence, or SEQ ID NO.394, 429-442, 641-649, 678-692, 2997-3103, 3113-3121, 3305-3455, 3479-3493, 3522-3556, 3628-3698, and 3755-3810nucleotide sequences having at least 85%, or at least 90%, or at least 95%, or at least 98%, or at least 99% sequence identity with any one of the following.
65. The conjugate of embodiment 63, wherein the reverse transcription template sequence comprises a nucleotide sequence that is at least 80% or 85% or 90% or 95% or 99% identical to the endogenous DNA target.
66. The complex of embodiment 63, wherein the reverse transcription primer binding site hybridizes to the free 3' end of the cut DNA.
67. The conjugate of embodiment 63, wherein any linker sequence is at least 1 nucleotide in length, or at least 2, at least 3, at least 4, at least 5, at least 6, at least 7, at least 8, at least 9, at least 10, At least 11, at least 12, at least 13, at least 14, or at least 15 nucleotides.
68. A polynucleotide encoding the fusion protein of any of aspects 1 to 30.
69. A vector comprising the polynucleotide of embodiment 68.
70. A cell comprising a fusion protein of any one of embodiments 1 to 30 and an extended guide RNA bound to the napDNAbp of the fusion protein.
71. A cell comprising the complex of any one of embodiments 48-67.
72. A medicament comprising: (i) the fusion protein of any of embodiments 1 to 30, the conjugate of embodiments 48 to 67, the polynucleotide of embodiment 68, or the vector of embodiment 69; and (ii) a pharmaceutically acceptable excipient. Composition.
73. A pharmaceutical composition comprising (i) a conjugate of embodiments 48-67, (ii) a reverse transcriptase provided in trans; and (iii) a pharmaceutically acceptable excipient.
74. A kit comprising: (i) a nucleic acid sequence encoding the fusion protein of any one of embodiments 1 to 30; and (ii) a nucleic acid construct comprising a promoter driving expression of the sequence of (i).
75. A method for incorporating desired nucleotide changes into a double-stranded DNA sequence, the method comprising:
(i) Reverse transcription by contacting a double-stranded DNA sequence with a complex containing a fusion protein and an elongated guide RNA, where the fusion protein contains napDNAbp and reverse transcriptase, and the elongated guide RNA contains the desired nucleotide change. Contains a template sequence;
(ii) nicking a double-stranded DNA sequence on the non-target strand, thereby generating free single-stranded DNA with a 3' end;
(iii) hybridizing the 3′ end of the free single-stranded DNA to a reverse transcription template sequence, thereby priming the reverse transcriptase domain;
(iv) polymerizing the strands of DNA from the 3' end, thereby producing a single-stranded DNA flap containing the desired nucleotide changes;
(v) replacing the endogenous DNA strand adjacent to the cut site by a single-stranded DNA flap, thereby incorporating the desired nucleotide change into the double-stranded DNA sequence;
including.
76. 75. The method of embodiment 75, wherein (v) the step of replacing: (i) hybridizing the single-stranded DNA flap to an endogenous DNA strand adjacent to the cut site to create a sequence mismatch; (ii) ) excising the endogenous DNA strand; and (iii) repairing the mismatch to form the desired product containing the desired nucleotide changes in both strands of the DNA.
77. 77. The method of embodiment 76, wherein the desired nucleotide change is a single nucleotide substitution, deletion, or insertion.
78. 78. The method of embodiment 77, wherein the single nucleotide substitution is a transition or transversion.
79. The method of embodiment 76, wherein the desired nucleotide change is (1) a G to T substitution, (2) a G to A substitution, (3) a G to C substitution, (4) a T to G substitution, (5) a T to A substitution, (6) a T to C substitution, (7) a C to G substitution, (8) a C to T substitution, (9) a C to A substitution, (10) an A to T substitution, (11) an A to G substitution, or (12) an A to C substitution.
80. 76. The method of embodiment 76, wherein the desired nucleoid change is (1) a G:C base pair to a T:A base pair, (2) a G:C base pair to an A:T base pair, ( 3) G:C base pair to C:G base pair, (4) T:A base pair to G:C base pair, (5) T:A base pair to A:T base pair, (6) T:A base pair becomes C:G base pair, (7) C:G base pair becomes G:C base pair, (8) C:G base pair becomes T:A base pair, (9) C: G base pair to A:T base pair, (10) A:T base pair to T:A base pair, (11) A:T base pair to G:C base pair, or (12) A:T. Converts a base pair to a C:G base pair.
81. The method of embodiment 76, wherein the desired nucleotide change is an insertion or deletion of 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, or 25 nucleotides.
82. 77. The method of embodiment 76, wherein the desired nucleotide change modifies a disease-associated gene.
83. The method of embodiment 82, wherein the disease-associated gene is: adenosine deaminase (ADA) deficiency; alpha-1 antitrypsin deficiency; cystic fibrosis; Duchenne muscular dystrophy; galactosemia; hemochromatosis; Huntington's disease; maple Consists of syrup urine disease; Marfan syndrome; type 1 neurofibromatosis; congenital nail hyperplasia; phenylketonuria; severe combined immunodeficiency; sickle cell disease; Smith-Lemli-Opitz syndrome; and Tay-Sachs disease. associated with a single gene disorder selected from the group.
84. 83. The method of embodiment 82, wherein the disease-associated gene is associated with a polygenic disorder selected from the group consisting of: heart disease; hypertension; Alzheimer's disease; arthritis; diabetes; cancer; and obesity.
85. 77. The method of embodiment 76, wherein the napDNAbp is nuclease-inactive Cas9 (dCas9), Cas9 nickase (nCas9), or nuclease-active Cas9.
86. The method of embodiment 76, wherein napDNAbp is SEQ ID NO.18Contains the amino acid sequence of
87. 76. The method of embodiment 76, wherein napDNAbp is SEQ ID NO.18-88, 126, 130, 137, 141, 147, 153, 157, 445, 460, 467, and 482-487an amino acid sequence having at least 80%, 85%, 90%, 95%, 98%, or 99% sequence identity with any one amino acid sequence of
88. 76. The method of embodiment 76, wherein the reverse transcriptase is SEQ ID NO.89-100, 105-122, 128-129, 132, 139, 143, 149, 154, 159, 235, 454, 471, 516, 662, 700, 701-716, 739-741, and 766Contains any one of the following amino acid sequences.
89. 76. The method of embodiment 76, wherein the reverse transcriptase domain is SEQ ID NO:89-100, 105-122, 128-129, 132, 139, 143, 149, 154, 159, 235, 454, 471, 516, 662, 700, 701-716, 739-741, and 766an amino acid sequence having at least 80%, 85%, 90%, 95%, 98%, or 99% sequence identity with any one amino acid sequence of
90. 77. The method of embodiment 76, wherein the elongated guide RNA comprises RNA extension at the 5' or 3' end of the guide RNA or at an intramolecular location, and the RNA extension comprises a reverse transcription template sequence.
91. 90. The method of embodiment 90, wherein the RNA elongation is at least 5 nucleotides, at least 6 nucleotides, at least 7 nucleotides, at least 8 nucleotides, at least 9 nucleotides, at least 10 nucleotides, at least 11 nucleotides, at least 12 nucleotides, at least 13 nucleotides in length. , at least 14 nucleotides, at least 15 nucleotides, at least 16 nucleotides, at least 17 nucleotides, at least 18 nucleotides, at least 19 nucleotides, at least 20 nucleotides, at least 21 nucleotides, at least 22 nucleotides, at least 23 nucleotides, at least 24 nucleotides, or at least 25 nucleotides be.
92. 76. The method of embodiment 76, wherein the elongated guide RNA has SEQ ID NO.394, 429-442, 641-649, 678-692, 2997-3103, 3113-3121, 3305-3455, 3479-3493, 3522-3556, 3628-3698, and 3755-3810having a nucleotide sequence selected from the group consisting of:
93. A method for introducing one or more changes in the nucleotide sequence of a DNA molecule at a target locus, the method comprising:
(i) a reverse transcriptase (RT) template in which the DNA molecule is contacted with a nucleic acid programmed DNA binding protein (napDNAbp) and a guide RNA that targets napDNAbp to the target locus, the guide RNA containing at least one desired nucleotide change; Contains an array;
(ii) creating an exposed 3' end of the DNA strand at the target locus;
(iii) hybridizing the exposed 3′ end to the RT template sequence to prime reverse transcription;
(vi) synthesizing by reverse transcriptase a single-stranded DNA flap containing at least one desired nucleotide change based on the RT template sequence; and
(v) incorporating at least one desired nucleotide change onto the corresponding endogenous DNA, thereby introducing one or more changes in the nucleotide sequence of the DNA molecule at the target locus;
including.
94. 94. The method of embodiment 93, wherein the one or more changes in the nucleotide sequence comprises a transition.
95. 95. The method of embodiment 94, wherein the transition is selected from the group consisting of: (a) T to C; (b) A to G; (c) C to T; and (d) G to A.
96. 94. The method of embodiment 93, wherein the one or more changes in the nucleotide sequence comprises a transversion.
97. 96. The method of aspect 96, wherein the transversion is: (a) T to A; (b) T to G; (c) C to G; (d) C to A; (e) A to T; (f) (g) G to C; and (h) G to T.
98. 94. The method of embodiment 93, wherein the one or more changes in the nucleotide sequence include: (1) a G:C base pair to a T:A base pair; (2) a G:C base pair to an A:T base pair; (3) G:C base pair to C:G base pair, (4) T:A base pair to G:C base pair, (5) T:A base pair to A:T base pair, (6 )T:A base pair to C:G base pair, (7)C:G base pair to G:C base pair, (8)C:G base pair to T:A base pair, (9)C :G base pair to A:T base pair, (10) A:T base pair to T:A base pair, (11) A:T base pair to G:C base pair, or (12) A: It involves changing a T base pair to a C:G base pair.
99. 94. The method of embodiment 93, wherein the one or more changes in the nucleotide sequence are 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, Contains insertions or deletions of 17, 18, 19, 20, 21, 22, 23, 24, or 25 nucleotides.
100. 94. The method of embodiment 93, wherein the one or more changes in the nucleotide sequence comprises correction of a disease-associated gene.
101. The method of embodiment 100, wherein the disease-associated gene is associated with a single-gene disorder selected from the group consisting of: adenosine deaminase (ADA) deficiency; alpha-1 antitrypsin deficiency; cystic fibrosis; Duchenne muscular dystrophy; galactosemia; hemochromatosis; Huntington's disease; maple syrup urine disease; Marfan syndrome; neurofibromatosis type 1; pachyonychia congenita; phenylketonuria; severe combined immunodeficiency; sickle cell disease; Smith-Lemli-Opitz syndrome; and Tay-Sachs disease.
102. Embodiment 100, wherein the disease-associated gene is associated with a polygenic disorder selected from the group consisting of: heart disease; hypertension; Alzheimer's disease; arthritis; diabetes; cancer; and obesity.
103. 94. The method of embodiment 93, wherein napDNAbp is nuclease active Cas9 or a variant thereof.
104. 94. The method of embodiment 93, wherein napDNAbp is nuclease-inactive Cas9 (dCas9) or Cas9 nickase (nCas9) or a variant thereof.
105. The method of embodiment 93, wherein napDNAbp is SEQ ID NO.18Contains the amino acid sequence of
106. The method of embodiment 93, wherein napDNAbp is selected from the group consisting of SEQ ID NO:18-88, 126, 130, 137, 141, 147, 153, 157, 445, 460, 467, and 482-487an amino acid sequence having at least 80%, 85%, 90%, 95%, 98%, or 99% sequence identity with any one amino acid sequence of
107. 94. The method of embodiment 93, wherein the reverse transcriptase is introduced in trans.
108. 94. The method of embodiment 93, wherein napDNAbp comprises a fusion to reverse transcriptase.
109. The method of embodiment 93, wherein the reverse transcriptase is SEQ ID NO.89-100, 105-122, 128-129, 132, 139, 143, 149, 154, 159, 235, 454, 471, 516, 662, 700, 701-716, 739-741, and 766Contains any one of the following amino acid sequences.
110. 94. The method of embodiment 93, wherein the reverse transcriptase is SEQ ID NO.89-100, 105-122, 128-129, 132, 139, 143, 149, 154, 159, 235, 454, 471, 516, 662, 700, 701-716, 739-741, and 766an amino acid sequence having at least 80%, 85%, 90%, 95%, 98%, or 99% sequence identity with any one amino acid sequence of
111. 94. The method of embodiment 93, wherein the step of forming an exposed 3' end of the DNA strand at the target locus comprises nicking the DNA strand with a nuclease.
112. The method of embodiment 111, wherein the nuclease is napDNAbp, is provided as a fusion domain of napDNAbp, or is provided in trans.
113. The method of embodiment 93, wherein the step of forming an exposed 3' end of the DNA strand at the target locus includes contacting the DNA strand with a chemical agent.
114. 94. The method of embodiment 93, wherein forming an exposed 3' end of the DNA strand at the target locus comprises introducing a replication error.
115. 94. The method of embodiment 93, wherein the step of contacting the DNA molecule with napDNAbp and guide RNA forms an R-loop.
116. Embodiment 115. The method of embodiment 115, wherein the DNA strand from which the exposed 3' end is formed is on the R-loop.
117. 94. The method of embodiment 93, wherein the guide RNA comprises an extended portion that includes a reverse transcriptase (RT) template sequence.
118. The method of embodiment 117, wherein the elongated portion is at the 3' end of the guide RNA, at the 5' end of the guide RNA, or at a position within the molecule of the guide RNA.
119. 94. The method of embodiment 93, wherein the guide RNA further comprises a primer binding site.
120. The method of embodiment 93, wherein the guide RNA further comprises a spacer sequence.
121. 94. The method of embodiment 93, wherein the RT template sequence is homologous to the corresponding endogenous DNA.
122. A method for introducing one or more changes in the nucleotide sequence of a DNA molecule at a target locus by primed reverse transcription to a primed target, the method comprising: (a) converting the DNA molecule at the target locus to (i) a nucleic acid program; (b) reverse transcription primed to the primed target of the RT template. (c) incorporating the desired nucleotide changes onto the DNA molecule at the target locus by DNA repair and/or replication processes.
one two three. The method of embodiment 122, wherein the RT template is located at the 3' end of the guide RNA, at the 5' end of the guide RNA, or at an intramolecular location of the guide RNA.
124. Embodiment 122 The method of embodiment 122, wherein the desired nucleotide change comprises a transition, transversion, insertion, or deletion, or any combination thereof.
125.aspect122, wherein the desired nucleotide change is a transition selected from the group consisting of: (a) T to C; (b) A to G; (c) C to T; and (d) G to A. include.
126.aspect122, wherein the desired nucleotide change comprises a transversion selected from the group consisting of: (a) T to A; (b) T to G; (c) C to G; (d) C to A; (e) A to T; (f) A to C; (g) G to C; and (h) G to T.
127. Embodiment 122, wherein the desired nucleotide change is (1) a G:C base pair to a T:A base pair, (2) a G:C base pair to an A:T base pair, (3) a G:C base pair to a T:A base pair; :C base pair becomes C:G base pair, (4) T:A base pair becomes G:C base pair, (5) T:A base pair becomes A:T base pair, (6) T:A base pair to C:G base pair, (7) C:G base pair to G:C base pair, (8) C:G base pair to T:A base pair, (9) C:G base pair. into an A:T base pair, (10) an A:T base pair into a T:A base pair, (11) an A:T base pair into a G:C base pair, or (12) an A:T base pair. This includes changing to a C:G base pair.
128. A polynucleotide encoding the elongated guide RNA of any one of embodiments 31-47.
129. A vector comprising the polynucleotide of embodiment 128.
130. A cell comprising the vector of embodiment 129.
131. The fusion protein of any of embodiments 1 to 30, wherein the reverse transcriptase is an error-prone reverse transcriptase.
132. A method for mutagenizing a DNA molecule at a target locus by primed target reverse transcription, the method comprising: (a) contacting the DNA molecule at the target locus with (i) a fusion protein comprising a nucleic acid programmable DNA binding protein (napDNAbp) and an error-prone reverse transcriptase, and (ii) a guide RNA comprising an RT template containing a desired nucleotide change; (b) performing primed target reverse transcription of the RT template to generate a mutated single-stranded DNA; and (c) incorporating the mutated single-stranded DNA onto the DNA molecule at the target locus by DNA repair and/or replication processes.
133. 133. The method of embodiment 132, wherein the fusion protein comprises the amino acid sequence of PE1, PE2, or PE3.
134. 133. The method of embodiment 132, wherein napDNAbp is Cas9 nickase (nCas9).
135. The method of embodiment 132, wherein napDNAbp is SEQ ID NO: 18 to88, 126, 130, 137, 141, 147, 153, 157, 445, 460, 467, and 482-487The amino acid sequence of
136. 133. The method of embodiment 132, wherein the guide RNA comprises SEQ ID NO: 222.
137. Embodiment 132, wherein the step of (b) performing primed reverse transcription on a primed target comprises a 3' end primer at the target locus capable of priming reverse transcription by annealing to a primer binding site on a guide RNA; Including generating associative arrays.
138. A method for replacing a trinucleotide repeat expansion mutation on a target DNA molecule by a healthy sequence containing a healthy number of repeat trinucleotides, the method comprising: (a) converting the DNA molecule at the target locus to (i) a nucleic acid programmed contacting a fusion protein comprising a DNA binding protein (napDNAbp) and a reverse transcriptase and (ii) a guide RNA comprising an RT template comprising a replacement sequence, which said fusion protein introduces; (b) priming the RT template to the primed target; (c) incorporating the single-stranded DNA onto the DNA molecule at the target locus by a DNA repair and/or replication process; .
139. 139. The method of embodiment 138, wherein the fusion protein comprises the amino acid sequence of PE1, PE2, or PE3.
140. Embodiment 138, wherein the napDNAbp is Cas9 nickase (nCas9).
141. Embodiment 138. The method of embodiment 138, wherein napDNAbp is SEQ ID NO: 18 to88, 126, 130, 137, 141, 147, 153, 157, 445, 460, 467, and 482-487Contains the amino acid sequence of
142. 139. The method of embodiment 138, wherein the guide RNA comprises SEQ ID NO: 222.
143. Embodiment 138, wherein (b) performing primed reverse transcription on a primed target comprises a 3' end primer at the target locus capable of priming reverse transcription by annealing to a primer binding site on a guide RNA; Including generating associative arrays.
144. 139. The method of embodiment 138, wherein the trinucleotide repeat expansion mutation is associated with Huntington's disease, Fragile X syndrome, or Friedreich's ataxia.
145. Embodiment 138, wherein the trinucleotide repeat expansion comprises a CAG triplet repeat unit.
146. 139. The method of embodiment 138, wherein the trinucleotide repeat expansion comprises a GAA triplet repeat unit.
147. A method of incorporating a functional moiety onto a protein of interest encoded by a target nucleotide sequence by prime editing, the method comprising: (a) converting the target nucleotide sequence to (i) nucleic acid programmed DNA binding protein (napDNAbp) and reverse transcriptase; (b) polymerizing the single-stranded DNA sequence encoding the functional moiety; and (c) DNA repair and/or or incorporating, by a replication process, a single-stranded DNA sequence in place of the corresponding endogenous strand in the target nucleotide sequence, wherein the method generates a recombinant target nucleotide sequence encoding a fusion protein comprising the protein of interest and the functional moiety. arise.
148. Embodiment 147. The method of embodiment 147, wherein the functional moiety is a peptide tag.
149. Embodiment 148, wherein the peptide tag is an affinity tag, solubilization tag, chromatography tag, epitope tag, or fluorescent tag.
150. Embodiment 148, wherein the peptide tag is: AviTag (SEQ ID NO: 245); C-tag (SEQ ID NO: 246); calmodulin tag (SEQ ID NO: 247); polyglutamic acid tag (SEQ ID NO: 248); E-tag (SEQ ID NO: 249). );FLAG tag(Sequence number2);HA tag(sequence numberFive);His tag (SEQ ID NO. 252-262);Myc tag (SEQ ID NO.6; NE tag (SEQ ID NO: 264); Rho1D4 tag (SEQ ID NO: 265); S tag (SEQ ID NO: 266); SBP tag (SEQ ID NO: 267); Softag-1 (SEQ ID NO: 268); Softag-2 (SEQ ID NO: 269); Spot tag (SEQ ID NO: 270); Strep tag (SEQ ID NO: 271); TC tag (SEQ ID NO: 272); Ty tag (SEQ ID NO: 273); V5 tag (SEQ ID NO:3); VSV tag (SEQ ID NO: 275); and Xpress tag (SEQ ID NO: 276).
151. Embodiment 148, wherein the peptide tag is: AU1 epitope (SEQ ID NO: 278); AU5 epitope (SEQ ID NO: 279); bacteriophage T7 epitope (T7 tag) (SEQ ID NO: 280); bluetongue virus tag (B tag). (SEQ ID NO: 281); E2 epitope (SEQ ID NO: 282); histidine affinity tag (HAT) (SEQ ID NO: 283); HSV epitope (SEQ ID NO: 284); polyarginine (Arg tag) (SEQ ID NO: 285); polyaspartic acid ( Asp tag) (SEQ ID NO: 286); polyphenylalanine (Phe tag) (SEQ ID NO: 287); S1 tag (SEQ ID NO: 288); S tag (SEQ ID NO: 266); and VSVtag(Sequence number 275) is selected from the group consisting of
152. Embodiment 147. The method of embodiment 147, wherein the functional moiety is an immune epitope.
153. Embodiment 152, wherein the immune epitope is: tetanus toxoid (SEQ ID NO: 396); diphtheria toxin variant CRM197 (SEQ ID NO: 398); mumps immune epitope 1 (SEQ ID NO: 400); mumps immune epitope 2 (SEQ ID NO: 402). Mumps immune epitope 3 (SEQ ID NO: 404); Rubella virus (SEQ ID NO: 406); Hemagglutinin (SEQ ID NO: 408); Neuraminidase (SEQ ID NO: 410); TAP1 (SEQ ID NO: 412); TAP2 (SEQ ID NO: 414); Class I HLA hemagglutinin epitope for class I HLA (SEQ ID NO: 416); neuraminidase epitope for class I HLA (SEQ ID NO: 418); hemagglutinin epitope for class II HLA (SEQ ID NO: 420); neuraminidase epitope for class II HLA (SEQ ID NO: 422); hemagglutinin epitope H5N1 binding class I and class II HLA (SEQ ID NO: 424); neuraminidase epitope H5N1 binding class I and class II HLA (SEQ ID NO: 426).
154. A method of embodiment 147, wherein the functional moiety alters the localization of a target protein.
155. Embodiment 147. The method of embodiment 147, wherein the functional moiety is a degradation tag, so that the degradation rate of the protein of interest is altered.
156. 155. The method of aspect 155, wherein the decomposition tagcomprises an amino acid sequence encoding a degradation tag as disclosed herein..
157. Embodiment 147. The method of embodiment 147, wherein the functional moiety is a small molecule binding domain.
158. The method of embodiment 157, wherein the small molecule binding domain is FKBP12 of SEQ ID NO: 488.
159. The method of embodiment 157, wherein the small molecule binding domain is FKBP12-F36V of SEQ ID NO: 489.
160. Embodiment 157, wherein the small molecule binding domain is SEQ ID NO: 49.0 and 493~494 cyclophilin.
161. Embodiment 157. The method of embodiment 157, wherein the small molecule binding domain is incorporated onto two or more proteins of interest.
162. 162. The method of embodiment 161, wherein the two or more proteins of interest can be dimerized by contacting the small molecule.
163. The method of embodiment 157, wherein the small molecule is:
Figure 2020191234000477
Figure 2020191234000478
It is a low molecular weight dimer selected from the group consisting of:
164. A method for incorporating an immune epitope into a protein of interest encoded by a target nucleotide sequence by prime editing, the method comprising: (a) contacting the target nucleotide sequence with (i) a prime editing factor comprising a nucleic acid programmable DNA binding protein (napDNAbp) and a reverse transcriptase and (ii) a PEgRNA comprising an editing template encoding a functional moiety; (b) polymerizing a single-stranded DNA sequence encoding the immune epitope; and (c) incorporating the single-stranded DNA sequence in place of the corresponding endogenous strand in the target nucleotide sequence by DNA repair and/or replication processes, the method producing a recombinant target nucleotide sequence encoding a fusion protein comprising the protein of interest and the immune epitope.
165. 164. The method of embodiment 164, wherein the immune epitope is: tetanus toxoid (SEQ ID NO: 396); diphtheria toxin variant CRM197 (SEQ ID NO: 398); mumps immune epitope 1 (SEQ ID NO: 400); mumps immune epitope 2 (SEQ ID NO: 402). Mumps immune epitope 3 (SEQ ID NO: 404); Rubella virus (SEQ ID NO: 406); Hemagglutinin (SEQ ID NO: 408); Neuraminidase (SEQ ID NO: 410); TAP1 (SEQ ID NO: 412); TAP2 (SEQ ID NO: 414); Class I HLA hemagglutinin epitope for class I HLA (SEQ ID NO: 416); neuraminidase epitope for class I HLA (SEQ ID NO: 420); neuraminidase epitope for class II HLA (SEQ ID NO: 422); hemagglutinin epitope H5N1 binding class I and class II HLA (SEQ ID NO: 424); neuraminidase epitope H5N1 binding class I and class II HLA (SEQ ID NO: 426).
166. Embodiment 164. The method of embodiment 164, wherein the fusion protein comprises the amino acid sequence of PE1, PE2, or PE3.
167. Embodiment 164. The method of embodiment 164, wherein napDNAbp is Cas9 nickase (nCas9).
168. The method of embodiment 164, wherein napDNAbp is SEQ ID NO: 18 to88, 126, 130, 137, 141, 147, 153, 157, 445, 460, 467, and 482-487Contains the amino acid sequence of
169. 165. The method of embodiment 164, wherein the guide RNA comprises SEQ ID NO: 222.
170. A method of incorporating small molecule dimerization domains onto a protein of interest encoded by a target nucleotide sequence by prime editing, the method comprising: (a) converting the target nucleotide sequence into (i) a nucleic acid programmed DNA binding protein ( (b) polymerizing a single-stranded DNA sequence encoding an immune epitope; and (c) incorporating the single-stranded DNA sequence in place of the corresponding endogenous strand in the target nucleotide sequence by a DNA repair and/or replication process, the method comprising: A recombinant target nucleotide sequence is generated that encodes a fusion protein comprising an integration domain.
171. Embodiment 170. The method of embodiment 170, further comprising performing the method on a second protein of interest.
172. 172. The method of embodiment 171, wherein the first protein of interest and the second protein of interest dimerize in the presence of a small molecule that binds to a respective dimerization domain of the proteins.
173. 170. The method of embodiment 170, wherein the small molecule binding domain is FKBP12 of SEQ ID NO: 488.
174. The method of embodiment 170, wherein the small molecule binding domain is FKBP12-F36V of sequence number 489.
175. Embodiment 170, wherein the small molecule binding domain is SEQ ID NO: 49.0 and 493~494 cyclophilins.
176. Embodiment 170, wherein the small molecule is:
Figure 2020191234000479
Figure 2020191234000480
Figure 2020191234000481
It is a low molecular weight dimer selected from the group consisting of:
177. Embodiment 170, wherein the fusion protein comprises the amino acid sequence of PE1, PE2, or PE3.
178. Embodiment 170, wherein the napDNAbp is Cas9 nickase (nCas9).
179. The method of embodiment 170, wherein napDNAbp is SEQ ID NO: 18 to88, 126, 130, 137, 141, 147, 153, 157, 445, 460, 467, and 482-487Contains the amino acid sequence of
180. Embodiment 170, wherein the guide RNA comprises SEQ ID NO: 222.
181. A method of incorporating a peptide tag or epitope onto a protein using prime editing, comprising: a prime editing agent configured to insert into a target nucleotide sequence encoding a protein a second nucleotide sequence encoding a peptide tag; contacting the recombinant nucleotide sequence with a construct so that the peptide tag and protein are expressed from the recombinant nucleotide sequence as a fusion protein.
182. 182. The method of embodiment 181, wherein the peptide tag is used for protein purification and/or detection.
183. 182. The method of embodiment 181, wherein the peptide tag is polyhistidine (e.g., HHHHHH(Sequence number 257)), FLAG (for example, DYKDDDDK(Sequence number 2)), V5 (for example, GKPIPNPLLGLLDST(Sequence number 3)), GCN4, HA (e.g., YPYDVPDYA(Sequence number 5)), Myc (e.g. EQKLISEED(Sequence number 6)), GST, etc.
184. 182. The method of embodiment 181, wherein the peptide tag has an amino acid sequence selected from the group consisting of SEQ ID NOs: 245-290.
185. 182. The method of embodiment 181, wherein the peptide tag is fused to the protein by a linker.
186. The method of embodiment 181, wherein the fusion protein has the following structure: [protein]-[peptide tag] or [peptide tag]-[protein], where "]-[" represents an optional linker.
187. The method of embodiment 181, wherein the linker has the amino acid sequence of SEQ ID NOs: 127, 165-176, 446, 453, and 767-769.
188. 182. The method of embodiment 181, wherein the prime editing factor construct has SEQ ID NO.101-104, 181-183, 223-234, 237-244, 277, 324-330, 332, 334, 336, 338, 340, 342, 344, 346, 348, 350, 352, 354, 356, 358, 360, 362, 364, 366, 368, 394, 429-442, 499-505, 641-649, 678-692, 735-736, 757-761, 776-777PEgRNA containing the nucleotide sequence of
189. 182. The method of embodiment 181, wherein the PEgRNA comprises a spacer, a gRNA core, and an extended arm, the spacer being complementary to a target nucleotide sequence, and the extended arm comprising a reverse transcriptase template encoding a peptide tag.
190. 182. The method of embodiment 181, wherein the PEgRNA comprises a spacer, a gRNA core, and an extended arm, the spacer being complementary to a target nucleotide sequence, and the extended arm comprising a reverse transcriptase template encoding a peptide tag.
191. A method of preventing or halting the progression of a prion disease by incorporating one or more protective mutations on a PRNP encoded by a target nucleotide sequence by prime editing, the method comprising: (a) (i) a prime editing factor comprising a nucleic acid programmed DNA binding protein (napDNAbp) and a reverse transcriptase; and (ii) a PEgRNA comprising an editing template encoding a functional moiety; (b) a prime editing factor comprising a nucleic acid programmed DNA binding protein (napDNAbp) and a reverse transcriptase; polymerizing the single-stranded DNA sequence; and (c) incorporating the single-stranded DNA sequence in place of the corresponding endogenous strand in the target nucleotide sequence by a DNA repair and/or replication process, the method comprising: A recombinant target nucleotide sequence is generated that encodes a PRNP containing a protective mutation that is resistant to.
192. 192. The method of embodiment 191, wherein the prion disease is a human prion disease.
193. Embodiment 191, wherein the prion disease is an animal prion disease.
194. The method of embodiment 192, wherein the prion disease is Creutzfeldt-Jakob disease (CJD), variant Creutzfeldt-Jakob disease (vCJD), Gerstmann-Straussler-Scheinker syndrome, fatal familial insomnia, or kuru.
195. Embodiment 193, wherein the prion disease is bovine spongiform encephalopathy (BSE or "mad cow disease"), chronic wasting disease (CWD), scrapie, transmissible mink encephalopathy, feline spongiform encephalopathy, and ungulate spongiform encephalopathy. It is encephalopathy.
196. The method of embodiment 191, wherein the wild type PRNP amino acid sequence is SEQ ID NO: 291-292.
197. Embodiment 191, wherein the method results in a modified PRNP amino acid sequence selected from the group consisting of SEQ ID NOs: 293-323, wherein the modified PRNP protein is resistant to misfolding.
198. 192. The method of embodiment 191, wherein the fusion protein comprises the amino acid sequence of PE1, PE2, or PE3.
199. 192. The method of embodiment 191, wherein napDNAbp is Cas9 nickase (nCas9).
200. The method of embodiment 191, wherein napDNAbp is SEQ ID NO: 18 to88, 126, 130, 137, 141, 147, 153, 157, 445, 460, 467, and 482-487Contains the amino acid sequence of
201. 192. The method of embodiment 191, wherein the guide RNA comprises SEQ ID NO: 222.
202. A method of incorporating a ribonucleotide motif or tag onto an RNA of interest encoded by a target nucleotide sequence by prime editing, the method comprising: (a) converting the target nucleotide sequence into (i) a nucleic acid programmed DNA binding protein (napDNAbp); and a prime editing agent comprising a reverse transcriptase and (ii) an editing template encoding a ribonucleotide motif or tag; (b) polymerizing a single-stranded DNA sequence encoding a ribonucleotide motif or tag. and (c) incorporating a single-stranded DNA sequence in place of the corresponding endogenous strand in the target nucleotide sequence by a DNA repair and/or replication process, the method comprising: A recombinant target nucleotide sequence is generated that encodes a modified RNA.
203. Embodiment 202. The method of embodiment 202, wherein the ribonucleotide motif or tag is the detection moiety.
204. The method of embodiment 202, wherein the ribonucleotide motif or tag affects the expression level of the RNA of interest.
205. Embodiment 202 The method of embodiment 202, wherein the ribonucleotide motif or tag affects the trafficking or subcellular localization of the RNA of interest.
206. Embodiment 202, wherein the ribonucleotide motif or tag is SV40 type 1, SV40 type 2, SV40 type 3, hGH, BGH, rbGlob, TK, MALAT1 ENE-mascRNA, KSHV PAN ENE, Smbox/U1 snRNA box, selected from the group consisting of U1 snRNA 3' box, tRNA-lysine, broccoli aptamer, spinach aptamer, mango aptamer, HDV ribozyme, and m6A.
207. The method of embodiment 202, wherein the PEgRNA is SEQ ID NO.101-104, 181-183, 223-234, 237-244, 277, 324-330, 332, 334, 336, 338, 340, 342, 344, 346, 348, 350, 352, 354, 356, 358, 360, 362, 364, 366, 368, 394, 429-442, 499-505, 641-649, 678-692, 735-736, 757-761, 776-777, 2997-3103, 3113-3121, 3305- 3455, 3479-3493, 3522-3540, 3549-3556, 3628-3698, 3755-3810, 3874, 3890-3901, 3905-3911, 3913-3929, 3972-3989including.
208. The method of embodiment 202, wherein the fusion protein comprises an amino acid sequence of PE1, PE2, or PE3.
209. Embodiment 202, wherein the napDNAbp is Cas9 nickase (nCas9).
210. The method of embodiment 202, wherein napDNAbp is SEQ ID NO: 18 to88, 126, 130, 137, 141, 147, 153, 157, 445, 460, 467, and 482-487Contains the amino acid sequence of
211. A method of incorporating or deleting a functional moiety on a protein of interest encoded by a target nucleotide sequence by prime editing, the method comprising: (a) converting the target nucleotide sequence into (i) a nucleic acid programmed DNA binding protein (napDNAbp); ) and a prime editing factor comprising reverse transcriptase and (ii) a PEgRNA comprising an editing template encoding the functional moiety or its deletion; (b) a single-stranded DNA sequence encoding the functional moiety or its deletion; and (c) incorporating a single-stranded DNA sequence in place of the corresponding endogenous strand in the target nucleotide sequence by a DNA repair and/or replication process, the method comprising or a deletion thereof, resulting in a recombinant target nucleotide sequence encoding a modified protein, wherein the functional moiety alters the modification state or localization state of the protein.
212. Embodiment 211. The method of embodiment 211, wherein the functional moiety alters the phosphorylation, ubiquitination, glycosylation, lipid modification, hydroxylation, methylation, acetylation, crotonylation, or SUMOylation status of the protein of interest.
Group 2. Aspects 213-424
213. A fusion protein that includes a nucleic acid programmed DNA binding protein (napDNAbp) and a polymerase.
214. The fusion protein of embodiment 213, wherein the fusion protein is capable of performing prime editing in the presence of a prime editing guide RNA (PEgRNA).
215. The fusion protein of embodiment 213, wherein napDNAbp has nickase activity.
216. The fusion protein of embodiment 213, wherein napDNAbp is a Cas9 protein or a variant thereof.
217. The fusion protein of embodiment 213, wherein napDNAbp is nuclease-active Cas9, nuclease-inactive Cas9 (dCas9), or Cas9 nickase (nCas9).
218. The fusion protein of embodiment 213, wherein napDNAbp is Cas9 nickase (nCas9).
219. The fusion protein of embodiment 213, wherein napDNAbp is selected from the group consisting of: Cas9, Cas12e, Cas12d, Cas12a, Cas12b1, Cas13a, Cas12c, and Argonaute, and optionally has nickase activity.
220. The fusion protein of embodiment 213, wherein the fusion protein is capable of binding to a target DNA sequence when complexed with PEgRNA.
221. The fusion protein of embodiment 220, wherein the target DNA sequence comprises a target strand and a complementary non-target strand.
222. The fusion protein of embodiment 220, wherein the binding of the fusion protein complexed to PEgRNA forms an R-loop.
223. The fusion protein of embodiment 222, wherein the R-loop comprises (i) an RNA-DNA hybrid comprising PEgRNA and a target strand and (ii) a complementary non-target strand.
224. The fusion protein of embodiment 223, wherein the complementary non-target strand is nicked to form a prime sequence with a free 3' end.
225. A fusion protein of embodiment 214, wherein the PEgRNA comprises (a) a guide RNA and (b) an extension arm at the 5' or 3' end of the guide RNA or positioned intramolecularly of the guide RNA.
226. The fusion protein of embodiment 225, wherein the extended arm comprises (i) a DNA synthesis template sequence containing a desired nucleotide change and (ii) a primer binding site.
227. Embodiment 226. The fusion protein of embodiment 226, wherein the DNA synthesis template sequence encodes a single-stranded DNA flap that is complementary to an endogenous DNA sequence adjacent to the nick site, the single-stranded DNA flap containing a desired nucleotide change. including.
228. Embodiment 225, wherein the elongated arm is at least 5 nucleotides, at least 6 nucleotides, at least 7 nucleotides, at least 8 nucleotides, at least 9 nucleotides, at least 10 nucleotides, at least 11 nucleotides, at least 12 nucleotides, at least 13 nucleotides in length. nucleotides, at least 14 nucleotides, at least 15 nucleotides, at least 16 nucleotides, at least 17 nucleotides, at least 18 nucleotides, at least 19 nucleotides, at least 20 nucleotides, at least 21 nucleotides, at least 22 nucleotides, at least 23 nucleotides, at least 24 nucleotides, or at least 25 nucleotides It is.
229. The fusion protein of embodiment 227, wherein the single-stranded DNA flap hybridizes to the endogenous DNA sequence adjacent to the nick site, thereby incorporating the desired nucleotide change.
230. The fusion protein of embodiment 227, wherein the single-stranded DNA flap replaces the endogenous DNA sequence with a free 5' end and adjacent to the nick site.
231. The fusion protein of embodiment 230, wherein the endogenous DNA sequence having a 5' end is excised by the cell.
232. A fusion protein of embodiment 230, wherein cellular repair of the single-stranded DNA flap results in incorporation of a desired nucleotide change, thereby forming a desired product.
233. The fusion protein of embodiment 226, wherein the desired nucleotide change is between about -4 and +10 of the PAM sequence, or between about -10 and +20 of the PAM sequence, or between about -20 and +40 of the PAM sequence, or The desired nucleotide change is incorporated on an editing window that is between approximately -30 and +100 of the PAM sequence, or the desired nucleotide change is at least 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, Incorporates 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99, or 100 nucleotides downstream.
234. The fusion protein of embodiment 213, wherein napDNAbp is SEQ ID NO:18Amino acid sequence of or SEQ ID NO.18an amino acid sequence having at least 80%, 85%, 90%, 95%, 98%, or 99% sequence identity with the amino acid sequence of
235. The fusion protein of embodiment 213, wherein napDNAbp is SEQ ID NO:18-88, 126, 130, 137, 141, 147, 153, 157, 445, 460, 467, and 482-487an amino acid sequence having at least 80%, 85%, 90%, 95%, 98%, or 99% sequence identity with any one amino acid sequence of
236. The fusion protein of embodiment 213, wherein the polymerase is reverse transcriptase, and wherein SEQ ID NO:89-100, 105-122, 128-129, 132, 139, 143, 149, 154, 159, 235, 454, 471, 516, 662, 700, 701-716, 739-741, and 766Contains any one of the following amino acid sequences.
237. The fusion protein of embodiment 213, wherein the polymerase is reverse transcriptase, and wherein SEQ ID NO:89-100, 105-122, 128-129, 132, 139, 143, 149, 154, 159, 235, 454, 471, 516, 662, 700, 701-716, 739-741, and 766an amino acid sequence having at least 80%, 85%, 90%, 95%, 98%, or 99% sequence identity with any one amino acid sequence of
238. The fusion protein of embodiment 213, wherein the polymerase is a naturally occurring reverse transcriptase from a retrovirus or retrotransposon.
239. The fusion protein of any one of the preceding embodiments, wherein the fusion protein has the structure NH2-[napDNAbp]-[polymerase]-COOH; or NH2-[polymerase]-[napDNAbp]-COOH, with each occurrence of "]-[" indicating the presence of an optional linker sequence.
240. The fusion protein of embodiment 239, wherein the linker sequence is selected from the group consisting of SEQ ID NO:127, 165-176, 446, 453, and 767-769Contains the amino acid sequence of
241. The fusion protein of embodiment 226, wherein the desired nucleotide change is a single nucleotide change, an insertion of one or more nucleotides, or a deletion of one or more nucleotides.
242. The fusion protein of embodiment 241, wherein the insertion or deletion is at least 1, at least 2, at least 3, at least 4, at least 5, at least 6, at least 7, at least 8, at least 9, at least 10, at least 11, at least 12 , at least 13, at least 14, at least 15, at least 16, at least 17, at least 18, at least 19, at least 20, at least 21, at least 22, at least 23, at least 24, at least 25, at least 26, at least 27, at least 28, at least 29, at least 30, at least 31, at least 32, at least 33, at least 34, at least 35, at least 36, at least 37, at least 38, at least 39, at least 40, at least 41, at least 42, at least 43, at least 44, at least 45, At least 46, at least 47, at least 48, at least 49, or at least 50.
243. PEgRNA comprising a guide RNA and at least one nucleic acid extension arm comprising a DNA synthesis template.
244. The PEgRNA of embodiment 241, wherein the nucleic acid extension arm is located at the 3' or 5' end of the guide RNA or a position within the molecule of the guide RNA, and the nucleic acid extension arm is DNA or RNA.
245. The PEgRNA of embodiment 242, wherein the PEgRNA is capable of binding napDNAbp and directing napDNAbp to a target DNA sequence.
246. The PEgRNA of embodiment 245, wherein the target DNA sequence comprises a target strand and a complementary non-target strand, and the guide RNA hybridizes to the target strand to form an RNA-DNA hybrid and an R-loop.
247. The PEgRNA of embodiment 243, wherein at least one nucleic acid extension arm comprises (i) a DNA synthesis template and (ii) a primer binding site.
248. The PEgRNA of embodiment 247, wherein the nucleic acid extended arm is at least 5 nucleotides, at least 6 nucleotides, at least 7 nucleotides, at least 8 nucleotides, at least 9 nucleotides, at least 10 nucleotides, at least 11 nucleotides, at least 12 nucleotides, at least 13 nucleotides in length. nucleotides, at least 14 nucleotides, at least 15 nucleotides, at least 16 nucleotides, at least 17 nucleotides, at least 18 nucleotides, at least 19 nucleotides, at least 20 nucleotides, at least 21 nucleotides, at least 22 nucleotides, at least 23 nucleotides, at least 24 nucleotides, or at least 25 nucleotides It is.
249. The PEgRNA of embodiment 247, wherein the DNA synthesis template is at least 3 nucleotides, at least 4 nucleotides, at least 5 nucleotides, at least 6 nucleotides, at least 7 nucleotides, at least 8 nucleotides, at least 9 nucleotides, at least 10 nucleotides, at least 11 nucleotides in length. nucleotides, at least 12 nucleotides, at least 13 nucleotides, at least 14 nucleotides, or at least 15 nucleotides.
250. The PEgRNA of embodiment 247, wherein the primer binding site is at least 3 nucleotides, at least 4 nucleotides, at least 5 nucleotides, at least 6 nucleotides, at least 7 nucleotides, at least 8 nucleotides, at least 9 nucleotides, at least 10 nucleotides, at least 11 nucleotides in length. nucleotides, at least 12 nucleotides, at least 13 nucleotides, at least 14 nucleotides, or at least 15 nucleotides.
251. The PEgRNA of embodiment 243 further comprises at least one additional structure selected from the group consisting of a linker, stem-loop, hairpin, toe-loop, aptamer, or RNA-protein recruitment domain.
252. The PEgRNA of embodiment 247, wherein the DNA synthesis template encodes a single-stranded DNA flap that is complementary to an endogenous DNA sequence adjacent to the nick site, and the single-stranded DNA flap includes the desired nucleotide change. .
253. A PEGRNA of embodiment 252, wherein the single-stranded DNA flap displaces endogenous single-stranded DNA having a 5' end on the nicked target DNA sequence, and the endogenous single-stranded DNA is immediately adjacent to and downstream of the nick site.
254. The PEgRNA of embodiment 253, wherein the endogenous single-stranded DNA with a free 5' end is excised by the cell.
255. Embodiment 253 PEgRNA, wherein cellular repair of the single-stranded DNA flap results in the incorporation of the desired nucleotide change, thereby forming the desired product.
256. PEgRNA of embodiment 243, comprising SEQ ID NO:101-104, 181-183, 223-234, 237-244, 277, 324-330, 332, 334, 336, 338, 340, 342, 344, 346, 348, 350, 352, 354, 356, 358, 360, 362, 364, 366, 368, 394, 429-442, 499-505, 641-649, 678-692, 735-736, 757-761, 776-777nucleotide sequence, or SEQ ID NO.101-104, 181-183, 223-234, 237-244, 277, 324-330, 332, 334, 336, 338, 340, 342, 344, 346, 348, 350, 352, 354, 356, 358, 360, 362, 364, 366, 368, 394, 429-442, 499-505, 641-649, 678-692, 735-736, 757-761, 776-777nucleotide sequences having at least 85%, or at least 90%, or at least 95%, or at least 98%, or at least 99% sequence identity with any one of the following.
257. The PEgRNA of embodiment 247, wherein the DNA synthesis template comprises a nucleotide sequence that is at least 80% or 85% or 90% or 95% or 99% identical to the endogenous DNA target.
258. The PEgRNA of embodiment 247, wherein the primer binding site hybridizes to the free 3' end of the cut DNA.
259. The PEgRNA of embodiment 251, wherein the at least one additional structure is located at the 3' or 5' end of the PEgRNA.
260. A complex comprising the fusion protein of any one of embodiments 213-242 and PEgRNA.
261. Embodiment 260, wherein the PEgRNA comprises a guide RNA and a nucleic acid extension arm at the 3' or 5' end of the guide RNA or at a position within the molecule of the guide RNA.
262. Embodiment 260, wherein the PEgRNA is capable of binding napDNAbp and directing napDNAbp to a target DNA sequence.
263. Embodiment 262, wherein the target DNA sequence comprises a target strand and a complementary non-target strand, and the guide RNA hybridizes to the target strand to form an RNA-DNA hybrid and an R-loop.
264. The complex of embodiment 261, wherein at least one nucleic acid extension arm comprises (i) a DNA synthesis template and (ii) a primer binding site.
265. Embodiment 260, wherein the PEgRNA is SEQ ID NO:101-104, 181-183, 223-234, 237-244, 277, 324-330, 332, 334, 336, 338, 340, 342, 344, 346, 348, 350, 352, 354, 356, 358, 360, 362, 364, 366, 368, 394, 429-442, 499-505, 641-649, 678-692, 735-736, 757-761, 776-777nucleotide sequence, or SEQ ID NO.101-104, 181-183, 223-234, 237-244, 277, 324-330, 332, 334, 336, 338, 340, 342, 344, 346, 348, 350, 352, 354, 356, 358, 360, 362, 364, 366, 368, 394, 429-442, 499-505, 641-649, 678-692, 735-736, 757-761, 776-777or at least 90%, or at least 95%, or at least 98%, or at least 99% sequence identity with any one of the following:
266. The conjugate of embodiment 264, wherein the DNA synthesis template comprises a nucleotide sequence that is at least 80% or 85% or 90% or 95% or 99% identical to the endogenous DNA target.
267. Embodiment 264. The complex of embodiment 264, wherein the primer binding site hybridizes to the free 3' end of the cut DNA.
268. A complex containing napDNAbp and PEgRNA.
269. The complex of embodiment 268, wherein napDNAbp is Cas9 nickase.
270. The complex of embodiment 268, wherein napDNAbp is SEQ ID NO.18Contains the amino acid sequence of
271. Embodiment 268, wherein napDNAbp is SEQ ID NO:18-88, 126, 130, 137, 141, 147, 153, 157, 445, 460, 467, and 482-487an amino acid sequence having at least 80%, 85%, 90%, 95%, 98%, or 99% sequence identity with any one amino acid sequence of
272. Embodiment 268, wherein the PEgRNA comprises a guide RNA and a nucleic acid extension arm at the 3' or 5' end of the guide RNA or at a position within the molecule of the guide RNA.
273. Embodiment 268. The complex of embodiment 268, wherein the PEgRNA is capable of directing napDNAbp to a target DNA sequence.
274. The complex of embodiment 272, wherein the target DNA sequence comprises a target strand and a complementary non-target strand, and the spacer sequence of PEgRNA hybridizes to the target strand to form an RNA-DNA hybrid and an R-loop.
275. The complex of embodiment 273, wherein the nucleic acid extension arm comprises (i) a DNA synthesis template and (ii) a primer binding site.
276. Embodiment 269, wherein the PEgRNA is SEQ ID NO:101-104, 181-183, 223-234, 237-244, 277, 324-330, 332, 334, 336, 338, 340, 342, 344, 346, 348, 350, 352, 354, 356, 358, 360, 362, 364, 366, 368, 394, 429-442, 499-505, 641-649, 678-692, 735-736, 757-761, 776-777, 2997-3103, 3113-3121, 3305- 3455, 3479-3493, 3522-3540, 3549-3556, 3628-3698, 3755-3810, 3874, 3890-3901, 3905-3911, 3913-3929, 3972-3989nucleotide sequence, or SEQ ID NO.101-104, 181-183, 223-234, 237-244, 277, 324-330, 332, 334, 336, 338, 340, 342, 344, 346, 348, 350, 352, 354, 356, 358, 360, 362, 364, 366, 368, 394, 429-442, 499-505, 641-649, 678-692, 735-736, 757-761, 776-777nucleotide sequences having at least 85%, or at least 90%, or at least 95%, or at least 98%, or at least 99% sequence identity with any one of the following.
277. The conjugate of embodiment 276, wherein the DNA synthesis template comprises a nucleotide sequence that is at least 80% or 85% or 90% or 95% or 99% identical to the endogenous DNA target.
278. The complex of embodiment 276, wherein the primer binding site hybridizes to the free 3' end of the cut DNA.
279. The conjugate of embodiment 276, wherein the PEgRNA further comprises at least one additional structure selected from the group consisting of a linker, a stem-loop, a hairpin, a toe-loop, an aptamer, or an RNA-protein recruitment domain.
280. A polynucleotide encoding the fusion protein of any of embodiments 213-242.
281. A vector comprising the polynucleotide of embodiment 280.
282. A cell comprising the fusion protein of any of embodiments 213-242 and PEgRNA bound to napDNAbp of the fusion protein.
283. A cell comprising the complex of any one of embodiments 260-279.
284. A pharmaceutical composition comprising: (i) a fusion protein of any of embodiments 213-242, a conjugate of embodiments 260-279, a polynucleotide of embodiment 68, or a vector of embodiment 69; and (ii) a pharmaceutically acceptable Contains excipients.
285. A pharmaceutical composition comprising: (i) a conjugate of embodiments 260-279, (ii) a polymerase provided in trans; and (iii) a pharmaceutically acceptable excipient.
286. A kit comprising: (i) a nucleic acid sequence encoding a fusion protein of any one of embodiments 213-242; and (ii) a nucleic acid construct comprising a promoter driving expression of the sequence of (i).
287. A method for incorporating desired nucleotide changes into a double-stranded DNA sequence, the method comprising:
(i) contacting the double-stranded DNA sequence with a complex comprising a fusion protein and PEgRNA, the fusion protein comprising napDNAbp and a polymerase, and the PEgRNA comprising a DNA synthesis template containing the desired nucleotide changes and a primer binding site;
(ii) nicking the double-stranded DNA sequence, thereby generating free single-stranded DNA with a 3' end;
(iii) hybridizing the 3' end of the free single-stranded DNA to the primer binding site, thereby priming the polymerase;
(iv) polymerizing a strand of DNA from the 3' end hybridized to the primer binding site, thereby producing a single-stranded DNA flap that is complementary to the DNA synthesis template and contains the desired nucleotide changes; ;
(v) replacing the endogenous DNA strand adjacent to the cut site by a single-stranded DNA flap, thereby incorporating the desired nucleotide change into the double-stranded DNA sequence;
including.
288. 287. The method of embodiment 287, wherein (v) the replacing step comprises: (i) hybridizing the single-stranded DNA flap to an endogenous DNA strand adjacent to the cut site to create a sequence mismatch; (ii) ) excising the endogenous DNA strand; and (iii) repairing the mismatch to form the desired product containing the desired nucleotide changes in both strands of the DNA.
289. Embodiment 288, wherein the desired nucleotide change is a single nucleotide substitution, deletion, or insertion.
290. Embodiment 289. The method of embodiment 289, wherein the single nucleotide substitution is a transition or transversion.
291. Embodiment 288, wherein the desired nucleotide change is (1) a G to T substitution, (2) a G to A substitution, (3) a G to C substitution, (4) a T to G substitution, (5) Substitution of A from T, (6) Substitution of C from T, (7) Substitution of G from C, (8) Substitution of T from C, (9) Substitution of A from C, (10) Substitution of A (11) A to G substitution, or (12) A to C substitution.
292. Embodiment 288, wherein the desired nucleoid change is (1) a G:C base pair to a T:A base pair; (2) a G:C base pair to an A:T base pair; 3) G:C base pair to C:G base pair, (4) T:A base pair to G:C base pair, (5) T:A base pair to A:T base pair, (6) T:A base pair becomes C:G base pair, (7) C:G base pair becomes G:C base pair, (8) C:G base pair becomes T:A base pair, C:G base pair. into an A:T base pair, (10) an A:T base pair into a T:A base pair, (11) an A:T base pair into a G:C base pair, or (12) an A:T base pair. Convert to C:G base pair.
293. Embodiment 288, wherein the desired nucleotide change is 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, An insertion or deletion of 19, 20, 21, 22, 23, 24, or 25 nucleotides.
294. Embodiment 288. The method of embodiment 288, wherein the desired nucleotide change modifies a disease-associated gene.
295. Embodiment 294, wherein the disease-associated gene is: adenosine deaminase (ADA) deficiency; alpha-1 antitrypsin deficiency; cystic fibrosis; Duchenne muscular dystrophy; galactosemia; hemochromatosis; Huntington's disease; maple Syrupuria; Marfan syndrome; type 1 neurofibromatosis; congenital nail hypertrophy; phenylketonuria; severe combined immunodeficiency; sickle cell disease; Smith-Lemli-Opitz syndrome; trinucleotide repeat disorder; prion disease associated with a single gene disorder selected from the group consisting of; and Tay-Sachs disease.
296. The method of embodiment 294, wherein the disease-associated gene is associated with a polygenic disorder selected from the group consisting of: heart disease; high blood pressure; Alzheimer's disease; arthritis; diabetes; cancer; and obesity.
297. The method of embodiment 287, wherein the napDNAbp is a nuclease-inactive Cas9 (dCas9), a Cas9 nickase (nCas9), or a nuclease-active Cas9.
298. 287. The method of embodiment 287, wherein napDNAbp is SEQ ID NO.18Amino acid sequence of or SEQ ID NO.18an amino acid sequence having at least 80%, 85%, 90%, 95%, 98%, or 99% sequence identity with the amino acid sequence of
299. 287. The method of embodiment 287, wherein napDNAbp is SEQ ID NO.18-88, 126, 130, 137, 141, 147, 153, 157, 445, 460, 467, and 482-487.an amino acid sequence having at least 80%, 85%, 90%, 95%, 98%, or 99% sequence identity with any one amino acid sequence of
300. 287. The method of embodiment 287, wherein the polymerase is reverse transcriptase, and wherein SEQ ID NO.89-100, 105-122, 128-129, 132, 139, 143, 149, 154, 159, 235, 454, 471, 516, 662, 700, 701-716, 739-741, and 766Contains any one of the following amino acid sequences.
301. 287. The method of embodiment 287, wherein the polymerase is reverse transcriptase, and wherein SEQ ID NO.89-100, 105-122, 128-129, 132, 139, 143, 149, 154, 159, 235, 454, 471, 516, 662, 700, 701-716, 739-741, and 766an amino acid sequence having at least 80%, 85%, 90%, 95%, 98%, or 99% sequence identity with any one amino acid sequence of
302. Embodiment 287, wherein the PEgRNA comprises a nucleic acid extension arm at the 3' or 5' end of the guide RNA or at an intramolecular location, the extension arm comprising a DNA synthesis template sequence and a primer binding site.
303. Embodiment 302, wherein the extended arm is at least 5 nucleotides, at least 6 nucleotides, at least 7 nucleotides, at least 8 nucleotides, at least 9 nucleotides, at least 10 nucleotides, at least 11 nucleotides, at least 12 nucleotides, at least 13 nucleotides in length. , at least 14 nucleotides, at least 15 nucleotides, at least 16 nucleotides, at least 17 nucleotides, at least 18 nucleotides, at least 19 nucleotides, at least 20 nucleotides, at least 21 nucleotides, at least 22 nucleotides, at least 23 nucleotides, at least 24 nucleotides, or at least 25 nucleotides be.
304. Embodiment 287 The method of embodiment 287, wherein the PEgRNA has SEQ ID NO.101-104, 181-183, 223-234, 237-244, 277, 324-330, 332, 334, 336, 338, 340, 342, 344, 346, 348, 350, 352, 354, 356, 358, 360, 362, 364, 366, 368, 394, 429-442, 499-505, 641-649, 678-692, 735-736, 757-761, 776-777having a nucleotide sequence selected from the group consisting of:
305. A method for introducing one or more changes in the nucleotide sequence of a DNA molecule at a target locus, the method comprising:
(i) contacting the DNA molecule with a nucleic acid programmed DNA binding protein (napDNAbp) and a PEgRNA that targets the napDNAbp to the target locus, the PEgRNA forming a reverse transcriptase (RT) template containing at least one desired nucleotide change; comprising a sequence and a primer binding site;
(ii) forming an exposed 3' end of the DNA strand at the target locus;
(iii) hybridizing the exposed 3′ end to a primer binding site to prime reverse transcription;
(iv) synthesizing by reverse transcriptase a single-stranded DNA flap containing at least one desired nucleotide change based on the RT template sequence; and
(v) incorporating at least one desired nucleotide change onto the corresponding endogenous DNA, thereby introducing one or more changes in the nucleotide sequence of the DNA molecule at the target locus;
including.
306. Embodiment 305. The method of embodiment 305, wherein the one or more changes in the nucleotide sequence comprises a transition.
307. 306. The method of embodiment 306, wherein the transition is selected from the group consisting of: (a) T to C; (b) A to G; (c) C to T; and (d) G to A.
308. Embodiment 305. The method of embodiment 305, wherein the one or more changes in the nucleotide sequence comprises a transversion.
309. Embodiment 308, wherein the transversion is: (a) T to A; (b) T to G; (c) C to G; (d) C to A; (e) A to T; (f) (g) G to C; and (h) G to T.
310. Embodiment 305, wherein the one or more changes in the nucleotide sequence include: (1) a G:C base pair to a T:A base pair; (2) a G:C base pair to an A:T base pair; (3) G:C base pair to C:G base pair, (4) T:A base pair to G:C base pair, (5) T:A base pair to A:T base pair, (6 )T:A base pair to C:G base pair, (7)C:G base pair to G:C base pair, (8)C:G base pair to T:A base pair, (9)C :G base pair to A:T base pair, (9) A:T base pair to T:A base pair, (11) A:T base pair to G:C base pair, or (12) A: It involves changing a T base pair to a C:G base pair.
311. Embodiment 305, wherein the one or more changes in the nucleotide sequence are 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, Contains insertions or deletions of 17, 18, 19, 20, 21, 22, 23, 24, or 25 nucleotides.
312. The method of embodiment 305, wherein one or more changes in the nucleotide sequence include a correction of a disease-associated gene.
313. The method of embodiment 312, wherein the disease-associated gene is: adenosine deaminase (ADA) deficiency; alpha-1 antitrypsin deficiency; cystic fibrosis; Duchenne muscular dystrophy; galactosemia; hemochromatosis; Huntington's disease; maple Syrupuria; Marfan syndrome; type 1 neurofibromatosis; congenital nail hypertrophy; phenylketonuria; severe combined immunodeficiency; sickle cell disease; Smith-Lemli-Opitz syndrome; trinucleotide repeat disorder; prion disease associated with a single gene disorder selected from the group consisting of; and Tay-Sachs disease.
314. Embodiment 312. The method of embodiment 312, wherein the disease-associated gene is associated with a polygenic disorder selected from the group consisting of: heart disease; hypertension; Alzheimer's disease; arthritis; diabetes; cancer; and obesity.
315. Embodiment 305, wherein the napDNAbp is nuclease-active Cas9 or a variant thereof.
316. Embodiment 305, wherein the napDNAbp is nuclease-inactive Cas9 (dCas9) or Cas9 nickase (nCas9) or a variant thereof.
317. Embodiment 305, wherein napDNAbp is SEQ ID NO.18Amino acid sequence of or SEQ ID NO.18an amino acid sequence having at least 80%, 85%, 90%, 95%, 98%, or 99% sequence identity with.
318. Embodiment 305, wherein napDNAbp is SEQ ID NO.18-88, 126, 130, 137, 141, 147, 153, 157, 445, 460, 467, and 482-487an amino acid sequence having at least 80%, 85%, 90%, 95%, 98%, or 99% sequence identity with any one amino acid sequence of
319. Embodiment 305. The method of embodiment 305, wherein the reverse transcriptase is introduced in trans.
320. Embodiment 305, wherein the napDNAbp comprises a fusion to reverse transcriptase.
321. Embodiment 305, wherein the reverse transcriptase is SEQ ID NO.89-100, 105-122, 128-129, 132, 139, 143, 149, 154, 159, 235, 454, 471, 516, 662, 700, 701-716, 739-741, and 766The amino acid sequence of any one of the following:
322. Embodiment 305, wherein the reverse transcriptase is SEQ ID NO.89-100, 105-122, 128-129, 132, 139, 143, 149, 154, 159, 235, 454, 471, 516, 662, 700, 701-716, 739-741, and 766an amino acid sequence having at least 80%, 85%, 90%, 95%, 98%, or 99% sequence identity with any one amino acid sequence of
323. Embodiment 305. The method of embodiment 305, wherein the step of forming an exposed 3' end of the DNA strand at the target locus comprises nicking the DNA strand with a nuclease.
324. Embodiment 323. The method of embodiment 323, wherein the nuclease is provided in trans.
325. Embodiment 305. The method of embodiment 305, wherein forming an exposed 3' end of the DNA strand at the target locus comprises contacting the DNA strand with a chemical agent.
326. Embodiment 305. The method of embodiment 305, wherein forming an exposed 3' end of the DNA strand at the target locus comprises introducing a replication error.
327. Embodiment 305. The method of embodiment 305, wherein the step of contacting the DNA molecule with napDNAbp and guide RNA forms an R-loop.
328. The method of embodiment 327, wherein the DNA strand from which the exposed 3' end is formed is on the R-loop.
329. Embodiment 315. The method of embodiment 315, wherein the PEgRNA comprises an extended arm that includes a reverse transcriptase (RT) template sequence and a primer binding site.
330. 329. The method of embodiment 329, wherein the elongated arm is at the 3' end of the guide RNA, the 5' end of the guide RNA, or an intramolecular position of the guide RNA.
331. Embodiment 305, wherein the PEgRNA further comprises at least one additional structure selected from the group consisting of a linker, stem-loop, hairpin, toe-loop, aptamer, or RNA-protein recruitment domain.
332. Embodiment 305, wherein the PEgRNA further comprises a homology arm.
333. Embodiment 305. The method of embodiment 305, wherein the RT template sequence is homologous to the corresponding endogenous DNA.
334. A method for introducing one or more changes in the nucleotide sequence of a DNA molecule at a target locus by primed reverse transcription to a primed target, the method comprising: (a) converting the DNA molecule at the target locus to (i) a nucleic acid program; (b) reverse transcription primed to the primed target of the RT template. (c) incorporating the desired nucleotide changes onto the DNA molecule at the target locus by DNA repair and/or replication processes.
335. Embodiment 334. The method of embodiment 334, wherein the RT template is located at the 3' end of the guide RNA, at the 5' end of the guide RNA, or at an intramolecular location of the guide RNA.
336. Embodiment 334. The method of embodiment 334, wherein the desired nucleotide change comprises a transition, transversion, insertion, or deletion, or any combination thereof.
337. Embodiment 334, wherein the desired nucleotide change is a transition selected from the group consisting of: (a) T to C; (b) A to G; (c) C to T; and (d) G to A. including.
338. 335. The method of claim 334, wherein the desired nucleotide change is (a) T to A; (b) T to G; (c) C to G; (d) C to A; (e) A to T; (f) A to C; (g) G to C; and (h) G to T.
339. 335. The method of claim 334, wherein the desired nucleotide change is (1) a G:C base pair to a T:A base pair, (2) a G:C base pair to an A:T base pair, (3) G:C base pair to C:G base pair, (4) T:A base pair to G:C base pair, (5) T:A base pair to A:T base pair, (6) T: A base pair becomes C:G base pair, (7) C:G base pair becomes G:C base pair, (8) C:G base pair becomes T:A base pair, (9) C:G base pair. pair to A:T base pair, (10) A:T base pair to T:A base pair, (11) A:T base pair to G:C base pair, or (12) A:T base pair. It involves changing to a C:G base pair.
340. A polynucleotide encoding the PEgRNA of any one of embodiments 243-259.
341. A vector comprising the polynucleotide of embodiment 340.
342. A cell comprising the vector of embodiment 341.
343. The fusion protein of embodiment 213, wherein the polymerase is an error-prone reverse transcriptase.
344. A method for mutagenizing a DNA molecule at a target locus by primed target reverse transcription, the method comprising: (a) contacting the DNA molecule at the target locus with (i) a fusion protein comprising a nucleic acid programmable DNA binding protein (napDNAbp) and an error-prone reverse transcriptase, and (ii) a guide RNA comprising an RT template containing a desired nucleotide change; (b) performing primed target reverse transcription of the RT template to generate a mutated single-stranded DNA; and (c) incorporating the mutated single-stranded DNA onto the DNA molecule at the target locus by DNA repair and/or replication processes.
345. The method of any preceding embodiment, wherein the fusion protein comprises the amino acid sequence of PE1, PE2, or PE3.
346. A method of any preceding embodiment, wherein the napDNAbp is Cas9 nickase (nCas9).
347. The method of embodiment 344, wherein napDNAbp is selected from SEQ ID NOs: 18 to 19.88, 126, 130, 137, 141, 147, 153, 157, 445, 460, 467, and 482-487Contains the amino acid sequence of
348. Embodiment 344 The method of embodiment 344, wherein the guide RNA is SEQ ID NO.222including.
349. Embodiment 344 The method of embodiment 344, wherein the step of (b) performing primed reverse transcription on a primed target comprises a 3' end primer at the target locus capable of priming reverse transcription by annealing to a primer binding site on a guide RNA. Including generating associative arrays.
350. A method for replacing a trinucleotide repeat expansion mutation on a target DNA molecule by a healthy sequence containing a healthy number of repeat trinucleotides, the method comprising: (a) converting the DNA molecule at the target locus to (i) a nucleic acid programmed contacting a fusion protein containing a DNA binding protein (napDNAbp) and a polymerase; and (ii) a DNA synthesis template containing a replacement sequence and a PEgRNA containing a primer binding site; producing single-stranded DNA; and (c) incorporating single-stranded DNA onto a DNA molecule at a target locus by a DNA repair and/or replication process.
351. Embodiment 350, wherein the fusion protein comprises the amino acid sequence of PE1, PE2, or PE3.
352. Embodiment 350, wherein the napDNAbp is Cas9 nickase (nCas9).
353. The method of embodiment 350, wherein napDNAbp is SEQ ID NO: 18 to88, 126, 130, 137, 141, 147, 153, 157, 445, 460, 467, and 482-487Contains the amino acid sequence of
354. Embodiment 350, wherein the guide RNA is SEQ ID NO.222including.
355. Embodiment 350, wherein (b) performing prime editing generates a 3' end primer binding sequence at the target locus that is capable of priming a polymerase by annealing to a primer binding site on the guide RNA. include.
356. Embodiment 350, wherein the trinucleotide repeat expansion mutation is associated with Huntington's disease, Fragile X syndrome, or Friedreich's ataxia.
357. Embodiment 350, wherein the trinucleotide repeat expansion comprises a CAG triplet repeat unit.
358. The method of embodiment 350, wherein the trinucleotide repeat expansion mutation comprises a repeat unit of a GAA triplet.
359. A method of incorporating a functional moiety onto a protein of interest encoded by a target nucleotide sequence by prime editing, the method comprising: (a) converting the target nucleotide sequence to (i) a nucleic acid programmed DNA binding protein (napDNAbp) and a polymerase; contacting PEgRNA containing a prime editing factor and (ii) a DNA synthesis template encoding a functional moiety; (b) polymerizing a single-stranded DNA sequence encoding a functional moiety; and (c) DNA repair and/or incorporating a single-stranded DNA sequence in place of the corresponding endogenous strand in the target nucleotide sequence by a replication process, the method yielding a recombinant target nucleotide sequence encoding a fusion protein comprising the protein of interest and the functional moiety. .
360. Embodiment 359. The method of embodiment 359, wherein the functional moiety is a peptide tag.
361. Embodiment 360, wherein the peptide tag is an affinity tag, a solubilization tag, a chromatography tag, an epitope or immunoepitope tag, or a fluorescent tag.
362. Embodiment 360, wherein the peptide tag is: AviTag (SEQ ID NO: 245); C-tag (SEQ ID NO: 246); calmodulin tag (SEQ ID NO: 247); polyglutamic acid tag (SEQ ID NO: 248); E-tag (SEQ ID NO: 249). ); FLAG tag (SEQ ID NO.2);HA tag(Sequence numberFive);His tag (SEQ ID NO. 252-262);Myc tag (SEQ ID NO.6); NE tag (SEQ ID NO: 264); Rho1D4 tag (SEQ ID NO: 265); S tag (SEQ ID NO: 266); SBP tag (SEQ ID NO: 267); Softag-1 (SEQ ID NO: 268); Softag-2 (SEQ ID NO: 269); ); Spot tag (SEQ ID NO: 270); Strep tag (SEQ ID NO: 271); TC tag (SEQ ID NO: 272); Ty tag (SEQ ID NO: 273); V5 tag (SEQ ID NO:3); VSV tag (SEQ ID NO: 275); and Xpress tag (SEQ ID NO: 276).
363. Embodiment 360, wherein the peptide tag is: AU1 epitope (SEQ ID NO: 278); AU5 epitope (SEQ ID NO: 279); bacteriophage T7 epitope (T7 tag) (SEQ ID NO: 280); bluetongue virus tag (B tag). (SEQ ID NO: 281); E2 epitope (SEQ ID NO: 282); histidine affinity tag (HAT) (SEQ ID NO: 283); HSV epitope (SEQ ID NO: 284); polyarginine (Arg tag) (SEQ ID NO: 285); polyaspartic acid ( Asp tag) (SEQ ID NO: 286); polyphenylalanine (Phe tag) (SEQ ID NO: 287); S1 tag (SEQ ID NO: 288); S tag (SEQ ID NO: 266); and VSV-tag(Sequence number 275) is selected from the group consisting of
364. Embodiment 359. The method of embodiment 359, wherein the functional moiety is an immune epitope.
365. Embodiment 364, wherein the immune epitope is: tetanus toxoid (SEQ ID NO: 396); diphtheria toxin variant CRM197 (SEQ ID NO: 398); mumps immune epitope 1 (SEQ ID NO: 400); mumps immune epitope 2 (SEQ ID NO: 402). Mumps immune epitope 3 (SEQ ID NO: 404); Rubella virus (SEQ ID NO: 406); Hemagglutinin (SEQ ID NO: 408); Neuraminidase (SEQ ID NO: 410); TAP1 (SEQ ID NO: 412); TAP2 (SEQ ID NO: 414); Class I HLA hemagglutinin epitope for class I HLA (SEQ ID NO: 416); neuraminidase epitope for class I HLA (SEQ ID NO: 420); neuraminidase epitope for class II HLA (SEQ ID NO: 422); hemagglutinin epitope H5N1 binding class I and class II HLA (SEQ ID NO: 424); neuraminidase epitope H5N1 binding class I and class II HLA (SEQ ID NO: 426).
366. Embodiment 359. The method of embodiment 359, wherein the functional moiety alters localization of the protein of interest.
367. Embodiment 359. The method of embodiment 359, wherein the functional moiety is a degradation tag, so that the degradation rate of the protein of interest is altered.
368. Embodiment 367. The method of embodiment 367, wherein the degradation tag results in elimination of the tagged protein.
369. Embodiment 359. The method of embodiment 359, wherein the functional moiety is a small molecule binding domain.
370. Embodiment 359. The method of embodiment 359, wherein the small molecule binding domain is FKBP12 of SEQ ID NO: 488.
371. Embodiment 359. The method of embodiment 359, wherein the small molecule binding domain is FKBP12-F36V of SEQ ID NO: 489.
372. Embodiment 359, wherein the small molecule binding domain is SEQ ID NO: 49.0 and 493~494 cyclophilins.
373. Embodiment 359. The method of embodiment 359, wherein the small molecule binding domain is incorporated onto two or more proteins of interest.
374. Embodiment 373. The method of embodiment 373, wherein the two or more proteins of interest can be dimerized by contacting the small molecule.
375. The method of embodiment 369, wherein the small molecule is:
Figure 2020191234000482
Figure 2020191234000483
Figure 2020191234000484
It is a low molecular weight dimer selected from the group consisting of:
376. A method of incorporating an immune epitope into a protein of interest encoded by a target nucleotide sequence by prime editing, the method comprising: (a) converting the target nucleotide sequence to (i) a nucleic acid programmed DNA binding protein (napDNAbp) and a polymerase; contacting a PEgRNA containing a prime editing factor and (ii) an editing template encoding a functional moiety; (b) polymerizing a single-stranded DNA sequence encoding an immune epitope; and (c) DNA repair and/or replication. The process involves incorporating a single-stranded DNA sequence in place of the corresponding endogenous strand in the target nucleotide sequence, and the method results in a recombinant target nucleotide sequence encoding a fusion protein comprising the protein of interest and the immune epitope.
377. The method of embodiment 376, wherein the immune epitope is: tetanus toxoid (SEQ ID NO: 396); diphtheria toxin variant CRM197 (SEQ ID NO: 398); mumps immune epitope 1 (SEQ ID NO: 400); mumps immune epitope 2 (SEQ ID NO: 402). Mumps immune epitope 3 (SEQ ID NO: 404); Rubella virus (SEQ ID NO: 406); Hemagglutinin (SEQ ID NO: 408); Neuraminidase (SEQ ID NO: 410); TAP1 (SEQ ID NO: 412); TAP2 (SEQ ID NO: 414); Class I HLA hemagglutinin epitope for class I HLA (SEQ ID NO: 416); neuraminidase epitope for class I HLA (SEQ ID NO: 420); neuraminidase epitope for class II HLA (SEQ ID NO: 422); hemagglutinin epitope H5N1 binding class I and class II HLA (SEQ ID NO: 424); neuraminidase epitope H5N1 binding class I and class II HLA (SEQ ID NO: 426).
378. Embodiment 376. The method of embodiment 376, wherein the fusion protein comprises the amino acid sequence of PE1, PE2, or PE3.
379. Embodiment 376, wherein the napDNAbp is Cas9 nickase (nCas9).
380. The method of embodiment 376, wherein napDNAbp is SEQ ID NO: 18 to88, 126, 130, 137, 141, 147, 153, 157, 445, 460, 467, and 482-487Contains the amino acid sequence of
381. 376. The method of embodiment 376, wherein the PEgRNA is SEQ ID NO.101-104, 181-183, 223-234, 237-244, 277, 324-330, 332, 334, 336, 338, 340, 342, 344, 346, 348, 350, 352, 354, 356, 358, 360, 362, 364, 366, 368, 394, 429-442, 499-505, 641-649, 678-692, 735-736, 757-761, 776-777including.
382. A method of incorporating small molecule dimerization domains onto a protein of interest encoded by a target nucleotide sequence by prime editing, the method comprising: (a) converting the target nucleotide sequence into (i) a nucleic acid programmed DNA binding protein ( (b) polymerizing a single-stranded DNA sequence encoding an immune epitope; and (c) incorporating the single-stranded DNA sequence in place of the corresponding endogenous strand in the target nucleotide sequence by a DNA repair and/or replication process, the method comprising: small molecule dimerization with the protein of interest; A recombinant target nucleotide sequence is generated that encodes a fusion protein comprising a domain.
383. The method of embodiment 382, further comprising performing the method on a second protein of interest.
384. Embodiment 383. The method of embodiment 383, wherein the first protein of interest and the second protein of interest dimerize in the presence of a small molecule that binds to a respective dimerization domain of the proteins.
385. The method of embodiment 382, wherein the small molecule binding domain is FKBP12 of SEQ ID NO: 488.
386. The method of embodiment 382, wherein the small molecule binding domain is FKBP12-F36V of SEQ ID NO: 489.
387. Embodiment 382, wherein the small molecule binding domain is SEQ ID NO: 49.0 and 493~494 cyclophilins.
388. Embodiment 382 The method of embodiment 382, wherein the small molecule is:
Figure 2020191234000485
Figure 2020191234000486
Figure 2020191234000487
It is a low molecular weight dimer selected from the group consisting of:
389. Embodiment 382, wherein the fusion protein comprises the amino acid sequence of PE1, PE2, or PE3.
390. Embodiment 382, wherein the napDNAbp is Cas9 nickase (nCas9).
391. The method of embodiment 382, wherein napDNAbp is SEQ ID NO: 18 to88, 126, 130, 137, 141, 147, 153, 157, 445, 460, 467, and 482-487Contains the amino acid sequence of
392. Embodiment 382 The method of embodiment 382, wherein the PEgRNA is SEQ ID NO.101-104, 181-183, 223-234, 237-244, 277, 324-330, 332, 334, 336, 338, 340, 342, 344, 346, 348, 350, 352, 354, 356, 358, 360, 362, 364, 366, 368, 394, 429-442, 499-505, 641-649, 678-692, 735-736, 757-761, 776-777including.
393. A method of incorporating a peptide tag or epitope onto a protein using prime editing, comprising: a prime editing agent configured to insert into a target nucleotide sequence encoding a protein a second nucleotide sequence encoding a peptide tag; contacting the recombinant nucleotide sequence with a construct so that the peptide tag and protein are expressed from the recombinant nucleotide sequence as a fusion protein.
394. Embodiment 383. The method of embodiment 383, wherein the peptide tag is used for protein purification and/or detection.
395. Embodiment 383. The method of embodiment 383, wherein the peptide tag is polyhistidine (e.g., HHHHHH(Sequence number 257)), FLAG (for example, DYKDDDDK(Sequence number 2)), V5 (for example, GKPIPNPLLGLLDST(Sequence number 3)), GCN4, HA (e.g., YPYDVPDYA(Sequence number 5)), Myc (e.g. EQKLISEED(Sequence number 6)), or GST.
396. Embodiment 383, wherein the peptide tag has an amino acid sequence selected from the group consisting of SEQ ID NOs: 245-290.
397. The method of embodiment 383, wherein the peptide tag is fused to the protein by a linker.
398. Embodiment 383, wherein the fusion protein has the following structure: [protein]-[peptide tag] or [peptide tag]-[protein], where "]-[" represents an optional linker.
399. The method of embodiment 383, wherein the linker is SEQ ID NO:127, 165-176, 446, 453, and 767-769It has an amino acid sequence of
400. Embodiment 383, wherein the prime editing factor construct comprises SEQ ID NO:101-104, 181-183, 223-234, 237-244, 277, 324-330, 332, 334, 336, 338, 340, 342, 344, 346, 348, 350, 352, 354, 356, 358, 360, 362, 364, 366, 368, 394, 429-442, 499-505, 641-649, 678-692, 735-736, 757-761, 776-777PEgRNA containing the nucleotide sequence of
401. Embodiment 383, wherein the PEgRNA comprises a spacer, a gRNA core, and an extended arm, the spacer being complementary to a target nucleotide sequence, and the extended arm comprising a reverse transcriptase template encoding a peptide tag.
402. Embodiment 383, wherein the PEgRNA comprises a spacer, a gRNA core, and an extended arm, the spacer being complementary to a target nucleotide sequence, and the extended arm comprising a reverse transcriptase template encoding a peptide tag.
403. A method of preventing or halting the progression of a prion disease by incorporating one or more protective mutations on a PRNP encoded by a target nucleotide sequence by prime editing, the method comprising: (a) (i) contacting with a prime editing factor comprising a nucleic acid programmed DNA binding protein (napDNAbp) and a polymerase and (ii) a PEgRNA comprising an editing template encoding a functional moiety; (b) a single strand encoding a protective mutation; polymerizing the DNA sequence; and (c) incorporating the single-stranded DNA sequence in place of the corresponding endogenous strand in the target nucleotide sequence by a DNA repair and/or replication process, wherein the method is resistant to misfolding. A recombinant target nucleotide sequence is generated that encodes a PRNP containing a protective mutation that is resistant.
404. Embodiment 403. The method of embodiment 403, wherein the prion disease is a human prion disease.
405. The method of embodiment 403, wherein the prion disease is an animal prion disease.
406. Embodiment 404, wherein the prion disease is Creutzfeldt-Jakob disease (CJD), variant Creutzfeldt-Jakob disease (vCJD), Gerstmann-Strausler-Scheinker syndrome, fatal familial insomnia, or Kuru disease. It is.
407. Embodiment 403, wherein the prion disease is bovine spongiform encephalopathy (BSE or "mad cow disease"), chronic wasting disease (CWD), scrapie, transmissible mink encephalopathy, feline spongiform encephalopathy, and ungulate spongiform encephalopathy. It is encephalopathy.
408. The method of embodiment 403, wherein the wild type PRNP amino acid sequence is SEQ ID NO: 291-292.
409. Embodiment 403, wherein the method results in a modified PRNP amino acid sequence selected from the group consisting of SEQ ID NOs: 293-323, wherein the modified PRNP protein is resistant to misfolding.
410. Embodiment 403, wherein the fusion protein comprises the amino acid sequence of PE1, PE2, or PE3.
411. Embodiment 403, wherein the napDNAbp is Cas9 nickase (nCas9).
412. The method of embodiment 403, wherein napDNAbp is SEQ ID NO: 18 to88, 126, 130, 137, 141, 147, 153, 157, 445, 460, 467, and 482-487Contains the amino acid sequence of
413.. Embodiment 403, wherein the PEgRNA is SEQ ID NO.101-104, 181-183, 223-234, 237-244, 277, 324-330, 332, 334, 336, 338, 340, 342, 344, 346, 348, 350, 352, 354, 356, 358, 360, 362, 364, 366, 368, 394, 429-442, 499-505, 641-649, 678-692, 735-736, 757-761, 776-777including.
414. A method of incorporating a ribonucleotide motif or tag onto an RNA of interest encoded by a target nucleotide sequence by prime editing, the method comprising: (a) converting the target nucleotide sequence into (i) a nucleic acid programmed DNA binding protein (napDNAbp); and a prime editing agent comprising a polymerase; and (ii) contacting PEgRNA comprising an editing template encoding a ribonucleotide motif or tag; (b) polymerizing a single-stranded DNA sequence encoding a ribonucleotide motif or tag; and (c) incorporating a single-stranded DNA sequence in place of the corresponding endogenous strand in the target nucleotide sequence by a DNA repair and/or replication process, the method comprising A recombinant target nucleotide sequence is generated that encodes the desired RNA.
415. Embodiment 414. The method of embodiment 414, wherein the ribonucleotide motif or tag is the detection moiety.
416. Embodiment 414. The method of embodiment 414, wherein the ribonucleotide motif or tag affects the expression level of the RNA of interest.
417. Embodiment 414. The method of embodiment 414, wherein the ribonucleotide motif or tag affects trafficking or subcellular localization of the RNA of interest.
418. The method of embodiment 414, wherein the ribonucleotide motif or tag is selected from the group consisting of SV40 type 1, SV40 type 2, SV40 type 3, hGH, BGH, rbGlob, TK, MALAT1 ENE-mascRNA, KSHV PAN ENE, Smbox/U1 snRNA box, U1 snRNA 3' box, tRNA-lysine, broccoli aptamer, spinach aptamer, mango aptamer, HDV ribozyme, and m6A.
419. 414. The method of embodiment 414, wherein the PEgRNA is SEQ ID NO.101-104, 181-183, 223-234, 237-244, 277, 324-330, 332, 334, 336, 338, 340, 342, 344, 346, 348, 350, 352, 354, 356, 358, 360, 362, 364, 366, 368, 394, 429-442, 499-505, 641-649, 678-692, 735-736, 757-761, 776-777including.
420. Embodiment 414. The method of embodiment 414, wherein the fusion protein comprises the amino acid sequence of PE1, PE2, or PE3.
421. Embodiment 414. The method of embodiment 414, wherein napDNAbp is Cas9 nickase (nCas9).
422. The method of embodiment 414, wherein napDNAbp is SEQ ID NO: 18 to88, 126, 130, 137, 141, 147, 153, 157, 445, 460, 467, and 482-487Contains the amino acid sequence of
423. A method of incorporating or deleting a functional moiety on a protein of interest encoded by a target nucleotide sequence by prime editing, the method comprising: (a) converting the target nucleotide sequence into (i) a nucleic acid programmed DNA binding protein (napDNAbp); ) and a prime editing factor comprising a polymerase and (ii) PEgRNA comprising an editing template encoding the functional moiety or its deletion; (b) polymerizing the single-stranded DNA sequence encoding the functional moiety or its deletion; and (c) incorporating a single-stranded DNA sequence in place of the corresponding endogenous strand in the target nucleotide sequence by a DNA repair and/or replication process, the method comprising: A recombinant target nucleotide sequence is generated that encodes a modified protein containing a deletion, the functional moiety altering the modification state or localization state of the protein.
424. Embodiment 423. The method of embodiment 423, wherein the functional moiety alters the phosphorylation, ubiquitination, glycosylation, lipid modification, hydroxylation, methylation, acetylation, crotonylation, or SUMOylation status of the protein of interest.

群A.融合タンパク質、ガイド、および方法
態様1.融合タンパク質であって、核酸プログラム型DNA結合タンパク質(napDNAbp)および逆転写酵素を含む。
Group A. Fusion proteins, guides, and methods Embodiment 1. A fusion protein that includes a nucleic acid programmed DNA binding protein (napDNAbp) and a reverse transcriptase.

態様2.態様1の融合タンパク質であって、融合タンパク質が、伸長されたガイドRNAの存在下において、プライム標的にプライムされた逆転写によるゲノム編集を実行することができる。 Aspect 2. The fusion protein of embodiment 1, wherein the fusion protein is capable of performing genome editing by primed target-primed reverse transcription in the presence of an elongated guide RNA.

態様3.態様1の融合タンパク質であって、napDNAbpがニッカーゼ活性を有する。 Aspect 3. The fusion protein of embodiment 1, wherein napDNAbp has nickase activity.

態様4.態様1の融合タンパク質であって、napDNAbpがCas9タンパク質またはそのバリアントである。 Aspect 4. The fusion protein of embodiment 1, wherein napDNAbp is a Cas9 protein or a variant thereof.

態様5.態様1の融合タンパク質であって、napDNAbpがヌクレアーゼ活性Cas9、ヌクレアーゼ不活性型Cas9(dCas9)、またはCas9ニッカーゼ(nCas9)である。 Embodiment 5. The fusion protein of embodiment 1, wherein napDNAbp is a nuclease-active Cas9, a nuclease-inactive Cas9 (dCas9), or a Cas9 nickase (nCas9).

態様6.態様1の融合タンパク質であって、napDNAbpがCas9ニッカーゼ(nCas9)である。 Aspect 6. The fusion protein of embodiment 1, wherein napDNAbp is Cas9 nickase (nCas9).

態様7.態様1の融合タンパク質であって、napDNAbpが:Cas9、CasX、CasY、Cpf1、C2c1、C2c2、C2C3、およびアルゴノートからなる群から選択され、任意にニッカーゼ活性を有する。 Aspect 7. The fusion protein of embodiment 1, wherein napDNAbp is selected from the group consisting of: Cas9, CasX, CasY, Cpf1, C2c1, C2c2, C2C3, and Argonaute, and optionally has nickase activity.

態様8.態様1の融合タンパク質であって、融合タンパク質が伸長されたガイドRNAと複合体化したときに標的DNA配列に結合することができる。 Aspect 8. The fusion protein of embodiment 1 is capable of binding to a target DNA sequence when the fusion protein is complexed with an elongated guide RNA.

態様9.態様8の融合タンパク質であって、標的DNA配列が標的鎖および相補的な非標的鎖を含む。 Aspect 9. The fusion protein of embodiment 8, wherein the target DNA sequence comprises a target strand and a complementary non-target strand.

態様10.態様8の融合タンパク質であって、伸長されたガイドRNAと複合体化した融合タンパク質の結合がRループを形成する。 Aspect 10. In the fusion protein of embodiment 8, the binding of the fusion protein complexed with the elongated guide RNA forms an R-loop.

態様11.態様10の融合タンパク質であって、Rループが、(i)伸長されたガイドRNAと標的鎖とを含むRNA-DNAハイブリッドおよび(ii)相補的な非標的鎖を含む。 Aspect 11. The fusion protein of embodiment 10, wherein the R-loop comprises (i) an RNA-DNA hybrid comprising an extended guide RNA and a target strand and (ii) a complementary non-target strand.

態様12.態様11の融合タンパク質であって、相補的な非標的鎖がニッキングされて、遊離の3’端を有する逆転写酵素プライム配列を形成する。 Aspect 12. The fusion protein of embodiment 11, wherein the complementary non-target strand is nicked to form a reverse transcriptase prime sequence with a free 3' end.

態様13.態様2の融合タンパク質であって、伸長されたガイドRNAが、(a)ガイドRNA、および(b)ガイドRNAの5'もしくは3’端またはガイドRNAの分子内の位置付けにおけるRNA伸長を含む。 Aspect 13. The fusion protein of embodiment 2, wherein the elongated guide RNA comprises (a) a guide RNA, and (b) an RNA extension at the 5' or 3' end of the guide RNA or at an intramolecular location of the guide RNA.

態様14.態様13の融合タンパク質であって、RNA伸長が、(i)所望のヌクレオチド変化を含む逆転写鋳型配列、(ii)逆転写プライマー結合部位、および(iii)任意にリンカー配列を含む。 Aspect 14. The fusion protein of embodiment 13, wherein the RNA extension comprises (i) a reverse transcription template sequence containing the desired nucleotide changes, (ii) a reverse transcription primer binding site, and (iii) an optional linker sequence.

態様15.態様14の融合タンパク質であって、逆転写鋳型配列が、ニック部位に隣接する内生DNA配列に対して相補的である一本鎖DNAフラップをコードし、一本鎖DNAフラップが所望のヌクレオチド変化を含む。 Aspect 15. The fusion protein of embodiment 14, wherein the reverse transcription template sequence encodes a single-stranded DNA flap that is complementary to an endogenous DNA sequence adjacent to the nick site, and wherein the single-stranded DNA flap carries a desired nucleotide change. including.

態様16.態様13の融合タンパク質であって、RNA伸長が、長さが少なくとも5ヌクレオチド、少なくとも6ヌクレオチド、少なくとも7ヌクレオチド、少なくとも8ヌクレオチド、少なくとも9ヌクレオチド、少なくとも10ヌクレオチド、少なくとも11ヌクレオチド、少なくとも12ヌクレオチド、少なくとも13ヌクレオチド、少なくとも14ヌクレオチド、少なくとも15ヌクレオチド、少なくとも16ヌクレオチド、少なくとも17ヌクレオチド、少なくとも18ヌクレオチド、少なくとも19ヌクレオチド、少なくとも20ヌクレオチド、少なくとも21ヌクレオチド、少なくとも22ヌクレオチド、少なくとも23ヌクレオチド、少なくとも24ヌクレオチド、または少なくとも25ヌクレオチドである。 Embodiment 16. The fusion protein of embodiment 13, wherein the RNA extension is at least 5 nucleotides, at least 6 nucleotides, at least 7 nucleotides, at least 8 nucleotides, at least 9 nucleotides, at least 10 nucleotides, at least 11 nucleotides, at least 12 nucleotides, at least 13 nucleotides, at least 14 nucleotides, at least 15 nucleotides, at least 16 nucleotides, at least 17 nucleotides, at least 18 nucleotides, at least 19 nucleotides, at least 20 nucleotides, at least 21 nucleotides, at least 22 nucleotides, at least 23 nucleotides, at least 24 nucleotides, or at least 25 nucleotides in length.

態様17.態様15の融合タンパク質であって、一本鎖DNAフラップが、ニック部位に隣接する内生DNA配列にハイブリダイズし、それによって所望のヌクレオチド変化を組み入れる。 Aspect 17. The fusion protein of embodiment 15, wherein the single-stranded DNA flap hybridizes to the endogenous DNA sequence adjacent to the nick site, thereby incorporating the desired nucleotide change.

態様18.態様15の融合タンパク質であって、一本鎖DNAフラップが、遊離の5'端を有しかつニック部位に隣接する内生DNA配列に取って代わる。 Aspect 18. The fusion protein of embodiment 15, wherein the single-stranded DNA flap replaces the endogenous DNA sequence with a free 5' end and adjacent to the nick site.

態様19.態様18の融合タンパク質であって、5'端を有する内生DNA配列が細胞によって切除される。 Aspect 19. The fusion protein of embodiment 18, wherein the endogenous DNA sequence having a 5' end is excised by the cell.

態様20.態様18の融合タンパク質であって、一本鎖DNAフラップの細胞性修復が所望のヌクレオチド変化の組み入れをもたらし、それによって所望の産物を形成する。 Mode 20. The fusion protein of embodiment 18, wherein cellular repair of the single-stranded DNA flap results in the incorporation of the desired nucleotide change, thereby forming the desired product.

態様21.態様14の融合タンパク質であって、所望のヌクレオチド変化がPAM配列の約-4から+10の間もしくはPAM配列の約-10から+20の間もしくはPAM配列の約-20から+40の間もしくはPAM配列の約-30から+100の間である編集窓上に組み入れされるか、または所望のヌクレオチド変化がニック部位の少なくとも1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、もしくは100ヌクレオチド下流に組み入れされる。 Aspect 21. The fusion protein of embodiment 14, wherein the desired nucleotide change is between about -4 and +10 of the PAM sequence, or between about -10 and +20 of the PAM sequence, or between about -20 and +40 of the PAM sequence, or The desired nucleotide change is incorporated on an editing window that is between approximately -30 and +100 of the PAM sequence, or the desired nucleotide change is at least 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, Incorporates 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99, or 100 nucleotides downstream.

態様22.態様1の融合タンパク質であって、napDNAbpが、配列番号18のアミノ酸配列、または配列番号18のアミノ酸配列と少なくとも80%、85%、90%、95%、98%、もしくは99%同一であるアミノ酸配列を含む。 Aspect 22. The fusion protein of embodiment 1, wherein napDNAbp is the amino acid sequence of SEQ ID NO: 18, or an amino acid that is at least 80%, 85%, 90%, 95%, 98%, or 99% identical to the amino acid sequence of SEQ ID NO: 18. Contains arrays.

態様23.態様1の融合タンパク質であって、napDNAbpが、配列番号18~88、126、130、137、141、147、153、157、445、460、467、および482~487のいずれか1つのアミノ酸配列と少なくとも80%、85%、90%、95%、98%、または99%同一であるアミノ酸配列を含む。 Aspect 23. The fusion protein of embodiment 1, wherein napDNAbp is an amino acid sequence of any one of SEQ ID NOs: 18-88, 126, 130, 137, 141, 147, 153, 157, 445, 460, 467, and 482-487. Comprising amino acid sequences that are at least 80%, 85%, 90%, 95%, 98%, or 99% identical.

様1の融合タンパク質であって、逆転写酵素が配列番号89のアミノ酸配列のいずれか1つを含む。 The fusion protein of embodiment 1, wherein the reverse transcriptase comprises any one of the amino acid sequences of SEQ ID NO: 89.

態様24.態様1の融合タンパク質であって、逆転写酵素が、配列番号89~100、105~122、128~129、132、139、143、149、154、159、235、454、471、516、662、700、701~716、739~741、および766のアミノ酸配列のいずれか1つを含む。 Aspect 24. The fusion protein of embodiment 1, wherein the reverse transcriptase is SEQ ID NO: 89-100, 105-122, 128-129, 132, 139, 143, 149, 154, 159, 235, 454, 471, 516, 662, 700, 701-716, 739-741, and 766.

様1の融合タンパク質であって、逆転写酵素が、配列番号89のいずれか1つのアミノ酸配列と少なくとも80%、85%、90%、95%、98%、または99%同一であるアミノ酸配列を含む。 The fusion protein of embodiment 1, wherein the reverse transcriptase has an amino acid sequence that is at least 80%, 85%, 90%, 95%, 98%, or 99% identical to any one amino acid sequence of SEQ ID NO: 89. including.

態様25.態様1の融合タンパク質であって、逆転写酵素が、配列番号89~100、105~122、128~129、132、139、143、149、154、159、235、454、471、516、662、700、701~716、739~741、および766のいずれか1つのアミノ酸配列と少なくとも80%、85%、90%、95%、98%、または99%同一であるアミノ酸配列を含む。 Aspect 25. The fusion protein of embodiment 1, wherein the reverse transcriptase is SEQ ID NO: 89-100, 105-122, 128-129, 132, 139, 143, 149, 154, 159, 235, 454, 471, 516, 662, 700, 701-716, 739-741, and 766.

態様26.態様1の融合タンパク質であって、逆転写酵素がレトロウイルスまたはレトロトランスポゾンからの天然に存在する逆転写酵素である。 Aspect 26. The fusion protein of embodiment 1, wherein the reverse transcriptase is a naturally occurring reverse transcriptase from a retrovirus or retrotransposon.

態様27.先の態様のいずれか1つの融合タンパク質であって、融合タンパク質が構造NH2-[napDNAbp]-[逆転写酵素]-COOH;またはNH2-[逆転写酵素]-[napDNAbp]-COOHを含み、「]-[」の夫々のものが任意のリンカー配列の存在を指示する。 Aspect 27. The fusion protein of any one of the preceding embodiments, wherein the fusion protein comprises the structure NH2-[napDNAbp]-[reverse transcriptase]-COOH; or NH2-[reverse transcriptase]-[napDNAbp]-COOH; ]-[” each indicates the presence of an arbitrary linker sequence.

態様28.態様27の融合タンパク質であって、リンカー配列が配列番号127、165~176、446、453、および767~769のアミノ酸配列を含む。 Aspect 28. The fusion protein of embodiment 27, wherein the linker sequence comprises the amino acid sequences of SEQ ID NOs: 127, 165-176, 446, 453, and 767-769.

態様29.態様14の融合タンパク質であって、所望のヌクレオチド変化が1ヌクレオチド変化、1つ以上のヌクレオチドの挿入、または1つ以上のヌクレオチドの欠失である。 Aspect 29. The fusion protein of embodiment 14, wherein the desired nucleotide change is a single nucleotide change, an insertion of one or more nucleotides, or a deletion of one or more nucleotides.

態様30.態様29の融合タンパク質であって、挿入または欠失が、少なくとも1、少なくとも2、少なくとも3、少なくとも4、少なくとも5、少なくとも6、少なくとも7、少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも16、少なくとも17、少なくとも18、少なくとも19、少なくとも20、少なくとも21、少なくとも22、少なくとも23、少なくとも24、少なくとも25、少なくとも26、少なくとも27、少なくとも28、少なくとも29、少なくとも30、少なくとも31、少なくとも32、少なくとも33、少なくとも34、少なくとも35、少なくとも36、少なくとも37、少なくとも38、少なくとも39、少なくとも40、少なくとも41、少なくとも42、少なくとも43、少なくとも44、少なくとも45、少なくとも46、少なくとも47、少なくとも48、少なくとも49、または少なくとも50である。 Aspect 30. The fusion protein of embodiment 29, wherein the insertion or deletion is at least 1, at least 2, at least 3, at least 4, at least 5, at least 6, at least 7, at least 8, at least 9, at least 10, at least 11, at least 12 , at least 13, at least 14, at least 15, at least 16, at least 17, at least 18, at least 19, at least 20, at least 21, at least 22, at least 23, at least 24, at least 25, at least 26, at least 27, at least 28, at least 29, at least 30, at least 31, at least 32, at least 33, at least 34, at least 35, at least 36, at least 37, at least 38, at least 39, at least 40, at least 41, at least 42, at least 43, at least 44, at least 45, At least 46, at least 47, at least 48, at least 49, or at least 50.

態様31.ガイドRNAと少なくとも1つのRNA伸長とを含む伸長されたガイドRNA。 Aspect 31. An extended guide RNA comprising a guide RNA and at least one RNA extension.

態様32.態様1の伸長されたガイドRNAであって、RNA伸長が、ガイドRNAの3'もしくは5'端またはガイドRNAの分子内の位置の位置である。 Aspect 32. The elongated guide RNA of embodiment 1, wherein the RNA extension is at the 3' or 5' end of the guide RNA or at a position within the molecule of the guide RNA.

態様33.態様31の伸長されたガイドRNAであって、伸長されたガイドRNAが、napDNAbpに結合することおよびnapDNAbpを標的DNA配列へと導くことができる。 Aspect 33. The elongated guide RNA of embodiment 31, wherein the elongated guide RNA is capable of binding napDNAbp and directing napDNAbp to a target DNA sequence.

態様34.態様33の伸長されたガイドRNAであって、標的DNA配列が標的鎖および相補的な非標的鎖を含み、ガイドRNAが標的鎖にハイブリダイズして、RNA-DNAハイブリッドおよびRループを形成する。 Aspect 34. The elongated guide RNA of embodiment 33, wherein the target DNA sequence comprises a target strand and a complementary non-target strand, and the guide RNA hybridizes to the target strand to form an RNA-DNA hybrid and an R-loop.

態様35.態様31の伸長されたガイドRNAであって、少なくとも1つのRNA伸長が、(i)逆転写鋳型配列、(ii)逆転写プライマー結合部位、および(iii)任意にリンカー配列を含む。 Aspect 35. The extended guide RNA of embodiment 31, wherein the at least one RNA extension comprises (i) a reverse transcription template sequence, (ii) a reverse transcription primer binding site, and (iii) an optional linker sequence.

態様36.態様35の伸長されたガイドRNAであって、RNA伸長が、長さが少なくとも5ヌクレオチド、少なくとも6ヌクレオチド、少なくとも7ヌクレオチド、少なくとも8ヌクレオチド、少なくとも9ヌクレオチド、少なくとも10ヌクレオチド、少なくとも11ヌクレオチド、少なくとも12ヌクレオチド、少なくとも13ヌクレオチド、少なくとも14ヌクレオチド、少なくとも15ヌクレオチド、少なくとも16ヌクレオチド、少なくとも17ヌクレオチド、少なくとも18ヌクレオチド、少なくとも19ヌクレオチド、少なくとも20ヌクレオチド、少なくとも21ヌクレオチド、少なくとも22ヌクレオチド、少なくとも23ヌクレオチド、少なくとも24ヌクレオチド、または少なくとも25ヌクレオチドである。 Aspect 36. The elongated guide RNA of embodiment 35, wherein the RNA elongation is at least 5 nucleotides, at least 6 nucleotides, at least 7 nucleotides, at least 8 nucleotides, at least 9 nucleotides, at least 10 nucleotides, at least 11 nucleotides, at least 12 nucleotides in length. , at least 13 nucleotides, at least 14 nucleotides, at least 15 nucleotides, at least 16 nucleotides, at least 17 nucleotides, at least 18 nucleotides, at least 19 nucleotides, at least 20 nucleotides, at least 21 nucleotides, at least 22 nucleotides, at least 23 nucleotides, at least 24 nucleotides, or At least 25 nucleotides.

態様37.態様35の伸長されたガイドRNAであって、逆転写鋳型配列が、長さが少なくとも3ヌクレオチド、少なくとも4ヌクレオチド、少なくとも5ヌクレオチド、少なくとも6ヌクレオチド、少なくとも7ヌクレオチド、少なくとも8ヌクレオチド、少なくとも9ヌクレオチド、少なくとも10ヌクレオチド、少なくとも11ヌクレオチド、少なくとも12ヌクレオチド、少なくとも13ヌクレオチド、少なくとも14ヌクレオチド、または少なくとも15ヌクレオチドである。 Aspect 37. The elongated guide RNA of embodiment 35, wherein the reverse transcription template sequence is at least 3 nucleotides, at least 4 nucleotides, at least 5 nucleotides, at least 6 nucleotides, at least 7 nucleotides, at least 8 nucleotides, at least 9 nucleotides, at least 10 nucleotides, at least 11 nucleotides, at least 12 nucleotides, at least 13 nucleotides, at least 14 nucleotides, or at least 15 nucleotides.

態様38.態様35の伸長されたガイドRNAであって、逆転写プライマー結合部位配列が、長さが少なくとも3ヌクレオチド、少なくとも4ヌクレオチド、少なくとも5ヌクレオチド、少なくとも6ヌクレオチド、少なくとも7ヌクレオチド、少なくとも8ヌクレオチド、少なくとも9ヌクレオチド、少なくとも10ヌクレオチド、少なくとも11ヌクレオチド、少なくとも12ヌクレオチド、少なくとも13ヌクレオチド、少なくとも14ヌクレオチド、または少なくとも15ヌクレオチドである。 Aspect 38. The elongated guide RNA of embodiment 35, wherein the reverse transcription primer binding site sequence is at least 3 nucleotides, at least 4 nucleotides, at least 5 nucleotides, at least 6 nucleotides, at least 7 nucleotides, at least 8 nucleotides, at least 9 nucleotides in length. , at least 10 nucleotides, at least 11 nucleotides, at least 12 nucleotides, at least 13 nucleotides, at least 14 nucleotides, or at least 15 nucleotides.

態様39.態様35の伸長されたガイドRNAであって、任意のリンカー配列が、長さが少なくとも3ヌクレオチド、少なくとも4ヌクレオチド、少なくとも5ヌクレオチド、少なくとも6ヌクレオチド、少なくとも7ヌクレオチド、少なくとも8ヌクレオチド、少なくとも9ヌクレオチド、少なくとも10ヌクレオチド、少なくとも11ヌクレオチド、少なくとも12ヌクレオチド、少なくとも13ヌクレオチド、少なくとも14ヌクレオチド、または少なくとも15ヌクレオチドである。 Embodiment 39. The extended guide RNA of embodiment 35, wherein the optional linker sequence is at least 3 nucleotides, at least 4 nucleotides, at least 5 nucleotides, at least 6 nucleotides, at least 7 nucleotides, at least 8 nucleotides, at least 9 nucleotides, at least 10 nucleotides, at least 11 nucleotides, at least 12 nucleotides, at least 13 nucleotides, at least 14 nucleotides, or at least 15 nucleotides in length.

態様40.態様35の伸長されたガイドRNAであって、逆転写鋳型配列が、ニック部位に隣接する内生DNA配列に対して相補的である一本鎖DNAフラップをコードし、一本鎖DNAフラップが所望のヌクレオチド変化を含む。 Aspect 40. The elongated guide RNA of embodiment 35, wherein the reverse transcription template sequence encodes a single-stranded DNA flap that is complementary to an endogenous DNA sequence adjacent to the nick site, and wherein the single-stranded DNA flap is desired. Contains nucleotide changes.

態様41.態様40の伸長されたガイドRNAであって、一本鎖DNAフラップが、ニッキングされた標的DNA配列上の5'端を有する内生一本鎖DNAを押し除け、内生一本鎖DNAがニック部位の下流において直ちに隣接する。 Aspect 41. The elongated guide RNA of embodiment 40, wherein the single-stranded DNA flap displaces endogenous single-stranded DNA having a 5' end on the nicked target DNA sequence, and the endogenous single-stranded DNA is nicked. Immediately adjacent downstream of the site.

態様42.態様41の伸長されたガイドRNAであって、遊離の5'端を有する内生一本鎖DNAが細胞によって切除される。 Aspect 42. The elongated guide RNA of embodiment 41, wherein the endogenous single-stranded DNA with a free 5' end is excised by the cell.

態様43.態様41の伸長されたガイドRNAであって、一本鎖DNAフラップの細胞性修復が所望のヌクレオチド変化の組み入れをもたらし、それによって所望の産物を形成する。 Aspect 43. The elongated guide RNA of embodiment 41, wherein cellular repair of the single-stranded DNA flap results in the incorporation of the desired nucleotide change, thereby forming the desired product.

態様44.態様31の伸長されたガイドRNAであって、配列番号394、429~442、641~649、678~692、2997~3103、3113~3121、3305~3455、3479~3493、3522~3556、3628~3698、および3755~3810のヌクレオチド配列、または配列番号394、429~442、641~649、678~692、2997~3103、3113~3121、3305~3455、3479~3493、3522~3556、3628~3698、および3755~3810のいずれか1つとの少なくとも85%もしくは少なくとも90%もしくは少なくとも95%もしくは少なくとも98%もしくは少なくとも99%配列同一性を有するヌクレオチド配列を含む。 Aspect 44. The elongated guide RNA of embodiment 31, comprising SEQ ID NOs : 394, 429-442, 641-649, 678-692, 2997-3103, 3113-3121, 3305-3455, 3479-3493, 3522-3556, 3628- 3698, and the nucleotide sequence of 3755-3810 , or SEQ ID NO: 394, 429-442, 641-649, 678-692, 2997-3103, 3113-3121, 3305-3455, 3479-3493, 3522-3556, 3628-3698 , and any one of 3755-3810.

態様45.態様35の伸長されたガイドRNAであって、逆転写鋳型配列が、内生DNA標的と少なくとも80%または85%または90%または95%または99%同一であるヌクレオチド配列を含む。 Aspect 45. The elongated guide RNA of embodiment 35, wherein the reverse transcription template sequence comprises a nucleotide sequence that is at least 80% or 85% or 90% or 95% or 99% identical to the endogenous DNA target.

態様46.態様35の伸長されたガイドRNAであって、逆転写プライマー結合部位が、カットされたDNAの遊離の3’端とハイブリダイズする。 Aspect 46. The elongated guide RNA of embodiment 35, wherein the reverse transcription primer binding site hybridizes to the free 3' end of the cut DNA.

態様47.態様35の伸長されたガイドRNAであって、任意のリンカー配列が、長さが少なくとも1ヌクレオチド、または少なくとも2、少なくとも3、少なくとも4、少なくとも5、少なくとも6、少なくとも7、少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、または少なくとも15ヌクレオチドである。 Aspect 47. The elongated guide RNA of embodiment 35, wherein any linker sequence is at least 1 nucleotide in length, or at least 2, at least 3, at least 4, at least 5, at least 6, at least 7, at least 8, at least 9, At least 10, at least 11, at least 12, at least 13, at least 14, or at least 15 nucleotides.

態様48.態様1~30のいずれか1つの融合タンパク質と伸長されたガイドRNAとを含むことを含む複合体。 Aspect 48. A complex comprising the fusion protein of any one of embodiments 1 to 30 and an elongated guide RNA.

態様49.態様48の複合体であって、伸長されたガイドRNAが、ガイドRNAと、ガイドRNAの3'もしくは5'端またはガイドRNAの分子内の位置におけるRNA伸長とを含む。 Aspect 49. Embodiment 48, wherein the elongated guide RNA comprises a guide RNA and an RNA extension at the 3' or 5' end of the guide RNA or at a position within the molecule of the guide RNA.

態様50.態様48の複合体であって、伸長されたガイドRNAが、napDNAbpに結合することおよびnapDNAbpを標的DNA配列へと導くことができる。 Aspect 50. The complex of embodiment 48, wherein the elongated guide RNA is capable of binding napDNAbp and directing napDNAbp to a target DNA sequence.

態様51.態様50の複合体であって、標的DNA配列が標的鎖および相補的な非標的鎖を含み、ガイドRNAが標的鎖にハイブリダイズして、RNA-DNAハイブリッドおよびRループを形成する。 Aspect 51. The complex of embodiment 50, wherein the target DNA sequence comprises a target strand and a complementary non-target strand, and the guide RNA hybridizes to the target strand to form an RNA-DNA hybrid and an R-loop.

態様52.態様49の複合体であって、少なくとも1つのRNA伸長が、(i)逆転写鋳型配列、(ii)逆転写プライマー結合部位、および(iii)任意にリンカー配列を含む。 Aspect 52. Embodiment 49, wherein the at least one RNA extension comprises (i) a reverse transcription template sequence, (ii) a reverse transcription primer binding site, and (iii) an optional linker sequence.

態様53.態様48の複合体であって、伸長されたガイドRNAが、配列番号394、429~442、641~649、678~692、2997~3103、3113~3121、3305~3455、3479~3493、3522~3556、3628~3698、および3755~3810のヌクレオチド配列、または配列番号394、429~442、641~649、678~692、2997~3103、3113~3121、3305~3455、3479~3493、3522~3556、3628~3698、および3755~3810のいずれか1つとの少なくとも85%もしくは少なくとも90%もしくは少なくとも95%もしくは少なくとも98%もしくは少なくとも99%配列同一性を有するヌクレオチド配列を含む。 Aspect 53. The complex of embodiment 48, wherein the elongated guide RNA is SEQ ID NO: 394, 429-442, 641-649, 678-692, 2997-3103, 3113-3121, 3305-3455, 3479-3493, 3522- Nucleotide sequences of 3556, 3628-3698, and 3755-3810, or SEQ ID NO: 394, 429-442, 641-649, 678-692, 2997-3103, 3113-3121, 3305-3455, 3479-3493, 3522-3556 , 3628-3698, and 3755-3810.

態様54.態様52の複合体であって、逆転写鋳型配列が、内生DNA標的との少なくとも80%または85%または90%または95%または99%配列同一性を有するヌクレオチド配列を含む。 Aspect 54. The conjugate of embodiment 52, wherein the reverse transcription template sequence comprises a nucleotide sequence having at least 80% or 85% or 90% or 95% or 99% sequence identity with the endogenous DNA target.

態様55.態様52の複合体であって、逆転写プライマー結合部位が、カットされたDNAの遊離の3'端とハイブリダイズする。 Aspect 55. 53. The complex of embodiment 52, wherein the reverse transcription primer binding site hybridizes to the free 3' end of the cut DNA.

態様56.napDNAbpおよび伸長されたガイドRNAを含むことを含む複合体。 Aspect 56. complex containing napDNAbp and elongated guide RNA.

態様57.態様56の複合体であって、napDNAbpがCas9ニッカーゼである。 Aspect 57. The conjugate of embodiment 56, wherein napDNAbp is Cas9 nickase.

態様58.態様56の複合体であって、napDNAbpが、配列番号18のアミノ酸配列、または配列番号18との少なくとも80%、85%、90%、95%、98%、もしくは99%配列同一性を有するアミノ酸配列を含む。 Aspect 58. The conjugate of embodiment 56, wherein napDNAbp has the amino acid sequence of SEQ ID NO: 18, or an amino acid having at least 80%, 85%, 90%, 95%, 98%, or 99% sequence identity with SEQ ID NO: 18. Contains arrays.

態様59.態様57の複合体であって、napDNAbpが、配列番号18~88、126、130、137、141、147、153、157、445、460、467、および482~487のいずれか1つのアミノ酸配列との少なくとも80%、85%、90%、95%、98%、または99%配列同一性を有するアミノ酸配列を含む。 Aspect 59. The complex of embodiment 57, wherein napDNAbp is an amino acid sequence of any one of SEQ ID NOs: 18-88, 126, 130, 137, 141, 147, 153, 157, 445, 460, 467, and 482-487. amino acid sequences having at least 80%, 85%, 90%, 95%, 98%, or 99% sequence identity.

態様60.態様57の複合体であって、伸長されたガイドRNAが、ガイドRNAと、ガイドRNAの3'もしくは5'端またはガイドRNAの分子内の位置におけるRNA伸長とを含む。 Aspect 60. Embodiment 57, wherein the elongated guide RNA comprises a guide RNA and an RNA extension at the 3' or 5' end of the guide RNA or at a position within the molecule of the guide RNA.

態様61.態様57の複合体であって、伸長されたガイドRNAがnapDNAbpを標的DNA配列へと導くことができる。 Aspect 61. Embodiment 57. The complex of embodiment 57, wherein the elongated guide RNA is capable of directing napDNAbp to a target DNA sequence.

態様62.態様61の複合体であって、標的DNA配列が標的鎖および相補的な非標的鎖を含み、スペーサー配列が標的鎖にハイブリダイズして、RNA-DNAハイブリッドおよびRループを形成する。 Aspect 62. The complex of embodiment 61, wherein the target DNA sequence comprises a target strand and a complementary non-target strand, and the spacer sequence hybridizes to the target strand to form an RNA-DNA hybrid and an R-loop.

態様63.態様61の複合体であって、RNA伸長が、(i)逆転写鋳型配列、(ii)逆転写プライマー結合部位、および(iii)任意にリンカー配列を含む。 Aspect 63. The complex of embodiment 61, wherein the RNA extension comprises (i) a reverse transcription template sequence, (ii) a reverse transcription primer binding site, and (iii) an optional linker sequence.

態様64.態様57の複合体であって、伸長されたガイドRNAが、配列番号394、429~442、641~649、678~692、2997~3103、3113~3121、3305~3455、3479~3493、3522~3556、3628~3698、および3755~3810のヌクレオチド配列、または配列番号394、429~442、641~649、678~692、2997~3103、3113~3121、3305~3455、3479~3493、3522~3556、3628~3698、および3755~3810のいずれか1つとの少なくとも85%もしくは少なくとも90%もしくは少なくとも95%もしくは少なくとも98%もしくは少なくとも99%配列同一性を有するヌクレオチド配列を含む。 Aspect 64. The complex of embodiment 57, wherein the elongated guide RNA is SEQ ID NO: 394, 429-442, 641-649, 678-692, 2997-3103, 3113-3121, 3305-3455, 3479-3493, 3522- Nucleotide sequences of 3556, 3628-3698, and 3755-3810, or SEQ ID NO: 394, 429-442, 641-649, 678-692, 2997-3103, 3113-3121, 3305-3455, 3479-3493, 3522-3556 , 3628-3698, and 3755-3810.

態様65.態様63の複合体であって、逆転写鋳型配列が、内生DNA標的と少なくとも80%または85%または90%または95%または99%同一であるヌクレオチド配列を含む。 Aspect 65. The conjugate of embodiment 63, wherein the reverse transcription template sequence comprises a nucleotide sequence that is at least 80% or 85% or 90% or 95% or 99% identical to the endogenous DNA target.

態様66.態様63の複合体であって、逆転写プライマー結合部位が、カットされたDNAの遊離の3'端とハイブリダイズする。 Aspect 66. The complex of embodiment 63, wherein the reverse transcription primer binding site hybridizes to the free 3' end of the cut DNA.

態様67.態様63の複合体であって、任意のリンカー配列が、長さが少なくとも1ヌクレオチド、または少なくとも2、少なくとも3、少なくとも4、少なくとも5、少なくとも6、少なくとも7、少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、または少なくとも15ヌクレオチドである。 Aspect 67. The conjugate of embodiment 63, wherein any linker sequence is at least 1 nucleotide in length, or at least 2, at least 3, at least 4, at least 5, at least 6, at least 7, at least 8, at least 9, at least 10, At least 11, at least 12, at least 13, at least 14, or at least 15 nucleotides.

態様68.態様1~30のいずれかの融合タンパク質をコードするポリヌクレオチド。 Aspect 68. A polynucleotide encoding a fusion protein according to any one of aspects 1 to 30.

態様69.態様68のポリヌクレオチドを含むベクター。 Aspect 69. A vector comprising the polynucleotide of embodiment 68.

態様70.態様1~30のいずれかの融合タンパク質と融合タンパク質のnapDNAbpに結合した伸長されたガイドRNAとを含む細胞。 Mode 70. A cell comprising the fusion protein of any of embodiments 1 to 30 and an elongated guide RNA bound to napDNAbp of the fusion protein.

態様71.態様48~67のいずれか1つの複合体を含む細胞。 Aspect 71. A cell comprising the complex of any one of embodiments 48-67.

態様72.医薬組成物であって:(i)態様1~30のいずれかの融合タンパク質、態様48~67の複合体、態様68のポリヌクレオチド、または態様69のベクターと;(ii)薬学的に許容される賦形剤とを含む。 Mode 72. A pharmaceutical composition comprising: (i) a fusion protein of any of embodiments 1 to 30, a conjugate of embodiments 48 to 67, a polynucleotide of embodiment 68, or a vector of embodiment 69; and excipients.

態様73.医薬組成物であって:(i)態様48~67の複合体、(ii)トランスで提供される逆転写酵素;および(iii)薬学的に許容される賦形剤を含む。 Aspect 73. A pharmaceutical composition comprising: (i) a conjugate of embodiments 48-67, (ii) a reverse transcriptase provided in trans; and (iii) a pharmaceutically acceptable excipient.

態様74.キットであって:(i)態様1~30のいずれか1つの融合タンパク質をコードする核酸配列;および(ii)(i)の配列の発現を駆動するプロモーターを含む核酸構築物を含む。 Aspect 74. A kit comprising: (i) a nucleic acid sequence encoding the fusion protein of any one of embodiments 1 to 30; and (ii) a nucleic acid construct comprising a promoter driving expression of the sequence of (i).

態様75.所望のヌクレオチド変化を二本鎖DNA配列に組み入れるための方法であって、方法が: Aspect 75. A method for incorporating desired nucleotide changes into a double-stranded DNA sequence, the method comprising:

(i)融合タンパク質および伸長されたガイドRNAを含む複合体と二本鎖DNA配列を接触させ、融合タンパク質がnapDNAbpおよび逆転写酵素を含み、伸長されたガイドRNAが所望のヌクレオチド変化を含む逆転写鋳型配列を含むこと; (i) Reverse transcription by contacting a double-stranded DNA sequence with a complex containing a fusion protein and an elongated guide RNA, where the fusion protein contains napDNAbp and reverse transcriptase, and the elongated guide RNA contains the desired nucleotide change. Contains a template sequence;

(ii)非標的鎖上において二本鎖DNA配列にニッキングし、それによって3’端を有する遊離の一本鎖DNAを生成すること; (ii) nicking a double-stranded DNA sequence on the non-target strand, thereby generating free single-stranded DNA with a 3' end;

(iii)遊離の一本鎖DNAの3'端を逆転写鋳型配列にハイブリダイズさせ、それによって逆転写酵素ドメインをプライムすること; (iii) hybridizing the 3′ end of the free single-stranded DNA to a reverse transcription template sequence, thereby priming the reverse transcriptase domain;

(iv)3'端からDNAの鎖を重合し、それによって所望のヌクレオチド変化を含む一本鎖DNAフラップを生成すること; (iv) polymerizing the strands of DNA from the 3' end, thereby producing a single-stranded DNA flap containing the desired nucleotide changes;

(v)カットされた部位に隣接する内生DNA鎖を一本鎖DNAフラップによって置き換え、それによって所望のヌクレオチド変化を二本鎖DNA配列に組み入れること、
を含む。
(v) replacing the endogenous DNA strand adjacent to the cut site by a single-stranded DNA flap, thereby incorporating the desired nucleotide change into the double-stranded DNA sequence;
including.

態様76.態様75の方法であって、(v)置き換えるステップが:(i)一本鎖DNAフラップをカットされた部位に隣接する内生DNA鎖にハイブリダイズさせて、配列ミスマッチを生出すること;(ii)内生DNA鎖を切り出すこと;および(iii)ミスマッチを修復して、所望のヌクレオチド変化をDNAの両方の鎖に含む所望の産物を形成すること、を含む。 Aspect 76. 75. The method of embodiment 75, wherein (v) the step of replacing: (i) hybridizing the single-stranded DNA flap to an endogenous DNA strand adjacent to the cut site to create a sequence mismatch; (ii) ) excising the endogenous DNA strand; and (iii) repairing the mismatch to form the desired product containing the desired nucleotide changes in both strands of the DNA.

態様77.態様76の方法であって、所望のヌクレオチド変化が1ヌクレオチド置換、欠失、または挿入である。 Aspect 77. 77. The method of embodiment 76, wherein the desired nucleotide change is a single nucleotide substitution, deletion, or insertion.

態様78.態様77の方法であって、1ヌクレオチド置換がトランジションまたはトランスバージョンである。 Aspect 78. 78. The method of embodiment 77, wherein the single nucleotide substitution is a transition or transversion.

態様79.態様76の方法であって、所望のヌクレオチド変化が、(1)GからTの置換、(2)GからAの置換、(3)GからCの置換、(4)TからGの置換、(5)TからAの置換、(6)TからCの置換、(7)CからGの置換、(8)CからTの置換、(9)CからAの置換、(10)AからTの置換、(11)AからG置換、または(12)AからCの置換である。 Aspect 79. 76. The method of embodiment 76, wherein the desired nucleotide change is (1) a G to T substitution, (2) a G to A substitution, (3) a G to C substitution, (4) a T to G substitution, (5) Substitution of A from T, (6) Substitution of C from T, (7) Substitution of G from C, (8) Substitution of T from C, (9) Substitution of A from C, (10) Substitution of A T substitution, (11) A to G substitution, or (12) A to C substitution.

態様80.態様76の方法であって、所望のヌクレオチド(nucleoid)変化が、(1)G:C塩基対をT:A塩基対に、(2)G:C塩基対をA:T塩基対に、(3)G:C塩基対をC:G塩基対に、(4)T:A塩基対をG:C塩基対に、(5)T:A塩基対をA:T塩基対に、(6)T:A塩基対をC:G塩基対に、(7)C:G塩基対をG:C塩基対に、(8)C:G塩基対をT:A塩基対に、(9)C:G塩基対をA:T塩基対に、(10)A:T塩基対をT:A塩基対に、(11)A:T塩基対をG:C塩基対に、または(12)A:T塩基対をC:G塩基対に変換する。 Mode 80. 76. The method of embodiment 76, wherein the desired nucleoid change is (1) a G:C base pair to a T:A base pair, (2) a G:C base pair to an A:T base pair, ( 3) G:C base pair to C:G base pair, (4) T:A base pair to G:C base pair, (5) T:A base pair to A:T base pair, (6) T:A base pair becomes C:G base pair, (7) C:G base pair becomes G:C base pair, (8) C:G base pair becomes T:A base pair, (9) C: G base pair to A:T base pair, (10) A:T base pair to T:A base pair, (11) A:T base pair to G:C base pair, or (12) A:T. Converts base pairs to C:G base pairs.

態様81.態様76の方法であって、所望のヌクレオチド変化が1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、または25ヌクレオチドの挿入または欠失である。 Aspect 81. 77. The method of embodiment 76, wherein the desired nucleotide change is 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19 , 20, 21, 22, 23, 24, or 25 nucleotide insertions or deletions.

態様82.態様76の方法であって、所望のヌクレオチド変化が疾患関連遺伝子を修正する。 Mode 82. 77. The method of embodiment 76, wherein the desired nucleotide change modifies a disease-associated gene.

態様83.態様82の方法であって、疾患関連遺伝子が:アデノシンデアミナーゼ(ADA)欠損症;アルファ-1アンチトリプシン欠損症;嚢胞性線維症;デュシェンヌ型筋ジストロフィー;ガラクトース血症;ヘモクロマトーシス;ハンチントン病;メープルシロップ尿症;マルファン症候群;1型神経線維腫症;先天性爪肥厚症;フェニルケトン尿症;重症複合免疫不全;鎌状赤血球症;スミス・レムリ・オピッツ症候群;およびテイ・サックス病からなる群から選択される単一遺伝子障害に関連する。 Aspect 83. The method of embodiment 82, wherein the disease-associated gene is: adenosine deaminase (ADA) deficiency; alpha-1 antitrypsin deficiency; cystic fibrosis; Duchenne muscular dystrophy; galactosemia; hemochromatosis; Huntington's disease; maple Consists of syrup urine disease; Marfan syndrome; type 1 neurofibromatosis; congenital nail hyperplasia; phenylketonuria; severe combined immunodeficiency; sickle cell disease; Smith-Lemli-Opitz syndrome; and Tay-Sachs disease. associated with a single gene disorder selected from the group.

態様84.態様82の方法であって、疾患関連遺伝子が:心臓病;高血圧;アルツハイマー病;関節炎;糖尿病;がん;および肥満からなる群から選択される多遺伝子性障害に関連する。 Mode 84. 83. The method of embodiment 82, wherein the disease-associated gene is associated with a polygenic disorder selected from the group consisting of: heart disease; hypertension; Alzheimer's disease; arthritis; diabetes; cancer; and obesity.

態様85.態様76の方法であって、napDNAbpが、ヌクレアーゼ不活性型Cas9(dCas9)、Cas9ニッカーゼ(nCas9)、またはヌクレアーゼ活性Cas9である。 Mode 85. 77. The method of embodiment 76, wherein the napDNAbp is nuclease-inactive Cas9 (dCas9), Cas9 nickase (nCas9), or nuclease-active Cas9.

態様86.態様76の方法であって、napDNAbpが配列番号18のアミノ酸配列を含む。 Mode 86. 77. The method of embodiment 76, wherein napDNAbp comprises the amino acid sequence of SEQ ID NO: 18.

態様87.態様76の方法であって、napDNAbpが、配列番号18~88、126、130、137、141、147、153、157、445、460、467、および482~487のいずれか1つのアミノ酸配列との少なくとも80%、85%、90%、95%、98%、または99%配列同一性を有するアミノ酸配列を含む。 Mode 87. 76. The method of embodiment 76, wherein napDNAbp has an amino acid sequence of any one of SEQ ID NOs: 18-88, 126, 130, 137, 141, 147, 153, 157, 445, 460, 467, and 482-487. Comprising amino acid sequences with at least 80%, 85%, 90%, 95%, 98%, or 99% sequence identity.

態様88.態様76の方法であって、逆転写酵素が、配列番号89~100、105~122、128~129、132、139、143、149、154、159、235、454、471、516、662、700、701~716、739~741、および766のアミノ酸配列のいずれか1つを含む。 Mode 88. The method of embodiment 76, wherein the reverse transcriptase is SEQ ID NO: 89-100, 105-122, 128-129, 132, 139, 143, 149, 154, 159, 235, 454, 471, 516, 662, 700 , 701-716, 739-741, and 766.

態様89.態様76の方法であって、逆転写酵素ドメインが、配列番号89~100、105~122、128~129、132、139、143、149、154、159、235、454、471、516、662、700、701~716、739~741、および766のいずれか1つのアミノ酸配列との少なくとも80%、85%、90%、95%、98%、または99%配列同一性を有するアミノ酸配列を含む。 Mode 89. The method of embodiment 76, wherein the reverse transcriptase domain is SEQ ID NOs: 89-100, 105-122, 128-129, 132, 139, 143, 149, 154, 159, 235, 454, 471, 516, 662, 700, 701-716, 739-741, and 766.

態様90.態様76の方法であって、伸長されたガイドRNAが、RNA伸長をガイドRNAの3'もしくは5'端または分子内の位置付けに含み、RNA伸長が逆転写鋳型配列を含む。 Aspect 90. 77. The method of embodiment 76, wherein the elongated guide RNA comprises an RNA extension at the 3' or 5' end of the guide RNA or at an intramolecular position, and the RNA extension comprises a reverse transcription template sequence.

態様91.態様90の方法であって、RNA伸長が、長さが少なくとも5ヌクレオチド、少なくとも6ヌクレオチド、少なくとも7ヌクレオチド、少なくとも8ヌクレオチド、少なくとも9ヌクレオチド、少なくとも10ヌクレオチド、少なくとも11ヌクレオチド、少なくとも12ヌクレオチド、少なくとも13ヌクレオチド、少なくとも14ヌクレオチド、少なくとも15ヌクレオチド、少なくとも16ヌクレオチド、少なくとも17ヌクレオチド、少なくとも18ヌクレオチド、少なくとも19ヌクレオチド、少なくとも20ヌクレオチド、少なくとも21ヌクレオチド、少なくとも22ヌクレオチド、少なくとも23ヌクレオチド、少なくとも24ヌクレオチド、または少なくとも25ヌクレオチドである。 Aspect 91. 90. The method of embodiment 90, wherein the RNA elongation is at least 5 nucleotides, at least 6 nucleotides, at least 7 nucleotides, at least 8 nucleotides, at least 9 nucleotides, at least 10 nucleotides, at least 11 nucleotides, at least 12 nucleotides, at least 13 nucleotides in length. , at least 14 nucleotides, at least 15 nucleotides, at least 16 nucleotides, at least 17 nucleotides, at least 18 nucleotides, at least 19 nucleotides, at least 20 nucleotides, at least 21 nucleotides, at least 22 nucleotides, at least 23 nucleotides, at least 24 nucleotides, or at least 25 nucleotides be.

態様92.態様76の方法であって、伸長されたガイドRNAが、配列番号394、429~442、641~649、678~692、2997~3103、3113~3121、3305~3455、3479~3493、3522~3556、3628~3698、および3755~3810からなる群から選択されるヌクレオチド配列を有する。 Aspect 92. The method of embodiment 76, wherein the elongated guide RNA is SEQ ID NO: 394, 429-442, 641-649, 678-692, 2997-3103, 3113-3121, 3305-3455, 3479-3493, 3522-3556. , 3628-3698, and 3755-3810.

態様93.標的座位におけるDNA分子のヌクレオチド配列の1つ以上の変化を導入するための方法であって: Aspect 93. A method for introducing one or more changes in the nucleotide sequence of a DNA molecule at a target locus, the method comprising:

(i)核酸プログラム型DNA結合タンパク質(napDNAbp)およびnapDNAbpを標的座位へと標的化するガイドRNAとDNA分子を接触させ、ガイドRNAが少なくとも1つの所望のヌクレオチド変化を含む逆転写酵素(RT)鋳型配列を含むこと; (i) a reverse transcriptase (RT) template in which the DNA molecule is contacted with a nucleic acid programmed DNA binding protein (napDNAbp) and a guide RNA that targets napDNAbp to the target locus, the guide RNA containing at least one desired nucleotide change; Contains an array;

(ii)標的座位におけるDNA鎖の暴露された3’端を形成すること; (ii) forming an exposed 3' end of the DNA strand at the target locus;

(iii)暴露された3’端をRT鋳型配列にハイブリダイズさせて逆転写をプライムすること; (iii) hybridizing the exposed 3′ end to the RT template sequence to prime reverse transcription;

(iv)逆転写酵素によって、RT鋳型配列に基づく少なくとも1つの所望のヌクレオチド変化を含む一本鎖DNAフラップを合成すること;および (iv) synthesizing by reverse transcriptase a single-stranded DNA flap containing at least one desired nucleotide change based on the RT template sequence; and

(v)少なくとも1つの所望のヌクレオチド変化を対応する内生DNA上に組み込み、それによって、標的座位においてDNA分子のヌクレオチド配列の1つ以上の変化を導入すること、
を含む。
(v) incorporating at least one desired nucleotide change onto the corresponding endogenous DNA, thereby introducing one or more changes in the nucleotide sequence of the DNA molecule at the target locus;
including.

態様94.態様93の方法であって、ヌクレオチド配列の1つ以上の変化がトランジションを含む。 Aspect 94. 94. The method of embodiment 93, wherein the one or more changes in the nucleotide sequence comprises a transition.

態様95.態様94の方法であって、トランジションが、(a)TからC;(b)AからG;(c)CからT;および(d)GからAからなる群から選択される。 Aspect 95. 95. The method of embodiment 94, wherein the transition is selected from the group consisting of (a) T to C; (b) A to G; (c) C to T; and (d) G to A.

態様96.態様93の方法であって、ヌクレオチド配列の1つ以上の変化がトランスバージョンを含む。 Aspect 96. 94. The method of embodiment 93, wherein the one or more changes in the nucleotide sequence comprises a transversion.

態様97.態様96の方法であって、トランスバージョンが、(a)TからA;(b)TからG;(c)CからG;(d)CからA;(e)AからT;(f)AからC;(g)GからC;および(h)GからTからなる群から選択される。 Aspect 97. 96. The method of aspect 96, wherein the transversion is: (a) T to A; (b) T to G; (c) C to G; (d) C to A; (e) A to T; (f) (g) G to C; and (h) G to T.

態様98.態様93の方法であって、ヌクレオチド配列の1つ以上の変化が、(1)G:C塩基対をT:A塩基対に、(2)G:C塩基対をA:T塩基対に、(3)G:C塩基対をC:G塩基対に、(4)T:A塩基対をG:C塩基対に、(5)T:A塩基対をA:T塩基対に、(6)T:A塩基対をC:G塩基対に、(7)C:G塩基対をG:C塩基対に、(8)C:G塩基対をT:A塩基対に、(9)C:G塩基対をA:T塩基対に、(10)A:T塩基対をT:A塩基対に、(11)A:T塩基対をG:C塩基対に、または(12)A:T塩基対をC:G塩基対に変化させることを含む。 Aspect 98. 94. The method of embodiment 93, wherein the one or more changes in the nucleotide sequence include: (1) a G:C base pair to a T:A base pair; (2) a G:C base pair to an A:T base pair; (3) G:C base pair to C:G base pair, (4) T:A base pair to G:C base pair, (5) T:A base pair to A:T base pair, (6 )T:A base pair to C:G base pair, (7)C:G base pair to G:C base pair, (8)C:G base pair to T:A base pair, (9)C :G base pair to A:T base pair, (10) A:T base pair to T:A base pair, (11) A:T base pair to G:C base pair, or (12) A: It involves changing a T base pair to a C:G base pair.

態様99.態様93の方法であって、ヌクレオチド配列の1つ以上の変化が、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、または25ヌクレオチドの挿入または欠失を含む。 Aspect 99. 94. The method of embodiment 93, wherein the one or more changes in the nucleotide sequence are 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, Contains insertions or deletions of 17, 18, 19, 20, 21, 22, 23, 24, or 25 nucleotides.

態様100.態様93の方法であって、ヌクレオチド配列の1つ以上の変化が疾患関連遺伝子の修正を含む。 Mode 100. 94. The method of embodiment 93, wherein the one or more changes in the nucleotide sequence comprises correction of a disease-associated gene.

態様101.態様100の方法であって、疾患関連遺伝子が:アデノシンデアミナーゼ(ADA)欠損症;アルファ-1アンチトリプシン欠損症;嚢胞性線維症;デュシェンヌ型筋ジストロフィー;ガラクトース血症;ヘモクロマトーシス;ハンチントン病;メープルシロップ尿症;マルファン症候群;1型神経線維腫症;先天性爪肥厚症;フェニルケトン尿症;重症複合免疫不全;鎌状赤血球症;スミス・レムリ・オピッツ症候群;およびテイ・サックス病からなる群から選択される単一遺伝子障害に関連する。 Aspect 101. Embodiment 100, wherein the disease-associated gene is: adenosine deaminase (ADA) deficiency; alpha-1 antitrypsin deficiency; cystic fibrosis; Duchenne muscular dystrophy; galactosemia; hemochromatosis; Huntington's disease; maple Consists of syrup urine disease; Marfan syndrome; type 1 neurofibromatosis; congenital nail hyperplasia; phenylketonuria; severe combined immunodeficiency; sickle cell disease; Smith-Lemli-Opitz syndrome; and Tay-Sachs disease. associated with a single gene disorder selected from the group.

態様102.態様100の方法であって、疾患関連遺伝子が:心臓病;高血圧;アルツハイマー病;関節炎;糖尿病;がん;および肥満からなる群から選択される多遺伝子性障害に関連する。 Aspect 102. Embodiment 100, wherein the disease-associated gene is associated with a polygenic disorder selected from the group consisting of: heart disease; hypertension; Alzheimer's disease; arthritis; diabetes; cancer; and obesity.

態様103.態様93の方法であって、napDNAbpがヌクレアーゼ活性Cas9またはそのバリアントである。 Aspect 103. 94. The method of embodiment 93, wherein napDNAbp is nuclease active Cas9 or a variant thereof.

態様104.態様93の方法であって、napDNAbpがヌクレアーゼ不活性型Cas9(dCas9)もしくはCas9ニッカーゼ(nCas9)またはそのバリアントである。 Aspect 104. 94. The method of embodiment 93, wherein napDNAbp is nuclease-inactive Cas9 (dCas9) or Cas9 nickase (nCas9) or a variant thereof.

態様105.態様93の方法であって、napDNAbpが配列番号18のアミノ酸配列を含む。 Aspect 105. 94. The method of embodiment 93, wherein napDNAbp comprises the amino acid sequence of SEQ ID NO: 18.

態様106.態様93の方法であって、napDNAbpが、配列番号18~88、126、130、137、141、147、153、157、445、460、467、および482~487のいずれか1つのアミノ酸配列との少なくとも80%、85%、90%、95%、98%、または99%配列同一性を有するアミノ酸配列を含む。 Aspect 106. Embodiment 93, wherein napDNAbp has an amino acid sequence of any one of SEQ ID NOs: 18-88, 126, 130, 137, 141, 147, 153, 157, 445, 460, 467, and 482-487. Comprising amino acid sequences with at least 80%, 85%, 90%, 95%, 98%, or 99% sequence identity.

態様107.態様93の方法であって、逆転写酵素がトランスで導入される。 Aspect 107. 94. The method of embodiment 93, wherein the reverse transcriptase is introduced in trans.

態様108.態様93の方法であって、napDNAbpが逆転写酵素への融合体を含む。 Aspect 108. 94. The method of embodiment 93, wherein napDNAbp comprises a fusion to reverse transcriptase.

態様109.態様93の方法であって、逆転写酵素が、f配列番号89~100、105~122、128~129、132、139、143、149、154、159、235、454、471、516、662、700、701~716、739~741、および766のアミノ酸配列のいずれか1つを含む。 Aspect 109. The method of embodiment 93, wherein the reverse transcriptase is f SEQ ID NO: 89-100, 105-122, 128-129, 132, 139, 143, 149, 154, 159, 235, 454, 471, 516, 662, 700, 701-716, 739-741, and 766.

態様110.態様93の方法であって、逆転写酵素が、配列番号89~100、105~122、128~129、132、139、143、149、154、159、235、454、471、516、662、700、701~716、739~741、および766のいずれか1つのアミノ酸配列との少なくとも80%、85%、90%、95%、98%、または99%配列同一性を有するアミノ酸配列を含む。 Aspect 110. Embodiment 93, wherein the reverse transcriptase is SEQ ID NO: 89-100, 105-122, 128-129, 132, 139, 143, 149, 154, 159, 235, 454, 471, 516, 662, 700 , 701-716, 739-741, and 766.

態様111.態様93の方法であって、標的座位におけるDNA鎖の暴露された3’端を形成するステップが、ヌクレアーゼによってDNA鎖へニックを入れることを含む。 Aspect 111. 94. The method of embodiment 93, wherein the step of forming an exposed 3' end of the DNA strand at the target locus comprises nicking the DNA strand with a nuclease.

態様112.態様111の方法であって、ヌクレアーゼがnapDNAbpであるか、napDNAbpの融合ドメインとして提供されるか、またはトランスで提供される。 Aspect 112. Embodiment 111, wherein the nuclease is napDNAbp, is provided as a fusion domain of napDNAbp, or is provided in trans.

態様113.態様93の方法であって、標的座位におけるDNA鎖の暴露された3’端を形成するステップが、DNA鎖を化学的薬剤と接触させることを含む。 Aspect 113. 94. The method of embodiment 93, wherein forming an exposed 3' end of the DNA strand at the target locus comprises contacting the DNA strand with a chemical agent.

態様114.態様93の方法であって、標的座位におけるDNA鎖の暴露された3’端を形成するステップが、複製エラーを導入することを含む。 Aspect 114. 94. The method of embodiment 93, wherein forming an exposed 3' end of the DNA strand at the target locus comprises introducing a replication error.

態様115.態様93の方法であって、DNA分子をnapDNAbpおよびガイドRNAと接触させるステップがRループを形成する。 Aspect 115. 94. The method of embodiment 93, wherein the step of contacting the DNA molecule with napDNAbp and guide RNA forms an R-loop.

態様116.態様115の方法であって、暴露された3’端が形成されるDNA鎖がRループ上にある。 Aspect 116. Embodiment 115. The method of embodiment 115, wherein the DNA strand from which the exposed 3' end is formed is on the R-loop.

態様117.態様93の方法であって、ガイドRNAが、逆転写酵素(RT)鋳型配列を含む伸長された部分を含む。 Aspect 117. 94. The method of embodiment 93, wherein the guide RNA comprises an extended portion that includes a reverse transcriptase (RT) template sequence.

態様118.態様117の方法であって、伸長された部分が、ガイドRNAの3’端、ガイドRNAの5'端、またはガイドRNAの分子内の位置にある。 Aspect 118. The method of embodiment 117, wherein the elongated portion is at the 3' end of the guide RNA, at the 5' end of the guide RNA, or at a position within the molecule of the guide RNA.

態様119.態様93の方法であって、ガイドRNAがさらにプライマー結合部位を含む。 Aspect 119. 94. The method of embodiment 93, wherein the guide RNA further comprises a primer binding site.

態様120.態様93の方法であって、ガイドRNAがさらにスペーサー配列を含む。 Aspect 120. 94. The method of embodiment 93, wherein the guide RNA further comprises a spacer sequence.

態様121.態様93の方法であって、RT鋳型配列が、対応する内生DNAに対して相同的である。 Aspect 121. 94. The method of embodiment 93, wherein the RT template sequence is homologous to the corresponding endogenous DNA.

態様122.プライム標的にプライムされた逆転写によって、標的座位におけるDNA分子のヌクレオチド配列の1つ以上の変化を導入するための方法であって、方法が:(a)標的座位におけるDNA分子を(i)核酸プログラム型DNA結合タンパク質(napDNAbp)および逆転写酵素を含む融合タンパク質ならびに(ii)所望のヌクレオチド変化を含むRT鋳型を含むガイドRNAと接触させること;(b)RT鋳型のプライム標的にプライムされた逆転写を行なって、所望のヌクレオチド変化を含む一本鎖DNAを生成すること;ならびに(c)DNA修復および/または複製プロセスによって標的座位におけるDNA分子上に所望のヌクレオチド変化を組み込むことを含む。 Aspect 122. A method for introducing one or more changes in the nucleotide sequence of a DNA molecule at a target locus by primed reverse transcription to a primed target, the method comprising: (a) converting the DNA molecule at the target locus into (i) a nucleic acid molecule; contacting a fusion protein comprising a programmed DNA binding protein (napDNAbp) and a reverse transcriptase and (ii) a guide RNA comprising an RT template containing the desired nucleotide changes; (b) a reverse primed target of the RT template; (c) incorporating the desired nucleotide changes onto the DNA molecule at the target locus by DNA repair and/or replication processes.

態様123.態様122の方法であって、RT鋳型が、ガイドRNAの3'端、ガイドRNAの5'端、またはガイドRNAの分子内の位置付けに位置付けられる。 Aspect 123. The method of embodiment 122, wherein the RT template is located at the 3' end of the guide RNA, at the 5' end of the guide RNA, or at an intramolecular location of the guide RNA.

態様124.態様122の方法であって、所望のヌクレオチド変化が、トランジション、トランスバージョン、挿入、もしくは欠失、またはそれらのいずれかの組み合わせを含む。 Aspect 124. Embodiment 122. The method of embodiment 122, wherein the desired nucleotide change comprises a transition, transversion, insertion, or deletion, or any combination thereof.

態様125.請求項122の方法であって、所望のヌクレオチド変化が、(a)TからC;(b)AからG;(c)CからT;および(d)GからAからなる群から選択されるトランジションを含む。 Aspect 125. 123. The method of claim 122, wherein the desired nucleotide change is selected from the group consisting of: (a) T to C; (b) A to G; (c) C to T; and (d) G to A. Contains transitions.

態様126.請求項122の方法であって、所望のヌクレオチド変化が、(a)TからA;(b)TからG;(c)CからG;(d)CからA;(e)AからT;(f)AからC;(g)GからC;および(h)GからTからなる群から選択されるトランスバージョンを含む。 Aspect 126. 123. The method of claim 122, wherein the desired nucleotide change is (a) T to A; (b) T to G; (c) C to G; (d) C to A; (e) A to T; (f) A to C; (g) G to C; and (h) G to T.

態様127.態様122の方法であって、所望のヌクレオチド変化が、(1)G:C塩基対をT:A塩基対に、(2)G:C塩基対をA:T塩基対に、(3)G:C塩基対をC:G塩基対に、(4)T:A塩基対をG:C塩基対に、(5)T:A塩基対をA:T塩基対に、(6)T:A塩基対をC:G塩基対に、(7)C:G塩基対をG:C塩基対に、(8)C:G塩基対をT:A塩基対に、(9)C:G塩基対をA:T塩基対に、(10)A:T塩基対をT:A塩基対に、(11)A:T塩基対をG:C塩基対に、または(12)A:T塩基対をC:G塩基対に変化させることを含む。 Aspect 127. Embodiment 122, wherein the desired nucleotide change is (1) a G:C base pair to a T:A base pair, (2) a G:C base pair to an A:T base pair, (3) a G:C base pair to a T:A base pair; :C base pair becomes C:G base pair, (4) T:A base pair becomes G:C base pair, (5) T:A base pair becomes A:T base pair, (6) T:A base pair to C:G base pair, (7) C:G base pair to G:C base pair, (8) C:G base pair to T:A base pair, (9) C:G base pair. into an A:T base pair, (10) an A:T base pair into a T:A base pair, (11) an A:T base pair into a G:C base pair, or (12) an A:T base pair. This includes changing to a C:G base pair.

態様128.態様31~47のいずれか1つの伸長されたガイドRNAをコードするポリヌクレオチド。 Aspect 128. A polynucleotide encoding the elongated guide RNA of any one of embodiments 31-47.

態様129.態様128のポリヌクレオチドを含むベクター。 Aspect 129. A vector comprising the polynucleotide of embodiment 128.

態様130.態様129のベクターを含む細胞。 Aspect 130. A cell comprising the vector of embodiment 129.

態様131.態様1~30のいずれかの融合タンパク質であって、逆転写酵素がエラーを起こしやすい逆転写酵素である。 Aspect 131. The fusion protein of any of embodiments 1 to 30, wherein the reverse transcriptase is an error-prone reverse transcriptase.

態様132.プライム標的にプライムされた逆転写によって標的座位におけるDNA分子に変異導入するための方法であって、方法が:(a)標的座位におけるDNA分子を(i)核酸プログラム型DNA結合タンパク質(napDNAbp)およびエラーを起こしやすい逆転写酵素を含む融合タンパク質ならびに(ii)所望のヌクレオチド変化を含むRT鋳型を含むガイドRNAと接触させること;(b)RT鋳型のプライム標的にプライムされた逆転写を行なって、変異導入された一本鎖DNAを生成すること;ならびに(c)DNA修復および/または複製プロセスによって、変異導入された一本鎖DNAを標的座位におけるDNA分子上に組み込むことを含む。 Aspect 132. A method for mutagenizing a DNA molecule at a target locus by primed reverse transcription, the method comprising: (a) converting the DNA molecule at the target locus to (i) a nucleic acid programmed DNA binding protein (napDNAbp); contacting a fusion protein comprising an error-prone reverse transcriptase and (ii) a guide RNA comprising an RT template comprising the desired nucleotide changes; (b) performing primed reverse transcription on a primed target of the RT template; producing mutagenized single-stranded DNA; and (c) incorporating the mutagenized single-stranded DNA onto a DNA molecule at a target locus by a DNA repair and/or replication process.

態様133.態様132の方法であって、融合タンパク質がPE1、PE2、またはPE3のアミノ酸配列を含む。 Aspect 133. 133. The method of embodiment 132, wherein the fusion protein comprises the amino acid sequence of PE1, PE2, or PE3.

態様134.態様132の方法であって、napDNAbpがCas9ニッカーゼ(nCas9)である。 Aspect 134. 133. The method of embodiment 132, wherein napDNAbp is Cas9 nickase (nCas9).

態様135.態様132の方法であって、napDNAbpが配列番号18~88、126、130、137、141、147、153、157、445、460、467、および482~487のアミノ酸配列を含む。 Aspect 135. Embodiment 132, wherein the napDNAbp comprises the amino acid sequences of SEQ ID NOs: 18-88, 126, 130, 137, 141, 147, 153, 157, 445, 460, 467, and 482-487.

態様136.態様132の方法であって、ガイドRNAが配列番号222を含む。 Aspect 136. 133. The method of embodiment 132, wherein the guide RNA comprises SEQ ID NO: 222.

態様137.態様132の方法であって、(b)プライム標的にプライムされた逆転写を行うステップが、ガイドRNA上のプライマー結合部位へのアニーリングによって逆転写をプライムすることができる標的座位における3'端プライマー結合配列を生成することを含む。 Embodiment 137. The method of embodiment 132, wherein (b) performing primed reverse transcription on the primed target comprises generating a 3' end primer binding sequence at the target locus capable of priming reverse transcription by annealing to a primer binding site on the guide RNA.

態様138.健康な数の反復トリヌクレオチドを含む健康な配列によって標的DNA分子上のトリヌクレオチド反復拡大変異を置き換えるための方法であって、方法が:(a)標的座位におけるDNA分子を(i)核酸プログラム型DNA結合タンパク質(napDNAbp)および逆転写酵素を含む融合タンパク質ならびに(ii)置き換え配列を含むRT鋳型を含むガイドRNAと接触させ、前記融合タンパク質が導入すること(intr);(b)RT鋳型のプライム標的にプライムされた逆転写を行なって、置き換え配列を含む一本鎖DNAを生成すること;ならびに(c)DNA修復および/または複製プロセスによって、標的座位におけるDNA分子上に一本鎖DNAを組み込むことを含む。 Aspect 138. A method for replacing a trinucleotide repeat expansion mutation on a target DNA molecule by a healthy sequence containing a healthy number of repeat trinucleotides, the method comprising: (a) converting the DNA molecule at the target locus to (i) a nucleic acid programmed contacting a fusion protein comprising a DNA binding protein (napDNAbp) and a reverse transcriptase and (ii) a guide RNA comprising an RT template comprising a replacement sequence and introducing said fusion protein (intr); (b) priming the RT template; performing target-primed reverse transcription to generate single-stranded DNA containing the replacement sequence; and (c) incorporating the single-stranded DNA onto the DNA molecule at the target locus by DNA repair and/or replication processes. Including.

態様139.態様138の方法であって、融合タンパク質がPE1、PE2、またはPE3のアミノ酸配列を含む。 Embodiment 139. The method of embodiment 138, wherein the fusion protein comprises an amino acid sequence of PE1, PE2, or PE3.

態様140.態様138の方法であって、napDNAbpがCas9ニッカーゼ(nCas9)である。 Aspect 140. Embodiment 138, wherein the napDNAbp is Cas9 nickase (nCas9).

態様141.態様138の方法であって、napDNAbpが、配列番号18~88、126、130、137、141、147、153、157、445、460、467、および482~487のアミノ酸配列を含む。 Aspect 141. Embodiment 138, wherein the napDNAbp comprises the amino acid sequences of SEQ ID NOs: 18-88, 126, 130, 137, 141, 147, 153, 157, 445, 460, 467, and 482-487.

態様142.態様138の方法であって、ガイドRNAが配列番号222を含む。 Aspect 142. 139. The method of embodiment 138, wherein the guide RNA comprises SEQ ID NO: 222.

態様143.態様138の方法であって、(b)プライム標的にプライムされた逆転写を行うステップが、ガイドRNA上のプライマー結合部位へのアニーリングによって逆転写をプライムすることができる標的座位における3'端プライマー結合配列を生成することを含む。 Aspect 143. Embodiment 138, wherein (b) performing primed reverse transcription on a primed target comprises a 3' end primer at the target locus capable of priming reverse transcription by annealing to a primer binding site on a guide RNA; Including generating associative arrays.

態様144.態様138の方法であって、トリヌクレオチド反復拡大変異がハンチントン病、脆弱X症候群、またはフリードライヒ運動失調症に関連する。 Aspect 144. 139. The method of embodiment 138, wherein the trinucleotide repeat expansion mutation is associated with Huntington's disease, Fragile X syndrome, or Friedreich's ataxia.

態様145.態様138の方法であって、トリヌクレオチド反復拡大変異がCAGトリプレットの繰り返し単位を含む。 Aspect 145. 139. The method of embodiment 138, wherein the trinucleotide repeat expansion comprises a CAG triplet repeat unit.

態様146.態様138の方法であって、トリヌクレオチド反復拡大変異がGAAトリプレットの繰り返し単位を含む。 Aspect 146. 139. The method of embodiment 138, wherein the trinucleotide repeat expansion comprises a GAA triplet repeat unit.

態様147.プライム編集によって、標的ヌクレオチド配列によってコードされる目当てのタンパク質上に機能部分を組み入れる方法であって、方法が:(a)標的ヌクレオチド配列を(i)核酸プログラム型DNA結合タンパク質(napDNAbp)および逆転写酵素を含むプライム編集因子ならびに(ii)機能部分をコードする編集鋳型を含むPEgRNAと接触させること;(b)機能部分をコードする一本鎖DNA配列を重合すること;ならびに(c)DNA修復および/または複製プロセスによって、標的ヌクレオチド配列における対応する内生鎖の代わりに一本鎖DNA配列を組み込むことを含み、方法が、目当てのタンパク質と機能部分とを含む融合タンパク質をコードする組み換え標的ヌクレオチド配列を生ずる。 Aspect 147. A method of incorporating a functional moiety onto a protein of interest encoded by a target nucleotide sequence by prime editing, the method comprising: (a) converting the target nucleotide sequence to (i) nucleic acid programmed DNA binding protein (napDNAbp) and reverse transcription; contacting a prime editing factor comprising an enzyme and (ii) a PEgRNA comprising an editing template encoding a functional moiety; (b) polymerizing a single-stranded DNA sequence encoding a functional moiety; and (c) DNA repair and and/or incorporating a single-stranded DNA sequence in place of the corresponding endogenous strand in the target nucleotide sequence by a replication process, the method comprising a recombinant target nucleotide sequence encoding a fusion protein comprising the protein of interest and a functional moiety. will occur.

態様148.態様147の方法であって、機能部分がペプチドタグである。 Aspect 148. Embodiment 147. The method of embodiment 147, wherein the functional moiety is a peptide tag.

態様149.態様148の方法であって、ペプチドタグがアフィニティータグ、可溶化タグ、クロマトグラフィータグ、エピトープタグ、または蛍光タグである。 Aspect 149. Embodiment 148, wherein the peptide tag is an affinity tag, solubilization tag, chromatography tag, epitope tag, or fluorescent tag.

態様150.態様148の方法であって、ペプチドタグが:AviTag(配列番号245);Cタグ(配列番号246);カルモジュリンタグ(配列番号247);ポリグルタミン酸タグ(配列番号248);Eタグ(配列番号249);FLAGタグ(配列番号2);HAタグ(配列番号5);Hisタグ(配列番号252~262);Mycタグ(配列番号6);NEタグ(配列番号264);Rho1D4タグ(配列番号265);Sタグ(配列番号266);SBPタグ(配列番号267);Softag-1(配列番号268);Softag-2(配列番号269);Spotタグ(配列番号270);Strepタグ(配列番号271);TCタグ(配列番号272);Tyタグ(配列番号273);V5タグ(配列番号3);VSVタグ(配列番号275);およびXpressタグ(配列番号276)からなる群から選択される。 Mode 150. Embodiment 148, wherein the peptide tag is: AviTag (SEQ ID NO: 245); C-tag (SEQ ID NO: 246); calmodulin tag (SEQ ID NO: 247); polyglutamic acid tag (SEQ ID NO: 248); E-tag (SEQ ID NO: 249). ); FLAG tag (SEQ ID NO: 2); HA tag (SEQ ID NO: 5); His tag (SEQ ID NO: 252-262); Myc tag (SEQ ID NO: 6); NE tag (SEQ ID NO: 264); Rho1D4 tag (SEQ ID NO: 265); );S tag (SEQ ID NO: 266);SBP tag (SEQ ID NO: 267);Softag-1 (SEQ ID NO: 268);Softag-2 (SEQ ID NO: 269);Spot tag (SEQ ID NO: 270);Strep tag (SEQ ID NO: 271 ); TC tag (SEQ ID NO: 272); Ty tag (SEQ ID NO: 273); V5 tag (SEQ ID NO: 3); VSV tag (SEQ ID NO: 275); and Xpress tag (SEQ ID NO: 276).

態様151.態様148の方法であって、ペプチドタグが:AU1エピトープ(配列番号278);AU5エピトープ(配列番号279);バクテリオファージT7エピトープ(T7タグ)(配列番号280);ブルータングウイルスタグ(Bタグ)(配列番号281);E2エピトープ(配列番号282);ヒスチジンアフィニティータグ(HAT)(配列番号283);HSVエピトープ(配列番号284);ポリアルギニン(Argタグ)(配列番号285);ポリアスパラギン酸(Aspタグ)(配列番号286);ポリフェニルアラニン(Pheタグ)(配列番号287);S1タグ(配列番号288);Sタグ(配列番号266);およびVSV-G(配列番号275)からなる群から選択される。 Aspect 151. Embodiment 148, wherein the peptide tag is: AU1 epitope (SEQ ID NO: 278); AU5 epitope (SEQ ID NO: 279); bacteriophage T7 epitope (T7 tag) (SEQ ID NO: 280); bluetongue virus tag (B tag). (SEQ ID NO: 281); E2 epitope (SEQ ID NO: 282); histidine affinity tag (HAT) (SEQ ID NO: 283); HSV epitope (SEQ ID NO: 284); polyarginine (Arg tag) (SEQ ID NO: 285); polyaspartic acid ( Asp tag) (SEQ ID NO: 286); polyphenylalanine (Phe tag) (SEQ ID NO: 287); S1 tag (SEQ ID NO: 288); S tag (SEQ ID NO: 266); and VSV-G (SEQ ID NO: 275). selected.

態様152.態様147の方法であって、機能部分が免疫エピトープである。 Aspect 152. Embodiment 147. The method of embodiment 147, wherein the functional moiety is an immune epitope.

態様153.態様152の方法であって、免疫エピトープが:破傷風トキソイド(配列番号396);ジフテリア毒素変異体CRM197(配列番号398);ムンプス免疫エピトープ1(配列番号400);ムンプス免疫エピトープ2(配列番号402);ムンプス免疫エピトープ3(配列番号404);風疹ウイルス(配列番号406);ヘマグルチニン(配列番号408);ノイラミニダーゼ(配列番号410);TAP1(配列番号412);TAP2(配列番号414);クラスI HLAに対するヘマグルチニンエピトープ(配列番号416);クラスI HLAに対するノイラミニダーゼエピトープ(配列番号418);クラスII HLAに対するヘマグルチニンエピトープ(配列番号420);クラスII HLAに対するノイラミニダーゼエピトープ(配列番号422);ヘマグルチニンエピトープH5N1結合クラスIおよびクラスII HLA(配列番号424);ノイラミニダーゼエピトープH5N1結合クラスIおよびクラスII HLA(配列番号426)からなる群から選択される。 Aspect 153. Embodiment 152, wherein the immune epitope is: tetanus toxoid (SEQ ID NO: 396); diphtheria toxin variant CRM197 (SEQ ID NO: 398); mumps immune epitope 1 (SEQ ID NO: 400); mumps immune epitope 2 (SEQ ID NO: 402). Mumps immune epitope 3 (SEQ ID NO: 404); Rubella virus (SEQ ID NO: 406); Hemagglutinin (SEQ ID NO: 408); Neuraminidase (SEQ ID NO: 410); TAP1 (SEQ ID NO: 412); TAP2 (SEQ ID NO: 414); Class I HLA hemagglutinin epitope for class I HLA (SEQ ID NO: 416); neuraminidase epitope for class I HLA (SEQ ID NO: 420); neuraminidase epitope for class II HLA (SEQ ID NO: 422); hemagglutinin epitope H5N1 binding class I and class II HLA (SEQ ID NO: 424); neuraminidase epitope H5N1 binding class I and class II HLA (SEQ ID NO: 426).

態様154.態様147の方法であって、機能部分が目当てのタンパク質の局在を変改する。 Aspect 154. Embodiment 147. The method of embodiment 147, wherein the functional moiety alters localization of the protein of interest.

態様155.態様147の方法であって、機能部分が分解タグであり、その結果、目当てのタンパク質の分解速度が変改される。 Aspect 155. Embodiment 147. The method of embodiment 147, wherein the functional moiety is a degradation tag, so that the degradation rate of the protein of interest is altered.

態様156.態様155の方法であって、分解タグが、本明細書に開示の分解タグをコードするアミノ酸配列を含む。 Aspect 156. Embodiment 155. The method of embodiment 155, wherein the degradation tag comprises an amino acid sequence encoding a degradation tag as disclosed herein.

態様157.態様147の方法であって、機能部分が低分子結合ドメインである。 Aspect 157. Embodiment 147. The method of embodiment 147, wherein the functional moiety is a small molecule binding domain.

態様158.態様157の方法であって、低分子結合ドメインが配列番号488のFKBP12である。 Embodiment 158. The method of embodiment 157, wherein the small molecule binding domain is FKBP12 of SEQ ID NO:488.

態様159.態様157の方法であって、低分子結合ドメインが配列番号489のFKBP12-F36Vである。 Aspect 159. The method of embodiment 157, wherein the small molecule binding domain is FKBP12-F36V of SEQ ID NO: 489.

態様160.態様157の方法であって、低分子結合ドメインが配列番号490および493~494のシクロフィリンである。 Mode 160. The method of embodiment 157, wherein the small molecule binding domain is a cyclophilin of SEQ ID NOs: 490 and 493-494.

態様161.態様157の方法であって、低分子結合ドメインが目当ての2つ以上のタンパク質上に組み入れされる。 Embodiment 161. The method of embodiment 157, wherein the small molecule binding domains are incorporated onto two or more proteins of interest.

態様162.態様161の方法であって、目当ての2つ以上のタンパク質が低分子と接触することによって二量体化し得る。 Embodiment 162. The method of embodiment 161, wherein two or more proteins of interest can be dimerized by contact with a small molecule.

態様163.態様157の方法であって、低分子が、群1の態様163に開示される化合物からなる群から選択される低分子の二量体である。 Aspect 163. Embodiment 157. The method of embodiment 157, wherein the small molecule is a dimer of a small molecule selected from the group consisting of the compounds disclosed in embodiment 163 of group 1.

態様164.プライム編集によって、標的ヌクレオチド配列によってコードされる目当てのタンパク質上に免疫エピトープを組み入れる方法であって、方法が:(a)標的ヌクレオチド配列を(i)核酸プログラム型DNA結合タンパク質(napDNAbp)および逆転写酵素を含むプライム編集因子ならびに(ii)機能部分をコードする編集鋳型を含むPEgRNAと接触させること;(b)免疫エピトープをコードする一本鎖DNA配列を重合すること;ならびに(c)DNA修復および/または複製プロセスによって、標的ヌクレオチド配列における対応する内生鎖の代わりに一本鎖DNA配列を組み込むことを含み、方法が、目当てのタンパク質と免疫エピトープとを含む融合タンパク質をコードする組み換え標的ヌクレオチド配列を生ずる。 Aspect 164. A method of incorporating an immune epitope onto a protein of interest encoded by a target nucleotide sequence by prime editing, the method comprising: (a) converting the target nucleotide sequence to (i) nucleic acid programmed DNA binding protein (napDNAbp) and reverse transcription; contacting a prime editing factor comprising an enzyme and (ii) PEgRNA comprising an editing template encoding a functional moiety; (b) polymerizing a single-stranded DNA sequence encoding an immune epitope; and (c) DNA repair and and/or incorporating a single-stranded DNA sequence in place of the corresponding endogenous strand in the target nucleotide sequence by a replication process, wherein the method comprises recombinant target nucleotide sequences encoding a fusion protein comprising the protein of interest and the immune epitope. will occur.

態様165.態様164の方法であって、免疫エピトープが:破傷風トキソイド(配列番号396);ジフテリア毒素変異体CRM197(配列番号630);ムンプス免疫エピトープ1(配列番号400);ムンプス免疫エピトープ2(配列番号402);ムンプス免疫エピトープ3(配列番号404);風疹ウイルス(配列番号406);ヘマグルチニン(配列番号408);ノイラミニダーゼ(配列番号410);TAP1(配列番号412);TAP2(配列番号414);クラスI HLAに対するヘマグルチニンエピトープ(配列番号416);クラスI HLAに対するノイラミニダーゼエピトープ(配列番号418);クラスII HLAに対するヘマグルチニンエピトープ(配列番号420);クラスII HLAに対するノイラミニダーゼエピトープ(配列番号422);ヘマグルチニンエピトープH5N1結合クラスIおよびクラスII HLA(配列番号424);ノイラミニダーゼエピトープH5N1結合クラスIおよびクラスII HLA(配列番号426)からなる群から選択される。 Embodiment 165. The method of embodiment 164, wherein the immune epitope is: tetanus toxoid (SEQ ID NO: 396); diphtheria toxin variant CRM197 (SEQ ID NO: 630); mumps immune epitope 1 (SEQ ID NO: 400); mumps immune epitope 2 (SEQ ID NO: 402); mumps immune epitope 3 (SEQ ID NO: 404); rubella virus (SEQ ID NO: 406); hemagglutinin (SEQ ID NO: 408); neuraminidase (SEQ ID NO: 410); TAP1 (SEQ ID NO: 412); TAP2 (SEQ ID NO: 414); hemagglutinin epitope for class I HLA (SEQ ID NO: 416); neuraminidase epitope for class I HLA (SEQ ID NO: 418); hemagglutinin epitope for class II HLA (SEQ ID NO: 420); neuraminidase epitope for class II HLA (SEQ ID NO: 422); hemagglutinin epitope H5N1 binding class I and class II HLA (SEQ ID NO: 424); Selected from the group consisting of neuraminidase epitope H5N1-binding class I and class II HLA (SEQ ID NO: 426).

態様166.態様164の方法であって、融合タンパク質がPE1、PE2、またはPE3のアミノ酸配列を含む。 Aspect 166. Embodiment 164. The method of embodiment 164, wherein the fusion protein comprises the amino acid sequence of PE1, PE2, or PE3.

態様167.態様164の方法であって、napDNAbpがCas9ニッカーゼ(nCas9)である。 Aspect 167. Embodiment 164. The method of embodiment 164, wherein napDNAbp is Cas9 nickase (nCas9).

態様168.態様164の方法であって、napDNAbpが、配列番号18~88、126、130、137、141、147、153、157、445、460、467、および482~487のアミノ酸配列を含む。 Mode 168. Embodiment 164, wherein the napDNAbp comprises the amino acid sequences of SEQ ID NOs: 18-88, 126, 130, 137, 141, 147, 153, 157, 445, 460, 467, and 482-487.

態様169.態様164の方法であって、ガイドRNAが配列番号222を含む。 Mode 169. 165. The method of embodiment 164, wherein the guide RNA comprises SEQ ID NO: 222.

態様170.プライム編集によって、標的ヌクレオチド配列によってコードされる目当てのタンパク質上に低分子二量体化ドメインを組み入れる方法であって、方法が:(a)標的ヌクレオチド配列を(i)核酸プログラム型DNA結合タンパク質(napDNAbp)および逆転写酵素を含むプライム編集因子ならびに(ii)低分子二量体化ドメインをコードする編集鋳型を含むPEgRNAと接触させること;(b)免疫エピトープをコードする一本鎖DNA配列を重合すること;ならびに(c)DNA修復および/または複製プロセスによって、標的ヌクレオチド配列における対応する内生鎖の代わりに一本鎖DNA配列を組み込むことを含み、方法が、目当てのタンパク質と低分子二量体化ドメインとを含む融合タンパク質をコードする組み換え標的ヌクレオチド配列を生ずる。 Mode 170. A method of incorporating a small molecule dimerization domain onto a protein of interest encoded by a target nucleotide sequence by prime editing, the method comprising: (a) converting the target nucleotide sequence into (i) a nucleic acid programmed DNA binding protein ( (b) polymerizing a single-stranded DNA sequence encoding an immune epitope; and (c) incorporating a single-stranded DNA sequence in place of the corresponding endogenous strand in the target nucleotide sequence by a DNA repair and/or replication process, the method comprising: A recombinant target nucleotide sequence is generated that encodes a fusion protein comprising an integration domain.

態様171.態様170の方法であって、さらに、目当ての第2のタンパク質に対して方法を行うことを含む。 Embodiment 171. The method of embodiment 170, further comprising performing the method on a second protein of interest.

態様172.態様171の方法であって、目当ての第1のタンパク質および目当ての第2のタンパク質が、前記タンパク質の夫々の二量体化ドメインに結合する低分子の存在下において二量体化する。 Aspect 172. Embodiment 171 The method of embodiment 171, wherein the first protein of interest and the second protein of interest dimerize in the presence of a small molecule that binds to a respective dimerization domain of the proteins.

態様173.態様170の方法であって、低分子結合ドメインが配列番号488のFKBP12である。 Embodiment 173. The method of embodiment 170, wherein the small molecule binding domain is FKBP12 of SEQ ID NO:488.

態様174.態様170の方法であって、低分子結合ドメインが配列番号489のFKBP12-F36Vである。 Aspect 174. Embodiment 170, wherein the small molecule binding domain is FKBP12-F36V of SEQ ID NO: 489.

態様175.態様170の方法であって、低分子結合ドメインが配列番号490および493~494のシクロフィリンである。 Aspect 175. Embodiment 170, wherein the small molecule binding domain is a cyclophilin of SEQ ID NOs: 490 and 493-494.

態様176.態様170の方法であって、低分子が、群1の態様163に開示される化合物からなる群から選択される低分子の二量体である。 Aspect 176. Embodiment 170. The method of embodiment 170, wherein the small molecule is a dimer of a small molecule selected from the group consisting of the compounds disclosed in embodiment 163 of group 1.

態様177.態様170の方法であって、融合タンパク質がPE1、PE2、またはPE3のアミノ酸配列を含む。 Aspect 177. Embodiment 170, wherein the fusion protein comprises the amino acid sequence of PE1, PE2, or PE3.

態様178.態様170の方法であって、napDNAbpがCas9ニッカーゼ(nCas9)である。 Aspect 178. Embodiment 170, wherein the napDNAbp is Cas9 nickase (nCas9).

態様179.態様170の方法であって、napDNAbpが配列番号18~88、126、130、137、141、147、153、157、445、460、467、および482~487のアミノ酸配列を含む。 Aspect 179. Embodiment 170, wherein the napDNAbp comprises the amino acid sequences of SEQ ID NOs: 18-88, 126, 130, 137, 141, 147, 153, 157, 445, 460, 467, and 482-487.

態様180.態様170の方法であって、ガイドRNAが配列番号222を含む。 Mode 180. Embodiment 170, wherein the guide RNA comprises SEQ ID NO: 222.

態様181.プライム編集を用いてタンパク質上にペプチドタグまたはエピトープを組み入れる方法であって:タンパク質をコードする標的ヌクレオチド配列を、ペプチドタグをコードする第2のヌクレオチド配列をそれに挿入するように構成されたプライム編集因子構築物と接触させて、組み換えヌクレオチド配列をもたらすことを含み、その結果、ペプチドタグおよびタンパク質が融合タンパク質として組み換えヌクレオチド配列から発現される。 Mode 181. A method of incorporating a peptide tag or epitope onto a protein using prime editing, comprising: a prime editing agent configured to insert into a target nucleotide sequence encoding a protein a second nucleotide sequence encoding a peptide tag; contacting the recombinant nucleotide sequence with a construct so that the peptide tag and protein are expressed from the recombinant nucleotide sequence as a fusion protein.

態様182.態様181の方法であって、ペプチドタグがタンパク質の精製および/または検出に用いられる。 Embodiment 182. The method of embodiment 181, wherein the peptide tag is used for purifying and/or detecting the protein.

態様183.態様181の方法であって、ペプチドタグが、ポリヒスチジン(例えば、HHHHHH)(配列番号252~262)、FLAG(例えば、DYKDDDDK)(配列番号2)、V5(例えば、GKPIPNPLLGLDST)(配列番号3)、GCN4、HA(例えば、YPYDVPDYA)(配列番号5)、Myc(例えばEQKLISEED)(配列番号6)、GSTなどである。 Aspect 183. 182. The method of embodiment 181, wherein the peptide tag is polyhistidine (e.g., HHHHHH) (SEQ ID NO: 252-262), FLAG (e.g., DYKDDDDK) (SEQ ID NO: 2), V5 (e.g., GKPIPNPLLGLLDST) (SEQ ID NO: 3). , GCN4, HA (eg, YPYDVPDYA) (SEQ ID NO: 5), Myc (eg, EQKLISEED) (SEQ ID NO: 6), GST, and the like.

態様184.態様181の方法であって、ペプチドタグが、配列番号1~6、245~249、252~262、264~273、275~276、281、278~288、および622からなる群から選択されるアミノ酸配列を有する。 Mode 184. 182. The method of embodiment 181, wherein the peptide tag is an amino acid selected from the group consisting of SEQ ID NOs: 1-6, 245-249, 252-262, 264-273, 275-276, 281, 278-288, and 622. It has an array.

態様185.態様181の方法であって、ペプチドタグがリンカーによってタンパク質に融合される。 Mode 185. 182. The method of embodiment 181, wherein the peptide tag is fused to the protein by a linker.

態様186.態様181の方法であって、融合タンパク質が次の構造を有し:[タンパク質]-[ペプチドタグ]または[ペプチドタグ]-[タンパク質]、「]-[」が任意のリンカーを表す。 Embodiment 186. The method of embodiment 181, wherein the fusion protein has the following structure: [protein]-[peptide tag] or [peptide tag]-[protein], where "]-[" represents an optional linker.

態様187.態様181の方法であって、リンカーが配列番号127、165~176、446、453、および767~769のアミノ酸配列を有する。 Mode 187. The method of embodiment 181, wherein the linker has the amino acid sequence of SEQ ID NOs: 127, 165-176, 446, 453, and 767-769.

態様188.態様181の方法であって、プライム編集因子構築物が、配列番号101~104、181~183、223~244、277、325~334、336、338、340、342、344、346、348、350、352、354、356、358、360、362、364、366、368、499~505、735~761、776~777のヌクレオチド配列を含むPEgRNAを含む。 Embodiment 188. The method of embodiment 181, wherein the prime editor construct comprises a PEgRNA comprising a nucleotide sequence of SEQ ID NOs: 101-104, 181-183, 223-244, 277, 325-334, 336, 338, 340, 342, 344, 346, 348, 350, 352, 354, 356, 358, 360, 362, 364, 366, 368, 499-505, 735-761, 776-777.

態様189.態様181の方法であって、PEgRNAがスペーサー、gRNAコア、および伸長アームを含み、スペーサーが標的ヌクレオチド配列に対して相補的であり、伸長アームがペプチドタグをコードする逆転写酵素鋳型を含む。 Embodiment 189. The method of embodiment 181, wherein the PEGRNA comprises a spacer, a gRNA core, and an extension arm, the spacer being complementary to a target nucleotide sequence, and the extension arm comprises a reverse transcriptase template encoding a peptide tag.

態様190.態様181の方法であって、PEgRNAがスペーサー、gRNAコア、および伸長アームを含み、スペーサーが標的ヌクレオチド配列に対して相補的であり、伸長アームがペプチドタグをコードする逆転写酵素鋳型を含む。 Mode 190. 182. The method of embodiment 181, wherein the PEgRNA comprises a spacer, a gRNA core, and an extended arm, the spacer being complementary to a target nucleotide sequence, and the extended arm comprising a reverse transcriptase template encoding a peptide tag.

態様191.プライム編集によって標的ヌクレオチド配列によってコードされるPRNP上に1つ以上の防護性変異を組み入れることによって、プリオン病を防止またはその進行を停止させる方法であって、方法が:(a)標的ヌクレオチド配列を(i)核酸プログラム型DNA結合タンパク質(napDNAbp)および逆転写酵素を含むプライム編集因子ならびに(ii)機能部分をコードする編集鋳型を含むPEgRNAと接触させること;(b)防護性変異をコードする一本鎖DNA配列を重合すること;ならびに(c)DNA修復および/または複製プロセスによって、標的ヌクレオチド配列における対応する内生鎖の代わりに一本鎖DNA配列を組み込むことを含み、方法が、ミスフォールディングに対して耐性である防護性変異を含むPRNPをコードする組み換え標的ヌクレオチド配列を生ずる。 Aspect 191. A method of preventing or halting the progression of a prion disease by incorporating one or more protective mutations on a PRNP encoded by a target nucleotide sequence by prime editing, the method comprising: (a) (i) a prime editing factor comprising a nucleic acid programmed DNA binding protein (napDNAbp) and a reverse transcriptase; and (ii) a PEgRNA comprising an editing template encoding a functional moiety; (b) a prime editing factor comprising a nucleic acid programmed DNA binding protein (napDNAbp) and a reverse transcriptase; polymerizing the single-stranded DNA sequence; and (c) incorporating the single-stranded DNA sequence in place of the corresponding endogenous strand in the target nucleotide sequence by a DNA repair and/or replication process, the method comprising: A recombinant target nucleotide sequence is generated that encodes a PRNP containing a protective mutation that is resistant to.

態様192.態様191の方法であって、プリオン病がヒトプリオン病である。 Mode 192. 192. The method of embodiment 191, wherein the prion disease is a human prion disease.

態様193.態様191の方法であって、プリオン病が動物プリオン病である。 Aspect 193. Embodiment 191, wherein the prion disease is an animal prion disease.

態様194.態様192の方法であって、プリオン病が、クロイツフェルト・ヤコブ病(CJD)、変異型クロイツフェルト・ヤコブ病(vCJD)、ゲルストマン・ストロイスラー・シャインカー症候群、致死性家族性不眠症、またはクールー病である。 Aspect 194. The method of aspect 192, wherein the prion disease is Creutzfeldt-Jakob disease (CJD), variant Creutzfeldt-Jakob disease (vCJD), Gerstmann-Straussler-Scheinker syndrome, fatal familial insomnia, or kuru.

態様195.態様193の方法であって、プリオン病が、牛海綿状脳症(BSEまたは「狂牛病」)、慢性消耗病(CWD)、スクレイピー、伝達性ミンク脳症、ネコ海綿状脳症、および有蹄類海綿状脳症である。 Mode 195. Embodiment 193, wherein the prion disease is bovine spongiform encephalopathy (BSE or "mad cow disease"), chronic wasting disease (CWD), scrapie, transmissible mink encephalopathy, feline spongiform encephalopathy, and ungulate sponges. It is a shape encephalopathy.

態様196.態様191の方法であって、野生型PRNPアミノ酸配列が配列番号291~292である。 Aspect 196. The method of embodiment 191, wherein the wild type PRNP amino acid sequence is SEQ ID NO: 291-292.

態様197.態様191の方法であって、方法が、配列番号293~309および311~323からなる群から選択される改変されたPRNPアミノ酸配列をもたらし、前記改変されたPRNPタンパク質がミスフォールディングに対して耐性である。 Embodiment 197. The method of embodiment 191, wherein the method results in a modified PRNP amino acid sequence selected from the group consisting of SEQ ID NOs: 293-309 and 311-323, and the modified PRNP protein is resistant to misfolding.

態様198.態様191の方法であって、融合タンパク質がPE1、PE2、またはPE3のアミノ酸配列を含む。 Mode 198. 192. The method of embodiment 191, wherein the fusion protein comprises the amino acid sequence of PE1, PE2, or PE3.

態様199.態様191の方法であって、napDNAbpがCas9ニッカーゼ(nCas9)である。 Mode 199. 192. The method of embodiment 191, wherein napDNAbp is Cas9 nickase (nCas9).

態様200.態様191の方法であって、napDNAbpが、配列番号18~88、126、130、137、141、147、153、157、445、460、467、および482~487のアミノ酸配列を含む。 Mode 200. The method of embodiment 191, wherein napDNAbp comprises the amino acid sequences of SEQ ID NOs: 18-88, 126, 130, 137, 141, 147, 153, 157, 445, 460, 467, and 482-487.

態様201.態様191の方法であって、ガイドRNAが配列番号222を含む。 Mode 201. 192. The method of embodiment 191, wherein the guide RNA comprises SEQ ID NO: 222.

態様202.プライム編集によって、標的ヌクレオチド配列によってコードされる目当てのRNA上にリボヌクレオチドモチーフまたはタグを組み入れる方法であって、方法が:(a)標的ヌクレオチド配列を(i)核酸プログラム型DNA結合タンパク質(napDNAbp)および逆転写酵素を含むプライム編集因子ならびに(ii)リボヌクレオチドモチーフまたはタグをコードする編集鋳型を含むPEgRNAと接触させること;(b)リボヌクレオチドモチーフまたはタグをコードする一本鎖DNA配列を重合すること;ならびに(c)DNA修復および/または複製プロセスによって、標的ヌクレオチド配列における対応する内生鎖の代わりに一本鎖DNA配列を組み込むことを含み、方法が、リボヌクレオチドモチーフまたはタグを含む目当ての修飾されたRNAをコードする組み換え標的ヌクレオチド配列を生ずる。 Embodiment 202. A method for incorporating a ribonucleotide motif or tag on a desired RNA encoded by a target nucleotide sequence by prime editing, the method comprising: (a) contacting the target nucleotide sequence with (i) a prime editing factor comprising a nucleic acid programmable DNA binding protein (napDNAbp) and a reverse transcriptase, and (ii) a PEgRNA comprising an editing template encoding the ribonucleotide motif or tag; (b) polymerizing a single-stranded DNA sequence encoding the ribonucleotide motif or tag; and (c) incorporating the single-stranded DNA sequence in place of the corresponding endogenous strand in the target nucleotide sequence by DNA repair and/or replication processes, the method producing a recombinant target nucleotide sequence encoding a modified RNA of interest comprising the ribonucleotide motif or tag.

態様203.態様202の方法であって、リボヌクレオチドモチーフまたはタグが検出部分である。 Embodiment 203. The method of embodiment 202, wherein the ribonucleotide motif or tag is the detection moiety.

態様204.態様202の方法であって、リボヌクレオチドモチーフまたはタグが目当てのRNAの発現レベルに影響する。 Mode 204. Embodiment 202. The method of embodiment 202, wherein the ribonucleotide motif or tag affects the expression level of the RNA of interest.

態様205.態様202の方法であって、リボヌクレオチドモチーフまたはタグが目当てのRNAの輸送または細胞下レベル位置付けに影響する。 Mode 205. Embodiment 202 The method of embodiment 202, wherein the ribonucleotide motif or tag affects the trafficking or subcellular localization of the RNA of interest.

態様206.態様202の方法であって、リボヌクレオチドモチーフまたはタグが、SV40 1型、SV40 2型、SV40 3型、hGH、BGH、rbGlob、TK、MALAT1 ENE-mascRNA、KSHV PAN ENE、Smbox/U1 snRNAボックス、U1 snRNA 3'ボックス、tRNA-リジン、broccoliアプタマー、spinachアプタマー、mangoアプタマー、HDVリボザイム、およびm6Aからなる群から選択される。 Embodiment 206. The method of embodiment 202, wherein the ribonucleotide motif or tag is selected from the group consisting of SV40 type 1, SV40 type 2, SV40 type 3, hGH, BGH, rbGlob, TK, MALAT1 ENE-mascRNA, KSHV PAN ENE, Smbox/U1 snRNA box, U1 snRNA 3' box, tRNA-lysine, broccoli aptamer, spinach aptamer, mango aptamer, HDV ribozyme, and m6A.

態様207.態様202の方法であって、PEgRNAが、配列番号101~104、181~183、223~244、277、325~334、336、338、340、342、344、346、348、350、352、354、356、358、360、362、364、366、368、499~505、735~761、776~777を含む。 Mode 207. Embodiment 202, wherein the PEgRNA is SEQ ID NO: 101-104, 181-183, 223-244, 277, 325-334, 336, 338, 340, 342, 344, 346, 348, 350, 352, 354 , 356, 358, 360, 362, 364, 366, 368, 499-505, 735-761, 776-777.

態様208.態様202の方法であって、融合タンパク質がPE1、PE2、またはPE3のアミノ酸配列を含む。 Mode 208. Embodiment 202, wherein the fusion protein comprises the amino acid sequence of PE1, PE2, or PE3.

態様209.態様202の方法であって、napDNAbpがCas9ニッカーゼ(nCas9)である。 Mode 209. Embodiment 202, wherein the napDNAbp is Cas9 nickase (nCas9).

態様210.態様202の方法であって、napDNAbpが、配列番号18~88、126、130、137、141、147、153、157、445、460、467、および482~487のアミノ酸配列を含む。 Mode 210. Embodiment 202, wherein the napDNAbp comprises the amino acid sequences of SEQ ID NOs: 18-88, 126, 130, 137, 141, 147, 153, 157, 445, 460, 467, and 482-487.

態様211.プライム編集によって、標的ヌクレオチド配列によってコードされる目当てのタンパク質上の機能部分を組み入れまたは欠失する方法であって、方法が:(a)標的ヌクレオチド配列を(i)核酸プログラム型DNA結合タンパク質(napDNAbp)および逆転写酵素を含むプライム編集因子ならびに(ii)機能部分またはその欠失をコードする編集鋳型を含むPEgRNAと接触させること;(b)機能部分またはその欠失をコードする一本鎖DNA配列を重合すること;ならびに(c)DNA修復および/または複製プロセスによって、標的ヌクレオチド配列における対応する内生鎖の代わりに一本鎖DNA配列を組み込むことを含み、方法が、目当てのタンパク質および機能部分またはその除去を含む改変されたタンパク質をコードする組み換え標的ヌクレオチド配列を生じ、機能部分がタンパク質の修飾状態または局在状態を変改する。 Mode 211. A method of incorporating or deleting a functional moiety on a protein of interest encoded by a target nucleotide sequence by prime editing, the method comprising: (a) converting the target nucleotide sequence into (i) a nucleic acid programmed DNA binding protein (napDNAbp); ) and a prime editing factor comprising reverse transcriptase and (ii) a PEgRNA comprising an editing template encoding the functional moiety or its deletion; (b) a single-stranded DNA sequence encoding the functional moiety or its deletion; and (c) incorporating a single-stranded DNA sequence in place of the corresponding endogenous strand in the target nucleotide sequence by a DNA repair and/or replication process, the method comprising or a deletion thereof, resulting in a recombinant target nucleotide sequence encoding a modified protein, wherein the functional moiety alters the modification state or localization state of the protein.

態様212.態様211の方法であって、機能部分が、目当てのタンパク質のリン酸化、ユビキチン化、グリコシル化、脂質修飾、ヒドロキシル化、メチル化、アセチル化、クロトニル化、SUMO化状態を変改する。 Embodiment 212. The method of embodiment 211, wherein the functional moiety alters the phosphorylation, ubiquitination, glycosylation, lipid modification, hydroxylation, methylation, acetylation, crotonylation, or sumoylation status of the protein of interest.

態様213.融合タンパク質であって、核酸プログラム型DNA結合タンパク質(napDNAbp)とポリメラーゼとを含む。 Embodiment 213. A fusion protein comprising a nucleic acid programmable DNA binding protein (napDNAbp) and a polymerase.

態様214.態様213の融合タンパク質であって、融合タンパク質が、プライム編集ガイドRNA(PEgRNA)の存在下においてプライム編集を実行することができる。 Mode 214. The fusion protein of embodiment 213, wherein the fusion protein is capable of performing prime editing in the presence of a prime editing guide RNA (PEgRNA).

態様215.態様213の融合タンパク質であって、napDNAbpがニッカーゼ活性を有する。 Mode 215. The fusion protein of embodiment 213, wherein napDNAbp has nickase activity.

態様216.態様213の融合タンパク質であって、napDNAbpがCas9タンパク質またはそのバリアントである。 Mode 216. The fusion protein of embodiment 213, wherein napDNAbp is a Cas9 protein or a variant thereof.

態様217.態様213の融合タンパク質であって、napDNAbpがヌクレアーゼ活性Cas9、ヌクレアーゼ不活性型Cas9(dCas9)、またはCas9ニッカーゼ(nCas9)である。 Mode 217. The fusion protein of embodiment 213, wherein napDNAbp is nuclease-active Cas9, nuclease-inactive Cas9 (dCas9), or Cas9 nickase (nCas9).

態様218.態様213の融合タンパク質であって、napDNAbpがCas9ニッカーゼ(nCas9)である。 Mode 218. The fusion protein of embodiment 213, wherein napDNAbp is Cas9 nickase (nCas9).

態様219.態様213の融合タンパク質であって、napDNAbpが:Cas9、Cas12e、Cas12d、Cas12a、Cas12b1、Cas13a、Cas12c、およびアルゴノートからなる群から選択され、任意にニッカーゼ活性を有する。 Mode 219. The fusion protein of embodiment 213, wherein napDNAbp is selected from the group consisting of: Cas9, Cas12e, Cas12d, Cas12a, Cas12b1, Cas13a, Cas12c, and Argonaute, and optionally has nickase activity.

態様220.態様213の融合タンパク質であって、融合タンパク質がPEgRNAと複合体化したときに標的DNA配列に結合することができる。 Mode 220. The fusion protein of embodiment 213, wherein the fusion protein is capable of binding to a target DNA sequence when complexed with PEgRNA.

態様221.態様220の融合タンパク質であって、標的DNA配列が標的鎖および相補的な非標的鎖を含む。 Mode 221. The fusion protein of embodiment 220, wherein the target DNA sequence comprises a target strand and a complementary non-target strand.

態様222.態様220の融合タンパク質であって、PEgRNAと複合体化した融合タンパク質の結合がRループを形成する。 Mode 222. The fusion protein of embodiment 220, wherein the binding of the fusion protein complexed to PEgRNA forms an R-loop.

態様223.態様222の融合タンパク質であって、Rループが、(i)PEgRNAと標的鎖とを含むRNA-DNAハイブリッドおよび(ii)相補的な非標的鎖を含む。 Embodiment 223. The fusion protein of embodiment 222, wherein the R-loop comprises (i) an RNA-DNA hybrid comprising the PEgRNA and a target strand and (ii) a complementary non-target strand.

態様224.態様223の融合タンパク質であって、相補的な非標的鎖がニッキングされて、遊離の3'端を有するプライム配列を形成する。 Mode 224. The fusion protein of embodiment 223, wherein the complementary non-target strand is nicked to form a prime sequence with a free 3' end.

態様225.態様214の融合タンパク質であって、PEgRNAが、(a)ガイドRNAと、(b)ガイドRNAの5'もしくは3’端またはガイドRNAの分子内の位置付けにおける伸長アームとを含む。 Mode 225. The fusion protein of embodiment 214, wherein the PEgRNA comprises (a) a guide RNA and (b) an extended arm at the 5' or 3' end of the guide RNA or at an intramolecular location of the guide RNA.

態様226.態様225の融合タンパク質であって、伸長アームが(i)所望のヌクレオチド変化を含むDNA合成鋳型配列および(ii)プライマー結合部位を含む。 Mode 226. The fusion protein of embodiment 225, wherein the extended arm comprises (i) a DNA synthesis template sequence containing a desired nucleotide change and (ii) a primer binding site.

態様227.態様226の融合タンパク質であって、DNA合成鋳型配列が、ニック部位に隣接する内生DNA配列に対して相補的である一本鎖DNAフラップをコードし、一本鎖DNAフラップが所望のヌクレオチド変化を含む。 Embodiment 227. The fusion protein of embodiment 226, wherein the DNA synthesis template sequence encodes a single-stranded DNA flap that is complementary to the endogenous DNA sequence adjacent to the nick site, and the single-stranded DNA flap contains the desired nucleotide change.

態様228.態様225の融合タンパク質であって、伸長アームが、長さが少なくとも5ヌクレオチド、少なくとも6ヌクレオチド、少なくとも7ヌクレオチド、少なくとも8ヌクレオチド、少なくとも9ヌクレオチド、少なくとも10ヌクレオチド、少なくとも11ヌクレオチド、少なくとも12ヌクレオチド、少なくとも13ヌクレオチド、少なくとも14ヌクレオチド、少なくとも15ヌクレオチド、少なくとも16ヌクレオチド、少なくとも17ヌクレオチド、少なくとも18ヌクレオチド、少なくとも19ヌクレオチド、少なくとも20ヌクレオチド、少なくとも21ヌクレオチド、少なくとも22ヌクレオチド、少なくとも23ヌクレオチド、少なくとも24ヌクレオチド、または少なくとも25ヌクレオチドである。 Mode 228. Embodiment 225, wherein the elongated arm is at least 5 nucleotides, at least 6 nucleotides, at least 7 nucleotides, at least 8 nucleotides, at least 9 nucleotides, at least 10 nucleotides, at least 11 nucleotides, at least 12 nucleotides, at least 13 nucleotides in length. nucleotides, at least 14 nucleotides, at least 15 nucleotides, at least 16 nucleotides, at least 17 nucleotides, at least 18 nucleotides, at least 19 nucleotides, at least 20 nucleotides, at least 21 nucleotides, at least 22 nucleotides, at least 23 nucleotides, at least 24 nucleotides, or at least 25 nucleotides It is.

態様229.態様227の融合タンパク質であって、一本鎖DNAフラップが、ニック部位に隣接する内生DNA配列にハイブリダイズし、それによって所望のヌクレオチド変化を組み入れる。 Mode 229. The fusion protein of embodiment 227, wherein the single-stranded DNA flap hybridizes to the endogenous DNA sequence adjacent to the nick site, thereby incorporating the desired nucleotide change.

態様230.態様227の融合タンパク質であって、一本鎖DNAフラップが、遊離の5'端を有しかつニック部位に隣接する内生DNA配列に取って代わる。 Mode 230. The fusion protein of embodiment 227, wherein the single-stranded DNA flap replaces the endogenous DNA sequence with a free 5' end and adjacent to the nick site.

態様231.態様230の融合タンパク質であって、5'端を有する内生DNA配列が細胞によって切除される。 Aspect 231. The fusion protein of embodiment 230, wherein the endogenous DNA sequence having a 5' end is excised by the cell.

態様232.態様230の融合タンパク質であって、一本鎖DNAフラップの細胞性修復が所望のヌクレオチド変化の組み入れをもたらし、それによって所望の産物を形成する。 Mode 232. The fusion protein of embodiment 230, wherein cellular repair of the single-stranded DNA flap results in the incorporation of the desired nucleotide change, thereby forming the desired product.

態様233.態様226の融合タンパク質であって、所望のヌクレオチド変化がPAM配列の約-4から+10の間もしくはPAM配列の約-10から+20の間もしくはPAM配列の約-20から+40の間もしくはPAM配列の約-30から+100の間である編集窓上に組み入れされるか、または所望のヌクレオチド変化がニック部位の少なくとも1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、もしくは100ヌクレオチド下流に組み入れされる。 Aspect 233. The fusion protein of embodiment 226, wherein the desired nucleotide change is between about -4 and +10 of the PAM sequence, or between about -10 and +20 of the PAM sequence, or between about -20 and +40 of the PAM sequence, or The desired nucleotide change is incorporated on an editing window that is between approximately -30 and +100 of the PAM sequence, or the desired nucleotide change is at least 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, Incorporates 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99, or 100 nucleotides downstream.

態様234.態様213の融合タンパク質であって、napDNAbpが、配列番号18のアミノ酸配列、または配列番号18のアミノ酸配列との少なくとも80%、85%、90%、95%、98%、もしくは99%配列同一性を有するアミノ酸配列を含む。 Aspect 234. The fusion protein of embodiment 213, wherein napDNAbp is the amino acid sequence of SEQ ID NO: 18 , or at least 80%, 85%, 90%, 95%, 98%, or 99% sequence identity with the amino acid sequence of SEQ ID NO: 18. It contains an amino acid sequence having the following.

態様235.態様213の融合タンパク質であって、napDNAbpが、配列番号18~88、126、130、137、141、147、153、157、445、460、467、および482~487のいずれか1つのアミノ酸配列との少なくとも80%、85%、90%、95%、98%、または99%配列同一性を有するアミノ酸配列を含む。 Mode 235. The fusion protein of embodiment 213, wherein napDNAbp is an amino acid sequence of any one of SEQ ID NOs: 18-88, 126, 130, 137, 141, 147, 153, 157, 445, 460, 467, and 482-487. amino acid sequences having at least 80%, 85%, 90%, 95%, 98%, or 99% sequence identity.

態様236.態様213の融合タンパク質であって、ポリメラーゼが逆転写酵素であり、配列番号89~100、105~122、128~129、132、139、143、149、154、159、235、454、471、516、662、700、701~716、739~741、および766のアミノ酸配列のいずれか1つを含む。 Aspect 236. The fusion protein of embodiment 213, wherein the polymerase is reverse transcriptase, SEQ ID NOs: 89-100, 105-122, 128-129, 132, 139, 143, 149, 154, 159, 235, 454, 471, 516 , 662, 700, 701-716, 739-741, and 766.

態様237.態様213の融合タンパク質であって、ポリメラーゼが逆転写酵素であり、配列番号89~100、105~122、128~129、132、139、143、149、154、159、235、454、471、516、662、700、701~716、739~741、および766のいずれか1つのアミノ酸配列との少なくとも80%、85%、90%、95%、98%、または99%配列同一性を有するアミノ酸配列を含む。 Aspect 237. The fusion protein of embodiment 213, wherein the polymerase is reverse transcriptase, SEQ ID NOs: 89-100, 105-122, 128-129, 132, 139, 143, 149, 154, 159, 235, 454, 471, 516 , 662, 700, 701-716, 739-741, and 766. including.

態様238.態様213の融合タンパク質であって、ポリメラーゼがレトロウイルスまたはレトロトランスポゾンからの天然に存在する逆転写酵素である。 Mode 238. The fusion protein of embodiment 213, wherein the polymerase is a naturally occurring reverse transcriptase from a retrovirus or retrotransposon.

態様239.先の態様のいずれか1つの融合タンパク質であって、融合タンパク質が構造NH2-[napDNAbp]-[ポリメラーゼ]-COOH;またはNH2-[ポリメラーゼ]-[napDNAbp]-COOHを含み、「]-[」の夫々のものが任意のリンカー配列の存在を指示する。 Mode 239. The fusion protein of any one of the preceding embodiments, wherein the fusion protein comprises the structure NH2-[napDNAbp]-[polymerase]-COOH; or NH2-[polymerase]-[napDNAbp]-COOH; each of which indicates the presence of an optional linker sequence.

態様240.態様239の融合タンパク質であって、リンカー配列が配列番号127、165~176、446、453、および767~769のアミノ酸配列を含む。 Mode 240. The fusion protein of embodiment 239, wherein the linker sequence comprises the amino acid sequences of SEQ ID NOs: 127, 165-176, 446, 453, and 767-769.

態様241.態様226の融合タンパク質であって、所望のヌクレオチド変化が1ヌクレオチド変化、1つ以上のヌクレオチドの挿入、または1つ以上のヌクレオチドの欠失である。 Aspect 241. The fusion protein of embodiment 226, wherein the desired nucleotide change is a single nucleotide change, an insertion of one or more nucleotides, or a deletion of one or more nucleotides.

態様242.態様241の融合タンパク質であって、挿入または欠失が、少なくとも1、少なくとも2、少なくとも3、少なくとも4、少なくとも5、少なくとも6、少なくとも7、少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも16、少なくとも17、少なくとも18、少なくとも19、少なくとも20、少なくとも21、少なくとも22、少なくとも23、少なくとも24、少なくとも25、少なくとも26、少なくとも27、少なくとも28、少なくとも29、少なくとも30、少なくとも31、少なくとも32、少なくとも33、少なくとも34、少なくとも35、少なくとも36、少なくとも37、少なくとも38、少なくとも39、少なくとも40、少なくとも41、少なくとも42、少なくとも43、少なくとも44、少なくとも45、少なくとも46、少なくとも47、少なくとも48、少なくとも49、または少なくとも50である。 Mode 242. The fusion protein of embodiment 241, wherein the insertion or deletion is at least 1, at least 2, at least 3, at least 4, at least 5, at least 6, at least 7, at least 8, at least 9, at least 10, at least 11, at least 12 , at least 13, at least 14, at least 15, at least 16, at least 17, at least 18, at least 19, at least 20, at least 21, at least 22, at least 23, at least 24, at least 25, at least 26, at least 27, at least 28, at least 29, at least 30, at least 31, at least 32, at least 33, at least 34, at least 35, at least 36, at least 37, at least 38, at least 39, at least 40, at least 41, at least 42, at least 43, at least 44, at least 45, At least 46, at least 47, at least 48, at least 49, or at least 50.

態様243.ガイドRNAとDNA合成鋳型を含む少なくとも1つの核酸伸長アームとを含むPEgRNA。 Aspect 243. PEgRNA comprising a guide RNA and at least one nucleic acid extension arm comprising a DNA synthesis template.

態様244.態様241のPEgRNAであって、核酸伸長アームがガイドRNAの3'もしくは5'端またはガイドRNAの分子内の位置の位置であり、核酸伸長アームがDNAまたはRNAである。 Mode 244. The PEgRNA of embodiment 241, wherein the nucleic acid extension arm is located at the 3' or 5' end of the guide RNA or a position within the molecule of the guide RNA, and the nucleic acid extension arm is DNA or RNA.

態様245.態様242のPEgRNAであって、PEgRNAが、napDNAbpに結合することおよびnapDNAbpを標的DNA配列へと導くことができる。 Mode 245. The PEgRNA of embodiment 242, wherein the PEgRNA is capable of binding napDNAbp and directing napDNAbp to a target DNA sequence.

態様246.態様245のPEgRNAであって、標的DNA配列が標的鎖および相補的な非標的鎖を含み、ガイドRNAが標的鎖にハイブリダイズして、RNA-DNAハイブリッドおよびRループを形成する。 Mode 246. The PEgRNA of embodiment 245, wherein the target DNA sequence comprises a target strand and a complementary non-target strand, and the guide RNA hybridizes to the target strand to form an RNA-DNA hybrid and an R-loop.

態様247.態様243のPEgRNAであって、少なくとも1つの核酸伸長アームが(i)DNA合成鋳型および(ii)プライマー結合部位を含む。 Aspect 247. The PEgRNA of embodiment 243, wherein at least one nucleic acid extension arm comprises (i) a DNA synthesis template and (ii) a primer binding site.

態様248.態様247のPEgRNAであって、核酸伸長アームが、長さが少なくとも5ヌクレオチド、少なくとも6ヌクレオチド、少なくとも7ヌクレオチド、少なくとも8ヌクレオチド、少なくとも9ヌクレオチド、少なくとも10ヌクレオチド、少なくとも11ヌクレオチド、少なくとも12ヌクレオチド、少なくとも13ヌクレオチド、少なくとも14ヌクレオチド、少なくとも15ヌクレオチド、少なくとも16ヌクレオチド、少なくとも17ヌクレオチド、少なくとも18ヌクレオチド、少なくとも19ヌクレオチド、少なくとも20ヌクレオチド、少なくとも21ヌクレオチド、少なくとも22ヌクレオチド、少なくとも23ヌクレオチド、少なくとも24ヌクレオチド、または少なくとも25ヌクレオチドである。 Mode 248. The PEgRNA of embodiment 247, wherein the nucleic acid extended arm is at least 5 nucleotides, at least 6 nucleotides, at least 7 nucleotides, at least 8 nucleotides, at least 9 nucleotides, at least 10 nucleotides, at least 11 nucleotides, at least 12 nucleotides, at least 13 nucleotides in length. nucleotides, at least 14 nucleotides, at least 15 nucleotides, at least 16 nucleotides, at least 17 nucleotides, at least 18 nucleotides, at least 19 nucleotides, at least 20 nucleotides, at least 21 nucleotides, at least 22 nucleotides, at least 23 nucleotides, at least 24 nucleotides, or at least 25 nucleotides It is.

態様249.態様247のPEgRNAであって、DNA合成鋳型が、長さが少なくとも3ヌクレオチド、少なくとも4ヌクレオチド、少なくとも5ヌクレオチド、少なくとも6ヌクレオチド、少なくとも7ヌクレオチド、少なくとも8ヌクレオチド、少なくとも9ヌクレオチド、少なくとも10ヌクレオチド、少なくとも11ヌクレオチド、少なくとも12ヌクレオチド、少なくとも13ヌクレオチド、少なくとも14ヌクレオチド、または少なくとも15ヌクレオチドである。 Mode 249. The PEgRNA of embodiment 247, wherein the DNA synthesis template is at least 3 nucleotides, at least 4 nucleotides, at least 5 nucleotides, at least 6 nucleotides, at least 7 nucleotides, at least 8 nucleotides, at least 9 nucleotides, at least 10 nucleotides, at least 11 nucleotides in length. nucleotides, at least 12 nucleotides, at least 13 nucleotides, at least 14 nucleotides, or at least 15 nucleotides.

態様250.態様247のPEgRNAであって、プライマー結合部位が、長さが少なくとも3ヌクレオチド、少なくとも4ヌクレオチド、少なくとも5ヌクレオチド、少なくとも6ヌクレオチド、少なくとも7ヌクレオチド、少なくとも8ヌクレオチド、少なくとも9ヌクレオチド、少なくとも10ヌクレオチド、少なくとも11ヌクレオチド、少なくとも12ヌクレオチド、少なくとも13ヌクレオチド、少なくとも14ヌクレオチド、または少なくとも15ヌクレオチドである。 Mode 250. The PEgRNA of embodiment 247, wherein the primer binding site is at least 3 nucleotides, at least 4 nucleotides, at least 5 nucleotides, at least 6 nucleotides, at least 7 nucleotides, at least 8 nucleotides, at least 9 nucleotides, at least 10 nucleotides, at least 11 nucleotides in length. nucleotides, at least 12 nucleotides, at least 13 nucleotides, at least 14 nucleotides, or at least 15 nucleotides.

態様251.態様243のPEgRNAであって、さらに、リンカー、ステムループ、ヘアピン、トウループ、アプタマー、またはRNA-タンパク質動員ドメインからなる群から選択される少なくとも1つの追加の構造を含む。 Mode 251. The PEgRNA of embodiment 243 further comprises at least one additional structure selected from the group consisting of a linker, stem-loop, hairpin, toe-loop, aptamer, or RNA-protein recruitment domain.

態様252.態様247のPEgRNAであって、DNA合成鋳型が、ニック部位に隣接する内生DNA配列に対して相補的である一本鎖DNAフラップをコードし、一本鎖DNAフラップが所望のヌクレオチド変化を含む。 Mode 252. The PEgRNA of embodiment 247, wherein the DNA synthesis template encodes a single-stranded DNA flap that is complementary to an endogenous DNA sequence adjacent to the nick site, and the single-stranded DNA flap includes the desired nucleotide change. .

態様253.態様252のPEgRNAであって、一本鎖DNAフラップが、ニッキングされた標的DNA配列上の5'端を有する内生一本鎖DNAを押し除け、内生一本鎖DNAがニック部位の下流において直ちに隣接する。 Aspect 253. The PEgRNA of embodiment 252, wherein the single-stranded DNA flap displaces endogenous single-stranded DNA having a 5' end on the nicked target DNA sequence, and the endogenous single-stranded DNA is located downstream of the nick site. Immediately adjacent.

態様254.態様253のPEgRNAであって、遊離の5'端を有する内生一本鎖DNAが細胞によって切除される。 Mode 254. The PEgRNA of embodiment 253, wherein the endogenous single-stranded DNA with a free 5' end is excised by the cell.

態様255.態様253のPEgRNAであって、一本鎖DNAフラップの細胞性修復が所望のヌクレオチド変化の組み入れをもたらし、それによって所望の産物を形成する。 Mode 255. Embodiment 253 PEgRNA, wherein cellular repair of the single-stranded DNA flap results in the incorporation of the desired nucleotide change, thereby forming the desired product.

態様256.態様243のPEgRNAであって、配列番号101~104、181~183、223~244、277、325~334、336、338、340、342、344、346、348、350、352、354、356、358、360、362、364、366、368、499~505、735~761、776~777のヌクレオチド配列、または配列番号101~104、181~183、223~244、277、325~334、336、338、340、342、344、346、348、350、352、354、356、358、360、362、364、366、368、499~505、735~761、776~777のいずれか1つとの少なくとも85%もしくは少なくとも90%もしくは少なくとも95%もしくは少なくとも98%もしくは少なくとも99%配列同一性を有するヌクレオチド配列を含む。 Aspect 256. PEgRNA of embodiment 243, comprising SEQ ID NOs: 101-104, 181-183, 223-244, 277, 325-334, 336, 338, 340, 342, 344, 346, 348, 350, 352, 354, 356, 358, 360, 362, 364, 366, 368, 499-505, 735-761, 776-777 nucleotide sequence, or SEQ ID NO: 101-104, 181-183, 223-244, 277, 325-334, 336, At least one of the following nucleotide sequences having 85% or at least 90% or at least 95% or at least 98% or at least 99% sequence identity.

態様257.態様247のPEgRNAであって、DNA合成鋳型が、内生DNA標的と少なくとも80%または85%または90%または95%または99%同一であるヌクレオチド配列を含む。 Embodiment 257. The PEGRNA of embodiment 247, wherein the DNA synthesis template comprises a nucleotide sequence that is at least 80%, or 85%, or 90%, or 95%, or 99% identical to the endogenous DNA target.

態様258.態様247のPEgRNAであって、プライマー結合部位が、カットされたDNAの遊離の3'端とハイブリダイズする。 Mode 258. The PEgRNA of embodiment 247, wherein the primer binding site hybridizes to the free 3' end of the cut DNA.

態様259.態様251のPEgRNAであって、少なくとも1つの追加の構造がPEgRNAの3'または5'端に位置付けられる。 Mode 259. The PEgRNA of embodiment 251, wherein the at least one additional structure is located at the 3' or 5' end of the PEgRNA.

態様260.態様213~242のいずれか1つの融合タンパク質とPEgRNAとを含むことを含む複合体。 Mode 260. A complex comprising the fusion protein of any one of embodiments 213-242 and PEgRNA.

態様261.態様260の複合体であって、PEgRNAが、ガイドRNAと、ガイドRNAの3'もしくは5'端またはガイドRNAの分子内の位置における核酸伸長アームとを含む。 Embodiment 261. The complex of embodiment 260, wherein the PEGRNA comprises a guide RNA and a nucleic acid extension arm at the 3' or 5' end of the guide RNA or at an intramolecular position of the guide RNA.

態様262.態様260の複合体であって、PEgRNAが、napDNAbpに結合することおよびnapDNAbpを標的DNA配列へと導くことができる。 Mode 262. Embodiment 260, wherein the PEgRNA is capable of binding napDNAbp and directing napDNAbp to a target DNA sequence.

態様263.態様262の複合体であって、標的DNA配列が標的鎖および相補的な非標的鎖を含み、ガイドRNAが標的鎖にハイブリダイズして、RNA-DNAハイブリッドおよびRループを形成する。 Mode 263. Embodiment 262, wherein the target DNA sequence comprises a target strand and a complementary non-target strand, and the guide RNA hybridizes to the target strand to form an RNA-DNA hybrid and an R-loop.

態様264.態様261の複合体であって、少なくとも1つの核酸伸長アームが(i)DNA合成鋳型および(ii)プライマー結合部位を含む。 Mode 264. The complex of embodiment 261, wherein at least one nucleic acid extension arm comprises (i) a DNA synthesis template and (ii) a primer binding site.

態様265.態様260の複合体であって、PEgRNAが、配列番号101~104、181~183、223~244、277、325~334、336、338、340、342、344、346、348、350、352、354、356、358、360、362、364、366、368、499~505、735~761、776~777のヌクレオチド配列、または配列番号101~104、181~183、223~244、277、325~334、336、338、340、342、344、346、348、350、352、354、356、358、360、362、364、366、368、499~505、735~761、776~777のいずれか1つとの少なくとも85%もしくは少なくとも90%もしくは少なくとも95%もしくは少なくとも98%もしくは少なくとも99%配列同一性を有するヌクレオチド配列を含む。 Mode 265. The complex of embodiment 260, wherein the PEgRNA is SEQ ID NO: 101-104, 181-183, 223-244, 277, 325-334, 336, 338, 340, 342, 344, 346, 348, 350, 352, Nucleotide sequences of 354, 356, 358, 360, 362, 364, 366, 368, 499-505, 735-761, 776-777, or SEQ ID NO: 101-104, 181-183, 223-244, 277, 325- 334, 336, 338, 340, 342, 344, 346, 348, 350, 352, 354, 356, 358, 360, 362, 364, 366, 368, 499-505, 735-761, 776-777 nucleotide sequences having at least 85% or at least 90% or at least 95% or at least 98% or at least 99% sequence identity with one.

態様266.態様264の複合体であって、DNA合成鋳型が、内生DNA標的と少なくとも80%または85%または90%または95%または99%同一であるヌクレオチド配列を含む。 Mode 266. The conjugate of embodiment 264, wherein the DNA synthesis template comprises a nucleotide sequence that is at least 80% or 85% or 90% or 95% or 99% identical to the endogenous DNA target.

態様267.態様264の複合体であって、プライマー結合部位が、カットされたDNAの遊離の3’端とハイブリダイズする。 Mode 267. Embodiment 264. The complex of embodiment 264, wherein the primer binding site hybridizes to the free 3' end of the cut DNA.

態様268.napDNAbpおよびPEgRNAを含むことを含む複合体。 Mode 268. complex containing napDNAbp and PEgRNA.

態様269.態様268の複合体であって、napDNAbpがCas9ニッカーゼである。 Mode 269. Embodiment 268, wherein napDNAbp is Cas9 nickase.

態様270.態様268の複合体であって、napDNAbpが配列番号18のアミノ酸配列を含む。 Mode 270. Embodiment 268, wherein the napDNAbp comprises the amino acid sequence of SEQ ID NO: 18.

態様271.態様268の複合体であって、napDNAbpが、配列番号18~88、126、130、137、141、147、153、157、445、460、467、および482~487のいずれか1つのアミノ酸配列との少なくとも80%、85%、90%、95%、98%、または99%配列同一性を有するアミノ酸配列を含む。 Mode 271. Embodiment 268, wherein napDNAbp is an amino acid sequence of any one of SEQ ID NOs: 18-88, 126, 130, 137, 141, 147, 153, 157, 445, 460, 467, and 482-487. amino acid sequences having at least 80%, 85%, 90%, 95%, 98%, or 99% sequence identity.

態様272.態様268の複合体であって、PEgRNAが、ガイドRNAと、ガイドRNAの3'もしくは5'端またはガイドRNAの分子内の位置における核酸伸長アームとを含む。 Embodiment 272. The complex of embodiment 268, wherein the PEGRNA comprises a guide RNA and a nucleic acid extension arm at the 3' or 5' end of the guide RNA or at an intramolecular position of the guide RNA.

態様273.態様268の複合体であって、PEgRNAがnapDNAbpを標的DNA配列へと導くことができる。 Aspect 273. Embodiment 268. The complex of embodiment 268, wherein the PEgRNA is capable of directing napDNAbp to a target DNA sequence.

態様274.態様272の複合体であって、標的DNA配列が標的鎖および相補的な非標的鎖を含み、PEgRNAのスペーサー配列が標的鎖にハイブリダイズしてRNA-DNAハイブリッドおよびRループを形成する。 Mode 274. Embodiment 272, wherein the target DNA sequence comprises a target strand and a complementary non-target strand, and the PEgRNA spacer sequence hybridizes to the target strand to form an RNA-DNA hybrid and an R-loop.

態様275.態様273の複合体であって、核酸伸長アームが(i)DNA合成鋳型および(ii)プライマー結合部位を含む。 Mode 275. The complex of embodiment 273, wherein the nucleic acid extension arm comprises (i) a DNA synthesis template and (ii) a primer binding site.

態様276.態様269の複合体であって、PEgRNAが、配列番号101~104、181~183、223~244、277、325~334、336、338、340、342、344、346、348、350、352、354、356、358、360、362、364、366、368、499~505、735~761、776~777のヌクレオチド配列、または配列番号101~104、181~183、223~244、277、325~334、336、338、340、342、344、346、348、350、352、354、356、358、360、362、364、366、368、499~505、735~761、776~777のいずれか1つとの少なくとも85%もしくは少なくとも90%もしくは少なくとも95%もしくは少なくとも98%もしくは少なくとも99%配列同一性を有するヌクレオチド配列を含む。 Mode 276. The complex of embodiment 269, wherein the PEgRNA is SEQ ID NO: 101-104, 181-183, 223-244, 277, 325-334, 336, 338, 340, 342, 344, 346, 348, 350, 352, Nucleotide sequences of 354, 356, 358, 360, 362, 364, 366, 368, 499-505, 735-761, 776-777, or SEQ ID NO: 101-104, 181-183, 223-244, 277, 325- 334, 336, 338, 340, 342, 344, 346, 348, 350, 352, 354, 356, 358, 360, 362, 364, 366, 368, 499-505, 735-761, 776-777 nucleotide sequences having at least 85% or at least 90% or at least 95% or at least 98% or at least 99% sequence identity with one.

態様277.態様276の複合体であって、DNA合成鋳型が、内生DNA標的と少なくとも80%または85%または90%または95%または99%同一であるヌクレオチド配列を含む。 Embodiment 277. The complex of embodiment 276, wherein the DNA synthesis template comprises a nucleotide sequence that is at least 80%, or 85%, or 90%, or 95%, or 99% identical to the endogenous DNA target.

態様278.態様276の複合体であって、プライマー結合部位が、カットされたDNAの遊離の3’端とハイブリダイズする。 Mode 278. The complex of embodiment 276, wherein the primer binding site hybridizes to the free 3' end of the cut DNA.

態様279.態様276の複合体であって、PEgRNAが、さらに、リンカー、ステムループ、ヘアピン、トウループ、アプタマー、またはRNA-タンパク質動員ドメインからなる群から選択される少なくとも1つの追加の構造を含む。 Mode 279. The conjugate of embodiment 276, wherein the PEgRNA further comprises at least one additional structure selected from the group consisting of a linker, a stem-loop, a hairpin, a toe-loop, an aptamer, or an RNA-protein recruitment domain.

態様280.態様213~242のいずれかの融合タンパク質をコードするポリヌクレオチド。 Mode 280. A polynucleotide encoding the fusion protein of any of embodiments 213-242.

態様281.態様280のポリヌクレオチドを含むベクター。 Mode 281. A vector comprising the polynucleotide of embodiment 280.

態様282.態様213~242のいずれかの融合タンパク質と融合タンパク質のnapDNAbpに結合したPEgRNAとを含む細胞。 Mode 282. A cell comprising the fusion protein of any of embodiments 213-242 and PEgRNA bound to napDNAbp of the fusion protein.

態様283.態様260~279のいずれか1つの複合体を含む細胞。 Mode 283. A cell comprising the complex of any one of embodiments 260-279.

態様284.医薬組成物であって:(i)態様213~242のいずれかの融合タンパク質、態様260~279の複合体、態様68のポリヌクレオチド、または態様69のベクター;および(ii)薬学的に許容される賦形剤を含む。 Embodiment 284. A pharmaceutical composition comprising: (i) a fusion protein of any one of embodiments 213 to 242, a complex of embodiments 260 to 279, a polynucleotide of embodiment 68, or a vector of embodiment 69; and (ii) a pharma- ceutically acceptable excipient.

態様285.医薬組成物であって:(i)態様260~279の複合体、(ii)トランスで提供されるポリメラーゼ;および(iii)薬学的に許容される賦形剤を含む。 Mode 285. A pharmaceutical composition comprising: (i) a conjugate of embodiments 260-279, (ii) a polymerase provided in trans; and (iii) a pharmaceutically acceptable excipient.

態様286.キットであって:(i)態様213~242のいずれか1つの融合タンパク質をコードする核酸配列(nuleic acid sequencing);および(ii)(i)の配列の発現を駆動するプロモーターを含む核酸構築物を含む。 Mode 286. A kit comprising: (i) a nucleic acid sequence encoding the fusion protein of any one of embodiments 213 to 242; and (ii) a nucleic acid construct comprising a promoter driving expression of the sequence of (i). include.

態様287.所望のヌクレオチド変化を二本鎖DNA配列に組み入れるための方法であって、方法が: Mode 287. A method for incorporating desired nucleotide changes into a double-stranded DNA sequence, the method comprising:

(i)融合タンパク質およびPEgRNAを含む複合体と二本鎖DNA配列を接触させ、融合タンパク質がnapDNAbpおよびポリメラーゼを含み、PEgRNAが所望のヌクレオチド変化を含むDNA合成鋳型とプライマー結合部位とを含むこと; (i) contacting the double-stranded DNA sequence with a complex comprising a fusion protein and PEgRNA, the fusion protein comprising napDNAbp and a polymerase, and the PEgRNA comprising a DNA synthesis template containing the desired nucleotide changes and a primer binding site;

(ii)二本鎖DNA配列にニッキングし、それによって、3'端を有する遊離の一本鎖DNAを生成すること; (ii) nicking the double-stranded DNA sequence, thereby generating free single-stranded DNA with a 3' end;

(iii)遊離の一本鎖DNAの3'端をプライマー結合部位にハイブリダイズさせ、それによってポリメラーゼをプライムすること; (iii) hybridizing the 3' end of the free single-stranded DNA to the primer binding site, thereby priming the polymerase;

(iv)プライマー結合部位にハイブリダイズした3'端からDNAの鎖を重合し、それによって、DNA合成鋳型に対して相補的であるかつ所望のヌクレオチド変化を含む一本鎖DNAフラップを生成すること; (iv) polymerizing the strand of DNA from the 3' end hybridized to the primer binding site, thereby producing a single-stranded DNA flap that is complementary to the DNA synthesis template and contains the desired nucleotide changes; ;

(v)カットされた部位に隣接する内生DNA鎖を一本鎖DNAフラップによって置き換え、それによって所望のヌクレオチド変化を二本鎖DNA配列に組み入れること、
を含む。
(v) replacing the endogenous DNA strand adjacent to the cut site by a single-stranded DNA flap, thereby incorporating the desired nucleotide change into the double-stranded DNA sequence;
including.

態様288.態様287の方法であって、(v)置き換えるステップが:(i)一本鎖DNAフラップをカットされた部位に隣接する内生DNA鎖にハイブリダイズさせて、配列ミスマッチを生出すること;(ii)内生DNA鎖を切り出すこと;および(iii)ミスマッチを修復して、所望のヌクレオチド変化をDNAの両方の鎖に含む所望の産物を形成すること、を含む。 Mode 288. Embodiment 287, wherein (v) the replacing step comprises: (i) hybridizing the single-stranded DNA flap to an endogenous DNA strand adjacent to the cut site to create a sequence mismatch; (ii) ) excising the endogenous DNA strand; and (iii) repairing the mismatch to form the desired product containing the desired nucleotide changes in both strands of the DNA.

態様289.態様288の方法であって、所望のヌクレオチド変化が1ヌクレオチド置換、欠失、または挿入である。 Mode 289. Embodiment 288, wherein the desired nucleotide change is a single nucleotide substitution, deletion, or insertion.

態様290.態様289の方法であって、1ヌクレオチド置換がトランジションまたはトランスバージョンである。 Mode 290. Embodiment 289. The method of embodiment 289, wherein the single nucleotide substitution is a transition or transversion.

態様291.態様288の方法であって、所望のヌクレオチド変化が、(1)GからTの置換、(2)GからAの置換、(3)GからCの置換、(4)TからGの置換、(5)TからAの置換、(6)TからCの置換、(7)CからGの置換、(8)CからTの置換、(9)CからAの置換、(10)AからTの置換、(11)AからGの置換、または(12)AからCの置換である。 Mode 291. Embodiment 288, wherein the desired nucleotide change is (1) a G to T substitution, (2) a G to A substitution, (3) a G to C substitution, (4) a T to G substitution, (5) Substitution of A from T, (6) Substitution of C from T, (7) Substitution of G from C, (8) Substitution of T from C, (9) Substitution of A from C, (10) Substitution of A substitution of T, (11) substitution of A to G, or (12) substitution of A to C.

態様292.態様288の方法であって、所望のヌクレオチド変化が、(1)G:C塩基対をT:A塩基対に、(2)G:C塩基対をA:T塩基対に、(3)G:C塩基対をC:G塩基対に、(4)T:A塩基対をG:C塩基対に、(5)T:A塩基対をA:T塩基対に、(6)T:A塩基対をC:G塩基対に、(7)C:G塩基対をG:C塩基対に、(8)C:G塩基対をT:A塩基対に、C:G塩基対をA:T塩基対に、(10)A:T塩基対をT:A塩基対に、(11)A:T塩基対をG:C塩基対に、または(12)A:T塩基対をC:G塩基対に変換する。 Mode 292. Embodiment 288, wherein the desired nucleotide change is (1) a G:C base pair to a T:A base pair, (2) a G:C base pair to an A:T base pair, (3) a G:C base pair to a T:A base pair; :C base pair becomes C:G base pair, (4) T:A base pair becomes G:C base pair, (5) T:A base pair becomes A:T base pair, (6) T:A base pair to C:G base pair, (7) C:G base pair to G:C base pair, (8) C:G base pair to T:A base pair, C:G base pair to A: T base pair, (10) A:T base pair to T:A base pair, (11) A:T base pair to G:C base pair, or (12) A:T base pair to C:G. Convert to base pairs.

態様293.態様288の方法であって、所望のヌクレオチド変化が1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、または25ヌクレオチドの挿入または欠失である。 Embodiment 293. The method of embodiment 288, wherein the desired nucleotide change is an insertion or deletion of 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, or 25 nucleotides.

態様294.態様288の方法であって、所望のヌクレオチド変化が疾患関連遺伝子を修正する。 Mode 294. Embodiment 288. The method of embodiment 288, wherein the desired nucleotide change modifies a disease-associated gene.

態様295.態様294の方法であって、疾患関連遺伝子が:アデノシンデアミナーゼ(ADA)欠損症;アルファ-1アンチトリプシン欠損症;嚢胞性線維症;デュシェンヌ型筋ジストロフィー;ガラクトース血症;ヘモクロマトーシス;ハンチントン病;メープルシロップ尿症;マルファン症候群;1型神経線維腫症;先天性爪肥厚症;フェニルケトン尿症;重症複合免疫不全;鎌状赤血球症;スミス・レムリ・オピッツ症候群;トリヌクレオチド反復障害;プリオン病;およびテイ・サックス病からなる群から選択される単一遺伝子障害に関連する。 Mode 295. Embodiment 294, wherein the disease-associated gene is: adenosine deaminase (ADA) deficiency; alpha-1 antitrypsin deficiency; cystic fibrosis; Duchenne muscular dystrophy; galactosemia; hemochromatosis; Huntington's disease; maple Syrupuria; Marfan syndrome; type 1 neurofibromatosis; congenital nail hypertrophy; phenylketonuria; severe combined immunodeficiency; sickle cell disease; Smith-Lemli-Opitz syndrome; trinucleotide repeat disorder; prion disease associated with a single gene disorder selected from the group consisting of; and Tay-Sachs disease.

態様296.態様294の方法であって、疾患関連遺伝子が:心臓病;高血圧;アルツハイマー病;関節炎;糖尿病;がん;および肥満からなる群から選択される多遺伝子性障害に関連する。 Mode 296. Embodiment 294, wherein the disease-associated gene is associated with a polygenic disorder selected from the group consisting of: heart disease; hypertension; Alzheimer's disease; arthritis; diabetes; cancer; and obesity.

態様297.態様287の方法であって、napDNAbpがヌクレアーゼ不活性型Cas9(dCas9)、Cas9ニッカーゼ(nCas9)、またはヌクレアーゼ活性Cas9である。 Mode 297. Embodiment 287, wherein the napDNAbp is nuclease-inactive Cas9 (dCas9), Cas9 nickase (nCas9), or nuclease-active Cas9.

態様298.態様287の方法であって、napDNAbpが、配列番号18のアミノ酸配列、または配列番号18のアミノ酸配列との少なくとも80%、85%、90%、95%、98%、もしくは99%配列同一性を有するアミノ酸配列を含む。 Mode 298. Embodiment 287, wherein napDNAbp has the amino acid sequence of SEQ ID NO: 18, or at least 80%, 85%, 90%, 95%, 98%, or 99% sequence identity with the amino acid sequence of SEQ ID NO: 18. Contains an amino acid sequence with

態様299.態様287の方法であって、napDNAbpが、配列番号18~88、126、130、137、141、147、153、157、445、460、467、および482~487のいずれか1つのアミノ酸配列との少なくとも80%、85%、90%、95%、98%、または99%配列同一性を有するアミノ酸配列を含む。 Embodiment 299. The method of embodiment 287, wherein the napDNAbp comprises an amino acid sequence having at least 80%, 85%, 90%, 95%, 98%, or 99% sequence identity to any one of the amino acid sequences of SEQ ID NOs: 18-88, 126, 130, 137, 141, 147, 153, 157, 445, 460, 467, and 482-487.

態様300.態様287の方法であって、ポリメラーゼが逆転写酵素であり、配列番号89~100、105~122、128~129、132、139、143、149、154、159、235、454、471、516、662、700、701~716、739~741、および766のアミノ酸配列のいずれか1つを含む。 Mode 300. The method of embodiment 287, wherein the polymerase is a reverse transcriptase, SEQ ID NOs: 89-100, 105-122, 128-129, 132, 139, 143, 149, 154, 159, 235, 454, 471, 516, Contains any one of the amino acid sequences 662, 700, 701-716, 739-741, and 766.

態様301.態様287の方法であって、ポリメラーゼが逆転写酵素であり、配列番号89~100、105~122、128~129、132、139、143、149、154、159、235、454、471、516、662、700、701~716、739~741、および766のいずれか1つのアミノ酸配列との少なくとも80%、85%、90%、95%、98%、または99%配列同一性を有するアミノ酸配列を含む。 Aspect 301. The method of embodiment 287, wherein the polymerase is a reverse transcriptase, and SEQ ID NOs: 89-100, 105-122, 128-129, 132, 139, 143, 149, 154, 159, 235, 454, 471, 516, An amino acid sequence having at least 80%, 85%, 90%, 95%, 98%, or 99% sequence identity with any one amino acid sequence of 662, 700, 701-716, 739-741, and 766. include.

態様302.態様287の方法であって、PEgRNAが核酸伸長アームをガイドRNAの3'もしくは5'端または分子内の位置付けに含み、伸長アームがDNA合成鋳型配列およびプライマー結合部位を含む。 Aspect 302. Embodiment 287, wherein the PEgRNA comprises a nucleic acid extension arm at the 3' or 5' end of the guide RNA or at an intramolecular location, the extension arm comprising a DNA synthesis template sequence and a primer binding site.

態様303.態様302の方法であって、伸長アームが、長さが少なくとも5ヌクレオチド、少なくとも6ヌクレオチド、少なくとも7ヌクレオチド、少なくとも8ヌクレオチド、少なくとも9ヌクレオチド、少なくとも10ヌクレオチド、少なくとも11ヌクレオチド、少なくとも12ヌクレオチド、少なくとも13ヌクレオチド、少なくとも14ヌクレオチド、少なくとも15ヌクレオチド、少なくとも16ヌクレオチド、少なくとも17ヌクレオチド、少なくとも18ヌクレオチド、少なくとも19ヌクレオチド、少なくとも20ヌクレオチド、少なくとも21ヌクレオチド、少なくとも22ヌクレオチド、少なくとも23ヌクレオチド、少なくとも24ヌクレオチド、または少なくとも25ヌクレオチドである。 Aspect 303. Embodiment 302, wherein the extended arm is at least 5 nucleotides, at least 6 nucleotides, at least 7 nucleotides, at least 8 nucleotides, at least 9 nucleotides, at least 10 nucleotides, at least 11 nucleotides, at least 12 nucleotides, at least 13 nucleotides in length. , at least 14 nucleotides, at least 15 nucleotides, at least 16 nucleotides, at least 17 nucleotides, at least 18 nucleotides, at least 19 nucleotides, at least 20 nucleotides, at least 21 nucleotides, at least 22 nucleotides, at least 23 nucleotides, at least 24 nucleotides, or at least 25 nucleotides be.

態様304.態様287の方法であって、PEgRNAが、配列番号101~104、181~183、223~244、277、325~334、336、338、340、342、344、346、348、350、352、354、356、358、360、362、364、366、368、499~505、735~761、776~777からなる群から選択されるヌクレオチド配列を有する。 Aspect 304. Embodiment 287, wherein the PEgRNA is SEQ ID NO: 101-104, 181-183, 223-244, 277, 325-334, 336, 338, 340, 342, 344, 346, 348, 350, 352, 354 , 356, 358, 360, 362, 364, 366, 368, 499-505, 735-761, 776-777.

態様305.標的座位におけるDNA分子のヌクレオチド配列の1つ以上の変化を導入するための方法であって: Aspect 305. A method for introducing one or more changes in the nucleotide sequence of a DNA molecule at a target locus, the method comprising:

(i)DNA分子を、核酸プログラム型DNA結合タンパク質(napDNAbp)およびnapDNAbpを標的座位へと標的化するPEgRNAと接触させ、PEgRNAが少なくとも1つの所望のヌクレオチド変化を含む逆転写酵素(RT)鋳型配列とプライマー結合部位とを含むこと; (i) contacting the DNA molecule with a nucleic acid programmed DNA binding protein (napDNAbp) and a PEgRNA that targets napDNAbp to the target locus, and the PEgRNA contains a reverse transcriptase (RT) template sequence containing at least one desired nucleotide change; and a primer binding site;

(ii)標的座位におけるDNA鎖の暴露された3'端を形成すること; (ii) forming an exposed 3' end of the DNA strand at the target locus;

(iii)暴露された3'端をプライマー結合部位にハイブリダイズさせて逆転写をプライムすること; (iii) hybridizing the exposed 3′ end to a primer binding site to prime reverse transcription;

(iv)逆転写酵素によって、RT鋳型配列に基づく少なくとも1つの所望のヌクレオチド変化を含む一本鎖DNAフラップを合成すること;および (iv) synthesizing by reverse transcriptase a single-stranded DNA flap containing at least one desired nucleotide change based on the RT template sequence; and

(v)少なくとも1つの所望のヌクレオチド変化を対応する内生DNA上に組み込み、それによって、標的座位においてDNA分子のヌクレオチド配列の1つ以上の変化を導入すること、
を含む。
(v) incorporating at least one desired nucleotide change onto the corresponding endogenous DNA, thereby introducing one or more changes in the nucleotide sequence of the DNA molecule at the target locus;
including.

態様306.態様305の方法であって、ヌクレオチド配列の1つ以上の変化がトランジションを含む。 Aspect 306. Embodiment 305. The method of embodiment 305, wherein the one or more changes in the nucleotide sequence comprises a transition.

態様307.態様306の方法であって、トランジションが、(a)TからC;(b)AからG;(c)CからT;および(d)GからAからなる群から選択される。 Aspect 307. 306. The method of embodiment 306, wherein the transition is selected from the group consisting of: (a) T to C; (b) A to G; (c) C to T; and (d) G to A.

態様308.態様305の方法であって、ヌクレオチド配列の1つ以上の変化がトランスバージョンを含む。 Aspect 308. Embodiment 305, wherein the one or more changes in the nucleotide sequence comprises a transversion.

態様309.態様308の方法であって、トランスバージョンが、(a)TからA;(b)TからG;(c)CからG;(d)CからA;(e)AからT;(f)AからC;(g)GからC;および(h)GからTからなる群から選択される。 Aspect 309. Embodiment 308, wherein the transversion is: (a) T to A; (b) T to G; (c) C to G; (d) C to A; (e) A to T; (f) (g) G to C; and (h) G to T.

態様310.態様305の方法であって、ヌクレオチド配列の1つ以上の変化が、(1)G:C塩基対をT:A塩基対に、(2)G:C塩基対をA:T塩基対に、(3)G:C塩基対をC:G塩基対に、(4)T:A塩基対をG:C塩基対に、(5)T:A塩基対をA:T塩基対に、(6)T:A塩基対をC:G塩基対に、(7)C:G塩基対をG:C塩基対に、(8)C:G塩基対をT:A塩基対に、(9)C:G塩基対をA:T塩基対に、(9)A:T塩基対をT:A塩基対に、(11)A:T塩基対をG:C塩基対に、または(12)A:T塩基対をC:G塩基対に変化させることを含む。 Embodiment 310. The method of embodiment 305, wherein the one or more changes in the nucleotide sequence include changing (1) a G:C base pair to a T:A base pair, (2) a G:C base pair to an A:T base pair, (3) a G:C base pair to a C:G base pair, (4) a T:A base pair to a G:C base pair, (5) a T:A base pair to an A:T base pair, (6) a T:A base pair to a C:G base pair, (7) a C:G base pair to a G:C base pair, (8) a C:G base pair to a T:A base pair, (9) a C:G base pair to an A:T base pair, (9) an A:T base pair to a T:A base pair, (11) an A:T base pair to a G:C base pair, or (12) an A:T base pair to a C:G base pair.

態様311.態様305の方法であって、ヌクレオチド配列の1つ以上の変化が、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、または25ヌクレオチドの挿入または欠失を含む。 Aspect 311. Embodiment 305, wherein the one or more changes in the nucleotide sequence are 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, Contains insertions or deletions of 17, 18, 19, 20, 21, 22, 23, 24, or 25 nucleotides.

態様312.態様305の方法であって、ヌクレオチド配列の1つ以上の変化が疾患関連遺伝子の修正を含む。 Aspect 312. Embodiment 305. The method of embodiment 305, wherein the one or more changes in the nucleotide sequence comprises correction of a disease-associated gene.

態様313.態様312の方法であって、疾患関連遺伝子が:アデノシンデアミナーゼ(ADA)欠損症;アルファ-1アンチトリプシン欠損症;嚢胞性線維症;デュシェンヌ型筋ジストロフィー;ガラクトース血症;ヘモクロマトーシス;ハンチントン病;メープルシロップ尿症;マルファン症候群;1型神経線維腫症;先天性爪肥厚症;フェニルケトン尿症;重症複合免疫不全;鎌状赤血球症;スミス・レムリ・オピッツ症候群;トリヌクレオチド反復障害;プリオン病;およびテイ・サックス病からなる群から選択される単一遺伝子障害に関連する。 Aspect 313. The method of embodiment 312, wherein the disease-associated gene is: adenosine deaminase (ADA) deficiency; alpha-1 antitrypsin deficiency; cystic fibrosis; Duchenne muscular dystrophy; galactosemia; hemochromatosis; Huntington's disease; maple Syrupuria; Marfan syndrome; type 1 neurofibromatosis; congenital nail hypertrophy; phenylketonuria; severe combined immunodeficiency; sickle cell disease; Smith-Lemli-Opitz syndrome; trinucleotide repeat disorder; prion disease associated with a single gene disorder selected from the group consisting of; and Tay-Sachs disease.

態様314.態様312の方法であって、疾患関連遺伝子が:心臓病;高血圧;アルツハイマー病;関節炎;糖尿病;がん;および肥満からなる群から選択される多遺伝子性障害に関連する。 Aspect 314. Embodiment 312. The method of embodiment 312, wherein the disease-associated gene is associated with a polygenic disorder selected from the group consisting of: heart disease; hypertension; Alzheimer's disease; arthritis; diabetes; cancer; and obesity.

態様315.態様305の方法であって、napDNAbpがヌクレアーゼ活性Cas9またはそのバリアントである。 Aspect 315. Embodiment 305, wherein the napDNAbp is nuclease-active Cas9 or a variant thereof.

態様316.態様305の方法であって、napDNAbpがヌクレアーゼ不活性型Cas9(dCas9)もしくはCas9ニッカーゼ(nCas9)またはそのバリアントである。 Aspect 316. Embodiment 305, wherein the napDNAbp is nuclease-inactive Cas9 (dCas9) or Cas9 nickase (nCas9) or a variant thereof.

態様317.態様305の方法であって、napDNAbpが、配列番号18のアミノ酸配列、または配列番号18との少なくとも80%、85%、90%、95%、98%、もしくは99%配列同一性を有するアミノ酸配列を含む。 Aspect 317. Embodiment 305, wherein napDNAbp is the amino acid sequence of SEQ ID NO: 18, or an amino acid sequence having at least 80%, 85%, 90%, 95%, 98%, or 99% sequence identity with SEQ ID NO: 18. including.

態様318.態様305の方法であって、napDNAbpが、配列番号18~88、126、130、137、141、147、153、157、445、460、467、および482~487のいずれか1つのアミノ酸配列との少なくとも80%、85%、90%、95%、98%、または99%配列同一性を有するアミノ酸配列を含む。 Aspect 318. Embodiment 305, wherein napDNAbp has an amino acid sequence of any one of SEQ ID NOs: 18-88, 126, 130, 137, 141, 147, 153, 157, 445, 460, 467, and 482-487. Comprising amino acid sequences with at least 80%, 85%, 90%, 95%, 98%, or 99% sequence identity.

態様319.態様305の方法であって、逆転写酵素がトランスで導入される。 Aspect 319. Embodiment 305. The method of embodiment 305, wherein the reverse transcriptase is introduced in trans.

態様320.態様305の方法であって、napDNAbpが逆転写酵素への融合体を含む。 Mode 320. Embodiment 305, wherein the napDNAbp comprises a fusion to reverse transcriptase.

態様321.態様305の方法であって、逆転写酵素が、配列番号89~100、105~122、128~129、132、139、143、149、154、159、235、454、471、516、662、700、701~716、739~741、および766のアミノ酸配列のいずれか1つを含む。 Aspect 321. Embodiment 305, wherein the reverse transcriptase is SEQ ID NO: 89-100, 105-122, 128-129, 132, 139, 143, 149, 154, 159, 235, 454, 471, 516, 662, 700 , 701-716, 739-741, and 766.

態様322.態様305の方法であって、逆転写酵素が、配列番号89~100、105~122、128~129、132、139、143、149、154、159、235、454、471、516、662、700、701~716、739~741、および766のいずれか1つのアミノ酸配列との少なくとも80%、85%、90%、95%、98%、または99%配列同一性を有するアミノ酸配列を含む。 Aspect 322. Embodiment 305, wherein the reverse transcriptase is SEQ ID NO: 89-100, 105-122, 128-129, 132, 139, 143, 149, 154, 159, 235, 454, 471, 516, 662, 700 , 701-716, 739-741, and 766.

態様323.態様305の方法であって、標的座位におけるDNA鎖の暴露された3'端を形成するステップが、ヌクレアーゼによってDNA鎖へニックを入れることを含む。 Aspect 323. Embodiment 305. The method of embodiment 305, wherein the step of forming an exposed 3' end of the DNA strand at the target locus comprises nicking the DNA strand with a nuclease.

態様324.態様323の方法であって、ヌクレアーゼがトランスで提供され、提供される。 Aspect 324. Embodiment 323. The method of embodiment 323, wherein the nuclease is provided and provided in trans.

態様325.態様305の方法であって、標的座位におけるDNA鎖の暴露された3'端を形成するステップが、DNA鎖を化学的薬剤と接触させることを含む。 Embodiment 325. The method of embodiment 305, wherein the step of forming an exposed 3' end of the DNA strand at the target locus comprises contacting the DNA strand with a chemical agent.

態様326.態様305の方法であって、標的座位におけるDNA鎖の暴露された3'端を形成するステップが、複製エラーを導入することを含む。 Aspect 326. Embodiment 305. The method of embodiment 305, wherein forming an exposed 3' end of the DNA strand at the target locus comprises introducing a replication error.

態様327.態様305の方法であって、DNA分子をnapDNAbpおよびガイドRNAと接触させるステップがRループを形成する。 Aspect 327. Embodiment 305. The method of embodiment 305, wherein the step of contacting the DNA molecule with napDNAbp and guide RNA forms an R-loop.

態様328.態様327の方法であって、暴露された3'端が形成されるDNA鎖がRループ上にある。 Aspect 328. Embodiment 327. The method of embodiment 327, wherein the DNA strand from which the exposed 3' end is formed is on the R-loop.

態様329.態様315の方法であって、PEgRNAが、逆転写酵素(RT)鋳型配列とプライマー結合部位とを含む伸長アームを含む。 Aspect 329. Embodiment 315. The method of embodiment 315, wherein the PEgRNA comprises an extended arm that includes a reverse transcriptase (RT) template sequence and a primer binding site.

態様330.態様329の方法であって、伸長アームが、ガイドRNAの3'端、ガイドRNAの5'端、またはガイドRNAの分子内の位置にある。 Aspect 330. 329. The method of embodiment 329, wherein the elongated arm is at the 3' end of the guide RNA, the 5' end of the guide RNA, or an intramolecular position of the guide RNA.

態様331.態様305の方法であって、PEgRNAが、さらに、リンカー、ステムループ、ヘアピン、トウループ、アプタマー、またはRNA-タンパク質動員ドメインからなる群から選択される少なくとも1つの追加の構造を含む。 Aspect 331. Embodiment 305, wherein the PEgRNA further comprises at least one additional structure selected from the group consisting of a linker, stem-loop, hairpin, toe-loop, aptamer, or RNA-protein recruitment domain.

態様332.態様305の方法であって、PEgRNAがさらに相同アームを含む。 Aspect 332. Embodiment 305, wherein the PEgRNA further comprises a homology arm.

態様333.態様305の方法であって、RT鋳型配列が、対応する内生DNAに対して相同的である。 Aspect 333. Embodiment 305. The method of embodiment 305, wherein the RT template sequence is homologous to the corresponding endogenous DNA.

態様334.プライム標的にプライムされた逆転写によって、標的座位におけるDNA分子のヌクレオチド配列の1つ以上の変化を導入するための方法であって、方法が:(a)標的座位におけるDNA分子を(i)核酸プログラム型DNA結合タンパク質(napDNAbp)および逆転写酵素を含む融合タンパク質ならびに(ii)所望のヌクレオチド変化を含むRT鋳型を含むガイドRNAと接触させること;(b)RT鋳型のプライム標的にプライムされた逆転写を行なって、所望のヌクレオチド変化を含む一本鎖DNAを生成すること;ならびに(c)DNA修復および/または複製プロセスによって標的座位におけるDNA分子上に所望のヌクレオチド変化を組み込むことを含む。 Aspect 334. A method for introducing one or more changes in the nucleotide sequence of a DNA molecule at a target locus by primed reverse transcription to a primed target, the method comprising: (a) converting the DNA molecule at the target locus into (i) a nucleic acid molecule; contacting a fusion protein comprising a programmed DNA binding protein (napDNAbp) and a reverse transcriptase and (ii) a guide RNA comprising an RT template containing the desired nucleotide changes; (b) a reverse primed target of the RT template; (c) incorporating the desired nucleotide changes onto the DNA molecule at the target locus by DNA repair and/or replication processes.

態様335.態様334の方法であって、RT鋳型が、ガイドRNAの3'端、ガイドRNAの5'端、またはガイドRNAの分子内の位置付けに位置付けられる。 Aspect 335. Embodiment 334. The method of embodiment 334, wherein the RT template is located at the 3' end of the guide RNA, at the 5' end of the guide RNA, or at an intramolecular location of the guide RNA.

態様336.態様334の方法であって、所望のヌクレオチド変化が、トランジション、トランスバージョン、挿入、もしくは欠失、またはそれらのいずれかの組み合わせを含む。 Aspect 336. Embodiment 334. The method of embodiment 334, wherein the desired nucleotide change comprises a transition, transversion, insertion, or deletion, or any combination thereof.

態様337.態様334の方法であって、所望のヌクレオチド変化が、(a)TからC;(b)AからG;(c)CからT;および(d)GからAからなる群から選択されるトランジションを含む。 Aspect 337. Embodiment 334, wherein the desired nucleotide change is a transition selected from the group consisting of: (a) T to C; (b) A to G; (c) C to T; and (d) G to A. including.

態様338.請求項334の方法であって、所望のヌクレオチド変化が、(a)TからA;(b)TからG;(c)CからG;(d)CからA;(e)AからT;(f)AからC;(g)GからC;および(h)GからTからなる群から選択されるトランスバージョンを含む。 Aspect 338. 335. The method of claim 334, wherein the desired nucleotide change is (a) T to A; (b) T to G; (c) C to G; (d) C to A; (e) A to T; (f) A to C; (g) G to C; and (h) G to T.

態様339.態様334の方法であって、所望のヌクレオチド変化が、(1)G:C塩基対をT:A塩基対に、(2)G:C塩基対をA:T塩基対に、(3)G:C塩基対をC:G塩基対に、(4)T:A塩基対をG:C塩基対に、(5)T:A塩基対をA:T塩基対に、(6)T:A塩基対をC:G塩基対に、(7)C:G塩基対をG:C塩基対に、(8)C:G塩基対をT:A塩基対に、(9)C:G塩基対をA:T塩基対に、(10)A:T塩基対をT:A塩基対に、(11)A:T塩基対をG:C塩基対に、または(12)A:T塩基対をC:G塩基対に変化させることを含む。 Aspect 339. 334. The method of embodiment 334, wherein the desired nucleotide change is (1) a G:C base pair to a T:A base pair, (2) a G:C base pair to an A:T base pair, (3) a G:C base pair to a T:A base pair; :C base pair becomes C:G base pair, (4) T:A base pair becomes G:C base pair, (5) T:A base pair becomes A:T base pair, (6) T:A base pair to C:G base pair, (7) C:G base pair to G:C base pair, (8) C:G base pair to T:A base pair, (9) C:G base pair. into an A:T base pair, (10) an A:T base pair into a T:A base pair, (11) an A:T base pair into a G:C base pair, or (12) an A:T base pair. This includes changing to a C:G base pair.

態様340.態様243~259のいずれか1つのPEgRNAをコードするポリヌクレオチド。 Embodiment 340. A polynucleotide encoding a PEgRNA according to any one of embodiments 243 to 259.

態様341.態様340のポリヌクレオチドを含むベクター。 Aspect 341. A vector comprising the polynucleotide of aspect 340.

態様342.態様341のベクターを含む細胞。 Aspect 342. A cell comprising the vector of embodiment 341.

態様343.態様213の融合タンパク質であって、ポリメラーゼがエラーを起こしやすい逆転写酵素である。 Aspect 343. The fusion protein of embodiment 213, wherein the polymerase is an error-prone reverse transcriptase.

態様344.プライム標的にプライムされた逆転写によって標的座位におけるDNA分子に変異導入するための方法であって、方法が:(a)標的座位におけるDNA分子を(i)核酸プログラム型DNA結合タンパク質(napDNAbp)およびエラーを起こしやすい逆転写酵素を含む融合タンパク質ならびに(ii)所望のヌクレオチド変化を含むRT鋳型を含むガイドRNAと接触させること;(b)RT鋳型のプライム標的にプライムされた逆転写を行なって、変異導入された一本鎖DNAを生成すること;ならびに(c)DNA修復および/または複製プロセスによって、変異導入された一本鎖DNAを標的座位におけるDNA分子上に組み込むことを含む。 Aspect 344. A method for mutagenizing a DNA molecule at a target locus by primed reverse transcription, the method comprising: (a) converting the DNA molecule at the target locus to (i) a nucleic acid programmed DNA binding protein (napDNAbp); contacting a fusion protein comprising an error-prone reverse transcriptase and (ii) a guide RNA comprising an RT template comprising the desired nucleotide changes; (b) performing primed reverse transcription on a primed target of the RT template; producing mutagenized single-stranded DNA; and (c) incorporating the mutagenized single-stranded DNA onto a DNA molecule at a target locus by a DNA repair and/or replication process.

態様345.いずれかの先行する態様の方法であって、融合タンパク質がPE1、PE2、またはPE3のアミノ酸配列を含む。 Aspect 345. The method of any preceding embodiment, wherein the fusion protein comprises the amino acid sequence of PE1, PE2, or PE3.

態様346.いずれかの先行する態様の方法であって、napDNAbpがCas9ニッカーゼ(nCas9)である。 Aspect 346. The method of any preceding embodiment, wherein napDNAbp is Cas9 nickase (nCas9).

態様347.態様344の方法であって、napDNAbpが配列番号18~88、126、130、137、141、147、153、157、445、460、467、および482~487のアミノ酸配列を含む。 Aspect 347. Embodiment 344, wherein the napDNAbp comprises the amino acid sequences of SEQ ID NOs: 18-88 , 126, 130, 137, 141, 147, 153, 157, 445, 460, 467, and 482-487 .

態様348.態様344の方法であって、ガイドRNAが配列番号222を含む。 Aspect 348. Embodiment 344. The method of embodiment 344, wherein the guide RNA comprises SEQ ID NO: 222.

態様349.態様344の方法であって、(b)プライム標的にプライムされた逆転写を行うステップが、ガイドRNA上のプライマー結合部位へのアニーリングによって逆転写をプライムすることができる標的座位における3'端プライマー結合配列を生成することを含む。 Aspect 349. Embodiment 344 The method of embodiment 344, wherein the step of (b) performing primed reverse transcription on a primed target comprises a 3' end primer at the target locus capable of priming reverse transcription by annealing to a primer binding site on a guide RNA. Including generating associative arrays.

態様350.健康な数の反復トリヌクレオチドを含む健康な配列によって標的DNA分子上のトリヌクレオチド反復拡大変異を置き換えるための方法であって、方法が:(a)標的座位におけるDNA分子を(i)核酸プログラム型DNA結合タンパク質(napDNAbp)およびポリメラーゼを含む融合タンパク質ならびに(ii)置き換え配列を含むDNA合成鋳型とプライマー結合部位とを含むPEgRNAと接触させること;(b)プライム編集を行なって、置き換え配列を含む一本鎖DNAを生成すること;ならびに(c)DNA修復および/または複製プロセスによって、標的座位におけるDNA分子上に一本鎖DNAを組み込むことを含む。 Mode 350. A method for replacing a trinucleotide repeat expansion mutation on a target DNA molecule by a healthy sequence containing a healthy number of repeat trinucleotides, the method comprising: (a) converting the DNA molecule at the target locus to (i) a nucleic acid programmed contacting a fusion protein containing a DNA binding protein (napDNAbp) and a polymerase; and (ii) a DNA synthesis template containing a replacement sequence and a PEgRNA containing a primer binding site; producing single-stranded DNA; and (c) incorporating single-stranded DNA onto a DNA molecule at a target locus by a DNA repair and/or replication process.

態様351.態様350の方法であって、融合タンパク質がPE1、PE2、またはPE3のアミノ酸配列を含む。 Aspect 351. Embodiment 350, wherein the fusion protein comprises the amino acid sequence of PE1, PE2, or PE3.

態様352.態様350の方法であって、napDNAbpがCas9ニッカーゼ(nCas9)である。 Aspect 352. Embodiment 350, wherein the napDNAbp is Cas9 nickase (nCas9).

態様353.態様350の方法であって、napDNAbpが、配列番号18~88、126、130、137、141、147、153、157、445、460、467、および482~487のアミノ酸配列を含む。 Aspect 353. Embodiment 350, wherein the napDNAbp comprises the amino acid sequences of SEQ ID NOs: 18-88, 126, 130, 137, 141, 147, 153, 157, 445, 460, 467, and 482-487.

態様354.態様350の方法であって、ガイドRNAが配列番号222を含む。 Embodiment 354. The method of embodiment 350, wherein the guide RNA comprises SEQ ID NO: 222.

態様355.態様350の方法であって、(b)プライム編集を行うステップが、ガイドRNA上のプライマー結合部位へのアニーリングによってポリメラーゼをプライムすることができる標的座位における3’端プライマー結合配列を生成することを含む。 Aspect 355. Embodiment 350, wherein (b) performing prime editing generates a 3' end primer binding sequence at the target locus that is capable of priming a polymerase by annealing to a primer binding site on the guide RNA. include.

態様356.態様350の方法であって、トリヌクレオチド反復拡大変異がハンチントン病、脆弱X症候群、またはフリードライヒ運動失調症に関連する。 Aspect 356. Embodiment 350, wherein the trinucleotide repeat expansion mutation is associated with Huntington's disease, Fragile X syndrome, or Friedreich's ataxia.

態様357.態様350の方法であって、トリヌクレオチド反復拡大変異がCAGトリプレットの繰り返し単位を含む。 Aspect 357. Embodiment 350, wherein the trinucleotide repeat expansion comprises a CAG triplet repeat unit.

態様358.態様350の方法であって、トリヌクレオチド反復拡大変異がGAAトリプレットの繰り返し単位を含む。 Aspect 358. Embodiment 350, wherein the trinucleotide repeat expansion comprises a GAA triplet repeat unit.

態様359.プライム編集によって、標的ヌクレオチド配列によってコードされる目当てのタンパク質上に機能部分を組み入れる方法であって、方法が:(a)標的ヌクレオチド配列を(i)核酸プログラム型DNA結合タンパク質(napDNAbp)およびポリメラーゼを含むプライム編集因子ならびに(ii)機能部分をコードするDNA合成鋳型を含むPEgRNAと接触させること;(b)機能部分をコードする一本鎖DNA配列を重合すること;ならびに(c)DNA修復および/または複製プロセスによって、標的ヌクレオチド配列における対応する内生鎖の代わりに一本鎖DNA配列を組み込むことを含み、方法が、目当てのタンパク質と機能部分とを含む融合タンパク質をコードする組み換え標的ヌクレオチド配列を生ずる。 Aspect 359. A method of incorporating a functional moiety onto a protein of interest encoded by a target nucleotide sequence by prime editing, the method comprising: (a) converting the target nucleotide sequence to (i) a nucleic acid programmed DNA binding protein (napDNAbp) and a polymerase; (b) polymerizing the single-stranded DNA sequence encoding the functional moiety; and (c) DNA repair and/or or incorporating, by a replication process, a single-stranded DNA sequence in place of the corresponding endogenous strand in the target nucleotide sequence, wherein the method generates a recombinant target nucleotide sequence encoding a fusion protein comprising the protein of interest and the functional moiety. arise.

態様360.態様359の方法であって、機能部分がペプチドタグである。 Mode 360. Embodiment 359. The method of embodiment 359, wherein the functional moiety is a peptide tag.

態様361.態様360の方法であって、ペプチドタグがアフィニティータグ、可溶化タグ、クロマトグラフィータグ、エピトープもしくは免疫エピトープタグ、または蛍光タグである。 Aspect 361. Embodiment 360, wherein the peptide tag is an affinity tag, a solubilization tag, a chromatography tag, an epitope or immunoepitope tag, or a fluorescent tag.

態様362.態様360の方法であって、ペプチドタグが:AviTag(配列番号245);Cタグ(配列番号246);カルモジュリンタグ(配列番号247);ポリグルタミン酸タグ(配列番号248);Eタグ(配列番号249);FLAGタグ(配列番号2);HAタグ(配列番号5);Hisタグ(配列番号252~262);Mycタグ(配列番号6);NEタグ(配列番号264);Rho1D4タグ(配列番号265);Sタグ(配列番号266);SBPタグ(配列番号267);Softag-1(配列番号268);Softag-2(配列番号269);Spotタグ(配列番号270);Strepタグ(配列番号271);TCタグ(配列番号272);Tyタグ(配列番号273);V5タグ(配列番号3);VSVタグ(配列番号275);およびXpressタグ(配列番号276)からなる群から選択される。 Embodiment 362. The method of embodiment 360, wherein the peptide tag is selected from the group consisting of: AviTag (SEQ ID NO:245); C-tag (SEQ ID NO:246); Calmodulin tag (SEQ ID NO:247); Polyglutamic acid tag (SEQ ID NO:248); E-tag (SEQ ID NO:249); FLAG-tag (SEQ ID NO:2); HA-tag (SEQ ID NO:5); His-tag (SEQ ID NOs:252-262); Myc-tag (SEQ ID NO:6); NE-tag (SEQ ID NO:264); Rho1D4-tag (SEQ ID NO:265); S-tag (SEQ ID NO:266); SBP-tag (SEQ ID NO:267); Softag-1 (SEQ ID NO:268); Softag-2 (SEQ ID NO:269); Spot-tag (SEQ ID NO:270); Strep-tag (SEQ ID NO:271); TC-tag (SEQ ID NO:272); Ty-tag (SEQ ID NO:273); V5-tag (SEQ ID NO:3); VSV-tag (SEQ ID NO:275); and Xpress-tag (SEQ ID NO:276).

態様363.態様360の方法であって、ペプチドタグが:AU1エピトープ(配列番号278);AU5エピトープ(配列番号279);バクテリオファージT7エピトープ(T7タグ)(配列番号280);ブルータングウイルスタグ(Bタグ)(配列番号281);E2エピトープ(配列番号282);ヒスチジンアフィニティータグ(HAT)(配列番号283);HSVエピトープ(配列番号284);ポリアルギニン(Argタグ)(配列番号285);ポリアスパラギン酸(Aspタグ)(配列番号286);ポリフェニルアラニン(Pheタグ)(配列番号287);S1タグ(配列番号288);Sタグ(配列番号266);およびVSV-G(配列番号275)からなる群から選択される。 Aspect 363. Embodiment 360, wherein the peptide tag is: AU1 epitope (SEQ ID NO: 278); AU5 epitope (SEQ ID NO: 279); bacteriophage T7 epitope (T7 tag) (SEQ ID NO: 280); bluetongue virus tag (B tag). (SEQ ID NO: 281); E2 epitope (SEQ ID NO: 282); histidine affinity tag (HAT) (SEQ ID NO: 283); HSV epitope (SEQ ID NO: 284); polyarginine (Arg tag) (SEQ ID NO: 285); polyaspartic acid ( Asp tag) (SEQ ID NO: 286); polyphenylalanine (Phe tag) (SEQ ID NO: 287); S1 tag (SEQ ID NO: 288); S tag (SEQ ID NO: 266); and VSV-G (SEQ ID NO: 275). selected.

態様364.態様359の方法であって、機能部分が免疫エピトープである。 Embodiment 364. The method of embodiment 359, wherein the functional moiety is an immune epitope.

態様365.態様364の方法であって、免疫エピトープが:破傷風トキソイド(配列番号396);ジフテリア毒素変異体CRM197(配列番号630);ムンプス免疫エピトープ1(配列番号400);ムンプス免疫エピトープ2(配列番号402);ムンプス免疫エピトープ3(配列番号404);風疹ウイルス(配列番号406);ヘマグルチニン(配列番号408);ノイラミニダーゼ(配列番号410);TAP1(配列番号412);TAP2(配列番号414);クラスI HLAに対するヘマグルチニンエピトープ(配列番号416);クラスI HLAに対するノイラミニダーゼエピトープ(配列番号418);クラスII HLAに対するヘマグルチニンエピトープ(配列番号420);クラスII HLAに対するノイラミニダーゼエピトープ(配列番号422);ヘマグルチニンエピトープH5N1結合クラスIおよびクラスII HLA(配列番号424);ノイラミニダーゼエピトープH5N1結合クラスIおよびクラスII HLA(配列番号426)からなる群から選択される。 Mode 365. Embodiment 364, wherein the immune epitope is: tetanus toxoid (SEQ ID NO: 396); diphtheria toxin variant CRM197 (SEQ ID NO: 630); mumps immune epitope 1 (SEQ ID NO: 400); mumps immune epitope 2 (SEQ ID NO: 402). Mumps immune epitope 3 (SEQ ID NO: 404); Rubella virus (SEQ ID NO: 406); Hemagglutinin (SEQ ID NO: 408); Neuraminidase (SEQ ID NO: 410); TAP1 (SEQ ID NO: 412); TAP2 (SEQ ID NO: 414); Class I HLA hemagglutinin epitope for class I HLA (SEQ ID NO: 416); neuraminidase epitope for class I HLA (SEQ ID NO: 420); neuraminidase epitope for class II HLA (SEQ ID NO: 422); hemagglutinin epitope H5N1 binding class I and class II HLA (SEQ ID NO: 424); neuraminidase epitope H5N1 binding class I and class II HLA (SEQ ID NO: 426).

態様366.態様359の方法であって、機能部分が目当てのタンパク質の局在を変改する。 Aspect 366. Embodiment 359. The method of embodiment 359, wherein the functional moiety alters localization of the protein of interest.

態様367.態様359の方法であって、機能部分が分解タグであり、その結果、目当てのタンパク質の分解速度が変改される。 Aspect 367. Embodiment 359. The method of embodiment 359, wherein the functional moiety is a degradation tag, so that the degradation rate of the protein of interest is altered.

態様368.態様367の方法であって、分解タグが、タグ付けされたタンパク質の消去をもたらす。 Mode 368. Embodiment 367. The method of embodiment 367, wherein the degradation tag results in elimination of the tagged protein.

態様369.態様359の方法であって、機能部分が低分子結合ドメインである。 Aspect 369. Embodiment 359. The method of embodiment 359, wherein the functional moiety is a small molecule binding domain.

態様370.態様359の方法であって、低分子結合ドメインが配列番号488のFKBP12である。 Mode 370. Embodiment 359. The method of embodiment 359, wherein the small molecule binding domain is FKBP12 of SEQ ID NO: 488.

態様371.態様359の方法であって、低分子結合ドメインが配列番号489のFKBP12-F36Vである。 Aspect 371. Embodiment 359. The method of embodiment 359, wherein the small molecule binding domain is FKBP12-F36V of SEQ ID NO: 489.

態様372.態様359の方法であって、低分子結合ドメインが配列番号490および493~494のシクロフィリンである。 Aspect 372. The method of embodiment 359, wherein the small molecule binding domain is a cyclophilin of SEQ ID NOs: 490 and 493-494.

態様373.態様359の方法であって、低分子結合ドメインが目当ての2つ以上のタンパク質上に組み入れされる。 Aspect 373. Embodiment 359. The method of embodiment 359, wherein the small molecule binding domain is incorporated onto two or more proteins of interest.

態様374.態様373の方法であって、目当ての2つ以上のタンパク質が低分子と接触することによって二量体化し得る。 Aspect 374. Embodiment 373. The method of embodiment 373, wherein the two or more proteins of interest can be dimerized by contacting with a small molecule.

態様375.態様369の方法であって、低分子が、群1の態様163に開示される化合物からなる群から選択される低分子の二量体である。 Embodiment 375. The method of embodiment 369, wherein the small molecule is a dimer of a small molecule selected from the group consisting of the compounds disclosed in embodiment 163 of group 1.

態様376.プライム編集によって、標的ヌクレオチド配列によってコードされる目当てのタンパク質上に免疫エピトープを組み入れる方法であって、方法が:(a)標的ヌクレオチド配列を(i)核酸プログラム型DNA結合タンパク質(napDNAbp)およびポリメラーゼを含むプライム編集因子ならびに(ii)機能部分をコードする編集鋳型を含むPEgRNAと接触させること;(b)免疫エピトープをコードする一本鎖DNA配列を重合すること;ならびに(c)DNA修復および/または複製プロセスによって、標的ヌクレオチド配列における対応する内生鎖の代わりに一本鎖DNA配列を組み込むことを含み、方法が、目当てのタンパク質と免疫エピトープとを含む融合タンパク質をコードする組み換え標的ヌクレオチド配列を生ずる。 Aspect 376. A method of incorporating an immune epitope onto a protein of interest encoded by a target nucleotide sequence by prime editing, the method comprising: (a) converting the target nucleotide sequence to (i) a nucleic acid programmed DNA binding protein (napDNAbp) and a polymerase; (b) polymerizing a single-stranded DNA sequence encoding an immune epitope; and (c) DNA repair and/or incorporating, by a replication process, a single-stranded DNA sequence in place of the corresponding endogenous strand in the target nucleotide sequence, the method yielding a recombinant target nucleotide sequence encoding a fusion protein comprising the protein of interest and the immune epitope. .

態様377.態様376の方法であって、免疫エピトープが:破傷風トキソイド(配列番号396);ジフテリア毒素変異体CRM197(配列番号630);ムンプス免疫エピトープ1(配列番号400);ムンプス免疫エピトープ2(配列番号402);ムンプス免疫エピトープ3(配列番号404);風疹ウイルス(配列番号406);ヘマグルチニン(配列番号408);ノイラミニダーゼ(配列番号410);TAP1(配列番号412);TAP2(配列番号414);クラスI HLAに対するヘマグルチニンエピトープ(配列番号416);クラスI HLAに対するノイラミニダーゼエピトープ(配列番号418);クラスII HLAに対するヘマグルチニンエピトープ(配列番号420);クラスII HLAに対するノイラミニダーゼエピトープ(配列番号422);ヘマグルチニンエピトープH5N1結合クラスIおよびクラスII HLA(配列番号424);ノイラミニダーゼエピトープH5N1結合クラスIおよびクラスII HLA(配列番号426)からなる群から選択される。 Aspect 377. Embodiment 376, wherein the immune epitope is: tetanus toxoid (SEQ ID NO: 396); diphtheria toxin variant CRM197 (SEQ ID NO: 630); mumps immune epitope 1 (SEQ ID NO: 400); mumps immune epitope 2 (SEQ ID NO: 402). Mumps immune epitope 3 (SEQ ID NO: 404); Rubella virus (SEQ ID NO: 406); Hemagglutinin (SEQ ID NO: 408); Neuraminidase (SEQ ID NO: 410); TAP1 (SEQ ID NO: 412); TAP2 (SEQ ID NO: 414); Class I HLA hemagglutinin epitope for class I HLA (SEQ ID NO: 416); neuraminidase epitope for class I HLA (SEQ ID NO: 420); neuraminidase epitope for class II HLA (SEQ ID NO: 422); hemagglutinin epitope H5N1 binding class I and class II HLA (SEQ ID NO: 424); neuraminidase epitope H5N1 binding class I and class II HLA (SEQ ID NO: 426).

態様378.態様376の方法であって、融合タンパク質がPE1、PE2、またはPE3のアミノ酸配列を含む。 Aspect 378. Embodiment 376. The method of embodiment 376, wherein the fusion protein comprises the amino acid sequence of PE1, PE2, or PE3.

態様379.態様376の方法であって、napDNAbpがCas9ニッカーゼ(nCas9)である。 Aspect 379. Embodiment 376, wherein the napDNAbp is Cas9 nickase (nCas9).

態様380.態様376の方法であって、napDNAbpが、配列番号18~88、126、130、137、141、147、153、157、445、460、467、および482~487のアミノ酸配列を含む。 Mode 380. Embodiment 376, wherein the napDNAbp comprises the amino acid sequences of SEQ ID NOs: 18-88, 126, 130, 137, 141, 147, 153, 157, 445, 460, 467, and 482-487.

態様381.態様376の方法であって、PEgRNAが、配列番号101~104、181~183、223~244、277、325~334、336、338、340、342、344、346、348、350、352、354、356、358、360、362、364、366、368、499~505、735~761、776~777を含む。 Aspect 381. 376. The method of embodiment 376, wherein the PEgRNA is , 356, 358, 360, 362, 364, 366, 368, 499-505, 735-761, 776-777.

態様382.プライム編集によって、標的ヌクレオチド配列によってコードされる目当てのタンパク質上に低分子二量体化ドメインを組み入れる方法であって、方法が:(a)標的ヌクレオチド配列を(i)核酸プログラム型DNA結合タンパク質(napDNAbp)およびポリメラーゼを含むプライム編集因子ならびに(ii)低分子二量体化ドメインをコードする編集鋳型を含むPEgRNAと接触させること;(b)免疫エピトープをコードする一本鎖DNA配列を重合すること;ならびに(c)DNA修復および/または複製プロセスによって、標的ヌクレオチド配列における対応する内生鎖の代わりに一本鎖DNA配列を組み込むことを含み、方法が、目当てのタンパク質と低分子二量体化ドメインとを含む融合タンパク質をコードする組み換え標的ヌクレオチド配列を生ずる。 Embodiment 382. A method for incorporating a small dimerization domain onto a protein of interest encoded by a target nucleotide sequence by prime editing, the method comprising: (a) contacting the target nucleotide sequence with (i) a prime editing factor comprising a nucleic acid programmable DNA binding protein (napDNAbp) and a polymerase, and (ii) a PEgRNA comprising an editing template encoding the small dimerization domain; (b) polymerizing a single-stranded DNA sequence encoding an immune epitope; and (c) incorporating the single-stranded DNA sequence in place of the corresponding endogenous strand in the target nucleotide sequence by DNA repair and/or replication processes, the method producing a recombinant target nucleotide sequence encoding a fusion protein comprising the protein of interest and the small dimerization domain.

態様383.態様382の方法であって、さらに、目当ての第2のタンパク質に対して方法を行うことを含む。 Aspect 383. Embodiment 382. The method of embodiment 382, further comprising performing the method on a second protein of interest.

態様384.態様383の方法であって、目当ての第1のタンパク質および目当ての第2のタンパク質が、前記タンパク質の夫々の二量体化ドメインに結合する低分子の存在下において二量体化する。 Aspect 384. Embodiment 383. The method of embodiment 383, wherein the first protein of interest and the second protein of interest dimerize in the presence of a small molecule that binds to a respective dimerization domain of the proteins.

態様385.態様382の方法であって、低分子結合ドメインが配列番号488のFKBP12である。 Aspect 385. The method of embodiment 382, wherein the small molecule binding domain is FKBP12 of SEQ ID NO: 488.

態様386.態様382の方法であって、低分子結合ドメインが配列番号489のFKBP12-F36Vである。 Aspect 386. The method of embodiment 382, wherein the small molecule binding domain is FKBP12-F36V of SEQ ID NO: 489.

態様387.態様382の方法であって、低分子結合ドメインが配列番号490および493~494のシクロフィリンである。 Aspect 387. The method of embodiment 382, wherein the small molecule binding domain is a cyclophilin of SEQ ID NOs: 490 and 493-494.

態様388.態様382の方法であって、低分子が、群1の態様163に開示される化合物からなる群から選択される低分子の二量体である。 Mode 388. Embodiment 382. The method of embodiment 382, wherein the small molecule is a dimer of a small molecule selected from the group consisting of the compounds disclosed in embodiment 163 of group 1.

態様389.態様382の方法であって、融合タンパク質がPE1、PE2、またはPE3のアミノ酸配列を含む。 Aspect 389. Embodiment 382, wherein the fusion protein comprises the amino acid sequence of PE1, PE2, or PE3.

態様390.態様382の方法であって、napDNAbpがCas9ニッカーゼ(nCas9)である。 Aspect 390. Embodiment 382, wherein the napDNAbp is Cas9 nickase (nCas9).

態様391.態様382の方法であって、napDNAbpが、配列番号18~88、126、130、137、141、147、153、157、445、460、467、および482~487のアミノ酸配列を含む。 Embodiment 391. The method of embodiment 382, wherein the napDNAbp comprises the amino acid sequence of SEQ ID NOs: 18-88, 126, 130, 137, 141, 147, 153, 157, 445, 460, 467, and 482-487.

態様392.態様382の方法であって、PEgRNAが、配列番号101~104、181~183、223~244、277、325~334、336、338、340、342、344、346、348、350、352、354、356、358、360、362、364、366、368、499~505、735~761、776~777を含む。 Aspect 392. Embodiment 382, wherein the PEgRNA is SEQ ID NO: 101-104, 181-183, 223-244, 277, 325-334, 336, 338, 340, 342, 344, 346, 348, 350, 352, 354 , 356, 358, 360, 362, 364, 366, 368, 499-505, 735-761, 776-777.

態様393.プライム編集を用いてタンパク質上にペプチドタグまたはエピトープを組み入れる方法であって:タンパク質をコードする標的ヌクレオチド配列を、ペプチドタグをコードする第2のヌクレオチド配列をそれに挿入するように構成されたプライム編集因子構築物と接触させて、組み換えヌクレオチド配列をもたらすことを含み、その結果、ペプチドタグおよびタンパク質が融合タンパク質として組み換えヌクレオチド配列から発現される。 Aspect 393. A method of incorporating a peptide tag or epitope onto a protein using prime editing, comprising: a prime editing agent configured to insert into a target nucleotide sequence encoding a protein a second nucleotide sequence encoding a peptide tag; contacting the recombinant nucleotide sequence with a construct so that the peptide tag and protein are expressed from the recombinant nucleotide sequence as a fusion protein.

態様394.態様383の方法であって、ペプチドタグがタンパク質の精製および/または検出に用いられる。 Aspect 394. Embodiment 383. The method of embodiment 383, wherein the peptide tag is used for protein purification and/or detection.

態様395.態様383の方法であって、ペプチドタグが、ポリヒスチジン(例えば、HHHHHH)(配列番号252~262)、FLAG(例えば、DYKDDDDK)(配列番号2)、V5(例えば、GKPIPNPLLGLDST)(配列番号3)、GCN4、HA(例えば、YPYDVPDYA)(配列番号5)、Myc(例えばEQKLISEED)(配列番号6)、またはGSTである。 Aspect 395. Embodiment 383, wherein the peptide tag is polyhistidine (e.g., HHHHHH) (SEQ ID NO: 252-262), FLAG (e.g., DYKDDDDK) (SEQ ID NO: 2), V5 (e.g., GKPIPNPLLGLLDST) (SEQ ID NO: 3) , GCN4, HA (eg, YPYDVPDYA) (SEQ ID NO: 5), Myc (eg, EQKLISEED) (SEQ ID NO: 6), or GST.

態様396.態様383の方法であって、ペプチドタグが、配列番号1~6、245~249、252~262、264~273、275~276、281、278~288、および622からなる群から選択されるアミノ酸配列を有する。 Aspect 396. Embodiment 383, wherein the peptide tag is an amino acid selected from the group consisting of SEQ ID NOs: 1-6, 245-249, 252-262, 264-273, 275-276, 281, 278-288, and 622. It has an array.

態様397.態様383の方法であって、ペプチドタグがリンカーによってタンパク質に融合される。 Aspect 397. Embodiment 383. The method of embodiment 383, wherein the peptide tag is fused to the protein by a linker.

態様398.態様383の方法であって、融合タンパク質が次の構造を有し:[タンパク質]-[ペプチドタグ]または[ペプチドタグ]-[タンパク質]、「]-[」が任意のリンカーを表す。 Aspect 398. Embodiment 383, wherein the fusion protein has the following structure: [protein]-[peptide tag] or [peptide tag]-[protein], where "]-[" represents an optional linker.

態様399.態様383の方法であって、リンカーが配列番号127、165~176、446、453、および767~769のアミノ酸配列を有する。 Embodiment 399. The method of embodiment 383, wherein the linker has an amino acid sequence of SEQ ID NOs: 127, 165-176, 446, 453, and 767-769.

態様400.態様383の方法であって、プライム編集因子構築物が、配列番号101~104、181~183、223~244、277、325~334、336、338、340、342、344、346、348、350、352、354、356、358、360、362、364、366、368、499~505、735~761、776~777のヌクレオチド配列を含むPEgRNAを含む。 Mode 400. Embodiment 383, wherein the prime editing factor construct comprises SEQ ID NOs: 101-104, 181-183, 223-244, 277, 325-334, 336, 338, 340, 342, 344, 346, 348, 350, Contains PEgRNA containing nucleotide sequences 352, 354, 356, 358, 360, 362, 364, 366, 368, 499-505, 735-761, 776-777.

態様401.態様383の方法であって、PEgRNAがスペーサー、gRNAコア、および伸長アームを含み、スペーサーが標的ヌクレオチド配列に対して相補的であり、伸長アームがペプチドタグをコードする逆転写酵素鋳型を含む。 Embodiment 401. The method of embodiment 383, wherein the PEGRNA comprises a spacer, a gRNA core, and an extension arm, the spacer being complementary to a target nucleotide sequence, and the extension arm comprises a reverse transcriptase template encoding a peptide tag.

態様402.態様383の方法であって、PEgRNAがスペーサー、gRNAコア、および伸長アームを含み、スペーサーが標的ヌクレオチド配列に対して相補的であり、伸長アームがペプチドタグをコードする逆転写酵素鋳型を含む。 Aspect 402. Embodiment 383, wherein the PEgRNA comprises a spacer, a gRNA core, and an extended arm, the spacer being complementary to a target nucleotide sequence, and the extended arm comprising a reverse transcriptase template encoding a peptide tag.

態様403.プライム編集によって標的ヌクレオチド配列によってコードされるPRNP上に1つ以上の防護性変異を組み入れることによって、プリオン病を防止またはその進行を停止させる方法であって、方法が:(a)標的ヌクレオチド配列を(i)核酸プログラム型DNA結合タンパク質(napDNAbp)およびポリメラーゼを含むプライム編集因子ならびに(ii)機能部分をコードする編集鋳型を含むPEgRNAと接触させること;(b)防護性変異をコードする一本鎖DNA配列を重合すること;ならびに(c)DNA修復および/または複製プロセスによって、標的ヌクレオチド配列における対応する内生鎖の代わりに一本鎖DNA配列を組み込むことを含み、方法が、ミスフォールディングに対して耐性である防護性変異を含むPRNPをコードする組み換え標的ヌクレオチド配列を生ずる。 Aspect 403. A method of preventing or halting the progression of a prion disease by incorporating one or more protective mutations on a PRNP encoded by a target nucleotide sequence by prime editing, the method comprising: (a) (i) contacting with a prime editing factor comprising a nucleic acid programmed DNA binding protein (napDNAbp) and a polymerase and (ii) a PEgRNA comprising an editing template encoding a functional moiety; (b) a single strand encoding a protective mutation; polymerizing the DNA sequence; and (c) incorporating the single-stranded DNA sequence in place of the corresponding endogenous strand in the target nucleotide sequence by a DNA repair and/or replication process, wherein the method is resistant to misfolding. A recombinant target nucleotide sequence is generated that encodes a PRNP containing a protective mutation that is resistant.

態様404.態様403の方法であって、プリオン病がヒトプリオン病である。 Aspect 404. Embodiment 403. The method of embodiment 403, wherein the prion disease is a human prion disease.

態様405.態様403の方法であって、プリオン病が動物プリオン病である。 Aspect 405. Embodiment 403. The method of embodiment 403, wherein the prion disease is an animal prion disease.

態様406.態様404の方法であって、プリオン病がクロイツフェルト・ヤコブ病(CJD)、変異型クロイツフェルト・ヤコブ病(vCJD)、ゲルストマン・ストロイスラー・シャインカー症候群、致死性家族性不眠症、またはクールー病である。 Aspect 406. Embodiment 404, wherein the prion disease is Creutzfeldt-Jakob disease (CJD), variant Creutzfeldt-Jakob disease (vCJD), Gerstmann-Strausler-Scheinker syndrome, fatal familial insomnia, or Kuru disease. It is.

態様407.態様403の方法であって、プリオン病が牛海綿状脳症(BSEまたは「狂牛病」)、慢性消耗病(CWD)、スクレイピー、伝達性ミンク脳症、ネコ海綿状脳症、および有蹄類海綿状脳症である。 Aspect 407. Embodiment 403, wherein the prion disease is bovine spongiform encephalopathy (BSE or "mad cow disease"), chronic wasting disease (CWD), scrapie, transmissible mink encephalopathy, feline spongiform encephalopathy, and ungulate spongiform encephalopathy. It is encephalopathy.

態様408.態様403の方法であって、野生型PRNPアミノ酸配列が配列番号291~292である。 Aspect 408. The method of embodiment 403, wherein the wild type PRNP amino acid sequence is SEQ ID NO: 291-292.

態様409.態様403の方法であって、方法が、配列番号293~309、311~323からなる群から選択される改変されたPRNPアミノ酸配列をもたらし、前記改変されたPRNPタンパク質がミスフォールディングに対して耐性である。 Aspect 409. Embodiment 403, wherein the method results in a modified PRNP amino acid sequence selected from the group consisting of SEQ ID NOs: 293-309, 311-323, and wherein the modified PRNP protein is resistant to misfolding. be.

態様410.態様403の方法であって、融合タンパク質がPE1、PE2、またはPE3のアミノ酸配列を含む。 Aspect 410. Embodiment 403, wherein the fusion protein comprises the amino acid sequence of PE1, PE2, or PE3.

態様411.態様403の方法であって、napDNAbpがCas9ニッカーゼ(nCas9)である。 Aspect 411. Embodiment 403, wherein the napDNAbp is Cas9 nickase (nCas9).

態様412.態様403の方法であって、napDNAbpが、配列番号18~88、126、130、137、141、147、153、157、445、460、467、および482~487のアミノ酸配列を含む。 Aspect 412. Embodiment 403, wherein the napDNAbp comprises the amino acid sequences of SEQ ID NOs: 18-88, 126, 130, 137, 141, 147, 153, 157, 445, 460, 467, and 482-487.

態様413.態様403の方法であって、PEgRNAが、配列番号101~104、181~183、223~244、277、325~334、336、338、340、342、344、346、348、350、352、354、356、358、360、362、364、366、368、499~505、735~761、776~777を含む。 Aspect 413. Embodiment 403, wherein the PEgRNA is SEQ ID NO. , 356, 358, 360, 362, 364, 366, 368, 499-505, 735-761, 776-777.

態様414.プライム編集によって、標的ヌクレオチド配列によってコードされる目当てのRNA上にリボヌクレオチドモチーフまたはタグを組み入れる方法であって、方法が:(a)標的ヌクレオチド配列を(i)核酸プログラム型DNA結合タンパク質(napDNAbp)およびポリメラーゼを含むプライム編集因子ならびに(ii)リボヌクレオチドモチーフまたはタグをコードする編集鋳型を含むPEgRNAと接触させること;(b)リボヌクレオチドモチーフまたはタグをコードする一本鎖DNA配列を重合すること;ならびに(c)DNA修復および/または複製プロセスによって、標的ヌクレオチド配列における対応する内生鎖の代わりに一本鎖DNA配列を組み込むことを含み、方法が、リボヌクレオチドモチーフまたはタグを含む目当ての修飾されたRNAをコードする組み換え標的ヌクレオチド配列を生ずる。 Aspect 414. A method of incorporating a ribonucleotide motif or tag onto an RNA of interest encoded by a target nucleotide sequence by prime editing, the method comprising: (a) converting the target nucleotide sequence into (i) a nucleic acid programmed DNA binding protein (napDNAbp); and a prime editing agent comprising a polymerase; and (ii) contacting PEgRNA comprising an editing template encoding a ribonucleotide motif or tag; (b) polymerizing a single-stranded DNA sequence encoding a ribonucleotide motif or tag; and (c) incorporating a single-stranded DNA sequence in place of the corresponding endogenous strand in the target nucleotide sequence by a DNA repair and/or replication process, the method comprising A recombinant target nucleotide sequence is generated that encodes the desired RNA.

態様415.態様414の方法であって、リボヌクレオチドモチーフまたはタグが検出部分である。 Aspect 415. Embodiment 414. The method of embodiment 414, wherein the ribonucleotide motif or tag is the detection moiety.

態様416.態様414の方法であって、リボヌクレオチドモチーフまたはタグが目当てのRNAの発現レベルに影響する。 Aspect 416. Embodiment 414. The method of embodiment 414, wherein the ribonucleotide motif or tag affects the expression level of the RNA of interest.

態様417.態様414の方法であって、リボヌクレオチドモチーフまたはタグが目当てのRNAの輸送または細胞下レベル位置付けに影響する。 Aspect 417. Embodiment 414. The method of embodiment 414, wherein the ribonucleotide motif or tag affects trafficking or subcellular localization of the RNA of interest.

態様418.態様414の方法であって、リボヌクレオチドモチーフまたはタグが、SV40 1型、SV40 2型、SV40 3型、hGH、BGH、rbGlob、TK、MALAT1 ENE-mascRNA、KSHV PAN ENE、Smbox/U1 snRNAボックス、U1 snRNA 3’ボックス、tRNA-リジン、broccoliアプタマー、spinachアプタマー、mangoアプタマー、HDVリボザイム、およびm6Aからなる群から選択される。 Aspect 418. Embodiment 414, wherein the ribonucleotide motif or tag is SV40 type 1, SV40 type 2, SV40 type 3, hGH, BGH, rbGlob, TK, MALAT1 ENE-mascRNA, KSHV PAN ENE, Smbox/U1 snRNA box, selected from the group consisting of U1 snRNA 3' box, tRNA-lysine, broccoli aptamer, spinach aptamer, mango aptamer, HDV ribozyme, and m6A.

態様419.態様414の方法であって、PEgRNAが、配列番号101~104、181~183、223~244、277、325~334、336、338、340、342、344、346、348、350、352、354、356、358、360、362、364、366、368、499~505、735~761、776~777を含む。 Embodiment 419. The method of embodiment 414, wherein the PEGRNA comprises SEQ ID NOs: 101-104, 181-183, 223-244, 277, 325-334, 336, 338, 340, 342, 344, 346, 348, 350, 352, 354, 356, 358, 360, 362, 364, 366, 368, 499-505, 735-761, 776-777.

態様420.態様414の方法であって、融合タンパク質がPE1、PE2、またはPE3のアミノ酸配列を含む。 Aspect 420. Embodiment 414. The method of embodiment 414, wherein the fusion protein comprises the amino acid sequence of PE1, PE2, or PE3.

態様421.態様414の方法であって、napDNAbpがCas9ニッカーゼ(nCas9)である。 Aspect 421. Embodiment 414. The method of embodiment 414, wherein napDNAbp is Cas9 nickase (nCas9).

態様422.態様414の方法であって、napDNAbpが、配列番号18~88、126、130、137、141、147、153、157、445、460、467、および482~487のアミノ酸配列を含む。 Aspect 422. Embodiment 414, wherein the napDNAbp comprises the amino acid sequences of SEQ ID NOs: 18-88, 126, 130, 137, 141, 147, 153, 157, 445, 460, 467, and 482-487.

態様423.プライム編集によって、標的ヌクレオチド配列によってコードされる目当てのタンパク質上の機能部分を組み入れまたは欠失する方法であって、方法が:(a)標的ヌクレオチド配列を(i)核酸プログラム型DNA結合タンパク質(napDNAbp)およびポリメラーゼを含むプライム編集因子ならびに(ii)機能部分またはその欠失をコードする編集鋳型を含むPEgRNAと接触させること;(b)機能部分またはその欠失をコードする一本鎖DNA配列を重合すること;ならびに(c)DNA修復および/または複製プロセスによって、標的ヌクレオチド配列における対応する内生鎖の代わりに一本鎖DNA配列を組み込むことを含み、方法が、目当てのタンパク質および機能部分またはその除去を含む改変されたタンパク質をコードする組み換え標的ヌクレオチド配列を生じ、機能部分がタンパク質の修飾状態または局在状態を変改する。 Embodiment 423. A method for inserting or deleting a functional moiety on a protein of interest encoded by a target nucleotide sequence by prime editing, the method comprising: (a) contacting the target nucleotide sequence with (i) a prime editing factor comprising a nucleic acid programmable DNA binding protein (napDNAbp) and a polymerase, and (ii) a PEgRNA comprising an editing template encoding the functional moiety or deletion; (b) polymerizing a single-stranded DNA sequence encoding the functional moiety or deletion; and (c) incorporating the single-stranded DNA sequence in place of the corresponding endogenous strand in the target nucleotide sequence by DNA repair and/or replication processes, the method producing a recombinant target nucleotide sequence encoding the protein of interest and an altered protein comprising the functional moiety or deletion, the functional moiety altering the modification or localization state of the protein.

態様424.態様423の方法であって、機能部分が、目当てのタンパク質のリン酸化、ユビキチン化、グリコシル化、脂質修飾、ヒドロキシル化、メチル化、アセチル化、クロトニル化、SUMO化状態を変改する。 Aspect 424. Embodiment 423. The method of embodiment 423, wherein the functional moiety alters the phosphorylation, ubiquitination, glycosylation, lipid modification, hydroxylation, methylation, acetylation, crotonylation, or SUMOylation status of the protein of interest.

態様425.融合タンパク質であって、核酸プログラム型DNA結合タンパク質(napDNAbp)ドメインとRNA依存性DNAポリメラーゼ活性を含むドメインとを含む。 Aspect 425. A fusion protein comprising a nucleic acid programmed DNA binding protein (napDNAbp) domain and a domain containing RNA-dependent DNA polymerase activity.

態様426.態様425の融合タンパク質であって、融合タンパク質が、プライム編集ガイドRNA(PEgRNA)の存在下においてプライム編集を実行して、所望のヌクレオチド変化を標的配列上に組み入れることができる。 Aspect 426. The fusion protein of embodiment 425, wherein the fusion protein is capable of performing prime editing in the presence of a prime editing guide RNA (PEgRNA) to incorporate desired nucleotide changes onto the target sequence.

態様427.態様425の融合タンパク質であって、napDNAbpドメインがニッカーゼ活性を有する。 Aspect 427. The fusion protein of embodiment 425, wherein the napDNAbp domain has nickase activity.

態様428.態様425の融合タンパク質であって、napDNAbpドメインがCas9タンパク質またはそのバリアントである。 Aspect 428. The fusion protein of embodiment 425, wherein the napDNAbp domain is a Cas9 protein or a variant thereof.

態様429.態様425の融合タンパク質であって、napDNAbpドメインが、ヌクレアーゼ活性Cas9、ヌクレアーゼ不活性型Cas9(dCas9)、またはCas9ニッカーゼ(nCas9)である。 Aspect 429. The fusion protein of embodiment 425, wherein the napDNAbp domain is nuclease-active Cas9, nuclease-inactive Cas9 (dCas9), or Cas9 nickase (nCas9).

態様430.態様425の融合タンパク質であって、napDNAbpドメインがCas9ニッカーゼ(nCas9)である。 Aspect 430. The fusion protein of embodiment 425, wherein the napDNAbp domain is Cas9 nickase (nCas9).

態様431.態様425の融合タンパク質であって、napDNAbpドメインが:Cas9、Cas12e、Cas12d、Cas12a、Cas12b1、Cas13a、Cas12c、およびアルゴノートからなる群から選択され、任意にニッカーゼ活性を有する。 Aspect 431. The fusion protein of embodiment 425, wherein the napDNAbp domain is selected from the group consisting of: Cas9, Cas12e, Cas12d, Cas12a, Cas12b1, Cas13a, Cas12c, and Argonaute, and optionally has nickase activity.

態様432.態様425の融合タンパク質であって、RNA依存性DNAポリメラーゼ活性を含むドメインが逆転写酵素であり、配列番号89~100、105~122、128~129、132、139、143、149、154、159、235、454、471、516、662、700、701~716、739~741、および766のアミノ酸配列のいずれか1つを含む。 Aspect 432. The fusion protein of embodiment 425, wherein the domain comprising RNA-dependent DNA polymerase activity is reverse transcriptase, and SEQ ID NOs: 89-100, 105-122, 128-129, 132, 139, 143, 149, 154, 159 , 235, 454, 471, 516, 662, 700, 701-716, 739-741, and 766.

態様433.態様425の融合タンパク質であって、RNA依存性DNAポリメラーゼ活性を含むドメインが逆転写酵素であり、配列番号89~100、105~122、128~129、132、139、143、149、154、159、235、454、471、516、662、700、701~716、739~741、および766のいずれか1つのアミノ酸配列との少なくとも80%、85%、90%、95%、98%、または99%配列同一性を有するアミノ酸配列を含み、任意に、RNA依存性DNAポリメラーゼを含むドメインがエラーを起こしやすいである。 Aspect 433. The fusion protein of embodiment 425, wherein the domain comprising RNA-dependent DNA polymerase activity is reverse transcriptase, and SEQ ID NOs: 89-100, 105-122, 128-129, 132, 139, 143, 149, 154, 159 , 235, 454, 471, 516, 662, 700, 701-716, 739-741, and 766. Domains containing amino acid sequences with % sequence identity and optionally containing an RNA-dependent DNA polymerase are error-prone.

態様434.態様425の融合タンパク質であって、RNA依存性DNAポリメラーゼ活性を含むドメインが、レトロウイルスまたはレトロトランスポゾンからの天然に存在する逆転写酵素である。 Aspect 434. The fusion protein of embodiment 425, wherein the domain comprising RNA-dependent DNA polymerase activity is a naturally occurring reverse transcriptase from a retrovirus or retrotransposon.

態様435.態様425の融合タンパク質であって、融合タンパク質がPEgRNAと複合体化したときに標的DNA配列に結合することができる。 Aspect 435. Embodiment 425. The fusion protein of embodiment 425, wherein the fusion protein is capable of binding to a target DNA sequence when complexed with PEgRNA.

態様436.態様435の融合タンパク質であって、標的DNA配列が標的鎖および相補的な非標的鎖を含む。 Aspect 436. Embodiment 435. The fusion protein of embodiment 435, wherein the target DNA sequence comprises a target strand and a complementary non-target strand.

態様437.態様435の融合タンパク質であって、PEgRNAと複合体化した融合タンパク質の結合がRループを形成する。 Aspect 437. The fusion protein of embodiment 435, wherein the binding of the fusion protein complexed to PEgRNA forms an R-loop.

態様438.態様437の融合タンパク質であって、Rループが、(i)PEgRNAと標的鎖とを含むRNA-DNAハイブリッドおよび(ii)相補的な非標的鎖を含む。 Aspect 438. The fusion protein of embodiment 437, wherein the R-loop comprises (i) an RNA-DNA hybrid comprising PEgRNA and a target strand and (ii) a complementary non-target strand.

態様439.態様437の融合タンパク質であって、標的または相補的な非標的鎖がニッキングされて、遊離の3’端を有するプライム配列を形成する。 Aspect 439. The fusion protein of embodiment 437, wherein the target or complementary non-target strand is nicked to form a prime sequence with a free 3' end.

態様440.態様439の融合タンパク質であって、ニック部位が標的鎖上のPAM配列の上流にある。 Aspect 440. The fusion protein of embodiment 439, wherein the nick site is upstream of the PAM sequence on the target strand.

態様441.態様439の融合タンパク質であって、ニック部位が非標的鎖上のPAM配列の上流にある。 Aspect 441. The fusion protein of embodiment 439, wherein the nick site is upstream of the PAM sequence on the non-target strand.

態様442.態様439の融合タンパク質であって、ニック部位がPAM配列の5'端に対して相対的に-1、-2、-3、-4、-5、-6、-7、-8、または-9である。 Aspect 442. The fusion protein of embodiment 439, wherein the nick site is -1, -2, -3, -4, -5, -6, -7, -8, or - relative to the 5' end of the PAM sequence. It is 9.

態様443.態様426の融合タンパク質であって、PEgRNAがガイドRNAおよび少なくとも1つの核酸伸長アームを含む。 Aspect 443. The fusion protein of embodiment 426, wherein the PEgRNA comprises a guide RNA and at least one nucleic acid extension arm.

態様444.態様443の融合タンパク質であって、伸長アームが、ガイドRNAの5'もしくは3'端またはガイドRNAの分子内の位置付けにある。 Aspect 444. The fusion protein of embodiment 443, wherein the extended arm is located at the 5' or 3' end of the guide RNA or within the molecule of the guide RNA.

態様445.態様443の融合タンパク質であって、伸長アームが(i)所望のヌクレオチド変化を含むDNA合成鋳型配列および(ii)プライマー結合部位を含む。 Aspect 445. The fusion protein of embodiment 443, wherein the extended arm comprises (i) a DNA synthesis template sequence containing a desired nucleotide change and (ii) a primer binding site.

態様446.態様445の融合タンパク質であって、DNA合成鋳型配列が、ニック部位に隣接する内生DNA配列に対して相補的である一本鎖DNAフラップをコードし、一本鎖DNAフラップが所望のヌクレオチド変化を含む。 Aspect 446. Embodiment 445. The fusion protein of embodiment 445, wherein the DNA synthesis template sequence encodes a single-stranded DNA flap that is complementary to an endogenous DNA sequence adjacent to the nick site, and wherein the single-stranded DNA flap comprises a desired nucleotide change. including.

態様447.態様443の融合タンパク質であって、伸長アームが、少なくとも5ヌクレオチド、少なくとも6ヌクレオチド、少なくとも7ヌクレオチド、少なくとも8ヌクレオチド、少なくとも9ヌクレオチド、少なくとも10ヌクレオチド、少なくとも11ヌクレオチド、少なくとも12ヌクレオチド、少なくとも13ヌクレオチド、少なくとも14ヌクレオチド、少なくとも15ヌクレオチド、少なくとも16ヌクレオチド、少なくとも17ヌクレオチド、少なくとも18ヌクレオチド、少なくとも19ヌクレオチド、少なくとも20ヌクレオチド、少なくとも21ヌクレオチド、少なくとも22ヌクレオチド、少なくとも23ヌクレオチド、少なくとも24ヌクレオチド、少なくとも25ヌクレオチド、少なくとも26ヌクレオチド、少なくとも27ヌクレオチド、少なくとも28ヌクレオチド、少なくとも29ヌクレオチド、少なくとも30ヌクレオチド、少なくとも31ヌクレオチド、少なくとも32ヌクレオチド、少なくとも33ヌクレオチド、少なくとも34ヌクレオチド、少なくとも35ヌクレオチド、少なくとも36ヌクレオチド、少なくとも37ヌクレオチド、少なくとも38ヌクレオチド、少なくとも39ヌクレオチド、少なくとも40ヌクレオチド、少なくとも41ヌクレオチド、少なくとも42ヌクレオチド、少なくとも43ヌクレオチド、少なくとも44ヌクレオチド、少なくとも45ヌクレオチド、少なくとも46ヌクレオチド、少なくとも47ヌクレオチド、少なくとも48ヌクレオチド、少なくとも49ヌクレオチド、または少なくとも50ヌクレオチドである。 Aspect 447. Embodiment 443, wherein the elongated arm comprises at least 5 nucleotides, at least 6 nucleotides, at least 7 nucleotides, at least 8 nucleotides, at least 9 nucleotides, at least 10 nucleotides, at least 11 nucleotides, at least 12 nucleotides, at least 13 nucleotides, at least 14 nucleotides, at least 15 nucleotides, at least 16 nucleotides, at least 17 nucleotides, at least 18 nucleotides, at least 19 nucleotides, at least 20 nucleotides, at least 21 nucleotides, at least 22 nucleotides, at least 23 nucleotides, at least 24 nucleotides, at least 25 nucleotides, at least 26 nucleotides , at least 27 nucleotides, at least 28 nucleotides, at least 29 nucleotides, at least 30 nucleotides, at least 31 nucleotides, at least 32 nucleotides, at least 33 nucleotides, at least 34 nucleotides, at least 35 nucleotides, at least 36 nucleotides, at least 37 nucleotides, at least 38 nucleotides, at least 39 nucleotides, at least 40 nucleotides, at least 41 nucleotides, at least 42 nucleotides, at least 43 nucleotides, at least 44 nucleotides, at least 45 nucleotides, at least 46 nucleotides, at least 47 nucleotides, at least 48 nucleotides, at least 49 nucleotides, or at least 50 nucleotides.

態様448.態様443の融合タンパク質であって、一本鎖DNAフラップが、ニック部位に隣接する内生DNA配列にハイブリダイズし、それによって所望のヌクレオチド変化を標的鎖上に組み入れる。 Aspect 448. The fusion protein of embodiment 443, wherein the single-stranded DNA flap hybridizes to the endogenous DNA sequence adjacent to the nick site, thereby incorporating the desired nucleotide change on the target strand.

態様449.態様443の融合タンパク質であって、一本鎖DNAフラップが、遊離の5'端を有しかつニック部位に隣接する内生DNA配列に取って代わる。 Embodiment 449. The fusion protein of embodiment 443, wherein the single-stranded DNA flap has a free 5' end and replaces the endogenous DNA sequence adjacent to the nick site.

態様450.態様446の融合タンパク質であって、5'端を有する内生DNA配列が細胞によって切除される。 Mode 450. The fusion protein of embodiment 446, wherein the endogenous DNA sequence having a 5' end is excised by the cell.

態様451.態様446の融合タンパク質であって、5'端を有する内生DNA配列がフラップエンドヌクレアーゼによって切除される。 Aspect 451. The fusion protein of embodiment 446, wherein the endogenous DNA sequence having a 5' end is excised by a flap endonuclease.

態様452.態様448の融合タンパク質であって、一本鎖DNAフラップの細胞性修復が、所望のヌクレオチド変化を非標的鎖上に組み込み、それによって所望の産物を形成する。 Aspect 452. The fusion protein of embodiment 448, wherein cellular repair of the single-stranded DNA flap incorporates the desired nucleotide change onto the non-target strand, thereby forming the desired product.

態様453.態様449の融合タンパク質であって、所望のヌクレオチド変化が、PAM配列の約-4から+10の間、またはPAM配列の約-10から+20の間、またはPAM配列の約-20から+40の間、またはPAM配列の約-30から+100の間である編集窓上に組み入れされる。 Aspect 453. 449. The fusion protein of embodiment 449, wherein the desired nucleotide change is between about -4 and +10 of the PAM sequence, or between about -10 and +20 of the PAM sequence, or between about -20 and +40 of the PAM sequence. or between approximately -30 and +100 of the PAM array.

態様454.態様449の融合タンパク質であって、所望のヌクレオチド変化が、ニック部位の少なくとも1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、または100ヌクレオチド下流に組み入れされる。 Aspect 454. 449. The fusion protein of embodiment 449, wherein the desired nucleotide change is at least 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16 of the nick site. , 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41 , 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66 , 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91 , 92, 93, 94, 95, 96, 97, 98, 99, or 100 nucleotides downstream.

態様455.態様425の融合タンパク質であって、napDNAbpが、配列番号18のアミノ酸配列、または配列番号18のアミノ酸配列との少なくとも80%、85%、90%、95%、98%、もしくは99%配列同一性を有するアミノ酸配列を含む。 Aspect 455. The fusion protein of embodiment 425, wherein napDNAbp is the amino acid sequence of SEQ ID NO: 18 , or at least 80%, 85%, 90%, 95%, 98%, or 99% sequence identity with the amino acid sequence of SEQ ID NO: 18. It contains an amino acid sequence having the following.

態様456.態様425の融合タンパク質であって、napDNAbpが、配列番号18~88、126、130、137、141、147、153、157、445、460、467、および482~487のいずれか1つのアミノ酸配列との少なくとも80%、85%、90%、95%、98%、または99%配列同一性を有するアミノ酸配列を含む。 Aspect 456. The fusion protein of embodiment 425, wherein napDNAbp is an amino acid sequence of any one of SEQ ID NOs: 18-88, 126, 130, 137, 141, 147, 153, 157, 445, 460, 467, and 482-487. amino acid sequences having at least 80%, 85%, 90%, 95%, 98%, or 99% sequence identity.

態様457.先の態様のいずれか1つの融合タンパク質であって、融合タンパク質が構造NH2-[napDNAbp]-[RNA依存性DNAポリメラーゼ活性を含むドメイン]-COOH;またはNH2-[RNA依存性DNAポリメラーゼ活性を含むドメイン]-[napDNAbp]-COOHを含み、「]-[」の夫々のものが任意のリンカー配列の存在を指示する。 Aspect 457. The fusion protein of any one of the preceding embodiments, wherein the fusion protein has the structure NH2-[napDNAbp]-[domain comprising RNA-dependent DNA polymerase activity]-COOH; or NH2-[domain comprising RNA-dependent DNA polymerase activity]-COOH; The domain ]-[napDNAbp]-COOH, with each "]-[" indicating the presence of an optional linker sequence.

態様458.態様457の融合タンパク質であって、リンカー配列が配列番号127、165~176、446、453、および767~769のアミノ酸配列を含む。 Aspect 458. The fusion protein of embodiment 457, wherein the linker sequence comprises the amino acid sequences of SEQ ID NOs: 127, 165-176, 446, 453, and 767-769.

態様459.態様425の融合タンパク質であって、所望のヌクレオチド変化が1ヌクレオチド変化、1つ以上のヌクレオチドの挿入、または1つ以上のヌクレオチドの欠失である。 Aspect 459. The fusion protein of embodiment 425, wherein the desired nucleotide change is a single nucleotide change, an insertion of one or more nucleotides, or a deletion of one or more nucleotides.

態様460.態様459の融合タンパク質であって、挿入または欠失が、少なくとも1、少なくとも2、少なくとも3、少なくとも4、少なくとも5、少なくとも6、少なくとも7、少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも16、少なくとも17、少なくとも18、少なくとも19、少なくとも20、少なくとも21、少なくとも22、少なくとも23、少なくとも24、少なくとも25、少なくとも26、少なくとも27、少なくとも28、少なくとも29、少なくとも30、少なくとも31、少なくとも32、少なくとも33、少なくとも34、少なくとも35、少なくとも36、少なくとも37、少なくとも38、少なくとも39、少なくとも40、少なくとも41、少なくとも42、少なくとも43、少なくとも44、少なくとも45、少なくとも46、少なくとも47、少なくとも48、少なくとも49、または少なくとも50である。 Mode 460. 459. The fusion protein of embodiment 459, wherein the insertion or deletion is at least 1, at least 2, at least 3, at least 4, at least 5, at least 6, at least 7, at least 8, at least 9, at least 10, at least 11, at least 12 , at least 13, at least 14, at least 15, at least 16, at least 17, at least 18, at least 19, at least 20, at least 21, at least 22, at least 23, at least 24, at least 25, at least 26, at least 27, at least 28, at least 29, at least 30, at least 31, at least 32, at least 33, at least 34, at least 35, at least 36, at least 37, at least 38, at least 39, at least 40, at least 41, at least 42, at least 43, at least 44, at least 45, At least 46, at least 47, at least 48, at least 49, or at least 50.

態様461.態様425~460のいずれかの融合タンパク質とPEgRNAとを含む複合体であって、PEgRNAが融合タンパク質をプライム編集の標的DNA配列へと導く。 Aspect 461. A complex comprising the fusion protein of any of embodiments 425-460 and PEgRNA, wherein the PEgRNA directs the fusion protein to a target DNA sequence for prime editing.

態様462.態様461の複合体であって、PEgRNAが、ガイドRNAと、ガイドRNAの3'もしくは5'端またはガイドRNAの分子内の位置における核酸伸長アームとを含む。 Embodiment 462. The complex of embodiment 461, wherein the PEgRNA comprises a guide RNA and a nucleic acid extension arm at the 3' or 5' end of the guide RNA or at an intramolecular position of the guide RNA.

態様463.態様462の複合体であって、PEgRNAが、napDNAbpに結合することおよびnapDNAbpを標的DNA配列へと導くことができる。 Aspect 463. Embodiment 462, wherein the PEgRNA is capable of binding napDNAbp and directing napDNAbp to a target DNA sequence.

態様464.態様463の複合体であって、標的DNA配列が標的鎖および相補的な非標的鎖を含み、ガイドRNAが標的鎖にハイブリダイズして、RNA-DNAハイブリッドおよびRループを形成する。 Aspect 464. The complex of embodiment 463, wherein the target DNA sequence comprises a target strand and a complementary non-target strand, and the guide RNA hybridizes to the target strand to form an RNA-DNA hybrid and an R-loop.

態様465.態様464の複合体であって、少なくとも1つの核酸伸長アームが(i)DNA合成鋳型および(ii)プライマー結合部位を含む。 Aspect 465. The complex of embodiment 464, wherein at least one nucleic acid extension arm comprises (i) a DNA synthesis template and (ii) a primer binding site.

態様466.態様464の複合体であって、PEgRNAが、配列番号101~104、181~183、223~244、277、325~334、336、338、340、342、344、346、348、350、352、354、356、358、360、362、364、366、368、499~505、735~761、776~777のヌクレオチド配列、または配列番号101~104、181~183、223~244、277、325~334、336、338、340、342、344、346、348、350、352、354、356、358、360、362、364、366、368、499~505、735~761、776~777のいずれか1つとの少なくとも85%もしくは少なくとも90%もしくは少なくとも95%もしくは少なくとも98%もしくは少なくとも99%配列同一性を有するヌクレオチド配列を含む。 Aspect 466. The complex of embodiment 464, wherein the PEgRNA is SEQ ID NO: 101-104, 181-183, 223-244, 277, 325-334, 336, 338, 340, 342, 344, 346, 348, 350, 352, Nucleotide sequences of 354, 356, 358, 360, 362, 364, 366, 368, 499-505, 735-761, 776-777, or SEQ ID NO: 101-104, 181-183, 223-244, 277, 325- 334, 336, 338, 340, 342, 344, 346, 348, 350, 352, 354, 356, 358, 360, 362, 364, 366, 368, 499-505, 735-761, 776-777 nucleotide sequences having at least 85% or at least 90% or at least 95% or at least 98% or at least 99% sequence identity with one.

態様467.態様465の複合体であって、DNA合成鋳型が、内生DNA標的と少なくとも80%または85%または90%または95%または99%同一であるヌクレオチド配列を含む。 Aspect 467. The conjugate of embodiment 465, wherein the DNA synthesis template comprises a nucleotide sequence that is at least 80% or 85% or 90% or 95% or 99% identical to the endogenous DNA target.

態様468.態様465の複合体であって、プライマー結合部位が、カットされたDNAの遊離の3'端とハイブリダイズする。 Mode 468. Embodiment 465. The complex of embodiment 465, wherein the primer binding site hybridizes to the free 3' end of the cut DNA.

態様469.態様461の複合体であって、napDNAbpがCas9ニッカーゼである。 Aspect 469. The complex of embodiment 461, wherein napDNAbp is Cas9 nickase.

態様470.態様461の複合体であって、napDNAbpが、配列番号18のアミノ酸配列、または配列番号18との少なくとも80%、85%、90%、95%、98%、もしくは99%配列同一性を有するアミノ酸配列を含む。 Mode 470. The conjugate of embodiment 461, wherein napDNAbp has the amino acid sequence of SEQ ID NO: 18, or an amino acid having at least 80%, 85%, 90%, 95%, 98%, or 99% sequence identity with SEQ ID NO: 18. Contains arrays.

態様471.態様461の複合体であって、napDNAbpが、配列番号18~88、126、130、137、141、147、153、157、445、460、467、および482~487のいずれか1つのアミノ酸配列との少なくとも80%、85%、90%、95%、98%、または99%配列同一性を有するアミノ酸配列を含む。 Aspect 471. Embodiment 461, wherein napDNAbp is an amino acid sequence of any one of SEQ ID NOs: 18-88, 126, 130, 137, 141, 147, 153, 157, 445, 460, 467, and 482-487. amino acid sequences having at least 80%, 85%, 90%, 95%, 98%, or 99% sequence identity.

態様472.態様461の複合体であって、PEgRNAが、ガイドRNAと、ガイドRNAの3'もしくは5'端またはガイドRNAの分子内の位置における核酸伸長アームとを含む。 Aspect 472. Embodiment 461, wherein the PEgRNA comprises a guide RNA and a nucleic acid extension arm at the 3' or 5' end of the guide RNA or at a position within the molecule of the guide RNA.

態様473.態様465の複合体であって、DNA合成鋳型が、内生DNA標的と少なくとも80%または85%または90%または95%または99%同一であるヌクレオチド配列を含む。 Aspect 473. The conjugate of embodiment 465, wherein the DNA synthesis template comprises a nucleotide sequence that is at least 80% or 85% or 90% or 95% or 99% identical to the endogenous DNA target.

態様474.態様465の複合体であって、プライマー結合部位が、カットされたDNAの遊離の3'端とハイブリダイズする。 Aspect 474. Embodiment 465. The complex of embodiment 465, wherein the primer binding site hybridizes to the free 3' end of the cut DNA.

態様475.態様462の複合体であって、PEgRNAが、さらに、リンカー、ステムループ、ヘアピン、トウループ、アプタマー、またはRNA-タンパク質動員ドメインからなる群から選択される少なくとも1つの追加の構造を含む。 Aspect 475. The conjugate of embodiment 462, wherein the PEgRNA further comprises at least one additional structure selected from the group consisting of a linker, stem-loop, hairpin, toe-loop, aptamer, or RNA-protein recruitment domain.

態様476.態様425~461のいずれかの融合タンパク質をコードするポリヌクレオチド。 Aspect 476. A polynucleotide encoding the fusion protein of any of embodiments 425-461.

態様477.上の態様のいずれかのPEgRNAをコードするポリヌクレオチド。 Aspect 477. A polynucleotide encoding PEgRNA of any of the above embodiments.

態様478.態様476のポリヌクレオチドを含むベクターであって、融合タンパク質の発現がプロモーターのコントロール下にある。 Aspect 478. Embodiment 476 A vector comprising the polynucleotide of embodiment 476, wherein expression of the fusion protein is under the control of a promoter.

態様479.態様477のポリヌクレオチドを含むベクターであって、PEgRNAの発現がプロモーターのコントロール下にある。 Aspect 479. A vector comprising the polynucleotide of embodiment 477, wherein expression of PEgRNA is under the control of a promoter.

態様480.態様479のベクターであって、プロモーターがU6プロモーターである。 Mode 480. The vector of embodiment 479, wherein the promoter is the U6 promoter.

態様481.態様479のベクターであって、プロモーターがCMVプロモーターである。 Aspect 481. The vector of embodiment 479, wherein the promoter is a CMV promoter.

態様482.態様480のベクターであって、PEgRNAが、U6プロモーターによる転写効率を改善するために、伸長アーム上のTの1つ以上の繰り返しのクラスターを除去するように操作される。 Aspect 482. Embodiment 480, wherein the PEgRNA is engineered to remove one or more repeat clusters of T on the extended arm to improve transcription efficiency by the U6 promoter.

態様483.態様482のベクターであって、除去されるTの1つ以上の繰り返しのクラスターが、少なくとも3つのT、少なくとも4つのT、少なくとも5つのT、少なくとも6つのT、少なくとも7つのT、少なくとも8つのT、少なくとも9つのT、少なくとも10のT、少なくとも11のT、少なくとも12のT、少なくとも13のT、少なくとも14のT、少なくとも15のT、少なくとも16のT、少なくとも17のT、少なくとも18のT、少なくとも19のT、または少なくとも20のTを含む。 Aspect 483. The vector of embodiment 482, wherein the cluster of one or more repeats of T to be removed comprises at least 3 Ts, at least 4 Ts, at least 5 Ts, at least 6 Ts, at least 7 Ts, at least 8 Ts. T, at least 9 T, at least 10 T, at least 11 T, at least 12 T, at least 13 T, at least 14 T, at least 15 T, at least 16 T, at least 17 T, at least 18 T, at least 19 T, or at least 20 T.

態様484.態様425~460のいずれかの融合タンパク質と融合タンパク質のnapDNAbpに結合したPEgRNAとを含む細胞。 Aspect 484. A cell comprising the fusion protein of any of embodiments 425-460 and PEgRNA bound to napDNAbp of the fusion protein.

態様485.態様461~475のいずれか1つの複合体を含む細胞。 Aspect 485. A cell comprising the complex of any one of embodiments 461-475.

態様486.医薬組成物であって:(i)態様425~460のいずれかの融合タンパク質、態様461~475の複合体、態様476~477のポリヌクレオチド、または態様478~483のベクター;および(ii)薬学的に許容される賦形剤を含む。 Aspect 486. A pharmaceutical composition comprising: (i) a fusion protein of any of embodiments 425-460, a conjugate of embodiments 461-475, a polynucleotide of embodiments 476-477, or a vector of embodiments 478-483; and (ii) a pharmaceutical composition. Contains legally acceptable excipients.

態様487.医薬組成物であって:(i)態様461~475の複合体、(ii)トランスで提供されるポリメラーゼ;および(iii)薬学的に許容される賦形剤を含む。 Aspect 487. A pharmaceutical composition comprising: (i) a conjugate of embodiments 461-475, (ii) a polymerase provided in trans; and (iii) a pharmaceutically acceptable excipient.

態様488.プライム編集のためのキットであって:(i)態様425~460のいずれか1つの融合タンパク質をコードする核酸分子;および(ii)融合タンパク質を標的DNA部位へと導くことができるPEgRNAをコードする核酸分子を含み、(i)および(ii)の核酸分子が単一のDNA構築物または別個のDNA構築物上に含有され得る。 Aspect 488. A kit for prime editing, comprising: (i) a nucleic acid molecule encoding a fusion protein of any one of embodiments 425-460; and (ii) encoding a PEgRNA capable of directing the fusion protein to a target DNA site. The nucleic acid molecules of (i) and (ii) may be contained on a single DNA construct or on separate DNA constructs.

態様489.態様488のキットであって、(i)の核酸分子が、さらに、融合タンパク質の発現を駆動するプロモーターを含む。 Aspect 489. The kit of embodiment 488, wherein the nucleic acid molecule of (i) further comprises a promoter that drives expression of the fusion protein.

態様490.態様488のキットであって、(ii)の核酸分子が、さらに、PEgRNAの発現を駆動するプロモーターを含む。 Aspect 490. The kit of embodiment 488, wherein the nucleic acid molecule of (ii) further comprises a promoter that drives expression of PEgRNA.

態様491.態様490のキットであって、プロモーターがU6プロモーターである。 Aspect 491. The kit of aspect 490, wherein the promoter is a U6 promoter.

態様492.態様490のキットであって、プロモーターがCMVプロモーターである。 Aspect 492. The kit of embodiment 490, wherein the promoter is a CMV promoter.

態様493.態様457の融合タンパク質であって、リンカー配列が配列番号174(1×SGGS)、446(2×SGGS)、3889(3×SGGS)、171(1×XTEN)、3968(1×EAAAK)、3969(2×EAAAK)、および3970(3×EAAAK)のアミノ酸配列を含む。 Aspect 493. The fusion protein of embodiment 457, wherein the linker sequence is SEQ ID NO: 174 (1×SGGS), 446 (2×SGGS), 3889 (3×SGGS), 171 (1×XTEN), 3968 (1×EAAAK), 3969 (2×EAAAK), and 3970 (3×EAAAK) amino acid sequences.

群B.PEガイドおよびデザインの方法
態様1.ガイドRNAとDNA合成鋳型を含む少なくとも1つの核酸伸長アームとを含むPEgRNA。
Group B. PE guide and design method aspect 1. PEgRNA comprising a guide RNA and at least one nucleic acid extension arm comprising a DNA synthesis template.

態様2.態様1のPEgRNAであって、核酸伸長アームがガイドRNAの3'もしくは5'端またはガイドRNAの分子内の位置の位置であり、核酸伸長アームがDNAまたはRNAである。 Aspect 2. PEgRNA of embodiment 1, wherein the nucleic acid extension arm is at the 3' or 5' end of the guide RNA or at a position within the molecule of the guide RNA, and the nucleic acid extension arm is DNA or RNA.

態様3.態様1のPEgRNAであって、PEgRNAが、napDNAbpに結合することおよびnapDNAbpを標的DNA配列へと導くことができる。 Aspect 3. PEgRNA of embodiment 1, wherein the PEgRNA is capable of binding to napDNAbp and directing napDNAbp to a target DNA sequence.

態様4.態様3のPEgRNAであって、標的DNA配列が標的鎖および相補的な非標的鎖を含む。 Aspect 4. The PEgRNA of aspect 3, wherein the target DNA sequence comprises a target strand and a complementary non-target strand.

態様5.態様3のPEgRNAであって、ガイドRNAが標的鎖にハイブリダイズして、RNA-DNAハイブリッドおよびRループを形成する。 Aspect 5. PEgRNA of embodiment 3, wherein the guide RNA hybridizes to the target strand to form an RNA-DNA hybrid and an R-loop.

態様6.態様1のPEgRNAであって、少なくとも1つの核酸伸長アームがさらにプライマー結合部位を含む。 Aspect 6. The PEgRNA of embodiment 1, wherein at least one nucleic acid extension arm further comprises a primer binding site.

態様7.態様1のPEgRNAであって、核酸伸長アームが、少なくとも5ヌクレオチド、少なくとも6ヌクレオチド、少なくとも7ヌクレオチド、少なくとも8ヌクレオチド、少なくとも9ヌクレオチド、少なくとも10ヌクレオチド、少なくとも11ヌクレオチド、少なくとも12ヌクレオチド、少なくとも13ヌクレオチド、少なくとも14ヌクレオチド、少なくとも15ヌクレオチド、少なくとも16ヌクレオチド、少なくとも17ヌクレオチド、少なくとも18ヌクレオチド、少なくとも19ヌクレオチド、少なくとも20ヌクレオチド、少なくとも21ヌクレオチド、少なくとも22ヌクレオチド、少なくとも23ヌクレオチド、少なくとも24ヌクレオチド、少なくとも25ヌクレオチド、少なくとも26ヌクレオチド、少なくとも27ヌクレオチド、少なくとも28ヌクレオチド、少なくとも29ヌクレオチド、少なくとも30ヌクレオチド、少なくとも31ヌクレオチド、少なくとも32ヌクレオチド、少なくとも33ヌクレオチド、少なくとも34ヌクレオチド、少なくとも35ヌクレオチド、少なくとも36ヌクレオチド、少なくとも37ヌクレオチド、少なくとも38ヌクレオチド、少なくとも39ヌクレオチド、少なくとも40ヌクレオチド、少なくとも41ヌクレオチド、少なくとも42ヌクレオチド、少なくとも43ヌクレオチド、少なくとも44ヌクレオチド、少なくとも45ヌクレオチド、少なくとも46ヌクレオチド、少なくとも47ヌクレオチド、少なくとも48ヌクレオチド、少なくとも49ヌクレオチド、または少なくとも50ヌクレオチドである。 Aspect 7. PEgRNA of embodiment 1, wherein the nucleic acid extending arm comprises at least 5 nucleotides, at least 6 nucleotides, at least 7 nucleotides, at least 8 nucleotides, at least 9 nucleotides, at least 10 nucleotides, at least 11 nucleotides, at least 12 nucleotides, at least 13 nucleotides, at least 14 nucleotides, at least 15 nucleotides, at least 16 nucleotides, at least 17 nucleotides, at least 18 nucleotides, at least 19 nucleotides, at least 20 nucleotides, at least 21 nucleotides, at least 22 nucleotides, at least 23 nucleotides, at least 24 nucleotides, at least 25 nucleotides, at least 26 nucleotides , at least 27 nucleotides, at least 28 nucleotides, at least 29 nucleotides, at least 30 nucleotides, at least 31 nucleotides, at least 32 nucleotides, at least 33 nucleotides, at least 34 nucleotides, at least 35 nucleotides, at least 36 nucleotides, at least 37 nucleotides, at least 38 nucleotides, at least 39 nucleotides, at least 40 nucleotides, at least 41 nucleotides, at least 42 nucleotides, at least 43 nucleotides, at least 44 nucleotides, at least 45 nucleotides, at least 46 nucleotides, at least 47 nucleotides, at least 48 nucleotides, at least 49 nucleotides, or at least 50 nucleotides.

態様8.態様1のPEgRNAであって、DNA合成鋳型が、長さが少なくとも3ヌクレオチド、少なくとも4ヌクレオチド、少なくとも5ヌクレオチド、少なくとも6ヌクレオチド、少なくとも7ヌクレオチド、少なくとも8ヌクレオチド、少なくとも9ヌクレオチド、少なくとも10ヌクレオチド、少なくとも11ヌクレオチド、少なくとも12ヌクレオチド、少なくとも13ヌクレオチド、少なくとも14ヌクレオチド、または少なくとも15ヌクレオチドである。 Aspect 8. The PEgRNA of embodiment 1, wherein the DNA synthesis template is at least 3 nucleotides, at least 4 nucleotides, at least 5 nucleotides, at least 6 nucleotides, at least 7 nucleotides, at least 8 nucleotides, at least 9 nucleotides, at least 10 nucleotides, at least 11 nucleotides in length. nucleotides, at least 12 nucleotides, at least 13 nucleotides, at least 14 nucleotides, or at least 15 nucleotides.

態様9.態様6のPEgRNAであって、プライマー結合部位が、長さが少なくとも3ヌクレオチド、少なくとも4ヌクレオチド、少なくとも5ヌクレオチド、少なくとも6ヌクレオチド、少なくとも7ヌクレオチド、少なくとも8ヌクレオチド、少なくとも9ヌクレオチド、少なくとも10ヌクレオチド、少なくとも11ヌクレオチド、少なくとも12ヌクレオチド、少なくとも13ヌクレオチド、少なくとも14ヌクレオチド、または少なくとも15ヌクレオチドである。 Aspect 9. The PEgRNA of embodiment 6, wherein the primer binding site is at least 3 nucleotides, at least 4 nucleotides, at least 5 nucleotides, at least 6 nucleotides, at least 7 nucleotides, at least 8 nucleotides, at least 9 nucleotides, at least 10 nucleotides, at least 11 nucleotides in length. nucleotides, at least 12 nucleotides, at least 13 nucleotides, at least 14 nucleotides, or at least 15 nucleotides.

態様10.態様1のPEgRNAであって、さらに、tRNA、リンカー、ステムループ、ヘアピン、トウループ、アプタマー、またはRNA-タンパク質動員ドメインからなる群から選択される少なくとも1つの追加の構造を含む。 Aspect 10. The PEgRNA of embodiment 1 further comprises at least one additional structure selected from the group consisting of a tRNA, a linker, a stem-loop, a hairpin, a toe-loop, an aptamer, or an RNA-protein recruitment domain.

態様11.態様1のPEgRNAであって、DNA合成鋳型が、ニック部位に隣接する内生DNA配列に対して相補的である一本鎖DNAフラップをコードし、一本鎖DNAフラップが所望のヌクレオチド変化を含む。 Aspect 11. The PEgRNA of embodiment 1, wherein the DNA synthesis template encodes a single-stranded DNA flap that is complementary to an endogenous DNA sequence adjacent to the nick site, and the single-stranded DNA flap contains a desired nucleotide change. .

態様12.態様11のPEgRNAであって、一本鎖DNAフラップが、ニッキングされた標的DNA配列上の5'端を有する内生一本鎖DNAを押し除け、内生一本鎖DNAがニック部位の下流において直ちに隣接する。 Aspect 12. PEgRNA of embodiment 11, wherein the single-stranded DNA flap displaces endogenous single-stranded DNA having a 5' end on the nicked target DNA sequence, and the endogenous single-stranded DNA is located downstream of the nicked site. Immediately adjacent.

態様13.態様11のPEgRNAであって、遊離の5'端を有する内生一本鎖DNAが細胞によって切除される。 Aspect 13. PEgRNA of embodiment 11, wherein the endogenous single-stranded DNA with a free 5' end is excised by the cell.

態様14.態様13のPEgRNAであって、一本鎖DNAフラップの細胞性修復が所望のヌクレオチド変化の組み入れをもたらし、それによって所望の産物を形成する。 Aspect 14. PEgRNA of embodiment 13, wherein cellular repair of the single-stranded DNA flap results in the incorporation of the desired nucleotide change, thereby forming the desired product.

態様15.態様1のPEgRNAであって、配列番号101~104、181~183、223~244、277、325~334、336、338、340、342、344、346、348、350、352、354、356、358、360、362、364、366、368、499~505、735~761、776~777のヌクレオチド配列、または配列番号101~104、181~183、223~244、277、325~334、336、338、340、342、344、346、348、350、352、354、356、358、360、362、364、366、368、499~505、735~761、776~777のいずれか1つとの少なくとも85%もしくは少なくとも90%もしくは少なくとも95%もしくは少なくとも98%もしくは少なくとも99%配列同一性を有するヌクレオチド配列を含む。 Aspect 15. PEgRNA of embodiment 1, comprising SEQ ID NOs: 101-104, 181-183, 223-244, 277, 325-334, 336, 338, 340, 342, 344, 346, 348, 350, 352, 354, 356, 358, 360, 362, 364, 366, 368, 499-505, 735-761, 776-777 nucleotide sequence, or SEQ ID NO: 101-104, 181-183, 223-244, 277, 325-334, 336, At least one of the following nucleotide sequences having 85% or at least 90% or at least 95% or at least 98% or at least 99% sequence identity.

態様16.態様1のPEgRNAであって、DNA合成鋳型が、内生DNA標的と少なくとも80%または85%または90%または95%または99%同一であるヌクレオチド配列を含む。 Aspect 16. The PEgRNA of embodiment 1, wherein the DNA synthesis template comprises a nucleotide sequence that is at least 80% or 85% or 90% or 95% or 99% identical to the endogenous DNA target.

態様17.態様6のPEgRNAであって、プライマー結合部位が、カットされたDNAの遊離の3'端とハイブリダイズする。 Aspect 17. PEgRNA of embodiment 6, wherein the primer binding site hybridizes to the free 3' end of the cut DNA.

態様18.態様10のPEgRNAであって、少なくとも1つの追加の構造がPEgRNAの3'または5'端に位置付けられる。 Aspect 18. The PEgRNA of embodiment 10, wherein the at least one additional structure is located at the 3' or 5' end of the PEgRNA.

態様19.態様10のPEgRNAであって、リンカーが、配列番号127、165~176、446、453、および767~769からなる群から選択されるヌクレオチド配列を含む。 Aspect 19. The PEgRNA of embodiment 10, wherein the linker comprises a nucleotide sequence selected from the group consisting of SEQ ID NOs: 127, 165-176, 446, 453, and 767-769.

態様20.態様10のPEgRNAであって、ステムループが本明細書に記載のステムループから選択されるヌクレオチド配列を含む。 Mode 20. The PEgRNA of embodiment 10, wherein the stem-loop comprises a nucleotide sequence selected from the stem-loops described herein.

態様21.態様10のPEgRNAであって、ヘアピンが本明細書に記載のヘアピンから選択されるヌクレオチド配列を含む。 Aspect 21. The PEgRNA of embodiment 10, wherein the hairpin comprises a nucleotide sequence selected from the hairpins described herein.

態様22.態様10のPEgRNAであって、トウループが本明細書に記載のトウループから選択されるヌクレオチド配列を含む。 Aspect 22. The PEgRNA of aspect 10, wherein the toe loop comprises a nucleotide sequence selected from the toe loops described herein.

態様23.態様10のPEgRNAであって、アプタマーが、本明細書に記載のアプタマーから選択されるヌクレオチド配列を含む。 Aspect 23. The PEgRNA of embodiment 10, wherein the aptamer comprises a nucleotide sequence selected from the aptamers described herein.

態様24.態様10のPEgRNAであって、RNA-タンパク質動員ドメインが、本明細書に記載のRNA-タンパク質動員ドメインから選択されるヌクレオチド配列を含む。 Aspect 24. The PEgRNA of embodiment 10, wherein the RNA-protein recruitment domain comprises a nucleotide sequence selected from the RNA-protein recruitment domains described herein.

態様25.所望のヌクレオチド変化を標的ヌクレオチド配列上に組み入れるためのプライム編集への使用のためのPEgRNAをデザインするための方法であって、前記PEgRNAがスペーサー、gRNAコア、および伸長アームを含み、前記伸長アームがプライマー結合部位およびDNA合成鋳型を含み、前記方法が: Aspect 25. A method for designing PEgRNA for use in prime editing to incorporate a desired nucleotide change onto a target nucleotide sequence, the PEgRNA comprising a spacer, a gRNA core, and an extended arm, the extended arm comprising: comprising a primer binding site and a DNA synthesis template, the method comprising:

(i)標的ヌクレオチド配列上の所望の標的編集部位を選択すること; (i) selecting the desired target editing site on the target nucleotide sequence;

(ii)標的編集部位の上流および下流のコンテキストヌクレオチド配列を得ること; (ii) obtaining the context nucleotide sequences upstream and downstream of the target editing site;

(iii)所望の標的編集部位に対して近位であるコンテキストヌクレオチド配列上の推定プロトスペーサー隣接モチーフ(PAM)部位を位置付けること; (iii) positioning a putative protospacer adjacent motif (PAM) site on the context nucleotide sequence that is proximal to the desired target editing site;

(iv)各推定PAM部位について対応するニック部位を同定すること; (iv) Identifying the corresponding nick site for each putative PAM site;

(v)スペーサーをデザインすること; (v) designing spacers;

(vi)gRNAコアをデザインすること; (vi) designing the gRNA core;

(vii)伸長アームをデザインすること;および (vii) designing an extension arm; and

(viii)スペーサー、gRNAコア、および伸長アームをコンカテネーションすることによって完全なPEgRNAを構築すること、
を含む。
(viii) constructing a complete PEgRNA by concatenating a spacer, a gRNA core, and an extended arm;
including.

態様26.態様25の方法であって、所望の標的編集部位を選択するステップ(i)が、疾患を引き起こす変異を選択することを含む。 Aspect 26. The method of aspect 25, wherein step (i) of selecting the desired target editing site comprises selecting a disease-causing mutation.

態様27.態様26の方法であって、疾患を引き起こす変異が:がん、自己免疫障害、神経学的障害、皮膚障害、呼吸疾患、および心臓疾患からなる群から選択される疾患に関連する。 Aspect 27. Embodiment 26. The method of embodiment 26, wherein the disease-causing mutation is associated with a disease selected from the group consisting of: cancer, autoimmune disorders, neurological disorders, skin disorders, respiratory disorders, and heart disorders.

態様28.態様25の方法であって、標的編集部位から上流および下流のコンテキストヌクレオチド配列を得るステップ(ii)が、所望の標的編集部位を含む領域の約50~55塩基対(bp)、約55~60bp、約60~65bp、約65~70bp、約70~75bp、約75~80bp、約80~85bp、約85~90bp、約90~95bp、約95~100bp、約100~105bp、約105~110bp、約110~125bp、約125~130bp、約130~135bp、約135~140bp、約140~145bp、約145~150bp、約150~155bp、約155~160bp、約160~165bp、約165~170bp、約170~175bp、約175~180bp、約180~185bp、約185~190bp、約190~195bp、約195~200bp、約200~205bp、約205~210bp、約210~215bp、約215~220bp、約220~225bp、約225~230bp、約230~235bp、約235~240bp、約240~245bp、または約245~250bpを得ることを含む。 Aspect 28. Embodiment 25, wherein step (ii) of obtaining upstream and downstream context nucleotide sequences from the target editing site comprises about 50-55 base pairs (bp), about 55-60 bp of the region containing the desired target editing site. , about 60-65bp, about 65-70bp, about 70-75bp, about 75-80bp, about 80-85bp, about 85-90bp, about 90-95bp, about 95-100bp, about 100-105bp, about 105-110bp , about 110-125bp, about 125-130bp, about 130-135bp, about 135-140bp, about 140-145bp, about 145-150bp, about 150-155bp, about 155-160bp, about 160-165bp, about 165-170bp , about 170-175bp, about 175-180bp, about 180-185bp, about 185-190bp, about 190-195bp, about 195-200bp, about 200-205bp, about 205-210bp, about 210-215bp, about 215-220bp , about 220-225bp, about 225-230bp, about 230-235bp, about 235-240bp, about 240-245bp, or about 245-250bp.

態様29.態様28の方法であって、所望の標的編集部位が、コンテキストヌクレオチド配列の各端からおよそ等距離に位置取る。 Aspect 29. Embodiment 28. The method of embodiment 28, wherein the desired target editing site is located approximately equidistant from each end of the context nucleotide sequence.

態様30.態様25の方法であって、ステップ(iii)において、推定PAM部位が所望の標的編集部位に対して近位である。 Aspect 30. Embodiment 25. The method of embodiment 25, wherein in step (iii) the putative PAM site is proximal to the desired target editing site.

態様31.態様25の方法であって、ステップ(iii)において、推定PAM部位が、標的編集部位から30ヌクレオチド未満の、または標的編集部位から29、28、27、26、25、24、23、22、21、20、19、18、17、16、15、14、13、12、11、10、9、8、7、6、5、4、3、もしくは2ヌクレオチド未満の位置に位置付けられた関連するニック部位を有するものを含む。 Aspect 31. The method of embodiment 25, wherein in step (iii) the putative PAM site is less than 30 nucleotides from the target editing site, or 29, 28, 27, 26, 25, 24, 23, 22, 21 , 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, or related nicks located at less than 2 nucleotide positions Including those with parts.

態様32.態様25の方法であって、ステップ(iii)において、推定PAM部位が、標的編集部位から30ヌクレオチド超の、または標的編集部位から31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、もしくは100ヌクレオチド超の位置に位置付けられた関連するニック部位を有するものを含む。 Aspect 32. The method of embodiment 25, wherein in step (iii) the putative PAM site is more than 30 nucleotides from the target editing site, or 31, 32, 33, 34, 35, 36, 37, 38, 39 from the target editing site. , 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64 , 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89 , 90, 91, 92, 93, 94, 95, 96, 97, 98, 99, or with an associated nick site located at more than 100 nucleotide positions.

態様33.態様25の方法であって、ステップ(iii)において、推定PAM部位が、前記PAM部位に結合する1つのまたは対応するnapDNAbpに関連する。 Aspect 33. 26. The method of embodiment 25, wherein in step (iii) the putative PAM site is associated with one or a corresponding napDNAbp that binds to said PAM site.

態様34.態様33の方法であって、推定PAM部位およびそれらの対応するnapDNAbpが、次の群分けのいずれかから選択される:(a)配列番号18~25および87~88のSpCas9ならびにNGG;(b)Sp VQR nCas9;ならびに(c)NGAN。 Embodiment 34. The method of embodiment 33, wherein the putative PAM sites and their corresponding napDNAbp are selected from any of the following groupings: (a) SpCas9 and NGG of SEQ ID NOs: 18-25 and 87-88; (b) Sp VQR nCas9; and (c) NGAN.

態様35.態様25の方法であって、スペーサーをデザインするステップ(v)が、各推定PAMに関連するプロトスペーサー配列の相補ヌクレオチド配列を決定することを含む。 Aspect 35. Embodiment 25. The method of embodiment 25, wherein step (v) of designing a spacer comprises determining the complementary nucleotide sequence of the protospacer sequence associated with each putative PAM.

態様36.態様25の方法であって、gRNAコアをデザインするステップ(vi)が、各推定PAMという文脈において、前記推定PAMの夫々に関連するnapDNAbpに結合することができるgRNAコア配列を選択することを含む。 Aspect 36. Embodiment 25, wherein the step (vi) of designing a gRNA core comprises, in the context of each putative PAM, selecting a gRNA core sequence capable of binding to the napDNAbp associated with each of said putative PAMs. .

態様37.態様25の方法であって、伸長アームをデザインするステップ(vii)が、(a)目当ての編集を含むDNA合成鋳型および(b)プライマー結合部位をデザインすることを含む。 Aspect 37. Embodiment 25. The method of embodiment 25, wherein step (vii) of designing the extension arm comprises designing (a) a DNA synthesis template containing the desired edit and (b) a primer binding site.

態様38.態様37の方法であって、プライマー結合部位をデザインすることが、(a)標的ヌクレオチド配列のPAM含有鎖上のDNAプライマーを同定し、DNAプライマーの3'端が、PAM部位に関連するニック部位の上流の最初のヌクレオチドであること、および(b)DNAプライマーの相補体をデザインし、前記相補体がプライマー結合部位を形成することを含む。 Aspect 38. 38. The method of aspect 37, wherein designing a primer binding site comprises: (a) identifying a DNA primer on a PAM-containing strand of the target nucleotide sequence, wherein the 3' end of the DNA primer has a nick site associated with the PAM site; and (b) designing a complement of the DNA primer, said complement forming a primer binding site.

態様39.態様38の方法であって、プライマー結合部位が長さが8から15ヌクレオチドである。 Aspect 39. 39. The method of embodiment 38, wherein the primer binding site is 8 to 15 nucleotides in length.

態様40.態様38の方法であって、DNAプライマーが約40~60%GC含量を含有する場合に、プライマー結合部位が12~13ヌクレオチドである。 Aspect 40. The method of embodiment 38, wherein the primer binding site is 12-13 nucleotides when the DNA primer contains about 40-60% GC content.

態様41.態様38の方法であって、DNAプライマーが約40%未満のGC含量を含有する場合に、プライマー結合部位が14~15ヌクレオチドである。 Embodiment 41. The method of embodiment 38, wherein the primer binding site is 14-15 nucleotides when the DNA primer contains less than about 40% GC content.

態様42.態様38の方法であって、DNAプライマーが約60%よりも多大なGC含量を含有する場合に、プライマー結合部位が8~11ヌクレオチドである。 Aspect 42. The method of embodiment 38, wherein the DNA primer contains a GC content of greater than about 60%, wherein the primer binding site is 8-11 nucleotides.

態様43.プライム編集の方法であって、標的DNA配列を、態様1~24のいずれかのPEgRNAならびにnapDNAbpおよびRNA依存性DNAポリメラーゼ活性を有するドメインを含むプライム編集因子融合タンパク質と接触させることを含む。 Aspect 43. A method of prime editing comprising contacting a target DNA sequence with a PEgRNA of any of embodiments 1-24 and a prime editing factor fusion protein comprising napDNAbp and a domain having RNA-dependent DNA polymerase activity.

態様44.態様43の方法であって、napDNAbpがニッカーゼ活性を有する。 Aspect 44. 44. The method of embodiment 43, wherein the napDNAbp has nickase activity.

態様45.態様43の方法であって、napDNAbpがCas9タンパク質またはそのバリアントである。 Aspect 45. 44. The method of embodiment 43, wherein napDNAbp is a Cas9 protein or a variant thereof.

態様46.態様43の方法であって、napDNAbpがヌクレアーゼ活性Cas9、ヌクレアーゼ不活性型Cas9(dCas9)、またはCas9ニッカーゼ(nCas9)である。 Aspect 46. 44. The method of embodiment 43, wherein the napDNAbp is nuclease-active Cas9, nuclease-inactive Cas9 (dCas9), or Cas9 nickase (nCas9).

態様47.態様43の方法であって、napDNAbpがCas9ニッカーゼ(nCas9)である。 Aspect 47. Embodiment 43. The method of embodiment 43, wherein napDNAbp is Cas9 nickase (nCas9).

態様48.態様43の方法であって、napDNAbpが:Cas9、Cas12e、Cas12d、Cas12a、Cas12b1、Cas13a、Cas12c、およびアルゴノートからなる群から選択され、任意にニッカーゼ活性を有する。 Aspect 48. 44. The method of embodiment 43, wherein the napDNAbp is selected from the group consisting of: Cas9, Cas12e, Cas12d, Cas12a, Cas12b1, Cas13a, Cas12c, and Argonaute, and optionally has nickase activity.

態様49.態様43の方法であって、RNA依存性DNAポリメラーゼ活性を含むドメインが逆転写酵素であり、配列番号89~100、105~122、128~129、132、139、143、149、154、159、235、454、471、516、662、700、701~716、739~741、および766のアミノ酸配列のいずれか1つを含む。 Aspect 49. 44. The method of embodiment 43, wherein the domain comprising RNA-dependent DNA polymerase activity is reverse transcriptase, and SEQ ID NOs: 89-100, 105-122, 128-129, 132, 139, 143, 149, 154, 159, 235, 454, 471, 516, 662, 700, 701-716, 739-741, and 766.

態様50.態様43の方法であって、RNA依存性DNAポリメラーゼ活性を含むドメインが逆転写酵素であり、配列番号89~100、105~122、128~129、132、139、143、149、154、159、235、454、471、516、662、700、701~716、739~741、および766のいずれか1つのアミノ酸配列との少なくとも80%、85%、90%、95%、98%、または99%配列同一性を有するアミノ酸配列を含む。 Aspect 50. 44. The method of embodiment 43, wherein the domain comprising RNA-dependent DNA polymerase activity is reverse transcriptase, and SEQ ID NOs: 89-100, 105-122, 128-129, 132, 139, 143, 149, 154, 159, At least 80%, 85%, 90%, 95%, 98%, or 99% with any one amino acid sequence of 235, 454, 471, 516, 662, 700, 701-716, 739-741, and 766 Contains amino acid sequences that have sequence identity.

態様51.態様43の方法であって、RNA依存性DNAポリメラーゼ活性を含むドメインが、レトロウイルスまたはレトロトランスポゾンからの天然に存在する逆転写酵素である。 Aspect 51. 44. The method of embodiment 43, wherein the domain comprising RNA-dependent DNA polymerase activity is a naturally occurring reverse transcriptase from a retrovirus or retrotransposon.

群C.PE複合体
態様1.プライム編集のための複合体であって:
Group C. PE composite embodiment 1. A complex for prime editing:

(i)核酸プログラム型DNA結合タンパク質(napDNAbp)とaRNA依存性DNAポリメラーゼ活性を含むドメインとを含む融合タンパク質;および (i) a fusion protein comprising a nucleic acid programmed DNA binding protein (napDNAbp) and a domain containing aRNA-dependent DNA polymerase activity; and

(ii)プライム編集ガイドRNA(PEgRNA)、
を含む。
(ii) prime editing guide RNA (PEgRNA),
including.

態様2.態様1の複合体であって、融合タンパク質が、プライム編集ガイドRNA(PEgRNA)の存在下においてプライム編集を実行して、所望のヌクレオチド変化を標的配列上に組み入れることができる。 Aspect 2. The complex of embodiment 1, wherein the fusion protein is capable of performing prime editing in the presence of a prime editing guide RNA (PEgRNA) to incorporate desired nucleotide changes onto the target sequence.

態様3.態様11の複合体であって、napDNAbpがニッカーゼ活性を有する。 Aspect 3. The complex of embodiment 11, wherein napDNAbp has nickase activity.

態様4.態様1の複合体であって、napDNAbpがCas9タンパク質またはそのバリアントである。 Embodiment 4. The complex of embodiment 1, wherein napDNAbp is a Cas9 protein or a variant thereof.

態様5.態様1の複合体であって、napDNAbpがヌクレアーゼ活性Cas9、ヌクレアーゼ不活性型Cas9(dCas9)、またはCas9ニッカーゼ(nCas9)である。 Aspect 5. The complex of embodiment 1, wherein napDNAbp is nuclease-active Cas9, nuclease-inactive Cas9 (dCas9), or Cas9 nickase (nCas9).

態様6.態様1の複合体であって、napDNAbpがCas9ニッカーゼ(nCas9)である。 Aspect 6. The complex of embodiment 1, wherein napDNAbp is Cas9 nickase (nCas9).

態様7.態様1の複合体であって、napDNAbpが:Cas9、Cas12e、Cas12d、Cas12a、Cas12b1、Cas13a、Cas12c、およびアルゴノートからなる群から選択され、任意にニッカーゼ活性を有する。 Aspect 7. The complex of embodiment 1, wherein the napDNAbp is selected from the group consisting of: Cas9, Cas12e, Cas12d, Cas12a, Cas12b1, Cas13a, Cas12c, and Argonaute, and optionally has nickase activity.

態様8.態様1の複合体であって、RNA依存性DNAポリメラーゼ活性を含むドメインが逆転写酵素であり、配列番号89~100、105~122、128~129、132、139、143、149、154、159、235、454、471、516、662、700、701~716、739~741、および766のアミノ酸配列のいずれか1つを含む。 Aspect 8. The complex of embodiment 1, wherein the domain containing RNA-dependent DNA polymerase activity is reverse transcriptase, and SEQ ID NOs: 89-100, 105-122, 128-129, 132, 139, 143, 149, 154, 159 , 235, 454, 471, 516, 662, 700, 701-716, 739-741, and 766.

態様9.態様1の複合体であって、RNA依存性DNAポリメラーゼ活性を含むドメインが逆転写酵素であり、配列番号89~100、105~122、128~129、132、139、143、149、154、159、235、454、471、516、662、700、701~716、739~741、および766のいずれか1つのアミノ酸配列との少なくとも80%、85%、90%、95%、98%、または99%配列同一性を有するアミノ酸配列を含む。 Aspect 9. The complex of embodiment 1, wherein the domain containing RNA-dependent DNA polymerase activity is reverse transcriptase, and SEQ ID NOs: 89-100, 105-122, 128-129, 132, 139, 143, 149, 154, 159 , 235, 454, 471, 516, 662, 700, 701-716, 739-741, and 766. % sequence identity.

態様10.態様1の複合体であって、RNA依存性DNAポリメラーゼ活性を含むドメインが、レトロウイルスまたはレトロトランスポゾンからの天然に存在する逆転写酵素である。 Aspect 10. The complex of embodiment 1, wherein the domain comprising RNA-dependent DNA polymerase activity is a naturally occurring reverse transcriptase from a retrovirus or retrotransposon.

態様11.態様1の複合体であって、融合タンパク質がPEgRNAと複合体化したときに標的DNA配列に結合することができる。 Aspect 11. The complex of embodiment 1, wherein the fusion protein is capable of binding to a target DNA sequence when complexed with PEgRNA.

態様12.態様1の複合体であって、PEgRNAが、ガイドRNAとDNA合成鋳型を含む少なくとも1つの核酸伸長アームとを含む。 Aspect 12. The complex of embodiment 1, wherein the PEgRNA comprises a guide RNA and at least one nucleic acid extension arm comprising a DNA synthesis template.

態様13.態様12の複合体であって、核酸伸長アームがガイドRNAの3'もしくは5'端またはガイドRNAの分子内の位置の位置であり、核酸伸長アームがDNAまたはRNAである。 Aspect 13. The complex of embodiment 12, wherein the nucleic acid extension arm is at the 3' or 5' end of the guide RNA or at a position within the molecule of the guide RNA, and the nucleic acid extension arm is DNA or RNA.

態様14.態様12の複合体であって、PEgRNAが、napDNAbpに結合することおよびnapDNAbpを標的DNA配列へと導くことができる。 Aspect 14. The complex of embodiment 12, wherein the PEgRNA is capable of binding napDNAbp and directing napDNAbp to a target DNA sequence.

態様15.態様14の複合体であって、標的DNA配列が標的鎖および相補的な非標的鎖を含む。 Aspect 15. Embodiment 14. The conjugate of embodiment 14, wherein the target DNA sequence comprises a target strand and a complementary non-target strand.

態様16.態様12の複合体であって、ガイドRNAが標的鎖にハイブリダイズして、RNA-DNAハイブリッドおよびRループを形成する。 Aspect 16. The complex of embodiment 12, wherein the guide RNA hybridizes to the target strand to form an RNA-DNA hybrid and an R-loop.

態様17.態様12の複合体であって、少なくとも1つの核酸伸長アームがさらにプライマー結合部位を含む。 Aspect 17. The conjugate of embodiment 12, wherein at least one nucleic acid extension arm further comprises a primer binding site.

態様18.態様12の複合体であって、核酸伸長アームが、少なくとも5ヌクレオチド、少なくとも6ヌクレオチド、少なくとも7ヌクレオチド、少なくとも8ヌクレオチド、少なくとも9ヌクレオチド、少なくとも10ヌクレオチド、少なくとも11ヌクレオチド、少なくとも12ヌクレオチド、少なくとも13ヌクレオチド、少なくとも14ヌクレオチド、少なくとも15ヌクレオチド、少なくとも16ヌクレオチド、少なくとも17ヌクレオチド、少なくとも18ヌクレオチド、少なくとも19ヌクレオチド、少なくとも20ヌクレオチド、少なくとも21ヌクレオチド、少なくとも22ヌクレオチド、少なくとも23ヌクレオチド、少なくとも24ヌクレオチド、少なくとも25ヌクレオチド、少なくとも26ヌクレオチド、少なくとも27ヌクレオチド、少なくとも28ヌクレオチド、少なくとも29ヌクレオチド、少なくとも30ヌクレオチド、少なくとも31ヌクレオチド、少なくとも32ヌクレオチド、少なくとも33ヌクレオチド、少なくとも34ヌクレオチド、少なくとも35ヌクレオチド、少なくとも36ヌクレオチド、少なくとも37ヌクレオチド、少なくとも38ヌクレオチド、少なくとも39ヌクレオチド、少なくとも40ヌクレオチド、少なくとも41ヌクレオチド、少なくとも42ヌクレオチド、少なくとも43ヌクレオチド、少なくとも44ヌクレオチド、少なくとも45ヌクレオチド、少なくとも46ヌクレオチド、少なくとも47ヌクレオチド、少なくとも48ヌクレオチド、少なくとも49ヌクレオチド、または少なくとも50ヌクレオチドである。 Aspect 18. The conjugate of embodiment 12, wherein the nucleic acid extending arm comprises at least 5 nucleotides, at least 6 nucleotides, at least 7 nucleotides, at least 8 nucleotides, at least 9 nucleotides, at least 10 nucleotides, at least 11 nucleotides, at least 12 nucleotides, at least 13 nucleotides, At least 14 nucleotides, at least 15 nucleotides, at least 16 nucleotides, at least 17 nucleotides, at least 18 nucleotides, at least 19 nucleotides, at least 20 nucleotides, at least 21 nucleotides, at least 22 nucleotides, at least 23 nucleotides, at least 24 nucleotides, at least 25 nucleotides, at least 26 nucleotides, at least 27 nucleotides, at least 28 nucleotides, at least 29 nucleotides, at least 30 nucleotides, at least 31 nucleotides, at least 32 nucleotides, at least 33 nucleotides, at least 34 nucleotides, at least 35 nucleotides, at least 36 nucleotides, at least 37 nucleotides, at least 38 nucleotides, at least 39 nucleotides, at least 40 nucleotides, at least 41 nucleotides, at least 42 nucleotides, at least 43 nucleotides, at least 44 nucleotides, at least 45 nucleotides, at least 46 nucleotides, at least 47 nucleotides, at least 48 nucleotides, at least 49 nucleotides, or at least 50 nucleotides .

態様19.態様12の複合体であって、DNA合成鋳型が、長さが少なくとも3ヌクレオチド、少なくとも4ヌクレオチド、少なくとも5ヌクレオチド、少なくとも6ヌクレオチド、少なくとも7ヌクレオチド、少なくとも8ヌクレオチド、少なくとも9ヌクレオチド、少なくとも10ヌクレオチド、少なくとも11ヌクレオチド、少なくとも12ヌクレオチド、少なくとも13ヌクレオチド、少なくとも14ヌクレオチド、または少なくとも15ヌクレオチドである。 Aspect 19. The complex of embodiment 12, wherein the DNA synthesis template is at least 3 nucleotides, at least 4 nucleotides, at least 5 nucleotides, at least 6 nucleotides, at least 7 nucleotides, at least 8 nucleotides, at least 9 nucleotides, at least 10 nucleotides, at least 11 nucleotides, at least 12 nucleotides, at least 13 nucleotides, at least 14 nucleotides, or at least 15 nucleotides.

態様20.態様17の複合体であって、プライマー結合部位が、長さが少なくとも3ヌクレオチド、少なくとも4ヌクレオチド、少なくとも5ヌクレオチド、少なくとも6ヌクレオチド、少なくとも7ヌクレオチド、少なくとも8ヌクレオチド、少なくとも9ヌクレオチド、少なくとも10ヌクレオチド、少なくとも11ヌクレオチド、少なくとも12ヌクレオチド、少なくとも13ヌクレオチド、少なくとも14ヌクレオチド、または少なくとも15ヌクレオチドである。 Mode 20. Embodiment 17, wherein the primer binding site is at least 3 nucleotides, at least 4 nucleotides, at least 5 nucleotides, at least 6 nucleotides, at least 7 nucleotides, at least 8 nucleotides, at least 9 nucleotides, at least 10 nucleotides, at least 11 nucleotides, at least 12 nucleotides, at least 13 nucleotides, at least 14 nucleotides, or at least 15 nucleotides.

態様21.態様12の複合体であって、PEgRNAが、さらに、リンカー、ステムループ、ヘアピン、トウループ、アプタマー、またはRNA-タンパク質動員ドメインからなる群から選択される少なくとも1つの追加の構造を含む。 Aspect 21. The conjugate of embodiment 12, wherein the PEgRNA further comprises at least one additional structure selected from the group consisting of a linker, a stem-loop, a hairpin, a toe-loop, an aptamer, or an RNA-protein recruitment domain.

態様22.態様12の複合体であって、DNA合成鋳型が、ニック部位に隣接する内生DNA配列に対して相補的である一本鎖DNAフラップをコードし、一本鎖DNAフラップが所望のヌクレオチド変化を含む。 Aspect 22. The complex of embodiment 12, wherein the DNA synthesis template encodes a single-stranded DNA flap that is complementary to an endogenous DNA sequence adjacent to the nick site, and the single-stranded DNA flap makes a desired nucleotide change. include.

態様23.態様22の複合体であって、一本鎖DNAフラップが、ニッキングされた標的DNA配列上の5'端を有する内生一本鎖DNAを押し除け、内生一本鎖DNAがニック部位の下流において直ちに隣接する。 Aspect 23. The complex of embodiment 22, wherein the single-stranded DNA flap displaces endogenous single-stranded DNA having a 5' end on the nicked target DNA sequence, and the endogenous single-stranded DNA is disposed downstream of the nick site. Immediately adjacent.

態様24.態様23の複合体であって、遊離の5'端を有する内生一本鎖DNAが細胞によって切除される。 Aspect 24. The complex of embodiment 23, wherein the endogenous single-stranded DNA with a free 5' end is excised by the cell.

態様25.態様23の複合体であって、一本鎖DNAフラップの細胞性修復が所望のヌクレオチド変化の組み入れをもたらし、それによって所望の産物を形成する。 Aspect 25. The complex of embodiment 23, wherein cellular repair of the single-stranded DNA flap results in the incorporation of a desired nucleotide change, thereby forming a desired product.

態様26.態様12の複合体であって、PEgRNAが、配列番号101~104、181~183、223~244、277、325~334、336、338、340、342、344、346、348、350、352、354、356、358、360、362、364、366、368、499~505、735~761、776~777のヌクレオチド配列、または配列番号101~104、181~183、223~244、277、325~334、336、338、340、342、344、346、348、350、352、354、356、358、360、362、364、366、368、499~505、735~761、776~777のいずれか1つとの少なくとも85%もしくは少なくとも90%もしくは少なくとも95%もしくは少なくとも98%もしくは少なくとも99%配列同一性を有するヌクレオチド配列を含む。 Aspect 26. The complex of embodiment 12, wherein PEgRNA is SEQ ID NO : 101-104, 181-183, 223-244, 277, 325-334, 336, 338, 340, 342, 344, 346, 348, 350, 352, Nucleotide sequences of 354, 356, 358, 360, 362, 364, 366, 368, 499-505, 735-761, 776-777, or SEQ ID NO: 101-104, 181-183, 223-244, 277, 325- 334, 336, 338, 340, 342, 344, 346, 348, 350, 352, 354, 356, 358, 360, 362, 364, 366, 368, 499-505, 735-761, 776-777 nucleotide sequences having at least 85% or at least 90% or at least 95% or at least 98% or at least 99% sequence identity with one.

態様27.態様12の複合体であって、DNA合成鋳型が、内生DNA標的と少なくとも80%または85%または90%または95%または99%同一であるヌクレオチド配列を含む。 Aspect 27. The conjugate of embodiment 12, wherein the DNA synthesis template comprises a nucleotide sequence that is at least 80% or 85% or 90% or 95% or 99% identical to the endogenous DNA target.

態様28.態様17の複合体であって、プライマー結合部位が、カットされたDNAの遊離の3'端とハイブリダイズする。 Aspect 28. The complex of embodiment 17, wherein the primer binding site hybridizes to the free 3' end of the cut DNA.

態様29.態様21の複合体であって、少なくとも1つの追加の構造がPEgRNAの3'または5'端に位置付けられる。 Aspect 29. The conjugate of embodiment 21, wherein the at least one additional structure is located at the 3' or 5' end of the PEgRNA.

態様30.態様29の複合体であって、リンカーが、配列番号127、165~176、446、453、および767~769からなる群から選択されるヌクレオチド配列を含む。 Aspect 30. The conjugate of embodiment 29, wherein the linker comprises a nucleotide sequence selected from the group consisting of SEQ ID NOs: 127, 165-176, 446, 453, and 767-769.

態様31.態様29の複合体であって、ステムループが、本明細書に記載のステムループから選択されるヌクレオチド配列を含む。 Aspect 31. The conjugate of embodiment 29, wherein the stem-loop comprises a nucleotide sequence selected from the stem-loops described herein.

態様32.態様29の複合体であって、ヘアピンが、本明細書に記載のヘアピンから選択されるヌクレオチド配列を含む。 Aspect 32. The conjugate of embodiment 29, wherein the hairpin comprises a nucleotide sequence selected from the hairpins described herein.

態様33.態様29の複合体であって、トウループが、本明細書に記載のトウループから選択されるヌクレオチド配列を含む。 Aspect 33. The complex of aspect 29, wherein the toe loop comprises a nucleotide sequence selected from the toe loops described herein.

態様34.態様29の複合体であって、アプタマーが、本明細書に記載のアプタマーから選択されるヌクレオチド配列を含む。 Aspect 34. The complex of aspect 29, wherein the aptamer comprises a nucleotide sequence selected from the aptamers described herein.

態様35.態様29の複合体であって、RNA-タンパク質動員ドメインが、本明細書に記載のRNA-タンパク質動員ドメインから選択されるヌクレオチド配列を含む。 Aspect 35. The conjugate of embodiment 29, wherein the RNA-protein recruitment domain comprises a nucleotide sequence selected from the RNA-protein recruitment domains described herein.

態様36.態様1の複合体であって、標的DNA配列が標的鎖および相補的な非標的鎖を含む。 Aspect 36. The complex of embodiment 1, wherein the target DNA sequence comprises a target strand and a complementary non-target strand.

態様37.態様36の複合体であって、Rループが、(i)PEgRNAと標的鎖とを含むRNA-DNAハイブリッドおよび(ii)相補的な非標的鎖を含む。 Aspect 37. The complex of embodiment 36, wherein the R-loop comprises (i) an RNA-DNA hybrid comprising PEgRNA and a target strand and (ii) a complementary non-target strand.

態様38.態様37の複合体であって、標的または相補的な非標的鎖がニッキングされて、遊離の3’端を有するプライム配列を形成する。 Aspect 38. The conjugate of embodiment 37, wherein the target or complementary non-target strand is nicked to form a prime sequence with a free 3' end.

態様39.態様38の複合体であって、ニック部位が標的鎖上のPAM配列の上流にある。 Aspect 39. The conjugate of embodiment 38, wherein the nick site is upstream of the PAM sequence on the target strand.

態様40.態様38の複合体であって、ニック部位が非標的鎖上のPAM配列の上流にある。 Aspect 40. The conjugate of embodiment 38, wherein the nick site is upstream of the PAM sequence on the non-target strand.

態様41.態様38の複合体であって、ニック部位がPAM配列の5'端に対して相対的に-1、-2、-3、-4、-5、-6、-7、-8、または-9である。 Aspect 41. The complex of embodiment 38, wherein the nick site is -1, -2, -3, -4, -5, -6, -7, -8, or - relative to the 5' end of the PAM sequence. It is 9.

態様42.態様22の複合体であって、一本鎖DNAフラップが、ニック部位に隣接する内生DNA配列にハイブリダイズし、それによって所望のヌクレオチド変化を標的鎖上に組み入れる。 Aspect 42. The complex of embodiment 22, wherein the single-stranded DNA flap hybridizes to an endogenous DNA sequence adjacent to the nick site, thereby incorporating a desired nucleotide change onto the target strand.

態様43.態様22の複合体であって、一本鎖DNAフラップが、遊離の5'端を有しかつニック部位に隣接する内生DNA配列に取って代わる。 Aspect 43. The complex of embodiment 22, wherein the single-stranded DNA flap replaces the endogenous DNA sequence having a free 5' end and adjacent to the nick site.

態様44.態様22の複合体であって、5'端を有する内生DNA配列が細胞によって切除される。 Aspect 44. The complex of embodiment 22, wherein the endogenous DNA sequence having a 5' end is excised by the cell.

態様45.態様44の複合体であって、5'端を有する内生DNA配列がフラップエンドヌクレアーゼによって切除される。 Aspect 45. The complex of aspect 44, wherein the endogenous DNA sequence having a 5' end is excised by a flap endonuclease.

態様46.態様43の複合体であって、一本鎖DNAフラップの細胞性修復が、所望のヌクレオチド変化を非標的鎖上に組み込み、それによって所望の産物を形成する。 Embodiment 46. The complex of embodiment 43, wherein cellular repair of the single-stranded DNA flap incorporates a desired nucleotide change onto the non-target strand, thereby forming a desired product.

態様47.態様46の複合体であって、所望のヌクレオチド変化が、PAM配列の約-4から+10の間、またはPAM配列の約-10から+20の間、またはPAM配列の約-20から+40の間、またはPAM配列の約-30から+100の間である編集窓上に組み入れされる。 Aspect 47. The conjugate of embodiment 46, wherein the desired nucleotide change is between about -4 and +10 of the PAM sequence, or between about -10 and +20 of the PAM sequence, or between about -20 and +40 of the PAM sequence. or between approximately -30 and +100 of the PAM array.

態様48.態様47の複合体であって、所望のヌクレオチド変化が、ニック部位の少なくとも1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、または100ヌクレオチド下流に組み入れされる。 Aspect 48. The conjugate of embodiment 47, wherein the desired nucleotide change is at least 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16 of the nick site. , 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41 , 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66 , 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91 , 92, 93, 94, 95, 96, 97, 98, 99, or 100 nucleotides downstream.

態様49.先の態様のいずれか1つの複合体であって、融合タンパク質が構造NH2-[napDNAbp]-[RNA依存性DNAポリメラーゼ活性を含むドメイン]-COOH;またはNH2-[RNA依存性DNAポリメラーゼ活性を含むドメイン]-[napDNAbp]-COOHを含み、「]-[」の夫々のものが任意のリンカー配列の存在を指示する。 Aspect 49. The complex of any one of the preceding embodiments, wherein the fusion protein has the structure NH2-[napDNAbp]-[domain comprising RNA-dependent DNA polymerase activity]-COOH; or NH2-[domain comprising RNA-dependent DNA polymerase activity]-COOH; The domain ]-[napDNAbp]-COOH, with each "]-[" indicating the presence of an optional linker sequence.

態様50.態様49の複合体であって、リンカー配列が配列番号127、165~176、446、453、および767~769のアミノ酸配列を含む。 Aspect 50. The conjugate of embodiment 49, wherein the linker sequence comprises the amino acid sequences of SEQ ID NOs: 127, 165-176, 446, 453, and 767-769.

態様51.態様1の複合体であって、融合タンパク質が、さらに、napDNAbpとRNA依存性DNAポリメラーゼ活性を含むドメインとを連結するリンカーを含む。 Aspect 51. The conjugate of embodiment 1, wherein the fusion protein further comprises a linker connecting napDNAbp and a domain containing RNA-dependent DNA polymerase activity.

態様52.態様51の複合体であって、リンカー配列が配列番号174(1×SGGS)、446(2×SGGS)、3889(3×SGGS)、171(1×XTEN)、3968(1×EAAAK)、3969(2×EAAAK)、および3970(3×EAAAK)のアミノ酸配列を含む。
群D.変異を修正するためのPE法
Aspect 52. The complex of embodiment 51, wherein the linker sequence is SEQ ID NO: 174 (1×SGGS), 446 (2×SGGS), 3889 (3×SGGS), 171 (1×XTEN), 3968 (1×EAAAK), 3969 (2×EAAAK), and 3970 (3×EAAAK) amino acid sequences.
Group D. PE method to correct mutations

態様1.所望のヌクレオチド変化を二本鎖DNA配列に組み入れるための方法であって、方法が:
融合タンパク質およびPEgRNAを含む複合体と二本鎖DNA配列を接触させ、融合タンパク質がnapDNAbpおよびポリメラーゼを含み、PEgRNAが所望のヌクレオチド変化を含むDNA合成鋳型とプライマー結合部位とを含むこと;
Aspect 1. A method for incorporating desired nucleotide changes into a double-stranded DNA sequence, the method comprising:
contacting the double-stranded DNA sequence with a complex comprising the fusion protein and PEgRNA, the fusion protein comprising napDNAbp and a polymerase, and the PEgRNA comprising a DNA synthesis template containing the desired nucleotide change and a primer binding site;

それによって、二本鎖DNA配列にニッキングし、それによって3’端を有する遊離の一本鎖DNAを生成すること; thereby nicking a double-stranded DNA sequence, thereby producing free single-stranded DNA with a 3' end;

それによって、遊離の一本鎖DNAの3’端をプライマー結合部位にハイブリダイズさせ、それによってポリメラーゼをプライムすること; thereby hybridizing the 3' end of the free single-stranded DNA to the primer binding site, thereby priming the polymerase;

それによって、プライマー結合部位にハイブリダイズした3’端からDNAの鎖を重合し、それによって、DNA合成鋳型に対して相補的であるかつ所望のヌクレオチド変化を含む一本鎖DNAフラップを生成すること; thereby polymerizing a strand of DNA from the 3' end hybridized to the primer binding site, thereby producing a single-stranded DNA flap that is complementary to the DNA synthesis template and contains the desired nucleotide changes. ;

それによって、カットされた部位に隣接する内生DNA鎖を一本鎖DNAフラップによって置き換え、それによって所望のヌクレオチド変化を二本鎖DNA配列に組み入れること、
を含む。
thereby replacing the endogenous DNA strand adjacent to the cut site by a single-stranded DNA flap, thereby incorporating the desired nucleotide change into the double-stranded DNA sequence;
including.

態様2.態様1の方法であって、内生DNA鎖を置き換えることが:(i)一本鎖DNAフラップをカットされた部位に隣接する内生DNA鎖にハイブリダイズさせて、配列ミスマッチを生出すること;(ii)内生DNA鎖を切り出すこと;および(iii)ミスマッチを修復して、所望のヌクレオチド変化をDNAの両方の鎖に含む所望の産物を形成することを含む。 Aspect 2. The method of embodiment 1, wherein the endogenous DNA strand is replaced by: (i) hybridizing a single-stranded DNA flap to the endogenous DNA strand adjacent to the cut site, creating a sequence mismatch; (ii) excising the endogenous DNA strand; and (iii) repairing the mismatch to form the desired product containing the desired nucleotide changes in both strands of the DNA.

態様3.態様1の方法であって、所望のヌクレオチド変化が1ヌクレオチド置換、欠失、または挿入である。 Aspect 3. The method of embodiment 1, wherein the desired nucleotide change is a single nucleotide substitution, deletion, or insertion.

態様4.態様3の方法であって、1ヌクレオチド置換がトランジションまたはトランスバージョンである。 Aspect 4. The method of embodiment 3, wherein the single nucleotide substitution is a transition or transversion.

態様5.態様1の方法であって、所望のヌクレオチド変化が、(1)GからTの置換、(2)GからAの置換、(3)GからCの置換、(4)TからGの置換、(5)TからAの置換、(6)TからCの置換、(7)CからGの置換、(8)CからTの置換、(9)CからAの置換、(10)AからTの置換、(11)AからGの置換、または(12)AからCの置換である。 Aspect 5. The method of embodiment 1, wherein the desired nucleotide change is (1) a G to T substitution, (2) a G to A substitution, (3) a G to C substitution, (4) a T to G substitution, (5) Substitution of A from T, (6) Substitution of C from T, (7) Substitution of G from C, (8) Substitution of T from C, (9) Substitution of A from C, (10) Substitution of A (11) A to G substitution, or (12) A to C substitution.

態様6.態様1の方法であって、所望のヌクレオチド変化が、(1)G:C塩基対をT:A塩基対に、(2)G:C塩基対をA:T塩基対に、(3)G:C塩基対をC:G塩基対に、(4)T:A塩基対をG:C塩基対に、(5)T:A塩基対をA:T塩基対に、(6)T:A塩基対をC:G塩基対に、(7)C:G塩基対をG:C塩基対に、(8)C:G塩基対をT:A塩基対に、C:G塩基対をA:T塩基対に、(10)A:T塩基対をT:A塩基対に、(11)A:T塩基対をG:C塩基対に、または(12)A:T塩基対をC:G塩基対に変換する。 Aspect 6. The method of embodiment 1, wherein the desired nucleotide change is (1) a G:C base pair to a T:A base pair, (2) a G:C base pair to an A:T base pair, (3) a G :C base pair becomes C:G base pair, (4) T:A base pair becomes G:C base pair, (5) T:A base pair becomes A:T base pair, (6) T:A base pair to C:G base pair, (7) C:G base pair to G:C base pair, (8) C:G base pair to T:A base pair, C:G base pair to A: T base pair, (10) A:T base pair to T:A base pair, (11) A:T base pair to G:C base pair, or (12) A:T base pair to C:G. Convert to base pairs.

態様7.態様1の方法であって、所望のヌクレオチド変化が、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、または25ヌクレオチドの挿入または欠失である。 Aspect 7. The method of embodiment 1, wherein the desired nucleotide change is 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, An insertion or deletion of 19, 20, 21, 22, 23, 24, or 25 nucleotides.

態様8.態様1の方法であって、所望のヌクレオチド変化が疾患関連遺伝子を修正する。 Aspect 8. Embodiment 1. The method of embodiment 1, wherein the desired nucleotide change modifies a disease-associated gene.

態様9.態様8の方法であって、疾患関連遺伝子が:アデノシンデアミナーゼ(ADA)欠損症;アルファ-1アンチトリプシン欠損症;嚢胞性線維症;デュシェンヌ型筋ジストロフィー;ガラクトース血症;ヘモクロマトーシス;ハンチントン病;メープルシロップ尿症;マルファン症候群;1型神経線維腫症;先天性爪肥厚症;フェニルケトン尿症;重症複合免疫不全;鎌状赤血球症;スミス・レムリ・オピッツ症候群;トリヌクレオチド反復障害;プリオン病;およびテイ・サックス病からなる群から選択される単一遺伝子障害に関連する。 Aspect 9. The method of embodiment 8, wherein the disease-related gene is: adenosine deaminase (ADA) deficiency; alpha-1 antitrypsin deficiency; cystic fibrosis; Duchenne muscular dystrophy; galactosemia; hemochromatosis; Huntington's disease; maple Syrupuria; Marfan syndrome; neurofibromatosis type 1; congenital nail hyperplasia; phenylketonuria; severe combined immunodeficiency; sickle cell disease; Smith-Lemli-Opitz syndrome; trinucleotide repeat disorder; prion disease associated with a single gene disorder selected from the group consisting of; and Tay-Sachs disease.

態様10.態様8の方法であって、疾患関連遺伝子が:心臓病;高血圧;アルツハイマー病;関節炎;糖尿病;がん;および肥満からなる群から選択される多遺伝子性障害に関連する。 Embodiment 10. The method of embodiment 8, wherein the disease-associated gene is associated with a polygenic disorder selected from the group consisting of: heart disease; hypertension; Alzheimer's disease; arthritis; diabetes; cancer; and obesity.

態様11.態様1の方法であって、napDNAbpが、ヌクレアーゼ不活性型Cas9(dCas9)、Cas9ニッカーゼ(nCas9)、またはヌクレアーゼ活性Cas9である。 Aspect 11. The method of embodiment 1, wherein napDNAbp is nuclease-inactive Cas9 (dCas9), Cas9 nickase (nCas9), or nuclease-active Cas9.

態様12.態様1の方法であって、napDNAbpが配列番号18のアミノ酸配列を含む。 Aspect 12. The method of embodiment 1, wherein napDNAbp comprises the amino acid sequence of SEQ ID NO: 18.

態様13.態様1の方法であって、napDNAbpが、配列番号18~88、126、130、137、141、147、153、157、445、460、467、および482~487のいずれか1つのアミノ酸配列との少なくとも80%、85%、90%、95%、98%、または99%配列同一性を有するアミノ酸配列を含む。 Aspect 13. The method of embodiment 1, wherein napDNAbp has an amino acid sequence of any one of SEQ ID NOs: 18-88, 126, 130, 137, 141, 147, 153, 157, 445, 460, 467, and 482-487. Comprising amino acid sequences with at least 80%, 85%, 90%, 95%, 98%, or 99% sequence identity.

態様14.態様1の方法であって、ポリメラーゼが逆転写酵素であり、配列番号89~100、105~122、128~129、132、139、143、149、154、159、235、454、471、516、662、700、701~716、739~741、および766のアミノ酸配列のいずれか1つを含む。 Embodiment 14. The method of embodiment 1, wherein the polymerase is a reverse transcriptase and comprises any one of the amino acid sequences of SEQ ID NOs: 89-100, 105-122, 128-129, 132, 139, 143, 149, 154, 159, 235, 454, 471, 516, 662, 700, 701-716, 739-741, and 766.

態様15.態様1の方法であって、ポリメラーゼが逆転写酵素であり、配列番号89~100、105~122、128~129、132、139、143、149、154、159、235、454、471、516、662、700、701~716、739~741、および766のいずれか1つのアミノ酸配列との少なくとも80%、85%、90%、95%、98%、または99%配列同一性を有するアミノ酸配列を含む。 Aspect 15. The method of embodiment 1, wherein the polymerase is reverse transcriptase, SEQ ID NOs: 89-100, 105-122, 128-129, 132, 139, 143, 149, 154, 159, 235, 454, 471, 516, An amino acid sequence having at least 80%, 85%, 90%, 95%, 98%, or 99% sequence identity with any one amino acid sequence of 662, 700, 701-716, 739-741, and 766. include.

態様16.態様1の方法であって、PEgRNAが核酸伸長アームをガイドRNAの3'もしくは5'端または分子内の位置付けに含み、伸長アームがDNA合成鋳型配列およびプライマー結合部位を含む。 Aspect 16. The method of embodiment 1, wherein the PEgRNA comprises a nucleic acid extension arm at the 3' or 5' end of the guide RNA or at an intramolecular location, the extension arm comprising a DNA synthesis template sequence and a primer binding site.

態様17.態様16の方法であって、伸長アームが、長さが少なくとも5ヌクレオチド、少なくとも6ヌクレオチド、少なくとも7ヌクレオチド、少なくとも8ヌクレオチド、少なくとも9ヌクレオチド、少なくとも10ヌクレオチド、少なくとも11ヌクレオチド、少なくとも12ヌクレオチド、少なくとも13ヌクレオチド、少なくとも14ヌクレオチド、少なくとも15ヌクレオチド、少なくとも16ヌクレオチド、少なくとも17ヌクレオチド、少なくとも18ヌクレオチド、少なくとも19ヌクレオチド、少なくとも20ヌクレオチド、少なくとも21ヌクレオチド、少なくとも22ヌクレオチド、少なくとも23ヌクレオチド、少なくとも24ヌクレオチド、または少なくとも25ヌクレオチドである。 Aspect 17. 17. The method of embodiment 16, wherein the extended arm is at least 5 nucleotides, at least 6 nucleotides, at least 7 nucleotides, at least 8 nucleotides, at least 9 nucleotides, at least 10 nucleotides, at least 11 nucleotides, at least 12 nucleotides, at least 13 nucleotides in length. , at least 14 nucleotides, at least 15 nucleotides, at least 16 nucleotides, at least 17 nucleotides, at least 18 nucleotides, at least 19 nucleotides, at least 20 nucleotides, at least 21 nucleotides, at least 22 nucleotides, at least 23 nucleotides, at least 24 nucleotides, or at least 25 nucleotides be.

態様18.態様1の方法であって、PEgRNAが、配列番号101~104、181~183、223~244、277、325~334、336、338、340、342、344、346、348、350、352、354、356、358、360、362、364、366、368、499~505、735~761、776~777からなる群から選択されるヌクレオチド配列を有する。 Aspect 18. The method of embodiment 1, wherein the PEgRNA is SEQ ID NO: 101-104, 181-183, 223-244, 277, 325-334, 336, 338, 340, 342, 344, 346, 348, 350, 352, 354 , 356, 358, 360, 362, 364, 366, 368, 499-505, 735-761, 776-777.

態様19.標的座位におけるDNA分子のヌクレオチド配列の1つ以上の変化を導入するための方法であって:
DNA分子を、核酸プログラム型DNA結合タンパク質(napDNAbp)およびnapDNAbpを標的座位へと標的化するPEgRNAと接触させ、PEgRNAが少なくとも1つの所望のヌクレオチド変化を含む逆転写酵素(RT)鋳型配列とプライマー結合部位とを含むこと;
Embodiment 19. A method for introducing one or more changes in a nucleotide sequence of a DNA molecule at a target locus, comprising:
contacting the DNA molecule with a nucleic acid programmable DNA binding protein (napDNAbp) and a PEgRNA that targets the napDNAbp to a target locus, the PEgRNA comprising a reverse transcriptase (RT) template sequence containing at least one desired nucleotide change and a primer binding site;

それによって、標的座位におけるDNA鎖の暴露された3'端を形成すること; Thereby creating an exposed 3' end of the DNA strand at the target locus;

それによって、暴露された3'端をプライマー結合部位にハイブリダイズさせて逆転写をプライムすること; thereby priming reverse transcription by hybridizing the exposed 3' end to the primer binding site;

それによって、逆転写酵素によって、RT鋳型配列に基づく少なくとも1つの所望のヌクレオチド変化を含む一本鎖DNAフラップを合成すること; thereby synthesizing, by reverse transcriptase, a single-stranded DNA flap containing at least one desired nucleotide change based on the RT template sequence;

それによって、少なくとも1つの所望のヌクレオチド変化を対応する内生DNA上に組み込み、それによって、標的座位においてDNA分子のヌクレオチド配列の1つ以上の変化を導入すること、
を含む。
thereby incorporating at least one desired nucleotide change onto the corresponding endogenous DNA, thereby introducing one or more changes in the nucleotide sequence of the DNA molecule at the target locus;
including.

態様20.態様19の方法であって、ヌクレオチド配列の1つ以上の変化がトランジションを含む。 Mode 20. Embodiment 19. The method of embodiment 19, wherein the one or more changes in the nucleotide sequence comprises a transition.

態様21.態様19の方法であって、トランジションが、(a)TからC;(b)AからG;(c)CからT;および(d)GからAからなる群から選択される。 Embodiment 21. The method of embodiment 19, wherein the transition is selected from the group consisting of: (a) T to C; (b) A to G; (c) C to T; and (d) G to A.

態様22.態様19の方法であって、ヌクレオチド配列の1つ以上の変化がトランスバージョンを含む。 Embodiment 22. The method of embodiment 19, wherein the one or more changes in the nucleotide sequence include a transversion.

態様23.態様22の方法であって、トランスバージョンが、(a)TからA;(b)TからG;(c)CからG;(d)CからA;(e)AからT;(f)AからC;(g)GからC;および(h)GからTからなる群から選択される。 Aspect 23. 23. The method of embodiment 22, wherein the transversion is (a) T to A; (b) T to G; (c) C to G; (d) C to A; (e) A to T; (f) (g) G to C; and (h) G to T.

態様24.態様19の方法であって、ヌクレオチド配列の1つ以上の変化が、(1)G:C塩基対をT:A塩基対に、(2)G:C塩基対をA:T塩基対に、(3)G:C塩基対をC:G塩基対に、(4)T:A塩基対をG:C塩基対に、(5)T:A塩基対をA:T塩基対に、(6)T:A塩基対をC:G塩基対に、(7)C:G塩基対をG:C塩基対に、(8)C:G塩基対をT:A塩基対に、(9)C:G塩基対をA:T塩基対に、(9)A:T塩基対をT:A塩基対に、(11)A:T塩基対をG:C塩基対に、または(12)A:T塩基対をC:G塩基対に変化させることを含む。 Aspect 24. The method of embodiment 19, wherein the one or more changes in the nucleotide sequence include (1) a G:C base pair to a T:A base pair; (2) a G:C base pair to an A:T base pair; (3) G:C base pair to C:G base pair, (4) T:A base pair to G:C base pair, (5) T:A base pair to A:T base pair, (6 )T:A base pair to C:G base pair, (7)C:G base pair to G:C base pair, (8)C:G base pair to T:A base pair, (9)C :G base pair to A:T base pair, (9) A:T base pair to T:A base pair, (11) A:T base pair to G:C base pair, or (12) A: It involves changing a T base pair to a C:G base pair.

態様25.態様19の方法であって、ヌクレオチド配列の1つ以上の変化が、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、または25ヌクレオチドの挿入または欠失を含む。 Aspect 25. The method of embodiment 19, wherein the one or more changes in the nucleotide sequence are 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, Contains insertions or deletions of 17, 18, 19, 20, 21, 22, 23, 24, or 25 nucleotides.

態様26.態様19の方法であって、ヌクレオチド配列の1つ以上の変化が疾患関連遺伝子の修正を含む。 Aspect 26. Embodiment 19. The method of embodiment 19, wherein the one or more changes in the nucleotide sequence comprises correction of a disease-associated gene.

態様27.態様26の方法であって、疾患関連遺伝子が:アデノシンデアミナーゼ(ADA)欠損症;アルファ-1アンチトリプシン欠損症;嚢胞性線維症;デュシェンヌ型筋ジストロフィー;ガラクトース血症;ヘモクロマトーシス;ハンチントン病;メープルシロップ尿症;マルファン症候群;1型神経線維腫症;先天性爪肥厚症;フェニルケトン尿症;重症複合免疫不全;鎌状赤血球症;スミス・レムリ・オピッツ症候群;トリヌクレオチド反復障害;プリオン病;およびテイ・サックス病からなる群から選択される単一遺伝子障害に関連する。 Aspect 27. The method of embodiment 26, wherein the disease-associated gene is: adenosine deaminase (ADA) deficiency; alpha-1 antitrypsin deficiency; cystic fibrosis; Duchenne muscular dystrophy; galactosemia; hemochromatosis; Huntington's disease; maple Syrupuria; Marfan syndrome; type 1 neurofibromatosis; congenital nail hypertrophy; phenylketonuria; severe combined immunodeficiency; sickle cell disease; Smith-Lemli-Opitz syndrome; trinucleotide repeat disorder; prion disease associated with a single gene disorder selected from the group consisting of; and Tay-Sachs disease.

態様28.態様26の方法であって、疾患関連遺伝子が:心臓病;高血圧;アルツハイマー病;関節炎;糖尿病;がん;および肥満からなる群から選択される多遺伝子性障害に関連する。 Aspect 28. Embodiment 26. The method of embodiment 26, wherein the disease-associated gene is associated with a polygenic disorder selected from the group consisting of: heart disease; hypertension; Alzheimer's disease; arthritis; diabetes; cancer; and obesity.

態様29.態様19の方法であって、napDNAbpがヌクレアーゼ活性Cas9またはそのバリアントである。 Aspect 29. Embodiment 19. The method of embodiment 19, wherein napDNAbp is nuclease active Cas9 or a variant thereof.

態様30.態様19の方法であって、napDNAbpがヌクレアーゼ不活性型Cas9(dCas9)もしくはCas9ニッカーゼ(nCas9)またはそのバリアントである。 Aspect 30. The method of embodiment 19, wherein napDNAbp is nuclease-inactive Cas9 (dCas9) or Cas9 nickase (nCas9) or a variant thereof.

態様31.態様19の方法であって、napDNAbpが配列番号18のアミノ酸配列を含む。 Aspect 31. 19. The method of embodiment 19, wherein napDNAbp comprises the amino acid sequence of SEQ ID NO: 18.

態様32.態様19の方法であって、napDNAbpが、配列番号18~88、126、130、137、141、147、153、157、445、460、467、および482~487のいずれか1つのアミノ酸配列との少なくとも80%、85%、90%、95%、98%、または99%配列同一性を有するアミノ酸配列を含む。 Aspect 32. The method of embodiment 19, wherein napDNAbp has an amino acid sequence of any one of SEQ ID NOs: 18-88, 126, 130, 137, 141, 147, 153, 157, 445, 460, 467, and 482-487. Comprising amino acid sequences with at least 80%, 85%, 90%, 95%, 98%, or 99% sequence identity.

態様33.態様19の方法であって、逆転写酵素がトランスで導入される。 Aspect 33. Embodiment 19. The method of embodiment 19, wherein the reverse transcriptase is introduced in trans.

態様34.態様19の方法であって、napDNAbpが逆転写酵素への融合体を含む。 Aspect 34. Embodiment 19. The method of embodiment 19, wherein napDNAbp comprises a fusion to reverse transcriptase.

態様35.態様19の方法であって、逆転写酵素が、配列番号89~100、105~122、128~129、132、139、143、149、154、159、235、454、471、516、662、700、701~716、739~741、および766のアミノ酸配列のいずれか1つを含む。 Aspect 35. The method of embodiment 19, wherein the reverse transcriptase is SEQ ID NO: 89-100, 105-122, 128-129, 132, 139, 143, 149, 154, 159, 235, 454, 471, 516, 662, 700 , 701-716, 739-741, and 766.

態様36.態様19の方法であって、逆転写酵素が、配列番号89~100、105~122、128~129、132、139、143、149、154、159、235、454、471、516、662、700、701~716、739~741、および766のいずれか1つのアミノ酸配列との少なくとも80%、85%、90%、95%、98%、または99%配列同一性を有するアミノ酸配列を含む。 Aspect 36. The method of embodiment 19, wherein the reverse transcriptase is SEQ ID NO: 89-100, 105-122, 128-129, 132, 139, 143, 149, 154, 159, 235, 454, 471, 516, 662, 700 , 701-716, 739-741, and 766.

態様37.態様19の方法であって、標的座位におけるDNA鎖の暴露された3’端を形成するステップが、ヌクレアーゼによってDNA鎖へニックを入れることを含む。 Aspect 37. Embodiment 19. The method of embodiment 19, wherein the step of forming an exposed 3' end of the DNA strand at the target locus comprises nicking the DNA strand with a nuclease.

態様38.態様37の方法であって、ヌクレアーゼがnapDNAbpであるか、napDNAbpの融合ドメインとして提供されるか、またはトランスで提供される。 Aspect 38. Embodiment 37. The method of embodiment 37, wherein the nuclease is napDNAbp, is provided as a fusion domain of napDNAbp, or is provided in trans.

態様39.態様19の方法であって、標的座位におけるDNA鎖の暴露された3'端を形成するステップが、DNA鎖を化学的薬剤と接触させることを含む。 Aspect 39. Embodiment 19. The method of embodiment 19, wherein the step of forming an exposed 3' end of the DNA strand at the target locus comprises contacting the DNA strand with a chemical agent.

態様40.態様19の方法であって、標的座位におけるDNA鎖の暴露された3'端を形成するステップが、複製エラーを導入することを含む。 Aspect 40. Embodiment 19. The method of embodiment 19, wherein forming an exposed 3' end of the DNA strand at the target locus comprises introducing a replication error.

態様41.態様19の方法であって、DNA分子をnapDNAbpおよびガイドRNAと接触させるステップがRループを形成する。 Aspect 41. Embodiment 19. The method of embodiment 19, wherein the step of contacting the DNA molecule with napDNAbp and guide RNA forms an R-loop.

態様42.態様41の方法であって、暴露された3'端が形成されるDNA鎖がRループ上にある。 Aspect 42. The method of embodiment 41, wherein the DNA strand from which the exposed 3' end is formed is on the R-loop.

態様43.態様19の方法であって、PEgRNAが、逆転写酵素(RT)鋳型配列とプライマー結合部位とを含む伸長アームを含む。 Aspect 43. Embodiment 19. The method of embodiment 19, wherein the PEgRNA comprises an extended arm that includes a reverse transcriptase (RT) template sequence and a primer binding site.

態様44.態様43の方法であって、伸長アームが、ガイドRNAの3'端、ガイドRNAの5'端、またはガイドRNAの分子内の位置にある。 Aspect 44. 44. The method of embodiment 43, wherein the elongated arm is at the 3' end of the guide RNA, at the 5' end of the guide RNA, or at a position within the molecule of the guide RNA.

態様45.態様19の方法であって、PEgRNAが、さらに、リンカー、ステムループ、ヘアピン、トウループ、アプタマー、またはRNA-タンパク質動員ドメインからなる群から選択される少なくとも1つの追加の構造を含む。 Aspect 45. The method of embodiment 19, wherein the PEgRNA further comprises at least one additional structure selected from the group consisting of a linker, a stem-loop, a hairpin, a toe-loop, an aptamer, or an RNA-protein recruitment domain.

態様46.態様19の方法であって、PEgRNAがさらに相同アームを含む。 Aspect 46. Embodiment 19. The method of embodiment 19, wherein the PEgRNA further comprises a homology arm.

態様47.態様19の方法であって、RT鋳型配列が、対応する内生DNAに対して相同的である。 Aspect 47. The method of embodiment 19, wherein the RT template sequence is homologous to the corresponding endogenous DNA.

態様48.プライム標的にプライムされた逆転写によって、標的座位におけるDNA分子のヌクレオチド配列の1つ以上の変化を導入するための方法であって、方法が:(a)標的座位におけるDNA分子を(i)核酸プログラム型DNA結合タンパク質(napDNAbp)および逆転写酵素を含む融合タンパク質ならびに(ii)所望のヌクレオチド変化を含むRT鋳型を含むガイドRNAと接触させること; Aspect 48. A method for introducing one or more changes in the nucleotide sequence of a DNA molecule at a target locus by primed reverse transcription to a primed target, the method comprising: (a) converting the DNA molecule at the target locus into (i) a nucleic acid molecule; contacting a fusion protein comprising a programmed DNA binding protein (napDNAbp) and a reverse transcriptase and (ii) a guide RNA comprising an RT template comprising the desired nucleotide changes;

それによって、RT鋳型のプライム標的にプライムされた逆転写を行なって、所望のヌクレオチド変化を含む一本鎖DNAを生成すること; thereby performing primed reverse transcription on the primed target of the RT template to generate single-stranded DNA containing the desired nucleotide changes;

それによって、DNA修復および/または複製プロセスによって標的座位におけるDNA分子上に所望のヌクレオチド変化を組み込むこと、
を含む。
thereby incorporating desired nucleotide changes on the DNA molecule at the target locus by DNA repair and/or replication processes;
including.

態様49.態様48の方法であって、RT鋳型が、ガイドRNAの3'端、ガイドRNAの5'端、またはガイドRNAの分子内の位置付けに位置付けられる。 Aspect 49. 49. The method of embodiment 48, wherein the RT template is located at the 3' end of the guide RNA, at the 5' end of the guide RNA, or at an intramolecular position of the guide RNA.

態様50.態様48の方法であって、所望のヌクレオチド変化が、トランジション、トランスバージョン、挿入、もしくは欠失、またはそれらのいずれかの組み合わせを含む。 Aspect 50. 49. The method of embodiment 48, wherein the desired nucleotide change comprises a transition, transversion, insertion, or deletion, or any combination thereof.

態様51.態様48の方法であって、所望のヌクレオチド変化が、(a)TからC;(b)AからG;(c)CからT;および(d)GからAからなる群から選択されるトランジションを含む。 Embodiment 51. The method of embodiment 48, wherein the desired nucleotide change comprises a transition selected from the group consisting of: (a) T to C; (b) A to G; (c) C to T; and (d) G to A.

態様52.態様48の方法であって、所望のヌクレオチド変化が、(a)TからA;(b)TからG;(c)CからG;(d)CからA;(e)AからT;(f)AからC;(g)GからC;および(h)GからTからなる群から選択されるトランスバージョンを含む。 Aspect 52. Embodiment 48, wherein the desired nucleotide change is (a) T to A; (b) T to G; (c) C to G; (d) C to A; (e) A to T; (g) G to C; and (h) G to T.

態様53.態様48の方法であって、所望のヌクレオチド変化が、(1)G:C塩基対をT:A塩基対に、(2)G:C塩基対をA:T塩基対に、(3)G:C塩基対をC:G塩基対に、(4)T:A塩基対をG:C塩基対に、(5)T:A塩基対をA:T塩基対に、(6)T:A塩基対をC:G塩基対に、(7)C:G塩基対をG:C塩基対に、(8)C:G塩基対をT:A塩基対に、(9)C:G塩基対をA:T塩基対に、(10)A:T塩基対をT:A塩基対に、(11)A:T塩基対をG:C塩基対に、または(12)A:T塩基対をC:G塩基対に変化させることを含む。 Embodiment 53. The method of embodiment 48, wherein the desired nucleotide change comprises changing (1) a G:C base pair to a T:A base pair, (2) a G:C base pair to an A:T base pair, (3) a G:C base pair to a C:G base pair, (4) a T:A base pair to a G:C base pair, (5) a T:A base pair to an A:T base pair, (6) a T:A base pair to a C:G base pair, (7) a C:G base pair to a G:C base pair, (8) a C:G base pair to a T:A base pair, (9) a C:G base pair to an A:T base pair, (10) an A:T base pair to a T:A base pair, (11) an A:T base pair to a G:C base pair, or (12) an A:T base pair to a C:G base pair.

態様54.健康な数の反復トリヌクレオチドを含む健康な配列によって標的DNA分子上のトリヌクレオチド反復拡大変異を置き換えるための方法であって、方法が:(a)標的座位におけるDNA分子を(i)核酸プログラム型DNA結合タンパク質(napDNAbp)およびポリメラーゼを含む融合タンパク質ならびに(ii)置き換え配列を含むDNA合成鋳型とプライマー結合部位とを含むPEgRNAと接触させること;(b)プライム編集を行なって、置き換え配列を含む一本鎖DNAを生成すること;ならびに(c)DNA修復および/または複製プロセスによって、標的座位におけるDNA分子上に一本鎖DNAを組み込むことを含む。 Aspect 54. A method for replacing a trinucleotide repeat expansion mutation on a target DNA molecule by a healthy sequence containing a healthy number of repeat trinucleotides, the method comprising: (a) converting the DNA molecule at the target locus to (i) a nucleic acid programmed contacting a fusion protein containing a DNA binding protein (napDNAbp) and a polymerase; and (ii) a DNA synthesis template containing a replacement sequence and a PEgRNA containing a primer binding site; producing single-stranded DNA; and (c) incorporating single-stranded DNA onto a DNA molecule at a target locus by a DNA repair and/or replication process.

態様55.態様54の方法であって、融合タンパク質がPE1、PE2、またはPE3のアミノ酸配列を含む。 Aspect 55. 55. The method of embodiment 54, wherein the fusion protein comprises the amino acid sequence of PE1, PE2, or PE3.

態様56.態様54の方法であって、napDNAbpがCas9ニッカーゼ(nCas9)である。 Aspect 56. 55. The method of embodiment 54, wherein napDNAbp is Cas9 nickase (nCas9).

態様57.態様54の方法であって、napDNAbpが、配列番号18~88、126、130、137、141、147、153、157、445、460、467、および482~487のアミノ酸配列を含む。 Aspect 57. 55. The method of embodiment 54, wherein napDNAbp comprises the amino acid sequences of SEQ ID NOs: 18-88, 126, 130, 137, 141, 147, 153, 157, 445, 460, 467, and 482-487.

態様58.態様54の方法であって、ガイドRNAが配列番号222を含む。 Aspect 58. 55. The method of embodiment 54, wherein the guide RNA comprises SEQ ID NO: 222.

態様59.態様54の方法であって、(b)プライム編集を行うステップが、ガイドRNA上のプライマー結合部位へのアニーリングによってポリメラーゼをプライムすることができる標的座位における3’端プライマー結合配列を生成することを含む。 Aspect 59. 55. The method of embodiment 54, wherein (b) performing prime editing generates a 3' end primer binding sequence at the target locus that is capable of priming a polymerase by annealing to a primer binding site on the guide RNA. include.

態様60.態様54の方法であって、トリヌクレオチド反復拡大変異がハンチントン病、脆弱X症候群、またはフリードライヒ運動失調症に関連する。 Aspect 60. 55. The method of embodiment 54, wherein the trinucleotide repeat expansion mutation is associated with Huntington's disease, Fragile X syndrome, or Friedreich's ataxia.

態様61.態様54の方法であって、トリヌクレオチド反復拡大変異がCAGトリプレットの繰り返し単位を含む。 Aspect 61. 55. The method of embodiment 54, wherein the trinucleotide repeat expansion comprises a CAG triplet repeat unit.

態様62.態様54の方法であって、トリヌクレオチド反復拡大変異がGAAトリプレットの繰り返し単位を含む。 Aspect 62. 55. The method of embodiment 54, wherein the trinucleotide repeat expansion comprises a GAA triplet repeat unit.

態様63.プライム標的にプライムされた逆転写によって、標的座位におけるDNA分子のヌクレオチド配列の1つ以上の変化を導入するための方法であって、方法が:
(a)標的座位におけるDNA分子を(i)核酸プログラム型DNA結合タンパク質(napDNAbp)および逆転写酵素を含む融合タンパク質ならびに(ii)所望のヌクレオチド変化を含むRT鋳型を含むガイドRNAと接触させること;
Aspect 63. A method for introducing one or more changes in the nucleotide sequence of a DNA molecule at a target locus by primed reverse transcription to a primed target, the method comprising:
(a) contacting a DNA molecule at a target locus with a guide RNA comprising (i) a fusion protein comprising a nucleic acid programmed DNA binding protein (napDNAbp) and a reverse transcriptase and (ii) an RT template comprising the desired nucleotide changes;

それによって、RT鋳型のプライム標的にプライムされた逆転写を行なって、所望のヌクレオチド変化を含む一本鎖DNAを生成すること; thereby performing primed reverse transcription on the primed target of the RT template to generate single-stranded DNA containing the desired nucleotide changes;

それによって、DNA修復および/または複製プロセスによって標的座位におけるDNA分子上に所望のヌクレオチド変化を組み込むこと、
を含む。
thereby incorporating desired nucleotide changes on the DNA molecule at the target locus by DNA repair and/or replication processes;
including.

態様64.態様63の方法であって、RT鋳型が、ガイドRNAの3'端、ガイドRNAの5'端、またはガイドRNAの分子内の位置付けに位置付けられる。 Aspect 64. 64. The method of embodiment 63, wherein the RT template is located at the 3' end of the guide RNA, at the 5' end of the guide RNA, or at an intramolecular position of the guide RNA.

態様65.態様63の方法であって、所望のヌクレオチド変化が、トランジション、トランスバージョン、挿入、もしくは欠失、またはそれらのいずれかの組み合わせを含む。 Aspect 65. 64. The method of embodiment 63, wherein the desired nucleotide change comprises a transition, transversion, insertion, or deletion, or any combination thereof.

態様66.態様63の方法であって、所望のヌクレオチド変化が、(a)TからC;(b)AからG;(c)CからT;および(d)GからAからなる群から選択されるトランジションを含む。 Aspect 66. 64. The method of embodiment 63, wherein the desired nucleotide change is selected from the group consisting of: (a) T to C; (b) A to G; (c) C to T; and (d) G to A. including.

態様67.態様63の方法であって、所望のヌクレオチド変化が:(a)TからA;(b)TからG;(c)CからG;(d)CからA;(e)AからT;(f)AからC;(g)GからC;および(h)GからTからなる群から選択されるトランスバージョンを含む。 Embodiment 67. The method of embodiment 63, wherein the desired nucleotide change comprises a transversion selected from the group consisting of: (a) T to A; (b) T to G; (c) C to G; (d) C to A; (e) A to T; (f) A to C; (g) G to C; and (h) G to T.

態様68.態様63の方法であって、所望のヌクレオチド変化が、(1)G:C塩基対をT:A塩基対に、(2)G:C塩基対をA:T塩基対に、(3)G:C塩基対をC:G塩基対に、(4)T:A塩基対をG:C塩基対に、(5)T:A塩基対をA:T塩基対に、(6)T:A塩基対をC:G塩基対に、(7)C:G塩基対をG:C塩基対に、(8)C:G塩基対をT:A塩基対に、(9)C:G塩基対をA:T塩基対に、(10)A:T塩基対をT:A塩基対に、(11)A:T塩基対をG:C塩基対に、または(12)A:T塩基対をC:G塩基対に変化させることを含む。 Aspect 68. Embodiment 63, wherein the desired nucleotide change is (1) a G:C base pair to a T:A base pair, (2) a G:C base pair to an A:T base pair, (3) a G:C base pair to a T:A base pair; :C base pair becomes C:G base pair, (4) T:A base pair becomes G:C base pair, (5) T:A base pair becomes A:T base pair, (6) T:A base pair to C:G base pair, (7) C:G base pair to G:C base pair, (8) C:G base pair to T:A base pair, (9) C:G base pair. into an A:T base pair, (10) an A:T base pair into a T:A base pair, (11) an A:T base pair into a G:C base pair, or (12) an A:T base pair. This includes changing to a C:G base pair.

態様69.プライム編集によって標的ヌクレオチド配列によってコードされるPRNP上に1つ以上の防護性変異を組み入れることによって、プリオン病を防止またはその進行を停止させる方法であって、方法が:(a)標的ヌクレオチド配列を(i)核酸プログラム型DNA結合タンパク質(napDNAbp)およびポリメラーゼを含むプライム編集因子ならびに(ii)機能部分をコードする編集鋳型を含むPEgRNAと接触させること; Aspect 69. A method of preventing or halting the progression of a prion disease by incorporating one or more protective mutations on a PRNP encoded by a target nucleotide sequence by prime editing, the method comprising: (a) contacting (i) a prime editing factor comprising a nucleic acid programmed DNA binding protein (napDNAbp) and a polymerase and (ii) a PEgRNA comprising an editing template encoding a functional moiety;

それによって、防護性変異をコードする一本鎖DNA配列を重合すること; thereby polymerizing a single-stranded DNA sequence encoding a protective mutation;

それによって、DNA修復および/または複製プロセスによって、標的ヌクレオチド配列における対応する内生鎖の代わりに一本鎖DNA配列を組み込むこと、
を含み;
thereby incorporating, by DNA repair and/or replication processes, a single-stranded DNA sequence in place of the corresponding endogenous strand in the target nucleotide sequence;
including;

方法が、ミスフォールディングに対して耐性である防護性変異を含むPRNPをコードする組み換え標的ヌクレオチド配列を生ずる。 The method produces a recombinant target nucleotide sequence encoding a PRNP containing a protective mutation that is resistant to misfolding.

態様70.態様69の方法であって、プリオン病がヒトプリオン病である。 Mode 70. 69. The method of embodiment 69, wherein the prion disease is a human prion disease.

態様71.態様69の方法であって、プリオン病が動物プリオン病である。 Aspect 71. 69. The method of embodiment 69, wherein the prion disease is an animal prion disease.

態様72.態様69の方法であって、プリオン病がクロイツフェルト・ヤコブ病(CJD)、変異型クロイツフェルト・ヤコブ病(vCJD)、ゲルストマン・ストロイスラー・シャインカー症候群、致死性家族性不眠症、またはクールー病である。 Aspect 72. 69. The method of embodiment 69, wherein the prion disease is Creutzfeldt-Jakob disease (CJD), variant Creutzfeldt-Jakob disease (vCJD), Gerstmann-Straussler-Scheinker syndrome, fatal familial insomnia, or Kuru disease. It is.

態様73.態様69の方法であって、プリオン病が牛海綿状脳症(BSEまたは「狂牛病」)、慢性消耗病(CWD)、スクレイピー、伝達性ミンク脳症、ネコ海綿状脳症、および有蹄類海綿状脳症である。 Embodiment 73. The method of embodiment 69, wherein the prion disease is bovine spongiform encephalopathy (BSE or "mad cow disease"), chronic wasting disease (CWD), scrapie, transmissible mink encephalopathy, feline spongiform encephalopathy, and ungulate spongiform encephalopathy.

態様74.態様69の方法であって、野生型PRNPアミノ酸配列が配列番号291~292である。 Aspect 74. 69. The method of embodiment 69, wherein the wild-type PRNP amino acid sequence is SEQ ID NO: 291-292.

態様75.態様69の方法であって、方法が、配列番号293~309、311~323からなる群から選択される改変されたPRNPアミノ酸配列をもたらし、前記改変されたPRNPタンパク質がミスフォールディングに対して耐性である。 Aspect 75. 69. The method of embodiment 69, wherein the method results in a modified PRNP amino acid sequence selected from the group consisting of SEQ ID NOs: 293-309, 311-323, and wherein the modified PRNP protein is resistant to misfolding. be.

態様76.態様69の方法であって、融合タンパク質がPE1、PE2、またはPE3のアミノ酸配列を含む。 Aspect 76. 69. The method of embodiment 69, wherein the fusion protein comprises the amino acid sequence of PE1, PE2, or PE3.

態様77.態様69の方法であって、napDNAbpがCas9ニッカーゼ(nCas9)である。 Aspect 77. 69. The method of embodiment 69, wherein napDNAbp is Cas9 nickase (nCas9).

態様78.態様69の方法であって、napDNAbpが、配列番号18~88、126、130、137、141、147、153、157、445、460、467、および482~487のアミノ酸配列を含む。 Embodiment 78. The method of embodiment 69, wherein the napDNAbp comprises the amino acid sequences of SEQ ID NOs: 18-88, 126, 130, 137, 141, 147, 153, 157, 445, 460, 467, and 482-487.

態様79.態様69の方法であって、PEgRNAが、配列番号101~104、181~183、223~244、277、325~334、336、338、340、342、344、346、348、350、352、354、356、358、360、362、364、366、368、499~505、735~761、776~777を含む。 Aspect 79. The method of embodiment 69, wherein the PEgRNA is SEQ ID NO: 101-104, 181-183, 223-244, 277, 325-334, 336, 338, 340, 342, 344, 346, 348, 350, 352, 354 , 356, 358, 360, 362, 364, 366, 368, 499-505, 735-761, 776-777.

態様80.プライム編集によって標的ヌクレオチド配列上のサイクリン依存性キナーゼ様5遺伝子(CDKL5)の変異を修正することによって、CDKL5欠損症障害を処置する方法であって、方法が:(a)標的ヌクレオチド配列を(i)核酸プログラム型DNA結合タンパク質(napDNAbp)およびポリメラーゼを含むプライム編集因子ならびに(ii)CDKL5の変異を修正する編集鋳型を含むPEgRNAと接触させること; Embodiment 80. A method for treating a CDKL5 deficiency disorder by correcting a mutation in a cyclin-dependent kinase-like 5 gene (CDKL5) on a target nucleotide sequence by prime editing, the method comprising: (a) contacting the target nucleotide sequence with (i) a prime editing factor comprising a nucleic acid programmable DNA binding protein (napDNAbp) and a polymerase, and (ii) a PEgRNA comprising an editing template that corrects the mutation in CDKL5;

それによって、編集をコードする一本鎖DNA配列を重合すること; thereby polymerizing a single-stranded DNA sequence encoding the edit;

それによって、DNA修復および/または複製プロセスによって、標的ヌクレオチド配列における対応する内生鎖の代わりに一本鎖DNA配列を組み込むこと、
を含み;
thereby incorporating, by DNA repair and/or replication processes, a single-stranded DNA sequence in place of the corresponding endogenous strand in the target nucleotide sequence;
including;

方法が、修復されたCDKL5遺伝子をコードする組み換え標的ヌクレオチド配列を生ずる。 The method produces a recombinant target nucleotide sequence encoding a repaired CDKL5 gene.

態様81.態様D80の方法であって、CDKL5の変異が1412delAである。 Aspect 81. The method of embodiment D80, wherein the CDKL5 mutation is 1412delA.

群E.タンパク質構造/機能を改変することおよび/または変異導入のためのPE法
態様1.プライム編集によって標的座位におけるDNA分子に変異導入する方法であって、方法が:(a)標的座位におけるDNA分子を(i)核酸プログラム型DNA結合タンパク質(napDNAbp)およびエラーを起こしやすいポリメラーゼ(polymer)(例えば、エラーを起こしやすい逆転写酵素)を含む融合タンパク質ならびに(ii)所望のヌクレオチド変化を含む編集鋳型を含むガイドRNAと接触させること;それによって、編集鋳型を鋳型とする一本鎖DNAを重合すること、ならびにDNA修復および/または複製プロセスによって、標的座位におけるDNA分子上に一本鎖DNAを組み込むことを含む。
Group E. PE method embodiment 1 for modifying protein structure/function and/or introducing mutations . A method of mutagenizing a DNA molecule at a target locus by prime editing, the method comprising: (a) converting the DNA molecule at the target locus to (i) a nucleic acid programmed DNA binding protein (napDNAbp) and an error-prone polymerase (polymer); (e.g., an error-prone reverse transcriptase) and (ii) a guide RNA containing an editing template containing the desired nucleotide changes; thereby making the single-stranded DNA templated with the editing template It involves incorporating single-stranded DNA onto a DNA molecule at a target locus by polymerizing and by DNA repair and/or replication processes.

態様2.いずれかの先行する態様の方法であって、融合タンパク質がPE1、PE2、またはPE3のアミノ酸配列を含む。 Aspect 2. The method of any preceding embodiment, wherein the fusion protein comprises the amino acid sequence of PE1, PE2, or PE3.

態様3.いずれかの先行する態様の方法であって、napDNAbpがCas9ニッカーゼ(nCas9)である。 Aspect 3. The method of any preceding embodiment, wherein napDNAbp is Cas9 nickase (nCas9).

態様4.態様1の方法であって、napDNAbpが、配列番号18~88、126、130、137、141、147、153、157、445、460、467、および482~487のアミノ酸配列を含む。 Embodiment 4. The method of embodiment 1, wherein napDNAbp comprises the amino acid sequences of SEQ ID NOs: 18-88, 126, 130, 137, 141, 147, 153, 157, 445, 460, 467, and 482-487.

態様5.態様1の方法であって、ガイドRNAが配列番号222を含む。 Aspect 5. The method of embodiment 1, wherein the guide RNA comprises SEQ ID NO: 222.

態様6.プライム編集によって、標的ヌクレオチド配列によってコードされる目当てのタンパク質上に免疫エピトープを組み入れる方法であって、方法が:(a)標的ヌクレオチド配列を(i)核酸プログラム型DNA結合タンパク質(napDNAbp)およびポリメラーゼを含むプライム編集因子ならびに(ii)機能部分をコードする編集鋳型を含むPEgRNAと接触させること; Aspect 6. A method of incorporating an immune epitope onto a protein of interest encoded by a target nucleotide sequence by prime editing, the method comprising: (a) converting the target nucleotide sequence to (i) a nucleic acid programmed DNA binding protein (napDNAbp) and a polymerase; (ii) a PEgRNA comprising an editing template encoding a functional moiety;

それによって、免疫エピトープをコードする一本鎖DNA配列を重合すること; thereby polymerizing a single-stranded DNA sequence encoding an immune epitope;

それによって、DNA修復および/または複製プロセスによって、標的ヌクレオチド配列における対応する内生鎖の代わりに一本鎖DNA配列を組み込むこと、
を含み;
thereby incorporating, by DNA repair and/or replication processes, a single-stranded DNA sequence in place of the corresponding endogenous strand in the target nucleotide sequence;
including;

方法が、目当てのタンパク質と免疫エピトープとを含む融合タンパク質をコードする組み換え標的ヌクレオチド配列を生ずる。 The method produces a recombinant target nucleotide sequence that encodes a fusion protein that includes the protein of interest and the immune epitope.

態様7.態様6の方法であって、免疫エピトープが:破傷風トキソイド(配列番号396);ジフテリア毒素変異体CRM197(配列番号630);ムンプス免疫エピトープ1(配列番号400);ムンプス免疫エピトープ2(配列番号402);ムンプス免疫エピトープ3(配列番号404);風疹ウイルス(配列番号406);ヘマグルチニン(配列番号408);ノイラミニダーゼ(配列番号410);TAP1(配列番号412);TAP2(配列番号414);クラスI HLAに対するヘマグルチニンエピトープ(配列番号416);クラスI HLAに対するノイラミニダーゼエピトープ(配列番号418);クラスII HLAに対するヘマグルチニンエピトープ(配列番号420);クラスII HLAに対するノイラミニダーゼエピトープ(配列番号422);ヘマグルチニンエピトープH5N1結合クラスIおよびクラスII HLA(配列番号424);ならびにノイラミニダーゼエピトープH5N1結合クラスIおよびクラスII HLA(配列番号426)からなる群から選択される。 Aspect 7. The method of embodiment 6, wherein the immune epitope is: tetanus toxoid (SEQ ID NO: 396); diphtheria toxin variant CRM197 (SEQ ID NO: 630); mumps immune epitope 1 (SEQ ID NO: 400); mumps immune epitope 2 (SEQ ID NO: 402). Mumps immune epitope 3 (SEQ ID NO: 404); Rubella virus (SEQ ID NO: 406); Hemagglutinin (SEQ ID NO: 408); Neuraminidase (SEQ ID NO: 410); TAP1 (SEQ ID NO: 412); TAP2 (SEQ ID NO: 414); Class I HLA hemagglutinin epitope for class I HLA (SEQ ID NO: 416); neuraminidase epitope for class I HLA (SEQ ID NO: 420); neuraminidase epitope for class II HLA (SEQ ID NO: 422); hemagglutinin epitope H5N1 binding class I and class II HLA (SEQ ID NO: 424); and neuraminidase epitope H5N1 binding class I and class II HLA (SEQ ID NO: 426).

態様8.態様6の方法であって、融合タンパク質がPE1、PE2、またはPE3のアミノ酸配列を含む。 Aspect 8. Embodiment 6. The method of embodiment 6, wherein the fusion protein comprises the amino acid sequence of PE1, PE2, or PE3.

態様9.態様6の方法であって、napDNAbpがCas9ニッカーゼ(nCas9)である。 Aspect 9. The method of embodiment 6, wherein napDNAbp is Cas9 nickase (nCas9).

態様10.態様6の方法であって、napDNAbpが、配列番号18~88、126、130、137、141、147、153、157、445、460、467、および482~487のアミノ酸配列を含む。 Aspect 10. The method of embodiment 6, wherein napDNAbp comprises the amino acid sequences of SEQ ID NOs: 18-88, 126, 130, 137, 141, 147, 153, 157, 445, 460, 467, and 482-487.

態様11.態様6の方法であって、PEgRNAが、配列番号101~104、181~183、223~244、277、325~334、336、338、340、342、344、346、348、350、352、354、356、358、360、362、364、366、368、499~505、735~761、776~777を含む。 Aspect 11. The method of embodiment 6, wherein the PEgRNA is SEQ ID NO: 101-104, 181-183, 223-244, 277, 325-334, 336, 338, 340, 342, 344, 346, 348, 350, 352, 354 , 356, 358, 360, 362, 364, 366, 368, 499-505, 735-761, 776-777.

態様12.プライム編集によって、標的ヌクレオチド配列によってコードされる目当てのタンパク質上に低分子二量体化ドメインを組み入れる方法であって、方法が:(a)標的ヌクレオチド配列を(i)核酸プログラム型DNA結合タンパク質(napDNAbp)およびポリメラーゼを含むプライム編集因子ならびに(ii)低分子二量体化ドメインをコードする編集鋳型を含むPEgRNAと接触させること; Embodiment 12. A method for incorporating a small dimerization domain onto a protein of interest encoded by a target nucleotide sequence by prime editing, the method comprising: (a) contacting the target nucleotide sequence with (i) a prime editing factor comprising a nucleic acid programmable DNA binding protein (napDNAbp) and a polymerase, and (ii) a PEgRNA comprising an editing template encoding the small dimerization domain;

それによって、免疫エピトープをコードする一本鎖DNA配列を重合すること; thereby polymerizing a single-stranded DNA sequence encoding an immune epitope;

それによって、DNA修復および/または複製プロセスによって、標的ヌクレオチド配列における対応する内生鎖の代わりに一本鎖DNA配列を組み込むこと、
を含み;
thereby incorporating, by DNA repair and/or replication processes, a single-stranded DNA sequence in place of the corresponding endogenous strand in the target nucleotide sequence;
including;

方法が、目当てのタンパク質と低分子二量体化ドメインとを含む融合タンパク質をコードする改変された標的ヌクレオチド配列を生ずる。 The method produces a modified target nucleotide sequence that encodes a fusion protein that includes the protein of interest and a small dimerization domain.

態様13.態様12の方法であって、さらに、目当ての第2のタンパク質に対して方法を行うことを含む。 Aspect 13. The method of embodiment 12, further comprising performing the method on a second protein of interest.

態様14.態様13の方法であって、目当ての第1のタンパク質および目当ての第2のタンパク質が、前記タンパク質の夫々の二量体化ドメインに結合する低分子の存在下において二量体化する。 Aspect 14. Embodiment 13. The method of embodiment 13, wherein the first protein of interest and the second protein of interest dimerize in the presence of a small molecule that binds to a respective dimerization domain of the protein.

態様15.態様12の方法であって、低分子結合ドメインが配列番号488のFKBP12である。 Aspect 15. The method of embodiment 12, wherein the small molecule binding domain is FKBP12 of SEQ ID NO: 488.

態様16.態様12の方法であって、低分子結合ドメインが配列番号489のFKBP12-F36Vである。 Aspect 16. The method of embodiment 12, wherein the small molecule binding domain is FKBP12-F36V of SEQ ID NO: 489.

態様17.態様12の方法であって、低分子結合ドメインが配列番号490および493~494のシクロフィリンである。 Aspect 17. The method of embodiment 12, wherein the small molecule binding domain is a cyclophilin of SEQ ID NOs: 490 and 493-494.

態様18.態様12の方法であって、低分子が本明細書に記載の低分子の二量体である。 Aspect 18. The method of embodiment 12, wherein the small molecule is a dimer of a small molecule as described herein.

態様19.態様12の方法であって、融合タンパク質がPE1、PE2、またはPE3のアミノ酸配列を含む。 Aspect 19. The method of embodiment 12, wherein the fusion protein comprises the amino acid sequence of PE1, PE2, or PE3.

態様20.態様12の方法であって、napDNAbpがCas9ニッカーゼ(nCas9)である。 Mode 20. The method of embodiment 12, wherein napDNAbp is Cas9 nickase (nCas9).

態様21.態様12の方法であって、napDNAbpが、配列番号18~88、126、130、137、141、147、153、157、445、460、467、および482~487のアミノ酸配列を含む。 Aspect 21. The method of embodiment 12, wherein napDNAbp comprises the amino acid sequences of SEQ ID NOs: 18-88, 126, 130, 137, 141, 147, 153, 157, 445, 460, 467, and 482-487.

態様22.態様12の方法であって、PEgRNAが、配列番号101~104、181~183、223~244、277、325~334、336、338、340、342、344、346、348、350、352、354、356、358、360、362、364、366、368、499~505、735~761、776~777を含む。 Aspect 22. The method of embodiment 12, wherein the PEgRNA is SEQ ID NO: 101-104, 181-183, 223-244, 277, 325-334, 336, 338, 340, 342, 344, 346, 348, 350, 352, 354 , 356, 358, 360, 362, 364, 366, 368, 499-505, 735-761, 776-777.

態様23.プライム編集を用いてタンパク質上にペプチドタグまたはエピトープを組み入れる方法であって:タンパク質をコードする標的ヌクレオチド配列を、ペプチドタグをコードする第2のヌクレオチド配列をそれに挿入するように構成されたプライム編集因子構築物と接触させて、組み換えヌクレオチド配列をもたらすことを含み、その結果、ペプチドタグおよびタンパク質が融合タンパク質として組み換えヌクレオチド配列から発現される。 Aspect 23. A method of incorporating a peptide tag or epitope onto a protein using prime editing, comprising: a prime editing agent configured to insert into a target nucleotide sequence encoding a protein a second nucleotide sequence encoding a peptide tag; contacting the recombinant nucleotide sequence with a construct so that the peptide tag and protein are expressed from the recombinant nucleotide sequence as a fusion protein.

態様24.態様23の方法であって、ペプチドタグがタンパク質の精製および/または検出に用いられる。 Aspect 24. Embodiment 23. The method of embodiment 23, wherein the peptide tag is used for protein purification and/or detection.

態様25.態様23の方法であって、ペプチドタグが、ポリヒスチジン(例えば、HHHHHH、配列番号252~262)、FLAG(例えば、DYKDDDDK、配列番号2)、V5(例えば、GKPIPNPLLGLDST、配列番号3)、GCN4、HA(例えば、YPYDVPDYA、配列番号5)、Myc(例えばEQKLISEED、配列番号6)、またはGSTである。 Aspect 25. Embodiment 23, wherein the peptide tag is polyhistidine (eg, HHHHHH, SEQ ID NO: 252-262), FLAG (eg, DYKDDDDK, SEQ ID NO: 2), V5 (eg, GKPIPNPLLGLLDST, SEQ ID NO: 3), GCN4, HA (eg, YPYDVPDYA, SEQ ID NO: 5), Myc (eg, EQKLISEED, SEQ ID NO: 6), or GST.

態様26.態様23の方法であって、ペプチドタグが、配列番号1~6、245~249、252~262、264~273、275~276、281、278~288、および622からなる群から選択されるアミノ酸配列を有する。 Aspect 26. 24. The method of embodiment 23, wherein the peptide tag is an amino acid selected from the group consisting of SEQ ID NOs: 1-6, 245-249, 252-262, 264-273, 275-276, 281, 278-288, and 622. It has an array.

態様27.態様23の方法であって、ペプチドタグがリンカーによってタンパク質に融合される。 Aspect 27. Embodiment 23. The method of embodiment 23, wherein the peptide tag is fused to the protein by a linker.

態様28.態様23の方法であって、融合タンパク質が次の構造を有し:[タンパク質]-[ペプチドタグ]または[ペプチドタグ]-[タンパク質]、「]-[」が任意のリンカーを表す。 Aspect 28. The method of embodiment 23, wherein the fusion protein has the following structure: [protein]-[peptide tag] or [peptide tag]-[protein], where "]-[" represents an optional linker.

態様29.態様23の方法であって、リンカーが配列番号127、165~176、446、453、および767~769のアミノ酸配列を有する。 Aspect 29. The method of embodiment 23, wherein the linker has the amino acid sequence of SEQ ID NOs: 127, 165-176, 446, 453, and 767-769.

態様30.態様23の方法であって、プライム編集因子構築物が、配列番号101~104、181~183、223~244、277、325~334、336、338、340、342、344、346、348、350、352、354、356、358、360、362、364、366、368、499~505、735~761、776~777のヌクレオチド配列を含むPEgRNAを含む。 Aspect 30. 24. The method of embodiment 23, wherein the prime editing factor construct comprises SEQ ID NOs: 101-104, 181-183, 223-244, 277, 325-334, 336, 338, 340, 342, 344, 346, 348, 350, Contains PEgRNA containing the nucleotide sequences 352, 354, 356, 358, 360, 362, 364, 366, 368, 499-505, 735-761, 776-777.

態様31.態様23の方法であって、PEgRNAがスペーサー、gRNAコア、および伸長アームを含み、スペーサーが標的ヌクレオチド配列に対して相補的であり、伸長アームがペプチドタグをコードする逆転写酵素鋳型を含む。 Aspect 31. Embodiment 23. The method of embodiment 23, wherein the PEgRNA comprises a spacer, a gRNA core, and an extended arm, the spacer being complementary to a target nucleotide sequence, and the extended arm comprising a reverse transcriptase template encoding a peptide tag.

態様32.態様23の方法であって、PEgRNAがスペーサー、gRNAコア、および伸長アームを含み、スペーサーが標的ヌクレオチド配列に対して相補的であり、伸長アームがペプチドタグをコードする逆転写酵素鋳型を含む。 Aspect 32. Embodiment 23. The method of embodiment 23, wherein the PEgRNA comprises a spacer, a gRNA core, and an extended arm, the spacer being complementary to a target nucleotide sequence, and the extended arm comprising a reverse transcriptase template encoding a peptide tag.

態様33.プライム編集によって、標的ヌクレオチド配列によってコードされる目当てのタンパク質上の機能部分を組み入れまたは欠失する方法であって、方法が:(a)標的ヌクレオチド配列を(i)核酸プログラム型DNA結合タンパク質(napDNAbp)およびポリメラーゼを含むプライム編集因子ならびに(ii)機能部分またはその欠失をコードする編集鋳型を含むPEgRNAと接触させること;(b)機能部分またはその欠失をコードする一本鎖DNA配列を重合すること;ならびに(c)DNA修復および/または複製プロセスによって、標的ヌクレオチド配列における対応する内生鎖の代わりに一本鎖DNA配列を組み込むことを含み、方法が、目当てのタンパク質および機能部分またはその除去を含む改変されたタンパク質をコードする組み換え標的ヌクレオチド配列を生じ、機能部分がタンパク質の修飾状態または局在状態を変改する。 Aspect 33. A method of incorporating or deleting a functional moiety on a protein of interest encoded by a target nucleotide sequence by prime editing, the method comprising: (a) converting the target nucleotide sequence into (i) a nucleic acid programmed DNA binding protein (napDNAbp); ) and a prime editing factor comprising a polymerase and (ii) PEgRNA comprising an editing template encoding the functional moiety or its deletion; (b) polymerizing the single-stranded DNA sequence encoding the functional moiety or its deletion; and (c) incorporating a single-stranded DNA sequence in place of the corresponding endogenous strand in the target nucleotide sequence by a DNA repair and/or replication process, the method comprising: A recombinant target nucleotide sequence is generated that encodes a modified protein containing a deletion, the functional moiety altering the modification state or localization state of the protein.

態様34.態様33の方法であって、機能部分が、目当てのタンパク質のリン酸化、ユビキチン化、グリコシル化、脂質修飾、ヒドロキシル化、メチル化、アセチル化、クロトニル化、またはSUMO化状態を変改する。 Aspect 34. Embodiment 33. The method of embodiment 33, wherein the functional moiety alters the phosphorylation, ubiquitination, glycosylation, lipid modification, hydroxylation, methylation, acetylation, crotonylation, or SUMOylation status of the protein of interest.

群F.PE送達方法および組成物
態様1.ポリペプチドであって、プライム編集因子融合タンパク質のN末端半分またはC末端半分を含む。
Group F. PE Delivery Method and Composition Embodiment 1. A polypeptide comprising the N-terminal half or the C-terminal half of a prime editing factor fusion protein.

態様2.態様1のポリペプチドであって、プライム編集因子融合タンパク質が、核酸プログラム型DNA結合タンパク質(napDNAbp)ドメインとポリメラーゼドメインとを含む。 Aspect 2. The polypeptide of embodiment 1, wherein the prime editing factor fusion protein comprises a nucleic acid programmed DNA binding protein (napDNAbp) domain and a polymerase domain.

態様3.態様1のポリペプチドであって、プライム編集因子融合タンパク質が、プライム編集ガイドRNA(PEgRNA)の存在下においてプライム編集を実行することができる。 Aspect 3. The polypeptide of embodiment 1, wherein the prime editing factor fusion protein is capable of performing prime editing in the presence of a prime editing guide RNA (PEgRNA).

態様4.態様2のポリペプチドであって、napDNAbpがCas9タンパク質またはそのバリアントである。 Aspect 4. The polypeptide of aspect 2, wherein napDNAbp is a Cas9 protein or a variant thereof.

態様5.態様2のポリペプチドであって、napDNAbpがニッカーゼ活性を有するヌクレアーゼである。 Aspect 5. The polypeptide of embodiment 2, wherein napDNAbp is a nuclease having nickase activity.

態様6.態様2のポリペプチドであって、napDNAbpがヌクレアーゼ活性Cas9、ヌクレアーゼ不活性型Cas9(dCas9)、またはCas9ニッカーゼ(nCas9)である。 Aspect 6. The polypeptide of embodiment 2, wherein napDNAbp is nuclease-active Cas9, nuclease-inactive Cas9 (dCas9), or Cas9 nickase (nCas9).

態様7.態様2のポリペプチドであって、napDNAbpが:Cas9、Cas12e、Cas12d、Cas12a、Cas12b1、Cas13a、Cas12c、およびアルゴノートからなる群から選択され、任意にニッカーゼ活性を有する。 Aspect 7. The polypeptide of embodiment 2, wherein the napDNAbp is selected from the group consisting of: Cas9, Cas12e, Cas12d, Cas12a, Cas12b1, Cas13a, Cas12c, and Argonaute, and optionally has nickase activity.

態様8.態様1のポリペプチドであって、ポリペプチドが、プライム編集因子融合タンパク質を分裂部位において分裂することによって形成される。 Aspect 8. The polypeptide of embodiment 1, wherein the polypeptide is formed by splitting a prime editing factor fusion protein at a cleavage site.

態様9.態様8のポリペプチドであって、分裂部位がnapDNAbpドメイン上のペプチド結合である。 Aspect 9. The polypeptide of aspect 8, wherein the cleavage site is a peptide bond on the napDNAbp domain.

態様10.態様8のポリペプチドであって、分裂部位がポリメラーゼドメイン上のペプチド結合である。 Aspect 10. The polypeptide of embodiment 8, wherein the cleavage site is a peptide bond on the polymerase domain.

態様11.態様8のポリペプチドであって、分裂部位がnapDNAbpドメインとポリメラーゼドメインとの間のリンカー上のペプチド結合である。 Embodiment 11. The polypeptide of embodiment 8, wherein the cleavage site is a peptide bond on the linker between the napDNAbp domain and the polymerase domain.

態様12.態様9のポリペプチドであって、分裂部位が、配列番号18(標準的なSpCas9)の残基1および2、2および3、3および4、4および5、5および6、6および7、7および8、8および9、9および10、10および11、11および12、12および13、13および14、14および15、16および17、17および18、18および19、19および20、20および21、21および22、22および23、23および24、24および25、25および26、26および27、27および(ad)28、28および29、29および30、30および31、31および32、32および33、33および34、34および35、35および36、36および37、37および38、38および39、39および40、40および41、41および42、42および43、43および44、44および45、45および46、46および47、47および48、48および49、49および50の間、または残基50~100、100~150、150~200、200~250、250~300、300~350、350~400、400~450、450~500、500~600、600~700、700~800、800~900、900~1000、1000~1100、1100~1200、1200~1300、もしくは1300~1368の間のいずれか2つの残基の間、あるいは配列番号18のSpCas9ホモログまたは等価物のいずれか2つの同等アミノ酸残基の間のペプチド結合である。 Aspect 12. The polypeptide of embodiment 9, wherein the cleavage site is residues 1 and 2, 2 and 3, 3 and 4, 4 and 5, 5 and 6, 6 and 7, 7 of SEQ ID NO: 18 (standard SpCas9). and 8, 8 and 9, 9 and 10, 10 and 11, 11 and 12, 12 and 13, 13 and 14, 14 and 15, 16 and 17, 17 and 18, 18 and 19, 19 and 20, 20 and 21 , 21 and 22, 22 and 23, 23 and 24, 24 and 25, 25 and 26, 26 and 27, 27 and (ad) 28, 28 and 29, 29 and 30, 30 and 31, 31 and 32, 32 and 33, 33 and 34, 34 and 35, 35 and 36, 36 and 37, 37 and 38, 38 and 39, 39 and 40, 40 and 41, 41 and 42, 42 and 43, 43 and 44, 44 and 45, between 45 and 46, 46 and 47, 47 and 48, 48 and 49, 49 and 50, or residues 50-100, 100-150, 150-200, 200-250, 250-300, 300-350, 350 Between ~400, 400-450, 450-500, 500-600, 600-700, 700-800, 800-900, 900-1000, 1000-1100, 1100-1200, 1200-1300, or 1300-1368 A peptide bond between any two residues or between any two equivalent amino acid residues of the SpCas9 homologue of SEQ ID NO: 18 or equivalent.

態様13.態様9のポリペプチドであって、分裂部位が、配列番号89(標準的な逆転写酵素、M-MLV RT)の残基1および2、2および3、3および4、4および5、5および6、6および7、7および8、8および9、9および10、10および11、11および12、12および13、13および14、14および15、16および17、17および18、18および19、19および20、20および21、21および22、22および23、23および24、24および25、25および26、26および27、27および(ad)28、28および29、29および30、30および31、31および32、32および33、33および34、34および35、35および36、36および37、37および38、38および39、39および40、40および41、41および42、42および43、43および44、44および45、45および46、46および47、47および48、48および49、49および50の間、または残基50~100、100~150、150~200、200~250、250~300、300~350、350~400、400~450、450~500、500~600、もしくは600~667の間のいずれか2つの残基の間、あるいは配列番号89の逆転写酵素ホモログまたは等価物のいずれか2つの同等アミノ酸残基の間のペプチド結合である。 Aspect 13. The polypeptide of embodiment 9, wherein the cleavage site comprises residues 1 and 2, 2 and 3, 3 and 4, 4 and 5, 5 and 6, 6 and 7, 7 and 8, 8 and 9, 9 and 10, 10 and 11, 11 and 12, 12 and 13, 13 and 14, 14 and 15, 16 and 17, 17 and 18, 18 and 19, 19 and 20, 20 and 21, 21 and 22, 22 and 23, 23 and 24, 24 and 25, 25 and 26, 26 and 27, 27 and (ad) 28, 28 and 29, 29 and 30, 30 and 31 , 31 and 32, 32 and 33, 33 and 34, 34 and 35, 35 and 36, 36 and 37, 37 and 38, 38 and 39, 39 and 40, 40 and 41, 41 and 42, 42 and 43, 43 and between 44, 44 and 45, 45 and 46, 46 and 47, 47 and 48, 48 and 49, 49 and 50, or residues 50 to 100, 100 to 150, 150 to 200, 200 to 250, 250 to between any two residues between 300, 300-350, 350-400, 400-450, 450-500, 500-600, or 600-667, or a reverse transcriptase homolog or equivalent of SEQ ID NO: 89 is a peptide bond between any two equivalent amino acid residues.

態様14.態様1のポリペプチドであって、ポリペプチドがプライム編集因子融合タンパク質のN末端半分である。 Aspect 14. The polypeptide of embodiment 1, wherein the polypeptide is the N-terminal half of a prime editing factor fusion protein.

態様15.態様1のポリペプチドであって、ポリペプチドがプライム編集因子融合タンパク質のC末端半分である。 Embodiment 15. The polypeptide of embodiment 1, wherein the polypeptide is the C-terminal half of a prime editor fusion protein.

態様16.態様1~15のいずれかのポリペプチドと任意にPEgRNAとをコードするヌクレオチド配列。 Aspect 16. A nucleotide sequence encoding the polypeptide of any of embodiments 1 to 15 and optionally PEgRNA.

態様17.ウイルスゲノムであって、態様1~15のいずれかのポリペプチドと任意にPEgRNAとをコードするヌクレオチド配列を含む。 Aspect 17. A viral genome comprising a nucleotide sequence encoding a polypeptide of any of embodiments 1 to 15 and optionally PEgRNA.

態様18.態様17のウイルスゲノムであって、ヌクレオチド配列が、さらに、態様1~15のいずれかのポリペプチドを発現することにとって好適なプロモーター配列を含む。 Aspect 18. The viral genome of aspect 17, wherein the nucleotide sequence further comprises a promoter sequence suitable for expressing the polypeptide of any of aspects 1 to 15.

態様19.態様17のウイルスゲノムであって、ヌクレオチド配列が、さらに、PEgRNAをコードする配列を含む。 Aspect 19. The viral genome of embodiment 17, wherein the nucleotide sequence further comprises a sequence encoding PEgRNA.

態様20.ウイルス粒子であって、態様1~15のいずれかのポリペプチドと任意にPEgRNAとをコードするヌクレオチド配列を含むゲノムを含む。 Mode 20. A virus particle comprising a genome comprising a nucleotide sequence encoding a polypeptide of any of embodiments 1 to 15 and optionally PEgRNA.

態様21.態様20のウイルス粒子であって、ウイルス粒子がアデノウイルス粒子、アデノ随伴ウイルス粒子、またはレンチウイルス粒子である。 Aspect 21. The virus particle of embodiment 20, wherein the virus particle is an adenovirus particle, an adeno-associated virus particle, or a lentivirus particle.

態様22.態様20のウイルス粒子であって、ゲノムによってコードされるポリペプチドがプライム編集因子融合タンパク質のN末端半分である。 Aspect 22. The viral particle of embodiment 20, wherein the polypeptide encoded by the genome is the N-terminal half of a prime editing factor fusion protein.

態様23.態様20のウイルス粒子であって、ゲノムによってコードされるポリペプチドがプライム編集因子融合タンパク質のC末端半分である。 Aspect 23. The viral particle of embodiment 20, wherein the polypeptide encoded by the genome is the C-terminal half of a prime editing factor fusion protein.

態様24.医薬組成物であって、態様20~23のいずれかのウイルス粒子および医薬賦形剤を含む。 Aspect 24. A pharmaceutical composition comprising the virus particles of any of embodiments 20-23 and a pharmaceutical excipient.

態様25.医薬組成物であって、態様22のウイルス粒子(N末端半分をコードする)および医薬賦形剤を含む。 Aspect 25. A pharmaceutical composition comprising the virus particle of embodiment 22 (encoding the N-terminal half) and a pharmaceutical excipient.

態様26.医薬組成物であって、態様23のウイルス粒子(C末端半分をコードする)および医薬賦形剤を含む。 Aspect 26. A pharmaceutical composition comprising the virus particle of embodiment 23 (encoding the C-terminal half) and a pharmaceutical excipient.

態様27.リボヌクレオタンパク質(RNP)複合体であって、態様1~15のいずれかのポリペプチドと任意にPEgRNAとをコードするヌクレオチド配列を含む。 Aspect 27. A ribonucleoprotein (RNP) complex comprising a nucleotide sequence encoding a polypeptide of any of embodiments 1 to 15 and optionally PEgRNA.

態様28.態様27のリボヌクレオタンパク質(RNP)複合体であって、ゲノムによってコードされるポリペプチドがプライム編集因子融合タンパク質のN末端半分である。 Aspect 28. The ribonucleoprotein (RNP) complex of embodiment 27, wherein the polypeptide encoded by the genome is the N-terminal half of a prime editing factor fusion protein.

態様29.態様27のリボヌクレオタンパク質(RNP)複合体であって、ゲノムによってコードされるポリペプチドがプライム編集因子融合タンパク質のC末端半分である。 Embodiment 29. The ribonucleoprotein (RNP) complex of embodiment 27, wherein the polypeptide encoded by the genome is the C-terminal half of a prime editor fusion protein.

態様30.医薬組成物であって、態様27~29のいずれかのリボヌクレオタンパク質(RNP)複合体および医薬賦形剤を含む。 Aspect 30. A pharmaceutical composition comprising a ribonucleoprotein (RNP) complex according to any of embodiments 27-29 and a pharmaceutical excipient.

態様31.医薬組成物であって、態様28のリボヌクレオタンパク質(RNP)複合体(N末端半分をコードする)および医薬賦形剤を含む。 Aspect 31. A pharmaceutical composition comprising a ribonucleoprotein (RNP) complex of embodiment 28 (encoding the N-terminal half) and a pharmaceutical excipient.

態様32.医薬組成物であって、態様29のリボヌクレオタンパク質(RNP)複合体(C末端半分をコードする)および医薬賦形剤を含む。 Aspect 32. A pharmaceutical composition comprising a ribonucleoprotein (RNP) complex (encoding the C-terminal half) of aspect 29 and a pharmaceutical excipient.

態様33.医薬組成物であって、第1のAAV粒子および第2のAAV粒子を含み、第1のAAVベクターがプライム編集因子融合タンパク質のN末端半分を発現し、第2のAAVベクターがプライム編集因子融合タンパク質のC末端半分を発現し、N末端半分およびC末端半分が細胞内で組み合わせられてプライム編集因子を再構成する。 Aspect 33. A pharmaceutical composition comprising a first AAV particle and a second AAV particle, the first AAV vector expressing the N-terminal half of a prime editing factor fusion protein, and the second AAV vector expressing the prime editing factor fusion protein. The C-terminal half of the protein is expressed, and the N-terminal and C-terminal halves are combined within the cell to reconstitute the prime editing factor.

態様34.態様33の医薬組成物であって、第1または第2のAAV粒子がPEgRNAをもまた発現し、これが再構成されたプライム編集因子を標的DNA部位へと標的化する。 Embodiment 34. The pharmaceutical composition of embodiment 33, wherein the first or second AAV particle also expresses a PEgRNA, which targets the reconstituted primed editing element to the target DNA site.

態様35.態様33の医薬組成物であって、プライム編集因子融合タンパク質が核酸プログラム型DNA結合タンパク質(napDNAbp)ドメインとポリメラーゼドメインとを含む。 Aspect 35. Embodiment 33. The pharmaceutical composition of embodiment 33, wherein the prime editing factor fusion protein comprises a nucleic acid programmed DNA binding protein (napDNAbp) domain and a polymerase domain.

態様36.態様33の医薬組成物であって、プライム編集因子融合タンパク質が、プライム編集ガイドRNA(PEgRNA)の存在下においてプライム編集を実行することができる。 Aspect 36. Embodiment 33. The pharmaceutical composition of embodiment 33, wherein the prime editing factor fusion protein is capable of performing prime editing in the presence of a prime editing guide RNA (PEgRNA).

態様37.態様35の医薬組成物であって、napDNAbpがCas9タンパク質またはそのバリアントである。 Aspect 37. The pharmaceutical composition of embodiment 35, wherein napDNAbp is a Cas9 protein or a variant thereof.

態様38.態様35の医薬組成物であって、napDNAbpがニッカーゼ活性を有するヌクレアーゼである。 Aspect 38. Embodiment 35. The pharmaceutical composition of embodiment 35, wherein napDNAbp is a nuclease with nickase activity.

態様39.態様35の医薬組成物であって、napDNAbpがヌクレアーゼ活性Cas9、ヌクレアーゼ不活性型Cas9(dCas9)、またはCas9ニッカーゼ(nCas9)である。 Aspect 39. The pharmaceutical composition of embodiment 35, wherein napDNAbp is nuclease-active Cas9, nuclease-inactive Cas9 (dCas9), or Cas9 nickase (nCas9).

態様40.態様35の医薬組成物であって、napDNAbpが:Cas9、Cas12e、Cas12d、Cas12a、Cas12b1、Cas13a、Cas12c、およびアルゴノートからなる群から選択され、任意にニッカーゼ活性を有する。 Aspect 40. The pharmaceutical composition of embodiment 35, wherein the napDNAbp is selected from the group consisting of: Cas9, Cas12e, Cas12d, Cas12a, Cas12b1, Cas13a, Cas12c, and Argonaute, and optionally has nickase activity.

態様41.態様33の医薬組成物であって、N末端およびC末端半分がプライム編集因子融合タンパク質を分裂部位において分裂することによって形成される。 Aspect 41. Embodiment 33. The pharmaceutical composition of embodiment 33, wherein the N-terminal and C-terminal halves are formed by splitting the prime editing factor fusion protein at a cleavage site.

態様42.態様41の医薬組成物であって、分裂部位がnapDNAbpドメイン上のペプチド結合である。 Aspect 42. The pharmaceutical composition of embodiment 41, wherein the cleavage site is a peptide bond on the napDNAbp domain.

態様43.態様41の医薬組成物であって、分裂部位がポリメラーゼドメイン上のペプチド結合である。 Aspect 43. 42. The pharmaceutical composition of embodiment 41, wherein the cleavage site is a peptide bond on the polymerase domain.

態様44.態様41の医薬組成物であって、分裂部位がリンカー上のペプチド結合である。 Aspect 44. Embodiment 41. The pharmaceutical composition of embodiment 41, wherein the cleavage site is a peptide bond on the linker.

態様45.態様41の医薬組成物であって、分裂部位が、配列番号18(標準的なSpCas9)の残基1および2、2および3、3および4、4および5、5および6、6および7、7および8、8および9、9および10、10および11、11および12、12および13、13および14、14および15、16および17、17および18、18および19、19および20、20および21、21および22、22および23、23および24、24および25、25および26、26および27、27および(ad)28、28および29、29および30、30および31、31および32、32および33、33および34、34および35、35および36、36および37、37および38、38および39、39および40、40および41、41および42、42および43、43および44、44および45、45および46、46および47、47および48、48および49、49および50の間、または残基50~100、100~150、150~200、200~250、250~300、300~350、350~400、400~450、450~500、500~600、600~700、700~800、800~900、900~1000、1000~1100、1100~1200、1200~1300、もしくは1300~1368の間のいずれか2つの残基の間、あるいは配列番号18のSpCas9ホモログまたは等価物のいずれか2つの同等アミノ酸残基の間のペプチド結合である。 Aspect 45. 42. The pharmaceutical composition of embodiment 41, wherein the cleavage site comprises residues 1 and 2, 2 and 3, 3 and 4, 4 and 5, 5 and 6, 6 and 7 of SEQ ID NO: 18 (standard SpCas9); 7 and 8, 8 and 9, 9 and 10, 10 and 11, 11 and 12, 12 and 13, 13 and 14, 14 and 15, 16 and 17, 17 and 18, 18 and 19, 19 and 20, 20 and 21, 21 and 22, 22 and 23, 23 and 24, 24 and 25, 25 and 26, 26 and 27, 27 and (ad) 28, 28 and 29, 29 and 30, 30 and 31, 31 and 32, 32 and 33, 33 and 34, 34 and 35, 35 and 36, 36 and 37, 37 and 38, 38 and 39, 39 and 40, 40 and 41, 41 and 42, 42 and 43, 43 and 44, 44 and 45 , 45 and 46, 46 and 47, 47 and 48, 48 and 49, 49 and 50 or between residues 50-100, 100-150, 150-200, 200-250, 250-300, 300-350, Between 350-400, 400-450, 450-500, 500-600, 600-700, 700-800, 800-900, 900-1000, 1000-1100, 1100-1200, 1200-1300, or 1300-1368 or between any two equivalent amino acid residues of the SpCas9 homologue of SEQ ID NO: 18 or equivalent.

態様46.態様41の医薬組成物であって、分裂部位が、配列番号89(標準的な逆転写酵素、M-MLV RT)の残基1および2、2および3、3および4、4および5、5および6、6および7、7および8、8および9、9および10、10および11、11および12、12および13、13および14、14および15、16および17、17および18、18および19、19および20、20および21、21および22、22および23、23および24、24および25、25および26、26および27、27および(ad)28、28および29、29および30、30および31、31および32、32および33、33および34、34および35、35および36、36および37、37および38、38および39、39および40、40および41、41および42、42および43、43および44、44および45、45および46、46および47、47および48、48および49、49および50の間、または残基50~100、100~150、150~200、200~250、250~300、300~350、350~400、400~450、450~500、500~600、もしくは600~667の間のいずれか2つの残基の間、あるいは配列番号89の逆転写酵素ホモログまたは等価物のいずれか2つの同等アミノ酸残基の間のペプチド結合である。 Aspect 46. The pharmaceutical composition of embodiment 41, wherein the cleavage site comprises residues 1 and 2, 2 and 3, 3 and 4, 4 and 5, 5 of SEQ ID NO: 89 (standard reverse transcriptase, M-MLV RT). and 6, 6 and 7, 7 and 8, 8 and 9, 9 and 10, 10 and 11, 11 and 12, 12 and 13, 13 and 14, 14 and 15, 16 and 17, 17 and 18, 18 and 19 , 19 and 20, 20 and 21, 21 and 22, 22 and 23, 23 and 24, 24 and 25, 25 and 26, 26 and 27, 27 and (ad) 28, 28 and 29, 29 and 30, 30 and 31, 31 and 32, 32 and 33, 33 and 34, 34 and 35, 35 and 36, 36 and 37, 37 and 38, 38 and 39, 39 and 40, 40 and 41, 41 and 42, 42 and 43, between 43 and 44, 44 and 45, 45 and 46, 46 and 47, 47 and 48, 48 and 49, 49 and 50, or residues 50-100, 100-150, 150-200, 200-250, 250 Between any two residues between ~300, 300-350, 350-400, 400-450, 450-500, 500-600, or 600-667, or a reverse transcriptase homolog or equivalent of SEQ ID NO: 89 is a peptide bond between any two equivalent amino acid residues of a substance.

態様47.態様33の医薬組成物であって、プライム編集因子融合タンパク質のN末端半分が、本明細書に記載のN末端プライム編集因子融合タンパク質をコードするアミノ酸配列を有する。 Aspect 47. The pharmaceutical composition of embodiment 33, wherein the N-terminal half of the prime editing factor fusion protein has an amino acid sequence encoding an N-terminal prime editing factor fusion protein as described herein.

態様48.態様33の医薬組成物であって、プライム編集因子融合タンパク質のC末端半分が、本明細書に記載のN末端プライム編集因子融合タンパク質をコードするアミノ酸配列を有する。 Aspect 48. The pharmaceutical composition of embodiment 33, wherein the C-terminal half of the prime editing factor fusion protein has an amino acid sequence encoding an N-terminal prime editing factor fusion protein as described herein.

態様49.プライム編集因子融合タンパク質を細胞に送達する方法であって、細胞を第1のAAV粒子および第2のAAV粒子によってトランスフェクションすることを含み、第1のAAVベクターがプライム編集因子融合タンパク質のN末端半分を発現し、第2のAAVベクターがプライム編集因子融合タンパク質のC末端半分を発現し、N末端半分およびC末端半分が細胞内で組み合わせられてプライム編集因子融合タンパク質を再構成する。 Embodiment 49. A method of delivering a prime editor fusion protein to a cell, comprising transfecting the cell with a first AAV particle and a second AAV particle, wherein the first AAV vector expresses the N-terminal half of the prime editor fusion protein and the second AAV vector expresses the C-terminal half of the prime editor fusion protein, and wherein the N-terminal and C-terminal halves combine in the cell to reconstitute the prime editor fusion protein.

態様50.態様49の方法であって、第1または第2のAAV粒子がPEgRNAをもまた発現し、これが再構成されたプライム編集因子を標的DNA部位へと標的化する。 Aspect 50. Embodiment 49. The method of embodiment 49, wherein the first or second AAV particle also expresses PEgRNA, which targets the reconstituted prime editing factor to the target DNA site.

態様51.態様49の方法であって、プライム編集因子融合タンパク質が核酸プログラム型DNA結合タンパク質(napDNAbp)ドメインとポリメラーゼドメインとを含む。 Aspect 51. 49. The method of embodiment 49, wherein the prime editing factor fusion protein comprises a nucleic acid programmed DNA binding protein (napDNAbp) domain and a polymerase domain.

態様52.態様49の方法であって、プライム編集因子融合タンパク質が、プライム編集ガイドRNA(PEgRNA)の存在下においてプライム編集を実行することができる。 Aspect 52. Embodiment 49. The method of embodiment 49, wherein the prime editing factor fusion protein is capable of performing prime editing in the presence of a prime editing guide RNA (PEgRNA).

態様53.態様51の方法であって、napDNAbpがCas9タンパク質またはそのバリアントである。 Aspect 53. 52. The method of embodiment 51, wherein napDNAbp is a Cas9 protein or a variant thereof.

態様54.態様53の方法であって、napDNAbpがニッカーゼ活性を有するヌクレアーゼである。 Embodiment 54. The method of embodiment 53, wherein napDNAbp is a nuclease having nickase activity.

態様55.態様53の方法であって、napDNAbpがヌクレアーゼ活性Cas9、ヌクレアーゼ不活性型Cas9(dCas9)、またはCas9ニッカーゼ(nCas9)である。 Aspect 55. 54. The method of embodiment 53, wherein the napDNAbp is nuclease-active Cas9, nuclease-inactive Cas9 (dCas9), or Cas9 nickase (nCas9).

態様56.態様53の方法であって、napDNAbpが:Cas9、Cas12e、Cas12d、Cas12a、Cas12b1、Cas13a、Cas12c、およびアルゴノートからなる群から選択され、任意にニッカーゼ活性を有する。 Aspect 56. 54. The method of embodiment 53, wherein the napDNAbp is selected from the group consisting of: Cas9, Cas12e, Cas12d, Cas12a, Cas12b1, Cas13a, Cas12c, and Argonaute, and optionally has nickase activity.

態様57.態様49の方法であって、N末端およびC末端半分がプライム編集因子融合タンパク質を分裂部位において分裂することによって形成される。 Aspect 57. 49. The method of embodiment 49, wherein the N-terminal and C-terminal halves are formed by splitting the prime editing factor fusion protein at a cleavage site.

態様58.態様57の方法であって、分裂部位がnapDNAbpドメイン上のペプチド結合である。 Aspect 58. 58. The method of embodiment 57, wherein the cleavage site is a peptide bond on the napDNAbp domain.

態様59.態様57の方法であって、分裂部位がポリメラーゼドメイン上のペプチド結合である。 Aspect 59. 58. The method of embodiment 57, wherein the cleavage site is a peptide bond on the polymerase domain.

態様60.態様57の方法であって、分裂部位がリンカー上のペプチド結合である。 Aspect 60. Embodiment 57. The method of embodiment 57, wherein the cleavage site is a peptide bond on the linker.

態様61.態様57の方法であって、分裂部位が、配列番号18(標準的なSpCas9)の残基1および2、2および3、3および4、4および5、5および6、6および7、7および8、8および9、9および10、10および11、11および12、12および13、13および14、14および15、16および17、17および18、18および19、19および20、20および21、21および22、22および23、23および24、24および25、25および26、26および27、27および(ad)28、28および29、29および30、30および31、31および32、32および33、33および34、34および35、35および36、36および37、37および38、38および39、39および40、40および41、41および42、42および43、43および44、44および45、45および46、46および47、47および48、48および49、49および50の間、または残基50~100、100~150、150~200、200~250、250~300、300~350、350~400、400~450、450~500、500~600、600~700、700~800、800~900、900~1000、1000~1100、1100~1200、1200~1300、もしくは1300~1368の間のいずれか2つの残基の間、あるいは配列番号18のSpCas9ホモログまたは等価物のいずれか2つの同等アミノ酸残基の間のペプチド結合である。 Aspect 61. 58. The method of embodiment 57, wherein the cleavage site comprises residues 1 and 2, 2 and 3, 3 and 4, 4 and 5, 5 and 6, 6 and 7, 7 and 8, 8 and 9, 9 and 10, 10 and 11, 11 and 12, 12 and 13, 13 and 14, 14 and 15, 16 and 17, 17 and 18, 18 and 19, 19 and 20, 20 and 21, 21 and 22, 22 and 23, 23 and 24, 24 and 25, 25 and 26, 26 and 27, 27 and (ad) 28, 28 and 29, 29 and 30, 30 and 31, 31 and 32, 32 and 33 , 33 and 34, 34 and 35, 35 and 36, 36 and 37, 37 and 38, 38 and 39, 39 and 40, 40 and 41, 41 and 42, 42 and 43, 43 and 44, 44 and 45, 45 and between 46, 46 and 47, 47 and 48, 48 and 49, 49 and 50, or residues 50 to 100, 100 to 150, 150 to 200, 200 to 250, 250 to 300, 300 to 350, 350 to Any between 400, 400-450, 450-500, 500-600, 600-700, 700-800, 800-900, 900-1000, 1000-1100, 1100-1200, 1200-1300, or 1300-1368 or between any two equivalent amino acid residues of the SpCas9 homolog of SEQ ID NO: 18 or equivalent.

態様62.態様57の方法であって、分裂部位が、配列番号89(標準的な逆転写酵素、M-MLV RT)の残基1および2、2および3、3および4、4および5、5および6、6および7、7および8、8および9、9および10、10および11、11および12、12および13、13および14、14および15、16および17、17および18、18および19、19および20、20および21、21および22、22および23、23および24、24および25、25および26、26および27、27および(ad)28、28および29、29および30、30および31、31および32、32および33、33および34、34および35、35および36、36および37、37および38、38および39、39および40、40および41、41および42、42および43、43および44、44および45、45および46、46および47、47および48、48および49、49および50の間、または残基50~100、100~150、150~200、200~250、250~300、300~350、350~400、400~450、450~500、500~600、もしくは600~667の間のいずれか2つの残基の間、あるいは配列番号89の逆転写酵素ホモログまたは等価物のいずれか2つの同等アミノ酸残基の間のペプチド結合である。 Aspect 62. 58. The method of embodiment 57, wherein the cleavage site comprises residues 1 and 2, 2 and 3, 3 and 4, 4 and 5, 5 and 6 of SEQ ID NO: 89 (standard reverse transcriptase, M-MLV RT). , 6 and 7, 7 and 8, 8 and 9, 9 and 10, 10 and 11, 11 and 12, 12 and 13, 13 and 14, 14 and 15, 16 and 17, 17 and 18, 18 and 19, 19 and 20, 20 and 21, 21 and 22, 22 and 23, 23 and 24, 24 and 25, 25 and 26, 26 and 27, 27 and (ad) 28, 28 and 29, 29 and 30, 30 and 31, 31 and 32, 32 and 33, 33 and 34, 34 and 35, 35 and 36, 36 and 37, 37 and 38, 38 and 39, 39 and 40, 40 and 41, 41 and 42, 42 and 43, 43 and between 44, 44 and 45, 45 and 46, 46 and 47, 47 and 48, 48 and 49, 49 and 50, or residues 50-100, 100-150, 150-200, 200-250, 250-300 , 300-350, 350-400, 400-450, 450-500, 500-600, or 600-667, or a reverse transcriptase homologue of SEQ ID NO: 89 or an equivalent. A peptide bond between any two equivalent amino acid residues.

態様63.態様49の方法であって、プライム編集因子融合タンパク質のN末端半分が、本明細書に記載のN末端プライム編集因子融合タンパク質をコードするアミノ酸配列を有する。 Aspect 63. 49. The method of embodiment 49, wherein the N-terminal half of the prime editing factor fusion protein has an amino acid sequence encoding an N-terminal prime editing factor fusion protein as described herein.

態様64.態様49の方法であって、プライム編集因子融合タンパク質のC末端半分が、本明細書に記載のC末端プライム編集因子融合タンパク質をコードするアミノ酸配列を有する。 Aspect 64. 49. The method of embodiment 49, wherein the C-terminal half of the prime editing factor fusion protein has an amino acid sequence encoding a C-terminal prime editing factor fusion protein as described herein.

態様65.態様49の方法であって、第1のAAV粒子が、第1のプライム編集因子構成要素をコードするヌクレオチド配列を含む組み換えAAVゲノムを含む。 Aspect 65. 49. The method of embodiment 49, wherein the first AAV particle comprises a recombinant AAV genome comprising a nucleotide sequence encoding a first prime editing element component.

態様66.態様49の方法であって、第2のAAV粒子が、第2のプライム編集因子構成要素をコードするヌクレオチド配列を含む組み換えAAVゲノムを含む。 Aspect 66. 49. The method of embodiment 49, wherein the second AAV particle comprises a recombinant AAV genome comprising a nucleotide sequence encoding a second prime editing element component.

態様67.態様49の方法であって、トランスフェクションステップがインビボで行われる。 Aspect 67. Embodiment 49. The method of embodiment 49, wherein the transfection step is performed in vivo.

態様68.態様49の方法であって、トランスフェクションステップがエクスビボで行われる。 Aspect 68. Embodiment 49. The method of embodiment 49, wherein the transfection step is performed ex vivo.

態様69.態様50の方法であって、標的DNA部位が疾患関連遺伝子である。 Aspect 69. 50. The method of embodiment 50, wherein the target DNA site is a disease-related gene.

態様70.態様69の方法であって、疾患関連遺伝子が:アデノシンデアミナーゼ(ADA)欠損症;アルファ-1アンチトリプシン欠損症;嚢胞性線維症;デュシェンヌ型筋ジストロフィー;ガラクトース血症;ヘモクロマトーシス;ハンチントン病;メープルシロップ尿症;マルファン症候群;1型神経線維腫症;先天性爪肥厚症;フェニルケトン尿症;重症複合免疫不全;鎌状赤血球症;スミス・レムリ・オピッツ症候群;トリヌクレオチド反復障害;プリオン病;およびテイ・サックス病からなる群から選択される単一遺伝子障害に関連する。 Mode 70. 69. The method of embodiment 69, wherein the disease-associated gene is: adenosine deaminase (ADA) deficiency; alpha-1 antitrypsin deficiency; cystic fibrosis; Duchenne muscular dystrophy; galactosemia; hemochromatosis; Huntington's disease; maple Syrupuria; Marfan syndrome; type 1 neurofibromatosis; congenital nail hypertrophy; phenylketonuria; severe combined immunodeficiency; sickle cell disease; Smith-Lemli-Opitz syndrome; trinucleotide repeat disorder; prion disease associated with a single gene disorder selected from the group consisting of; and Tay-Sachs disease.

態様71.態様69の方法であって、疾患関連遺伝子が:心臓病;高血圧;アルツハイマー病;関節炎;糖尿病;がん;および肥満からなる群から選択される多遺伝子性障害に関連する。 Aspect 71. 69. The method of embodiment 69, wherein the disease-associated gene is associated with a polygenic disorder selected from the group consisting of: heart disease; hypertension; Alzheimer's disease; arthritis; diabetes; cancer; and obesity.

態様72.態様51の方法であって、プログラム可能なDNA結合タンパク質(napDNAbp)ドメイン。 Aspect 72. 52. The method of embodiment 51, wherein the programmable DNA binding protein (napDNAbp) domain.

態様73.態様51の方法であって、ポリメラーゼドメインが逆転写酵素である。 Aspect 73. 52. The method of embodiment 51, wherein the polymerase domain is a reverse transcriptase.

態様74.態様73の方法であって、逆転写酵素が、配列番号89~100、105~122、128~129、132、139、143、149、154、159、235、454、471、516、662、700、701~716、739~741、および766のアミノ酸配列のいずれか1つを含む。 Embodiment 74. The method of embodiment 73, wherein the reverse transcriptase comprises any one of the amino acid sequences of SEQ ID NOs: 89-100, 105-122, 128-129, 132, 139, 143, 149, 154, 159, 235, 454, 471, 516, 662, 700, 701-716, 739-741, and 766.

態様75.態様73の方法であって、逆転写酵素が、配列番号89~100、105~122、128~129、132、139、143、149、154、159、235、454、471、516、662、700、701~716、739~741、および766のいずれか1つのアミノ酸配列との少なくとも80%、85%、90%、95%、98%、または99%配列同一性を有するアミノ酸配列を含む。 Aspect 75. The method of embodiment 73, wherein the reverse transcriptase is SEQ ID NO: 89-100, 105-122, 128-129, 132, 139, 143, 149, 154, 159, 235, 454, 471, 516, 662, 700 , 701-716, 739-741, and 766.

態様76.態様73の方法であって、napDNAbpが配列番号18のアミノ酸配列を含む。 Aspect 76. 74. The method of embodiment 73, wherein napDNAbp comprises the amino acid sequence of SEQ ID NO: 18.

態様77.態様73の方法であって、napDNAbpが、配列番号18~88、126、130、137、141、147、153、157、445、460、467、および482~487のいずれか1つのアミノ酸配列との少なくとも80%、85%、90%、95%、98%、または99%配列同一性を有するアミノ酸配列を含む。
態様78.態様8のポリペプチドであって、分裂部位が、配列番号18の1023および1024の間、または配列番号18との少なくとも85%、少なくとも90%、少なくとも95%、少なくとも99%、もしくは少なくとも99.5%配列同一性を有するアミノ酸配列上の対応する位置である。
Aspect 77. 74. The method of embodiment 73, wherein napDNAbp has an amino acid sequence of any one of SEQ ID NOs: 18-88, 126, 130, 137, 141, 147, 153, 157, 445, 460, 467, and 482-487. Comprising amino acid sequences with at least 80%, 85%, 90%, 95%, 98%, or 99% sequence identity.
Aspect 78. The polypeptide of embodiment 8, wherein the splitting site is between 1023 and 1024 of SEQ ID NO: 18, or at least 85%, at least 90%, at least 95%, at least 99%, or at least 99.5% sequence with SEQ ID NO: 18. Corresponding positions on amino acid sequences that have identity.

群G.RNA構造/機能を改変するためのPE法
態様1.プライム編集によって、標的ヌクレオチド配列によってコードされる目当てのRNA上にリボヌクレオチドモチーフまたはタグを組み入れる方法であって、方法が:(a)標的ヌクレオチド配列を(i)核酸プログラム型DNA結合タンパク質(napDNAbp)およびポリメラーゼを含むプライム編集因子ならびに(ii)リボヌクレオチドモチーフまたはタグをコードする編集鋳型を含むPEgRNAと接触させること;それによって、リボヌクレオチドモチーフまたはタグをコードする一本鎖DNA配列を重合すること;ならびにDNA修復および/または複製プロセスによって、標的ヌクレオチド配列における対応する内生鎖の代わりに一本鎖DNA配列を組み込むことを含み、方法が、リボヌクレオチドモチーフまたはタグを含む目当ての修飾されたRNAをコードする標的ヌクレオチド配列を生ずる。
Group G. PE method embodiment 1 for modifying RNA structure/function . A method of incorporating a ribonucleotide motif or tag onto an RNA of interest encoded by a target nucleotide sequence by prime editing, the method comprising: (a) converting the target nucleotide sequence into (i) a nucleic acid programmed DNA binding protein (napDNAbp); and a prime editing agent comprising a polymerase and (ii) PEgRNA comprising an editing template encoding a ribonucleotide motif or tag; thereby polymerizing the single-stranded DNA sequence encoding the ribonucleotide motif or tag; and incorporating a single-stranded DNA sequence in place of the corresponding endogenous strand in the target nucleotide sequence by a DNA repair and/or replication process, the method comprising generate a target nucleotide sequence encoding the target nucleotide sequence.

態様2.態様1の方法であって、リボヌクレオチドモチーフまたはタグが検出部分である。 Aspect 2. The method of embodiment 1, wherein the ribonucleotide motif or tag is the detection moiety.

態様3.態様1の方法であって、リボヌクレオチドモチーフまたはタグが目当てのRNAの発現レベルに影響する。 Aspect 3. Embodiment 1. The method of embodiment 1, wherein the ribonucleotide motif or tag affects the expression level of the RNA of interest.

態様4.態様1の方法であって、リボヌクレオチドモチーフまたはタグが目当てのRNAの輸送または細胞下レベル位置付けに影響する。 Aspect 4. The method of embodiment 1, wherein the ribonucleotide motif or tag affects the trafficking or subcellular localization of the RNA of interest.

態様5.態様1の方法であって、リボヌクレオチドモチーフまたはタグが、SV40 1型、SV40 2型、SV40 3型、hGH、BGH、rbGlob、TK、MALAT1 ENE-mascRNA、KSHV PAN ENE、Smbox/U1 snRNAボックス、U1 snRNA 3'ボックス、tRNA-リジン、broccoliアプタマー、spinachアプタマー、mangoアプタマー、HDVリボザイム、およびm6Aからなる群から選択される。 Aspect 5. The method of embodiment 1, wherein the ribonucleotide motif or tag is SV40 type 1, SV40 type 2, SV40 type 3, hGH, BGH, rbGlob, TK, MALAT1 ENE-mascRNA, KSHV PAN ENE, Smbox/U1 snRNA box, selected from the group consisting of U1 snRNA 3' box, tRNA-lysine, broccoli aptamer, spinach aptamer, mango aptamer, HDV ribozyme, and m6A.

態様6.態様1の方法であって、PEgRNAが、配列番号101~104、181~183、223~244、277、325~334、336、338、340、342、344、346、348、350、352、354、356、358、360、362、364、366、368、499~505、735~761、776~777を含む(表を見よ)。 Aspect 6. The method of embodiment 1, wherein the PEgRNA is SEQ ID NO: 101-104, 181-183, 223-244, 277, 325-334, 336, 338, 340, 342, 344, 346, 348, 350, 352, 354 , 356, 358, 360, 362, 364, 366, 368, 499-505, 735-761, 776-777 (see table).

態様7.態様1の方法であって、融合タンパク質がPE1、PE2、またはPE3のアミノ酸配列を含む。 Aspect 7. The method of embodiment 1, wherein the fusion protein comprises the amino acid sequence of PE1, PE2, or PE3.

態様8.態様1の方法であって、napDNAbpがCas9ニッカーゼ(nCas9)である。 Aspect 8. The method of embodiment 1, wherein napDNAbp is Cas9 nickase (nCas9).

態様9.態様1の方法であって、napDNAbpが、配列番号18~88、126、130、137、141、147、153、157、445、460、467、および482~487のアミノ酸配列を含む。 Aspect 9. The method of embodiment 1, wherein napDNAbp comprises the amino acid sequences of SEQ ID NOs: 18-88, 126, 130, 137, 141, 147, 153, 157, 445, 460, 467, and 482-487.

群H.遺伝子ライブラリを作るためのPE法
態様1.プライム編集によって、プログラムされた変異体遺伝子ライブラリを構築する方法であって、方法が:
Group H. PE method mode 1 for creating a gene library . A method of constructing a programmed mutant gene library by prime editing, the method comprising:

(a)1つ以上の標的遺伝子座位を夫々が含む標的ヌクレオチド配列のライブラリを(i)核酸プログラム型DNA結合タンパク質(napDNAbp)およびポリメラーゼを含むプライム編集因子ならびに(ii)1つ以上の標的遺伝子座位に対して相対的に少なくとも1つの遺伝子変化を有する配列を含む編集鋳型を含むPEgRNAと接触させること; (a) a library of target nucleotide sequences each comprising one or more target gene loci; (i) a prime editing factor comprising a nucleic acid programmed DNA binding protein (napDNAbp) and a polymerase; and (ii) one or more target gene loci. contacting PEgRNA comprising an editing template comprising a sequence having at least one genetic change relative to;

それによって、編集鋳型を鋳型とする一本鎖DNA配列を重合すること;ならびに thereby polymerizing a single-stranded DNA sequence templated with the editing template; and

DNA修復および/または複製プロセスによって、1つ以上の標的遺伝子座位の代わりに一本鎖DNA配列を組み込み、それによって、少なくとも1つの遺伝子変化を前記ライブラリの標的ヌクレオチド配列の標的遺伝子座位上に組み込むこと、
を含む。
Incorporating a single-stranded DNA sequence in place of one or more target genetic loci by a DNA repair and/or replication process, thereby incorporating at least one genetic change onto the target genetic locus of the target nucleotide sequences of said library. ,
including.

態様2.態様1の方法であって、ライブラリがプラスミドライブラリである。 Aspect 2. The method of embodiment 1, wherein the library is a plasmid library.

態様3.態様1の方法であって、ライブラリがファージライブラリである。 Aspect 3. The method of embodiment 1, wherein the library is a phage library.

態様4.態様1の方法であって、1つ以上の標的遺伝子座位がタンパク質をコードする領域を含む。 Aspect 4. Embodiment 1. The method of embodiment 1, wherein the one or more target gene loci comprises a protein-coding region.

態様5.態様1の方法であって、1つ以上の標的遺伝子座位がタンパク質の二次構造モチーフをコードする領域を含む。 Aspect 5. Embodiment 1. The method of embodiment 1, wherein the one or more target gene loci comprises a region encoding a protein secondary structure motif.

態様6.態様5の方法であって、二次構造モチーフがアルファヘリックスである。 Aspect 6. Embodiment 5. The method of embodiment 5, wherein the secondary structure motif is an alpha helix.

態様7.態様5の方法であって、二次構造モチーフがベータシートである。 Aspect 7. The method of embodiment 5, wherein the secondary structure motif is a beta sheet.

態様8.態様1の方法であって、napDNAbpがCas9タンパク質またはそのバリアントである。 Aspect 8. The method of embodiment 1, wherein napDNAbp is a Cas9 protein or a variant thereof.

態様9.態様1の方法であって、napDNAbpがニッカーゼ活性を有するヌクレアーゼである。 Aspect 9. The method of embodiment 1, wherein napDNAbp is a nuclease with nickase activity.

態様10.態様1の方法であって、napDNAbpがヌクレアーゼ活性Cas9、ヌクレアーゼ不活性型Cas9(dCas9)、またはCas9ニッカーゼ(nCas9)である。 Aspect 10. The method of embodiment 1, wherein napDNAbp is nuclease-active Cas9, nuclease-inactive Cas9 (dCas9), or Cas9 nickase (nCas9).

態様11.態様1の方法であって、napDNAbpが配列番号18のアミノ酸配列を含む。 Aspect 11. The method of embodiment 1, wherein napDNAbp comprises the amino acid sequence of SEQ ID NO: 18.

態様12.態様1の方法であって、napDNAbpが、配列番号18~88、126、130、137、141、147、153、157、445、460、467、および482~487のいずれか1つのアミノ酸配列との少なくとも80%、85%、90%、95%、98%、または99%配列同一性を有するアミノ酸配列を含む。 Embodiment 12. The method of embodiment 1, wherein napDNAbp comprises an amino acid sequence having at least 80%, 85%, 90%, 95%, 98%, or 99% sequence identity to any one of the amino acid sequences of SEQ ID NOs: 18-88, 126, 130, 137, 141, 147, 153, 157, 445, 460, 467, and 482-487.

態様13.態様1の方法であって、ポリメラーゼドメインが逆転写酵素である。 Aspect 13. The method of embodiment 1, wherein the polymerase domain is a reverse transcriptase.

態様14.態様13の方法であって、逆転写酵素が、配列番号89~100、105~122、128~129、132、139、143、149、154、159、235、454、471、516、662、700、701~716、739~741、および766のアミノ酸配列のいずれか1つを含む。 Aspect 14. The method of embodiment 13, wherein the reverse transcriptase is SEQ ID NO: 89-100, 105-122, 128-129, 132, 139, 143, 149, 154, 159, 235, 454, 471, 516, 662, 700 , 701-716, 739-741, and 766.

態様15.態様14の方法であって、逆転写酵素が、配列番号89~100、105~122、128~129、132、139、143、149、154、159、235、454、471、516、662、700、701~716、739~741、および766のいずれか1つのアミノ酸配列との少なくとも80%、85%、90%、95%、98%、または99%配列同一性を有するアミノ酸配列を含む。 Aspect 15. The method of embodiment 14, wherein the reverse transcriptase is SEQ ID NO: 89-100, 105-122, 128-129, 132, 139, 143, 149, 154, 159, 235, 454, 471, 516, 662, 700 , 701-716, 739-741, and 766.

態様16.態様1の方法であって、編集鋳型の少なくとも1つの遺伝子変化が挿入である。 Aspect 16. The method of embodiment 1, wherein at least one genetic change in the editing template is an insertion.

態様17.態様1の方法であって、編集鋳型の少なくとも1つの遺伝子変化が欠失である。 Aspect 17. The method of embodiment 1, wherein at least one genetic change in the editing template is a deletion.

態様18.態様1の方法であって、編集鋳型の少なくとも1つの遺伝子変化が置換である。 Aspect 18. The method of embodiment 1, wherein at least one genetic change in the editing template is a substitution.

態様19.態様1の方法であって、少なくとも1つの遺伝子変化が1つ以上のコドンの挿入である。 Aspect 19. The method of aspect 1, wherein at least one genetic change is an insertion of one or more codons.

態様20.態様1の方法であって、少なくとも1つの遺伝子変化が1つ以上のコドンの欠失である。 Mode 20. The method of embodiment 1, wherein the at least one genetic change is a deletion of one or more codons.

態様21.態様1の方法であって、少なくとも1つの遺伝子変化が停止コドンの挿入である。 Aspect 21. The method of embodiment 1, wherein the at least one genetic change is the insertion of a stop codon.

態様22.態様1の方法であって、少なくとも1つの遺伝子変化が非停止コドンから停止コドンへの変換である。 Embodiment 22. The method of embodiment 1, wherein at least one genetic change is a conversion of a non-stop codon to a stop codon.

態様23.態様1の方法であって、方法が、同時に、少なくとも2、または3、または4、または5、または6、または7、または8、または9、または10、または10~100の間、または100~200の間、または200~300の間、または300~400の間、または400~500の間の標的遺伝子座位に対して、ライブラリの標的ヌクレオチド配列の夫々について行われる。 Aspect 23. The method of embodiment 1, wherein the method simultaneously comprises at least 2, or 3, or 4, or 5, or 6, or 7, or 8, or 9, or 10, or between 10 and 100, or between 100 and Each of the target nucleotide sequences of the library is performed for between 200, or between 200 and 300, or between 300 and 400, or between 400 and 500 target gene loci.

態様24.態様1の方法であって、方法がPACEまたはPANCE進化の間に行われ、少なくとも1つの遺伝子変化を前記ライブラリの標的ヌクレオチド配列の標的遺伝子座位に組み込むことの夫々のものが、新たな標的配列をもまた組み入れる。 Aspect 24. The method of embodiment 1, wherein the method is performed during PACE or PANCE evolution, and each of the steps of incorporating at least one genetic change into a target locus of a target nucleotide sequence of said library introduces a new target sequence. Also incorporate.

群I.オフターゲット検出のためのPE法
態様1.プライム編集因子によるオフターゲット編集を評価する方法であって、方法が:
Group I. PE method aspect 1 for off-target detection . A method for evaluating off-target editing by prime editing factors, the method comprising:

(a)編集部位を有する標的ヌクレオチド配列を(i)核酸プログラム型DNA結合タンパク質(napDNAbp)およびポリメラーゼを含むプライム編集因子融合タンパク質ならびに(ii)検出可能な配列をコードするDNA合成鋳型を含むPEgRNAと接触させ; (a) A target nucleotide sequence containing an editing site is combined with (i) a prime editing factor fusion protein containing a nucleic acid programmed DNA binding protein (napDNAbp) and a polymerase and (ii) a PEgRNA containing a DNA synthesis template encoding a detectable sequence. bring into contact;

PEgRNAが融合タンパク質と複合体化し、前記融合タンパク質を編集部位へと、および存在する場合には1つ以上のオフターゲット部位へとガイドし; PEgRNA complexed with a fusion protein and guiding said fusion protein to the editing site and, if present, to one or more off-target sites;

プライム編集因子融合タンパク質が、検出可能な配列を編集部位に、および存在する場合には1つ以上のオフターゲット部位に組み入れること; the prime editing factor fusion protein incorporates a detectable sequence at the editing site and, if present, at one or more off-target sites;

(b)編集部位および1つ以上のオフターゲット部位のヌクレオチド配列を決定すること、
を含む。
(b) determining the nucleotide sequence of the editing site and one or more off-target sites;
including.

態様2.態様1の方法であって、標的ヌクレオチド配列がゲノムである。 Aspect 2. The method of embodiment 1, wherein the target nucleotide sequence is a genome.

態様3.態様1の方法であって、接触させるステップがin vitroである。 Aspect 3. The method of embodiment 1, wherein the contacting step is in vitro.

態様4.態様1の方法であって、接触させるステップがインビボである。 Aspect 4. The method of aspect 1, wherein the contacting step is in vivo.

態様5.態様1の方法であって、編集部位が疾患関連遺伝子の変異である。 Aspect 5. The method of embodiment 1, wherein the editing site is a mutation in a disease-related gene.

態様6.態様5の方法であって、変異が1塩基置換、挿入、欠失、または逆位である。 Aspect 6. Embodiment 5. The method of embodiment 5, wherein the mutation is a single base substitution, insertion, deletion, or inversion.

態様7.態様1の方法であって、疾患関連遺伝子が:アデノシンデアミナーゼ(ADA)欠損症;アルファ-1アンチトリプシン欠損症;嚢胞性線維症;デュシェンヌ型筋ジストロフィー;ガラクトース血症;ヘモクロマトーシス;ハンチントン病;メープルシロップ尿症;マルファン症候群;1型神経線維腫症;先天性爪肥厚症;フェニルケトン尿症;重症複合免疫不全;鎌状赤血球症;スミス・レムリ・オピッツ症候群;およびテイ・サックス病からなる群から選択される単一遺伝子障害に関連する。 Aspect 7. The method of embodiment 1, wherein the disease-associated gene is: adenosine deaminase (ADA) deficiency; alpha-1 antitrypsin deficiency; cystic fibrosis; Duchenne muscular dystrophy; galactosemia; hemochromatosis; Huntington's disease; maple Consisting of syrup urine disease; Marfan syndrome; type 1 neurofibromatosis; congenital nail hyperplasia; phenylketonuria; severe combined immunodeficiency; sickle cell disease; Smith-Lemli-Opitz syndrome; and Tay-Sachs disease. associated with a single gene disorder selected from the group.

態様8.態様1の方法であって、疾患関連遺伝子が:心臓病;高血圧;アルツハイマー病;関節炎;糖尿病;がん;および肥満からなる群から選択される多遺伝子性障害に関連する。 Aspect 8. The method of embodiment 1, wherein the disease-associated gene is associated with a polygenic disorder selected from the group consisting of: heart disease; hypertension; Alzheimer's disease; arthritis; diabetes; cancer; and obesity.

態様9.態様1の方法であって、融合タンパク質が、配列番号101~104、181~183、223~244、277、325~334、336、338、340、342、344、346、348、350、352、354、356、358、360、362、364、366、368、499~505、735~761、776~777のアミノ酸配列、または配列番号101~104、181~183、223~244、277、325~334、336、338、340、342、344、346、348、350、352、354、356、358、360、362、364、366、368、499~505、735~761、776~777との少なくとも80%、85%、90%、95%、98%、もしくは99%配列同一性を有するアミノ酸配列を有する。 Aspect 9. The method of embodiment 1, wherein the fusion protein comprises SEQ ID NOs: 101-104, 181-183, 223-244, 277, 325-334, 336, 338, 340, 342, 344, 346, 348, 350, 352, Amino acid sequence of 354, 356, 358, 360, 362, 364, 366, 368, 499-505, 735-761, 776-777, or SEQ ID NO: 101-104, 181-183, 223-244, 277, 325- 334, 336, 338, 340, 342, 344, 346, 348, 350, 352, 354, 356, 358, 360, 362, 364, 366, 368, 499-505, 735-761, 776-777 and at least Having amino acid sequences that have 80%, 85%, 90%, 95%, 98%, or 99% sequence identity.

態様10.態様1の方法であって、napDNAbpがCas9、Cas12e、Cas12d、Cas12a、Cas12b1、Cas13a、Cas12c、もしくはアルゴノート、またはCas9、Cas12e、Cas12d、Cas12a、Cas12b1、Cas13a、Cas12c、もしくはアルゴノートのバリアントである。 Aspect 10. The method of embodiment 1, wherein napDNAbp is Cas9, Cas12e, Cas12d, Cas12a, Cas12b1, Cas13a, Cas12c, or Argonaute, or a variant of Cas9, Cas12e, Cas12d, Cas12a, Cas12b1, Cas13a, Cas12c, or Argonaute. .

態様11.態様1の方法であって、napDNAbpがCas9またはそのバリアントである。 Aspect 11. The method of embodiment 1, wherein napDNAbp is Cas9 or a variant thereof.

態様12.態様1の方法であって、napDNAbpがヌクレアーゼ活性Cas9、ヌクレアーゼ不活性型Cas9(dCas9)、またはCas9ニッカーゼ(nCas9)である。 Aspect 12. The method of embodiment 1, wherein napDNAbp is nuclease-active Cas9, nuclease-inactive Cas9 (dCas9), or Cas9 nickase (nCas9).

態様13.態様1の方法であって、napDNAbpがCas9ニッカーゼ(nCas9)である。 Aspect 13. The method of embodiment 1, wherein napDNAbp is Cas9 nickase (nCas9).

態様14.態様1の方法であって、napDNAbpが、配列番号18のアミノ酸配列、または配列番号18との少なくとも80%、85%、90%、95%、98%、もしくは99%配列同一性を有するアミノ酸配列を含む。 Aspect 14. The method of embodiment 1, wherein napDNAbp is the amino acid sequence of SEQ ID NO: 18, or an amino acid sequence having at least 80%, 85%, 90%, 95%, 98%, or 99% sequence identity with SEQ ID NO: 18. including.

態様15.態様1の方法であって、napDNAbpが、SpCas9野生型、あるいは配列番号18~88、126、130、137、141、147、153、157、445、460、467、および482~487のいずれか1つのアミノ酸、または配列番号18~88、126、130、137、141、147、153、157、445、460、467、および482~487のいずれかとの少なくとも80%、85%、90%、95%、98%、もしくは99%配列同一性を有するアミノ酸配列のそのバリアントである。 Aspect 15. The method of embodiment 1, wherein napDNAbp is SpCas9 wild type or any one of SEQ ID NOs : 18-88, 126, 130, 137, 141, 147, 153, 157, 445, 460, 467, and 482-487. or at least 80%, 85%, 90%, 95 with any of SEQ ID NOs : 18-88 , 126, 130, 137, 141, 147, 153, 157, 445, 460, 467, and 482-487. %, 98%, or 99% sequence identity.

態様16.態様1の方法であって、napDNAbpがSpCas9オーソログである。 Aspect 16. The method of embodiment 1, wherein napDNAbp is an SpCas9 ortholog.

態様17.態様1の方法であって、napDNAbpが、配列番号18~88、126、130、137、141、147、153、157、445、460、467、および482~487のいずれか1つのアミノ酸、または配列番号18~88、126、130、137、141、147、153、157、445、460、467、および482~487のいずれかとの少なくとも80%、85%、90%、95%、98%、もしくは99%配列同一性を有するアミノ酸配列である。 Aspect 17. The method of embodiment 1, wherein napDNAbp is any one amino acid of SEQ ID NO : 18-88, 126, 130, 137, 141, 147, 153, 157, 445, 460, 467, and 482-487, or at least 80%, 85%, 90%, 95%, 98% with any of SEQ ID NO: 18-88, 126, 130, 137, 141, 147, 153, 157, 445, 460, 467, and 482-487; or an amino acid sequence with 99% sequence identity.

態様18.態様1の方法であって、napDNAbpが、配列番号18~88、126、130、137、141、147、153、157、445、460、467、および482~487のいずれか1つのアミノ酸配列との少なくとも80%、85%、90%、95%、98%、または99%配列同一性を有するアミノ酸配列を含む。 Aspect 18. The method of embodiment 1, wherein napDNAbp has an amino acid sequence of any one of SEQ ID NOs: 18-88, 126, 130, 137, 141, 147, 153, 157, 445, 460, 467, and 482-487. Comprising amino acid sequences with at least 80%, 85%, 90%, 95%, 98%, or 99% sequence identity.

態様19.態様1の方法であって、ポリメラーゼがRNA依存性DNAポリメラーゼ活性を含む。 Aspect 19. The method of embodiment 1, wherein the polymerase comprises RNA-dependent DNA polymerase activity.

態様20.態様1の方法であって、ポリメラーゼが逆転写酵素である。 Mode 20. The method of embodiment 1, wherein the polymerase is reverse transcriptase.

態様21.態様1の方法であって、逆転写酵素が天然に存在する野生型逆転写酵素であり、配列番号89のいずれか1つのアミノ酸配列、または配列番号89のいずれかとの少なくとも80%、85%、90%、95%、98%、もしくは99%配列同一性を有するアミノ酸配列を有する。 Embodiment 21. The method of embodiment 1, wherein the reverse transcriptase is a naturally occurring wild-type reverse transcriptase having an amino acid sequence of any one of SEQ ID NO:89, or an amino acid sequence having at least 80%, 85%, 90%, 95%, 98%, or 99% sequence identity to any one of SEQ ID NO:89.

態様22.態様1の方法であって、逆転写酵素がバリアント逆転写酵素であり、配列番号89~100、105~122、128~129、132、139、143、149、154、159、235、454、471、516、662、700、701~716、739~741、および766のいずれか1つのアミノ酸配列、または配列番号89~100、105~122、128~129、132、139、143、149、154、159、235、454、471、516、662、700、701~716、739~741、および766のいずれかとの少なくとも80%、85%、90%、95%、98%、もしくは99%配列同一性を有するアミノ酸配列を有する。 Aspect 22. The method of embodiment 1, wherein the reverse transcriptase is a variant reverse transcriptase, and SEQ ID NOs: 89-100, 105-122, 128-129, 132, 139, 143, 149, 154, 159, 235, 454, 471 , 516, 662, 700, 701-716, 739-741, and 766, or SEQ ID NO: 89-100, 105-122, 128-129, 132, 139, 143, 149, 154, At least 80%, 85%, 90%, 95%, 98%, or 99% sequence identity with any of 159, 235, 454, 471, 516, 662, 700, 701-716, 739-741, and 766 It has an amino acid sequence.

態様23.態様1の方法であって、逆転写酵素が、配列番号89~100、105~122、128~129、132、139、143、149、154、159、235、454、471、516、662、700、701~716、739~741、および766のアミノ酸配列のいずれか1つを含む。 Aspect 23. The method of embodiment 1, wherein the reverse transcriptase is SEQ ID NO: 89-100, 105-122, 128-129, 132, 139, 143, 149, 154, 159, 235, 454, 471, 516, 662, 700. , 701-716, 739-741, and 766.

態様24.態様1の方法であって、逆転写酵素が、配列番号89~100、105~122、128~129、132、139、143、149、154、159、235、454、471、516、662、700、701~716、739~741、および766のいずれか1つのアミノ酸配列との少なくとも80%、85%、90%、95%、98%、または99%配列同一性を有するアミノ酸配列を含む。 Embodiment 24. The method of embodiment 1, wherein the reverse transcriptase comprises an amino acid sequence having at least 80%, 85%, 90%, 95%, 98%, or 99% sequence identity to any one of the amino acid sequences of SEQ ID NOs: 89-100, 105-122, 128-129, 132, 139, 143, 149, 154, 159, 235, 454, 471, 516, 662, 700, 701-716, 739-741, and 766.

態様25.態様1の方法であって、検出可能な配列が、少なくとも1、または少なくとも2、または少なくとも3、または少なくとも4、または少なくとも5、または少なくとも6、または少なくとも7、または少なくとも8、または少なくとも9、または少なくとも10、または少なくとも11、または少なくとも12、または少なくとも13、または少なくとも14、または少なくとも15、または少なくとも16、または少なくとも17、または少なくとも18、または少なくとも19、または少なくとも20、または少なくとも21、または少なくとも22、または少なくとも23、または少なくとも24、または少なくとも25、または少なくとも26、または少なくとも27、または少なくとも28、または少なくとも29、または少なくとも30、または少なくとも31、または少なくとも32、または少なくとも33、または少なくとも34、または少なくとも35、または少なくとも40、または少なくとも50、または少なくとも60、または少なくとも70、または少なくとも80、または少なくとも90、または少なくとも100核酸塩基の挿入である。 Aspect 25. The method of embodiment 1, wherein the detectable sequence is at least 1, or at least 2, or at least 3, or at least 4, or at least 5, or at least 6, or at least 7, or at least 8, or at least 9, or at least 10, or at least 11, or at least 12, or at least 13, or at least 14, or at least 15, or at least 16, or at least 17, or at least 18, or at least 19, or at least 20, or at least 21, or at least 22 , or at least 23, or at least 24, or at least 25, or at least 26, or at least 27, or at least 28, or at least 29, or at least 30, or at least 31, or at least 32, or at least 33, or at least 34, or The insertion is at least 35, or at least 40, or at least 50, or at least 60, or at least 70, or at least 80, or at least 90, or at least 100 nucleobases.

態様26.態様1の方法であって、検出可能な配列が、少なくとも1、または少なくとも2、または少なくとも3、または少なくとも4、または少なくとも5、または少なくとも6、または少なくとも7、または少なくとも8、または少なくとも9、または少なくとも10、または少なくとも11、または少なくとも12、または少なくとも13、または少なくとも14、または少なくとも15、または少なくとも16、または少なくとも17、または少なくとも18、または少なくとも19、または少なくとも20、または少なくとも21、または少なくとも22、または少なくとも23、または少なくとも24、または少なくとも25、または少なくとも26、または少なくとも27、または少なくとも28、または少なくとも29、または少なくとも30、または少なくとも31、または少なくとも32、または少なくとも33、または少なくとも34、または少なくとも35、または少なくとも40、または少なくとも50、または少なくとも60、または少なくとも70、または少なくとも80、または少なくとも90、または少なくとも100核酸塩基の欠失である。 Embodiment 26. The method of embodiment 1, wherein the detectable sequence is a deletion of at least 1, or at least 2, or at least 3, or at least 4, or at least 5, or at least 6, or at least 7, or at least 8, or at least 9, or at least 10, or at least 11, or at least 12, or at least 13, or at least 14, or at least 15, or at least 16, or at least 17, or at least 18, or at least 19, or at least 20, or at least 21, or at least 22, or at least 23, or at least 24, or at least 25, or at least 26, or at least 27, or at least 28, or at least 29, or at least 30, or at least 31, or at least 32, or at least 33, or at least 34, or at least 35, or at least 40, or at least 50, or at least 60, or at least 70, or at least 80, or at least 90, or at least 100 nucleobases.

態様27.態様1の方法であって、検出可能な配列が核酸塩基置換である。 Aspect 27. The method of embodiment 1, wherein the detectable sequence is a nucleobase substitution.

態様28.態様1の方法であって、検出可能な配列がトランジション変異である。 Aspect 28. The method of embodiment 1, wherein the detectable sequence is a transition mutation.

態様29.態様1の方法であって、検出可能な配列がトランスバージョン変異である。 Aspect 29. The method of embodiment 1, wherein the detectable sequence is a transversion mutation.

態様30.態様1の方法であって、検出可能な配列が1ヌクレオチド置換であり:(1)GからTの置換、(2)GからAの置換、(3)GからCの置換、(4)TからGの置換、(5)TからAの置換、(6)TからCの置換、(7)CからGの置換、(8)CからTの置換、(9)CからAの置換、(10)AからTの置換、(11)AからGの置換、および(12)AからCの置換からなる群から選択される。 Aspect 30. The method of embodiment 1, wherein the detectable sequence is a single nucleotide substitution: (1) G to T substitution, (2) G to A substitution, (3) G to C substitution, (4) T Substitution of G from (5) Substitution of A from T, (6) Substitution of C from T, (7) Substitution of G from C, (8) Substitution of T from C, (9) Substitution of A from C, selected from the group consisting of (10) A to T substitution, (11) A to G substitution, and (12) A to C substitution.

態様31.態様1の方法であって、検出可能な配列が1ヌクレオチド置換であり、これが、(1)G:C塩基対をT:A塩基対に、(2)G:C塩基対をA:T塩基対に、(3)G:C塩基対をC:G塩基対に、(4)T:A塩基対をG:C塩基対に、(5)T:A塩基対をA:T塩基対に、(6)T:A塩基対をC:G塩基対に、(7)C:G塩基対をG:C塩基対に、(8)C:G塩基対をT:A塩基対に、(9)C:G塩基対をA:T塩基対に、(10)A:T塩基対をT:A塩基対に、(11)A:T塩基対をG:C塩基対に、または(12)A:T塩基対をC:G塩基対に変換する。 Aspect 31. The method of embodiment 1, wherein the detectable sequence is a single nucleotide substitution, which converts (1) a G:C base pair into a T:A base pair, and (2) a G:C base pair into an A:T base pair. (3) G:C base pair to C:G base pair, (4) T:A base pair to G:C base pair, (5) T:A base pair to A:T base pair. , (6) T:A base pair to C:G base pair, (7) C:G base pair to G:C base pair, (8) C:G base pair to T:A base pair, ( 9) C:G base pair to A:T base pair, (10) A:T base pair to T:A base pair, (11) A:T base pair to G:C base pair, or (12) )Convert A:T base pair to C:G base pair.

態様32.態様1の方法であって、検出可能な配列がバーコード配列である。 Aspect 32. The method of embodiment 1, wherein the detectable sequence is a barcode sequence.

態様33.態様1の方法であって、オンターゲットおよびオフターゲット部位におけるヌクレオチド配列を決定するステップ(d)が、(i)標的ヌクレオチド配列をフラグメント化してフラグメントを形成すること、(ii)アダプター配列をフラグメントの端に取り付けること、(iii)プライマーのペアを用いてアンプリコンをPCR増幅し、1つのプライマーが、フラグメントの1つの端に取り付けられたアダプター配列にアニーリング、別のプライマー、それがフラグメント上に位置付けられたプライム編集によって挿入されたアダプター配列にアニールすること、および(iv)アンプリコンを配列決定して編集の位置付けを決定することを含む。 Aspect 33. The method of embodiment 1, wherein step (d) of determining the nucleotide sequences at the on-target and off-target sites comprises: (i) fragmenting the target nucleotide sequence to form fragments; (ii) adding an adapter sequence to the fragments; (iii) PCR amplify the amplicon using a pair of primers, one primer annealing to an adapter sequence attached to one end of the fragment, and another primer that positions it on the fragment. (iv) sequencing the amplicon to determine the location of the edit.

群J.細胞データ記録のためのPE法
態様1.プライム編集によって細胞性のイベントを記録する方法であって、方法が:(A)細胞に(i)napDNAbpおよびRNA依存性DNAポリメラーゼを含むプライム編集因子融合タンパク質と(ii)PEgRNAとをコードする1つ以上の構築物を導入し、融合タンパク質および/またはPEgRNAの発現が、細胞性のイベントの生起によって誘導され、融合タンパク質および/またはPEgRNAの発現によって、細胞のゲノム上の標的編集部位のプライム編集をもたらして、検出可能な配列を導入すること、ならびに(B)検出可能な配列を同定し、それによって細胞性のイベントの生起を同定することを含む。
Group J. PE method mode 1 for recording cell data . 1. A method for recording cellular events by prime editing, the method comprising: (A) injecting into a cell one encoding a prime editing factor fusion protein comprising (i) napDNAbp and an RNA-dependent DNA polymerase, and (ii) PEgRNA. one or more constructs are introduced, expression of the fusion protein and/or PEgRNA is induced by the occurrence of a cellular event, and expression of the fusion protein and/or PEgRNA primes the targeted editing site on the genome of the cell. (B) identifying the detectable sequence and thereby identifying the occurrence of the cellular event.

態様2.態様1の方法であって、ステップ(A)のプライム編集が新たな標的編集部位を同時に導入し、その結果、細胞性のイベントの記録が反復的に生起し得る。 Aspect 2. The method of embodiment 1, wherein the prime editing of step (A) simultaneously introduces new target editing sites, so that recording of cellular events can occur repeatedly.

態様3.態様1の方法であって、PEgRNAが、検出可能な配列をコードする編集鋳型を含む。 Aspect 3. The method of embodiment 1, wherein the PEgRNA comprises an editing template encoding a detectable sequence.

態様4.態様3の方法であって、編集鋳型がさらに新たな標的編集部位をコードする。 Aspect 4. The method of embodiment 3, wherein the editing template further encodes a new target editing site.

態様5.態様1の方法であって、検出可能な配列が、少なくとも1、または少なくとも2、または少なくとも3、または少なくとも4、または少なくとも5、または少なくとも6、または少なくとも7、または少なくとも8、または少なくとも9、または少なくとも10、または少なくとも11、または少なくとも12、または少なくとも13、または少なくとも14、または少なくとも15、または少なくとも16、または少なくとも17、または少なくとも18、または少なくとも19、または少なくとも20、または少なくとも21、または少なくとも22、または少なくとも23、または少なくとも24、または少なくとも25、または少なくとも26、または少なくとも27、または少なくとも28、または少なくとも29、または少なくとも30、または少なくとも31、または少なくとも32、または少なくとも33、または少なくとも34、または少なくとも35、または少なくとも40、または少なくとも50、または少なくとも60、または少なくとも70、または少なくとも80、または少なくとも90、または少なくとも100核酸塩基の挿入である。 Aspect 5. The method of embodiment 1, wherein the detectable sequence is at least 1, or at least 2, or at least 3, or at least 4, or at least 5, or at least 6, or at least 7, or at least 8, or at least 9, or at least 10, or at least 11, or at least 12, or at least 13, or at least 14, or at least 15, or at least 16, or at least 17, or at least 18, or at least 19, or at least 20, or at least 21, or at least 22 , or at least 23, or at least 24, or at least 25, or at least 26, or at least 27, or at least 28, or at least 29, or at least 30, or at least 31, or at least 32, or at least 33, or at least 34, or The insertion is at least 35, or at least 40, or at least 50, or at least 60, or at least 70, or at least 80, or at least 90, or at least 100 nucleobases.

態様6.態様1の方法であって、検出可能な配列が、少なくとも1、または少なくとも2、または少なくとも3、または少なくとも4、または少なくとも5、または少なくとも6、または少なくとも7、または少なくとも8、または少なくとも9、または少なくとも10、または少なくとも11、または少なくとも12、または少なくとも13、または少なくとも14、または少なくとも15、または少なくとも16、または少なくとも17、または少なくとも18、または少なくとも19、または少なくとも20、または少なくとも21、または少なくとも22、または少なくとも23、または少なくとも24、または少なくとも25、または少なくとも26、または少なくとも27、または少なくとも28、または少なくとも29、または少なくとも30、または少なくとも31、または少なくとも32、または少なくとも33、または少なくとも34、または少なくとも35、または少なくとも40、または少なくとも50、または少なくとも60、または少なくとも70、または少なくとも80、または少なくとも90、または少なくとも100核酸塩基の欠失である。 Embodiment 6. The method of embodiment 1, wherein the detectable sequence is a deletion of at least 1, or at least 2, or at least 3, or at least 4, or at least 5, or at least 6, or at least 7, or at least 8, or at least 9, or at least 10, or at least 11, or at least 12, or at least 13, or at least 14, or at least 15, or at least 16, or at least 17, or at least 18, or at least 19, or at least 20, or at least 21, or at least 22, or at least 23, or at least 24, or at least 25, or at least 26, or at least 27, or at least 28, or at least 29, or at least 30, or at least 31, or at least 32, or at least 33, or at least 34, or at least 35, or at least 40, or at least 50, or at least 60, or at least 70, or at least 80, or at least 90, or at least 100 nucleobases.

態様7.態様1の方法であって、検出可能な配列が核酸塩基置換である。 Aspect 7. The method of embodiment 1, wherein the detectable sequence is a nucleobase substitution.

態様8.態様1の方法であって、検出可能な配列がトランジション変異である。 Aspect 8. The method of embodiment 1, wherein the detectable sequence is a transition mutation.

態様9.態様1の方法であって、検出可能な配列がトランスバージョン変異である。 Aspect 9. The method of embodiment 1, wherein the detectable sequence is a transversion mutation.

態様10.態様1の方法であって、検出可能な配列が1ヌクレオチド置換であり、そこについて、1ヌクレオチド置換が(1)GからTの置換、(2)GからAの置換、(3)GからCの置換、(4)TからGの置換、(5)TからAの置換、(6)TからCの置換、(7)CからGの置換、(8)CからTの置換、(9)CからAの置換、(10)AからTの置換、(11)AからGの置換、または(12)AからCの置換である。 Aspect 10. The method of embodiment 1, wherein the detectable sequence is a single nucleotide substitution, wherein the single nucleotide substitutions include (1) a G to T substitution, (2) a G to A substitution, and (3) a G to C substitution. (4) Substitution from T to G, (5) Substitution from T to A, (6) Substitution from T to C, (7) Substitution from C to G, (8) Substitution from C to T, (9 ) C to A substitution, (10) A to T substitution, (11) A to G substitution, or (12) A to C substitution.

態様11.態様1の方法であって、検出可能な配列が1ヌクレオチド置換であり、これが、(1)G:C塩基対をT:A塩基対に、(2)G:C塩基対をA:T塩基対に、(3)G:C塩基対をC:G塩基対に、(4)T:A塩基対をG:C塩基対に、(5)T:A塩基対をA:T塩基対に、(6)T:A塩基対をC:G塩基対に、(7)C:G塩基対をG:C塩基対に、(8)C:G塩基対をT:A塩基対に、(9)C:G塩基対をA:T塩基対に、(10)A:T塩基対をT:A塩基対に、(11)A:T塩基対をG:C塩基対に、または(12)A:T塩基対をC:G塩基対に変換する。 Aspect 11. The method of embodiment 1, wherein the detectable sequence is a single nucleotide substitution, which converts (1) a G:C base pair into a T:A base pair, and (2) a G:C base pair into an A:T base pair. (3) G:C base pair to C:G base pair, (4) T:A base pair to G:C base pair, (5) T:A base pair to A:T base pair. , (6) T:A base pair to C:G base pair, (7) C:G base pair to G:C base pair, (8) C:G base pair to T:A base pair, ( 9) C:G base pair to A:T base pair, (10) A:T base pair to T:A base pair, (11) A:T base pair to G:C base pair, or (12) )Convert A:T base pair to C:G base pair.

態様12.態様1の方法であって、検出可能な配列がバーコード配列である。 Aspect 12. The method of embodiment 1, wherein the detectable sequence is a barcode sequence.

態様13.態様1の方法であって、検出可能な配列が、細胞性のイベントの各生起について、検出可能な配列の反復的な挿入の結果として、長さが経時的に増大する。 Aspect 13. The method of embodiment 1, wherein the detectable sequence increases in length over time as a result of repeated insertions of the detectable sequence for each occurrence of a cellular event.

態様14.態様1の方法であって、検出ステップが、編集された標的部位、または編集された標的部位のアンプリコンを配列決定することを含む。 Aspect 14. The method of embodiment 1, wherein the detecting step comprises sequencing the edited target site or an amplicon of the edited target site.

態様15.態様1の方法であって、napDNAbpが、Cas9、Cas12e、Cas12d、Cas12a、Cas12b1、Cas13a、Cas12c、もしくはアルゴノート、またはCas9、Cas12e、Cas12d、Cas12a、Cas12b1、Cas13a、Cas12c、もしくはアルゴノートのバリアントである。 Aspect 15. The method of embodiment 1, wherein napDNAbp is Cas9, Cas12e, Cas12d, Cas12a, Cas12b1, Cas13a, Cas12c, or Argonaute, or a variant of Cas9, Cas12e, Cas12d, Cas12a, Cas12b1, Cas13a, Cas12c, or Argonaute. be.

態様16.態様1の方法であって、napDNAbpがCas9またはそのバリアントである。 Aspect 16. The method of embodiment 1, wherein napDNAbp is Cas9 or a variant thereof.

態様17.態様1の方法であって、napDNAbpがヌクレアーゼ活性Cas9、ヌクレアーゼ不活性型Cas9(dCas9)、またはCas9ニッカーゼ(nCas9)である。 Aspect 17. The method of embodiment 1, wherein napDNAbp is nuclease-active Cas9, nuclease-inactive Cas9 (dCas9), or Cas9 nickase (nCas9).

態様18.態様1の方法であって、napDNAbpがCas9ニッカーゼ(nCas9)である。 Aspect 18. The method of embodiment 1, wherein napDNAbp is Cas9 nickase (nCas9).

態様19.態様1の方法であって、napDNAbpが、配列番号18のアミノ酸配列、または配列番号18との少なくとも80%、85%、90%、95%、98%、もしくは99%配列同一性を有するアミノ酸配列を含む。 Aspect 19. The method of embodiment 1, wherein napDNAbp is the amino acid sequence of SEQ ID NO: 18 , or an amino acid sequence having at least 80%, 85%, 90%, 95%, 98%, or 99% sequence identity with SEQ ID NO: 18. including.

態様20.態様1の方法であって、napDNAbpが、SpCas9野生型、あるいは配列番号18~88、126、130、137、141、147、153、157、445、460、467、および482~487のいずれか1つのアミノ酸配列、または配列番号18~88、126、130、137、141、147、153、157、445、460、467、および482~487のいずれかとの少なくとも80%、85%、90%、95%、98%、もしくは99%配列同一性を有するアミノ酸配列のそのバリアントである。 Mode 20. The method of embodiment 1, wherein napDNAbp is SpCas9 wild type or any one of SEQ ID NOs : 18-88, 126, 130, 137, 141, 147, 153, 157, 445, 460, 467, and 482-487. or at least 80%, 85%, 90% with any of SEQ ID NOs: 18-88, 126, 130, 137, 141, 147, 153, 157, 445, 460, 467, and 482-487; A variant thereof with an amino acid sequence that has 95%, 98%, or 99% sequence identity.

態様21.態様1の方法であって、napDNAbpがSpCas9オーソログである。 Aspect 21. The method of embodiment 1, wherein napDNAbp is an SpCas9 ortholog.

態様22.態様1の方法であって、napDNAbpが、配列番号18~88、126、130、137、141、147、153、157、445、460、467、および482~487のいずれか1つのアミノ酸配列、または配列番号18~88、126、130、137、141、147、153、157、445、460、467、および482~487のいずれかとの少なくとも80%、85%、90%、95%、98%、もしくは99%配列同一性を有するアミノ酸配列である。 Aspect 22. The method of embodiment 1, wherein napDNAbp has an amino acid sequence of any one of SEQ ID NOs : 18-88, 126, 130, 137, 141, 147, 153, 157, 445, 460, 467, and 482-487, or at least 80%, 85%, 90%, 95%, 98% with any of SEQ ID NO: 18-88, 126, 130, 137, 141, 147, 153, 157, 445, 460, 467, and 482-487 , or an amino acid sequence with 99% sequence identity.

態様23.態様1の方法であって、RNA依存性DNAポリメラーゼが逆転写酵素である。 Aspect 23. The method of embodiment 1, wherein the RNA-dependent DNA polymerase is reverse transcriptase.

態様24.態様23の方法であって、逆転写酵素が天然に存在する野生型逆転写酵素であり、配列番号89のいずれか1つのアミノ酸配列、または配列番号89のいずれかとの少なくとも80%、85%、90%、95%、98%、もしくは99%配列同一性を有するアミノ酸配列を有する。 Aspect 24. 24. The method of embodiment 23, wherein the reverse transcriptase is a naturally occurring wild-type reverse transcriptase, and the amino acid sequence of any one of SEQ ID NO: 89, or at least 80%, 85%, Having amino acid sequences with 90%, 95%, 98%, or 99% sequence identity.

態様25.態様23の方法であって、逆転写酵素がバリアント逆転写酵素であり、配列番号89~100、105~122、128~129、132、139、143、149、154、159、235、454、471、516、662、700、701~716、739~741、および766のいずれか1つのアミノ酸配列、または配列番号89~100、105~122、128~129、132、139、143、149、154、159、235、454、471、516、662、700、701~716、739~741、および766のいずれかとの少なくとも80%、85%、90%、95%、98%、もしくは99%配列同一性を有するアミノ酸配列を有する。 Aspect 25. The method of embodiment 23, wherein the reverse transcriptase is a variant reverse transcriptase, and SEQ ID NOs: 89-100, 105-122, 128-129, 132, 139, 143, 149, 154, 159, 235, 454, 471 , 516, 662, 700, 701-716, 739-741, and 766, or SEQ ID NO: 89-100, 105-122, 128-129, 132, 139, 143, 149, 154, At least 80%, 85%, 90%, 95%, 98%, or 99% sequence identity with any of 159, 235, 454, 471, 516, 662, 700, 701-716, 739-741, and 766 It has an amino acid sequence.

態様26.態様1の方法であって、融合タンパク質が、配列番号123および134(PE1、PE2)のいずれか1つのアミノ酸配列、または配列番号123および134(PE1、PE2)のいずれかとの少なくとも80%、85%、90%、95%、98%、もしくは99%配列同一性を有するアミノ酸配列を含む。 Aspect 26. The method of embodiment 1, wherein the fusion protein has an amino acid sequence of any one of SEQ ID NO: 123 and 134 (PE1, PE2), or at least 85 %, 90%, 95%, 98%, or 99% sequence identity.

態様27.態様1の方法であって、プライム編集因子融合タンパク質および/またはPEgRNAをコードする1つ以上の構築物が、さらに、細胞性のイベントが生起するときに誘導可能である1つ以上のプロモーターを含む。 Aspect 27. The method of embodiment 1, wherein the one or more constructs encoding the prime editing factor fusion protein and/or PEgRNA further comprise one or more promoters that are inducible when a cellular event occurs.

態様28.態様1の方法であって、細胞性のイベントが、細胞によって受容される刺激によってマークされる。 Aspect 28. The method of embodiment 1, wherein the cellular event is marked by a stimulus received by the cell.

態様29.態様28の方法であって、刺激が、低分子、タンパク質、ペプチド、アミノ酸、代謝物質、無機分子、有機金属分子、有機分子、薬物もしくは薬物候補、糖、脂質、金属、核酸、内生もしくは外因的なシグナルカスケードの活性化の間に生ずる分子、光、熱、音、圧力、機械的ストレス、剪断ストレス、またはウイルスもしくは他の微生物、pHの変化、または酸化還元状態の変化である。 Aspect 29. 29. The method of embodiment 28, wherein the stimulus is a small molecule, protein, peptide, amino acid, metabolite, inorganic molecule, organometallic molecule, organic molecule, drug or drug candidate, sugar, lipid, metal, nucleic acid, endogenous or exogenous agent. molecules, light, heat, sound, pressure, mechanical stress, shear stress, or viruses or other microorganisms, changes in pH, or changes in redox conditions that occur during the activation of a biological signal cascade.

態様30.プライム編集を用いて細胞性のイベントを記録するための細胞データ記録プラスミドであって: Aspect 30. A cellular data recording plasmid for recording cellular events using prime editing, comprising:

i.(a)核酸プログラム型DNA結合タンパク質(napDNAbp)をコードする核酸配列および(b)RNA依存性DNAポリメラーゼを含む融合タンパク質(前記融合タンパク質は第1のプロモーターに作動可能に連結される); i. a fusion protein comprising (a) a nucleic acid sequence encoding a nucleic acid programmed DNA binding protein (napDNAbp) and (b) an RNA-dependent DNA polymerase, said fusion protein being operably linked to a first promoter;

ii.第2のプロモーターに作動可能に連結されたプライム編集因子ガイドRNA(PEgRNA)をコードする核酸配列(PEgRNAは標的配列に対して相補的である);ならびに ii. a nucleic acid sequence encoding a prime editing factor guide RNA (PEgRNA) operably linked to a second promoter, where the PEgRNA is complementary to the target sequence; and

iii.複製起点;
を含み、
iii. origin of replication;
including;

プロモーターの少なくとも1つが誘導性プロモーターであり、PEgRNAが、検出可能な配列を標的編集部位において組み入れるために十分にPEgRNAの発現およびnapDNAbpの発現を誘導する条件下において、napDNAbpと会合する。 At least one of the promoters is an inducible promoter, and the PEgRNA associates with the napDNAbp under conditions that induce expression of the PEgRNA and expression of the napDNAbp sufficient to incorporate a detectable sequence at the target editing site.

態様31.態様30の細胞データ記録プラスミドであって、誘導性プロモーターが細胞性のイベントによって誘導される。 Aspect 31. Embodiment 30. The cellular data recording plasmid of embodiment 30, wherein the inducible promoter is induced by a cellular event.

態様32.態様30の細胞データ記録プラスミドであって、細胞性のイベントが、細胞によって受容される刺激によってマークされる。 Aspect 32. The cellular data recording plasmid of embodiment 30, wherein cellular events are marked by stimuli received by the cell.

態様33.態様32の細胞データ記録プラスミドであって、刺激が、低分子、タンパク質、ペプチド、アミノ酸、代謝物質、無機分子、有機金属分子、有機分子、薬物もしくは薬物候補、糖、脂質、金属、核酸、内生もしくは外因的なシグナルカスケードの活性化の間に生ずる分子、光、熱、音、圧力、機械的ストレス、剪断ストレス、またはウイルスもしくは他の微生物、pHの変化、または酸化還元状態の変化である。 Aspect 33. The cell data recording plasmid of embodiment 32, wherein the stimulus is a small molecule, protein, peptide, amino acid, metabolite, inorganic molecule, organometallic molecule, organic molecule, drug or drug candidate, sugar, lipid, metal, nucleic acid, molecules, light, heat, sound, pressure, mechanical stress, shear stress, or viruses or other microorganisms, changes in pH, or changes in redox conditions that occur during activation of biological or extrinsic signal cascades. .

態様34.態様30の細胞データ記録プラスミドであって、第1および第2のプロモーターが同じである。 Aspect 34. The cell data recording plasmid of embodiment 30, wherein the first and second promoters are the same.

態様35.態様30の細胞データ記録プラスミドであって、第1および第2のプロモーターが異なる。 Aspect 35. Embodiment 30. The cell data recording plasmid of embodiment 30, wherein the first and second promoters are different.

態様36.態様30の細胞データ記録プラスミドであって、少なくとも1つの誘導性プロモーターがアンヒドロテトラサイクリン誘導性プロモーター、IPTG誘導性プロモーター、ラムノース誘導性プロモーター、またはアラビノース誘導性プロモーターである。 Aspect 36. The cell data recording plasmid of aspect 30, wherein at least one inducible promoter is an anhydrotetracycline-inducible promoter, an IPTG-inducible promoter, a rhamnose-inducible promoter, or an arabinose-inducible promoter.

態様37.態様30の細胞データ記録プラスミドであって、第1または第2のプロモーターが恒常的プロモーターである。 Aspect 37. The cell data recording plasmid of embodiment 30, wherein the first or second promoter is a constitutive promoter.

態様38.態様37の細胞データ記録プラスミドであって、恒常的プロモーターがLacプロモーター、サイトメガロウイルス(CMV)プロモーター、恒常的RNAポリメラーゼIIIプロモーター、またはUBCプロモーターである。 Aspect 38. The cell data recording plasmid of embodiment 37, wherein the constitutive promoter is the Lac promoter, the cytomegalovirus (CMV) promoter, the constitutive RNA polymerase III promoter, or the UBC promoter.

態様39.態様30の細胞データ記録プラスミドであって、複製起点がpSC101、pMB1、pBR322、ColE1、またはp15A複製起点配列を含む。 Aspect 39. The cell data recording plasmid of embodiment 30, wherein the origin of replication comprises a pSC101, pMB1, pBR322, ColE1, or p15A origin of replication sequence.

態様40.態様30の細胞データ記録プラスミドであって、PEgRNAが、検出可能な配列をコードする編集鋳型を含む。 Aspect 40. The cell data recording plasmid of embodiment 30, wherein the PEgRNA comprises an editing template encoding a detectable sequence.

態様41.態様40の細胞データ記録プラスミドであって、編集鋳型がさらに新たな標的編集部位をコードする。 Aspect 41. The cell data recording plasmid of aspect 40, wherein the editing template further encodes a new target editing site.

態様42.態様30の細胞データ記録プラスミドであって、検出可能な配列が、少なくとも1、または少なくとも2、または少なくとも3、または少なくとも4、または少なくとも5、または少なくとも6、または少なくとも7、または少なくとも8、または少なくとも9、または少なくとも10、または少なくとも11、または少なくとも12、または少なくとも13、または少なくとも14、または少なくとも15、または少なくとも16、または少なくとも17、または少なくとも18、または少なくとも19、または少なくとも20、または少なくとも21、または少なくとも22、または少なくとも23、または少なくとも24、または少なくとも25、または少なくとも26、または少なくとも27、または少なくとも28、または少なくとも29、または少なくとも30、または少なくとも31、または少なくとも32、または少なくとも33、または少なくとも34、または少なくとも35、または少なくとも40、または少なくとも50、または少なくとも60、または少なくとも70、または少なくとも80、または少なくとも90、または少なくとも100核酸塩基の挿入である。 Aspect 42. The cell data recording plasmid of embodiment 30, wherein the detectable sequence is at least 1, or at least 2, or at least 3, or at least 4, or at least 5, or at least 6, or at least 7, or at least 8, or at least 9, or at least 10, or at least 11, or at least 12, or at least 13, or at least 14, or at least 15, or at least 16, or at least 17, or at least 18, or at least 19, or at least 20, or at least 21, or at least 22, or at least 23, or at least 24, or at least 25, or at least 26, or at least 27, or at least 28, or at least 29, or at least 30, or at least 31, or at least 32, or at least 33, or at least 34, or at least 35, or at least 40, or at least 50, or at least 60, or at least 70, or at least 80, or at least 90, or at least 100 nucleobase insertions.

態様43.態様30の細胞データ記録プラスミドであって、検出可能な配列が、少なくとも1、または少なくとも2、または少なくとも3、または少なくとも4、または少なくとも5、または少なくとも6、または少なくとも7、または少なくとも8、または少なくとも9、または少なくとも10、または少なくとも11、または少なくとも12、または少なくとも13、または少なくとも14、または少なくとも15、または少なくとも16、または少なくとも17、または少なくとも18、または少なくとも19、または少なくとも20、または少なくとも21、または少なくとも22、または少なくとも23、または少なくとも24、または少なくとも25、または少なくとも26、または少なくとも27、または少なくとも28、または少なくとも29、または少なくとも30、または少なくとも31、または少なくとも32、または少なくとも33、または少なくとも34、または少なくとも35、または少なくとも40、または少なくとも50、または少なくとも60、または少なくとも70、または少なくとも80、または少なくとも90、または少なくとも100核酸塩基の欠失である。 Aspect 43. The cell data recording plasmid of embodiment 30, wherein the detectable sequence is at least 1, or at least 2, or at least 3, or at least 4, or at least 5, or at least 6, or at least 7, or at least 8, or at least 9, or at least 10, or at least 11, or at least 12, or at least 13, or at least 14, or at least 15, or at least 16, or at least 17, or at least 18, or at least 19, or at least 20, or at least 21, or at least 22, or at least 23, or at least 24, or at least 25, or at least 26, or at least 27, or at least 28, or at least 29, or at least 30, or at least 31, or at least 32, or at least 33, or at least The deletion is 34, or at least 35, or at least 40, or at least 50, or at least 60, or at least 70, or at least 80, or at least 90, or at least 100 nucleobases.

態様44.態様30の細胞データ記録プラスミドであって、検出可能な配列が核酸塩基置換である。 Aspect 44. The cell data recording plasmid of embodiment 30, wherein the detectable sequence is a nucleobase substitution.

態様45.態様30の細胞データ記録プラスミドであって、検出可能な配列がトランジション変異である。 Aspect 45. The cell data recording plasmid of embodiment 30, wherein the detectable sequence is a transition mutation.

態様46.態様30の細胞データ記録プラスミドであって、検出可能な配列がトランスバージョン変異である。 Aspect 46. The cell data recording plasmid of embodiment 30, wherein the detectable sequence is a transversion mutation.

態様47.態様30の細胞データ記録プラスミドであって、検出可能な配列が1ヌクレオチド置換であり、そこから、1ヌクレオチド置換が、(1)GからTの置換、(2)GからAの置換、(3)GからCの置換、(4)TからGの置換、(5)TからAの置換、(6)TからCの置換、(7)CからGの置換、(8)CからTの置換、(9)CからAの置換、(10)AからTの置換、(11)AからGの置換、または(12)AからCの置換である。 Aspect 47. The cell data recording plasmid of embodiment 30, wherein the detectable sequence is a single nucleotide substitution, from which the single nucleotide substitution is: (1) a G to T substitution, (2) a G to A substitution, (3) a G to A substitution; ) G to C substitution, (4) T to G substitution, (5) T to A substitution, (6) T to C substitution, (7) C to G substitution, (8) C to T substitution. (9) C to A substitution, (10) A to T substitution, (11) A to G substitution, or (12) A to C substitution.

態様48.態様30の細胞データ記録プラスミドであって、検出可能な配列が1ヌクレオチド置換であり、これが、(1)G:C塩基対をT:A塩基対に、(2)G:C塩基対をA:T塩基対に、(3)G:C塩基対をC:G塩基対に、(4)T:A塩基対をG:C塩基対に、(5)T:A塩基対をA:T塩基対に、(6)T:A塩基対をC:G塩基対に、(7)C:G塩基対をG:C塩基対に、(8)C:G塩基対をT:A塩基対に、(9)C:G塩基対をA:T塩基対に、(10)A:T塩基対をT:A塩基対に、(11)A:T塩基対をG:C塩基対に、または(12)A:T塩基対をC:G塩基対に変換する。 Aspect 48. The cell data recording plasmid of embodiment 30, wherein the detectable sequence is a single nucleotide substitution, (1) a G:C base pair becomes a T:A base pair, and (2) a G:C base pair becomes an A base pair. :T base pair, (3) G:C base pair to C:G base pair, (4) T:A base pair to G:C base pair, (5) T:A base pair to A:T. (6) T:A base pair to C:G base pair, (7) C:G base pair to G:C base pair, (8) C:G base pair to T:A base pair. (9) C:G base pair to A:T base pair, (10) A:T base pair to T:A base pair, (11) A:T base pair to G:C base pair, or (12) convert A:T base pairs to C:G base pairs.

態様49.態様30の細胞データ記録プラスミドであって、検出可能な配列がバーコード配列である。 Aspect 49. The cell data recording plasmid of embodiment 30, wherein the detectable sequence is a barcode sequence.

態様50.態様30の細胞データ記録プラスミドであって、検出可能な配列が、細胞性のイベントの各生起について、検出可能な配列の反復的な挿入の結果として、長さが経時的に増大する。 Aspect 50. The cellular data recording plasmid of embodiment 30, wherein the detectable sequence increases in length over time as a result of repeated insertion of the detectable sequence for each occurrence of a cellular event.

態様51.態様30の細胞データ記録プラスミドであって、検出ステップが、編集された標的部位、または編集された標的部位のアンプリコンを配列決定することを含む。 Aspect 51. The cell data recording plasmid of embodiment 30, wherein the detecting step comprises sequencing the edited target site or an amplicon of the edited target site.

態様52.態様30の細胞データ記録プラスミドであって、napDNAbpが、Cas9、Cas12e、Cas12d、Cas12a、Cas12b1、Cas13a、Cas12c、もしくはアルゴノート、またはCas9、Cas12e、Cas12d、Cas12a、Cas12b1、Cas13a、Cas12c、もしくはアルゴノートのバリアントである。 Aspect 52. The cell data recording plasmid of embodiment 30, wherein napDNAbp is Cas9, Cas12e, Cas12d, Cas12a, Cas12b1, Cas13a, Cas12c, or Argonaute, or Cas9, Cas12e, Cas12d, Cas12a, Cas12b1, Cas13a, Cas12c, or Argonaute. This is a variant of

態様53.態様30の細胞データ記録プラスミドであって、napDNAbpがCas9またはそのバリアントである。 Aspect 53. The cell data recording plasmid of embodiment 30, wherein napDNAbp is Cas9 or a variant thereof.

態様54.態様30の細胞データ記録プラスミドであって、napDNAbpがヌクレアーゼ活性Cas9、ヌクレアーゼ不活性型Cas9(dCas9)、またはCas9ニッカーゼ(nCas9)である。 Aspect 54. The cell data recording plasmid of embodiment 30, wherein napDNAbp is nuclease-active Cas9, nuclease-inactive Cas9 (dCas9), or Cas9 nickase (nCas9).

態様55.態様30の細胞データ記録プラスミドであって、napDNAbpがCas9ニッカーゼ(nCas9)である。 Aspect 55. The cell data recording plasmid of embodiment 30, wherein napDNAbp is Cas9 nickase (nCas9).

態様56.態様30の細胞データ記録プラスミドであって、napDNAbpが、配列番号18のアミノ酸配列、または配列番号18との少なくとも80%、85%、90%、95%、98%、もしくは99%配列同一性を有するアミノ酸配列を含む。 Aspect 56. The cell data recording plasmid of embodiment 30, wherein napDNAbp has the amino acid sequence of SEQ ID NO: 18, or at least 80%, 85%, 90%, 95%, 98%, or 99% sequence identity with SEQ ID NO: 18. Contains an amino acid sequence with

態様57.態様30の細胞データ記録プラスミドであって、napDNAbpが、SpCas9野生型、あるいは配列番号18~88、126、130、137、141、147、153、157、445、460、467、および482~487のいずれか1つのアミノ酸配列、または配列番号18~88、126、130、137、141、147、153、157、445、460、467、および482~487のいずれかとの少なくとも80%、85%、90%、95%、98%、もしくは99%配列同一性を有するアミノ酸配列のそのバリアントである。 Aspect 57. The cell data recording plasmid of embodiment 30, wherein napDNAbp is SpCas9 wild type or SEQ ID NO : 18-88, 126, 130, 137, 141, 147, 153, 157, 445, 460, 467, and 482-487. at least 80%, 85% with any one amino acid sequence , or with any of SEQ ID NOs: 18-88, 126, 130, 137, 141, 147, 153, 157, 445, 460, 467, and 482-487; A variant thereof with an amino acid sequence that has 90%, 95%, 98%, or 99% sequence identity.

態様58.態様30の細胞データ記録プラスミドであって、napDNAbpがSpCas9オーソログである。 Aspect 58. The cell data recording plasmid of embodiment 30, wherein napDNAbp is an SpCas9 ortholog.

態様59.態様30の細胞データ記録プラスミドであって、napDNAbpが、配列番号18~88、126、130、137、141、147、153、157、445、460、467、および482~487のいずれか1つのアミノ酸配列、または配列番号18~88、126、130、137、141、147、153、157、445、460、467、および482~487のいずれかとの少なくとも80%、85%、90%、95%、98%、もしくは99%配列同一性を有するアミノ酸配列である。 Aspect 59. The cell data recording plasmid of embodiment 30, wherein napDNAbp is any one of SEQ ID NOs : 18-88, 126, 130, 137, 141, 147, 153, 157, 445, 460, 467, and 482-487. or at least 80%, 85%, 90%, 95% with any of the amino acid sequences , or SEQ ID NOs: 18-88, 126, 130, 137, 141, 147, 153, 157, 445, 460, 467, and 482-487. , 98%, or 99% sequence identity.

態様60.態様30の細胞データ記録プラスミドであって、RNA依存性DNAポリメラーゼが逆転写酵素である。 Aspect 60. The cell data recording plasmid of embodiment 30, wherein the RNA-dependent DNA polymerase is reverse transcriptase.

態様61.態様30の細胞データ記録プラスミドであって、逆転写酵素が天然に存在する野生型逆転写酵素であり、配列番号89のいずれか1つのアミノ酸配列、または配列番号89のいずれかとの少なくとも80%、85%、90%、95%、98%、もしくは99%配列同一性を有するアミノ酸配列を有する。 Aspect 61. Embodiment 30 The cell data recording plasmid of embodiment 30, wherein the reverse transcriptase is a naturally occurring wild-type reverse transcriptase, the amino acid sequence of any one of SEQ ID NO: 89, or at least 80% with any one of SEQ ID NO: 89; Having amino acid sequences with 85%, 90%, 95%, 98%, or 99% sequence identity.

態様62.態様30の細胞データ記録プラスミドであって、逆転写酵素がバリアント逆転写酵素であり、配列番号89~100、105~122、128~129、132、139、143、149、154、159、235、454、471、516、662、700、701~716、739~741、および766のいずれか1つのアミノ酸配列、または配列番号89~100、105~122、128~129、132、139、143、149、154、159、235、454、471、516、662、700、701~716、739~741、および766のいずれかとの少なくとも80%、85%、90%、95%、98%、もしくは99%配列同一性を有するアミノ酸配列を有する。 Aspect 62. The cell data recording plasmid of embodiment 30, wherein the reverse transcriptase is a variant reverse transcriptase, SEQ ID NOs: 89-100, 105-122, 128-129, 132, 139, 143, 149, 154, 159, 235, Any one amino acid sequence of 454, 471, 516, 662, 700, 701-716, 739-741, and 766, or SEQ ID NO: 89-100, 105-122, 128-129, 132, 139, 143, 149 , 154, 159, 235, 454, 471, 516, 662, 700, 701-716, 739-741, and 766 at least 80%, 85%, 90%, 95%, 98%, or 99% have amino acid sequences with sequence identity.

態様63.態様30の細胞データ記録プラスミドであって、融合タンパク質が、配列番号123および134(PE1、PE2)のいずれか1つのアミノ酸配列、または配列番号123および134(PE1、PE2)のいずれかと少なくとも80%、85%、90%、95%、98%、もしくは99%配列同一性を有するアミノ酸配列を含む。 Aspect 63. The cell data recording plasmid of embodiment 30, wherein the fusion protein has an amino acid sequence of any one of SEQ ID NOs: 123 and 134 (PE1, PE2), or at least 80% with any one of SEQ ID NOs: 123 and 134 (PE1, PE2). , 85%, 90%, 95%, 98%, or 99% sequence identity.

態様64.態様30~63のいずれか1つの細胞データレコーダプラスミドを含む細胞への使用のためのキット。 Aspect 64. A kit for use in a cell comprising the cell data recorder plasmid of any one of embodiments 30-63.

態様65.態様64のキットであって、細胞が原核細胞である。 Aspect 65. Embodiment 64. The kit of embodiment 64, wherein the cell is a prokaryotic cell.

態様66.態様64のキットであって、細胞が真核細胞である。 Aspect 66. 65. The kit of embodiment 64, wherein the cell is a eukaryotic cell.

態様67.態様30~63のいずれか1つの細胞データ記録プラスミドを含む細胞。 Aspect 67. A cell comprising the cell data recording plasmid of any one of embodiments 30-63.

態様68.態様67の細胞であって、細胞が原核細胞である。 Aspect 68. Embodiment 67. The cell of embodiment 67, wherein the cell is a prokaryotic cell.

態様69.態様67の細胞であって、細胞が真核細胞である。 Aspect 69. The cell of embodiment 67, wherein the cell is a eukaryotic cell.

態様70.態様69の細胞であって、真核細胞が哺乳類細胞である。 Mode 70. 69. The cell of embodiment 69, wherein the eukaryotic cell is a mammalian cell.

態様71.態様70の細胞であって、哺乳類細胞がヒト細胞である。 Aspect 71. Embodiment 70, wherein the mammalian cell is a human cell.

態様72.プライム編集によって細胞性のイベントを記録する方法であって、方法が:(A)態様30~63のいずれかの細胞データ記録プラスミドを細胞に導入し、融合タンパク質および/またはPEgRNAが細胞性のイベントの生起によって誘導され、融合タンパク質および/またはPEgRNAの発現が、検出可能な配列を導入するための細胞のゲノム上の標的編集部位のプライム編集をもたらすことと、(B)検出可能な配列を同定し、それによって細胞性のイベントの生起を同定することとを含む。 Aspect 72. A method for recording a cellular event by prime editing, the method comprising: (A) introducing the cellular data recording plasmid of any of aspects 30 to 63 into a cell, the fusion protein and/or PEgRNA recording a cellular event; (B) that expression of the fusion protein and/or PEgRNA results in prime editing of the targeted editing site on the cell's genome to introduce the detectable sequence; and (B) identify the detectable sequence. and thereby identifying the occurrence of cellular events.

態様73.態様72の方法であって、(A)導入するステップが、トランスフェクションまたはエレクトロポレーションによってである。 Aspect 73. 73. The method of embodiment 72, wherein the step of (A) introducing is by transfection or electroporation.

均等物および範囲
クレームにおいて、「a」、「an」、および「the」などの冠詞は、1または1より多いことを意味してもよいが、それと反する指示がないか、またはそれとは別に、文脈から明らかでない場合に限る。ある群の1以上のメンバー間に「または」を包含するクレームまたは記載は、その群のメンバーのうち、1つ、1つより多いか、または、すべてが、所定の生成物またはプロセスに存在するか、それに採用されるか、またはそれとは別に、それに関係があるか、を満たすと考えるが、それと反する指示がないか、またはそれとは別に、文脈から明らかでない場合に限る。本発明は、その群のうち、正確に1つのメンバーが、所定の生成物またはプロセスに存在するか、それに採用されるか、またはそれとは別に、それに関係がある態様を包含する。本発明は、その群のメンバーのうち、1つより多いかまたはすべてが、所定の生成物またはプロセスに存在するか、それに採用されるか、またはそれとは別に、それに関係がある態様を包含する。
In equivalents and scope claims, articles such as "a,""an," and "the" may mean one or more than one, unless there is an indication to the contrary or otherwise. Unless it is clear from the context. A claim or statement that includes "or" between one or more members of a group means that one, more than one, or all of the members of the group are present in a given product or process. , adopted by, or otherwise related to, is considered to satisfy, unless there is an indication to the contrary or otherwise is not clear from the context. The invention encompasses embodiments in which exactly one member of the group is present in, employed in, or otherwise pertains to a given product or process. The invention encompasses embodiments in which more than one or all of the members of the group are present in, employed in, or otherwise relate to a given product or process. .

しかも、本発明は、列挙されたクレームの1以上からの1以上の限定、要素、節、および記述用語(descriptive terms)が、別のクレーム中へ導入される、すべての変動、組み合わせ、および順列を包括する。例えば、別のクレームに従属するいずれのクレームも、同じ基本クレームに従属するいずれか他のクレーム中に見出される1以上の限定を包含するように修飾され得る。要素が、例として、マーカッシュ群形式において列挙されたものとして提示されている場合、要素の各下位群もまた開示されており、いずれの要素(単数または複数)も群から除去され得る。一般に、本発明、または本発明の側面が、特定の要素および/または特長を含むとして見なされる場合、本発明のある態様または本発明のある側面は、かかる要素および/または特長からなるか、または実質的にそれからなると理解されるべきである。簡潔さを目的として、それらの態様は、本明細書中、in haec verbaで具体的に表明されていない。用語「含むこと(comprising)」および「含有すること(containing)」が、オープンであることを意図し、追加の要素またはステップの包含を容認することにもまた留意する。範囲が与えられるとき、エンドポイントも包含される。しかも、別段の指示がないか、またはそれとは別に、文脈および当業者の理解から明らかでない場合に限り、範囲として表現された値は、いずれか具体的な値、または本発明の異なる態様において述べられた範囲内の部分範囲を、文脈が明確に別段の指図をしない限り範囲の下限の単位の10倍まで、想定し得る。 Moreover, the present invention encompasses all variations, combinations, and permutations in which one or more limitations, elements, clauses, and descriptive terms from one or more of the enumerated claims are introduced into another claim. For example, any claim that is dependent on another claim may be modified to include one or more limitations found in any other claim that is dependent on the same base claim. Where elements are presented as being enumerated in Markush group format, as an example, each subgroup of elements is also disclosed, and any element or elements may be removed from the group. In general, when the invention, or aspects of the invention, are described as including certain elements and/or features, it should be understood that an embodiment of the invention or an aspect of the invention consists of, or consists essentially of, such elements and/or features. For purposes of brevity, those embodiments have not been specifically recited in haec verba herein. It is also noted that the terms "comprising" and "containing" are intended to be open and permit the inclusion of additional elements or steps. When ranges are given, the endpoints are also included. Moreover, unless otherwise indicated or otherwise clear from the context and the understanding of one of ordinary skill in the art, values expressed as ranges may assume any specific value or subrange within the ranges set forth in different aspects of the invention, up to 10 times the unit of the lower limit of the range, unless the context clearly dictates otherwise.

本出願は、種々の発行済み特許、公開特許出願、雑誌記事、および他の公刊物を参照し、これらのすべては参照によって本明細書に組み込まれる。組み込まれる参照のいずれかと本明細書との間に矛盾がある場合、本明細書がコントロールする(control)ものとする。加えて、先行技術に属する本発明のいずれか特定の態様は、クレームのいずれかの1以上からはっきりと除外され得る。かかる態様は当業者に知られていると思われるので、それらは、除外が本明細書においてはっきりと表明されていない場合であっても、除外され得る。本発明のいずれか特定の態様は、先行技術の存在に関するか否かにかかわらず、いずれかのクレームから、いずれかの理由で除外され得る。 This application references various issued patents, published patent applications, journal articles, and other publications, all of which are incorporated herein by reference. In the event of a conflict between any incorporated reference and this specification, the present specification will control. In addition, any particular embodiment of the invention that belongs to the prior art may be specifically excluded from any one or more of the claims. Since such aspects will be known to those skilled in the art, they may be excluded even if the exclusion is not explicitly stated herein. Any particular aspect of the invention may be excluded from any claim for any reason, whether or not related to the existence of prior art.

当業者は、本明細書に記載の具体的な態様の多くの均等物を認識するか、またはせいぜいルーチンな実験法を使用して確かめる能力があるであろう。本明細書に記載の本態様の範囲は、上の記載に限定されることを意図せず、むしろ添付のクレームに表明されているとおりである。当業者は、以下のクレームにおいて定義されるとおり、本発明の精神または範囲から逸脱せずに、この記載への種々の変化および修飾がなされてもよいことを解するであろう。 Those skilled in the art will recognize, or be able to ascertain using no more than routine experimentation, many equivalents to the specific embodiments described herein. The scope of the embodiments described herein is not intended to be limited to the above description, but rather is as expressed in the appended claims. Those skilled in the art will appreciate that various changes and modifications may be made to this description without departing from the spirit or scope of the invention, as defined in the following claims.

Claims (21)

プライム編集のためのシステムであって、
核酸プログラム型DNA結合タンパク質(napDNAbp)および逆転写酵素を含むプライム編集因子、および、
プライム編集ガイドRNA(PEgRNA)
を含み、
ここで、PEgRNAと複合体化したプライム編集因子は、
標的鎖および相補的な非標的鎖を含む標的DNA配列に結合すること、
(i)PEgRNAと標的鎖とを含むRNA-DNAハイブリッドおよび(ii)相補的な非標的鎖を含むRループを形成すること、および、
相補的な非標的鎖をニッキングして、遊離の3'端を有する逆転写酵素プライム配列を形成すること
ができ、
ここで、PEgRNAは、(a)ガイドRNAおよび、(b)(i)1つ以上の所望のヌクレオチド変化を含む逆転写鋳型配列と(ii)逆転写プライマー結合部位とを含むRNA伸長を含み、
ここで、逆転写プライマー結合部位は、ニック入り標的DNA配列の非標的鎖の遊離3'端とハイブリダイズすることができる、前記システム。
A system for prime editing, comprising:
Prime editors, including nucleic acid-programmed DNA binding proteins (napDNAbp) and reverse transcriptase, and
Prime Editing Guide RNA (PEgRNA)
including
Here, the prime editor complexed with PEgRNA is
binding to a target DNA sequence comprising a target strand and a complementary non-target strand;
forming (i) an RNA-DNA hybrid comprising the PEgRNA and the target strand and (ii) an R-loop comprising the complementary non-target strand; and
capable of nicking the complementary non-target strand to form a reverse transcriptase prime sequence with a free 3'end;
wherein the PEgRNA comprises (a) a guide RNA and an RNA extension comprising (b) (i) a reverse transcription template sequence containing one or more desired nucleotide changes and (ii) a reverse transcription primer binding site,
wherein the reverse transcription primer binding site is capable of hybridizing with the free 3' end of the non-target strand of the nicked target DNA sequence.
napDNAbpが、
(i)Cas9タンパク質またはその機能的等価物である;
(ii)Cas9ニッカーゼである;
(iii)Cas9、CasX、CasY、Cpf1、C2c1、C2c2、C2C3、およびアルゴノートからなる群から選択され、ニッカーゼ活性を有する;
(iv)Cas9、Cas12a、およびCas12b1からなる群から選択され、ニッカーゼ活性を有する;または、
(v)標準的なSpCas9配列を参照して、H840A、N854A、またはN863Aを有する、
請求項1に記載のシステム。
napDNAbp is
(i) a Cas9 protein or a functional equivalent thereof;
(ii) is a Cas9 nickase;
(iii) selected from the group consisting of Cas9, CasX, CasY, Cpf1, C2c1, C2c2, C2C3, and Argonaute and having nickase activity;
(iv) is selected from the group consisting of Cas9, Cas12a, and Cas12b1 and has nickase activity; or
(v) having H840A, N854A, or N863A with reference to the canonical SpCas9 sequence;
The system of claim 1.
逆転写酵素が、
(i)レトロウイルスまたはレトロトランスポゾンからの逆転写酵素、または、
(ii)モロニーマウス白血病ウイルス逆転写酵素(M-MLV RT)またはバリアントM-MLV RT
である、請求項1または2に記載のシステム。
reverse transcriptase is
(i) a reverse transcriptase from a retrovirus or retrotransposon, or
(ii) Moloney murine leukemia virus reverse transcriptase (M-MLV RT) or variant M-MLV RT
3. A system according to claim 1 or 2, wherein:
(i)バリアントM-MLV RTが、以下のアミノ酸置換:
配列番号89に対して、P51X、S67X、E69X、L139X、T197X、D200X、H204X、F209X、E302X、T306X、F309X、W313X、T330X、L345X、L435X、N454X、D524X、E562X、D583X、H594X、L603X、E607X、およびD653X、ここでXは任意のアミノ酸の置換である、
の1つ以上を含む、
(ii)バリアントM-MLV RTが、以下のアミノ酸変異:
配列番号89に対して、P51L、S67K、E69K、L139P、T197A、D200N、H204R、F209N、E302K、E302R、T306K、F309N、W313F、T330P、L345G、L435G、N454K、D524G、E562Q、D583N、H594Q、L603W、E607K、およびD653N
の1つ以上を含む、
(iii)バリアントM-MLV RTが、配列番号89に対して、D200N、T330P、および/またはL603Wのアミノ酸置換を含む、
(iv)バリアントM-MLV RTが、配列番号89に対して、D200N、T306K、W313F、T330P、およびL603Wのアミノ酸置換を含む、
(v)逆転写酵素が、配列番号89のアミノ酸配列と、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、または少なくとも99%の配列同一性を有するアミノ酸配列を含む、
(vi)逆転写酵素が、配列番号122の配列を有する、または、
(vii)バリアントM-MLV RTが、C末端が短縮されており、配列番号89のアミノ酸配列に対して、D200N、T306K、W313F、および/またはT330Pの変異を含む、
請求項3に記載のシステム。
(i) the variant M-MLV RT has the following amino acid substitutions:
P51X, S67X, E69X, L139X, T197X, D200X, H204X, F209X, E302X, T306X, F309X, W313X, T330X, L345X, L435X, N454X, D524X, E562X, D583X, H594X, E607X, E607X, for SEQ ID NO:89 , and D653X, where X is any amino acid substitution,
including one or more of
(ii) the variant M-MLV RT has the following amino acid mutations:
P51L, S67K, E69K, L139P, T197A, D200N, H204R, F209N, E302K, E302R, T306K, F309N, W313F, T330P, L345G, L435G, N454K, D524G, E562Q, D583WQN, L609WQ, H59 for SEQ ID NO:89 , E607K, and D653N
including one or more of
(iii) the variant M-MLV RT comprises D200N, T330P, and/or L603W amino acid substitutions relative to SEQ ID NO:89;
(iv) the variant M-MLV RT comprises amino acid substitutions D200N, T306K, W313F, T330P, and L603W relative to SEQ ID NO:89;
(v) the reverse transcriptase comprises an amino acid sequence having at least 80%, at least 85%, at least 90%, at least 95%, or at least 99% sequence identity with the amino acid sequence of SEQ ID NO:89;
(vi) the reverse transcriptase has the sequence of SEQ ID NO: 122, or
(vii) variant M-MLV RT is truncated at the C-terminus and contains mutations D200N, T306K, W313F, and/or T330P relative to the amino acid sequence of SEQ ID NO:89;
4. The system of claim 3.
短縮バリアントM-MLV RTが、配列番号766の配列を含む、請求項4に記載のシステム。 5. The system of claim 4, wherein the truncated variant M-MLV RT comprises the sequence of SEQ ID NO:766. napDNAbpおよび逆転写酵素が、接続され、融合タンパク質を形成する、請求項1~5のいずれか一項に記載のシステム。 The system of any one of claims 1-5, wherein napDNAbp and reverse transcriptase are connected to form a fusion protein. 融合タンパク質が、NH2-[napDNAbp]-[逆転写酵素]-COOH、またはNH2-[逆転写酵素]-[napDNAbp]-COOHの構造を含み、ここで、「]-[」の夫々のものは任意のペプチドリンカーの存在を示す、請求項6に記載のシステム。 The fusion protein comprises the structure NH2-[napDNAbp]-[reverse transcriptase]-COOH or NH2-[reverse transcriptase]-[napDNAbp]-COOH, where each of the "]-[" 7. The system of claim 6, which indicates the presence of any peptide linker. 融合タンパク質が、配列番号134のアミノ酸配列、または配列番号134のアミノ酸配列と少なくとも80%の配列同一性を有するアミノ酸配列を含む、請求項6または7に記載のシステム。 8. The system of claim 6 or 7, wherein the fusion protein comprises the amino acid sequence of SEQ ID NO:134 or an amino acid sequence having at least 80% sequence identity with the amino acid sequence of SEQ ID NO:134. RNA伸長が、長さが少なくとも5ヌクレオチド、少なくとも6ヌクレオチド、少なくとも7ヌクレオチド、少なくとも8ヌクレオチド、少なくとも9ヌクレオチド、少なくとも10ヌクレオチド、少なくとも11ヌクレオチド、少なくとも12ヌクレオチド、少なくとも13ヌクレオチド、少なくとも14ヌクレオチド、少なくとも15ヌクレオチド、少なくとも16ヌクレオチド、少なくとも17ヌクレオチド、少なくとも18ヌクレオチド、少なくとも19ヌクレオチド、少なくとも20ヌクレオチド、少なくとも21ヌクレオチド、少なくとも22ヌクレオチド、少なくとも23ヌクレオチド、少なくとも24ヌクレオチド、または少なくとも25ヌクレオチドである、請求項1~8のいずれか一項に記載のシステム。 RNA elongation is at least 5 nucleotides, at least 6 nucleotides, at least 7 nucleotides, at least 8 nucleotides, at least 9 nucleotides, at least 10 nucleotides, at least 11 nucleotides, at least 12 nucleotides, at least 13 nucleotides, at least 14 nucleotides, at least 15 nucleotides in length , at least 16 nucleotides, at least 17 nucleotides, at least 18 nucleotides, at least 19 nucleotides, at least 20 nucleotides, at least 21 nucleotides, at least 22 nucleotides, at least 23 nucleotides, at least 24 nucleotides, or at least 25 nucleotides. A system according to any one of clauses. (i)1つ以上の所望のヌクレオチド変化が、PAM配列の約-4~+10の間にある編集窓内にある、および/または、
(ii)1つ以上の所望のヌクレオチド変化が、1つ以上の単一塩基ヌクレオチド変化、1つ以上のヌクレオチドの欠失、1つ以上のヌクレオチドの挿入、またはそれらの組み合わせである、および/または、
(iii)1つ以上の所望のヌクレオチド変化が、ニック部位の少なくとも1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、または100ヌクレオチド下流である、
請求項1~9のいずれか一項に記載のシステム。
(i) the one or more desired nucleotide changes are within an editing window that is between about -4 and +10 of the PAM sequence, and/or
(ii) the one or more desired nucleotide changes are one or more single base nucleotide changes, deletions of one or more nucleotides, insertions of one or more nucleotides, or combinations thereof, and/or ,
(iii) the one or more desired nucleotide changes are at least 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17 at the nick site , 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42 , 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67 , 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92 , 93, 94, 95, 96, 97, 98, 99, or 100 nucleotides downstream of
A system according to any one of claims 1-9.
1つ以上のヌクレオチドの挿入、または、1つ以上のヌクレオチドの欠失が、長さが少なくとも1、少なくとも2、少なくとも3、少なくとも4、少なくとも5、少なくとも6、少なくとも7、少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも16、少なくとも17、少なくとも18、少なくとも19、少なくとも20、少なくとも21、少なくとも22、少なくとも23、少なくとも24、少なくとも25、少なくとも26、少なくとも27、少なくとも28、少なくとも29、少なくとも30、少なくとも31、少なくとも32、少なくとも33、少なくとも34、少なくとも35、少なくとも36、少なくとも37、少なくとも38、少なくとも39、少なくとも40、少なくとも41、少なくとも42、少なくとも43、少なくとも44、少なくとも45、少なくとも46、少なくとも47、少なくとも48、少なくとも49、または少なくとも50ヌクレオチドである、請求項10に記載のシステム。 insertion of one or more nucleotides or deletion of one or more nucleotides in length of at least 1, at least 2, at least 3, at least 4, at least 5, at least 6, at least 7, at least 8, at least 9, at least 10, at least 11, at least 12, at least 13, at least 14, at least 15, at least 16, at least 17, at least 18, at least 19, at least 20, at least 21, at least 22, at least 23, at least 24, at least 25, at least 26 , at least 27, at least 28, at least 29, at least 30, at least 31, at least 32, at least 33, at least 34, at least 35, at least 36, at least 37, at least 38, at least 39, at least 40, at least 41, at least 42, at least 11. The system of claim 10, which is 43, at least 44, at least 45, at least 46, at least 47, at least 48, at least 49, or at least 50 nucleotides. 逆転写鋳型配列が、
(i)標的DNA配列と少なくとも80%、85%、90%、95%、または99%同一であるヌクレオチド配列を含む、および/または
(ii)所望のヌクレオチド編集を例外として、ニックの下流の標的DNA配列に対して相同的である置き換え鎖をコードする
請求項1~11のいずれか一項に記載のシステム。
the reverse transcription template sequence is
(i) contains a nucleotide sequence that is at least 80%, 85%, 90%, 95%, or 99% identical to the target DNA sequence, and/or
(ii) the system of any one of claims 1-11 encoding a replacement strand that is homologous to the target DNA sequence downstream of the nick, with the exception of the desired nucleotide edit;
プライマー結合部位が、長さが3~20ヌクレオチドである、請求項1~12のいずれか一項に記載のシステム。 The system of any one of claims 1-12, wherein the primer binding site is 3-20 nucleotides in length. プライマー結合部位が、長さが7~17ヌクレオチドである、請求項1~13のいずれか一項に記載のシステム。 The system of any one of claims 1-13, wherein the primer binding site is 7-17 nucleotides in length. ガイドRNAおよびRNA伸長が、単一分子内である、請求項1~14のいずれか一項に記載のシステム。 15. The system of any one of claims 1-14, wherein the guide RNA and RNA elongation are within a single molecule. RNA伸長が、5'から3'方向に、逆転写鋳型およびプライマー結合部位を含む、請求項1~15のいずれか一項に記載のシステム。 16. The system of any one of claims 1-15, wherein RNA elongation comprises, in the 5' to 3' direction, a reverse transcription template and a primer binding site. 請求項1~16のいずれか一項に記載のシステムをコードする、1つ以上のポリヌクレオチド。 One or more polynucleotides encoding the system of any one of claims 1-16. 請求項17に記載の1つ以上のポリヌクレオチドを含む、1つ以上のベクター。 18. One or more vectors comprising one or more polynucleotides of claim 17. 請求項1~16のいずれか一項に記載のシステム、請求項17に記載の1つ以上のポリヌクレオチド、または請求項18に記載の1つ以上のベクターを含む細胞。 A cell comprising the system of any one of claims 1-16, one or more polynucleotides of claim 17, or one or more vectors of claim 18. (i)請求項1~16のいずれか一項に記載のシステム、請求項17に記載の1つ以上のポリヌクレオチド、または請求項18に記載の1つ以上のベクター、および、
(ii)薬学的に許容し得る賦形剤
を含む、医薬組成物。
(i) a system according to any one of claims 1 to 16, one or more polynucleotides according to claim 17, or one or more vectors according to claim 18, and
(ii) a pharmaceutical composition comprising a pharmaceutically acceptable excipient;
医薬における使用のための、請求項1~16のいずれか一項に記載のシステム、請求項17に記載の1つ以上のポリヌクレオチド、請求項18に記載の1つ以上のベクター、請求項19に記載の細胞、または請求項20に記載の医薬組成物。 A system according to any one of claims 1 to 16, one or more polynucleotides according to claim 17, one or more vectors according to claim 18, claim 19, for use in medicine or the pharmaceutical composition of claim 20.
JP2021556862A 2019-03-19 2020-03-19 Editing Methods and Compositions for Editing Nucleotide Sequences Pending JP2022526908A (en)

Applications Claiming Priority (23)

Application Number Priority Date Filing Date Title
US201962820813P 2019-03-19 2019-03-19
US62/820,813 2019-03-19
US201962858958P 2019-06-07 2019-06-07
US62/858,958 2019-06-07
US201962889996P 2019-08-21 2019-08-21
US201962922654P 2019-08-21 2019-08-21
US62/922,654 2019-08-21
US62/889,996 2019-08-21
US201962913553P 2019-10-10 2019-10-10
US201962973558P 2019-10-10 2019-10-10
US62/973,558 2019-10-10
US62/913,553 2019-10-10
US201962931195P 2019-11-05 2019-11-05
US62/931,195 2019-11-05
US201962944231P 2019-12-05 2019-12-05
US201962974537P 2019-12-05 2019-12-05
US62/944,231 2019-12-05
US62/974,537 2019-12-05
US202062991069P 2020-03-17 2020-03-17
US202063100548P 2020-03-17 2020-03-17
US62/991,069 2020-03-17
US63/100,548 2020-03-17
PCT/US2020/023713 WO2020191234A1 (en) 2019-03-19 2020-03-19 Methods and compositions for editing nucleotide sequences

Publications (2)

Publication Number Publication Date
JP2022526908A JP2022526908A (en) 2022-05-27
JPWO2020191234A5 true JPWO2020191234A5 (en) 2024-03-28

Family

ID=72519164

Family Applications (4)

Application Number Title Priority Date Filing Date
JP2021556865A Pending JP2022531539A (en) 2019-03-19 2020-03-19 Editing Methods and Compositions for Editing Nucleotide Sequences
JP2021556867A Pending JP2022532470A (en) 2019-03-19 2020-03-19 Editing Methods and Compositions for Editing Nucleotide Sequences
JP2021556862A Pending JP2022526908A (en) 2019-03-19 2020-03-19 Editing Methods and Compositions for Editing Nucleotide Sequences
JP2021556876A Pending JP2022527740A (en) 2019-03-19 2020-03-19 Editing Methods and Compositions for Editing Nucleotide Sequences

Family Applications Before (2)

Application Number Title Priority Date Filing Date
JP2021556865A Pending JP2022531539A (en) 2019-03-19 2020-03-19 Editing Methods and Compositions for Editing Nucleotide Sequences
JP2021556867A Pending JP2022532470A (en) 2019-03-19 2020-03-19 Editing Methods and Compositions for Editing Nucleotide Sequences

Family Applications After (1)

Application Number Title Priority Date Filing Date
JP2021556876A Pending JP2022527740A (en) 2019-03-19 2020-03-19 Editing Methods and Compositions for Editing Nucleotide Sequences

Country Status (14)

Country Link
US (9) US20230078265A1 (en)
EP (4) EP3942043A2 (en)
JP (4) JP2022531539A (en)
KR (2) KR20210142210A (en)
CN (4) CN114127285A (en)
AU (2) AU2020240109A1 (en)
BR (2) BR112021018606A2 (en)
CA (2) CA3130488A1 (en)
DE (3) DE112020001342T5 (en)
GB (3) GB2601618A (en)
IL (2) IL286335A (en)
MX (2) MX2021011325A (en)
SG (2) SG11202109882VA (en)
WO (12) WO2020191243A1 (en)

Families Citing this family (157)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150044192A1 (en) 2013-08-09 2015-02-12 President And Fellows Of Harvard College Methods for identifying a target site of a cas9 nuclease
US9340799B2 (en) 2013-09-06 2016-05-17 President And Fellows Of Harvard College MRNA-sensing switchable gRNAs
US9840699B2 (en) 2013-12-12 2017-12-12 President And Fellows Of Harvard College Methods for nucleic acid editing
EP3177718B1 (en) 2014-07-30 2022-03-16 President and Fellows of Harvard College Cas9 proteins including ligand-dependent inteins
EP3365356B1 (en) 2015-10-23 2023-06-28 President and Fellows of Harvard College Nucleobase editors and uses thereof
GB2568182A (en) 2016-08-03 2019-05-08 Harvard College Adenosine nucleobase editors and uses thereof
AU2017308889B2 (en) 2016-08-09 2023-11-09 President And Fellows Of Harvard College Programmable Cas9-recombinase fusion proteins and uses thereof
US11542509B2 (en) 2016-08-24 2023-01-03 President And Fellows Of Harvard College Incorporation of unnatural amino acids into proteins using base editing
KR102622411B1 (en) 2016-10-14 2024-01-10 프레지던트 앤드 펠로우즈 오브 하바드 칼리지 AAV delivery of nucleobase editor
WO2018119359A1 (en) 2016-12-23 2018-06-28 President And Fellows Of Harvard College Editing of ccr5 receptor gene to protect against hiv infection
US11898179B2 (en) 2017-03-09 2024-02-13 President And Fellows Of Harvard College Suppression of pain by gene editing
WO2018165629A1 (en) 2017-03-10 2018-09-13 President And Fellows Of Harvard College Cytosine to guanine base editor
EP3601562A1 (en) 2017-03-23 2020-02-05 President and Fellows of Harvard College Nucleobase editors comprising nucleic acid programmable dna binding proteins
WO2018209320A1 (en) 2017-05-12 2018-11-15 President And Fellows Of Harvard College Aptazyme-embedded guide rnas for use with crispr-cas9 in genome editing and transcriptional activation
US9982279B1 (en) 2017-06-23 2018-05-29 Inscripta, Inc. Nucleic acid-guided nucleases
PT3645719T (en) 2017-06-30 2022-05-18 Inscripta Inc Automated cell processing methods, modules, instruments, and systems
US11732274B2 (en) 2017-07-28 2023-08-22 President And Fellows Of Harvard College Methods and compositions for evolving base editors using phage-assisted continuous evolution (PACE)
EP3676376A2 (en) 2017-08-30 2020-07-08 President and Fellows of Harvard College High efficiency base editors comprising gam
WO2019051097A1 (en) 2017-09-08 2019-03-14 The Regents Of The University Of California Rna-guided endonuclease fusion polypeptides and methods of use thereof
KR20200121782A (en) 2017-10-16 2020-10-26 더 브로드 인스티튜트, 인코퍼레이티드 Uses of adenosine base editor
US10526598B2 (en) 2018-04-24 2020-01-07 Inscripta, Inc. Methods for identifying T-cell receptor antigens
US10858761B2 (en) 2018-04-24 2020-12-08 Inscripta, Inc. Nucleic acid-guided editing of exogenous polynucleotides in heterologous cells
BR112021018606A2 (en) 2019-03-19 2021-11-23 Harvard College Methods and compositions for editing nucleotide sequences
US11001831B2 (en) 2019-03-25 2021-05-11 Inscripta, Inc. Simultaneous multiplex genome editing in yeast
CN109913485A (en) * 2019-03-25 2019-06-21 南京农业大学 A method of it prepares, purify HOPS complex proteins
CA3139122C (en) 2019-06-06 2023-04-25 Inscripta, Inc. Curing for recursive nucleic acid-guided cell editing
WO2021072328A1 (en) 2019-10-10 2021-04-15 The Broad Institute, Inc. Methods and compositions for prime editing rna
WO2021080922A1 (en) * 2019-10-21 2021-04-29 The Trustees Of Columbia University In The City Of New York Methods of performing rna templated genome editing
CN115279898A (en) * 2019-10-23 2022-11-01 成对植物服务股份有限公司 Compositions and methods for RNA templated editing in plants
BR112022008468A2 (en) * 2019-11-01 2022-07-19 Shanghai Bluecross Medical Science Inst METHOD FOR TARGETED MODIFICATION OF A PLANT GENOME SEQUENCE
CN114901302A (en) * 2019-11-05 2022-08-12 成对植物服务股份有限公司 Compositions and methods for RNA-encoded DNA replacement alleles
WO2021092204A1 (en) * 2019-11-05 2021-05-14 Spotlight Therapeutics Methods and compositions for nucleic acid-guided nuclease cell targeting screen
US11203762B2 (en) 2019-11-19 2021-12-21 Inscripta, Inc. Methods for increasing observed editing in bacteria
CA3157127A1 (en) 2019-12-18 2021-06-24 Aamir MIR Cascade/dcas3 complementation assays for in vivo detection of nucleic acid-guided nuclease edited cells
US20230049737A1 (en) * 2019-12-30 2023-02-16 The Broad Institute, Inc. Genome editing using reverse transcriptase enabled and fully active crispr complexes
EP4121522A1 (en) 2020-03-19 2023-01-25 Intellia Therapeutics, Inc. Methods and compositions for directed genome editing
US20210332388A1 (en) 2020-04-24 2021-10-28 Inscripta, Inc. Compositions, methods, modules and instruments for automated nucleic acid-guided nuclease editing in mammalian cells
DE112021002672T5 (en) 2020-05-08 2023-04-13 President And Fellows Of Harvard College METHODS AND COMPOSITIONS FOR EDIT BOTH STRANDS SIMULTANEOUSLY OF A DOUBLE STRANDED NUCLEOTIDE TARGET SEQUENCE
WO2022006042A1 (en) * 2020-06-29 2022-01-06 President And Fellows Of Harvard College Methods, compositions, and kits for nucleic acid barcoding of biomolecules
WO2022007959A1 (en) * 2020-07-10 2022-01-13 中国科学院动物研究所 System and method for editing nucleic acid
WO2022026345A1 (en) * 2020-07-30 2022-02-03 Inscripta, Inc. Arrayed nucleic acid-guided nuclease or nickase fusion editing
US20230295615A1 (en) * 2020-08-07 2023-09-21 The Jackson Laboratory Targeted Sequence Insertion Compositions and Methods
WO2022036150A1 (en) 2020-08-13 2022-02-17 Sana Biotechnology, Inc. Methods of treating sensitized patients with hypoimmunogenic cells, and associated methods and compositions
WO2022060749A1 (en) 2020-09-15 2022-03-24 Inscripta, Inc. Crispr editing to embed nucleic acid landing pads into genomes of live cells
JP2023543803A (en) * 2020-09-24 2023-10-18 ザ ブロード インスティテュート,インコーポレーテッド Prime Editing Guide RNA, its composition, and its uses
US20240018492A1 (en) * 2020-09-29 2024-01-18 Institute For Basic Science Prime editing using hiv reverse transcriptase and cas9 or variant thereof
JP2023543602A (en) * 2020-10-06 2023-10-17 キージーン ナムローゼ フェンノートシャップ Targeted sequence addition
US11761020B2 (en) 2020-10-15 2023-09-19 Aavocyte, Inc. Recombinant adeno-associated virus vectors with CD14 promoter and use thereof
EP4232583A1 (en) * 2020-10-21 2023-08-30 Massachusetts Institute of Technology Systems, methods, and compositions for site-specific genetic engineering using programmable addition via site-specific targeting elements (paste)
KR20230111189A (en) * 2020-10-23 2023-07-25 더 브로드 인스티튜트, 인코퍼레이티드 Reprogrammable ISCB nuclease and uses thereof
US20240026381A1 (en) * 2020-11-03 2024-01-25 The Board Of Trustees Of The University Of Illinois Split prime editing platforms
JP2023549125A (en) * 2020-11-05 2023-11-22 ユニバーシティ オブ ワシントン Precise genome deletion and replacement method based on prime editing
AU2021374974A1 (en) * 2020-11-06 2023-05-25 Pairwise Plants Services, Inc. Compositions and methods for rna-encoded dna-replacement of alleles
EP4244369A1 (en) * 2020-11-12 2023-09-20 Shanghaitech University Genomic editing of improved efficiency and accuracy
CN114480330A (en) * 2020-11-13 2022-05-13 广州达安基因股份有限公司 Reverse transcriptase mutant with multiple mutation sites
EP4256040A1 (en) * 2020-12-07 2023-10-11 Inscripta, Inc. Grna stabilization in nucleic acid-guided nickase editing
CN112626049B (en) * 2020-12-14 2022-04-01 安徽省农业科学院水稻研究所 SpCas9-NRRH mutant for recognizing specific sites in rice gene targeting and application thereof
EP4271802A1 (en) 2021-01-04 2023-11-08 Inscripta, Inc. Mad nucleases
CA3203876A1 (en) * 2021-01-11 2022-07-14 David R. Liu Prime editor variants, constructs, and methods for enhancing prime editing efficiency and precision
CN112708605A (en) * 2021-01-14 2021-04-27 中山大学 Proteome obtained by splitting Cas9 protein and application thereof
CN117083379A (en) * 2021-01-15 2023-11-17 4M基因组学公司 Polypeptide fusion or conjugate for gene editing
WO2022158898A1 (en) * 2021-01-21 2022-07-28 한국생명공학연구원 Genome replacement and insertion technology using reverse-transcriptase enzyme on basis of francisella novicida cas9 module
US20230374476A1 (en) * 2021-02-05 2023-11-23 University Of Massachusetts Prime editor system for in vivo genome editing
WO2022173830A1 (en) * 2021-02-09 2022-08-18 The Broad Institute, Inc. Nuclease-guided non-ltr retrotransposons and uses thereof
US11884924B2 (en) * 2021-02-16 2024-01-30 Inscripta, Inc. Dual strand nucleic acid-guided nickase editing
WO2022182786A1 (en) * 2021-02-23 2022-09-01 University Of Massachusetts Genome editing for treating muscular dystrophy
WO2022204476A1 (en) 2021-03-26 2022-09-29 The Board Of Regents Of The University Of Texas System Nucleotide editing to reframe dmd transcripts by base editing and prime editing
WO2022212926A1 (en) * 2021-04-01 2022-10-06 Prime Medicine, Inc. Methods and compositions for editing nucleotide sequences
CN115161316A (en) * 2021-04-02 2022-10-11 上海科技大学 Guide editing tool, fusion RNA and application thereof
JP2024513087A (en) * 2021-04-07 2024-03-21 アストラゼネカ・アクチエボラーグ Compositions and methods for site-specific modification
WO2022234051A1 (en) * 2021-05-06 2022-11-10 Universität Zürich Split prime editing enzyme
CN118043457A (en) * 2021-05-17 2024-05-14 武汉大学 System and method for inserting and editing large nucleic acid fragments
EP4347805A1 (en) 2021-05-27 2024-04-10 Astrazeneca AB Cas9 effector proteins with enhanced stability
EP4349979A1 (en) 2021-05-27 2024-04-10 Institute Of Zoology, Chinese Academy Of Sciences Engineered cas12i nuclease, effector protein and use thereof
CN117642420A (en) 2021-05-28 2024-03-01 萨那生物科技公司 Lipid particles comprising truncated baboon endogenous retrovirus (BaEV) envelope glycoproteins and related methods and uses
AU2022284804A1 (en) * 2021-06-01 2023-12-07 Arbor Biotechnologies, Inc. Gene editing systems comprising a crispr nuclease and uses thereof
EP4352230A2 (en) * 2021-06-03 2024-04-17 Prime Medicine, Inc. Genome editing compositions and methods for treatment of wilson's disease
WO2022261509A1 (en) 2021-06-11 2022-12-15 The Broad Institute, Inc. Improved cytosine to guanine base editors
WO2022265965A1 (en) * 2021-06-14 2022-12-22 10X Genomics, Inc. Reverse transcriptase variants for improved performance
WO2023283092A1 (en) * 2021-07-06 2023-01-12 Prime Medicine, Inc. Compositions and methods for efficient genome editing
US20230052518A1 (en) 2021-07-12 2023-02-16 Labsimply, Inc. Nuclease cascade assay
WO2023288332A2 (en) * 2021-07-16 2023-01-19 Prime Medicine, Inc. Genome editing compositions and methods for treatment of wilson's disease
EP4373939A2 (en) * 2021-07-23 2024-05-29 Prime Medicine, Inc. Genome editing compositions and methods for treatment of chronic granulomatous disease
WO2023015318A2 (en) * 2021-08-05 2023-02-09 Prime Medicine, Inc. Genome editing compositions and methods for treatment of cystic fibrosis
AU2022325166A1 (en) * 2021-08-06 2024-02-08 President And Fellows Of Harvard College Improved prime editors and methods of use
AU2022326565A1 (en) 2021-08-11 2024-02-08 Sana Biotechnology, Inc. Genetically modified cells for allogeneic cell therapy
CA3227108A1 (en) 2021-08-11 2023-02-16 Xiaomeng HU Genetically modified primary cells for allogeneic cell therapy
AU2022325955A1 (en) 2021-08-11 2024-02-08 Sana Biotechnology, Inc. Genetically modified cells for allogeneic cell therapy to reduce instant blood mediated inflammatory reactions
AU2022325231A1 (en) 2021-08-11 2024-02-08 Sana Biotechnology, Inc. Genetically modified cells for allogeneic cell therapy to reduce complement-mediated inflammatory reactions
AU2022334454A1 (en) * 2021-08-24 2024-03-14 Prime Medicine, Inc. Genome editing compositions and methods for treatment of retinopathy
IL311218A (en) * 2021-09-08 2024-05-01 Flagship Pioneering Innovations Vi Llc Pah-modulating compositions and methods
IL311225A (en) * 2021-09-08 2024-05-01 Flagship Pioneering Innovations Vi Llc Methods and compositions for modulating a genome
KR20240055811A (en) 2021-09-10 2024-04-29 애질런트 테크놀로지스, 인크. Guide RNA with chemical modifications for prime editing
WO2023049931A1 (en) * 2021-09-27 2023-03-30 The Trustees Of Columbia University In The City Of New York Methods and systems for modifying the crumbs homologue-1 (crb1) gene
CA3232862A1 (en) * 2021-09-27 2023-03-30 Steven Petrou Compositions and methods for the treatment of pcdh19 related disorders
GB202113933D0 (en) * 2021-09-29 2021-11-10 Genome Res Ltd Methods for gene editing
WO2023070110A2 (en) * 2021-10-21 2023-04-27 Prime Medicine, Inc. Genome editing compositions and methods for treatment of retinitis pigmentosa
WO2023070062A2 (en) * 2021-10-21 2023-04-27 Prime Medicine, Inc. Genome editing compositions and methods for treatment of usher syndrome type 3
WO2023069790A1 (en) 2021-10-22 2023-04-27 Sana Biotechnology, Inc. Methods of engineering allogeneic t cells with a transgene in a tcr locus and associated compositions and methods
WO2023076898A1 (en) * 2021-10-25 2023-05-04 The Broad Institute, Inc. Methods and compositions for editing a genome with prime editing and a recombinase
CA3237300A1 (en) 2021-11-01 2023-05-04 Tome Biosciences, Inc. Single construct platform for simultaneous delivery of gene editing machinery and nucleic acid cargo
WO2023081787A2 (en) * 2021-11-04 2023-05-11 Prime Medicine, Inc. Genome editing compositions and methods for treatment of fanconi anemia
WO2023086805A2 (en) * 2021-11-09 2023-05-19 Sri International Platform using ipsc-derived cardiomyocytes carrying gene variants as models of cardiac disease and drug-response
WO2023097224A1 (en) * 2021-11-23 2023-06-01 The Broad Institute, Inc. Reprogrammable isrb nucleases and uses thereof
WO2023102538A1 (en) * 2021-12-03 2023-06-08 The Broad Institute, Inc. Self-assembling virus-like particles for delivery of prime editors and methods of making and using same
WO2023102550A2 (en) 2021-12-03 2023-06-08 The Broad Institute, Inc. Compositions and methods for efficient in vivo delivery
US20230279375A1 (en) 2021-12-13 2023-09-07 Labsimply, Inc. Signal boost cascade assay
WO2023114052A1 (en) 2021-12-13 2023-06-22 Labsimply, Inc. Tuning cascade assay kinetics via molecular design
WO2023114473A2 (en) * 2021-12-16 2023-06-22 10X Genomics, Inc. Recombinant reverse transcriptase variants for improved performance
WO2023114992A1 (en) * 2021-12-17 2023-06-22 Massachusetts Institute Of Technology Programmable insertion approaches via reverse transcriptase recruitment
WO2023115041A1 (en) 2021-12-17 2023-06-22 Sana Biotechnology, Inc. Modified paramyxoviridae attachment glycoproteins
WO2023115039A2 (en) 2021-12-17 2023-06-22 Sana Biotechnology, Inc. Modified paramyxoviridae fusion glycoproteins
WO2023122764A1 (en) 2021-12-22 2023-06-29 Tome Biosciences, Inc. Co-delivery of a gene editor construct and a donor template
WO2023133595A2 (en) 2022-01-10 2023-07-13 Sana Biotechnology, Inc. Methods of ex vivo dosing and administration of lipid particles or viral vectors and related systems and uses
WO2023141602A2 (en) 2022-01-21 2023-07-27 Renagade Therapeutics Management Inc. Engineered retrons and methods of use
WO2023150518A1 (en) 2022-02-01 2023-08-10 Sana Biotechnology, Inc. Cd3-targeted lentiviral vectors and uses thereof
WO2023150637A1 (en) * 2022-02-02 2023-08-10 Inscripta, Inc. Nucleic acid-guided nickase fusion proteins
WO2023150647A1 (en) 2022-02-02 2023-08-10 Sana Biotechnology, Inc. Methods of repeat dosing and administration of lipid particles or viral vectors and related systems and uses
WO2023150802A1 (en) * 2022-02-07 2023-08-10 Travin Bio, Inc. Methods and compositions for targeted delivery of intracellular biologics
KR20230121565A (en) * 2022-02-08 2023-08-18 주식회사 툴젠 A method for predicting off-targets which are cappable of occuring in process of genome editing by prime editing system
WO2023158836A1 (en) 2022-02-17 2023-08-24 Sana Biotechnology, Inc. Engineered cd47 proteins and uses thereof
TW202342744A (en) * 2022-03-01 2023-11-01 美商巴斯夫農業解決方案種子美國有限責任公司 Cas12a nickases
WO2023200406A2 (en) * 2022-04-14 2023-10-19 National University Of Singapore Method of detecting a polynucleotide analyte
WO2023205708A1 (en) * 2022-04-20 2023-10-26 Massachusetts Institute Of Technology SITE SPECIFIC GENETIC ENGINEERING UTILIZING TRANS-TEMPLATE RNAs
WO2023205687A1 (en) * 2022-04-20 2023-10-26 The Broad Institute, Inc. Improved prime editing methods and compositions
WO2023205744A1 (en) 2022-04-20 2023-10-26 Tome Biosciences, Inc. Programmable gene insertion compositions
WO2023212594A2 (en) * 2022-04-26 2023-11-02 University Of Massachusetts SINGLE pegRNA-MEDIATED LARGE INSERTIONS
WO2023205844A1 (en) * 2022-04-26 2023-11-02 Peter Maccallum Cancer Institute Nucleic acids and uses thereof
WO2023215831A1 (en) 2022-05-04 2023-11-09 Tome Biosciences, Inc. Guide rna compositions for programmable gene insertion
WO2023225670A2 (en) 2022-05-20 2023-11-23 Tome Biosciences, Inc. Ex vivo programmable gene insertion
WO2023232024A1 (en) * 2022-05-30 2023-12-07 Wuhan University System and methods for duplicating target fragments
KR102472344B1 (en) * 2022-05-31 2022-11-30 주식회사 엠케이바이오텍 Composition for treating alleviated hip dysplasia of dog using prime editors
CN114958767B (en) * 2022-06-02 2022-12-27 健颐生物科技发展(山东)有限公司 Preparation method of neural stem cell preparation constructed based on hiPSC cells
WO2023250174A1 (en) * 2022-06-23 2023-12-28 Prime Medicine, Inc. Split prime editors
CN115058451A (en) * 2022-06-23 2022-09-16 五邑大学 Double-reporting plasmid for homologous recombination and single base editing and construction method and application thereof
WO2024006762A1 (en) * 2022-06-27 2024-01-04 The Uab Research Foundation Nucleic acid probes and their uses for the detection of prevotella bivia
CN115148281B (en) * 2022-06-29 2023-07-14 广州源井生物科技有限公司 Automatic design method and system for gene editing point mutation scheme
CN115093470B (en) * 2022-06-30 2023-03-24 广州市乾相生物科技有限公司 Intein Mtu RecA mutant and application thereof in production of glutathione GSH
WO2024020346A2 (en) 2022-07-18 2024-01-25 Renagade Therapeutics Management Inc. Gene editing components, systems, and methods of use
WO2024020111A1 (en) * 2022-07-20 2024-01-25 Syntax Bio, Inc. Systems for cell programming and methods thereof
CN115331736B (en) * 2022-07-20 2023-07-25 佛山科学技术学院 Splicing method for extending high-throughput sequencing genes based on text matching
WO2024020587A2 (en) 2022-07-22 2024-01-25 Tome Biosciences, Inc. Pleiopluripotent stem cell programmable gene insertion
CN116064517A (en) * 2022-07-29 2023-05-05 之江实验室 Production mode of pilot editing gRNA and application thereof
WO2024038003A1 (en) * 2022-08-15 2024-02-22 Institut Pasteur Methods and systems for generating nucleic acid diversity in crispr-associated genes
WO2024044655A1 (en) 2022-08-24 2024-02-29 Sana Biotechnology, Inc. Delivery of heterologous proteins
WO2024042489A1 (en) 2022-08-25 2024-02-29 LifeEDIT Therapeutics, Inc. Chemical modification of guide rnas with locked nucleic acid for rna guided nuclease-mediated gene editing
WO2024044723A1 (en) 2022-08-25 2024-02-29 Renagade Therapeutics Management Inc. Engineered retrons and methods of use
WO2024064838A1 (en) 2022-09-21 2024-03-28 Sana Biotechnology, Inc. Lipid particles comprising variant paramyxovirus attachment glycoproteins and uses thereof
WO2024076473A1 (en) 2022-10-02 2024-04-11 Vedabio, Inc. Dimerization screening assays
WO2024077267A1 (en) 2022-10-07 2024-04-11 The Broad Institute, Inc. Prime editing methods and compositions for treating triplet repeat disorders
WO2024081820A1 (en) 2022-10-13 2024-04-18 Sana Biotechnology, Inc. Viral particles targeting hematopoietic stem cells
WO2024097315A2 (en) 2022-11-02 2024-05-10 Sana Biotechnology, Inc. Cell therapy products and methods for producing same
WO2024095245A2 (en) 2022-11-04 2024-05-10 LifeEDIT Therapeutics, Inc. Evolved adenine deaminases and rna-guided nuclease fusion proteins with internal insertion sites and methods of use
CN116286738B (en) * 2023-02-03 2023-11-24 珠海舒桐医疗科技有限公司 DSB-PE gene editing system and application thereof
CN117363588A (en) * 2023-02-15 2024-01-09 中国农业科学院兰州兽医研究所 Preparation method and application of recombinant bluetongue virus expressing tetracysteine tag
CN116501703B (en) * 2023-06-27 2023-09-01 江铃汽车股份有限公司 Method and equipment for carrying out data merging processing on ADAMS analysis result
CN117535354A (en) * 2023-09-28 2024-02-09 广州瑞风生物科技有限公司 Method and composition for repairing HBA2 gene mutation and application thereof

Family Cites Families (1834)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US381A (en) 1837-09-12 Samuel nicolsonj of bo
US13738A (en) 1855-10-30 eaton
US4217344A (en) 1976-06-23 1980-08-12 L'oreal Compositions containing aqueous dispersions of lipid spheres
US4235871A (en) 1978-02-24 1980-11-25 Papahadjopoulos Demetrios P Method of encapsulating biologically active materials in lipid vesicles
US4186183A (en) 1978-03-29 1980-01-29 The United States Of America As Represented By The Secretary Of The Army Liposome carriers in chemotherapy of leishmaniasis
US4182449A (en) 1978-04-18 1980-01-08 Kozlow William J Adhesive bandage and package
US4261975A (en) 1979-09-19 1981-04-14 Merck & Co., Inc. Viral liposome particle
US4663290A (en) 1982-01-21 1987-05-05 Molecular Genetics, Inc. Production of reverse transcriptase
US4485054A (en) 1982-10-04 1984-11-27 Lipoderm Pharmaceuticals Limited Method of encapsulating biologically active materials in multilamellar lipid vesicles (MLV)
US4501728A (en) 1983-01-06 1985-02-26 Technology Unlimited, Inc. Masking of liposomes from RES recognition
US4880635B1 (en) 1984-08-08 1996-07-02 Liposome Company Dehydrated liposomes
US5049386A (en) 1985-01-07 1991-09-17 Syntex (U.S.A.) Inc. N-ω,(ω-1)-dialkyloxy)- and N-(ω,(ω-1)-dialkenyloxy)Alk-1-YL-N,N,N-tetrasubstituted ammonium lipids and uses therefor
US4897355A (en) 1985-01-07 1990-01-30 Syntex (U.S.A.) Inc. N[ω,(ω-1)-dialkyloxy]- and N-[ω,(ω-1)-dialkenyloxy]-alk-1-yl-N,N,N-tetrasubstituted ammonium lipids and uses therefor
US4946787A (en) 1985-01-07 1990-08-07 Syntex (U.S.A.) Inc. N-(ω,(ω-1)-dialkyloxy)- and N-(ω,(ω-1)-dialkenyloxy)-alk-1-yl-N,N,N-tetrasubstituted ammonium lipids and uses therefor
US4797368A (en) 1985-03-15 1989-01-10 The United States Of America As Represented By The Department Of Health And Human Services Adeno-associated virus as eukaryotic expression vector
US4921757A (en) 1985-04-26 1990-05-01 Massachusetts Institute Of Technology System for delayed and pulsed release of biologically active substances
US4774085A (en) 1985-07-09 1988-09-27 501 Board of Regents, Univ. of Texas Pharmaceutical administration systems containing a mixture of immunomodulators
US5139941A (en) 1985-10-31 1992-08-18 University Of Florida Research Foundation, Inc. AAV transduction vectors
US4737323A (en) 1986-02-13 1988-04-12 Liposome Technology, Inc. Liposome extrusion method
US5017492A (en) 1986-02-27 1991-05-21 Life Technologies, Inc. Reverse transcriptase and method for its production
DE122007000007I1 (en) 1986-04-09 2007-05-16 Genzyme Corp Genetically transformed animals secreting a desired protein in milk
US4889818A (en) 1986-08-22 1989-12-26 Cetus Corporation Purified thermostable enzyme
US5079352A (en) 1986-08-22 1992-01-07 Cetus Corporation Purified thermostable enzyme
US5374553A (en) 1986-08-22 1994-12-20 Hoffmann-La Roche Inc. DNA encoding a thermostable nucleic acid polymerase enzyme from thermotoga maritima
US4837028A (en) 1986-12-24 1989-06-06 Liposome Technology, Inc. Liposomes with enhanced circulation time
US4920016A (en) 1986-12-24 1990-04-24 Linear Technology, Inc. Liposomes with enhanced circulation time
JPH0825869B2 (en) 1987-02-09 1996-03-13 株式会社ビタミン研究所 Antitumor agent-embedded liposome preparation
US4917951A (en) 1987-07-28 1990-04-17 Micro-Pak, Inc. Lipid vesicles formed of surfactants and steroids
US4911928A (en) 1987-03-13 1990-03-27 Micro-Pak, Inc. Paucilamellar lipid vesicles
RO108522B1 (en) 1987-04-23 1994-06-30 Fmc Corp Derivates of di(aryl)-cyclopropyl, its substitutes and intermediaries thereof
US4873316A (en) 1987-06-23 1989-10-10 Biogen, Inc. Isolation of exogenous recombinant proteins from the milk of transgenic mammals
RO114469B1 (en) 1987-12-15 1999-04-30 Gene Shears Pty Ltd Oligoribonucleotide compound, process for preparation and method of inactivation
US5244797B1 (en) 1988-01-13 1998-08-25 Life Technologies Inc Cloned genes encoding reverse transcriptase lacking rnase h activity
US4965185A (en) 1988-06-22 1990-10-23 Grischenko Valentin I Method for low-temperature preservation of embryos
US5223409A (en) 1988-09-02 1993-06-29 Protein Engineering Corp. Directed evolution of novel binding proteins
JP3771253B2 (en) 1988-09-02 2006-04-26 ダイアックス コープ. Generation and selection of novel binding proteins
US5270179A (en) 1989-08-10 1993-12-14 Life Technologies, Inc. Cloning and expression of T5 DNA polymerase reduced in 3'- to-5' exonuclease activity
US5047342A (en) 1989-08-10 1991-09-10 Life Technologies, Inc. Cloning and expression of T5 DNA polymerase
EP0451221B1 (en) 1989-08-31 1994-10-12 City Of Hope Chimeric dna-rna catalytic sequences
US5264618A (en) 1990-04-19 1993-11-23 Vical, Inc. Cationic lipids for intracellular delivery of biologically active molecules
US5427908A (en) 1990-05-01 1995-06-27 Affymax Technologies N.V. Recombinant library screening methods
WO1991017424A1 (en) 1990-05-03 1991-11-14 Vical, Inc. Intracellular delivery of biologically active substances by means of self-assembling lipid complexes
US5637459A (en) 1990-06-11 1997-06-10 Nexstar Pharmaceuticals, Inc. Systematic evolution of ligands by exponential enrichment: chimeric selex
US5580737A (en) 1990-06-11 1996-12-03 Nexstar Pharmaceuticals, Inc. High-affinity nucleic acid ligands that discriminate between theophylline and caffeine
JP2709311B2 (en) 1990-09-28 1998-02-04 エフ.ホフマン−ラ ロシュ アクチェンゲゼルシャフト 5 → 3 ′ exonuclease mutation of thermostable DNA polymerase
EP0553264A4 (en) 1990-10-05 1994-07-13 Wayne M Barnes Thermostable dna polymerase
PL169576B1 (en) 1990-10-12 1996-08-30 Max Planck Gesellschaft Method of obtaining rna molecule of catalytic activity
US5173414A (en) 1990-10-30 1992-12-22 Applied Immune Sciences, Inc. Production of recombinant adeno-associated virus vectors
NZ314630A (en) 1991-01-17 2000-11-24 Harvard College Use of trans-splicing ribozymes for genetic modification and cell ablation in a host cell
NZ241310A (en) 1991-01-17 1995-03-28 Gen Hospital Corp Trans-splicing ribozymes
PT100379B (en) 1991-04-10 1999-01-29 Scripps Research Inst LIBRARIES OF HETERODYMERIC RECEPTORS USING FAGOMIDEOS
DE4216134A1 (en) 1991-06-20 1992-12-24 Europ Lab Molekularbiolog SYNTHETIC CATALYTIC OLIGONUCLEOTIDE STRUCTURES
US6872816B1 (en) 1996-01-24 2005-03-29 Third Wave Technologies, Inc. Nucleic acid detection kits
US5652094A (en) 1992-01-31 1997-07-29 University Of Montreal Nucleozymes
JPH05274181A (en) 1992-03-25 1993-10-22 Nec Corp Setting/canceling system for break point
US5587308A (en) 1992-06-02 1996-12-24 The United States Of America As Represented By The Department Of Health & Human Services Modified adeno-associated virus vector capable of expression from a novel promoter
US5834247A (en) 1992-12-09 1998-11-10 New England Biolabs, Inc. Modified proteins comprising controllable intervening protein sequences or their elements methods of producing same and methods for purification of a target protein comprised by a modified protein
US5496714A (en) 1992-12-09 1996-03-05 New England Biolabs, Inc. Modification of protein by use of a controllable interveining protein sequence
US5434058A (en) 1993-02-09 1995-07-18 Arch Development Corporation Apolipoprotein B MRNA editing protein compositions and methods
US5436149A (en) 1993-02-19 1995-07-25 Barnes; Wayne M. Thermostable DNA polymerase with enhanced thermostability and enhanced length and efficiency of primer extension
CN1127527A (en) 1993-05-17 1996-07-24 加利福尼亚大学董事会 Ribozyme gene therapy for HIV infection and Aids
US5512462A (en) 1994-02-25 1996-04-30 Hoffmann-La Roche Inc. Methods and reagents for the polymerase chain reaction amplification of long DNA sequences
US5651981A (en) 1994-03-29 1997-07-29 Northwestern University Cationic phospholipids for transfection
US5912155A (en) 1994-09-30 1999-06-15 Life Technologies, Inc. Cloned DNA polymerases from Thermotoga neapolitana
US5614365A (en) 1994-10-17 1997-03-25 President & Fellow Of Harvard College DNA polymerase having modified nucleotide binding site for DNA sequencing
US5449639A (en) 1994-10-24 1995-09-12 Taiwan Semiconductor Manufacturing Company Ltd. Disposable metal anti-reflection coating process used together with metal dry/wet etch
US5767099A (en) 1994-12-09 1998-06-16 Genzyme Corporation Cationic amphiphiles containing amino acid or dervatized amino acid groups for intracellular delivery of therapeutic molecules
US6057153A (en) 1995-01-13 2000-05-02 Yale University Stabilized external guide sequences
US5795587A (en) 1995-01-23 1998-08-18 University Of Pittsburgh Stable lipid-comprising drug delivery complexes and methods for their production
US5830430A (en) 1995-02-21 1998-11-03 Imarx Pharmaceutical Corp. Cationic lipids and the use thereof
US5851548A (en) 1995-06-07 1998-12-22 Gen-Probe Incorporated Liposomes containing cationic lipids and vitamin D
US5773258A (en) 1995-08-25 1998-06-30 Roche Molecular Systems, Inc. Nucleic acid amplification using a reversibly inactivated thermostable enzyme
NO953680D0 (en) 1995-09-18 1995-09-18 Hans Prydz Cell cycle Enzymes
US5962313A (en) 1996-01-18 1999-10-05 Avigen, Inc. Adeno-associated virus vectors comprising a gene encoding a lyosomal enzyme
WO1997044348A1 (en) 1996-05-17 1997-11-27 Thomas Jefferson University Ribozyme-mediated gene replacement
US6887707B2 (en) 1996-10-28 2005-05-03 University Of Washington Induction of viral mutation by incorporation of miscoding ribonucleoside analogs into viral RNA
GB9701425D0 (en) 1997-01-24 1997-03-12 Bioinvent Int Ab A method for in vitro molecular evolution of protein function
US5981182A (en) 1997-03-13 1999-11-09 Albert Einstein College Of Medicine Of Yeshiva University Vector constructs for the selection and identification of open reading frames
US20040203109A1 (en) 1997-06-06 2004-10-14 Incyte Corporation Human regulatory proteins
US5849528A (en) 1997-08-21 1998-12-15 Incyte Pharmaceuticals, Inc.. Polynucleotides encoding a human S100 protein
US6355415B1 (en) 1997-09-29 2002-03-12 Ohio University Compositions and methods for the use of ribozymes to determine gene function
US6156509A (en) 1997-11-12 2000-12-05 Genencor International, Inc. Method of increasing efficiency of directed evolution of a gene using phagemid
US6429301B1 (en) 1998-04-17 2002-08-06 Whitehead Institute For Biomedical Research Use of a ribozyme to join nucleic acids and peptides
US6183998B1 (en) 1998-05-29 2001-02-06 Qiagen Gmbh Max-Volmer-Strasse 4 Method for reversible modification of thermostable enzymes
US8097648B2 (en) 1998-06-17 2012-01-17 Eisai R&D Management Co., Ltd. Methods and compositions for use in treating cancer
AU1115300A (en) 1998-10-13 2000-05-01 Advanced Research And Technology Institute, Inc. Assays for identifying functional alterations in the p53 tumor suppressor
EP2298728A1 (en) 1998-11-12 2011-03-23 Life Technologies Corporation Transfection reagents
US6599692B1 (en) 1999-09-14 2003-07-29 Sangamo Bioscience, Inc. Functional genomics using zinc finger proteins
US7013219B2 (en) 1999-01-12 2006-03-14 Sangamo Biosciences, Inc. Regulation of endogenous gene expression in cells using zinc finger proteins
US6534261B1 (en) 1999-01-12 2003-03-18 Sangamo Biosciences, Inc. Regulation of endogenous gene expression in cells using zinc finger proteins
US6453242B1 (en) 1999-01-12 2002-09-17 Sangamo Biosciences, Inc. Selection of sites for targeting by zinc finger proteins and methods of designing zinc finger proteins to bind to preselected sites
US20090130718A1 (en) 1999-02-04 2009-05-21 Diversa Corporation Gene site saturation mutagenesis
CA2365601A1 (en) 1999-03-29 2000-10-05 Kansai Technology Licensing Organization Co., Ltd. Novel cytidine deaminase
US6365410B1 (en) 1999-05-19 2002-04-02 Genencor International, Inc. Directed evolution of microorganisms
GB9920194D0 (en) 1999-08-27 1999-10-27 Advanced Biotech Ltd A heat-stable thermostable DNA polymerase for use in nucleic acid amplification
DE60043158D1 (en) 1999-11-18 2009-11-26 Pharmexa Inc HETEROKLITIC ANALOGUE OF CLASS I EPITOPES
AU785007B2 (en) 1999-11-24 2006-08-24 Mcs Micro Carrier Systems Gmbh Polypeptides comprising multimers of nuclear localization signals or of protein transduction domains and their use for transferring molecules into cells
IL150069A0 (en) 1999-12-06 2002-12-01 Sangamo Biosciences Inc Methods of using randomized libraries of zinc finger proteins for the identification of gene function
US6689558B2 (en) 2000-02-08 2004-02-10 Sangamo Biosciences, Inc. Cells for drug discovery
US7378248B2 (en) 2000-03-06 2008-05-27 Rigel Pharmaceuticals, Inc. In vivo production of cyclic peptides for inhibiting protein-protein interaction
US7078208B2 (en) 2000-05-26 2006-07-18 Invitrogen Corporation Thermostable reverse transcriptases and uses thereof
US6573092B1 (en) 2000-10-10 2003-06-03 Genvec, Inc. Method of preparing a eukaryotic viral vector
MXPA03003690A (en) 2000-10-27 2004-05-05 Chiron Spa Nucleic acids and proteins from streptococcus groups a b.
CN101317825A (en) 2000-10-30 2008-12-10 欧罗赛铁克股份有限公司 Controlled release hydrocodone formulations
US20040003420A1 (en) 2000-11-10 2004-01-01 Ralf Kuhn Modified recombinase
US7067650B1 (en) 2000-11-22 2006-06-27 National Institute Of Advanced Industrial Science And Technology Ribozymes targeting bradeion transcripts and use thereof
AU2002227882B2 (en) 2001-01-25 2007-06-28 Evolva Ltd Concatemers of differentially expressed multiple genes
US20050222030A1 (en) 2001-02-21 2005-10-06 Anthony Allison Modified annexin proteins and methods for preventing thrombosis
ATE398180T1 (en) 2001-02-27 2008-07-15 Univ Rochester METHODS AND COMPOSITIONS FOR MODIFYING THE EDITING OF APOLIPOPROTEIN B MRNA
US7807408B2 (en) 2001-03-19 2010-10-05 President & Fellows Of Harvard College Directed evolution of proteins
US7476500B1 (en) 2001-03-19 2009-01-13 President And Fellows Of Harvard College In vivo selection system for enzyme activity
DE60213826T3 (en) 2001-03-19 2013-10-17 President And Fellows Of Harvard College DEVELOPMENT OF NEW MOLECULAR FUNCTIONS
AU2002257076A1 (en) 2001-03-19 2002-10-03 President And Fellows Of Harvard College Nucleic acid shuffling
CA2444098C (en) 2001-04-19 2016-06-21 The Scripps Research Institute Methods and composition for the production of orthogonal trna-aminoacyltrna synthetase pairs
AU2002330714A1 (en) 2001-05-30 2003-01-02 Biomedical Center In silico screening for phenotype-associated expressed sequences
JP4473573B2 (en) 2001-07-26 2010-06-02 ストラタジーン カリフォルニア Multisite mutagenesis
US20030167533A1 (en) 2002-02-04 2003-09-04 Yadav Narendra S. Intein-mediated protein splicing
DK1506288T3 (en) 2002-05-10 2013-07-22 Medical Res Council ACTIVATION-INDUCED DEAMINASE (AID)
US20070015238A1 (en) 2002-06-05 2007-01-18 Snyder Richard O Production of pseudotyped recombinant AAV virions
US9388459B2 (en) 2002-06-17 2016-07-12 Affymetrix, Inc. Methods for genotyping
EP1578932A4 (en) 2002-07-12 2006-08-30 Affymetrix Inc Synthetic tag genes
WO2004016767A2 (en) 2002-08-19 2004-02-26 The President And Fellows Of Harvard College Evolving new molecular function
JP2006500030A (en) 2002-09-20 2006-01-05 イェール ユニバーシティ Riboswitch, method of using the same, and composition for use with riboswitch
US8017323B2 (en) 2003-03-26 2011-09-13 President And Fellows Of Harvard College Free reactant use in nucleic acid-templated synthesis
AU2004230592B2 (en) 2003-04-14 2007-10-04 Caliper Life Sciences, Inc. Reduction of migration shift assay interference
WO2004113495A2 (en) 2003-05-23 2004-12-29 The President And Fellows Of Harvard College Rna-based transcriptional regulators
US20050136429A1 (en) 2003-07-03 2005-06-23 Massachusetts Institute Of Technology SIRT1 modulation of adipogenesis and adipose function
DE602004011789T2 (en) 2003-07-07 2009-02-12 The Scripps Research Institute, La Jolla Compositions of orthogonal lysyl tRNA and aminoacyl-tRNA synthetase pairs and their uses
ES2808687T3 (en) 2003-08-08 2021-03-01 Sangamo Therapeutics Inc Methods and compositions for directed cleavage and recombination
US7670807B2 (en) 2004-03-10 2010-03-02 East Tennessee State Univ. Research Foundation RNA-dependent DNA polymerase from Geobacillus stearothermophilus
WO2005098043A2 (en) 2004-03-30 2005-10-20 The President And Fellows Of Harvard College Ligand-dependent protein splicing
US7595179B2 (en) 2004-04-19 2009-09-29 Applied Biosystems, Llc Recombinant reverse transcriptases
US7919277B2 (en) 2004-04-28 2011-04-05 Danisco A/S Detection and typing of bacterial strains
US7476734B2 (en) 2005-12-06 2009-01-13 Helicos Biosciences Corporation Nucleotide analogs
CA2632216C (en) 2004-07-06 2013-11-12 Societe De Commercialisation Des Produits De La Recherche Appliquee Socpra Sciences Sante Et Humaines S.E.C. A target-dependent nucleic acid adapter
US7851658B2 (en) 2004-08-17 2010-12-14 President And Fellows Of Harvard College Palladium-catalyzed carbon-carbon bond forming reactions
US8728526B2 (en) 2004-08-19 2014-05-20 The United States of America, Represented by Secretary of Department of Health and Human Services, NIH Coacervate microparticles useful for the sustained release administration of therapeutic agents
US9315862B2 (en) 2004-10-05 2016-04-19 California Institute Of Technology Aptamer regulated nucleic acids and uses thereof
US8178291B2 (en) 2005-02-18 2012-05-15 Monogram Biosciences, Inc. Methods and compositions for determining hypersusceptibility of HIV-1 to non-nucleoside reverse transcriptase inhibitors
JP2006248978A (en) 2005-03-10 2006-09-21 Mebiopharm Co Ltd New liposome preparation
EP1899465B1 (en) 2005-06-17 2010-03-24 The President and Fellows of Harvard College Iterated branching reaction pathways via nucleic acid-mediated chemistry
WO2007011722A2 (en) 2005-07-15 2007-01-25 President And Fellows Of Harvard College Reaction discovery system
US9783791B2 (en) 2005-08-10 2017-10-10 Agilent Technologies, Inc. Mutant reverse transcriptase and methods of use
AU2015252023B2 (en) 2005-08-26 2017-06-29 Dupont Nutrition Biosciences Aps Use
DK3284833T3 (en) 2005-08-26 2022-02-07 Dupont Nutrition Biosci Aps USE OF CRISPR-ASSOCIATED GENES (CAS)
AU2012244264B2 (en) 2005-08-26 2015-08-06 Dupont Nutrition Biosciences Aps Use
JPWO2007037444A1 (en) 2005-09-30 2009-04-16 国立大学法人 北海道大学 Vector for delivering the target substance into the nucleus or cell
KR100784478B1 (en) 2005-12-05 2007-12-11 한국과학기술원 A Prepartion method for a protein with new function through simultaneous incorporation of functional elements
US20080051317A1 (en) 2005-12-15 2008-02-28 George Church Polypeptides comprising unnatural amino acids, methods for their production and uses therefor
CA2651389C (en) 2006-05-05 2017-04-25 Molecular Transfer, Inc. Novel reagents for transfection of eukaryotic cells
ES2373586T3 (en) 2006-05-19 2012-02-06 Danisco A/S MARKED MICROORGANISMS AND METHODS TO MARK.
CA2656298A1 (en) 2006-06-02 2007-12-13 President And Fellows Of Harvard College Protein surface remodeling
US8129115B2 (en) 2006-06-06 2012-03-06 Panasonic Corporation Method of modifying nucleotide chain
US7572618B2 (en) 2006-06-30 2009-08-11 Bristol-Myers Squibb Company Polynucleotides encoding novel PCSK9 variants
WO2008005529A2 (en) 2006-07-07 2008-01-10 The Trustees Columbia University In The City Of New York Cell-mediated directed evolution
US20120322861A1 (en) 2007-02-23 2012-12-20 Barry John Byrne Compositions and Methods for Treating Diseases
BRPI0808704B1 (en) 2007-03-02 2022-01-18 Dupont Nutrition Biosciences Aps METHOD TO GENERATE AN INITIAL CULTURE COMPRISING AT LEAST TWO BACTERIOPHAGE-RESISTANT VARIANTS, INITIATOR CULTURE AND FERMENTATION METHOD
ATE530638T1 (en) 2007-04-26 2011-11-15 Univ Ramot PLURIPOTENT AUTOLOGOUS STEM CELLS FROM THE ORAL OR GASTROINTESTINAL MUCOSA
FI7694U1 (en) 2007-05-30 2007-11-30 Matti Koskinen Lure
WO2009002418A2 (en) 2007-06-21 2008-12-31 Merck & Co., Inc. T-cell peptide epitopes from carcinoembryonic antigen, immunogenic analogs, and uses thereof
FR2919804B1 (en) 2007-08-08 2010-08-27 Erytech Pharma COMPOSITION AND ANTI-TUMOR THERAPEUTIC VACCINE
WO2009029105A1 (en) 2007-08-31 2009-03-05 Vulano Group, Inc. Virtual aggregation processor for incorporating reverse path feedback into content delivered on a forward path
WO2009033027A2 (en) 2007-09-05 2009-03-12 Medtronic, Inc. Suppression of scn9a gene expression and/or function for the treatment of pain
EP2188384B1 (en) 2007-09-27 2015-07-15 Sangamo BioSciences, Inc. Rapid in vivo identification of biologically active nucleases
US20110014616A1 (en) 2009-06-30 2011-01-20 Sangamo Biosciences, Inc. Rapid screening of biologically active nucleases and isolation of nuclease-modified cells
KR100949310B1 (en) 2007-11-21 2010-03-23 한국과학기술연구원 Method for detection of the interaction HBV capsid and surface proteins using cellular imaging, and screening method of inhibitory agent of HBV proliferation using thereof
US9029524B2 (en) 2007-12-10 2015-05-12 California Institute Of Technology Signal activated RNA interference
EP2087789A1 (en) 2008-02-06 2009-08-12 Heinrich-Heine-Universität Düsseldorf Fto-modified non-human mammal
WO2009100373A1 (en) 2008-02-08 2009-08-13 Sangamo Biosciences, Inc. Treatment of chronic pain with zinc finger proteins
GB0806562D0 (en) * 2008-04-10 2008-05-14 Fermentas Uab Production of nucleic acid
WO2009146179A1 (en) 2008-04-15 2009-12-03 University Of Iowa Research Foundation Zinc finger nuclease for the cftr gene and methods of use thereof
CN102066405B (en) 2008-04-28 2015-09-30 哈佛大学校长及研究员协会 For the supercharged proteins of cell-penetrating
US8394604B2 (en) 2008-04-30 2013-03-12 Paul Xiang-Qin Liu Protein splicing using short terminal split inteins
US8546553B2 (en) 2008-07-25 2013-10-01 University Of Georgia Research Foundation, Inc. Prokaryotic RNAi-like system and methods of use
FR2934346B1 (en) 2008-07-28 2010-09-03 Claude Benit VALVE FOR SANITARY INSTALLATION AND MULTIFUNCTION DEVICE FOR SANITARY APPARATUS COMPRISING SUCH A VALVE
JP2010033344A (en) 2008-07-29 2010-02-12 Azabu Jui Gakuen Method for expressing uneven distribution of nucleic acid constituent base
EP2159286A1 (en) 2008-09-01 2010-03-03 Consiglio Nazionale Delle Ricerche Method for obtaining oligonucleotide aptamers and uses thereof
US8790664B2 (en) 2008-09-05 2014-07-29 Institut National De La Sante Et De La Recherche Medicale (Inserm) Multimodular assembly useful for intracellular delivery
WO2010028347A2 (en) 2008-09-05 2010-03-11 President & Fellows Of Harvard College Continuous directed evolution of proteins and nucleic acids
US8636884B2 (en) 2008-09-15 2014-01-28 Abbott Diabetes Care Inc. Cationic polymer based wired enzyme formulations for use in analyte sensors
US20100076057A1 (en) 2008-09-23 2010-03-25 Northwestern University TARGET DNA INTERFERENCE WITH crRNA
US9404098B2 (en) 2008-11-06 2016-08-02 University Of Georgia Research Foundation, Inc. Method for cleaving a target RNA using a Cas6 polypeptide
US10662227B2 (en) 2008-11-07 2020-05-26 Dupont Nutrition Biosciences Aps Bifidobacteria CRISPR sequences
US20110016540A1 (en) 2008-12-04 2011-01-20 Sigma-Aldrich Co. Genome editing of genes associated with trinucleotide repeat expansion disorders in animals
AU2009325069B2 (en) 2008-12-11 2015-03-19 Pacific Biosciences Of California, Inc. Classification of nucleic acid templates
US9175338B2 (en) 2008-12-11 2015-11-03 Pacific Biosciences Of California, Inc. Methods for identifying nucleic acid modifications
WO2010075424A2 (en) 2008-12-22 2010-07-01 The Regents Of University Of California Compositions and methods for downregulating prokaryotic genes
WO2010091203A2 (en) * 2009-02-04 2010-08-12 Lucigen Corporation Rna-and dna-copying enzymes
US20100305197A1 (en) 2009-02-05 2010-12-02 Massachusetts Institute Of Technology Conditionally Active Ribozymes And Uses Thereof
WO2010091294A2 (en) 2009-02-05 2010-08-12 The Regents Of The University Of California New targeted antimicrobial moieties
CN102421791A (en) 2009-03-04 2012-04-18 得克萨斯系统大学评议会 Stabilized reverse transcriptase fusion proteins
CN102421897B (en) 2009-03-06 2015-12-16 合成基因组股份有限公司 For cloning and operating genomic method
EP2425023B1 (en) 2009-04-27 2015-12-23 Pacific Biosciences of California, Inc. Real-time sequencing methods and systems
WO2010129023A2 (en) 2009-04-28 2010-11-11 President And Fellows Of Harvard College Supercharged proteins for cell penetration
WO2010132092A2 (en) 2009-05-12 2010-11-18 The Scripps Research Institute Cytidine deaminase fusions and related methods
US9063156B2 (en) 2009-06-12 2015-06-23 Pacific Biosciences Of California, Inc. Real-time analytical methods and systems
WO2011000106A1 (en) 2009-07-01 2011-01-06 Protiva Biotherapeutics, Inc. Improved cationic lipids and methods for the delivery of therapeutic agents
NZ598457A (en) 2009-08-03 2014-06-27 Recombinetics Inc Methods and compositions for targeted gene modification
WO2011017293A2 (en) 2009-08-03 2011-02-10 The General Hospital Corporation Engineering of zinc finger arrays by context-dependent assembly
GB0913681D0 (en) 2009-08-05 2009-09-16 Glaxosmithkline Biolog Sa Immunogenic composition
US8889394B2 (en) 2009-09-07 2014-11-18 Empire Technology Development Llc Multiple domain proteins
US8529326B2 (en) 2009-10-23 2013-09-10 California Institute Of Technology Games having biotechnological content
DK2494060T3 (en) 2009-10-30 2016-08-01 Synthetic Genomics Inc Coding of text for nucleic acid sequences
SG10201912571XA (en) 2009-11-02 2020-02-27 Univ Washington Therapeutic nuclease compositions and methods
US9175340B2 (en) 2009-11-04 2015-11-03 President And Fellows Of Harvard College Reactivity-dependent and interaction-dependent PCR
US20110104787A1 (en) 2009-11-05 2011-05-05 President And Fellows Of Harvard College Fusion Peptides That Bind to and Modify Target Nucleic Acid Sequences
US20110142886A1 (en) 2009-12-01 2011-06-16 Intezyne Technologies, Incorporated Pegylated polyplexes for polynucleotide delivery
TR201901311T4 (en) 2009-12-01 2019-02-21 Translate Bio Inc Steroid derivative for delivery of mRNA in human genetic diseases.
PT2816112T (en) 2009-12-10 2018-11-20 Univ Iowa State Res Found Inc Tal effector-mediated dna modification
JP2013514779A (en) 2009-12-18 2013-05-02 ボード オブ トラスティーズ オブ ザ レランド スタンフォード ジュニア ユニバーシティ Use of cytidine deaminase-related drugs to promote demethylation and cell reprogramming
NZ600546A (en) 2010-01-22 2014-08-29 Dow Agrosciences Llc Excision of transgenes in genetically modified organisms
WO2011090804A1 (en) 2010-01-22 2011-07-28 Dow Agrosciences Llc Targeted genomic alteration
US9198983B2 (en) 2010-01-25 2015-12-01 Alnylam Pharmaceuticals, Inc. Compositions and methods for inhibiting expression of Mylip/Idol gene
JP2013520989A (en) 2010-03-05 2013-06-10 シンセティック ジェノミクス インコーポレーテッド Methods for genome cloning and manipulation
GB201004575D0 (en) 2010-03-19 2010-05-05 Immatics Biotechnologies Gmbh Composition of tumor associated peptides and related anti cancer vaccine for the treatment of gastric cancer and other cancers
WO2011123830A2 (en) 2010-04-02 2011-10-06 Amunix Operating Inc. Alpha 1-antitrypsin compositions and methods of making and using same
BR112012028805A2 (en) 2010-05-10 2019-09-24 The Regents Of The Univ Of California E Nereus Pharmaceuticals Inc endoribonuclease compositions and methods of use thereof.
CN103025344B (en) 2010-05-17 2016-06-29 桑格摩生物科学股份有限公司 Novel DNA-associated proteins and application thereof
GB201008267D0 (en) 2010-05-18 2010-06-30 Univ Edinburgh Cationic lipids
BR112012030522A2 (en) 2010-05-27 2020-10-13 Heinrich-Pette-Institut Leibniz-Institut Fur Experimentelle Virologie - Stiftung Burgerlichen Rechts METHOD FOR THE PREPARATION OF AN EXPRESSION VECTOR THAT CODES A CONFIGURED RECOMBINASE, METHOD FOR THE PREPARATION OF A TRANSFORMED CELL, NUCLEIC ACID, CONFIGURED RECOMBINASE ENCODED BY NUCLEIC ACID, TRANSFORMED COMMODIC CYCLE "EFFECT"
US8748667B2 (en) 2010-06-04 2014-06-10 Sirna Therapeutics, Inc. Low molecular weight cationic lipids for oligonucleotide delivery
EP2392208B1 (en) 2010-06-07 2016-05-04 Helmholtz Zentrum München Deutsches Forschungszentrum für Gesundheit und Umwelt (GmbH) Fusion proteins comprising a DNA-binding domain of a Tal effector protein and a non-specific cleavage domain of a restriction nuclease and their use
US20110201118A1 (en) 2010-06-14 2011-08-18 Iowa State University Research Foundation, Inc. Nuclease activity of tal effector and foki fusion protein
WO2012016186A1 (en) 2010-07-29 2012-02-02 President And Fellows Of Harvard College Macrocyclic kinase inhibitors and uses thereof
WO2012019168A2 (en) 2010-08-06 2012-02-09 Moderna Therapeutics, Inc. Engineered nucleic acids and methods of use thereof
WO2012020759A1 (en) 2010-08-13 2012-02-16 国立大学法人京都大学 Variant reverse transcriptase
AU2011305572B2 (en) 2010-09-20 2016-08-04 Diane Goll Microencapsulation process and product
AU2011312413A1 (en) 2010-09-29 2013-05-23 Sound Surgical Technologies Llc Power assisted lipoplasty
DK2630156T3 (en) 2010-10-20 2018-12-17 Dupont Nutrition Biosci Aps CRISPR-CAS SEQUENCES OF LACTOCOCCUS
US9458484B2 (en) 2010-10-22 2016-10-04 Bio-Rad Laboratories, Inc. Reverse transcriptase mixtures with improved storage stability
US9405700B2 (en) 2010-11-04 2016-08-02 Sonics, Inc. Methods and apparatus for virtualization in an integrated circuit
EP2642985A4 (en) 2010-11-26 2014-05-07 Univ Witwatersrand Jhb Polymeric matrix of polymer-lipid nanoparticles as a pharmaceutical dosage form
KR101255338B1 (en) 2010-12-15 2013-04-16 포항공과대학교 산학협력단 Polynucleotide delivering complex for a targeting cell
ES2753198T5 (en) 2010-12-16 2023-05-31 Amgen Europe Gmbh Oral pharmaceutical forms of controlled release of poorly soluble drugs and their uses
JP6088438B2 (en) 2010-12-22 2017-03-01 プレジデント アンド フェローズ オブ ハーバード カレッジ Continuous directed evolution
US9499592B2 (en) 2011-01-26 2016-11-22 President And Fellows Of Harvard College Transcription activator-like effectors
KR101818126B1 (en) 2011-02-09 2018-01-15 (주)바이오니아 Reverse Transcriptase Having Improved Thermostability
US9528124B2 (en) 2013-08-27 2016-12-27 Recombinetics, Inc. Efficient non-meiotic allele introgression
WO2012125445A2 (en) 2011-03-11 2012-09-20 President And Fellows Of Harvard College Small molecule-dependent inteins and uses thereof
US9164079B2 (en) 2011-03-17 2015-10-20 Greyledge Technologies Llc Systems for autologous biological therapeutics
US20120244601A1 (en) 2011-03-22 2012-09-27 Bertozzi Carolyn R Riboswitch based inducible gene expression platform
JP2012210172A (en) 2011-03-30 2012-11-01 Japan Science & Technology Agency Liposome varying inner material composition responding to external environment
US8709466B2 (en) 2011-03-31 2014-04-29 International Business Machines Corporation Cationic polymers for antimicrobial applications and delivery of bioactive materials
WO2012138927A2 (en) 2011-04-05 2012-10-11 Philippe Duchateau Method for the generation of compact tale-nucleases and uses thereof
WO2012148953A1 (en) 2011-04-25 2012-11-01 Stc.Unm Solid compositions for pharmaceutical use
CN103492578B (en) 2011-04-27 2016-10-19 阿迈瑞斯公司 Method for genomic modification
WO2012158985A2 (en) 2011-05-17 2012-11-22 Transposagen Biopharmaceuticals, Inc. Methods for site-specific genetic modification in spermatogonial stem cells using zinc finger nuclease (zfn) for the creation of model organisms
WO2012158986A2 (en) 2011-05-17 2012-11-22 Transposagen Biopharmaceuticals, Inc. Methods for site-specific genetic modification in stem cells using xanthomonas tal nucleases (xtn) for the creation of model organisms
US8691750B2 (en) 2011-05-17 2014-04-08 Axolabs Gmbh Lipids and compositions for intracellular delivery of biologically active compounds
US20140113376A1 (en) 2011-06-01 2014-04-24 Rotem Sorek Compositions and methods for downregulating prokaryotic genes
CN103906527B (en) 2011-06-08 2020-07-10 川斯勒佰尔公司 Lipid nanoparticle compositions and methods for MRNA delivery
CA2843853A1 (en) 2011-07-01 2013-01-10 President And Fellows Of Harvard College Macrocyclic insulin-degrading enzyme (ide) inhibitors and uses thereof
EP2732038B1 (en) 2011-07-15 2018-09-05 The General Hospital Corporation Methods of transcription activator like effector assembly
EP2734622B1 (en) 2011-07-19 2018-09-05 Vivoscript, Inc. Compositions and methods for re-programming cells without genetic modification for repairing cartilage damage
US10323236B2 (en) 2011-07-22 2019-06-18 President And Fellows Of Harvard College Evaluation and improvement of nuclease cleavage specificity
WO2013039861A2 (en) 2011-09-12 2013-03-21 modeRNA Therapeutics Engineered nucleic acids and methods of use thereof
EP2755986A4 (en) 2011-09-12 2015-05-20 Moderna Therapeutics Inc Engineered nucleic acids and methods of use thereof
DK2762569T3 (en) 2011-09-28 2018-08-27 Ribomic Inc NGF aptamer and its use.
WO2013045632A1 (en) 2011-09-28 2013-04-04 Era Biotech, S.A. Split inteins and uses thereof
GB2496687A (en) 2011-11-21 2013-05-22 Gw Pharma Ltd Tetrahydrocannabivarin (THCV) in the protection of pancreatic islet cells
US9228201B2 (en) 2011-11-25 2016-01-05 Rijk Zwaan Zaadteelt En Zaadhandel B.V. Lettuce variety 45-89 RZ, “caledonas”
JP6132848B2 (en) 2011-12-08 2017-05-31 サレプタ セラピューティクス, インコーポレイテッド Oligonucleotide analogues targeting human LMNA
IN2014MN00974A (en) 2011-12-16 2015-04-24 Targetgene Biotechnologies Ltd
MX2014007233A (en) 2011-12-16 2015-02-04 Moderna Therapeutics Inc Modified nucleoside, nucleotide, and nucleic acid compositions.
GB201122458D0 (en) 2011-12-30 2012-02-08 Univ Wageningen Modified cascade ribonucleoproteins and uses thereof
WO2013119602A1 (en) 2012-02-06 2013-08-15 President And Fellows Of Harvard College Arrdc1-mediated microvesicles (armms) and uses thereof
RU2650811C2 (en) 2012-02-24 2018-04-17 Фред Хатчинсон Кэнсер Рисерч Сентер Compositions and methods for treatment of hemoglobinopathies
EP2820159B1 (en) 2012-02-29 2019-10-23 Sangamo Therapeutics, Inc. Methods and compositions for treating huntington's disease
JP2015512255A (en) 2012-03-17 2015-04-27 ザ リージェンツ オブ ザ ユニバーシティ オブ カリフォルニア Rapid diagnosis and personalized treatment of acne
WO2013141680A1 (en) 2012-03-20 2013-09-26 Vilnius University RNA-DIRECTED DNA CLEAVAGE BY THE Cas9-crRNA COMPLEX
US9637739B2 (en) 2012-03-20 2017-05-02 Vilnius University RNA-directed DNA cleavage by the Cas9-crRNA complex
WO2013152359A1 (en) 2012-04-06 2013-10-10 The Regents Of The University Of California Novel tetrazines and method of synthesizing the same
BR112014026203A2 (en) 2012-04-23 2017-07-18 Bayer Cropscience Nv plant-directed genome engineering
KR102091298B1 (en) 2012-05-02 2020-03-19 다우 아그로사이언시즈 엘엘씨 Targeted modification of malate dehydrogenase
JP6559063B2 (en) 2012-05-07 2019-08-14 サンガモ セラピューティクス, インコーポレイテッド Methods and compositions for nuclease-mediated targeted integration of transgenes
WO2013169398A2 (en) 2012-05-09 2013-11-14 Georgia Tech Research Corporation Systems and methods for improving nuclease specificity and activity
ES2960803T3 (en) 2012-05-25 2024-03-06 Univ California Methods and compositions for RNA-directed modification of target DNA and for modulation of RNA-directed transcription
PL2855667T3 (en) 2012-05-25 2024-03-25 Cellectis Methods for engineering allogeneic and immunosuppressive resistant t cell for immunotherapy
US20150017136A1 (en) 2013-07-15 2015-01-15 Cellectis Methods for engineering allogeneic and highly active t cell for immunotherapy
US20140056868A1 (en) 2012-05-30 2014-02-27 University of Washington Center for Commercialization Supercoiled MiniVectors as a Tool for DNA Repair, Alteration and Replacement
US9102936B2 (en) 2012-06-11 2015-08-11 Agilent Technologies, Inc. Method of adaptor-dimer subtraction using a CRISPR CAS6 protein
CN104540382A (en) 2012-06-12 2015-04-22 弗·哈夫曼-拉罗切有限公司 Methods and compositions for generating conditional knock-out alleles
EP2674501A1 (en) 2012-06-14 2013-12-18 Agence nationale de sécurité sanitaire de l'alimentation,de l'environnement et du travail Method for detecting and identifying enterohemorrhagic Escherichia coli
US9688971B2 (en) 2012-06-15 2017-06-27 The Regents Of The University Of California Endoribonuclease and methods of use thereof
EP2861737B1 (en) 2012-06-19 2019-04-17 Regents Of The University Of Minnesota Gene targeting in plants using dna viruses
US9267127B2 (en) 2012-06-21 2016-02-23 President And Fellows Of Harvard College Evolution of bond-forming enzymes
PL2877490T3 (en) 2012-06-27 2019-03-29 The Trustees Of Princeton University Split inteins, conjugates and uses thereof
CN104508130B (en) 2012-06-29 2016-09-28 麻省理工学院 Large-scale parallel combination hereditism
US9125508B2 (en) 2012-06-30 2015-09-08 Seasons 4, Inc. Collapsible tree system
EP2872154B1 (en) 2012-07-11 2017-05-31 Sangamo BioSciences, Inc. Methods and compositions for delivery of biologics
EP3444342B1 (en) 2012-07-11 2020-05-27 Sangamo Therapeutics, Inc. Methods and compositions for the treatment of lysosomal storage diseases
CN116622704A (en) 2012-07-25 2023-08-22 布罗德研究所有限公司 Inducible DNA binding proteins and genomic disruption tools and uses thereof
US10058078B2 (en) 2012-07-31 2018-08-28 Recombinetics, Inc. Production of FMDV-resistant livestock by allele substitution
EP2879678B1 (en) 2012-07-31 2023-03-01 Yeda Research and Development Co. Ltd. Enoxacin for treating amyotrophic lateral sclerosis
EP2880171B1 (en) 2012-08-03 2018-10-03 The Regents of The University of California Methods and compositions for controlling gene expression by rna processing
KR102474010B1 (en) 2012-08-29 2022-12-02 상가모 테라퓨틱스, 인코포레이티드 Methods and compositions for treatment of a genetic condition
EP4148134A1 (en) 2012-09-04 2023-03-15 The Scripps Research Institute Chimeric polypeptides having targeted binding specificity
ES2714523T3 (en) 2012-09-04 2019-05-28 Cellectis Chimeric receptor of multi-chain antigens and uses thereof
WO2014039513A2 (en) 2012-09-04 2014-03-13 The Trustees Of The University Of Pennsylvania Inhibition of diacylglycerol kinase to augment adoptive t cell transfer
UA118090C2 (en) 2012-09-07 2018-11-26 ДАУ АГРОСАЙЄНСІЗ ЕлЕлСі Fad2 performance loci and corresponding target site specific binding proteins capable of inducing targeted breaks
US9914930B2 (en) 2012-09-07 2018-03-13 Dow Agrosciences Llc FAD3 performance loci and corresponding target site specific binding proteins capable of inducing targeted breaks
UA119135C2 (en) 2012-09-07 2019-05-10 ДАУ АГРОСАЙЄНСІЗ ЕлЕлСі Engineered transgene integration platform (etip) for gene targeting and trait stacking
US20140075593A1 (en) 2012-09-07 2014-03-13 Dow Agrosciences Llc Fluorescence activated cell sorting (facs) enrichment to generate plants
WO2014043143A1 (en) 2012-09-11 2014-03-20 Life Technologies Corporation Nucleic acid amplification
GB201216564D0 (en) 2012-09-17 2012-10-31 Univ Edinburgh Genetically edited animal
WO2014047103A2 (en) 2012-09-18 2014-03-27 The Translational Genomics Research Institute Isolated genes and transgenic organisms for producing biofuels
US9181535B2 (en) 2012-09-24 2015-11-10 The Chinese University Of Hong Kong Transcription activator-like effector nucleases (TALENs)
CN104822830B (en) 2012-10-03 2021-07-09 谷万达公司 Intein-modified proteases, method for their preparation and industrial use
JO3470B1 (en) 2012-10-08 2020-07-05 Merck Sharp & Dohme 5-phenoxy-3h-pyrimidin-4-one derivatives and their use as hiv reverse transcriptase inhibitors
JP6401704B2 (en) 2012-10-10 2018-10-10 サンガモ セラピューティクス, インコーポレイテッド Compounds that modify T cells and uses thereof
EP2906602B1 (en) 2012-10-12 2019-01-16 The General Hospital Corporation Transcription activator-like effector (tale) - lysine-specific demethylase 1 (lsd1) fusion proteins
ES2926021T3 (en) 2012-10-23 2022-10-21 Toolgen Inc Composition for cleaving a target DNA comprising a target DNA-specific guide RNA and Cas protein-encoding nucleic acid or Cas protein, and use thereof
US20140115728A1 (en) 2012-10-24 2014-04-24 A. Joseph Tector Double knockout (gt/cmah-ko) pigs, organs and tissues
JP2015533284A (en) 2012-10-30 2015-11-24 リコンビネティクス・インコーポレイテッドRecombinetics,Inc. Control of sexual maturity in animals
BR112015009812A2 (en) 2012-10-31 2017-08-22 Cellectis METHOD FOR SPECIFIC GENETIC INSERTION INTO A PLANT GENOME, TRANSFORMED PLANT CELL AND ITS USE, HERBICIDIDE RESISTANT PLANT, KIT, VECTOR, AND HOST CELL
WO2014068346A2 (en) 2012-10-31 2014-05-08 Mezögazdásagi Biotechnológiai Kutatóközpont Identification of a xanthomonas euvesicatoria resistance gene from pepper (capsicum annuum) and method for generating plants with resistance
RU2019143431A (en) 2012-11-01 2020-04-28 Фэктор Байосайенс Инк. METHODS AND PRODUCTS FOR EXPRESSION OF PROTEINS IN CELLS
WO2014071235A1 (en) 2012-11-01 2014-05-08 Massachusetts Institute Of Technology Genetic device for the controlled destruction of dna
US20140127752A1 (en) 2012-11-07 2014-05-08 Zhaohui Zhou Method, composition, and reagent kit for targeted genomic enrichment
US9879227B2 (en) 2012-11-09 2018-01-30 Marco Archetti Diffusible factors and cancer cells
WO2014081855A1 (en) 2012-11-20 2014-05-30 Universite De Montreal Methods and compositions for muscular dystrophies
WO2014081730A1 (en) 2012-11-20 2014-05-30 Cold Spring Harbor Laboratory Mutations in solanaceae plants that modulate shoot architecture and enhance yield-related phenotypes
KR20150085846A (en) 2012-11-20 2015-07-24 제이.알.심프롯캄패니 Tal-Mediated Transfer DNA Insertion
CN109554350B (en) 2012-11-27 2022-09-23 儿童医疗中心有限公司 Targeting BCL11A distal regulatory elements for fetal hemoglobin re-induction
WO2014085261A1 (en) 2012-11-29 2014-06-05 North Carolina State University Synthetic pathway for biological carbon dioxide sequestration
DK2925866T3 (en) 2012-11-30 2018-10-29 Univ Aarhus CIRCULAR RNA FOR INHIBITING MICRO-RNA
WO2014085830A2 (en) 2012-11-30 2014-06-05 The Parkinson's Institute Screening assays for therapeutics for parkinson's disease
WO2014086494A1 (en) 2012-12-05 2014-06-12 Merz Pharma Gmbh & Co. Kgaa Novel recombinant clostridial neurotoxins with enhanced membrane localization
AU2013355327A1 (en) 2012-12-05 2015-06-11 Sangamo Therapeutics, Inc. Methods and compositions for regulation of metabolic disorders
EP3617309A3 (en) 2012-12-06 2020-05-06 Sigma Aldrich Co. LLC Crispr-based genome modification and regulation
ES2740648T3 (en) 2012-12-06 2020-02-06 Synthetic Genomics Inc Algae mutants that have a blocked high-light acclimatized phenotype
US9447422B2 (en) 2012-12-06 2016-09-20 Synthetic Genomics, Inc. Autonomous replication sequences and episomal DNA molecules
US10272163B2 (en) 2012-12-07 2019-04-30 The Regents Of The University Of California Factor VIII mutation repair and tolerance induction
US9914931B2 (en) 2012-12-07 2018-03-13 Synthetic Genomics, Inc. Nannochloropsis spliced leader sequences and uses therefor
WO2014093479A1 (en) 2012-12-11 2014-06-19 Montana State University Crispr (clustered regularly interspaced short palindromic repeats) rna-guided control of gene regulation
EP3144390B1 (en) 2012-12-12 2020-03-18 The Broad Institute, Inc. Engineering of systems, methods and optimized guide compositions for sequence manipulation
CN114634950A (en) 2012-12-12 2022-06-17 布罗德研究所有限公司 CRISPR-CAS component systems, methods, and compositions for sequence manipulation
EP2931899A1 (en) 2012-12-12 2015-10-21 The Broad Institute, Inc. Functional genomics using crispr-cas systems, compositions, methods, knock out libraries and applications thereof
IL239344B1 (en) 2012-12-12 2024-02-01 Broad Inst Inc Engineering of systems, methods and optimized guide compositions for sequence manipulation
SG10201912328UA (en) 2012-12-12 2020-02-27 Broad Inst Inc Delivery, Engineering and Optimization of Systems, Methods and Compositions for Sequence Manipulation and Therapeutic Applications
ES2576128T3 (en) 2012-12-12 2016-07-05 The Broad Institute, Inc. Modification by genetic technology and optimization of systems, methods and compositions for the manipulation of sequences with functional domains
WO2014093709A1 (en) 2012-12-12 2014-06-19 The Broad Institute, Inc. Methods, models, systems, and apparatus for identifying target sequences for cas enzymes or crispr-cas systems for target sequences and conveying results thereof
CN113355357A (en) 2012-12-12 2021-09-07 布罗德研究所有限公司 Engineering and optimization of improved systems, methods and enzyme compositions for sequence manipulation
DK2825654T3 (en) 2012-12-12 2017-08-21 Broad Inst Inc SYSTEMS, PROCEDURES, AND COMPOSITIONS WITH CRISPR-CAS COMPONENTS FOR SEQUENCE MANIPULATION.
US20140310830A1 (en) 2012-12-12 2014-10-16 Feng Zhang CRISPR-Cas Nickase Systems, Methods And Compositions For Sequence Manipulation in Eukaryotes
US8697359B1 (en) 2012-12-12 2014-04-15 The Broad Institute, Inc. CRISPR-Cas systems and methods for altering expression of gene products
RU2015128052A (en) 2012-12-13 2017-01-19 Дау Агросайенсиз Ллс PRECISE TARGETING OF GENES REGARDING SPECIFIC LOCUS OF CORN
AU2013359146B2 (en) 2012-12-13 2017-12-07 Corteva Agriscience Llc DNA detection methods for site specific nuclease activity
CN105144204B (en) 2012-12-13 2018-02-27 麻省理工学院 Logical AND storage system based on recombinase
IL308158A (en) 2012-12-17 2023-12-01 Harvard College Rna-guided human genome engineering
US9708589B2 (en) 2012-12-18 2017-07-18 Monsanto Technology Llc Compositions and methods for custom site-specific DNA recombinases
CN105120656A (en) 2012-12-21 2015-12-02 塞尔克蒂斯股份有限公司 Potatoes with reduced cold-induced sweetening
DK3491915T3 (en) 2012-12-27 2023-08-28 Keygene Nv Method of inducing a targeted translocation in a plant
WO2014110006A1 (en) 2013-01-10 2014-07-17 Ge Healthcare Dharmacon, Inc. Templates, libraries, kits and methods for generating molecules
CN105142396A (en) 2013-01-14 2015-12-09 重组股份有限公司 Hornless livestock
CN104995302B (en) 2013-01-16 2021-08-31 爱默蕾大学 CAS 9-nucleic acid complexes and uses related thereto
CN103233028B (en) 2013-01-25 2015-05-13 南京徇齐生物技术有限公司 Specie limitation-free eucaryote gene targeting method having no bio-safety influence and helical-structure DNA sequence
AU2014215025B2 (en) 2013-02-05 2018-08-30 The United States Of America, As Represented By The Secretary, Department Of Health And Human Services Cell lines for virus production and methods of use
WO2014124226A1 (en) 2013-02-07 2014-08-14 The Rockefeller University Sequence specific antimicrobials
WO2014127287A1 (en) 2013-02-14 2014-08-21 Massachusetts Institute Of Technology Method for in vivo tergated mutagenesis
ES2768291T3 (en) 2013-02-14 2020-06-22 Univ Osaka Method for isolating a specific genomic region using a molecule that specifically binds to an endogenous DNA sequence
MX2015010841A (en) 2013-02-20 2016-05-09 Regeneron Pharma Genetic modification of rats.
US20150353885A1 (en) 2013-02-21 2015-12-10 Cellectis Method to counter-select cells or organisms by linking loci to nuclease components
ES2522765B2 (en) 2013-02-22 2015-03-18 Universidad De Alicante Method to detect spacer insertions in CRISPR structures
JP6491113B2 (en) 2013-02-25 2019-03-27 サンガモ セラピューティクス, インコーポレイテッド Methods and compositions for enhancing nuclease-mediated gene disruption
EP2922393B2 (en) 2013-02-27 2022-12-28 Helmholtz Zentrum München - Deutsches Forschungszentrum für Gesundheit und Umwelt (GmbH) Gene editing in the oocyte by cas9 nucleases
WO2014138379A1 (en) 2013-03-06 2014-09-12 The Johns Hopkins University The telomerator-a tool for chromosome engineering
WO2014143381A1 (en) 2013-03-09 2014-09-18 Agilent Technologies, Inc. Methods of in vivo engineering of large sequences using multiple crispr/cas selections of recombineering events
US10329574B2 (en) 2013-03-12 2019-06-25 E I Du Pont De Nemours And Company Methods for the identification of variant recognition sites for rare-cutting engineered double-strand-break-inducing agents and compositions and uses thereof
WO2014165177A1 (en) 2013-03-12 2014-10-09 Sangamo Biosciences, Inc. Methods and compositions for modification of hla
EP2970923B1 (en) 2013-03-13 2018-04-11 President and Fellows of Harvard College Mutants of cre recombinase
AU2014235794A1 (en) 2013-03-14 2015-10-22 Caribou Biosciences, Inc. Compositions and methods of nucleic acid-targeting nucleic acids
US20140283156A1 (en) 2013-03-14 2014-09-18 Cold Spring Harbor Laboratory Trans-splicing ribozymes and silent recombinases
WO2014153118A1 (en) 2013-03-14 2014-09-25 The Board Of Trustees Of The Leland Stanford Junior University Treatment of diseases and conditions associated with dysregulation of mammalian target of rapamycin complex 1 (mtorc1)
ES2692363T3 (en) 2013-03-14 2018-12-03 Translate Bio, Inc. Therapeutic compositions of mRNA and its use to treat diseases and disorders
US10760064B2 (en) 2013-03-15 2020-09-01 The General Hospital Corporation RNA-guided targeting of genetic and epigenomic regulatory proteins to specific genomic loci
WO2014144094A1 (en) 2013-03-15 2014-09-18 J.R. Simplot Company Tal-mediated transfer dna insertion
US20140273235A1 (en) 2013-03-15 2014-09-18 Regents Of The University Of Minnesota ENGINEERING PLANT GENOMES USING CRISPR/Cas SYSTEMS
US20140273230A1 (en) 2013-03-15 2014-09-18 Sigma-Aldrich Co., Llc Crispr-based genome modification and regulation
WO2015099850A1 (en) 2013-12-26 2015-07-02 The General Hospital Corporation Multiplex guide rnas
WO2014204578A1 (en) 2013-06-21 2014-12-24 The General Hospital Corporation Using rna-guided foki nucleases (rfns) to increase specificity for rna-guided genome editing
US11332719B2 (en) 2013-03-15 2022-05-17 The Broad Institute, Inc. Recombinant virus and preparations thereof
US20140349400A1 (en) * 2013-03-15 2014-11-27 Massachusetts Institute Of Technology Programmable Modification of DNA
IL290273B2 (en) 2013-03-15 2024-03-01 Cibus Us Llc Methods and compositions for increasing efficiency of increased efficiency of targeted gene modification using oligonucleotide-mediated gene repair
US9234213B2 (en) 2013-03-15 2016-01-12 System Biosciences, Llc Compositions and methods directed to CRISPR/Cas genomic engineering systems
US20160046959A1 (en) 2013-03-15 2016-02-18 Carlisle P. Landel Reproducible method for testis-mediated genetic modification (tgm) and sperm-mediated genetic modification (sgm)
US10119133B2 (en) 2013-03-15 2018-11-06 The General Hospital Corporation Using truncated guide RNAs (tru-gRNAs) to increase specificity for RNA-guided genome editing
CA2906970C (en) 2013-03-21 2021-05-18 Ospedale San Raffaele Srl Targeted disruption of t cell receptor genes using engineered zinc finger protein nucleases
WO2014161821A1 (en) 2013-04-02 2014-10-09 Bayer Cropscience Nv Targeted genome engineering in eukaryotes
EP3789487A1 (en) 2013-04-03 2021-03-10 Memorial Sloan Kettering Cancer Center Effective generation of tumor-targeted t-cells derived from pluripotent stem cells
EP2981617B1 (en) 2013-04-04 2023-07-05 President and Fellows of Harvard College Therapeutic uses of genome editing with crispr/cas systems
CA2908253C (en) 2013-04-04 2024-01-09 Trustees Of Dartmouth College Compositions and methods for in vivo excision of hiv-1 proviral dna
EP2981166B1 (en) 2013-04-05 2020-09-09 Dow AgroSciences LLC Methods and compositions for integration of an exogenous sequence within the genome of plants
US20150056629A1 (en) 2013-04-14 2015-02-26 Katriona Guthrie-Honea Compositions, systems, and methods for detecting a DNA sequence
DK2986729T3 (en) 2013-04-16 2018-10-29 Regeneron Pharma TARGETED MODIFICATION OF ROOT THROUGH
EP2986709A4 (en) 2013-04-16 2017-03-15 University Of Washington Through Its Center For Commercialization Activating an alternative pathway for homology-directed repair to stimulate targeted gene correction and genome engineering
WO2014172470A2 (en) 2013-04-16 2014-10-23 Whitehead Institute For Biomedical Research Methods of mutating, modifying or modulating nucleic acid in a cell or nonhuman mammal
US10053725B2 (en) 2013-04-23 2018-08-21 President And Fellows Of Harvard College In situ interaction determination
EP2796558A1 (en) 2013-04-23 2014-10-29 Rheinische Friedrich-Wilhelms-Universität Bonn Improved gene targeting and nucleic acid carrier molecule, in particular for use in plants
CN103224947B (en) 2013-04-28 2015-06-10 陕西师范大学 Gene targeting system
CA2910427C (en) 2013-05-10 2024-02-20 Sangamo Biosciences, Inc. Delivery methods and compositions for nuclease-mediated genome engineering
JP6599848B2 (en) 2013-05-10 2019-10-30 ホワイトヘッド・インスティテュート・フォー・バイオメディカル・リサーチ In vitro generation of red blood cells with sortable proteins
FI2997141T3 (en) 2013-05-13 2022-12-15 Cd19 specific chimeric antigen receptor and uses thereof
CA2912375C (en) 2013-05-13 2023-03-14 Cellectis Methods for engineering highly active t cell for immunotherapy
EP3730615A3 (en) 2013-05-15 2020-12-09 Sangamo Therapeutics, Inc. Methods and compositions for treatment of a genetic condition
WO2014186686A2 (en) 2013-05-17 2014-11-20 Two Blades Foundation Targeted mutagenesis and genome engineering in plants using rna-guided cas nucleases
US20140349405A1 (en) 2013-05-22 2014-11-27 Wisconsin Alumni Research Foundation Rna-directed dna cleavage and gene editing by cas9 enzyme from neisseria meningitidis
US11414695B2 (en) 2013-05-29 2022-08-16 Agilent Technologies, Inc. Nucleic acid enrichment using Cas9
CA2913830C (en) 2013-05-29 2021-06-29 Cellectis Methods for engineering t cells for immunotherapy by using rna-guided cas nuclease system
JP7065564B2 (en) 2013-05-29 2022-05-12 セレクティス Methods for Providing Accurate DNA Cleavage Using CAS9 Nickase Activity
US11685935B2 (en) 2013-05-29 2023-06-27 Cellectis Compact scaffold of Cas9 in the type II CRISPR system
WO2014194190A1 (en) 2013-05-30 2014-12-04 The Penn State Research Foundation Gene targeting and genetic modification of plants via rna-guided genome editing
US10000746B2 (en) 2013-05-31 2018-06-19 Cellectis LAGLIDADG homing endonuclease cleaving the T cell receptor alpha gene and uses thereof
US20140359796A1 (en) 2013-05-31 2014-12-04 Recombinetics, Inc. Genetically sterile animals
AU2014273089B2 (en) 2013-05-31 2018-02-22 Cellectis A LAGLIDADG homing endonuclease cleaving the C-C Chemokine Receptor Type-5 (CCR5) gene and uses thereof
EP3603679B1 (en) 2013-06-04 2022-08-10 President and Fellows of Harvard College Rna-guided transcriptional regulation
US9267135B2 (en) 2013-06-04 2016-02-23 President And Fellows Of Harvard College RNA-guided transcriptional regulation
CA2914519A1 (en) 2013-06-05 2014-12-11 Duke University Rna-guided gene editing and gene regulation
WO2014200659A1 (en) 2013-06-11 2014-12-18 Clontech Laboratories, Inc. Protein enriched microvesicles and methods of making and using the same
US20150315252A1 (en) 2013-06-11 2015-11-05 Clontech Laboratories, Inc. Protein enriched microvesicles and methods of making and using the same
WO2014201015A2 (en) 2013-06-11 2014-12-18 The Regents Of The University Of California Methods and compositions for target dna modification
WO2014199358A1 (en) 2013-06-14 2014-12-18 Cellectis Methods for non-transgenic genome editing in plants
EP3011035B1 (en) 2013-06-17 2020-05-13 The Broad Institute, Inc. Assay for quantitative evaluation of target site cleavage by one or more crispr-cas guide sequences
CA2915845A1 (en) 2013-06-17 2014-12-24 The Broad Institute, Inc. Delivery, engineering and optimization of systems, methods and compositions for targeting and modeling diseases and disorders of post mitotic cells
WO2014204725A1 (en) 2013-06-17 2014-12-24 The Broad Institute Inc. Optimized crispr-cas double nickase systems, methods and compositions for sequence manipulation
EP3011034B1 (en) 2013-06-17 2019-08-07 The Broad Institute, Inc. Delivery, use and therapeutic applications of the crispr-cas systems and compositions for targeting disorders and diseases using viral components
AU2014281028B2 (en) 2013-06-17 2020-09-10 Massachusetts Institute Of Technology Delivery and use of the CRISPR-Cas systems, vectors and compositions for hepatic targeting and therapy
EP3725885A1 (en) 2013-06-17 2020-10-21 The Broad Institute, Inc. Functional genomics using crispr-cas systems, compositions methods, screens and applications thereof
WO2014204724A1 (en) 2013-06-17 2014-12-24 The Broad Institute Inc. Delivery, engineering and optimization of tandem guide systems, methods and compositions for sequence manipulation
SG11201510297QA (en) 2013-06-19 2016-01-28 Sigma Aldrich Co Llc Targeted integration
CA2915779A1 (en) 2013-06-25 2014-12-31 Cellectis Modified diatoms for biofuel production
US20160369268A1 (en) 2013-07-01 2016-12-22 The Board Of Regents Of The University Of Texas System Transcription activator-like effector (tale) libraries and methods of synthesis and use
JP2016528890A (en) 2013-07-09 2016-09-23 プレジデント アンド フェローズ オブ ハーバード カレッジ Therapeutic use of genome editing using the CRISPR / Cas system
RU2764637C2 (en) 2013-07-09 2022-01-19 Президент Энд Фэллоуз Оф Харвард Коллидж Multiplex genomic engineering guided by rna
RU2016104064A (en) 2013-07-10 2017-08-15 Новартис Аг CELLS OF MYCELIUM MUSHROOMS WITH MULTIPLE INSUFFICIENCY OF PROTEASES AND METHODS OF USING THEM
SG10201913015XA (en) 2013-07-10 2020-02-27 Harvard College Orthogonal cas9 proteins for rna-guided gene regulation and editing
AU2014287250A1 (en) 2013-07-10 2016-02-18 EffStock, LLC Mrap2 knockouts
JP7019233B2 (en) 2013-07-11 2022-02-15 モデルナティエックス インコーポレイテッド Compositions and Methods of Use Containing Synthetic polynucleotides and Synthetic sgRNAs Encoding CRISPR-Related Proteins
CN106222197A (en) 2013-07-16 2016-12-14 中国科学院上海生命科学研究院 Plant Genome pointed decoration method
US9663782B2 (en) 2013-07-19 2017-05-30 Larix Bioscience Llc Methods and compositions for producing double allele knock outs
GB201313235D0 (en) 2013-07-24 2013-09-04 Univ Edinburgh Antiviral Compositions Methods and Animals
US10563225B2 (en) 2013-07-26 2020-02-18 President And Fellows Of Harvard College Genome engineering
CN103388006B (en) 2013-07-26 2015-10-28 华东师范大学 A kind of construction process of site-directed point mutation
US10421957B2 (en) 2013-07-29 2019-09-24 Agilent Technologies, Inc. DNA assembly using an RNA-programmable nickase
WO2015017866A1 (en) 2013-08-02 2015-02-05 Enevolv, Inc. Processes and host cells for genome, pathway, and biomolecular engineering
ITTO20130669A1 (en) 2013-08-05 2015-02-06 Consiglio Nazionale Ricerche ADENO-ASSOCIATED MOMCULAR-SPECIFIC VECTOR AND ITS EMPLOYMENT IN THE TREATMENT OF MUSCLE PATHOLOGIES
US20150044772A1 (en) 2013-08-09 2015-02-12 Sage Labs, Inc. Crispr/cas system-based novel fusion protein and its applications in genome editing
US20150044192A1 (en) 2013-08-09 2015-02-12 President And Fellows Of Harvard College Methods for identifying a target site of a cas9 nuclease
WO2015024017A2 (en) 2013-08-16 2015-02-19 President And Fellows Of Harvard College Rna polymerase, methods of purification and methods of use
WO2015021990A1 (en) 2013-08-16 2015-02-19 University Of Copenhagen Rna probing method and reagents
CN105705640B (en) 2013-08-20 2019-02-15 非营利性组织佛兰芒综合大学生物技术研究所 Inhibit lncRNA for treating melanoma
US9359599B2 (en) 2013-08-22 2016-06-07 President And Fellows Of Harvard College Engineered transcription activator-like effector (TALE) domains and uses thereof
AU2014308899B2 (en) 2013-08-22 2020-11-19 E. I. Du Pont De Nemours And Company Methods for producing genetic modifications in a plant genome without incorporating a selectable transgene marker, and compositions thereof
GB201315321D0 (en) 2013-08-28 2013-10-09 Koninklijke Nederlandse Akademie Van Wetenschappen Transduction Buffer
JP6588438B2 (en) 2013-08-28 2019-10-09 サンガモ セラピューティクス, インコーポレイテッド Composition for linking a DNA binding domain and a cleavage domain
SG10201801658XA (en) 2013-08-29 2018-03-28 Univ Temple Methods and compositions for rna-guided treatment of hiv infection
EP3041345B1 (en) 2013-09-04 2024-05-01 KWS SAAT SE & Co. KGaA Plant resistant to helminthosporium turcicum
SG10201801782PA (en) 2013-09-04 2018-04-27 Csir Site-specific nuclease single-cell assay targeting gene regulatory elements to silence gene expression
CA2922823C (en) 2013-09-04 2023-01-17 Dow Agrosciences Llc Rapid targeting analysis in crops for determining donor insertion
US10760065B2 (en) 2013-09-05 2020-09-01 Massachusetts Institute Of Technology Tuning microbial populations with programmable nucleases
US9340799B2 (en) 2013-09-06 2016-05-17 President And Fellows Of Harvard College MRNA-sensing switchable gRNAs
US9388430B2 (en) 2013-09-06 2016-07-12 President And Fellows Of Harvard College Cas9-recombinase fusion proteins and uses thereof
US9526784B2 (en) 2013-09-06 2016-12-27 President And Fellows Of Harvard College Delivery system for functional nucleases
WO2015040075A1 (en) 2013-09-18 2015-03-26 Genome Research Limited Genomic screening methods using rna-guided endonucleases
DE202014010413U1 (en) 2013-09-18 2015-12-08 Kymab Limited Cells and organisms
WO2015042393A2 (en) 2013-09-20 2015-03-26 President And Fellows Of Harvard College Evolved sortases and uses thereof
PT3049116T (en) 2013-09-23 2019-04-03 Rensselaer Polytech Inst Nanoparticle-mediated gene delivery, genomic editing and ligand-targeted modification in various cell populations
US20160237455A1 (en) 2013-09-27 2016-08-18 Editas Medicine, Inc. Crispr-related methods and compositions
WO2015048690A1 (en) 2013-09-27 2015-04-02 The Regents Of The University Of California Optimized small guide rnas and methods of use
US20160237451A1 (en) 2013-09-30 2016-08-18 Regents Of The University Of Minnesota Conferring resistance to geminiviruses in plants using crispr/cas systems
CN105593375A (en) 2013-09-30 2016-05-18 加利福尼亚大学董事会 Identification of cxcr8, a novel chemokine receptor
US20160208214A1 (en) 2013-10-02 2016-07-21 Northeastern University Methods and compositions for generation of developmentally-incompetent eggs in recipients of nuclear genetic transfer
JP5774657B2 (en) 2013-10-04 2015-09-09 国立大学法人京都大学 Method for genetic modification of mammals using electroporation
CA2932581A1 (en) 2013-10-07 2015-04-16 Northeastern University Methods and compositions for ex vivo generation of developmentally competent eggs from germ line cells using autologous cell systems
US20150098954A1 (en) 2013-10-08 2015-04-09 Elwha Llc Compositions and Methods Related to CRISPR Targeting
DE102013111099B4 (en) 2013-10-08 2023-11-30 Eberhard Karls Universität Tübingen Medizinische Fakultät Permanent gene correction using nucleotide-modified messenger RNA
JP2015076485A (en) 2013-10-08 2015-04-20 株式会社ジャパンディスプレイ Display device
WO2015052231A2 (en) 2013-10-08 2015-04-16 Technical University Of Denmark Multiplex editing system
EP3055423B1 (en) 2013-10-11 2019-12-25 Cellectis Method for detecting nucleic acid sequences of interest using talen protein
WO2015057671A1 (en) 2013-10-14 2015-04-23 The Broad Institute, Inc. Artificial transcription factors comprising a sliding domain and uses thereof
JP6734774B2 (en) 2013-10-15 2020-08-05 ザ スクリプス リサーチ インスティテュート Peptide chimeric antigen receptor T cell switch and uses thereof
US20150238631A1 (en) 2013-10-15 2015-08-27 The California Institute For Biomedical Research Chimeric antigen receptor t cell switches and uses thereof
CA2926078C (en) 2013-10-17 2021-11-16 Sangamo Biosciences, Inc. Delivery methods and compositions for nuclease-mediated genome engineering in hematopoietic stem cells
CN105899665B (en) 2013-10-17 2019-10-22 桑格摩生物科学股份有限公司 The delivering method and composition being transformed for nuclease-mediated genome project
WO2015058047A2 (en) 2013-10-18 2015-04-23 President And Fellows Of Harvard College Fluorination of organic compounds
CA2927965A1 (en) 2013-10-25 2015-04-30 Cellectis Design of rare-cutting endonucleases for efficient and specific targeting dna sequences comprising highly repetitive motives
WO2015065964A1 (en) 2013-10-28 2015-05-07 The Broad Institute Inc. Functional genomics using crispr-cas systems, compositions, methods, screens and applications thereof
US10584358B2 (en) 2013-10-30 2020-03-10 North Carolina State University Compositions and methods related to a type-II CRISPR-Cas system in Lactobacillus buchneri
CA2926534A1 (en) 2013-11-04 2015-05-07 Dow Agrosciences Llc A universal donor system for gene targeting
EP3066202B1 (en) 2013-11-04 2021-03-03 Dow AgroSciences LLC Optimal soybean loci
TWI721478B (en) 2013-11-04 2021-03-11 美商陶氏農業科學公司 Optimal maize loci
TWI659103B (en) 2013-11-04 2019-05-11 陶氏農業科學公司 Optimal soybean loci
EP3065540B1 (en) 2013-11-04 2021-12-15 Corteva Agriscience LLC Optimal maize loci
WO2015069682A2 (en) 2013-11-05 2015-05-14 President And Fellows Of Harvard College Precise microbiota engineering at the cellular level
WO2015070083A1 (en) 2013-11-07 2015-05-14 Editas Medicine,Inc. CRISPR-RELATED METHODS AND COMPOSITIONS WITH GOVERNING gRNAS
WO2015077058A2 (en) 2013-11-08 2015-05-28 The Broad Institute, Inc. Compositions and methods for selecting a treatment for b-cell neoplasias
WO2015070193A1 (en) 2013-11-11 2015-05-14 Liu Oliver Compositions and methods for targeted gene disruption in prokaryotes
US10369201B2 (en) 2013-11-11 2019-08-06 Sangamo Therapeutics, Inc. Methods and compositions for treating Huntington's disease
SI3068881T1 (en) 2013-11-13 2019-05-31 Children's Medical Center Corporation Nuclease-mediated regulation of gene expression
CA2930590C (en) 2013-11-15 2021-02-16 The United States Of America, As Represented By The Secretary, Department Of Health And Human Services Engineering neural stem cells using homologous recombination
CN106103703A (en) 2013-11-18 2016-11-09 耶鲁大学 Use compositions and the method for transposon
JP2016537028A (en) 2013-11-18 2016-12-01 クリスパー セラピューティクス アーゲー CRISPR-CAS System Materials and Methods
US10787684B2 (en) 2013-11-19 2020-09-29 President And Fellows Of Harvard College Large gene excision and insertion
US9074199B1 (en) 2013-11-19 2015-07-07 President And Fellows Of Harvard College Mutant Cas9 proteins
WO2015075056A1 (en) 2013-11-19 2015-05-28 Thermo Fisher Scientific Baltics Uab Programmable enzymes for isolation of specific dna fragments
WO2015075154A2 (en) 2013-11-20 2015-05-28 Fondazione Telethon Artificial dna-binding proteins and uses thereof
CN105765061A (en) 2013-11-22 2016-07-13 塞勒克提斯公司 Method of engineering chemotherapy drug resistant T-cells for immunotherapy
EP3071686B1 (en) 2013-11-22 2020-07-22 Cellectis SA Method for generating batches of allogeneic t-cells with averaged potency
CA2930973A1 (en) 2013-11-22 2015-05-28 Pal SAERTROM C/ebp alpha short activating rna compositions and methods of use
CN103642836A (en) 2013-11-26 2014-03-19 苏州同善生物科技有限公司 Method for establishing fragile X-syndrome non-human primate model on basis of CRISPR gene knockout technology
CN103614415A (en) 2013-11-27 2014-03-05 苏州同善生物科技有限公司 Method for establishing obese rat animal model based on CRISPR (clustered regularly interspaced short palindromic repeat) gene knockout technology
WO2015079056A1 (en) 2013-11-28 2015-06-04 Haplogen Genomics Gmbh Somatic human cell line mutations
JP6535684B2 (en) 2013-12-09 2019-06-26 サンガモ セラピューティクス, インコーポレイテッド Methods and compositions for genome manipulation
RU2685914C1 (en) 2013-12-11 2019-04-23 Регенерон Фармасьютикалс, Инк. Methods and compositions for genome targeted modification
CA2932472A1 (en) 2013-12-12 2015-06-18 Massachusetts Institute Of Technology Compositions and methods of use of crispr-cas systems in nucleotide repeat disorders
WO2015089427A1 (en) 2013-12-12 2015-06-18 The Broad Institute Inc. Crispr-cas systems and methods for altering expression of gene products, structural information and inducible modular cas enzymes
CN111206032A (en) 2013-12-12 2020-05-29 布罗德研究所有限公司 Delivery, use and therapeutic applications of CRISPR-CAS systems and compositions for genome editing
US9840699B2 (en) 2013-12-12 2017-12-12 President And Fellows Of Harvard College Methods for nucleic acid editing
EP3080271B1 (en) 2013-12-12 2020-02-12 The Broad Institute, Inc. Systems, methods and compositions for sequence manipulation with optimized functional crispr-cas systems
WO2015089473A1 (en) 2013-12-12 2015-06-18 The Broad Institute Inc. Engineering of systems, methods and optimized guide compositions with new architectures for sequence manipulation
WO2015089465A1 (en) 2013-12-12 2015-06-18 The Broad Institute Inc. Delivery, use and therapeutic applications of the crispr-cas systems and compositions for hbv and viral diseases and disorders
CA2932475A1 (en) 2013-12-12 2015-06-18 The Broad Institute, Inc. Delivery, use and therapeutic applications of the crispr-cas systems and compositions for targeting disorders and diseases using particle delivery components
WO2015089364A1 (en) 2013-12-12 2015-06-18 The Broad Institute Inc. Crystal structure of a crispr-cas system, and uses thereof
EP3835419A1 (en) 2013-12-12 2021-06-16 The Regents of The University of California Methods and compositions for modifying a single stranded target nucleic acid
CA2933134A1 (en) 2013-12-13 2015-06-18 Cellectis Cas9 nuclease platform for microalgae genome engineering
US20160312233A1 (en) 2013-12-13 2016-10-27 Cellectis New method of selection of algal-transformed cells using nuclease
US20150191744A1 (en) 2013-12-17 2015-07-09 University Of Massachusetts Cas9 effector-mediated regulation of transcription, differentiation and gene editing/labeling
AU2014368982B2 (en) 2013-12-19 2021-03-25 Amyris, Inc. Methods for genomic integration
ES2818625T3 (en) 2013-12-30 2021-04-13 Univ Pittsburgh Commonwealth Sys Higher Education Fusion genes associated with progressive prostate cancer
CN103668472B (en) 2013-12-31 2014-12-24 北京大学 Method for constructing eukaryon gene knockout library by using CRISPR (Clustered Regularly Interspaced Short Palindromic Repeats)/Cas9 system
US9963689B2 (en) 2013-12-31 2018-05-08 The Regents Of The University Of California Cas9 crystals and methods of use thereof
SG10201805815YA (en) 2014-01-08 2018-08-30 Harvard College Rna-guided gene drives
CN106459996A (en) 2014-01-14 2017-02-22 Lam疗法公司 Mutagenesis methods
US10774338B2 (en) 2014-01-16 2020-09-15 The Regents Of The University Of California Generation of heritable chimeric plant traits
US10179911B2 (en) 2014-01-20 2019-01-15 President And Fellows Of Harvard College Negative selection and stringency modulation in continuous evolution systems
GB201400962D0 (en) 2014-01-21 2014-03-05 Kloehn Peter C Screening for target-specific affinity binders using RNA interference
WO2015109752A1 (en) 2014-01-21 2015-07-30 The Institute Of Genetics And Developmental Biology Chinese Academy Of Sciences Modified plants
US9663770B2 (en) * 2014-01-22 2017-05-30 Life Technologies Corporation Reverse transcriptases for use in high temperature nucleic acid synthesis
CA2936976A1 (en) 2014-01-24 2015-07-30 Children's Medical Center Corporation High-throughput mouse model for optimizing antibody affinities
EP3097212A4 (en) 2014-01-24 2017-10-04 North Carolina State University Methods and compositions for sequences guiding cas9 targeting
WO2015113063A1 (en) 2014-01-27 2015-07-30 Georgia Tech Research Corporation Methods and systems for identifying crispr/cas off-target sites
CN104805078A (en) 2014-01-28 2015-07-29 北京大学 Design, synthesis and use of RNA molecule for high-efficiency genome editing
US9850525B2 (en) 2014-01-29 2017-12-26 Agilent Technologies, Inc. CAS9-based isothermal method of detection of specific DNA sequence
US10233456B2 (en) 2014-01-30 2019-03-19 The Board Of Trustees Of The University Of Arkansas Method, vectors, cells, seeds and kits for stacking genes into a single genomic site
US20150291969A1 (en) 2014-01-30 2015-10-15 Chromatin, Inc. Compositions for reduced lignin content in sorghum and improving cell wall digestibility, and methods of making the same
GB201401707D0 (en) 2014-01-31 2014-03-19 Sec Dep For Health The Adeno-associated viral vectors
MX2016009771A (en) 2014-01-31 2016-11-14 Factor Bioscience Inc Methods and products for nucleic acid production and delivery.
WO2015115903A1 (en) 2014-02-03 2015-08-06 Academisch Ziekenhuis Leiden H.O.D.N. Lumc Site-specific dna break-induced genome editing using engineered nucleases
PL3102673T3 (en) 2014-02-03 2020-11-02 Sangamo Therapeutics, Inc. Methods and compositions for treatment of a beta thalessemia
DK3102722T3 (en) 2014-02-04 2020-11-16 Jumpcode Genomics Inc THROUGH FRACTIONING
USRE48856E1 (en) 2014-02-07 2021-12-21 Vib Vzw Inhibition of NEAT1 for treatment of solid tumors
EP3690044B1 (en) 2014-02-11 2024-01-10 The Regents of the University of Colorado, a body corporate Crispr enabled multiplexed genome engineering
CA2939621C (en) 2014-02-13 2019-10-15 Takara Bio Usa, Inc. Methods of depleting a target molecule from an initial collection of nucleic acids, and compositions and kits for practicing the same
EP3105317B1 (en) 2014-02-14 2018-09-19 Cellectis Cells for immunotherapy engineered for targeting antigen present both on immune cells and pathological cells
SG11201606819QA (en) 2014-02-18 2016-09-29 Univ Duke Compositions for the inactivation of virus replication and methods of making and using the same
AU2015220765A1 (en) 2014-02-20 2016-09-01 Dsm Ip Assets B.V. Phage insensitive Streptococcus thermophilus
JP6665102B2 (en) 2014-02-21 2020-03-13 セレクティスCellectis Methods for inhibiting regulatory T cells in situ
CA2939942A1 (en) 2014-02-24 2015-08-27 Sangamo Biosciences, Inc. Methods and compositions for nuclease-mediated targeted integration
WO2015127428A1 (en) 2014-02-24 2015-08-27 Massachusetts Institute Of Technology Methods for in vivo genome editing
JP6521669B2 (en) 2014-02-25 2019-05-29 国立研究開発法人農業・食品産業技術総合研究機構 Plant cell in which mutation is introduced into target DNA, and method for producing the same
ES2898460T3 (en) 2014-02-27 2022-03-07 Monsanto Technology Llc Compositions and methods for site-directed genomic modification
CN103820441B (en) 2014-03-04 2017-05-17 黄行许 Method for human CTLA4 gene specific knockout through CRISPR-Cas9 (clustered regularly interspaced short palindromic repeat) and sgRNA(single guide RNA)for specially targeting CTLA4 gene
CN103820454B (en) 2014-03-04 2016-03-30 上海金卫生物技术有限公司 The method of CRISPR-Cas9 specific knockdown people PD1 gene and the sgRNA for selectively targeted PD1 gene
CN111471675A (en) 2014-03-05 2020-07-31 国立大学法人神户大学 Method for modifying genome sequence of nucleic acid base for specifically converting target DNA sequence, and molecular complex used therefor
EP3114227B1 (en) 2014-03-05 2021-07-21 Editas Medicine, Inc. Crispr/cas-related methods and compositions for treating usher syndrome and retinitis pigmentosa
WO2015138510A1 (en) 2014-03-10 2015-09-17 Editas Medicine., Inc. Crispr/cas-related methods and compositions for treating leber's congenital amaurosis 10 (lca10)
WO2015136001A1 (en) 2014-03-11 2015-09-17 Cellectis Method for generating t-cells compatible for allogenic transplantation
EP3116533B1 (en) 2014-03-12 2020-08-12 Precision Biosciences, Inc. Dystrophin gene exon deletion using engineered nucleases
WO2015138870A2 (en) 2014-03-13 2015-09-17 The Trustees Of The University Of Pennsylvania Compositions and methods for targeted epigenetic modification
AU2015229095B2 (en) 2014-03-14 2022-01-27 Cibus Europe B.V. Methods and compositions for increasing efficiency of targeted gene modification using oligonucleotide-mediated gene repair
WO2015138855A1 (en) 2014-03-14 2015-09-17 The Regents Of The University Of California Vectors and methods for fungal genome engineering by crispr-cas9
WO2015143046A2 (en) 2014-03-18 2015-09-24 Sangamo Biosciences, Inc. Methods and compositions for regulation of zinc finger protein expression
AU2015234204A1 (en) 2014-03-20 2016-10-06 Universite Laval CRISPR-based methods and products for increasing frataxin levels and uses thereof
CN106460009A (en) 2014-03-21 2017-02-22 小利兰·斯坦福大学托管委员会 Genome editing without nucleases
CA2942347C (en) 2014-03-24 2023-03-14 IMMCO Diagnostics, Inc. Improved anti-nuclear antibody detection and diagnostics for systemic and non-systemic autoimmune disorders
EP3450553B1 (en) 2014-03-24 2019-12-25 Translate Bio, Inc. Mrna therapy for treatment of ocular diseases
EP3129484A1 (en) 2014-03-25 2017-02-15 Editas Medicine, Inc. Crispr/cas-related methods and compositions for treating hiv infection and aids
WO2015148680A1 (en) 2014-03-25 2015-10-01 Ginkgo Bioworks, Inc. Methods and genetic systems for cell engineering
CN106459951A (en) 2014-03-26 2017-02-22 马里兰大学派克分院 Targeted genome editing in zygotes of domestic large animals
US9609415B2 (en) 2014-03-26 2017-03-28 Bose Corporation Headphones with cable management
WO2015148863A2 (en) 2014-03-26 2015-10-01 Editas Medicine, Inc. Crispr/cas-related methods and compositions for treating sickle cell disease
WO2015148860A1 (en) 2014-03-26 2015-10-01 Editas Medicine, Inc. Crispr/cas-related methods and compositions for treating beta-thalassemia
AU2015237746B2 (en) 2014-03-28 2020-01-30 Aposense Ltd. Compounds and methods for trans-membrane delivery of molecules
US9993563B2 (en) 2014-03-28 2018-06-12 Aposense Ltd. Compounds and methods for trans-membrane delivery of molecules
EP3498845B1 (en) 2014-04-01 2022-06-22 Editas Medicine, Inc. Crispr/cas-related methods and compositions for treating herpes simplex virus type 1 (hsv-1)
WO2015153791A1 (en) 2014-04-01 2015-10-08 Editas Medicine, Inc. Crispr/cas-related methods and compositions for treating herpes simplex virus type 2 (hsv-2)
WO2015153760A2 (en) 2014-04-01 2015-10-08 Sangamo Biosciences, Inc. Methods and compositions for prevention or treatment of a nervous system disorder
US10507232B2 (en) 2014-04-02 2019-12-17 University Of Florida Research Foundation, Incorporated Materials and methods for the treatment of latent viral infection
WO2015153780A1 (en) 2014-04-02 2015-10-08 Editas Medicine, Inc. Crispr/cas-related methods and compositions for treating primary open angle glaucoma
WO2015153940A1 (en) 2014-04-03 2015-10-08 Massachusetts Institute Of Technology Methods and compositions for the production of guide rna
CN103911376B (en) 2014-04-03 2017-02-15 黄行许 CRISPR-Cas9 targeted knockout hepatitis b virus cccDNA and specific sgRNA thereof
US11439712B2 (en) 2014-04-08 2022-09-13 North Carolina State University Methods and compositions for RNA-directed repression of transcription using CRISPR-associated genes
EP3556858A3 (en) 2014-04-09 2020-01-22 Editas Medicine, Inc. Crispr/cas-related methods and compositions for treating cystic fibrosis
US10253311B2 (en) 2014-04-10 2019-04-09 The Regents Of The University Of California Methods and compositions for using argonaute to modify a single stranded target nucleic acid
JP2017513472A (en) 2014-04-11 2017-06-01 セレクティスCellectis Method for generating immune cells resistant to arginine and / or tryptophan depleted microenvironment
ES2962509T3 (en) 2014-04-14 2024-03-19 Maxcyte Inc Methods and compositions to modify genomic DNA
CN103923911B (en) 2014-04-14 2016-06-08 上海金卫生物技术有限公司 The method of CRISPR-Cas9 specific knockdown CCR5 gene and the sgRNA for selectively targeted CCR5 gene
US20170037414A1 (en) 2014-04-14 2017-02-09 Nemesis Bioscience Ltd Therapeutic
GB201406970D0 (en) 2014-04-17 2014-06-04 Green Biologics Ltd Targeted mutations
GB201406968D0 (en) 2014-04-17 2014-06-04 Green Biologics Ltd Deletion mutants
EP3800248A3 (en) 2014-04-18 2021-08-04 Editas Medicine, Inc. Crispr-cas-related methods, compositions and components for cancer immunotherapy
CN105039399A (en) 2014-04-23 2015-11-11 复旦大学 Pluripotent stem cell-hereditary cardiomyopathy cardiac muscle cell and preparation method thereof
WO2015164748A1 (en) 2014-04-24 2015-10-29 Sangamo Biosciences, Inc. Engineered transcription activator like effector (tale) proteins
KR20160145186A (en) 2014-04-24 2016-12-19 보드 오브 리전츠, 더 유니버시티 오브 텍사스 시스템 Application of induced pluripotent stem cells to generate adoptive cell therapy products
KR101823661B1 (en) 2014-04-24 2018-01-30 기초과학연구원 A method of selecting a nuclease target sequence for gene knockout based on microhomology
US20150307889A1 (en) 2014-04-28 2015-10-29 Dow Agrosciences Llc Haploid maize transformation
CN111647627A (en) 2014-04-28 2020-09-11 重组股份有限公司 Multiple gene editing
WO2015168158A1 (en) 2014-04-28 2015-11-05 Fredy Altpeter Targeted genome editing to modify lignin biosynthesis and cell wall composition
WO2015167766A1 (en) 2014-04-29 2015-11-05 Seattle Children's Hospital (dba Seattle Children's Research Institute) Ccr5 disruption of cells expressing anti-hiv chimeric antigen receptor (car) derived from broadly neutralizing antibodies
CN104178506B (en) 2014-04-30 2017-03-01 清华大学 TALER albumen is by sterically hindered performance transcripting suppressioning action and its application
WO2015165276A1 (en) 2014-04-30 2015-11-05 清华大学 Reagent kit using tale transcriptional repressor for modular construction of synthetic gene line in mammalian cell
WO2015168404A1 (en) 2014-04-30 2015-11-05 Massachusetts Institute Of Technology Toehold-gated guide rna for programmable cas9 circuitry with rna input
US10563207B2 (en) 2014-04-30 2020-02-18 Tsinghua University Modular construction of synthetic gene circuits in mammalian cells using TALE transcriptional repressors
WO2015168547A2 (en) 2014-05-01 2015-11-05 Andre Lieber In vivo gene engineering with adenoviral vectors
GB201407852D0 (en) 2014-05-02 2014-06-18 Iontas Ltd Preparation of libraries od protein variants expressed in eukaryotic cells and use for selecting binding molecules
WO2015171603A1 (en) 2014-05-06 2015-11-12 Two Blades Foundation Methods for producing plants with enhanced resistance to oomycete pathogens
WO2015171932A1 (en) 2014-05-08 2015-11-12 Sangamo Biosciences, Inc. Methods and compositions for treating huntington's disease
EP3140403A4 (en) 2014-05-09 2017-12-20 Université Laval Prevention and treatment of alzheimer's disease by genome editing using the crispr/cas system
US20170266197A1 (en) 2014-05-09 2017-09-21 Indiana University Research And Technology Corporation Methods and compositions for treating hepatitis b virus infections
US10487336B2 (en) 2014-05-09 2019-11-26 The Regents Of The University Of California Methods for selecting plants after genome editing
WO2015175642A2 (en) 2014-05-13 2015-11-19 Sangamo Biosciences, Inc. Methods and compositions for prevention or treatment of a disease
CN104004782B (en) 2014-05-16 2016-06-08 安徽省农业科学院水稻研究所 A kind of breeding method extending paddy rice breeding time
CN104017821B (en) 2014-05-16 2016-07-06 安徽省农业科学院水稻研究所 Directed editor's grain husk shell color determines the gene OsCHI method formulating brown shell rice material
WO2015173436A1 (en) 2014-05-16 2015-11-19 Vrije Universiteit Brussel Genetic correction of myotonic dystrophy type 1
CN103981212B (en) 2014-05-16 2016-06-01 安徽省农业科学院水稻研究所 The clever shell color of the rice varieties of yellow grain husk shell is changed into the breeding method of brown
CN103981211B (en) 2014-05-16 2016-07-06 安徽省农业科学院水稻研究所 A kind of breeding method formulating cleistogamous rice material
WO2015179540A1 (en) 2014-05-20 2015-11-26 Regents Of The University Of Minnesota Method for editing a genetic sequence
CA2852593A1 (en) 2014-05-23 2015-11-23 Universite Laval Methods for producing dopaminergic neurons and uses thereof
US10653123B2 (en) 2014-05-27 2020-05-19 Dana-Farber Cancer Institute, Inc. Methods and compositions for perturbing gene expression in hematopoietic stem cell lineages in vivo
WO2015183025A1 (en) 2014-05-28 2015-12-03 주식회사 툴젠 Method for sensitive detection of target dna using target-specific nuclease
AU2015266770A1 (en) 2014-05-30 2016-12-08 The Board Of Trustees Of The Leland Stanford Junior University Compositions and methods of delivering treatments for latent viral infections
US9970001B2 (en) 2014-06-05 2018-05-15 Sangamo Therapeutics, Inc. Methods and compositions for nuclease design
WO2015188191A1 (en) 2014-06-06 2015-12-10 Wong Wilson W Dna recombinase circuits for logical control of gene expression
CA2950178A1 (en) 2014-06-06 2015-12-10 The California Institute For Biomedical Research Methods of constructing amino terminal immunoglobulin fusion proteins and compositions thereof
WO2015188135A1 (en) 2014-06-06 2015-12-10 The California Institute For Biomedical Research Constant region antibody fusion proteins and compositions thereof
KR102374379B1 (en) 2014-06-06 2022-03-17 리제너론 파마슈티칼스 인코포레이티드 Methods and compositions for modifying a targeted locus
WO2015188094A1 (en) 2014-06-06 2015-12-10 President And Fellows Of Harvard College Methods for targeted modification of genomic dna
CN104004778B (en) 2014-06-06 2016-03-02 重庆高圣生物医药有限责任公司 Targeting knockout carrier containing CRISPR/Cas9 system and adenovirus thereof and application
WO2015191693A2 (en) 2014-06-10 2015-12-17 Massachusetts Institute Of Technology Method for gene editing
US11274302B2 (en) 2016-08-17 2022-03-15 Diacarta Ltd Specific synthetic chimeric Xenonucleic acid guide RNA; s(XNA-gRNA) for enhancing CRISPR mediated genome editing efficiency
CA2951882A1 (en) 2014-06-11 2015-12-17 Tom E. HOWARD Factor viii mutation repair and tolerance induction and related cdnas, compositions, methods and systems
ES2937642T3 (en) 2014-06-11 2023-03-30 Univ Duke Compositions and methods for rapid and dynamic flow control using synthetic metabolic valves
US11584936B2 (en) 2014-06-12 2023-02-21 King Abdullah University Of Science And Technology Targeted viral-mediated plant genome editing using CRISPR /Cas9
WO2015191911A2 (en) 2014-06-12 2015-12-17 Clontech Laboratories, Inc. Protein enriched microvesicles and methods of making and using the same
WO2015195547A1 (en) 2014-06-16 2015-12-23 University Of Washington Methods for controlling stem cell potential and for gene editing in stem cells
JP6930834B2 (en) 2014-06-16 2021-09-01 ザ・ジョンズ・ホプキンス・ユニバーシティー Compositions and Methods for Expression of CRISPR Guide RNA Using the H1 Promoter
AU2015277180A1 (en) 2014-06-17 2017-01-12 Poseida Therapeutics, Inc. A method for directing proteins to specific loci in the genome and uses thereof
CA2952906A1 (en) 2014-06-20 2015-12-23 Cellectis Potatoes with reduced granule-bound starch synthase
EP3155099B1 (en) 2014-06-23 2018-03-21 Regeneron Pharmaceuticals, Inc. Nuclease-mediated dna assembly
KR102598819B1 (en) 2014-06-23 2023-11-03 더 제너럴 하스피탈 코포레이션 Genomewide unbiased identification of dsbs evaluated by sequencing (guide-seq)
WO2015200555A2 (en) 2014-06-25 2015-12-30 Caribou Biosciences, Inc. Rna modification to engineer cas9 activity
ES2901074T3 (en) 2014-06-26 2022-03-21 Regeneron Pharma Methods and compositions for targeted genetic modifications and methods of use
GB201411344D0 (en) 2014-06-26 2014-08-13 Univ Leicester Cloning
CN106662033B (en) 2014-06-30 2019-01-18 日产自动车株式会社 Internal combustion engine
EP3162328B1 (en) 2014-06-30 2022-01-19 Kao Corporation Adhesive sheet for cooling
US20180187172A1 (en) 2014-07-01 2018-07-05 Board Of Regents, The University Of Texas System Regulated gene expression from viral vectors
JP6782171B2 (en) 2014-07-02 2020-11-11 シャイアー ヒューマン ジェネティック セラピーズ インコーポレイテッド Encapsulation of messenger RNA
WO2016007604A1 (en) 2014-07-09 2016-01-14 Gen9, Inc. Compositions and methods for site-directed dna nicking and cleaving
EP2966170A1 (en) 2014-07-10 2016-01-13 Heinrich-Pette-Institut Leibniz-Institut für experimentelle Virologie-Stiftung bürgerlichen Rechts - HBV inactivation
MX2017000422A (en) 2014-07-11 2017-05-01 Du Pont Compositions and methods for producing plants resistant to glyphosate herbicide.
BR112017000621B1 (en) 2014-07-11 2024-03-12 Pioneer Hi-Bred International, Inc Method for improving an agronomic trait of a corn or soybean plant
CN104109687A (en) 2014-07-14 2014-10-22 四川大学 Construction and application of Zymomonas mobilis CRISPR (clustered regularly interspaced short palindromic repeats)-Cas (CRISPR-association proteins)9 system
WO2016011080A2 (en) 2014-07-14 2016-01-21 The Regents Of The University Of California Crispr/cas transcriptional modulation
US10738278B2 (en) 2014-07-15 2020-08-11 Juno Therapeutics, Inc. Engineered cells for adoptive cell therapy
US9944933B2 (en) 2014-07-17 2018-04-17 Georgia Tech Research Corporation Aptamer-guided gene targeting
EP3193944B1 (en) 2014-07-17 2021-04-07 University of Pittsburgh - Of the Commonwealth System of Higher Education Methods of treating cells containing fusion genes
US20160053272A1 (en) 2014-07-18 2016-02-25 Whitehead Institute For Biomedical Research Methods Of Modifying A Sequence Using CRISPR
US20160053304A1 (en) 2014-07-18 2016-02-25 Whitehead Institute For Biomedical Research Methods Of Depleting Target Sequences Using CRISPR
US10975406B2 (en) 2014-07-18 2021-04-13 Massachusetts Institute Of Technology Directed endonucleases for repeatable nucleic acid cleavage
EP3172237A2 (en) 2014-07-21 2017-05-31 Novartis AG Treatment of cancer using humanized anti-bcma chimeric antigen receptor
CA3176503A1 (en) 2014-07-21 2016-01-28 Illumina, Inc Polynucleotide enrichment using crispr-cas systems
JP6653420B2 (en) 2014-07-22 2020-02-26 パナソニックIpマネジメント株式会社 Composite magnetic material, coil component using the same, and method of manufacturing composite magnetic material
KR102234266B1 (en) 2014-07-23 2021-04-02 삼성전자주식회사 Semiconductor device and method for fabricating the same
DK3172315T3 (en) 2014-07-24 2020-12-21 Dsm Ip Assets Bv PROFESSIONALLY RESISTANT LACTIC ACID BACTERIA
US20170211048A1 (en) 2014-07-25 2017-07-27 Boehringer Ingelheim International Gmbh Enhanced reprogramming to ips cells
US9757420B2 (en) 2014-07-25 2017-09-12 Sangamo Therapeutics, Inc. Gene editing for HIV gene therapy
WO2016014794A1 (en) 2014-07-25 2016-01-28 Sangamo Biosciences, Inc. Methods and compositions for modulating nuclease-mediated genome engineering in hematopoietic stem cells
EP3194600B1 (en) 2014-07-26 2019-08-28 Consiglio Nazionale Delle Ricerche Compositions and methods for treatment of muscular dystrophy
EP3177718B1 (en) 2014-07-30 2022-03-16 President and Fellows of Harvard College Cas9 proteins including ligand-dependent inteins
WO2016019144A2 (en) 2014-07-30 2016-02-04 Sangamo Biosciences, Inc. Gene correction of scid-related genes in hematopoietic stem and progenitor cells
FR3024464A1 (en) 2014-07-30 2016-02-05 Centre Nat Rech Scient TARGETING NON-VIRAL INTEGRATIVE VECTORS IN NUCLEOLAR DNA SEQUENCES IN EUKARYOTES
US9850521B2 (en) 2014-08-01 2017-12-26 Agilent Technologies, Inc. In vitro assay buffer for Cas9
EP2982758A1 (en) 2014-08-04 2016-02-10 Centre Hospitalier Universitaire Vaudois (CHUV) Genome editing for the treatment of huntington's disease
US20160076093A1 (en) 2014-08-04 2016-03-17 University Of Washington Multiplex homology-directed repair
CN113789317B (en) 2014-08-06 2024-02-23 基因工具股份有限公司 Gene editing using campylobacter jejuni CRISPR/CAS system-derived RNA-guided engineered nucleases
JP6598860B2 (en) 2014-08-06 2019-10-30 カレッジ オブ メディシン ポチョン チャ ユニバーシティ インダストリー−アカデミック コーオペレイション ファウンデーション Immunocompatible cells produced by nuclease-mediated editing of genes encoding HLA
WO2016022866A1 (en) 2014-08-07 2016-02-11 Agilent Technologies, Inc. Cis-blocked guide rna
WO2016022931A1 (en) 2014-08-07 2016-02-11 The Rockefeller University Compositions and methods for transcription-based crispr-cas dna editing
CA2959130A1 (en) 2014-08-11 2016-02-18 The Board Of Regents Of The University Of Texas System Prevention of muscular dystrophy by crispr/cas9-mediated gene editing
US10513711B2 (en) 2014-08-13 2019-12-24 Dupont Us Holding, Llc Genetic targeting in non-conventional yeast using an RNA-guided endonuclease
CN104178461B (en) 2014-08-14 2017-02-01 北京蛋白质组研究中心 CAS9-carrying recombinant adenovirus and application thereof
US11071289B2 (en) 2014-08-14 2021-07-27 Biocytogen Boston Corp DNA knock-in system
US9879270B2 (en) 2014-08-15 2018-01-30 Wisconsin Alumni Research Foundation Constructs and methods for genome editing and genetic engineering of fungi and protists
WO2016028682A1 (en) 2014-08-17 2016-02-25 The Broad Institute Inc. Genome editing using cas9 nickases
AU2015305570C1 (en) * 2014-08-19 2020-07-23 President And Fellows Of Harvard College RNA-guided systems for probing and mapping of nucleic acids
WO2016028887A1 (en) 2014-08-19 2016-02-25 Pacific Biosciences Of California, Inc. Compositions and methods for enrichment of nucleic acids
WO2016026444A1 (en) 2014-08-20 2016-02-25 Shanghai Institutes For Biological Sciences, Chinese Academy Of Sciences Biomarker and therapeutic target for triple negative breast cancer
CA2957938A1 (en) 2014-08-25 2016-03-03 GeneWeave Biosciences, Inc. Non-replicative transduction particles and transduction particle-based reporter systems
WO2016033230A1 (en) 2014-08-26 2016-03-03 The Regents Of The University Of California Hypersensitive aba receptors
ES2730378T3 (en) 2014-08-27 2019-11-11 Caribou Biosciences Inc Procedures to increase the efficiency of the modification mediated by Cas9
US10450584B2 (en) 2014-08-28 2019-10-22 North Carolina State University Cas9 proteins and guiding features for DNA targeting and genome editing
US10570418B2 (en) 2014-09-02 2020-02-25 The Regents Of The University Of California Methods and compositions for RNA-directed target DNA modification
WO2016035044A1 (en) 2014-09-05 2016-03-10 Vilnius University Programmable rna shredding by the type iii-a crispr-cas system of streptococcus thermophilus
WO2016037157A2 (en) 2014-09-05 2016-03-10 The Johns Hopkins University Targeting capn9/capns2 activity as a therapeutic strategy for the treatment of myofibroblast differentiation and associated pathologies
WO2016040594A1 (en) 2014-09-10 2016-03-17 The Regents Of The University Of California Reconstruction of ancestral cells by enzymatic recording
CN108064129A (en) 2014-09-12 2018-05-22 纳幕尔杜邦公司 The generation in the site-specific integration site of complex character locus and application method in corn and soybean
CN106715431A (en) 2014-09-16 2017-05-24 吉利德科学公司 Solid forms of a toll-like receptor modulator
EP3878948A1 (en) 2014-09-16 2021-09-15 Sangamo Therapeutics, Inc. Methods and compositions for nuclease-mediated genome engineering and correction in hematopoietic stem cells
WO2016049024A2 (en) 2014-09-24 2016-03-31 The Broad Institute Inc. Delivery, use and therapeutic applications of the crispr-cas systems and compositions for modeling competition of multiple cancer mutations in vivo
WO2016049163A2 (en) 2014-09-24 2016-03-31 The Broad Institute Inc. Use and production of chd8+/- transgenic animals with behavioral phenotypes characteristic of autism spectrum disorder
WO2016049251A1 (en) 2014-09-24 2016-03-31 The Broad Institute Inc. Delivery, use and therapeutic applications of the crispr-cas systems and compositions for modeling mutations in leukocytes
KR20230067694A (en) 2014-09-24 2023-05-16 시티 오브 호프 Adeno-associated virus vector variants for high efficiency genome editing and methods thereof
WO2016049258A2 (en) 2014-09-25 2016-03-31 The Broad Institute Inc. Functional screening with optimized functional crispr-cas systems
WO2016046635A1 (en) 2014-09-25 2016-03-31 Institut Pasteur Methods for characterizing human papillomavirus associated cervical lesions
WO2016054225A1 (en) 2014-09-30 2016-04-07 Stc.Unm Plasmid delivery in the treatment of cancer and other disease states
EP3845655A1 (en) 2014-10-01 2021-07-07 The General Hospital Corporation Methods for increasing efficiency of nuclease-induced homology-directed repair
US9879283B2 (en) 2014-10-09 2018-01-30 Life Technologies Corporation CRISPR oligonucleotides and gene editing
CA2963840A1 (en) 2014-10-09 2016-04-14 Seattle Children's Hospital (dba Seattle Children's Research Institute) Long poly(a) plasmids and methods for introduction of long poly(a) sequences into the plasmid
EP3204496A1 (en) 2014-10-10 2017-08-16 Editas Medicine, Inc. Compositions and methods for promoting homology directed repair
US10583201B2 (en) 2014-10-10 2020-03-10 Massachusetts Eye And Ear Infirmary Efficient delivery of therapeutic molecules in vitro and in vivo
WO2016061073A1 (en) 2014-10-14 2016-04-21 Memorial Sloan-Kettering Cancer Center Composition and method for in vivo engineering of chromosomal rearrangements
MX2017004890A (en) 2014-10-15 2018-02-12 Regeneron Pharma Methods and compositions for generating or maintaining pluripotent cells.
CN104342457A (en) 2014-10-17 2015-02-11 杭州师范大学 Method for targetedly integrating exogenous gene into target gene
CN107208086A (en) 2014-10-17 2017-09-26 霍华德休斯医学研究所 genomic probe
US10308947B2 (en) 2014-10-17 2019-06-04 The Penn State Research Foundation Methods and compositions for multiplex RNA guided genome editing and other RNA technologies
BR112017008082A2 (en) 2014-10-20 2017-12-26 Envirologix Inc compositions and methods for detecting an rna virus
US10920208B2 (en) 2014-10-22 2021-02-16 President And Fellows Of Harvard College Evolution of proteases
WO2016065364A1 (en) 2014-10-24 2016-04-28 Life Technologies Corporation Compositions and methods for enhancing homologous recombination
WO2016069591A2 (en) 2014-10-27 2016-05-06 The Broad Institute Inc. Compositions, methods and use of synthetic lethal screening
WO2016069774A1 (en) 2014-10-28 2016-05-06 Agrivida, Inc. Methods and compositions for stabilizing trans-splicing intein modified proteases
WO2016069912A1 (en) 2014-10-29 2016-05-06 Massachusetts Eye And Ear Infirmary Efficient delivery of therapeutic molecules in vitro and in vivo
EP3212165B1 (en) 2014-10-30 2024-02-28 President and Fellows of Harvard College Delivery of negatively charged proteins using cationic lipids
MA40880A (en) 2014-10-30 2017-09-05 Temple Univ Of The Commonwealth RNA-GUIDED ERADICATION OF HUMAN JC VIRUS AND OTHER POLYOMAVIRUSES
EP3215168B1 (en) 2014-10-31 2023-08-02 The Trustees of the University of Pennsylvania Altering gene expression in modified t cells and uses thereof
US9816080B2 (en) 2014-10-31 2017-11-14 President And Fellows Of Harvard College Delivery of CAS9 via ARRDC1-mediated microvesicles (ARMMs)
TWI716367B (en) 2014-10-31 2021-01-21 麻省理工學院 Massively parallel combinatorial genetics for crispr
CN104404036B (en) 2014-11-03 2017-12-01 赛业(苏州)生物科技有限公司 Conditional gene knockout method based on CRISPR/Cas9 technologies
US10435697B2 (en) 2014-11-03 2019-10-08 Nanyang Technological University Recombinant expression system that senses pathogenic microorganisms
CN104504304B (en) 2014-11-03 2017-08-25 深圳先进技术研究院 A kind of short palindrome repetitive sequence recognition methods of regular intervals of cluster and device
EP3739047A1 (en) 2014-11-04 2020-11-18 National University Corporation Kobe University Method for modifying genome sequence to introduce specific mutation to targeted dna sequence by base-removal reaction, and molecular complex used therein
WO2016073559A1 (en) 2014-11-05 2016-05-12 The Regents Of The University Of California Methods for autocatalytic genome editing and neutralizing autocatalytic genome editing
CN107406838A (en) 2014-11-06 2017-11-28 纳幕尔杜邦公司 Peptide-mediated delivering of the endonuclease of RNA guiding into cell
WO2016073990A2 (en) 2014-11-07 2016-05-12 Editas Medicine, Inc. Methods for improving crispr/cas-mediated genome-editing
WO2016077273A1 (en) 2014-11-11 2016-05-19 Q Therapeutics, Inc. Engineering mesenchymal stem cells using homologous recombination
CN114438174A (en) 2014-11-11 2022-05-06 伊鲁米那股份有限公司 Polynucleotide amplification using CRISPR-CAS system
EP3219810B1 (en) 2014-11-14 2022-01-05 Institute for Basic Science Method for detecting off-target site of genetic scissors in genome
WO2016075662A2 (en) 2014-11-15 2016-05-19 Zumutor Biologics, Inc. Dna-binding domain, non-fucosylated and partially fucosylated proteins, and methods thereof
US11470826B2 (en) 2014-11-17 2022-10-18 National University Corporation Tokyo Medical And Dental University Method of conveniently producing genetically modified non-human mammal with high efficiency
CN107109422B (en) 2014-11-19 2021-08-13 基础科学研究院 Genome editing using split Cas9 expressed from two vectors
US11319555B2 (en) 2014-11-20 2022-05-03 Duke University Compositions, systems and methods for cell therapy
NZ731962A (en) 2014-11-21 2022-07-01 Regeneron Pharma Methods and compositions for targeted genetic modification using paired guide rnas
US10227661B2 (en) 2014-11-21 2019-03-12 GeneWeave Biosciences, Inc. Sequence-specific detection and phenotype determination
WO2016086177A2 (en) 2014-11-25 2016-06-02 Drexel University Compositions and methods for hiv quasi-species excision from hiv-1-infected patients
WO2016084088A1 (en) 2014-11-26 2016-06-02 Ramot At Tel-Aviv University Ltd. Targeted elimination of bacterial genes
GB201421096D0 (en) 2014-11-27 2015-01-14 Imp Innovations Ltd Genome editing methods
CA2968808A1 (en) 2014-11-27 2016-06-02 Danziger Innovations Ltd. Nucleic acid constructs for genome editing
WO2016082135A1 (en) 2014-11-27 2016-06-02 中国农业科学院北京畜牧兽医研究所 Method for porcine h11 site-specific insertion by using site-specific cleavage system
CN105695485B (en) 2014-11-27 2020-02-21 中国科学院上海生命科学研究院 Cas9 encoding gene for filamentous fungus Crispr-Cas system and application thereof
US10479997B2 (en) 2014-12-01 2019-11-19 Novartis Ag Compositions and methods for diagnosis and treatment of prostate cancer
WO2016089866A1 (en) 2014-12-01 2016-06-09 President And Fellows Of Harvard College Rna-guided systems for in vivo gene editing
CN107250148B (en) 2014-12-03 2021-04-16 安捷伦科技有限公司 Guide RNAs with chemical modifications
CN104450774A (en) 2014-12-04 2015-03-25 中国农业科学院作物科学研究所 Construction of soybean CRISPR/Cas9 system and application of soybean CRISPR/Cas9 system in soybean gene modification
WO2016090385A1 (en) 2014-12-05 2016-06-09 Applied Stemcell, Inc. Site-directed crispr/recombinase compositions and methods of integrating transgenes
CN104531704B (en) 2014-12-09 2019-05-21 中国农业大学 Utilize the method for CRISPR-Cas9 system knock-out animal FGF5 gene
CN104531705A (en) 2014-12-09 2015-04-22 中国农业大学 Method for knocking off animal myostatin gene by using CRISPR-Cas9 system
WO2016094679A1 (en) 2014-12-10 2016-06-16 Regents Of The University Of Minnesota Genetically modified cells, tissues, and organs for treating disease
US20170362580A1 (en) 2014-12-12 2017-12-21 James Zhu Methods and compositions for selectively eliminating cells of interest
WO2016094880A1 (en) 2014-12-12 2016-06-16 The Broad Institute Inc. Delivery, use and therapeutic applications of crispr systems and compositions for genome editing as to hematopoietic stem cells (hscs)
CN104480144B (en) 2014-12-12 2017-04-12 武汉大学 CRISPR/Cas9 recombinant lentiviral vector for human immunodeficiency virus gene therapy and lentivirus of CRISPR/Cas9 recombinant lentiviral vector
CA2969464A1 (en) 2014-12-12 2016-06-16 Tod M. Woolf Compositions and methods for editing nucleic acids in cells utilizing oligonucleotides
WO2016094874A1 (en) 2014-12-12 2016-06-16 The Broad Institute Inc. Escorted and functionalized guides for crispr-cas systems
WO2016094872A1 (en) 2014-12-12 2016-06-16 The Broad Institute Inc. Dead guides for crispr transcription factors
EP3889260A1 (en) 2014-12-12 2021-10-06 The Broad Institute, Inc. Protected guide rnas (pgrnas)
AU2015362618B2 (en) 2014-12-16 2022-01-27 C3J Therapeutics, Inc. Compositions of and methods for in vitro viral genome engineering
CN107667171A (en) 2014-12-16 2018-02-06 丹尼斯科美国公司 Fungal gene group modification system and application method
PL3234134T3 (en) 2014-12-17 2020-12-28 Proqr Therapeutics Ii B.V. Targeted rna editing
CA2969384A1 (en) 2014-12-17 2016-06-23 Cellectis Inhibitory chimeric antigen receptor (icar or n-car) expressing non-t cell transduction domain
AU2015363113B2 (en) 2014-12-17 2021-03-11 E. I. Du Pont De Nemours And Company Compositions and methods for efficient gene editing in E. coli using guide RNA/Cas endonuclease systems in combination with circular polynucleotide modification templates
WO2016097751A1 (en) 2014-12-18 2016-06-23 The University Of Bath Method of cas9 mediated genome engineering
US9840702B2 (en) 2014-12-18 2017-12-12 Integrated Dna Technologies, Inc. CRISPR-based compositions and methods of use
CN104745626B (en) 2014-12-19 2018-05-01 中国航天员科研训练中心 A kind of fast construction method of conditional gene knockout animal model and application
WO2016100974A1 (en) 2014-12-19 2016-06-23 The Broad Institute Inc. Unbiased identification of double-strand breaks and genomic rearrangement by genome-wide insert capture sequencing
CA2971444A1 (en) 2014-12-20 2016-06-23 Arc Bio, Llc Compositions and methods for targeted depletion, enrichment, and partitioning of nucleic acids using crispr/cas system proteins
CN104560864B (en) 2014-12-22 2017-08-11 中国科学院微生物研究所 Utilize the 293T cell lines of the knockout IFN β genes of CRISPR Cas9 system constructings
US10190106B2 (en) 2014-12-22 2019-01-29 Univesity Of Massachusetts Cas9-DNA targeting unit chimeras
WO2016106239A1 (en) 2014-12-23 2016-06-30 The Regents Of The University Of California Methods and compositions for nucleic acid integration
WO2016106236A1 (en) 2014-12-23 2016-06-30 The Broad Institute Inc. Rna-targeting system
CA2968939A1 (en) 2014-12-24 2016-06-30 The Johns Hopkins University Systems and methods for genome modification and regulation
EP3237615B2 (en) 2014-12-24 2023-07-26 The Broad Institute, Inc. Crispr having or associated with destabilization domains
CN104651398A (en) 2014-12-24 2015-05-27 杭州师范大学 Method for knocking out microRNA gene family by utilizing CRISPR-Cas9 specificity
AU2015101792A4 (en) 2014-12-24 2016-01-28 Massachusetts Institute Of Technology Engineering of systems, methods and optimized enzyme and guide scaffolds for sequence manipulation
JPWO2016104716A1 (en) 2014-12-26 2017-10-05 国立研究開発法人理化学研究所 Gene knockout method
WO2016108926A1 (en) 2014-12-30 2016-07-07 The Broad Institute Inc. Crispr mediated in vivo modeling and genetic screening of tumor growth and metastasis
WO2016109255A1 (en) 2014-12-30 2016-07-07 University Of South Florida Methods and compositions for cloning into large vectors
CN104498493B (en) 2014-12-30 2017-12-26 武汉大学 The method of CRISPR/Cas9 specific knockdown hepatitis type B viruses and the gRNA for selectively targeted HBV DNA
WO2016109840A2 (en) 2014-12-31 2016-07-07 Synthetic Genomics, Inc. Compositions and methods for high efficiency in vivo genome editing
CN104651399B (en) 2014-12-31 2018-11-16 广西大学 A method of gene knockout being realized in Pig embryos cell using CRISPR/Cas system
ES2842151T3 (en) 2015-01-06 2021-07-13 Univ Yonsei Iacf Endonuclease targeting the blood coagulation factor VIII gene and composition for the treatment of hemophilia comprising the same
CN108064287A (en) 2015-01-06 2018-05-22 帝斯曼知识产权资产管理有限公司 For solving the CRISPR-CAS systems of fat yeast host cell
US11396665B2 (en) 2015-01-06 2022-07-26 Dsm Ip Assets B.V. CRISPR-CAS system for a filamentous fungal host cell
EP3242949B1 (en) 2015-01-06 2021-11-03 DSM IP Assets B.V. A crispr-cas system for a yeast host cell
CN104651392B (en) 2015-01-06 2018-07-31 华南农业大学 A method of obtaining temp-sensing sterile line using CRISPR/Cas9 system rite-directed mutagenesis P/TMS12-1
CN104593422A (en) 2015-01-08 2015-05-06 中国农业大学 Method of cloning reproductive and respiratory syndrome resisting pig
WO2016112242A1 (en) * 2015-01-08 2016-07-14 President And Fellows Of Harvard College Split cas9 proteins
EP3242938B1 (en) 2015-01-09 2020-01-08 Bio-Rad Laboratories, Inc. Detection of genome editing
WO2016114972A1 (en) 2015-01-12 2016-07-21 The Regents Of The University Of California Heterodimeric cas9 and methods of use thereof
JP7278027B2 (en) 2015-01-12 2023-05-19 マサチューセッツ インスティテュート オブ テクノロジー Gene editing by microfluidic delivery
WO2016112963A1 (en) 2015-01-13 2016-07-21 Riboxx Gmbh Delivery of biomolecules into cells
MA41349A (en) 2015-01-14 2017-11-21 Univ Temple RNA-GUIDED ERADICATION OF HERPES SIMPLEX TYPE I AND OTHER ASSOCIATED HERPES VIRUSES
DK3244909T3 (en) 2015-01-14 2020-01-13 Univ Aix Marseille PROTEASOMIN INHIBITORS TO TREAT A DISORDER RELATED TO AN ACCUMULATION OF NON-DEGRADATED ABNORMAL PROTEIN OR CANCER
CN107429263A (en) 2015-01-15 2017-12-01 斯坦福大学托管董事会 The method of controlling gene group editor
CN104611370A (en) 2015-01-16 2015-05-13 深圳市科晖瑞生物医药有限公司 Method for rejecting B2M (beta 2-microglobulin) gene segment
AR103446A1 (en) 2015-01-19 2017-05-10 Inst Genetics & Dev Biolog Cas METHOD FOR PRECISION TO MODIFY A PLANT THROUGH THE TRANSITIONAL EXPRESSION OF GENES
CN104725626B (en) 2015-01-22 2016-06-29 漳州亚邦化学有限公司 A kind of preparation method of the unsaturated-resin suitable in artificial quartz in lump
CN105821072A (en) 2015-01-23 2016-08-03 深圳华大基因研究院 CRISPR-Cas9 system used for assembling DNA and DNA assembly method
WO2016123071A1 (en) 2015-01-26 2016-08-04 Cold Spring Harbor Laboratory Methods of identifying essential protein domains
US10059940B2 (en) 2015-01-27 2018-08-28 Minghong Zhong Chemically ligated RNAs for CRISPR/Cas9-lgRNA complexes as antiviral therapeutic agents
CN104561095B (en) 2015-01-27 2017-08-22 深圳市国创纳米抗体技术有限公司 A kind of preparation method for the transgenic mice that can produce growth factor of human nerve
EP3250689B1 (en) 2015-01-28 2020-11-04 The Regents of The University of California Methods and compositions for labeling a single-stranded target nucleic acid
NZ733702A (en) 2015-01-28 2022-04-29 Caribou Biosciences Inc Crispr hybrid dna/rna polynucleotides and methods of use
AU2016211118B2 (en) 2015-01-29 2022-03-31 Centre National De La Recherche Scientifique Method for inducing targeted meiotic recombinations
EP3250693B2 (en) 2015-01-30 2023-12-20 The Regents of The University of California Protein delivery in primary hematopoietic cells
BR112017016639A2 (en) 2015-02-02 2018-06-19 Meiragtx Uk Ii Ltd regulation of gene expression by alternative scattering aptamer-mediated modulation
CN104593418A (en) 2015-02-06 2015-05-06 中国医学科学院医学实验动物研究所 Method for establishing humanized rat drug evaluation animal model
WO2016130600A2 (en) 2015-02-09 2016-08-18 Duke University Compositions and methods for epigenome editing
KR101584933B1 (en) 2015-02-10 2016-01-13 성균관대학교산학협력단 Recombinant vector for inhibiting antibiotic resistance and uses thereof
WO2016130697A1 (en) 2015-02-11 2016-08-18 Memorial Sloan Kettering Cancer Center Methods and kits for generating vectors that co-express multiple target molecules
CN104928321B (en) 2015-02-12 2018-06-01 中国科学院西北高原生物研究所 A kind of scale loss zebra fish pattern and method for building up by Crispr/Cas9 inductions
CN104726494B (en) 2015-02-12 2018-10-23 中国人民解放军第二军医大学 The method that CRISPR-Cas9 technologies build chromosome translocation stem cell and animal model
EP3256170B1 (en) 2015-02-13 2020-09-23 University of Massachusetts Compositions and methods for transient delivery of nucleases
US20160244784A1 (en) 2015-02-15 2016-08-25 Massachusetts Institute Of Technology Population-Hastened Assembly Genetic Engineering
WO2016132122A1 (en) 2015-02-17 2016-08-25 University Of Edinburgh Assay construct
JP6354100B2 (en) 2015-02-19 2018-07-11 国立大学法人徳島大学 Method for introducing Cas9 mRNA into a fertilized egg of a mammal by electroporation
AU2016225179C1 (en) 2015-02-23 2022-11-03 Crispr Therapeutics Ag Materials and methods for treatment of hemoglobinopathies
US20180200387A1 (en) 2015-02-23 2018-07-19 Crispr Therapeutics Ag Materials and methods for treatment of human genetic diseases including hemoglobinopathies
US20180245073A1 (en) 2015-02-23 2018-08-30 Voyager Therapeutics, Inc. Regulatable expression using adeno-associated virus (aav)
CN107406858A (en) 2015-02-25 2017-11-28 先锋国际良种公司 The composition and method that adjustment type for guide RNA/CAS endonuclease complex is expressed
US20160244829A1 (en) 2015-02-25 2016-08-25 University-Industry Foundation, Yonsei University Method for target dna enrichment using crispr system
WO2016135507A1 (en) 2015-02-27 2016-09-01 University Of Edinburgh Nucleic acid editing systems
CN104805099B (en) 2015-03-02 2018-04-13 中国人民解放军第二军医大学 A kind of nucleic acid molecules and its expression vector of safe coding Cas9 albumen
EP3858990A1 (en) 2015-03-03 2021-08-04 The General Hospital Corporation Engineered crispr-cas9 nucleases with altered pam specificity
CN104651401B (en) 2015-03-05 2019-03-08 东华大学 A kind of method that mir-505 diallele knocks out
CN104673816A (en) 2015-03-05 2015-06-03 广东医学院 PCr-NHEJ (non-homologous end joining) carrier as well as construction method of pCr-NHEJ carrier and application of pCr-NHEJ carrier in site-specific knockout of bacterial genes
US20180271891A1 (en) 2015-03-11 2018-09-27 The Broad Institute Inc. Selective treatment of prmt5 dependent cancer
US20160264934A1 (en) 2015-03-11 2016-09-15 The General Hospital Corporation METHODS FOR MODULATING AND ASSAYING m6A IN STEM CELL POPULATIONS
GB201504223D0 (en) 2015-03-12 2015-04-29 Genome Res Ltd Biallelic genetic modification
CN105969792A (en) 2015-03-12 2016-09-28 中国科学院遗传与发育生物学研究所 A method of improving plant resistance to invaded DNA viruses
EP3858992A1 (en) 2015-03-13 2021-08-04 The Jackson Laboratory A three-component crispr/cas complex system and uses thereof
CN106032540B (en) 2015-03-16 2019-10-25 中国科学院上海生命科学研究院 Gland relevant viral vector building of CRISPR/Cas9 endonuclease enzyme system and application thereof
AR103926A1 (en) 2015-03-16 2017-06-14 Inst Genetics & Dev Biolog Cas METHOD FOR MAKING MODIFICATIONS DIRECTED SITE IN THE GENOMA OF A PLANT USING NON-HEREDABLE MATERIALS
EP3271849B1 (en) 2015-03-17 2021-09-08 Bio-Rad Laboratories, Inc. Detection of genome editing
WO2016149484A2 (en) 2015-03-17 2016-09-22 Temple University Of The Commonwealth System Of Higher Education Compositions and methods for specific reactivation of hiv latent reservoir
EP3271461A1 (en) 2015-03-20 2018-01-24 Danmarks Tekniske Universitet Crispr/cas9 based engineering of actinomycetal genomes
MA41382A (en) 2015-03-20 2017-11-28 Univ Temple GENE EDITING BASED ON THE TAT-INDUCED CRISPR / ENDONUCLEASE SYSTEM
CN104726449A (en) 2015-03-23 2015-06-24 国家纳米科学中心 CRISPR-Cas9 system for preventing and/or treating HIV, as well as preparation method and application thereof
CN106148416B (en) 2015-03-24 2019-12-17 华东师范大学 Method for breeding Cyp gene knockout rat and method for preparing liver microsome thereof
EP4019635A1 (en) 2015-03-25 2022-06-29 Editas Medicine, Inc. Crispr/cas-related methods, compositions and components
EP3274453B1 (en) 2015-03-26 2021-01-27 Editas Medicine, Inc. Crispr/cas-mediated gene conversion
CA2981509A1 (en) 2015-03-30 2016-10-06 The Board Of Regents Of The Nevada System Of Higher Educ. On Behalf Of The University Of Nevada, La Compositions comprising talens and methods of treating hiv
US20180080051A1 (en) 2015-03-31 2018-03-22 Exeligen Scientific, Inc. Cas 9 retroviral integrase and cas 9 recombinase systems for targeted incorporation of a dna sequence into a genome of a cell or organism
WO2016161380A1 (en) 2015-04-01 2016-10-06 Editas Medicine, Inc. Crispr/cas-related methods and compositions for treating duchenne muscular dystrophy and becker muscular dystrophy
EP3300507A4 (en) 2015-04-02 2019-03-13 Agenovir Corporation Gene delivery methods and compositions
CN106434737A (en) 2015-04-03 2017-02-22 内蒙古中科正标生物科技有限责任公司 CRISPR/Cas9 technology-based monocotyledon gene knockout vector and application thereof
WO2016161446A1 (en) 2015-04-03 2016-10-06 Dana-Farber Cancer Institute, Inc. Composition and methods of genome editing of b-cells
US20170166928A1 (en) 2015-04-03 2017-06-15 Whitehead Institute For Biomedical Research Compositions And Methods For Genetically Modifying Yeast
KR102648489B1 (en) 2015-04-06 2024-03-15 더 보드 어브 트러스티스 어브 더 리랜드 스탠포드 주니어 유니버시티 Chemically modified guide RNA for CRISPR/CAS-mediated gene regulation
US11214779B2 (en) 2015-04-08 2022-01-04 University of Pittsburgh—of the Commonwealth System of Higher Education Activatable CRISPR/CAS9 for spatial and temporal control of genome editing
US11390860B2 (en) 2015-04-13 2022-07-19 The University Of Tokyo Set of polypeptides exhibiting nuclease activity or nickase activity with dependence on light or in presence of drug or suppressing or activating expression of target gene
US10155938B2 (en) 2015-04-14 2018-12-18 City Of Hope Coexpression of CAS9 and TREX2 for targeted mutagenesis
GB201506509D0 (en) 2015-04-16 2015-06-03 Univ Wageningen Nuclease-mediated genome editing
US11299729B2 (en) 2015-04-17 2022-04-12 President And Fellows Of Harvard College Vector-based mutagenesis system
US10738290B2 (en) 2015-04-21 2020-08-11 Novartis Ag RNA-guided gene editing system and uses thereof
CN104805118A (en) 2015-04-22 2015-07-29 扬州大学 Method for targeted knockout of specific gene of Suqin yellow chicken embryonic stem cell
CN104762321A (en) 2015-04-22 2015-07-08 东北林业大学 Knockout vector construction method based on CRISPR/Cas9 system target knockout KHV gene and crNRA prototype thereof
SG11201708653RA (en) 2015-04-24 2017-11-29 Editas Medicine Inc Evaluation of cas9 molecule/guide rna molecule complexes
CN107614012A (en) 2015-04-24 2018-01-19 加利福尼亚大学董事会 Using the cell detection of engineering, monitoring or treatment disease or the system of the patient's condition and preparation and use their method
US11268158B2 (en) 2015-04-24 2022-03-08 St. Jude Children's Research Hospital, Inc. Assay for safety assessment of therapeutic genetic manipulations, gene therapy vectors and compounds
WO2016174056A1 (en) 2015-04-27 2016-11-03 Genethon Compositions and methods for the treatment of nucleotide repeat expansion disorders
WO2016176191A1 (en) 2015-04-27 2016-11-03 The Trustees Of The University Of Pennsylvania Dual aav vector system for crispr/cas9 mediated correction of human disease
EP3087974A1 (en) 2015-04-29 2016-11-02 Rodos BioTarget GmbH Targeted nanocarriers for targeted drug delivery of gene therapeutics
EP3289080B1 (en) 2015-04-30 2021-08-25 The Trustees of Columbia University in the City of New York Gene therapy for autosomal dominant diseases
US20190002920A1 (en) 2015-04-30 2019-01-03 The Brigham And Women's Hospital, Inc. Methods and kits for cloning-free genome editing
US20160346359A1 (en) 2015-05-01 2016-12-01 Spark Therapeutics, Inc. Adeno-associated Virus-Mediated CRISPR-Cas9 Treatment of Ocular Disease
EP3289076B1 (en) 2015-05-01 2021-11-17 Precision Biosciences, Inc. Precise deletion of chromoscomal sequences in vivo
CN104894068A (en) 2015-05-04 2015-09-09 南京凯地生物科技有限公司 Method for preparing CAR-T cell by CRISPR/Cas9
US11845928B2 (en) 2015-05-04 2023-12-19 Tsinghua University Methods and kits for fragmenting DNA
WO2016177682A1 (en) 2015-05-06 2016-11-10 Snipr Technologies Limited Altering microbial populations & modifying microbiota
GB2531454A (en) 2016-01-10 2016-04-20 Snipr Technologies Ltd Recombinogenic nucleic acid strands in situ
WO2016182917A1 (en) 2015-05-08 2016-11-17 Children's Medical Center Corporation Targeting bcl11a enhancer functional regions for fetal hemoglobin reinduction
WO2016182893A1 (en) 2015-05-08 2016-11-17 Teh Broad Institute Inc. Functional genomics using crispr-cas systems for saturating mutagenesis of non-coding elements, compositions, methods, libraries and applications thereof
WO2016183236A1 (en) 2015-05-11 2016-11-17 Editas Medicine, Inc. Crispr/cas-related methods and compositions for treating hiv infection and aids
JP7030522B2 (en) 2015-05-11 2022-03-07 エディタス・メディシン、インコーポレイテッド Optimized CRISPR / CAS9 system and method for gene editing in stem cells
SG10202112057QA (en) 2015-05-12 2021-12-30 Sangamo Therapeutics Inc Nuclease-mediated regulation of gene expression
KR101785847B1 (en) 2015-05-12 2017-10-17 연세대학교 산학협력단 Targeted genome editing based on CRISPR/Cas9 system using short linearized double-stranded DNA
CN108136047B (en) 2015-05-13 2022-12-13 西雅图儿童医院(Dba西雅图儿童研究所) Enhancing endonuclease-based gene editing in primary cells
US10920221B2 (en) 2015-05-13 2021-02-16 President And Fellows Of Harvard College Methods of making and using guide RNA for use with Cas9 systems
EP3294774A1 (en) 2015-05-13 2018-03-21 Zumutor Biologics, Inc. Afucosylated protein, cell expressing said protein and associated methods
CN105886498A (en) 2015-05-13 2016-08-24 沈志荣 Method for specifically knocking out human PCSK9 gene by virtue of CRISPR-Cas9 and sgRNA for specifically targeting PCSK9 gene
CN107614680A (en) 2015-05-14 2018-01-19 南加利福尼亚大学 Utilize the optimization gene editing of recombinant nucleic acid inscribe enzyme system
WO2016183438A1 (en) 2015-05-14 2016-11-17 Massachusetts Institute Of Technology Self-targeting genome editing system
US20180142236A1 (en) 2015-05-15 2018-05-24 Ge Healthcare Dharmacon, Inc. Synthetic single guide rna for cas9-mediated gene editing
CA2985506A1 (en) 2015-05-15 2016-11-24 Pioneer Hi-Bred International, Inc. Guide rna/cas endonuclease systems
BR112017024514A2 (en) 2015-05-16 2018-07-24 Genzyme Corporation genetic editing of deep intronic mutations
WO2016185411A1 (en) 2015-05-18 2016-11-24 King Abdullah University Of Science And Technology Method of inhibiting plant virus pathogen infections by crispr/cas9-mediated interference
CN104846010B (en) 2015-05-18 2018-07-06 安徽省农业科学院水稻研究所 A kind of method for deleting transgenic paddy rice riddled basins
EP3095870A1 (en) 2015-05-19 2016-11-23 Kws Saat Se Methods for the in planta transformation of plants and manufacturing processes and products based and obtainable therefrom
CN106011104B (en) 2015-05-21 2019-09-27 清华大学 Gene editing and expression regulation method are carried out using Cas system is split
US20160340622A1 (en) 2015-05-22 2016-11-24 Nabil Radi Abdou Bar Soap Anchoring Core
CN105518135B (en) 2015-05-22 2020-11-24 深圳市第二人民医院 Method for specifically knocking out pig CMAH gene by CRISPR-Cas9 and sgRNA for specifically targeting CMAH gene
WO2016187904A1 (en) 2015-05-22 2016-12-01 深圳市第二人民医院 Method for pig cmah gene specific knockout by means of crispr-cas9 and sgrna for specially targeting cmah gene
WO2016187717A1 (en) 2015-05-26 2016-12-01 Exerkine Corporation Exosomes useful for genome editing
US20180148711A1 (en) 2015-05-28 2018-05-31 Coda Biotherapeutics, Inc. Genome editing vectors
CN104894075B (en) 2015-05-28 2019-08-06 华中农业大学 CRISPR/Cas9 and Cre/lox system editor's Pseudorabies virus genome prepares vaccine approach and application
CN105624146B (en) 2015-05-28 2019-02-15 中国科学院微生物研究所 Molecular cloning method based on CRISPR/Cas9 and brewing yeast cell endogenous homologous recombination
KR102451796B1 (en) 2015-05-29 2022-10-06 노쓰 캐롤라이나 스테이트 유니버시티 Methods for screening bacteria, archaea, algae and yeast using CRISPR nucleic acids
US20160346362A1 (en) 2015-05-29 2016-12-01 Agenovir Corporation Methods and compositions for treating cytomegalovirus infections
JP2018516983A (en) 2015-05-29 2018-06-28 アジェノビア コーポレーション Compositions and methods for treating viral infections
JP2018516596A (en) 2015-05-29 2018-06-28 アジェノビア コーポレーション Antiviral methods and compositions
CA3000182A1 (en) 2015-05-29 2016-12-08 Agenovir Corporation Methods and compositions for treating cells for transplant
US20160346360A1 (en) 2015-05-29 2016-12-01 Agenovir Corporation Compositions and methods for cell targeted hpv treatment
EP3302556A4 (en) 2015-05-29 2018-12-05 Clark Atlanta University Human cell lines mutant for zic2
US10117911B2 (en) 2015-05-29 2018-11-06 Agenovir Corporation Compositions and methods to treat herpes simplex virus infections
CA2987684A1 (en) 2015-06-01 2016-12-08 The Hospital For Sick Children Delivery of structurally diverse polypeptide cargo into mammalian cells by a bacterial toxin
EA037359B1 (en) 2015-06-01 2021-03-17 Тэмпл Юниверсити - Оф Зе Коммонвэлс Систем Оф Хайе Эдьюкейшн Methods and compositions for rna-guided treatment of hiv infection
CN105112445B (en) 2015-06-02 2018-08-10 广州辉园苑医药科技有限公司 A kind of miR-205 gene knockout kits based on CRISPR-Cas9 gene Knockouts
WO2016196655A1 (en) 2015-06-03 2016-12-08 The Regents Of The University Of California Cas9 variants and methods of use thereof
WO2016196887A1 (en) 2015-06-03 2016-12-08 Board Of Regents Of The University Of Nebraska Dna editing using single-stranded dna
US20180245074A1 (en) 2015-06-04 2018-08-30 Protiva Biotherapeutics, Inc. Treating hepatitis b virus infection using crispr
US10626393B2 (en) 2015-06-04 2020-04-21 Arbutus Biopharma Corporation Delivering CRISPR therapeutics with lipid nanoparticles
CN105039339B (en) 2015-06-05 2017-12-19 新疆畜牧科学院生物技术研究所 A kind of method of specific knockdown sheep FecB genes with RNA mediations and its special sgRNA
US11279926B2 (en) 2015-06-05 2022-03-22 The Regents Of The University Of California Methods and compositions for generating CRISPR/Cas guide RNAs
CN116334142A (en) * 2015-06-09 2023-06-27 爱迪塔斯医药公司 CRISPR/CAS related methods and compositions for improving transplantation
ES2961258T3 (en) 2015-06-10 2024-03-11 Firmenich & Cie Cell lines for screening aroma and odor receptors
US20160362667A1 (en) 2015-06-10 2016-12-15 Caribou Biosciences, Inc. CRISPR-Cas Compositions and Methods
ES2807440T3 (en) 2015-06-10 2021-02-23 Firmenich & Cie Musk compound identification procedure
WO2016198500A1 (en) 2015-06-10 2016-12-15 INSERM (Institut National de la Santé et de la Recherche Médicale) Methods and compositions for rna-guided treatment of human cytomegalovirus (hcmv) infection
WO2016197362A1 (en) 2015-06-11 2016-12-15 深圳市第二人民医院 Method for specific knockout of swine vwf gene using crispr-cas9 specificity, and sgrna used for specifically targeting vwf gene
WO2016197360A1 (en) 2015-06-11 2016-12-15 深圳市第二人民医院 Method for specific knockout of swine gfra1 gene using crispr-cas9 specificity, and sgrna used for specifically targeting gfra1 gene
CN105492608B (en) 2015-06-11 2021-07-23 深圳市第二人民医院 Method for specifically knocking out pig PDX1 gene by CRISPR-Cas9 and sgRNA for specifically targeting PDX1 gene
CN105518134A (en) 2015-06-11 2016-04-20 深圳市第二人民医院 Method for pig SLA-2 gene specific knockout through CRISPR-Cas9 and sgRNA for specially targeting SLA-2 gene
CN105518139B (en) 2015-06-11 2021-02-02 深圳市第二人民医院 Method for specifically knocking out pig FGL2 gene by CRISPR-Cas9 and sgRNA for specifically targeting FGL2 gene
CN106414740A (en) 2015-06-11 2017-02-15 深圳市第二人民医院 Method for specific knockout of swine SLA-3 gene using CRISPR-Cas9 specificity, and sgRNA used for specifically targeting sla-3 gene
WO2016197361A1 (en) 2015-06-11 2016-12-15 深圳市第二人民医院 Method for specific knockout of swine ggta1 gene using crispr-cas9 specificity, and sgrna used for specifically targeting ggta1 gene
CN105593367A (en) 2015-06-11 2016-05-18 深圳市第二人民医院 CRISPR-Cas9 specificity pig SLA-1 gene knockout method and sgRNA used for specific targeting SLA-1 gene
WO2016197355A1 (en) 2015-06-11 2016-12-15 深圳市第二人民医院 Crispr-cas9 method for specific knockout of swine sall1 gene and sgrna for use in targeting specifically sall1 gene
WO2016201138A1 (en) 2015-06-12 2016-12-15 The Regents Of The University Of California Reporter cas9 variants and methods of use thereof
US20180187190A1 (en) 2015-06-12 2018-07-05 Erasmus University Medical Center Rotterdam New crispr assays
GB201510296D0 (en) 2015-06-12 2015-07-29 Univ Wageningen Thermostable CAS9 nucleases
CA2983874C (en) 2015-06-15 2022-06-21 North Carolina State University Methods and compositions for efficient delivery of nucleic acids and rna-based antimicrobials
WO2016205623A1 (en) 2015-06-17 2016-12-22 North Carolina State University Methods and compositions for genome editing in bacteria using crispr-cas9 systems
AU2016278959A1 (en) 2015-06-17 2018-01-18 The Uab Research Foundation CRISPR/Cas9 complex for introducing a functional polypeptide into cells of blood cell lineage
EP3310932B1 (en) 2015-06-17 2023-08-30 The UAB Research Foundation Crispr/cas9 complex for genomic editing
WO2016205728A1 (en) 2015-06-17 2016-12-22 Massachusetts Institute Of Technology Crispr mediated recording of cellular events
WO2016205759A1 (en) 2015-06-18 2016-12-22 The Broad Institute Inc. Engineering and optimization of systems, methods, enzymes and guide scaffolds of cas9 orthologs and variants for sequence manipulation
US9790490B2 (en) 2015-06-18 2017-10-17 The Broad Institute Inc. CRISPR enzymes and systems
EP3800255A3 (en) 2015-06-18 2021-06-23 Robert D. Bowles Rna-guided transcriptional regulation and methods of using the same for the treatment of back pain
WO2016205749A1 (en) 2015-06-18 2016-12-22 The Broad Institute Inc. Novel crispr enzymes and systems
WO2016205745A2 (en) 2015-06-18 2016-12-22 The Broad Institute Inc. Cell sorting
CN109536474A (en) 2015-06-18 2019-03-29 布罗德研究所有限公司 Reduce the CRISPR enzyme mutant of undershooting-effect
EP3430134B1 (en) 2015-06-18 2022-09-21 The Broad Institute, Inc. Novel crispr enzymes and systems
US9957501B2 (en) 2015-06-18 2018-05-01 Sangamo Therapeutics, Inc. Nuclease-mediated regulation of gene expression
GB201511376D0 (en) 2015-06-29 2015-08-12 Ecolab Usa Inc Process for the treatment of produced water from chemical enhanced oil recovery
US11279928B2 (en) 2015-06-29 2022-03-22 Massachusetts Institute Of Technology Compositions comprising nucleic acids and methods of using the same
WO2017004261A1 (en) 2015-06-29 2017-01-05 Ionis Pharmaceuticals, Inc. Modified crispr rna and modified single crispr rna and uses thereof
CA2986314C (en) 2015-06-30 2024-04-23 Cellectis Methods for improving functionality in nk cell by gene inactivation using specific endonuclease
BR112017028201A2 (en) 2015-07-02 2018-08-28 Univ Johns Hopkins crisp / cas9 based treatments
DK3320091T3 (en) 2015-07-06 2021-02-01 Dsm Ip Assets Bv GUIDE RNA COLLECTION VECTOR
US20170009242A1 (en) 2015-07-06 2017-01-12 Whitehead Institute For Biomedical Research CRISPR-Mediated Genome Engineering for Protein Depletion
CN105132451B (en) 2015-07-08 2019-07-23 电子科技大学 A kind of single transcriptional units directed modification skeleton carrier of CRISPR/Cas9 and its application
US20170014449A1 (en) 2015-07-13 2017-01-19 Elwha LLC, a limited liability company of the State of Delaware Site-specific epigenetic editing
US20180200342A1 (en) 2015-07-13 2018-07-19 Institut Pasteur Improving sequence-specific antimicrobials by blocking dna repair
CA2991301A1 (en) 2015-07-13 2017-01-19 Sangamo Therapeutics, Inc. Delivery methods and compositions for nuclease-mediated genome engineering
EP3323890A4 (en) 2015-07-14 2019-01-30 Fukuoka University Method for inducing site-specific rna mutations, target editing guide rna used in method, and target rna target editing guide rna complex
MA42895A (en) 2015-07-15 2018-05-23 Juno Therapeutics Inc MODIFIED CELLS FOR ADOPTIVE CELL THERAPY
CN108291218B (en) 2015-07-15 2022-08-19 新泽西鲁特格斯州立大学 Nuclease-independent targeted gene editing platform and application thereof
US20170020922A1 (en) 2015-07-16 2017-01-26 Batu Biologics Inc. Gene editing for immunological destruction of neoplasia
WO2017015015A1 (en) 2015-07-17 2017-01-26 Emory University Crispr-associated protein from francisella and uses related thereto
WO2017015101A1 (en) 2015-07-17 2017-01-26 University Of Washington Methods for maximizing the efficiency of targeted gene correction
US10676735B2 (en) 2015-07-22 2020-06-09 Duke University High-throughput screening of regulatory element function with epigenome editing technologies
WO2017015545A1 (en) 2015-07-22 2017-01-26 President And Fellows Of Harvard College Evolution of site-specific recombinases
AU2016297167A1 (en) 2015-07-23 2018-02-22 Mayo Foundation For Medical Education And Research Editing mitochondrial DNA
CA2993474A1 (en) 2015-07-25 2017-02-02 Habib FROST A system, device and a method for providing a therapy or a cure for cancer and other pathological states
CN106399360A (en) 2015-07-27 2017-02-15 上海药明生物技术有限公司 FUT8 gene knockout method based on CRISPR technology
DK3329001T3 (en) 2015-07-28 2021-12-20 Danisco Us Inc RE-EDITING SYSTEMS AND APPLICATION PROCEDURES
CN105063061B (en) 2015-07-28 2018-10-30 华南农业大学 A kind of rice mass of 1000 kernel gene tgw6 mutant and the preparation method and application thereof
CN106701808A (en) 2015-07-29 2017-05-24 深圳华大基因研究院 DNA polymerase I defective strain and construction method thereof
US10612011B2 (en) 2015-07-30 2020-04-07 President And Fellows Of Harvard College Evolution of TALENs
US10166255B2 (en) 2015-07-31 2019-01-01 Regents Of The University Of Minnesota Intracellular genomic transplant and methods of therapy
US20200123533A1 (en) 2015-07-31 2020-04-23 The Trustees Of Columbia University In The City Of New York High-throughput strategy for dissecting mammalian genetic interactions
WO2017023974A1 (en) 2015-08-03 2017-02-09 President And Fellows Of Harvard College Cas9 genome editing and transcriptional regulation
WO2017024047A1 (en) 2015-08-03 2017-02-09 Emendobio Inc. Compositions and methods for increasing nuclease induced recombination rate in cells
WO2017024318A1 (en) 2015-08-06 2017-02-09 Dana-Farber Cancer Institute, Inc. Targeted protein degradation to attenuate adoptive t-cell therapy associated adverse inflammatory responses
BR112018002558A2 (en) 2015-08-07 2018-09-25 Commw Scient Ind Res Org method for producing an animal comprising a genetic modification in the germline
US9580727B1 (en) 2015-08-07 2017-02-28 Caribou Biosciences, Inc. Compositions and methods of engineered CRISPR-Cas9 systems using split-nexus Cas9-associated polynucleotides
CN104962523B (en) 2015-08-07 2018-05-25 苏州大学 A kind of method for measuring non-homologous end joining repairing activity
BR112018002600A2 (en) 2015-08-11 2018-10-23 Cellectis modified immunotherapy cells for cd38 antigen targeting and cd38 gene inactivation
EP3334832A4 (en) 2015-08-14 2019-06-26 Institute Of Genetics And Developmental Biology, Chinese Academy Of Sciences Method for obtaining glyphosate-resistant rice by site-directed nucleotide substitution
CN105255937A (en) 2015-08-14 2016-01-20 西北农林科技大学 Method for expression of CRISPR sgRNA by eukaryotic cell III-type promoter and use thereof
JP6986509B2 (en) 2015-08-19 2021-12-22 アーク バイオ, エルエルシー Nucleic acid capture using a nucleic acid guided nuclease-based system
CN107922953B (en) 2015-08-20 2022-03-04 应用干细胞有限公司 Nuclease for improving gene editing efficiency
CN105112519A (en) 2015-08-20 2015-12-02 郑州大学 CRISPR-based Escherichia coli O157:H7 strain detection reagent box and detection method
CN105177126B (en) 2015-08-21 2018-12-04 东华大学 It is a kind of using Fluorescence PCR assay to the Classification Identification method of mouse
ES2929110T3 (en) 2015-08-25 2022-11-24 Univ Duke Compositions and methods to improve the specificity in genetic engineering using RNA-guided endonucleases
CN106480083B (en) 2015-08-26 2021-12-14 中国科学院分子植物科学卓越创新中心 CRISPR/Cas 9-mediated large-fragment DNA splicing method
US9512446B1 (en) 2015-08-28 2016-12-06 The General Hospital Corporation Engineered CRISPR-Cas9 nucleases
US9926546B2 (en) 2015-08-28 2018-03-27 The General Hospital Corporation Engineered CRISPR-Cas9 nucleases
WO2017040348A1 (en) 2015-08-28 2017-03-09 The General Hospital Corporation Engineered crispr-cas9 nucleases
WO2017040709A1 (en) 2015-08-31 2017-03-09 Caribou Biosciences, Inc. Directed nucleic acid repair
WO2017040511A1 (en) 2015-08-31 2017-03-09 Agilent Technologies, Inc. Compounds and methods for crispr/cas-based genome editing by homologous recombination
CN105087620B (en) 2015-08-31 2017-12-29 中国农业大学 One kind is overexpressed the 1BB carriers of pig costimulation acceptor 4 and its application
AU2016316027B2 (en) 2015-09-01 2022-04-07 Dana-Farber Cancer Institute Inc. Systems and methods for selection of gRNA targeting strands for Cas9 localization
EP3344756A4 (en) 2015-09-02 2019-09-04 University of Massachusetts Detection of gene loci with crispr arrayed repeats and/or polychromatic single guide ribonucleic acids
WO2017040786A1 (en) 2015-09-04 2017-03-09 Massachusetts Institute Of Technology Multilayer genetic safety kill circuits based on single cas9 protein and multiple engineered grna in mammalian cells
CN105400810B (en) 2015-09-06 2019-05-07 吉林大学 The method that phosphopenic rickets model is established using knockout technology
WO2017044419A1 (en) 2015-09-08 2017-03-16 University Of Massachusetts Dnase h activity of neisseria meningitidis cas9
CA2998087A1 (en) 2015-09-09 2017-03-16 National University Corporation Kobe University Method for modifying genome sequence that specifically converts nucleobase of targeted dna sequence, and molecular complex used in said method
ES2938623T3 (en) 2015-09-09 2023-04-13 Univ Kobe Nat Univ Corp Method for converting a genome sequence of a gram-positive bacterium by specific nucleic acid base conversion of a targeted DNA sequence and the molecular complex used therein
CN108291224A (en) 2015-09-10 2018-07-17 优美佳生物技术有限公司 Method and composition for treating glaucoma
WO2017044776A1 (en) 2015-09-10 2017-03-16 Texas Tech University System Single-guide rna (sgrna) with improved knockout efficiency
CN105274144A (en) 2015-09-14 2016-01-27 徐又佳 Preparation method of zebrafish with hepcidin gene knocked out by use of CRISPR / Cas9 technology
US10109551B2 (en) 2015-09-15 2018-10-23 Intel Corporation Methods and apparatuses for determining a parameter of a die
US10301613B2 (en) 2015-09-15 2019-05-28 Arizona Board Of Regents On Behalf Of Arizona State University Targeted remodeling of prokaryotic genomes using CRISPR-nickases
CN105210981B (en) 2015-09-15 2018-09-28 中国科学院生物物理研究所 Establish the method and its application for the ferret model that can be applied to human diseases research
CN105112422B (en) 2015-09-16 2019-11-08 中山大学 Gene miR408 and UCL is cultivating the application in high-yield rice
WO2017049129A2 (en) 2015-09-18 2017-03-23 President And Fellows Of Harvard College Methods of making guide rna
WO2017053312A1 (en) 2015-09-21 2017-03-30 The Regents Of The University Of California Compositions and methods for target nucleic acid modification
CN105132427B (en) 2015-09-21 2019-01-08 新疆畜牧科学院生物技术研究所 A kind of dual-gene method for obtaining gene editing sheep of specific knockdown mediated with RNA and its dedicated sgRNA
US10369232B2 (en) 2015-09-21 2019-08-06 Arcturus Therapeutics, Inc. Allele selective gene editing and uses thereof
EP3352776A4 (en) 2015-09-23 2019-03-13 Sangamo Therapeutics, Inc. Htt repressors and uses thereof
EP3337909B1 (en) 2015-09-24 2020-03-18 Sigma Aldrich Co. LLC Methods and reagents for molecular proximity detection using rna-guided nucleic acid binding proteins
US11667911B2 (en) 2015-09-24 2023-06-06 Editas Medicine, Inc. Use of exonucleases to improve CRISPR/CAS-mediated genome editing
WO2017064546A1 (en) 2015-09-24 2017-04-20 Crispr Therapeutics Ag Novel family of rna-programmable endonucleases and their uses in genome editing and other applications
KR101795999B1 (en) 2015-09-25 2017-11-09 전남대학교산학협력단 Primer for Beta2-Microglobulin gene remove using CRISPR/CAS9 system
WO2017053729A1 (en) 2015-09-25 2017-03-30 The Board Of Trustees Of The Leland Stanford Junior University Nuclease-mediated genome editing of primary cells and enrichment thereof
KR101745863B1 (en) 2015-09-25 2017-06-12 전남대학교산학협력단 Primer for prohibitin2 gene remove using CRISPR/CAS9 system
EP3353309A4 (en) 2015-09-25 2019-04-10 Tarveda Therapeutics, Inc. Compositions and methods for genome editing
EP3147363B1 (en) 2015-09-26 2019-10-16 B.R.A.I.N. Ag Activation of taste receptor genes in mammalian cells using crispr-cas-9
EP3356521A4 (en) 2015-09-28 2019-03-13 Temple University - Of The Commonwealth System of Higher Education Methods and compositions for rna-guided treatment of hiv infection
US20170087225A1 (en) 2015-09-29 2017-03-30 Agenovir Corporation Compositions and methods for latent viral transcription regulation
US20170088587A1 (en) 2015-09-29 2017-03-30 Agenovir Corporation Antiviral fusion proteins and genes
CN105177038B (en) 2015-09-29 2018-08-24 中国科学院遗传与发育生物学研究所 A kind of CRISPR/Cas9 systems of efficient fixed point editor Plant Genome
CN108601883A (en) 2015-09-29 2018-09-28 埃吉诺维亚公司 Delivering method and composition
WO2017058791A1 (en) 2015-09-29 2017-04-06 Agenovir Corporation Compositions and methods for treatment of latent viral infections
CN105331627B (en) 2015-09-30 2019-04-02 华中农业大学 A method of prokaryotic gene group editor is carried out using endogenous CRISPR-Cas system
EP3356520B1 (en) 2015-10-02 2022-03-23 The U.S.A. as represented by the Secretary, Department of Health and Human Services Lentiviral protein delivery system for rna-guided genome editing
CA3004710A1 (en) 2015-10-06 2017-04-13 The Children's Hospital Of Philadelphia Compositions and methods for treating fragile x syndrome and related syndromes
WO2017062754A1 (en) 2015-10-07 2017-04-13 New York University Compositions and methods for enhancing crispr activity by polq inhibition
WO2017062886A1 (en) 2015-10-08 2017-04-13 Cellink Corporation Battery interconnects
WO2017062723A1 (en) 2015-10-08 2017-04-13 President And Fellows Of Harvard College Multiplexed genome editing
AU2016335572B2 (en) 2015-10-09 2022-12-08 The Children's Hospital Of Philadelphia Compositions and methods for treating Huntington's disease and related disorders
WO2017062855A1 (en) 2015-10-09 2017-04-13 Monsanto Technology Llc Novel rna-guided nucleases and uses thereof
WO2017066175A1 (en) 2015-10-12 2017-04-20 E. I. Du Pont De Nemours And Company Protected dna templates for gene modification and increased homologous recombination in cells and methods of use
EP4089175A1 (en) 2015-10-13 2022-11-16 Duke University Genome engineering with type i crispr systems in eukaryotic cells
WO2017066707A1 (en) 2015-10-14 2017-04-20 Life Technologies Corporation Ribonucleoprotein transfection agents
CN105400779A (en) 2015-10-15 2016-03-16 芜湖医诺生物技术有限公司 Target sequence, recognized by streptococcus thermophilus CRISPR-Cas9 system, of human CCR5 gene, sgRNA and application of CRISPR-Cas9 system
FR3042506B1 (en) 2015-10-16 2018-11-30 IFP Energies Nouvelles GENETIC TOOL FOR PROCESSING BACTERIA CLOSTRIDIUM
AU2016337408B2 (en) 2015-10-16 2022-11-03 Astrazeneca Ab Inducible modification of a cell genome
WO2017066781A1 (en) 2015-10-16 2017-04-20 Modernatx, Inc. Mrna cap analogs with modified phosphate linkage
CN108778343A (en) 2015-10-16 2018-11-09 天普大学-联邦高等教育系统 The method and composition of the gene editing of guide RNA is carried out using CPF1
CN105331607A (en) 2015-10-19 2016-02-17 芜湖医诺生物技术有限公司 Human CCR5 gene target sequence recognized by streptococcus thermophilus CRISPR (clustered regularly interspaced short palindromic repeat)-Cas9 (CRISPR-associated protein 9) system, sgRNA (single guide ribonucleic acid) and application
EP3365269A4 (en) 2015-10-19 2019-06-19 The Methodist Hospital Crispr-cas9 delivery to hard-to-transfect cells via membrane deformation
WO2017068077A1 (en) 2015-10-20 2017-04-27 Institut National De La Sante Et De La Recherche Medicale (Inserm) Methods and products for genetic engineering
CA2996326A1 (en) 2015-10-20 2017-04-27 Pioneer Hi-Bred International, Inc. Methods and compositions for marker-free genome modification
CN105331608A (en) 2015-10-20 2016-02-17 芜湖医诺生物技术有限公司 Human CXCR4 gene target sequence identified by neisseria meningitidis CRISPR-Cas9 system, sgRNA and application of target sequence and sgRNA
CN105316337A (en) 2015-10-20 2016-02-10 芜湖医诺生物技术有限公司 Streptococcus thermophilus derived human CXCR3 gene target sequence recognizable by CRISPR (clustered regularly interspaced short palindromic repeat)-Cas9 (CRISPR associated 9) system and sgRNA (single guide ribonucleic acid) and application thereof
CN105331609A (en) 2015-10-20 2016-02-17 芜湖医诺生物技术有限公司 Human CCR5 gene target sequence identified by neisseria meningitidis CRISPR-Cas9 system, sgRNA and application of target sequence and sgRNA
CN105316324A (en) 2015-10-20 2016-02-10 芜湖医诺生物技术有限公司 Streptococcus thermophilus derived human CXCR3 gene target sequence recognizable by CRISPR (clustered regularly interspaced short palindromic repeat)-Cas9 (CRISPR associated 9) system and sgRNA (single guide ribonucleic acid) and application thereof
AU2016341919A1 (en) 2015-10-21 2018-04-19 Editas Medicine, Inc. CRISPR/CAS-related methods and compositions for treating hepatitis b virus
CN105219799A (en) 2015-10-22 2016-01-06 天津吉诺沃生物科技有限公司 The breeding method of a kind of English ryegrass based on CRISPR/Cas system
CN116814590A (en) 2015-10-22 2023-09-29 布罗德研究所有限公司 VI-B type CRISPR enzyme and system
DK3350327T3 (en) 2015-10-23 2019-01-21 Caribou Biosciences Inc CONSTRUCTED CRISPR CLASS-2-NUCLEIC ACID TARGETING-NUCLEIC ACID
EP3159407A1 (en) 2015-10-23 2017-04-26 Silence Therapeutics (London) Ltd Guide rnas, methods and uses
EP3365356B1 (en) 2015-10-23 2023-06-28 President and Fellows of Harvard College Nucleobase editors and uses thereof
TW201715041A (en) 2015-10-26 2017-05-01 國立清華大學 Method for bacterial genome editing
US9988637B2 (en) 2015-10-26 2018-06-05 National Tsing Hua Univeristy Cas9 plasmid, genome editing system and method of Escherichia coli
US10280411B2 (en) 2015-10-27 2019-05-07 Pacific Biosciences of California, In.c Methods, systems, and reagents for direct RNA sequencing
KR20180091821A (en) 2015-10-27 2018-08-16 리컴비네틱스 인코포레이티드 How to manipulate humanized CAR T-cells and platelets by genetic complementarity
WO2017072590A1 (en) 2015-10-28 2017-05-04 Crispr Therapeutics Ag Materials and methods for treatment of duchenne muscular dystrophy
US20180230489A1 (en) 2015-10-28 2018-08-16 Voyager Therapeutics, Inc. Regulatable expression using adeno-associated virus (aav)
WO2017074526A1 (en) 2015-10-28 2017-05-04 Sangamo Biosciences, Inc. Liver-specific constructs, factor viii expression cassettes and methods of use thereof
WO2017074962A1 (en) 2015-10-30 2017-05-04 Brandeis University Modified cas9 compositions and methods of use
CN109312338B (en) 2015-10-30 2022-09-27 爱迪塔斯医药公司 CRISPR/CAS related methods and compositions for treating herpes simplex virus
CN105238806B (en) 2015-11-02 2018-11-27 中国科学院天津工业生物技术研究所 A kind of building and its application of the CRISPR/Cas9 gene editing carrier for microorganism
CN105316327B (en) 2015-11-03 2019-01-29 中国农业科学院作物科学研究所 Wheat TaAGO4a gene C RISPR/Cas9 carrier and its application
SG11201803701YA (en) 2015-11-04 2018-06-28 Univ Pennsylvania Methods and compositions for gene editing in hematopoietic stem cells
WO2017079428A1 (en) 2015-11-04 2017-05-11 President And Fellows Of Harvard College Site specific germline modification
ES2953925T3 (en) 2015-11-04 2023-11-17 Fate Therapeutics Inc Genomic engineering of pluripotent cells
GB2544270A (en) 2015-11-05 2017-05-17 Fundació Centre De Regulació Genòmica Nucleic acids, peptides and methods
EP3371300A1 (en) 2015-11-05 2018-09-12 Centro en Investigación Biomédica en Red Process of gene-editing of cells isolated from a subject suffering from a metabolic disease affecting the erythroid lineage, cells obtained by said process and uses thereof
CA3004497A1 (en) 2015-11-06 2017-05-11 The Jackson Laboratory Large genomic dna knock-in and uses thereof
WO2017078751A1 (en) 2015-11-06 2017-05-11 The Methodist Hospital Micoluidic cell deomailiy assay for enabling rapid and efficient kinase screening via the crispr-cas9 system
WO2017081097A1 (en) 2015-11-09 2017-05-18 Ifom Fondazione Istituto Firc Di Oncologia Molecolare Crispr-cas sgrna library
WO2017083722A1 (en) 2015-11-11 2017-05-18 Greenberg Kenneth P Crispr compositions and methods of using the same for gene therapy
US11566052B2 (en) 2015-11-11 2023-01-31 Lonza Ltd. CRISPR-associated (Cas) proteins with reduced immunogenicity
US10851367B2 (en) 2015-11-12 2020-12-01 Pfizer Inc. Tissue-specific genome engineering using CRISPR-Cas9
US11306308B2 (en) 2015-11-13 2022-04-19 Massachusetts Institute Of Technology High-throughput CRISPR-based library screening
US20170191047A1 (en) 2015-11-13 2017-07-06 University Of Georgia Research Foundation, Inc. Adenosine-specific rnase and methods of use
KR101885901B1 (en) 2015-11-13 2018-08-07 기초과학연구원 RGEN RNP delivery method using 5'-phosphate removed RNA
JP7418957B2 (en) 2015-11-16 2024-01-22 リサーチ インスティチュート アット ネイションワイド チルドレンズ ホスピタル Materials and methods for the treatment of titinic myopathies and other titinopathies
CN106893739A (en) 2015-11-17 2017-06-27 香港中文大学 For the new method and system of target gene operation
CN105602987A (en) 2015-11-23 2016-05-25 深圳市默赛尔生物医学科技发展有限公司 High-efficiency knockout method for XBP1 gene in DC cell
WO2017091630A1 (en) 2015-11-23 2017-06-01 The Regents Of The University Of California Tracking and manipulating cellular rna via nuclear delivery of crispr/cas9
US20170145438A1 (en) 2015-11-24 2017-05-25 University Of South Carolina Viral Vectors for Gene Editing
JP6500293B2 (en) 2015-11-25 2019-04-17 国立大学法人群馬大学 DNA methylation editing kit and DNA methylation editing method
US10240145B2 (en) 2015-11-25 2019-03-26 The Board Of Trustees Of The Leland Stanford Junior University CRISPR/Cas-mediated genome editing to treat EGFR-mutant lung cancer
US20180346940A1 (en) 2015-11-27 2018-12-06 The Regents Of The University Of California Compositions and methods for the production of hydrocarbons, hydrogen and carbon monoxide using engineered azotobacter strains
CN105505979A (en) 2015-11-28 2016-04-20 湖北大学 Method for acquiring aromatic rice strain by targeting Badh2 gene via CRISPR/Cas9 gene editing technology
CN106811479B (en) 2015-11-30 2019-10-25 中国农业科学院作物科学研究所 The system and its application of Herbicide Resistant Rice are obtained using CRISPR/Cas9 system pointed decoration als gene
KR101906491B1 (en) 2015-11-30 2018-12-05 기초과학연구원 Composition for Genome Editing comprising Cas9 derived from F. novicida
CN105296518A (en) 2015-12-01 2016-02-03 中国农业大学 Homologous arm vector construction method used for CRISPR/Cas 9 technology
RU2634395C1 (en) 2015-12-01 2017-10-26 Федеральное государственное автономное образовательное учреждение высшего профессионального образования "Балтийский Федеральный Университет имени Иммануила Канта" (БФУ им. И. Канта) GENETIC CONSTRUCT BASED ON CRISPR/Cas9 GENOME SYSTEM EDITING, CODING Cas9 NUCLEASE, SPECIFICALLY IMPORTED IN HUMAN CELLS MITOCHONDRIA
WO2017096237A1 (en) 2015-12-02 2017-06-08 Ceres, Inc. Methods for genetic modification of plants
EP3383409A4 (en) 2015-12-02 2019-10-02 The Regents of The University of California Compositions and methods for modifying a target nucleic acid
WO2017093370A1 (en) 2015-12-03 2017-06-08 Technische Universität München T-cell specific genome editing
CN105779449B (en) 2015-12-04 2018-11-27 新疆农业大学 A kind of cotton promoters GbU6-5PS and application
CN105779448B (en) 2015-12-04 2018-11-27 新疆农业大学 A kind of cotton promoters GbU6-7PS and application
JP2018536436A (en) 2015-12-04 2018-12-13 ノバルティス アーゲー Compositions and methods for immuno-oncology
CN105462968B (en) 2015-12-07 2018-10-16 北京信生元生物医学科技有限公司 It is a kind of targeting apoC III CRISPR-Cas9 systems and its application
CN106845151B (en) 2015-12-07 2019-03-26 中国农业大学 The screening technique and device of CRISPR-Cas9 system sgRNA action target spot
WO2017100431A2 (en) 2015-12-09 2017-06-15 Excision Biotherapeutics, Inc. Gene editing methods and compositions for eliminating risk of jc virus activation and pml (progressive multifocal leukoencephalopathy) during immunosuppresive therapy
CN105463003A (en) 2015-12-11 2016-04-06 扬州大学 Recombinant vector for eliminating activity of kanamycin drug resistance gene and building method of recombinant vector
EP3387134B1 (en) 2015-12-11 2020-10-14 Danisco US Inc. Methods and compositions for enhanced nuclease-mediated genome modification and reduced off-target site effects
CN105296537A (en) 2015-12-12 2016-02-03 西南大学 Fixed-point gene editing method based on intratestis injection
CN105400773B (en) 2015-12-14 2018-06-26 同济大学 CRISPR/Cas9 applied to Large-scale Screening cancer gene is enriched with sequencing approach
WO2017105350A1 (en) 2015-12-14 2017-06-22 Cellresearch Corporation Pte Ltd A method of generating a mammalian stem cell carrying a transgene, a mammalian stem cell generated by the method and pharmaceuticals uses of the mammalian stem cell
NO343153B1 (en) 2015-12-17 2018-11-19 Hydra Systems As A method of assessing the integrity status of a barrier plug
CN105463027A (en) 2015-12-17 2016-04-06 中国农业大学 Method for preparing high muscle content and hypertrophic cardiomyopathy model cloned pig
WO2017106616A1 (en) 2015-12-17 2017-06-22 The Regents Of The University Of Colorado, A Body Corporate Varicella zoster virus encoding regulatable cas9 nuclease
IL297018A (en) 2015-12-18 2022-12-01 Sangamo Therapeutics Inc Targeted disruption of the mhc cell receptor
WO2017106657A1 (en) 2015-12-18 2017-06-22 The Broad Institute Inc. Novel crispr enzymes and systems
US11118194B2 (en) 2015-12-18 2021-09-14 The Regents Of The University Of California Modified site-directed modifying polypeptides and methods of use thereof
JP2018537106A (en) 2015-12-18 2018-12-20 ダニスコ・ユーエス・インク Methods and compositions for polymerase II (Pol-II) based guide RNA expression
US11352631B2 (en) 2015-12-18 2022-06-07 Sangamo Therapeutics, Inc. Targeted disruption of the T cell receptor
EP3390631B1 (en) 2015-12-18 2020-04-08 Danisco US Inc. Methods and compositions for t-rna based guide rna expression
JP6700306B2 (en) 2015-12-18 2020-05-27 国立研究開発法人科学技術振興機構 Pre-fertilization egg cell, fertilized egg, and method for modifying target gene
WO2017106767A1 (en) 2015-12-18 2017-06-22 The Scripps Research Institute Production of unnatural nucleotides using a crispr/cas9 system
WO2017109134A1 (en) 2015-12-22 2017-06-29 Curevac Ag Method for producing rna molecule compositions
WO2017112620A1 (en) 2015-12-22 2017-06-29 North Carolina State University Methods and compositions for delivery of crispr based antimicrobials
AU2016376191A1 (en) 2015-12-23 2018-07-12 Crispr Therapeutics Ag Materials and methods for treatment of amyotrophic lateral sclerosis and/or frontal temporal lobular degeneration
CN105543270A (en) 2015-12-24 2016-05-04 中国农业科学院作物科学研究所 Double resistance CRISPR/Cas9 carrier and application
CN105543266A (en) 2015-12-25 2016-05-04 安徽大学 CRISPR (Clustered Regularly Interspaced Short Palindromic Repeat sequences)-Cas (CRISPR-associated proteins) system in Streptomyces virginiae IBL14 and method for carrying out gene editing by using CRISPR-Cas system
CN105505976A (en) 2015-12-25 2016-04-20 安徽大学 Construction method of penicillin-producing recombined strain of streptomyces virginiae IBL14
JP2019500043A (en) 2015-12-28 2019-01-10 ノバルティス アーゲー Compositions and methods for the treatment of abnormal hemoglobinosis
CN115216459A (en) 2015-12-29 2022-10-21 孟山都技术公司 Novel CRISPR-associated transposase and use thereof
CN105441451B (en) 2015-12-31 2019-03-22 暨南大学 A kind of sgRNA targeting sequencing of special target people ABCB1 gene and application
CN105567735A (en) 2016-01-05 2016-05-11 华东师范大学 Site specific repairing carrier system and method of blood coagulation factor genetic mutation
EP3400296A1 (en) 2016-01-08 2018-11-14 Novozymes A/S Genome editing in bacillus host cells
US11441146B2 (en) 2016-01-11 2022-09-13 Christiana Care Health Services, Inc. Compositions and methods for improving homogeneity of DNA generated using a CRISPR/Cas9 cleavage system
CN105647922A (en) 2016-01-11 2016-06-08 中国人民解放军疾病预防控制所 Application of CRISPR-Cas9 system based on new gRNA (guide ribonucleic acid) sequence in preparing drugs for treating hepatitis B
US11427837B2 (en) 2016-01-12 2022-08-30 The Regents Of The University Of California Compositions and methods for enhanced genome editing
CN108779471A (en) 2016-01-14 2018-11-09 孟菲斯肉类公司 Method for extending replication capacity of body cell during cultured in vitro
WO2017123910A1 (en) 2016-01-14 2017-07-20 The Brigham And Women's Hospital, Inc. Genome editing for treating glioblastoma
EP3402327A1 (en) 2016-01-15 2018-11-21 The Jackson Laboratory Genetically modified non-human mammals by multi-cycle electroporation of cas9 protein
CN105567734A (en) 2016-01-18 2016-05-11 丹弥优生物技术(湖北)有限公司 Method for precisely editing genome DNA sequence
WO2017126987A1 (en) 2016-01-18 2017-07-27 Анатолий Викторович ЗАЗУЛЯ Red blood cells for targeted drug delivery
CN105567738A (en) 2016-01-18 2016-05-11 南开大学 Method for inducing CCR5-delta32 deletion with genome editing technology CRISPR-Cas9
US20190264186A1 (en) 2016-01-22 2019-08-29 The Broad Institute Inc. Crystal structure of crispr cpf1
CN105567689B (en) 2016-01-25 2019-04-09 重庆威斯腾生物医药科技有限责任公司 CRISPR/Cas9 targeting knockout people TCAB1 gene and its specificity gRNA
WO2018106268A1 (en) 2016-01-25 2018-06-14 Excision Biotherapeutics Rna guided eradication of human jc virus and other polyomaviruses
CN105543228A (en) 2016-01-25 2016-05-04 宁夏农林科学院 Method for transforming rice into fragrant rice rapidly
CA3011874A1 (en) 2016-01-25 2017-08-03 Excision Biotherapeutics, Inc. Methods and compositions for rna-guided treatment of hiv infection
EP3199632A1 (en) 2016-01-26 2017-08-02 ACIB GmbH Temperature-inducible crispr/cas system
CN105567688A (en) 2016-01-27 2016-05-11 武汉大学 CRISPR/SaCas9 system for gene therapy of AIDS
ES2949163T3 (en) 2016-01-29 2023-09-26 Univ Princeton Split Inteines with Exceptional Splicing Activity
JP6800171B2 (en) 2016-01-30 2020-12-16 株式会社ボナック Artificial single guide RNA and its uses
CN105647968B (en) 2016-02-02 2019-07-23 浙江大学 A kind of CRISPR/Cas9 working efficiency fast testing system and its application
CN107022562B (en) 2016-02-02 2020-07-17 中国种子集团有限公司 Method for site-directed mutagenesis of maize gene by using CRISPR/Cas9 system
WO2017136794A1 (en) 2016-02-03 2017-08-10 Massachusetts Institute Of Technology Structure-guided chemical modification of guide rna and its applications
CN105671083B (en) 2016-02-03 2017-09-29 安徽柯顿生物科技有限公司 The gene recombined virus plasmids of PD 1 and structure, the Puro of recombinant retrovirus Lenti PD 1 and packaging and application
WO2017136520A1 (en) 2016-02-04 2017-08-10 President And Fellows Of Harvard College Mitochondrial genome editing and regulation
US20190038780A1 (en) 2016-02-05 2019-02-07 Regents Of The University Of Minnesota Vectors and system for modulating gene expression
WO2017139264A1 (en) 2016-02-09 2017-08-17 President And Fellows Of Harvard College Dna-guided gene editing and regulation
EP3413908A4 (en) 2016-02-11 2019-09-25 The Regents of The University of California Methods and compositions for modifying a mutant dystrophin gene in a cell's genome
RU2016104674A (en) 2016-02-11 2017-08-16 Анатолий Викторович Зазуля ERYTHROCYT MODIFICATION DEVICE WITH DIRECTED MEDICINAL TRANSPORT MECHANISM FOR CRISPR / CAS9 GENE THERAPY FUNCTIONS
CN105647962A (en) 2016-02-15 2016-06-08 浙江大学 Gene editing method for knocking out rice MIRNA393b stem-loop sequences with application of CRISPR(clustered regulatory interspersed short palindromic repeat)-Cas9 system
WO2017142835A1 (en) 2016-02-15 2017-08-24 Temple University - Of The Commonwealth System Of Higher Education Excision of retroviral nucleic acid sequences
US9896696B2 (en) 2016-02-15 2018-02-20 Benson Hill Biosystems, Inc. Compositions and methods for modifying genomes
CN105594664B (en) 2016-02-16 2018-10-02 湖南师范大学 A kind of method of gene knockout selection and breeding stat1a Gene Deletion zebra fish
JP2019508037A (en) 2016-02-16 2019-03-28 イェール ユニバーシティーYale Universit Compositions for enhancing targeted gene editing and methods of use thereof
CN105647969B (en) 2016-02-16 2020-12-15 湖南师范大学 Method for breeding zebra fish with stat1a gene deletion by gene knockout
CN105624187A (en) 2016-02-17 2016-06-01 天津大学 Site-directed mutation method for genomes of saccharomyces cerevisiae
US11326161B2 (en) 2016-02-18 2022-05-10 President And Fellows Of Harvard College Methods and systems of molecular recording by CRISPR-Cas system
EP3420080B1 (en) 2016-02-22 2019-08-21 Caribou Biosciences, Inc. Methods for modulating dna repair outcomes
US20170275665A1 (en) 2016-02-24 2017-09-28 Board Of Regents, The University Of Texas System Direct crispr spacer acquisition from rna by a reverse-transcriptase-cas1 fusion protein
CN105646719B (en) 2016-02-24 2019-12-20 无锡市妇幼保健院 Efficient fixed-point transgenic tool and application thereof
WO2017147278A1 (en) 2016-02-25 2017-08-31 The Children's Medical Center Corporation Customized class switch of immunoglobulin genes in lymphoma and hybridoma by crispr/cas9 technology
EP3420077A4 (en) 2016-02-25 2019-12-25 Agenovir Corporation Viral and oncoviral nuclease treatment
US20170246260A1 (en) 2016-02-25 2017-08-31 Agenovir Corporation Modified antiviral nuclease
US20170247703A1 (en) 2016-02-25 2017-08-31 Agenovir Corporation Antiviral nuclease methods
KR20180110144A (en) 2016-02-26 2018-10-08 란자테크 뉴질랜드 리미티드 CRISPR / CAS system for C1-immobilized bacteria
US10538750B2 (en) 2016-02-29 2020-01-21 Agilent Technologies, Inc. Methods and compositions for blocking off-target nucleic acids from cleavage by CRISPR proteins
US11447768B2 (en) 2016-03-01 2022-09-20 University Of Florida Research Foundation, Incorporated Molecular cell diary system
CN105671070B (en) 2016-03-03 2019-03-19 江南大学 A kind of CRISPRCas9 system and its construction method for Bacillus subtilis genes group editor
KR102587132B1 (en) 2016-03-04 2023-10-11 에디타스 메디신, 인코포레이티드 Crispr-cpf1-related methods, compositions and components for cancer immunotherapy
CN105821039B (en) 2016-03-09 2020-02-07 李旭 Specific sgRNA combined with immune gene to inhibit HBV replication, expression vector and application of specific sgRNA
CN105821040B (en) 2016-03-09 2018-12-14 李旭 Combined immunization gene inhibits sgRNA, gene knockout carrier and its application of high-risk HPV expression
CN107177591A (en) 2016-03-09 2017-09-19 北京大学 SgRNA sequences using CRISPR technical editor's CCR5 genes and application thereof
CN105861547A (en) 2016-03-10 2016-08-17 黄捷 Method for permanently embedding identity card number into genome
WO2017155717A1 (en) 2016-03-11 2017-09-14 Pioneer Hi-Bred International, Inc. Novel cas9 systems and methods of use
WO2017160752A1 (en) 2016-03-14 2017-09-21 Intellia Therapeutics, Inc. Methods and compositions for gene editing
KR102532663B1 (en) 2016-03-14 2023-05-16 에디타스 메디신, 인코포레이티드 CRISPR/CAS-Related Methods and Compositions for the Treatment of Beta Dyshemoglobinosis
US11530394B2 (en) 2016-03-15 2022-12-20 University Of Massachusetts Anti-CRISPR compounds and methods of use
CN108885048B (en) 2016-03-15 2020-10-23 开利公司 Refrigerated sales cabinet
EP3219799A1 (en) 2016-03-17 2017-09-20 IMBA-Institut für Molekulare Biotechnologie GmbH Conditional crispr sgrna expression
US20200291370A1 (en) 2016-03-18 2020-09-17 President And Fellows Of Harvard College Mutant Cas Proteins
WO2017165862A1 (en) 2016-03-25 2017-09-28 Editas Medicine, Inc. Systems and methods for treating alpha 1-antitrypsin (a1at) deficiency
US11597924B2 (en) 2016-03-25 2023-03-07 Editas Medicine, Inc. Genome editing systems comprising repair-modulating enzyme molecules and methods of their use
CN106047803A (en) 2016-03-28 2016-10-26 青岛市胶州中心医院 Cell model obtained after targeted knockout of rabbit bone morphogenetic protein-2 (BMP2) gene based on CRISPR/Cas9 and application thereof
WO2017172644A2 (en) 2016-03-28 2017-10-05 The Charles Stark Draper Laboratory, Inc. Bacteria identification and antibiotic susceptibility profiling device
EP3436578B1 (en) 2016-03-30 2022-01-19 F. Hoffmann-La Roche AG Improved sortase
KR102617874B1 (en) 2016-03-30 2023-12-22 인텔리아 테라퓨틱스, 인크. Lipid nanoparticle formulations for CRISPR/CAS components
WO2017173004A1 (en) 2016-03-30 2017-10-05 Mikuni Takayasu A method for in vivo precise genome editing
GB2565461B (en) 2016-03-31 2022-04-13 Harvard College Methods and compositions for the single tube preparation of sequencing libraries using Cas9
WO2017173092A1 (en) 2016-03-31 2017-10-05 The Regents Of The University Of California Methods for genome editing in zygotes
US10597586B2 (en) 2016-03-31 2020-03-24 Exxonmobil Chemical Patents Inc. Burner, furnace, and steam cracking processes using the same
CN106167525B (en) 2016-04-01 2019-03-19 北京康明百奥新药研发有限公司 Screen the methods and applications of ultralow fucose cell line
US10301619B2 (en) 2016-04-01 2019-05-28 New England Biolabs, Inc. Compositions and methods relating to synthetic RNA polynucleotides created from synthetic DNA oligonucleotides
CN109072191B (en) 2016-04-04 2024-03-22 苏黎世联邦理工学院 Mammalian cell lines for protein production and library generation
US20190093091A1 (en) 2016-04-06 2019-03-28 Temple University - Of The Commonwealth System Of Higher Education Compositions for eradicating flavivirus infections in subjects
CN105802980A (en) 2016-04-08 2016-07-27 北京大学 CRISPR/Cas9 system with Gateway compatibility and application of CRISPR/Cas9 system
CN106399306B (en) 2016-04-12 2019-11-05 西安交通大学第一附属医院 Target sgRNA, genophore and its application that people lncRNA-UCA1 inhibits bladder cancer
WO2017180694A1 (en) 2016-04-13 2017-10-19 Editas Medicine, Inc. Cas9 fusion molecules gene editing systems, and methods of use thereof
WO2017180711A1 (en) 2016-04-13 2017-10-19 Editas Medicine, Inc. Grna fusion molecules, gene editing systems, and methods of use thereof
US20190127713A1 (en) 2016-04-13 2019-05-02 Duke University Crispr/cas9-based repressors for silencing gene targets in vivo and methods of use
EP3443085B1 (en) 2016-04-14 2022-09-14 BOCO Silicon Valley, Inc. Genome editing of human neural stem cells using nucleases
EP3442596A1 (en) 2016-04-14 2019-02-20 Université de Lausanne Treatment and/or prevention of dna-triplet repeat diseases or disorders
CN105821116A (en) 2016-04-15 2016-08-03 扬州大学 Directional knockout on sheep MSTN gene and detection method for influence thereof on myogenic differentiation
US20200172935A1 (en) 2016-04-16 2020-06-04 Ohio State Innovation Foundation Modified cpf1 mrna, modified guide rna, and uses thereof
US20190119678A1 (en) 2016-04-18 2019-04-25 Ruprecht-Karls-Universität Heidelberg Means and methods for inactivating therapeutic dna in a cell
US20190134227A1 (en) 2016-04-18 2019-05-09 The Board Of Regents Of The University Of Texas System Generation of genetically engineered animals by crispr/cas9 genome editing in spermatogonial stem cells
CA3026110A1 (en) 2016-04-19 2017-11-02 The Broad Institute, Inc. Novel crispr enzymes and systems
CN106086062A (en) 2016-04-19 2016-11-09 上海市农业科学院 A kind of tomato dna group that obtains pinpoints the method knocking out mutant
WO2017184768A1 (en) 2016-04-19 2017-10-26 The Broad Institute Inc. Novel crispr enzymes and systems
CA3026112A1 (en) 2016-04-19 2017-10-26 The Broad Institute, Inc. Cpf1 complexes with reduced indel activity
CN105886616B (en) 2016-04-20 2020-08-07 广东省农业科学院农业生物基因研究中心 Efficient specific sgRNA recognition site guide sequence for pig gene editing and screening method thereof
CN105821075B (en) 2016-04-22 2017-09-12 湖南农业大学 A kind of construction method of tea tree CaMTL5 CRISPR/Cas9 genome editor's carriers
CN107304435A (en) 2016-04-22 2017-10-31 中国科学院青岛生物能源与过程研究所 A kind of Cas9/RNA systems and its application
CN105861552B (en) 2016-04-25 2019-10-11 西北农林科技大学 A kind of construction method for the CRISPR/Cas9 gene editing system that T7 RNA polymerase mediates
US11248216B2 (en) 2016-04-25 2022-02-15 The Regents Of The University Of California Methods and compositions for genomic editing
CN107326046A (en) 2016-04-28 2017-11-07 上海邦耀生物科技有限公司 A kind of method for improving foreign gene homologous recombination efficiency
EP3449000A1 (en) 2016-04-29 2019-03-06 Sarepta Therapeutics, Inc. Oligonucleotide analogues targeting human lmna
CN105821049B (en) 2016-04-29 2019-06-04 中国农业大学 A kind of preparation method of Fbxo40 gene knock-out pig
KR20230038804A (en) 2016-04-29 2023-03-21 바스프 플랜트 사이언스 컴퍼니 게엠베하 Improved methods for modification of target nucleic acids
CN105886534A (en) 2016-04-29 2016-08-24 苏州溯源精微生物科技有限公司 Tumor metastasis inhibition method
AU2017260714B2 (en) 2016-05-01 2023-10-05 Duane CHUNG Harnessing heterologous and endogenous CRISPR-Cas machineries for efficient markerless genome editing in clostridium
WO2017192512A2 (en) 2016-05-02 2017-11-09 Massachusetts Institute Of Technology Amphiphilic nanoparticles for delivery of crispr based therapy
CN105950639A (en) 2016-05-04 2016-09-21 广州美格生物科技有限公司 Preparation method of staphylococcus aureus CRISPR/Cas9 system and application of system in constructing mouse model
US11078247B2 (en) 2016-05-04 2021-08-03 Curevac Ag RNA encoding a therapeutic protein
WO2017191210A1 (en) 2016-05-04 2017-11-09 Novozymes A/S Genome editing by crispr-cas9 in filamentous fungal host cells
WO2017193029A2 (en) 2016-05-05 2017-11-09 Duke University Crispr/cas-related methods and compositions for treating duchenne muscular dystrophy
CN106244591A (en) 2016-08-23 2016-12-21 苏州吉玛基因股份有限公司 Modify crRNA application in CRISPR/Cpf1 gene editing system
WO2017190664A1 (en) 2016-05-05 2017-11-09 苏州吉玛基因股份有限公司 Use of chemosynthetic crrna and modified crrna in crispr/cpf1 gene editing systems
CN105907785B (en) 2016-05-05 2020-02-07 苏州吉玛基因股份有限公司 Application of chemically synthesized crRNA in CRISPR/Cpf1 system in gene editing
WO2017192172A1 (en) 2016-05-05 2017-11-09 Temple University - Of The Commonwealth System Of Higher Education Rna guided eradication of varicella zoster virus
CN105985985B (en) 2016-05-06 2019-12-31 苏州大学 Preparation method of allogeneic mesenchymal stem cells edited by CRISPR technology and optimized by IGF (insulin-like growth factor) and application of allogeneic mesenchymal stem cells in treatment of myocardial infarction
US20190300872A1 (en) 2016-05-06 2019-10-03 Tod M. Woolf Improved Methods of Genome Editing with and without Programmable Nucleases
US20190161743A1 (en) 2016-05-09 2019-05-30 President And Fellows Of Harvard College Self-Targeting Guide RNAs in CRISPR System
CN105861554B (en) 2016-05-10 2020-01-31 华南农业大学 method for realizing animal sex control based on editing Rbmy gene and application
US20190225956A1 (en) 2016-05-10 2019-07-25 United States Government As Represented By The Department Of Veterans Affairs Lentiviral delivery of crispr/cas constructs that cleave genes essential for hiv-1 infection and replication
CN109152342A (en) 2016-05-12 2019-01-04 布赖恩.P.汉利 CRISPR and most of body cell of other gene therapy safe deliveries into human and animal
CN107365786A (en) 2016-05-12 2017-11-21 中国科学院微生物研究所 A kind of method and its application being cloned into spacer sequences in CRISPR-Cas9 systems
WO2017197238A1 (en) * 2016-05-12 2017-11-16 President And Fellows Of Harvard College Aav split cas9 genome editing and transcriptional regulation
KR101922989B1 (en) 2016-05-13 2018-11-28 연세대학교 산학협력단 Generation and tracking of substitution mutations in the genome using a CRISPR/Retron system
CN105907758B (en) 2016-05-18 2020-06-05 世翱(上海)生物医药科技有限公司 CRISPR-Cas9 guide sequence and primer thereof, transgenic expression vector and construction method thereof
CN106011171B (en) 2016-05-18 2019-10-11 西北农林科技大学 A kind of gene seamless edit method repaired using CRISPR/Cas9 technology based on SSA
CN105838733A (en) 2016-05-18 2016-08-10 云南省农业科学院花卉研究所 Cas9 mediated carnation gene editing carrier and application
CN106446600B (en) 2016-05-20 2019-10-18 同济大学 A kind of design method of the sgRNA based on CRISPR/Cas9
MX2018014172A (en) 2016-05-20 2019-08-22 Regeneron Pharma Methods for breaking immunological tolerance using multiple guide rnas.
US20190201551A1 (en) 2016-05-23 2019-07-04 Washington University Pulmonary targeted cas9/crispr for in vivo editing of disease genes
US20190300867A1 (en) 2016-05-23 2019-10-03 The Trustees Of Columbia University In The City Of New York Bypassing the pam requirement of the crispr-cas system
CN105950560B (en) 2016-05-24 2019-07-23 苏州系统医学研究所 Humanization PD-L1 tumor cell line and animal model and application with the cell line
CN106011167B (en) 2016-05-27 2019-11-01 上海交通大学 The method of the application and rice fertility restorer of male sterility gene OsDPW2
WO2017207589A1 (en) 2016-06-01 2017-12-07 Kws Saat Se Hybrid nucleic acid sequences for genome engineering
WO2017208247A1 (en) 2016-06-02 2017-12-07 Yissum Research Development Company Of The Hebrew University Of Jerusalem Ltd. Assay for the removal of methyl-cytosine residues from dna
AU2017274145B2 (en) 2016-06-02 2020-07-23 Sigma-Aldrich Co Llc Using programmable DNA binding proteins to enhance targeted genome modification
US11140883B2 (en) 2016-06-03 2021-10-12 Auburn University Gene editing of reproductive hormones to sterilize aquatic animals
JP2019517503A (en) 2016-06-03 2019-06-24 テンプル ユニバーシティー オブ ザ コモンウェルス システム オブ ハイヤー エデュケーション Negative feedback regulation of HIV-1 by gene editing strategies
WO2017213898A2 (en) 2016-06-07 2017-12-14 Temple University - Of The Commonwealth System Of Higher Education Rna guided compositions for preventing and treating hepatitis b virus infections
CN106119275A (en) 2016-06-07 2016-11-16 湖北大学 Based on CRISPR/Cas9 technology, nonglutinous rice strain is transformed into targeting vector and the method for waxy strain
US10767175B2 (en) 2016-06-08 2020-09-08 Agilent Technologies, Inc. High specificity genome editing using chemically modified guide RNAs
US11779657B2 (en) 2016-06-10 2023-10-10 City Of Hope Compositions and methods for mitochondrial genome editing
CN106086008B (en) 2016-06-10 2019-03-12 中国农业科学院植物保护研究所 The CRISPR/cas9 system and its application of hidden kind of TRP gene of Bemisia tabaci MED
CN109312317A (en) 2016-06-14 2019-02-05 先锋国际良种公司 CPF1 endonuclease is used for the purposes of Plant Genome modification
CN106434752A (en) 2016-06-14 2017-02-22 南通大学附属医院 Process of knocking out Wnt3a gene and verification method thereof
CN106167821A (en) 2016-06-16 2016-11-30 郑州大学 A kind of staphylococcus aureus CRISPR site detection kit and detection method
CN106167808A (en) 2016-06-16 2016-11-30 郑州大学 A kind of method eliminating mecA plasmid based on CRISPR/Cas9 technology
CN105950633B (en) 2016-06-16 2019-05-03 复旦大学 Application of the gene OsARF4 in control rice grain length and mass of 1000 kernel
CN105950626B (en) 2016-06-17 2018-09-28 新疆畜牧科学院生物技术研究所 The method of different hair color sheep is obtained based on CRISPR/Cas9 and targets the sgRNA of ASIP genes
US20190323038A1 (en) 2016-06-17 2019-10-24 Montana State Univesity Bidirectional targeting for genome editing
KR20190019168A (en) 2016-06-17 2019-02-26 더 브로드 인스티튜트, 인코퍼레이티드 Type VI CRISPR Operating System and System
US20190330603A1 (en) 2016-06-17 2019-10-31 Genesis Technologies Limited Crispr-cas system, materials and methods
KR102555713B1 (en) 2016-06-20 2023-07-14 키진 엔.브이. Methods for Targeted DNA Alteration in Plant Cells
US20170362635A1 (en) 2016-06-20 2017-12-21 University Of Washington Muscle-specific crispr/cas9 editing of genes
WO2017223107A1 (en) 2016-06-20 2017-12-28 Unity Biotechnology, Inc. Genome modifying enzyme therapy for diseases modulated by senescent cells
CA3018430A1 (en) 2016-06-20 2017-12-28 Pioneer Hi-Bred International, Inc. Novel cas systems and methods of use
CN106148370A (en) 2016-06-21 2016-11-23 苏州瑞奇生物医药科技有限公司 Fat rats animal model and construction method
JP2019522481A (en) 2016-06-22 2019-08-15 アイカーン スクール オブ メディシン アット マウント サイナイ Viral delivery of RNA using self-cleaving ribozymes and its CRISPR-based application
AU2017281497B2 (en) 2016-06-22 2023-04-06 Proqr Therapeutics Ii B.V. Single-stranded RNA-editing oligonucleotides
CN106047877B (en) 2016-06-24 2019-01-11 中山大学附属第一医院 A kind of sgRNA and CRISPR/Cas9 slow virus system of targeting knockout FTO gene and application
CN106119283A (en) 2016-06-24 2016-11-16 广西壮族自治区水牛研究所 A kind of method that the CRISPR of utilization Cas9 targeting knocks out MSTN gene
CN105925608A (en) 2016-06-24 2016-09-07 广西壮族自治区水牛研究所 Method for targeted knockout of gene ALK6 by using CRISPR-Cas9
EP3478840A1 (en) 2016-06-29 2019-05-08 Crispr Therapeutics AG Compositions and methods for gene editing
WO2018005691A1 (en) 2016-06-29 2018-01-04 The Regents Of The University Of California Efficient genetic screening method
WO2018005873A1 (en) 2016-06-29 2018-01-04 The Broad Institute Inc. Crispr-cas systems having destabilization domain
CN106148286B (en) 2016-06-29 2019-10-29 牛刚 A kind of construction method and cell model and pyrogen test kit for detecting the cell model of pyrogen
US10927383B2 (en) 2016-06-30 2021-02-23 Ethris Gmbh Cas9 mRNAs
US10892034B2 (en) 2016-07-01 2021-01-12 Microsoft Technology Licensing, Llc Use of homology direct repair to record timing of a molecular event
CN109477130B (en) 2016-07-01 2022-08-30 微软技术许可有限责任公司 Storage by iterative DNA editing
US20180004537A1 (en) 2016-07-01 2018-01-04 Microsoft Technology Licensing, Llc Molecular State Machines
KR20190039703A (en) 2016-07-05 2019-04-15 더 존스 홉킨스 유니버시티 CRISPR / CAS9-based compositions and methods for treating retinal degeneration
WO2018009520A1 (en) 2016-07-06 2018-01-11 Novozymes A/S Improving a microorganism by crispr-inhibition
CN106191057B (en) 2016-07-06 2018-12-25 中山大学 A kind of sgRNA sequence for knocking out people's CYP2E1 gene, the construction method of CYP2E1 gene deleted cell strains and its application
CN106051058A (en) 2016-07-07 2016-10-26 上海格昆机电科技有限公司 Rotating rack used for spaceflight storage tank and particle treatment instrument and transmission mechanism of rotation rack
WO2018009822A1 (en) 2016-07-08 2018-01-11 Ohio State Innovation Foundation Modified nucleic acids, hybrid guide rnas, and uses thereof
CN107586777A (en) 2016-07-08 2018-01-16 上海吉倍生物技术有限公司 People's PDCD1 genes sgRNA purposes and its related drugs
CN106047930B (en) 2016-07-12 2020-05-19 北京百奥赛图基因生物技术有限公司 Preparation method of Flox rat with conditional knockout of PS1 gene
KR102319845B1 (en) 2016-07-13 2021-11-01 디에스엠 아이피 어셋츠 비.브이. CRISPR-CAS system for avian host cells
EP3485023B1 (en) 2016-07-15 2023-11-15 Salk Institute for Biological Studies Methods and compositions for genome editing in non-dividing cells
WO2018013990A1 (en) 2016-07-15 2018-01-18 Zymergen Inc. Scarless dna assembly and genome editing using crispr/cpf1 and dna ligase
CN106191061B (en) 2016-07-18 2019-06-18 暨南大学 A kind of sgRNA targeting sequencing of special target people ABCG2 gene and its application
CN106191062B (en) 2016-07-18 2019-06-14 广东华南疫苗股份有限公司 A kind of TCR-/PD-1- double negative t cells and its construction method
CN106190903B (en) 2016-07-18 2019-04-02 华中农业大学 Riemerlla anatipestifer Cas9 gene deletion mutants and its application
CN106434651B (en) 2016-07-19 2021-05-18 广西大学 Agrobacterium tumefaciens and CRISPR-Cas9 mediated gene site-directed insertion inactivation method and application thereof
US20190151476A1 (en) 2016-07-19 2019-05-23 Duke University Therapeutic applications of cpf1-based genome editing
KR20230088522A (en) 2016-07-21 2023-06-19 맥스시티 인코포레이티드 Methods and compositions for modifying genomic dna
CN106191107B (en) 2016-07-22 2020-03-20 湖南农业大学 Molecular improvement method for reducing rice grain falling property
CN106191064B (en) 2016-07-22 2019-06-07 中国农业大学 A method of preparing MC4R gene knock-out pig
WO2018015444A1 (en) 2016-07-22 2018-01-25 Novozymes A/S Crispr-cas9 genome editing with multiple guide rnas in filamentous fungi
EP3488001A1 (en) 2016-07-25 2019-05-29 Mayo Foundation for Medical Education and Research Treating cancer
CN106222193B (en) 2016-07-26 2019-09-20 浙江大学 A kind of recombinant vector and the screening technique without transgene gene editor plant
WO2018018979A1 (en) 2016-07-26 2018-02-01 浙江大学 Recombinant plant vector and method for screening non-transgenic gene-edited strain
WO2018022634A1 (en) 2016-07-26 2018-02-01 The General Hospital Corporation Variants of crispr from prevotella and francisella 1 (cpf1)
CN106191099A (en) 2016-07-27 2016-12-07 苏州泓迅生物科技有限公司 A kind of parallel multiple editor's carrier of genes of brewing yeast group based on CRISPR Cas9 system and application thereof
CN106086061A (en) 2016-07-27 2016-11-09 苏州泓迅生物科技有限公司 A kind of genes of brewing yeast group editor's carrier based on CRISPR Cas9 system and application thereof
WO2018021878A1 (en) 2016-07-28 2018-02-01 주식회사 비엠티 Heating jacket for outdoor piping
CN106191113B (en) 2016-07-29 2020-01-14 中国农业大学 Preparation method of MC3R gene knockout pig
CN106191124B (en) 2016-07-29 2019-10-11 中国科学院重庆绿色智能技术研究院 It is a kind of to save the fish breeding method that liquid improves CRISPR-Cas9 gene editing and passaging efficiency using fish-egg
CN106191114B (en) 2016-07-29 2020-02-11 中国科学院重庆绿色智能技术研究院 Breeding method for knocking out fish MC4R gene by using CRISPR-Cas9 system
GB201613135D0 (en) 2016-07-29 2016-09-14 Medical Res Council Genome editing
CN106434748A (en) 2016-07-29 2017-02-22 中国科学院重庆绿色智能技术研究院 Development and applications of heat shock induced Cas9 enzyme transgene danio rerio
EP3491134B1 (en) 2016-08-01 2023-10-11 University of Pittsburgh - of The Commonwealth System of Higher Education Human induced pluripotent stem cells for high efficiency genetic engineering
CN106434688A (en) 2016-08-01 2017-02-22 云南纳博生物科技有限公司 Artificial fixed-point rice dense and erect panicle (DEP1) gene mutant body and application thereof
CN106011150A (en) 2016-08-01 2016-10-12 云南纳博生物科技有限公司 Rice grain number per ear Gn1a gene artificial site-directed mutant and application thereof
US11566263B2 (en) 2016-08-02 2023-01-31 Editas Medicine, Inc. Compositions and methods for treating CEP290 associated disease
WO2018025206A1 (en) 2016-08-02 2018-02-08 Kyoto University Method for genome editing
GB2568182A (en) 2016-08-03 2019-05-08 Harvard College Adenosine nucleobase editors and uses thereof
CN106282241A (en) 2016-08-05 2017-01-04 无锡市第二人民医院 The method obtaining knocking out the Brachydanio rerio of bmp2a gene by CRISPR/Cas9
AU2017308889B2 (en) 2016-08-09 2023-11-09 President And Fellows Of Harvard College Programmable Cas9-recombinase fusion proteins and uses thereof
CN106222203A (en) 2016-08-10 2016-12-14 云南纳博生物科技有限公司 CRISPR/Cas technology is utilized to obtain bombyx mori silk fibroin heavy chain gene mutant and mutation method and application
KR101710026B1 (en) 2016-08-10 2017-02-27 주식회사 무진메디 Composition comprising delivery carrier of nano-liposome having Cas9 protein and guide RNA
CN106172238B (en) 2016-08-12 2019-01-22 中南大学 The construction method of miR-124 knock out mice animal model and application
CN106222177B (en) 2016-08-13 2018-06-26 江苏集萃药康生物科技有限公司 A kind of CRISPR-Cas9 systems for targeting people STAT6 and its application for treating anaphylactia
US20210166783A1 (en) 2016-08-17 2021-06-03 The Broad Institute, Inc. Methods for identifying class 2 crispr-cas systems
WO2018035300A1 (en) 2016-08-17 2018-02-22 The Regents Of The University Of California Split trans-complementing gene-drive system for suppressing aedes aegypti mosquitos
US11810649B2 (en) 2016-08-17 2023-11-07 The Broad Institute, Inc. Methods for identifying novel gene editing elements
WO2018035503A1 (en) 2016-08-18 2018-02-22 The Regents Of The University Of California Crispr-cas genome engineering via a modular aav delivery system
AU2017312132A1 (en) 2016-08-19 2019-03-21 Bluebird Bio, Inc. Genome editing enhancers
KR102594051B1 (en) 2016-08-20 2023-10-26 아벨리노 랩 유에스에이, 인크. Single guide RNA, CRISPR/Cas9 system, and methods of use thereof
CN106191071B (en) 2016-08-22 2018-09-04 广州资生生物科技有限公司 A kind of CRISPR-Cas9 systems and its application for treating breast cancer disease
CN106191116B (en) 2016-08-22 2019-10-08 西北农林科技大学 Foreign gene based on CRISPR/Cas9 knocks in integration system and its method for building up and application
CN106244555A (en) 2016-08-23 2016-12-21 广州医科大学附属第三医院 A kind of method of efficiency improving gene targeting and the base in-situ remediation method in beta globin gene site
CN106086028B (en) 2016-08-23 2019-04-23 中国农业科学院作物科学研究所 A kind of method by genome editor raising rice resistance starch content and its dedicated sgRNA
BR112019003327A2 (en) 2016-08-24 2019-07-02 Sangamo Therapeutics Inc specific target engineered nucleases
CN106109417A (en) 2016-08-24 2016-11-16 李因传 A kind of bionical lipidosome drug carrier of liver plasma membrane, manufacture method and application thereof
US11542509B2 (en) 2016-08-24 2023-01-03 President And Fellows Of Harvard College Incorporation of unnatural amino acids into proteins using base editing
IL264639B2 (en) 2016-08-24 2024-01-01 Sangamo Therapeutics Inc Regulation of globulin gene expression using engineered zinc finger nucleases
CN106244609A (en) 2016-08-24 2016-12-21 浙江理工大学 The screening system of a kind of Noncoding gene regulating PI3K AKT signal path and screening technique
KR101856345B1 (en) 2016-08-24 2018-06-20 경상대학교산학협력단 Method for generation of APOBEC3H and APOBEC3CH double-knocked out cat using CRISPR/Cas9 system
CN106544357B (en) 2016-08-25 2018-08-21 湖南杂交水稻研究中心 A method of cultivating low cadmium-accumulation rice variety
CN107784200B (en) 2016-08-26 2020-11-06 深圳华大生命科学研究院 Method and device for screening novel CRISPR-Cas system
CN106350540A (en) 2016-08-26 2017-01-25 苏州系统医学研究所 High-efficient inducible type CRISPR/Cas9 gene knockout carrier mediated by lentivirus and application thereof
CN106318973B (en) 2016-08-26 2019-09-13 深圳市第二人民医院 A kind of gene regulation device and gene regulation method based on CRISPR-Cas9
CN106244557B (en) 2016-08-29 2019-10-25 中国农业科学院北京畜牧兽医研究所 The method of rite-directed mutagenesis ApoE gene and LDLR gene
CN106480097A (en) 2016-10-13 2017-03-08 南京凯地生物科技有限公司 Knocking out that people PD 1 is gene constructed using CRISPR/Cas9 technology can the method for targeting MSLN novel C AR T cell and its application
CN106399367A (en) 2016-08-31 2017-02-15 深圳市卫光生物制品股份有限公司 Method for improving efficiency of CRISPR mediated homologous recombination
CN106399375A (en) 2016-08-31 2017-02-15 南京凯地生物科技有限公司 Method for constructing CD19 targeting CAR-T (chimeric antigen receptor-T) cells by knocking out PD-1 (programmed death 1) genes by virtue of CRISPR/Cas9
CN107794272B (en) 2016-09-06 2021-10-12 中国科学院上海营养与健康研究所 High-specificity CRISPR genome editing system
CN106399311A (en) 2016-09-07 2017-02-15 同济大学 Endogenous protein marking method used for Chip-seq genome-wide binding spectrum
US20180105806A1 (en) 2016-09-07 2018-04-19 Massachusetts Institute Of Technology Method for rna-guided endonuclease-based dna assembly
WO2018049073A1 (en) 2016-09-07 2018-03-15 Flagship Pioneering, Inc. Methods and compositions for modulating gene expression
CN106399377A (en) 2016-09-07 2017-02-15 同济大学 Method for screening drug target genes based on CRISPR/Cas9 high-throughput technology
CN106367435B (en) 2016-09-07 2019-11-08 电子科技大学 A kind of method that rice miRNA orientation knocks out
CN107574179B (en) 2016-09-09 2018-07-10 康码(上海)生物科技有限公司 A kind of CRISPR/Cas9 high efficiency gene editing systems for kluyveromyces optimization
EP3510151A4 (en) * 2016-09-09 2020-04-15 The Board of Trustees of the Leland Stanford Junior University High-throughput precision genome editing
US11485971B2 (en) 2016-09-14 2022-11-01 Yeda Research And Development Co. Ltd. CRISP-seq, an integrated method for massively parallel single cell RNA-seq and CRISPR pooled screens
CN106318934B (en) 2016-09-21 2020-06-05 上海交通大学 Gene complete sequence of carrot β (1,2) xylose transferase and plasmid construction of CRISPR/CAS9 for transfecting dicotyledonous plants
US20180127786A1 (en) 2016-09-23 2018-05-10 Casebia Therapeutics Limited Liability Partnership Compositions and methods for gene editing
WO2017216392A1 (en) 2016-09-23 2017-12-21 Dsm Ip Assets B.V. A guide-rna expression system for a host cell
US9580698B1 (en) 2016-09-23 2017-02-28 New England Biolabs, Inc. Mutant reverse transcriptase
CN106957858A (en) 2016-09-23 2017-07-18 西北农林科技大学 A kind of method that utilization CRISPR/Cas9 systems knock out sheep MSTN, ASIP, BCO2 gene jointly
EP3497215B1 (en) 2016-09-28 2024-01-10 Cellivery Therapeutics, Inc. Cell-permeable (cp)-cas9 recombinant protein and uses thereof
EP3523426A4 (en) 2016-09-30 2020-01-22 The Regents of The University of California Rna-guided nucleic acid modifying enzymes and methods of use thereof
CN107880132B (en) 2016-09-30 2022-06-17 北京大学 Fusion protein and method for carrying out homologous recombination by using same
CN106480027A (en) 2016-09-30 2017-03-08 重庆高圣生物医药有限责任公司 CRISPR/Cas9 targeting knock out people PD 1 gene and its specificity gRNA
EP3518656A4 (en) 2016-09-30 2020-09-30 Monsanto Technology LLC Method for selecting target sites for site-specific genome modification in plants
CN107881184B (en) 2016-09-30 2021-08-27 中国科学院分子植物科学卓越创新中心 Cpf 1-based DNA in-vitro splicing method
GB2569734B (en) 2016-09-30 2022-09-07 Univ California RNA-guided nucleic acid modifying enzymes and methods of use thereof
EP3518981A4 (en) 2016-10-03 2020-06-10 President and Fellows of Harvard College Delivery of therapeutic rnas via arrdc1-mediated microvesicles
WO2018067846A1 (en) 2016-10-05 2018-04-12 President And Fellows Of Harvard College Methods of crispr mediated genome modulation in v. natriegens
US10669539B2 (en) 2016-10-06 2020-06-02 Pioneer Biolabs, Llc Methods and compositions for generating CRISPR guide RNA libraries
CN110462034A (en) 2016-10-07 2019-11-15 综合Dna技术公司 Streptococcus pyogenes CAS9 mutated gene and polypeptide encoded by it
CN106479985A (en) 2016-10-09 2017-03-08 上海吉玛制药技术有限公司 Application of the virus-mediated Cpf1 albumen in CRISPR/Cpf1 gene editing system
WO2018071623A2 (en) 2016-10-12 2018-04-19 Temple University - Of The Commonwealth System Of Higher Education Combination therapies for eradicating flavivirus infections in subjects
CN106434663A (en) 2016-10-12 2017-02-22 遵义医学院 Method for CRISPR/Cas9 targeted knockout of human ezrin gene enhancer key region and specific gRNA thereof
IT201600102542A1 (en) 2016-10-12 2018-04-12 Univ Degli Studi Di Trento Plasmid and lentiviral system containing a self-limiting Cas9 circuit that increases its safety.
AU2017341926B2 (en) 2016-10-14 2022-06-30 The General Hospital Corporation Epigenetically regulated site-specific nucleases
CN106434782B (en) 2016-10-14 2020-01-10 南京工业大学 Method for producing cis-4-hydroxyproline
US20190330620A1 (en) 2016-10-14 2019-10-31 Emendobio Inc. Rna compositions for genome editing
KR102622411B1 (en) 2016-10-14 2024-01-10 프레지던트 앤드 펠로우즈 오브 하바드 칼리지 AAV delivery of nucleobase editor
US11840694B2 (en) 2016-10-17 2023-12-12 Nanyang Technological University Truncated CRISPR-Cas proteins for DNA targeting
US10640810B2 (en) 2016-10-19 2020-05-05 Drexel University Methods of specifically labeling nucleic acids using CRISPR/Cas
WO2018081534A1 (en) 2016-10-28 2018-05-03 President And Fellows Of Harvard College Assay for exo-site binding molecules
WO2018081535A2 (en) 2016-10-28 2018-05-03 Massachusetts Institute Of Technology Dynamic genome engineering
EP3532616A1 (en) 2016-10-28 2019-09-04 Editas Medicine, Inc. Crispr/cas-related methods and compositions for treating herpes simplex virus
WO2018080573A1 (en) 2016-10-28 2018-05-03 Massachusetts Institute Of Technology Crispr/cas global regulator screening platform
WO2018079134A1 (en) 2016-10-31 2018-05-03 株式会社江口高周波 Reactor
US11795453B2 (en) 2016-10-31 2023-10-24 Emendobio, Inc. Compositions for genome editing
WO2018083606A1 (en) 2016-11-01 2018-05-11 Novartis Ag Methods and compositions for enhancing gene editing
WO2018085288A1 (en) 2016-11-01 2018-05-11 President And Fellows Of Harvard College Inhibitors of rna guided nucleases and uses thereof
GB201618507D0 (en) 2016-11-02 2016-12-14 Stichting Voor De Technische Wetenschappen And Wageningen Univ Microbial genome editing
US11732258B2 (en) 2016-11-02 2023-08-22 President And Fellows Of Harvard College Engineered guide RNA sequences for in situ detection and sequencing
CN106544353A (en) 2016-11-08 2017-03-29 宁夏医科大学总医院 A kind of method that utilization CRISPR Cas9 remove Acinetobacter bauamnnii drug resistance gene
EP3538561A4 (en) 2016-11-11 2020-10-21 The Regents of The University of California Variant rna-guided polypeptides and methods of use
CN106755088A (en) 2016-11-11 2017-05-31 广东万海细胞生物科技有限公司 A kind of autologous CAR T cells preparation method and application
JP2019523011A (en) 2016-11-14 2019-08-22 インスティテュート・オブ・ジェネティクス・アンド・ディヴェロプメンタル・バイオロジー、チャイニーズ・アカデミー・オブ・サイエンシズInstitute of Genetics and Developmental Biology, Chinese Academy of Sciences Methods for base editing in plants
CN106566838B (en) 2016-11-14 2019-11-01 上海伯豪生物技术有限公司 A kind of miR-126 full-length gene knockout kit and its application based on CRISPR-Cas9 technology
CN106554969A (en) 2016-11-15 2017-04-05 陕西理工学院 Mutiple Targets CRISPR/Cas9 expression vectors based on bacteriostasis and sterilization
CN106754912B (en) 2016-11-16 2019-11-08 上海交通大学 One kind orientation removes the plasmid and preparation of HBVcccDNA in liver cell
CN110139927A (en) 2016-11-16 2019-08-16 加利福尼亚大学董事会 CRISPR-CAS9 inhibitor
US20180282722A1 (en) 2016-11-21 2018-10-04 Massachusetts Institute Of Technology Chimeric DNA:RNA Guide for High Accuracy Cas9 Genome Editing
CN106480067A (en) 2016-11-21 2017-03-08 中国农业科学院烟草研究所 The old and feeble application of Nicotiana tabacum L. NtNAC096 Gene Handling Nicotiana tabacum L.
JP2019535287A (en) 2016-11-22 2019-12-12 インテグレイテツド・デイー・エヌ・エイ・テクノロジーズ・インコーポレイテツド CRISPR / CPF1 system and method
CN106755091A (en) 2016-11-28 2017-05-31 中国人民解放军第三军医大学第附属医院 Gene knockout carrier, MH7A cell NLRP1 gene knockout methods
MX2019006157A (en) 2016-11-28 2019-11-21 Univ Texas Prevention of muscular dystrophy by crispr/cpf1-mediated gene editing.
CN106480036B (en) 2016-11-30 2019-04-09 华南理工大学 A kind of DNA fragmentation and its application with promoter function
CN106834323A (en) 2016-12-01 2017-06-13 安徽大学 A kind of gene editing method based on Virginia streptomycete IBL14 genes cas7 53
CA3045335A1 (en) 2016-12-01 2018-06-07 Universite Laval Crispr-based treatment of friedreich ataxia
CN107043779B (en) 2016-12-01 2020-05-12 中国农业科学院作物科学研究所 Application of CRISPR/nCas 9-mediated site-specific base substitution in plants
US9816093B1 (en) 2016-12-06 2017-11-14 Caribou Biosciences, Inc. Engineered nucleic acid-targeting nucleic acids
WO2018103686A1 (en) 2016-12-07 2018-06-14 中国科学院上海生命科学研究院 Chloroplast genome editing method
CN106701830B (en) 2016-12-07 2020-01-03 湖南人文科技学院 Pig embryo p66 knock-outshcMethod for gene
IL267024B2 (en) 2016-12-08 2023-12-01 Intellia Therapeutics Inc MODIFIED GUIDE RNAs FOR GENOMIC EDITING
US11192929B2 (en) 2016-12-08 2021-12-07 Regents Of The University Of Minnesota Site-specific DNA base editing using modified APOBEC enzymes
CN106544351B (en) 2016-12-08 2019-09-10 江苏省农业科学院 CRISPR-Cas9 knock out in vitro drug resistant gene mcr-1 method and its dedicated cell-penetrating peptides
WO2018107103A1 (en) 2016-12-09 2018-06-14 The Broad Institute, Inc. Crispr-systems for modifying a trait of interest in a plant
SI3551753T1 (en) 2016-12-09 2022-09-30 The Broad Institute, Inc. Crispr effector system based diagnostics
US11293022B2 (en) 2016-12-12 2022-04-05 Integrated Dna Technologies, Inc. Genome editing enhancement
WO2018111946A1 (en) 2016-12-12 2018-06-21 Integrated Dna Technologies, Inc. Genome editing detection
CN107893074A (en) 2016-12-13 2018-04-10 广东赤萌医疗科技有限公司 A kind of gRNA, expression vector, knockout system, kit for being used to knock out CXCR4 genes
US11242513B2 (en) 2016-12-14 2022-02-08 Wageningen Universiteit Thermostable Cas9 nucleases
WO2018109101A1 (en) 2016-12-14 2018-06-21 Wageningen Universiteit Thermostable cas9 nucleases
KR101748575B1 (en) 2016-12-16 2017-06-20 주식회사 엠젠플러스 INSulin gene knockout diabetes mellitus or diabetic complications animal model and a method for producing the same
WO2018112336A1 (en) 2016-12-16 2018-06-21 Ohio State Innovation Foundation Systems and methods for dna-guided rna cleavage
CN106755026A (en) 2016-12-18 2017-05-31 吉林大学 The foundation of the structure and enamel hypocalcification model of sgRNA expression vectors
WO2018112446A2 (en) 2016-12-18 2018-06-21 Selonterra, Inc. Use of apoe4 motif-mediated genes for diagnosis and treatment of alzheimer's disease
WO2018119359A1 (en) 2016-12-23 2018-06-28 President And Fellows Of Harvard College Editing of ccr5 receptor gene to protect against hiv infection
GB2605925B (en) 2016-12-23 2023-02-22 Harvard College Gene editing of PCSK9
CN106755424B (en) 2016-12-26 2020-11-06 郑州大学 Escherichia coli ST131 strain detection primer, kit and detection method based on CRISPR
CN107354173A (en) 2016-12-26 2017-11-17 浙江省医学科学院 The method that liver specificity knock-out mice model is established based on CRISPR technologies and hydrodynamic force tail vein injection
CN106834347A (en) 2016-12-27 2017-06-13 安徽省农业科学院畜牧兽医研究所 A kind of goat CDK2 gene knockout carriers and its construction method
CN106755097A (en) 2016-12-27 2017-05-31 安徽省农业科学院畜牧兽医研究所 A kind of goat TLR4 gene knockout carriers and its construction method
CN106597260B (en) 2016-12-29 2020-04-03 合肥工业大学 Analog circuit fault diagnosis method based on continuous wavelet analysis and ELM network
CN106834341B (en) 2016-12-30 2020-06-16 中国农业大学 Gene site-directed mutagenesis vector and construction method and application thereof
CN106755077A (en) 2016-12-30 2017-05-31 华智水稻生物技术有限公司 Using CRISPR CAS9 technologies to the method for paddy rice CENH3 site-directed point mutations
CN106701763B (en) 2016-12-30 2019-07-19 重庆高圣生物医药有限责任公司 CRISPR/Cas9 targeting knockout human hepatitis B virus P gene and its specificity gRNA
CN106868008A (en) 2016-12-30 2017-06-20 重庆高圣生物医药有限责任公司 CRISPR/Cas9 targeting knock outs people Lin28A genes and its specificity gRNA
CN106701818B (en) 2017-01-09 2020-04-24 湖南杂交水稻研究中心 Method for cultivating common genic male sterile line of rice
US20190352634A1 (en) 2017-01-11 2019-11-21 Oxford University Innovation Limited Crispr rna
CN107012164B (en) 2017-01-11 2023-03-03 电子科技大学 CRISPR/Cpf1 plant genome directed modification functional unit, vector containing functional unit and application of functional unit
WO2018135838A2 (en) 2017-01-17 2018-07-26 기초과학연구원 Method for identifying base editing off-target site by dna single strand break
US20180201921A1 (en) 2017-01-18 2018-07-19 Excision Biotherapeutics, Inc. CRISPRs
CN106701823A (en) 2017-01-18 2017-05-24 上海交通大学 Establishment and application of CHO cell line for producing fucose-free monoclonal antibody
CN107058372A (en) 2017-01-18 2017-08-18 四川农业大学 A kind of construction method of CRISPR/Cas9 carriers applied on plant
CN106801056A (en) 2017-01-24 2017-06-06 中国科学院广州生物医药与健康研究院 The slow virus carrier and application of a kind of sgRNA and its structure
JP2020505074A (en) 2017-01-30 2020-02-20 カー・ヴェー・エス ザート エス・エー ウント コー. カー・ゲー・アー・アーKWS SAAT SE & Co. KGaA Binding repair templates to endonucleases for genome engineering
TWI608100B (en) 2017-02-03 2017-12-11 國立清華大學 Cas9 expression plasmid, gene editing system of escherichia coli and method thereof
TW201839136A (en) 2017-02-06 2018-11-01 瑞士商諾華公司 Compositions and methods for the treatment of hemoglobinopathies
US10465187B2 (en) 2017-02-06 2019-11-05 Trustees Of Boston University Integrated system for programmable DNA methylation
AU2018218280A1 (en) 2017-02-07 2019-08-29 The Regents Of The University Of California Gene therapy for haploinsufficiency
US20190345501A1 (en) 2017-02-07 2019-11-14 Massachusetts Institute Of Technology Methods and compositions for rna-guided genetic circuits
WO2018148647A2 (en) 2017-02-10 2018-08-16 Lajoie Marc Joseph Genome editing reagents and their use
IT201700016321A1 (en) 2017-02-14 2018-08-14 Univ Degli Studi Di Trento HIGH-SPECIFICITY CAS9 MUTANTS AND THEIR APPLICATIONS.
WO2018149915A1 (en) 2017-02-15 2018-08-23 Keygene N.V. Methods of targeted genetic alteration in plant cells
US20200063127A1 (en) 2017-02-15 2020-02-27 Massachusetts Institute Of Technology Dna writers, molecular recorders and uses thereof
CN106957855B (en) 2017-02-16 2020-04-17 上海市农业科学院 Method for targeted knockout of rice dwarf gene SD1 by using CRISPR/Cas9 technology
WO2018152418A1 (en) 2017-02-17 2018-08-23 Temple University - Of The Commonwealth System Of Higher Education Gene editing therapy for hiv infection via dual targeting of hiv genome and ccr5
CA3053861A1 (en) 2017-02-20 2018-08-23 Institute Of Genetics And Developmental Biology, Chinese Academy Of Sciences Genome editing method
US20200248168A1 (en) 2017-02-22 2020-08-06 Crispr Therapeutics Ag Compositions and methods for treatment of proprotein convertase subtilisin/kexin type 9 (pcsk9)-related disorders
EP3585899A1 (en) 2017-02-22 2020-01-01 CRISPR Therapeutics AG Materials and methods for treatment of primary hyperoxaluria type 1 (ph1) and other alanine-glyoxylate aminotransferase (agxt) gene related conditions or disorders
EP3585896A1 (en) 2017-02-22 2020-01-01 CRISPR Therapeutics AG Materials and methods for treatment of merosin-deficient cogenital muscular dystrophy (mdcmd) and other laminin, alpha 2 (lama2) gene related conditions or disorders
WO2018156372A1 (en) 2017-02-22 2018-08-30 The Regents Of The University Of California Genetically modified non-human animals and products thereof
JP2020508056A (en) 2017-02-22 2020-03-19 クリスパー・セラピューティクス・アクチェンゲゼルシャフトCRISPR Therapeutics AG Compositions and methods for gene editing
EP3585898A1 (en) 2017-02-22 2020-01-01 CRISPR Therapeutics AG Materials and methods for treatment of spinocerebellar ataxia type 1 (sca1) and other spinocerebellar ataxia type 1 protein (atxn1) gene related conditions or disorders
US20200216857A1 (en) 2017-02-22 2020-07-09 Crispr Therapeutics Ag Materials and methods for treatment of spinocerebellar ataxia type 2 (sca2) and other spinocerebellar ataxia type 2 protein (atxn2) gene related conditions or disorders
US20190365929A1 (en) 2017-02-22 2019-12-05 Crispr Therapeutics Ag Materials and methods for treatment of dystrophic epidermolysis bullosa (deb) and other collagen type vii alpha 1 chain (col7a1) gene related conditions or disorders
US20200040061A1 (en) 2017-02-22 2020-02-06 Crispr Therapeutics Ag Materials and methods for treatment of early onset parkinson's disease (park1) and other synuclein, alpha (snca) gene related conditions or disorders
US20190380314A1 (en) 2017-02-23 2019-12-19 President And Fellows Of Harvard College Methods of Genetic Modification of a Cell
CN106868031A (en) 2017-02-24 2017-06-20 北京大学 A kind of cloning process of multiple sgRNA series parallels expression based on classification assembling and application
WO2018161009A1 (en) 2017-03-03 2018-09-07 Yale University Aav-mediated direct in vivo crispr screen in glioblastoma
US11111492B2 (en) 2017-03-06 2021-09-07 Florida State University Research Foundation, Inc. Genome engineering methods using a cytosine-specific Cas9
US11898179B2 (en) 2017-03-09 2024-02-13 President And Fellows Of Harvard College Suppression of pain by gene editing
CN110662556A (en) 2017-03-09 2020-01-07 哈佛大学的校长及成员们 Cancer vaccine
WO2018165629A1 (en) * 2017-03-10 2018-09-13 President And Fellows Of Harvard College Cytosine to guanine base editor
EP3595694A4 (en) 2017-03-14 2021-06-09 The Regents of The University of California Engineering crispr cas9 immune stealth
EP3596218B1 (en) 2017-03-15 2023-08-23 The Broad Institute, Inc. Crispr effector system based diagnostics for virus detection
CN106978428A (en) 2017-03-15 2017-07-25 上海吐露港生物科技有限公司 A kind of Cas albumen specific bond target DNA, the method for regulation and control target gene transcription and kit
CN106906242A (en) 2017-03-16 2017-06-30 重庆高圣生物医药有限责任公司 A kind of method that raising CRIPSR/Cas9 targeting knock outs gene produces nonhomologous end joint efficiency
CA3057330A1 (en) 2017-03-21 2018-09-27 Anthony P. Shuber Treating cancer with cas endonuclease complexes
EP3601562A1 (en) 2017-03-23 2020-02-05 President and Fellows of Harvard College Nucleobase editors comprising nucleic acid programmable dna binding proteins
CN107012213A (en) 2017-03-24 2017-08-04 南开大学 The biomarker of colorectal cancer
CN106947780A (en) 2017-03-28 2017-07-14 扬州大学 A kind of edit methods of rabbit MSTN genes
US10876101B2 (en) 2017-03-28 2020-12-29 Locanabio, Inc. CRISPR-associated (Cas) protein
CN106906240A (en) 2017-03-29 2017-06-30 浙江大学 The method that the key gene HPT in barley VE synthesis paths is knocked out with CRISPR Cas9 systems
CA3058584A1 (en) 2017-03-30 2018-10-04 Kyoto University Method for inducing exon skipping by genome editing
CN108660161B (en) 2017-03-31 2023-05-09 中国科学院脑科学与智能技术卓越创新中心 Method for preparing chimeric gene-free knockout animal based on CRISPR/Cas9 technology
CN107058358B (en) 2017-04-01 2020-06-09 中国科学院微生物研究所 Construction of double-spacer sequence recognition and cleavage CRISPR-Cas9 vector and application of vector in Verticillium daemonii
US9938288B1 (en) 2017-04-05 2018-04-10 President And Fellows Of Harvard College Macrocyclic compound and uses thereof
CN106967726B (en) 2017-04-05 2020-12-29 华南农业大学 Method for creating interspecific hybrid compatible line of Asian cultivated rice and African cultivated rice and application
CN107142282A (en) 2017-04-06 2017-09-08 中山大学 A kind of method that utilization CRISPR/Cas9 realizes large fragment DNA site-directed integration in mammalian cell
CN107034229A (en) 2017-04-07 2017-08-11 江苏贝瑞利生物科技有限公司 High frequency zone CRISPR/CAS9 gene editings system candidate sgRNA systems and application in a kind of plant
CN110709513B (en) 2017-04-11 2023-10-03 豪夫迈·罗氏有限公司 Mutant reverse transcriptases with increased thermostability and products, methods and uses thereof
WO2018191388A1 (en) 2017-04-12 2018-10-18 The Broad Institute, Inc. Novel type vi crispr orthologs and systems
CN107058320B (en) 2017-04-12 2019-08-02 南开大学 The preparation and its application of IL7R gene delection zebra fish mutant
CN106916852B (en) 2017-04-13 2020-12-04 上海科技大学 Base editing system and construction and application method thereof
CN108728476A (en) 2017-04-14 2018-11-02 复旦大学 A method of generating diversity antibody library using CRISPR systems
CN107298701B (en) 2017-04-18 2020-10-30 上海大学 Corn transcription factor ZmbZIP22 and application thereof
WO2018195402A1 (en) 2017-04-20 2018-10-25 Egenesis, Inc. Methods for generating genetically modified animals
CN106957844A (en) 2017-04-20 2017-07-18 华侨大学 It is a kind of effectively to knock out the virus genomic CRISPR/Cas9 of HTLV 1 gRNA sequences
US11591589B2 (en) 2017-04-21 2023-02-28 The General Hospital Corporation Variants of Cpf1 (Cas12a) with altered PAM specificity
WO2018195555A1 (en) 2017-04-21 2018-10-25 The Board Of Trustees Of The Leland Stanford Junior University Crispr/cas 9-mediated integration of polynucleotides by sequential homologous recombination of aav donor vectors
CN107043775B (en) 2017-04-24 2020-06-16 中国农业科学院生物技术研究所 sgRNA capable of promoting development of cotton lateral roots and application thereof
EP3615665A1 (en) 2017-04-24 2020-03-04 DuPont Nutrition Biosciences ApS Novel anti-crispr genes and proteins and methods of use
US20180312822A1 (en) 2017-04-26 2018-11-01 10X Genomics, Inc. Mmlv reverse transcriptase variants
CN206970581U (en) 2017-04-26 2018-02-06 重庆威斯腾生物医药科技有限责任公司 A kind of kit for being used to aid in CRISPR/cas9 gene knockouts
WO2018197020A1 (en) 2017-04-27 2018-11-01 Novozymes A/S Genome editing by crispr-cas9 using short donor oligonucleotides
EP3619305A1 (en) 2017-05-03 2020-03-11 KWS SAAT SE & Co. KGaA Use of crispr-cas endonucleases for plant genome engineering
CN107012174A (en) 2017-05-04 2017-08-04 昆明理工大学 Application of the CRISPR/Cas9 technologies in silkworm zinc finger protein gene mutant is obtained
CN110785489A (en) 2017-05-04 2020-02-11 宾夕法尼亚大学董事会 Compositions and methods for gene editing in T cells using CRISPR/Cpf1
CN107254485A (en) 2017-05-08 2017-10-17 南京农业大学 A kind of new reaction system for being capable of rapid build plant gene fixed point knockout carrier
WO2018208755A1 (en) 2017-05-09 2018-11-15 The Regents Of The University Of California Compositions and methods for tagging target proteins in proximity to a nucleotide sequence of interest
CN107129999A (en) 2017-05-09 2017-09-05 福建省农业科学院畜牧兽医研究所 Using surely turn CRISPR/Cas9 systems to viral genome carry out target editor method
EP3622070A2 (en) 2017-05-10 2020-03-18 Editas Medicine, Inc. Crispr/rna-guided nuclease systems and methods
CN110869498A (en) 2017-05-10 2020-03-06 加利福尼亚大学董事会 CRISPR/CAS9 directed editing of cellular RNA via nuclear delivery
CN107130000B (en) 2017-05-12 2019-12-17 浙江卫未生物医药科技有限公司 CRISPR-Cas9 system for simultaneously knocking out KRAS gene and EGFR gene and application thereof
WO2018209320A1 (en) 2017-05-12 2018-11-15 President And Fellows Of Harvard College Aptazyme-embedded guide rnas for use with crispr-cas9 in genome editing and transcriptional activation
WO2018213351A1 (en) 2017-05-16 2018-11-22 The Regents Of The University Of California Thermostable rna-guided endonucleases and methods of use thereof
CN106916820B (en) 2017-05-16 2019-09-27 吉林大学 SgRNA and its application of porcine ROSA 26 gene can effectively be edited
CN106967697B (en) 2017-05-16 2021-03-26 上海交通大学 Cas9 nuclease G915F and application thereof
CN107012250B (en) 2017-05-16 2021-01-29 上海交通大学 Analysis method and application of genome DNA fragment editing accuracy suitable for CRISPR/Cas9 system
CN106987570A (en) 2017-05-16 2017-07-28 上海交通大学 A kind of Cas9 Nuclease Rs 780A and application thereof
CN106947750B (en) 2017-05-16 2020-12-08 上海交通大学 Cas9 nuclease Q920P and application thereof
CN106957830B (en) 2017-05-16 2020-12-25 上海交通大学 Cas9 nuclease delta F916 and application thereof
CN106957831B (en) 2017-05-16 2021-03-12 上海交通大学 Cas9 nuclease K918A and application thereof
CN106939303B (en) 2017-05-16 2021-02-23 上海交通大学 Cas9 nuclease R919P and application thereof
CN107326042A (en) 2017-05-16 2017-11-07 上海交通大学 The fixed point of paddy rice TMS10 genes knocks out system and its application
EP3625340A4 (en) 2017-05-18 2021-02-24 Cargill, Incorporated Genome editing system
WO2018213726A1 (en) 2017-05-18 2018-11-22 The Broad Institute, Inc. Systems, methods, and compositions for targeted nucleic acid editing
EP3625359A4 (en) 2017-05-18 2021-03-03 Children's National Medical Center Compositions comprising aptamers and nucleic acid payloads and methods of using the same
AU2018270088B2 (en) 2017-05-18 2024-05-16 Massachusetts Institute Of Technology Systems, methods, and compositions for targeted nucleic acid editing
CN107043787B (en) 2017-05-19 2017-12-26 南京医科大学 A kind of construction method and application that MARF1 rite-directed mutagenesis mouse models are obtained based on CRISPR/Cas9
CN107236737A (en) 2017-05-19 2017-10-10 上海交通大学 The sgRNA sequences of special target arabidopsis ILK2 genes and its application
WO2018217852A1 (en) 2017-05-23 2018-11-29 Gettysburg College Crispr based tool for characterizing bacterial serovar diversity
CN107034188B (en) 2017-05-24 2018-07-24 中山大学附属口腔医院 A kind of excretion body carrier, CRISPR/Cas9 gene editings system and the application of targeting bone
CN110997728A (en) 2017-05-25 2020-04-10 通用医疗公司 Bipartite Base Editor (BBE) structure and II-type-CAS 9 zinc finger editing
CN107177625B (en) 2017-05-26 2021-05-25 中国农业科学院植物保护研究所 Artificial vector system for site-directed mutagenesis and site-directed mutagenesis method
WO2018217981A1 (en) 2017-05-26 2018-11-29 North Carolina State University Altered guide rnas for modulating cas9 activity and methods of use
CN107287245B (en) 2017-05-27 2020-03-17 南京农业大学 Construction method of Glrx1 gene knockout animal model based on CRISPR/Cas9 technology
CN107142272A (en) 2017-06-05 2017-09-08 南京金斯瑞生物科技有限公司 A kind of method for controlling plasmid replication in Escherichia coli
US20200140835A1 (en) 2017-06-06 2020-05-07 The General Hospital Corporation Engineered CRISPR-Cas9 Nucleases
CN107034218A (en) 2017-06-07 2017-08-11 浙江大学 Targeting sgRNA, modification carrier for pig APN gene editings and its preparation method and application
CN107119071A (en) 2017-06-07 2017-09-01 江苏三黍生物科技有限公司 A kind of method for reducing plant amylose content and application
CN107177595A (en) 2017-06-07 2017-09-19 浙江大学 Targeting sgRNA, modification carrier for pig CD163 gene editings and its preparation method and application
CN106987757A (en) 2017-06-12 2017-07-28 苏州双金实业有限公司 A kind of corrosion resistant type austenitic based alloy
CN107236739A (en) 2017-06-12 2017-10-10 上海捷易生物科技有限公司 The method of CRISPR/SaCas9 specific knockdown people's CXCR4 genes
CN107227352A (en) 2017-06-13 2017-10-03 西安医学院 The detection method of GPR120 gene expressions based on eGFP and application
CN107083392B (en) 2017-06-13 2020-09-08 中国医学科学院病原生物学研究所 CRISPR/Cpf1 gene editing system and application thereof in mycobacteria
CN107245502B (en) 2017-06-14 2020-11-03 中国科学院武汉病毒研究所 CD 2-binding protein (CD2AP) and its interacting protein
CN107312798B (en) 2017-06-16 2020-06-23 武汉大学 CRISPR/Cas9 recombinant lentiviral vector containing gRNA sequence of specific targeting CCR5 gene and application
CN107099850B (en) 2017-06-19 2018-05-04 东北农业大学 A kind of method that CRISPR/Cas9 genomic knockouts library is built by digestion genome
CN107266541B (en) 2017-06-20 2021-06-04 上海大学 Corn transcription factor ZmbHLH167 and application thereof
CN107446951B (en) 2017-06-20 2021-01-08 温氏食品集团股份有限公司 Method for rapidly screening recombinant fowlpox virus through CRISPR/Cas9 system and application thereof
CN107058328A (en) 2017-06-22 2017-08-18 江苏三黍生物科技有限公司 A kind of method for improving plant amylose content and application
US10011849B1 (en) 2017-06-23 2018-07-03 Inscripta, Inc. Nucleic acid-guided nucleases
CN107099533A (en) 2017-06-23 2017-08-29 东北农业大学 A kind of sgRNA targeting sequencings of special target pig IGFBP3 genes and application
US9982279B1 (en) 2017-06-23 2018-05-29 Inscripta, Inc. Nucleic acid-guided nucleases
CN107227307A (en) 2017-06-23 2017-10-03 东北农业大学 A kind of sgRNA targeting sequencings of special target pig IRS1 genes and its application
CN107119053A (en) 2017-06-23 2017-09-01 东北农业大学 A kind of sgRNA targeting sequencings of special target pig MC4R genes and its application
CN107177631B (en) 2017-06-26 2020-11-24 中国农业大学 Method for knocking out NRK cell Slc22a2 gene by using CRISPR-CAS9 technology
CN111328290A (en) 2017-06-26 2020-06-23 博德研究所 CRISPR/CAS-adenine deaminase-based compositions, systems, and methods for targeted nucleic acid editing
WO2019005886A1 (en) 2017-06-26 2019-01-03 The Broad Institute, Inc. Crispr/cas-cytidine deaminase based compositions, systems, and methods for targeted nucleic acid editing
CN107217075B (en) 2017-06-28 2021-07-02 西安交通大学医学院第一附属医院 Method for constructing EPO gene knockout zebra fish animal model, primer, plasmid and preparation method
CN107356793A (en) 2017-07-01 2017-11-17 合肥东玖电气有限公司 A kind of fire-proof ammeter box
CN107312793A (en) 2017-07-05 2017-11-03 新疆农业科学院园艺作物研究所 The tomato dna editor carrier of Cas9 mediations and its application
WO2019010384A1 (en) * 2017-07-07 2019-01-10 The Broad Institute, Inc. Methods for designing guide sequences for guided nucleases
CN107190006A (en) 2017-07-07 2017-09-22 南通大学附属医院 A kind of sgRNA of targeting IGF IR genes and its application
CN107236741A (en) 2017-07-19 2017-10-10 广州医科大学附属第五医院 A kind of gRNA and method for knocking out wild-type T cells TCR alpha chains
CN107400677B (en) 2017-07-19 2020-05-22 江南大学 Bacillus licheniformis genome editing vector based on CRISPR-Cas9 system and preparation method thereof
CN107354156B (en) 2017-07-19 2021-02-09 广州医科大学附属第五医院 gRNA for knocking out TCR beta chain of wild T cell and method
CN107190008A (en) 2017-07-19 2017-09-22 苏州吉赛基因测序科技有限公司 A kind of method of capture genome target sequence based on Crispr/cas9 and its application in high-flux sequence
CN107446954A (en) 2017-07-28 2017-12-08 新乡医学院 A kind of preparation method of SD rat T cells deleting genetic model
CN107435051B (en) 2017-07-28 2020-06-02 新乡医学院 Cell line gene knockout method for rapidly obtaining large fragment deletion through CRISPR/Cas9 system
CN107435069A (en) 2017-07-28 2017-12-05 新乡医学院 A kind of quick determination method of cell line CRISPR/Cas9 gene knockouts
CN107384922A (en) 2017-07-28 2017-11-24 重庆医科大学附属儿童医院 CRISPR/Cas9 targeting knock outs people CNE9 genes and its specific gRNA
US11732274B2 (en) 2017-07-28 2023-08-22 President And Fellows Of Harvard College Methods and compositions for evolving base editors using phage-assisted continuous evolution (PACE)
CN107267515B (en) 2017-07-28 2020-08-25 重庆医科大学附属儿童医院 CRISPR/Cas9 targeted knockout human CNE10 gene and specific gRNA thereof
CN107418974A (en) 2017-07-28 2017-12-01 新乡医学院 It is a kind of to sort the quick method for obtaining CRISPR/Cas9 gene knockout stable cell lines using monoclonal cell
CN107217042B (en) 2017-07-31 2020-03-06 江苏东抗生物医药科技有限公司 Genetic engineering cell line for producing afucosylated protein and establishing method thereof
CN107446922A (en) 2017-08-03 2017-12-08 无锡市第二人民医院 A kind of gRNA sequences and its application method for knocking out hepcidin gene in human osteoblast cell's strain
CN107502618B (en) 2017-08-08 2021-03-12 中国科学院微生物研究所 Controllable vector elimination method and easy-to-use CRISPR-Cas9 tool
CN107312785B (en) 2017-08-09 2019-12-06 四川农业大学 Application of OsKTN80b gene in reducing plant height of rice
CN107384926B (en) 2017-08-13 2020-06-26 中国人民解放军疾病预防控制所 CRISPR-Cas9 system for targeted removal of bacterial drug-resistant plasmids and application
CN107365804B (en) 2017-08-13 2019-12-20 中国人民解放军疾病预防控制所 Method for packaging CRISPR-Cas9 system by using temperate phage vector
CN107446923B (en) 2017-08-13 2019-12-31 中国人民解放军疾病预防控制所 rAAV8-CRISPR-SaCas9 system and application thereof in preparation of hepatitis B treatment drug
CN107815463A (en) 2017-08-15 2018-03-20 西南大学 CRISPR/Cas9 technologies mediate the method for building up of miR167 precursor sequence editor's systems
CN108034656A (en) 2017-08-16 2018-05-15 四川省农业科学院生物技术核技术研究所 SgRNA, CRISPR/Cas9 carrier related with rice bronzing glume character, vector construction, application
CN107446924B (en) 2017-08-16 2020-01-14 中国科学院华南植物园 Kiwi fruit gene AcPDS editing vector based on CRISPR-Cas9 and construction method and application thereof
CN107384894B (en) 2017-08-21 2019-10-22 华南师范大学 Functional graphene oxide efficiently delivers method of the CRISPR/Cas9 for gene editing
CN107299114B (en) 2017-08-23 2021-08-27 中国科学院分子植物科学卓越创新中心 Efficient yeast chromosome fusion method
CN107557393B (en) 2017-08-23 2020-05-08 中国科学院上海应用物理研究所 Magnetic nanomaterial-mediated CRISPR/Cas 9T cell internal delivery system and preparation method and application thereof
CN107312795A (en) 2017-08-24 2017-11-03 浙江省农业科学院 The gene editing method of pink colour fruit tomato is formulated with CRISPR/Cas9 systems
EP3673059A4 (en) 2017-08-25 2021-09-01 President And Fellows Of Harvard College Evolution of bont peptidases
CN107488649A (en) 2017-08-25 2017-12-19 南方医科大学 A kind of fusion protein of Cpf1 and p300 Core domains, corresponding DNA target are to activation system and application
CN107460196A (en) 2017-08-25 2017-12-12 同济大学 A kind of construction method of immunodeficient mouse animal model and application
CN107541525B (en) 2017-08-26 2021-12-10 内蒙古大学 Method for mediating goat Tbeta 4 gene fixed-point knock-in based on CRISPR/Cas9 technology
CN107446932B (en) 2017-08-29 2020-02-21 江西省农业科学院 Gene for controlling male reproductive development of rice and application thereof
EP3676376A2 (en) 2017-08-30 2020-07-08 President and Fellows of Harvard College High efficiency base editors comprising gam
CN107519492B (en) 2017-09-06 2019-01-25 武汉迈特维尔生物科技有限公司 Application of the miR-3187-3p in coronary atherosclerotic heart disease is knocked out using CRISPR technology
CN107362372B (en) 2017-09-07 2019-01-11 佛山波若恩生物科技有限公司 Use application of the CRISPR technology in coronary atherosclerotic heart disease
CN107641631A (en) 2017-09-07 2018-01-30 浙江工业大学 A kind of method that bacillus coli gene is knocked out based on CRISPR/Cas9 systems by chemical conversion mediation
CN107502608B (en) 2017-09-08 2020-10-16 中山大学 Construction method and application of sgRNA and ALDH2 gene-deleted cell strain for knocking out human ALDH2 gene
WO2019051097A1 (en) * 2017-09-08 2019-03-14 The Regents Of The University Of California Rna-guided endonuclease fusion polypeptides and methods of use thereof
CN107557455A (en) 2017-09-15 2018-01-09 国家纳米科学中心 A kind of detection method of the nucleic acid specific fragment based on CRISPR Cas13a
US11624130B2 (en) 2017-09-18 2023-04-11 President And Fellows Of Harvard College Continuous evolution for stabilized proteins
CN107557390A (en) 2017-09-18 2018-01-09 江南大学 A kind of method for screening the high expression sites of Chinese hamster ovary celI system
CN107475300B (en) 2017-09-18 2020-04-21 上海市同济医院 Construction method and application of Ifit3-eKO1 gene knockout mouse animal model
CN107630042A (en) 2017-09-19 2018-01-26 安徽大学 A kind of prokaryotic gene edit methods for coming from I type Cas 4 cas genes of system
CN107557373A (en) 2017-09-19 2018-01-09 安徽大学 A kind of gene editing method based on I Type B CRISPR Cas system genes cas3
CN107523583A (en) 2017-09-19 2017-12-29 安徽大学 A kind of prokaryotic gene edit methods for coming from gene cas5 3 in I type CRISPR Cas systems
CN107630041A (en) 2017-09-19 2018-01-26 安徽大学 A kind of eukaryotic gene edit methods based on Virginia streptomycete IBL14 I Type B Cas systems
CN107557378A (en) 2017-09-19 2018-01-09 安徽大学 Gene cas7 3 eukaryotic gene edit methods in a kind of type CRISPR Cas systems based on I
CN107619837A (en) 2017-09-20 2018-01-23 西北农林科技大学 The method that nuclease-mediated Ipr1 fixed points insertion acquisition transgenic cow fetal fibroblast is cut using Cas9
CN107513531B (en) 2017-09-21 2020-02-21 无锡市妇幼保健院 gRNA target sequence for endogenously over-expressing lncRNA-XIST and application thereof
CN107686848A (en) 2017-09-26 2018-02-13 中山大学孙逸仙纪念医院 The stable of transposons collaboration CRISPR/Cas9 systems knocks out single plasmid vector and its application
CN107557394A (en) 2017-09-29 2018-01-09 南京鼓楼医院 The method for reducing embryonic gene editor's miss rate of CRISPR/Cas9 mediations
CN107760652A (en) 2017-09-29 2018-03-06 华南理工大学 The cell models of caco 2 and its method that CRISPR/CAS9 mediate drugs transporter target knocks out
CN107828794A (en) 2017-09-30 2018-03-23 上海市农业生物基因中心 A kind of method for creating of Rice Salt gene OsRR22 mutant, its amino acid sequence encoded, plant and the mutant
CN107760663A (en) 2017-09-30 2018-03-06 新疆大学 The clone of chufa pepc genes and structure and the application of expression vector
CN107630006B (en) 2017-09-30 2020-09-11 山东兴瑞生物科技有限公司 Method for preparing T cell with double knockout genes of TCR and HLA
CN107604003A (en) 2017-10-10 2018-01-19 南方医科大学 One kind knocks out kit and its application based on linearisation CRISPR CAS9 lentiviral vector genomes
CN107557381A (en) 2017-10-12 2018-01-09 南京农业大学 A kind of foundation and its application of Chinese cabbage CRISPR Cas9 gene editing systems
CN108102940B (en) 2017-10-12 2021-07-13 中石化上海工程有限公司 Industrial saccharomyces cerevisiae strain with XKS1 gene knocked out by CRISPR/Cas9 system and construction method
CN107474129B (en) 2017-10-12 2018-10-19 江西汉氏联合干细胞科技有限公司 The method of specificity enhancing CRISPR-CAS system gene editorial efficiencies
CN108103586A (en) 2017-10-13 2018-06-01 上海科技大学 A kind of CRISPR/Cas9 random libraries and its structure and application
CN107619829B (en) 2017-10-14 2018-08-24 南京平港生物技术有限公司 The method that GINS2 gene knockouts are carried out to mescenchymal stem cell using CRISPR-CAS systems
CN107586779B (en) 2017-10-14 2018-08-28 天津金匙生物科技有限公司 The method that CASP3 gene knockouts are carried out to mescenchymal stem cell using CRISPR-CAS systems
KR20200121782A (en) 2017-10-16 2020-10-26 더 브로드 인스티튜트, 인코퍼레이티드 Uses of adenosine base editor
CN107523567A (en) 2017-10-16 2017-12-29 遵义医学院 A kind of construction method for the esophageal cancer cell strain for knocking out people's ezrin genetic enhancers
CN107760715B (en) 2017-10-17 2021-12-10 张业胜 Transgenic vector and construction method and application thereof
CN107937427A (en) 2017-10-20 2018-04-20 广东石油化工学院 A kind of homologous repair vector construction method based on CRISPR/Cas9 systems
WO2019084062A1 (en) 2017-10-23 2019-05-02 The Broad Institute, Inc. Systems, methods, and compositions for targeted nucleic acid editing
CN107893086B (en) 2017-10-24 2021-09-03 中国科学院武汉植物园 Method for rapidly constructing Cas9 binary expression vector library of paired sgRNAs
CN107760684B (en) 2017-11-03 2018-09-25 上海拉德钫斯生物科技有限公司 The method that RBM17 gene knockouts are carried out to mescenchymal stem cell using CRISPR-CAS systems
US20200239379A1 (en) 2017-11-05 2020-07-30 Aveterra Corp Method and Apparatus for Automated Composting of Organic Wastes
CN107858346B (en) 2017-11-06 2020-06-16 天津大学 Method for knocking out saccharomyces cerevisiae chromosome
CN107794276A (en) 2017-11-08 2018-03-13 中国农业科学院作物科学研究所 Fast and effectively crops pinpoint genetic fragment or allele replacement method and system for a kind of CRISPR mediations
US20200318086A1 (en) 2017-11-10 2020-10-08 Novozymes A/S Temperature-sensitive cas9 protein
CN107630043A (en) 2017-11-14 2018-01-26 吉林大学 The method that Gadd45a knockout rabbit models are established using knockout technology
CN108441519A (en) 2017-11-15 2018-08-24 中国农业大学 The method that homologous remediation efficiency is improved in CRISPR/CAS9 gene editings
CN107858373B (en) 2017-11-16 2020-03-17 山东省千佛山医院 Construction method of endothelial cell conditional knockout CCR5 gene mouse model
CN108192956B (en) 2017-11-17 2021-06-01 东南大学 Cas9 nuclease-based DNA detection and analysis method and application thereof
CN107893075A (en) 2017-11-17 2018-04-10 和元生物技术(上海)股份有限公司 CRISPR Cas9 targeting knock out people colon-cancer cell RITA genes and its specific sgRNA
CN107828874B (en) 2017-11-20 2020-10-16 东南大学 DNA detection and typing method based on CRISPR and application thereof
CN107653256A (en) 2017-11-21 2018-02-02 云南省烟草农业科学研究院 A kind of Polyphenol Oxidase in Tobacco gene NtPPO1 and its directed mutagenesis method and application
CN107904261A (en) 2017-11-21 2018-04-13 福州大学 The preparation of CRISPR/Cas9 nano gene systems and its application in terms of transfection
CN107893076A (en) 2017-11-23 2018-04-10 和元生物技术(上海)股份有限公司 CRISPR Cas9 targeting knock outs human breast cancer cell RASSF2 genes and its specific sgRNA
CN107937501A (en) 2017-11-24 2018-04-20 安徽师范大学 A kind of method of fast and convenient screening CRISPR/Cas gene editing positive objects
CN107937432B (en) 2017-11-24 2020-05-01 华中农业大学 Genome editing method based on CRISPR system and application thereof
CN107828738A (en) 2017-11-28 2018-03-23 新乡医学院 A kind of dnmt rna deficiency Chinese hamster ovary celI system and preparation method and application
CN107988256B (en) 2017-12-01 2020-07-28 暨南大学 Recombinant vector for knocking-in human Huntington gene, construction method thereof and application thereof in construction of model pig
CN108148873A (en) 2017-12-06 2018-06-12 南方医科大学 A kind of CAV-1 gene delections zebra fish and preparation method thereof
CN108570479B (en) 2017-12-06 2020-04-03 内蒙古大学 Method for mediating down producing goat VEGF gene fixed-point knock-in based on CRISPR/Cas9 technology
CN107974466B (en) 2017-12-07 2020-09-29 中国科学院水生生物研究所 Sturgeon CRISPR/Cas9 gene editing method
CN108251423B (en) 2017-12-07 2020-11-06 嘉兴市第一医院 sgRNA of CRISPR-Cas9 system specific targeting human RSPO2 gene, activation method and application
CN108315330B (en) 2017-12-07 2020-05-19 嘉兴市第一医院 sgRNA of CRISPR-Cas9 system specific targeting human RSPO2 gene, knockout method and application
CN108148835A (en) 2017-12-07 2018-06-12 和元生物技术(上海)股份有限公司 The sgRNA of CRISPR-Cas9 targeting knock out SLC30A1 genes and its specificity
CN107828826A (en) 2017-12-12 2018-03-23 南开大学 A kind of external method for efficiently obtaining NSC
CN108103090B (en) 2017-12-12 2021-06-15 中山大学附属第一医院 RNA Cas9-m6A modified vector system for targeting RNA methylation, and construction method and application thereof
WO2019118935A1 (en) 2017-12-14 2019-06-20 Casebia Therapeutics Limited Liability Partnership Novel rna-programmable endonuclease systems and their use in genome editing and other applications
CN108103098B (en) 2017-12-14 2020-07-28 华南理工大学 Compound skin sensitization in-vitro evaluation cell model and construction method thereof
WO2019118949A1 (en) 2017-12-15 2019-06-20 The Broad Institute, Inc. Systems and methods for predicting repair outcomes in genetic engineering
CN107988268A (en) 2017-12-18 2018-05-04 湖南师范大学 A kind of method of gene knockout selection and breeding tcf25 Gene Deletion zebra fish
CN108018316A (en) 2017-12-20 2018-05-11 湖南师范大学 A kind of method of gene knockout selection and breeding rmnd5b Gene Deletion zebra fish
WO2019123430A1 (en) 2017-12-21 2019-06-27 Casebia Therapeutics Llp Materials and methods for treatment of usher syndrome type 2a and/or non-syndromic autosomal recessive retinitis pigmentosa (arrp)
CN108048466B (en) 2017-12-21 2020-02-07 嘉兴市第一医院 CRRNA of CRISPR-Cas13a system specific targeting human RSPO2 gene, system and application
RU2652899C1 (en) 2017-12-28 2018-05-03 Федеральное бюджетное учреждение науки "Центральный научно-исследовательский институт эпидемиологии" Федеральной службы по надзору в сфере защиты прав потребителей и благополучия человека (ФБУН ЦНИИ Эпидемиологии Роспотребнадзора) Rna-conductors to suppress the replication of hepatitis b virus and for the elimination of hepatitis b virus from host cell
CN107893080A (en) 2017-12-29 2018-04-10 江苏省农业科学院 A kind of sgRNA for targetting rat Inhba genes and its application
CN107988246A (en) 2018-01-05 2018-05-04 汕头大学医学院 A kind of gene knockout carrier and its zebra fish Glioma Model
CN107988229B (en) 2018-01-05 2020-01-07 中国农业科学院作物科学研究所 Method for obtaining tillering-changed rice by modifying OsTAC1 gene through CRISPR-Cas
CN108103092B (en) 2018-01-05 2021-02-12 中国农业科学院作物科学研究所 System for modifying OsHPH gene by using CRISPR-Cas system to obtain dwarf rice and application thereof
CN108559760A (en) 2018-01-09 2018-09-21 陕西师范大学 The method for establishing luciferase knock-in cell lines based on CRISPR targeted genomic modification technologies
WO2019139951A1 (en) 2018-01-09 2019-07-18 The United States Of America As Represented By The Secretary Of The Department Of Health And Human Services Detecting protein interaction sites in nucleic acids
US11268092B2 (en) 2018-01-12 2022-03-08 GenEdit, Inc. Structure-engineered guide RNA
CN108559730B (en) 2018-01-12 2021-09-24 中国人民解放军第四军医大学 Experimental method for constructing Hutat2 Fc gene knock-in monocyte by CRISPR/Cas9 technology
CN108148837A (en) 2018-01-12 2018-06-12 南京医科大学 ApoE-CRISPR/Cas9 carriers and its application in ApoE genes are knocked out
CN108251451A (en) 2018-01-16 2018-07-06 西南大学 CRISPR/Cas9-gRNA target practices sequence pair, plasmid and its application of HTT
CN108251452A (en) 2018-01-17 2018-07-06 扬州大学 A kind of transgenic zebrafish for expressing Cas9 genes and its construction method and application
JP7075170B2 (en) 2018-01-23 2022-05-25 インスティチュート フォー ベーシック サイエンス Extended single guide RNA and its uses
CN208034188U (en) 2018-02-09 2018-11-02 衡阳市振洋汽车配件有限公司 A kind of processing hole fixture quickly positioned
CN108359712B (en) 2018-02-09 2020-06-26 广东省农业科学院农业生物基因研究中心 Method for rapidly and efficiently screening SgRNA target DNA sequence
CN108559745A (en) 2018-02-10 2018-09-21 和元生物技术(上海)股份有限公司 The method for improving B16F10 cell transfecting efficiencies based on CRISPR-Cas9 technologies
CN108486145A (en) 2018-02-12 2018-09-04 中国科学院遗传与发育生物学研究所 Plant efficient methods of homologous recombination based on CRISPR/Cas9
CN108359691B (en) 2018-02-12 2021-09-28 中国科学院重庆绿色智能技术研究院 Kit and method for knocking out abnormal mitochondrial DNA by mito-CRISPR/Cas9 system
EP3752647B1 (en) 2018-02-15 2022-05-25 The Broad Institute, Inc. Cell data recorders and uses thereof
CN109021111B (en) 2018-02-23 2021-12-07 上海科技大学 Gene base editor
CN108396027A (en) 2018-02-27 2018-08-14 和元生物技术(上海)股份有限公司 The sgRNA of CRISPR-Cas9 targeting knock out people colon-cancer cell DEAF1 genes and its specificity
WO2019168953A1 (en) 2018-02-27 2019-09-06 President And Fellows Of Harvard College Evolved cas9 variants and uses thereof
CN108486159B (en) 2018-03-01 2021-10-22 南通大学附属医院 CRISPR-Cas9 system for knocking out GRIN2D gene and application thereof
CN108342480B (en) 2018-03-05 2022-03-01 北京医院 Gene variation detection quality control substance and preparation method thereof
CN108410906A (en) 2018-03-05 2018-08-17 淮海工学院 A kind of CRISPR/Cpf1 gene editing methods being applicable in Yu Haiyang shell-fish mitochondrial genomes
CN108410907B (en) 2018-03-08 2021-08-27 湖南农业大学 Method for realizing HMGCR gene knockout based on CRISPR/Cas9 technology
CN108410911B (en) 2018-03-09 2021-08-20 广西医科大学 LMNA gene knockout cell line constructed based on CRISPR/Cas9 technology
CN108486108B (en) 2018-03-16 2020-10-09 华南农业大学 Cell strain for knocking out human HMGB1 gene and application thereof
CN108486146B (en) 2018-03-16 2021-02-19 中国农业科学院作物科学研究所 Application of LbCpf1-RR mutant in CRISPR/Cpf1 system in plant gene editing
AU2019237541A1 (en) 2018-03-23 2020-10-08 Editas Medicine, Inc. CRISPR/Cas9-mediated exon-skipping approach for USH2A-associated Usher syndrome
CN108384784A (en) 2018-03-23 2018-08-10 广西医科大学 A method of knocking out Endoglin genes using CRISPR/Cas9 technologies
CN108504685A (en) 2018-03-27 2018-09-07 宜明细胞生物科技有限公司 A method of utilizing CRISPR/Cas9 system homologous recombination repair IL-2RG dcc genes
CN108410877A (en) 2018-03-27 2018-08-17 和元生物技术(上海)股份有限公司 The sgRNA of CRISPR-Cas9 targeting knock outs people's cell SANIL1 genes and its specificity
CN108424931A (en) 2018-03-29 2018-08-21 内蒙古大学 The method that CRISPR/Cas9 technologies mediate goat VEGF Gene targetings
CN108486234B (en) 2018-03-29 2022-02-11 东南大学 CRISPR (clustered regularly interspaced short palindromic repeats) typing PCR (polymerase chain reaction) method and application thereof
CN108504693A (en) 2018-04-04 2018-09-07 首都医科大学附属北京朝阳医院 The O-type that T synthase genes structure is knocked out using Crispr technologies glycosylates abnormal colon carcinoma cell line
CN108486111A (en) 2018-04-04 2018-09-04 山西医科大学 The method and its specificity sgRNA of CRISPR-Cas9 targeting knock out people's SMYD3 genes
CN108441520B (en) 2018-04-04 2020-07-31 苏州大学 Gene conditional knockout method constructed by using CRISPR/Cas9 system
CN108753772B (en) 2018-04-04 2020-10-30 南华大学 Construction method of human neuroblastoma cell line with CAPNS1 gene knocked out based on CRISPR/Cas technology
CN108486154A (en) 2018-04-04 2018-09-04 福州大学 A kind of construction method of sialidase gene knock-out mice model and its application
CN108504657B (en) 2018-04-12 2019-06-14 中南民族大学 The method for knocking out HEK293T cell KDM2A gene using CRISPR-CAS9 technology
CN108753817A (en) 2018-04-13 2018-11-06 北京华伟康信生物科技有限公司 The enhanced cell for enhancing the method for the anti-cancer ability of cell and being obtained using this method
CN108588182A (en) 2018-04-13 2018-09-28 中国科学院深圳先进技术研究院 Isothermal duplication and detection technique based on the substitution of CRISPR- chains
CN108823248A (en) 2018-04-20 2018-11-16 中山大学 A method of Luchuan pigs CD163 gene is edited using CRISPR/Cas9
CN108753832A (en) 2018-04-20 2018-11-06 中山大学 A method of editing Large White CD163 genes using CRISPR/Cas9
CN108588071A (en) 2018-04-25 2018-09-28 和元生物技术(上海)股份有限公司 The sgRNA of CRISPR-Cas9 targeting knock out people colon-cancer cell CNR1 genes and its specificity
CN108546712B (en) 2018-04-26 2020-08-07 中国农业科学院作物科学研究所 Method for realizing homologous recombination of target gene in plant by using CRISPR/L bcPf1 system
CN108588128A (en) 2018-04-26 2018-09-28 南昌大学 A kind of construction method of high efficiency soybean CRISPR/Cas9 systems and application
CN108707621B (en) 2018-04-26 2021-02-12 中国农业科学院作物科学研究所 CRISPR/Cpf1 system-mediated homologous recombination method taking RNA transcript as repair template
CN108642053A (en) 2018-04-28 2018-10-12 和元生物技术(上海)股份有限公司 The sgRNA of CRISPR-Cas9 targeting knock out people colon-cancer cell PPP1R1C genes and its specificity
CN108611364A (en) 2018-05-03 2018-10-02 南京农业大学 A kind of preparation method of non-transgenic CRISPR mutant
CN108588123A (en) 2018-05-07 2018-09-28 南京医科大学 CRISPR/Cas9 carriers combine the application in the blood product for preparing gene knock-out pig
US20220401530A1 (en) 2018-05-11 2022-12-22 Beam Therapeutics Inc. Methods of substituting pathogenic amino acids using programmable base editor systems
CN108610399B (en) 2018-05-14 2019-09-27 河北万玛生物医药有限公司 The method that specificity enhancing CRISPR-CAS system carries out gene editing efficiency in epidermal stem cells
CN108546717A (en) 2018-05-15 2018-09-18 吉林大学 The method that antisense lncRNA mediates cis regulatory inhibition expression of target gene
CN108624622A (en) 2018-05-16 2018-10-09 湖南艾佳生物科技股份有限公司 A kind of genetically engineered cell strain that can secrete mouse interleukin -6 based on CRISPR-Cas9 systems structure
CN108546718B (en) 2018-05-16 2021-07-09 康春生 Application of crRNA-mediated CRISPR/Cas13a gene editing system in tumor cells
CN108642055B (en) 2018-05-17 2021-12-03 吉林大学 sgRNA capable of effectively editing pig miR-17-92 gene cluster
CN108642090A (en) 2018-05-18 2018-10-12 中国人民解放军总医院 Method and the application that Nogo-B knocks out pattern mouse are obtained based on CRISPR/Cas9 technologies
CN108642077A (en) 2018-05-18 2018-10-12 江苏省农业科学院 Method based on CRISPR/Cas9 gene editing technology selection and breeding mung bean sterile mutants and special gRNA
CN108642078A (en) 2018-05-18 2018-10-12 江苏省农业科学院 Method based on CRISPR/Cas9 gene editing technology selection and breeding Mung Bean Bloomings pollination mutant and special gRNA
CN108559732A (en) 2018-05-21 2018-09-21 陕西师范大学 The method for establishing KI-T2A-luciferase cell lines based on CRISPR/Cas9 targeted genomic modification technologies
CN108707620A (en) 2018-05-22 2018-10-26 西北农林科技大学 A kind of Gene drive carriers and construction method
US20210198330A1 (en) 2018-05-23 2021-07-01 The Broad Institute, Inc. Base editors and uses thereof
US11117812B2 (en) 2018-05-24 2021-09-14 Aqua-Aerobic Systems, Inc. System and method of solids conditioning in a filtration system
CN108690844B (en) 2018-05-25 2021-10-15 西南大学 CRISPR/Cas9-gRNA targeting sequence pair of HTT, plasmid and HD cell model
CN108707629A (en) 2018-05-28 2018-10-26 上海海洋大学 The preparation method of zebra fish notch1b gene mutation bodies
CN108707628B (en) 2018-05-28 2021-11-23 上海海洋大学 Preparation method of zebra fish notch2 gene mutant
CN108823249A (en) 2018-05-28 2018-11-16 上海海洋大学 The method of CRISPR/Cas9 building notch1a mutant zebra fish
CN108753835A (en) 2018-05-30 2018-11-06 中山大学 A method of editing pig BMP15 genes using CRISPR/Cas9
CN108707604B (en) 2018-05-30 2019-07-23 江西汉氏联合干细胞科技有限公司 CNE10 gene knockout is carried out using CRISPR-Cas system in epidermal stem cells
CN108753836B (en) 2018-06-04 2021-10-12 北京大学 Gene regulation or editing system utilizing RNA interference mechanism
CA3102840A1 (en) 2018-06-05 2019-12-12 Lifeedit, Inc. Rna-guided nucleases and active fragments and variants thereof and methods of use
CN108715850B (en) 2018-06-05 2020-10-23 艾一生命科技(广东)有限公司 GING2 gene knockout in epidermal stem cells by using CRISPR-Cas system
CN108753813B (en) 2018-06-08 2021-08-24 中国水稻研究所 Method for obtaining marker-free transgenic plants
CN108753783A (en) 2018-06-13 2018-11-06 上海市同济医院 The construction method of Sqstm1 full genome knock-out mice animal models and application
WO2019241649A1 (en) 2018-06-14 2019-12-19 President And Fellows Of Harvard College Evolution of cytidine deaminases
CN108728486A (en) 2018-06-20 2018-11-02 江苏省农业科学院 A kind of construction method of eggplant CRISPR/Cas9 gene knockout carriers and application
CN108841845A (en) 2018-06-21 2018-11-20 广东石油化工学院 A kind of CRISPR/Cas9 carrier and its construction method with selection markers
CN108893529A (en) 2018-06-25 2018-11-27 武汉博杰生物医学科技有限公司 A kind of crRNA being mutated based on CRISPR technology specific detection people KRAS gene 2 and 3 exons
CN108866093B (en) 2018-07-04 2021-07-09 广东三杰牧草生物科技有限公司 Method for performing site-directed mutagenesis on alfalfa gene by using CRISPR/Cas9 system
CN108795902A (en) 2018-07-05 2018-11-13 深圳三智医学科技有限公司 A kind of safe and efficient CRISPR/Cas9 gene editings technology
CN108913714A (en) 2018-07-05 2018-11-30 江西省超级水稻研究发展中心 A method of BADH2 gene, which is knocked out, using CRISPR/Cas9 system formulates fragrant rice
EP3820495A4 (en) 2018-07-09 2022-07-20 The Broad Institute Inc. Rna programmable epigenetic rna modifiers and uses thereof
CN108913691B (en) 2018-07-16 2020-09-01 山东华御生物科技有限公司 Card3 gene knockout in epidermal stem cells by using CRISPR-Cas system
CN108913664B (en) 2018-07-20 2020-09-04 嘉兴学院 Method for knocking out CFP1 gene in ovarian cancer cell by CRISPR/Cas9 gene editing method
CN108823291B (en) 2018-07-25 2022-04-12 领航医学科技(深圳)有限公司 Specific nucleic acid fragment quantitative detection method based on CRISPR technology
CN108853133A (en) 2018-07-25 2018-11-23 福州大学 A kind of preparation method of PAMAM and CRISPR/Cas9 System reorganization plasmid delivery nanoparticle
KR20210053898A (en) 2018-07-31 2021-05-12 더 브로드 인스티튜트, 인코퍼레이티드 New CRISPR enzyme and system
CN108913717A (en) 2018-08-01 2018-11-30 河南农业大学 A method of using CRISPR/Cas9 system to rice PHYB site-directed point mutation
US20210277379A1 (en) 2018-08-03 2021-09-09 Beam Therapeutics Inc. Multi-effector nucleobase editors and methods of using same to modify a nucleic acid target sequence
EP3841203A4 (en) 2018-08-23 2022-11-02 The Broad Institute Inc. Cas9 variants having non-canonical pam specificities and uses thereof
JP2021534798A (en) 2018-08-28 2021-12-16 フラッグシップ パイオニアリング イノベーションズ シックス,エルエルシー Methods and compositions for regulating the genome
WO2020051360A1 (en) 2018-09-05 2020-03-12 The Broad Institute, Inc. Base editing for treating hutchinson-gilford progeria syndrome
WO2020086908A1 (en) 2018-10-24 2020-04-30 The Broad Institute, Inc. Constructs for improved hdr-dependent genomic editing
US20220389395A1 (en) 2018-10-29 2022-12-08 The Broad Institute, Inc. Nucleobase editors comprising geocas9 and uses thereof
US20220282275A1 (en) 2018-11-15 2022-09-08 The Broad Institute, Inc. G-to-t base editors and uses thereof
CN109517841B (en) 2018-12-05 2020-10-30 华东师范大学 Composition, method and application for nucleotide sequence modification
WO2020154500A1 (en) 2019-01-23 2020-07-30 The Broad Institute, Inc. Supernegatively charged proteins and uses thereof
JP2022523302A (en) 2019-01-28 2022-04-22 プロキューアール セラピューティクス ツー ベスローテン フェンノートシャップ RNA editing oligonucleotides for the treatment of Usher syndrome
EP3918070A1 (en) 2019-01-29 2021-12-08 University of Washington A method of gene editing
EP3918077A4 (en) 2019-01-31 2023-03-29 Beam Therapeutics, Inc. Nucleobase editors having reduced off-target deamination and methods of using same to modify a nucleobase target sequence
US20220177877A1 (en) 2019-03-04 2022-06-09 President And Fellows Of Harvard College Highly multiplexed base editing
US20220170013A1 (en) 2019-03-06 2022-06-02 The Broad Institute, Inc. T:a to a:t base editing through adenosine methylation
WO2020181178A1 (en) 2019-03-06 2020-09-10 The Broad Institute, Inc. T:a to a:t base editing through thymine alkylation
WO2020181180A1 (en) 2019-03-06 2020-09-10 The Broad Institute, Inc. A:t to c:g base editors and uses thereof
WO2020181202A1 (en) 2019-03-06 2020-09-10 The Broad Institute, Inc. A:t to t:a base editing through adenine deamination and oxidation
WO2020181195A1 (en) 2019-03-06 2020-09-10 The Broad Institute, Inc. T:a to a:t base editing through adenine excision
BR112021018606A2 (en) 2019-03-19 2021-11-23 Harvard College Methods and compositions for editing nucleotide sequences
US20220204975A1 (en) 2019-04-12 2022-06-30 President And Fellows Of Harvard College System for genome editing
WO2020214842A1 (en) 2019-04-17 2020-10-22 The Broad Institute, Inc. Adenine base editors with reduced off-target effects
EP3973054A1 (en) 2019-05-20 2022-03-30 The Broad Institute Inc. Aav delivery of nucleobase editors
CA3139122C (en) 2019-06-06 2023-04-25 Inscripta, Inc. Curing for recursive nucleic acid-guided cell editing
WO2020252455A1 (en) 2019-06-13 2020-12-17 The General Hospital Corporation Engineered human-endogenous virus-like particles and methods of use thereof for delivery to cells
US20220259609A1 (en) 2019-07-30 2022-08-18 Pairwise Plants Services, Inc. Morphogenic regulators and methods of using the same
WO2021025750A1 (en) 2019-08-08 2021-02-11 The Broad Institute, Inc. Base editors with diversified targeting scope
WO2021030666A1 (en) 2019-08-15 2021-02-18 The Broad Institute, Inc. Base editing by transglycosylation
US20220411777A1 (en) 2019-08-30 2022-12-29 The General Hospital Corporation C-to-G Transversion DNA Base Editors
WO2021042062A2 (en) 2019-08-30 2021-03-04 Joung J Keith Combinatorial adenine and cytosine dna base editors
WO2021072328A1 (en) 2019-10-10 2021-04-15 The Broad Institute, Inc. Methods and compositions for prime editing rna
WO2021080922A1 (en) 2019-10-21 2021-04-29 The Trustees Of Columbia University In The City Of New York Methods of performing rna templated genome editing
US11591607B2 (en) 2019-10-24 2023-02-28 Pairwise Plants Services, Inc. Optimized CRISPR-Cas nucleases and base editors and methods of use thereof
CA3158897A1 (en) 2019-10-30 2021-05-06 Pairwise Plants Services, Inc. Type v crispr-cas base editors and methods of use thereof
WO2021108717A2 (en) 2019-11-26 2021-06-03 The Broad Institute, Inc Systems and methods for evaluating cas9-independent off-target editing of nucleic acids
US20230049737A1 (en) 2019-12-30 2023-02-16 The Broad Institute, Inc. Genome editing using reverse transcriptase enabled and fully active crispr complexes
WO2021155065A1 (en) 2020-01-28 2021-08-05 The Broad Institute, Inc. Base editors, compositions, and methods for modifying the mitochondrial genome
EP4100519A2 (en) 2020-02-05 2022-12-14 The Broad Institute, Inc. Adenine base editors and uses thereof
US20230123669A1 (en) 2020-02-05 2023-04-20 The Broad Institute, Inc. Base editor predictive algorithm and method of use
WO2021158999A1 (en) 2020-02-05 2021-08-12 The Broad Institute, Inc. Gene editing methods for treating spinal muscular atrophy
AU2021230545A1 (en) 2020-03-04 2022-09-29 Flagship Pioneering Innovations Vi, Llc Improved methods and compositions for modulating a genome
CN116209756A (en) 2020-03-04 2023-06-02 旗舰先锋创新Vi有限责任公司 Methods and compositions for modulating genome
BR112022017713A2 (en) 2020-03-04 2022-11-16 Flagship Pioneering Innovations Vi Llc METHODS AND COMPOSITIONS TO MODULATE A GENOME
WO2021178898A1 (en) 2020-03-05 2021-09-10 Flagship Pioneering Innovations Vi, Llc Host defense suppressing methods and compositions for modulating a genome
US20230159913A1 (en) 2020-04-28 2023-05-25 The Broad Institute, Inc. Targeted base editing of the ush2a gene
DE112021002672T5 (en) 2020-05-08 2023-04-13 President And Fellows Of Harvard College METHODS AND COMPOSITIONS FOR EDIT BOTH STRANDS SIMULTANEOUSLY OF A DOUBLE STRANDED NUCLEOTIDE TARGET SEQUENCE
WO2022212926A1 (en) 2021-04-01 2022-10-06 Prime Medicine, Inc. Methods and compositions for editing nucleotide sequences
EP4352230A2 (en) 2021-06-03 2024-04-17 Prime Medicine, Inc. Genome editing compositions and methods for treatment of wilson's disease
WO2023283092A1 (en) 2021-07-06 2023-01-12 Prime Medicine, Inc. Compositions and methods for efficient genome editing
WO2023288332A2 (en) 2021-07-16 2023-01-19 Prime Medicine, Inc. Genome editing compositions and methods for treatment of wilson's disease
EP4373939A2 (en) 2021-07-23 2024-05-29 Prime Medicine, Inc. Genome editing compositions and methods for treatment of chronic granulomatous disease

Similar Documents

Publication Publication Date Title
US11643652B2 (en) Methods and compositions for prime editing nucleotide sequences
US11912985B2 (en) Methods and compositions for simultaneous editing of both strands of a target double-stranded nucleotide sequence
JPWO2020191234A5 (en)
JP2023543803A (en) Prime Editing Guide RNA, its composition, and its uses
JPWO2020191233A5 (en)
JPWO2020191243A5 (en)